導讀:早在 2017 年,Meta(當時名字還是 Facebook)就宣布了一項能夠通過意念發(fā)送信息的Brain-reading Hat計劃。公司首席執(zhí)行官扎克伯格當年在...
早在 2017 年,Meta(當時名字還是 Facebook)就宣布了一項能夠通過意念發(fā)送信息的“Brain-reading Hat”計劃。公司首席執(zhí)行官扎克伯格當年在一篇帖子中聲稱“我們正在開發(fā)一個新系統(tǒng),可以讓你直接用意念打字。”
如今,Meta 實際上已經(jīng)開發(fā)出來了,只不過,這個設備重達半噸有余,造價超過 200 萬美元,很難進入尋常百姓家。
借助這個設備,Meta 的神經(jīng)科學和人工智能研究人員成功地在人們打字時分析他們的大腦活動,僅憑思維就能判斷出他們按下了哪些鍵。時至今日,這聽起來仍然非常科幻。
這項研究成果分別發(fā)表在兩篇論文和一篇博客文章中。研究過程簡單來講,其實就是首先使用磁共振掃描儀從外部測量受試者的大腦活動,然后通過深度神經(jīng)網(wǎng)絡進行處理。
Forest Neurotech 的創(chuàng)始人 Sumner Norman 雖然沒有參與這項研究,但他認為,“正如我們一次又一次看到的那樣,當與高質(zhì)量數(shù)據(jù)結(jié)合時,深度神經(jīng)網(wǎng)絡能夠揭示出驚人的見解。”他稱贊 Meta 為獲取高質(zhì)量數(shù)據(jù)“付出了巨大努力”。
Meta 的“Brain & AI”研究團隊負責人 Jean-Rémi King 表示,該系統(tǒng)能夠識別打字員所按鍵位的準確率高達 80%,這一精度足以從大腦信號中重構(gòu)完整的句子。
然而,Meta 最初設想的這種消費級“腦電帽”遇到了技術(shù)難題,最終公司放棄了這一想法。
但 Meta 從未停止對神經(jīng)科學基礎研究的支持,并視其為通往更強大人工智能的重要途徑,這種人工智能可以像人類一樣學習和推理。在 Jean-Rémi King 看來,他們的任務是探索“智能的基本原理”,從人類大腦中汲取靈感。
“理解人腦的精確結(jié)構(gòu)或工作原理可能是為機器智能的發(fā)展提供信息的一種方式,而這也正是我們開展研究的出發(fā)點。”Jean-Rémi King 說道。
這種“意念打字”系統(tǒng)絕對不是一款商業(yè)產(chǎn)品,似乎也很難成為商業(yè)產(chǎn)品,它使用腦磁圖掃描儀收集大腦皮層神經(jīng)元活動產(chǎn)生的磁場信號,設備龐大且昂貴,必須在屏蔽室內(nèi)操作,因為地球的磁場都比腦內(nèi)的磁場強一萬億倍。
Sumner Norman 將該裝置比喻成一臺“側(cè)放并懸掛在用戶頭頂?shù)拇殴舱駫呙鑳x”。
除此之外,一旦受試者的頭部稍微移動信號就會丟失。“我們的努力其實并不是針對產(chǎn)品開發(fā)。實際上,我一直強調(diào)這沒有可行的產(chǎn)業(yè)化路徑,因為它太難實現(xiàn)了。”Jean-Rémi King 表示。
這項“意念打字”研究在西班牙巴斯克認知、大腦與語言中心開展,共有 35 名志愿者參與。每位參與者大約花費 20 小時在掃描儀內(nèi)輸入短語,比如“el procesador ejecuta la instrucción”(處理器執(zhí)行指令),同時他們的大腦信號被輸入到一個深度學習系統(tǒng)中,Meta 將其稱為“Brain2Qwerty”(名稱參考了鍵盤上的字母布局)。
深度學習系統(tǒng)的任務是,識別哪些大腦信號代表按下了 a 鍵,哪些代表按下 z 鍵等等,以此類推。最終,模型在學習了志愿者輸入了數(shù)千個字符后,就可以預測出他按下的鍵是什么。
在一篇論文中,Meta 研究人員報告稱平均錯誤率約為 32%,即預測的每三個字母中有一個是錯的。盡管如此,Meta 聲稱這是迄今為止使用全字母鍵盤和顱外信號進行“意念打字”最準確的結(jié)果。
雖然腦信號讀取技術(shù)發(fā)展迅速,但最有效的方法還是通過植入大腦內(nèi)部或表面的電極實現(xiàn)的,這些被稱為“侵入式”腦機接口技術(shù)。然而,這項技術(shù)需要進行開顱手術(shù)植入電極,進而從少量神經(jīng)元中非常精準地捕獲腦電信號。
例如,在 2023 年,一位因肌萎縮側(cè)索硬化癥而喪失語言能力的患者借助腦機接口,通過腦電波讀取軟件連接到語音合成器,重新獲得了語言能力。由馬斯克創(chuàng)立的 Neuralink 公司正在開展大腦植入裝置試驗,可使癱瘓患者控制鼠標光標。
Meta 表示,他們繼續(xù)專注于對“智能本質(zhì)”的基礎研究。
在這里,大型磁共振掃描儀發(fā)揮了關(guān)鍵作用。雖然這種設備不適合日常使用,也無法單獨監(jiān)測每個神經(jīng)元的活動,但它可以一次性全面觀測整個大腦的活動。
在另一項研究中,Meta 的科學家們使用同樣的意念打字數(shù)據(jù)從整體角度分析發(fā)現(xiàn),大腦是以一種自上而下的方式生成語言信息的,首先產(chǎn)生一個句子的整體信號,接著分解為單詞、音節(jié),最后才是具體的字母輸入。
“我們的核心發(fā)現(xiàn)是,大腦在生成語言時是具有層級結(jié)構(gòu)的。”Sumner Norman 解釋道。其實,這并不是一個全新的概念,但 Meta 的研究更多的是揭示了“這些不同層級是如何作為一個系統(tǒng)協(xié)同工作的”。
這些研究成果可能會對未來的人工智能開發(fā)設計產(chǎn)生重要影響。例如,像聊天機器人這樣的人工智能系統(tǒng)已經(jīng)在很大程度上依賴語言進行信息處理和邏輯推理,類似于人類的認知過程。
“語言已成為現(xiàn)代人工智能的基礎。”Jean-Rémi King 指出,“因此,理解大腦或任何系統(tǒng)如何獲取這種語言處理能力是我們開展這項研究的主要原因。”
下一篇:最后一頁