新的“读心术”人工智能直接从脑电波中翻译思想——无需植入物
世界首创的非侵入式人工智能系统可以将无声的想法转化为文本,同时只需要用户戴上贴身的帽子。
开发这项名为DeWave的技术的澳大利亚研究人员进行了测试该过程使用来自二十多个受试者的数据.
参与者戴着帽子默默阅读,帽子通过脑电图(EEG)记录他们的脑电波并将其解码为文本。
随着进一步的改进,DeWave可以帮助中风和瘫痪患者进行交流,并使人们更容易指挥仿生手臂或机器人等机器。
“这项研究代表了将原始脑电波直接翻译成语言的开创性努力,标志着该领域的重大突破。说来自悉尼科技大学(UTS)的计算机科学家Chin-Teng Lin。
尽管DeWave在Lin及其同事进行的实验中仅根据两组指标之一实现了略高于40%的准确率,但这比之前从EEG记录中翻译思想的标准提高了3%。
研究人员的目标是将准确率提高到90%左右,这与传统的语言翻译或语音识别软件方法相当。
其他方法将大脑信号翻译成语言需要侵入性手术植入电极或笨重,昂贵的MRI机器,这使得它们在日常使用中不切实际——而且它们经常需要使用眼动追踪将大脑信号转换为单词级块。
当一个人的眼睛从一个单词跳到另一个单词时,可以合理地假设他们的大脑在处理每个单词之间会短暂休息。将原始脑电波转换为单词(如果没有眼动追踪来指示相应的单词目标)则更加困难。
来自不同人的脑电波并不都以完全相同的方式表示单词之间的中断,这使得教人工智能如何解释个人想法成为一项挑战。
经过大量训练后,DeWave的编码器将脑电图波转换为代码,然后可以根据它们与DeWave“密码本”中条目的接近程度将其与特定单词进行匹配。
“它是第一个将离散编码技术纳入脑到文本翻译过程的公司,引入了一种创新的神经解码方法,”解释林。
“与大型语言模型的集成也为神经科学和人工智能开辟了新的领域。
Lin 和他的团队使用了经过训练的语言模型,其中包括一个名为 BERT 的系统与 GPT 的组合,并在现有数据集人数谁有阅读文本时记录的眼动追踪和大脑活动。
这有助于系统学会将脑电波模式与单词相匹配,然后 DeWave 进一步训练开源大型语言模型这基本上是用单词造句的。
翻译动词是 DeWave 表现最好的地方。另一方面,名词往往被翻译为意思相同的词对,而不是确切的翻译,例如“人”而不是“作者”。
“我们认为这是因为当大脑处理这些单词时,语义上相似的单词可能会产生相似的脑电波模式。说第一作者Yiqun Duan,悉尼科技大学的计算机科学家。
“尽管存在挑战,但我们的模型产生了有意义的结果,对齐了关键词并形成了相似的句子结构。”
测试的样本量相对较大,解决了人们的脑电波分布差异很大的事实,这表明该研究比仅在非常小的样本上测试的早期技术更可靠。
还有更多的工作要做,当脑电图信号通过帽而不是植入大脑的电极接收时,信号相当嘈杂。
“直接从大脑中翻译思想是一项有价值但具有挑战性的工作,需要持续付出巨大的努力,”该团队写.
“鉴于大型语言模型的快速发展,将大脑活动与自然语言联系起来的类似编码方法值得更多关注。
该研究发表在NeurIPS 2023 会议,预印本可在ArXiv的.