5

总忍不住想接话?原来是你的大脑在疯狂"脑补"下个词丨PNAS | 量子位

 2 years ago
source link: https://www.qbitai.com/2022/08/36844.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

总忍不住想接话?原来是你的大脑在疯狂“脑补”下个词丨PNAS

head.jpg萧箫 2022-08-12 08:46:32 来源:量子位

通过语义音素词性“做预测”

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

聊天、读书或听讲时,你有意识到自己正在疯狂“脑补”吗?

其实,你的大脑就像一个自动补全机一样,每时每刻都在猜别人要说什么。

不仅如此,大脑还会不断地将我们从外界获取的信息(图像、声音和文本等)与脑内的预测进行比较。

基于这一理论,研究人员搞出了不少NLP模型,包括语音识别、自动补全等,但他们却发现,人的“脑补”能力还是比这些AI更优秀。

01acb96b87854bc2a0366d353317191a~tplv-tt-shrink:640:0.image

所以,究竟是不是人的大脑和AI“脑补”的方法不一样?

现在,一群来自马普所和奈梅亨大学(Radboud University)的科学家,决定直接测一测人们“脑补”时发出的脑电波。

对这些脑电波特征进行分析后,他们发现了背后更详细的原因。

收集大脑听书时的“反应”

此前,科学家们已经发现,大脑会对外界事物进行预测,来引导自己处理信息。

但大脑究竟是基于哪些条件(词类/音素/语义等)做出的预测,不同条件之间是否会相互影响,一直没有明确定论。

例如,单词和语义究竟是怎么影响大脑预测的,预测单词会不会对语义造成影响,都还不清楚。

因此,科学家们想出了一个方法:让志愿者们听有声书,观察他们的大脑反应,并采用GPT-2来对预测内容进行一个定量分析,将预测结果进行对比。

df8819e49e944f7d92cedb726156eda5~tplv-tt-shrink:640:0.image

他们先找来19名志愿者,测量并记录他们1小时的脑电波(EEG);随后,又收集了3名志愿者9小时的脑磁图(MEG),来定位大脑中具体位置的神经活动。

e188537efbba423e946a1634e9d1756c~tplv-tt-shrink:640:0.image

其中,脑电波小组听的是一小时《老人与海》,每次时长180秒,一共播放20次;脑磁图小组听的是9个小时《福尔摩斯探案集》,每次1小时,并被要求在两次间隔之间回答具体问题。

随后,从不同维度对这些数据进行分析,并得出了几点结论。

优先考虑“更高级”的预测条件

研究人员先是验证发现,大脑的预测是持续不断地产生的。

08242d244f7e4d96a5988839772ab2fe~tplv-tt-shrink:640:0.image

在这个过程中,科学家们也发现了AI预测和人脑的相似性。

例如,如果预测结果不符合实际情况(猜错了),大脑就会感到“惊奇”,变得空前活跃。

随后,他们将有声书的内容分成几个层次,包括词性(动词/名词/形容词)、音素(音标)和语义(用GPT-2做预测)这几个“级别”。

92a064b158034b9da7fe06e37ed655fa~tplv-tt-shrink:640:0.image

然后,通过MRI还原了大脑在进行不同层次预测时的“可视化图”。

80b7dd087ccb4e36954036c72f636f04~tplv-tt-shrink:640:0.image

结果显示,大脑在用词性、语义和音素进行预测时,不同层次之间会相互进行影响。

也就是说,更“高级”的预测条件会影响优先级较低的预测条件,如语义(上下文)就会对音素预测产生影响。

例如在“They say his father was a _____.”这句话中,如果仅仅凭借音素预测下一个音节,和通过上下文进行预测的结果是不一样的。

如果只用音素和频率进行预测,大概率会认为单词音标会以/fɔ/开头,但结合上下文的话,就更容易做出“fisherman”,也就是/fi/开头的单词预测。

0f9528f9624240f4b18d8618497a9cce~tplv-tt-shrink:640:0.image

这样看来,或许也能通过将几个层次的预测条件结合起来,增加语音识别或自动补全等AI的准确性。

28359c42fe3f405bb800e5a849b09b82~tplv-tt-shrink:640:0.image

一作Micha Heilbron,目前是内梅亨大学和马普所研究院,研究方向是认知和计算神经科学,对于生成模型对语言处理中的作用感兴趣。

528cec3eb04041feb63fc500342ae496~tplv-tt-shrink:640:0.image

Kristijan Armeni,目前在约翰霍普金斯大学读博后,博士毕业于内梅亨大学,研究方向是自然语言处理和认知神经科学。

同样参与研究的几名作者Jan-Mathijs Schoffelen、Peter Hagoort、Floris P. de Lange也分别来自内梅亨大学和马普所。

对于这项研究,有网友提出了自己的观点,即大脑本身就是一种机制,会基于一种反馈回路做出决策和行动。

6fe55591df4745398f535a275298ff7c~tplv-tt-shrink:640:0.image

但也有网友从自己感受来看,大脑这个“预测机器”似乎经常出错。

cd77dbbef52f46a1a45d80d6d13bdead~tplv-tt-shrink:640:0.image

对此有网友提出了自己的观点:

毕竟大脑是个生存机器,而不是“真相检测仪”。如果说谎能促进健康,那么你的大脑便会选择说谎。

论文地址:
https://www.pnas.org/doi/abs/10.1073/pnas.2201968119

参考链接:
[1]https://news.ycombinator.com/item?id=32395840
[2]https://www.mpi.nl/news/our-brain-prediction-machine-always-active

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK