811 阅读 2023-03-13 18:14:49 上传
提要:本文综述神经涌现论相关文献,介绍其历史背景、主要观点、必要性、与先天论的论战与融合、主要应用课题,并对其进行评价。神经涌现论认为复杂认知功能起源于大脑现有机制的互动,即重复利用已有的大脑神经区域。这一理论是涌现论在神经认知科学领域的拓展,为该领域提供了一种和主流的模块论不同的语言与大脑关系研究框架。
关键词:神经涌现论;神经重复利用;大脑;语言
引言
在语言与人类大脑关系的研究热潮中,已经形成了先天论和涌现论两大主流理论范式。先天论持模块论,认为人类大脑中有专司语言功能的模块,语言知识在大脑中表征为规则系统,至少某些语言能力是先天的或领域独有的。涌现论认为语言知识在大脑中表征为网状的激活扩散系统,语言能力是通用认知能 力、语言经验、环境等多因素互动的结果。
涌现论的多个流派如联通论、频率论、动态系统论、复杂适应性系统论、互动协同论、加工决定论等已为学界熟知。然而其最新发展—神经涌现论(Neuroemergentism) 还未引起我国学者的关注。神经涌现论的前身是感觉运 动假设 (即感觉运动机制的限制可以影响语言发展) 以及双语发展过程是动 态非线性系统的假设。神经科学领域近期的多项研究进展都符合涌现论,但用涌现论这个术语来概括这些成果显得过于笼统,因 此 Hernandez et al. (2019a) 提出了神经涌现论。《神经语言学》杂志 (Journal of Neurolinguistics) 于 2019 年组织了一期神经涌现论专刊。本文以此为基础对神经涌现论最新相关文献进行述评。
2. 主要观点
神经涌现论的主要观点有三: 1)复杂认知功能起源于大脑现有机制的互动;2)语言深受个体的身体(特别是大脑)的特性影响;3)低层认知系统的细微变化会导致高层认知系统的巨大差异。首个观点来源于神经循环假设 (Neuronal Recycling, Dehaene & Cohen 2007) 和神经重复利用假设 (Neural Reuse, Anderson 2010),第二个观点则基于大脑塑造语言假说 (Christiansen & Chater 2016),而最后一个观点来源于神经建构主义 (Neuroconstructivism, Karmiloff-Smith 2009)。神经循环假设认为人类通过重组已有的大脑区域来学习新的文化发明。文化发明是指任何影响人类思维方式的认知技能,如阅读和算术等。人类学习新文化发明的过程不是基因重构而是神经循环利用过程。以阅读技能为例,大脑 皮层左枕侧颞沟 (left occipitotemporal sulcus) 有一块区域叫做视觉词形区(the visual word form area,VWFA),不仅负责文字解码,也负责人脸识别或其他物体识别。Dehaene et al. (2010, 参见 Hernandez et al. 2019a) 发现,在阅读文字时,有阅 读能力的受试大脑中VWFA 会处于激活状态,而文盲受试大脑中这个区域处于不活跃状态,但在看跳棋棋盘或进行人脸识别时又会被激活。因此,阅读能力的形成并不意味着大脑中产生了专司阅读的区域,而是利用已有的负责物体识别 的功能区域来拓展出新的阅读功能。也就是说,人脑中的神经认知系统就像环 境中的资源一样可以循环使用,而不是每当需要处理新的功能时就要生长出新的模块。人脸识别、数学、阅读等认知能力都是通过循环利用已有的神经结构而形成的。
神经重复利用假设在神经循环假设的基础上更进一步,认为所有新技能都是重复利用已有的神经基础。一个典型的大脑区域会在多种认知活动中被重 复使用,新认知功能的产生是通过大规模重新配置现有大脑区域实现的。负责旧功能的区域通常位于大脑的后部,新功能位于前部,所以测量大脑区域的演化时长比简单地进行功能分区可能更重要。旧功能更有可能由大脑中某个固定区域负责,而新功能则不大可能固定到某一区域 (localized),功能适应在大脑某个区域所执行的新旧功能比较相似时更有可能成功。和注意和感知等技能相比,语言属于新近产生的技能。对大量实证研究的综述 (Anderson 2010) 表明,语言任务比注意或感知任务所激活的大脑区域更为分散,说明语言任务利用了比一般认知任务更多的大脑神经资源。语言神经回路的激活与多项认知任务如视觉、记忆、注意等有关,体现了人脑利用已有神经资源来执行新功能的机制。此外,研究还发现大脑中 66%以上的区域至少在3种以上不同任务中会被激活,只有 17%的大脑区域仅在单一任务中被激活。根据这些研究结果, Anderson 提出,人类认知利用现存的大脑回路比创造新的回路更有效率,越是新近产生的认知功能所激活的大脑区域也越大并且更分散,所利用的现有神经资源也越多。
大脑塑造语言假说认为语言是适应大脑特点的演化系统,语言结构特征反映了语言使用者的神经认知机制。大脑塑造语言假说既从群体发生角度也从个体发生角度考察语言的演化。Christiansen & Chater (2016) 认为构式最能体现群 体发生和个体发生的统一。构式语法认为语言是构式的清单,语言习得和加工都是基于构式的,受领域通用的认知机制如文化传输、知觉运动加工等制约。语言演化是自然选择的过程,是通过选择合适的构式以更好地适应已有的神经基 础的过程。语言经过演化逐渐适应大脑,而不是相反。自然语言因能够被人类使用而存在。构式易于加工和习得,符合语言结构演化机制,是自然选择的基本单位,更有可能被后代继承。
神经建构主义认为生命早期认知系统的微小变化可能导致后期复杂认知系统的巨大差异。人的智能是动态的而不是静态的,在生命早期,大脑中的神经是互相关联的,随着年龄的增长才逐渐形成负责不同功能的专门的区域。大脑神经网络间的联结和失联都能揭示高层认知发展的过程 (Karmiloff-Smith 2009)。传统的神经科学研究试图寻找认知缺陷和大脑某个区域的关系,但这样做可能会忽视以下问题:某个完好的大脑区域可能存在细微的缺陷。大脑并不一定是有选择地损伤,某个微小变化可能会影响整个认知系统。例如,数字计算这种高层认知能力的缺陷可能是由低层认知能力如视觉和注意系统的某些微小缺陷导致的。某种高层认知能力的缺陷可能不是大脑中负责这一功能的区域出了问题,而有可能是低层或通用认知能力有某些缺陷。人的认知发展尽管很早就表现出由大脑皮层某个区域负责某种功能的特点,但实际上是环境的影响和区域竞争最终促使大脑中形成了领域独有的能力。
以上四个假设都符合涌现论思想。Hernandez et al. (2019a) 认为这四种假设应该统一到神经涌现论框架下,因为它们都认为高层认知功能是由已有的认知系统和环境、经验互动的结果。
3. 必要性
神经涌现论提出后引起了很多质疑,其中最主要的是这一术语是否必要。Tachihara & Goldberg (2019) 认为涌现论已经可以涵盖神经涌现论探讨的所有现象,因此无需再发明神经涌现论这个新术语。语言的涌现还受人类融入社会的动机,社会规范,基于统计的学习能力,交际压力以及领域通用的认知机制如注意、记忆、范畴化、认知控制等因素影响,而不仅是神经资源的重复利用。
MacWhinney (2019) 也表达了类似的看法。他认为自然中充满了涌现现象,涌现现象体现了结构、合并、层级、制约条件、框架、时间刻度等范畴的互动,语言也是如此,人类语言受基因、个体发生、巩固、加工、社会等五类过程制约。在这些过程中,基因过程变化最为缓慢,因为涉及镜像神经元、发声系统、 FoxP2 基因等要素,而语言使用导致的语言技能和大脑表征的联系则变化较快,变化最快的是在线的会话加工过程。从时间刻度来看,新结构跨越不同演化阶段涌现时会出现功能变异,而新结构跨越不同个体发生阶段或表观遗传阶 段涌现时会循环利用已有神经系统。神经循环或重复利用仅仅是一个层面中 的涌现现象。
Hernandez et al. (2019b) 对神经涌现论这一术语是否必要的回应是,涌现论概念过于宽泛,很难证伪,要使涌现论成为能够用实验来证明的科学,最好先缩小其研究范围,但也不能象神经循环假设那样过于聚焦某一具体现象。神经涌现论也称神经计算涌现论 (Neurocomputational Emergentism),选择神经计算层面 作为研究对象,是为了更加精确地限定涌现机制运作的范围。要消除对涌现论 可证伪性的质疑,研究者需要在不同层面确定具体的涌现现象,要提出可证伪的 具体假设,而仅仅使用涌现论已不能满足学科发展的这种需求。
4. 与先天论的论战与融合
在涌现论和先天论的论战中,涌现论阵营比较欠缺的是神经运作机制方面 的理论和实验证据。神经涌现论的提出弥补了这一缺陷。在此之前,神经认知科学中支持涌现论的理论和实验是零散的、不成系统的,而支持先天论的研究则已经有很多比较系统的归纳总结。例如,Friederici (2017) 收集的大量神经语言学实证研究成果支持语言层级结构是人脑独有特征的观点,符合先天论的模块观。但是,也有一些不符合先天论预测的证据。例如,Pylkkänen (2019) 对句 法和语义组合性神经基础的探讨发现,很难将语义组合和句法剥离开,因此很难证明有独立存在的句法加工。这些不符合先天论的研究结果需要进行系统归纳,并上升到理论高度,神经涌现论正是应这种要求而提出的。
尽管涌现论和先天论是对立的理论,但也不是绝对不可调和的,两种理论可以相互提供启示。Tachihara & Goldberg (2019) 认为神经涌现论者所举的一些例子如面部识别也可能符合先天论,因为区分朋友和敌人肯定是人类进化出来的一种能力,儿童很小时就能区分不同的脸。面部识别并不一定是循环利用已有的神经资源,也有可能和识别其它物体的机制是相似的。人们在进行面部识别的同时也可能在辨认不同个体的人,或在识别他们的表情,而这些识别能力与梭状回面孔区 (fusiform face area, FFA) 并无直接关系。同样,神经涌现论的一个重要启示是,很多看起来符合领域独有观的神经反应研究证据也可能从涌现论视 角进行解读。Javis (2019) 提出,人类语言能力是多个组件协同互动的结果,一些 动物的大脑中也有部分语言组件,只是没有人类大脑那么高级和全面,所以人类和动物的语言能力可能是连续性的,而不是简单的有和无,或领域独有与领域通用的对立。
探讨涌现论和先天论兼容的方案已经成为一种趋势。生成语言学持模块论,但也只是认为句法是由大脑中的模块负责的,而不是语言的所有方面都是如此。Sharwood Smith (2019) 认为,认知的复杂性也可能是专门负责某功能的神经系统和环境经验互动的结果,不一定要通过牺牲模块论的方式来解释。神经系统天生就具有模块性,只是随着和环境的持续互动,处理新功能的更复杂的模块会“涌现”而已。生物学上群体发生的组织符合模块论是没有争议的,有争议的是个体发生的组织以及组织架构在出生时的初始状态。神经涌现论所列举的实验结果仍然存在很大争议,在当前的科学实验水平下,求同存异也许是更好的选择。Sharwood Smith (2019) 的模块认知框架 (Modular Cognition Framework, MCF) 就是顺应这一趋势的尝试。MCF 认为语言涉及多个区域的互动。在 MCF 中,多个系统如概念结构系统、视觉系统、听觉系统采用并行加工的 方式,这些模块和它们各自加工原则的结合被用来解释语言的加工和习得。
5. 应用
除了上述专刊外,近年来不断有新的研究探讨神经涌现论的应用。所涉及的课题包括双语者认知能力的发展特点,语言习得的关键期,词汇和语法学习的神经机制,身体和环境的限制对认知发展的影响等。
5.1 双语认知
双语者和单语者认知是否有差异以及双语者是否有认知优势存在争议。如果双语者存在认知优势 ,这将是神经涌现论极好的例证。有研究 发现 (Hernandez et al. 2019a; Arredondo et al. 2022),双语经验可能会导致大脑中神经元之间联系性分布的变化,改善神经资源的提取效率,从而促进认知能力 (如执行控制能力)的提高;某个认知领域(如语言)的经验可以促进其他认知领域 (如视觉感知)的变化。这些发现符合不同认知功能可以互动的神经涌现论思想。Kovelman & Marks (2019) 指出,神经涌现论的一个重要观点是量变会引起质变, 双语习得是非常理想的检验这一观点的具体领域。例如,双语阅读能力的发展可 能会引起神经层面的变化,说明系统地使用双语不仅可能会使双语者两种语言水 平从量上逐渐提高,还可能出现质的变化,形成与单语者不同的新语言加工系统。
神经涌现论认为双语发展具有非线性动态特征。Hernandez (2013) 把双语 发展过程比作生态系统中的两类物种,它们可以和平共处并分享资源,但在有压力的情况下会竞争资源。Claussenius-Kalman et al. (2021) 也认为双语表征可能 反映了复杂的学习环境、个人的基因类型和不同认知能力之间的动态互动,学习环境和语言特征构成了生态系统,学习者的个体特征导致了不同专长 (expertise) 的形成,生态系统和专长的互动促进了双语认知特点的形成。
5.2 语言习得关键期
最近,语言习得的关键期研究有了新的重大发现。Hartshorne et al. (2018) 通过对大样本受试进行语法测试,并用计算机模型分析数据,发现句法学习能力在 17.4 岁后急剧下降,从而得出句法习得的关键期大概是在 17 岁左右。这一发现和传统上关于关键期是青春期开始前的结论有较大差异,也对否认关键期的观点是一种挑战。Hernandez et al. (2021) 运用神经涌现论对语言习得关键期较晚 结束的研究结论进行了解读,指出大脑在处理某些任务时,相邻区域的互动会使这些区域仅仅对与任务相关的行为刺激敏感,而对不相关的刺激逐渐不敏感,从而导致大脑区域专门化的发生,认知技能的发展程度和大脑中相关区域的专门化程度对应。年龄小的学习者大脑区域的互动性越好,在学习语言时可以整合 多种技能,而年龄大的学习者的适应能力则较弱。句法习得的关键期要到青春 期后期才结束的原因可能是大脑相关区域的专门化需要较长时间的神经发展过 程。另外,句法学习能力的减弱还有可能与一些通用认知能力的减弱有关。
5.3 词汇与语法的神经机制
词汇和语法的神经机制是否有差异一直是语言学界争论的焦点。按照模块论,词汇主要与联想记忆系统有关,语法与符号运算系统有关。按照联通论,词汇和语法没有本质区别,都由神经网络负责。Stocco (2019) 试图调和这两种观 点,一方面承认词汇和语法的神经机制不同,另一方面又试图用涌现论来解释两 种不同的神经机制。他认为负责词汇的是从长期记忆中理性提取信息的贝叶斯系统,负责语法的是增强式学习系统 (Reinforcement Learning),前者由海马回 (hippocampus) 区域负责,后者由基底神经节 (basal ganglia) 负责。记忆提取系统 通过理性分析方式考察输入的频率、新近性、和语境等因素,以实现记忆的最优 化。
词汇习得依赖海马回区域体现了利用已有神经资源处理新任务的思想。负责语法的增强式学习系统是一种机器学习理论,和基于统计的学习方式有一些 共同之处,但特点是学习行为受“奖励”驱动。语法学习者所受到的奖励是成功 的意义交际。由于这一系统并不专司语言功能,因此也符合神经涌现论。
5.4 环境和个体差异
神经涌现论强调环境和个体特征对语言习得的影响。环境因素包括目标语的输入特征、学习环境、语言使用等。D'Souza & D'Souza (2019) 认为环境是复杂适应性系统,语言也一样。儿童通过采样、选择、活动来建立关于世界的模型,而环境也会限制儿童的语言和认知发展。高层认知的涌现不仅是基因和环境互动 的结果,也与身体以及个体差异有关。儿童的身体会引导和限制语言的发展,例 如,儿童能通过所处的空间来避免指称歧义问题,与父母的物理和社会距离可预 测其词汇量的扩展。个体差异表现在语言学能的各个方面如注意能力、工作记忆容量、认知控制、认知灵活性等。Isbilen et al. (2019) 认为个体的组块能力很大 程度上可以预测其语言加工能力。为克服工作记忆容量的限制,语言使用者通 常会采用组块式的加工机制,符合组构特点的语言单位才会在语言演化中保存 下来。
6. 评价
神经涌现论是关于语言和认知的神经基础的理论。语言既属于心智系统, 也具有生物基础,与大脑关系密不可分。心智/大脑概念的辨析一直是认知科学 的一个难题 (胡朋志 2014)。就目前的自然科学水平而言,从生物学和生理学角 度还难以解释人类语言的大部分奥秘,所以现有研究主要从心智角度探讨语言的属性。Marr (1982) 认为心智可以从三个层面来研究:计算层面、算法层面和硬 件层面。各种认知模型对于不同层面的考察顺序有争议 (Griffiths et al. 2010)。自上而下的模型先从外界的问题和大脑的功能出发,再探讨神经基础,也就是先 从计算层面来模拟大脑的工作机制。涌现论是自下而上的模型,主张从神经机制出发,再探讨高层认知。语言学领域的生成语法关注的是计算层面,而涌现论 则关注算法和硬件层面。涌现论中早期的联通论面临的批评是难以确定联通网 络和神经回路是否对应,因为当时算法和硬件层面的研究还不够成熟。神经涌 现论则是在神经科学研究取得重要进展的背景下提出的,比联通论有了更为坚 实的实证支持。
神经涌现论的提出促使模块论和涌现论之间的对话更加深入。神经涌现论提供的不是抽象笼统的解释,而是具体的、可预测的和可检验的框架 (Marian & Hayakawa 2019)。涌现论仅仅将语言的神经基础看作联通网络是不够的,需要进 一步探讨哪些通用的或低层的认知能力与语言有关。例如,Koranda et al. (2022)发现语言产出中句法规划和一般的行动规划具有相同特点,说明句法规划可能不是语言独有的而是通用认知能力。同样,赞同先天论的研究者也不能再忽视 神经认知领域越来越多的符合涌现论的实验结果,要进一步考虑语言能力在哪些层面以及哪些区域已经本地化,而不能简单地认为语言能力都是领域独有的。
神经涌现论也为神经语言学实证研究提供了一个新的解释框架。例如,对 语言障碍人群的研究可能不应该仅仅关注他们大脑中某个可能受损伤的模块,完好的模块的一些细微差别也可能导致语言能力甚至整个认知系统的巨大差 异。又如,二语习得研究通常将成人学习外语普遍失败的现象归因于普遍语法不再可及或参数不能重设,从神经基础来说,就是语言模块在大脑已经侧化后失 去了可塑性,导致中介语表征特别是句法表征不能完整地建立。涌现论对于中介语损伤现象没有给出合理的解释,而神经涌现论弥补了这一不足。按照神经 涌现论,中介语表征的损伤不一定是语言模块的问题,而可能是其它模块或通用 认知能力有了一些细微变化造成的。
神经涌现论对二语习得领域现有的涌现论各派观点是一种超越。例如,互动协同论认为互动可以促进二语习得,而神经涌现论则要探讨互动促学过程中 神经机制的变化。频率论认为输入频率是二语习得的关键,而神经涌现论则需要考察输入频率如何影响大脑中神经区域的变化。传统观点认为不同的环境会影响二语习得的效果,而神经涌现论则要探讨不同环境 (如浸入式和课堂教学) 与左右脑中的不同神经网络的激活是否有关。
神经涌现论文献目前还存在一些混乱。当前学界关于词汇和语法的神经基 础的认识并不一致。语言涌现论的一个重要观点是词汇和语法都是构式,其心理加工机制应该相同,而神经涌现论中有的文献却认为词汇和语法的神经基础 不同。Stocco (2019) 认为语法学习利用的是增强式学习机制,这和将语法看作 程序性知识的传统观点差别不大。增强式学习只是机器学习的一种方式。当前深度学习成为机器学习的主流,采用的是神经网络模型。涌现论一直主张语法在大脑中表征为神经网络,而语言计算模型中最为成功的也是神经网络模型。神经涌现论领域的学者需要就此尽快达成共识。神经涌现论似乎也象涌现论一样有解释过多语言相关现象的冲动。很多关于环境和个体差异如何影响神经机制的研究虽然很有意义,但将其归入涌现论并 没有充足的理据,反而可能会造成理论的偏见。神经涌现论最大的价值还是在于论证通用认知能力与高级认知能力 (如句法加工) 的关系,没有必要面面俱到。
7. 结术语
过去二十多年中,由于神经影像学技术的发展,fMRI、fNIRS、ERP、EEG、MEG、DTI 等技术手段日益普及,神经认知语言学领域的实证研究论文呈爆发式增长状态 。在这背景下,需要及时对已有的实证研究进行归纳反思,Hernandez 等人提出的神经涌现论与其说是一种新理论,还不如说是对大量神经 认知科学研究文献进行的一种梳理和概括。不过,神经涌现论的提出使得语言 学与神经认知科学的交叉研究从零散走向系统,从自发走向自觉。神经涌现论 虽然关注语言能力,但其最终目标是通过寻找语言背后的神经或心理机制来解 释人类的认知能力,而语言学对语言结构的细致分析、语言习得过程的描述和双 语认知的探讨为检验神经涌现论提供了丰富的课题,这两个领域的互动必将大 大促进认知科学的进展。