第一次大规模人口迁徙原因(最早的语系没有人群迁徙)
第一次大规模人口迁徙原因(最早的语系没有人群迁徙)亚马逊流域。图片来自《亚马逊萌猴奇遇记》(Amazonia 2013)。在印欧语和南岛语这样的大语系中,以上两个过程造成的结果非常显著。相距动辄成千上万千米的一些语言,却具有显而易见的种系亲缘关系。例如,英语和孟加拉语,马来语和塔希提语,纳瓦霍语和加拿大的阿萨巴斯语。另一方面,在一些特定区域,不同语系表现出共同的区域特征。语言学家讨论较多的这类“语言区”包括印度次大陆、中美洲、巴尔干半岛和亚马逊盆地。然而,需要强调的是——这些区域内的语言,尽管存在互动,但一直保持它们自身的种系关系。比如,我们并没有在印度次大陆发现存在结构和词汇上混合了印欧语、达罗毗荼语、藏缅语和南亚语而无法分类的语言。另一个研究很充分的案例是亚马逊的沃佩斯(Vaupes)地区,那里的一些群体甚至实行异语外婚制(即人们必须和来自其他语言族群的人通婚),然而,尽管本地语系存在结构趋同和普遍的多语现象,但类似阿拉瓦语和图卡诺语
原文作者|[澳]彼得·贝尔伍德
摘编|罗东
《最早的农人:农业社会的起源》,[澳]彼得·贝尔伍德 著,陈洪波 等译,上海古籍出版社,2020年10月。
语系发生及其网络:“语言区”,或“语系树”
语言学家以及那些对比较历史语言学感兴趣的历史学家、考古学家和人类学家,都倾向于认为语系的历史有两种类型: 一个是从母语言到子语言的系统发育过程(即“语系树”模式),另一个是共同进化模式,强调相邻语言之间的互动作用(即“语言区”模式)。
语言学家鲍勃·迪克森认为,语系的存在是由于语言短期内间断性扩张所致。语系表现出共同的区域语言特征,这则是长期持续互动和借用过程的结果。正如他所说:“每种语言都有可能与其他语言有两个相似之处: 第一个是基因的相似性,它们出自同一种原始语言;第二个是地域的相似性,这是因为各语言在地理上相邻,相互借用造成的”。还有第三个可能,即巧合导致的相似,但这一条对于我们的讨论无关紧要。
电影《疯狂原始人》(The Croods 2013)画面。
在印欧语和南岛语这样的大语系中,以上两个过程造成的结果非常显著。相距动辄成千上万千米的一些语言,却具有显而易见的种系亲缘关系。例如,英语和孟加拉语,马来语和塔希提语,纳瓦霍语和加拿大的阿萨巴斯语。另一方面,在一些特定区域,不同语系表现出共同的区域特征。语言学家讨论较多的这类“语言区”包括印度次大陆、中美洲、巴尔干半岛和亚马逊盆地。然而,需要强调的是——这些区域内的语言,尽管存在互动,但一直保持它们自身的种系关系。比如,我们并没有在印度次大陆发现存在结构和词汇上混合了印欧语、达罗毗荼语、藏缅语和南亚语而无法分类的语言。另一个研究很充分的案例是亚马逊的沃佩斯(Vaupes)地区,那里的一些群体甚至实行异语外婚制(即人们必须和来自其他语言族群的人通婚),然而,尽管本地语系存在结构趋同和普遍的多语现象,但类似阿拉瓦语和图卡诺语这样的语系在种系上仍然保持内在的一致性。
亚马逊流域。图片来自《亚马逊萌猴奇遇记》(Amazonia 2013)。
另一个重要的基本概念是新语系的最初形成。按照迪克森的看法,新语系的形成相当之快。由于内部(遗传因素)和外部(地理因素)两个方面的原因,语言一直处于持续变化中。比较一下盎格鲁撒克森英语、乔叟的英语直到E.M.福斯特的英语,或者将现代罗曼语(Romance)诸语言与其共同的祖先拉丁语相比较,就明确无误地证明了这一点。因为这个理由,可以推断,那些分布范围广大的语系,例如印欧语系和南岛语系,应该是在距今很近的年代就达到了目前的地理范围,它们当今所有的语言分支仍然表现出拥有共同的源头就是证明。有些语言学家推算,语言可以追踪到的时间上限在距今7000年到10000年,早于这个时间,文化中常用的基本词汇表中的共有同源词百分比不会超过5%—10%。
因此说,如果早期印欧语系人群从起源地传播到遥远的冰岛和孟加拉所用的时间超过了1万年,那么印欧语系的存在状态不可能像今天这样还可以被语言学家清晰地辨认出来。
以上的表达似乎有点不好理解,但它确实表明,今天属于农业族群的各大语系确实是全新世而非更新世发生的现象,它们的历史完全处在以农业方式从事食物生产的时间范围之内。
语系的识别与种系关系
梵高作品《第一步》。画面是一个农村的耕地,背面是农民的房屋。
南岛语系包括大约1000多种语言,分布范围横贯半个地球,从马达加斯加直到复活节岛。南岛语的使用者大约有3.5亿人,大部分在东南亚,特别是印度尼西亚和菲律宾。南岛语系中各语言的使用者人数不一,从几百人(如西太平洋土语)到超过6000万人之众(爪哇语)。南岛语族群大多数是亚洲人种,但西太平洋上的美拉尼西亚人很多也说南岛语,就像菲律宾的尼格利陀人一样。在西方殖民时代之前,这里区域文化的发展差异巨大,从印度教和伊斯兰国家到森林狩猎采集游群各种形态均有。
然而,南岛语族各实体的这种时空分布状态并不是毫无来由的。尽管南岛语族分布十分广大,而且有一些其他族群特别是西美拉尼西亚人是后来学会的南岛语,但它们在语言和文化上有一个共同的核心地区,所有语言都是由此发散出来的。
再来看一些相关概念。语系(language family),是指一组语言,具有一套同样的语言特征,主要是从语言发展的早期阶段保留下来的。某些重要特征确实来自语言肇始期(原语言阶段)的发明,当然如果没有其他外部语言作为佐证,这一点还无法确认。语系或语族由关系亲密的语支(subgroup)构成,语支的共同特点是有创新(而不是对原来特点的保留),类似于生物分类学上的派生或自形特征。
不可否认,对同源词的识别复杂而困难,在理论上这会影响历史解释的准确性。例如,如果一个语支所有的语言在分化不久都开始借用,那么借词通常就会模仿同源词。但在这种情况下,这些早期借词与真正的同源词(一般是继承而来)一样,因产生于类似的地理环境而内在含义相近。
此外,如果出自祖先语言中的保留词只是保存在一个语支而非在周边语支均有,经常会被误以为是创新词,这样传播较远的真正的同源词就会被忽略而得不到记录。在这些情况下,语言研究的样本密度显然非常重要。人们必须搞清楚,其他语言是真的没有这些词,还是没有被记录下来。
语系树建构起来之后,从中可以发现语言的某些特征。所有语言都有一个可重建的祖型——原始语言(proto language)(或者是一组多层次的原始语言),表现出一套可复原的特征。对于试图重建古代文化的史前学家来说,最重要的特征词汇是传达了最原始含义的古代事物。
如果复原出的事物词汇其现代含义宽泛而且与其他词汇含义交叠,那么价值就比较有限,但一般来说,这类原始词汇是非常有用的文化信息来源。例如,原始语言的重建证实,下文讨论的很多重要语系确实植根于农业人群而非狩猎采集者。语言分析有时也能揭示出一种特定的文化特征是来自原始语言最初出现的时候,还是后来才引入的。因此,西太平洋地区许多与农业、航海、渔业和制陶有关的物质文化看起来可以连续不断地回溯到原始海洋语阶段(Proto Oceanic stage),即太平洋地区所有南岛语言的最初发展阶段,大约距今3500年。类似的情况,根据白乐思的说法,密克罗尼西亚马里亚纳群岛查莫罗语(Chamorro)里的大量词汇,是在大约距今4000年前直接来自原始马来波利尼西亚语,而不是更晚时候通过借用来到这些岛屿的。
狩猎的“原始人”。
然而,人们一定会问,如何确定所重建原始语言的地理范围?它只在某个村子使用,还是在一个大的方言区广泛流行?很久以前,戈登·柴尔德曾经评论原始印欧语:“雅利安语(原始印欧语)起源的摇篮在地理上必定是一个统一的整体;单是语言资料就体现出存在一组方言体系,在特定区域或大致相同的统一地理环境中构成了一个语言连续体。”莱曼的观点与之类似:“很显然存在一个社群,不管其规模大小和内部一致性如何,它们在一段时间内都说着后来名之为原始印欧语的相对统一的语言,而且这个社群还具有自己独特的文化。”但这并不意味着语言一定发源于某一个单一族群,比如说来自一处村落。正如迪克森所指出的那样,一个特定语系“可能并非来自单一语言,而是来自某个小区域内一组结构和形式类似的不同语言”。但是,一个原始语言不能在多个不相关的语言方向上走得太远,否则会破坏其内涵的统一性。
另一个方面,不同语系树可能有强弱之分,或者语系树在其不同发展阶段有强有弱。强语系树的形状就像真正的树那样,具有明显的根和发散出的枝。举一个例子,波利尼西亚语在其早期分化过程中形成了完整的树状结构,其中包括一种现在研究很透彻的原始语言——原波利尼西亚语。根据安德鲁·帕利的研究,该语言有大量创新内容,包括多达1392个事物名词(其中也有一些可能是同源词,但在波利尼西亚之外尚未发现)、14项形态特征和8项语法特征。所有这些都是在一个边界清晰且统一的起源地创造出来的,地理位置在大约公元前1000年到公元500年的西波利尼西亚,特别是汤加和萨摩亚群岛。这意味着存在一段漫长的发展停滞期,就相关考古材料来看,停滞了1000多年,在此期间,本地区人群之间保持交流联系,共同经历了大量而广泛的语言变化,但这些变化从未传播到周边其他地区,如斐济或瓦努阿图。
大麦地岩画(宁夏回族自治区中卫市)的史前岩画。
一般来说,语系的发源地,就像古生物学那样,最可能的地方是语支最早分离的地方,或者说语系树开始分叉的地方。但是,请记住,要想确定这一点,我们必须要有一个强语系树。如果是一个呈“耙形”结构的弱语系树,那就不太可能确定语言的准确起源地。幸运的是,许多语系都同时包含了耙形和树状两种分支结构。例如,印欧语系的大多数语支是耙形结构,但是古代安纳托利亚语有足够的特征说明印欧语系可能起源于土耳其的某个地方。同样,马来波利尼西亚语支也是耙形结构,但是,在南岛语系里,台湾土著语不属于马来波利尼西亚语支,而是形成了几个第一层语支,非常有力地证明了台湾岛是南岛语言的发源地。另一点需要注意的是,语系并不总是起源于当前分布范围的中心。中心区域起源的推断显然不适用于类似南岛语和贝努埃刚果语(包括班图语)这样的语系,这些语系早期基本上是从发源地单向向外传播的。
语言和语系是怎样传播的?
语言学家一般假设,一个真实存在的语系,一个可以通过对共享创新的比较研究得以证明的语系,其内部结构系由遗传构建而成,包括人群扩张过程中形成的多层次的可复原的原始语言。从比较的角度来看,这是唯一有意义的解释。历史资料表明,如果语言单独传播,没有伴随本语种人群的迁徙或者扩散,那么永远不可能产生我们所讨论的这种跨大洲级别的基因相似的语言群。人们只需要考察一下过去许多大帝国的多种多样的语言历史——亚述、阿契曼尼德、希腊、罗马、蒙古、阿兹特克,甚至西班牙和英国——就会意识到这一点。如果征服者没有进行大规模永久性移民,单靠帝国征服本身,那么长期来看,当地很少会去使用外来语。
以大航海时代为背景的电影《哥伦布传1492》(1992)剧照。
贸易在大规模语言传播过程中的作用也不大。在注重贸易的巴布亚新几内亚,语言的多样性在民族志时代达到了创纪录的水平(新几内亚当时有大约760种语言),现在这里普遍使用巴布亚皮钦语(一种混合语言——译者注)和英语,在很大程度上这是现代力量如国家、文化、电视和族外婚等造成的社会巨变的结果。然而,即使存在所有这些诱因,巴布亚皮钦语的统治地位仍然只是整个太平洋范围内的一个局部现象,而且规模和遥远的史前时期相比完全不可同日而语。由此可见,征服、贸易和文化扩散可以传播语言,但除非得到另一个因素——语言使用者自身移民活动的支持,单靠传播永远不会达到跨洲大语系的规模。
这里我不再过多引用其他历史文献,重点以公元7世纪阿拉伯人征服世界为例,来证明上文所说语言传播必须有其使用者参与方能成功的观点。我们首先看一下阿拉伯语本身的传播情况。在约旦和叙利亚的部分地区,早在7世纪前已经有大量阿拉伯语人群从阿拉伯半岛北迁至此,所以穆斯林征服这里的时候并未发生多少语言取代。将阿拉伯语引入伊拉克和埃及则需要进行征服活动,途径是通过驻防此地的阿拉伯士兵(如开罗附近的福斯塔特驻有大约40000人)及其家庭传播开来。因此,此地阿拉伯语的出现毫无疑问是通过移民和士兵之口开始的,不管后来此地(例如整个北非)有多少人学会了这种语言。
然而,阿拉伯的征服行动并没有延伸到南亚或东南亚,甚至没有直接进入伊朗和巴基斯坦。结果,今天世界上绝大多数(也许是80%)的穆斯林(其中印度尼西亚的人数远远超过其他任何国家)不会说除《古兰经》之外的阿拉伯语(外来词除外)。在念诵《古兰经》时,他们实际上使用的也是7世纪的阿拉伯语而不是现代阿拉伯语。正如曼斯菲尔德所说:“尽管阿拉伯语言和文化在伊斯兰世界中占有特殊和优越的地位,但只有约五分之一或六分之一的穆斯林说阿拉伯语。”这给了我们一个典型的反面例证——没有人口迁徙就没有语言传播,和宗教状况没有什么关系。
伊斯兰教在印度尼西亚的传播重复了一个1000多年前曾经发生的故事。一千多年前,来自印度的印度教和佛教也在这里传播过,但同样也没有大量人口迁入东南亚,除了少数商人和宗教人士。尽管印度的宗教和王权制度对印尼有着深刻的社会文化影响,马来语和爪哇语借用了数百个梵语、帕拉克里语和泰米尔语词汇,然而,印尼人从来没有转而使用印度语。除了偶尔学习一下之外,印度尼西亚语和印度语甚至没有因为相互联系而产生任何明显的形态上的相似性。正如科林·马西卡所指出的那样,仅靠宗教和政治的力量并不足以促进语言融合,而是需要人群之间“打破结构地亲密交往”。
所有这一切说明,阿拉伯语基本上只在中东和北非被征服地区的阿拉伯移民者口中传播,而且在早期,似乎其他非阿拉伯人很少转向使用该语言。毫无疑问,整个过程是由阿拉伯语与《古兰经》的联系所推动的,但这显然不是阿拉伯语传播的重要驱动因素。当然,在后来的几个世纪里,许多非阿拉伯血统的中东人和北非人肯定采用了阿拉伯语,但这有点离题,我们这里关注的是最初的传播及其因果关系,这显然不是语言转换带来的传播,而是母语使用者迁徙造成的。
电影《疯狂原始人》(The Croods 2013)画面。
相反,由于人口源源不断地从英国大量迁徙到美洲和澳大利亚,英语也因此传播到了这两个地区。然而在被英国人征服和控制的另外一些地区,比如南亚、非洲大部和马来西亚,密集的土著人口外加热带疾病使得殖民进程陷于困境,阿尔弗雷德·克罗斯比曾经对此做过精辟的描述。如今,非洲、印度和马来西亚的英语主要是精英阶层在使用,并没有显示出取代印度语、泰米尔语或马来语等主流语言的迹象。根据布雷顿的调查数据,1981年的人口普查显示,印度尽管有1100万人将英语作为第二语言(印度总人口为11亿),但母语为英语的人只有20.2万,大部分是英裔印度人。而今天在印度尼西亚,荷兰语基本上已经灭绝,原因在于尽管荷兰在这一地区殖民统治了300年,但其间没有发生任何较大规模的从荷兰到印尼的人口迁徙。
基本上,最核心的一点就是观察到,如果用比较方法识别出某语言是具有来自共同祖先语言(或一系列相关方言)历史的一个遗传单元,那么该语言必定是通过母语使用者的迁徙传播来的,而不可能仅仅通过语言转换来传播。考虑到这里所研究的语言关系万年以内的证据已经很难明确找到,以上观察对于从整体上认识现代人类的历史至关重要。既然世界上大部分地区和人群都可以划入少数几个大语系,那么现代人类的史前史很可能就是由大规模的洲际人群迁徙造成的。
但是,我认为最重要的一个前提是,不应该假定说母语的迁徙人群全部来自语系最初产生地区的土著居民。很多情况下,人群的生物特征和其语言并不完全对应,这种情况需要进一步解释。举例来说,西欧和南亚的人种有着明显的生物学差异,但他们的语言同属一个语系。在生物学特征上,美拉尼西亚人和说南岛语的菲律宾人更为接近,但他们的语言完全不是同一个语系。语言转变和接触导致的语言变化在今天显而易见,在人类整个历史上也同样如此。