第一章 现代中国人从哪里来?

话说有这么一个段子,我猜你肯定听过:新冠肺炎疫情期间,每个学校、居民区、写字楼的保安人员都变成了哲学家,看到谁都是灵魂三问——你是谁?你从哪里来?你要往哪里去?

这当然是个笑话了,但这个笑话的笑点抓得还是挺到位的。对于每一个有自省能力的现代人来说,关心自己的身份认同,关注自家文化和自己族群的来路和去处,大概都是无法避免的终极问题。

至少对于咱们中国人来说,这三个问题回答起来还真是挺不容易的。虽然人类起源的研究已经红火了很多年,特别是用DNA序列的变化研究人类起源、迁徙和融合在过去30多年里非常火热,但针对东亚地区的研究一直非常稀少。从某种程度上说,这也有点算一个“卡脖子”的问题,毕竟人类古DNA研究的技术门槛不低,大部分工作又主要是在美国和欧洲开展的,关注的焦点显然不在遥远的东方。

让人兴奋的是,在过去这几年时间里,由中国科学家开展的人类古DNA研究开始逐渐崭露头角。2021年,就有几项中国科学家主导的研究恰好都和这个话题有关。他们的研究从不同角度出发,丰富了我们对于现代中国人来源的认识。

1

要说清楚这个问题,我们得先聊一个更大的话题——今天居住在世界各地的人最早是从哪里来的?

这个问题在中学生物课上就有讨论,结论你应该还记得:生物学意义上的现代人,学名叫作Homo sapiens,属于脊索动物门——哺乳纲——灵长目——人科——人属——智人种,起源于20万~30万年前的非洲。今天地球上生活的所有人类个体,不论国籍、肤色、高矮胖瘦,祖籍全都可以追溯到非洲大陆。

这个说法有什么证据呢?

其实,“现代人起源于非洲”这个理论最早是进化论的老祖宗达尔文提出来的。达尔文在写出了《物种起源》这本巨著之后,很自然的想用自己的理论解释一下人类的起源问题。按照他自己提出的进化理论,地球生物拥有一个共同的祖先。在漫长的时光里,这个祖先的子孙后代通过可遗传的变异、生存竞争和自然选择,在丰富多样的地球环境里形成了成千上万的独特物种。有些物种比较接近,说明它们的共同祖先出现得晚,彼此分开的时间比较短;有些物种则相差甚远,说明它们可能很早就彼此分开、独立进化了。

按照这个说法,想要解决现代人的起源问题,最自然的方法就是看自然界哪些物种和人类最接近,然后顺藤摸瓜寻找这些物种和人类的共同祖先。达尔文关注到了大猩猩和黑猩猩这两种生物,认为它们就是人类最近的亲戚。后来证明,这个看法惊人的准确。而既然大猩猩和黑猩猩的原产地都是非洲大陆,达尔文自然就认为现代人也是从那里和两个亲戚分道扬镳,从此独立成家的。后来证明,这个看法也惊人的准确。

其实从技术上说,达尔文这个结论当时并没有什么像样的证据来支持,自己演绎的成分很多。比如一个很简单的问题就是,凭啥猩猩们生活在哪里,人就得是哪里起源的?猩猩们也可以是后来才迁移到非洲大陆的嘛。但大神就是大神,随便这么一猜,结果还真猜对了。

而在最近30多年的时间里,“现代人非洲起源”的理论得到了大量证据支持,特别是DNA证据的支持。

比如人们发现,在全世界范围内,人类基因多样性最多的地区就是非洲,比全世界其他地区加一块还要多。非洲一个原始部落——比如著名的桑人(人类已知最古老的民族)部落里——随便两个人之间的基因差异,可能比中国人和法国人之间的差异还大。最简单的解释就是,人类祖先原本就生活在非洲,其中只有一小群人从非洲离开,走向了全世界。这群出走的人,他们的遗传多样性当然就大大下降了。

打个比方你就好理解了。你从国家图书馆里随便拿一麻袋书回家,每一本复印几千次,放在一起,数量上看倒是也能办一个山寨图书馆。但毫无疑问,你这个图书馆书籍的多样性肯定远远不如国家图书馆。

利用DNA信息,科学家还能推测出人类离开非洲,一路迁移的路线图。这就要说到著名的“线粒体夏娃”和“Y染色体亚当”的研究了。

我简单介绍一下研究的思路。线粒体是人体细胞中的一个微型细胞器,主要负责生产细胞活动所需的能量。这个细胞器比较独特的地方是,它有一套自己的遗传物质——一个由16000多个碱基对构成的环形DNA分子。更有意思的是,我们知道,每个人体内的遗传物质都来自父亲和母亲,两边的贡献基本是一半对一半。但线粒体DNA完全来自母亲的卵细胞,父亲对此毫无贡献,而且还不产生干扰。因此,通过分析线粒体DNA序列的变化情况,我们可以重构人类母系家族的历史。谁是谁的女性祖先,谁是谁的女性后代,她们相隔多少时光,都可以从线粒体DNA上推算出来。

比如,你在东北找到了三个人,她们虽然不住在一起,但她们体内的线粒体DNA序列几乎完全一样。与此同时,第一个人的线粒体DNA上有一个突变A,第二个人有突变A和B,第三个人有突变A、B和C。那么,一个可能的猜测就是,这三个人其实是一家子的,分别是外婆、女儿和外孙女。这三个人当中,外婆是线粒体夏娃,她在生孩子的时候把自己的线粒体DNA突变A遗传给了女儿,同时,因为生育过程中的基因复制错误,让女儿获得了一个新的突变B;到了外孙女,故事重演,带了A、B、C三个突变。原则也很简单,后代会继承先代的基因变异,而且会时不时增添新的变异。当然你肯定也能想到,子孙传代过程中也有可能把祖先的变异给重新抹掉的所谓“回复突变”,但它出现的概率是相当低的,不影响这种分析方法的有效性。

类似线粒体DNA之于女性,男性特有的Y染色体只能从父亲传儿子,不会被妈妈的DNA干扰,因此也能很好地用来推算父系家族的历史。

如果把这个故事的时间尺度放大几千几万倍,基本就是科学家们找到“线粒体夏娃”和“Y染色体亚当”的思路。

我再打个比方说明一下这个思路。比如,科学家们分析了大量现代人的线粒体DNA序列,发现蒙古高原的人线粒体DNA上有基因突变A,北美地区的原住民体内有突变A和B,南美原住民体内则有突变A、B、C。那么,一个合理的猜测就是,人类的祖先是顺着这条路从蒙古穿过白令海峡走到北美,然后一路南下,穿过巴拿马地峡到达南美洲的。这一路上生儿育女,留下后代在当地定居,因此就把特征性的基因突变给留下来了。

更进一步的,科学家们还能大概推测出线粒体DNA出现一次变异需要多少时间。大致来说,任何一个特定位置,大概每代人只有一千万分之一的概率发生变异。拿这个数字当作计时器,就能进一步还原出祖先们到达不同地区的大致时间。现代人的母系和父系祖先,也就是传说中的线粒体夏娃和Y染色体亚当,都生活在20万~30万年前的非洲。这个信息当然进一步确认了现代人的非洲起源理论。

当然,在上面这个比方里你肯定也能想到,光是依靠A、B、C这三个突变做推论,其实有点勉强。所以一般来说,古人类DNA的研究往往还需要其他学科的证据支持。

我们还是用这个比方说事。比如正在研究的这三个东北女性,除了基因变异的信息之外,年龄差距恰好是一个比一个年轻二三十岁。不光如此,这三个人做饭的口味也很像,都是喜欢番茄炒鸡蛋多放辣椒;说话习惯也挺相似,都喜欢带一个“你瞅啥”;长相也像一家人,都是丹凤眼、小嘴巴,那这个祖孙三代的结论就更可靠了。

实际上,科学家们在做人类起源研究的时候也是这个思路,他们会关注古人类化石的发掘和特征比较、古人类使用的工具的差异、文化特征的差别、语言文字的变化等。如果这些信息和DNA的变异规律能对上,当然说服力就更强。

我还要纠正一个很常见的误解。线粒体夏娃和Y染色体亚当,并不是说在几十万年前地球上就一个女人、一个男人,他们周围完全可以生活着大量的伙伴,也都能生孩子。更不是说他们必须是夫妻——实际上这两个人完全可能相隔好几万年。

这两个人能成为夏娃和亚当,单纯是因为巧合。这里面的道理我打个比方你就明白了。假设你身边,有一对夫妻生了两个儿子、两个女儿。那孩子的爷爷、奶奶、外公、外婆都对孩子有基因层面的贡献,基本每人贡献了1/4。但是这几个孩子的线粒体夏娃是谁呢?是他们的外婆,可不是奶奶!因为奶奶的线粒体传到儿子这儿就断掉了;而几个孩子的Y染色体亚当是他们的爷爷,外公可不算,因为外公生的是女儿,自己的Y染色体没有人继承!你看,在这个故事里,线粒体夏娃和Y染色体亚当可不是一家人。所以说回线粒体夏娃,她特别幸运的地方就是从20万年前至今,他们的每一代后代里至少都有一个女性。别的祖先当然也会传递遗传信息给后代,但只要这上万代人的传承中有任何一代没生出女儿,线粒体就被丢掉了。

简单总结一下线粒体DNA和Y染色体DNA分析所展示的人类起源和迁移的路线图。这张线路图里的信息主要来自人们对现代人线粒体DNA和Y染色体DNA序列的分析和比较。

20万~30万年前,最早的智人,也就是现代人的直接祖先出现在非洲大陆,并在那里生息繁衍,开枝散叶。

到了5万~10万年前,一小批人类祖先开始通过阿拉伯半岛走出非洲。在今天的近东地区,他们分道扬镳,一支向西进入欧洲;一支向东北进入中亚和西伯利亚;还有一支向东南沿着海岸线进入今天的印度、东南亚和中国。

再往后,可能在两三万年前,后面这两支一路迁徙的祖先在西伯利亚会合后,穿过冰封的白令海峡进入今天的阿拉斯加,并花了一万年时间从北向南占领了整个美洲大陆。

最后一波大迁移发生在最近一万年之内。来自中国东南沿海的人类祖先驾着独木舟乘风破浪,先后来到今天的中国台湾地区和东南亚,此后又继续南下,在太平洋的小岛上找到了安身立命之所。最后一批探险家坐着独木舟挺进新西兰和复活节岛,那是公元1000年以后的事情了,那时候中国已经在宋朝统治下了。

到这个时候,这场持续几万年的大迁移才算基本告一段落。

这就是对现代人进行DNA序列分析,为我们提供的关于祖先来源的线索。

我必须强调一下,这张路线图所展示的情形肯定是过度简化了的。一个核心的原因在于,它的分析主要建立在现代人线粒体DNA和Y染色体DNA的序列分析之上,呈现的是人类祖先漫长迁移后的一个结果,就像一部漫长电影定格在片尾的“截图”,祖先们迁移路上发生的各种曲折故事在这张截图里是很难看到的。

比如,如果有一批祖先在经历了漫长的迁移之后,因为种种原因彻底灭绝了,并且没有留下后代,或者只对现代人的DNA有非常微弱的贡献,那通过分析现代人的基因序列就不太可能还原出他们的故事。即便他们可能曾经人数众多,独霸一方,但是没有在现代人的DNA里留下印迹。

再比如,人类祖先走出非洲的时候,肯定不是这么目标明确、路线清晰的。他们很可能会在一个水草丰美的地方住下来,一住就是上千年,直到环境特别恶劣或者人口膨胀住不下了,才会无奈地再次搬家。在搬家的路上,大概率也不是闷着头一直赶路,而是走走停停、走回头路甚至走几次回头路都是很自然的事情。毕竟祖先们的目的是找一个地方活下去,而不是替我们探索地球。

所以,也许一个更有可能的人类迁移路线图不是像一根箭头一样穿出非洲,扩散到全世界,而是像一个毛线团,线头彼此交织缠绕在一起。可能我们的祖先并不只走出过一次非洲,而是在几万年、十几万年的时间里多次分批走出非洲,甚至还会走出非洲之后又回到老家。可能先出发的祖先们在路上决定打道回府,还会和后出发的相遇,可能爆发惨烈的战争又或者长期地通婚。可能一群祖先在某个地方定居几百上千年之后,又被新来的其他祖先驱逐、屠杀或者同化。也可能两支沿着不同道路迁移的祖先会在某个地方不期而遇,然后携手继续前进……

这里涉及非常多的细节,此处不再展开。你需要知道的是,现代人类固然都起源于非洲,但从非洲祖先到如今全世界开枝散叶的现代人,中间发生的故事可能比你想象的更加曲折惊险。

2

说完人类的起源,接下来我们就可以讨论现代中国人的起源问题了。

按照现代人非洲起源的理论,世界各地的人都得到5万~10万年前的非洲去认祖归宗。中国人当然也不例外。尽管今天人们对中国土地上的居民具体是什么时间、沿哪条路线自非洲而来的,还有不少疑团未解,但大多数人的看法是,和地球上其他地方的居民一样,中国人同样是几万年前走出非洲的这一批人类祖先的后代。早在2001年,复旦大学的金力教授牵头测定了亚洲12000多名男性的Y染色体序列,证明它们无一例外都源自非洲的某个祖先类型Yuehai Ke,et al.“Y-chromosome evidence for no independent origin of modern human in China,”Chinese Science Bulletin,2021.

但既然说是“大多数人的看法”,那就说明学术界还没有形成一统江湖的理论。确实,至今还有不少科学家坚持,现代中国人的祖先不是5万~10万年前走出非洲的那一批人,或者不仅仅是5万~10万年前走出非洲的那一批人。

这话是什么意思呢?

刚刚咱们简单描绘了人类祖先走出非洲的时间表和路线图。但请注意,人类祖先走出非洲可不只是这么一次,在这之前可能有很多次。

早在200万年前,智人这种生物还没有出现的时候,统治非洲大陆的是一种人类的近亲——直立人(Homo erectus)。这是一种早期人类,已经能够直立行走并且制造简单的石器工具,但脑袋只有现代人的3/4大,眉骨突出,下巴前伸,有点像猿猴。直立人也至少有过一次大规模的走出非洲行动。早在智人出现之前很久,直立人就已经在欧亚大陆的很多地方生活了。比如大家耳熟能详的在北京周口店发现的北京猿人,就是直立人,它生活在距今大约70万年前。

在那之后,走出非洲应该还发生过很多次,包括下面我们会提到的人类最近的亲戚——尼安德特人和丹尼索瓦人,他们也早在智人出现之前就走出了非洲。在智人出现之后,后来的20万年时间里,我们的祖先们可能也有好几批先后走出非洲。

因此,有些科学家就认为,今天世界各地的现代人不是5万~10万年前才走出非洲的,而是更早,甚至200万年前就已经开始走出非洲了。这些生活在欧亚大陆很多地方的直立人在当地经过漫长的进化,分别形成了今天的欧洲人、亚洲人。这就是曾经占据主流的现代人多地起源理论。

非洲起源理论和多地起源理论,两派都同意人类的祖先能追溯到非洲大陆,区别在于追溯的时间点不同——非洲起源理论认为全世界人民关系比较近,5万~10万年前是一家;而多地起源理论认为全世界人民关系比较远,可能200万年前才是一家。

虽然非洲起源理论解释力强,简单明了,拥护者众,但支持多地起源理论的这方也提出了不少实在的证据或者质疑。

比如从化石的形态上看,中国本土的直立人化石,比如北京猿人,有些地方和现代中国人很接近,看起来像是一脉相承的。其中,比较有代表性的是所谓“铲形门齿”。你不妨试着用舌头舔舔自己上排门牙的内侧,是不是感觉两边凸起,中间有个凹陷,像一把铲子?这就是所谓的“铲形门齿”,在中国人中比例非常高。而北京猿人的门齿也是这样。

既然如此,这个特征是不是就是北京猿人传给我们的?

对于这个问题,科学家从DNA角度给出了合理解释。铲形门齿这个特征是一个叫作EDAR370A的基因变异导致的。这个基因变异除了改变牙齿的样子,也让人更容易出汗,毛发变得更浓密。这个特点也许会帮助我们的祖先在中国华南地区和东南亚的炎热潮湿环境中更好地生存下来Yana G.Kamberov,et al.“Modeling Recent Human Evolution in Mice by Expression of a Selected EDAR Variant,”Cell,2013.。既然如此,一个可能的解释就是,北京猿人也好,晚期智人也好,都出现了铲形门齿也不能说明他们是亲戚,只能说明他们为了适应环境都产生了同一个基因变异而已。生物学上,这种现象有个专门的名词,叫作“趋同进化”。打个比方,蝴蝶会飞,蝙蝠也会飞,喜鹊也会飞,但它们之间的生物学关系是很遥远的,只是都在同一个环境中进化出了类似的生存技能。

当然,这个解释本身并不能推翻中国人本地起源的理论,它只是说,非洲起源和本地起源两个理论都能解释我们特殊的铲形门齿的特征,两者暂时难分胜负。我们接下来还会继续展开。

在非洲起源理论中,非洲之外的所有现代人都是5万~10万年前走出非洲的那一小群祖先的后代。但是在中国境内,科学家却找到了几个历史更悠久的智人遗迹。比如中国南方发现的福岩洞等遗迹,用经典的铀钍定年法测定遗迹最顶端岩石的年代,发现它们至少有7万年历史,甚至达十几万年Wu Liu,et al.“The earliest unequivocally modern humans in southern China,”Nature,2015.。如果当真如此,说明早在人类祖先走出非洲之前,中国已经生活着很多智人了。如果他们才是我们祖先的话,非洲起源说就无法成立了。

不过,这个问题在最近出现了一个比较意外的回应。2021年2月8日,复旦大学李辉教授和合作者们在《美国科学院院刊》上发表了一篇新论文,重新研究了中国南方五处晚期智人遗迹的年代(黄龙洞、陆那洞、福岩洞、杨家坡洞、三游洞)。Xue-feng Sun,et al.“Ancient DNA and multimethod dating confirm the late arrival of anatomically modern humans in southern China,”PNAS,2021.

他们从这些晚期智人遗迹中找到了几颗智人的牙齿,提取到了微量的线粒体DNA,并且测定了它们的序列。根据刚才讲过的分析思路,科学家们推测,这些人类的活动时间并没有原来想的那么古老,可能最早是1.5万年前。与此同时,科学家们还在遗迹中找到了一些动物骨头,大概是祖先打猎留下的。利用碳14测年法测定古人牙齿和这些动物骨头的年代,结果也主要集中在同一时代,最早也不过3万年左右。

换句话说,不管是通过线粒体DNA分析,还是碳14测年法分析,这些遗迹的年代都仍然晚于非洲起源理论所允许的时间窗口。至于为什么这些遗迹上覆盖的岩石的年代反而更古老,科学家们也做出了一些合理的推测,这里就不展开了。

说到这,是不是非洲起源说大获全胜,现代中国人的起源就彻底没有疑问了呢?

并不是。就拿上面这项研究来说,在论文发表后也引发了不小的争议。比如就有科学家认为,这几颗牙齿根本不属于智人,反而更像鹿牙María Martinón-Torres,et al.“On the misidentification and unreliable context of the new‘human teeth’from Fuyan Cave(China),”PNAS,2021.),也有同行认为这项研究用的测年方法有些问题View ORCID ProfileT.F.G.Higham,et al.“The reliability of late radiocarbon dates from the Paleolithic of southern China,”PNAS,2021.。这些争议本身是挺常见的,也能体现出古人类学研究中的一些普遍难点,比如样本一般比较稀少难得,采集和鉴定存在难度;另外,各种测量方法本身也都存在一些误差和争议。

即便这项研究是正确的,可能也还不是问题的结束。你可能还记得刚才我们的讨论,人类祖先走出非洲的路线图很可能不是一根箭头,而是一个毛线团。在5万~10万年前这一批祖先走出非洲之前,可能还有更早的智人祖先走出过非洲,来到中国定居繁衍,只是可能并没有把他们的基因序列持续传递到现代中国人这里罢了。

比如,中国科学院古脊椎所的付巧妹研究员在2020年7月的一项研究中,从广西和贵州的1.1万年前的智人样本中提取并测定了线粒体DNA序列。结果发现,这些线粒体DNA序列上的某些特征现在仅存在于东南亚人群中,中国本土反而没有Fan Bai,et al.“Paleolithic genetic link between Southern China and Mainland Southeast Asia revealed by ancient mitochondrial genomes,”Journal of Human Genetics,2020.。也就是说,这一群1万年前生活在西南地区的人,并不是现代中国人的祖先,反而在现代东南亚人群中留下了痕迹。

按照这个解释,在中国土地上找到一些5万年之前的智人遗迹并不是特别值得惊讶的事情。就算上述几个南方智人遗址的时代被纠正了,但还有一些更古老的智人遗迹,比如2017年在河南许昌发现的“许昌人”头骨ZHAN-YANG LI,et al.“Late Pleistocene archaic human crania from Xuchang,China,”Science,2017.,可能还是很古老,已经有超过10万年历史。

从这个角度说,在中国大地上找到一些几万年、十几万年前的智人遗址,本身既不能用来支持非洲起源理论,也不能支持本地起源理论。更关键的证据是,这些智人身体里的DNA是不是对现代的中国人有影响。而这个问题,目前我们还没有答案。

非洲起源理论也好,本地起源理论也好,可能这种划分本身就已经过时了。根据最新的研究证据,现代人类更可能是融合的产物。

这个故事要从2010年说起。

德国帕博(Svante Paabo)实验室测定了一位4万年前生活的尼安德特人的基因组DNA序列,结果和现代人DNA序列比对发现,除了生活在非洲南部的人以外,欧洲人、亚洲人、美洲人身体里都有1%~4%的DNA序列是来自尼安德特人full RICHARD E.GREEN,et al.“A Draft Sequence of the Neandertal Genome,”Science,2010.。这就意味着人类走出非洲之后可不光是一路生儿育女、披荆斩棘,还和当时在欧洲大陆广泛生活的人类的亲戚——尼安德特人——发生了大范围的通婚杂交,并且在子孙后代的身体里留下了永恒的印迹。

同一年,帕博实验室还测定了另外一种人类亲戚——丹尼索瓦人——的基因组DNA。这种曾经广泛分布于亚洲大陆的人类近亲早已灭绝DONGJU ZHANG,et al.“Denisovan DNA in Late Pleistocene sediments from Baishiya Karst Cave on the Tibetan Plateau,”Science,2020.,但它们也给东亚地区的现代人后裔,特别是太平洋上居住的巴布亚人和新几内亚人贡献了一部分DNADavid Reich,et al.“Genetic history of an archaic hominin group from Denisova Cave in Siberia,”Natrue,2010.

也就是说,在人类祖先走出非洲、全球迁移的路线上,至少发生过两次大规模的人种之间的基因交流,一次是和尼安德特人,一次是和丹尼索瓦人。而这两群人,应该也是在几十万年前走出非洲的直立人的后代。从这个角度说,现代人还真不能说是纯粹的非洲起源或者本地起源,它有多个源头。

打个比方,如果现代人类是一棵大树,它主要的根系当然是出自5万~10万年前的非洲,但欧亚大陆上的尼安德特人和丹尼索瓦人也作为旁系的根,为这棵大树供给了养分。

既然如此,是不是也有一个可能性——今天中国人的来源其实比我们想象的复杂得多?

比如,除了非洲智人、尼安德特人、丹尼索瓦人之外,当时的亚欧大陆、中国的土地上有没有可能生活着其他人类近亲?如果有的话,他们有没有和远道而来的智人大规模通婚繁衍,为现代中国人贡献一部分遗传物质?

如果当真如此的话,从某种意义上说,现代中国人可能同时是5万~10万年前走出非洲的祖先的后代,也是尼安德特人和丹尼索瓦人的后代,还是更多的尚未被发现的、生活在亚欧大陆上的其他族群的后代。甚至像北京猿人这样的直立人,在东亚地区要是也进化出了能够和智人通婚的后代,那么传递一部分DNA下来也不是完全不能想象。

当然,这些问题在当下是很难完全搞清楚的。毕竟想要证明或者推翻这个猜测,需要找到更多生活在中国土地上的人类祖先的遗迹,然后测定他们的DNA序列,和现代人加以比较。这是一项对技术要求很高同时还高度依赖运气的工作。我们只能期待未来有新的研究成果,帮助我们进一步搞清楚中国人到底从哪里来。

3

抛开上面的疑团不谈,暂且接受现代人的非洲起源理论,接受中国人的祖先是一群5万~10万年前从非洲出发、跋涉而来的智人。这倒不太会影响接下来的讨论,毕竟我们还是承认虽然现代人的祖先可能不止一个,但主要的遗传物质还是从5万~10万年前走出非洲的智人祖先那里继承来的。

2017年,中国科学院古脊椎所的付巧妹研究员测定了生活在北京房山的田园洞人的基因组DNA,明确了早在4万年前,中国土地上已经生活着现代东亚人的祖先了Melinda A.Yang,et al.“40,000-Year-Old Individual from Asia Provides Insight into Early Population Structure in Eurasia,”Current Biology,2017.

那么,问题又来了,从4万年前到现在,祖先们在中国土地上又经历了什么?

这个问题当然没有那么容易回答。从传说中的三皇五帝、大禹治水到信史中的中国,中国人的早期历史还存在大量空白。而仅仅看二十四史我们就能想象,在中国这块土地上,民族的迁移、杂交、同化发生得多么频繁。在有信史之前,相信一定也发生过大量类似的事件,参与塑造了现代中国人的历史和现在。

有没有可能同样利用生物学的研究方法帮助我们揭开信史时代之前的中国历史呢?

最近这段时间,几项全新的研究给我们提供了几个特别精彩的范例。

日常生活里,大家经常开北方人和南方人的玩笑,比如粽子、豆腐脑、月饼到底是甜的还是咸的。好像一般规律是北方人吃甜粽子、甜月饼、咸豆腐脑,南方人则刚好反过来。这些饮食上的差别大概出现的时间很近,很可能是经济和文化的共同作用,上升不到人类学的研究范畴。但如果把历史拉长,中国的北方人、南方人之间真的有差异吗?

要回答这个问题,比较现代意义上的北方人和南方人就没什么用了,因为经历了几千年的民族迁移和融合,现代北方人和南方人在基因意义上是高度相似的同一群人。科学家们需要挖掘古代北方人和南方人的遗骨,测定他们的基因组DNA序列,才能做出更准确的分析。

这里要强调一下,提取祖先遗骨里的DNA并完成基因组测序是一个技术上非常有挑战性的任务。要知道这些几千上万年的遗骨暴露在恶劣环境中,里面的DNA大部分早就分崩离析,降解成碎片了,同时遗骨上生长的微生物还会造成大量DNA污染。科学家们需要非常小心地采集样本,在非常干净的实验室里钻开遗骨,从内部取出尚未被污染和降解的组织样本,然后富集当中的人类DNA,才有可能测出相对完整的基因组序列。

2020年5月14日,付巧妹研究员在《科学》杂志发表了一篇论文MELINDA A.YANG,et al.“Ancient DNA indicates human population shifts and admixture in northern and southern China,”Science,2020.。他们辛辛苦苦寻找到了1万年以来分布在山东、内蒙古、福建等地的接近300份智人遗骨,从中成功提取和测定了26个基因组序列。

对比这些基因组序列,科学家们发现,早在八九千年前,古代北方人和古代南方人的基因组DNA已经出现了明显的差异,前者更接近生活在北方西伯利亚的居民,后者更接近生活在东南亚和太平洋岛屿的南岛人。

考虑到中国人的祖先在差不多的时间分别在黄河流域驯化了小米、在长江流域驯化了水稻,进入了生产力和人口爆炸的农业时代。我们当然忍不住联想——也许在4万年前,人类祖先从非洲而来、由南向北占领中国的土地之后,就分别在两条大河附近定居、发展农业,形成了稳定的人口规模和势力范围,也因此形成了各具特色的基因特征。

但也是从那个时候开始,南北方就一直存在持续的基因交流。科学家们在古北方人的基因组里找到了属于南方人的特征,也在古南方人的基因组里看到了属于北方人的特征。这种持续的基因交流到现在,让今天的北方人、南方人之间的基因差异变得非常微小了。

这样两群人在此后的几千年时间里又发生了什么变化呢?

我们先看北方人。付巧妹团队发现,在过去几千年的时间里,古北方人的基因组序列逐渐南下,大范围地取代了原本的古南方人基因组。这说明古北方人可能大举南下,来到了南方人的地盘,双方长期的混居、通婚,最终融为一体。

最近,这项研究也得到了进一步的支持。2021年2月22日,厦门大学王传超教授和哈佛大学的大卫·里奇(David Reich)教授合作,在《自然》杂志发表了一篇论文。他们利用类似的手段系统分析了166个东亚地区的人类祖先的基因组DNA,分布时间是距今1000~8000年前Chuan-Chao Wang,et al.“Genomic insights into the formation of human populations in East Asia,”Nature,2021.。他们得到的一个重要结论就是“汉藏同源”,把古北方人的迁移路线梳理得更加具体了。

5000多年前,生活在黄河上游、甘肃、青海一带的祖先们塑造了今天的汉族和藏族人。发展出农业技术的他们,生产力、生育力猛增,一路向西南扩张,进入青藏高原,变成了今天的藏族;同时也向东向南扩张,变成了今天的汉族。

而原来的古南方人呢?他们也并没有束手待毙。

在付巧妹团队的研究中发现,福建沿海小岛上发现的古南方人的基因组DNA序列特征(所谓亮岛人),大量分布在台湾原住民和东南亚各国的居民当中。因此,一个可能是,在古北方人大举南下进入长江流域、华南地区的时候,古南方人也同样在大举南下。他们向东南方向发展,以台湾地区为跳板,进入东南亚岛屿,挺进太平洋。

而这个发现也得到了王传超论文的支持。同时,王传超他们的研究还发现了另一个非常重要的迁移方向。这些古南方人还有一部分向西南方向发展,穿过云贵高原,形成了今天傣族、壮族等少数民族的祖先,还进一步进入中南半岛。

说到这里,我们就可以做个总结了Ming Zhang,et al.“Human evolutionary history in Eastern Eurasia using insights from ancient DNA,”Current Opinion in Genetics&Development,2020.——

从智人的祖先走出非洲至今,现代中国人的历史至少有4万年,甚至更长。在这段时间里,有几个时间片段是我们现在有所了解的:

第一个阶段开始于5万~10万年前。一批智人祖先走出非洲大陆,可能沿着中东——印度——东南亚的路线进入中国,然后自南向北扩张,最晚在4万年前就已经占领了东亚最富饶的核心地带。

祖先们在迁移的路上可能发生过很多次大规模的融合,让我们的血脉里也带有尼安德特人、丹尼索瓦人的印迹,甚至还有更多今天已经湮没的祖先也把一部分遗传物质留传给了我们,只是我们还没有发现他们的踪迹。

第二个阶段开始于差不多1万年前。那个时候,祖先们已经分别在黄河和长江流域定居下来,驯化农作物,开始了生产力和人口的同步扩张。

北方人从黄河上游出发,向西登上青藏高原,成为今天藏族人的祖先;向东、向南扩散到整个中原地带,成为今天汉族人的祖先。而南方人也并没有就此消亡,他们当中的一部分人留在当地和古北方人充分融合,形成了今天的南方汉族人。而另一部分战略性地放弃了中国南方,大举向东南和西南方向迁移,成为今天云贵地区、东南亚和太平洋岛民的祖先。传说中的三皇五帝、阪泉之战、涿鹿之战、大禹治水,如果真有其事,大概就发生在这个时代。

第三个阶段开始于差不多三四千年前。伴随着金文和甲骨文的发明,中国正式进入信史时代。到了西周共和元年,中国历史更是开始了有确切纪年的时代。中华民族的集体回忆,从那时候起绵延至今,从未断绝。

从以上描述中你能看到,对现代中国人的形成历史还是有很多疑问的。比如,从4万年前智人定居在东亚,到1万年前形成古北方人和古南方人的格局,期间发生过什么?是什么原因让中国人的祖先先从南向北进入中原,又从北向南进入青藏高原、长江流域、西南地区,甚至走到更南?当时生活在中国周边地区的人类祖先,比如生活在西伯利亚地区的人类祖先,生活在中亚地区的人类祖先,是否和中原地区的祖先们发生过接触和基因交换?还有,这些史前时代的迁移和融合以及之后出现的各个新石器时代的文化,如仰韶文化、龙山文化、良渚文化之间又是什么关系……这些关系我们来源的问题还在等待更多的研究。

在大多数时候,当我们想到中华民族的历史、文化、传统时,我们想到最多的无非是这第三个阶段里发生的故事。是二十四史里的“道德三皇五帝,功名夏后商周”,是唐诗里的“尔曹身与名俱灭,不废江河万古流”。但是今年的《巡山报告》我想告诉你,中国人的历史要远比这个更长、更曲折,也一定藏着很多动人的故事。那段几万年的历史虽然没有用文字记载流传,但是现代科学的进步一定能够帮助我们读懂它。