在前面的章节中,我们简单梳理了物种的概念,而生物学研究中一个极为重要的方面就是确定生物之间的演化关系。很直观,人和黑猩猩的亲缘关系明显要比人和大象接近,人和大象的关系又比人和植物接近,但是当被命名的物种数量越来越多的时候,“直观的感受”就无法成为判断物种演化关系的标准,人和乌龟还有人和鸡哪一对的关系比较接近,或者说哪一对拥有更晚的共同祖先(common ancestor),这样的问题就需要比较严格的分析。
早期的分类学家自觉或不自觉地会采用阶梯状的分类等级,人常常是阶梯的最上面一级,往下依次和我们的亲缘关系越来越远。这种思想到今天依然广泛存在,比如这一幅流传广泛的宣传画:
而系统发育学的概念的诞生要晚很多,直到上世纪60~70年代才逐步成型,1965年由Camin和Sokal开发出了第一款可以用于支序分析(cladistic analysis)的电脑软件
A METHOD FOR DEDUCING BRANCHING SEQUENCES IN PHYLOGENY
又过了大概十年,随着计算机技术的成熟和合适的数学模型建立,系统发育才变成了演化生物学中的必备研究手段。现在,已经有大量的软件和模型供研究人员使用,但凡涉及到演化这个主题的文章里面多少涉及一些系统发育的东西。但是,就像之前所说的,我们现行的生物分类体系依然是200多年前林奈的那一套,那一套分类系统的本质还是阶梯化的,这就无可避免地与现行的方法产生了矛盾。
系统发育的源起
这里所说的系统发育对应的英文为“phylogeny”,研究的对象是生物类群的发展历史,理解成“系统”的“发育”也不算很晦涩。Phylogeny这个词源于德语中的Phylogenie,是德国生物学家恩斯特海克尔(Ernst Haeckel)提出。在海克尔1894年的大作Die Systematische Phylogenie (Systematics Phylogeny, 系统发育学)中,我们已经可以看到现代系统发育学思想的雏形。当然海克尔的科学思想中带有强烈的种族主义倾向,后来成为了优生学和种族歧视/屠杀的帮凶,应该引起后人警醒。
在分子生物学大发展之前,早期的系统发育研究主要建立在形态特征的基础上,现在形态学的研究更多的是与分子研究相辅相成或者作为无法获得分子数据的领域,例如古生物,的研究手段。
系统发育学真正的建立者应当算德国生物学家Willi Hennig,他在1950年出版的Basic Outline of a theory of phylogenetic systematics(系统发育学理论基础大纲),与之后的一系列著作一道,成为了系统发育学,特别是无脊椎动物领域,的基础。
到1998年,由Goloboff,Nixon和Farris合作开发的系统发育软件TNT(Tree Analysis Using New Technology)公布,算是系统发育分析领域中一个比较常用的软件。TNT软件windows版本的有比较友好的操作界面,mac版本则需要通过命令行操作,对萌新们不太友好。嗯,这个TNT不是之前鸟巢发布的那个,那个似乎不止对萌新不友好,“罗老师,别这样!”。
什么是树,怎么建树?
在讨论矛盾之前,先简单介绍一下什么是演化树。演化树是一种目前最通用的展示生物演化关系的图示,科学界甚至发起了构建包含所有已知生物(包括已经灭绝了的)的生命之树(Tree of life)的宏大计划。
树的每个端点代表一个分类单元,很多时候是物种,也可以是其他更高或更低的分类单元。每一个非端点的节点代表这个节点以上分类单位的共同祖先(common ancestor),也可以是一次成种(分化divergence)事件(speciation event)。从树的结构我们可以很容易理解演化支,单系/并系/旁系类群等概念。如果原始数据足够“好”,你可能会得到一颗严格分叉的树,叫作well-resolved,但很多时候由于数据或者方法的原因,会出现一个节点分出多个演化支的情况,这个树就不是严格分叉的,这个节点演化出的物种之间的演化关系就不太清晰。
现在建树的方法有不少,分别是邻接法(Neighbor joining NJ),似然法(Likelihood),简约法(Parsimony)和贝叶斯(Bayesian),具体的这里就不展开了。古生物的样本量一般不会太大,但是利用现代的测序技术在现生生物中可以得到海量的数据,分析的结果也会更有可信。另外强调一下,树的结构只是对生物演化历史的模拟,即使是各种参数都很优秀的树和真实的演化历史也可能存在区别。
目前来说,“演化树”对于生物演化历史最好的图示,尽管存在水平基因转移(horizontal gene transfer)和生物杂交等现象,也有学者认为网状结构是一种更好的表示方式,“演化树”依然是目前研究中最为常用,接受程度最高的一种图示方法。从对一个仅仅包含几个物种的小类群,到对整个生物圈建立的生命之树(tree of life),演化树被大量运用在生物学研究中。但是一旦引入了演化的概念,传统的层级分类方法势必受到强烈的冲击。
系统发育与传统分类的矛盾
先说一下结论,系统发育和传统分类的矛盾根本在于二者的视角不同,传统的分类学把整个生物圈当做一个静态不变的系统,所有的生物都是一成不变的,我们要做的是找出生物之间的分类关系;而系统发育是用动态的眼光来看待生物圈,会考虑到物种的出现,演化,和灭绝等等动态过程,要找出的是生物之间的演化关系。
简单地说,传统分类是静态的,系统发育是动态的。下面来具体讨论一下可能出现的问题:
- 分类单元是否一定是单系类群?
在系统发育研究中,任何一个有意义的演化支都应该是一个单系类群,也就是包含这个类群所在节点代表的共同祖先及其全部后裔。但是在传统的分类体系中,一个物种(species)和另一个物种是平等的,同样,科与科,纲与纲等等都是平等的。我们以动物举例,鸟纲(Aves)和哺乳纲(Mammalia)是单系类群,但是爬行纲(Reptilia)就不是一个单系类群,同样,两栖纲(Amphibia)也不是。但是这些分类单元今天也还在使用,更多的是科学性与实用性之间的妥协的结果。
2. 姐妹群(sister group)是否需要是同一等级的分类单元?
第二个矛盾是第一个矛盾的延续,如果你同意现代鸟类是恐龙的后裔,那么就是说爬行纲这个“纲”中还包含了另一个纲,这一点和传统分类学的层级观点产生了矛盾。分类学家们就开始做出调整,将二叠纪之后的一大堆陆生脊椎动物分成了合弓纲(Synapsid)和蜥形纲(Sauropsida)两个大的演化支,合弓纲可以粗略理解为今天的哺乳动物和其祖先,蜥形纲可以粗略理解成广义上的爬行动物(包括鸟)和其祖先,二者大约在距今3.2亿年前的石炭纪分开。与此同时,很多传统的分类名词例如“似哺乳爬行动物(mammal-like reptile)”,“槽齿类(thecodontia)” 都较少使用,甚至“爬行动物(reptiles)” 也会在被更加精确定义的情况下使用。
传统的分类学中对“姐妹群”并无太多要求,甚至这个概念本身都不一定存在,大量的高级分类单元之下存在很多并列关系的低级分类单元,例如哺乳纲下面有大约30个目,人科(Hominidae)下面有猩猩,黑猩猩,大猩猩和人四个属。如果引入了系统发育的概念,必然的就会出现互为姐妹群的两个类群处于不同的分类等级。
从图中可以看到,在下方的人属Homo中,能人Homo habilis与其他所有物种构成了姐妹群,而南方古猿(Australopithecus)这个属就不是一个单系类群。
3. 如何定义物种以上的分类单元?
系统发育研究中的大量高级分类单元的定义都是根据物种而非特征,A物种与B物种的共同祖先的全部后裔构成了一个演化支。如果在有着稳定的系统发育树结构的情况下,这样的定义是没有大问题的,无非就是多一些层级,都用XX类(clade/group/taxon)就好了,但是面对一些演化关系存在较大争议的类群,我们很难去定义高于种或者属的分类单元。例如什么是法布尔龙类(Fabrosauridae,现在认为不是单系类群),什么是南方古猿(Australopithecus)……这些都不是自然存在的演化支,而是人为聚在一起的一个类群,既不具有系统发育学上的演化意义,也很难再传统的分类系统中找到合适的位置。更多的,这些定义模糊的类群是一种在系统发育和传统分类之间妥协的产物,其中也有研究材料缺乏数据不足的原因。
4. 分类层级不够使用
理论上,系统发育树的每一个节点都需要一个名字,这样再多的分类层级也会不够用,而且即使够用,在使用中也会造成很大的困难。既然很多人都喜欢维基百科,那么我们就看看维基百科中的分类层级是怎么划分的。
稍加观察就能发现,传统分类学中的“界门纲目科属种”显然已经不够用了,不仅仅在对这七个单元加上了各种前缀,例如“下”,“亚”,“总”等等,大量的分类单元/演化支被称作“类”,已经抛弃了传统分类的命名规则(有兴趣的同学可以研究一下高级分类单元的后缀命名规则,链接在之前的文章中)。另一方面,“纲”这个单位,在这四幅图中出现了三次,分别是“鸟纲Aves”,“爬行纲Reptilia”和“蜥形纲Sauropsida”,这三个分类单元包含的物种数量是逐渐增加的。
因此,系统发育与传统分类之间的冲突造成的分类层级不够的结果就是:1. 大量分类单元被称作“类”;2. 相同等级的分类单元在不同语境中用来指代不同的类群。其中自然会给研究和交流造成困难,在这里就不展开了。
5. 高阶分类单元存在吗?
这一点是目前很多分类学家争论的焦点之一,如果说物种的定义只是不够精确,大多数情况下大家还能达成共识的话,对高阶分类单元定义的争论就从来没有停止。
在传统分类当中,各个类群都有着比较清晰的鉴定特征,例如哺乳动物的特征有胎生哺乳,有毛发,恒温等等,鸟类的特征有羽毛,具有喙,卵生等等。但是随着系统发育的引入,还有大量具有中间特征的“过渡物种(transitional species)” 的发现,依靠特征来鉴定分类单元的方法逐渐变得不可靠了。过去,面对现生的物种,两栖、爬行、哺乳和鸟四个大类群之间的界限还是比较清晰的;现在,对着一大堆带羽毛的恐龙和长满牙的鸟,哪些算龙哪些算鸟就不太容易说清楚了,中华龙鸟Sinosauropteryx,中国鸟龙Sinornithosaurus,这些学名也显示了龙鸟之间并不清晰的界限。
在上图中,兽脚类恐龙被分为若干“科(family)”一级的类群(以“-idae”结尾),这一点可能有两个原因,一是传统的把恐龙作为爬行纲/蜥形纲中的一个目,兽脚类恐龙是一个亚目,其下的分类阶元自然就是科了;另一方面,根据这些单元中包含了的属种数量,科是一个比较合理选择。
其实到这里,大家就可以看出,在对高级分类单元的等级划分和命名上有着非常强的主观性,在很多情况下一类生物在分类系统中是一个纲,一个目,一个科可能并不重要,更重要的是这一类生物之间的相似性和单系性(拥有一个共同祖先)。
从我个人的角度来说,高阶分类单元是一种人为的产物,是为了更加系统、科学地研究整个生物圈的一种分类方法。这种分类方法是对生物之间亲缘关系的模拟,在较大的尺度上准确性很高,但是在较小尺度上有很多模糊的地方。
这一章节主要介绍了传统分类和系统发育之间的矛盾,相信如果是从事演化生物学相关研究的同学在平时的工作中多少会遇到一些文中提到的问题。下一章节我们会用恐龙这个类群这个类群,仔细讨论。
敬请关注下一章节
古生物学的例子:有多少恐龙
来源:知乎 www.zhihu.com
作者:Congyu
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载