If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

构建一个系统发生树

系统发生树背后的逻辑。如何利用一组生物具有或缺少的特征信息来构建一个系统发生树。

关键点

  • 系统发育树 (也称系统发生树)是描述一组生物进化关系的假说。
  • 可以利用形态(身体形状),生物化学,行为或分子特征来构建系统发育树。
  • 在构建系统发育树时,我们根据物种共享的 衍生特性 (不同于祖先的特征),将它们分组。
  • 可以通过比较基因或蛋白质的序列来构建系统发育树。 密切相关的物种通常几乎没有序列差异,而较不相关的物种之间往往有较大差异。

介绍

我们都是有亲属关系的 — —我这里不仅仅是指我们人类之间!而是,地球上所有的生物都可以追溯到共同的祖先。 任何小的物种群也可以追溯到其祖先,而且往往是一个比较近代的共同祖先。
我们无法回到久远的过去,去看看物种是如何演变的,那我们如何才能知道它们是如何相互联系的? 在这篇文章中,我们将了解构建系统发育树的基本方法和逻辑,换句话说,是了解代表一组生物的进化历史和关系的树。

系统发育树简介

在系统发育树中,物种会标在树枝顶端。 树的分支以体现物种演变历史的方式连接起来,也就是代表我们对它们是如何通过一些列的衍生(分裂成两个),从一个共同的祖先演变而来的推断。 每个树枝分叉点都是从该分支点衍生出来的所有物种的共同祖先。 树上的线代表着从一个物种延伸到另一个物种的一系列的祖先。
图片修改自 Taxonomy and phylogeny: Figure 2, 作者 Robert Bear et al., CC BY 4.0
欲了解更详细的解释,请查阅关于系统发育树的文章。
即使你能过轻松看懂系统发育树,你也可能会想:应该如何构建发育树? 在这篇文章中,我们将仔细研究系统发育树是如何构造的。

树的构造原理

我们应该如何建立系统发育树?基本原则是来自达尔文的“经过改变的继承”概念。 通过研究当今生物体中的改变模式(新特性), 我们可以弄明白它们从一个共同的祖先进化来的路线—或者至少对其作出假说。
举个例子,让我们看看下面的系统发育树(它代表了假定鼠类物种的演变史)。 我们看到,在该物种演变史上不同时期出现的三种新特征:毛绒绒的尾巴、大耳朵和胡须。 每个新特性都由后代的物种共享(用刻度标志表示), 但这种新特性不会出现在前代物种中。
当我们正在建造系统发育树时, 在进化过程中产生不同于祖先的特征称为衍生特征。 在上面的例子中,毛茸茸的尾巴、大耳和胡须是衍生特征, 而光溜溜的尾巴、小耳朵和没有胡须是祖先特征。 一个要点是,衍生特征可以体现为某一特征的丧失或增加。 例如,如果沿着E线发生一种变化,导致尾巴消失,无尾将被视为衍生特征。
一个数据集中共享的衍生特征是帮助我们建造系统发育树的关键。 如上所述,共有的衍生特征往往以嵌套式出现,因此提供了在物种进化过程中何时出现分支的信息。
当我们正在从数据集构建系统发育树时, 我们的目标是利用现今物种中的共有衍生特征来推断其进化历史的分支模式。 然而,难题是我们不能直接观察到既定物种的演变过程以及何时新特征在分支出现。
但是,我们可以倒推回去。 也就是说,通过观察既定物种—例如A,B,C,D和E——来确定哪些特性是祖先特征,哪些是衍生的。 然后,我们可以使用共享衍生特征将物种分成如上面所示的嵌套组。以这种方式制作的系统发育树是对物种进化历史的一种假说——通常我们会选择所有可以解释衍生特征可能的分支模式里最简单的一个。

示例:构建系统发育树

如果我们是要构建系统发育树的生物学家,我们首先要挑选一组生物。 我们还要选择这些生物的既定特征(来自于它们多种物理的、行为的和生物化学的特征)来作为我们构建树的基础。
如果我们是要为一类物种建造系统发育树(有可能更针对于这篇文章的读者), 我们极有可能已经有了一整套特征,通常是一个表格方式,我们所要做的是把这些特征转换成一棵树。 例如,下面这个列表显示了各种特征是否存在,存在(+)和不存在(0):
特征七缌鳗羚羊白头鹰鳄鱼海鲈鱼
0+++0
0++++
羽毛00+00
00++0
毛皮0+000
图表改自于 Taxonomy and phylogeny: Figure 4, 作者 Robert Bear et al., CC BY 4.0
接下来,我们需要知道每一种特征是祖传的还是衍生的。 例如,出现了肺,者是一种祖先特征,还是一种衍生的特征? 请记住,祖传的特征是我们认为在既定物种的共同祖先存在的特征。 衍生的特征是我们认为在从祖先进化后出现的。
由于我们无法直接观察历史(能的话当然好,但那是不可能的),我们如何才能知道哪些特征是祖传的,哪些是衍生的?
  • 如果这是出现在作业或考试中,可能会问哪个特性是衍生的还是祖传的。
  • 如果是你自己的研究,你可能有足够的知识来识别祖传的和衍生的特征(例如,用化石来协助)。
  • 你也可能有 外群 的信息,外群是与所有近缘单系群(两个及以上)关系都较远的类群。
如果我们有外群的信息,我们可以把外群假定为祖先。 也就是说,我们可以假定它的特征代表着祖先的特征。
例如,在我们的例子中(为方便起见,数据再次列出),七缌鳗是一种没有颌和真正骨骼的鱼。如表所示,七缌鳗没有任何特征:它没有肺、颌、羽毛、胗和毛皮。 根据这些信息,我们可以假定如果没有这些特征就是祖先,如果出现这些特征则是衍生的。
特征七缌鳗羚羊白头鹰鳄鱼海鲈鱼
0+++0
0++++
羽毛00+00
00++0
皮毛0+000
图表改自于 Taxonomy and phylogeny: Figure 4, 作者 Robert Bear et al., CC BY 4.0
现在,我们可以通过根据生物的共同衍生特征对它们进行分组,开始构建系统发育树。 一个很好的起点是寻找最大数量生物之间共有的衍生特征。 这里,是颌的存在:除了外群(七缌鳗)以外,所有生物都有颌。 因此,我们可以把七缌鳗和其他物种分在不同的分支上,然后我们可以把出现颌的特征放在非七缌鳗的物种分支上。
图片该自于 Taxonomy and phylogeny: Figure 6, 作者 Robert Bear et al., CC BY 4.0
接下来,我们可以寻找下一个最大生物群的衍生特征。 这次是肺,羚羊、白头鹰和鳄鱼都有这一特征,但海鲈鱼没有。 根据这个模式,我们可以把海鲈鱼分在单独的分支上,并且我们可以将肺放在羚羊、白头鹰和鳄鱼的分支上。
图片该自于 Taxonomy and phylogeny: Figure 6, 作者 Robert Bear et al., CC BY 4.0
按同样的方式,我们现在可以寻找下一个最大数量生物共享的衍生特征。 这次是胗,它由鳄鱼和白头鹰(而不是羚羊)共享。 根据这个数据,我们可以把羚羊放到单独一支上,然后把胗放到鳄鱼和白头鹰的支上。
图片该自于 Taxonomy and phylogeny: Figure 6, 作者 Robert Bear et al., CC BY 4.0
剩下的皮毛和羽毛特征在构建树的过程中有用吗? 这些是衍生特征,但没有物种共享它们,因为每一特征只在一个物种中出现。不共享的衍生特征对构建树没有帮助,但我们仍然可以将它们放在树上最可能的位置。羽毛在白头鹰的分支上(在与鳄鱼分离之后)。 皮毛是在和鳄鱼和白头鹰分离后,出现在羚羊的分支上。
图片该自于 Taxonomy and phylogeny: Figure 6, 作者 Robert Bear et al., CC BY 4.0

构造树的简约原则和难点

当我们构建系统发育树时,使用了一个叫做简约的方法。 也就是说,我们总是找最简单的解释方式。这意味着,在建树过程中,我们会选择需要最少的独立遗传事件(存在特征和不存在特征)的树。
例如,我们 也可以 使用以下树来代表以上的特征模式:
图片该自于 Taxonomy and phylogeny: Figure 6, 作者 Robert Bear et al., CC BY 4.0
这一系列事件也可以对五个物种的特征进化作出解释。然而,由于需要涉及更多的独立变异,因此这种办法 不那么简约 。因为在海鲈鱼出现的位置,我们需要假定颌特征要独立出现两次(一次在海鲈鱼的分支,另外一次出现在羚羊、白头鹰和鳄鱼的分支上)。这样树上会有 6 个刻度线,而更简约的树上只有 5 个刻度线。
在这个例子中,看起来像是有一棵最好的树,数刻度线似乎没有什么必要。 然而,当研究人员构建系统发育树时,他们经常会利用许多特征,而这些特性模式很少 100, percent 彼此吻合。相反,这些特征直接会存在一些矛盾,导致不同树适于不同的特性模式。在这种情况下,研究人员可以使用简约法则来选择一棵和数据相符的树(假说)。
你可能会问:如果不考虑特征集,为什么不同树之间会互相矛盾?毕竟,一个物种在过去确实以某种特定方式进化。 问题是,当我们建树时,我们依赖的数据从不完整和完善。比如说:
  • 我们不能总是正确的区分祖先特征(同源 特征)和相似但是独立进化的特征(通过相交进化而产生的 类似 特征 )。
  • 一种特征可以在物种的进化史上多次出现和消失。一个物种可能具有衍生特征,但在进化过程中会又可能失去这种特征(恢复到祖先的形式)。
因为有像这样出错的可能,生物学家常常使用许多不同的特性来建造系统发育树。即使经过了仔细的选择和分析,仍有可能得出错误的结论(这是因为我们无法获知完整的历史资料)。

使用分子数据来构建树

DNA测序是为系统发育分析带来革命性的工具。 使用 DNA测序,而不是使用物理或行为特征来建造树,我们可以比较其直系同源(进化相关)的基因或蛋白质的顺序。
基因比较的基本原则和以上类似:祖传形式的DNA或蛋白质序列, 会随着时间发生了变化。 但是,基因或蛋白质并不完全对应于单一特征的两种状态。
相反,每一种蛋白质基因或氨基酸的核苷酸可被视为一种单独的特征,这个特征可以变异到多种状态(比如:核苷酸有A,T,C和G状态)。所以,一个带有 300 个核苷酸的基因可以代表有 4 种状态的300 种不同的特征!我们从基因序列比较中获得的信息数量——也就是我们建构的系统发育树的分辨率——会远远高于使用物理特征得到的信息数量。
为了分析基因序列数据和确定最可能的系统发育树,生物学家通常使用计算机程序和统计算法来完成。不过,一般来说,当我们比较物种之间的基因或蛋白质序列时:
  • 大量的差异多源自 不很 相关的物种
  • 少量差异多对应于 相关的物种
例如,假定我们比较人类与其他物种之间的血红蛋白(血液中携氧的蛋白质)的β链。 如果把人和大猩猩的蛋白质做比较,我们只能找到 1 个不同的核苷酸。和狗比较,有 15 个差异。与鸡比较,有 45 个不同的核苷酸,与七缌鳗相比,有127 个差异start superscript, 1, end superscript。 这些数字表明,在这些物种中,人与大猩猩的关系最近,与七缌鳗的关系最远。
AP 生物简答题视频里,你可以看到Sal用基因序列数据建构系统发育树的实例。

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.