构成一个人需要多少个基因?神经元的简单组成单元组合起来就能产生极其复杂的结构。加州大学尔湾分校研究/Ardy Rahman CC BY-NC

我们人类喜欢把自己看作是地球上所有生物中的佼佼者。生命历经三十多亿年的进化,从简单的单细胞生物发展到如今形态各异、大小不一、能力各异的多细胞动植物。除了日益复杂的生态环境,在生命演化的历史长河中,我们也见证了智慧的进化、复杂社会的形成以及科技的发明创造,直至今日,人们在三万五千英尺的高空环游世界,讨论着机上电影。

人们自然会认为生命的历史是一个不断进步的过程。 从简单到复杂并期望这能体现在基因数量的增加上。我们自认为凭借卓越的智力和全球统治地位引领潮流;我们期望,既然我们是最复杂的生物,就应该拥有最精密的基因组合。

这种假设看似合乎逻辑,但研究人员对各种基因组了解得越多,就越觉得它存在缺陷。大约半个世纪前,人类基因的估计数量只有数百万个。 今天我们只剩下大约20,000人了。例如,我们现在知道,香蕉及其…… 30,000基因它们拥有的基因比我们多50%。

随着研究人员不断探索新的方法,不仅能够统计生物体拥有的基因数量,还能统计其中多余的基因,我们发现,我们一直以来认为最简单的生命形式——病毒——与最复杂的生命形式——我们自身——之间的基因数量呈现出明显的趋同性。现在是时候重新思考生物体的复杂性是如何在其基因组中体现出来的了。


内心订阅图形


基因数量人类与巨型病毒基因数量的估计值趋于一致。图中实线代表人类的平均估计值,虚线代表所需基因数量的估计值。图中病毒的数据分别来自 MS2(1976 年)、HIV(1985 年)、2004 年的巨型病毒以及 20 世纪 90 年代 T4 病毒的平均基因数量。Sean Nee CC BY

统计基因数量

我们可以把我们所有的基因想象成一本烹饪书里的菜谱。它们用DNA碱基的字母写成——缩写为ACGT。基因提供了如何以及何时组装构成你身体的蛋白质的指令,这些蛋白质负责执行你体内所有的生命功能。 普遍 基因大约需要1000个碱基对。基因与环境和经验共同决定了我们是什么样的人——因此,了解一个完整的生物体由多少个基因组成是一件很有趣的事情。

当我们讨论基因数量时,我们可以展示病毒的实际基因数量,但出于一个重要的原因,我们只能展示人类基因数量的估计值。 挑战 计算基因 真核生物 ——包括我们人类、香蕉和念珠菌等酵母——就是我们的基因排列得并不像鸭子排成一排那样整齐。

我们的基因序列排列得就像菜谱的每一页都被撕下来,和大约30亿个其他字母混在一起一样。 50 percent 其中一些实际上描述的是失活的、死亡的病毒。因此,在真核生物中,很难统计出哪些基因具有至关重要的功能,并将它们与无关基因区分开来。

相比之下,对病毒(以及细菌,它们可能携带基因)中的基因进行计数则要困难得多。 10,000 基因的形成相对容易。这是因为基因的原材料——核酸——对于微小生物来说相对昂贵,因此存在强大的选择压力来删除不必要的序列。事实上,病毒真正的挑战在于如何发现它们。令人惊讶的是,所有 重大病毒发现包括 HIV 在内的许多病毒都不是通过测序鉴定出来的,而是通过放大观察其形态等传统方法鉴定出来的。 持续进步 分子技术领域已经教会了我们非凡的 病毒圈的多样性但这只能帮助我们统计已知存在的事物的基因数量。

即使数量更少,也能蓬勃发展

我们维持健康生活所需的基因数量可能比目前估计的整个基因组中约20,000个基因还要少。最近一项研究的作者合理地推断,人类必需基因的数量可能远不止这些。 可能要低得多.

这些研究人员观察了数千名健康成年人, 寻找自然发生的“击倒”现象, 某些特定基因的功能缺失。我们所有的基因都有两份拷贝——一份来自父母双方。通常情况下,一份活跃的拷贝可以弥补另一份拷贝的功能缺失,因此很难找到同时具有这两种功能的人。 由于失活基因本身就很少见,所以拷贝数也会失活。

利用现代基因工程技术,在实验室大鼠身上研究基因敲除相对容易,我们可以使选定的特定基因的两个拷贝都失活,甚至完全删除它们,然后观察其反应。但人体研究则需要生活在拥有21世纪医疗技术的社区中的人群,并且需要具备适合进行遗传和统计分析的已知谱系。 冰岛人是有用的 人口,以及本研究中的英属巴基斯坦人是另一个例子。

这项研究发现了700多个基因,敲除这些基因不会对健康造成明显影响。例如,一项令人惊讶的发现是,在小鼠生育能力中起关键作用的PRDM9基因,在人体内敲除也不会产生任何不良影响。

将分析结果推广到人类基因敲除研究之外 导致估算 实际上,构建一个健康的人类只需要3,000个基因。这与“巨型病毒设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“ Pandoravirus该病毒于2014年从西伯利亚30,000万年前的冰层中被发现,是迄今为止已知的最大病毒。 含有2,500个基因.

那么我们需要哪些基因呢?我们甚至还不了解四分之一的人类基因的实际功能,而这已经是相当先进的技术了。 相比我们对其他物种的了解.

复杂性源于最简单的事物

但无论人类基因的最终数量是20,000万个、3,000千个还是其他什么,关键在于,在理解复杂性时,基因的数量其实并不重要。我们至少在两种情况下早已认识到这一点,而对第三种情况的理解才刚刚起步。

数学家艾伦·图灵和 二战密码破译员 他建立了多细胞发育理论。他研究了简单的数学模型,现在被称为“反应扩散”过程,在这些模型中,少量化学物质(在图灵的模型中只有两种)扩散并相互反应。这些模型遵循简单的反应规则。 可以可靠地生成 非常复杂但又连贯的结构 容易看到的因此,动植物的生物结构并不需要复杂的程序设计。

同样,很明显的是…… 100万亿个连接 人类大脑中那些真正构成我们自身的部分,不可能由基因单独决定。 人工智能领域的最新突破 基于 神经网络这些是大脑的计算机模型,其中简单的元素(对应于神经元)通过与外界互动建立自身的连接。 结果非常显著。 在手写识别和医疗诊断等应用领域,谷歌已邀请公众参与。 玩游戏观察梦境 其人工智能。

微生物超越了基本范畴

因此,很明显,单个细胞无需非常复杂,大量细胞就能产生非常复杂的结果。所以,人类基因数量可能与病毒和细菌等单细胞微生物的基因数量相当,这并不令人惊讶。

令人惊讶的是,事实恰恰相反——微小的微生物也能拥有丰富而复杂的生活。一个新兴的研究领域——被称为“微生物组学”——正在兴起。社会微生物学——研究微生物极其复杂的社会生活,其复杂程度堪比我们人类的社会生活。 我自己的贡献 这些领域关注的是让病毒在这场看不见的肥皂剧中占据应有的位置。

过去十年我们逐渐意识到,微生物在其生命周期中超过 90% 的时间都处于休眠状态。 生物膜可以将其视为生物组织。事实上,许多生物膜都具有以下系统: 电气通信 细胞间的结构与脑组织类似,因此它们是研究偏头痛和癫痫等脑部疾病的模型。

生物膜也可以被视为“微生物之城以及整合 社会微生物学 医学研究是 进展迅速 在许多领域,例如囊性纤维化的治疗。 微生物的社会生活 在这些城市里——合作、冲突、真相、谎言,甚至…… 自杀 ——正在迅速成为 21 世纪进化生物学的主要研究领域。

正如人类生物学远没有我们想象的那么出众一样,微生物的世界却远比我们想象的有趣得多。而基因的数量似乎与此无关。

关于作者

Sean Nee,生态系统科学与管理研究教授 美国宾夕法尼亚州立大学

这篇文章最初发表于 谈话。 阅读 原创文章.

相关书籍:

{amazonWS:searchindex=Books;keywords=microbes;maxresults=3}