首页 » 新闻动态 >

对进化的理解的演变 - “基本上,所有模型都是错误的”

2021-09-18 11:50:04来源:

新的建模工具具有更好地理解疾病的影响

记住域名,王国,门,课,秩序,家庭,属,种类和达尔文的生活隐喻我们在高中生物学中学到了吗?这种描述生活素线的方式只是科学的最佳猜测,关于基因如何变化并随着时间的推移来改变他们今天所在的东西。

在鉴定蛋白质和基因变化时,将生物被重新分类为另一个属的原因并不罕见。例如,近期有不同种类细菌,植物和珊瑚的分类学的变化。

如果你能做出更好的进化变化模型,那么也许不是100%准确 - 考虑到复杂的生物已经不断发展数十亿年 - 可以给你比以往任何时候都更清晰的照片?

“进化就是这样,只有这就像猜测时间而不是空间。” - Kristen Naegle.

弗吉尼亚州公共卫生基因组学院弗吉尼亚工程学院生物医学工程与计算机科学副教授和乌瓦的公共卫生基因组学中心,以及她以前的博士学位。罗马·斯图斯基的学生,现在是马萨诸塞大学阿默斯特大学的博士研究员所做的。他们的工作表明如何建立重建进化变化的模型比以往任何时候都更加准确,这对了解疾病如何在人体中工作的突破来说。

他们的论文,“Aspen,一种用Ensemble Models改善准确性重建蛋白质演进的方法,”在2019年10月17日,在Elife期刊上发表。Aspen代表“通过蛋白质进化的替代来采样准确性”。他们的研究突出了乌瓦在生物医学数据科学中的优势。

弗吉尼亚州公共卫生基因组学院弗吉尼亚工程学院生物医学工程与计算机科学副教授和乌瓦的公共卫生基因组学中心,以及她以前的博士学位。罗马·斯图斯基,现在是马萨诸塞州大学的博士研究员发表了一种新的方法来建立重建进化变化的模型,比以往任何时候都更加准确,有影响更好地理解疾病。

“今天使用的大多数蛋白质演化模型可能是错误的,”Naegle说。“我们现在有办法在这些模型上探讨,并询问我们如何使用它是正确的,以构建更好的模型。这是一个重要的一步。“为了更好地了解他们在建模进化变革方面的工作中的复杂性,Naegle提供了类比:“如果我要求你预测某人在旧金山和纽约之间接受的路线,那将是一个模型。但是,如果我要求1000人让我预测有人所采取的路线,那么那条路线的分支是最遍布所有1000人的路线最有可能是真实的。这是因为大多数人可能同意两个城市之间的特定高速公路是最有效的方式,因此公路的部分具有非常强大的体重或概率。

“如果我看到没有人在所有这些1000路线上达成一定的事情,那就告诉我,我对任何一个模型都非常准确的信心很少。相反,如果每个人都同意绝对一切,或者大部分路线,我都会感到非常自信,必须有一个最佳方式来在这两点之间旅行。我可以想出一条新的路线,这不是1000人给我的一个,而是捕捉到所有1,000个建议之间最具共同的路线,而那种模型可能是近于真实路线的大量比任何唯一的途径给我的型号。最后,它仍然可能不会完全准确 - 除非我问实际进行旅行的人,否则我永远无法了解真正的路线 - 但这可能比他们自己的任何路线建议都好多了。

“进化就是这样,只有这就像猜测时间而不是空间。”

重建进化分支是棘手的,特别是当许多物种共享类似类型的蛋白质时,可能已经发展到了稍微不同的功能。在数学上,问题迅速变得非常大,但发现这种蛋白质进化的影响可能导致更好地了解我们的身体如何应对癌症和其他疾病。

当问题的解决方案来到Sloutsky,而他正在研究许多不同物种中常见的细胞信号中的重要蛋白质。他想知道蛋白质如何随着时间的推移而进化,以在不同物种中具有不同的功能。问题真的很大,他决定只抽出几个序列来重建进化的恐惧。

“重建不同意彼此,”他说,尽管有1000次尝试。“本身就不会是一个巨大的问题 - 我并不希望他们都同意。但我预计大部分时间都要重复一个模型,或者至少有很多时间。“

惊讶,他决定看看所有不同意的模型都有共同之处。“我知道我必须提出一些方式来将信息与所有这些模型结合起来,因为我不能只使用最常见的模型,”他说。“这是一种意想不到的挑战,并导致了这项工作。”

在几个月的过程中,精炼软件和测试较大和较大的重建问题,看蛋白质,Naegle和Sloutsky能够创建开源软件,可以将多种模型组合到非常准确地重建进化变化。

“我们的身体所做的一切都是由蛋白质完成的,”Sloutsky说。“这是一个强大的工具,了解分子生物学如何运作,蛋白质如何工作以及事物出错时,他们如何出错。”

Naegle和Sloutsky的原始数据和代码包括在Elife Publication中,因此其他研究人员可以使用它以获得更精确的建模。

Elife,专注于生物医学科学,在科学期刊中是独一无二的。同行评审员评估文章的研究和质量,以及审稿人的问题和作者的答案包括在出版物中。期刊的哲学是,知识应该是开放和可访问的。

例如,研究人员将能够使用Naegle和Sloutsky的新工具,以了解相似的蛋白质的发展,然后设计更好的药物以更具体地靶向蛋白质。Naegle也想象一个试图使用医学成像来辨别患者身体内部隐藏的质量的确切位置和形状的医生;这种更准确的建模工具可以帮助医生更好地了解质量而不将患者打开。

“乔治·埃姆。Box的典型哲学在此相关:“基本上,所有模型都是错误的,但有些是有用的,”“Naegle说。“我们现在有一种可量化的方法来询问模型有多好,并且通过使用大量模型中最有用的部分,我们可以构建更好的模型。”

参考:“Aspen,一种重建蛋白质演变的方法,通过罗马·斯图斯基和克里斯汀米Naegle,2019年10月17日,Elife.doi(克里斯汀M Neegle)
10.7554 / Elife.47676