The Unknome:研究人员刚刚创建了一个我们最神秘基因的数据库
为了增加我们对基因蓝图的理解,研究人员建立了一个我们几乎一无所知的基因数据库。
虽然我们知道这些基因存在并编码蛋白质,但我们不知道它们的用途。
“很明显,科学研究倾向于关注经过充分研究的蛋白质,导致人们担心知之甚少的基因被不合理地忽视,”研究者来自英国MRC分子生物学实验室(LMB)的解释。
“为了解决这个问题,我们开发了一个公开可用且可定制的'Unknome数据库'。
人类基因组序列的粗略草案已经有20年了。首次发布,包含数以万计的基因。
从那以后,我们学到了很多东西,先进的技术像CRISPR一样,但仍有数以万计的这些基因仍然是神秘的。
到目前为止,这些基因被科学忽视的原因有很多,分子生物学家João Rocha及其同事解释说。
它们包括资金和同行评审系统更倾向于支持对已经证明具有临床重要性的基因的研究,或者在实验室物种中更丰富或更广泛的基因。
Unknome数据库根据对蛋白质基因的了解程度对蛋白质基因进行排名,这些蛋白质基因适用于人类和实验室环境中通常研究的其他物种。
为了证明如何使用这个数据库,研究人员随后采集了260个在数据库中被列为高度未知的基因样本,这些基因也可以在实验室苍蝇中找到。果蝇基因组。
他们系统地删除了发育中的苍蝇的共同基因。许多苍蝇没有存活下来,这表明这些基因中的每一个编码的蛋白质在动物生物学中起着至关重要的作用。
“这些未表征的基因不值得他们忽视,”说分子生物学家肖恩·芒罗。
通过仅在某些组织中去除基因的表达,而不是在果蝇内的其他组织中,研究人员能够确定它们的一些功能。一些与男性生育能力、发育和压力反应相关的基因。
“通过识别问题被无意和不合理地忽视的情况,有可能加速科学进步,”该团队写.
Rocha及其同事现在已经确定了人类基因组中那些被忽视的问题,因此现在由世界各地的研究人员来帮助加速这一进展。
“我们的数据库提供了一个强大,多功能和高效的平台,可以识别和选择功能未知的重要基因进行分析,从而加速缩小unknome所代表的生物学知识差距,”门罗总结道.
这项研究发表于公共科学图书馆生物学.