人类基因组最后一块拼图完成,Science 罕见 6 篇连发
人类基因组测序迎来新的里程碑!首个完整无间隙人类基因组测序,由近百位科学家合作完成,填补上最后 8% 的空缺。最新一期 Science 罕见地以特刊形式连发 6 篇论文,另外两篇介绍研究方法的论文同日登上 Nature Method。
作者之一、华盛顿大学教授 Evan Eichler 称:
我们在生命天书中读到了前所未有的新章节。
回看 2003 年,人类基因组计划 (Human Genome Project) 首次完成 92% 的人类基因测序,创造了历史。到如今,新成立的端粒到端粒联盟 (T2T Consortium) 填补上最后 8% 的空缺,同时纠正了之前的一些错误,也将载入史册。
△T2T 联盟部分成员
新确认的 8% DNA 片段里包含重要的免疫反应基因,它们帮助人类适应和抵御病毒和细菌感染,在预测药物反应方面很有价值。
联盟发起人之一、马里兰大学的 Adam Phillippy 认为,个人基因组测序在 10 年内有望普及,个性化医疗成本会大幅下降。
另外新发现的基因中有一些使得人类大脑比其他灵长类动物大脑更大,有助于进一步揭开人类进化之谜。
攻克最后的 8%
当初的人类基因组计划由 6 国近 2000 位科学家耗时 13 年完成,最后遗留的 8% 靠当时的测序技术难以突破。原因有二:
其一,最后的 8% 里有很多片段是重复的。科学家们用拼图来形容这一困难。如果拼图里好多小块很相似就更难找到正确的位置。近几年发展出的新测序方法 Oxford Nanopore 和 PacBio HiFi 可以一次处理更长的 DNA 片段,就好像拼图的块变大,块数变小了。
其二,很难找到只有一套 DNA 的人类细胞。正常细胞同时拥有两套 DNA,分别来自父亲和母亲,测序时两组 DNA 混在一起增加了难度。这次的解决办法是使用一组来自"葡萄胎"的细胞,这是一种罕见妊娠疾病,使胚胎细胞异常生长,只保留一套 DNA。
用上新方法,人类 DNA 序列中 30.55 亿个碱基对的测序工作终于宣告完工。人类基因组计划前负责人 Robert Waterston 对新方法评价到:
(人类基因组)不再有任何隐藏的或未知的部分。
全新的人类参考基因组被命名为 T2T-CHM13,今后的个性化基因测序可以此为基准,锁定病变基因,提前预防和治疗。
这次研究成果几个月前已发布在生物预印本平台,现在正式见刊 Science。具体到已发表的内容上,还存在一点不足之处:使用的葡萄胎细胞保留的是 XX 染色体,缺失了 Y 染色体。
不过后来这段时间科学家们也没闲着,Y 染色体的测序工作其实也另外完成了。项目负责人 Adam Phillippy 在社交媒体宣布了这一消息,人体 24 条染色体基因测序已全部完成。
最新参考序列 T2T-CHM13 v2.0 的完整数据和在线浏览器已公开,可供全球研究团队使用。
而最新包含 Y 染色体测序成果的论文预印版计划在下个月发布。
论文地址:
https://www.science.org/toc/science/376/6588
CHM13 v2.0 相关数据和工具
https://genomeinformatics.github.io/CHM13v2/
2022-05-06 01:34:09