快捷搜索:  www.ymwears.cn

基因组学研究人员的里程碑式成就-人类X染色体的首次完整组装

第一个端粒到端粒完全无链的人类染色体DNA序列是基因组学研究的一个重要里程碑。

尽管目前的人类参考基因组是迄今为止产生的最准确和最完整的脊椎动物基因组,但即使经过了20年的改进,在DNA序列上仍然存在空白。现在,科学家们第一次确定了人类染色体从一端到另一端(端粒到端粒)的完整序列,没有遗漏,而且精确度达到了前所未有的水平。

人类X染色体的端粒到端粒组装于2020年7月14日发表在《自然》杂志上,这对基因组学研究者来说是一个里程碑式的成就。加州大学圣克鲁兹基因组学研究所的研究科学家,该研究的主要作者凯伦·米加说,这个项目之所以成为可能,是因为新的测序技术使超长测序成为可能。比如圣克鲁兹大学首创的纳米孔测序技术。

重复的DNA序列在整个基因组中很常见,而且一直对测序构成挑战,因为大多数技术产生的解读相对较短。然后必须像拼图一样拼合在一起来组装基因组。重复序列产生许多看起来几乎一模一样的短读取,就像拼图中的大片蓝天,不知道这些片段是如何组合在一起的,也不知道有多少次重复。

这些重复丰富的序列曾经被认为是难以处理的,但现在我们在测序技术上取得了飞跃和进步,多边投资担保机构说。通过纳米孔测序,我们得到了能跨越整个重复区域的数十万个碱基对的超长读数,从而绕过了一些挑战。

填补了人类基因组序列中剩余的空白,开辟了基因组的新区域,研究人员可以在这些区域中寻找序列变异与疾病之间的关联,并为有关人类生物学和进化的重要问题寻找其他线索。

我们开始发现,一些参考序列中存在空白的区域实际上是人类种群中变异最丰富的区域,所以我们一直缺失了很多可能对理解人类生物学和疾病很重要的信息。多边投资担保机构说。

端粒,端粒

多边投资担保机构和亚当Phillippy国家人类基因组研究所(NHGRI),相应的新论文的作者,共同Telomere-to-Telomere (T2T)财团追求一个完整的基因组组装后一起在2018年的一篇论文中展示了潜在的纳米孔技术来产生一个完整的人类基因组序列。这项研究使用了牛津纳米孔技术的MinION测序器,该测序器通过检测单个DNA分子通过膜上一个小孔(纳米孔)时电流的变化来对DNA进行排序。

这个新项目建立在这一努力的基础上,将纳米孔测序技术与PacBio和Illumina公司的其他测序技术以及BioNano基因组公司的光学图谱相结合。利用这些技术,该团队制作出了一个完整的基因组组合,在连续性、完整性和准确性方面超过了之前所有的人类基因组组合,甚至在某些指标上超过了当前的人类参考基因组。

尽管如此,多边投资担保机构表示,仍有多次中断。为了完成X染色体,研究小组必须手动解决序列中的几个缺口。两个片段重复被解决超长纳米孔读完全跨越重复和唯一锚定在任何一边。剩余的断裂在着丝点,这是一个众所周知的困难区域,在每个染色体中都可以发现重复的DNA。

在X染色体上,着丝点包含一个高度重复的DNA区域,该区域跨越310万个碱基对(碱基a、C、T和G在DNA双螺旋中形成对,并在其序列中编码遗传信息)。该团队能够识别重复序列中的变异作为标记,他们用这些标记来排列长片段,并将它们连接在一起,从而横跨整个着丝粒。

对我来说,我们可以把一个3兆大小的串联重复的想法是令人兴奋的。我们现在可以到达这些重复区域,这些区域覆盖了数百万个碱基,而这些碱基以前被认为是难以对付的。多边投资担保机构说。

抛光策略

下一步是利用多个测序技术的数据进行抛光,以确保序列中每个碱基的准确性。

我们在三个不同的测序平台上使用迭代过程抛光序列,以达到高水平的精度,多边投资担保机构解释说。独特的标记为超长读取提供了一个锚定系统,一旦你锚定读取,你可以使用多个数据集来调用每个base。

纳米孔测序,除了提供超长读取,还可以检测被甲基化修饰的碱基,这是一种表观遗传技术。这种改变不会改变序列,但对DNA结构和基因表达有重要影响。通过在X染色体上绘制甲基化模式,该团队能够确认之前的观察,并揭示着丝粒内甲基化模式的一些有趣的趋势。

新的人类基因组序列来自一种名为CHM13的人类细胞系,填补了目前被称为基因组参考联合体构建38 (GRCh38)的参考基因组的许多空白。

T2T联盟继续为完成所有CHM13染色体而工作。这是一个开放的联盟,所以在很多方面这是一个社区驱动的项目,有很多人投入了时间和资源,多边投资担保机构说。

阅读第一个端到端DNA序列的人类染色体,更多关于这一突破。

# # #

参考文献:人类X染色体端粒到端粒的组装凯伦·h·多边投资担保机构谢尔盖?科伦,这种倾向并不(Mitchell r . Vollger Ariel Gershman,安德烈Bzikadze, Shelise布鲁克斯,埃德蒙·豪,大卫?Porubsky Glennis Logsdon,瓦莱丽·a·施耐德Tamara Potapova, Jonathan Wood,威廉?Chow乔尔·阿姆斯特朗,珍妮Fredrickson,小将Pak,克里斯托夫Tigyi, Milinn Kremitzki,克里斯托弗·马尔科维奇,瓦莱丽·马杜罗,阿玛莉亚南美洲,杰拉德g . Bouffard亚历山大·m . Chang南希·f·汉森,艾米·b·Wilfert Franç瓦兹Thibaud-Nissen,安东尼·d·施密特,Jon-Matthew贝尔顿Siddarth一,梅根y丹尼斯,丹妮拉·c·索托,太阳Sahasrabudhe, Gulhan岩石,Josh快,尼古拉斯·j·鲁曼Nadine福尔摩斯,马修·松Urvashi Surti,罗莎安娜个,蒂娜a坟墓林赛,罗伯特。富尔顿,爱尔兰共和军大厅,教皇本笃祭碟,Kerstin豪,温斯顿Timp,爱丽丝年轻,詹姆斯·c·Mullikin帕维尔?a . Pevzner Jennifer l . Gerton贝思a·沙利文,埃文·e·为和亚当m . Phillippy 2020年7月14日,自然。

DOI: 10.1038 / s41586 - 020 - 2547 - 7

除了Miga和Phillippy,论文的作者还包括美国国家人类基因组研究所(National Human Genome Research Institute)的共同第一作者Sergey Koren,以及美国和英国近24个机构的科学家包括华盛顿大学、约翰霍普金斯大学、加州大学圣地亚哥分校和惠康桑格研究所。这项工作得到了美国国立卫生研究院的支持。

您可能还会对下面的文章感兴趣: