快捷搜索:  www.ymwears.cn

科学家首次完成了人类X染色体的完整组装

尽管目前的人类参考基因组是迄今为止产生的最准确和最完整的脊椎动物基因组,但即使经过了20年的改进,在DNA序列上仍然存在空白。现在,科学家们第一次确定了人类染色体从一端到另一端的完整序列(“端粒到端粒”),没有间隔,而且精确度达到了前所未有的水平。

7月14日在《自然》杂志上发表了完整的人类X染色体的端粒到端粒组装,这对基因组学研究者来说是一个里程碑式的成就。该研究的主要作者、加州大学圣克鲁兹基因组学研究所的研究科学家凯伦·米加(Karen Miga)说,这个项目之所以成为可能,是因为新的测序技术使“超长读取”成为可能,比如加州大学圣克鲁兹分校首创的纳米孔测序技术。

重复的DNA序列在整个基因组中很常见,而且总是给测序带来挑战,因为大多数技术产生相对较短的序列“读序列”,然后必须像拼图一样把它们拼在一起来组装基因组。重复序列产生许多看起来几乎一模一样的短读取,就像拼图中的大片蓝天,不知道这些片段是如何组合在一起的,也不知道有多少次重复。

Miga说:“这些重复丰富的序列曾经被认为是难以处理的,但现在我们在测序技术上取得了飞跃。”“通过纳米孔测序,我们获得了能跨越整个重复区域的数十万碱基对的超长读数,从而绕过了一些挑战。”

填补了人类基因组序列中剩余的空白,开辟了基因组的新区域,研究人员可以在这些区域中寻找序列变异与疾病之间的关联,并为有关人类生物学和进化的重要问题寻找其他线索。

Miga说:“我们开始发现,在参考序列中存在空白的一些区域实际上是人类变异最丰富的区域之一,因此我们一直缺失了许多可能对理解人类生物学和疾病很重要的信息。”

多边投资担保机构和亚当Phillippy国家人类基因组研究所(NHGRI),相应的新论文的作者,共同Telomere-to-Telomere (T2T)财团追求一个完整的基因组组装后一起在2018年的一篇论文中展示了潜在的纳米孔技术来产生一个完整的人类基因组序列。这项研究使用了牛津纳米孔技术的MinION测序器,该测序器通过检测单个DNA分子通过薄膜上的小孔(一个“纳米孔”)时电流的变化来对DNA进行排序。

这个新项目建立在这一努力的基础上,将纳米孔测序技术与PacBio和Illumina公司的其他测序技术以及BioNano基因组公司的光学图谱相结合。利用这些技术,该团队制作出了一个完整的基因组组合,在连续性、完整性和准确性方面超过了之前所有的人类基因组组合,甚至在某些指标上超过了当前的人类参考基因组。

尽管如此,多边投资担保机构表示,仍有多次中断。为了完成X染色体,研究小组必须手动解决序列中的几个缺口。两个片段重复被解决超长纳米孔读完全跨越重复和唯一锚定在任何一边。剩余的断裂在着丝点,这是一个众所周知的困难区域,在每个染色体中都可以发现重复的DNA。

在X染色体上,着丝点包含一个高度重复的DNA区域,该区域跨越310万个碱基对(碱基a、C、T和G在DNA双螺旋中形成对,并在其序列中编码遗传信息)。该团队能够识别重复序列中的变异作为标记,他们用这些标记来排列长片段,并将它们连接在一起,从而横跨整个着丝粒。

“对我来说,我们可以组装一个3兆大小的串联重复装置的想法是非常令人兴奋的。我们现在可以到达这些重复区域,这些区域覆盖了数以百万计的碱基,而这些碱基以前被认为是难以解决的。

下一步是利用多个测序技术的数据进行抛光,以确保序列中每个碱基的准确性。

Miga解释说:“我们在三个不同的测序平台上使用了一种迭代过程,以完善序列,达到高水平的准确性。”独特的标记为超长读取提供了一个锚定系统,一旦锚定读取,就可以使用多个数据集来调用每个基。

纳米孔测序,除了提供超长读取外,还可以检测被甲基化修饰的碱基。甲基化是一种“表观”变化,不会改变序列,但对DNA结构和基因表达有重要影响。通过在X染色体上绘制甲基化模式,该团队能够确认之前的观察,并揭示着丝粒内甲基化模式的一些有趣的趋势。

新的人类基因组序列来自一种名为CHM13的人类细胞系,填补了目前被称为基因组参考联合体构建38 (GRCh38)的参考基因组的许多空白。

T2T联盟继续为完成所有CHM13染色体而工作。多边投资担保机构说:“这是一个开放的联盟,因此在许多方面,这是一个由社区推动的项目,许多人为此投入了时间和资源。”

您可能还会对下面的文章感兴趣: