下一代测序技术已经伴随我们十多年了,但已经彻底改变了生物科学。美国测序公司太平洋生物科学(PacBio)的首席科学官乔纳斯·科拉赫(Jonas Korlach)表示,我们正在进入测序技术及其带来的对遗传学的深入理解的黄金时代;“现在我们有了这些工具来真正推进这一理解,我们可以利用这些知识来改善人类健康。”

一位科学家在计算机化基因测序设备的实验室里

资料来源:美国加州门洛帕克太平洋生物科学公司提供

对更好、更便宜的测序的需求推动了技术的巨大进步

测序成本和速度的降低推动了其应用的扩大。一些分析师预测,全球市场将从2020年的59亿美元(43亿英镑)增长到2025年的230亿美元。当Illumina的副总裁马克·罗斯2007年加入该公司时,“在短短几个月内就能生成整个人类基因组序列的可能性是一个巨大的启示”。他记得,他怀疑地问同事们,他们是否认为这项技术可以改进。他开玩笑说,事实证明这是一个非常幼稚的问题。

他将Ilumina的成功归功于其“优美优雅的方法”,以及该公司的研发投资:2020年,Illumina投资了6.82亿美元,约占其收入的21%。到目前为止,这已经将生成一个人类基因组的成本降低到600美元,同时提高了准确性和可读取的单个DNA片段的长度。

但也有新的测序方法取代了Ilumina的市场主导地位。2013年,ThermoFisher Scientific获得离子流160亿美元。Ion Torrent公司产品管理副总裁安迪·费尔顿(Andy Felton)说,非光学方法比其他系统更稳定。它以半导体为基础,检测氢离子。“你可以把它想象成一个非常小的pH值计,”费尔顿说。聚合酶通过数百万个小孔将天然核苷酸合并到DNA片段上,并检测每次添加的电压变化。费尔顿说:“这项技术的优势在于,我们可以在同一时间段内进行更多的读取。”

读测序

与Illumina一样,Ion Torrent是一种短读取技术——最大读取长度约为400个碱基。费尔顿说:“我们通常可以对几乎任何东西进行测序,”但这确实对高度重复和重复的基因组区域造成了问题,因为很难找到独特的部分来与参考样本进行比较。一些医学相关基因属于这一类,包括人类白细胞抗原(HLA)系统,它为部分免疫功能编码。在英国剑桥附近的威康桑格研究所参与评估测序仪器的Michael Quail说:“人们通常更多地使用长读测序。”“就像拼图一样,小块的拼图很难拼在一起,而大块的拼图则比较容易。”

一位科学家将一张样本载玻片装入一台白色机器

来源:Illumina, Inc.提供

Illumina在测序领域占据主导地位,但在某些方面,如读取长度和可移植性,挑战者正在出现

新一代测序仪能够读取更长的DNA片段——超过10,000个碱基。直到最近,这些技术都很容易出错。但是,科拉赫说,“大约两年前,我们打破了有两个世界的模式,一个是短而准确的读取,一个是长而嘈杂的读取,我们把两者的优点结合起来,创造了我们所谓的HiFi读取。”PacBio的单分子实时(SMRT)测序技术是由美国纽约康奈尔大学的Korlach和Stephen Turner共同发明的。该公司搬到了加州,并于2010年上市。

光学技术将单个DNA分子固定在称为零模波导的小孔中。Korlach说:“我们正在分别观察每个DNA聚合酶,你可以一直观察它,因为你不需要保持所有(放大的副本)同步。”这是通过将荧光标记附着在磷酸末端而不是碱基上的核苷酸合成而成的。Korlach解释说:“现在,当聚合酶切断磷酸二酯键时,它就会将标签从合并的核苷酸中分离出来,在每个合并周期之后,聚合酶都不知道其中有一个荧光标记,这确保了一个高效的过程。”

DNA链通过膜孔的数字艺术作品

资料来源:牛津纳米孔技术公司提供

牛津纳米孔测序仪可以读取超长的DNA和RNA片段

另一项重要的长读取技术来自牛津纳米孔,最初由英国牛津大学的Hagan Bayley开发,具有大约400万个碱基的读取记录。它还追踪单个DNA分子,这些分子被困在嵌入在耐电膜中的纳米孔中。当DNA通过小孔时,电流被中断,产生一种特征的“弯曲”,可以实时读取,以确定多个分子的DNA或RNA序列。Quail说:“(这)意味着测序发生得更快,单个分子可以在几分钟内测序。”2014年,牛津纳米孔还发布了其首款便携式阅读器“口袋大小”的测序设备

尽管人类基因组于2001年首次测序,但在“结构变异”领域仍然存在数百个空白,包括可能导致疾病的重复和倒置的基序。它们对Illumina短读测序是不可见的,但在4月Telomere-to-Telomere(T2T)联合完成了人类8号染色体的全序列。1“PacBio技术实现了这一壮举,”科拉赫说,“我们才刚刚开始发现所有存在的变异。”

获奖的科学

化学家David Klenerman解释说:“我们的目标不是解决测序问题,我们从生物技术和生物科学研究委员会获得了资金,做了一个非常基础的实验。”他们和英国剑桥大学的同事尚卡尔·巴拉苏布拉曼尼亚(Shankar Balasubramanian)一起,试图用荧光标记的核苷酸实时观察DNA合成。“我们意识到,我们正在做的实验基本上可以稍加改变,以使我们能够进行非常快速的测序。“最终,他们开发的下一代测序(NGS)技术在测序速度和成本方面提高了数百万倍,是生物科学的一场革命。”

一张两个人的照片

来源:©Emmi Korhonen/Lehtikuva/法新社/盖蒂图片社

Solexa创始人David Klenerman(左)和Shankar Balasubramanian分享了2021年千禧年奖。他们和帕斯卡·梅耶尔一起获得了2022年突破奖

Balasubramanian和Klenerman急切地指出,他们并不是独自完成这项工作的,而是与一个由跨学科人才组成的大型团队一起完成的。巴拉苏布拉曼尼亚说:“我们在化学部门做了很多概念验证工作。”这种方法被称为合成测序(SBS),首先将DNA分割成许多小的单链片段。这些被固定在流动细胞中,并使用荧光标记的颜色编码的核苷酸进行复制,带有可逆的终止端,该终止端阻止下一个碱基的合并,直到检测到颜色,之后终止端被切割。“(这种方法)的强大之处在于,你可以排列分子,并使整个过程并行化,”巴拉苏布拉曼尼亚说。

Balasubramanian和Klenerman在1998年成立了Solexa。2006年,他们发布了第一个商业化的基因组分析仪,可以在一次实验中对数十亿个碱基进行测序。对原始设计的一个改变是增加了一个扩增步骤,通过复制DNA片段来提高准确性。他们选择的桥式放大方法来自Pascal Mayer(与Klenerman和Blasubramanian一起获得2022年突破奖)和Laurent Farinelli,这对Solexa的成功至关重要。

Solexa在2007年被Illumina公司收购,巴拉苏布拉曼尼亚说,自那以后,Solexa公司对该系统进行了巨大的改进,现在每个实验可以测序数万亿个碱基。尽管有其他高通量DNA测序方法,但Illumina很快就主导了市场。2015年,该公司声称拥有所有权全世界90%的测序数据是用Illumina仪器生成的。

Klenerman说,他们知道他们的工作将产生影响,但他们没有预测到规模;“它(现在)被如此广泛地使用,这是相当令人惊讶的。”让巴拉苏布拉曼尼亚感到惊讶的是它的用途之广;“现在有数百种应用,[所有]检测计数和绘制生物系统中不同特征的方法,使用测序读数作为标签或代理。澳门万博公司对我来说,这在一开始是无法想象的。”

巴拉苏布拉曼尼亚认为,未来至关重要的一项进步是能够对DNA上的表观遗传标记(如甲基化)进行测序。他说:“我认为,超越这四个基因字母可以更全面地了解生物系统中正在发生的事情。”2012年,他创办了剑桥表观遗传学公司(Cambridge Epigenetics),开发直接测序甲基化和其他碱基修饰的技术。

巴拉苏布拉曼尼亚说:“我们已经经历了一个巨大的飞跃,一个小实验室现在可以做20年前全世界都做不到的事情。”但我们必须继续研究,因为我们可以从DNA中获得更多的信息。”

癌症诊断

对于大多数NGS公司来说,未来在于开发新的应用程序。其中一项为研究铺平了道路的发现是血液中存在小的DNA片段。公司最初用于胎儿DNA的非侵入性产前检测,现在已转向癌症诊断。罗斯是Illumina医学基因组学研究小组的一员,他说该公司现在将自己视为肿瘤学诊断开发公司。我们不仅专注于测序仪,我们还非常关注端到端流程。”

Illumina公司的TruSight Oncology 500试剂盒为临床医生提供了实体肿瘤中约500个基因突变的信息。其目的是使基于测序的诊断足够简单,非专业人员也能进行。Ion Torrent也在开发这种方法。费尔顿说:“我们设想,我们可以使下一代测序足够简单,无论是从技术湿侧操作,还是生物信息学,让大多数参与病理工作流程的实验室能够运行它。”最新的系统只需要10分钟的动手时间,从样本到报告。

罗斯说,最终,为了使NGS成为所有癌症患者的常规治疗方法,“(我们需要)更多的临床试验,将基因组测序与护理标准进行比较,以显示其临床和经济效益。”他补充说:“某些医疗保健系统开始接受人类全基因组测序。”他指的是英国国民医疗服务体系(NHS England)的基因组医学服务,该服务旨在为患有癌症和罕见疾病的国民医疗服务体系患者进行测序。

传染病监测——Covid-19的挑战

当然,癌症诊断并不是NGS的唯一应用。Korlach说:“如果Covid-19有任何一线希望的话,我认为它已经展示了测序的作用。”传统上,illumina不太关注传染病。但是,罗斯说,“疫情极大地改变了这种情况”。

Illumina开发了用于Covid-19监测的工具包,创建了一个参考基因组,可以与其他病毒基因组进行比较。罗斯说:“这很关键,因为这让我们有了一个监测项目,我们可以了解病毒的不同变种,以及它们是如何在社区中传播的。”2020年,Illumina捐赠了140万美元的测序系统和耗材非洲十个国家支持整个非洲大陆的监控工作。

在过去的两年里,离子激流还进入了传染病监测领域。“我们已经显著提高了敏感性……我们知道我们将进入一个更多接种疫苗和无症状患者的时代,所以我们将拥有较低的病毒载量。”它的设备可以从最少20个病毒拷贝中测序出完整的病毒基因组。牛津纳米孔公司开发了LamPORE检测方法,这是一种廉价且高度可扩展的Covid-19诊断检测方法,可在90分钟内检测出病毒,英国政府正在使用它对医护人员进行快速筛查。与大多数其他检测方法不同,LamPORE对Sars-CoV-2阳性样本中的RNA进行测序并扩增三个高度保守的基因。

未来路向

根据Korlach的说法,今天的测序能力是一项正在进行的工作,“我们还有很长的路要走,才能达到测序变得如此普遍,全面和准确,我们可以说,我们完成了!鹌鹑开玩笑说,我们还没有发明出《星际迷航》里的“三录仪”,它可以在几秒钟内分析一个物种。

插在笔记本电脑上的小型电子设备

资料来源:牛津纳米孔技术公司提供

像牛津纳米孔公司的MinION这样的便携式设备将测序能力带入了以前完全无法进入的现场应用

尽管成本大幅降低(2007年,人类基因组测序成本为30万美元,而今天为600美元),费尔顿说,成本仍然是“我们看到的更广泛采用的最大障碍”。2017年,Illumina的首席执行官弗朗西斯·德索萨(Francis D’souza)宣布了他的雄心,要达到100美元的人类基因组大关。罗斯说,这将“使基因组测序在医疗保健中的应用大众化”。在这一点上,可能的应用是巨大的。例如,Quail想象我们可以使用测序作为脑膜炎床边快速诊断的工具,或者立即识别抗微生物药物菌株。其他人设想对所有出生的婴儿进行测序,尽管罗斯承认“在这一领域显然需要讨论和解决伦理问题。”

费尔顿总结道:“在未来五到十年内,你很有可能会进行一项基于血液的癌症检测,它将检测出癌症的早期存在,并将被常规用于监测你的健康状况。”这很可能也适用于其他疾病。也许在未来,基因组测序将成为常规医疗检查的一部分,突变和表观遗传变化可以在一生中被追踪。但要取得这些进展,我们可能还需要再等一段时间,直到我们解释人类基因组的能力赶上测序技术已经提供的数据。