DNA测序技术的进步正在改变科学家研究基因组的方式。菲利普·布罗德维斯将带来最新进展

2003年4月,人类基因组计划完成了一项艰巨的任务。为了破译人类细胞DNA中碱基的整个序列,这个国际团队辛苦了13年,耗资超过10亿英镑。

八年过去了,出现了一种剧毒菌株大肠杆菌正在德国蔓延。关于污染来源的指责不绝于口——是来自西班牙的黄瓜吗?埃及胡芦巴种子?本地出产的豆芽?迅速而明确地确定这种菌株的性质和来源对公共卫生和国际政治关系都至关重要。

为了做到这一点,研究人员求助于最新的基因测序技术:可以在几小时内对细菌基因组进行测序的台式机器。

这是一个典型的例子,说明了多年来利用测序来回答的科学问题是如何变化的,来自英国欣克斯顿的惠康信托基金会桑格研究所的朱利安·帕克希尔解释说,该研究所是人类基因组计划英国分部的所在地。他说:“随着时间的推移,我们所说的基因组发生了变化。”早期测序工作的目标是产生完整、准确的参考基因组——无论是人类、模式生物还是病原体。

现在,研究人员通常对个体基因组之间的变异更感兴趣。帕克希尔说,对于细菌,我们可以开始研究它们是如何进化的,它们是如何对药物和疫苗做出反应的,以及它们是如何传播的。“你不需要(完美、完整的)基因组来回答这些问题。你仍然需要它们作为参考,但现在更多的是关于变异——你需要搅动大量几乎相同的序列,以便筛选出非常少量的变异。从这个意义上说,你再也不用研究单个基因组了。”

加快速度

为了在现实的时间内获得如此多的信息,测序的速度和成本都需要巨大的飞跃。“我们在人类基因组计划前后开始研究单个细菌基因组。大约15年前,做一个细菌基因组大概需要两年的时间;在过去两年里,我们已经测序了3万个基因。”帕克希尔说。“那时候它的价格大约是50万英镑;现在大约是50英镑。”

近年来,在1000美元(650英镑)的人类基因组目标的推动下,成本和产量(仪器在给定时间内可以生成的碱基对序列的数量)一直是制造商的主要驱动力。英国伯明翰大学的生物信息学家尼克·洛曼(Nick Loman)说:“制造商相信,不管正确与否,如果你能制造出价值1000美元的人类基因组,它将为个性化医疗打开一个充满可能性的世界。”

洛曼解释说,在过去的五年里,美国公司Illumina基本上主导了高通量测序市场。虽然底层化学成分基本保持不变,但该公司每6-9个月就能稳定地将其系统的吞吐量提高一倍。

Illumina公司的测序技术提取一份DNA样本,并将其分割成片段,每个片段大约有150个碱基长。然后,一个短的DNA“适配器”序列被添加到片段的两端,这与连接到该公司测序流细胞的链互补。使用类似于聚合酶链式反应(PCR)的过程,每个片段被复制多次,以形成连接到细胞上的相同片段的“簇”。为了确定序列,机器引入荧光标记的四种核苷酸碱基版本,并使用激光和相机光学确定哪些簇包含了哪些荧光核苷酸。

洛曼解释说,帮助Illumina提高其系统性能的因素之一是,最初的集群之间间隔得很远。这意味着当细胞成像时,每个簇的起始和终止位置都非常明显。洛曼补充说:“有人担心,如果它们靠得太近,软件就无法弄清楚发生了什么,这些簇会聚集在一起,重叠,你就会得到一个混合的信号,这意味着你无法读取序列。”“但他们发现,这些簇会抑制彼此的生长,所以你可以增加密度,让每个芯片上有越来越多的簇,但它们不会混合在一起。”

但是成本和产量并不是衡量定序器性能的唯一标准。454生命科学,现在是罗氏诊断部门的一部分,专注于增加他们仪器的“读取长度”——它可以测序的DNA片段的大小。454启动了高通量测序技术,该技术与Illumina的工作原理类似——将DNA片段附着在珠子上,并用乳液聚合酶链反应进行扩增。这些珠子在芯片上的微观孔阵列中被捕获,并通过使用荧光标记的核苷酸合成互补链来进行测序。454的全球营销经理本•博斯(Ben Boese)说:“阅读长度的延长与阅读质量的提高有关。”“当你做测序实验时,更长的阅读可以更容易地解释观察结果。博斯说,目前Illumina机器可以读取大约150个碱基的片段,而最新的454台机器可以读取大约700-1000个碱基的长度。

Boese说,阅读长度对于测序以前没有测序过的生物来说变得特别重要,这意味着没有参考基因组来进行工作。这是因为重新组装基因组有点像拼拼图——碎片越大,拼图就越容易,特别是当基因组的某些部分重复多次时,因此很难确定任何一块碎片的位置。Boese指出:“读取时间越长,你就能获得更多关于分子真实情况的信息,就能减少可能导致你走上错误道路或在结果中留下不确定性的统计推断。”

便宜得很

然而,Illumina公司和454公司的测序仪都依赖于光学器件来捕获数据,这意味着将数据存储和处理成一个序列需要大量的计算机能力和存储容量。这是美国公司Ion Torrent试图通过完全消除对光学的需求来绕过的瓶颈。

“我意识到,我们真正需要的是一种专门设计的设备,可以直接从化学信息转换为数字信息,”Ion Torrent的首席执行官乔纳森·罗斯伯格(Jonathan Rothberg)说。该公司基于20世纪70年代的晶体管开发了一种对离子敏感的芯片,并成为电子pH计的基础。Rothberg解释说,这种芯片有数亿个微型传感器,每个传感器都能在复制时对DNA单链进行测序。这四种核苷酸碱基的溶液依次在芯片上重复泛滥。每当碱基被添加到DNA链上时,就会释放一个氢离子,该传感器会检测到氢离子并将其转化为电信号。这不仅消除了对相机和激光的需要,还意味着可以使用天然核苷酸碱基而不是荧光修饰的碱基,这是限制光学系统读取长度的原因之一。

根据Rothberg的说法,使用纯半导体芯片的最大优势在于,它可以让公司直接进入服务于电子行业的万亿美元供应链,而不必从头开始使用一种全新的技术。罗斯伯格说:“如果你想想其他机器,它们更难生产,因为它们是以前没有人制造过的光学仪器。”我们的第一批机器是在生产xbox的同一家工厂生产的,所以你可以使用机器的电子供应链,以及一次性芯片的半导体供应链。

由于这一优势,“离子激流”第一代芯片的成本是“上一代技术的十分之一”,Rothberg说。“我们认为这类似于个人电脑的问世,所以我们称之为个人基因组机。”

正如Rothberg所指出的,半导体制造技术一直在按照摩尔定律发展,该定律说,芯片上可以安装的晶体管数量大约每两年翻一番。这意味着现代电子产品比20世纪90年代制造的电子产品强大1000倍左右——因此,通过使用更现代的芯片代工厂,离子激流可以利用摩尔定律的积累,直接跳过更密集的传感器芯片。

该公司刚刚在美国德克萨斯州贝勒医学院安装了第一个离子质子测序仪演示模型。罗斯伯格说:“有了质子,我们的想法是制造一种可以在大约两小时内完成人类基因组的芯片,价格为1000美元。”我们还没有完全赶上(半导体行业的)步伐。

技术掌握着主动权

然而,所有这些在速度、成本、吞吐量和读取长度方面的进步不仅仅是让研究人员更容易地回答同样的问题。洛曼说:“每当有人推出一种新的测序仪,它有更高的吞吐量、更长的读取时间或更好的错误率,它就能实现人们多年来一直想做的大量实验。”“技术完全在推动科学的发展。”

最典型的例子就是德国大肠杆菌洛曼和他在伯明翰的同事参与了调查。研究人员不仅需要确定所涉及的细菌菌株,而且还需要对其进行测序,从而了解为什么这种细菌如此致命。“当时还没有该菌株的参考基因组——显然有很多其他菌株。e .线圈大多数基因之前都被发现过,但从未以这种特定的顺序出现过,”洛曼说。

这意味着他们需要正确的数据从头开始组装基因组,而不需要对基因顺序和布局进行假设。在此过程中,他们发现了导致这种菌株致命性的几个因素,以及它的进化以及它如何在人与人之间传播的线索。他补充说:“除了发现志贺毒素,它实际上会杀死你,还有一些其他毒性因素,比如聚集粘附因子,它可能会更紧密地附着在肠腔上,让毒素转移到肠道中。”

毛孔向前

虽然大多数最新的机器目前只被授权用于研究目的,但临床诊断测序在经济上可行的前景打开了一些令人兴奋的可能性。洛曼说:“想象一下,你可以从一个严重败血症患者身上抽血,每个小时都很重要。”“在传统微生物学中,你会在好氧瓶和无氧瓶中培养样本,你会看到一些菌落,然后经历一个试图识别它们的过程,然后你必须筛选抗生素耐药性。”如果你能跳过所有这些步骤,在几个小时内从基因组中获得身份和抗生素耐药性,那将是非常令人兴奋的。”

英国牛津纳米孔公司(Oxford Nanopore)认为,这种应用正是其即将推出的测序仪可能具有优势的地方。今年2月,该公司宣布已经对其第一个基因组进行了测序——一个5000个碱基对长的小型病毒基因组。虽然这距离人类基因组测序还有很长的路要走,但值得注意的是,该公司通过将全基因组的两条链连接在一起形成发夹结构,在一个10千碱基的读取中对它们进行了测序。

纳米孔测序与其他高通量方法的最大区别在于,它不依赖于合成互补的DNA链来确定序列。相反,DNA通过由蛋白质纳米孔制成的聚合物膜上的一个孔被输送。第二种“加工”酶控制DNA棘轮通过孔的速度,当每个碱基通过孔的检测器部分时,它会在周围溶液中的离子流过孔时造成电流的特征差异。

该公司的首席科学官约翰·米尔顿(John Milton)当时解释说,牛津纳米孔花了相当大的精力来开发纳米孔和加工酶变体的正确组合,以及一种稳定的聚合物膜,让小孔可以嵌入其中,使整个系统更加坚固。因为它可以从单个DNA分子中获得序列,而不需要复制多个副本来放大信号,该公司正在研发一种设备,可以处理复杂的混合样本,如全血或非常稀释的样本,如被污水污染的水源。

但为了最大限度地发挥这种性能,音序器需要具有可移植性。这就是为什么除了开发基于实验室的模块化平台外,该公司还公布了名为MinION的一次性设备的计划,该设备可以插入电脑的USB端口。

“到目前为止,DNA测序是相当专业的,”米尔顿说,但他相信,新技术将在改变人们使用测序的方式方面发挥重要作用。他说,我们可以提供铁锹,但其他人会用它们来挖。“如果我们试图预测人们会做什么,我认为我们唯一能预测的就是我们的预测会是错误的。”