你的放映集需要有多大?

你永远不会在药物研发小组里听到这样的话:‘你知道,我相信我们的筛选集已经足够大、足够多样化了。我们就顺其自然吧。“至少,我可以告诉你,我从来没有听过这样的话——如果我听过,我会立即躲开说这话的人,因为担心他们接下来会做什么。”在其他条件相同的情况下,这样的观点会被许多人视为精神不稳定的初步证据。

女科学家在药物分子库中使用条形码阅读器

来源:©P. Dumas/Eurelios/科学图片库

是吗?我们将分阶段解决这个问题。在某种程度上,这取决于你要筛选的目标类型。例如,许多制药公司都有大量的激酶抑制剂,可能觉得它们的库存有点太多了,希望这些东西的比例能低一些。如果你在这样一家公司工作,正在筛选一个激酶靶点,那么你应该至少期待一些合法的命中。这些可能不是选择性的,或者在你想再次学习的化学课程中,但它们将是真实的。在这种情况下,是的,你的筛选集已经足够大了。

但是,如果你研究的是一个更不寻常的目标,尤其是来自一大类还没有被深入研究过的蛋白质,情况就不同了。在这里,即使筛选大型复合集合,也可能找不到特别吸引人的东西(或者更糟糕的是,没有特别真实的东西)。在这种情况下,人们习惯于责怪收集本身——如果这个讨厌的东西更大,或者它不是充满了过去项目中无用的甲基-乙基-丁基类似物,或者没有那么多(比如说)激酶抑制剂,好吧,我们可能会在这里取得一些进展。在药物发现的早期阶段,没有比对更好的筛选收集的想法更纯粹的“草必须更绿”的渴望了。他们就在外面的某个地方!真正的成功,真正的线索——为什么,这个项目可能已经开始了!但我们坐在这里,平静地呆在一大片显然毫无价值的化合物中。到底是谁把这些东西放在牌组里的?

这些是导致dna编码库的单相思。一个大型的化合物集合在百万结构范围内;在库存比较充足的行业,甚至可能有几百万美元。但大多数dna编码库可能在一个小塑料瓶中有十倍(或更多)的化合物:如果你能筛选十倍于此的化合物,你难道不期望成功吗?诚然,这些化合物都来自于相同的核心结构,但拜托!1000万或2000万!这只是其中一个库。我向你保证,没有哪个负责扩大放映平台的委员会打算把它扩大十倍;任何认真进行这种筛选的人可能都有一大堆不同的化合物,很容易就能筛选出5亿种化合物。你不觉得这里面有什么妙招吗?

说实话,答案仍然是“可能不会”。不幸的是,有些目标就是这样。但相对于这些,是否有任何规模的放映集可以做到这一点?当然,在某些情况下,dna编码库或其他类似的大型辅助集合(例如,不寻常的肽)取得了成功,而标准筛选平台却没有。这本身就足以让“我们需要更多化合物”的倡导者觉得他们赢得了这场争论。但是,没有人能确定,如果你筛选一个完全无序的蛋白质,不管你向它扔多少化合物,你都应该期望它能得到真正的命中。绘制分析的命中率会给你一个可怕的长尾分布,没有人知道它延伸到多远。探索它将带你走上另一条未知的曲线,在那里你将花费越来越多的时间和金钱,而无法预测安全着陆。

所以在范围的一端你几乎可以肯定你会从屏幕中得到化学物质;另一方面,可能根本就没有这样的东西可以得到。(我不确定我自己是否相信后一类,但我也没有任何证据证明它不存在。)正是在这个广阔的中间地带,人们总是可以抱怨他们拥有的化合物,而梦想着他们没有的化合物。