WO2019157693A1

WO2019157693A1 - Dna编码分子库及应用广的化合物筛选方法

Info

Publication number: WO2019157693A1
Application number: PCT/CN2018/076803
Authority: WO
Inventors: 韩珂珩; 托斯特·迪恩; 赵劲; 黄湧; 周海鹏; 李笑宇
Original assignee: 深圳劲宇生物科技有限公司
Priority date: 2018-02-14
Filing date: 2018-02-14
Publication date: 2019-08-22

Abstract

一种DNA编码分子库，包括DNA标签，该标签包括第一引物区和第二引物区，第一引物区一端连接有化合物，DNA编码分子库还包括短链DNA和夹板DNA，短链DNA的一端与第一引物区结合，短链DNA的另一端与夹板DNA通过碱基配对结合，且夹板DNA与DNA标签通过碱基配对结合；短链DNA在靠近化合物的一端连接有光交联基团。一种DNA编码分子库的化合物筛选方法：将上述DNA编码分子库中加入DNA连接酶进行连接处理，然后与蛋白质靶点孵育后光照处理；将光照处理后的产物进行电泳分离，收集与蛋白质靶点结合的DNA标签并进行DNA测序，以筛选出对应的化合物。该方法够用于任何蛋白质靶点的DNA编码分子库的筛选。

Description

DNA编码分子库及应用广的化合物筛选方法

技术领域

本发明属于生物化学技术领域，具体涉及一种DNA编码分子库及应用广的化合物筛选方法。

背景技术

当代药物研发中，针对疾病的药物靶点，通过构建大型的候选药物分子库，进行高通量、大规模筛选是新药研发中不可或缺的手段。当今世界上主要的制药公司均拥有大型的分子库和大规模的筛选平台用于新药研发。然而，传统的分子库和筛选平台成本高昂、技术门槛高、管理运行复杂，严重制约高通量筛选的发展和应用。近5年来，DNA编码分子库技术逐渐发展起来，成为药物研发中的新兴筛选方法。在DNA编码分子库中，每一个化合物与一个特异性的DNA链相连接，成为一个特异的条形码，实现对化合物的特异性编码。DNA编码分子库能够在极小的体系中，实现千万乃至上亿级的高通量筛选。筛选结果可以通过PCR扩增和DNA测序进行解码分析，以获得先导化合物用于进一步药物研发。近年来，DNA编码分子库已经得到新药研发领域中的广泛认可和应用，成为新药研发中的一种重要支撑技术。

使用DNA编码分子库进行药物筛选，所使用的靶点大多为纯化后的蛋白质，蛋白质靶点经修饰后，固载在磁珠之类的固相之上，再与分子库进行孵育。不能与靶点蛋白结合的小分子被洗脱，与结合在蛋白靶点上的小分子相分离，再在蛋白质变性条件下，对结合的小分子进行洗脱、PCR扩增，以及DNA测序，从而读出编码序列，获得与靶点结合的小分子的化学结构。然而，使用纯化、固载的蛋白靶点限制了DNA编码分子库的应用范围，很多其它类型的药物靶点，例如膜蛋白、蛋白质复合体、活细胞、病理组织等，由于较难或无法纯化和固载，并不能够用于DNA编码分子库的筛选，成为本领域中的一个瓶颈问题。

技术问题

本发明的目的在于克服现有技术的上述不足，提供一种DNA编码分子库及应用广的化合物筛选方法，旨在解决现有DNA编码分子库进行药物筛选时，只能应用于纯化、固载的蛋白靶点，从而限制了DNA编码分子库的应用范围的技术问题。

技术解决方案

为实现上述发明目的，本发明采用的技术方案如下：

本发明一方面提供一种DNA编码分子库，包括DNA标签，所述DNA标签包括第一引物区和第二引物区，所述第一引物区一端连接有化合物，所述DNA编码分子库还包括短链DNA和夹板DNA，所述短链DNA的一端与所述第一引物区结合，所述短链DNA的另一端与所述夹板DNA通过碱基配对结合，且所述夹板DNA与所述DNA标签通过碱基配对结合；所述短链DNA在靠近所述化合物的一端连接有光交联基团。

本发明另一方面提供一种DNA编码分子库的化合物筛选方法，包括如下步骤：

将上述DNA编码分子库中加入DNA连接酶进行连接处理，然后与蛋白质靶点孵育后光照处理；

将所述光照处理后的产物进行电泳分离，收集与所述蛋白质靶点结合的DNA标签；

将与所述蛋白质靶点结合的DNA标签进行DNA测序，以筛选出对应的化合物。

有益效果

本发明提供的DNA编码分子库中，引入了特有的短链DNA（本说明书中定义为PC-DNA）和夹板DNA，夹板DNA分别与短链DNA、DNA标签均通过碱基互补配对相结合，在其协助下，可使短链DNA与DNA标签连接，而PC-DNA中具有能够与DNA标签上连接有化合物一端的PCR引物区碱基互补的序列。这样通过夹板DNA协助使PC-DNA和DNA标签连接成链之后，PC-DNA还能够返回结合在标签上的PCR引物区，形成一个双链-大环的发卡结构；同时，因DNA编码分子库中，所有的DNA标签在两个末端具有相同的PCR引物区，所以仅需一种PC-DNA，就能够结合在所有DNA标签上的PCR引物区。这样，当光交联基团与蛋白质靶点发生交联反应后，可选出与蛋白质靶点结合的DNA标签，对该DNA标签进行DNA测序获取其序列信息，就可筛选与蛋白质靶点结合的化合物。

本发明提供的用上述本发明的DNA编码分子库进行化合物筛选的方法，彻底摆脱了传统DNA编码分子库筛选中对蛋白质靶点纯化和固载的要求。本方法不再依赖于物理洗脱来分离结合靶点和不结合靶点的化合物，也不依赖于酶降解，而是利用PC-DNA来实现配体诱导的光交联，以及从体系中电泳分离去除不与靶点结合的化合物，对与蛋白质靶点结合的DNA标签进行测序以筛选出对应的化合物，因此，从原理上讲，本方法能够应用于任何蛋白质靶点。本方法已经通过实验证明能够用于非固载蛋白质、蛋白质复合体、活细胞表面膜蛋白、细胞裂解液等多种复杂体系的DNA编码分子库的筛选，能够直接应用于膜蛋白、蛋白质复合体、活细胞、病理组织等其它现有筛选方法无法应用的药物靶点。

附图说明

图1为本发明中利用DNA编码分子库进行化合物筛选的流程示意图；

图2为本发明实施例1中对desthiobiotin化合物进行筛选的示意图；其中，a）是筛选流程，b）是测序结果；

图3为本发明实施例2中对GLCBS化合物进行筛选的示意图；其中，a）是筛选流程，b）是测序结果；

图4为本发明实施例3中具有4800个不同大环多肽的分子库进行化合物筛选的示意图，该分子库除了大量的背景序列之外，包含了一个带有GLCBS的标签序列做阳性对照；其中，a）是筛选流程，b）是富集结果。

本发明的实施方式

为了使本发明要解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图和实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

一方面，本发明实施例提供了一种DNA编码分子库，包括DNA标签，所述DNA标签包括第一引物区和第二引物区，所述第一引物区一端连接有化合物，所述DNA编码分子库还包括短链DNA和夹板DNA，所述短链DNA的一端与所述第一引物区结合，所述短链DNA的另一端与所述夹板DNA通过碱基配对结合，且所述夹板DNA与所述DNA标签通过碱基配对结合；所述短链DNA在靠近所述化合物的一端连接有光交联基团。

DNA编码分子库中是把DNA分子（即DNA标签）作为一种条形码，对分子库中的化合物进行编码，即每个化合物加上一个DNA标签（相同的化合物对应唯一碱基序列）。而本发明实施例提供的DNA编码分子库中，引入了特有的短链DNA和夹板DNA，夹板DNA分别与短链DNA、DNA标签均具有碱基互补配对相结合，可使短链DNA与DNA标签连接（后续通过DNA连接酶作用形成完整的DNA链），而PC-DNA中具有能够与所述DNA标签上连接有化合物的一端的PCR引物区（即第一引物区）碱基互补的序列，这样PC-DNA通过夹板DNA协助下和DNA标签连接成链之后，还能够返回结合在标签上的PCR引物区，形成一个双链-大环的发卡结构；同时，因DNA编码分子库中，所有的DNA标签在两个末端具有相同的PCR引物区，所以仅需一种PC-DNA，就能够结合在所有DNA标签上的PCR引物区。这样，当光交联基团与蛋白质靶点发生交联反应后，可选出与蛋白质靶点结合的DNA标签，对该DNA标签进行DNA测序获取其序列信息，就可筛选与蛋白质靶点结合的化合物。

进一步地，在本发明实施例的DNA编码分子库中，光交联基团包括苯基叠氮、二苯甲酮、丙基吖啶中的至少一种。光交联基团能够与蛋白质靶点发生交联反应以选出能与蛋白质靶点结合的化合物对应的DNA标签；而如果化合物不与蛋白质靶点结合，则蛋白质靶点与PC-DNA的交联不能发生。当然本发明的光交联基团很多种，具有相同功能的光交联基团都在本发明保护范围内，不局限于此几种。

进一步地，在本发明实施例的DNA编码分子库中，所述光交联基团连接在靠近所述化合物一端的所述短链DNA的第1-3个碱基内上，即所述光交联基团与所述短链DNA连接，连接位置在靠近所述化合物一端的第1-3个碱基范围内。在该范围内，光交联基团能够与蛋白质靶点更好地发生交联反应，在一优选实施例中，光交联基团连接在短链DNA靠近化合物一端的第1个碱基（即短链DNA序列的末端碱基）。

进一步地，在本发明实施例的DNA编码分子库中，所述夹板DNA与所述DNA标签通过7-10个碱基互补配对，所述夹板DNA与所述短链DNA通过7-10个碱基互补配对。在该碱基范围内可使DNA标签和短链DNA更加牢固地结合夹板DNA，更有利于后续DNA连接酶的作用。更进一步优选地，短链DNA具有20-25个碱基。该碱基范围内的短链DNA即可提供与夹板DNA互补配对连接的碱基数，又可提供和DNA标签上第一引物区互补配对连接的碱基数（在本发明一实施例中为10个碱基）。更进一步地，所述夹板DNA与所述DNA标签上的第二引物区通过碱基配对结合，这样DNA标签一端和短链DNA一端在夹板DNA协助下非常靠近，在DNA连接酶作用下更好地连接成完整的DNA链。

另一方面，本发明实施例还提供了一种DNA编码分子库的化合物筛选方法，其流程如图2所示，包括如下步骤：

S01：将上述DNA编码分子库中加入DNA连接酶进行连接处理，然后与蛋白质靶点孵育后光照处理；

S02：将上述光照处理后的产物进行电泳分离，收集与所述蛋白质靶点结合的DNA标签；

S03：将与所述蛋白质靶点结合的DNA标签进行DNA测序，以筛选出对应的化合物。

本发明实施例提供的DNA编码分子库的化合物筛选方法中，先将本发明实施例的DNA编码分子库中加入DNA连接酶进行连接处理；PC-DNA和DNA标签是通过DNA夹板的协助连在一起的，加入DNA连接酶进行处理，可通过DNA连接酶的作用将DNA标签和PC-DNA线性连接形成一条牢固、稳定的完整DNA链，这样后续电泳纯化过程中与蛋白质靶点发生交联反应连接PC-DNA与对应的DNA标签就不会分开，从而筛选对应的化合物。将本发明实施例特有的DNA编码分子库用DNA连接酶处理后，再与蛋白质靶点孵育，一部分化合物能够与靶点结合，使得PC-DNA上所带的光交联基团处于蛋白质靶点附近，在光照条件下，光交联基团能够共价捕获蛋白质靶点，而如果化合物不与蛋白质靶点结合，则蛋白质靶点与PC-DNA的交联不能发生；而没有和蛋白质靶点交联的化合物，由于具有较小的分子量，而在电泳条件下，与和蛋白质靶点交联的化合物相分离，因此实现了与“靶点-DNA”偶合物的分离，将分离获得的“靶点-DNA”偶合物上的DNA标签进行DNA测序，即可读出被选择的化合物的化学结构。本方法适用于任意一端连有小分子化合物的DNA编码分子库，不受编码方向的限制，同时利用现有的DNA编码分子库加入短链DNA和夹板DNA就可进行筛选，不需要分子库的标签重新设计或重建。

上述DNA编码分子库的化合物筛选方法，彻底摆脱了传统DNA编码分子库筛选中对蛋白质靶点纯化和固载的要求，其不再依赖于物理洗脱来分离结合靶点和不结合靶点的化合物，也不依赖于酶降解，而是利用PC-DNA来实现配体诱导的光交联，以及从体系中电泳分离去除不与靶点结合的化合物，对与蛋白质靶点结合的DNA标签进行测序以筛选出对应的化合物，因此，从原理上讲，本方法能够应用于任何蛋白质靶点。本方法已经通过实验证明能够用于非固载蛋白质、蛋白质复合体、活细胞表面膜蛋白、细胞裂解液等多种复杂体系的DNA编码分子库的筛选。

进一步地，在上述步骤S01中，蛋白质靶点可以为纯化蛋白质和/或非纯化蛋白质，蛋白质靶点还可以为修饰蛋白质或非修饰蛋白质，蛋白质靶点还可以为固载蛋白质和/或非固载蛋白质。从原理上讲，本方法能够应用于任何蛋白质靶点，将具有PC-DNA的DNA编码分子库与非固载、无修饰的蛋白质靶点孵育之后，该DNA编码分子库中的一部分化合物能够与蛋白质靶点结合，使得PC-DNA上所带的光交联基团处于蛋白质靶点附近，在光照条件下，光交联基团能够与蛋白质靶点发生交联反应，而如果小分子不与蛋白质靶点结合，则蛋白质靶点与PC-DNA的交联不能发生。

进一步地，在上述步骤S01中，所述光照处理的条件为：波长365nm，时间30s。在该光波长和光照时间条件下，可使光交联基团能够与蛋白质靶点更好地进行光交联反应。

进一步地，在上述步骤S02中，电泳分离为12%SDS-PAGE凝胶电泳分离。将DNA聚合物扩增延伸之后的溶液体系直接进行12%SDS-PAGE凝胶电泳分析，由于“靶点-DNA”偶合物分子量较高，在凝胶上将会处于蛋白质靶点本身之上；而没有和蛋白质靶点交联的分子库化合物，由于具有较小的分子量，处于凝胶的最下方，因此实现了与“靶点-DNA”偶合物的分离。

更进一步优选地，分离后的胶带，通过切胶、萃取、沉淀，获得纯化的“靶点-DNA”。更优选地，将分离后的“靶点-DNA”条带从胶上切下来，用1X PBS（磷酸盐缓冲液）浸泡过夜萃取，然后利用乙醇沉淀来获得纯化的“靶点-DNA”。

上述过程中，因蛋白质与PC-DNA之间是共价连接，而PC-DNA与对应的DNA标签通过DNA连接酶连成完整的DNA链，进而形成双链-大环的发卡结构，使得“靶点-DNA”偶合物在经过SDS-PAGE凝胶电泳这样强变性条件时更稳定且不被破坏结构；经过凝胶电泳分离的方法能够更好的去除不能和蛋白质靶点结合的化合物，降低背景，使得筛选效率更高。

最后，进一步地，在上述步骤S03中，将与蛋白质靶点结合的DNA标签进行DNA测序前可先PCR扩增，然后DNA测序，即可读出被选择的化合物化学结构。先进行PCR扩展再测序，测序效果更准确。

本发明先后进行过多次试验，现举一部分试验结果作为参考对发明进行进一步详细描述，下面结合具体实施例进行详细说明。

实施例1：

通过模型实验，验证我们提出的DNA编码分子库，含有DNA标签和PC-DNA形成的发卡结构，进行化合物筛选，该策略整个过程如图2所示。

我们首先选取了一个desthiobiotin的小分子化合物（结构式如图2a所示），将连接到一个DNA链上（即DNA标签），这个DNA链中有一个TTT的序列对之进行编码（如图2a所示的DNA-1）；desthiobiotin是一个已知的，能够与avidin蛋白质选择性结合，并具有高结合力的配体。与此相对应，另一个DNA链上面不带有任何小分子化合物，在相应的编码区域是一个“DDD”的混合序列（如图2a所示的DNA-2），其中D代表A，C，G三种碱基中的任意一种。

我们将这两种DNA以1:1000的比例进行混合之后，按照上文说明书所提出的：首先将DNA编码分子库（该分子库中加入有形成双链-大环发卡结构的PC-DNA和标签DNA）用DNA连接酶处理，然后与靶点蛋白avidin孵育相结合、光照处理（光照条件为：365 nm，30s）、凝胶分离、切胶、萃取浓缩、乙醇沉淀，获得“avidin-DNA”样品，对该样品经过PCR扩增之后，进行Sanger测序，测序结果如图2b所示。

从图2b中可知“，在筛选之前，1:1000的混合物的序列中，编码区仅仅能够看到DDD的混合序列，反映了体系中1000倍过量的DNA-2。然而在筛选之后（即经过图1中的流程之后），Sanger测序的结果显示，在编码区的序列变为了TTT序列，即证明了DNA-1被avidin靶点蛋白选择性的富集。本数据在原理上验证了我们所提出方法的可行性。

实施例2：

在用上述实施例1初步验证了我们的方法之后，我们进一步进行了实际的化合物筛选试验，整个过程如图3所示。。

如图3a所示，我们选取了DNA标签的5端连接有小分子GLCBS的DNA链（如图3a所示的DNA-3），GLCBS是一个已知的，能够与CA-II特异性结合的小分子，5端连接有小分子GLCBS的DNA链上带有一个“GCTT”对之进行编码。相对应的，另一条不带有任何小分子的DNA链上编码区域为“TCCC”（如图3a所示的DNA-4）。

将这两条DNA链按照1:10，1:100的比例混合，然后在夹板DNA和DNA连接酶的作用下，使DNA标签连接上一段带有光交联基团的PC-DNA序列，而且形成一个双链-大环的发卡结构。我们将用DNA酶连接处理形成的具有双链-大环结构的稳定DNA与靶点蛋白CA-II孵育相结合、光照处理（光照条件为：365 nm，30s）、凝胶分离、切胶、萃取浓缩、乙醇沉淀，获得“CAII-DNA”样品，对该样品经过PCR扩增之后，进行Sanger测序，测序结果如图3b所示。

从图3b可知：在筛选之前，混合物的序列中，编码区基本上都是TCCC的序列，反映了体系中过量的DNA-4。然而在筛选之后（即经过图1中的流程之后），Sanger测序的结果显示在编码区的序列变为了GCTT序列，证明了DNA-3被CA-II靶点蛋白选择性的富集，也进一步证明了该DNA编码分子库进行化合物筛选实验的可行性。

实施例3：

一种应用于真正的具有化学多样性的DNA编码分子库的化合物筛选方法，整个过程如图4所示。

该DNA编码分子库中：具有4800个不同大环多肽，其中每一个大环多肽均由一个特异的DNA序列所编码，同时我们在包含了一个带有GLCBS的序列作为阳性对照（如图4a所示）。此具有4801个化合物的分子库，有形成发卡结构的PC-DNA和标签DNA，按照上述实施例2的方法，对非固载无修饰的蛋白质靶点CA-II的筛选之后，进行PCR扩增和DNA测序来解码。由于本分子库的化学多样性和序列多样性，我们采用了第二代高通量测序仪来完成分子库的测序，最终数据以散点图的方式显示在图4b之中。从图4b可知：阳性对照GLCBS被富集了近60倍，而分子库中的其它化合物，由于缺乏和CA-II相结合的化学结构，基本没有被富集。

我们提供的数据从简单的模型分子库开始，到具有化学多样性的真正DNA编码分子库，较为系统地验证了所提出的新筛选方法（带光交联基团的PC-DNA连接、形成双链-大环的发卡结构、与靶点孵育、光交联）针对于非固载、无修饰蛋白质靶点筛选的可行性，本方法从原理上适用于各种DNA编码分子库，并不受分子库原始合成方法的限制，具有良好的普适性。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

一种DNA编码分子库，包括DNA标签，所述DNA标签包括第一引物区和第二引物区，所述第一引物区一端连接有化合物，其特征在于，所述DNA编码分子库还包括短链DNA和夹板DNA，所述短链DNA的一端与所述第一引物区结合，所述短链DNA的另一端与所述夹板DNA通过碱基配对结合，且所述夹板DNA与所述DNA标签通过碱基配对结合；所述短链DNA在靠近所述化合物的一端连接有光交联基团。
如权利要求1所述的DNA编码分子库，其特征在于，所述光交联基团包括苯基叠氮、二苯甲酮、丙基吖啶中的至少一种；和/或

所述光交联基团连接在靠近所述化合物一端的所述短链DNA的第1-3个碱基内上。
如权利要求1所述的DNA编码分子库，其特征在于，所述夹板DNA与所述DNA标签通过7-10个碱基互补配对。
如权利要求1所述的DNA编码分子库，其特征在于，所述夹板DNA与所述短链DNA通过7-10个碱基互补配对。
如权利要求1所述的DNA编码分子库，其特征在于，所述短链DNA具有20-25个碱基。
一种DNA编码分子库的化合物筛选方法，其特征在于，包括如下步骤：

将权利要求1-5任一项所述的DNA编码分子库中加入DNA连接酶进行连接处理，然后与蛋白质靶点孵育后光照处理；

将所述光照处理后的产物进行电泳分离，收集与所述蛋白质靶点结合的DNA标签；

将与所述蛋白质靶点结合的DNA标签进行DNA测序，以筛选出对应的化合物。
如权利要求6所述的DNA编码分子库的化合物筛选方法，其特征在于，所述蛋白质靶点包括纯化蛋白质和/或非纯化蛋白质。
如权利要求6所述的DNA编码分子库的化合物筛选方法，其特征在于，所述蛋白质靶点包括修饰蛋白质和/或非修饰蛋白质。
如权利要求6所述的DNA编码分子库的化合物筛选方法，其特征在于，所述蛋白质靶点包括固载蛋白质和/或非固载蛋白质。
如权利要求6所述的DNA编码分子库的化合物筛选方法，其特征在于，所述光照处理的条件为：波长365nm，时间30s。
如权利要求6所述的DNA编码分子库的化合物筛选方法，其特征在于，所述电泳分离为12%SDS-PAGE凝胶电泳分离。
如权利要求6-11任一项所述的DNA编码分子库的化合物筛选方法，其特征在于，所述电泳分离后还包括切胶、萃取和沉淀处理步骤。
如权利要求12所述的DNA编码分子库的化合物筛选方法，其特征在于，所述切胶后还包括用1X PBS浸泡处理步骤；和/或

所述沉淀为乙醇沉淀。
如权利要求6-11任一项所述的DNA编码分子库的化合物筛选方法，其特征在于，与所述蛋白质靶点结合的DNA标签进行DNA测序前还包括PCR扩增步骤。