WO2014094620A1

WO2014094620A1 - 一种先导化合物的合成及筛选方法与试剂盒

Info

Publication number: WO2014094620A1
Application number: PCT/CN2013/089873
Authority: WO
Inventors: 李进; 江洋; 陈湜; 瞿庆喜; 万金桥; 钟丽娜; 葛啸虎; 黄奇
Original assignee: 成都先导药物开发有限公司
Priority date: 2012-12-20
Filing date: 2013-12-18
Publication date: 2014-06-26
Also published as: CN103882532B; US20150321164A1; CN103882532A

Abstract

一种先导化合物的合成及筛选的方法，包括如下步骤：（1）取原料：取i种合成砌块与（i+2）种单链DNA片段；（2）用组合化学方法合成化合物，得到单链DNA标记的化合物的文库；（3）筛选：对DNA标记的化合物的文库进行筛选；（4）测序：取步骤（3）筛选得到的DNA标记的化合物，对DNA标记的化合物上的DNA测序，根据DNA序列即可确定该化合物的合成砌块和反应历程。还公开了一种先导化合物的合成及筛选试剂盒，以及一种组合化学文库。

Description

说明书

一种先导化合物的合成及筛选方法与试剂盒技术领域

本发明涉及化学领域，特别是涉及一种先导化合物的合成及筛选方法与试剂盒。

背景技术

自 80年代末期，随着分子生物学研究的突破一高通量筛选技术的发展，新药开发所需要的新分子实体的数目越来越多，科学家们把注意力从寻找天然产物转入合成大数目的化合物群——化学库，化学库是由诸多不同属性的有机化合物组成的。组合化学方法是一种合成化学库的技术，运用这项技术，不同系列的合成砌块——反应成分有序地排列起来以组成大系列的多样化分子实体群。组合化学合成法经常被人们称为数字游戏，也就是如何排列众多的合成砌块的问题，从理论上讲，组合合成的总反应产物数 N是由两个因素决定的，每一步的合成砌块数目 b和合成的步骤 x，例如，对于一个三步的线性组合反应，如果每步的反应物数目分别是 bl、b2、b3，那么理论上的总反应产物的数目是 N=blb2b3。组合化学研究的目标就是怎样有效地得到这一反应的所有产物 N。近年来，从固相合成到快速液相平行合成，组合化学在合成方法上取得了突破性的进展，常用的几种合成方法有固相有机合成和液相有机合成，固相有机合成包括混合裂分法和平行合成法，液相有机合成包括多组分液相合成法和官能团转化法。

组合化学合成技术建立的化学库中，产物成千上万，甚至上亿，像经典有机合成那样一个一个的纯化分离鉴定已不再可能。高通量筛选（Hi gh throughput screening, HTS)技术是指以分子水平和细胞水平的实验方法为基础，以微板形式作为实验工具载体，以自动化操作系统执行试验过程，以灵敏快速的检测仪器采集实验结果数据，以计算机对实验数据进行分析处理，同一时间对数以千、万计的样品检测，并以相应的数据库支持整个体系运转的技术体系。高通量筛选方法极大地提高了小分子化合物筛选的速度和效率，可以从组合化学文库中筛选作用于靶标分子的化合物。但是，用传统的高通量筛选方法将化合物从化学文库中筛选出来后，纯化并确定目标化合物的结构非常困难，需要的时间长，成本高，随着化合物文库的扩大，难度更大。

为了解决该问题，申请号： 95193518. 6，发明名称： "用标记编码的复杂组合化学文库 " 的专利申请公开了一种方法，即在合成的每个阶段，在化合物进行合成的载体（例如颗粒）上，专一地进行标记，以定义随同该载体上化合物合成时伴随的特定事项（通常指所加化学试剂）。所述标记使用鉴定剂分子来完成，该分子记录合成期间载体颗粒所经历的按顺序的事项，由此提供在该载体上生产化合物的反应历程。但是该申请并未提供实现该方法的技术方案。

现有技术中有报道使用寡核苷酸标记化合物的合成单元，根据生物领域的常识，在常规条件下，双链 DNA较单链 DNA稳定，因此通常选择双链的寡核苷酸对化合物的合成单元进行标记，如：公告号： EP 0643778 , 发明名称： " encoded combinatorial chemical l ibrari e s " 的专利公开了用单链寡核苷酸标记氨基酸或多肽的方法；公告号： US 7935658 ,发明名称： " methods for synths i s of encoded l ibrari es " 的专利公开了一种用双链 DNA片段标记合成砌块，形成化合物文库的方法；申请号： W0/2010/094036，发明名称： " METHODS OF CREATING AND SCREENING DNA-ENC0DED LIBRARIES " 的专利申请公开了用寡核苷酸标记化合物，形成化合物文库的方法，其寡核苷酸为发卡结构的双链 DNA。

但是，用双链 DNA标记合成砌块或者化合物时，在连接延伸过程中，双链 DNA容易交联，形成卷曲的三级结构，测序时，需要解链，操作较复杂，用双链 DNA标记三步以上的线性组合反应时，双链 DNA的测序结果误差较大，导致该方法只能停留在两维，因而只能通过增加每一步反应的合成砌块数目来增加文库中化合物数量，制得的化合物文库多样性差，不易合成得到目标化合物。

需要寻找新的，操作简便，结果更准确的标记方法。

发明内容

为了解决上述问题，本发明提供了一种先导化合物的合成及筛选的试剂盒和方法，以及一种新的组合化学文库。

名词解释：

合成砌块（Synthetic Bui lding Block), 又叫合成子，是指具备各种理化性质以及特定生物化学性质的、在新药（西药、农药）研发过程中必须使用的小分子化合物。先导化合物（lead compound)简称先导物，是通过各种途径和手段得到的具有某种生物活性和化学结构的化合物，用于进一步的结构改造和修饰，是现代新药研究的出发点。

反应历程：就是反应所经历的过程。

串联连接：是指若干段单链 DNA序列之间依次两端点相连，且连接点上没有分枝。

本发明先导化合物的合成及筛选的方法，它包括如下步骤：

( 1 ) 取原料： i种合成砌块与（i+2 ) 种单链 DNA片段，（i+2 ) 种单链 DNA片段包括 i种标记序列、 1种始端序列和 1种末端序列， i种标记序列分别特异标记 i种合成砌块，其中， i=l， 2， 3…！ 1 ;

(2 ) 用组合化学方法合成化合物：

a、制备初始合成砌块：选择广 i种合成砌块，将始端序列的一端连接在合成砌块上，另一端与所述合成砌块的特异标记序列串联连接，得到 l~i种标记有一端游离的单链 DNA的初始合成砌块； b、以步骤 a得到的初始合成砌块为基础，用线性组合反应的方式合成化合物，合成过程中，每加入新的合成砌块，就在与初始合成砌块相连的单链 DNA游离端串联连接所加入合成砌块的特异标记序列，使所述单链 DNA逐渐延长，合成结束后，在所述单链 DNA游离端串联连接末端序列，即得到单链 DNA标记的化合物文库；

( 3 ) 筛选：对 DNA标记的化合物的文库进行筛选，选出目标化合物；

(4 ) 测序：将步骤（3 ) 筛选得到的目标化合物的 DNA进行测序，确定目标化合物的结构。其中，步骤（1 ) 所述始端序列包括多聚腺苷。优选地，所述多聚腺苷为 12~20个腺苷。

其中，步骤（1 ) 所述标记序列的长度不低于 6bp。优选地，所述标记序列的长度为 9个 bp。其中，所述步骤（2 ) 合成过程中， pH为 8~12，温度为 (T3(rC。

其中，步骤（1 ) 所述标记序列的 3 ' 端连接一个核糖核苷酸。所述核糖核苷酸为胞苷。

其中，步骤（2 ) 中， a步骤中始端序列与初始合成砌块连接的方法是：

将始端序列氨基化，初始合成砌块羧基、巯基或炔基化，反应即得。

其中，步骤（2 )所述连接始端序列与标记序列、标记序列之间或者标记序列与末端序列的连接方法是：用多核苷激酶使得单链 DNA的 5 ' -端憐酸化，用 RNA连接酶连接，即可。所述的多核苷激酶为 T4多核苷激酶，所述 RNA连接酶为 T4 RNA连接酶。

其中，所述步骤（3 ) 中的筛选方法是基于受体-配体特异性反应的筛选方法。

本发明先导化合物的合成及筛选试剂盒，它包括如下成分：

1 ) i种合成砌块与（i+2 ) 种单链 DNA片段，单链 DNA片段分为始端序列、末端序列和 i种标记序列， i种标记序列分别特异标记 i种合成砌块，其中， i=l， 2， 3…！ 1 ;

2 ) 始端序列与合成砌块连接用试剂、组合化学方法用试剂和单链 DNA片段连接用试剂；

3 ) 化合物筛选用试剂；

4) DNA测序用试剂。

其中，成分 1 ) 所述始端序列包括多聚腺苷。优选地，所述多聚腺苷为 12~20个腺苷。

其中，成分 1 ) 所述标记序列的长度不低于 6bp。优选地，所述标记序列的长度为 9个 bp。其中，步骤（1 ) 所述标记序列的 3 ' 端连接一个核糖核苷酸。所述核糖核苷酸为胞苷。

其中，成分 2 ) 所述始端序列与合成砌块连接用试剂包含氨基化单链 DNA的试剂以及羧基、巯基或炔基化初始合成砌块的试剂。

其中，成分 2 ) 所述单链 DNA片段连接用试剂包括多核苷激酶和 RNA连接酶。

优选地，所述的多核苷激酶为 T4多核苷激酶，所述 RNA连接酶为 T4RNA连接酶连接。

本发明组合化学文库，它是以合成砌块为原料，用组合化学方法合成的组合化学文库，其中，每个化合物标记了一段单链 DNA序列，该单链 DNA序列的结构为始端序列—— i种标记序列——末端序列，所述 i种标记序列特异标记 i种组合化学合成过程中使用的合成砌块，其排列顺序与组合化学合成过程中合成砌块的加入顺序相同。

其中，所述标记序列的长度不低于 6bp。优选地，所述标记序列的长度为 9个 bp。

标记序列的长度为 6时，可制备 4096个不同序列的单链 DNA片段， DNA片段编码的、用于制备组合化学文库的合成砌块数以千计，能满足大多数化合物合成及筛选的需要；标记序列为或 9时，可制备 262144个不同序列的单链 DNA片段，其编码的、用于制备组合化学文库的合成砌块高达 262144个， DNA片段编码的、用于制备组合化学文库的合成砌块数以百万计，完全可以满足化合物合成及筛选的需要。若标记序列越长，其可以编码的合成砌块数量越大，制备的组合化学文库越大，但是相应的，成本越高，综合考虑库容和成本，标记序列的长度为 9时最优。

在本发明条件下，用单链 DNA标记合成砌块，连接过程中，单链 DNA之间不会互补而形成双链，结构稳定，也不易交联，测序时不需要解链，操作简单、快速、结果准确。因此，本发明方法可以包含多步线性组合反应，合成的化合物文库多样性好，库容大，容易合成得到目标化合物并确定其合成砌块、反应历程及化学结构，从而迅速合成得到大量目标化合物，是一种准确高效、操作简便、成本低廉的先导化合物文库合成和筛选方法，应用前景良好。

以下通过实施例形式的具体实施方式，对本发明的上述内容作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实施例。凡基于本发明上述内容所实现的技术均属于本发明的范围。

附图说明

图 1 本发明用组合化学方法合成化合物的进程示意图，其中， "H"表示合成砌块； "初"表示初始序列； "B"表示标记序列，其特异标记合成砌块，数字代表二者的对应关系，如， B1特异标记 HI; "末"表示末端序列；左栏表示反应步骤，与实施例 1反应步骤一致；得到的终产物，合成砌块从右至左仅表示合成砌块的加入顺序，初始序列、标记序列和末端序列从左至右表示最终得到的单链 DNA 序列的结构；

图 2 本发明化学文库以及筛选得到的胰蛋白酶抑制剂的电泳图；

图 3 测序结果柱状图，柱与化合物一一对应，其高度与该化合物与靶标的结合力相关； .

图 4 本发明胰蛋白酶抑制剂的 IC50图谱；

图 5 本发明胰蛋白酶抑制剂的 IC50图谱。

具体实施方式

以下通过实施例的形式来阐述具体实施方式，并对本发明的上述内容作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实施例。凡基于本发明上述内容所实现的技术均属于本发明的范围。

实施例 1 本发明先导化合物的合成及筛选方法

1、制备方法

( 1 )取合成砌块和单链 DNA片段：

i种合成砌块与（i+2)种单链 DNA片段，（i+2)种单链 DNA片段包括 i种标记序列、一种始端序列和一种末端序列， i种标记序列分别特异标记 i种合成砌块，其中， i=l, 2, 3—n;

始端序列上可连接多聚腺苷，以便分离纯化，标记序列上均可以连接胞苷，提高后续单链 DNA片段的连接效率。

表 1 单链 DNA片段

3

替换页（细则第 26条)

=2；

①初始合成砌块与始端序列连接：

取始端序列，氨基化，取合成砌块 1和 2, 羧基、巯基或炔基化；取活化的合成砌块 1和 2与活化的始端序列反应，得连接了始端序列的初始合成砌块；

4

替换页（细则第 26条) ②分别在始端序列上连接合成砌块 1和 2的标记序列（该连接方法除了可以用下述方法以外，还可以用其他单链 DNA的连接方法）：

用多核苷激酶使得单链 DNA的 5 ' -端憐酸化； RNA连接酶连接，即可；

③混合，得初始合成砌块混合物。

b、以步骤 a得到的初始合成砌块为基础，用线性组合反应的方式合成化合物，合成过程中，每加入新的合成砌块，就在与初始合成砌块相连的单链 DNA游离端串联连接所加入合成砌块的特异标记序列，使所述单链 DNA逐渐延长，合成结束后，在所述单链 DNA游离端串联连接末端序列，即得到单链 DNA标记的化合物文库；比如，三步线性组合反应。

I：

①合成（除了下述合成方法以外，还可以用其他化学合成方法）：取合成砌块 3~4，置于 2个微型反应容器中，分别与步骤 a制得的初始合成砌块混合物中混合，按照混合裂分法、平行合成法、多组分液相合成法或者官能团转化法合成；

②加标记序列：同步骤 a步骤②。

③混合，得混合物。

II：

①合成（除了下述合成方法以外，还可以用其他化学合成方法）：取合成砌块 5~6，置于 2个微型反应容器中，分别与步骤 b制得混合物混合，按照混合裂分法、平行合成法、多组分液相合成法或者官能团转化法合成；

②加标记序列：同步骤 a步骤②。

③加末端序列：同步骤 a步骤②。

④混合，即得到单链 DNA标记的化合物的文库。

(3) 筛选：对 DNA标记的化合物的文库进行筛选：

基于受体-配体特异性反应的色谱分离筛选方法，用生物靶分子对 DNA标记的化合物的文库进行筛选。

对色谱进行洗脱，将未与生物靶标分子结合的 DNA标记的化合物除去，分离得到与生物靶分子结合的 DNA标记的化合物。

(4) 测序：

取步骤（3 )筛选得到的 DNA标记的化合物，对 DNA标记的化合物上的 DNA测序，根据 DNA序列即可确定该化合物的合成砌块和反应历程。

实施例 2 用本发明方法成和筛选胰蛋白酶配体

1、材料和试剂

T4 PNK (500U NEB-M0201V) , T4 RNA l igase 1 (NEB- M0204S)， Cartridges (PCR purification Kit (cat. no 28104, Nucleotides removal Kit cat. no 28306) purchased from Qiagen (Hi lden, Germany) . dNTPs (0. 5 mM, NEB, cat. no89009) .

表 1所示单链 DNA片段，由 Genscript公司和 Biosune公司合成。

2、制备方法

( 1 )制备单链 DNA片段：

本实施例一共用了多少个合成砌块，请提供这写合成砌块及其编码序列。

54种合成砌块与 56种单链 DNA片段， 57种单链 DNA片段包括 55种标记序列、 1种始端序列和 1 种末端序列；

下述标记序列上均可以连接胞苷，提高后续单链 DNA片段的连接效率。

表 2 单链 DNA片段

标记序列 1 TGCCCAAGGc

2 CGTCTCGATc

3 TGCGCCGAGc

4 ATGGATTTAc

5 CATGTTTACc

6 GTAACATTAc

7 GGAGTTCAAc

8 CTTTGTACTc

9 ACTACCGTGc

10 ATGAATAAGc

6

替换页（细则第 26条)

C.8680/ClOZN3/X3d 0Z9t60/ 0Z OAV

6

C.8680/CTOZN3/X3d 0Z9t60/ 0Z OAV 01

C.8680/CT0ZN3/X3d 0Z9t60/ 0Z OAV 52 CGACTTAGCc

53 GTATGAAAAc

54 TTGGCAGGGc

55 TAGATATTGc

GGAGCTTGTGAATTCTGGc

末端序列

(2) 合成:

a、制备初始合成砌块：选择一种合成砌块，将始端序列的一端连接在合成砌块上，另一端与所述合成砌块的特异标记序列串联连接，得到一种标记有一端游离的单链 DNA的初始合成砌块；

①初始合成砌块与始端序列连接：

取始端序列，氨基化，取合成砌块 1，羧基化；取活化的合成砌块 1与活化的始端序列反应，得连接了始端序列的初始合成砌块。

反应混合物总体积为 150微升，溶剂为水和二甲亚砜体积比为 3 : 7，其中含三乙胺盐酸缓冲体系 ( H lO. O, 80mM)，其中，合成砌块 1的浓度为 30 mM，活化试剂 1_乙基 _3_ (3_二甲胺丙基)碳二亚胺盐酸盐（EDCI ) 浓度为 4 mM， 2-磺酸基羟基琥珀酰亚胺浓度为 10 mM，始端序列浓度为 20 M，室温反应 1小时。

②在始端序列上连接合成砌块 1的标记序列（该连接方法除了可以用下述方法以外，还可以用其他单链 DNA的连接方法）：

用多核苷激酶使得单链 DNA的 5 ' -端憐酸化； RNA连接酶连接，即可。

连接：取步骤①处理后的始端序列与标记序列 1， 15 ul的反应混合物包括 225pmol始端序列、 25pmol标记序列 1、 50单位 T4RNA连接酶以及连接反应的缓冲液；该混合物在 25°C孵育 1. 5h，后再 70°C加热 20min， T4RNA连接酶变性；加入 T4多核苷酸激酶和 InmATP, 反应 10个循环，接着在 75°C 孵育 20min使额外的多核苷激酶变性；

纯化：产物用等体积的 2 X上样缓冲液中，该缓冲液包含 40mM Tris-HCL (pH7. 6)、 1M NaCL和 ImM EDTA;

得到的混合物通过如下步骤纯化：反应液上 Qiagen Cartridge柱子；用 I X上样缓冲液悬浮； lOOOrmp离心 lmin，用硅化玻璃棉过滤；用 I X上样缓冲液、 0. 5M NaCL溶液和 80%乙醇依次冲洗；用 20 ul PE洗脱液洗脱；真空干燥，即可。

b、以步骤 a得到的初始合成砌块为基础，用三步线性组合反应的方式合成化合物，合成过程中，每加入新的合成砌块，就在与初始合成砌块相连的单链 DNA游离端串联连接所加入合成砌块的特异标记序列，使所述单链 DNA逐渐延长，合成结束后，在所述单链 DNA游离端串联连接末端序列，即得到单链 DNA标记的化合物文库；

第一批合成砌块，即初始砌块（1个）：合成砌块 1 ; 第二批合成砌块（5个）：合成砌块 2~6；

第三批合成砌块（49个）：合成砌块 55;

I：

①合成

取合成砌块 2~6，分别置于 5个微型反应容器中，与步骤 a制得的初始合成砌块混合，按照混合裂分法、平行合成法、多组分液相合成法或者官能团转化法合成。

分别置于 5个微型反应容器中，与步骤 a制得的初始合成砌块反应。以合成砌块 2为例，反应条件为 150微升反应混合物，溶剂为水和二甲亚砜体积比为 3:7，其中含三乙胺盐酸缓冲体系（pH9.0， 80mM)，合成砌块 1的浓度为 30mM，活化试剂 1-乙基 -3- (3-二甲胺丙基)碳二亚胺盐酸盐（EDCI) 4mM， 2-磺酸基羟基琥珀酰亚胺 10 mM，合成砌块 2的浓度 1.5 M，室温反应 15小时。

②分别加合成砌块 2~6的标记序列：同步骤 a步骤②。

③混合，得混合物。

II：

①合成

取合成砌块 7 5，分别置于 49个微型反应容器中，与步骤 a制得的初始合成砌块混合，按照混合裂分法、平行合成法、多组分液相合成法或者官能团转化法合成。

分别置于 49个微型反应容器中，与步骤 a制得的初始合成砌块反应。以合成砌块 2为例，反应条件为 150微升反应混合物，溶剂为水和二甲亚砜体积比为 3:7，其中含三乙胺盐酸缓冲体系（pH9.0， 80mM)，合成砌块 1的浓度为 30mM，活化试剂 1-乙基 -3- (3-二甲胺丙基)碳二亚胺盐酸盐（EDCI) 4mM， 2-磺酸基羟基琥珀酰亚胺 10 mM，合成砌块 2的浓度 1.5 M，室温反应 15小时。

②加标记序列：同步骤 a步骤②。

③加末端序列：同步骤 a步骤②。

④混合，即得到单链 DNA标记的化合物的文库。

(3) 筛选：对 DNA标记的化合物的文库进行筛选：

① CNBr树脂活化：

1 ) 0.1033克 CBNr活化 Sepharose 4B树脂，并把它们分为 2支，然后在 4ml的 ImM的氯化氢溶液 (PH3.0) 里静止；

2) 用 ImM的盐酸（pH值 3.0) 清洗液清洗 15分钟；

3) 将 4mg的胰蛋白酶溶解在 0.5毫升的偶联缓冲液（0.1M碳酸氢钠， 0.5M氯化钠， pH值 8.3) 中；

4) 轻微上下震荡混合物 1小时，在室温或 4°C过夜孵育；

5) 用 4ML耦合溶液洗去多余的蛋白质；

6) 将树脂转入 4mL0.1M的 Tris-HCl缓冲液 (pH8.0) 中，孵育 2小时;

7) 用清洗缓冲液 1和 2清洗树脂三次；（清洗液 1: 0.1M acetic acid, 0.5M NaCl, pH4.0;，清洗液 2: 0.1M Tris-HCl, 0.5M NaCl, pH8.0. )

8) 离心分离树脂， 6000r/min, 10min。

②胰蛋白酶在活化 CNBr树脂上的固化

1) 称取 100毫克活化的 CNBr 树脂至于 4毫升 ImM的盐酸中孵育；

2) 用 8mL的 ImM盐酸（1¾值 3.0) 清洗；

3)将 0.004mg/ml, 0.02mg/ml, 0. lmg/ml, 0.5mg/ml, 2.5mg/ml的胰蛋白酶溶液分别与五份活化 CNBr 树脂混合，在 4°C下孵育 5小时；

4) 用 0.1M Tris盐酸， 0.5M氯化钠，（pH值 8.3) 溶液清洗树脂；

5) 用 0.1M醋酸钠， 0.5M氯化钠，（pH4.0) 溶液清洗树脂；

6) 重复 4， 5步骤，交替清洗至少 3个循环。

7) 将胰蛋白酶固化的树脂在 4°C下保存在 PBS缓冲液中（pH7.4);

③胰蛋白酶化合物库亲和筛选

1) 取的步骤（2) 得到的单链 DNA标记的化合物的文库与 PBS缓冲液以 1:15体积比混合（17uL: 255uL);

2) 分别将 50 的文库样品加入胰腺牛胰蛋白酶 /CNBr树脂浆（2.5， 0.5， 0.1， 0.02， 0.004 和 Omg/mL ) ;

3 ) 用 PBS缓冲液配制 0. 3毫克 /毫升的鯡鱼精 DNA溶液；

4) 步骤 3 ) 得到的鯡鱼精 DNA溶液与步骤 2 ) 得到的胰腺牛胰蛋白酶 /CNBr树脂浆在 25 °C下孵育 1小时；

5 ) 将步骤 4 ) 的混合物转移到 2ml的 Spin柱子中，除去上清液；

6) 用 200 μ L PBS缓冲液洗涤树脂，重复 4次；

7 ) 在清洗后的浆液中加入 100 无菌水，筛选得到与胰蛋白酶配体样品。

鉴定：取步骤（2 ) 得到的单链 DNA标记的化合物文库与步骤（3 ) 筛选得到的胰蛋白酶亲和样品电泳检测。

检测结果如图 2所示，用胰腺牛胰蛋白酶 /CNBr树脂浆筛选均得到一目标条带，阴性对照则为空白条带，说明本发明筛选得到了纯化的胰蛋白酶配体样品。

(4) 测序：

取步骤（3 )筛选得到的 DNA标记的化合物，对 DNA标记的化合物上的 DNA测序，根据 DNA序列即可确定该化合物的合成砌块和反应历程：

取步骤（3 )筛选得到的样品进行聚合酶链接反应（PCR) , 将编码化合物的寡核苷酸代码进行 PCR 扩增（总体积 50微升， 30个循环，每个循环 94°C 1分钟， 55°C反应 1分钟， 72°C反应 40秒），以 5 μ L 胰蛋白酶 245库（浓度 100 fM) 为模板。

采用 Illumina Hi seq2000高通量测序平台，测序流程如下：

1 ) PCR扩增后的筛选寡核苷酸文库，利用 Axygen公司的 MAG-PCR-CL-250试剂盒进行纯化及质量检测报告；

2 ) 利用 Illumina公司的 Picogreen试剂盒进行核酸定量，得出样品核酸浓度，进行下一步测序文库制备；

3 ) 利用 Illumina公司的 chip-seq DNA sample试剂盒将 Hi seq2000特定测序接头（6个碱基长度）接在测序样本的 5 '端和 3 ' 端，再固定到 Hiseq2000测序仪的芯片 chip-seq plate上面，进行下一步桥式扩增；

4 )利用 Truseq PE Cluster Kit v3- cBot- HS 试剂盒进行核酸样本桥式扩增，在每个 chip- seq lane 上面得到足够测序使用的核酸簇（cluster ) ;

5 ) 利用 Hiseq 2000的 laser imaging系统， Truseq SBS Kit v3- HS (200cycles)的带标签 dNTP，记录从测序接头开始读取的每个碱基出现顺序及频次，测试核酸样本碱基；

6) 下机取出数据，数据处理。

测序结果如图 3所示，序列如 SEQ ID NO. 1所示： TCAGGCAGAGGCGATAGAGGCGATAGA, 结合表 2可以确定筛选得到的胰蛋白酶配体的结构如下：

根据该结构式，合成该化合物后进行检测，检测确定该化合物为胰蛋白酶抑制剂，其抑酶活性如图 4~5所示， IC50为 8. 1 ± 2. 1ηΜ，说明筛选得到的化合物确实为胰蛋白酶配体。

实验结果说明，本发明构建了一个含有 245个化合物的化学文库，并筛选得到了一个胰蛋白酶配体，其具有抑制胰蛋白酶的活性，说明本发明方法可以有效合成并筛选先导化合物。

实施例 3 本发明先导化合物的合成和筛选试剂盒

1、本发明试剂盒的组成（Ν个合成砌块的合成用量）

1 ) i种合成砌块与 i+2种单链 DNA片段，将单链 DNA片段分为始端序列、末端序列和 i种标记序列， i种标记序列分别特意标记 i种合成砌块，其中， i=l， 2， 3…！ 1 ;

表 3 合成砌块和不同序列的单链 DNA片段

序列名称单链 DNA的序列， 1. 5 M 合成砌块， 30 mM 5， -P03-AGATCTGATGGCGCGAGGGAAAAAAAAA 始端序列

AAA- 3' -P04

标记序列 TCAGGCAGAc

AGCATTTCAc

CGACTTAGCc

GGAGTTCAAc

CTACGAGAAc

TAGGCGTTAc

CGTTCTAATc

GGGAACGCGc

TTGTAGATCc

14

替换页（细则第 26条) ：：：

n TCTATGGGTc

GGAGCTTGTGAATTCTGGc

末端序列

2 ) 始端序列与合成砌块连接用试剂、组合化学方法合成用试剂和单链 DNA片段连接用试剂;

表 4 始端序列与合成砌块连接用试剂

表 6 DNA片段连接用试剂

4) DNA测序用试剂。

PCR纯化 MAG-PCR-CL-250 核酸定量 Picogreen试齐 !j盒文库构建 chip-seq DNA sample kit 桥式扩增 Truseq PE Cluster Kit v3 - cBot - HS 上机测序 Truseq SBS Kit v3- HS (200cycles) 本发明试剂盒按照本发明实施例 1提供的方法使用，可用于先导化合物的快速合成和筛选。综上，与现有技术用双链 DNA标记合成砌块相比，本发明用单链 DNA标记合成砌块，连接过程中单链 DNA不会互补，不易交联，结构稳定，单链 DNA的 PCR扩增以及测序较双链 DNA更为方便、快速。因此，本发明方法可以包含多步线性组合反应，合成的化合物文库多样性好，库容大，容易合成得到目标化合物，通过测序即可确定其合成砌块、反应历程及化学结构，准确高效、操作简便、成本低廉，具有良好的应用前景。

工业应用性

本发明试剂盒可用于先导化合物的快速合成和筛选，本发明方法可以包含多步线性组合反应，合成的化合物文库多样性好，库容大，容易合成得到目标化合物，通过测序即可确定其合成砌块、反应历程及化学结构，准确高效、操作简便、成本低廉。具有良好的应用前景，适合产业化应用。

Claims

权利要求书

1、一种先导化合物的合成及筛选方法，其特征在于：它包括如下步骤：

( 1 ) 取原料： i种合成砌块与（i+2 ) 种单链 DNA片段，（i+2 ) 种单链 DNA片段包括 i种标记序列、一种始端序列和一种末端序列， i种标记序列分别特异标记 i种合成砌块，其中， i=l， 2， 3…！ 1;

(2 ) 用组合化学方法合成化合物文库：

a、制备初始合成砌块：选择广 i种合成砌块，将始端序列的一端连接在合成砌块上，另一端与所述合成砌块的特异标记序列串联连接，得到 l~i种标记有一端游离的单链 DNA的初始合成砌块； b、用步骤 a得到的初始合成砌块，与广 i种合成砌块，用线性组合反应的方式合成化合物，合成过程中，每加入新的合成砌块，就在与初始合成砌块相连的单链 DNA游离端串联连接所加入合成砌块的特异标记序列，使所述单链 DNA逐渐延长，合成结束后，在所述单链 DNA游离端串联连接末端序列，即得到单链 DNA标记的化合物文库；

(4 ) 测序：将步骤（3 ) 筛选得到的目标化合物的 DNA进行测序，确定目标化合物的合成砌块和反应历程。

2、根据权利要求 1所述的方法，其特征在于步骤（1 ) 所述始端序列包括多聚腺苷。

3、根据权利要求 2所述的方法，其特征在于所述多聚腺苷为 12~20个腺苷。

4、根据权利要求 1所述的方法，其特征在于步骤（1 ) 所述标记序列的长度不低于 6bp。

5、根据权利要求 4所述的方法，其特征在于所述标记序列的长度为 9bp。

6、根据权利要求 1所述的方法，其特征在于步骤（1 ) 所述标记序列的 3 ' 端连接一个核糖核苷酸

7、根据权利要求 6所述的方法，其特征在于：所述核糖核苷酸为胞苷。

8、根据权利要求 1所述的方法，其特征在于：步骤（2 ) 中， a步骤中始端序列与初始合成砌块连接的方法是：

9、根据权利要求 1所述的方法，其特征在于：步骤（2 )中，合成过程 pH为 8~12，温度为 (T3(rC。

10、根据权利要求 1所述的方法，其特征在于：步骤（2 ) 中，始端序列与标记序列、标记序列之间或者标记序列与末端序列的连接方法是：用多核苷激酶使得单链 DNA的 5 ' -端憐酸化，用 RNA连接酶连接，即可。

11、根据权利要求 10所述的方法，其特征在于：所述的多核苷激酶为 T4多核苷激酶，所述 RNA 连接酶为 T4 RNA连接酶。

12、根据权利要求 1所述的方法，其特征在于：步骤（3 ) 所述筛选方法是基于受体 -配体特异性反应的筛选方法。

13、一种先导化合物的合成及筛选试剂盒，其特征在于：它包括如下成分：

1 ) i种合成砌块与（i+2 ) 种单链 DNA片段，（i+2 ) 种单链 DNA片段包括 i种标记序列、一种始端序列和一种末端序列， i种标记序列分别特异标记 i种合成砌块，其中， i=l， 2， 3…！ 1;

2 ) 始端序列与初始合成砌块连接用试剂、组合化学方法合成用试剂和单链 DNA片段连接用试剂；

3 ) 化合物筛选用试剂；

4) DNA测序用试剂。

14、根据权利要求 13所述的试剂盒，其特征在于成分 1 ) 所述始端序列包括多聚腺苷。

15、根据权利要求 14所述的试剂盒，其特征在于所述多聚腺苷为 12~20个腺苷。

16、根据权利要求 13所述的试剂盒，其特征在于成分 1 ) 所述标记序列的长度不低于 6bp。

17、根据权利要求 16所述的试剂盒，其特征在于所述标记序列的长度为 9 bp。

18、根据权利要求 13所述的试剂盒，其特征在于成分 1 ) 所述标记序列的 3 ' 端连接一个核糖核苷酸。

19、根据权利要求 18所述的试剂盒其特征在于：所述核糖核苷酸为胞苷。

20、根据权利要求 13所述的试剂盒其特征在于：成分 2 )所述始端序列与合成砌块连接用试剂包含氨基化单链 DNA的试剂以及羧基、巯基或炔基化合成砌块的试剂。

21、根据权利要求 13所述的试剂盒，其特征在于：成分 2 )所述单链 DNA片段连接用试剂包括多核苷激酶和 RNA连接酶。

22、根据权利要求 21所述的试剂盒，其特征在于：所述的多核苷激酶为 T4多核苷激酶，所述 RNA 连接酶为 T4 RNA连接酶连接。

23、一种组合化学文库，其特征在于：它是以合成砌块为原料，用组合化学方法合成的组合化学文库，其中，每个化合物标记了一段单链 DNA序列，该单链 DNA序列的结构为始端序列—— i种标记序列——末端序列，所述 i种标记序列特异标记 i种组合化学合成过程中使用的合成砌块，其排列顺序与组合化学合成过程中合成砌块的加入顺序相同。

24、根据权利要求 23所述的组合化学文库，其特征在于：所述标记序列的长度不低于 6bp。

25、根据权利要求 24所述的组合化学文库，其特征在于：所述标记序列的长度为 9个 bp。