CN113677836A - 用于处理或分析寡核苷酸编码分子的方法和系统 - Google Patents

用于处理或分析寡核苷酸编码分子的方法和系统 Download PDF

Info

Publication number
CN113677836A
CN113677836A CN202080021046.5A CN202080021046A CN113677836A CN 113677836 A CN113677836 A CN 113677836A CN 202080021046 A CN202080021046 A CN 202080021046A CN 113677836 A CN113677836 A CN 113677836A
Authority
CN
China
Prior art keywords
oligonucleotide
encoding
molecule
molecules
separation medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080021046.5A
Other languages
English (en)
Inventor
R·E·瓦茨
D·卡尼卡尔
P·J·麦克纳尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heistark Science
Original Assignee
Heistark Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heistark Science filed Critical Heistark Science
Publication of CN113677836A publication Critical patent/CN113677836A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/149Particles, e.g. beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/125Electrophoretic separation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • G01N2030/8813Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
    • G01N2030/8831Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving peptides or proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44756Apparatus specially adapted therefor
    • G01N27/44773Multi-stage electrophoresis, e.g. two-dimensional electrophoresis
    • G01N27/44778Multi-stage electrophoresis, e.g. two-dimensional electrophoresis on a common gel carrier, i.e. 2D gel electrophoresis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开提供了用于确定至少一种解析的寡核苷酸编码分子的靶活性的方法和系统。在一个实施方式中,方法包括提供分离介质,其中该分离介质含有至少一种靶分子;以及基于寡核苷酸编码分子对靶分子的不同靶活性,通过电泳分离至少两种寡核苷酸编码分子的混合物的各种方法。本文公开的方法的益处可以包括但不限于,收集和计算寡核苷酸编码分子的被编码部分对靶分子的靶活性的定性和定量数据。

Description

用于处理或分析寡核苷酸编码分子的方法和系统
相关申请的交叉引用
本申请要求于2019年3月14日提交的美国临时申请号62/818,645的权益,其全部内容通过引用借此并入本文。
背景技术
寡核苷酸编码的文库可以提供指导组合合成和识别具有不同特性和反应性的大量不同分子的有用方法。一般而言,寡核苷酸编码分子可以包括与被编码部分相连的编码部分,例如寡核苷酸。一般而言,编码部分用于记录或指导被编码部分的组合合成,并且在合成之后用于识别被编码部分的结构。以此类推,编码部分就像3-D打印机的分子条形码,它告诉打印机要产生什么,然后保持附接以在打印后识别产品。
然而,一旦已合成了数百万到数万亿不同寡核苷酸编码分子的文库,挑战在于确定这些被编码部分可能具有哪些有用的特性。寡核苷酸编码分子的合成和下一代测序一直是强大学术和工业研究的主题,导致越来越有效的方法来合成寡核苷酸编码分子、快速识别其被编码部分并确定其有用特性。尽管取得了这些进展,但用于分离、测量和/或确定这些分子的被编码部分的效用的方法未能跟上步伐。
仍然需要基于寡核苷酸编码分子对靶分子的结合靶活性来有效地分离寡核苷酸编码分子。仍然需要消除或减少假阳性和假阴性结果。仍然需要提供关于单个寡核苷酸编码分子对靶分子的靶活性的定性和/或定量数据。
发明内容
本公开提供了用于至少部分基于寡核苷酸编码分子对靶分子的不同靶活性(如通过电泳和寡核苷酸测序确定),收集至少一种解析的寡核苷酸编码分子的靶活性数据的方法和系统。本公开还提供了至少部分地基于寡核苷酸编码分子对于靶分子的不同靶活性的通过电泳分离至少两种寡核苷酸编码分子的混合物的方法和系统。本文公开的方法的益处可以包括,例如,提供寡核苷酸编码分子的被编码部分对靶分子的的靶活性的定性和定量数据。
确定至少一种解析的寡核苷酸编码分子的靶活性的方法包括提供分离介质,其中分离介质含有至少一种靶分子;将含有至少两种不同寡核苷酸编码分子的混合物的样品引入分离介质,其中所述至少两种不同寡核苷酸编码分子包括与至少一个被编码部分可操作连接的编码部分;通过将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,形成至少两种不同的解析的寡核苷酸编码分子;通过从分离介质分离至少两个分开的位置中的至少一个位置以形成至少一个解析的片段,从至少两种不同的解析的寡核苷酸编码分子中收获至少一种解析的寡核苷酸编码分子;处理至少一种解析的寡核苷酸编码分子以允许进行聚合酶链式反应(PCR);通过对至少一种解析的寡核苷酸编码分子的编码部分进行PCR扩增该至少一种解析的寡核苷酸编码分子的至少一种被编码部分;以及通过处理至少一种解析的寡核苷酸编码分子的至少一种被编码部分的至少一个位置和特征(identity)来确定至少一种解析的寡核苷酸编码分子的靶活性。
在一个实施方式中,本方法包括提供分离介质,其中分离介质含有至少一种靶分子;将含有至少两种不同寡核苷酸编码分子的混合物的样品引入分离介质,其中所述至少两种不同寡核苷酸编码分子包括与至少一个被编码部分可操作连接的编码部分;通过将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,形成至少两种不同的解析的寡核苷酸编码分子;通过从分离介质分割(segmenting)至少两个分开的位置中的至少一个位置以形成至少一个解析的片段,从至少两种不同的解析的寡核苷酸编码分子中收获至少一种解析的寡核苷酸编码分子;处理至少一种解析的寡核苷酸编码分子以允许进行PCR;通过对至少一种解析的寡核苷酸编码分子的编码部分进行PCR扩增至少一种解析的寡核苷酸编码分子的至少一个所编码的部分;以及通过将至少一个位置与至少一种解析的寡核苷酸编码分子的至少一个被编码部分的特征相关联来收集至少一种解析的寡核苷酸编码分子的靶活性数据。
在该方法的一个实施方式中,至少一种靶分子包括细胞、寡核苷酸、蛋白质、酶、核糖体和nanodisc中的至少一种。在该方法的一个实施方式中,分离介质含有颗粒、聚合物和分离表面中的至少一种,并且至少一种靶分子连接至分离介质、颗粒、聚合物、和分离面中的至少一种。在该方法的一个实施方式中,颗粒包括聚合物颗粒或金属胶体。在该方法的一个实施方式中,聚合物具有至少一种靶分子的最低重量靶分子的10%或更多的分子量。在一个实施方式中,该方法包括基于至少一种靶分子与至少两种不同的寡核苷酸编码分子的编码部分之间的至少一种靶活性来分离至少两种不同的寡核苷酸编码分子。在该方法的一个实施方式中,至少一种靶活性包括至少一种靶分子对至少一种寡核苷酸编码分子的编码部分的化学修饰。在该方法的一个实施方式中,寡核苷酸含有至少两个编码区域,至少一个被编码部分含有至少两个位置构建单元(building block),并且至少一个被编码部分的每个位置构建单元由寡核苷酸的1至5个编码区识别。在该方法的一个实施方式中,分离介质含有多孔凝胶和缓冲系统。
在该方法的一个实施方式中,至少两种不同的寡核苷酸编码分子具有根据式(I)的结构,
(I)G—L—B
其中
G包括包含至少两个编码区域的寡核苷酸;
B为含有至少两个位置构建单元的被编码部分;
L为可操作地将G连接到B的接头;和
其中B中的每个位置构建单元根据G的1至5个编码区域的位置分别识别。
在该方法的一个实施方式中,至少两种不同的寡核苷酸编码分子具有根据式(II)的结构,
(II)[(B1)M—L1]O—G—[(L2—(B2)K]P
其中
G包括包含至少两个编码区域的寡核苷酸;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接到G的接头;
L2为可操作地将B2连接到G的接头;
O为零或1;
P为零或1;
条件是O和P中的至少一个是1;和
其中位置M的位置构建单元B1和/或位置K的B2各自由G的1至5个编码区域识别。
在该方法的一个实施方式中,至少两种不同的寡核苷酸编码分子具有根据式(III)的结构,
(III)[(B1)M—L1]O—G’—[(L2—(B2)K]P
其中
G’包括寡核苷酸,G’包括至少两个编码区域和至少一个发夹区(haripin);
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,M与K相同或不同;
L1为可操作地将B1连接到G’的接头;
L2为可操作地将B2连接到G’的接头;
O是从0到5的整数;
P是从0到5的整数;
条件是O和P中的至少一个是1至5的整数;和
其中位置M处的位置构建单元B1和/或位置K处的B2各自由G’的1至5个编码区域识别。
在一个实施方式中,该方法进一步包括通过在第一方向遍及分离介质施加第一分离处理,将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,其中第一分离处理包括第一电压方案和第一持续时间。在一个实施方式中,该方法进一步包括通过在基本上垂直于第一方向的第一分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。在一个实施方式中,该方法进一步包括通过在第二方向遍及分离介质施加第二分离处理将至少两种不同的寡核苷酸编码分子分离到分离介质的至少两个分开的位置,其中第二方向基本上垂直于第一方向,其中第二分离处理包括第二电压方案和第二持续时间。在一个实施方式中,该方法进一步包括通过在基本上垂直于第一分割方向的第二分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。
附图说明
当结合附图阅读时,将更好地理解前述概述以及实施方式的以下详细描述。为了阐释的目的,附图中示出了一些实施方式,这些实施方式可能是优选的。应当理解,所描绘的实施方式不限于所示的精确细节。
图1为描绘本文公开的方法的实施方式的流程图。
图2为本文公开的方法的实施方式的示意图。
图3为用于模制用于靶活性分离的电泳通道的方法的实施方式的示意图。
图4为使用两种不同的分离介质进行二维电泳的方法的实施方式的示意图。
图5为用于荧光标记寡核苷酸编码分子的合成方案的化学表示(chemicalrepresentation)。
图6A显示了阳性对照化合物的化学结构。
图6B显示了阳性对照化合物的化学结构。
图6C显示了阳性对照化合物的化学结构。
图6D显示了阳性对照化合物的化学结构。
图6E显示了阳性对照化合物的化学结构。
图6F显示了阳性对照化合物的化学结构。
图6G显示了阳性对照化合物的化学结构。
图6H显示了阳性对照化合物的化学结构。
图6I显示了阳性对照化合物的化学结构。
图6J显示了阳性对照化合物的化学结构。
图6K显示了阳性对照化合物的化学结构。
图6L显示了阳性对照化合物的化学结构。
图6M显示了阳性对照化合物的化学结构。
图6N显示了阳性对照化合物的化学结构。
图6O显示了阳性对照化合物的化学结构。
图6P显示了阳性对照化合物的化学结构。
图7A含有基于浓度的化合物的偏振荧光图,其中702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732分别对应于图6A、6B、6C、6D、6E、6F、6G、6H、6I、6J、6K、6L、6M、6N、6O、6P的阳性对照化合物。
图7B含有基于浓度的化合物的偏振荧光图。
图8A为通过靶活性分离方案分离的对照化合物的色谱图。
图8B为通过靶活性分离方案分离的对照化合物的色谱图。
图8C为通过靶活性分离方案分离的对照化合物的色谱图。
图8D为通过靶活性分离方案分离的对照化合物的色谱图。
图9为通过靶活性分离方案分离的对照化合物的混合物的色谱图。
图10为通过靶活性分离方案分离的对照化合物的混合物的色谱图。
图11A为通过靶活性分离方案分离的对照化合物的混合物的色谱图。
图11B为通过靶活性分离方案分离的对照化合物的混合物的色谱图。
图12为用于实施本文公开的系统和方法的实施方式的计算机系统的示意图。
详细说明
除非另有说明,所有测量值均采用标准公制单位。
除非另有说明,前缀“u”在直接用作单位测量时表示“微”并且通常缩写为“μ”。例如,“uL”代表“微升”或“μL”。
除非另有说明,词“一个”、“一种”或“该”的所有实例都可以指代它们修饰的词的一个/种或多于一个/种。
除非另有说明,否则短语“……中的至少一个”是指对象中的一个或一个以上或一个以上的任意组合。例如,“H1、H2和H3中的至少一个”是指H1、H2或H3或其任何组合。
除非另有说明,术语“约”是指所描述的非百分比数的±10%,四舍五入到最接近的整数。例如,大约100mm,可以包括90到110mm。除非另有说明,术语“约”是指百分比数的±5%。例如,约20%可包括15%至25%。当就范围讨论术语“约”时,该术语是指小于下限且大于上限的合适量。例如,约100至约200mm可包括90至220mm。
除非另有说明,术语“杂交(hybridize)”、“杂交(hybridizing)”、“杂交的(hybridized)”和“杂交(hybridization)”包括沃森-克里克碱基配对,其包括用于DNA的鸟嘌呤-胞嘧啶和腺嘌呤-胸腺嘧啶(G-C和A-T)配对以及用于RNA的鸟嘌呤-胞嘧啶和腺嘌呤-尿嘧啶(G-C和A-U)配对。通常,这些术语用于选择性识别核苷酸的互补链的核苷酸链,称为反密码子或反编码区。
短语“选择性杂交(selectively hybridizing)”、“选择性杂交(selectivehybridization)”、“选择性分选(selectively sorting)”和“选择性识别(selectiverecognition)”是指互补寡核苷酸链相对于非互补寡核苷酸链的5:1至100:1或更多的选择性。
术语“寡核苷酸编码分子”是指含有寡核苷酸和至少一个被编码部分的本公开的分子。
术语“编码部分(encoding portion)”是指含有寡核苷酸的寡核苷酸编码分子的一部分,其中该寡核苷酸编码并且可以识别该寡核苷酸编码分子的被编码部分。
术语“被编码部分(encoded portion)”是指寡核苷酸编码分子的一个或多个部分,所述寡核苷酸编码分子含有构建单元的结构,例如位置构建单元B1和B2,它们被编码并且可以通过寡核苷酸编码分子的编码部分被识别。例如,术语“被编码部分”不包括例如接头,即使这些结构可以作为合成被编码部分的过程的一部分被添加,因为接头不是由寡核苷酸编码分子的编码部分编码的。作为第二个示例,术语“编码部分”和“被编码部分”将不包括在编码过程之后引入的分子结构,例如荧光侧链。
短语“位置构建单元的总数”是指被编码部分中构建单元的总数。术语“构建单元”的含义可能因上下文而异。术语“构建单元”一般是指在编码部分中被编码并被做为被编码部分的化学变化。构建单元的第一个示例是化学亚基,其可以与接头或另一构建单元反应并与接头或另一构建单元结合以形成被编码部分的一部分。作为第二个示例,构建单元可以是包括去除化学部分的化学变化。其具体示例包括但不限于酯的水解,或胺或醛或醇的脱保护。第三个示例包括代表对接头或另一个构建单元进行的化学变化的构建单元,这些变化改变了接头或构建单元的反应性。具体示例包括但不限于将醇氧化为醛或酮、将醛或酮还原为醇、将硝基基团还原为胺、将叠氮化物还原为胺,或将胺氧化成硝基基团或叠氮化物。
术语“被识别(identified)”和“识别(identifies)”是指编码部分的编码区域或编码区域的组合与寡核苷酸编码分子的被编码部分的构建单元的结构和/或序列之间存在的相关性。一般而言,编码区域序列的这种相关性可以与用于构建被编码部分的合成步骤的知识相组合,以允许推断或识别被编码部分的序列、结构和/或预测结构,即使并且当序列是从寡核苷酸编码分子的编码部分的PCR产生的拷贝间接获得的。
术语“第一”、“第二”等被理解为仅指定或区分所指的是哪个对象并且通常基于首先遇到的哪个对象的顺序的术语。例如,“第一”阵列是最先使用的阵列,而第一编码区域是能够固定在第一阵列上的第一编码区域。除非另有说明,术语“第一”、“第二”等不指分子内的位置。例如,应当理解,第一编码区域和第二编码区域可以是或可以不是连续的,并且在编码部分内可以彼此靠近或不靠近。
在本公开中,分子式中的连字符或破折号表示分子式的部分通过共价键或杂交直接彼此连接。
除非另有说明,核苷酸、整数值和百分比的所有范围包括所有中间整数以及端点。例如,5至10个核苷酸的范围将被理解为包括5、6、7、8、9和10个核苷酸。
在某些实施方式中,本公开涉及含有至少一个寡核苷酸部分作为编码部分和至少一个被编码部分的寡核苷酸编码分子(OEM),其中该寡核苷酸部分使用组合化学指导或编码至少一个编码部分的合成。在某些实施方式中,寡核苷酸编码分子的寡核苷酸部分可以识别或促进寡核苷酸编码分子的至少一个被编码部分的推导(deduction)。在某些实施方式中,本公开的寡核苷酸编码分子含有至少一个寡核苷酸或含有至少两个编码区域的寡核苷酸部分,其中至少两个编码区域的组合对应于并可用于识别或推导被编码部分中的构建单元的序列或被编码部分的结构的序列。在某些实施方式中,至少一个寡核苷酸或寡核苷酸部分可以通过聚合酶链反应(PCR)扩增以产生至少一个寡核苷酸或寡核苷酸部分的拷贝。在一个实施方式中,可以对原始寡核苷酸或寡核苷酸部分或其拷贝进行测序以确定寡核苷酸编码分子的至少两个编码区域的组合的特征。在某些实施方式中,至少两个编码区域的组合的特征可以与用于合成寡核苷酸编码分子的被编码部分的一系列组合化学步骤相关。在某些实施方式中,用于合成被编码部分的一系列组合化学步骤可以识别或允许推导寡核苷酸编码分子的被编码部分。
合成寡核苷酸编码分子文库的方法已经并将继续成为密集学术和工业研究的焦点,由于它们能够系统地评估数百万到数十亿分子对靶分子的分子间特性,例如靶活性。例如,如果靶分子是癌症通路中的关键酶,那么研究人员可以确定数百万到数十亿寡核苷酸编码分子中的一个或多个的被编码部分是否可以以增加或减少其催化反应速率的方式与该酶结合。以此类推,这就像通过使用可以在短时间内电子上尝试数百万种组合直到找到正确组合的设备来确定数字锁的组合。然而,数字锁被设计为通过正确的数字序列解锁,而生物靶标可能没有正确的结构组合,但希望可以发现一种或多种分子,它们可以很好地运作足以作为一种有效的疗法进行商业化。为了应对这一挑战,寡核苷酸编码分子文库可以使用一种引导进化来越来越接近可具有期望结合亲和性的分子。例如,如果寡核苷酸编码分子与靶分子的反应较弱,则可以合成下一个寡核苷酸编码分子文库,以探索最有希望的候选者的被编码部分的结构变化,希望发现具有更好的结合特性的被编码部分。这种引导进化和评估可以推进,直到找到有效的解决方案,或者到达死胡同,这样下一个分子被选为引导进化研究的起点。
然而,尽管该研究领域有望发现具有有用特性的分子,但绝大多数研究一直致力于开发合成寡核苷酸编码分子文库的有效方法。从编码部分或其聚合酶链反应(PCR)拷贝测序和识别寡核苷酸编码分子的被编码部分的下一代方法也取得了相当大的发展。还付出了相当大的努力来应用统计技术以从测序数据中取得更大的维度。在如何在靶分子上测试寡核苷酸编码分子的期望特性的问题上进展较少。
一种测试寡核苷酸编码分子文库是否与靶分子反应的传统方法是“大规模暴露”方法,其在某些情况下被称为“淘选(panning)”。大规模暴露方法简单地将靶分子暴露于溶剂或介质中的寡核苷酸编码分子文库或其一部分。通常,靶分子是固定的,并且寡核苷酸编码分子结合靶分子。暴露一段时间后,去除溶剂或介质,留下强结合寡核苷酸编码分子的附着靶分子或与靶分子缔合。这些强结合寡核苷酸编码分子可以通过以下来鉴定:使用PCR来制作编码部分的拷贝,然后对拷贝或原件(original)进行测序以解码和识别强结合编码部分的结构。该方法可以发现哪些成员或特别的寡核苷酸编码分子与靶分子强烈结合或缔合。然而,这种大规模暴露方法是不可靠的,并且在复制实验中确定的结合剂(binder)套件(suit)可能会有很大差异。通常,每次只可重现地捕获最强的结合剂,即使可能有许多分子只是中等或弱结合剂,但其结构可以为将化学结构与生物活性相关联提供有价值的见解。此外,该方法可以提供假阳性,其中在测试室中保持固定的成员结合到测试环境的某些部分,例如室本身、或系留介质、或另一种寡核苷酸编码分子。大规模暴露方法还提供假阴性,因为弱、中甚至强结合靶分子的分子可以结合、释放,然后在去除溶剂时被冲走。结合、释放和被冲走的分子永远无法在测序数据中恢复或识别,因此,这种由于试验损耗(assayattriton)造成的假阴性使真正的结合剂与非结合剂无法区分。假阴性的第二个来源是存在许多假阳性。通常,假阳性会在测序数据中提供比真正结合剂更强的信号。在这种情况下,人们无法从假阳性中辨别出真正的结合剂,而真正的结合剂在噪音中丢失了。事实上,这种大规模暴露方法没有提供测量寡核苷酸编码分子对靶分子的靶亲和性的数据。该标准方法产生的数据是二进制的:在PCR和测序过程中存在意味着结合;并且在PCR期间不存在意味着未结合。从处理的角度来看,大规模暴露方法可能是有效的,但从数据采集的角度来看,它效率低下且受限的。由于获取数据是寡核苷酸编码分子文库高通量筛选的主要目标,因此大规模暴露方法已成为药物发现过程中的瓶颈。
测试寡核苷酸编码分子文库是否结合靶分子的另一种传统方法是“大规模暴露然后电泳”方法,在一些情况下称为“凝胶阻滞分析(gel shift assay)”。在这种方法中,大规模暴露然后电泳方法简单地将靶分子暴露于溶剂或介质中的寡核苷酸编码分子文库,其方式类似于先前讨论的“大规模暴露”方法,只是靶分子没有结合。相比之下,结合靶分子的寡核苷酸编码分子文库、未结合的靶分子和未结合的寡核苷酸编码分子的混合物通过将混合物进行传统电泳来纯化。传统的电泳根据分子大小和电荷之间的差异来分离与靶分子结合的寡核苷酸编码分子,这可以将与寡核苷酸编码分子结合的靶分子与未结合的靶分子和未结合的寡核苷酸编码分子分离。这种大规模暴露随后进行电泳的方法可具有将与靶分子结合的那些寡核苷酸编码分子与那些寡核苷酸编码分子和保持未结合的靶分子分离的益处。然而,这种传统技术遭受同样的假阴性,并提供相同的二进制数据:结合或未结合。
本公开涉及通过应用一种“靶标活性电泳”来分离寡核苷酸编码分子的方法。作为本文公开的方法的一般概述,参考图1和图2,该方法包括提供分离介质,其中该分离介质含有至少一种靶分子,102、202;将含有至少两种不同的寡核苷酸编码分子的混合物的样品引入分离介质,其中所述至少两种不同的寡核苷酸编码分子包括可操作地连接(例如“L”)至至少一个被编码部分(“星形”)的编码部分(例如,“CBA”),104、204;通过将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,形成至少两种不同的解析的寡核苷酸编码分子,106、206(由闪电符号的大小描述的相对靶活性);通过从分离介质分割至少两个分开位置中的至少一个位置以形成至少一个解析的片段并测量迁移距离108、208(如D1或D2描绘),来从至少两种不同的解析的寡核苷酸编码分子中收获至少一种解析的寡核苷酸编码分子;处理至少一种解析的寡核苷酸编码分子以进行PCR,110、210;通过对至少一种解析的寡核苷酸编码分子的编码部分进行PCR来扩增至少一种解析的寡核苷酸编码分子的至少一个编码部分,112、212;对解析的寡核苷酸编码分子的编码部分或其PCR拷贝进行测序,并识别至少一种解析的寡核苷酸编码分子的至少一个被编码部分,114、214;通过将至少一个位置与至少一种解析的寡核苷酸编码分子的至少一个被编码部分的特征相关联,收集至少一种解析的寡核苷酸编码分子的靶活性数据,116、216。
一般而言,该方法包括将寡核苷酸编码分子的混合物引入含有靶分子的分离介质中,并使用电泳将寡核苷酸编码分子迁移通过含有靶分子的分离介质,使得寡核苷酸编码分子至少部分地基于靶分子和寡核苷酸编码分子的被编码部分之间的活性被分离。然后,在一个实施方式中,该方法可以包括将含有分离的或解析的寡核苷酸编码分子的分离介质分割,并测量不同片段从起点或样品孔的迁移距离。然后,在一个实施方式中,该方法可以包括通过处理分离介质以允许寡核苷酸编码分子的编码部分的PCR扩增来收获寡核苷酸编码分子。在一个实施方式中,该方法可以包括对寡核苷酸编码分子的编码部分进行PCR扩增并测序,然后关联序列数据以识别寡核苷酸编码分子的被编码部分,对编码部分进行测序,并识别或推导出寡核苷酸编码分子的被编码部分。在一个实施方式中,该方法可以包括通过将被编码部分的特征与其在分离介质中的迁移距离或位置相关联来收集靶活性数据。
更详细地,在一个实施方式中,该方法可以固定或降低靶分子在介质中的移动性。在一个实施方式中,可以将寡核苷酸编码分子文库引入到样品孔处的分离介质中。然后可以对寡核苷酸编码分子文库进行电泳,使寡核苷酸编码分子文库迁移通过介质以与固定的靶分子接触。进一步,在一个实施方式中,寡核苷酸编码分子文库可以部分地基于它们与靶分子的活性而被分离或解析。在一个实施方式中,对靶分子具有高活性的寡核苷酸编码分子将使其通过分离介质的迁移减慢,而对靶分子具有低活性的寡核苷酸编码分子将使其迁移减慢。在一个实施方式中,一旦实现了足够的分离,就可以通过将介质分割成几部分来回收含有寡核苷酸编码分子的样品混合物的部分。在一个实施方式中,可以通过将它们溶解在溶剂中或将它们浸泡在溶剂中以允许该部分中的寡核苷酸编码分子进入溶剂来分离这些部分。在一个实施方式中,一旦寡核苷酸编码分子的一部分被回收,寡核苷酸编码分子的被编码部分可以通过进行PCR以形成寡核苷酸编码分子的被编码部分的拷贝来确定。在一个实施方式中,可以对寡核苷酸编码分子的被编码部分的拷贝进行测序,并且可以使用序列数据来识别寡核苷酸编码分子并测量寡核苷酸编码分子在分离介质中的迁移距离。
在一个实施方式中,这种方法的一个益处可以是避免或减少假阴性,因为即使是强结合或反应的寡核苷酸编码分子也可以通过施加更强的电压来恢复,使得不必根据检测中分子的消失进行推断。在一个实施方式中,该方法的益处可以是寡核苷酸编码分子的迁移距离的测量可以提供寡核苷酸编码分子对靶分子的亲和性的定性和/或定量数据。相比之下,传统方法只能为每个分子提供二进制数据:结合或非结合。在一个实施方式中,当前公开的方法的益处可以包括测量不同类型的相互作用。例如,传统方法只能测量探针-靶亲和性。相比之下,本文公开的方法可以提供关于寡核苷酸编码分子的被编码部分的化学反应性的数据,因为与被编码部分反应(例如,催化反应)的靶分子的化学反应性,往往会减慢通过分离介质的迁移速率。
在一个实施方式中,当前公开的方法可以极大地增加被捕获和识别的真实结合剂的数量。首先,由于没有“冲洗”步骤,真正的结合剂不太可能因试验损耗而丢失。大规模暴露/淘选方法中的冲洗步骤使用液体流动,并且旨在将无法结合靶标的分子从靶标上移开。然而,真正的效果是移动未结合的分子—也就是说,冲洗将同样移动(a)无法结合的分子和(b)只是暂时未结合的分子两者。相比之下,本文公开的方法使用电泳来移动未与靶标结合的分子,而是将它们从一个有靶标的地方移动到另一个有靶标的地方;这为暂时未结合的分子提供了重新结合的更大机会。由于此过程沿迁移路径重复多次,因此作为试验损耗的假阴性丢失的化合物要少得多。其次,由于系统中的电压对以瞬态、非特异性方式结合的分子施加了非常强且持续的力,因此与冲洗过程相比,这些分子被更彻底地去除。由于被更完全地去除,这些化合物在测序数据中产生较小的信号,因此不太可能淹没真正结合剂的信号。净效应是信噪比的大幅增加,以及被确定为真正结合剂的化合物数量的大幅增加。
在一个实施方式中,该方法包括提供分离介质,其中该分离介质含有至少一种靶分子。在一个实施方式中,分离介质通常不受限制,只要该介质允许寡核苷酸编码分子的电泳。适当的分离介质包括多孔凝胶和适用于电泳的缓冲系统。适当的多孔凝胶可包括琼脂糖、聚丙烯酰胺、各种水凝胶和淀粉。适当的缓冲系统可包括Tris/乙酸酯/EDTA(TAE)、Tris/硼酸盐/EDTA(TBE)、Tris/硼酸盐(TB)和锂/硼酸盐(LB),其中EDTA代表乙二胺四乙酸,Tris代表三(羟甲基)氨基甲烷。可以利用所选缓冲系统中各种浓度的胶凝材料来控制凝胶的孔隙率。
在一个实施方式中,该方法包括提供含有至少一种靶分子的分离介质。
在一个实施方式中,靶分子可以被固定,或者靶分子的移动性可以通过将靶分子结合或拴系到分离介质、颗粒、聚合物和分离表面中的至少一种来降低。在一个实施方式中,靶分子可以在靶标与分离介质接触之前、期间或之后被结合或拴系至颗粒、聚合物和分离表面中的至少一种。在一个实施方式中,靶分子在加入分离介质如琼脂糖凝胶之前被结合或拴系到颗粒上。一般而言,可以使用将一个分子结合到表面或其他分子的任何适当的方法,只要该结合在电泳期间是稳定的。
在一个实施方式中,靶分子,例如蛋白质或蛋白质复合物,可以使用本领域已知的各种结合方法结合到包括分离介质、颗粒、聚合物和分离表面的锚(anchor)。适当的结合方法包括酰胺键交联、磺酰胺或砜形成、弱反应性亲电相互作用、聚合反应、二硫化物形成、酯形成、点击反应(如与铜的叠氮炔反应)、Diels-Alder环加成和交叉复分解,通过基质捕获固定海藻酸钙等。
已知将分子例如靶分子固定在固体表面上会导致或至少有风险使分子变形,这会隐藏天然分子的活性。避免或减少靶分子变形的方法可以是有利的,因为它们允许测量靶分子的天然活性。在一个实施方式中,靶分子与聚合物或低聚物(不同于分离介质的聚合物和/或低聚物)连接、结合、强烈缔合或拴系,其中该聚合物或低聚物具有10%或更多的分子量,包括靶分子最低分子量的20%至5000%。在一个实施方式中,将靶分子拴系于聚合物或低聚物的益处可以是寡核苷酸编码分子、靶分子和聚合物或低聚物的组合可以以不同的速率迁移通过分离介质,从而允许与其他分子进一步分离,同时消除或降低靶分子变形的风险。在一个实施方式中,将靶分子拴系于聚合物或低聚物的益处可以是寡核苷酸编码分子、靶分子和聚合物或低聚物可以在PCR并对编码部分进行测序以识别被编码部分之前从分离介质去除进入例如溶剂或缓冲液中。
在一个实施方式中,该方法包括分离介质,其中该分离介质含有结合或拴系到颗粒的靶分子。在一个实施方式中,颗粒可以是用适当的抗靶标标签标记的组合物。在一个实施方式中,颗粒可以是固体颗粒、非晶颗粒、多孔颗粒、聚合颗粒、金属胶体、材料混合物或单体电泳介质。适当的颗粒可包括离子交换树脂、硅石颗粒、聚苯乙烯、琼脂糖珠、生物素标记的琼脂糖、
Figure BDA0003261094520000171
珠、
Figure BDA0003261094520000172
树脂珠、树枝状聚合物(聚乙二醇、聚苯乙烯等)、
Figure BDA0003261094520000173
(磁性颗粒);和通过基质捕获固定的海藻酸钙。在一个实施方式中,将靶分子结合或拴系到颗粒的一个益处可以是靶分子被固定或其在电泳期间的迁移相对于未结合的靶分子减慢。
在一个实施方式中,将靶分子连接或拴系到颗粒上的益处可以是颗粒被固定在分离介质中。在一个实施方式中,靶分子连接或固定在凝胶电泳板的表面上,其中凝胶电泳板是在其上形成凝胶的表面。在一个实施方式中,将靶分子连接或拴系到颗粒或表面的益处可以是限制或防止靶分子的迁移,从而去除靶分子的迁移率作为分离的基础。
可以将靶分子选择性地结合到分离介质、颗粒、聚合物或分离表面的方法可以是有利的,因为它们允许使用不同的结合机制,这可以从多个实验的考虑中去除结合机制的选择。在一个实施方式中,共轭对反应将标记的靶分子选择性地结合到分离介质、颗粒、聚合物或分离表面。适当的共轭对反应包括His标签(其中His是组氨酸)(以6-10之间的整数)与含有或在其表面展示镍NTA或抗His抗体的颗粒;生物素标签与含有链霉亲和素、抗生物素蛋白或抗生物素抗体的颗粒;链霉亲和素结合肽与含有链霉亲和素或抗生物素蛋白的颗粒;Halo-Tag与展示Halo-Tag蛋白的颗粒;FLAG标签与含有或展示抗FLAG抗体的颗粒;钙调蛋白结合蛋白与含有或展示钙调蛋白的颗粒;谷胱甘肽S-转移酶与含有谷胱甘肽颗粒;纤维素结合结构域(CBP)与纤维素颗粒或分离介质;天然蛋白质与含有或展示抗蛋白质抗体的颗粒或通过常见的连接化学(例如,N-羟基琥珀酰亚胺或碳二亚胺化学)通过颗粒表面上与羧基基团反应的表面赖氨酸部分共价拴系到颗粒;链霉亲和素蛋白与含有或展示生物素或抗链霉亲和素抗体的颗粒;和寡核苷酸标记的蛋白质与含有或展示互补寡核苷酸的颗粒。
在一个实施方式中,该方法包括分离介质中的靶分子。在一个实施方式中,该方法可以包括在将寡核苷酸编码分子的样品或混合物引入分离介质之前将靶分子添加或混合到分离介质中。在一个实施方式中,该方法可以包括将靶分子固定或结合至分离介质或与分离介质接触或被分离介质包含的表面。在一个实施方式中,靶分子可以是细胞,包括干细胞或癌细胞;寡核苷酸,包括DNA(脱氧核糖核酸)和RNA(核糖核酸);天然细胞裂解物,过表达细胞裂解物的靶标;天然蛋白质、突变蛋白质、肽、酶,包括但不限于细胞色素、激酶、谷氨酰胺酶、磷酸化酶、核糖体、脂质体、合成分子和nanodisc,其中包括每一种、一些或全部的混合物。适当的合成分子可以包括药物和污染物(pollutant)。在一个实施方式中,nanodisc可以包括磷脂的脂质双层,其疏水边缘被两种两亲性蛋白质掩蔽。这种nanodisc通常用于研究膜蛋白。在一个实施方式中,靶分子连接至颗粒,包括纳米管、聚合物、纳米颗粒或胶体。
在一个实施方式中,靶分子可以沿着迁移轴均匀地或基本上均匀地分布在分离介质中,其中迁移轴可以是跨越分离介质的电压方向。在一个实施式中,靶标可以相对于迁移方向以增加或减少的浓度梯度分布,以增加或减少寡核苷酸编码分子的分离。在一个实施方式中,靶分子可以拴系至颗粒或聚合物,然后可以在介质凝固或胶凝之前将被拴系的靶标混合到分离介质中,并且可以将混合物离心,以提供分离介质内拴系的靶标的梯度浓度。将靶标拴系至聚合物或颗粒的一个益处是选择根据设计的概况(profile)将靶标分布在分离介质中的聚合物和颗粒。例如,一组均质的靶分子可以被拴系至两个不同大小的颗粒中的一个上,使得当分离介质凝固或凝胶时形成靶分子的两个组或带。
在一个实施方式中,可以在介质凝固或胶凝之前将靶分子混合到分离介质中,并且可以将混合物离心以提供分离介质内的靶分子梯度浓度。适当的离心方法可包括差速离心、速率区带离心和等密度离心。在一个实施方式中,分离介质中靶材料的浓度梯度可以通过尺寸排阻分级分离(size exclusion fractionation)、材料电泳、磁性靶标的磁性分离、基于与其他色谱分离技术分离的定时保留、或在液体介质中操纵靶标的任何适当的方法提供。
在一个实施方式中,该方法可以包括将一定量的靶分子与一定量的液体分离介质混合以提供分离介质中的靶分子浓度。在一个实施方式中,分离介质中靶分子的浓度可以在约500μg/mL至约5mg/mL的范围内。在一个实施方式中,该方法可以包括将靶分子与颗粒、聚合物或低聚物接触、混合或结合,然后将靶分子和颗粒、聚合物或低聚物的混合物加入到分离介质中。在一个实施方式中,该方法可以包括同时或以任何顺序将靶分子与颗粒、聚合物或低聚物添加到分离介质中。
在一个实施方式中,该方法包括提供分离介质,其中该分离介质含有至少一种靶分子和至少一个样品区域或样品孔。在一个实施方式中,该方法包括将分离介质添加、倾倒和/或模制到电泳板的平坦表面上以提供大致平坦的、连续的分离介质。这种平坦的、连续的分离介质示于图4,402。参照图3,分离介质可以模制或成形为如图3所示的分离介质的泳道(lane)。在一个实施方式中,该方法包括在顶面上提供具有泳道脊的模子(cast bearinglane ridge)302;将适当的聚合物,例如聚二甲基硅氧烷(PDMS),倾倒至具有泳道脊的模子的顶面上,并使其交联或胶凝304;定向模制的聚合物使得泳道通道面朝上306;任选地,封闭模具的部分308、310;并且用分离介质填充泳道通道以形成成形为分离泳道的分离介质312。在一个实施方式中,可以去除封闭模具部分的材料以形成样品孔312。在一个实施方式中,在分离介质凝固或胶凝后,可以将样品孔可切割成分开。已经发现,与通过使用连续分离介质或毛细管电泳进行分离相比,通过靶活性电泳可以获得更高的与靶标具有不同活性的寡核苷酸编码分子的分辨率。不希望被理论限制,据信使用毛细管电泳进行分离的优点是靶标没有被标记,但是当寡核苷酸编码分子在与靶标结合时比游离的那些获得更大的有效分子量时,完成分离,从而以不同的方式迁移。然而,可实现的分离程度限于移动的、未结合的寡核苷酸编码分子和移动的、结合的寡核苷酸编码分子的不同迁移率。靶标活性电泳可以获得更高的分辨率,因为结合固定的靶标的寡核苷酸编码分子获得了有效的无限分子量,到它们在结合时根本不能移动,而未结合的寡核苷酸编码分子仍能以系统的最大速率自由移动的程度。
在一个实施方式中,该方法包括通过将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置来形成至少两种不同的解析的寡核苷酸编码分子,其中分离介质被模制或成形为分离泳道,其中分离泳道具有宽度半径(radius of width)和深度半径(radius of depth),宽度半径R1和深度半径R2可以相同或不同,并且可以在迁移方向上沿着分离泳道的长度增加、减少或保持一致。
在一个实施方式中,该方法可以包括通过在第一方向遍及分离介质施加第一分离处理,将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,其中第一分离处理包括第一电压方案和第一持续时间。在一个实施方式中,该方法可以包括通过在基本上垂直于第一方向的第一分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。在方向或轴的上下文中,术语“基本上”是指在30度以内。据了解,越是对准所指方向,效果越好。如果第一次分离处理就足够了,则可能不需要进一步的纯化或分离方法。然而,如果第一次分离处理未提供所需的分辨率,则可以应用随后的第二次或连续处理。例如,在一个方向上施加第一处理之后,然后可以通过在第二方向上施加电泳条件来施加第二处理。
在一个实施方式中,该方法包括通过在第二方向遍及分离介质施加第二分离处理将至少两种不同的寡核苷酸编码分子分离到分离介质的至少两个分开的位置,其中第二方向基本上是垂直于第一方向,其中第二分离处理包括第二电压方案和第二持续时间。在一个实施方式中,该方法包括通过在基本上垂直于第一分割方向的第二分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。在该方法的一个实施方式中,当寡核苷酸编码分子保持在相同的分离介质中时,应用第一和第二分离处理。在一个实施方式中,对寡核苷酸编码分子的混合物应用二维电泳的益处可以是基于应用不同的第二电压参数,包括不同的电压、不同的变化率或斜坡电压或相对于施加的第一个电压参数的脉冲电压,提高了寡核苷酸编码分子的混合物的分离。该实施方式与本领域已知的二维电泳一致。
参考图4,在一个实施方式中,该方法包括提供第一分离介质,其中第一分离介质含有至少一种靶分子,402;以及通过在第一方向遍及分离介质施加第一分离处理将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,其中第一分离处理包括第一电压方案和第一持续时间,404;从第一分离介质分割第一分离介质的一部分或塞(plug),包括沿着分离线、泳道或轴,406;将来自第一分离介质的塞子插入或塞入第二分离介质的样品孔中,408、410;以及通过在第二方向遍及分离介质应用第二分离处理将至少两种不同的寡核苷酸编码分子分离到第二分离介质的至少两个分开的位置,412,其中第二方向基本上垂直于第一方向,其中第二分离处理包括第二电压方案和第二持续时间。在一个实施方式中,该方法包括通过在基本上垂直于第一分割方向的第二分割方向上从第二分离介质分割至少一个位置以形成至少一种解析的片段来收获至少一种解析的寡核苷酸编码分子。在一个实施方式中,第一和第二分离介质可以相同或不同。在一个实施方式中,第一分离介质可以含有第一靶分子并且第二分离介质可以含有第二靶分子,其中第一靶分子可以与第二靶分子相同或不同。在一个实施方式中,第一靶分子和第二靶分子的浓度可以相同或不同。
在一个实施方式中,分离介质包括至少一个样品区域或样品孔。在一个实施方式中,所述至少一个样品区域与包含至少一种靶分子的区域分开,其中所述间隔的范围为1mm至10cm。在一个实施方式中,至少一个样品区域可包括切入分离介质中的一个或多个洞或孔。在一个实施方式中,样品区域的益处可以包括用于在电泳或电泳分离之前引入含有至少两种不同寡核苷酸编码分子的混合物的样品的地方。在一个实施方式中,该方法可以包括测量从样本区域的边缘到解析的片段的边缘的迁移距离,其中样本区域的边缘是迁移方向上的边缘。
在一个实施方式中,至少两种不同的寡核苷酸编码分子或其一部分的混合物可以通过使样品进行电泳而与靶分子接触,使至少两种不同的寡核苷酸编码分子从样品区域迁移到与至少一种靶分子接触。电泳方法通常不受限制,只要该方法能够使混合物的至少一部分与靶分子接触和/或使至少两种不同的寡核苷酸编码分子迁移通过分离介质即可。在一个实施方式中,施加电泳的方法不会导致寡核苷酸编码分子、靶分子或拴系到靶分子的颗粒或聚合物(如果存在)的降解。
在一个实施方式中,该方法包括通过在第一方向遍及分离介质施加第一分离处理,将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,其中第一分离处理包括第一电压方案和第一持续时间。在一个实施方式中,该方法包括通过在第二方向遍及分离介质施加第二分离处理,将至少两种不同的寡核苷酸编码分子分离到分离介质的至少两个分开的位置,其中第二方向基本上垂直于第一方向,其中第二分离处理包括第二电压方案和第二持续时间。应当理解,分离步骤可以通过对另外的电压方案应用另外的分离处理以另外的持续时间并且任选地在另外的方向上根据需要经常重复进行。在该方法的一个实施方式中,第一分离处理可包括施加约5V至约150V,包括约30V至约140V,包括约50V至约120V的第一电压方案,进行约1至50小时,包括约2至约40小时,包括约3至约30小时的第一持续时间。在该方法的一个实施方式中,第二分离处理可包括施加约20V至约150V,包括约30V至约140V,包括约50V至约120V的第二电压方案,进行约1至50小时,包括约2至约40小时,包括约3至约30小时的第二持续时间。在一个实施方式中,第一处理方案和第二处理方案可以各自独立地包括以从约1V/hr到约5V/hr的速率增加施加的电压。在一个实施方式中,第一处理方案和第二处理方案可以各自独立地包括以从约1V/hr到约5V/hr的速率降低施加的电压。应当理解,不同的电压方案可用于不同长度的分离介质。通常,更长的长度需要更高的电压以提供更短的分离时间。在一个实施方式中,该方法可以包括将分离介质放置在阳极和阴极之间并遍及分离介质或凝胶施加从约1V/cm至约35V/cm范围的电压。在一个实施方式中,分离介质的范围可以从约3cm到约75cm。在一个实施方式中,第一处理方案和第二处理方案可以包括施加脉冲电流。在一个实施方式中,第一和第二电压方案可包括将分离介质加热、冷却或保持在约2℃至约60℃的温度,包括3℃至约10℃,包括10℃至约30℃,包括30℃至约40℃。
在一个实施方式中,该方法可以包括通过在基本上垂直于第一方向的第一分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段,来收获至少一种解析的寡核苷酸编码分子。在一个实施方式中,该方法可以包括通过在基本上垂直于第一分割方向的第二分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。除非另有说明,应用于分割的短语“基本上垂直的方向”是指以与寡核苷酸编码分子通过分离介质的迁移方向成约70°至约120°测量的角度切断或切割。术语“分割”通常不受限制,只要将分离介质分成几部分即可。例如,当分离介质是凝胶时,那么分割可以包括将凝胶切成片段。在一个实施方式中,如果分离介质是凝胶,则该方法可以包括冷冻凝胶并通过用手术刀、剃刀或激光器切割冷冻凝胶来分割冷冻凝胶。此外,当分离介质是液体时,那么分割可以包括通过移液取出等分试样以形成解析的液体片段。参考图2,在该方法的一个实施方式中,分离介质的一个或多个片段或解析的片段的迁移距离(例如,D1、D2)在分离介质的一个或多个片段从分离介质切断或切割之前、期间或之后测量。
在一个实施方式中,在分割分离介质之前、期间或之后,可以处理至少一种解析的寡核苷酸编码分子以允许进行PCR。只要改变分离介质以允许PCR,该步骤通常不受限制。在一个实施方式中,如果分离介质为液体,则该方法可以省略该步骤。在一个实施方式中,从分离片段去除寡核苷酸编码分子的部分可以包括将分离介质的分离片段在溶剂中浸泡或润湿直到寡核苷酸编码分子的至少一部分从片段扩散到溶剂中。在一个实施方式中,该方法可包括将片段或解析的片段浸泡在水或溶剂中以允许OEM从分离介质中排出。在一个实施方式中,该方法可包括,如果分离介质具有约20℃至约100℃之间的熔化温度,则在约20℃至约100℃之间加热缓冲溶液中的片段或解析的片段。在一个实施方式中,该方法可以包括将片段或解析的片段加热至约20℃至约100℃并添加能够溶解凝胶的酶。在一个实施方式中,如果分离介质是琼脂糖,该方法可以包括通过添加琼脂酶,包括α和/或β琼脂酶,包括β-琼脂酶I(Ipswich的NEB,MA)来处理至少一种解析的寡核苷酸编码分子以允许进行PCR。
在一个实施方式中,一种方法可以包括通过对至少一种解析的寡核苷酸编码分子的编码部分进行PCR以形成至少一种解析的寡核苷酸编码分子的编码部分的拷贝来扩增至少一种解析的寡核苷酸编码分子的至少一个被编码部分。使用PCR扩增解析的寡核苷酸编码分子的益处可以包括提高感兴趣的解析的寡核苷酸编码分子的信噪比。使用PCR扩增解析的寡核苷酸编码分子的益处可以包括了解被编码部分的特征,编码部分不可逆地结合到靶分子上,或者由于不可预见的反应而难以从分离介质中去除。PCR程序可以根据需要通过本领域已知的变化进行调整。
在一个实施方式中,该方法可以包括通过对寡核苷酸编码分子的编码部分进行测序和/或更可能地对寡核苷酸编码分子的编码部分的PCR拷贝的编码部分进行测序来识别或推导寡核苷酸编码分子的被编码部分的序列、结构或预期结构。对寡核苷酸编码分子和寡核苷酸编码分子的PCR拷贝进行测序的程序可以根据需要通过本领域已知的变化进行调整,包括应用下一代DNA测序、大规模平行或深度测序,这些都是目前正在研究和开发的因为这些方法可节省时间和金钱。在一个实施方式中,该方法包括识别一部分拷贝序列的序列,以识别或关联该部分寡核苷酸编码分子的每个编码区域或编码区域组合,以识别或关联至少一个被编码部分的每个位置构建单元。在一个实施方式中,通过对寡核苷酸编码分子的编码部分或其拷贝序列进行测序来识别、确定或推导寡核苷酸编码分子的被编码部分,这可以包括将编码部分中的寡核苷酸序列与用于合成被编码部分的合成步骤的序列相关联。
在一个实施方式中,该方法可以包括通过将至少一个位置与至少一种解析的寡核苷酸编码分子的至少一个被编码部分的特征相关联来收集至少一种解析的寡核苷酸编码分子的靶活性数据。在一个实施方式中,寡核苷酸编码分子或解析的寡核苷酸编码分子的被编码部分的特征可以与测量的迁移距离相关、匹配或关联。据信,相对于对靶分子具有较高活性的寡核苷酸编码分子,对靶分子具有低活性的寡核苷酸编码分子将通过分离介质快速迁移,因为那些具有较高活性的分子在反应过程中其进展减慢或受阻。此外,不希望受理论束缚,据信与靶分子相互作用的寡核苷酸编码分子将具有kon和koff,其中kon是寡核苷酸编码分子与靶分子反应、相互作用或缔合的速率,koff是寡核苷酸编码分子与靶分子解离或分离的速率。一般而言,据观察,亲和性较紧密的OEM迁移较慢,亲和性较松的OEM迁移较快。然而,应理解,靶活性不一定是影响电泳迁移的因素。例如,电泳速率可基于较小的分子尺寸和具有较高净负电荷的分子而增加。这些因素可以通过引入适当的对照分子来抵消。将靶活性与其他电泳因素分离的另一种方法可以是为每个寡核苷酸编码分子引入两个或更多个被编码部分。例如,具有一个被编码部分的OEM预计其迁移会减慢一个驻留时间。那么显然,具有两个或三个被编码部分的OEM的活性将比具有一个被编码部分的OEM大2或3倍,这样,相对于仅具有1.5到3倍驻留时间的OEM,具有2-3个被编码部分的OEM的迁移将被减慢。本文公开的方法的益处可以是具有多个被编码部分的OEM的使用可以是为了计算靶活性数据的目的,将靶活性作为相对于其他因素的因素进行隔离。这种方法的一个益处可以包括使用具有多个被编码部分的OEM来增强信噪比,从而可以通过引入每个OEM的多个被编码部分,以放大其驻留时间的差异,从而放大其计算的靶反应性的差异。
在一个实施方式中,该方法可以包括测量寡核苷酸编码分子从至少一个样品区域的第一迁移距离,并将迁移的距离与寡核苷酸编码分子的被编码部分的识别相关联。在一个实施方式中,该方法可以包括测量第二寡核苷酸编码分子从至少一个样品区域的第二迁移距离,并将第二迁移距离与第二寡核苷酸编码分子的被编码部分的识别相关联。在一个实施方式中,该方法可以包括通过将第一距离除以第二距离来计算相对于第二寡核苷酸编码分子第一寡核苷酸编码分子对靶分子的相对或定性结合亲和性。
在一个实施方式中,该方法可以包括一种或多种具有根据式(I)的结构的寡核苷酸编码分子,
(I)G—L—B
其中
G包括包含至少两个编码区域的寡核苷酸;
B是含有至少两个构建单元的被编码部分;
L是可操作地将G连接到B的接头;和
其中B中的每个构建单元或位置构建单元根据G的1至5个编码区域的位置分别识别。
在一个实施方式中,该方法可以包括一种或多种具有根据式(II)的结构的寡核苷酸编码分子,
(II)[(B1)M—L1]O—G—[(L2—(B2)K]P
其中
G包括包含至少两个编码区域的寡核苷酸;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,M与K相同或不同;
L1为可操作地将B1连接至G的接头;
L2为可操作地将B2连接至G的接头;
O为0或1;
P为0或1;
条件是O和P中的至少一个是1;和
其中位置M的每个位置构建单元B1和/或位置K的B2由G的1至5个编码区域识别。在一个实施方式中,如上所述,使用式II分子的方法的益处可包括引入展示两个被编码部分:(B1)M和(B2)K的OEM,这相对于显示单个被编码部分的OEM可以增加信噪比。
在一个实施方式中,该方法可以包括一种或多种具有根据式(III)的结构的寡核苷酸编码分子,
(III)[(B1)M—L1]O—G’—[(L2—(B2)K]P
其中
G’包括寡核苷酸,G’包括至少两个编码区域和至少一个发夹区;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接至G’的接头;
L2为可操作地将B2连接至G’的接头;
O为从0至5的整数;
P为从0至5的整数;
条件是O和P中的至少一个是从1至5的整数;和
其中位置M的每个位置构建单元B1和/或位置K的B2由G’的1至5个编码区域识别。在一个实施方式中,如上所述,使用式II分子的方法的益处可包括引入展示2至10个被编码部分:(B1)M和(B2)K的OEM,这相对于显示单个被编码部分的OEM可以增加信噪比。
在某些实施方式中,本公开还涉及形成寡核苷酸编码分子的方法。在某些实施方式中,本公开涉及通过使用本文公开的亲和电泳确定被编码部分对靶分子的亲和性来分离寡核苷酸编码分子的方法。在一个实施方式中,亲和电泳可以基于所需特性分离分子,包括但不限于结合靶分子的能力、结合靶分子的特定区域的能力、与已知化合物的竞争性或非竞争性结合的能力、不结合其他抗靶分子的能力、不结合其他密切相关的靶分子类别或家族的能力、对酶产生的化学变化有抵抗力的能力、对酶家族产生的化学变化有抵抗力的能力、容易被酶或酶家族化学改变的能力、具有一定程度的水溶性的能力、具有一定程度的组织渗透性的能力和具有一定程度的细胞渗透性的能力。
在某些实施方式中,式(I)的分子为寡核苷酸编码分子。在一个实施方式中,式(II)和(III)的分子是式(I)分子的亚种。在一个实施方式中,式(III)分子是式(II)分子的亚种。在式(I)分子的某些实施方式中,G包括被指导或选择用于合成被编码部分的寡核苷酸。在式(II)和(III)分子的某些实施方式中,(B1)M和(B2)K各自表示被编码部分。在式(I)分子的某些实施方式中,该分子含有寡核苷酸部分和至少一个被编码部分。应理解,G中的寡核苷酸的许多结构特征在本文中就其指导或编码式(I)分子的至少一个被编码部分的合成以及分子结构关系或这种合成过程作用于寡核苷酸编码分子结构的相关性讨论。应理解,式(I)或式(II)和/或(III)的分子的G或G'中的寡核苷酸的许多结构特征分别根据G或G',或其PCR拷贝中的寡核苷酸的能力进行讨论,以识别、关联或促进用于制备式(I)分子的合成步骤的推导。因此,应理解,被编码部分的构建单元的序列和/或结构与寡核苷酸部分的编码区域的序列或序列组合之间存在相关性。在式(I)和/或(II)的分子的一个实施方式中,G包括至少一个发夹区,并且可以表示为G’。
在式(I)、(II)和(III)分子的某些实施方式中,G或G’包括或为寡核苷酸。在某些实施方式中,寡核苷酸含有至少两个编码区,其中1%至100%,包括约50%至100%,包括约90%至100%的编码区域是单链的。在某些实施方式中,G或G’中的寡核苷酸含有至少一个末端编码区域,其中一个或两个末端编码区域是单链的。在某些实施方式中,G或G’中的寡核苷酸含有至少一个末端编码区域,其中一个或两个末端编码区域是双链的。
本公开所用的术语“发夹结构”是指按质量百分比计含有60%至100%的核苷酸,并且可以与寡核苷酸G的末端编码区域杂交形成G’的分子结构。在发夹结构的某些实施方式中,发夹结构形成单个、连续的聚合物链,并含有至少一个重叠部分(通常称为“茎”),其中重叠部分含有与相同发夹结构的互补序列杂交的核苷酸序列。在发夹结构的某些实施方式中,桥结构连接两条单独的寡核苷酸链;所述桥结构可包括2至20个PEG单元、包括3至15个PEG单元、包括6至12个PEG单元的聚乙二醇(PEG)聚合物。在发夹结构的某些实施方式中,桥结构可包括最多30个碳的烷烃链或最多20个单元的聚甘氨酸链,或包括带有反应性官能团的一些其他链。
在式(I)、(II)和(III)分子的某些实施方式中,G或G'中的寡核苷酸含有至少两个编码区域,包括2个至约21个编码区域,包括3至10个编码区域,包括3至5个编码区域。在某些实施方式中,如果编码区域的数量低于2,则编码区域的组合将是可能的。在某些实施方式中,如果编码区域的数量超过20,则无效率的合成会干扰准确合成。
在式(I)、(II)和(III)分子的某些实施方式中,至少两个编码区域的约50%至100%含有约6至约50个核苷酸,包括约12至约40个核苷酸,包括约8至约30个核苷酸。在某些实施方式中,如果编码区域包含少于约6个核苷酸,则编码区域不能准确地指导被编码部分的合成。在某些实施方式中,如果编码区域含有多于约50个核苷酸,则编码区域会是交叉反应的。这种交叉反应性会干扰编码区域准确指导和识别用于合成式(I)、(II)和(III)分子的被编码部分的合成步骤的能力。
在式(I)、(II)和(III)分子的某些实施方式中,G或G'中的寡核苷酸的目的是通过与互补的抗编码链选择性杂交指导式(I)、(II)或(III)分子的至少一个被编码部分的合成。在某些实施方式中,编码区域是单链的以促进与互补链的杂交。在某些实施方式中,70%至100%,包括80%至99%,包括80%至95%的编码区域是单链的。应当理解,如果存在,编码区域的互补链可以在合成期间编码式(I)、(II)和(III)分子的被编码部分的步骤之后添加。
在某些实施方式中,寡核苷酸可含有天然和非天然核苷酸。适当的核苷酸包括DNA(脱氧核糖核酸)的天然核苷酸,包括腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),以及RNA(核糖核酸)的天然核苷酸,腺嘌呤(A)、尿嘧啶(U)、鸟嘌呤(G)和胞嘧啶(C)。其他适当的碱基包括天然碱基,例如脱氧腺苷、脱氧胸苷、脱氧鸟苷、脱氧胞苷、肌苷、二氨基嘌呤;碱基类似物,例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、C5-丙炔基胞苷、C5-丙炔基尿苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-甲基胞苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤、4-((3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)氨基)嘧啶-2(1H)-酮、4-氨基-5-(庚-1,5-二炔-1-基)嘧啶-2(1H)-酮,6-甲基-3,7-二氢-2H-吡咯并[2,3-d]嘧啶-2-酮、3H-苯并[b]嘧啶并[4,5-e][1,4]噁嗪-2(10H)-酮和2-硫代胞苷;修饰的核苷酸,例如2'-取代的核苷酸,包括2'-O-甲基化碱基和2'-氟碱基;和修饰的糖,如2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖、己糖;和/或修饰的磷酸基团,例如硫代磷酸酯和5'-N-亚磷酰胺连接。应当理解,寡核苷酸是核苷酸的聚合物。术语“聚合物”和“低聚物”在本文中可互换使用。在某些实施方式中,寡核苷酸不必含有连续碱基。在某些实施方式中,寡核苷酸可以散布有接头部分或非核苷酸分子。
在式(I)、(II)、(III)分子的某些实施方式中,G中的寡核苷酸含有约60%至100%,包括约80%至99%,包括约80%至95%的DNA核苷酸。在某些实施方式中,寡核苷酸含有约60%至100%,包括约80%至99%,包括约80%至95%的RNA核苷酸。
在式(I)、(II)和(III)分子的某些实施方式中,G或G'中的寡核苷酸含有至少两个编码区域,其中至少两个编码区域重叠以是同延的(coextensive),条件是重叠编码区域仅共享约30%至1%的相同核苷酸,包括约20%至1%,包括约10%至2%。在式(I)、(II)和(III)分子的某些实施方式中,G或G'中的寡核苷酸为约40%至100%,包括约60%至100%,包括约80%%至100%的单链。在式(I)、(II)和(III)分子的某些实施方式中,G或G’中的寡核苷酸含有至少两个编码区域,其中至少两个编码区域相邻。在式(I)、(II)和(III)分子的某些实施方式中,G或G'中的寡核苷酸含有至少两个编码区域,其中至少两个编码区被不指导或记录式(I)、(II)或(III)分子的被编码部分的合成的核苷酸区域隔开。
术语“非编码区域”,当存在时,是指这样的寡核苷酸的区域,该区域不能与核苷酸的互补链杂交以指导式(I)、(II)和(III)分子的被编码部分的合成,或不对应于在合成过程中用于分选式(I)、(II)和(III)分子的任何抗编码寡核苷酸。在某些实施方式中,非编码区域是任选的。在某些实施方式中,寡核苷酸含有1至约20个非编码区域,包括2至约9个非编码区域,包括2至约4个非编码区域。在某些实施方式中,非编码区域含有约4至约50个核苷酸,包括约12至约40个核苷酸,并包括约8至约30个核苷酸。
在式(I)、(II)和(III)分子的某些实施方式中,非编码区域的一个目的是分离编码区域以避免或减少交叉杂交,因为交叉杂交会干扰式(I)、(II)和(III)分子的被编码部分的准确编码。在某些实施方式中,非编码区域的一个目的是向分子式(I)、(II)和(III)添加功能性,而不仅仅是杂交或编码。在某些实施方式中,一个或多个非编码区域可以是用标记修饰的寡核苷酸的区域,例如荧光标记或放射性标记。这样的标记可以促进式(I)、(II)和(III)分子的可视化或量化。在某些实施方式中,一个或多个非编码区域用利于处理的官能团或系链(tether)修饰。在某些实施方式中,一个或多个非编码区域是双链的,这减少了交叉杂交。在某些实施方式中,应理解非编码区域是任选的。在某些实施方式中,适当的非编码区域不干扰寡核苷酸的PCR扩增。
在某些实施方式中,一个或多个编码区域可以是用标记修饰的G或G'中的寡核苷酸的区域,例如荧光标记或放射性标记。这样的标记可以促进式(I)、(II)和(III)分子的可视化或量化。在某些实施方式中,一个或多个编码区域用利于处理的官能团或系链修饰。
在式(I)、(II)和(III)分子的某些实施方式中,G或G'包括由式(CN—(ZN—CN+1)A)或(ZN—(CN—ZN+1)A)表示的序列,其中C为编码区域,Z为非编码区域,N为1~20的整数,并且A为1~20的整数;其中每个非编码区域含有0至50个核苷酸并且任选地是双链的。在式(I)、(II)和(III)分子的某些实施方式中,每个或大部分编码区域含有6至50个核苷酸。在式(I)、(II)和(III)分子的某些实施方式中,每个或大部分编码区域含有8至30个核苷酸。
在式(I)、(II)和(III)分子的某些实施方式中,位置M处的位置构建单元B1和/或位置K处的B2的约10%至100%与来自2、3、4或5个编码区域的组合相关,包括约20%至100%,包括约30%至100%,包括约50%至100%,包括约70%至100%,包括约90%至100%。相反,在式(I)、(II)和(III)分子的某些实施方式中,位置M的处的位置构建单元B1和/或位置K处的B2的0至约90%与单个编码区域相关或由其识别,包括0至约10%,包括0至约20%,包括0至约30%,包括0至约50%,包括0至约70%。
在式(I)、(II)和(III)分子的某些实施方式中,B表示位置构建单元。本公开中使用的短语“构建单元”或“位置构建单元”是指作为形成较大分子结构的亚单元结合在一起的一系列单独构建单元中的一个单元。在某些实施方式中,(B1)M和(B2)K各自独立地表示结合在一起以形成分别具有M和K数量的单元的聚合物链的一系列单独的构建单元。例如,其中M为10,则(B)10是指一连串构建单元:B10—B9—B8—B7—B6—B5—B4—B3—B2—B1。例如,其中M为3并且K为2,则式(I)可以精确地表示为以下公式:
[((B1)3—(B1)2—(B1)1—L1]O—G—[(L2—(B2)1—(B2)2]P
应理解,M和K各自独立地用作B的每个单独单元的位置标识符,并且B1或B2的“1”或“2”仅用于区分所指的是哪条链。
本公开中术语“构建单元”的精确定义取决于其上下文。“构建单元”是能够与其他化学结构单元化学连接的化学结构单元。在某些实施方式中,构建单元具有一个、两个或更多个反应性化学基团,其允许构建单元经历将构建单元连接到其他化学结构单元的化学反应。应当理解,当构建单元进行反应以形成化学键时,构建单元的部分或全部反应性化学基团可能会丢失。例如,溶液中的构建单元可具有两个反应性化学基团。在该示例中,溶液中的构建单元可以与是构建单元的链的一部分的构建单元的反应性化学基团反应以增加链的长度或从链延伸支链。当在溶液或作为反应物的情况下提及构建单元时,则构建单元将被理解为包含至少一个反应性化学基团但可以包含两个或更多个反应性化学基团。当在比构建单元本身大的聚合物、低聚物或分子的情况下提及构建单元时,则构建单元将被理解为具有作为更大分子的(单体)单元的构建单元的结构,即使一个或多个化学反应基团将已经发生反应。
可用作构建单元的分子或化合物的类型通常不受限制,只要一种构建单元能够与另一构建单元一起反应形成共价键。在某些实施方式中,构建单元具有用作末端单元的一个化学反应性基团。在某些实施方式中,构建单元具有1、2、3、4、5或6个适当的反应性化学基团。在某些实施方式中,B的位置构建单元各自独立地具有1、2、3、4、5或6个适当的反应性化学基团。用于构建单元的适当的反应性化学基团包括伯胺、仲胺、羧酸、硫代酸、伯醇、仲醇、酯、硫醇、异氰酸酯、异硫氰酸酯、氯甲酸酯、磺酰氯、磺酰氟、硫代碳酸酯、杂芳基卤化物、醛、酮、卤代乙酸酯、芳基卤化物、叠氮化物、卤化物、三氟甲磺酸酯、二烯、亲二烯体、硼酸、硼酸酯、α-β不饱和酮、氰基丙烯酰胺、马来酰亚胺、炔烃和烯烃。
任何偶联化学都可用于连接构建单元,条件是偶联化学与寡核苷酸的存在相容。示例性偶联化学包括通过胺例如DNA连接的胺与Fmoc保护的氨基酸或其他各种取代的羧酸反应形成酰胺;通过胺(包括DNA连接的胺)与异氰酸酯和另一种胺(尿化(ureation))反应形成脲;通过胺(包括DNA连接的胺)与氯甲酸酯(甲氨酰化)和醇反应形成氨基甲酸酯;通过胺(包括DNA连接的胺)与磺酰氯反应形成磺酰胺;通过胺(包括DNA连接的胺)与硫代碳酸酯和另一种胺(硫脲化)反应形成硫脲;通过胺(包括DNA连接的胺)与杂芳基卤化物(SNAr)反应形成苯胺;通过胺(包括DNA连接的胺)与醛反应然后还原(还原胺化)形成仲胺;通过用氯乙酸酯酰化胺(包括DNA连接的胺),然后用另一种胺置换氯化物(SN2反应)形成类肽;通过以用芳基卤化物取代的羧酸酰化胺(包括与DNA连接的胺)然后用取代的炔烃取代卤化物(Sonogashira反应),形成含炔烃的化合物;通过以用芳基卤化物取代的羧酸酰化胺(包括与DNA连接的胺)然后用取代的硼酸取代卤化物(Suzuki反应),形成联芳基化合物;通过胺(包括DNA连接的胺)与氰脲酰氯反应然后与另一种胺、苯酚或硫醇反应(三聚氰酰化(cyanurylation)、芳族取代),形成取代的三嗪;通过胺(包括DNA连接的胺)与用适当的离去基团如卤根或三氟甲磺酸根取代的羧酸的酰化然后用另一种胺取代离去基团(SN2/SN1反应),形成仲胺;以及通过用带有烯烃或炔烃的化合物取代胺并使产物与叠氮化物或烯烃反应(Diels-Alder和Huisgen反应)形成环状化合物。在反应的某些实施方式中,与胺基团反应的分子,包括伯胺、仲胺、羧酸、伯醇、酯、硫醇、异氰酸酯、氯甲酸酯、磺酰氯、硫代碳酸酯、杂芳基卤化物、醛、氯乙酸酯、芳基卤化物、烯烃、卤化物、硼酸、炔烃和烯烃具有约30至约500道尔顿的分子量。
在偶联反应的某些实施方式中,可以使用带有二级反应活性基团(如胺、硫醇、卤化物、硼酸、炔烃或烯烃)的分子的任何化学,通过取代胺,包括DNA连接的胺,来添加第一个构建单元。然后二级反应基团可以与带有适当反应基团的构建单元反应。示例性的二级反应基团偶联化学包括将胺(包括DNA连接的胺)用Fmoc-氨基酸酰化,然后去除保护基团,并用醛和硼氢化物还原胺化新脱保护的胺;胺(包括DNA连接的胺)与醛或酮和硼氢化物的还原胺化,然后现在取代的胺与氰尿酰氯反应,然后用硫醇、苯酚或另一种胺从三嗪中置换另一种氯化物;胺(包括DNA连接的胺)与被杂芳基卤化物取代的羧酸的酰化,然后与另一种胺或硫醇发生SNAr反应以置换卤化物并形成苯胺或硫醚;胺(包括DNA连接的胺)用被卤代芳族基团取代的羧酸的酰化,然后在Sonogashira反应中由炔烃取代卤化物;或在硼酸酯介导的Suzuki反应中由芳基取代卤化物。
在某些实施方式中,偶联化学基于本领域已知的合适的成键反应。参见,例如,March,Advanced Organic Chemistry,第4版,New York:John Wiley and Sons(1992),第10至16章;Carey和Sundberg,Advanced Organic Chemistry,部分B,Plenum(1990),第1至11章;和Coltman等人,Principles and Applications of Organotransition MetalChemistry,University Science Books,Mill Valley,Calif.(1987),第13至20章;其全部内容以引用方式并入本文。
在某些实施方式中,除了用于连接构建单元的一个或多个反应基团之外,构建单元还可以包括一个或多个官能团。可以保护这些另外的官能团中的一个或多个以防止这些官能团发生不希望的反应。各种官能团的合适保护基团是本领域已知的(Greene和Wuts,Protective Groups in Organic Synthesis,第二版,纽约:John Wiley and Sons(1991),其全部内容通过引用并入本文)。特别有用的保护基团包括叔丁酯和醚、缩醛、三苯甲基醚和胺、乙酰酯、三甲基甲硅烷基醚、三氯乙基醚和酯以及氨基甲酸酯。
构建单元的类型通常不受限制,只要构建单元与一个或多个能够与其他构建单元形成共价键的反应基团相容。适当的构建单元包括但不限于肽、糖类、糖脂、脂质、蛋白聚糖、糖肽、磺酰胺、核蛋白、尿素、氨基甲酸酯、联乙烯多肽、酰胺、联乙烯磺酰胺肽、酯、糖类、碳酸酯、肽基膦酸酯、azatide、类肽(寡聚N-取代的甘氨酸)、醚、乙氧基甲缩醛低聚物(ethoxyformacetal oligomer)、硫醚、乙烯、乙二醇、二硫化物、亚芳基硫化物、核苷酸、吗啉代、亚胺、吡咯啉酮、乙烯亚胺、乙酸酯、苯乙烯、乙炔、乙烯基、磷脂、硅氧烷、异氰化物、异氰酸酯和甲基丙烯酸酯。在某些实施方式中,式(I)的(B1)M或(B2)K各自独立地代表这些分别具有M或K单元的构建单元的聚合物,包括多肽、多糖、聚糖脂、多脂、聚蛋白聚糖、聚糖肽、聚磺酰胺、多核蛋白、聚脲、聚氨基甲酸酯、聚乙烯类似物多肽、聚酰胺、聚乙烯类似物磺酰胺肽、聚酯、多糖、聚碳酸酯、聚肽基膦酸酯、聚氮杂肽(polyazatide)、类多肽(寡聚N取代的甘氨酸)、聚醚、聚乙氧基甲缩醛低聚物(polythoxyformacetal oligomer)、聚硫醚、聚乙烯、聚乙二醇、聚二硫化物、聚芳硫醚、多核苷酸、聚吗啉代、聚亚胺、聚吡咯啉酮、聚乙烯亚胺、聚乙酸酯、聚苯乙烯、聚乙炔、聚乙烯、聚磷脂、聚硅氧烷、聚异氰化物、聚异氰酸酯和聚甲基丙烯酸酯。在式(I)分子的某些实施方式中,约50%至约100%,包括约60%至约95%,以及包括约70%至约90%的构建单元的分子量为约30至约500道尔顿,包括约40至约350道尔顿,包括约50至约200道尔顿。
应当理解,具有两个反应活性基团的构建单元将形成线性低聚或聚合结构,或线性非聚合分子,包含每个构建单元作为单元。还应理解,具有三个或更多个反应性基团的构建单元可以形成在每个具有三个或更多个反应性基团的构建单元处具有支链的分子。
在式(I)、(II)或(III)分子的某些实施方式中,L、L1和L2各自独立地表示接头。术语“接头分子”是指具有两个或更多个能够反应形成接头的反应性基团的分子。术语“接头”是指将G或G'的发夹结构可操作地连接或共价键合到构建单元的分子的一部分。术语“可操作地连接”是指两个或多个化学结构以遍及寡核苷酸编码分子预期经历的各种操作(包括PCR扩增)中保持连接的方式连接或共价结合在一起。
在式(II)或(III)分子的某些实施方式中,Ll是分别可操作地将Bl与G或G'连接的接头。在式(II)或(III)分子的某些实施方式中,L2是分别将B2可操作地连接至G或G'的接头。在某些实施方式中,L1和L2各自独立地是双官能分子,其通过,以无任何特定顺序,使L1的反应性官能团之一与B1的反应性基团反应并且使L1的另一反应性官能团与G的反应性官能团或G'的发夹区反应,或以无任何特定顺序,使L2的反应性官能团之一与B2的反应性基团反应,并且L2的另一个反应性官能团与G的反应性官能团或G’的发夹区反应,将将B1连接到G或G'。在G'的发夹区的分子的某些实施方式中,L1和L2各自独立地是由B1和G或B2和G的化学反应性基团与包括PEG(例如叠氮基-PEG-NHS,或叠氮基-PEG-胺,或二叠氮基-PEG),或烷烃酸链部分(例如,5-叠氮基戊酸、(S)-2-(叠氮基甲基)-1-Boc-吡咯烷、4-叠氮基苯胺或4-叠氮基-丁烷-1-酸N-羟基琥珀酰亚胺酯);硫醇反应性接头,例如是PEG的那些(例如,SM(PEG)n NHS-PEG-马来酰亚胺)、烷烃链(例如,3-(吡啶-2-基二硫烷基)-丙酸-Osu或磺基琥珀酰亚胺基6-(3'-[2-吡啶基二硫代]-丙酰胺基)己酸酯));和用于寡核苷酸合成的酰胺,例如氨基改性剂(例如,6-(三氟乙酰氨基)-己基-(2-氰乙基)-(N,N-二异丙基)-亚磷酰胺)、硫醇改性剂(例如,5-三苯甲基-6-巯基己基-1-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺,或化学共反应对改性剂(例如,6-己炔-1-基-(2-氰乙基)-(N,N-二异丙基)-亚磷酰胺、3-二甲氧基三苯甲基氧基-2-(3-(3-炔丙基氧基丙酰胺基)丙酰胺基)丙基-1-O-琥珀酰基、长链烷基氨基CPG或4-叠氮基-丁烷-1-酸N-羟基琥珀酰亚胺酯));及其相容的组合。
在式(III)分子的某些实施方式中,G'的发夹区可被标注为H1或H2,其中每个发夹区独立地包括约20至约90个核苷酸,包括约32至约80个核苷酸,包括约45至约80个核苷酸。在某些实施方式中,H1和H2各自独立地含有1、2、3、4、5、6、7、8、9或10个,包括1至5个,包括2至4个,包括2至3个用适当的用于促进与接头分子或任选地与构建单元反应的官能团修饰的核苷酸,包括其中H1和H2各自独立地使用碱合成的情况,碱如但不限于5'-二甲氧基三苯甲基-5-乙炔基-2'-脱氧尿苷,3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为5-乙炔基-dU-CE亚磷酰胺,购自Glen Research,Sterling VA)。在某些实施方式中,H1和H2各自独立地包括具有促进与接头分子或任选地与构建单元反应的合适官能团的非核苷酸,包括但不限于3-二甲氧基三苯甲基氧基-2-(3-(5-己炔酰胺基)丙炔酰胺基)丙基-1-O-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为炔烃改性丝氨醇亚磷酰胺,来自GlenResearch,Sterling VA)和无碱基炔烃CEP(来自IBA GmbH,哥廷根,德国)。在某些实施方式中,Hl和H2各自独立地包括具有已经带有接头的修饰碱基的核苷酸,例如Hl和H2各自可以使用碱合成,碱如但不限于,5'-二甲氧基三苯甲基-N6-苯甲酰基-N8-[6-(三氟乙酰氨基)-己-1-基]-8-氨基-2'-脱氧腺苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为氨基改性剂C6 dA,购自Glen Research,Sterling VA)、5'-二甲氧基三苯甲基-N2-[6-(三氟乙酰氨基)-己-1-基]-2'-脱氧鸟苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为氨基改性剂C6 dG,购自Glen Research,Sterling,VA)、5'-二甲氧基三苯甲基-5-[3-甲基-丙烯酸基]-2'-脱氧尿苷、3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为CarboxydT,购自Glen Research,Sterling VA)5'-二甲氧基三苯甲基-5-[N-((9-芴基甲氧基羰基)-氨基己基)-3-丙烯酰亚胺]-2'-脱氧尿苷、3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为Fmoc-氨基改性剂C6 dT,Glen Research,Sterling,VA)、5'-二甲氧基三苯甲基-5-(辛-1,7-二炔基)-2'-脱氧尿苷、3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为C8炔烃dT,Glen Research,Sterling VA)、5'-(4,4'-二甲氧基三苯甲基)-5-[N-(6-(3-苯甲酰硫代丙酰基)-氨基己基)-3-丙烯酰胺]-2'脱氧尿苷、3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(也称为S-Bz-硫醇-改性剂C6-dT,Glen Research,Sterling VA)和5-羧基dC CEP(来自IBA GmbH,哥廷根,德国)、N4-TriGl-氨基2'脱氧胞苷(来自IBA GmbH,哥廷根,德国)。H1和H2中修饰核苷酸和非核苷酸的适当的官能团包括但不限于伯胺、仲胺、羧酸、伯醇、酯、硫醇、异氰酸酯、氯甲酸酯、磺酰基氯化物、硫代碳酸酯、杂芳基卤化物、醛、氯乙酸酯、芳基卤化物、卤化物、硼酸、炔烃、叠氮化物和烯烃。
在某些实施方式中,一个或多个发夹结构H1和H2可以用标记修饰,例如荧光标记或放射性标记。这种标记可以促进式(III)分子的可视化或量化。在某些实施方式中,一个或多个发夹结构H1和H2用利于处理的官能团或系链修饰。
在式(III)分子的某些实施方式中,Hl和H2的发夹结构的益处是一个或两者可允许在式(III)分子的一端或两端处的多个编码部分的多展示(polydisplay)。不希望受理论束缚,据信在本公开的寡核苷酸编码分子的一端或两端的多个被编码部分的多展示在某些条件下提供改进的选择特征。例如,被编码化合物的多价展示可以通过亲合性效应增加表观亲和性。
在式(II)或(III)分子的某些实施方式中,位置M处的位置构建单元B1和/或位置K处的B2的约10%至100%与2、3、4或5个编码区域的组合相关,包括约20%至100%,包括约30%至100%,包括约50%至100%,包括约70%至100%,包括约90%至100%。相反,在式(II)或(III)分子的某些实施方式中,位置M处的B1的位置构建单元和/或位置K处的B2的0至约90%与单个编码区域相关或由其识别,包括0至约10%,包括0至约20%,包括0至约30%,包括0至约50%,包括0至约70%。
本公开内容涉及合成寡核苷酸编码分子的方法,包括式(I)、(II)和(III)的分子。在合成式(I)、(II)和(III)分子的方法的某些实施方式中,该方法使用一系列“分选(sort)和反应”步骤,其中通过寡核苷酸编码分子的一个或多个编码区域与固定在杂交阵列上的抗编码低聚物的选择性杂交,将含有不同编码区域组合的寡核苷酸编码分子的混合物分选到亚库(sub-pool)中。在该方法的某些实施方式中,将寡核苷酸编码分子分选到亚库中的益处是这种分离允许每个亚库在组合或混合寡核苷酸编码分子的亚库以进行进一步化学处理之前,在单独的反应条件下与包括B1和/或B2的位置构建单元B反应。在该方法的某些实施方式,可以重复分选和反应过程以添加一系列位置构建单元。在该方法的某些实施方式中,使用分选和反应方法添加构建单元的益处是分子的被编码部分的每个位置构建单元的特征可以与用于在添加构建单元之前选择性分离或分选寡核苷酸编码分子的1、2、3、4或5个编码区域相关联。
在某些实施方式中,可以通过使用单个分选步骤将寡核苷酸编码分子分离成亚库、使寡核苷酸编码分子与构建单元反应、然后再混合来添加一个或多个构建单元。在这样的实施方式中,用于在合成过程中对寡核苷酸编码分子进行分选的一个编码区域将根据其位置唯一地识别或关联到构建单元,因为使用的编码区域的特征可以与用于添加构建单元的反应的特征相关联,这将包括添加的位置构建单元的特征。
在某些实施方式中,可以通过2、3、4或5个分选步骤添加一个或个构建单元,使寡核苷酸编码分子与构建单元反应,然后再混合。在这种实施方式案中,用于在合成过程中对寡核苷酸编码分子进行分选的编码区域的组合或系列将根据其位置唯一地识别或关联到构建单元,因为所使用的编码区域的组合或系列可以与用于添加构建单元的反应的特征关联,这将包括添加的位置构建单元的特征或结构。
在某些实施方式中,合成方法可以根据需要从单个分选步骤(单项表达)或一系列分选步骤(多项表达)独立地转换。在该方法的某些实施方式中,位置M处的位置构建单元B1和/或位置K处的B2的约10%至100%的通过一系列2、3、4或5个分选步骤添加,包括约20%至100%,包括约30%至100%,包括约50%至100%,包括约70%至100%,包括约90%至100%。如果使用一系列分选步骤添加的位置构建单元的量少于10%,那么低成本和更有效合成的益处将不会被领会到。
应理解,式(I)、(II)和(III)的分子可包括在库(pool)中的分子之间或之中相同的一个或多个编码区域,但也应理解,库中的绝大多数,如果不是全部分子将具有不同的编码区域组合。在该方法的某些实施方式中,具有不同编码区域组合的分子库的益处在于不同组合可以编码具有多个不同被编码部分的寡核苷酸编码分子。
在某些实施方式中,合成方法包括提供至少一个杂交阵列。提供杂交阵列的步骤通常不受限制,并且包括使用本领域已知的技术或商业购买杂交阵列来制造杂交阵列。在该方法的某些实施方式中,杂交阵列包括至少两个分离区域的基底,在其表面上具有固定的反密码子低聚物。在某些实施方式中,杂交阵列的每个区域含有不同的固定化反密码子低聚物,其中反密码子低聚物是能够与包括式(II)和(III)的式(I)分子的一个或多个编码区域杂交的寡核苷酸序列。在该方法的某些实施方式中,杂交阵列使用两个或更多个室。在该方法的某些实施方式中,杂交阵列的室含有颗粒,例如珠子,其在颗粒表面上具有固定的反密码子低聚物。在该方法的某些实施方式中,将包括式(II)和(III)在内的式(I)分子固定在阵列上的益处是该步骤允许基于一个或多个编码区域的特定寡核苷酸序列将分子分选或选择性地分离为分子的亚库。在某些实施方式中,分离的分子亚库然后可以从阵列中单独释放或去除到反应室中以用于进一步的杂交步骤或化学反应处理。在某些实施方式中,释放步骤是可选的,通常不受限制,可以包括通过加热、使用变性剂或将分子暴露于pH≥12的缓冲液使分子去杂交(dehybridizing)。在某些实施方式中,可以放置含有不同固定的寡核苷酸的阵列的室或区域,以允许每个室或区域的内容物流入孔的阵列以进行进一步化学处理。
在某些实施方式中,该方法包括使至少一种构建单元B,包括B1和/或B2,与寡核苷酸编码分子反应以形成式(II)和(III)分子的亚库,其中B1和/或B2如上对式(II)和(III)所定义的。在某些实施方式中,构建单元B1和/或B2可以在式(II)和(III)的分子之前、期间或之后添加到容器中。应当理解,容器可以在酸性、碱性或中性条件下包含溶剂和共反应物,这取决于用于与寡核苷酸编码分子反应和共价连接构建单元B1和/或B2以形成式(II)和(III)分子的化学。
在该方法的某些实施方式中,扩增步骤包括使用本领域已知的PCR技术分别产生式(I)、(II)和(III)的G或G'中的寡核苷酸的拷贝序列。在该方法的某些实施方式中,拷贝序列含有式(I)、(II)和(III)的至少两个编码区域的拷贝。在某些实施方式中,从至少一种探针分子扩增G或G'中的寡核苷酸的一个益处包括能够检测寡核苷酸编码分子的哪些编码部分能够结合靶分子,即使寡核苷酸编码分子不能容易从靶分子中去除。在某些实施方式中,扩增的益处在于它允许产生具有巨大多样性的分子文库。这种巨大多样性是以低数量的任何给定的式(I)、(II)和(III)分子为代价的。PCR扩增允许通过增加数量直到达到易于检测的数量来识别以非常小的数量存在的寡核苷酸序列。然后,拷贝序列的DNA测序和分析可以识别或关联能够结合靶标的式(I)、(II)和(III)的寡核苷酸编码分子的被编码部分。
式(I)、(II)和(III)或其可识别变体的分子文库的合成和分析先前已在WO2017/218293、WO 2018/204420和PCT/US2018/052494(在提交申请时未公开)中公开,其全文以引用方式并入本文。
示例性实施方式
实施方式1.一种收集至少一种解析的寡核苷酸编码分子的靶活性数据的方法,包括:
提供分离介质,其中该分离介质含有至少一种靶分子;
将含有至少两种不同寡核苷酸编码分子的混合物的样品引入分离介质,其中所述至少两种不同寡核苷酸编码分子包括与至少一个被编码部分可操作连接的编码部分;
通过将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,形成至少两种不同的解析的寡核苷酸编码分子;
通过从分离介质分割至少两个分开的位置中的至少一个位置以形成至少一个解析的片段,从至少两种不同解析的寡核苷酸编码分子收获至少一种解析的寡核苷酸编码分子;
处理至少一种解析的寡核苷酸编码分子以允许进行PCR;
通过对至少一种解析的寡核苷酸编码分子的编码部分进行PCR扩增该至少一种解析的寡核苷酸编码分子的至少一个被编码部分;和
通过将至少一个位置与至少一种解析的寡核苷酸编码分子的至少一个被编码部分的特征相关联,收集至少一种解析的寡核苷酸编码分子的靶活性数据。
实施方式2.根据实施方式1或3-15中任一项所述的方法,其中所述至少一种靶分子包括细胞、寡核苷酸、蛋白质、酶、核糖体和nanodisc中的至少一种。
实施方式3.根据实施方式1-2或4-15中任一项所述的方法,其中所述分离介质含有颗粒、聚合物和分离表面中的至少一种,并且所述至少一种靶分子连接至分离介质、颗粒、聚合物和分离表面中的至少一种。
实施方式4.根据实施方式1-3或5-15中任一项所述的方法,其中所述颗粒包括聚合物颗粒或金属胶体。
实施方式5.根据实施方式1-4或6-15中任一项所述的方法,其中所述聚合物具有所述至少一种靶分子的最低重量靶分子的10%或更多的分子量。
实施方式6.根据实施方式1-5或7-15中任一项的方法,基于至少一种靶分子与至少两种不同寡核苷酸编码分子的被编码部分之间的至少一种靶活性来分离至少两种不同寡核苷酸编码分子。
实施方式7.根据实施方式1-6或8-15中任一项所述的方法,其中所述至少一种靶标活性包括通过所述至少一种靶分子化学修饰所述至少一种寡核苷酸编码分子的被编码部分。
实施方式8.根据实施方式1-7或9-15中任一项所述的方法,其中
寡核苷酸含有至少两个编码区域,
至少一个编码部分包含至少两个位置构建单元,
至少一个被编码部分的每个位置构建单元由寡核苷酸的1至5个编码区域识别;和
分离介质含有多孔凝胶和缓冲系统。
实施方式9.根据实施方式1-8或10-15中任一项所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(I)的结构,
(I)G—L—B
其中
G包括包含至少两个编码区域的寡核苷酸;
B为含有至少两个构建单元的被编码部分;
L为可操作地将G连接到B的接头;和
其中B中的每个位置构建单元根据G的1至5个编码区域的位置分别识别。
实施方式10.根据实施方式1-9或11-15中任一项所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(II)的结构,
(II)[(B1)M—L1]O—G—[(L2—(B2)K]P
其中
G包括包含至少两个编码区域的寡核苷酸;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接到G的接头;
L2为可操作地将B2连接到G的接头;
O为零或1;
P为零或1;
条件是O和P中的至少一个是1;和
其中位置M处的每个位置构建单元B1和/或位置K处的B2由G的1至5个编码区域识别。
实施方式11.根据实施方式1-10或12-15中任一项所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(III)的结构,
(III)[(B1)M—L1]O—G’—[(L2—(B2)K]P
其中
G’包括寡核苷酸,G’包括至少两个编码区域和至少一个发夹区;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接到G’的接头;
L2为可操作地将B2连接到G’的接头;
O是从0到5的整数;
P是从0到5的整数;
条件是O和P中的至少一个是1至5的整数;和
其中位置M处的每个位置构建单元B1和/或位置K处的B2由G’的1至5个编码区域识别。
实施方式12.根据实施方式1-11或13-15中任一项所述的方法,进一步包括:
通过在第一方向遍及分离介质施加第一分离处理,将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,
其中第一分离处理包括第一电压方案和第一持续时间。
实施方式13.根据实施方式1-12或14-15中任一项所述的方法,进一步包括:
通过在基本上垂直于第一方向的第一分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。
实施方式14.根据实施方式1-13或15中任一项所述的方法,进一步包括:
通过在第二方向遍及分离介质施加第二分离处理将至少两种不同的寡核苷酸编码分子分离到分离介质的至少两个分开的位置,其中第二方向基本上垂直于第一方向,
其中第二分离处理包括第二电压方案和第二持续时间。
实施方式15.根据实施方式1-14中任一项所述的方法,进一步包括:
通过在基本上垂直于第一分割方向的第二分割方向上从分离介质分割至少一个位置以形成至少一个解析片段来收获至少一种解析的寡核苷酸编码分子。
甚至更多示例性实施方式
实施方式1A.一种方法,包括:
提供分离介质,其中该分离介质含有至少一种靶分子和至少一个样品区域;
将含有至少两种不同寡核苷酸编码分子的混合物的样品引入分离介质的样品区域,其中寡核苷酸编码分子包括与被编码部分可操作连接的编码部分;和
通过使样品进行电泳使混合物的至少一部分与分离介质中的靶标接触。
实施方式2A.根据实施方式1A所述的方法,其中编码部分含有连接至至少一个被编码部分的寡核苷酸,
其中寡核苷酸含有至少两个编码区域,
其中至少一个被编码部分含有至少两个位置构建单元,
其中至少一个被编码部分的每个位置构建单元由1至5个编码区域识别;和
分离介质含有多孔凝胶和缓冲系统。
实施方式3A.根据实施方式1A所述的方法,其中至少一种靶分子包括细胞、寡核苷酸、蛋白质、酶、核糖体和nanodisc中的至少一种。
实施方式4A.根据实施方式1A所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(I)的结构,
(I)G—L—B
其中
G包括包含至少两个编码区域的寡核苷酸;
B为含有至少两个构建单元的被编码部分;
L为可操作地将G连接到B的接头;和
其中B中的每个位置构建单元根据G的1至5个编码区域的位置分别识别。
实施方式5A.根据实施方式1A所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(II)的结构,
(II)[(B1)M—L1]O—G—[(L2—(B2)K]P
其中
G包括包含至少两个编码区域的寡核苷酸;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接到G的接头;
L2为可操作地将B2连接到G的接头;
O为零或1;
P为零或1;
条件是O和P中的至少一个是1;和
其中位置M处的每个位置构建单元B1和/或位置处K的B2由G的1至5个编码区域识别。
实施方式6A.根据实施方式1A所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(III)的结构,
(III)[(B1)M—L1]O—G’—[(L2—(B2)K]P
其中
G’包括寡核苷酸,G’包括至少两个编码区域和至少一个发夹区;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接到G’的接头;
L2为可操作地将B2连接到G’的接头;
O是从0到5的整数;
P是从0到5的整数;
条件是O和P中的至少一个是1至5的整数;和
其中位置M处的每个位置构建单元B1和/或位置K处的B2由G’的1至5个编码区域识别。
实施方式7A.根据实施方式1A所述的方法,进一步包括:
通过在第一方向遍及分离介质施加电压来分离至少两种不同的寡核苷酸编码分子。
实施方式8A.根据实施方式1A所述的方法,进一步包括:
通过在基本上垂直于第一方向的第一切断方向切断分离介质以形成分离片段来分离寡核苷酸编码分子的一部分。
实施方式9A.根据实施方式8A所述的方法,进一步包括:
从分离片段去除寡核苷酸编码分子的部分以形成寡核苷酸编码分子的恢复部分;
从寡核苷酸编码分子的恢复部分扩增寡核苷酸以形成一部分拷贝序列,
对拷贝序列部分进行测序以识别寡核苷酸编码分子的恢复部分的每个编码区域或编码区域组合,以识别至少一个被编码部分的每个位置构建单元。
实施方式10A.根据实施方式7A所述的方法,进一步包括:
通过在第二方向上遍及分离介质施加电压来分离至少两种不同的寡核苷酸编码分子,其中第二方向基本上垂直于第一方向。
实施方式11A.根据实施方式10A所述的方法,进一步包括:
通过在两个方向上切断分离介质来分离寡核苷酸编码分子的一部分,其中两个方向各自独立地基本上垂直于第一和第二方向以形成矩形分离片段。
实施方式12A.根据实施方式11A所述的方法,进一步包括:
从矩形分离片段去除寡核苷酸编码分子的部分以形成寡核苷酸编码分子的恢复部分;
从寡核苷酸编码分子的恢复部分扩增寡核苷酸以形成一部分拷贝序列,
对拷贝序列部分进行测序以识别寡核苷酸编码分子的恢复部分的每个编码区域或编码区域组合,以识别至少一个被编码部分的每个位置构建单元。
实施方式13A.根据实施方式1A所述的方法,其中所述分离介质含有颗粒和聚合物中的至少一种,并且所述至少一种靶分子连接至所述颗粒和所述聚合物中的至少一种。
实施方式14A.一种电泳系统,包括:
一种分离介质,该分离介质包含,
多孔凝胶;
多孔凝胶内的至少一种靶分子;和
多孔凝胶内的至少两种不同的寡核苷酸编码分子,
其中寡核苷酸编码分子含有连接至至少一个被编码部分的寡核苷酸,其中寡核苷酸含有至少两个编码区域,
其中至少一个被编码部分含有至少两个位置构建单元,
其中每个被编码部分的每个位置构建单元由2到5个编码区域识别。
实施方式15A.根据实施方式14A所述的电泳系统,所述多孔凝胶进一步包括:
颗粒和聚合物中的至少一种,并且至少一种靶分子与颗粒和聚合物中的至少一种连接。
计算机系统
本公开提供了被编程以实施本公开的方法的计算机系统,比如,例如收集至少一种解析的寡核苷酸编码分子的靶活性数据。图12示出了计算机系统1201,其包括中央处理单元(CPU,本文也称为“处理器”和“计算机处理器”)1205,其可以是单核或多核处理器,或用于平行处理的多个处理器。计算机系统1201还包括存储器或存储位置1210(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元1215(例如,硬盘)、用于与一个或多个其他系统通信的通信接口1220(例如,网络适配器)和外围设备1225,例如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器1210、存储单元1215、接口1220和外围设备1225通过诸如主板的通信总线(实线)与CPU 1205通信。存储单元1215可以是用于存储数据的数据存储单元(或数据仓库)。计算机系统1201可以在通信接口1220的帮助下可操作地偶联至计算机网络(“网络”)1230。网络1230可以是因特网(Internet)、内联网和/或外联网、或与因特网通信的内联网和/或外联网。在一些情况下,网络1230是电信和/或数据网络。网络1230可以包括一个或多个计算机服务器,其可以实现分布式计算,例如云计算。在一些情况下,在计算机系统1201的帮助下,网络1230可以实现对等网络,其可以使偶联到计算机系统1201的设备能够充当客户端或服务器。
CPU 1205可以执行一系列机器可读指令,这些指令可以体现在程序或软件中。指令可以存储在存储位置,例如存储器1210。指令可以被引导到CPU 1205,CPU 1205可以随后编程或以其他方式配置CPU 1205以实现本公开的方法。CPU 1205执行的操作的示例可以包括获取、解码、执行和写回。
CPU 1205可以是电路的一部分,例如集成电路。系统1201的一个或多个其他组件可以包括在电路中。在一些情况下,该电路是专用集成电路(ASIC)。
存储单元1215可以存储文件,例如驱动程序、文库和保存的程序。存储单元1215可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统1201可以包括一个或多个位于计算机系统1201外部的另外的数据存储单元,例如位于通过内联网或因特网与计算机系统1201通信的远程服务器上。
计算机系统1201可以通过网络1230与一个或多个远程计算机系统进行通信。例如,计算机系统1201可以与用户的远程计算机系统进行通信。远程计算机系统的示例包括个人计算机(例如便携式PC)、触屏平板电脑或平板电脑(例如
Figure BDA0003261094520000502
iPad、
Figure BDA0003261094520000501
Galaxy Tab)、电话、智能手机(例如
Figure BDA0003261094520000503
iPhone、支持Android的设备、
Figure BDA0003261094520000504
)或个人数字助理。用户可以通过网络1230访问计算机系统1201。
如本文所描述的方法可以通过存储在计算机系统1201的电子存储位置(例如,存储器1210或电子存储单元1215)上的机器(例如,计算机处理器)可执行代码来实现。机器可执行或机器可读代码可以以软件的形式提供。在使用过程中,代码可由处理器1205执行。在一些情况下,该代码可从存储单元1215中检索并存储在存储器1210中以供处理器1205随时访问。在一些情况下,可以不包括电子存储单元1215,并且机器可执行指令存储在存储器1210上。
代码可以被预编译和配置为与具有适于执行代码的处理器的机器一起使用,或者可以在运行期间被编译。代码可以以编程语言提供,可以选择编程语言以使代码能够以预编译或编译时(as-compiled)的方式执行。
本文提供的系统和方法的方面,例如计算机系统1201,可以体现在编程中。该技术的各个方面可以被认为是“产品”或“制品”,其通常以机器(或处理器)可执行代码和/或相关数据的形式在一种类型的机器可读介质上存在或在一种类型的机器可读介质中体现。机器可执行代码可以存储在电子存储单元上,例如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘。“存储”型介质可包括计算机、处理器等或其相关模块的任何或所有有形存储器,例如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可随时为软件编程提供非瞬时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。例如,这样的通信可以使软件能够从一台计算机或处理器负载到另一台计算机或处理器中,例如从管理服务器或主机计算机负载到应用服务器的计算机平台中。因此,可以承载软件元素的另一种类型的介质包括光波、电波和电磁波,例如跨本地设备之间的物理接口、通过有线和光学陆线网络以及通过各种空中链路(air-links)使用的。携带这种波的物理元件,例如有线或无线链路、光链路等,也可以被认为是承载软件的介质。如本文所用,除非限于非瞬时性、有形“存储”介质,诸如计算机或机器“可读介质”之类的术语是指参与向处理器提供指令以供执行的任何介质。
因此,诸如计算机可执行代码的机器可读介质可以采用多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机等中的任何存储设备,诸如可用于实施附图中所示的数据库等。易失性存储介质包括动态存储器,例如此类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的线路。载波传输介质可以采用电信号或电磁信号,或者声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,常见形式的计算机可读介质包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、打孔卡纸磁带、任何其他带有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒式磁带、传输数据或指令的载波、传输此类载体波的电缆或链路,或任何其他计算机可以从中读取编程代码和/或数据的介质。许多这些形式的计算机可读介质可涉及将一个或多个指令的一个或多个序列传送到处理器以供执行。
计算机系统1201可以包括电子显示器1235或与电子显示器1235通信,该电子显示器1235包括用于提供例如至少一种解析的寡核苷酸编码分子的靶活性数据的用户接口(UI)1240。UI的示例包括但不限于图形用户接口(GUI)和基于网络的用户界面。
本公开的方法和系统可以通过一种或多种算法来实现。算法可以在由中央处理单元1205执行时通过软件来实施。例如,该算法可以实施用于收集至少一种解析的寡核苷酸编码分子的靶活性数据的方法。
本公开的各种实施方式由以下实施例说明但不限于以下实施例。本领域技术人员将认识到用于完成本文列举的步骤或步骤的部分的许多等效技术。
实施例
实施例1.与DNA寡核苷酸连接的合成化合物的制备
DNA修饰领域的技术人员将理解,将活化酸与反应活性游离胺偶联的反应可以快速有效地生成大量化合物或单个化合物。
实施例1A.在
Figure BDA0003261094520000533
树脂上固定DNA
为了对与反应活性胺柄(handle)连接的DNA寡核苷酸进行化学修饰,首先将DNA固定在
Figure BDA0003261094520000531
树脂上。向384孔过滤板(E&K Scientific,EK-2288)的每个孔中加入40uL的1:1 DEAE
Figure BDA0003261094520000532
存储溶液。孔在板式真空歧管(plate vacuum manifold)上将孔用70uL水冲洗两次,然后用70uL结合缓冲液(蒸馏水中的10mM AcOH)冲洗两次。将板在离心机中以2000rpm旋转1分钟以干燥来自孔的所有液体。向每个孔中加入40uL结合缓冲液和10uL 100ng/uL适当的胺连接的DNA寡核苷酸,使用宽口吸头(Rainin)混合(triturated)所述孔,并在室温下孵育10分钟。将板以2000RPM在接收板(greiner bio-oneREF 781201)中旋转1分钟。将收集板中的洗脱液加到树脂的顶部,将所述孔混合并在室温下孵育5分钟。将板再次在接收板中旋转(2000RPM 1分钟),并且通过nanodrop分析每个洗脱液孔的DNA浓度以评估捕获效率。如果测得的DNA浓度高于1ng/uL,则将洗脱液第三次添加到树脂并再孵育5分钟并且经历维持长的时间(spin out),然后重复测量。如果测得的DNA浓度小于1ng/uL,则在真空歧管上冲洗孔(3x70uL结合缓冲液、3x70uL水、3x70uL甲醇)。
实施例1B.活化酸的生成一般程序和与反应活性胺相连的DNA寡核苷酸的偶联
为了将含有酸部分的化合物与DNA低聚物的游离胺偶联,用以下方式活化酸。对于每种酸,如根据酸的分子量计算的,制备浓度为400mM的80:20DMF:MeOH溶液。在80:20DMF:MeOH中制备1mL 40mM HoAT(5.5mg)溶液。在即将使用之前,将100mM EDC*HCl 7.7mg的原料液溶解在400uL MeOH中。为了生成活化酸,向15uL所需酸(400mM)中加入15uL HoAT(40mM),然后30uL DMF:MeOH 80:20,最后加入60uL EDC*HCl溶液(100mM),并且将混合物在室温下孵育5分钟。
实施例1C.用活化酸酰化DNA的一般程序
为了将活化酸溶液与连接到反应活性胺柄的DNA寡核苷酸偶联,将来自实施例1A的固定在过滤板中的DNA在真空歧管上用在DMF:MeOH 80:20中的70uL的400mM DIPEA冲洗3次,然后用70uL MeOH冲洗3次。然后将过滤板放在橡胶塞上放置以防止孔排水。向每个孔中加入70uL实施例1B中制备的所需活化酸溶液并混合孔。孔用金属胶带(tape seal)(Corning,Cat.#6569)密封并进行孵育(RT,1小时)。然后将板开封并通过真空歧管去除溶液。用橡胶塞密封板底部,将新鲜等分试样(70uL)的活化酸添加至适当的孔中,混合并用金属胶带密封板顶部并使其孵育(RT,1小时)。孵育后移除板密封件,通过真空歧管去除溶液并冲洗孔(3x,70uL,80:20DMF:MeOH)。
实施例1D.去除胺保护基团芴基甲氧羰基(Fmoc)
对于与活化酸偶联和反应的DNA连接的反应活性胺(实施例1C),对于Fmoc保护的酸被酰化的孔,加入60uL 4-甲基哌啶(20%v/v,DMF)并孵育10分钟。通过真空歧管去除溶液并冲洗孔(3x70uL DMF、3x70uL MeOH、3x70uL DI水)。将板旋转以去除任何痕量液体(1分钟,2000RPM)。这种新修饰的DNA寡核苷酸可以被洗脱(实施例1E),也可以进行另外的偶联(按照实施例1C-1D)以延伸化合物。
实施例1E.从
Figure BDA0003261094520000542
中洗脱、回收和纯化合成修饰的寡核苷酸
在修饰固定在
Figure BDA0003261094520000541
树脂上的DNA连接的反应活性胺的反应之后,DNA化合物构建体可以从孔中洗脱到收集板中进行分析和纯化。向孔中加入33uL洗脱缓冲液(1.5M NaCl、50mM NaOH的蒸馏水),混合并孵育5分钟。将过滤板置于接收板上并通过离心(1分钟,2000RPM)收集溶液。这些步骤重复另外两次以在99uL洗脱缓冲液中产生洗脱的DNA。向收集的洗脱液中加入2.5uL的1M乙酸(终浓度25mM)以中和50%的NaOH,同时防止洗脱液变为酸性。样品通过Agilent 1200HPLC在Phenomenex Clarity 2.6um Oligo-XT 100A柱(50x2.1mm)上使用针对关注的特定化合物-DNA构建体优化的HPLC方法进行纯化。
实施例1F.合成和产生附加到DNA的全长编码阳性对照分子
熟悉本领域的人将理解,可以利用修饰的引物,例如用来自实施例1A-1E的合成分子修饰的DNA寡核苷酸,产生更长的DNA构建体。BCA阳性对照是在如所述的选定的DNA寡核苷酸上合成的。纯化的化合物-DNA杂交体用作标准PCR中的引物,使用对化合物特征特异性的全长链模板。简言之,向由Za'-A(097-107)-Zbi-Bi-Zbf-Bf-Zci-Ci-Zcf-Cf-Zd-D001-Zf组成的模板链添加1uL的10uM化合物-Za-DNA杂交体进入25uL Q5 PCR反应中,并且如本领域技术人员将理解的,运行优化的PCR程序以生成“全长”234寡核苷酸密码,模拟DNA编码文库编码部分的长度和组成。使用thermoscientific GeneJet PCR纯化试剂盒的标准方案纯化产物。
实施例2通过正交反应条件荧光标记DNA寡核苷酸上的化合物
生产和纯化与DNA相连的已知结合亲和性的化合物,其中利用修饰的核苷酸来连接荧光化合物以视觉化DNA。本领域已知荧光团(在该实施例中为荧光素)的附接能够确定结合亲和性,并且还可用于使化合物在表面、凝胶或样品上的位置可视化。
2A.使用含有可商购的炔烃修饰的寡核苷酸的修饰DNA密码
正如本领域技术人员所熟悉的那样,利用正交反应柄(reaction handle),在这种情况下是炔烃,允许对关注的化合物的远端位点进行合成修饰。为了产生荧光化合物,将具有反应活性胺连接的末端(5AmMC6)的炔烃修饰的DNA核苷酸(i5OctdU)寡核苷酸用于合成所需化合物(如图6所示)并按实施例1B-1E进行纯化。纯化后,样品通过speed-vac干燥并溶解在20uL的DI水中。向该溶液中加入10uL的7.3mM 5-FAM叠氮化物(Lumiprobe,Cat.#C4130),然后加入80uL新鲜制备的Click反应缓冲液(120mM磷酸盐、1.2mM氨基胍、3mM三(苄基三唑基甲基)胺、6mM硫酸铜、12mM抗坏血酸钠水溶液)并进行孵育(30分钟,室温)。孵育80uLClick淬灭缓冲液(100mM Tris、10mM EDTA、0.005%吐温、0.002%SDS的去离子水)后,加入500uL结合缓冲液。向Eppendorf管溶液中加入40uL DEAE树脂,轻轻摇动进行孵育(20分钟,室温)。将管在台式离心机上离心1分钟,并通过移液去除上清液。将树脂重悬浮在50uL水中并转移至384孔过滤板。在真空歧管上冲洗孔(3x70uL DI水、3x70uL MeOH、1x70uLDMSO、3x70uL甲醇、3x70uL水)。使用上述程序洗脱DNA(3x33uL洗脱缓冲液到收集板中)。使用10uL的100mM AcOH中和洗脱液。使用标准方法使用HPLC纯化样品。
实施例3使用荧光偏振测量溶液中DNA上的荧光化合物与靶标的结合亲和性
1.使用可溶性蛋白质的阳性对照荧光偏振一般程序
图6显示了使用的阳性对照化合物。
本领域技术人员将理解,与未修饰的天然化合物相比,共价连接至DNA的化合物可具有修饰的、更高或更低或不变的亲和性特征。为了解决这个问题,使用常见的结合试验,荧光偏振用于评估所选的阳性对照分子,这些阳性对照分子被合成为能够使用正交化学进行荧光标记的DNA寡核苷酸的系链部分。DNA上的阳性对照化合物(如图6所示)在1xTrisBorate缓冲液(45mM,pH 8.19)中单独稀释至在1mL缓冲液中20nM的终浓度。将此20nM原料液按1:1稀释以生成10nM原料液。在1x TrisBorate缓冲液中制备100uM的BCA-II原料液。向384孔聚苯乙烯F型底小体积hibase非结合黑色板(Greinerbio-one,目录号784900)加入列1中10uL的20nM适当化合物的原料液。在列2-20中加入10uL适当的化合物10nM原料液。向列1添加10uL的100uM BCA-II蛋白质溶液,将孔混合并将孔的10uL转移到孔列2中,并通过移液混合,重复该过程直到第20孔。该程序在每个后续孔中产生以1:1稀释的储备蛋白浓度,从而提供50uM至95pM的范围,而荧光标记的DNA化合物的浓度保持恒定10nM。使用485/530的激发/发射和预编程的荧光偏振方法,通过Spectramax M5读板器读取板。将获得的值绘制成图,并且将结果拟合为希尔方程,以产生以纳摩尔值记录的结合亲和性(Kd)。
实施例4用于选择阳性性状与阴性性状分子的亲和电泳驻留泳道的产生。
实施例4A:有效地生成带有捕获部分的靶蛋白标记以进行固定
如本领域技术人员将认识到的,蛋白质的修饰被广泛使用且司空见惯,在该实施例中,来自牛红细胞的碳酸酐酶同工酶II用生物素修饰以允许靶标捕获到链霉亲和素包被的颗粒。为了达到这个目的,向来自牛红细胞(σC2552-25MG)的25mg(0.833微摩尔)碳酸酐酶同工酶II添加450uL的PBS(pH 7.8)。向该溶液中加入溶解在550uL PBS(pH 7.8)中的1.5mg(2.5微摩尔,3当量)NHS-dPeg4-生物素(Sigma QBD10200)。将该混合物(800uM蛋白质终浓度)在4℃下放置过夜。该生物素化蛋白质在后续步骤中无需纯化即可使用。
实施例4B:在链霉亲和素标记的琼脂糖树脂上生成固定化靶标
生物素化的靶蛋白(牛碳酸酐酶同工酶II)被固定在关注的树脂上。为了实现这一点,将10.6mL 50%的高容量链霉亲和素琼脂糖树脂(Thermo#20361)浆液加入50mL falcon管中。通过以下程序用三硼酸盐缓冲液(pH8.19)将树脂冲洗两次:将浆液以1000RPM离心1分钟,并通过移液器去除上清液,向其中加入5mL三硼酸盐缓冲液,并重复该程序。除去第二次洗液(wash)后,加入1mL如上制备的800uM生物素化牛碳酸酐酶。通过温和搅拌混合该浆液并使其在室温下孵育2小时。孵育后将样品离心(1000RPM,1分钟)并小心去除上清液,同时小心让树脂保持“湿润”。
实施例4C:在可选的链霉亲和素标记的树脂颗粒上生成固定靶标。
本领域技术人员可以认识到,实施例4B中描述的固定技术可以容易地进行改进以适应可选的树脂类型。在这个实施例中,链霉亲和素包被的硅石颗粒(Sphero SVSIP-05-50.4-0.6um)、链霉亲和素包被的聚苯乙烯颗粒(Sphero SVP-05-10 0.4-0.69um)和链霉亲和素包被的琼脂糖颗粒(载量较低的Thermofisher 20347)进行与上述相同的程序以产生包被靶蛋白质的颗粒。
实施例4D利用低熔点琼脂糖和靶标标记的颗粒生成亲和电泳驻留琼脂糖混合物。
为了将靶标包被的颗粒固定到用于电泳的适当的多孔介质中,本领域技术人员将认识到可以控制样品制备的温度以防止靶标展开。为了实现这种控制并在分离介质中产生固定的靶颗粒,使用了低熔点琼脂糖。向装有4克UltraPure低熔点琼脂糖(Invitrogen16520)的烧杯中加入100mL的0.5X三硼酸盐缓冲液(pH 8.19)以生成4%琼脂糖溶液。将烧杯以1分钟的间隔中间短暂搅拌进行高速微波加热,直到所有琼脂糖溶解并观察到最少气泡。将溶解的凝胶转移到两个50mL的falcon管中,使其冷却并在加热单元中保持在42℃。使用2克低熔点琼脂糖和100mL 0.5×三硼酸盐缓冲液(pH 8.19),如上所述单独制备2%低熔点琼脂糖溶液。在加热单元中将已装载有靶蛋白的5.3mL沉降的高容量链霉亲和素树脂样品温热至42℃。在42℃向温热的靶颗粒中加入8mL的4%低熔点琼脂糖。用移液管吸头彻底混合浆液,同时小心避免气泡。这种混合物能够使用定制的电泳模具(半圆柱体,4毫米高8毫米横截面)生成4泳道的9厘米亲和电泳驻留泳道。可以认识到,这种制备的规模可以根据靶标的可用性、颗粒的可用性或所需的泳道数和长度调整到更低或更高的量。制备的2%琼脂糖溶液用于在琼脂糖驻留泳道内创建样品的负载点。简而言之,将负载梳(loadingcomb)(尺寸如下所述)放置在距离凝胶模具顶部1厘米处,并添加2%琼脂糖以包围半圆柱负载点。使2%琼脂糖在室温下凝固,小心地从凝胶上取下负载梳,这会在每个泳道中产生凹陷(depression),能够在其间容纳15uL含有文库或所需样品的负载溶液。
模具是在免费的在线软件
Figure BDA0003261094520000581
中设计的。设计规范如下;底部LxWxD19x9x1深度,底部两侧有壁(19x0.5x0.8 cm)括住(bracket)。在底部上印有六个均匀间隔(0.5厘米间隔)的半圆柱体(参见图3,302),尺寸为19x0.8x0.4厘米。如图所示,“负载梳”印在具有长x宽x深尺寸为8.8x1x0.4厘米的底部上。在“负载梳底部”上印有六个高0.3厘米、宽0.6厘米的半圆柱体,半圆柱体之间的间距为0.6厘米,将半圆柱体括起来是两个正方体(0.3x0.3x0.3x厘米)以适合倾倒模具的边缘,迫使梳子位于准备好的模具内,并且半圆柱体位于半管内中心。UPS商店利用
Figure BDA0003261094520000591
Figure BDA0003261094520000592
SE Plus 3D打印机和常用的ABS(丙烯腈丁二烯苯乙烯)打印材料进行打印。
为了生成用于泳道制备和成像的解析选择模具,上述3D打印模具首先用气溶胶
Figure BDA0003261094520000595
Universal Mold Release轻轻喷涂,以在3D打印模具上创建均匀的光涂层。模具的端点开口末端使用遮蔽胶带密封,并且将
Figure BDA0003261094520000593
Figure BDA0003261094520000594
50(按照制造商的说明制备,重量比为1:2A:B彻底混合并超声处理2分钟以去除气泡)小心倒入以避免气泡,并放置过夜。设置后,clear-flex50模具被小心去除,生成能够填充有琼脂糖凝胶的半圆柱体泳道。模具用水和70%乙醇彻底冲洗,无需进一步改进即可使用。
解析选择凝胶泳道
实施例4E.生成带有负载点的全亲和电泳驻留泳道。
为了创建全亲和电泳驻留泳道构建体,可以产生样品负载点以允许将样品引入含有负载有靶标的驻留颗粒的多孔琼脂糖中。使用定制的印刷负载点梳,将先前制备的2%低熔点琼脂糖倒入由过滤塞封住的模具中。使凝胶冷却至室温,使琼脂糖凝固并小心去除所述梳。检查装载孔是否有任何不一致或洞。将所述梳轻轻放回负载孔区域并去掉多余的凝胶。另一个新鲜的过滤塞放置在距负载区域边缘适当距离处(约1-9厘米或任何自定义距离),并将靶标负载的颗粒/低熔点琼脂糖混合物移入泳道并使其冷却至室温并凝固以创建凝胶的“捕获区域”。过滤塞被去掉,向“捕获区域”的末端加入2%LMP琼脂糖以填充泳道至末端,为样品分子在遇到驻留“捕获区域”后提供额外的距离进行移动。
实施例5.根据电泳期间的亲和性对连接到DNA的已知结合分子进行分级(Fractionation)和分离:
实施例5A.通过靶活性电泳驻留泳道的荧光阳性对照电泳
a.图7A、图7B和图8A-D
正如亲和层析领域的技术人员可以理解的,所产生的亲和性电泳驻留泳道将用作取决于与靶标相互作用的分子的共振时间的分级,以在电泳期间延迟其通过凝胶的运动。如上所述,生成具有包括高负载链霉亲和素琼脂糖和固定靶标的靶牛碳酸酐酶II捕获区域的凝胶泳道。向这些泳道负载12uL的单一阳性对照化合物(图6)或荧光标记阳性对照(图6)的混合物(图8A、图8B、图8C、图8D、图9和图10),其中200ng每种化合物和2uL凝胶负载缓冲液。凝胶在40V运行18小时并定期成像以使用蓝色板在Bio-Rad Gel Dock EZ Imager上跟踪分离进展。从图6中可以看出,单一化合物实验产生的驻留因子(Rf’s)与合成修饰的寡核苷酸的亲和性相对应。可以以相同的方式添加和分离这些对照分子的混合物(图8A-D、9和10)。
实施例5B.通过不同颗粒类型和负载密度的亲和电泳驻留泳道进行荧光阳性对照电泳
a.图10
使用具有可变密度和颗粒类型的分离介质提供了具有增强特性潜力的可选驻留能力。为了评估这一点,生成的泳道含有在3cm具有捕获靶标位的以下驻留区域:1.具有捕获靶标的链霉亲和素标记的聚苯乙烯,2.具有捕获靶标的链霉亲和素标记的硅石,3.高负载链霉亲和素琼脂糖,4.低负载链霉亲和素琼脂糖(其中颗粒密度等于3),5.1/4密度的高负载链霉亲和素琼脂糖至泳道3(其中总靶量等于4)。这探索了颗粒类型、表面展示靶密度和靶颗粒密度。使用亲和性为362nM(化合物10)和7160nM(化合物5)的化合物和作为示踪剂的荧光素进行实验。电泳在90V下进行3小时。
实施例5C.全长编码寡核苷酸和编码分子分离
该方法的效用在于它能够将性状阳性化合物与性状阴性化合物分开,并且这样的方式做使得通过对靶标的亲和性来将性状阳性化合物分级,并进行测序以识别编码区域,从而识别编码化合物。在电泳之前,凝胶设备用去DI水冲洗。该设备填充有2L的0.5x TB缓冲液,并放置在水浴中的熟食冰箱(deli fridge)中(凝胶设备线以下),并使其冷却至4℃。将具有泳道的凝胶模具装入设备中并冷却30分钟。向制备好的解析选择凝胶(使用载有靶蛋白的高负载链霉亲和素琼脂糖的3cm捕获区域)添加12uL样品,其包含2uL紫色凝胶负载缓冲液(NEB#B7024S)、100ng虚拟文库(dummy library)(由1600万个独特的文库代码组成,但不是合成修饰的化合物)和50,000拷贝牛碳酸酐酶II(表XA)的每个阳性对照,它们是在实施例1F中生成的,并从虚拟文库样本中独立且唯一地编码。样品在90V下电泳5小时。
实施例5D驻留介质的物理分配
熟悉本领域技术的人员可以认识到,需要洁净室技术对于防止样品交叉污染至关重要。为了在凝胶运行后实现这一点,将其转移到层流罩中。亲和性选择凝胶被分配成44个1毫米的切片并转移到无菌PCR板。切片是使用在食指之间拿着的并压在凝胶切片上的一叠12把非上油剃须刀片(non-greased razor blade)生成的。PCR孔位置直接对应于凝胶切片的位置。
实施例5E从亲和性电泳驻留琼脂糖凝胶泳道中回收DNA寡核苷酸
为了从每个分配的切片产生编码DNA的PCR拷贝,可以以适合PCR扩增的形式回收DNA。为此,将含有上述生成的单个凝胶切片的PCR板在热循环仪中加热至95℃ 5分钟。将板离心(2000RPM,1分钟)并向每个孔中加入3uL 10x B-Agarase I缓冲液和5uL含有50,000个阳性对照DNA序列分子的水,以产生30uL的总体积。将板再次加热至95℃保持10分钟,然后将其置于42℃的加热单元中。将样品在42℃加热单元上保持10分钟,然后向每个孔中加入2uL B-琼脂酶(New England BioLabs Cat#M0392L)。然后使板孵育(1小时,42℃)。孵育后将板离心(2000RPM,1分钟)。如有必要,该板可在-20℃密封保存。此程序生成的样品不再能够凝胶化,并且可以在后续步骤中通过PCR进行扩增。
实施例5F通过特定索引寡核苷酸引物的PCR安装对单个凝胶切片进行索引
为了参照亲和性选择凝胶识别回收的DNA的位置,将索引寡核苷酸安装在亲本编码DNA链的所有扩增PCR拷贝上。为了从上面产生的溶解的凝胶样品中实现这一点,将孔混合并将15uL转移到新的96孔板中。每个凝胶切片都用zd'-D002'通过D096'-Zf索引单独索引。使用Q5 High-Fidelity 2x Master Mix(NEB M0492L)制备总共5mL的主混合物(mastermix)。向每个孔中添加1.25uL D-索引引物(10uM)和1.25uL Illumina-Za引物(10uM),并使用Illum_Za_T73方案运行12个循环。
实施例5G带有用于测序的Illumina Za和Illumina Zf引物组的索引安装的后扩增
为了对编码区域和索引区域进行测序以适当分配编码化合物结构,可以安装测序引物组。Illumina引物组使用标准PCR协议进行安装。简单地说,从每个索引-凝胶切片孔中取出2uL并转移到新的96孔PCR板中。向这些孔中加入23uL含有Illumina引物组的Q5主混合物。样品使用Illum_Za-T73协议运行10个循环。扩增后,将来自每个孔的2uL等分试样合并,并且每10uL合并的PCR反应物添加1uL Exo-I(NEB M0293-L)。组合的样品在37℃下孵育30分钟,然后在80℃下加热灭活15分钟。使用GeneJet PCR净化试剂盒(Thermo Cat.#K0701)纯化组合的核损外切酶样品。使用2%琼脂糖凝胶和光密度测定法评估样品的纯度以量化DNA的量。纯化的DNA被提交用于NGS测序。
实施例5H带有用于测序的Illumina Za和Illumina Zf引物组的索引安装的后扩增
a.图11A
将实施例5F中制备的DNA样品提交进行DNA测序。后处理方法分离和识别A097-A107编码区域,该编码区域编码样品中的阳性对照分子和位置索引,以确定代码源自的切片。测序计数由凝胶切片绘制(图11A),其中具有最佳亲和性的化合物与具有较低亲和性的化合物相比被高度保留,并且可以被分离、测序和识别。

Claims (15)

1.一种确定至少一种解析的寡核苷酸编码分子的靶活性的方法,包括:
提供分离介质,其中所述分离介质含有至少一种靶分子;
将含有至少两种不同的寡核苷酸编码分子的混合物的样品引入分离介质,其中所述至少两种不同的寡核苷酸编码分子包括与至少一个被编码部分可操作连接的编码部分;
通过将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,形成至少两种不同的解析的寡核苷酸编码分子;
通过从所述分离介质分割至少两个分开的位置中的至少一个位置以形成至少一个解析的片段,从至少两种不同的解析的寡核苷酸编码分子中收获至少一种解析的寡核苷酸编码分子;
处理至少一种解析的寡核苷酸编码分子以允许进行聚合酶链式反应(PCR);
通过对至少一种解析的寡核苷酸编码分子的编码部分进行PCR来扩增所述至少一种解析的寡核苷酸编码分子的至少一个被编码部分;和
通过处理至少一种解析的寡核苷酸编码分子的至少一个被编码部分的至少一个位置和特征来确定至少一种解析的寡核苷酸编码分子的靶活性。
2.根据权利要求1所述的方法,其中所述至少一种靶分子包括选自由下述组成的组中的至少一种:细胞、寡核苷酸、蛋白质、酶、核糖体和nanodisc。
3.根据权利要求1所述的方法,其中所述分离介质含有由下述组成的组中的至少一种:颗粒、聚合物和分离表面,并且所述至少一种靶分子连接至分离介质、颗粒、聚合物和分离表面中的至少一种。
4.根据权利要求3所述的方法,其中所述颗粒包括聚合物颗粒或金属胶体。
5.根据权利要求3所述的方法,其中所述聚合物具有所述至少一种靶分子的最低重量靶分子的10%或更多的分子量。
6.根据权利要求1所述的方法,进一步包括基于至少一种靶分子与至少两种不同的寡核苷酸编码分子的被编码部分之间的至少一种靶活性来分离至少两种不同的寡核苷酸编码分子。
7.根据权利要求6所述的方法,其中所述至少一种靶标活性包括所述至少一种靶分子对所述至少一种寡核苷酸编码分子的被编码部分的化学修饰。
8.根据权利要求1所述的方法,其中,
所述寡核苷酸含有至少两个编码区域,
所述至少一个被编码部分包含至少两个位置构建单元,
至少一个被编码部分的每个位置构建单元由寡核苷酸的1至5个编码区域识别;和
所述分离介质含有多孔凝胶和缓冲系统。
9.根据权利要求1所述的方法,其中,所述至少两种不同的寡核苷酸编码分子具有根据式(I)的结构,
(I) G—L—B
其中
G包括包含至少两个编码区域的寡核苷酸;
B为含有至少两个构建单元的被编码部分;
L为可操作地将G连接到B的接头;和
其中B中的每个位置构建单元根据G的1至5个编码区域的位置分别识别。
10.根据权利要求1所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(II)的结构,
(II) [(B1)M—L1]O—G—[(L2—(B2)K]P
其中
G包括包含至少两个编码区域的寡核苷酸;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接到G的接头;
L2为可操作地将B2连接到G的接头;
O为零或1;
P为零或1;
条件是O和P中的至少一个是1;和
其中位置M处的每个位置构建单元B1和/或位置K处的B2由G的1至5个编码区域识别。
11.根据权利要求1所述的方法,其中所述至少两种不同的寡核苷酸编码分子具有根据式(III)的结构,
(III) [(B1)M—L1]O—G’—[(L2—(B2)K]P
其中
G’包括寡核苷酸,G’包括至少两个编码区域和至少一个发夹区;
B1为位置构建单元,并且M表示1至20的整数;
B2为位置构建单元,并且K表示1至20的整数,其中B1与B2相同或不同,其中M与K相同或不同;
L1为可操作地将B1连接到G’的接头;
L2为可操作地将B2连接到G’的接头;
O是从0到5的整数;
P是从0到5的整数;
条件是O和P中的至少一个是1至5的整数;和
其中位置M处的每个位置构建单元B1和/或位置K处的B2由G’的1至5个编码区域识别。
12.根据权利要求1所述的方法,进一步包括:
通过在第一方向遍及分离介质施加第一分离处理,将至少两种不同的寡核苷酸编码分子分离到分离介质中的至少两个分开的位置,
其中第一分离处理包括第一电压方案和第一持续时间。
13.根据权利要求12所述的方法,进一步包括:
通过在基本上垂直于第一方向的第一分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。
14.根据权利要求13所述的方法,进一步包括:
通过在第二方向遍及分离介质施加第二分离处理将至少两种不同的寡核苷酸编码分子分离到分离介质的至少两个分开的位置,其中第二方向基本上垂直于第一方向,
其中第二分离处理包括第二电压方案和第二持续时间。
15.根据权利要求14所述的方法,进一步包括:
通过在基本上垂直于第一分割方向的第二分割方向上从分离介质分割至少一个位置以形成至少一个解析的片段来收获至少一种解析的寡核苷酸编码分子。
CN202080021046.5A 2019-03-14 2020-03-13 用于处理或分析寡核苷酸编码分子的方法和系统 Pending CN113677836A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962818645P 2019-03-14 2019-03-14
US62/818,645 2019-03-14
PCT/US2020/022662 WO2020186174A1 (en) 2019-03-14 2020-03-13 Methods and systems for processing or analyzing oligonucleotide encoded molecules

Publications (1)

Publication Number Publication Date
CN113677836A true CN113677836A (zh) 2021-11-19

Family

ID=72426920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080021046.5A Pending CN113677836A (zh) 2019-03-14 2020-03-13 用于处理或分析寡核苷酸编码分子的方法和系统

Country Status (7)

Country Link
US (1) US20220145362A1 (zh)
EP (1) EP3938566A4 (zh)
JP (1) JP2022525340A (zh)
KR (1) KR20210142668A (zh)
CN (1) CN113677836A (zh)
CA (1) CA3131890A1 (zh)
WO (1) WO2020186174A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3619340A4 (en) 2017-05-02 2021-01-20 Haystack Sciences Corporation MOLECULES FOR THE VERIFICATION OF OLIGONUCLEOTIDE DIRECTED COMBINATIONAL SYNTHESIS AND METHOD OF MANUFACTURING AND USING THEREOF
WO2023056379A2 (en) * 2021-09-30 2023-04-06 Insitro, Inc. Sorting of oligonucleotide-directed combinatorial libraries

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050087445A1 (en) * 2000-04-03 2005-04-28 The Wistar Institute Method and device for separation of charged molecules by solution isoelectric focusing
CN107428795A (zh) * 2014-12-30 2017-12-01 X-化学有限公司 用于标记dna编码文库的方法
WO2017218293A1 (en) * 2016-06-16 2017-12-21 Richard Edward Watts Oligonucleotide directed and recorded combinatorial synthesis of encoded probe molecules

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUE033651T2 (en) * 2002-10-30 2017-12-28 Nuevolution As A method for producing two-function complexes
US11118215B2 (en) * 2003-09-18 2021-09-14 Nuevolution A/S Method for obtaining structural information concerning an encoded molecule and method for selecting compounds
PT3305900T (pt) * 2005-12-01 2021-10-27 Nuevolution As Métodos de codificação enzimática para síntese eficaz de bibliotecas grandes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050087445A1 (en) * 2000-04-03 2005-04-28 The Wistar Institute Method and device for separation of charged molecules by solution isoelectric focusing
CN107428795A (zh) * 2014-12-30 2017-12-01 X-化学有限公司 用于标记dna编码文库的方法
WO2017218293A1 (en) * 2016-06-16 2017-12-21 Richard Edward Watts Oligonucleotide directed and recorded combinatorial synthesis of encoded probe molecules
CN109312492A (zh) * 2016-06-16 2019-02-05 哈斯达克科学公司 寡核苷酸指导和记录的编码探针分子的组合合成

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏义勇等: "心肌线粒体蛋白质组学中的双向电泳及硝酸银染色方法的优化", 基础医学与临床, vol. 38, no. 12, 31 December 2018 (2018-12-31), pages 1759 - 1760 *

Also Published As

Publication number Publication date
JP2022525340A (ja) 2022-05-12
KR20210142668A (ko) 2021-11-25
EP3938566A4 (en) 2023-02-08
WO2020186174A1 (en) 2020-09-17
CA3131890A1 (en) 2020-09-17
EP3938566A1 (en) 2022-01-19
US20220145362A1 (en) 2022-05-12

Similar Documents

Publication Publication Date Title
US11161087B2 (en) Methods and compositions for tagging and analyzing samples
Huang et al. Strategies for developing DNA-encoded libraries beyond binding assays
RU2761432C2 (ru) Способ и композиция для анализа клеточных компонентов
AU2015250034B2 (en) Systems and methods for barcoding nucleic acids
US20210046482A1 (en) Method and apparatus for processing tissue and other samples encoding cellular spatial position information
US20180304222A1 (en) Systems and methods for barcoding nucleic acids
US20200256862A1 (en) Functionalized solid support
US20220154179A1 (en) Oligonucleotide directed and recorded combinitorial synthesis of encoded probe molecules
CN113677836A (zh) 用于处理或分析寡核苷酸编码分子的方法和系统
CN111295444B (zh) 用于寡核苷酸指导的组合化学的多项式编码
US20210016283A1 (en) Ultrahigh throughput protein discovery
US20100112558A1 (en) Probe Bead Synthesis and Use
US20240052405A1 (en) Methods, compositions, and systems for mapping locations of single molecules in multi-dimensional space
US20230057339A1 (en) Systems and methods for characterizing locations of target analytes in multi-dimensional space
WO2023023308A1 (en) Systems and methods for characterizing locations of target analytes in multi-dimensional space
WO2023168018A2 (en) Method and apparatus for processing tissue and other samples encoding cellular spatial position information with combinatorial encoding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination