CN116802319A - 相对反应活性测定方法及寡核苷酸合成反应的设计方法 - Google Patents
相对反应活性测定方法及寡核苷酸合成反应的设计方法 Download PDFInfo
- Publication number
- CN116802319A CN116802319A CN202280012195.4A CN202280012195A CN116802319A CN 116802319 A CN116802319 A CN 116802319A CN 202280012195 A CN202280012195 A CN 202280012195A CN 116802319 A CN116802319 A CN 116802319A
- Authority
- CN
- China
- Prior art keywords
- oligonucleotide
- phosphoramidites
- relative reactivity
- internal standard
- phosphoramidite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009257 reactivity Effects 0.000 title claims abstract description 157
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 33
- 238000002515 oligonucleotide synthesis Methods 0.000 title claims abstract description 11
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 333
- 238000012360 testing method Methods 0.000 claims abstract description 287
- 239000000203 mixture Substances 0.000 claims abstract description 142
- 239000000178 monomer Substances 0.000 claims abstract description 139
- 230000000694 effects Effects 0.000 claims abstract description 123
- 238000012163 sequencing technique Methods 0.000 claims abstract description 59
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 30
- -1 nucleoside phosphoramidites Chemical class 0.000 claims abstract description 29
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 28
- 239000002777 nucleoside Substances 0.000 claims abstract description 21
- 150000008300 phosphoramidites Chemical class 0.000 claims description 202
- 239000002773 nucleotide Substances 0.000 claims description 86
- 125000003729 nucleotide group Chemical group 0.000 claims description 86
- 230000000875 corresponding effect Effects 0.000 claims description 65
- 230000008878 coupling Effects 0.000 claims description 56
- 238000010168 coupling process Methods 0.000 claims description 56
- 238000005859 coupling reaction Methods 0.000 claims description 56
- 108020004705 Codon Proteins 0.000 claims description 38
- 238000010348 incorporation Methods 0.000 claims description 25
- 125000001314 canonical amino-acid group Chemical group 0.000 claims description 21
- 239000000126 substance Substances 0.000 claims description 21
- 150000001413 amino acids Chemical class 0.000 claims description 16
- 108090000623 proteins and genes Proteins 0.000 claims description 15
- 238000007481 next generation sequencing Methods 0.000 claims description 12
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 11
- 206010015856 Extrasystoles Diseases 0.000 claims description 9
- 238000010532 solid phase synthesis reaction Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 125000006850 spacer group Chemical group 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 4
- 239000000047 product Substances 0.000 description 90
- 238000004128 high performance liquid chromatography Methods 0.000 description 31
- 238000000746 purification Methods 0.000 description 28
- 238000000926 separation method Methods 0.000 description 25
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 24
- 238000003752 polymerase chain reaction Methods 0.000 description 24
- 230000001808 coupling effect Effects 0.000 description 22
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 17
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 17
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 15
- 229940104302 cytosine Drugs 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 229930024421 Adenine Natural products 0.000 description 8
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 229960000643 adenine Drugs 0.000 description 8
- 239000011324 bead Substances 0.000 description 8
- 150000007523 nucleic acids Chemical group 0.000 description 8
- 230000008439 repair process Effects 0.000 description 8
- 230000002194 synthesizing effect Effects 0.000 description 8
- 229940113082 thymine Drugs 0.000 description 8
- 230000027455 binding Effects 0.000 description 7
- 238000010828 elution Methods 0.000 description 7
- 239000011541 reaction mixture Substances 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000012408 PCR amplification Methods 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 238000006482 condensation reaction Methods 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 3
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical class O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 3
- KLJXEVCGQAYFFG-UHFFFAOYSA-N aminophosphonous acid;2h-tetrazole Chemical compound NP(O)O.C1=NN=NN1 KLJXEVCGQAYFFG-UHFFFAOYSA-N 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 239000012043 crude product Substances 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 150000003536 tetrazoles Chemical class 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- RWSYPPRKMNWNII-JECWBDJGSA-N 19a86zw520 Chemical compound C([C@@]12[C@@H](C)[C@@H]([C@@H]3[C@H]([C@H]([C@H](C)[C@H]4O[C@H]5C[C@@H](C)C[C@H]6O[C@@]7(C)[C@H](O)C[C@H]8O[C@H]9C=C[C@H]%10O[C@H]%11C[C@@H]%12[C@H]([C@@H]([C@H]%13O[C@H](C=CC[C@@H]%13O%12)\C=C\[C@H](O)CO)O)O[C@@H]%11C=C[C@@H]%10O[C@@H]9C\C=C/C[C@@H]8O[C@@H]7C[C@@H]6O[C@@H]5C[C@@H]4O3)O)O2)C)CCO1 RWSYPPRKMNWNII-JECWBDJGSA-N 0.000 description 1
- 101000942941 Arabidopsis thaliana DNA ligase 6 Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- ZFXNQVKIENOWIT-UHFFFAOYSA-N [I].C1CCOC1 Chemical compound [I].C1CCOC1 ZFXNQVKIENOWIT-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- OIRDTQYFTABQOQ-UHFFFAOYSA-N ara-adenosine Natural products Nc1ncnc2n(cnc12)C1OC(CO)C(O)C1O OIRDTQYFTABQOQ-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 238000010612 desalination reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- SXADIBFZNXBEGI-UHFFFAOYSA-N phosphoramidous acid Chemical group NP(O)O SXADIBFZNXBEGI-UHFFFAOYSA-N 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- 150000005691 triesters Chemical class 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种相对反应活性测定方法及寡核苷酸合成反应的设计方法,所述相对反应活性测定方法包括:ⅰ)选定N+1个不同的三联核苷亚磷酰胺中的任意1个作为内标品,其余为待测品;ⅱ)制备N个包含内标品与待测品的单体混合物;ⅲ)基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成,获得合成的寡核苷酸链,其中所述一个或多个寡核苷酸序列包含对应所述N个单体混合物的至少N个活性测试点;ⅳ)对所述合成的寡核苷酸链进行测序;ⅴ)基于测序结果确定内标品与各个待测品的相对反应活性比。
Description
相关申请的交叉引用
本申请要求2021年1月29日提交的申请号为202110125872.0的中国专利申请的优先权,其全部内容通过引入并入本文。
本说明书涉及寡核苷酸的化学合成领域,特别涉及测定三联核苷亚磷酰胺相对反应活性的方法及寡核苷酸合成反应的设计方法。
近年来,分子和亚分子水平的蛋白质研究得到了极大的发展,其中组合基因合成在限制结构变异中起着重要的作用。寡核苷酸定向诱变是制备目的多肽或蛋白质变体的最常用方法。混合组成的寡核苷酸越来越多被用来生成用于研究生物分子功能的变体文库,以及用于寻找具有改进特性的肽和蛋白质,在诸多的文库制备方法中,通常使用兼并的寡核苷酸或寡核苷酸文库,但这种方法无法避免不需要的氨基酸以及终止密码子的掺入,也不能在预定的位置构建所需的密码子子集。使用预先形成的20个代表规范氨基酸密码子的三联核苷亚磷酰胺的混合物的方法,可以在特定基因的任意密码子位置上进行任意数量的密码子变异,从而获得高质量的突变文库。因此,对该三联核苷亚磷酰胺的需求快速增长。
在采用固相合成法合成寡核苷酸链时,不同的三联核苷亚磷酰胺显示出不同的偶联效率,为使文库中的密码子分布均匀或调整突变率,必须考虑三联核苷亚磷酰胺不同的反应活性来制备三核苷酸混合物。因此,有必要提出一种简单、快速、低成本的测定三联核苷亚磷酰胺相对反应活性的方法。
发明内容
本说明书实施例之一提供一种测定三联核苷亚磷酰胺相对反应活性的方法,所述方法包括:
ⅰ)选定N+1个不同的三联核苷亚磷酰胺中的任意1个作为内标品,其余N个三联核苷亚磷酰胺作为待测品,其中N为整数且N≥1;
ⅱ)制备N个单体混合物,其中,每个所述单体混合物包括所述内标品与一个所述待测品,每个所述单体混合物中所述内标品与其所述待测品的摩尔比相同,且各个所述单体混合物中的所述待测品都互不相同;
ⅲ)基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成,获得合成的寡核苷酸链,其中,通过设置所述N个单体混合物的掺入位点,使得所述一个或多个寡核苷酸序列包括至少N个活性测试点,每个所述单体混合物具有对应的至少一个活性测试点;
ⅳ)对所述合成的寡核苷酸链进行测序,及
ⅴ)基于测序结果确定内标品与各个待测品的相对反应活性比。
在一些实施例中,所述寡核苷酸序列具有测试区和非测试区,所述至少N个活性测试点分布于所述一个或多个寡核苷酸序列的测试区,且任意两个相邻的活性测试点之间独立地存在或不存在包含至少一个核苷酸的间隔序列。
在一些实施例中,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物任意地掺入所述一个或多个寡核苷酸序列的测试区所反应形成;或,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与一个相同碱基的核苷酸偶联所反应形成。
在一些实施例中,所述一个或多个寡核苷酸序列包括2N个活性测试点,所述2N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与2个不同碱基的核苷酸偶联所反应形成。
在一些实施例中,所述一个或多个寡核苷酸序列包括3N个活性测试点,所述3N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与3个不同碱基的核苷酸偶联所反应形成。
在一些实施例中,所述一个或多个寡核苷酸序列包括4N个活性测试点,所述4N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与4个不同碱基的核苷酸偶联所反应形成。
在一些实施例中,所述N+1个三联核苷亚磷酰胺中的任意一个三联核苷亚磷酰胺均对应一个编码氨基酸的密码子,所述N+1个三联核苷亚磷酰胺中的任意2个三联核苷亚磷酰胺所对应的密码子均编码不同的氨基酸。
在一些实施例中,所述N为18以内的任意正整数。
在一些实施例中,所述N为19。
在一些实施例中,选定的内标品为AAC亚磷酰胺。
在一些实施例中,所述基于测序结果确定内标品与各个待测品的相对反应活性比包括:统计测序结果中所述至少N个活性测试点分别对应的内标品读数与待测品读数,每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比。
在一些实施例中,所述方法还包括:ⅵ)基于相对反应活性比确定各个待测品的相对反应活性系数。
在一些实施例中,各个单体混合物中的内标品与待测品的摩尔比均为1:1。
在一些实施例中,所述对合成的寡核苷酸链进行测序包括:使用下一代测序技术进行合成的寡核苷酸链测序。
在一些实施例中,所述基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成包括:在DNA合成仪中使用固相合成法进行寡核苷酸链合成。
在一些实施例中,上述方法测定的三联核苷亚磷酰胺相对反应活性在构建基因文库中的应用。在一个具体实施方案中,上述方法测定的三联核苷亚磷酰胺相对反应活性在构建基因突变文库中的应用。利用上述方法测定的三联核苷亚磷酰胺相对反应活性来合成含有特定位点突变的核酸序列,突变位点可以是核酸序列中任意分布的20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的一种或多种。具体地,利用三联核苷亚磷酰胺相对反应活性来确定三联核苷亚磷酰胺相对反应活性系数,进一步确认各位点和/或突变位点处对应三联核苷亚磷酰胺加入量的比例,按照该比例将多种三联核苷亚磷酰胺作为合成原料,合成至核酸序列中预定位置,即可得到符合预定核酸序列的高质量DNA文库,如引物库、突变文库和基因元件组合文库等。
本说明书实施例之一提供一种寡核苷酸合成反应的设计方法,所述方法包括:
ⅰ)选定N+1个不同的三联核苷亚磷酰胺中的任意1个作为内标品,其余N个三联核苷亚磷酰胺作为待测品,其中N为整数且N≥1;
ii)确定内标品与各个待测品的相对反应活性比;及
iii)根据内标品与各个待测品的相对反应活性比确定合成寡核苷酸反应中所用三联核苷亚磷酰胺的比例。
在一些实施例中,所述确定内标品与各个待测品的相对反应活性比包括:
制备N个单体混合物,其中,每个所述单体混合物包括所述内标品与一个所述待测品,每个所述单体混合物中所述内标品与其所述待测品的摩尔比相同,且各个所述单体混合物中的所述待测品都互不相同;
基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成,获得合成的寡核苷酸链,其中,通过设置所述N个单体混合物的掺入位点,使得所述一个或多个寡核苷酸序列包括至少N个活性测试点,每个所述单体混合物具有对应的至少一个活性测试点;
对所述合成的寡核苷酸链进行测序,及
基于测序结果确定内标品与各个待测品的相对反应活性比。
在一些实施例中,选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余的AAA亚磷酰胺、ACT亚磷酰胺、ATC亚磷酰胺、ATG亚磷酰胺、CAG亚磷酰胺、CAT亚磷酰胺、CCG亚磷酰胺、CGT亚磷酰胺、CTG亚磷酰胺、GAA亚磷酰胺、GAC亚磷酰胺、GCT亚磷酰胺、GGT亚磷酰胺、GTT亚磷酰胺、TAC亚磷酰胺、TCT亚磷酰胺、TGC亚磷酰胺、TGG亚磷酰胺和TTC亚磷酰胺为待测品。
本说明书实施例之一提供一种寡核苷酸合成反应的设计方法,所述方法包括:选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余19个为待测品,确定如表所示的基于内标品与各个待测品的相对反应活性比所计算的各待测品的相对反应活性系数,根据所述相对反应活性系数确定合成寡核苷酸反应中所用三联核苷亚磷酰胺的比例。
本说明书实施例之一提供了三联核苷亚磷酰胺的相对反应活性系数,选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余19个为待测品,确定如下表所示的基于内标品与各个待测品的相对反应活性比所计算的各待测品的相对反应活性系数。
本说明的实施例之一还提供了上述三联核苷亚磷酰胺相对反应活性系数在构建基因文库中的应用。利用三联核苷亚磷酰胺相对其反应活性系数确定各位点和/或突变位点处对应三联核苷亚磷酰胺加入量的比例,按照该比例将多种三联核苷亚磷酰胺作为合成原料,合成至核酸序列中预定位置,即可得到符合预定核酸序列的高质量DNA文库,如引物库、突变文库和基因元件组合文库等。
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的基于寡核苷酸序列Seq1合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图2是根据本说明书一些实施例所示的基于寡核苷酸序列Seq2合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图3是根据本说明书一些实施例所示的基于寡核苷酸序列Seq3合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图4是根据本说明书一些实施例所示的基于寡核苷酸序列Seq4合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图5是根据本说明书一些实施例所示的基于寡核苷酸序列Seq5合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图6是根据本说明书一些实施例所示的基于寡核苷酸序列Seq6合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图7是根据本说明书一些实施例所示的基于寡核苷酸序列Seq7合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图8是根据本说明书一些实施例所示的基于寡核苷酸序列Seq8合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图9是根据本说明书一些实施例所示的基于寡核苷酸序列Seq9合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图10是根据本说明书一些实施例所示的基于寡核苷酸序列Seq10合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图11是根据本说明书一些实施例所示的基于寡核苷酸序列Seq11合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图12是根据本说明书一些实施例所示的基于寡核苷酸序列Seq12合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图13是根据本说明书一些实施例所示的基于寡核苷酸序列Seq13合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图14是根据本说明书一些实施例所示的基于寡核苷酸序列Seq14合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图15是根据本说明书一些实施例所示的基于寡核苷酸序列Seq15合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图16是根据本说明书一些实施例所示的基于寡核苷酸序列Seq16合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图17是根据本说明书一些实施例所示的基于寡核苷酸序列Seq17合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图18是根据本说明书一些实施例所示的基于寡核苷酸序列Seq18合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图19是根据本说明书一些实施例所示的基于寡核苷酸序列Seq19合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图20是根据本说明书一些实施例所示的基于寡核苷酸序列Seq20合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱;
图21是根据本说明书一些实施例所示的基于寡核苷酸序列Seq21合成的寡核苷酸粗品经分离纯化得到的寡核苷酸纯品的HPLC分析图谱。
为了更清楚地说明本申请实施例的技术方案,下面将对本说明书中一个或一些实施例作简单的介绍。显而易见地,下面描述的仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些实施例将本申请应用于其它类似情景。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
以下是对本申请中一些术语的定义。
术语“核苷亚磷酰胺”指通过化学修饰核苷酸得到的亚磷酰胺,是寡聚核苷酸固相合成的原料,可以包括单核苷亚磷酰胺、双核苷亚磷酰胺和三联核苷亚磷酰胺等。
术语“规范氨基酸密码子”指为便于工业应用,在64个密码子中选定的可编码氨基酸的20个密码子。选定的20个规范氨基酸密码子中,各个规范氨基酸密码子所编码的氨基酸互不相同。20个规范氨基酸密码子分别为AAA、AAC、ACU、AUC、AUG、CAG、CAU、CCG、CGU、CUG、GAA、GAC、GCU、GGU、GUU、UAC、UCU、UGC、UGG和UUC。
术语“聚合酶链式反应(PCR)”指一项利用DNA双链复制的原理,在生物体外复制特定DNA片段的核酸合成技术。透过这项技术,可在短时间内大量扩增目的基因。
术语“基因突变文库”是指针对一条或多条蛋白的核酸编码序列,通过突变将其中的一个或多个氨基酸位点突变成另外的19/20种氨基酸,以此对应的多种核酸序列形成的文库。
术语“基因元件组合文库”是指可准确、高效地将各种预定义的基因元件(DNA序列)组装和克隆到需要选择的载体中,以生成以特定排列方式组装的克隆构建体文库。这些预定义的基因元件(DNA序列)可能是启动子、增强子/阻遏物、特异性结合位点、定位信号、基因、终止子等。
在构建DNA文库时,利用三联核苷亚磷酰胺获得高质量文库的做法已得到广泛应用。通过使用预制备的20个代表规范氨基酸密码子的三联核苷亚磷酰胺的混合物的方法,可合成在任意密码子位置上进行任意数量的密码子变异的核苷酸序列。三联核苷亚磷酰胺合成寡核苷酸链的基本步骤包括:1)脱保护基:用三氯乙酸脱去连结在固相载体上的核苷酸的保护基团二甲氧基三苯甲基,获得游离的5’-羟基端,以供下一步缩合反应;2)活化:将三联核苷亚磷酰胺与四氮唑活化剂混合并进入固相载体,形成亚磷酰胺四唑活性中间体(其3’-端已被活化,但5’-端仍受保护基团二甲氧基三苯甲基保护),此中间体将与固相载体上的已脱保护基的核苷酸发生缩合反应;3)连接:亚磷酰胺四唑活性中间体遇到固相载体上已脱保护基团的核苷酸时,该磷酰胺四唑活性中间体3’端的亚磷酸基团与固相载体上已脱保护基团的核苷酸5’-羟基发生亲合反应,缩合并脱去四唑,此时合成的寡核苷酸链向前延长三个核苷酸;4)封闭:缩合反应后为了防止连在固相载体上的未参与反应的已脱保护基团的核苷酸5’-羟基在随后的循环反应中被延伸,常用乙酰化来封闭未参与反应的5’-羟基端;5)氧化:缩合反应时三联核苷酸单体是通过亚磷酯键与连在固相载体上的寡核苷酸连接的,常用碘的四氢呋喃溶液将亚磷酸三酯转化为磷酸三酯,得到稳定的寡核苷酸链。上述步骤使一个三联核苷酸被连到固相载体的核苷酸5’端上,循环上述步骤可得到目的寡核苷酸链。合成结束后可进行寡核苷酸链的切割及脱碱基保护基团操作,再经过分离纯化得到合成的寡核苷酸链。可以明确的是,在寡核苷酸链合成的过程中,不同三联核苷亚磷酰胺与脱保护基的核苷酸5’-羟基的偶联效率不同。在利用三联核苷亚磷酰胺构建文库过程中,需测定不同三联核苷亚磷酰胺的反应活性,以提高文库质量。
本说明书提供一种测定三联核苷亚磷酰胺相对反应活性的方法,该方法可在需要使用的数种三联亚磷酰胺中选定一个作为内标品,除内标品以外的三联亚磷酰胺作为待测品,内标品为待测品对比反应活性的参照。待测品分别单独与内标品以相同比例混合形成单体混合物,使用单体混合物合成包括预定活性测试点的寡核苷酸链,通过内标品与待测品在寡核苷酸链中各活性测试点的含量测定及对比进行待测品反应活性的相对定量的表征。通过内标品与待测品在寡核苷酸链中各活性测试点的含量测定及对比进行待测品反应活性的相对定量的表征。更进一步的,活性测试点可设置为反映内标品及待测品在相 同合成条件下与不同碱基的核苷酸的偶联效率,即反映内标品及待测品3’端与不同核苷酸(腺嘌呤脱氧核苷酸;鸟嘌呤脱氧核苷酸;胞嘧啶脱氧核苷酸;胸腺嘧啶脱氧核苷酸)5’端羟基亲和反应的反应活性,使相对反应活性的表征更为准确。上述测定三联核苷亚磷酰胺相对反应活性的方法可应用的方面包括但不限于构建DNA文库、多肽文库、抗体文库和蛋白质文库。
应当理解的是,本申请的测定三联核苷亚磷酰胺相对反应活性的方法的应用场景仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。
本发明提供了测定三联核苷亚磷酰胺相对反应活性的方法,该方法至少包括以下步骤:
步骤ⅰ,选定待测品及内标品。
在一些实施例中,选定待测品及内标品包括:在待测定的N+1个三联核苷亚磷酰胺中选定任意一个三联核苷亚磷酰胺作为内标品,其余N个三联核苷亚磷酰胺作为待测品,N≥1。在一些实施例中,N+1个三联核苷亚磷酰胺可以是64个代表密码子的三联核苷亚磷酰胺中的至少2个三联核苷亚磷酰胺。具体的,内标品可以是待测品相对反应活性的参考,可用于反映待测品的相对反应活性高于、或等于、或低于内标品的相对反应活性,内标品可以是待测定的三联核苷亚磷酰胺中的任意一个,且作为参照,内标品的相对反应活性比及相对反应活性系数可标记为1。
在一些实施例中,所述N+1个三联核苷亚磷酰胺中的任意一个三联核苷亚磷酰胺均对应一个编码氨基酸的密码子,所述N+1个三联核苷亚磷酰胺中的任意两个三联核苷亚磷酰胺所对应的密码子均编码不同的氨基酸。在一些实施例中,进一步的,N+1个三联核苷亚磷酰胺可以为20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的至少2个三联核苷亚磷酰胺。具体的,20个代表规范氨基酸密码子的三联核苷亚磷酰胺的序列组成及氨基酸对应关系见表1。
表1.三联核苷亚磷酰胺与氨基酸的对映关系表
在一些实施例中,待测品的数量N可以为18以内的任意正整数。例如,待测品的数量N可以为18,且N+1个三联核苷亚磷酰胺可以为20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的任意19个;其中,内标品可以为19个三联核苷亚磷酰胺中的任意一个,其余18个三联核苷亚磷酰胺为待测品。例如,待测品的数量N可以为2,且N+1个三联核苷亚磷酰胺可以为20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的任意3个;其中,内标品可以为3个三联核苷亚磷酰胺中的任意一个,其余2个三联核苷亚磷酰胺为待测品。例如,待测品的数量N可以为1,且N+1个三联核苷亚磷酰胺可以为20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的任意2个;其中,内标品可以为2个三联核苷亚磷酰胺中的任意一个,其余的一个三联核苷亚磷酰胺为待测品。
在一些实施例中,待测品的数量N可以为19。具体的,N可以为19,且N+1个三联核苷亚磷酰胺可以为20个代表规范氨基酸密码子的三联核苷亚磷酰胺;其中,内标品可以为AAA亚磷酰胺、或AAC亚磷酰胺、或ACT亚磷酰胺、或ATC亚磷酰胺、或ATG亚磷酰胺、或CAG亚磷酰胺、或CAT亚磷酰胺、或CCG亚磷酰胺、或CGT亚磷酰胺、或CTG亚磷酰胺、或GAA亚磷酰胺、或GAC亚磷酰胺、或GCT亚磷酰胺、或GGT亚磷酰胺、或GTT亚磷酰胺、或TAC亚磷酰胺、或TCT亚磷酰胺、或TGC亚磷酰胺、或TGG亚磷酰胺、或TTC亚磷酰胺,待测品可为除内标品以外的19个三联核苷亚磷酰胺。
在一些实施例中,进一步的,选定的内标品为AAC亚磷酰胺。例如,选定的内标品为AAC亚磷酰胺,待测品的数量N可以为1或2或3或4或5或6或7或8或9或10或11或12或13或14或15或16或17或18或19,且作为待测品的N个不同的三联核苷亚磷酰胺可以选自20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的除AAC亚磷酰胺以外的任意N个三联核苷亚磷酰胺。
步骤ⅱ,制备单体混合物。
单体混合物为内标品与单个待测品的混合物,单体混合物可作为合成寡核苷酸链的反应物。
在一些实施例中,制备单体混合物包括制备N个单体混合物,每个单体混合物为内标品与一个待测品的混合物,各个单体混合物中的待测品互不相同。在一些实施例中,各个单体混合物中的内标品与待测品的摩尔比均相同。例如,各个单体混合物中的内标品与待测品的摩尔比可以为1:4、或3:7、或2:3、或1:1、或3:2、或7:3、或4:1。在一些实施例中,为便于统计分析,各个混合反应中的内标品与待测品的摩尔比均为1:1。
步骤ⅲ,利用单体混合物合成寡核苷酸链。
利用单体混合物作为原料合成寡核苷酸链,合成的寡核苷酸链中,部分寡核苷酸链的一个单体混合物掺入位点可掺入内标品,其余寡核苷酸链的对应单体混合物掺入位点可掺入待测品。以内标品作为参照,可反映待测品在相同合成条件下的相对偶联效率。
在一些实施例中,利用单体混合物合成寡核苷酸链包括:基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成,获得合成的寡核苷酸链,其中,通过设置所述N个单体混合物的掺入位点,使得所述一个或多个寡核苷酸序列包括至少N个活性测试点,每个所述单体混合物具有对应的至少一个活性测试点。具体的,一个或多个寡核苷酸序列可设置N或2N或3N或4N个掺入位点,每个单体混合物可分别对应1或2或3或4个掺入位点,使得所述一个或多个寡核苷酸序列可分别对应地包括N或2N或3N或4N个活性测试点;其中,活性测试点可以为考察单体混合物偶联特定碱基的核苷酸的特定偶联活性测试点,活性测试点也可以为不考察单体混合物偶联特定碱基的核苷酸的非特定偶联活性测试点。
在一些实施例中,所述寡核苷酸序列可具有测试区和非测试区。具体的,若基于预设的一个寡核苷酸序列信息合成寡核苷酸链,则所述至少N个活性测试点分布于一个寡核苷酸序列的测试区;若基于预设的至少2个寡核苷酸序列信息合成寡核苷酸链,则每个寡核苷酸序列的测试区分布有所述至少N个活性测试点中的部分活性测试点;当寡核苷酸序列的数量大于1时,每个寡核苷酸序列的非测试区均相同,即每个寡核苷酸序列的非测试区的核苷酸排列顺序均相同;在一些实施例中,同一寡核苷酸序列中,测试区可位于两个非测试区之间,且两个非测试区分别设置有用于PCR扩增的引物结合位点。具体的,在对合成的寡核苷酸链进行PCR扩增、测序时,用于PCR扩增的正向引物可结合两个测试区中的一个测试区的引物结合位点,反向引物可结合另一个测试区的引物结合位点。
在一些实施例中,进一步的,所述至少N个活性测试点分布于所述一个或多个寡核苷酸序列的测试区;任意两个相邻的活性测试点之间独立地存在或不存在包含至少一个核苷酸的间隔序列。具体的,同一寡核苷酸序列的测试区内的多个活性测试点可按任意顺序排列;对于同一寡核苷酸序列中的活性测试点而言,不同的相邻活性测试点之间可独立地存在或不存在包含至少一个核苷酸的间隔序列;对于不同寡核苷酸序列中的活性测试点而言,不同的相邻活性测试点之间可独立地存在或不存在包含至少一个核苷酸的间隔序列。
在一些实施例中,所述寡核苷酸序列包含测试区和非测试区,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物任意地掺入所述一个或多个寡核苷酸序列的测试区所反应形成。具体的,N个活性测试点属于非特定偶联活性测试点。在一些实施例中,进一步的,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物任意地掺入所述一个或多个寡核苷酸序列的测试区所反应形成;对N个单体混合物编号从1至N,所述一个或多个寡核苷酸序列中的每一个寡核苷酸序列均可具有以下结构:
5’-L
1-M[X
i]-L
2-3’。
其中,L1和L2分别独立地为包含至少15个核苷酸的序列,L1和L2代表寡核苷酸序列的非测试区,L1至L2之间的序列代表寡核苷酸序列的测试区;
M为测试区内含Xi的序列单元的个数,M为整数且1≤M≤N,相邻序列单元之间独立地存在或不存在包含至少一个核苷酸的间隔序列;
Xi为掺入位点对应的单体混合物,i表示单体混合物的编号,i=1,2,……,N。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的一个寡核苷酸序列信息合成寡核苷酸链,该寡核苷酸序列设置有4个单体混合物的掺入位点,使得该寡核苷酸序列包括4个活性测试点,4个活性测试点属于非特定偶联活性测试点,该寡核苷酸序列可为:
5’-L
1-X
1ATX
2X
3CX
4-L
2-3’。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的2个寡核苷酸序列信息合成寡核苷酸链,2个寡核苷酸序列设置有4个单体混合物的掺入位点,使得2个寡核苷酸序列包括4个活性测试点,4个活性测试点属于非特定偶联活性测试点,2个寡核苷酸序列可分别为:
1)5’-L
1-X
1X
3-L
2-3’;
2)5’-L
1-X
2X
4-L
2-3’。
在一些实施例中,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与一个相同碱基的核苷酸偶联所反应形成。具体的,N个活性测试点属于特定偶联活性测试点。例如,N个活性测试点由N个单体混合物中的每一个单体混合物与腺嘌呤脱氧核苷酸偶联所形成,或N个活性测试点由N个单体混合物中的每一个单体混合物与鸟嘌呤脱氧核苷酸偶联所形成,或N个活性测试点由N个单体混合物中的每一个单体混合物与胞嘧啶脱氧核苷酸偶联所形成,或N个活性测试点由N个单体混合物中的每一个单体混合物与胸腺嘧啶脱氧核苷酸偶联所形成。在一些实施例中,进一步的,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与一个偶联测试核苷酸所反应形成;偶联测试核苷酸可以为4个不同碱基的核苷酸中的任意一个,对N个单体混合物编号从1至N,所述一个或多个寡核苷酸序列中的每一个寡核苷酸序列均可具有以下结构:
5’-L
1-M[X
iY]-L
2-3’。
其中,L1和L2分别独立地为包含至少15个核苷酸的序列,L1和L2代表寡核苷酸序列的非测试区,L1至L2之间的序列代表寡核苷酸序列的测试区;
M为测试区内含Xi和Y的序列单元的个数,M为整数且1≤M≤N,相邻序列单元之间存在或不存在包含至少一个核苷酸的间隔序列;
Xi为掺入位点对应的单体混合物,i表示单体混合物的编号,i=1,2,……,N;
Y为偶联测试核苷酸,Y为4个不同碱基的核苷酸中的任意一个。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的一个寡核苷酸序列信息合成寡核苷酸链,该寡核苷酸序列设置有4个单体混合物的掺入位点,使得该寡核苷酸序列包括4个活性测试点,4个活性测试点属于特定偶联活性测试点,每个活性测试点由4个单体混合物分别与胸腺嘧啶脱氧核苷酸偶联所形成;该寡核苷酸序列可为:
5’-L
1-X
1TX
2TX
3TX
4T-L
2-3’。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的2个寡核苷酸序列信息合成寡核苷酸链,2个寡核苷酸序列设置有4个单体混合物的掺入位点,使得2个寡核苷酸序列包括4个活性测试点,4个活性测试点属于特定偶联活性测试点,每个活性测试点由4个单体混合物分别鸟嘌呤脱氧核苷酸偶联所形成;2个寡核苷酸序列可分别为:
1)5’-L
1-X
1GX
3GTAX
4G-L
2-3’;
2)5’-L
1-X
2G-L
2-3’。
在一些实施例中,所述一个或多个寡核苷酸序列包括2N个活性测试点,所述2N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与2个不同碱基的核苷酸偶联所反应形成。具体的,2N个活性测试点属于特定偶联活性测试点,2个不同碱基的核苷酸可选自4个不同碱基的核苷酸中的任意2个。在一些实施例中,进一步的,所述一个或多个寡核苷酸序列包括2N个活性测试点,2N个活性测试点由N个单体混合物中的每一个单体混合物分别与2个不同碱基的偶联测试核苷酸偶联所反应形成;2个不同碱基的偶联测试核苷酸可以为4个不同碱基的核苷酸中的任意2个,对2个偶联测试核苷酸 编号从1至2,对N个单体混合物编号从1至N;所述一个或多个寡核苷酸序列中的每一个寡核苷酸序列均可具有以下结构:
5’-L
1-M[X
iY
j]-L
2-3’。
其中,L1和L2分别独立地为包含至少15个核苷酸的序列,L1和L2代表寡核苷酸序列的非测试区,L1至L2之间的序列代表寡核苷酸序列的测试区;
M为测试区内含Xi和Yj的序列单元的个数,M为整数且1≤M≤2N,,相邻序列单元之间存在或不存在包含至少一个核苷酸的间隔序列;
Xi为掺入位点对应的单体混合物,i表示单体混合物的编号,且i=1,2,……,N;
Yj为偶联测试核苷酸,j表示偶联测试核苷酸的编号,且j=1,2。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的一个寡核苷酸序列信息合成寡核苷酸链,该寡核苷酸序列设置有8个掺入位点,每个单体混合物具有对应的2个掺入位点,使得该寡核苷酸序列包括8个活性测试点,8个活性测试点属于特定偶联活性测试点,8个活性测试点由4个单体混合物分别与腺嘌呤脱氧核苷酸、胸腺嘧啶脱氧核苷酸偶联所形成;该寡核苷酸序列可为:
5’-L
1-X
1TCCX
1AX
2TAAX
2AX
3TGGX
3AX
4TTTX
4A-L
2-3’。
例如选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的4个寡核苷酸序列信息合成寡核苷酸链,4个寡核苷酸序列设置有8个掺入位点,每个单体混合物具有对应的2个掺入位点,使得4个寡核苷酸序列包括8个活性测试点,8个活性测试点属于特定偶联活性测试点,8个活性测试点由4个单体混合物分别与鸟嘌呤脱氧核苷酸、胞嘧啶脱氧核苷酸偶联所形成;4个寡核苷酸序列可分别为:
1)5’-L
1-X
1GX
2G-L
2-3’;
2)5’-L
1-X
3GX
4G-L
2-3’;
3)5’-L
1-X
1CX
2C-L
2-3’;
4)5’-L
1-X
3CX
4C-L
2-3’。
在一些实施例中,所述一个或多个寡核苷酸序列包括3N个活性测试点,所述3N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与3个不同碱基的核苷酸偶联所反应形成。具体的,3N个活性测试点属于特定偶联活性测试点,3个不同碱基的核苷酸可选自4个不同碱基的核苷酸中的任意3个。在一些实施例中,进一步的,所述一个或多个寡核苷酸序列包括3N个活性测试点,3N个活性测试点由N个单体混合物中的每一个单体混合物分别与3个不同碱基的偶联测试核苷酸偶联所反应形成;3个不同碱基的偶联测试核苷酸可以为4个不同碱基的核苷酸中的任意3个;对3个偶联测试核苷酸编号从1至3,对N个单体混合物编号从1至N,所述一个或多个寡核苷酸序列中的每一个寡核苷酸序列均可具有以下结构:
5’-L
1-M[X
iY
j]-L
2-3’。
其中,L1和L2分别独立地为包含至少15个核苷酸的序列,L1和L2代表寡核苷酸序列的非测试区,L1至L2之间的序列代表寡核苷酸序列的测试区;
M为测试区内含Xi和Yj的序列单元的个数,M为整数且1≤M≤3N,相邻序列单元之间存在或不存在包含至少一个核苷酸的间隔序列;
Xi为掺入位点对应的单体混合物,i表示单体混合物的编号,且i=1,2,……,N;
Yj为偶联测试核苷酸,j表示偶联测试核苷酸的编号,且j=1,2,3。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的一个寡核苷酸序列信息合成寡核苷酸链,该寡核苷酸序列设置有12个掺入位点,每个单体混合物具有对应的3个掺入位点,使得该寡核苷酸序列包括12个活性测试点,12个活性测试点属于特定偶联活性测试点,12个活性测试点由4个单体混合物分别与腺嘌呤脱氧核苷酸、鸟嘌呤脱氧核苷酸和胸腺嘧啶脱氧核苷酸偶联所形成;该寡核苷酸序列可为:
5’-L
1-X
1TX
2TX
3TX
4TX
1GX
2GX
3GX
4GX
1AX
2AX
3AX
4A-L
2-3’。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的3个寡核苷酸序列信息合成寡核苷酸链,3个寡核苷酸序列设置有12个掺入位点,每个单体混合物具有对应的3个掺入位点,使得3个寡核苷酸序列包括12个活性测试点,12个活性测试点属于特定偶联活性测试点,12个活性测试点由4个单体混合物分别与鸟嘌呤脱氧核苷酸、胞嘧啶脱氧核苷酸和胸腺嘧啶脱氧核苷酸偶联所形成;3个寡核苷酸序列可分别为:
1)5’-L
1-X
1CX
2CTX
3CX
4CA-L
2-3’;
2)5’-L
1-X
1GTTX
2GCCX
3GX
4G-L
2-3’;
3)5’-L
1-X
1TX
2TX
3TTGCX
4T-L
2-3’。
在一些实施例中,所述一个或多个寡核苷酸序列包括4N个活性测试点,所述4N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与4个不同碱基的核苷酸偶联所反应形成。具体的,
4N个活性测试点属于特定偶联活性测试点。在一些实施例中,进一步的,所述一个或多个寡核苷酸序列包括4N个活性测试点,4N个活性测试点由N个单体混合物中的每一个单体混合物分别与4个不同碱基的偶联测试核苷酸偶联所反应形成;对4个偶联测试核苷酸编号从1至4,对N个单体混合物编号从1至N;所述一个或多个寡核苷酸序列中的每一个寡核苷酸序列均可具有以下结构:
5’-L
1-M[X
iY
j]-L
2-3’。
其中,L1和L2分别独立地为包含至少15个核苷酸的序列,L1和L2代表寡核苷酸序列的非测试区,L1至L2之间的序列代表寡核苷酸序列的测试区;
M为测试区内含Xi和Yj的序列单元的个数,M为整数且1≤M≤4N,相邻序列单元之间存在或不存在包含至少一个核苷酸的间隔序列;
Xi为掺入位点对应的单体混合物,i表示单体混合物的编号,且i=1,2,……,N;
Yj为偶联测试核苷酸,j表示偶联测试核苷酸的编号,且j=1,2,3,4。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的2个寡核苷酸序列信息合成寡核苷酸链,2个寡核苷酸序列设置有16个掺入位点,每个单体混合物具有对应的4个掺入位点,使得2个寡核苷酸序列包括16个活性测试点,16个活性测试点属于特定偶联活性测试点,16个活性测试点由4个单体混合物分别与腺嘌呤脱氧核苷酸、鸟嘌呤脱氧核苷酸、胞嘧啶脱氧核苷酸和胸腺嘧啶脱氧核苷酸偶联所形成;2个寡核苷酸序列可分别为:
1)5’-L
1-X
1TX
2TX
1GX
2GX
3AX
4AX
3CX
4C-L
2-3’;
2)5’-L
1-X
3TX
4TX
3GX
4GX
1AX
2AX
1CX
2C-L
2-3’。
例如,选定5个三联核苷亚磷酰胺中的一个为内标品,其余4个为待测品,制备4个单体混合物X
1、X
2、X
3和X
4,可基于预设的8个寡核苷酸序列信息合成寡核苷酸链,8个寡核苷酸序列设置有16个掺入位点,每个单体混合物具有对应的4个掺入位点,使得8个寡核苷酸序列包括16个活性测试点,16个活性测试点属于特定偶联活性测试点,16个活性测试点由4个单体混合物分别与腺嘌呤脱氧核苷酸、鸟嘌呤脱氧核苷酸、胞嘧啶脱氧核苷酸和胸腺嘧啶脱氧核苷酸偶联所形成;8个寡核苷酸序列可分别为:
1)5’-L
1-X
1TCX
1AG-L
2-3’;
2)5’-L
1-X
1CAX
1GT-L
2-3’;
3)5’-L
1-X
2TCX
2AG-L
2-3’;
4)5’-L
1-X
2CAX
2GT-L
2-3’;
5)5’-L
1-X
3TCX
3AG-L
2-3’;
6)5’-L
1-X
3CAX
3GT-L
2-3’;
7)5’-L
1-X
4TCX
4AG-L
2-3’;
8)5’-L
1-X
4CAX
4GT-L
2-3’。
在一些实施例中,进一步的,所述L1包含PCR扩增的正向引物的结合位点,所述L2包含PCR扩增的反向引物的结合位点。具体的,L1和L2可分别结合PCR扩增的正向引物和反向引物,便于后续测序时进行PCR扩增。在一些实施例中,L1的序列可以为SEQ ID NO:1。在一些实施例中,L2的序列可以为SEQ ID NO:2。
在一些实施例中,利用单体混合物合成寡核苷酸链进一步包括:通过固相合成的方法合成寡核苷酸链。优选的,在一些实施例中,利用单体混合物合成寡核苷酸链进一步包括:在DNA合成仪中利用固相合成的方法合成寡核苷酸链。
在一些实施例中,利用单体混合物合成寡核苷酸链进一步包括:寡核苷酸链合成后获得寡核苷酸粗品,对寡核苷酸粗品进行分离纯化,获得合成的寡核苷酸链。具体的,对寡核苷酸粗品进行分离纯化,可使合成的失败序列与合成的寡核苷酸链分离,获得纯度较高的合成的寡核苷酸链,即寡核苷酸纯品。在一些实施例中,采用以下处理方式中的一种对寡核苷酸粗品进行分离纯化:OPC纯化法(Oligonucleotide Purification Cartridge,OPC)、聚丙烯酰胺凝胶电泳法(Polyacylamide Gel Electrophoresis,PAGE)、脱盐纯化法或高效液相色谱分析法(High Performance Liquid Chromatography,HPLC)。上述分离纯化处理方式可使合成的失败序列与合成的寡核苷酸链分离,获得寡核苷酸纯品,减少测序统计的工作量。
步骤ⅳ,寡核苷酸链测序。
在一些实施例中,寡核苷酸链测序包括:对步骤ⅲ合成的寡核苷酸链进行测序。在一些实施例中,为提升测序速度,降低测序难度,寡核苷酸链测序进一步包括使用下一代测序技术(Next Generation Sequencing,NGS)对步骤ⅲ合成的寡核苷酸链进行测序。例如,采用以下的测序平台中的一种对合成的寡核苷酸链进行测序:Illumina Hiseq测序平台、Illumina Miseq测序平台、Roche 454测序平台、Life Technologies的Ion Torrent测序平台。
步骤ⅴ,基于测序结果确定相对反应活性比。
在一些实施例中,基于测序结果确定相对反应活性比包括:统计测序结果中所述至少N个活性测试点分别对应的内标品读数与待测品读数,每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比。
例如,测序结果可为N个活性测试点分别对应的内标品读数与待测品读数,N个活性测试点属于非特定偶联活性测试点;每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比,该相对反应活性比反映在不考察偶联特定碱基的核苷酸的条件下,内标品与对应待测品的相对反应活性。
例如,测序结果可为N个活性测试点分别对应的内标品读数与待测品读数,N个活性测试点属于特定偶联活性测试点;每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比,该相对反应活性比反映在考察偶联特定碱基的核苷酸(4个不同碱基的核苷酸中的任意一个)的条件下,内标品与对应待测品的相对反应活性。每个待测品具有对应的一个相对反应活性比。
例如,测序结果可为N个活性测试点分别对应的内标品读数与待测品读数,N个活性测试点属于特定偶联活性测试点;每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比,该相对反应活性比反映在考察偶联特定碱基的核苷酸(4个不同碱基的核苷酸中的任意一个)的条件下,内标品与对应待测品的相对反应活性。每个待测品具有对应的一个相对反应活性比。
例如,测序结果可为2N个活性测试点分别对应的内标品读数与待测品读数,2N个活性测试点属于特定偶联活性测试点;每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比,该相对反应活性比反映在考察偶联特定碱基的核苷酸(4个不同碱基的核苷酸中的任意2个)的条件下,内标品与对应待测品的相对反应活性。每个待测品具有对应的2个相对反应活性比。
例如,测序结果可为3N个活性测试点分别对应的内标品读数与待测品读数,3N个活性测试点属于特定偶联活性测试点;每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比,该相对反应活性比反映在考察偶联特定碱基的核苷酸(4个不同碱基的核苷酸中的任意3个)的条件下,内标品与对应待测品的相对反应活性。每个待测品具有对应的3个相对反应活性比。
例如,测序结果可为4N个活性测试点分别对应的内标品读数与待测品读数,4N个活性测试点属于特定偶联活性测试点;每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比,该相对反应活性比反映在考察偶联特定碱基的核苷酸(4个不同碱基的核苷酸)的条件下,内标品与对应待测品的相对反应活性。每个待测品具有对应的4个相对反应活性比。
在一些实施例中,上述方法进一步包括:步骤ⅳ,基于相对反应活性比确定各个待测品的相对反应活性系数。在一些实施例中,一个或多个寡核苷酸序列包括的活性测试点为N个,则每个待测品的相对反应活性系数为内标品与对应待测品的相对反应活性比。在一些实施例中,一个或多个寡核苷酸序列包括的活性测试点为2N个,且2N个活性测试点属于特定偶联活性测试点,每个待测品具有对应的2个相对反应活性比,则每个待测品的相对反应活性系数为内标品与对应待测品的2个相对反应活性比的平均值。在一些实施例中,一个或多个寡核苷酸序列包括的活性测试点为3N个,且3N个活性测试点属于特定偶联活性测试点,每个待测品具有对应的3个相对反应活性比,则每个待测品的相对反应活性系数为内标品与对应待测品的3个相对反应活性比的平均值。在一些实施例中,一个或多个寡核苷酸序列包括的活性测试点为4N个,且4N个活性测试点属于特定偶联活性测试点,每个待测品具有对应的4个相对反应活性比,则每个待测品的相对反应活性系数为内标品与对应待测品的4个相对反应活性比的平均值。具体的,每个待测品具有对应的一个偶联腺嘌呤脱氧核苷酸测定的相对反应活性比,一个偶联鸟嘌呤脱氧核苷酸测定的相对反应活性比,一个偶联胞嘧啶脱氧核苷酸测定的相对反应活性比,及一个偶联胸腺嘧啶脱氧核苷酸测定的相对反应活性比,每个待测品的相对反应活性系数为对应的上述4个相对 反应活性比的平均值。使用相对反应活性比的平均值表征各三联核苷亚磷酰胺的相对反应活性具有更高的准确性及适用性。
根据本说明书实施例公开的一种寡核苷酸合成反应的设计方法,该设计方法包括:
ⅰ)选定N+1个不同的三联核苷亚磷酰胺中的任意1个作为内标品,其余N个三联核苷亚磷酰胺作为待测品,其中N为整数且N≥1;
ii)确定内标品与各个待测品的相对反应活性比;及
iii)根据内标品与各个待测品的相对反应活性比确定合成寡核苷酸反应中所用三联核苷亚磷酰胺的比例。
具体的,根据相对反应活性比确定三联核苷亚磷酰胺的比例,例如摩尔比,可调节各三联核苷酸在合成的寡核苷酸链中的分布情况,进一步的,在建立文库时可调整突变率。
在一些实施例中,确定内标品与各个待测品的相对反应活性比包括:
制备N个单体混合物,其中,每个所述单体混合物包括所述内标品与一个所述待测品,每个所述单体混合物中所述内标品与其所述待测品的摩尔比相同,且各个所述单体混合物中的所述待测品都互不相同;
基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成,获得合成的寡核苷酸链,其中,通过设置所述N个单体混合物的掺入位点,使得所述一个或多个寡核苷酸序列包括至少N个活性测试点,每个所述单体混合物具有对应的至少一个活性测试点;
对所述合成的寡核苷酸链进行测序,及
基于测序结果确定内标品与各个待测品的相对反应活性比。
具体的,关于确定内标品与各个待测品的相对反应活性比的详细内容,可以在本披露的其他部分中找到。
在一些实施例中,选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余的AAA亚磷酰胺、ACT亚磷酰胺、ATC亚磷酰胺、ATG亚磷酰胺、CAG亚磷酰胺、CAT亚磷酰胺、CCG亚磷酰胺、CGT亚磷酰胺、CTG亚磷酰胺、GAA亚磷酰胺、GAC亚磷酰胺、GCT亚磷酰胺、GGT亚磷酰胺、GTT亚磷酰胺、TAC亚磷酰胺、TCT亚磷酰胺、TGC亚磷酰胺、TGG亚磷酰胺和TTC亚磷酰胺为待测品。
根据本说明书实施例公开的一种寡核苷酸合成反应的设计方法,该设计方法包括:选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余19个为待测品,确定如下表所示的基于内标品与各个待测品的相对反应活性比所计算的各待测品的相对反应活性系数,根据所述相对反应活性系数确定合成寡核苷酸反应中所用三联核苷亚磷酰胺的比例。
具体的,每个待测品具有在偶联4个不同碱基的核苷酸条件下对应测定的4个相对反应活性比,各待测品的相对反应活性系数为4个相对反应活性比的平均值。关于确定内标品与各个待测品的相对反应活性比及相对反应活性系数的详细内容,可以在本披露的其他部分中找到。
下面结合附图和具体实施例对本发明作进一步说明,以便本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不对本发明构成限定。应当理解的是,对于本领域的技术人员来说,在了解本发明的原理后,可以在不背离该原理的情况下,进行各种形式和细节上的改变以实施本发明。
下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂公司购买得到的。
实施例1、选定内标品及待测品,制备混合单体
本实施例测定20个代表规范氨基酸密码子的三联核苷亚磷酰胺的相对反应活性。
1.1选定AAC亚磷酰胺作为其他19个三联核苷亚磷酰胺的内标品,其他19个三联核苷亚磷酰胺作为待测品。
1.2 19个待测品分别与内标品等比例混合形成19个单体混合物,每个单体混合物包含内标品和一个待测品。
实施例2、寡核苷酸链的合成
本实施例在自动化DNA合成仪上合成寡核苷酸链,合成方法为固相合成法。本实施例所使用的自动化DNA合成仪型号为Dr.Oligo48。
2.1将腺嘌呤核苷亚磷酰胺、鸟嘌呤核苷亚磷酰胺、胞嘧啶核苷亚磷酰胺、胸腺嘧啶核苷亚磷酰胺溶于乙腈,浓度为0.06M,分别置于自动化DNA合成仪的对应通道中;19个单体混合物分别溶于乙腈和二氯甲烷的混合溶液中(体积比=1:1),浓度为0.15M,分别置于自动化DNA合成仪的对应通道中。
2.2预设20个寡核苷酸序列的信息,预设的寡核苷酸序列信息和单体混合物信息具体见表2,将20个寡核苷酸序列的信息上载于自动化DNA合成仪中。
表2.预设的寡核苷酸序列信息和单体混合物信息表
其中:L1为:5’-CGGCAGCACATGTAGTGCAAGTCAAGGTT-3’(SEQ ID NO:1);L2为:5’-ACCACTACTACTACACGCCGCTCACTCAT-3’(SEQ ID NO:2)。
2.3基于预设的20个寡核苷酸序列的信息,采用固相合成法合成寡核苷酸链(Beaucage et al.,J.Tetrahedron Letters.22.20:1859-1862(1981)),获得20组寡核苷酸粗品;其中,单体混合物的偶联时间为300s×2次。
以基于寡核苷酸序列Seq5合成的一组寡核苷酸链为例进行说明,该组寡核苷酸链至少包含2
3种核苷酸排列顺序,该组寡核苷酸链具体的序列信息见表3。
表3.核苷酸序列信息表
编号 | 核苷酸排列顺序(5’-3’) |
1 | L1-CTGTTGGTGCTT-L2 |
2 | L1-CTGTAACTGCTT-L2 |
3 | L1-CTGTTGGTAACT-L2 |
4 | L1-AACTTGGTGCTT-L2 |
5 | L1-AACTAACTGCTT-L2 |
6 | L1-AACTTGGTAACT-L2 |
7 | L1-CTGTAACTAACT-L2 |
8 | L1-AACTAACTAACT-L2 |
其中:L1为:5’-CGGCAGCACATGTAGTGCAAGTCAAGGTT-3’(SEQ ID NO:1);L2为:5’-ACCACTACTACTACACGCCGCTCACTCAT-3’(SEQ ID NO:2)。
2.4对获得的20组寡核苷酸粗品进行HPLC梯度洗脱,梯度洗脱的条件见表4;通过梯度洗脱进行分离纯化,获得20组寡核苷酸纯品,该寡核苷酸纯品即为合成的寡核苷酸链;对20组寡核苷酸纯品进行HPLC梯度洗脱,梯度洗脱的条件见表5。20组寡核苷酸纯品分别基于预设的寡核苷酸序列Seq1-Seq20合成及纯化获得,该20组寡核苷酸纯品的HPLC分析图谱如图1至图20所示,20组寡核苷酸纯品的HPLC分析测定纯度见表6。
表4.寡核苷酸粗品梯度洗脱反应条件表
流动相 | 浓度% | 时间min |
乙腈 | 8-18 | 0-15 |
乙腈 | 88 | 15.01-17 |
乙腈 | 8 | 17.01-19 |
表5.寡核苷酸纯品梯度洗脱反应条件表
流动相 | 浓度% | 时间min |
乙腈 | 8-18 | 0-15 |
乙腈 | 88 | 15.01-17 |
流动相 | 浓度% | 时间min |
乙腈 | 8 | 17.01-19 |
表6. 20组寡核苷酸纯品的HPLC测定纯度
实施例3、寡核苷酸建库及下一代测序
3.1建库
3.1.1设计扩增引物
设计的正向引物的序列为:5’-TCGTGTCAAGTACGGCAGCA-3’(SEQ ID NO:3);设计的反向引物的序列为:5’-CCAGACCCGATATGAGTGAGC-3’(SEQ ID NO:4)。其中,正向引物含有与L1的结合位点,反向引物含有与L2的结合位点。
3.1.2建库的聚合酶链式反应(PCR)
PCR反应体系如表7。
表7.PCR反应体系表
组分 | 体积量μL |
单链模板(150ng) | 5 |
正向引物(10uM) | 1 |
反向引物(10uM) | 1 |
预混液 | 25 |
无核酸酶水 | 18 |
将实施例3获得的合成的寡核苷酸链作为单链模板加入按照表7所示配置PCR反应体系并置于PCR反应管中。
将装载有PCR反应体系的PCR反应管放置于PCR仪上,设置并运行如表8所示的PCR程序,获得PCR产物。
表8.PCR程序说明
3.1.3磁珠纯化
利用110μL的Yeasen磁珠试剂盒(上海翊圣生物科技有限公司生产的Hieff NGS DNA分离磁珠,货号为12599ES03)对PCR产物进行纯化,取20μLYeasen磁珠试剂盒中的洗脱液进行洗脱,回收18μL纯化的PCR产物。18μL纯化的PCR产物包含300ng纯化的寡核苷酸链。
3.2连接建库
3.2.1末端修复
按照表9配置末端修复反应混合液,其中纯化的寡核苷酸链作为DNA插入片段加入该末端修复反应混合液中。
将按照表9所示配置末端修复反应混合液置于PCR反应管中。
表9.末端修复反应混合液配比信息
试剂名称 | 体积(μL) |
DNA插入片断(200ng) | 30 |
末端修复缓冲液 | 17.8 |
末端修复酶 | 2.20 |
总体积 | 50 |
将装载有末端修复反应混合液的PCR反应管放置于PCR仪上,设置并运行如表10所示的PCR程序,获得末端修复产物。
表10.PCR仪操作条件表
温度 | 时间 | 循环数 |
37℃ | 30min | 1 |
75℃ | 30min | 1 |
4℃ | 维持至下一步 | 1 |
3.2.2测序接头连接
使用二代测序文库制备试剂盒KAPA HyperPlus试剂盒(罗氏诊断产品(上海)有限公司生产,货号为KK8512)进行接头连接。
按照表11配置测序接头连接反应混合液。
表11.测序接头连接混合液配置表
试剂名称 | 体积(μL) |
连接酶缓冲液 | 27.75 |
Ligase Enzyme连接酶 | 1 |
总体积 | 28.75 |
将装有末端修复产物的PCR反应管置于冰上,向该PCR反应管内加入1.25μL的测序接头(选用自Illumina TruSeq HT Kits中的D501-D508接头与D701-D712接头)和28.75μL的测序接头连接混合液。
将装载有末端修复产物、测序接头连接混合液及测序接头的PCR反应管放置于PCR仪上,设置并运行如表12所示的PCR程序,获得测序接头连接产物。
表12.PCR仪操作条件表
温度 | 时间 | 循环数 |
23℃ | 15min | 1 |
4℃ | 维持至下一步 | 1 |
3.2.3磁珠纯化
利用110μL的Yeasen磁珠试剂盒(上海翊圣生物科技有限公司生产的Hieff NGS DNA分离磁珠,货号为12599ES03)对测序接头连接产物进行纯化,取16μLYeasen磁珠试剂盒中的洗脱液进行洗脱,回收15μL纯化的测序接头连接产物。
3.2.4下一代测序及统计分析
对纯化的测序接头连接产物进行下一代测序,获得76个活性测试点的对应待测品序列及内标品序列的读数,每个活性测试点的内标品读数与待测品读数的比值为内标品与待测品的相对反应活性比,该相对反应活性比反映在偶联特定碱基的核苷酸的条件下,内标品与待测品的相对反应活性。
以X
4为例,预设的4个寡核苷酸序列Seq5-Seq8分别包含单体混合物X
4(AAC/CTG)对应的偶联腺嘌呤脱氧核苷酸形成的活性测试点X
4A、偶联鸟嘌呤脱氧核苷酸形成的活性测试点X
4G、偶联胞嘧啶脱氧核苷酸形成的活性测试点X
4C、偶联胸腺嘧啶脱氧核苷酸形成的活性测试点X
4T。基于预定的寡核苷酸序列Seq5-8合成的寡核苷酸链包含4组寡核苷酸序列,基于对应寡核苷酸序列Seq5生成的一组寡核苷酸序列的测序结果,可读取CTG亚磷酰胺的活性测试点X
4T的内标品读数及待测品读数。基于对应寡核苷酸序列Seq6生成的一组寡核苷酸序列的测序结果,可读取CTG亚磷酰胺的活性测试点X
4C、的内标品读数及待测品读数。基于寡核苷酸序列Seq7生成的一组寡核苷酸序列的测序结果,可读取CTG亚磷酰胺的活性测试点X
4G的内标品读数及待测品读数。对应寡核苷酸序列Seq8生成的一组寡核苷酸序列的测序结果,可读取CTG亚磷酰胺的活性测试点X
4A的内标品读数及待测品读数。具体读数及相对反应活性比见表13。
表13.CTG亚磷酰胺的活性测试点读数表
读取数 | AAC | CTG | 相对反应活性比 |
T | 7162 | 4017 | 1.78 |
C | 5694 | 1971 | 2.89 |
G | 3975 | 1993 | 1.99 |
A | 5600 | 3394 | 1.65 |
下一代测序及统计分析的结果见表14。
表14.不同三联核苷亚磷酰胺与内标品AAC的相对反应活性系数表
注:内标品AAC亚磷酰胺的各相对反应活性比及相对反应活性系数均为1。
由表14可知,19种三联核苷亚磷酰胺相对AAC亚磷酰胺的反应活性可以分为三类,比AAC反应活性高的单体有5种,反应活性系数在0.8-0.9之间;与AAC反应活性相当的单体有8种,反应活性系数在1.0-1.4之间;比AAC反应活性低的单体有6种,反应活性系数在1.4-2.1之间。
实施例4、验证三联核苷亚磷酰胺的相对反应活性
为了验证测得的相对反应活性系数的数据准确性,将20个代表规范氨基酸密码子的三联核苷亚磷酰胺按相对反应活性数据配制成比例均为5%的混合单体X
20,将混合单体X
20掺入寡核苷酸序列中。考虑到四种不同的核苷的5’端羟基与三联核苷亚磷酰胺反应底物的反应活性不同,因此设计寡核苷酸序列Seq21,该序列寡核苷酸序列Seq21包含混合单体与4个不同碱基的核苷酸偶联形成的活性测试点。寡核苷酸序列Seq21的具体序列信息为:
5’-L1-X
20TX
20GX
20CX
20A-L2-3’
其中,L1为:5’-CGGCAGCACATGTAGTGCAAGTCAAGGTT-3’(SEQ ID NO:1);
L2为5’-ACCACTACTACTACACGCCGCTCACTCAT-3’(SEQ ID NO:2)。
参照实施例2和实施例3进行寡核苷酸链的合成、建库及下一代测序。基于预设的寡核苷酸序列Seq21信息合成寡核苷酸粗品,寡核苷酸粗品经过分离纯化后获得寡核苷酸纯品,该寡核苷酸纯品即为合成的寡核苷酸链。该寡核苷酸纯品的HPLC分析图谱如图21所示,该寡核苷酸纯品的HPLC测定纯度为99.6%。合成的寡核苷酸链的测序统计分析结果见表14。由表14可知,在基于寡核苷酸序列Seq21合成的一组寡核苷酸链中,20种密码子在寡核苷酸链的各不同活性测试点的占比均处于预设范围内(3.5-6.5%),该比例范围对于下游应用如文库的构建是足够精准的;另外,同一密码子在四种不同的核苷所对应的活性测试点上所测的比例的标准偏差在0.001-0.009之间,证明了上述反应活性系数的可靠性。
表14. 20种密码子在寡核苷酸链不同活性测试点的占比
本领域的技术人员应当理解,以上实施例仅为说明本发明,而不对本发明构成限制。凡在本发明的精神和原则内所作的任何修改、等同替换和变动等,均应包含在本发明的保护范围之内。
Claims (22)
- 一种测定三联核苷亚磷酰胺相对反应活性的方法,其包括:ⅰ)选定N+1个不同的三联核苷亚磷酰胺中的任意1个作为内标品,其余N个三联核苷亚磷酰胺作为待测品,其中N为整数且N≥1;ⅱ)制备N个单体混合物,其中,每个所述单体混合物包括所述内标品与一个所述待测品,每个所述单体混合物中所述内标品与其所述待测品的摩尔比相同,且各个所述单体混合物中的所述待测品都互不相同;ⅲ)基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成,获得合成的寡核苷酸链,其中,通过设置所述N个单体混合物的掺入位点,使得所述一个或多个寡核苷酸序列包括至少N个活性测试点,每个所述单体混合物具有对应的至少一个活性测试点;ⅳ)对所述合成的寡核苷酸链进行测序,及ⅴ)基于测序结果确定内标品与各个待测品的相对反应活性比。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述寡核苷酸序列具有测试区和非测试区,所述至少N个活性测试点分布于所述一个或多个寡核苷酸序列的测试区,且任意两个相邻的活性测试点之间独立地存在或不存在包含至少一个核苷酸的间隔序列。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物任意地掺入所述一个或多个寡核苷酸序列的测试区所反应形成;或,所述一个或多个寡核苷酸序列包括N个活性测试点,所述N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与一个相同碱基的核苷酸偶联所反应形成。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述一个或多个寡核苷酸序列包括2N个活性测试点,所述2N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与2个不同碱基的核苷酸偶联所反应形成。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述一个或多个寡核苷酸序列包括3N个活性测试点,所述3N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与3个不同碱基的核苷酸偶联所反应形成。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述一个或多个寡核苷酸序列包括4N个活性测试点,所述4N个活性测试点由所述N个单体混合物中的每一个单体混合物分别与4个不同碱基的核苷酸偶联所反应形成。
- 如权利要求1至6任意一项权利要求所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述N+1个三联核苷亚磷酰胺中的任意一个三联核苷亚磷酰胺均对应一个编码氨基酸的密码子,所述N+1个三联核苷亚磷酰胺中的任意2个三联核苷亚磷酰胺所对应的密码子均编码不同的氨基酸。
- 如权利要求7所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述N为18以内的任意正整数。
- 如权利要求7所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述N为19。
- 如权利要求7所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,选定的内标品为AAC亚磷酰胺。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述基于测序结果确定内标品与各个待测品的相对反应活性比包括:统计测序结果中所述至少N个活性测试点分别对应的内标品读数与待测品读数,每个活性测试点的内标品读数与待测品读数的比值为内标品与对应该活性测试点的待测品的相对反应活性比。
- 如权利要求11所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述方法还包括:ⅵ)基于相对反应活性比确定各个待测品的相对反应活性系数。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,各个单体混合物中的内标品与待测品的摩尔比均为1:1。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述对合成的寡核苷酸链进行测序包括:使用下一代测序技术进行合成的寡核苷酸链测序。
- 如权利要求1所述的测定三联核苷亚磷酰胺相对反应活性的方法,其特征在于,所述基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成包括:在DNA合成仪中使用固相合成法进行寡核苷酸链合成。
- 权利要求1-15中任一项所述方法测定的三联核苷亚磷酰胺相对反应活性在构建基因文库中的应用。
- 一种寡核苷酸合成反应的设计方法,其包括:ⅰ)选定N+1个不同的三联核苷亚磷酰胺中的任意1个作为内标品,其余N个三联核苷亚磷酰胺作为待测品,其中N为整数且N≥1;ii)确定内标品与各个待测品的相对反应活性比;及iii)根据内标品与各个待测品的相对反应活性比确定合成寡核苷酸反应中所用三联核苷亚磷酰胺的比例。
- 如权利要求17所述的寡核苷酸合成反应的设计方法,其特征在于,确定内标品与各个待测品的相对反应活性比包括:制备N个单体混合物,其中,每个所述单体混合物包括所述内标品与一个所述待测品,每个所述单体混合物中所述内标品与其所述待测品的摩尔比相同,且各个所述单体混合物中的所述待测品都互不相同;基于预设的一个或多个寡核苷酸序列信息进行寡核苷酸链合成,获得合成的寡核苷酸链,其中,通过设置所述N个单体混合物的掺入位点,使得所述一个或多个寡核苷酸序列包括至少N个活性测试点,每个所述单体混合物具有对应的至少一个活性测试点;对所述合成的寡核苷酸链进行测序,及基于测序结果确定内标品与各个待测品的相对反应活性比。
- 如权利要求17所述的寡核苷酸合成反应的设计方法,其特征在于,选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余的AAA亚磷酰胺、ACT亚磷酰胺、ATC亚磷酰胺、ATG亚磷酰胺、CAG亚磷酰胺、CAT亚磷酰胺、CCG亚磷酰胺、CGT亚磷酰胺、CTG亚磷酰胺、GAA亚磷酰胺、GAC亚磷酰胺、GCT亚磷酰胺、GGT亚磷酰胺、GTT亚磷酰胺、TAC亚磷酰胺、TCT亚磷酰胺、TGC亚磷酰胺、TGG亚磷酰胺和TTC亚磷酰胺为待测品。
- 一种寡核苷酸合成反应的设计方法,其特征在于包括:选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余19个为待测品,确定如下表所示的基于内标品与各个待测品的相对反应活性比所计算的各待测品的相对反应活性系数,根据所述相对反应活性系数确定合成寡核苷酸反应中所用三联核苷亚磷酰胺的比例。
- 三联核苷亚磷酰胺的相对反应活性系数,其特征在于,选定20个代表规范氨基酸密码子的三联核苷亚磷酰胺中的AAC亚磷酰胺为内标品,其余19个为待测品,确定如下表所示的基于内标品与各个待测品的相对反应活性比所计算的各待测品的相对反应活性系数。
- 权利要求21所述的三联核苷亚磷酰胺相对反应活性系数在构建基因文库中的应用。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021101258720 | 2021-01-29 | ||
CN202110125872 | 2021-01-29 | ||
PCT/CN2022/074485 WO2022161450A1 (zh) | 2021-01-29 | 2022-01-28 | 相对反应活性测定方法及寡核苷酸合成反应的设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116802319A true CN116802319A (zh) | 2023-09-22 |
Family
ID=82654186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280012195.4A Pending CN116802319A (zh) | 2021-01-29 | 2022-01-28 | 相对反应活性测定方法及寡核苷酸合成反应的设计方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116802319A (zh) |
WO (1) | WO2022161450A1 (zh) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105348343B (zh) * | 2015-11-25 | 2019-01-04 | 北京大学 | 发色团修饰的脱氧核苷亚磷酰胺单体化合物及其制备方法和应用 |
-
2022
- 2022-01-28 WO PCT/CN2022/074485 patent/WO2022161450A1/zh active Application Filing
- 2022-01-28 CN CN202280012195.4A patent/CN116802319A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022161450A1 (zh) | 2022-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0643778B1 (en) | Encoded combinatorial chemical libraries | |
AU2003304278B2 (en) | Bead bound combinatorial oligonucleoside phosphorothioate and phosphorodithioate aptamer libraries | |
US7179894B2 (en) | Combinatorial selection of oligonucleotide aptamers | |
Larder et al. | Quantitative detection of HIV-1 drug resistance mutations by automated DNA sequencing | |
US5523388A (en) | Methods of synthesizing oligonucleotides with random codons | |
IE822547L (en) | Oligonucleotides | |
NZ239498A (en) | Synthesising oligonucleotides having random codons using individual monomers | |
EP0800526B1 (en) | Method for the controlled synthesis of polynucleotide mixtures which encode desired mixtures of peptides | |
CA2470965A1 (en) | System biology approach: high throughput screening (hts) platforms with multiple dimensions | |
CN108823296B (zh) | 一种检测核酸样本污染的方法、试剂盒及应用 | |
CA3201205A1 (en) | Oligonucleotides | |
CN110628889A (zh) | Illumina二代测序平台文库构建引入分子标签的方法、接头序列及应用 | |
CN112029771B (zh) | 一种特异性结合哌替啶的核酸适配体及其应用 | |
CN116802319A (zh) | 相对反应活性测定方法及寡核苷酸合成反应的设计方法 | |
CN113795591A (zh) | 表征肿瘤并且识别肿瘤异质性的方法和系统 | |
CN116536308A (zh) | 测序封闭剂及其应用 | |
CN112266963B (zh) | 一种联合检测慢性粒细胞白血病检测试剂盒 | |
CN113699215B (zh) | 一种核酸适体筛选方法 | |
Coggins | The Impact of Recombinant DNA Techniques on the Study of Enzymes | |
WO1999063077A2 (en) | Compositions of nucleic acid which alter ligand-binding characteristics and related methods and products | |
CN117512063A (zh) | Dna文库构建方法、装置及其应用 | |
KR20110007723A (ko) | 압타머 제조방법 | |
Biro | Design and Production of Specifically High Affinity Reacting Peptides (SHARP®-s) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |