CN117337333A - 用于补体链测序的方法 - Google Patents
用于补体链测序的方法 Download PDFInfo
- Publication number
- CN117337333A CN117337333A CN202280035082.6A CN202280035082A CN117337333A CN 117337333 A CN117337333 A CN 117337333A CN 202280035082 A CN202280035082 A CN 202280035082A CN 117337333 A CN117337333 A CN 117337333A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- stranded nucleic
- nanopore
- pair
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 167
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 29
- 230000000295 complement effect Effects 0.000 title claims description 61
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 426
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 426
- 239000002157 polynucleotide Substances 0.000 claims abstract description 426
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 253
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 252
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 252
- 239000011148 porous material Substances 0.000 claims description 135
- 239000012528 membrane Substances 0.000 claims description 109
- 125000003729 nucleotide group Chemical group 0.000 claims description 79
- 125000006850 spacer group Chemical group 0.000 claims description 73
- 230000005945 translocation Effects 0.000 claims description 57
- 150000002632 lipids Chemical class 0.000 claims description 54
- 102000004169 proteins and genes Human genes 0.000 claims description 47
- 108090000623 proteins and genes Proteins 0.000 claims description 47
- 239000011732 tocopherol Substances 0.000 claims description 34
- 229960001295 tocopherol Drugs 0.000 claims description 33
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 23
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 23
- 150000001413 amino acids Chemical class 0.000 claims description 22
- 229920001184 polypeptide Polymers 0.000 claims description 22
- 150000002500 ions Chemical class 0.000 claims description 18
- 229930003799 tocopherol Natural products 0.000 claims description 16
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 claims description 15
- 235000010384 tocopherol Nutrition 0.000 claims description 15
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 claims description 15
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 13
- 229930182558 Sterol Natural products 0.000 claims description 11
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 11
- 229930195729 fatty acid Natural products 0.000 claims description 11
- 239000000194 fatty acid Substances 0.000 claims description 11
- 150000004665 fatty acids Chemical class 0.000 claims description 11
- 150000003432 sterols Chemical class 0.000 claims description 11
- 235000003702 sterols Nutrition 0.000 claims description 11
- 239000002041 carbon nanotube Substances 0.000 claims description 10
- 229910021393 carbon nanotube Inorganic materials 0.000 claims description 10
- 150000001875 compounds Chemical class 0.000 claims description 4
- 230000001737 promoting effect Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 abstract description 20
- 230000001965 increasing effect Effects 0.000 abstract description 15
- 239000003795 chemical substances by application Substances 0.000 abstract description 5
- 108060004795 Methyltransferase Proteins 0.000 description 103
- 102000023732 binding proteins Human genes 0.000 description 85
- 108091008324 binding proteins Proteins 0.000 description 85
- 239000002773 nucleotide Substances 0.000 description 55
- 108020004414 DNA Proteins 0.000 description 46
- 102000053602 DNA Human genes 0.000 description 46
- 238000005259 measurement Methods 0.000 description 40
- 235000018102 proteins Nutrition 0.000 description 40
- 239000010410 layer Substances 0.000 description 31
- 239000000523 sample Substances 0.000 description 27
- 102000004190 Enzymes Human genes 0.000 description 26
- 108090000790 Enzymes Proteins 0.000 description 26
- 239000000232 Lipid Bilayer Substances 0.000 description 26
- 229920002477 rna polymer Polymers 0.000 description 21
- 239000002585 base Substances 0.000 description 19
- 235000001014 amino acid Nutrition 0.000 description 18
- 230000002209 hydrophobic effect Effects 0.000 description 17
- 108091005703 transmembrane proteins Proteins 0.000 description 15
- 102000035160 transmembrane proteins Human genes 0.000 description 15
- 150000003839 salts Chemical class 0.000 description 13
- 108091006146 Channels Proteins 0.000 description 12
- -1 molecules Proteins 0.000 description 12
- 239000007864 aqueous solution Substances 0.000 description 11
- 229920001400 block copolymer Polymers 0.000 description 11
- 230000003993 interaction Effects 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 10
- 238000012986 modification Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 229920000642 polymer Polymers 0.000 description 9
- 230000008878 coupling Effects 0.000 description 8
- 238000010168 coupling process Methods 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 229920001223 polyethylene glycol Polymers 0.000 description 8
- 229920000428 triblock copolymer Polymers 0.000 description 8
- 108060002716 Exonuclease Proteins 0.000 description 7
- 239000002202 Polyethylene glycol Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 102000013165 exonuclease Human genes 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 101710183280 Topoisomerase Proteins 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 239000000178 monomer Substances 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 102000012410 DNA Ligases Human genes 0.000 description 5
- 108010061982 DNA Ligases Proteins 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- 238000007672 fourth generation sequencing Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 125000001183 hydrocarbyl group Chemical group 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 229950004354 phosphorylcholine Drugs 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- YDNKGFDKKRUKPY-JHOUSYSJSA-N C16 ceramide Natural products CCCCCCCCCCCCCCCC(=O)N[C@@H](CO)[C@H](O)C=CCCCCCCCCCCCCC YDNKGFDKKRUKPY-JHOUSYSJSA-N 0.000 description 4
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- CRJGESKKUOMBCT-VQTJNVASSA-N N-acetylsphinganine Chemical compound CCCCCCCCCCCCCCC[C@@H](O)[C@H](CO)NC(C)=O CRJGESKKUOMBCT-VQTJNVASSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- 102000008579 Transposases Human genes 0.000 description 4
- 108010020764 Transposases Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 229940106189 ceramide Drugs 0.000 description 4
- ZVEQCJWYRWKARO-UHFFFAOYSA-N ceramide Natural products CCCCCCCCCCCCCCC(O)C(=O)NC(CO)C(O)C=CCCC=C(C)CCCCCCCCC ZVEQCJWYRWKARO-UHFFFAOYSA-N 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000002800 charge carrier Substances 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- VVGIYYKRAMHVLU-UHFFFAOYSA-N newbouldiamide Natural products CCCCCCCCCCCCCCCCCCCC(O)C(O)C(O)C(CO)NC(=O)CCCCCCCCCCCCCCCCC VVGIYYKRAMHVLU-UHFFFAOYSA-N 0.000 description 4
- 239000003960 organic solvent Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000005641 tunneling Effects 0.000 description 4
- 101710092462 Alpha-hemolysin Proteins 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108091093094 Glycol nucleic acid Proteins 0.000 description 3
- 102100022536 Helicase POLQ-like Human genes 0.000 description 3
- 101000899334 Homo sapiens Helicase POLQ-like Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 108091046915 Threose nucleic acid Proteins 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 230000001588 bifunctional effect Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 235000012000 cholesterol Nutrition 0.000 description 3
- 229920001577 copolymer Polymers 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 238000002847 impedance measurement Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000002356 single layer Substances 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- OILXMJHPFNGGTO-UHFFFAOYSA-N (22E)-(24xi)-24-methylcholesta-5,22-dien-3beta-ol Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)C=CC(C)C(C)C)C1(C)CC2 OILXMJHPFNGGTO-UHFFFAOYSA-N 0.000 description 2
- VLSDXINSOMDCBK-BQYQJAHWSA-N (E)-1,1'-azobis(N,N-dimethylformamide) Chemical compound CN(C)C(=O)\N=N\C(=O)N(C)C VLSDXINSOMDCBK-BQYQJAHWSA-N 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 2
- TZCPCKNHXULUIY-RGULYWFUSA-N 1,2-distearoyl-sn-glycero-3-phosphoserine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCCCCCCCCCCCC TZCPCKNHXULUIY-RGULYWFUSA-N 0.000 description 2
- WJWCWIMVMYWVNZ-UHFFFAOYSA-N 2-azidohexanoic acid Chemical compound CCCCC(C(O)=O)N=[N+]=[N-] WJWCWIMVMYWVNZ-UHFFFAOYSA-N 0.000 description 2
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 2
- OQMZNAMGEHIHNN-UHFFFAOYSA-N 7-Dehydrostigmasterol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)C=CC(CC)C(C)C)CCC33)C)C3=CC=C21 OQMZNAMGEHIHNN-UHFFFAOYSA-N 0.000 description 2
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 2
- ZWZWYGMENQVNFU-UHFFFAOYSA-N Glycerophosphorylserin Natural products OC(=O)C(N)COP(O)(=O)OCC(O)CO ZWZWYGMENQVNFU-UHFFFAOYSA-N 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 239000005642 Oleic acid Substances 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- 101710203389 Outer membrane porin F Proteins 0.000 description 2
- 101710203388 Outer membrane porin G Proteins 0.000 description 2
- 235000021314 Palmitic acid Nutrition 0.000 description 2
- 108010013381 Porins Proteins 0.000 description 2
- 102000017033 Porins Human genes 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- ATBOMIWRCZXYSZ-XZBBILGWSA-N [1-[2,3-dihydroxypropoxy(hydroxy)phosphoryl]oxy-3-hexadecanoyloxypropan-2-yl] (9e,12e)-octadeca-9,12-dienoate Chemical group CCCCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCC\C=C\C\C=C\CCCCC ATBOMIWRCZXYSZ-XZBBILGWSA-N 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- LGJMUZUPVCAVPU-UHFFFAOYSA-N beta-Sitostanol Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(CC)C(C)C)C1(C)CC2 LGJMUZUPVCAVPU-UHFFFAOYSA-N 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 150000003841 chloride salts Chemical class 0.000 description 2
- VZWXIQHBIQLMPN-UHFFFAOYSA-N chromane Chemical group C1=CC=C2CCCOC2=C1 VZWXIQHBIQLMPN-UHFFFAOYSA-N 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 239000003431 cross linking reagent Substances 0.000 description 2
- 101150099331 csgG gene Proteins 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- ZGSPNIOCEDOHGS-UHFFFAOYSA-L disodium [3-[2,3-di(octadeca-9,12-dienoyloxy)propoxy-oxidophosphoryl]oxy-2-hydroxypropyl] 2,3-di(octadeca-9,12-dienoyloxy)propyl phosphate Chemical compound [Na+].[Na+].CCCCCC=CCC=CCCCCCCCC(=O)OCC(OC(=O)CCCCCCCC=CCC=CCCCCC)COP([O-])(=O)OCC(O)COP([O-])(=O)OCC(OC(=O)CCCCCCCC=CCC=CCCCCC)COC(=O)CCCCCCCC=CCC=CCCCCC ZGSPNIOCEDOHGS-UHFFFAOYSA-L 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 150000002190 fatty acyls Chemical group 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 229910021389 graphene Inorganic materials 0.000 description 2
- 239000003228 hemolysin Substances 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- 239000013554 lipid monolayer Substances 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 2
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 2
- 150000003905 phosphatidylinositols Chemical class 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 239000000276 potassium ferrocyanide Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000012085 test solution Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- HLZKNKRTKFSKGZ-UHFFFAOYSA-N tetradecan-1-ol Chemical compound CCCCCCCCCCCCCCO HLZKNKRTKFSKGZ-UHFFFAOYSA-N 0.000 description 2
- XOGGUFAVLNCTRS-UHFFFAOYSA-N tetrapotassium;iron(2+);hexacyanide Chemical compound [K+].[K+].[K+].[K+].[Fe+2].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] XOGGUFAVLNCTRS-UHFFFAOYSA-N 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- MQAYPFVXSPHGJM-UHFFFAOYSA-M trimethyl(phenyl)azanium;chloride Chemical compound [Cl-].C[N+](C)(C)C1=CC=CC=C1 MQAYPFVXSPHGJM-UHFFFAOYSA-M 0.000 description 2
- 229930195735 unsaturated hydrocarbon Chemical group 0.000 description 2
- KZJWDPNRJALLNS-VPUBHVLGSA-N (-)-beta-Sitosterol Natural products O[C@@H]1CC=2[C@@](C)([C@@H]3[C@H]([C@H]4[C@@](C)([C@H]([C@H](CC[C@@H](C(C)C)CC)C)CC4)CC3)CC=2)CC1 KZJWDPNRJALLNS-VPUBHVLGSA-N 0.000 description 1
- BQPPJGMMIYJVBR-UHFFFAOYSA-N (10S)-3c-Acetoxy-4.4.10r.13c.14t-pentamethyl-17c-((R)-1.5-dimethyl-hexen-(4)-yl)-(5tH)-Delta8-tetradecahydro-1H-cyclopenta[a]phenanthren Natural products CC12CCC(OC(C)=O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C BQPPJGMMIYJVBR-UHFFFAOYSA-N 0.000 description 1
- CSVWWLUMXNHWSU-UHFFFAOYSA-N (22E)-(24xi)-24-ethyl-5alpha-cholest-22-en-3beta-ol Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(C)C=CC(CC)C(C)C)C1(C)CC2 CSVWWLUMXNHWSU-UHFFFAOYSA-N 0.000 description 1
- RQOCXCFLRBRBCS-UHFFFAOYSA-N (22E)-cholesta-5,7,22-trien-3beta-ol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)C=CCC(C)C)CCC33)C)C3=CC=C21 RQOCXCFLRBRBCS-UHFFFAOYSA-N 0.000 description 1
- CHGIKSSZNBCNDW-UHFFFAOYSA-N (3beta,5alpha)-4,4-Dimethylcholesta-8,24-dien-3-ol Natural products CC12CCC(O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21 CHGIKSSZNBCNDW-UHFFFAOYSA-N 0.000 description 1
- ALSTYHKOOCGGFT-KTKRTIGZSA-N (9Z)-octadecen-1-ol Chemical compound CCCCCCCC\C=C/CCCCCCCCO ALSTYHKOOCGGFT-KTKRTIGZSA-N 0.000 description 1
- XKKCQTLDIPIRQD-JGVFFNPUSA-N 1-[(2r,5s)-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)CC1 XKKCQTLDIPIRQD-JGVFFNPUSA-N 0.000 description 1
- BMQZYMYBQZGEEY-UHFFFAOYSA-M 1-ethyl-3-methylimidazolium chloride Chemical compound [Cl-].CCN1C=C[N+](C)=C1 BMQZYMYBQZGEEY-UHFFFAOYSA-M 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- XYTLYKGXLMKYMV-UHFFFAOYSA-N 14alpha-methylzymosterol Natural products CC12CCC(O)CC1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C XYTLYKGXLMKYMV-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical compound C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- KLEXDBGYSOIREE-UHFFFAOYSA-N 24xi-n-propylcholesterol Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(CCC)C(C)C)C1(C)CC2 KLEXDBGYSOIREE-UHFFFAOYSA-N 0.000 description 1
- XMTQQYYKAHVGBJ-UHFFFAOYSA-N 3-(3,4-DICHLOROPHENYL)-1,1-DIMETHYLUREA Chemical compound CN(C)C(=O)NC1=CC=C(Cl)C(Cl)=C1 XMTQQYYKAHVGBJ-UHFFFAOYSA-N 0.000 description 1
- 125000004080 3-carboxypropanoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C(O[H])=O 0.000 description 1
- FPTJELQXIUUCEY-UHFFFAOYSA-N 3beta-Hydroxy-lanostan Natural products C1CC2C(C)(C)C(O)CCC2(C)C2C1C1(C)CCC(C(C)CCCC(C)C)C1(C)CC2 FPTJELQXIUUCEY-UHFFFAOYSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- WOVKYSAHUYNSMH-RRKCRQDMSA-N 5-bromodeoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-RRKCRQDMSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 229910018072 Al 2 O 3 Inorganic materials 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- WOVKYSAHUYNSMH-UHFFFAOYSA-N BROMODEOXYURIDINE Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-UHFFFAOYSA-N 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 101100096476 Bacillus subtilis (strain 168) splB gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010071023 Bacterial Outer Membrane Proteins Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 101100478849 Bifidobacterium adolescentis (strain ATCC 15703 / DSM 20083 / NCTC 11814 / E194a) sucP gene Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- LPZCCMIISIBREI-MTFRKTCUSA-N Citrostadienol Natural products CC=C(CC[C@@H](C)[C@H]1CC[C@H]2C3=CC[C@H]4[C@H](C)[C@@H](O)CC[C@]4(C)[C@H]3CC[C@]12C)C(C)C LPZCCMIISIBREI-MTFRKTCUSA-N 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 235000016795 Cola Nutrition 0.000 description 1
- 244000228088 Cola acuminata Species 0.000 description 1
- 235000011824 Cola pachycarpa Nutrition 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- YTBSYETUWUMLBZ-QWWZWVQMSA-N D-threose Chemical compound OC[C@@H](O)[C@H](O)C=O YTBSYETUWUMLBZ-QWWZWVQMSA-N 0.000 description 1
- ARVGMISWLZPBCH-UHFFFAOYSA-N Dehydro-beta-sitosterol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)CCC(CC)C(C)C)CCC33)C)C3=CC=C21 ARVGMISWLZPBCH-UHFFFAOYSA-N 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 101100421425 Drosophila melanogaster Sply gene Proteins 0.000 description 1
- 108700035208 EC 7.-.-.- Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101100169997 Enterobacteria phage T4 dda gene Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- DNVPQKQSNYMLRS-NXVQYWJNSA-N Ergosterol Natural products CC(C)[C@@H](C)C=C[C@H](C)[C@H]1CC[C@H]2C3=CC=C4C[C@@H](O)CC[C@]4(C)[C@@H]3CC[C@]12C DNVPQKQSNYMLRS-NXVQYWJNSA-N 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- BKLIAINBCQPSOV-UHFFFAOYSA-N Gluanol Natural products CC(C)CC=CC(C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(O)C(C)(C)C4CC3 BKLIAINBCQPSOV-UHFFFAOYSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 108010006464 Hemolysin Proteins Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- LOPKHWOTGJIQLC-UHFFFAOYSA-N Lanosterol Natural products CC(CCC=C(C)C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(C)(O)C(C)(C)C4CC3 LOPKHWOTGJIQLC-UHFFFAOYSA-N 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- 101100024453 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) mspB gene Proteins 0.000 description 1
- 101100155954 Mycoplasma capricolum subsp. capricolum (strain California kid / ATCC 27343 / NCTC 10154) uvrD gene Proteins 0.000 description 1
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- CAHGCLMLTWQZNJ-UHFFFAOYSA-N Nerifoliol Natural products CC12CCC(O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C CAHGCLMLTWQZNJ-UHFFFAOYSA-N 0.000 description 1
- GSBKRFGXEJLVMI-UHFFFAOYSA-N Nervonyl carnitine Chemical group CCC[N+](C)(C)C GSBKRFGXEJLVMI-UHFFFAOYSA-N 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 101710144111 Non-structural protein 3 Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101710116435 Outer membrane protein Proteins 0.000 description 1
- 101150113153 PIF1 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010056995 Perforin Proteins 0.000 description 1
- 102100028467 Perforin-1 Human genes 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101150099060 SGPL1 gene Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 101100408281 Schizosaccharomyces pombe (strain 972 / ATCC 24843) pfh1 gene Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- HZYXFRGVBOPPNZ-UHFFFAOYSA-N UNPD88870 Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)=CCC(CC)C(C)C)C1(C)CC2 HZYXFRGVBOPPNZ-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- WREGKURFCTUGRC-POYBYMJQSA-N Zalcitabine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)CC1 WREGKURFCTUGRC-POYBYMJQSA-N 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000013006 addition curing Methods 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 229910001514 alkali metal chloride Inorganic materials 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- MJVXAPPOFPTTCA-UHFFFAOYSA-N beta-Sistosterol Natural products CCC(CCC(C)C1CCC2C3CC=C4C(C)C(O)CCC4(C)C3CCC12C)C(C)C MJVXAPPOFPTTCA-UHFFFAOYSA-N 0.000 description 1
- NJKOMDUNNDKEAI-UHFFFAOYSA-N beta-sitosterol Natural products CCC(CCC(C)C1CCC2(C)C3CC=C4CC(O)CCC4C3CCC12C)C(C)C NJKOMDUNNDKEAI-UHFFFAOYSA-N 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 229950004398 broxuridine Drugs 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- BBJQPKLGPMQWBU-JADYGXMDSA-N cholesteryl palmitate Chemical compound C([C@@H]12)C[C@]3(C)[C@@H]([C@H](C)CCCC(C)C)CC[C@H]3[C@@H]1CC=C1[C@]2(C)CC[C@H](OC(=O)CCCCCCCCCCCCCCC)C1 BBJQPKLGPMQWBU-JADYGXMDSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 125000003374 diacylglycerol group Chemical group 0.000 description 1
- 150000001982 diacylglycerols Chemical class 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- QBSJHOGDIUQWTH-UHFFFAOYSA-N dihydrolanosterol Natural products CC(C)CCCC(C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(C)(O)C(C)(C)C4CC3 QBSJHOGDIUQWTH-UHFFFAOYSA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- OGQYPPBGSLZBEG-UHFFFAOYSA-N dimethyl(dioctadecyl)azanium Chemical compound CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC OGQYPPBGSLZBEG-UHFFFAOYSA-N 0.000 description 1
- 150000002009 diols Chemical group 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- KPUWHANPEXNPJT-UHFFFAOYSA-N disiloxane Chemical class [SiH3]O[SiH3] KPUWHANPEXNPJT-UHFFFAOYSA-N 0.000 description 1
- WLGSIWNFEGRXDF-UHFFFAOYSA-N dodecanoic acid Chemical group CCCCCCCCCCCC(O)=O.CCCCCCCCCCCC(O)=O WLGSIWNFEGRXDF-UHFFFAOYSA-N 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 238000002848 electrochemical method Methods 0.000 description 1
- 239000008151 electrolyte solution Substances 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- DNVPQKQSNYMLRS-SOWFXMKYSA-N ergosterol Chemical compound C1[C@@H](O)CC[C@]2(C)[C@H](CC[C@]3([C@H]([C@H](C)/C=C/[C@@H](C)C(C)C)CC[C@H]33)C)C3=CC=C21 DNVPQKQSNYMLRS-SOWFXMKYSA-N 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 150000002191 fatty alcohols Chemical class 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 101150028858 hel308 gene Proteins 0.000 description 1
- KYYWBEYKBLQSFW-UHFFFAOYSA-N hexadecanoic acid Chemical group CCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCC(O)=O KYYWBEYKBLQSFW-UHFFFAOYSA-N 0.000 description 1
- ACCCMOQWYVYDOT-UHFFFAOYSA-N hexane-1,1-diol Chemical group CCCCCC(O)O ACCCMOQWYVYDOT-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 101150041770 hlyE gene Proteins 0.000 description 1
- 230000000887 hydrating effect Effects 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 229920001600 hydrophobic polymer Polymers 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- NHXTZGXYQYMODD-UHFFFAOYSA-N icosanoic acid Chemical group CCCCCCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCCCCCC(O)=O NHXTZGXYQYMODD-UHFFFAOYSA-N 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 229920000592 inorganic polymer Polymers 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000011810 insulating material Substances 0.000 description 1
- 239000002608 ionic liquid Substances 0.000 description 1
- CAHGCLMLTWQZNJ-RGEKOYMOSA-N lanosterol Chemical compound C([C@]12C)C[C@@H](O)C(C)(C)[C@H]1CCC1=C2CC[C@]2(C)[C@H]([C@H](CCC=C(C)C)C)CC[C@@]21C CAHGCLMLTWQZNJ-RGEKOYMOSA-N 0.000 description 1
- 229940058690 lanosterol Drugs 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 230000003489 leucocidal effect Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 101150060059 mspA gene Proteins 0.000 description 1
- 101150065599 mspC gene Proteins 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 229940043348 myristyl alcohol Drugs 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- RQFLGKYCYMMRMC-UHFFFAOYSA-N octadecanoic acid Chemical group CCCCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCCCC(O)=O RQFLGKYCYMMRMC-UHFFFAOYSA-N 0.000 description 1
- 235000021313 oleic acid Nutrition 0.000 description 1
- 229940055577 oleyl alcohol Drugs 0.000 description 1
- XMLQWXUVTXCDDL-UHFFFAOYSA-N oleyl alcohol Natural products CCCCCCC=CCCCCCCCCCCO XMLQWXUVTXCDDL-UHFFFAOYSA-N 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 108010014203 outer membrane phospholipase A Proteins 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 101150027434 pcrA gene Proteins 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical group CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000036619 pore blockages Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 239000012429 reaction media Substances 0.000 description 1
- 101150056906 recJ gene Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229920002379 silicone rubber Polymers 0.000 description 1
- 239000004945 silicone rubber Substances 0.000 description 1
- KZJWDPNRJALLNS-VJSFXXLFSA-N sitosterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CC[C@@H](CC)C(C)C)[C@@]1(C)CC2 KZJWDPNRJALLNS-VJSFXXLFSA-N 0.000 description 1
- 229950005143 sitosterol Drugs 0.000 description 1
- 235000015500 sitosterol Nutrition 0.000 description 1
- NLQLSVXGSXCXFE-UHFFFAOYSA-N sitosterol Natural products CC=C(/CCC(C)C1CC2C3=CCC4C(C)C(O)CCC4(C)C3CCC2(C)C1)C(C)C NLQLSVXGSXCXFE-UHFFFAOYSA-N 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- HCXVJBMSMIARIN-PHZDYDNGSA-N stigmasterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)/C=C/[C@@H](CC)C(C)C)[C@@]1(C)CC2 HCXVJBMSMIARIN-PHZDYDNGSA-N 0.000 description 1
- 229940032091 stigmasterol Drugs 0.000 description 1
- 235000016831 stigmasterol Nutrition 0.000 description 1
- BFDNMXAIBMJLBB-UHFFFAOYSA-N stigmasterol Natural products CCC(C=CC(C)C1CCCC2C3CC=C4CC(O)CCC4(C)C3CCC12C)C(C)C BFDNMXAIBMJLBB-UHFFFAOYSA-N 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 101150017218 tatD gene Proteins 0.000 description 1
- ZTUXEFFFLOVXQE-UHFFFAOYSA-N tetradecanoic acid Chemical group CCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCC(O)=O ZTUXEFFFLOVXQE-UHFFFAOYSA-N 0.000 description 1
- TUNFSRHWOTWDNC-HKGQFRNVSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCC[14C](O)=O TUNFSRHWOTWDNC-HKGQFRNVSA-N 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 125000002640 tocopherol group Chemical class 0.000 description 1
- 235000019149 tocopherols Nutrition 0.000 description 1
- 101150015906 traI gene Proteins 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 101150073340 uvrD gene Proteins 0.000 description 1
- 101150108755 uvrD1 gene Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开的方面涉及用于使用纳米孔来表征核酸的组合物和方法。本公开部分基于用于增加核酸链的后续测序的方法。在一些实施方案中,所述方法包括:增加系链剂的浓度。在一些实施方案中,所述方法包括:使用具有刚性(或加强)前导区段的衔接子。还提供了可以在所述方法中使用的组合物和系统,所述组合物和系统包括例如用于附接至双链多核苷酸和/或系链剂的衔接子。
Description
背景技术
目前,广泛的应用需要快速且廉价的多核苷酸(例如,DNA或RNA)测序和识别技术。链测序通常涉及使用多核苷酸结合蛋白(诸如解旋酶)来控制多核苷酸通过纳米孔的移动。双链多核苷酸可以通过在通过纳米孔的易位之前分离链以提供单链多核苷酸来确定。双链多核苷酸的两条链可以通过桥接部分(诸如发夹环)连接,以便确保正向(模板)链的易位之后是反向(补体)链的易位。然而,这种发夹连接的多核苷酸的制备会增加样品制备时间并导致有价值分析物的损失。此外,发夹连接的模板和补体多核苷酸链通过纳米孔的易位可能引起该纳米孔另一(反式)侧上的链的重新杂交。这可能会改变易位速率,从而导致较低的测序准确性。
发明内容
本公开的方面涉及用于使用纳米孔来表征核酸的组合物和方法。本公开部分基于用于增加核酸链的后续测序的方法。还提供了可以在该方法中使用的组合物和系统,该组合物和系统包括例如用于附接至双链多核苷酸和/或系链剂的衔接子。
在一些方面,本公开提供了一种方法,其包括:将多条系链添加到包含设置在膜中的纳米孔的孔中,其中添加到该孔中的系链的浓度为至少100nM;使该纳米孔与包含一对非共价结合的单链核酸的双链核酸复合物接触,该一对中的每个单链核酸包含具有前导区的衔接子;以及对该膜施加电势以促进该单链核酸通过该纳米孔的易位。
在一些实施例中,一对中的第一核酸和第二核酸各自是DNA或RNA。在一些实施例中,一对中的第一核酸和第二核酸是彼此互补的。
在一些实施例中,一对中的第一单链核酸的衔接子定位在该第一单链核酸的5'端上。在一些实施例中,一对中的第二单链核酸的衔接子定位在该第二单链核酸的5'端上。
在一些实施例中,每个前导区包括一个或多个聚dT区段。在一些实施例中,每个前导区包括两个或更多个聚dT区段,任选地,其中聚dT区段中的每个聚dT区段是不连续的。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,纳米孔是蛋白质纳米孔,任选地,其中该纳米孔是CsgG纳米孔。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚。在一些实施例中,系链中的每条系链包含辛基-生育酚。在一些实施例中,添加到孔中的系链的浓度包括约100nM至1μM、500nM至2μM、1μM至10μM或5μM至50μM。
在一些实施例中,该方法进一步包括以下步骤:测量指示一对中的第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的该第一和第二核酸两者的数据来确定双链核酸复合物的特征。
在一些实施例中,该方法进一步包括:检测对应于通过纳米孔的离子流的信号,以检测易位通过孔的第一和第二核酸的多核苷酸;识别对应于该一对中的第一核酸的易位的信号和对应于该一对中的该第二核酸的单独易位的顺序信号;以及分析识别到的该信号,从而对双链核酸复合物进行测序。
在一些方面,本公开提供了包含双链核酸复合物的系统,每个复合物包含一对非共价结合的单链核酸,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨该膜施加电势以促进该单链核酸通过该纳米孔的易位,并且其中该系统被配置使得一对中的核酸顺序易位通过该纳米孔的可能性大于来自不同对的非共价结合的单链核酸的核酸顺序易位通过该纳米孔的可能性。
在一些方面,本公开提供了包含双链核酸复合物的系统,每个复合物包含一对非共价结合的单链核酸,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨该膜施加电势以促进该单链核酸通过纳米孔的易位,并且其中该膜包含多条系链,该多条系链被配置和布置成促进非共价结合的单链核酸对中的成员以至少10%的后续读取频率顺序易位通过该纳米孔。
在一些实施例中,一对中的第一核酸和第二核酸各自是DNA或RNA。在一些实施例中,一对中的第一核酸和第二核酸是彼此互补的。
在一些实施例中,一对中的第一单链核酸的衔接子定位在该第一单链核酸的5'端上。在一些实施例中,一对中的第二单链核酸的衔接子定位在该第二单链核酸的5'端上。
在一些实施例中,每个前导区包括一个或多个聚dT区段。在一些实施例中,每个前导区包括两个或更多个聚dT区段,任选地,其中聚dT区段中的每个聚dT区段是不连续的。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,纳米孔是蛋白质纳米孔。在一些实施例中,纳米孔是CsgG纳米孔。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚。在一些实施例中,系链中的每条系链包含辛基-生育酚。
在一些实施例中,一对中的核酸顺序易位通过纳米孔的可能性比来自不同对的非共价结合的单链核酸的核酸顺序易位通过该纳米孔的可能性大至少15%、20%、25%或30%。
在一些实施例中,每条系链包含疏水锚定物和包含与该疏水锚定物偶联的多核苷酸的系链接头,其中每个衔接子包含多核苷酸,该多核苷酸的至少一部分与该系链接头的相应部分杂交以形成一段具有长度为约24至30个碱基对的双链多核苷酸。
在一些方面,本公开提供了用于使两个非共价结合的分子顺序易位通过纳米孔的方法,该方法包括:接触包含一对非共价结合的单链核酸的双链核酸复合物,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,该膜包含在孔中,其中添加到该孔中的系链的浓度为至少1μM;以及向该膜施加电势,其中在施加电势之后,第一单链核酸易位通过该纳米孔,并且当该第一单链核酸易位时,使第二单链核酸与该系链中的存在于该膜上的至少一条系链可逆地结合,并且在该一对中的该第一单链核酸已经完全易位通过该纳米孔之后,使该一对中的该第二单链核酸易位通过该纳米孔。
在一些方面,本公开提供了用于使两个非共价结合的分子顺序易位通过纳米孔的方法,该方法包括:提供包含一对非共价结合的单链核酸的双链核酸复合物,该一对中的每个单链核酸包含具有前导区的衔接子;在促进该一对中的第一单链核酸通过该纳米孔的条件下,使(i)中的该双链核酸复合物与设置在包含多条系链的膜中的纳米孔接触,该膜包含在孔中,其中添加到该孔中的系链的浓度为至少1μM;使第二单链核酸与该系链中的存在于该膜上的至少一条系链可逆地结合;以及在该一对中的该第一单链核酸已经完全易位通过该纳米孔之后,使该一对中的该第二单链核酸易位通过该纳米孔。
在一些实施例中,一对中的第一核酸和第二核酸各自是DNA或RNA。在一些实施例中,一对中的第一核酸和第二核酸是彼此互补的。
在一些实施例中,每个前导区包括一个或多个聚dT区段。在一些实施例中,每个前导区包括两个或更多个聚dT区段,其中这些聚dT区段中的每个聚dT区段是不连续的。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,纳米孔是蛋白质纳米孔。在一些实施例中,纳米孔是CsgG纳米孔。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚,任选地,其中系链中的每条系链包含辛基-生育酚。在一些实施例中,添加到孔中的系链的浓度包括约1μM至5μM、2μM至20μM或10μM至50μM。
在一些实施例中,促进该一对中的第一单链核酸通过纳米孔的易位的条件包括跨膜施加电势。
在一些实施例中,使该一对中的第二单链核酸易位通过纳米孔包括:通过纳米孔捕获第二单链核酸的前导区。
在一些实施例中,该一对中的第二单链核酸紧接该一对中的第一单链核酸之后易位通过纳米孔。
在一些实施例中,不是复合物一部分的一种或多种核酸在该一对中的第二单链核酸易位通过纳米孔之前易位通过该纳米孔。
在一些实施例中,在第一单链核酸完全易位通过纳米孔之后,该第一单链核酸和第二单链核酸不再非共价结合。
在一些实施例中,该方法进一步包括:测量指示该一对中的第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的该第一和第二核酸两者的数据来确定双链核酸复合物的特征。
在一些实施例中,该方法进一步包括:检测对应于通过纳米孔的离子流的信号,以检测易位通过孔的第一和第二核酸的多核苷酸;识别对应于该一对中的第一核酸的易位的信号和对应于该一对中的该第二核酸的单独易位的顺序信号;以及分析识别到的该信号,从而对双链核酸复合物进行测序。
在一些方面,本公开提供了双链核酸复合物,该双链核酸复合物包含第一单链核酸和第一衔接子,该第一单链核酸包含第一模板核酸区段,其中该第一衔接子包含前导序列,该前导序列包含至少两个非连续的聚dT区段,其中该第一单链核酸与第二单链核酸非共价结合,该第二单链核酸包含与该第一模板核酸区段互补的第二模板核酸区段,以及第二衔接子,其中该第二衔接子包含前导序列,该前导序列包含至少两个不连续的聚dT区段;以及系链。
在一些实施例中,第一模板核酸区段和/或第二模板核酸区段是DNA或RNA。
在一些实施例中,每个前导区包括三个或更多个不连续的聚dT区段。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚。在一些实施例中,系链中的每条系链包含辛基-生育酚。
在一些方面,本公开提供了一种用于核酸测序的系统,该系统包括:孔,该孔包括设置在膜中的纳米孔;多条系链,其中添加到该孔中的该多条系链的浓度为至少100nM;双链核酸分子,该双链核酸分子包含与互补的第二链杂交的第一链,每条链包含前导序列,该前导序列包含至少两个不连续的聚dT区段。
附图说明
图1示出了与仅包含iSpC3间隔分子的前导区相比,当使用包含聚dT的前导区时孔中的链捕获增加,如实例2中详述。
图2示出了使用四种不同杂交长度获得的后续百分比,如实例3中详述。后续分类根据重点从上到下呈现在每个条中。
具体实施方式
本公开的方面涉及用于使用纳米孔来表征核酸的组合物和方法。本公开部分基于用于增加核酸链的后续测序的方法。如本文所用,“后续”或“后续事件”是指双链核酸分子的两条互补核酸链以顺序(例如,一条链接着另一条链)方式易位通过纳米孔。在一些实施例中,后续包括:双链核酸分子的两条互补核酸链(例如,一对链)紧接着易位通过纳米孔(例如,在该一对中的两条核酸链之前没有其他分子的单链核酸通过孔)。在一些实施例中,后续包括:不是互补核酸对(例如,双链核酸分子的互补链)的一部分的一种或多种(例如,1、2、3、4、5种等)核酸在该一对中的第一核酸和第二核酸通过纳米孔的易位之间易位通过孔。在一些实施例中,后续包括:不是互补核酸对(例如,双链核酸分子的互补链)的一部分的少于10种(例如,10、9、8、7、6、5、4、3、2或1种)核酸在该一对中的第一核酸和第二核酸通过纳米孔的易位之间易位通过孔。在一些实施例中,本文所述的方法和系统惊人地将纳米孔测序期间的后续事件增加至超过约10%、15%、25%或30%。在一些实施例中,本文所述的方法和系统令人惊讶地将纳米孔测序期间的后续事件增加至超过30%。在一些实施例中,本文所述的方法和系统令人惊讶地将纳米孔测序期间的后续事件增加至超过约35%、40%、45%、50%、55%、60%、65%、70%或75%。不希望受任何特定理论的束缚,由本文所述的组合物、系统和方法介导的后续事件的增加改善了例如通过Q分数测量的测序质量。
在一些实施例中,本文所述的方法进一步包括:执行比对以识别双链核酸复合物的单链核酸对,其中在候选对的序列之间或候选对的序列与参考序列之间进行比对。在一个实施例中,在单链核酸被识别为与多于一条其他核酸链配对的情况下,在时间上彼此最接近地易位纳米孔的两条链可以被确定为实际对。在一个实施例中,该方法因此还可以包括:测量单链核酸的易位时间以确定易位顺序和易位之间的时间。
核酸
本公开的方面涉及用于对核酸进行测序的组合物和方法。在一些实施例中,核酸是双链的。在一些实施例中,双链核酸包含一对非共价结合的单链核酸。
如本文所用,术语“非共价结合的分子”是指包含第一成员和第二成员的分子,其中该第一成员和该第二成员通过非共价附接的方式彼此相关联并且可以彼此分离作为单独的实体。第一成员和第二成员之间的分离和结合过程是可逆的。非共价附接方式的实例包括但不限于互补碱基配对、离子相互作用、疏水相互作用和/或范德华相互作用。
在一些实施例中,非共价结合的分子包含互补的多核苷酸链。两条多核苷酸链之间的互补区(例如,链之间发生互补碱基配对的区)的长度可以变化。在一些实施例中,两条多核苷酸链在该两条多核苷酸链的整个长度上是至少50%、60%、70%、80%、90%、95%、99%或99%互补的。在一些实施例中,两条多核苷酸链在该两条多核苷酸链的整个长度上是100%互补的。在一些实施例中,两条多核苷酸链在该两条多核苷酸链中较短者的长度上是至少50%、60%、70%、80%、90%、95%、99%或99%互补的。在一些实施例中,两条多核苷酸链在该两条多核苷酸链中较短者的长度上是100%互补的。
在一些实施例中,非共价结合的分子对包含与衔接子偶联的靶核酸(例如,靶双链多核苷酸)。衔接子在整个说明书中进行了一般性描述,并且在下面标题为“衔接子”的部分中进行了详细描述。
应当注意的是,本文所述的衔接子可以附接至双链多核苷酸的任一端或两端(例如,每条多核苷酸链的5'端、每条多核苷酸链的3'端、或者每条多核苷酸链的5'端和3'端两者)。在一些实施例中,相同的衔接子附接至双链多核苷酸的两端。在一些实施例中,不同衔接子可以附接至双链多核苷酸的端。不同衔接子与双链多核苷酸的端的附接可以例如通过将两个或更多个不同衔接子群体与双链多核苷酸混合在一起来实现。通常,形成与不同衔接子附接的双链多核苷酸的混合物,但也存在获得所需异源衔接子混合物的方法(例如,通过纯化或通过控制衔接子与双链多核苷酸的端的附接)。
多核苷酸可以是核酸,诸如脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含与DNA的一条链杂交的RNA的一条链。多核苷酸可以是本领域已知的任何合成核酸,诸如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其他合成聚合物。PNA主链由通过肽键连接的重复N-(2-氨基乙基)-甘氨酸单元构成。GNA主链由通过磷酸二酯键连接的重复二醇单元组成。TNA主链由通过磷酸二酯键连接的重复苏糖组成。LNA由如上所讨论的核糖核苷酸形成,具有连接核糖部分中的2'氧和4'碳的额外桥。
多核苷酸优选是DNA、RNA或DNA或RNA杂交体,最优选DNA。靶多核苷酸可以是双链的。靶多核苷酸可以包含单链区和具有其他结构的区,诸如发夹环、三链体和/或四链体。DNA/RNA杂交体可以包含同一链上的DNA和RNA。优选地,DNA/RNA杂交体包含与RNA链杂交的一条DNA链。
在一些实施例中,靶多核苷酸不包含发夹结构或任何用于连接模板和补体的共价键。在一些实施例中,靶多核苷酸(例如,模板)和与该靶多核苷酸互补的多核苷酸(例如,补体)不通过桥接部分(诸如发夹环)连接。然而,在一些实施例中,当单链(例如,模板或补体)易位通过纳米孔时,由于其两端上的衔接子的相互作用,该链本身可以形成发夹结构。这种衔接子设计可以有利于表征长多核苷酸,例如,通过保持链的另一端靠近纳米孔。
复合物的每条核酸链(例如,靶多核苷酸链或其互补链)可以为任何长度。例如,多核苷酸在长度上可以是至少10、至少50、至少100、至少150、至少200、至少250、至少300、至少400或至少500个核苷酸或核苷酸对。靶多核苷酸在长度上可以是1000或更多个核苷酸或核苷酸对、5000或更多个核苷酸或核苷酸对、或者100000或更多个核苷酸或核苷酸对、或者500,000或更多个核苷酸或核苷酸对、或者1,000,000或更多个核苷酸或核苷酸、10,000,000个或更多个核苷酸或核苷酸对、或者100,000,000或更多个核苷酸或核苷酸对、或者200,000,000或更多个核苷酸或核苷酸对、或者染色体的整个长度。靶多核苷酸可以是寡核苷酸。寡核苷酸是短核苷酸聚合物,其通常具有50或更少个核苷酸,诸如40或更少、30或更少、20或更少、10或更少或5或更少个核苷酸。靶寡核苷酸在长度上优选为约15至约30个核苷酸,诸如长度为约20至约25个核苷酸。例如,寡核苷酸在长度上可以是约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个核苷酸。
靶多核苷酸可以是较长靶多核苷酸的片段。在该实施例中,较长的靶多核苷酸通常被片段化成多个(诸如两个或更多个)较短的靶多核苷酸。本发明的方法可以用于对那些较短的靶多核苷酸中的一个或多个(诸如2、3、4、5或更多个)较短的靶多核苷酸进行测序。
在一些实施例中,本文所述的各个方面的方法可以用于对样品内的多个靶多核苷酸(诸如2、3、4或5至10、15、20或更多个靶多核苷酸)进行取样。
在一些实施例中,本文所述的各个方面的方法可以用于对样品中以双链形式存在的多核苷酸进行测序。
在一些实施例中,双链多核苷酸可以在其3'端或5'端具有衔接子。这种构型在本文中也可以称为双链核酸复合物。
在一些实施例中,双链多核苷酸可以具有附接至每条多核苷酸链的3'端或每条多核苷酸链的5'端的衔接子。这种构型在本文中也可以称为双链核酸复合物。
靶多核苷酸通常存在于包含该靶多核苷酸的多个拷贝的样品中和/或包含多种不同多核苷酸的样品中。在一些实施例中,本文所述的任何方面的方法可以包括:确定样品中的一种或多种靶多核苷酸的序列。该方法可以包括:使孔与两种或更多种双链多核苷酸接触。例如,该方法可以包括:使孔与样品接触,其中基本上所有双链多核苷酸在其两条链中的每一条链上都具有单链前导序列。在一些实施例中,双链多核苷酸仅经由互补碱基配对彼此偶联。在这些实施例中,双链多核苷酸可以具有四个自由端,其中自由端是多核苷酸链的端。多核苷酸链的端可以是单链的(例如,单链突出端)或与另一条多核苷酸链碱基配对。在一些实施例中,被测序的双链多核苷酸的两条链不是共价附接的(例如,没有发夹或其他共价附接)。然而,可以将不桥接模板和互补多核苷酸的部分添加到自由端中的一个或多个自由端。
样品
本公开的方面涉及对样品(例如,从受试者(例如人类受试者)获得的样品)中存在的一种或多种分析物(例如,靶多核苷酸)进行测序。分析物可以包括蛋白质、肽、分子、多肽、多核苷酸等。样品可以是任何合适的样品。样品可以是生物样品。本文所述的方法的任何实施例可以在从任何生物体或微生物获得或提取的样品上体外执行。生物体或微生物通常是古生菌、原核生物或真核生物,并且通常属于五个界中的一个界:植物界、动物界、真菌界、原核生物界和原生界。在一些实施例中,本文所述的各个方面的方法可以在从任何病毒获得或提取的样品上体外执行。
样品优选是流体样品。样品通常包含体液。体液可以获自人或动物。人或动物可能患有、怀疑患有疾病或处于患病风险中。样品可以是尿液、淋巴液、唾液、粘液、精液或羊水,但优选是全血、血浆或血清。通常,样品源自人类,但或者,它可以来自另一哺乳动物(诸如来自商业养殖的动物(诸如马、牛、羊或猪))或者可以另选地是宠物,诸如猫或狗。
或者,植物来源的样品通常获自商业作物,诸如谷类、豆类、水果或蔬菜,例如,小麦、大麦、燕麦、油菜籽、玉米、大豆、稻米、香蕉、苹果、西红柿、马铃薯、葡萄、烟草、豆类、扁豆、甘蔗、可可、棉花、茶或咖啡。
样品可以是非生物样品。非生物样品优选是流体样品。非生物样品的实例包括手术液、水(诸如饮用水、海水或河水)以及用于实验室测试的试剂。
可以在测定之前对样品进行处理,例如通过离心或通过穿过过滤掉不需要的分子或细胞(诸如红细胞)的膜。取样后可以立即进行测量。样品通常也可以在测定之前储存,优选低于-70℃。
在一些实施例中,样品可以包含基因组DNA。基因组DNA可以被片段化,或者本文所述的任何方法还可以包括片段化基因组DNA。DNA可以通过任何合适的方法片段化。例如,片段化DNA的方法是本领域已知的。此类方法可以使用转座酶,诸如MuA转座酶或市售的G管。
前导区
本公开的方面涉及包含第一核酸链和第二核酸链的双链核酸复合物,每条链包含前导区(也称为前导序列)。前导序列通常包含聚合物。聚合物优选带负电荷。聚合物优选是多核苷酸(诸如DNA或RNA)、经修饰的多核苷酸(诸如碱性DNA)、PNA、LNA、聚乙二醇(PEG)或多肽。前导区优选包含多核苷酸,并且更优选包含单链多核苷酸。
前导区可以为任何长度,但在长度上通常为10至150个核苷酸,诸如为20至150个核苷酸。前导区的长度通常取决于该方法中使用的跨膜孔。
本公开部分基于这样的认识:在一些实施例中,刚性或加强前导序列(例如,相对于先前使用的前导序列)在对双链核酸的链测序期间提供增强的后续。在一些实施例中,前导区(例如,加强或刚性前导区)包含一个或多个聚dT区段。在一些实施例中,前导区(例如,硬化或刚性前导区)包含2、3、4、5、6、7、8、9或10个聚dT区段。每个聚dT区段的长度可以不同。在一些实施例中,每个聚dT区段在长度上的范围为约2至约15个dT核苷酸(例如,2、3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸)。在一些实施例中,每个聚dT区段在长度上的范围为约2至约30个dT核苷酸(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸)。在一些实施例中,每个聚dT区段在长度上的范围为约5至约10个dT核苷酸(例如,5、6、7、8、9或10个核苷酸)。
在一些实施例中,聚dT区段是不连续的(例如,每个聚dT区段沿着相同的基于磷酸酯的主链存在,但被一个或多个不包含dT核苷的核苷酸分隔开)。分隔聚dT区段的前导序列的长度可以不同。在一些实施例中,非聚dT前导序列的长度范围为约1至约5(例如,1、2、3、4或5)个核苷酸。非聚dT核苷酸中的每个非聚dT核苷酸可以选自A、G或C或它们的修饰版本。在一些实施例中,前导区(例如,刚性前导区)包含少于1、2、3、4、5、6、7、8、9或10个非dT核苷酸的核苷酸。
本公开部分基于相对于先前使用的前导区包括较少间隔分子的前导区。不希望受理论束缚,间隔分子的减少被认为增加了前导区的刚性(例如,刚度)并有助于改善纳米孔测序期间的后续。在一些实施例中,前导区包括1、2、3、4、5、6、7、8、9或10个间隔分子。在一些实施例中,每个间隔分子单独选自iSpC3、iSpC9和iSpC18分子,例如如Integrated DNATechnologies所述(也称为C3、iSp9和iSp18间隔分子)。
在一些实施例中,间隔分子可以包含硝基吲哚、肌苷、吖啶、2-氨基嘌呤、2-6-二氨基嘌呤、5-溴-脱氧尿苷、反向胸苷、反向双脱氧胸苷、双脱氧-胞苷(ddC)、5-甲基胞苷、5-羟甲基胞苷、2'-邻甲基RNA碱基、异脱氧胞苷(Iso-dC)、异脱氧鸟苷(Iso-dG)、C3(OC3H6OPO3)基团、光可裂解(PC)[OC3H6-C(O)NHCH2-C6H3NO2-CH(CH3)OPO3]基团、己二醇基团、间隔子9(iSp9)[(OCH2CH2)3OPO3]基团或间隔子18(iSp18)[(OCH2CH2)6OPO3]基团。
前导序列优先穿入跨膜孔,并且因此促进多核苷酸穿过该孔的移动。前导序列也可以用于将多核苷酸连接至如本文所讨论的一个或多个锚定物。
通常,前导序列存在于靶多核苷酸的一端以及与该靶多核苷酸互补的多核苷酸的一端处。前导序列可以存在于靶多核苷酸的5'端和该靶多核苷酸的补体的5'端处。或者,前导序列可以存在于靶多核苷酸的3'端和该靶多核苷酸的补体的3'端处。前导序列可以存在于靶多核苷酸的5'端和互补多核苷酸的3'端处,或反之亦然。在这些后面的实施例中,通常使用两种不同多核苷酸结合蛋白(例如,多核苷酸解旋酶),其中第一多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿多核苷酸在5'至3'的方向上移动,并且第二多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿多核苷酸在3'至5'的方向上移动。
前导序列可以通过任何合适的方法附接至双链多核苷酸。例如,前导序列可以连接至靶多核苷酸和/或其补体。或者,前导序列可以通过消化双链多核苷酸的一条链以在另一条链上产生单链突出端来生成。
多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以在其附接至靶多核苷酸或其补体之前与前导序列结合。多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以与存在于双链多核苷酸中的前导序列结合。与前导序列结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)的活性可以停滞,直到多核苷酸接触跨膜孔。使多核苷酸结合蛋白(例如,多核苷酸解旋酶)停滞的方法是本领域已知的,例如在WO 2014/135838中。
衔接子
前导序列可以存在于衔接子中。在一些实施例中,衔接子包含双链区(例如,双链体茎)和至少一个单链区。单链区中的至少一个单链区可以是前导序列。衔接子可以包含至少一个非多核苷酸区。附接至靶双链多核苷酸两端的衔接子可以是相同或不同的。优选地,该一对中的衔接子是相同的。
前导序列优选存在于衔接子一条链的5'端(或3'端)处的第一单链区中。第二单链区可以存在于衔接子的另一条链的3'端(或5'端)处。衔接子的第一和第二单链区是不互补的。在该实施例中,衔接子可以称为Y衔接子。
Y衔接子通常包含(a)双链区(例如,双链体茎)和(b)单链区或在另一端不互补的区。如果Y衔接子包含单链区,则它可以被描述为具有突出端。Y衔接子中非互补区的存在赋予衔接子其Y形状,因为与双链部分不同,两条链通常不会彼此杂交。Y衔接子可以包括一个或多个锚定物。
在一些实施例中,Y衔接子包含优先穿入孔中的前导序列。在一些实施例中,可以使用本领域已知的任何方法将Y衔接子附接至多核苷酸。例如,衔接子中的一个或两个衔接子可以使用连接酶连接,诸如T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、Tma DNA连接酶和9°N DNA连接酶。
在一些实施例中,样品中的双链多核苷酸被修饰,使得它们在两端包含Y衔接子。可以使用任何方式的修饰。该方法可以包括:通过添加衔接子来修饰双链靶多核苷酸。
通过使多核苷酸与MuA转座酶和双链MuA底物群体接触,可以为双链多核苷酸提供衔接子,诸如Y衔接子或锚定物(例如,系链)。转座酶将双链多核苷酸片段化并将MuA底物连接至片段的一端或两端。这产生了多个包含衔接子或锚定物的经修饰的双链多核苷酸。然后可以使用本发明的方法研究经修饰的双链多核苷酸。这些基于MuA的方法公开于WO2015/022544和WO 2016/059363中。它们也在WO2015/150786中进行详细讨论。
衔接子还可以包含锚定物以将包含靶多核苷酸的双链多核苷酸和/或其补体拴系至包含孔的膜,即衔接子还可以包含膜系链。锚定物优选附接至不是前导序列的单链区。
在一些实施例中,衔接子具有与其结合(例如与前导区结合)的多核苷酸结合蛋白。用于将多核苷酸结合蛋白加载到多核苷酸衔接子上的合适的方法描述于WO 2020/234612中,其通过引用的方式整体并入本文。
多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以与衔接子中的前导序列结合,或者可以在衔接子已经附接至双链多核苷酸之后添加多核苷酸结合蛋白(例如,多核苷酸解旋酶)。与前导序列结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)的活性可以停滞,直到多核苷酸接触跨膜孔。
前导序列或衔接子可以通过任何合适的方法附接至双链多核苷酸。例如,前导序列可以连接至靶多核苷酸和/或其补体,或者衔接子可以连接至双链多核苷酸。
在一些实施例中,双链条形码序列可以连接至靶双链多核苷酸的一端或两端。可以在添加前导序列或衔接子之前将条形码序列添加到双链多核苷酸。例如,条形码序列可以位于靶双链多核苷酸的端和衔接子之间。在一些实施例中,条形码序列包含在衔接子中。
唯一的条形码序列可以附接(例如连接)至样品中的每个双链多核苷酸。条形码序列可以用于识别对应于靶多核苷酸和与该靶多核苷酸互补的多核苷酸顺序易位通过孔的信号。
在一些实施例中,本文所述的衔接子(例如,不包含前导区的衔接子区段)可以包含一个或多个间隔子以防止预结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿着双链多核苷酸移动并解旋该双链多核苷酸。这些间隔子防止多核苷酸结合蛋白(例如,多核苷酸解旋酶)的进一步移动,直到该多核苷酸结合蛋白(例如,多核苷酸解旋酶)位于孔处并且跨孔施加电势差。电势差提供的附加力将多核苷酸结合蛋白(例如,多核苷酸解旋酶)推到间隔子上并允许其解旋并控制多核苷酸通过纳米孔的移动。因此,多核苷酸结合蛋白(例如,多核苷酸解旋酶)的移动通常仅在多核苷酸位于纳米孔中时而不是之前发生。间隔子和用于防止预结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿着双链多核苷酸移动并解旋该双链多核苷酸直至多核苷酸处于纳米孔中的方法的实例描述于例如WO2015/110813中,其内容通过引用的方式整体并入本文。
适合在表征双链多核苷酸的方法中使用的衔接子的另外的实例描述于WO 2018/100370和WO 2020/234612中,其内容通过引用的方式整体并入本文。
系链
本公开的各个方面涉及用于改善后续的方法和系统,其包含系链剂(也称为锚定物、系链或膜系链)。可以使用一个或多条系链将双链核酸复合物(例如,双链靶多核苷酸,其中多核苷酸的每条链包含前导区或衔接子)与膜偶联。通常,一个或多条系链附接至靶多核苷酸的每条链。在一些实施例中,系链是衔接子的一部分。系链和将系链附接至衔接子的方法的实例公开于WO 2012/164270和WO 2015/150786中,其内容通过引用的方式整体并入本文。
如果膜是两亲层(诸如三嵌段共聚物膜),则一个或多条系链优选包含可以插入膜中的多肽锚定物和/或疏水锚定物。疏水锚定物优选包含脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸酯或生育酚。在优选的实施例中,一个或多条系链不连接(例如,结合)纳米孔。
在一些实施例中,系链剂是系链复合物的一部分,并且系链复合物集中于两亲层的区域中。将系链复合物集中于在两亲层的区域中的方法描述于PCT/GB2020/053104(对应于国际公开WO 2021/111139)中,其通过引用的方式整体并入本文。
膜的组分(诸如两亲分子、共聚物或脂质)可以被化学修饰或功能化以形成一个或多个锚定物。下面更详细地讨论合适的化学修饰和功能化膜的组分的合适的方法的实例。任何比例的膜组分可以被功能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。
在一些实施例中,一种或多种锚定物优选包含一种或多种接头。一种或多种锚定物可以包含一种或多种(诸如2、3、4或更多种)接头。在一些实施例中,每个接头选自iSpC3、iSpC9(iSp9)和iSpC18(iSp18)分子,例如,如Integrated DNA Technologies所述。接头的另外的实例包括但不限于聚合物,诸如多核苷酸、聚乙二醇(PEG)、多糖和多肽。这些接头可以是直链、支链或环状的。例如,接头可以是环状多核苷酸。靶多核苷酸可以与环多核苷酸接头上的互补序列杂交。
在一些实施例中,一种或多种系链或一种或多种接头可以包含可以被切割或分解的组分,诸如限制位点或光不稳定基团。
功能化接头和它们可以偶联分子的方法是本领域已知的。例如,用马来酰亚胺基团功能化的接头将与蛋白质中的半胱氨酸残基反应并附接。
使用“锁和钥匙”布置可以避免多核苷酸的交联。每个接头仅一端可以一起反应以形成更长的接头,并且该接头的另一端各自分别与多核苷酸或膜反应。此类接头描述于WO2010/086602中。
双链核酸复合物经由一个或多条系链与膜的偶联可以是永久的或稳定的。换句话说,偶联可以使得多核苷酸在与孔相互作用时保持与膜偶联。
这种偶联可以是瞬时的。换句话说,偶联可以使得多核苷酸在与孔相互作用时可以与膜解偶联。对于多核苷酸测序,偶联的瞬时性质是优选的。如果永久或稳定的接头直接附接至多核苷酸的5'或3'端,并且该接头短于膜和跨膜孔的通道之间的距离,那么一些序列数据将丢失,因为测序运行不能继续到多核苷酸的端。如果偶联是瞬时的,那么当偶联的端随机脱离膜时,则可以将多核苷酸加工至完成。靶多核苷酸和/或其补体可以瞬时偶联至膜,诸如两亲层,例如,使用胆固醇、脂肪酰基链或生育酚的三嵌段共聚物膜或脂质膜。可以使用长度为6至30个碳原子的任何脂肪酰基链,诸如十六烷酸。
在一些实施例中,系链包含生育酚。生育酚是包含具有羟基的色满环和疏水侧链的化合物。生育酚的四种已知形式(α(alpha)、β(beta)、γ(gamma)和δ(delta))的不同之处在于甲基在色满环上的定位。在一些实施例中,系链包含生育酚和一个或多个接头(例如,iSpC3接头、iSpC8接头、iSpC9分子等)。在一些实施例中,系链包含生育酚和iSpC8接头(也称为辛基-生育酚)。
本公开部分基于以下认识:增加包含设置在膜中的纳米孔的孔中的系链的浓度提高后续事件频率。系链的浓度(例如,添加到包含设置在膜中的纳米孔的孔中的系链浓度)可以不同。在一些实施例中,添加到孔中的浓度为约100nM与500nM、250nM与800nM、400nM与1μM、600nM与1.5μM、1.0μM与2.5μM、2.0μM与4.0μM或3.0与5.0μM之间。在一些实施例中,添加到孔中的浓度超过5.0μM(例如,8μM、10μM、15μM)。如实例中所述,已经观察到增加系链的浓度令人惊讶地增加纳米孔测序期间的后续事件。该观察结果是令人惊讶的,因为之前认为包含设置在膜中的纳米孔的孔中的系链(例如,添加>50nM系链)的浓度增加会不期望地导致孔堵塞。
在一些实施例中,在递送至膜之前将一个或多条系链与双链核酸复合物混合。在一些实施例中,一个或多条系链与膜接触,并且随后与双链核酸复合物接触。
根据一些实施例,当复合物的一条链附接至优先穿入孔中的前导序列(例如,加强或刚性先导区)时,一个或多条系链(例如,辛基-生育酚系链)可以用于将双链核酸复合物偶联至膜。
在一些实施例中,双链核酸复合物包含衔接子,并且该复合物经由该衔接子与系链之间的相互作用与膜偶联。
在一些实施例中,系链包含疏水锚定物和与疏水锚定物偶联的接头(也称为系链接头),该接头包含多核苷酸。在一些实施例中,疏水锚定物包含生育酚。在一些实施例中,疏水锚定物包含辛基-生育酚。
在一些实施例中,疏水锚定物和系链接头经由一个或多个间隔分子(例如,1、2、3、4、5、6、7、8、9或10个间隔分子)彼此连接,诸如本文所述。在一些实施例中,一种或多种间隔分子是iSpC3间隔分子、iSp9间隔分子或iSp18间隔分子。
在一个实施例中,系链接头包含长度为约24至约30个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为约25至约30个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为24、25、26、27、28、29或30个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为24、25或26个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为25个核苷酸的多核苷酸。
在一些实施例中,衔接子包含多核苷酸,该多核苷酸的至少一部分与系链接头的相应部分杂交以形成双链多核苷酸区段。衔接子中包含的多核苷酸的至少一部分和系链接头的相应部分可以彼此互补,例如,可以包含互补核酸序列或由互补核酸序列组成。
在一个实施例中,由此形成的双链多核苷酸区段具有约24至30个碱基对、约25至30个碱基对或者约20、21、22、23、24、25、26、27、28、29或30个碱基对的长度。在一个实施例中,双链多核苷酸区段具有24、25或26个碱基对的长度。在一个实施例中,双链多核苷酸片段具有25个碱基对的长度。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的相应部分杂交。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的互补多核苷酸区段杂交。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的互补多核苷酸区段杂交以形成长度为24、25或26个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为24、25或26个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含长度为24、25或26个核苷酸的多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为24、25或26个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的互补多核苷酸区段杂交以形成长度为25个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为25个碱基对的双链多核苷酸。
在一个实施例中,系链包含长度为25个核苷酸的多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为25个碱基对的双链多核苷酸。
发明人发现,当杂交部分在长度上为约24至约30个碱基对时,经由系链接头和衔接子之间的杂交将系链连接至衔接子可以提供增加的后续率。不希望受理论的束缚,发明人相信,通过增加杂交部分的长度,在系链和衔接子之间产生更强的附接,这降低了模板在模板链穿过孔时补体链衔接子从膜脱离的可能性,并且因此增加了补体链接头保留在孔附近并在模板链穿过孔后立即被捕获用于测序的可能性,从而提高了后续率。
纳米孔
跨膜孔是在某种程度上穿过膜的结构。它允许由施加的电势驱动的水合离子流过膜或在膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不必穿过膜。它的一端可以是封闭的。例如,孔可以是膜中的间隙、通道、沟槽或狭缝,水合离子可以沿着其流动或流入其中。
任何跨膜孔都可以用于本发明中。孔可以是生物的或人造的。合适的孔包括但不限于蛋白质孔、多核苷酸孔和固态孔。孔可以是DNA折纸孔(Langecker等人,Science,2012;338:932-936)。孔可以是马达蛋白纳米孔,例如,允许双链多核苷酸易位的纳米孔。在一些实施例中,马达蛋白纳米孔能够解旋双链多核苷酸。示例性马达蛋白纳米孔包括但不限于phi29马达蛋白纳米孔,例如,如Wendell等人"Translocation of double-stranded DNAthrough membrane-adapted phi29 motor protein nanopores"Nat Nanotechnol,4(2009),第765-772页中所述。在一些实施例中,Feng等人"Nanopore-based fourth-generation DNA sequencing technology"Genomics,Proteomics&Bioinformatics(2015),第13卷,第1期,第4-16页中所述或引用的任何纳米孔可以用于本文所述的各个方面中。
跨膜孔优选为跨膜蛋白孔。跨膜蛋白孔是允许水合离子(诸如多核苷酸)从膜的一侧流到该膜的另一侧的多肽或多肽的集合。在本发明中,跨膜蛋白孔能够形成允许由施加的电势驱动的水合离子从膜的一侧流到另一侧的孔。跨膜蛋白孔优选允许多核苷酸从膜(诸如三嵌段共聚物膜)的一侧流到另一侧。跨膜蛋白孔允许多核苷酸(诸如DNA或RNA)穿过孔。
跨膜蛋白孔可以是单体或寡聚物。孔优选地由数个重复亚基组成,诸如至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15或至少16个亚基。孔优选是六聚体、七聚体、八聚体或九聚体孔。孔可以是同源低聚物或异源低聚物。
跨膜蛋白孔通常包括离子可以流过的桶或通道。孔的亚基通常围绕中心轴并为跨膜β桶或通道或跨膜α-螺旋束或通道贡献链。
跨膜蛋白孔的桶或通道通常包含促进与核苷酸、多核苷酸或核酸相互作用的氨基酸。这些氨基酸优选位于桶或通道的缩颈附近。跨膜蛋白孔通常包括一种或多种带正电荷的氨基酸,诸如精氨酸、赖氨酸或组氨酸或芳香族氨基酸,诸如酪氨酸或色氨酸。这些氨基酸通常促进孔与核苷酸、多核苷酸或核酸之间的相互作用。
根据本发明使用的跨膜蛋白孔可以源自β-桶孔或α-螺旋束孔。β-桶孔包含由β-链形成的桶或通道。合适的β-桶孔包括但不限于β-毒素(诸如α-溶血素、炭疽毒素和杀白细胞素)以及细菌的外膜蛋白/孔蛋白(诸如耻垢分枝杆菌孔蛋白(Msp),例如,MspA、MspB、MspC或MspD、CsgG、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟菌自转运脂蛋白(NalP))和其他孔,诸如溶素。α-螺旋束孔包含由α-螺旋形成的桶或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和外膜蛋白,诸如WZA和ClyA毒素。在一些实施例中,纳米孔是CsgG纳米孔。
跨膜孔可以源自或基于Msp、α-溶血素(α-HL)、胞溶素、CsgG、ClyA、Spl和溶血蛋白茶香毒素C(FraC)。跨膜蛋白孔优选源自CsgG,更优选源自大肠杆菌链K-12子链MC4100的CsgG。来自CsgG的合适的孔公开于WO 2016/034591、WO 2017/149316、WO 2017/149317、WO2017/149318和WO 2019/002893中。跨膜结构域可以源自胞溶素。源自胞溶素的合适的孔公开于WO 2013/153359中。
本文所述的蛋白质中的任何蛋白质(诸如跨膜蛋白孔)可以被修饰以帮助其识别或纯化,例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉抗生物素蛋白标签、标记标签、SUMO标签、GST标签或MBP标签或者通过添加信号序列以促进它们从其中多肽天然不含有这样的序列的细胞中分泌。引入遗传标签的另一方法是将标签化学反应到孔或构建体上的天然或工程化位置上。这样的实例是使凝胶转移试剂与在孔外部工程化的半胱氨酸反应。这已经被证明是一种分离溶血素异寡聚物的方法(Chem Biol.1997年7月;4(7):497-505)。孔可以用显示标签来标记。显示标记可以是允许检测孔的任何合适的标记。合适的标记包括但不限于荧光分子、放射性同位素(例如,125I、35S)、酶、抗体、抗原、多核苷酸和配体,诸如生物素。
本文所述的蛋白质中的任何蛋白质(诸如跨膜蛋白孔)可以合成制备或通过重组的方式制备。例如,孔可以通过体外翻译和转录(IVTT)来合成。孔的氨基酸序列可以被修饰以包括非天然存在的氨基酸或以增加蛋白质的稳定性。当通过合成方式生产蛋白质时,可以在生产期间中引入此类氨基酸。孔也可以在合成或重组生产之后进行改变。
本文所述的蛋白质中的任何蛋白质(诸如跨膜蛋白质孔)可以使用本领域已知的标准方法来生产。编码孔或构建体的多核苷酸序列可以使用本领域的标准方法得到和复制。编码孔或构建体的多核苷酸序列可以使用本领域的标准技术在细菌宿主细胞中进行表达。可以通过来自重组表达载体的多肽的原位表达来在细胞中产生孔。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法描述于Sambrook,J.和Russell,D.(2001),Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY。
可以在通过任何蛋白质液相色谱系统从蛋白质产生生物体进行纯化之后或在重组表达之后大规模产生孔。典型的蛋白质液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、Bio-Rad BioLogic系统和Gilson HPLC系统。
孔可以以阵列的形式提供,诸如包含多个纳米孔的纳米孔阵列。此类阵列描述于例如WO 2014/064443中,其通过引用的方式整体并入本文。
在一些实施例中,孔不包含缀合至孔的标签(例如,核酸标签),该标签与双链核酸复合物的一部分结合。例如,在一些实施例中,孔不包含缀合至孔的标签,诸如WO 2018/100370中所述;因此,在一些实施例中,孔不是标签修饰的孔,诸如WO 2018/100370中所述。
膜
根据本文所述的各个方面可以使用任何膜。合适的膜是本领域众所周知的。膜优选是两亲层或固态层。
两亲层是由两亲分子(诸如磷脂)形成的层,其具有亲水性和亲脂性。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物是本领域已知的并且包括例如嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中两个或多个单体亚基聚合在一起以形成单个聚合物链的聚合物材料。嵌段共聚物通常具有由每个单体亚基贡献的特性。然而,嵌段共聚物可能具有由各个亚基形成的聚合物所不具备的独特特性。嵌段共聚物可以被工程化使得单体亚基中的一个单体亚基是疏水性的(即亲脂性的),而其他亚基在水性介质中时是亲水性的。在这种情况下,嵌段共聚物可以具有两亲特性并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚基组成),但也可以由两个以上的单体亚基构建以形成表现为两亲物的更复杂的排列。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选是三嵌段共聚物膜。
古细菌双极性四醚脂质是天然存在的脂质,该脂质被构造使得脂质形成单层膜。这些脂质通常存在于在恶劣的生物环境中生存的极端微生物、嗜热微生物、嗜盐微生物和嗜酸微生物中。据信它们的稳定性源自最终双层的融合性质。通过产生具有亲水-疏水-亲水一般基序的三嵌段聚合物,可以直接构建模拟这些生物实体的嵌段共聚物材料。这种材料可以形成单体膜,其行为类似于脂质双层,并涵盖从囊泡到层状膜的一系列相行为。由这些三嵌段共聚物形成的膜与生物脂质膜相比具有多个优点。由于三嵌段共聚物是合成的,因此可以仔细控制精确的结构,以提供形成膜和与孔和其他蛋白质相互作用所需的正确链长和特性。
嵌段共聚物也可以由不属于脂质子材料的亚基构建;例如,疏水聚合物可以由硅氧烷或其他非烃基单体制成。嵌段共聚物的亲水子区段也可以具有低蛋白质结合特性,这允许产生在暴露于原始生物样品时具有高度耐受性的膜。该头基单元也可以源自非经典脂质头基。
与生物脂质膜相比,三嵌段共聚物膜还具有增加的机械稳定性和环境稳定性,例如,更高的操作温度或pH范围。嵌段共聚物的合成性质提供了一个平台为各种应用定制聚合物基膜。
膜最优选是WO2014/064443或WO2014/064444中公开的膜中的一者。
两亲分子可以被化学修饰或功能化以促进多核苷酸的偶联。
两亲层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以被支撑。两亲层可以是凹的。两亲层可以悬挂在凸起的柱上,使得该两亲层的外围区(其附接至柱)高于两亲层区。这可以允许微粒沿着膜行进、移动、滑动或滚动,如上所述。
两亲膜通常是天然可移动的,本质上充当二维流体,脂质扩散速率约为10-8cm s-1。这意味着孔和偶联的多核苷酸通常可以在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并且充当用于一系列实验研究的优秀平台。例如,脂质双层可以用于通过单通道记录进行膜蛋白的体外研究。或者,脂质双层可以用作生物传感器来检测一系列物质的存在。脂质双层可以是任何脂质双层。合适的脂质双层包括但不限于平面脂质双层、支撑双层或脂质体。脂质双层优选是平面脂质双层。合适的脂质双层公开于WO 2008/102121、WO 2009/077734和WO 2006/100484中。
用于形成脂质双层的方法是本领域已知的。脂质双层通常通过Montal和Mueller的方法形成(Proc.Natl.Acad.Sci.美国,1972;69:3561-3566),其中脂质单层通过垂直于水溶液/空气界面的孔的任一侧承载在该水溶液/空气界面上。通常通过以下将脂质添加到电解质水溶液的表面:首先将其溶解在有机溶剂中,并且然后让一滴溶剂在孔的任一侧的水溶液表面上蒸发。一旦有机溶剂蒸发,孔的任一侧上的溶液/空气界面就会物理地上下移动经过孔,直到形成双层。平面脂质双层可以跨过膜中的孔或跨进入凹部的开口形成。
Montal和Mueller的方法很受欢迎,因为它是一种具有成本效益且相对简单的形成适合蛋白质孔插入的优质脂质双层的方法。双层形成的其他常见方法包括尖端浸渍、涂层双层和脂质体双层的膜片钳。
尖端浸渍双层形成需要将孔表面(例如,移液管吸头)接触到携带单层脂质的测试溶液的表面。同样,通过允许溶解在有机溶剂中的一滴脂质在溶液表面蒸发来首先在溶液/空气界面处生成脂质单层。然后双层通过Langmuir-Schaefer工艺来形成,并且需要机械自动化来相对于溶液表面移动孔。
对于涂层双层,将溶解在有机溶剂中的一滴脂质直接涂在孔上,将其浸入测试水溶液中。使用画笔或类似物将脂质溶液薄薄地涂在孔上。溶剂的稀释导致脂质双层的形成。然而,从双层中完全去除溶剂是困难的,并且因此通过该方法形成的双层不太稳定且在电化学测量期间更容易产生噪声。
膜片钳常用于生物细胞膜的研究中。通过吸力将细胞膜夹在移液管端,并将一小块膜附接在孔上。该方法已经适用于通过夹紧脂质体来产生脂质双层,然后脂质体破裂,留下密封在移液管的孔上的脂质双层。该方法需要稳定、巨大且单层的脂质体,并在具有玻璃表面的材料中制造小孔。
脂质体可以通过超声处理、挤压或Mozafari方法形成(Colas等人(2007)Micron38:841-847)。
在一个优选的实施例中,脂质双层如WO 2009/077734中所述形成。有利地,在该方法中,脂质双层由干燥的脂质形成。在最优选的实施例中,脂质双层跨开口形成,如WO2009/077734中所述。
脂质双层由两个相对的脂质层形成。排列两层脂质使得它们的疏水尾基彼此面对以形成疏水内部。脂质的亲水头基团向外面向双层每侧的水环境。双层可以存在于许多脂质相中,包括但不限于液体无序相(流体层状)、液体有序相、固体有序相(层状凝胶相、叉指状凝胶相)和平面双层晶体(层状亚凝胶相、层状晶体相)。
可以使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得形成具有所需特性(诸如表面电荷、支撑膜蛋白的能力、堆积密度或机械特性)的脂质双层。脂质组合物可以包括一种或多种不同脂质。例如,脂质组合物可以含有多达100种脂质。脂质组合物优选含有1至10种脂质。脂质组合物可以包括天然存在的脂质和/或人造脂质。
脂质通常包含头基、界面部分和两个可以相同或不同的疏水尾基。合适的头基包括但不限于:中性头基,诸如二酰基甘油酯(DG)和神经酰胺(CM);两性离子头基,诸如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电荷的头基,诸如磷脂酰甘油(PG);磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷酸(PA)和心磷脂(CA);以及带正电的头基,诸如三甲基铵丙烷(TAP)。合适的界面部分包括但不限于天然存在的界面部分,诸如基于甘油或基于神经酰胺的部分。合适的疏水尾基包括但不限于:饱和烃链,诸如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,诸如油酸(顺式-9-十八烷酸);以及支链烃链,诸如植烷酰基。不饱和烃链中链的长度以及双键的位置和数量可以不同。支链烃链中链的长度以及支链(诸如甲基)的位置和数量可以不同。疏水尾基可以作为醚或酯连接至界面部分。脂质可以是霉菌酸。
脂质也可以被化学修饰。脂质的头基或尾基可以被化学修饰。其头基已经被化学修饰的合适的脂质包括但不限于:PEG修饰的脂质,诸如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];功能化的PEG脂质,诸如1,2-二硬脂酰-sn-甘油-3磷酸乙醇胺-N-[生物素(聚乙二醇)2000];以及缀合修饰的脂质,诸如1,2-二油酰-sn-甘油-3-磷酸乙醇胺-N-(琥珀酰)和1,2-二棕榈酰-sn-甘油-3-磷酸乙醇胺-N-(生物素)。其尾基已经被化学修饰的合适的脂质包括但不限于:可聚合脂质,诸如1,2-双(10,12-二十三碳二炔酰基)-sn-甘油-3-磷酸胆碱;氟化脂质,诸如1-棕榈酰-2-(16-氟棕榈酰)-sn-甘油-3-磷酸胆碱;氘化脂质,诸如1,2-二棕榈酰-D62-sn-甘油-3-磷酸胆碱;以及醚连接的脂质,诸如1,2-二-邻植烷酰基-sn-甘油-3-磷酸胆碱。脂质可以被化学修饰或功能化以促进多核苷酸的偶联。
两亲层(例如,脂质组合物)通常包含将影响该层的特性的一种或多种添加剂。合适的添加剂包括但不限于:脂肪酸,诸如棕榈酸、肉豆蔻酸和油酸;脂肪醇,诸如棕榈醇、肉豆蔻醇和油醇;甾醇,诸如胆固醇、麦角甾醇、羊毛甾醇、谷甾醇和豆甾醇;溶血磷脂,诸如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;以及神经酰胺。
固态层可以由有机和无机材料形成,包括但不限于微电子材料、绝缘材料(诸如Si3N4、Al2O3和SiO)、有机和无机聚合物(诸如聚酰胺、塑料(诸如特氟隆)或弹性体(诸如双组分加成固化硅橡胶))以及玻璃。固态层可以由石墨烯形成。合适的石墨烯层公开于WO2009/035647中。Yusko等人,Nature Nanotechnology,2011;6:253-260和美国专利申请号2013/0048499描述了在不使用微粒的情况下将蛋白质递送至固态层中的跨膜孔。本发明的方法可以用于改进这些文献中公开的方法中的递送。
该方法通常使用以下来执行:(i)包含孔的人工两亲层、(ii)包含孔的分离的天然存在的脂质双层或(iii)孔插入其中的细胞。该方法通常使用人造两亲层(诸如人造三嵌段共聚物层)来执行。除了孔之外,层还可以包括其他跨膜和/或膜内蛋白质以及其他分子。下面讨论合适的装置和条件。本发明的方法通常在体外执行。
根据本发明的方法对其递送多核苷酸的膜包含在液体中。液体使膜保持“湿润”并防止其干燥。液体通常是水溶液。水溶液通常具有与水相同的密度。水溶液的密度通常为约1g/cm3。溶液的密度可能取决于温度和溶液的具体成分而有所不同。水溶液通常具有约0.97至约1.03g/cm3的密度。
膜通常分离两体积的水溶液。膜阻止电流在体积之间的流动。插入膜中的跨膜孔选择性地允许离子穿过膜,这可以记录为电极在两体积水溶液中检测到的电信号。靶多核苷酸的存在调节离子流,并且通过观察电信号的最终变化来检测。
多核苷酸结合蛋白
本公开的方面涉及包含一种或多种多核苷酸结合蛋白的方法、组合物和系统。多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以是能够与多核苷酸结合并控制其通过孔的移动的任何蛋白质。
本文所述的方法中的任何方法可以包括以下步骤:控制单链核酸(例如,最初包含在如本文所述的双链核酸复合物中的单链核酸)通过纳米孔的移动(例如,易位)。
在本领域中确定蛋白质是否与多核苷酸结合是简单的。蛋白质通常与多核苷酸相互作用并修饰多核苷酸的至少一种特性。蛋白质可以通过切割多核苷酸以形成单独的核苷酸或更短的核苷酸链(诸如二核苷酸或三核苷酸)来修饰该多核苷酸。部分可以通过将多核苷酸定向或将其移动到特定位置(即控制其移动)来修饰该多核苷酸。
多核苷酸结合蛋白(例如,多核苷酸解旋酶)优选源自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸的至少一种特性相互作用并对其进行修饰的多肽。酶可以通过切割多核苷酸以形成单独的核苷酸或更短的核苷酸链(诸如二核苷酸或三核苷酸)来修饰该多核苷酸。酶可以通过将多核苷酸定向或移动至特定位置来修饰该多核苷酸。多核苷酸处理酶不需要表现出酶活性,只要它能够结合多核苷酸并控制其通过孔的移动即可。例如,酶可以被修饰以去除其酶活性或者可以在阻止其充当酶的条件下使用。下面更详细地讨论此类条件。
通常,多核苷酸结合蛋白是解旋酶、聚合酶、核酸外切酶、拓扑异构酶或它们的变体。
多核苷酸处理酶优选源自核酸水解酶。用于酶构建体的多核苷酸处理酶更优选源自酶分类(EC)组3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31中任一者的成员。酶可以是WO 2010/086603中公开的那些酶中的任一者。
优选的酶是聚合酶、解旋酶、转位酶和拓扑异构酶,诸如旋转酶。聚合酶可以是PyroPhage 3173DNA聚合酶(其可从Lucigen Corporation商购)、SD聚合酶(可从Bioron商购)或它们的变体。聚合酶优选是Phi29 DNA聚合酶或其变体。拓扑异构酶优选是部分分类(EC)组5.99.1.2和5.99.1.3中任一者的成员。
酶最优选源自解旋酶。解旋酶可以是或源自He1308解旋酶、RecD解旋酶,诸如Tral解旋酶或TrwC解旋酶、XPD解旋酶或Dda解旋酶。解旋酶可以是或源自He1308 Mbu、He1308Csy、He1308 Tga、He1308 Mhu、Tral Eco、XPD Mbu或它们的变体。
解旋酶可以是WO 2013/057495、WO 2013/098562、WO2013098561、WO 2014/013260、WO 2014/013259、WO 2014/013262和WO/2015/055981中公开的解旋酶、经修饰的解旋酶或解旋酶构建体中的任一者。
Dda解旋酶优选包含WO/2015/055981和WO 2016/055777中公开的修饰中的任一者。
根据本发明可以使用任何数量的解旋酶。例如,可以使用1种、2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种解旋酶。在一些实施例中,可以使用不同数量的解旋酶。可以使用上述解旋酶中的两种或者更多种解旋酶的任何组合。两种或更多种解旋酶可以是两种或更多种Dda解旋酶。两种或更多种解旋酶可以是一种或多种Dda解旋酶和一种或多种TrwC解旋酶。两种或更多种解旋酶可以是相同解旋酶的不同变体。
两种或更多种解旋酶优选彼此附接。两种或更多种解旋酶更优选彼此共价附接。解旋酶可以以任何顺序并使用任何方法附接。用于本发明的优选解旋酶构建体描述于WO2014/013260、WO 2014/013259、WO 2014/013262和WO2015/055981中。
在一些实施例中,多核苷酸结合蛋白是多核苷酸解旋酶。多核苷酸解旋酶是能够将双链多核苷酸解旋成单链的酶。在一些实施例中,多核苷酸解旋酶能够将双链DNA解旋成单链。在一些实施例中,多核苷酸解旋酶是具有解旋酶活性的酶。多核苷酸解旋酶的实例包括例如本文所述的解旋酶。
可以使用本领域已知的任何方法测量多核苷酸结合能力。例如,可以使蛋白质与多核苷酸接触,并且可以测量其结合多核苷酸并沿着多核苷酸移动的能力。蛋白质可以包括促进多核苷酸结合和/或促进其在高盐浓度和/或室温下的活性的修饰。蛋白质可以被修饰使得它们结合多核苷酸(即保留多核苷酸结合能力),但不充当解旋酶(即,当具有促进移动的所有必要组分(例如ATP和Mg2+时,不沿着多核苷酸移动)。此类修饰在领域是已知的。例如,解旋酶中Mg2+结合结构域的修饰通常产生不充当解旋酶的变体。这些类型的变体可以充当分子制动器。
酶可以共价附接至孔。可以使用任何方法将酶共价附接至孔。
在链测序中,多核苷酸在施加的电势下或逆着施加的电势易位通过孔。渐进地或持续地作用于双链多核苷酸的核酸外切酶可以用于孔的顺式侧,以在施加的电势下使剩余的单链馈送通过,或者在反向电势下用于反式侧。同样,解旋双链DNA的解旋酶也可以以类似的方式使用。也可以使用聚合酶。测序应用也可能需要逆着施加的电势进行链易位,但DNA必须首先在反向电势或无电势下被酶“捕获”。随着结合后电势被切换回来,链将从顺式到反式穿过孔,并通过电流保持在延伸构象中。单链DNA核酸外切酶或单链DNA依赖性聚合酶可以充当分子马达,以受控的逐步方式(从反式到顺式)逆着施加的电势将最近易位的单链拉回通过孔。
任何解旋酶均可以用于本发明。解旋酶对于孔可以以两种模式工作。首先,该方法优选使用解旋酶执行,使得其利用由施加的电压产生的场使多核苷酸移动通过孔。在这种模式下,多核苷酸的5'端首先被捕获在孔中,并且解旋酶将多核苷酸移动到孔中,使得它通过具有场的孔,直到它最终易位通过到膜的反式侧。或者,该方法优选执行,使得解旋酶逆着由所施加的电压产生的场使多核苷酸移动通过孔。在这种模式下,多核苷酸的3'端首先被捕获在孔中,并且解旋酶将多核苷酸移动通过孔,使得它逆着施加的场被拉出孔,直到最终弹回到膜的顺式侧。
该方法也可以以相反的方向执行。多核苷酸的3'端首先被捕获在孔中,并且解旋酶可以将多核苷酸移动到孔中,使得它通过具有场的孔,直到它最终易位通过到膜的反式侧。
当解旋酶不具有促进移动的必要成分或被修饰以阻碍或阻止其移动时,它可以与多核苷酸结合,并在多核苷酸被施加的场拉入孔中时充当减慢多核苷酸移动的制动器。在不活动模式下,多核苷酸是在3'还是5'向下捕获并不重要,是施加的场将多核苷酸拉向反式侧进入孔中,其中酶充当制动器。当在非活动模式下时,解旋酶对多核苷酸的移动控制可以以多种方式描述,包括棘轮、滑动和制动。缺乏解旋酶活性的解旋酶变体也可以以这种方式使用。
多核苷酸可以以任何顺序与多核苷酸结合蛋白(例如,多核苷酸解旋酶)和孔接触。优选的是,当多核苷酸与多核苷酸结合蛋白((例如,多核苷酸解旋酶)诸如解旋酶)和孔接触时,多核苷酸首先与多核苷酸结合蛋白(例如,多核苷酸解旋酶)形成复合物。当跨孔施加电压时,多核苷酸/多核苷酸结合蛋白(例如,多核苷酸解旋酶)复合物随后与孔形成复合物并控制多核苷酸通过孔的移动。
可以修饰多核苷酸结合蛋白以防止该多核苷酸结合蛋白从多核苷酸脱离。因此,靶多核苷酸优选不从多核苷酸结合蛋白脱离。
如本文所用,术语“脱离”是指多核苷酸结合蛋白从靶多核苷酸解离。因此,可以修饰多核苷酸结合蛋白以防止其从靶多核苷酸解离,例如进入反应介质中。区分多核苷酸结合蛋白的潜在“脱离”和多核苷酸结合蛋白从靶多核苷酸“解开”是重要的。如本文所用,“解开”是指靶多核苷酸瞬时释放到多核苷酸结合蛋白的活动位点(本文更详细地描述),但并不意味着脱离。因此,例如,可以修饰多核苷酸结合蛋白以防止多核苷酸结合蛋白从多核苷酸脱离,但不防止多核苷酸结合蛋白从多核苷酸解开。当未结合时,多核苷酸结合蛋白保持与靶多核苷酸接合。例如,多核苷酸结合蛋白可以保持与靶多核苷酸接合(即,可以防止它从靶多核苷酸脱离),因为它在靶多核苷酸周围是拓扑上闭合的。多核苷酸结合位点可以保持自由以结合或解开靶多核苷酸,使得多核苷酸结合蛋白可以与靶多核苷酸结合或解开,同时多核苷酸结合蛋白保持与靶多核苷酸接合。当多核苷酸结合蛋白从靶多核苷酸解开时,它能够在施加的力下在靶多核苷酸上(例如,沿着)移动并且能够与靶多核苷酸重新结合。当接合于靶多核苷酸上但从靶多核苷酸解开时,多核苷酸结合蛋白不能从靶多核苷酸解离。
多核苷酸结合蛋白可以适合于以任何合适的方式防止脱离。例如,可以将多核苷酸结合蛋白加载到多核苷酸上并且然后进行修饰以便防止其从多核苷酸脱离。或者,可以修饰多核苷酸结合蛋白以防止其在加载到多核苷酸上之前从多核苷酸脱离。对多核苷酸结合蛋白和/或多核苷酸结合蛋白进行修饰以便防止其从多核苷酸脱离可以使用本领域已知的方法来实现,诸如WO 2014/013260中讨论的那些,其通过引用的方式整体并入本文,并且特别参考描述对多核苷酸结合蛋白(诸如解旋酶)进行修饰以便防止其与多核苷酸链脱离的段落。例如,可以通过用四甲基偶氮二甲酰胺(TMAD)处理来修饰多核苷酸结合蛋白。各种其他闭合部分描述于WO 2021/255476(其通过引用的方式整体并入本文)中。
例如,多核苷酸结合蛋白和/或多核苷酸结合蛋白可以具有多核苷酸非结合开口,例如,当多核苷酸结合蛋白从链脱离时多核苷酸链可以通过的空腔、裂缝或空隙。多核苷酸非结合开口可以是当多核苷酸结合蛋白从多核苷酸脱离时多核苷酸可以通过的开口。针对给定的多核苷酸结合蛋白的多核苷酸非结合开口可以通过参考其结构来确定,例如,通过参考其X射线晶体结构。X射线晶体结构可以在存在和/或不存在多核苷酸底物的情况下获得。多核苷酸非结合开口在给定的多核苷酸结合蛋白中的位置可以使用本领域已知的标准包通过分子建模来推断或确认。多核苷酸非结合开口可以通过一个或多个部分(例如,多核苷酸结合蛋白的一个或多个结构域)的移动来瞬时产生。
可以通过闭合多核苷酸非结合开口来修饰多核苷酸结合蛋白。可以用闭合部分闭合多核苷酸非结合开口。因此,闭合多核苷酸非结合开口可以防止多核苷酸结合蛋白从多核苷酸脱离。例如,可以通过共价闭合多核苷酸非结合开口来修饰多核苷酸结合蛋白。然而,如上所解释,闭合多核苷酸非结合开口不一定阻止靶多核苷酸从多核苷酸结合蛋白的多核苷酸结合位点解开。用于以这种方式寻址的优选蛋白质是解旋酶。
多核苷酸结合蛋白可以用闭合部分来修饰,用于:(i)拓扑上闭合靶多核苷酸周围的多核苷酸结合蛋白的多核苷酸结合位点和(ii)促进靶多核苷酸从多核苷酸结合蛋白的多核苷酸结合位点解开和/或延迟靶多核苷酸与多核苷酸结合蛋白的多核苷酸结合位点的重新结合。多核苷酸结合蛋白可以以任何合适的方式修饰以促进此类闭合部分的附接。
闭合部分可以包含双功能交联部分。闭合部分可以包含双功能交联剂。双功能交联剂可以在多核苷酸结合蛋白上的两个点处附接并闭合多核苷酸结合蛋白的多核苷酸非结合开口,从而防止多核苷酸从多核苷酸结合蛋白脱离,同时允许多核苷酸从多核苷酸结合蛋白的多核苷酸结合位点解开。
闭合部分可以附接在多核苷酸结合蛋白上的任何合适的位置处。例如,闭合部分可以交联多核苷酸结合蛋白的两个氨基酸残基。通常,通过闭合部分交联的至少一种氨基酸是半胱氨酸或非天然氨基酸。可以通过对多核苷酸结合蛋白的天然存在的氨基酸残基的取代或修饰来将半胱氨酸或非天然氨基酸引入多核苷酸结合蛋白中。用于引入非天然氨基酸的方法是本领域众所周知的,并且包括例如与包含此类非天然氨基酸的合成多肽链的天然化学连接。用于将半胱氨酸引入多核苷酸结合蛋白中的方法同样在本领域技术人员的能力范围内,例如,使用参考文献中公开的技术,诸如Sambrook等人,Molecular Cloning:ALaboratory Manual,第4版,Cold Spring Harbor Press,Plainsview,New York(2012);以及Ausubel等人,Current Protocols in Molecular Biology(附录114),John Wiley&Sons,New York(2016)。
闭合部分可以具有约至约/>的长度。闭合部分的长度可以根据静态键长或更优选地使用分子动力学模拟来计算。长度可以例如为约/>至约/>诸如约/>至约例如,约/>至约/>诸如约/>至约/>或约/>例如,约/>
本文更详细地讨论了适合于使用如上所述的闭合部分来闭合的多核苷酸结合蛋白。多核苷酸结合蛋白优选是解旋酶,例如,本文所述的Dda解旋酶。
多核苷酸结合蛋白可以是外切核酸酶或可以源自外切核酸酶。合适的酶包括但不限于来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III、来自嗜热链球菌的RecJ和噬菌体λ核酸外切酶、TatD核酸外切酶及它们的变体。
多核苷酸结合蛋白可以是聚合酶。聚合酶可以是3173DNA聚合酶(其可从/>Corporation商购)、SD聚合酶(可从/>商购)、来自NEB的Klenow或其变体。在一个实施例中,酶是Phi29 DNA聚合酶或其变体。可以用于本发明的Phi29聚合酶的修饰版本公开于美国专利号5,576,204中。
多核苷酸结合蛋白可以是拓扑异构酶。在一个实施例中,拓扑异构酶是部分分类(EC)组5.99.1.2和5.99.1.3中的任一者的成员。拓扑异构酶可以是逆转录酶,其是能够催化从RNA模板形成cDNA的酶。它们可从例如New England和/>商购。
多核苷酸结合蛋白优选是解旋酶。可以根据本发明的方法使用任何合适的解旋酶。例如,根据本公开内容使用的该酶或每种酶可以独立地选自Hel308解旋酶、RecD解旋酶、TraI解旋酶、TrwC解旋酶、XPD解旋酶和Dda解旋酶或它们的变体。单体解旋酶可以包括附接在一起的几个结构域。例如,TraI解旋酶和TraI亚组解旋酶可以含有两个RecD解旋酶结构域、一个松弛酶结构域和一个C末端结构域。这些结构域通常形成单体解旋酶,该解旋酶能够在不形成寡聚体的情况下发挥作用。合适的解旋酶的具体实例包括Hel308、NS3、Dda、UvrD、Rep、PcrA、Pif1和TraI。这些解旋酶通常作用于单链DNA。可以沿着双链DNA的两条链移动的解旋酶的实例包括FtfK和六聚酶复合物或多亚基复合物,诸如RecBCD。多核苷酸结合蛋白优选是Dda(DNA依赖性ATP酶)解旋酶。
Hel308解旋酶在公开(诸如WO 2013/057495)中描述,其全部内容通过引用的方式并入。RecD解旋酶在公开(诸如WO 2013/098562)中描述,其全部内容通过引用的方式并入。XPD解旋酶在公开(诸如WO 2013/098561)中描述,其全部内容通过引用的方式并入。Dda解旋酶在公开(诸如WO 2015/055981和WO 2016/055777)中描述,其全部内容通过引用的方式并入。
解旋酶可以是Trwc Cba或其变体、Hel308 Mbu或其变体或Dda或其变体。变体可以以本文讨论的任何方式不同于天然序列。Dda的示例性变体包括E94C/A360C。Dda的另一示例性变体包括E94C/A360C,并且然后包括(ΔM1)G1G2(即,删除M1,并且然后添加G1和G2)。
方法
在一些方面,本公开涉及通过使复合物的链易位通过纳米孔并检测或测量一种或多种信号来对双链核酸复合物进行测序的方法。在一些实施例中,该方法包括:测量指示一对中的第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的该第一和第二核酸两者的数据来确定双链核酸复合物的特征。在一些实施例中,该方法包括:检测对应于通过纳米孔的离子流的信号,以检测易位通过该纳米孔的一对中的第一和第二核酸的多核苷酸;识别对应于该一对中的第一核酸的易位的信号和对应于该一对中的该第二核酸的单独易位的顺序信号;以及分析识别到的该信号,从而对双链核酸复合物进行测序。
如本文所用,术语“易位(translocate)”或“易位(translocation)”是指沿着纳米孔的至少一部分的移动。在一些实施例中,易位是从纳米孔的顺式侧移动到该纳米孔的反式侧。
可以使用电学测量和/或光学测量来监测通过跨膜孔的离子流。
电学测量可以是电流测量、阻抗测量、隧道测量或场效应晶体管(FET)测量。
当多肽易位通过跨膜孔时,通过跨膜孔的离子流的变化可以被检测为电流、电阻或光学特性的变化。测量的效应可以是穿过跨膜孔的电子隧道效应。测量的效应可以是由于多核苷酸与跨膜孔的相互作用而引起的电势的变化,其中在FET测量中使用局部电势传感器来监测该效应。
可以进行多种不同类型的测量。这包括但不限于:电学测量和光学测量。涉及荧光测量的合适的光学方法公开于J.Am.Chem.Soc.2009,131 1652-1653中。可能的电学测量包括电流测量、阻抗测量、隧道测量(Ivanov A P等人,Nano Lett.2011年1月12日;11(1):279-85)以及FET测量(国际申请WO 2005/124888)。光学测量可以与电学测量相结合(SoniG V等人,Rev Sci Instrum.2010年1月;81(1):014301)。测量可以是跨膜电流测量,诸如流过孔的离子电流的测量。
可以使用标准单通道记录设备进行电学测量,如Stoddart D等人,Proc NatlAcad Sci,12;106(19):7702-7,Lieberman K R等人,J Am Chem Soc.2010;132(50):17961-72以及国际申请WO 2000/28312中所述。或者,可以使用多通道系统进行电学测量,例如,如WO 2009/077734和WO 2011/067559中所述。
方法优选在跨膜施加的电势下执行。施加的电势可以是电压电势。或者,施加的电势可以是化学势。在一些实施例中,施加的电势可以由渗透压不平衡来驱动。这个的实例是使用跨膜的盐梯度,诸如两亲层。盐梯度公开于Holden等人,J Am Chem Soc.2007年7月11日;129(27):8650-5中。在一些情况下,当多核苷酸相对于孔移动时穿过该孔的电流用于估计或确定多核苷酸的序列。
在本文所述的各个方面的一些实施例中,该方法可以涉及进一步表征靶多核苷酸。当靶多核苷酸与孔接触时,当多核苷酸相对于该孔移动时,进行指示靶多核苷酸的一个或多个特征的一种或多种测量。
该方法可以涉及确定多核苷酸是否被修饰。可以测量任何经修饰的存在或不存在。该方法优选包括:确定多核苷酸是否被甲基化、氧化、损伤、用一种或多种蛋白质或用一种或多种标记、标签或间隔子修饰。特定的修饰将导致与孔的特定的相互作用,这可以使用下述方法进行测量。例如,甲基胞嘧啶可以基于在其与每个核苷酸相互作用期间通过孔的离子流来与胞嘧啶进行区分。
系统
本公开的方面涉及用于执行本文所述方法的系统。在一些实施例中,系统包含双链核酸复合物,每个复合物包含一对非共价结合的单链核酸,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨该膜施加电势以促进该单链核酸通过该纳米孔的易位,并且其中该系统被配置使得一对中的核酸顺序易位通过该纳米孔的可能性大于来自不同对的非共价结合的单链核酸的核酸顺序易位通过该纳米孔的可能性。在一些实施例中,系统包括孔(例如,测序装置的孔),该孔包括设置在膜中的纳米孔;多条系链,其中添加到该孔中的该多条系链的浓度为至少100nM;双链核酸分子,该双链核酸分子包含与互补的第二链杂交的第一链,每条链包含前导序列,该前导序列包含至少两个非连续的聚dT区段。
该系统可以是适合于研究其中膜中存在孔的膜/孔系统的任何装置的一部分。该方法可以使用适合于跨膜孔感测的任何装置来执行。例如,装置包括包含水溶液的室和将该室分成两个部分的屏障。屏障通常具有孔(例如,孔),在孔中(或穿过孔)形成含有孔的膜。或者,屏障形成其中存在孔的膜。
该方法可以使用WO 2008/102120中所述的装置来执行。可以进行多种不同类型的测量。这包括但不限于:电学测量和光学测量。涉及荧光测量的合适的光学方法公开于J.Am.Chem.Soc.2009,131 1652-1653中。可能的电学测量包括:电流测量、阻抗测量、隧道测量(Ivanov AP等人,Nano Lett.2011年1月12日;11(1):279-85)以及FET测量(国际申请WO 2005/124888)。光学测量可以与电学测量相结合(Soni G V等人,Rev SciInstrum.2010年1月;81(1):014301)。测量可以是跨膜电流测量,诸如流过孔的离子电流的测量。
可以使用标准单通道记录设备进行电学测量,如Stoddart D等人,Proc NatlAcad Sci,12;106(19):7702-7,Lieberman K R等人,J Am Chem Soc.2010;132(50):17961-72以及国际申请WO 2000/28312中所述。或者,可以使用多通道系统进行电学测量,例如,如国际申请WO 2009/077734和国际申请WO 2011/067559中所述。
方法优选在跨膜施加的电势下执行。施加的电势可以是电压电势。或者,施加的电势可以是化学势。这个的实例是使用跨膜的盐梯度,诸如两亲层。盐梯度公开于Holden等人,J Am Chem Soc.2007年7月11日;129(27):8650-5中。在一些情况下,当多核苷酸相对于孔移动时穿过该孔的电流用于估计或确定多核苷酸的序列。
该方法可以涉及测量当多核苷酸相对于孔移动时通过孔的电流。因此,装置也可以包括能够施加电势并测量穿过膜和孔的电信号的电路。该方法可以使用膜片钳或电压钳来执行。该方法优选地涉及电压钳的使用。
本发明的方法可以涉及当多核苷酸相对于孔移动时测量穿过孔的电流。用于测量通过跨膜蛋白孔的离子电流的合适的条件是本领域已知的并且公开于实例中。方法通常通过在膜和孔上施加电压来执行。所使用的电压通常为+5V至-5V,诸如+4V至-4V、+3V至-3V或+2V至-2V。所使用的电压通常为-600mV至+600mV或-400mV至+400mV。所使用的电压优选在具有选自-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV的下限和独立地选自+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV的上限的范围内。所使用的电压更优选在100mV至240mV的范围内并且最优选在120mV至220mV的范围内。通过使用增加的施加电势可以增加孔对不同核苷酸的区分。
该方法通常在任何电荷载流子的存在下执行,诸如金属盐(例如,碱金属盐)、卤化物盐(例如,氯化物盐(诸如碱金属氯化物盐))。电荷载体可以包括离子液体或有机盐,例如,四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑鎓。在上面讨论的示例性装置中,盐存在于室中的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl)或亚铁氰化钾和铁氰化钾的混合物。优选KCl、NaCl以及亚铁氰化钾和铁氰化钾的混合物。电荷载流子可以在膜上是不对称的。例如,膜的每侧上的电荷载流子的类型和/或浓度可以不同。
盐浓度可以处于饱和状态。盐浓度可以为3M或更低,并且通常为0.1至2.5M、0.3至1.9M、0.5至1.8M、0.7至1.7M、0.9至1.6M或1M至1.4M。盐浓度优选为150mM至1M。该方法优选使用至少0.3M(诸如至少0.4M、至少0.5M、至少0.6M、至少0.8M、至少1.0M、至少1.5M、至少2.0M、至少2.5M或至少3.0M)的盐浓度执行。高盐浓度提供高信噪比并允许在正常电流波动的背景下识别指示核苷酸的存在的电流。
该方法通常在缓冲液的存在下执行。在上面讨论的示例性装置中,缓冲液存在于室中的水溶液中。任何缓冲液均可以用于本发明的方法中。通常,缓冲液是磷酸盐缓冲液。其他合适的缓冲液是HEPES和Tris-HCl缓冲液。该方法通常在4.0至12.0、4.5至10.0、5.0至9.0、5.5至8.8、6.0至8.7或7.0至8.8或7.5至8.5的pH下执行。所使用的pH优选为约7.5。
该方法可以在0℃至100℃、15℃至95℃、16℃至90℃、17℃至85℃、18℃至80℃、19℃至70℃或20℃至60℃执行。该方法通常在室温下进行。该方法任选地在支持酶功能的温度下进行,诸如约37℃。
数据分析和比对
如本文所述,在一些实施例中,本文所述的方法进一步包括执行比对步骤。核酸序列比对可以使用本领域已知的各种比对方法中的任一种比对方法执行,例如,诸如WO2015140535或Rang等人,Genome Biol 19,90(2018)中所公开。
可以执行候选对的全部或部分比对。可以指定最小比对重叠,即确定要比对的一对中的核酸的最小数量。对(通常是碱基对)的最小数量可以选自20、50、100、500、1000或更大之间的值。
为了确定核苷酸序列,可以执行本领域已知的各种方法,例如,诸如WO 2015/140535、WO 2013/121224、WO 2020/109773或WO 2018/203084中所公开,所有这些均据此通过引用的方式整体并入本文。
实例1
较高浓度的辛基-生育酚系链可以提高后续率
来自大肠杆菌的基因组DNA被扩增并片段化。使用Oxford NanoporeTechnologies的连接测序试剂盒SQK-LSK109将定制测序衔接子连接到DNA片段,以形成测序文库。
电学测量是在Oxford Nanopore Technologies的GridION流动池上获得的。流动池用冲洗缓冲液装填,并在添加测序文库之前将含有指定浓度的测试系链的冲洗系链添加到该流动池中。将10ng测序文库添加到流动池中。
后续率被确定为被识别为后续事件的链的百分比。
表1
系链 | 后续百分比 |
50nM OTT-a | 15% |
1μM OTT-a | 25% |
50nM CHOL | 12% |
50nM OTT-b | 12% |
表2
定制测序衔接子由以下顶链组成,包括5'前导序列:
3333//99/CTTATTTTTTTATTTTTTTATTTT/3/CTACATCTCCTTATTCGCTGCAC/333/TTmUmUTT/8/CCTGTACTTCGTTCAGTTACGTATTGCT-N3
其中3=iSpC3、8=iSp18、mU=2'OMe RNA、9=iSp9、N3=用叠氮基己酸标记的3'氨基C7。间隔子经由Integrated DNA Technologies,Inc使用的代码表示。
实例2
包含一个或多个聚dT部分的前导区提供增强的孔捕获
根据实例1所述的方法制备DNA测序文库。比较了包含以下前导序列的定制测序衔接子:
聚T:33333333TTTTTTTTTTTTTTTTTTTTTTTT
间隔子:333333333333333333333333333333
3=iSpC3间隔子。
与间隔子前导区相比,聚T前导区的孔捕获和所得灵敏度有所增加(图1)。
实例3
较长的系链和衔接子之间的杂交长度提供增加的后续
根据实例1所述的方法制备DNA测序文库。在添加3ng连接文库之前,用200nM系链引发流动池。
比较了以下系链:
8=iSp18间隔子
较长的杂交序列提高了后续率。用25个碱基对杂交长度实现了最高的后续率(或“双链”数据),提供了大约40%的后续率(所获得的所有数据的百分比)。结果呈现在图2中。
序列表
<110> OXFORD NANOPORE TECHNOLOGIES PLC
<120> 用于补体链测序的方法
<130> N424437WO
<150> US 63/190,689
<151> 2021-05-19
<160> 9
<170> PatentIn版本3.5
<210> 1
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8888,其中8是iSp18间隔子
<220>
<221> misc_feature
<222> (15)..(15)
<223> 3'-Cy5
<400> 1
ttgaccgctc gcctc 15
<210> 2
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[胆固醇]-8888,其中8是iSp18间隔子
<400> 2
ttgaccgctc gcctc 15
<210> 3
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-33,其中3是iSp3间隔子
<400> 3
ttgaccgctc gcctc 15
<210> 4
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-333399,其中3是iSpC3并且9是iSp9
<220>
<221> misc_feature
<222> (24)..(25)
<223> iSpC3
<220>
<221> misc_feature
<222> (47)..(48)
<223> 333,其中3是iSpC3
<220>
<221> misc_feature
<222> (50)..(50)
<223> 2'-邻甲基RNA
<220>
<221> misc_feature
<222> (51)..(51)
<223> 2'-邻甲基RNA
<220>
<221> misc_feature
<222> (53)..(54)
<223> iSp18
<220>
<221> misc_feature
<222> (81)..(81)
<223> 用叠氮基己酸标记的C3'-氨基C7
<400> 4
cttatttttt tattttttta ttttctacat ctccttattc gctgcacttu uttcctgtac 60
ttcgttcagt tacgtattgc t 81
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-33333333,其中3是iSpC3间隔子
<400> 5
tttttttttt tttttttttt tttt 24
<210> 6
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 6
gtcaggatta gtgcgtctac atggc 25
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 7
gtcaggatta gtgcgtctac a 21
<210> 8
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 8
gtcaggatta gtgcgt 16
<210> 9
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 9
gtcaggatta gt 12
Claims (59)
1.一种方法,其包括:
(i)将多条系链添加到包含设置在膜中的纳米孔的孔中,其中添加到所述孔中的系链的浓度为至少100nM;
(ii)使所述纳米孔与包含一对非共价结合的单链核酸的双链核酸复合物接触,所述一对中的每个单链核酸包含具有前导区的衔接子;以及
(iii)向所述膜施加电势以促进所述单链核酸通过所述纳米孔的易位。
2.根据权利要求1所述的方法,其中所述一对中的第一核酸和第二核酸各自是DNA或RNA。
3.根据权利要求1或2所述的方法,其中所述一对中的所述第一核酸和第二核酸是彼此互补的。
4.根据权利要求1至3中任一项所述的方法,其中所述一对中的第一单链核酸的衔接子定位在所述第一单链核酸的5'端上且/或所述一对中的第二单链核酸的衔接子定位在所述第二单链核酸的5'端上。
5.根据权利要求1至4中任一项所述的方法,其中每个前导区包括一个或多个聚dT区段。
6.根据权利要求5所述的方法,其中每个前导区包括两个或更多个聚dT区段,任选地,其中所述聚dT区段中的每个聚dT区段是不连续的。
7.根据权利要求1至6中任一项所述的方法,其中每个衔接子进一步包含一个或多个间隔子。
8.根据权利要求7所述的方法,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
9.根据权利要求1至8中任一项所述的方法,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
10.根据权利要求1至9中任一项所述的方法,其中所述纳米孔是蛋白质纳米孔,任选地,其中所述纳米孔是CsgG纳米孔。
11.根据权利要求1至10中任一项所述的方法,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
12.根据权利要求11所述的方法,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
13.根据权利要求1至12中任一项所述的方法,其中添加到所述孔中的系链的所述浓度包括约100nM至1μM、500nM至2μM、1μM至10μM或5μM至50μM。
14.根据权利要求1至13中任一项所述的方法,其进一步包括以下步骤:测量指示所述一对中的所述第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的所述第一和第二核酸两者的数据来确定所述双链核酸复合物的特征。
15.根据权利要求1至14中任一项所述的方法,其进一步包括:(iv)检测对应于通过所述纳米孔的离子流的信号,以检测易位通过所述孔的所述第一和第二核酸的多核苷酸;(v)识别对应于所述一对中的所述第一核酸的易位的信号和对应于所述一对中的所述第二核酸的单独易位的顺序信号;以及(vi)分析(v)中识别到的所述信号,从而对所述双链核酸复合物进行测序。
16.一种系统,其包含双链核酸复合物,每个复合物包含一对非共价结合的单链核酸,所述一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨所述膜施加电势以促进所述单链核酸通过所述纳米孔的易位,并且其中所述系统被配置使得一对中的核酸顺序易位通过所述纳米孔的可能性大于来自不同对的非共价结合的单链核酸的核酸顺序易位通过所述纳米孔的可能性。
17.一种系统,其包含双链核酸复合物,每个复合物包含一对非共价结合的单链核酸,所述一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨所述膜施加电势以促进所述单链核酸通过所述纳米孔的易位,并且其中所述膜包含多条系链,所述多条系链被配置和布置成促进非共价结合的单链核酸对中的成员以至少10%的后续读取频率顺序易位通过所述纳米孔。
18.根据权利要求16或权利要求17所述的系统,其中所述一对中的所述第一核酸和所述第二核酸各自是DNA或RNA。
19.根据权利要求16至18中任一项所述的系统,其中所述一对中的所述第一核酸和第二核酸是彼此互补的。
20.根据权利要求16至19中任一项所述的系统,其中所述一对中的第一单链核酸的衔接子定位在所述第一单链核酸的5'端上且/或所述一对中的第二单链核酸的衔接子定位在所述第二单链核酸的5'端上。
21.根据权利要求16至20中任一项所述的系统,其中每个前导区包括一个或多个聚dT区段。
22.根据权利要求21所述的系统,其中每个前导区包括两个或更多个聚dT区段,任选地,其中所述聚dT区段中的每个聚dT区段是不连续的。
23.根据权利要求16至22中任一项所述的系统,其中每个衔接子进一步包含一个或多个间隔子。
24.根据权利要求16至23中任一项所述的系统,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
25.根据权利要求16至24中任一项所述的系统,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
26.根据权利要求16至25中任一项所述的系统,其中所述纳米孔是蛋白质纳米孔,任选地,其中所述纳米孔是CsgG纳米孔。
27.根据权利要求16至26中任一项所述的系统,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
28.根据权利要求27所述的系统,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
29.根据权利要求16至28中任一项所述的系统,其中一对中的核酸顺序易位通过所述纳米孔的可能性比来自不同非共价结合的单链核酸对的核酸顺序易位通过所述纳米孔的可能性大至少15%、20%、25%或30%。
30.一种用于使两个非共价结合的分子顺序易位通过纳米孔的方法,所述方法包括:
(i)接触包含一对非共价结合的单链核酸的双链核酸复合物,所述一对中的每个单链核酸包含衔接子,所述衔接子具有通向设置在包含多条系链的膜中的纳米孔的前导区,所述膜包含在孔中,其中添加到所述孔中的系链的浓度为至少1μM;以及
(ii)向所述膜施加电势,其中在施加所述电势之后,第一单链核酸易位通过所述纳米孔,并且当所述第一单链核酸易位时,使第二单链核酸与所述系链中的存在于所述膜上的至少一条系链可逆地结合,并且在所述一对中的所述第一单链核酸已经完全易位通过所述纳米孔之后,所述一对中的所述第二单链核酸易位通过所述纳米孔。
31.一种用于使两个非共价结合的分子顺序易位通过纳米孔的方法,所述方法包括:
(i)提供包含一对非共价结合的单链核酸的双链核酸复合物,所述一对中的每个单链核酸包含具有前导区的衔接子;
(ii)在促进所述一对中的第一单链核酸易位通过所述纳米孔的条件下,使(i)中的所述双链核酸复合物与设置在包含多条系链的膜中的纳米孔接触,所述膜包含在孔中,其中添加到所述孔中的系链的浓度为至少1μM;
(iii)使所述第二单链核酸与所述系链中的存在于所述膜上的至少一条系链可逆地结合;以及
(iv)在所述一对中的所述第一单链核酸已经完全易位通过所述纳米孔之后,使所述一对中的所述第二单链核酸易位通过所述纳米孔。
32.根据权利要求30或31所述的方法,其中所述一对中的所述第一核酸和所述第二核酸各自是DNA或RNA。
33.根据权利要求30至32中任一项所述的方法,其中所述一对中的所述第一核酸和第二核酸是彼此互补的。
34.根据权利要求30至33中任一项所述的方法,其中每个前导区包括一个或多个聚dT区段。
35.根据权利要求34所述的方法,其中每个前导区包括两个或更多个聚dT区段,其中所述聚dT区段中的每个聚dT区段是不连续的。
36.根据权利要求30至35中任一项所述的方法,其中每个衔接子进一步包含一个或多个间隔子。
37.根据权利要求36所述的方法,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
38.根据权利要求30至37中任一项所述的方法,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
39.根据权利要求30至38中任一项所述的方法,其中所述纳米孔是蛋白质纳米孔。
40.根据权利要求30至39中任一项所述的方法,其中所述纳米孔是CsgG纳米孔。
41.根据权利要求30至40中任一项所述的方法,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
42.根据权利要求41所述的方法,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
43.根据权利要求30至42中任一项所述的方法,其中添加到所述孔中的系链的所述浓度包括约1μM至5μM、2μM至20μM或10μM至50μM。
44.根据权利要求31至43中任一项所述的方法,其中促进所述一对中的第一单链核酸通过所述纳米孔的易位包括:跨所述膜施加电势。
45.根据权利要求30至44中任一项所述的方法,其中使所述一对中的所述第二单链核酸易位通过所述纳米孔包括:通过所述纳米孔捕获所述第二单链核酸的所述前导区。
46.根据权利要求30至45中任一项所述的方法,其中所述一对中的所述第二单链核酸紧接在所述一对中的所述第一单链核酸之后易位通过所述纳米孔。
47.根据权利要求30至45中任一项所述的方法,其中不是所述复合物的一部分的一种或多种核酸在所述一对中的所述第二单链核酸易位通过所述纳米孔之前易位通过所述纳米孔。
48.根据权利要求30至47中任一项所述的方法,其中在所述第一单链核酸完全易位通过所述纳米孔之后,所述第一单链核酸和所述第二单链核酸不再非共价结合。
49.根据权利要求30至49中任一项所述的方法,其进一步包括以下步骤:测量指示所述一对中的所述第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的所述第一和第二核酸两者的数据来确定所述双链核酸复合物的特征。
50.根据权利要求30至49中任一项所述的方法,其进一步包括:(a)检测对应于通过所述纳米孔的离子流的信号,以检测易位通过所述孔的所述第一和第二核酸的多核苷酸;(b)识别对应于所述一对中的所述第一核酸的易位的信号和对应于所述一对中的所述第二核酸的单独易位的顺序信号;以及(c)分析(b)中识别到的信号,从而对所述双链核酸复合物进行测序。
51.一种双链核酸复合物,其包含:
(i)第一单链核酸和第一衔接子,所述第一单链核酸包含第一模板核酸,其中所述第一衔接子包含前导序列,所述前导序列包含至少两个非连续的聚dT区段,其中
所述第一单链核酸与第二单链核酸非共价结合,所述第二单链核酸包含与第一模板核酸区段互补的第二模板核酸区段,以及第二衔接子,其中所述第二衔接子包含前导序列,所述前导序列包含至少两个非连续的聚dT区段;以及
(ii)系链。
52.根据权利要求51所述的复合物,其中所述第一模板核酸区段和/或所述第二模板核酸区段是DNA或RNA。
53.根据权利要求51或52所述的复合物,其中每个前导区包括三个或更多个不连续的聚dT区段。
54.根据权利要求51至53中任一项所述的复合物,其中每个衔接子进一步包含一个或多个间隔子。
55.根据权利要求54所述的复合物,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
56.根据权利要求51至55中任一项所述的复合物,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
57.根据权利要求51至56中任一项所述的复合物,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
58.根据权利要求57所述的复合物,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
59.一种包括孔的用于核酸测序的系统,所述系统包括:
(i)设置在膜中的纳米孔;
(ii)多条系链,其中添加到所述孔中的所述多条系链的浓度是至少100nM;
(iii)双链核酸分子,所述双链核酸分子包含与互补的第二链杂交的第一链,每条链包含前导序列,所述前导序列包含至少两个非连续的聚dT区段。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163190689P | 2021-05-19 | 2021-05-19 | |
US63/190,689 | 2021-05-19 | ||
PCT/GB2022/051269 WO2022243692A1 (en) | 2021-05-19 | 2022-05-19 | Methods for complement strand sequencing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117337333A true CN117337333A (zh) | 2024-01-02 |
Family
ID=81854718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280035082.6A Pending CN117337333A (zh) | 2021-05-19 | 2022-05-19 | 用于补体链测序的方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4341433A1 (zh) |
CN (1) | CN117337333A (zh) |
WO (1) | WO2022243692A1 (zh) |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5198543A (en) | 1989-03-24 | 1993-03-30 | Consejo Superior Investigaciones Cientificas | PHI29 DNA polymerase |
US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
WO2005124888A1 (en) | 2004-06-08 | 2005-12-29 | President And Fellows Of Harvard College | Suspended carbon nanotube field effect transistor |
GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
EP2126588A1 (en) | 2007-02-20 | 2009-12-02 | Oxford Nanopore Technologies Limited | Formation of lipid bilayers |
EP3540436B1 (en) | 2007-09-12 | 2023-11-01 | President And Fellows Of Harvard College | High-resolution molecular sensor |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
CN102439043A (zh) | 2009-01-30 | 2012-05-02 | 牛津纳米孔技术有限公司 | 杂交连接物 |
US9127313B2 (en) | 2009-12-01 | 2015-09-08 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument |
US9347929B2 (en) | 2011-03-01 | 2016-05-24 | The Regents Of The University Of Michigan | Controlling translocation through nanopores with fluid wall |
EP4273092A3 (en) | 2011-05-27 | 2024-01-17 | Oxford Nanopore Technologies plc | Method and apparatus for determining the presence, absence or characteristics of an analyte |
BR112014009579B1 (pt) | 2011-10-21 | 2021-06-22 | Oxford Nanopore Technologies Limited | Métodos para caracterizar um polinucleotídeo alvo, e para formar um sensor, uso de uma helicase, kit, e, aparelho de análise |
US9617591B2 (en) | 2011-12-29 | 2017-04-11 | Oxford Nanopore Technologies Ltd. | Method for characterising a polynucleotide by using a XPD helicase |
US10385382B2 (en) | 2011-12-29 | 2019-08-20 | Oxford Nanopore Technologies Ltd. | Enzyme method |
CN104321441B (zh) | 2012-02-16 | 2016-10-19 | 牛津楠路珀尔科技有限公司 | 聚合物的测量的分析 |
BR112014025157B1 (pt) | 2012-04-10 | 2022-02-08 | Oxford Nanopore Technologies Limited | Monômero de lisenina mutante, construto, poro, método para caracterizar um analito alvo, uso de um poro, e, kit |
EP2875154B1 (en) | 2012-07-19 | 2017-08-23 | Oxford Nanopore Technologies Limited | SSB method for characterising a nucleic acid |
CA2879261C (en) | 2012-07-19 | 2022-12-06 | Oxford Nanopore Technologies Limited | Modified helicases |
EP2875152B1 (en) | 2012-07-19 | 2019-10-09 | Oxford Nanopore Technologies Limited | Enzyme construct |
WO2014064444A1 (en) | 2012-10-26 | 2014-05-01 | Oxford Nanopore Technologies Limited | Droplet interfaces |
GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
WO2014135838A1 (en) | 2013-03-08 | 2014-09-12 | Oxford Nanopore Technologies Limited | Enzyme stalling method |
JP6677640B2 (ja) | 2013-10-18 | 2020-04-08 | オックスフォード ナノポール テクノロジーズ リミテッド | 修飾酵素 |
WO2015110813A1 (en) | 2014-01-22 | 2015-07-30 | Oxford Nanopore Technologies Limited | Method for attaching one or more polynucleotide binding proteins to a target polynucleotide |
WO2015140535A1 (en) | 2014-03-21 | 2015-09-24 | Oxford Nanopore Technologies Limited | Analysis of a polymer from multi-dimensional measurements |
WO2015150786A1 (en) | 2014-04-04 | 2015-10-08 | Oxford Nanopore Technologies Limited | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
CN117164682A (zh) | 2014-09-01 | 2023-12-05 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
GB201418159D0 (en) | 2014-10-14 | 2014-11-26 | Oxford Nanopore Tech Ltd | Method |
EP3423485B1 (en) | 2016-03-02 | 2021-12-29 | Oxford Nanopore Technologies plc | Mutant pore |
GB201620450D0 (en) * | 2016-12-01 | 2017-01-18 | Oxford Nanopore Tech Ltd | Method |
GB201707138D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Machine learning analysis of nanopore measurements |
EP4273156A3 (en) | 2017-06-30 | 2024-01-17 | Vib Vzw | Novel protein pores |
GB201809323D0 (en) * | 2018-06-06 | 2018-07-25 | Oxford Nanopore Tech Ltd | Method |
GB201819378D0 (en) | 2018-11-28 | 2019-01-09 | Oxford Nanopore Tech Ltd | Analysis of nanopore signal using a machine-learning technique |
GB201907244D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
GB201917742D0 (en) | 2019-12-04 | 2020-01-15 | Oxford Nanopore Tech Ltd | Method |
US20240076729A9 (en) | 2020-06-18 | 2024-03-07 | Oxford Nanopore Technologies Plc | Method |
-
2022
- 2022-05-19 EP EP22726800.0A patent/EP4341433A1/en active Pending
- 2022-05-19 WO PCT/GB2022/051269 patent/WO2022243692A1/en active Application Filing
- 2022-05-19 CN CN202280035082.6A patent/CN117337333A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022243692A1 (en) | 2022-11-24 |
EP4341433A1 (en) | 2024-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11946102B2 (en) | Coupling method | |
US11649490B2 (en) | Method of target molecule characterisation using a molecular pore | |
EP3548636B1 (en) | Methods and systems for characterizing analytes using nanopores | |
EP3464624B1 (en) | Method of nanopore sequencing of concatenated nucleic acids | |
EP3126515B1 (en) | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid | |
EP3207157B1 (en) | Methods for delivering an analyte to transmembrane pores | |
CN117337333A (zh) | 用于补体链测序的方法 | |
CN116478983B (zh) | 一种rna-dna嵌合接头及其应用 | |
CN117587110A (zh) | 富集方法、表征分析物的方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |