CN117999346A - 形成窄通道孔的α-溶血素变体及其用途 - Google Patents
形成窄通道孔的α-溶血素变体及其用途 Download PDFInfo
- Publication number
- CN117999346A CN117999346A CN202280050834.6A CN202280050834A CN117999346A CN 117999346 A CN117999346 A CN 117999346A CN 202280050834 A CN202280050834 A CN 202280050834A CN 117999346 A CN117999346 A CN 117999346A
- Authority
- CN
- China
- Prior art keywords
- seq
- amino acid
- narrow channel
- identity
- nanopore
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 101710092462 Alpha-hemolysin Proteins 0.000 title claims abstract description 345
- 239000011148 porous material Substances 0.000 title abstract description 37
- 238000006467 substitution reaction Methods 0.000 claims abstract description 91
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 87
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 87
- 229920001184 polypeptide Polymers 0.000 claims abstract description 83
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 54
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 44
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 21
- 150000001413 amino acids Chemical group 0.000 claims description 193
- 235000001014 amino acid Nutrition 0.000 claims description 177
- 229940024606 amino acid Drugs 0.000 claims description 176
- 239000004235 Orange GGN Substances 0.000 claims description 102
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 39
- 239000004472 Lysine Substances 0.000 claims description 38
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 36
- 235000013922 glutamic acid Nutrition 0.000 claims description 36
- 239000004220 glutamic acid Substances 0.000 claims description 36
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 33
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 33
- 239000004475 Arginine Substances 0.000 claims description 32
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 32
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 32
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 32
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 32
- 229960001230 asparagine Drugs 0.000 claims description 32
- 235000009582 asparagine Nutrition 0.000 claims description 32
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims description 31
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 31
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 30
- 229930182817 methionine Natural products 0.000 claims description 30
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 29
- 235000004279 alanine Nutrition 0.000 claims description 29
- 239000004474 valine Substances 0.000 claims description 29
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 28
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 28
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 28
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 28
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 28
- 229960000310 isoleucine Drugs 0.000 claims description 28
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 28
- 238000012163 sequencing technique Methods 0.000 claims description 18
- 229920002842 oligophosphate Polymers 0.000 claims description 16
- 230000004888 barrier function Effects 0.000 claims description 14
- 125000000539 amino acid group Chemical group 0.000 claims description 10
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Polymers OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 10
- 239000008151 electrolyte solution Substances 0.000 claims description 9
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 8
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 8
- 229920000642 polymer Polymers 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000000295 complement effect Effects 0.000 claims description 7
- 238000007672 fourth generation sequencing Methods 0.000 claims description 7
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 5
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 229940104302 cytosine Drugs 0.000 claims description 2
- 229940035893 uracil Drugs 0.000 claims description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 claims 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims 2
- 230000003321 amplification Effects 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000001419 dependent effect Effects 0.000 claims 2
- 238000003199 nucleic acid amplification method Methods 0.000 claims 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 claims 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims 1
- 229960005305 adenosine Drugs 0.000 claims 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 claims 1
- 238000005342 ion exchange Methods 0.000 claims 1
- 229940104230 thymidine Drugs 0.000 claims 1
- 230000035515 penetration Effects 0.000 abstract description 3
- 125000003275 alpha amino acid group Chemical group 0.000 description 47
- 210000004027 cell Anatomy 0.000 description 23
- 108090000623 proteins and genes Proteins 0.000 description 22
- 239000002773 nucleotide Substances 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 18
- 125000003729 nucleotide group Chemical group 0.000 description 17
- 235000018102 proteins Nutrition 0.000 description 16
- 108020004414 DNA Proteins 0.000 description 15
- 239000003228 hemolysin Substances 0.000 description 14
- 239000012528 membrane Substances 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 150000002500 ions Chemical class 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 230000001747 exhibiting effect Effects 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 239000002585 base Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 108010090804 Streptavidin Proteins 0.000 description 5
- 239000003792 electrolyte Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- UYPYRKYUKCHHIB-UHFFFAOYSA-N trimethylamine N-oxide Chemical compound C[N+](C)(C)[O-] UYPYRKYUKCHHIB-UHFFFAOYSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 4
- 108010006464 Hemolysin Proteins Proteins 0.000 description 4
- -1 a-HL Proteins 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- 238000006384 oligomerization reaction Methods 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- UGJBHEZMOKVTIM-UHFFFAOYSA-N N-formylglycine Chemical compound OC(=O)CNC=O UGJBHEZMOKVTIM-UHFFFAOYSA-N 0.000 description 2
- 102220484184 Replication stress response regulator SDE2_E287R_mutation Human genes 0.000 description 2
- 108010048586 SpyCatcher peptide Proteins 0.000 description 2
- 108010092505 SpyTag peptide Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108060008539 Transglutaminase Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 238000000329 molecular dynamics simulation Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 102200139519 rs104893652 Human genes 0.000 description 2
- 238000001338 self-assembly Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 102000003601 transglutaminase Human genes 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000095992 Clostridium phage phiCPV4 Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 101100496858 Mus musculus Colec12 gene Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101000866975 Staphylococcus aureus Alpha-hemolysin Proteins 0.000 description 1
- 101900127397 Staphylococcus aureus Alpha-hemolysin Proteins 0.000 description 1
- 206010042602 Supraventricular extrasystoles Diseases 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 101100388071 Thermococcus sp. (strain GE8) pol gene Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 238000012382 advanced drug delivery Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 150000001294 alanine derivatives Chemical class 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 230000005520 electrodynamics Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005421 electrostatic potential Methods 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 101150024289 hly gene Proteins 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000037427 ion transport Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- KJLLKLRVCJAFRY-UHFFFAOYSA-N mebutizide Chemical compound ClC1=C(S(N)(=O)=O)C=C2S(=O)(=O)NC(C(C)C(C)CC)NC2=C1 KJLLKLRVCJAFRY-UHFFFAOYSA-N 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- HEGSGKPQLMEBJL-UHFFFAOYSA-N n-octyl beta-D-glucopyranoside Natural products CCCCCCCCOC1OC(CO)C(O)C(O)C1O HEGSGKPQLMEBJL-UHFFFAOYSA-N 0.000 description 1
- HEGSGKPQLMEBJL-RKQHYHRCSA-N octyl beta-D-glucopyranoside Chemical compound CCCCCCCCO[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HEGSGKPQLMEBJL-RKQHYHRCSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 231100000654 protein toxin Toxicity 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- DFEYYRMXOJXZRJ-UHFFFAOYSA-N sevoflurane Chemical compound FCOC(C(F)(F)F)C(F)(F)F DFEYYRMXOJXZRJ-UHFFFAOYSA-N 0.000 description 1
- 229960002078 sevoflurane Drugs 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 108010092231 staphylococcal alpha-toxin Proteins 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 150000003680 valines Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/305—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
- C07K14/31—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
Abstract
本文中描述了具有相对窄通道和相对于SEQ ID NO:1的D127G和D128K取代的α‑溶血素纳米孔。所述窄通道减少核酸模板穿过所述纳米孔的程度,同时所述D127G和D128K取代改善窄通道孔的寿命和到达率。本文中也公开了用于形成此类纳米孔的多肽、包含此类纳米孔的系统以及制备和使用此类纳米孔的方法。
Description
技术领域
公开了与金黄色葡萄球菌α-溶血素多肽的变体有关的组合物和方法。α-溶血素(α溶血素)变体可用作例如用于确定聚合物序列信息的装置中的纳米孔组分。
背景技术
溶血素是由多种生物体产生的蛋白质毒素家族的成员。一些溶血素,例如α溶血素,可以通过在膜中形成孔或通道来破坏细胞膜(例如,宿主细胞膜)的完整性。由成孔蛋白在膜中形成的孔或通道可用于将某些聚合物(例如,多肽或多核苷酸)从膜的一侧运输至另一侧。
α-溶血素(也称为α-溶血素、α-HL、a-HL或α-HL)是一种自组装毒素,该自组装毒素在宿主细胞膜中形成通道。α溶血素已成为纳米孔测序界的主要组分。它具有许多有利的特性,包括高稳定性、自组装以及足够宽以容纳单链DNA但不容纳双链DNA的孔径(Kasianowicz等人,1996)。
先前关于在a-HL孔中DNA检测的工作集中在分析DNA易位通过孔时的离子电流特征(Kasianowicz等人,1996;Akeson等人,1999;Meller等人,2001),考虑到易位率(100mV时约1nt/μs)和在离子电流信号中的固有噪声,这是一项非常困难的任务。在基于纳米孔的传感器中,通过结合永久栓在孔内部的探针分子,已经实现了更高的特异性(Howorka等人,2001a和Howorka等人,2001b;Movileanu等人,2000)。
野生型α溶血素导致大量删除错误,即碱基未被测量。因此,在改进用于基于标签的边合成边测序(SBS)的α溶血素纳米孔方面已经做出了许多努力,实例包括US 2017-0088588 A1、US 2017-0088890 A1、US 2017-0306397 A1、US 2018-0002750 A1和US 2018-0002750 A1。然而,仍然需要具有改进特性的α溶血素纳米孔。
发明内容
公开了葡萄球菌α溶血素多肽的变体,其含有可用于生成可用于基于标签的边合成边测序反应的纳米孔的氨基酸变异。本文公开的变体多肽可用于制备七聚体纳米孔,与由参考α溶血素多肽形成的孔相比,该七聚体纳米孔具有相对窄的收缩位点和更长的孔寿命。
在一个方面,提供了包含至少一个窄通道α-溶血素(α溶血素)亚单位的α-溶血素(α溶血素)多肽,所述亚单位包含相对于SEQ ID NO:1的D127G和D128K取代。在一些实施例中,对应于SEQ ID NO:1的E111和/或K147的氨基酸残基选自由以下项组成的组:谷氨酸、赖氨酸、精氨酸和谷氨酰胺。在一些实施例中,对应于SEQ ID NO:1的E111和/或K147的氨基酸残基选自由以下项组成的组:谷氨酸和赖氨酸。在一些实施例中,窄通道α溶血素亚单位包含E111和K147中的一者或两者(即相对于SEQ ID NO:1在那些位置处的野生型残基)。在一些实施例中,对应于SEQ ID NO:1的M113的氨基酸残基选自由以下项组成的组:亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。在一些实施例中,对应于SEQ ID NO:1的M113的氨基酸残基为甲硫氨酸(即在相对于SEQ ID NO:1该位置处的野生型残基)。在一些实施例中,窄通道α溶血素亚单位包含E111、M113和K147中的每一者(即在相对于SEQ ID NO:1那些位置处的野生型残基)。例如,窄通道α溶血素亚单位可以包含与SEQ ID NO:1具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中该氨基酸序列包含在对应于SEQ ID NO:1的E111位置处的谷氨酸残基,在对应于SEQ ID NO:1的M113位置处的甲硫氨酸残基,在对应于SEQ ID NO:1的K147位置处的赖氨酸残基,相对于SEQ ID NO:1的D127G取代,以及相对于SEQ ID NO:1的D128K取代。作为另一个实例,窄通道α溶血素亚单位可包含与SEQ ID NO:2具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中该氨基酸序列包含SEQ ID NO:2的G127、K128、E111、M113和K147中的每一者。作为另一个实例,窄通道α溶血素亚单位包含与SEQ ID NO:3具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中该氨基酸序列包含SEQ ID NO:3的G127、K128、E111、M113和K147中的每一者。作为另一个实例,窄通道α溶血素亚单位包含或由以下组成:选自由以下项组成的组的氨基酸序列:SEQ ID NO:2和SEQ ID NO:3.作为另一个实例,窄通道α溶血素亚单位包含与SEQ IDNO:4具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中该氨基酸序列包含相对于SEQ ID NO:4的N111E、A113M和N147K取代,并且进一步包含SEQ ID NO:4的G127和K128。作为另一个实例,窄通道α溶血素亚单位包含与SEQ ID NO:5具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中该氨基酸序列包含相对于SEQ ID NO:5的N111E、A113M、N147K和G128K取代,并且进一步包含SEQ ID NO:5的G127。作为另一个实例,窄通道α溶血素亚单位包含与SEQ ID NO:6具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中氨基酸序列包含相对于SEQ ID NO:6的D127G取代,相对于SEQID NO:6的D128K取代,在对应于SEQ ID NO:6的E111位置处的谷氨酸残基,在对应于SEQ IDNO:6的M113位置处的甲硫氨酸残基,以及在对应于SEQ ID NO:6的K147位置处的赖氨酸残基。作为另一个实例,窄通道α溶血素亚单位包含与SEQ ID NO:7具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中氨基酸序列包含相对于SEQ ID NO:7的D127G取代,相对于SEQ ID NO:7的D128K取代,在对应于SEQ ID NO:7的E111位置处的谷氨酸残基,在对应于SEQ ID NO:7的M113位置处的甲硫氨酸残基,以及在对应于SEQ ID NO:7的K147位置处的赖氨酸残基。作为另一个实例,窄通道α溶血素亚单位包含与SEQ ID NO:8具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中氨基酸序列包含相对于SEQ ID NO:8的D127G取代,相对于SEQ ID NO:8的D128K取代,在对应于SEQ ID NO:8的E111位置处的谷氨酸残基,在对应于SEQ ID NO:8的M113位置处的甲硫氨酸残基,以及在对应于SEQ ID NO:8的K147位置处的赖氨酸残基。
还提供了窄通道α溶血素纳米孔,所述纳米孔包含至少6个窄通道α溶血素亚单位,该窄通道α溶血素亚单位包含相对于SEQ ID NO:1的D127G和D128K取代。纳米孔具有以下特性:(a)比纳米孔P-0304更窄的收缩位点;以及(b)相对于纳米孔P-0031寿命增加。在某些实施例中,本文所述的窄通道α溶血素纳米孔与DNA聚合酶结合,诸如经由共价键。在某些示例性实施例中,窄通道α溶血素纳米孔为6:1纳米孔,并且DNA聚合酶连接至“1”组分。
在某些示例性方面中,还提供了编码本文所述的窄通道α溶血素变体多肽中的任一个的核酸。例如,核酸序列可以源自金黄色葡萄球菌αHL(SEQ ID NO:9)。在某些示例性方面中,还提供了包括编码本文所述的任何一种溶血素变体的任何此类核酸的载体。还提供了用该载体转化的宿主细胞。
在某些示例性方面中,提供了一种使用所公开的窄通道α-溶血素纳米孔检测和/或识别靶核酸分子的方法。该方法包括,例如,提供芯片,该芯片包括在膜中的本文所述的纳米孔组装,该膜设置成邻近或靠近传感电极。该方法然后包括在靶核酸分子的互补链的合成过程中使用纳米孔检测带标签的核苷酸。
通过以下详细描述,本发明的其他目标、特征和优点将变得显而易见。然而,应当理解的是,详细描述和具体实例虽然指示了本发明的实施例,但仅通过说明的方式给出,因为在本发明的范围和精神内的各种变化和修改将通过此详细描述对本领域技术人员来说变得显而易见。
附图说明
图1描述了具有潜在线程问题的两次测序运行。(A)示出了具有清晰的开放通道水平101、标签水平102a-102d以及可能由模板线程引起的持续背景水平103的测序运行。(B)示出了具有显著背景噪声103和可能由模板线程引起的测序消除104的测序运行。
图2是4种不同孔的到达率(X轴)与孔寿命(Y轴)的曲线图:P-0031、P-0304、P-0411和P-0414。
图3是显示使用宽通道(P-0304)与窄通道(P-0411和P-0414)α溶血素纳米孔的线程孔的分数的条形图。
图4是表5中公开的亚单位之间的序列比对。
具体实施方式
现在将仅使用以下定义和实例通过参考的方式详细描述本发明。本文引用的所有专利和出版物,包括此类专利和出版物中所公开的所有序列,均明确并入作为参考。
除非本文另外定义,否则本文所用的所有科学技术术语的含义与本发明所属领域普通技术人员通常理解的含义相同。Singleton,等人,Dictionary ofMicrobiology andMolecular Biology,第2版,John Wiley and Sons,New York(1994),以及Hale和Margham,The Harper Collins Dictionary ofBiology,Harper Perennial,NY(1991)为一个技术人员提供了本发明中使用的许多术语的通用词典。对于本领域的定义和术语,从业者特别针对Sambrook等,1989,和Ausubel FM等,1993。应理解,本发明并不限于所述的特定方法、方案和试剂,因为这些是可变的。
数字范围包括定义范围的数字。术语大约在本文中用于表示值的正负百分之十(10%)。例如,“大约100”是指90与110之间的任何数字。
除非另有说明,否则核酸以5'至3'取向从左至右书写;氨基酸序列分别以氨基到羧基的取向从左至右书写。
本文提供的标题不是对本发明的各个方面或实施方案的限制,这些方面或实施方案可通过参考整个说明书来获得。因此,通过参考整个说明书,下面定义的术语被更全面地定义。
I.定义
α-溶血素:如本文所用,“α-溶血素”、“α-溶血素”、“a-HL”和“α溶血素”可互换使用,并且是指从金黄色葡萄球菌的hly基因表达的多肽。
α-溶血素纳米孔:如本文所用,“α-溶血素纳米孔”是指由7个α-溶血素亚单位形成的纳米孔。
α-溶血素多肽:如本文所用,“α-溶血素多肽”是指包含至少一个α-溶血素亚单位的任何多肽。
α-溶血素亚单位:如本文所用,“α-溶血素亚单位”是指能够自组装成七聚体纳米孔的SEQ ID NO:1及其变体。
氨基酸:如本文所用,术语“氨基酸”在其最广义上是指可以并入多肽链中的任何化合物和/或物质。在一些实施例中,氨基酸具有通用结构H2N—C(H)(R)—COOH。在一些实施例中,氨基酸为天然存在的氨基酸。在一些实施例中,氨基酸为合成氨基酸;在一些实施例中,氨基酸为D-氨基酸;在一些实施例中,氨基酸为L-氨基酸。“标准氨基酸”是指在天然存在的肽中常见的二十种标准L-氨基酸中的任何一种。“非标准氨基酸”是指除标准氨基酸之外的任何氨基酸,无论其是合成制备的还是从天然来源获得的。如本文所用,“合成氨基酸”或“非天然氨基酸”涵盖化学修饰的氨基酸,包括但不限于盐、氨基酸衍生物(诸如酰胺)和/或取代。氨基酸,包括在肽中的羧基和/或氨基末端氨基酸,可以通过甲基化、酰胺化、乙酰化和/或用其他化学物质取代来修饰,而不会对其活性产生不利影响。氨基酸可以参与二硫键。术语“氨基酸”可与“氨基酸残基”互换使用,并且可以指游离氨基酸和/或肽的氨基酸残基。从使用该术语的上下文中显而易见,它是指游离氨基酸还是肽的残基。应当注意的是,所有氨基酸残基序列在本文中均由左右取向为氨基末端至羧基末端的常规方向的式表示。
到达率:如本文所用,α溶血素纳米孔的“到达率”是α溶血素纳米孔捕获生物素化标签分子的标签的频率的量度。例如,可以通过以下方式来确定到达率:获得具有插入双层中的多个目标孔的芯片、使链霉亲和素-生物素-TAG流过该芯片、并测量在多个孔中的每一个处的捕获事件之间的平均时间(通常在非常低的AC调制频率下,诸如约50Hz)。到达率是所有孔的事件之间的平均时间。
碱基对(bp):如本文所用,碱基对是指双链核酸中腺嘌呤(A)与胸腺嘧啶(T)、腺嘌呤(A)与尿嘧啶(U)或胞嘧啶(C)与鸟嘌呤(G)的伙伴关系。
互补:如本文所用,术语“互补”是指两条多核苷酸链的区域之间或两个核苷酸之间通过碱基配对的序列互补性的广义概念。已知腺嘌呤核苷酸能够与胸腺嘧啶或尿嘧啶核苷酸形成特定的氢键(“碱基配对”)。类似地,已知胞嘧啶核苷酸能够与鸟嘌呤核苷酸碱基配对。
串联的α溶血素多肽:一种α-溶血素多肽,其包括通过一个或多个柔性接头序列彼此分离的多个α-溶血素亚单位。生成串联的α溶血素多肽的示例性方法和这样做的注意事项通过例如Hammerstein和US2017-0088890A1公开。
表达盒:“表达盒”或“表达载体”是指通过重组或合成生成的核酸构建体,其具有允许特定核酸在靶细胞中转录的一系列特定核酸元件。重组表达盒可以并入质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分除其他序列之外还包括待转录的核酸序列和启动子。
异源:“异源”核酸构建体或序列具有对于表达其的细胞来说不是天然的序列的一部分。就控制序列而言,异源是指实际上不发挥作用来调节其当前调节的表达的相同基因的控制序列(即启动子或增强子)。通常,异源核酸序列对于它们所存在的细胞或基因组的一部分来说不是内源的,并且已经通过感染、转染、转化、显微注射、电穿孔等添加至细胞中。“异源”核酸构建体可以含有与在天然细胞中发现的控制序列/DNA编码序列组合相同或不同的控制序列/DNA编码序列组合。
宿主细胞:术语“宿主细胞”是指含有载体并支持表达构建体的复制、和/或转录或转录和翻译(表达)的细胞。用于本发明的宿主细胞可以是原核细胞,诸如大肠杆菌或枯草芽孢杆菌,或真核细胞诸如酵母、植物、昆虫、两栖动物或哺乳动物细胞。一般而言,宿主细胞是原核的,例如,大肠杆菌。
分离的:“分离的”分子为与例如在其自然环境中通常与之相关的至少一个其他分子分离的核酸分子。分离的核酸分子包括这样的核酸分子,其含有在通常表达该核酸分子的细胞中,但该核酸分子存在于染色体外或与其天然染色体位置不同的染色体位置处。
寿命:如本文所用,一种α溶血素纳米孔的“寿命”是在纳米孔测序阵列上保持能够捕获生物素化标签分子的标签1小时的α溶血素纳米孔的百分比的量度。例如,可以通过以下方式来确定寿命:获得具有插入双层中的多个目标孔的芯片,使链霉亲和素-生物素-TAG流过芯片,并在1个小时内跟踪在芯片上的所有单独纳米孔的活性。孔种类的寿命是指在整个1小时内保持活性的孔的百分比。
突变:如本文所用,术语“突变”是指引入亲本序列中的改变,包括但不限于取代、插入和/或删除(包括截短)。突变的后果包括但不限于产生由亲本序列编码的蛋白质中未发现的新特性、特征、功能、表型或性状。
纳米孔:本文中使用的术语“纳米孔”通常指在膜中形成或以其他方式提供的孔、通道或通路。膜可以是有机膜,诸如脂质双层,或合成膜,诸如由聚合材料形成的膜。膜可以是聚合材料。纳米孔可以设置成邻近或靠近传感电路或耦合至传感电路的电极,诸如,例如,互补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路。在一些实例中,纳米孔具有0.1纳米(nm)至约1000nm数量级的特征宽度或直径。一些纳米孔为蛋白质。α溶血素是纳米孔形成多肽的一个实例。
窄通道α-溶血素纳米孔:如本文所用,窄通道α溶血素纳米孔是包含至少6个窄通道α溶血素亚单位的α溶血素纳米孔。
窄通道α-溶血素多肽:如本文所用,窄通道α溶血素多肽是包含至少1个窄通道α溶血素亚单位的α溶血素多肽。
窄通道α-溶血素亚单位:如本文所用,窄通道α溶血素亚单位是当与SEQ ID NO:1比对时的α溶血素亚单位,其具有:(a)在对应于SEQ ID NO:1的E111位置处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)的侧链长的侧链的氨基酸,(b)在对应于SEQ IDNO:1的K147位置处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)的侧链长的侧链的氨基酸,和/或(c)在对应于SEQ ID NO:1的M113位置处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)的侧链长的侧链的氨基酸。
核酸分子:术语“核酸分子”包括RNA、DNA和cDNA分子。应当理解,由于遗传密码的简并性,可产生编码给定蛋白质(诸如α-溶血素和/或其变体)的多种核苷酸序列。本发明考虑了编码变体α-溶血素的每一种可能的变体核苷酸序列,考虑到遗传密码的简并性,所有这些都是可能的。
同一性百分比:当使用序列比对程序比对时,术语“%同一性”是指编码本发明多肽中的任何一个的核酸序列或本发明多肽的氨基酸序列之间的核酸或氨基酸同一性的水平。例如,如本文所用,80%同一性包括给定序列的同源物,该同源物在给定序列的长度上具有大于80%的同一性。同一性的示例性水平包括但不限于与给定序列(例如,本文所述的本发明多肽中的任何一个的编码序列)75%、80%、85%、90%、95%、98%或更大同一性。可用于确定两个序列之间的同一性的示例性计算机程序包括但不限于BLAST程序套件(例如,BLASTN、BLASTX和TBLASTX、BLASTP和TBLASTN),其可在互联网上公开获得。另请参见Altschul等人,1990和Altschul等人,1997。当相对于GenBank DNA序列和其他公共数据库中的核酸序列评估给定核酸序列时,通常使用BLASTN程序进行序列搜索。BLASTX程序可以用于搜索已在所有阅读框中针对GenBank蛋白序列和其他公共数据库中的氨基酸序列翻译的核酸序列。BLASTN和BLASTX均使用开放空位罚分11.0和扩展空位罚分1.0的默认参数运行,并且利用BLOSUM-62矩阵。(参见,例如,Altschul,S.F.,等人,Nucleic Acids Res.25:3389-3402,1997。)为了确定两个或更多个序列之间的“%同一性”,可以使用例如MacVector版本13.0.7中的CLUSTAL-W程序对所选序列进行比对,该程序使用默认参数操作,包括开放空位罚分10.0,扩展空位罚分0.1,以及BLOSUM 30相似度矩阵。
启动子:如本文所用,术语“启动子”是指发挥引导下游基因转录功能的核酸序列。启动子通常适用于表达靶基因的宿主细胞。启动子与其他转录和翻译调节核酸序列(也称为“控制序列”)一起是表达给定基因所必需的。通常,转录和翻译调节序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列和增强子或激活子序列。
纯化的:如本文所用,“纯化的”意指分子按包含其的样品的重量计以至少95%的浓度,或按重量计以至少98%的浓度存在于样品中。
标签:如本文所用,术语“标签”是指可检测纳米孔部分,该部分可为原子或分子,或者原子或分子的集合。标签可提供光学、电化学、磁性或静电(例如,感应,电容)标记,该标记可借助于纳米孔来检测。通常,当核苷酸附着到标签上时,该核苷酸被称为“带标签的核苷酸”。
变体:如本文所用,术语“变体”是指与衍生自其的野生型多肽相比,显示改变的一级氨基酸序列的多肽。
变体α溶血素多肽:术语“变体α-溶血素多肽”或“变体αHL多肽”意指包含至少一种变体α溶血素亚单位的α-溶血素多肽。
变体α溶血素亚单位:术语“变体α-溶血素”或“变体αHL”意指相对于SEQ ID NO:1具有一个或多个取代、插入或删除的α-溶血素多肽。
变体窄通道α溶血素纳米孔:术语“变体窄通道α溶血素纳米孔”意指窄通道α-溶血素纳米孔,其中6个窄通道α溶血素亚单位中的至少1个为变体窄通道α溶血素亚单位。
变体窄通道α溶血素多肽:术语“变体窄通道α溶血素多肽”是包含至少1个变体窄通道α溶血素亚单位的α溶血素多肽。
变体窄通道α溶血素亚单位:术语“变体窄通道α溶血素亚单位”意指相对于SEQ IDNO:1具有一个或多个取代、插入或删除的窄通道α-溶血素亚单位。
载体:如本文所用,术语“载体”是指设计用于在不同宿主细胞之间转移的核酸构建体。“表达载体”是指具有在外源细胞中并入并表达异源DNA片段的能力的载体。许多原核和真核表达载体是可商购的。适当表达载体的选择在本领域技术人员的知识范围内。
野生型α溶血素:如本文所用,术语“野生型α溶血素”是指包含SEQ ID NO:1的α溶血素亚单位。
II.命名法
在本说明书和权利要求书中,使用氨基酸残基的常规单字母和三-字母代码。
为了便于参考,本申请的变体通过使用以下命名法进行描述:原始氨基酸;位置;取代的氨基酸。根据该命名法,例如,缬氨酸在位置149处被赖氨酸取代如下所示:
Val149Lys或V149K
多个突变用加号分隔,诸如:
Ala1Lys+Asn47Lys+Glu287Arg或A1K+N47K+E287R
代表在位置1、47和287处的突变,分别用赖氨酸取代丙氨酸、用赖氨酸取代天冬酰胺、以及用精氨酸取代谷氨酸。氨基酸取代的范围用破折号表示,诸如从残基127到131的甘氨酸残基的范围为:127-131Gly或127-133G。
III.发展背景
“宽通道”α-溶血素纳米孔是其中形成收缩位点的一个或多个氨基酸已被修饰为相对于野生型α-溶血素具有短侧链的残基的纳米孔。这在收缩位点处提供了比具有天然残基的孔更宽的直径,这允许标签更自由地流过β桶。表1列出了形成通道的SEQ ID NO:1的面向溶剂的氨基酸残基。“#”表示SEQ ID NO:1内的位置,“AA”表示SEQ ID NO:1的所述位置处的氨基酸,并且“位置”表示氨基酸所在的α溶血素纳米孔的子区域。
表1
可以看出,三个氨基酸组成了收缩位点:E111、M113和K147。在经典的“宽通道”α-溶血素中,E111和K147均被修饰为天冬酰胺(即相对于SEQ ID NO:1的E111N和K147N取代),而M113被修饰为丙氨酸(相对于SEQ ID NO:1的M113A取代)。
虽然宽通道α溶血素孔通常具有相对较高的到达率,但它们确实有一些局限性。图1示出了使用宽通道α-溶血素纳米孔运行的两种基于标签的边合成边测序(SBS)。顶部的暗带是开放通道水平101,并且占据纳米孔的通道的标签被记录为相对于开放通道的信号变化(在这种情况下,电导水平),不同的标签导致在信号102a-102d中的不同变化。然而,经常观察到持续的背景带103,这可能导致标签信号的卷积随着线程速率的增加而增加。另外,还可以观察到测序活性的消除104,如(B)所示。这两个问题都限制了基于标签的SBS的吞吐量和准确性。在不受理论约束的情况下,异常模式可以至少部分地由模板核酸和/或引物穿入纳米孔中导致。据信,背景水平是由模板和/或引物部分插入纳米孔和从纳米孔排出引起的,而消除是由模板或引物完全穿过纳米孔引起的。
本公开证明,将窄通道α溶血素纳米孔与D127G和D128K取代配对导致相对长的寿命和可接受的到达率(图2),同时显著减少表现出线程现象的孔的数量(图3)。
IV.包含一种或多种变体窄通道α-溶血素亚单位的多肽
在一个方面,提供了一种分离的多肽,其包含变体窄通道α-溶血素亚单位、基本上由变体窄通道α-溶血素亚单位组成、或由变体窄通道α-溶血素亚单位组成,所述亚单位包含相对于SEQ ID NO:1的D127G和D128K取代。变体窄通道α溶血素亚单位通常至少具有以下特征:
(a)与选自由以下项组成的组的氨基酸序列的至少75%同一性:SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ IDNO:8;
(b)相对于SEQ ID NO:1的D127G取代;
(c)相对于SEQ ID NO:1的D128K取代;以及
(d)以下中的一者或多者:
(d1)在对应于SEQ ID NO:1的E111的位置处的具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)的侧链长的侧链的氨基酸,
(d2)在对应于SEQ ID NO:1的K147的位置处的具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)的侧链长的侧链的氨基酸,和/或
(d3)在对应于SEQ ID NO:1的M113的位置处的具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)的侧链长的侧链的氨基酸。
相对于SEQ ID NO:1在D127和D128处的取代与在收缩位点处的较长氨基酸的组合相对于具有宽通道的类似孔(诸如包含E111N、M113A和K147N的孔)减少了模板线程,同时改进所得孔的寿命并具有可接受的到达率。
在本文描述的一些实施例中,变体窄通道α溶血素纳米孔根据其“线程率”来表征。在本文中,“线程率”应指具有表现出线程状态的高质量读数(HQR)的6:1窄通道α溶血素纳米孔的百分比,其中“6”组分为变体窄通道α溶血素亚单位,并且“1”组分为亚单位G2043。具有线程状态的孔的百分比可以如实例5中所述计算。在一些实施例中,变体窄通道α溶血素纳米孔具有小于15%的线程率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于10%的线程率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于5%的线程率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于2%的线程率。
在本文描述的一些实施例中,变体窄通道α溶血素纳米孔根据其“%寿命”来表征。在本文中,“%寿命”应指暴露于350mV测序波形1小时后对带T40标签的链霉亲和素保持活性的6:1窄通道α溶血素纳米孔的百分比,其中“6”组分为变体窄通道α溶血素亚单位,“1”组分”为亚单位G2043。可以如实例4中所述计算%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于60%的%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于70%的%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于75%的%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于80%的%寿命。
在本文所述的一些实施例中,变体窄通道α溶血素纳米孔根据其“到达率”来表征。在本文中,“到达率”应指带T40标签的链霉亲和素在暴露于50Hz、150mV波形15分钟期间在6:1窄通道α溶血素纳米孔上的平均到达率,其中“6”组分为变体窄通道α溶血素亚单位,“1”组分”为亚单位G2043。可以如实例4中所述计算到达率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于25ms的到达率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于20ms的到达率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于15ms的到达率。
在某些示例性实施例中,本文提供的变体窄通道α溶血素亚单位与SEQ ID NO:1所示的序列具有80%、85%、90%、95%或更大同一性,条件是所述氨基酸序列包含(a)相对于SEQ ID NO:1的D127G取代和D128K取代中的一者或两者,并且进一步包含(b)在相对于SEQID NO:1的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:1的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素亚单位包含E111、M113和K147中的每一者。
在另一个实施例中,变体窄通道α溶血素亚单位包含与SEQ ID NO:2具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中氨基酸序列(a)包含G127和K128中的每一者,并且进一步包含(b)在相对于SEQ ID NO:2的E111和K147中的一者或两者处的氨基酸,具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:2的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素亚单位包含E111、M113和K147中的每一者。在又一个实施例中,变体窄通道α溶血素亚单位包含SEQ ID NO:2或由其组成。
在另一个实施例中,变体窄通道α溶血素亚单位包含与SEQ ID NO:3具有至少75%、80%、90%、95%、98%或更大同一性的氨基酸序列,其中氨基酸序列(a)包含G127和K128中的每一者,并且进一步包含(b)在相对于SEQ ID NO:3的E111和K147中的一者或两者处的氨基酸,具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:3的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素亚单位包含E111、M113和K147中的每一者。在又一个实施例中,变体窄通道α溶血素亚单位包含SEQ ID NO:3或由其组成。
在某些示例性实施例中,变体窄通道α溶血素亚单位与SEQ ID NO:4所示的序列具有75%、80%、85%、90%、95%或更大同一性,条件是所述氨基酸序列包含(a)SEQ ID NO:4的G127和K128中的每一者,并且进一步包含(b)在相对于SEQ ID NO:4的N111和N147的一者或两者处,具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:4的A113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在另一个实施例中,变体窄通道α溶血素亚单位包含相对于SEQ ID NO:4的N111E、A113M和N147K取代中的每一者。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在另一个实施例中,变体窄通道α溶血素亚单位包含相对于SEQ ID NO:4的N111E、A113M和N147K取代中的每一者。
在某些示例性实施例中,变体窄通道α溶血素亚单位与SEQ ID NO:5所示的序列具有75%、80%、85%、90%、95%或更大同一性,条件是所述氨基酸序列包含:(a)(a1)SEQ IDNO:5的G127,和(a2)相对于SEQ ID NO:5的G128K取代中的一者或两者,并且进一步包含(b)在相对于SEQ ID NO:5的N111和N147的一者或两者处,具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:5的A113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在另一个实施例中,变体窄通道α溶血素亚单位包含相对于SEQID NO:5的N111E、A113M和N147K取代中的每一者。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在另一个实施例中,变体窄通道α溶血素亚单位包含相对于SEQ ID NO:5的N111E、A113M和N147K取代中的每一者。
在某些示例性实施例中,变体窄通道α溶血素亚单位与SEQ ID NO:6所示的序列具有75%、80%、85%、90%、95%或更大同一性,条件是所述氨基酸序列包含:(a)相对于SEQID NO:6的D127G和D128K取代中的一者或两者,以及(b)在相对于SEQ ID NO:6的E111和K147中的一者或两者处,具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:6的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素亚单位包含相对于SEQ ID NO:6的E111、K147和M113中的每一者。
在某些示例性实施例中,变体窄通道α溶血素亚单位与SEQ ID NO:7所示的序列具有75%、80%、85%、90%、95%或更大同一性,条件是所述氨基酸序列包含:(a)相对于SEQID NO:7的D127G和D128K取代中的一者或两者,以及(b)在相对于SEQ ID NO:7的E111和K147中的一者或两者处,具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:7的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素亚单位包含相对于SEQ ID NO:7的E111、K147和M113中的每一者。
在某些示例性实施例中,变体窄通道α溶血素亚单位与SEQ ID NO:8所示的序列具有75%、80%、85%、90%、95%或更大同一性,条件是所述氨基酸序列包含:(a)相对于SEQID NO:8的D127G和D128K取代中的一者或两者,以及(b)在相对于SEQ ID NO:8的E111和K147中的一者或两者处,具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c)在相对于SEQ ID NO:8的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素亚单位具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素亚单位包含相对于SEQ ID NO:8的E111、K147和M113中的每一者。
本文公开的变体窄通道α溶血素亚单位可以含有相对于SEQ ID NO:1-8中的任一个的进一步修改,其改变或改进所得纳米孔的特征。本领域已经描述了用于生成可用于基于纳米孔的测序的α-溶血素变体的多种方案和突变,包括例如在Noskov、Bhattacharya、Stoddart、PCT/US2015/57902、US10,301,31、PCT/EP2016/072220、US10,227,645、PCT/US2017/028636、US10,351,908、PCT/EP2017/065972、US 10,934,582、PCT/EP2019/054792、US2020-0385433,每一篇均通过引用并入本文。作为一个非限制性实例,本发明的变体窄通道α溶血素亚单位可以包括控制非低聚α溶血素亚单位自低聚能力的取代。例如,在H35处具有取代(例如,H35G/L/D/E取代)的α溶血素亚单位只要保持在室温或更低温度(例如25℃或更低)下,则基本上是非低聚的,但当温度升高到更高温度(例如35℃)时会稳定地低聚。用于控制自低聚和/或引导特定低聚的模式的取代策略的其他实例公开于例如WO 2017-050718。另一个实例包括减少孔的到达率变异系数(CV)的取代,诸如D227N。在一些实施例中,变体窄通道α溶血素亚单位相对于SEQ ID NO:1-8中的任一个具有一组修改,其导致寿命≥80%。在一些实施例中,变体窄通道α溶血素亚单位相对于SEQ ID NO:1-8中的任一个具有一组修改,其导致到达率≤15ms。在一些实施例中,变体窄通道α溶血素亚单位相对于SEQ ID NO:1-8中的任一个具有一组修改,其导致寿命≥80%且到达率≤15ms。在其他实施例中,变体窄通道α溶血素亚单位相对于SEQ ID NO:1-8中的任一个具有一组修改,其导致寿命≥80%,到达率≤15ms,且线程率低于2%。
多肽可包含1至7个变体窄通道α溶血素亚单位。在一个实施例中,本文公开的多肽包含单个α变体窄通道α溶血素亚单位。在另一个实施例中,多肽是串联的α溶血素多肽,其包含2至7个变体窄通道α溶血素亚单位,明确地包括包含2个窄通道α溶血素亚单位的多肽、包含窄通道α溶血素亚单位的多肽、包含4个窄通道α溶血素亚单位的多肽、包含5个窄通道α溶血素亚单位的多肽、包含6个窄通道α溶血素亚单位的多肽、以及包含7个窄通道α溶血素亚单位的多肽。例如,Hammerstein和US 2017-0088890A1公开了生成串联的α溶血素多肽的示例性方法和这样做的注意事项。在一个实施例中,串联的窄通道α溶血素多肽的每个窄通道α溶血素亚单位通过接头序列与其他窄通道α溶血素亚单位分离。在一些实施例中,接头序列为柔性接头。例如,Hammerstein和Chen公开了示例性柔性接头。
多肽还可以包括用于纯化多肽的组分,诸如,例如表位标签、蛋白酶切割位点等。
多肽还可以包括用于将其他活性剂(诸如聚合酶)附着至多肽上的实体(本文称为“附着组分”)。示例性附着组分包括例如SpyTag/SpyCatcher肽系统的组分(Zakeri等人,PNAS109:E690-E6972012),天然化学连接系统(Thapa等人,Molecules 19:14461-144832014)、分选酶系统(Wu和Guo,J Carbohydr Chem 31:48-662012;Heck等人,ApplMicrobiol Biotechnol 97:461-4752013)、转谷氨酰胺酶系统(Dennler等人,BioconjugChem 25:5695782014)、甲酰甘氨酸链接(Rashidian等人,Bio conjug Chem 24:1277-12942013)或本领域中已知的化学连接技术。
V.核酸、表达盒、表达载体、重组细胞和产生多肽的方法
在本公开的另一个方面,提供了分离的多核苷酸,所述分离的多核苷酸包含编码如第IV部分中所描述的分离的多肽的核苷酸序列。在一个实施例中,核酸是表达盒,其包含编码多肽的核苷酸序列,该核苷酸序列连接至一组足以在原核或真核细胞或无细胞表达系统中转录编码多肽的核苷酸序列的核酸转录元件(如启动子、增强子、起始和终止密码子、核糖体结合位点等)。
另一方面,提供了包含编码多肽的核苷酸的载体。例如,载体可以为克隆载体或表达载体。合适的载体主链包括,例如,本领域常规使用的那些,诸如质粒、人工染色体、BAC或PAC。许多载体和表达系统可从诸如Novagen(Madison,Wis.)、Clonetech(Pal Alto,Calif.)、Stratagene(La Jolla,Calif.)和Invitrogen/Life Technologies(Carlsbad,Calif.)等公司商购获得。载体通常含有一个或多个调节区域。调节区域包括但不限于启动子序列、增强子序列、反应元件、蛋白质识别位点、诱导元件、蛋白质结合序列、5'和3'非翻译区域(UTR)、转录起始位点、终止序列、多腺苷酸化序列等。
在另一个实施例中,提供了包含表达载体的宿主细胞。例如,用表达载体转化或瞬时或稳定转染可用于产生多肽的宿主细胞。在本公开的另一个方面,提供了制备如本文所述的变体α-溶血素多肽的方法,该方法包括(a)在足以诱导多肽表达的条件下培养包含如本文所公开的表达载体的宿主细胞,和(b)从宿主细胞纯化多肽。此类方法是本领域众所周知的,并且用于这样做的许多系统是可商购获得的。
VI.变体窄通道α溶血素纳米孔
在一个实施例中,提供了变体窄通道α溶血素纳米孔或包含变体窄通道α溶血素纳米孔作为生物组分的混合纳米孔,变体窄通道α溶血素纳米孔具有以下性质:(a)比纳米孔P-0304更低的线程率;和(b)相对于纳米孔P-0031寿命增加(参见表2)。
表2
在一些实施例中,变体窄通道α溶血素纳米孔进一步具有与孔P-0411或P-0414的到达率相当或更好的到达率:
表3
表4
变体窄通道α溶血素纳米孔的每个亚单位可以是相同的(称为“同七聚体”),或者七聚体的至少一个亚单位可以相对于其他亚单位具有修改,诸如不同的一级氨基酸序列和/或促进多肽附着的修改(称为“异七聚体”)。异七聚α溶血素纳米孔在本文中可通过在纳米孔中使用的不同亚单位的种类的比率来指代。例如,“6:1α溶血素纳米孔”具有6个相同的亚单位和1个不同的亚单位。在此类实例中,提及“6”组分应表示6个相同亚单位中的每一者,而提及“1”组分应指1个不同的亚单位。在一些实施例中,α溶血素纳米孔的每个亚单位设置在不含有额外亚单位(本文中称为“非低聚亚单位”)的多肽中。由非低聚α溶血素亚单位制备同七聚体和异七聚体的示例性方法公开于US2017-0088890 A1。例如,可以通过混合两种不同的亚单位制剂(例如,其中亚单位用可用于结合聚合酶的实体和不含有此类修改的另一种实体进行修饰的一种制剂)来生成6:1异七聚体。在膜的存在下,旨在所得七聚体中过量的实体以相对于另一个七聚体的摩尔过量的方式提供,并且混合物在水溶液(诸如20mM Tris-HCl pH 8.0、200mM NaCl或20mM柠檬酸钠pH 3、400mM NaCl、0.1%TWEEN20+0.2M TMAO)中在37℃下孵育过夜。然后通过阳离子交换色谱法纯化所得七聚体。在一些实施方案中,低聚在三甲胺N-氧化物(TMAO)(诸如0.1至5M TMAO、1至4M TMAO等)的存在下进行。在其他实施例中,纳米孔包括至少一组串联的亚单位。由串联的α溶血素亚单位制备α溶血素纳米孔的示例性方法公开于例如,Hammerstein和US 2017-0088890A1。
本文所述的变体窄通道α溶血素纳米孔还可包括与其附着的聚合酶。在一个实施例中,将单个聚合酶附着至变体窄通道α溶血素纳米孔。示例性聚合酶包括源自DNA聚合酶梭菌噬菌体phiCPV4(由GenBank登录号YP_00648862描述,本文称为“Pol6”)、phi29 DNA聚合酶、T7 DNA pol、T4 DNA pol、大肠杆菌DNA pol 1、Klenow片段、T7 RNA聚合酶和大肠杆菌RNA聚合酶以及相关的亚单位和辅因子的那些。在一个实施方案中,聚合酶为源自Pol6的DNA聚合酶。可用于基于纳米孔的测序的示例性Pol6衍生物公开于例如,US2016/0222363、US2016/0333327、US 2017/0267983、US2018/0094249和US2018/0245147。将聚合酶附着至α溶血素纳米孔的示例性方法包括SpyTag/SpyCatcher肽系统(Zakeri等人PNAS109:E690-E6972012),天然化学连接系统(Thapa等人,Molecules 19:14461144832014)、分选酶系统(Wu和Guo,J Carbohydr Chem 31:48-662012;Heck等人,Appl Microbiol Biotechnol 97:4614752013)、转谷氨酰胺酶系统(Dennler等人,Bioconjug Chem 25:569-5782014)、甲酰甘氨酸链接(Rashidian等人,Bio conjug Chem 24:1277-12942013)或本领域中已知的化学连接技术。在一个实施例中,聚合酶附着至α溶血素亚单位中的一者的氨基酸侧链。在一个实施例中,α溶血素纳米孔为6:1纳米孔,其中聚合酶附着至“1”组分。在一个实施例中,α溶血素纳米孔为6:1纳米孔,其中聚合酶附着至“1”组分,并且其中聚合酶为DNA聚合酶。在另一个实施例中,α溶血素纳米孔为6:1纳米孔,其中聚合酶附着至“1”组分,并且其中聚合酶是衍生自Pol6的DNA聚合酶。
在本文描述的一些实施例中,变体窄通道α溶血素纳米孔根据其“线程率”来表征。在本文中,“线程率”应指具有表现出线程状态的高质量读数(HQR)的变体窄通道α溶血素纳米孔的百分比。具有线程状态的孔的百分比可以如实例5中所述计算。在一些实施例中,变体窄通道α溶血素纳米孔具有小于15%的线程率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于10%的线程率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于5%的线程率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于2%的线程率。
在本文描述的一些实施例中,变体窄通道α溶血素纳米孔根据其“%寿命”来表征。在本文中,“%寿命”应指在暴露于350mV测序波形1小时后,对带T40标签的链霉亲和素保持活性的变体窄通道α溶血素纳米孔的百分比。可以如实例4中所述计算%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于60%的%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于70%的%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于75%的%寿命。在一些实施例中,变体窄通道α溶血素纳米孔具有大于80%的%寿命。
在本文所述的一些实施例中,变体窄通道α溶血素纳米孔根据其“到达率”来表征。在本文中,“到达率”应指在暴露于50Hz、150mV波形15分钟期间,带T40标签的链霉亲和素在变体窄通道α溶血素纳米孔上的平均到达率。可以如实例4中所述计算到达率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于25ms的到达率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于20ms的到达率。在一些实施例中,变体窄通道α溶血素纳米孔具有小于15ms的到达率。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)与SEQ ID NO:1的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性;(b)相对于SEQ ID NO:1的D127G取代;(c)相对于SEQ IDNO:1的D128K取代,和(d)(d1)在相对于SEQ ID NO:1的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(d2)在相对于SEQ ID NO:1的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得变体窄通道α溶血素纳米孔具有小于孔P-0304的线程率的线程率。在一个实施例中,变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含(a1)相对于SEQ ID NO:1的D127G取代和D128K取代中的一者或两者,并且进一步包含(a2)在相对于SEQ ID NO:1的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(a3)在相对于SEQ ID NO:1的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:1具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸并且进一步附着至或适于附着至聚合酶。在另一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含氨基酸序列,该氨基酸序列具有(a1)相对于SEQ ID NO:1的D127G取代,(a2)相对于SEQ ID NO:1的D128K取代,以及(a3)SEQ ID NO:1的E111、M113和K147中的每一者;和(b)“1”组分包含与SEQ ID NO:1具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)与SEQ ID NO:2的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性,(b)包含SEQ ID NO:2的G127和K128中的每一者,并且(c)进一步包含(c1)在相对于SEQ ID NO:2的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c2)在相对于SEQ ID NO:2的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于2%的线程率。在又一个实施例中,窄通道α溶血素亚单位包含E111、M113和K147中的每一者。在又一个实施例中,窄通道α溶血素亚单位包含SEQ ID NO:2或由其组成。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分(a1)包含相对于SEQ ID NO:2的G127和K128中的每一者,并且进一步包含(a2)在相对于SEQ ID NO:2的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(a3)在相对于SEQ ID NO:2的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:2具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸,并且进一步附着至或适于附着至聚合酶。在另一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含SEQ ID NO:2的G127、K128、E111、M113和K147中的每一者;和(b)“1”组分包含与SEQ ID NO:2具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)与SEQ ID NO:3的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性,(b)包含SEQ ID NO:3的G127和K128中的每一者,并且(c)进一步包含(c1)在相对于SEQ ID NO:3的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c2)在相对于SEQ ID NO:3的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,选择在E111、K147和/或M113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于2%的线程率。在又一个实施例中,窄通道α溶血素亚单位包含E111、M113和K147中的每一者。在又一个实施例中,窄通道α溶血素亚单位包含SEQ ID NO:3或由其组成。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分(a1)包含相对于SEQ ID NO:3的G127和K128中的每一者,并且进一步包含(a2)在相对于SEQ ID NO:3的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(a3)在相对于SEQ ID NO:3的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:3具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸并且进一步附着至或适于附着至聚合酶。在另一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含SEQ ID NO:3的G127、K128、E111、M113和K147中的每一者;和(b)“1”组分包含与SEQ ID NO:3具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)与SEQ ID NO:4的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性,(b)SEQ ID NO:4的G127和K128中的每一者,并且(c)进一步包含(c1)在相对于SEQ ID NO:4的N111和N147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c2)在相对于SEQ ID NO:4的A113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于2%的线程率。在另一个实施例中,多肽包含相对于SEQ ID NO:4的N111E、A113M和N147K取代中的每一者。在另一个实施例中,多肽包含相对于SEQ ID NO:4的G127和K128中的每一者并且进一步包含相对于SEQ ID NO:4的N111E、A113M和N147K取代中的每一者。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分(a1)包含相对于SEQ ID NO:4的G127和K128中的每一者,并且进一步包含(a2)在相对于SEQ IDNO:4的N111和N147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(a3)在相对于SEQ ID NO:4的A113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:4具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸并且进一步附着至或适于附着至聚合酶。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含相对于SEQ ID NO:4的G127和K128中的每一者,并且进一步包含相对于SEQID NO:4的N111E、N147K、A113M取代中的每一者;和(b)“1”组分包含与SEQ ID NO:4具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)与SEQ ID NO:5的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性,(b)包含(b1)SEQ ID NO:5的G127,和(b2)相对于SEQ IDNO:5的G128K取代中的一者或两者,并且(c)进一步包含(c1)在相对于SEQ ID NO:5的N111和N147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c2)在相对于SEQ ID NO:5的A113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素具有小于孔P-0304的线程率的线程率。在一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,选择在N111、N147和/或A113处的氨基酸使得变体窄通道α溶血素纳米孔具有小于2%的线程率。在另一个实施例中,多肽包含相对于SEQ ID NO:5的N111E、A113M和N147K取代中的每一者。在又一个实施例中,多肽包含SEQ ID NO:5的G127以及相对于SEQ ID NO:5的G128K、N111E、A113M和N147K取代。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含:(a1)SEQ ID NO:5的G127,(a2)相对于SEQ ID NO:5的G128K取代,(a3)在相对于SEQID NO:5的N111和N147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和(a4)在相对于SEQ ID NO:5的A113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:5具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸并且进一步附着至或适于附着至聚合酶。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含SEQ ID NO:5的G127和相对于SEQ ID NO:5的G128K、N111E、N147K、A113M取代中的每一者;和(b)“1”组分包含与SEQ ID NO:5具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)提供了与SEQ ID NO:6的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性,(b)相对于SEQ ID NO:6的D127G取代和D128K取代中的一者或两者,并且(c)进一步包含(c1)在相对于SEQ ID NO:6的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c2)在相对于SEQ ID NO:6的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得显示线程状态的纳米孔的百分比相对于孔P-0304减少。在一个实施例中,变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含(a1)相对于SEQ ID NO:6的D127G取代和D128K取代中的一者或两者,并且进一步包含(a2)在相对于SEQ ID NO:6的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(a3)在相对于SEQ ID NO:6的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:6具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸并且进一步附着至或适于附着至聚合酶。在另一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含氨基酸序列,该氨基酸序列具有(a1)相对于SEQ ID NO:6的D127G取代,(a2)相对于SEQ ID NO:6的D128K取代,以及(a3)SEQ ID NO:6的E111、M113和K147中的每一者;和(b)“1”组分包含与SEQ ID NO:6具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)与SEQ ID NO:7的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性,(b)相对于SEQ ID NO:7的D127G取代和D128K取代中的一者或两者,并且(c)进一步包含(c1)在相对于SEQ ID NO:7的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c2)在相对于SEQ ID NO:7的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得显示线程状态的纳米孔的百分比相对于孔P-0304减少。在一个实施例中,变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含(a1)相对于SEQ ID NO:7的D127G取代和D128K取代中的一者或两者,并且进一步包含(a2)在相对于SEQ ID NO:7的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(a3)在相对于SEQ ID NO:7的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:7具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸并且进一步附着至或适于附着至聚合酶。在另一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含氨基酸序列,该氨基酸序列具有(a1)相对于SEQ ID NO:7的D127G取代,(a2)相对于SEQ ID NO:7的D128K取代,以及(a3)SEQ ID NO:7的E111、M113和K147中的每一者;和(b)“1”组分包含与SEQ ID NO:7具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
在一个实施例中,变体窄通道α溶血素纳米孔包含1、2、3、4、5、6或7个具有以下特征的窄通道α溶血素亚单位:(a)与SEQ ID NO:8的至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性,(b)相对于SEQ ID NO:8的D127G取代和D128K取代,并且(c)进一步包含(c1)在相对于SEQ ID NO:8的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(c2)在相对于SEQ IDNO:8的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸。选择在E111、K147和/或M113处的氨基酸,使得显示线程状态的纳米孔的百分比相对于孔P-0304减少。在一个实施例中,变体窄通道α溶血素纳米孔具有小于15%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于10%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于5%的线程率。在另一个实施例中,变体窄通道α溶血素纳米孔具有小于2%的线程率。在又一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含(a1)相对于SEQ ID NO:8的D127G取代和D128K取代中的一者或两者,并且进一步包含(a2)在相对于SEQ ID NO:8的E111和K147中的一者或两者处具有比天冬酰胺(诸如谷氨酸、赖氨酸、精氨酸或谷氨酰胺)长的侧链的氨基酸,和/或(a3)在相对于SEQ ID NO:8的M113处具有比丙氨酸(诸如亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸)长的侧链的氨基酸;(b)“1”组分包含与SEQ ID NO:8具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、或至少95%同一性的氨基酸并且进一步附着至或适于附着至聚合酶。在另一个实施例中,变体窄通道α溶血素纳米孔为6:1异七聚体,其中:(a)至少“6”组分包含氨基酸序列,该氨基酸序列具有(a1)相对于SEQ ID NO:8的D127G取代,(a2)相对于SEQ ID NO:8的D128K取代,以及(a3)SEQ ID NO:8的E111、M113和K147中的每一者;和(b)“1”组分包含与SEQ ID NO:8具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性或至少95%同一性的氨基酸序列并且进一步附着至或适于附着至聚合酶。
VII.SBS测序系统和方法
在一个实施例中,提供了一种用于进行核酸边合成边测序(SBS)的系统,该系统包括:(a)如第VI部分中所公开的变体窄通道α溶血素纳米孔,(b)与纳米孔相关的核酸聚合酶,(c)设置在电解质溶液中的一组核苷酸寡磷酸酯,所述核苷酸寡磷酸酯包含能够穿过(a)的纳米孔的带正电荷的标签,以及(d)至少一个电极,其被定位成记录流过通道的电流的特征。
图4示出了用于进行基于标签的SBS核苷酸测序的纳米孔测序复合体500的示例性实施例。电阻屏障501将本体电解质溶液502与第二电解质溶液503分离。如本文所公开的七聚体α溶血素纳米孔504设置在电阻屏障501中,并且纳米孔505的通道提供离子可以在本体电解质502与第二电解质503之间流动的路径。工作电极506设置在电阻屏障501的含有第二电解质503的一侧(称为电阻屏障的“反式侧”)并且定位在七聚体α溶血素纳米孔504附近。对电极507位于含有本体电解质502的电阻屏障501的一侧(称为电阻屏障的“顺式侧”)。信号源508适于在工作电极506与对电极507之间施加电压信号。聚合酶509与七聚体α溶血素纳米孔504相关,并且引发的模板核酸510与聚合酶相关。本体电解质502包括四种不同的带聚合物标签的核苷寡磷酸酯511(标签展示为511a)。聚合酶509催化聚合物带标签的核苷酸511并入模板的扩增子中。当带标签的核苷寡磷酸酯511与聚合酶509正确复合时,可以通过电动力将标签511a拉到(例如,负载)纳米孔中,诸如在电场的存在下生成的力,该电场由跨电阻屏障501和/或纳米孔504施加的电压生成。当标签511a占据纳米孔504的通道时,其影响通过纳米孔504的离子流,由此生成离子封锁信号512。每个核苷酸511具有独特的聚合物标签511a,其由于标签511a的不同化学结构和/或尺寸而生成独特的离子封锁信号。通过识别独特的离子封锁信号512,可以识别独特的标签511a的身份(以及因此与其相关的核苷酸510)。将每个核苷酸510掺入到扩增子中,迭代地重复该过程。
VIII.实例
实例1:变体α-溶血素多肽的生成和表达
编码具有SEQ ID NO:1的氨基酸序列的野生型α溶血素的DNA是从商业来源购买的。使用QuikChange多位点定向诱变试剂盒(Agilent,La Jolla,CA)通过位点定向诱变进行序列修改,以生成编码SEQ ID NO:2-8的核酸,该核酸具有C-末端接头/TEV/HisTag。另外,SEQ ID NO:5、7和8中的每一者用C-末端SpyTag表达。用pET-26b(+)载体转化大肠杆菌BL21 DE3细胞(ThermoFisher,Waltham,MA,USA),并根据制造商的说明书培养转化的细胞以进行蛋白质表达。通过离心收获培养的细胞,然后经由超声处理裂解。通过亲和柱色谱法(Metal Affinity Resin,Takara Bio USA)从裂解物中纯化带有可裂解表位标签的多肽。切割表位标签,并经由亲和柱色谱法(/>Metal Affinity Resin,Takara Bio USA)将变体α溶血素多肽与切割标签和未切割多肽分离。如果在5天内使用,则将蛋白质储存在4℃下,否则添加8%海藻糖并储存在-80℃下。以这种方式产生的变体α溶血素多肽的氨基酸序列及其与SEQ ID NO:1的比对如图4所示。所示序列包括α溶血素亚单位序列,但不包括相关的SpyTag序列。
实例2:纳米孔的组装
使用大约10mg的总蛋白,将以下α溶血素/SpyTag与所需的α溶血素变体蛋白组合以亚单位1与亚单位2的9:1比例(w/w)混合在一起,形成七聚体的混合物:
表5
将二植酰磷脂酰胆碱(DPhPC)脂质溶解在50mM Tris、200mM NaCl、pH 8或150mMKCl、30mM HEPES、pH 7.5中至50mg/ml的最终浓度,并添加至a-HL亚单位混合物中至5mg/ml的最终浓度。将α溶血素亚单位的混合物在37℃下孵育至少60分钟。此后,将n-辛基-β-D-吡喃葡萄糖苷(βOG)添加至5%(重量/体积)的最终浓度以溶解所得脂质-蛋白质混合物。离心样品以清除蛋白质聚集体和残留的脂质复合体,并收集上清液用于进一步纯化。然后对七聚体的混合物进行阳离子交换纯化,并收集对应于6:1比例的亚单位1:亚单位2的洗脱级分。
实例3:孔的到达率和寿命
为了测量所生成的纳米孔的寿命,将实例2中生成的6:1孔插入到如PCT/US14/61853中所述的测序阵列上。将与聚脱氧胸苷40mer(T40标签)缀合的链霉亲和素珠流到阵列上,并将350mV的测序波形施加至系统上1小时。随着电荷极性的变化,标签插入(导致“插入状态”)并从孔中弹出(导致“开放通道”),这是通过监测阵列上每个单独孔的电导变化来观察的。孔被认为是“活跃的”,只要它们继续显示出与插入状态和开放通道相关的不同电导水平。孔种类的“寿命”是通过计算在整个1小时运行过程中保持活跃的单个孔的百分比来确定的。
为了测量孔的到达率,使用与在寿命实验中相同的设置,不同之处在于阵列经受50Hz、150mV波形15分钟。孔种类的“到达率”通过以下方式确定:(a)确定在阵列上每个单独孔的孔插入之间的平均时间,(b)计算在(a)中确定的所有平均值的平均值。
每个实验针对表5中描述的所有孔进行。结果如图2所示,其中绘制了针对每个孔物种的寿命(Y轴)与平均到达率(X轴)的关系图。可以看出,相对于SEQ ID NO:1具有D127G+D128K取代的两个窄通道α溶血素纳米孔(P-0411和P-0414)具有相对高的寿命(>80%)和可接受的到达率(<15ms),与宽通道α溶血素纳米孔(P-0304)相当。没有D127G+D128K取代的窄通道α溶血素纳米孔的寿命低得多(<10%)。这表示D127G+D128K取代极大地改进了窄通道α溶血素纳米孔的寿命,同时保持可接受的到达率。
实例5:使用窄通道α溶血素纳米孔减缓线程
为了评估窄通道α溶血素纳米孔对模板线程程度的影响,对来自实例2的每个孔运行标准测序实验。
用含有编码Pol6 DNA聚合酶-SpyCatcher融合蛋白的表达盒的pPR-IBA2质粒(IBALife Sciences,Germany)转化大肠杆菌BL21 DE3细胞(ThermoFisher,Waltham,MA,USA)。根据制造商的说明书培养转化的细胞进行蛋白质表达,并使用钴亲和柱纯化融合蛋白。将SpyCatcher-聚合酶融合物与来自实例2的6:1纳米孔以1:1摩尔比在4℃下在3mM SrCl2中孵育过夜。然后使用尺寸排阻色谱法纯化聚合酶-α溶血素七聚体复合体。
如US2017-0268052中所述,从纯化的聚合酶-α溶血素七聚体复合体生成聚合酶孔模板复合体,并如PCT/US14/61853中所述将其插入测序阵列上。在包含20mM HEPES pH 8、300mM KGlu、3mM Mg2+的缓冲液存在下,将带负电荷标签的核苷酸流到系统上,并进行标准测序运行。测序运行中的聚合数据仅针对生成高质量读数(HQR)的孔进行过滤,并计算显示模板线程证据的HQR的百分比。
对宽通道α溶血素纳米孔(孔P-0304)和具有D127G+D128K取代的两个窄通道α溶血素纳米孔(孔P-0411和P-0414)重复该实验。如图3所示,P-0304具有大于15%的表现出线程状态的孔,而P-0411和P-0414都具有小于2%的表现出线程状态的孔。
应当理解,本文所述的实例和实施例仅用于说明目的,并且其各种修改或变化将被建议给本领域技术人员,并且将被包括在本申请的精神和界限内以及所附权利要求的范围内。本文引用的所有出版物、专利和专利申请出于所有目的通过引用整体并入本文。
/>
/>
/>
/>
/>
/>
引文列表
Akeson et al.,Microsecond timescale discrimination amongpolycytidylic acid,polyadenylic acid,and polyuridylic acid as homopolymers oras segments within single RNA molecules,Biophys.J.(1999)77:3227–3233.
Aksimentiev and Schulten,Imaging a-Hemolysin with Molecular Dynamics:Ionic Conductance,Osmotic Permeability,and the Electrostatic Potential Map,Biophysical Journal(2005)88:3745–3761.
Bhattacharya et al.,Rectification of the Current in α-Hemolysin PoreDepends on the Cation Type:The Alkali Series Probed by Molecular DynamicsSimulations and Experiments,The Journal of Physical Chemistry(2011),Vol.115,Issue 10,pp.4255–4264.
Butler et al.,Single-molecule DNA detection with an engineered MspAprotein nanopore,PNAS(2008)105(52):20647–20652.
Chen et al.,Fusion Protein Linkers:Property,Design and Functionality,Advanced Drug Delivery Reviews,15 October 2013,Vol.65,Issue 10,pp.1357-1369.
Hammerstein et al.,Subunit dimers of α-hemolysin expand theengineering toolbox for protein Nanopores,Journal of Biological Chemistry,Vol.286,Issue 16,pp.14324–34.
Howorka et al.,Sequence-specific detection of individual DNA strandsusing engineered nanopores,Nat.Biotechnol.,19(2001a),pp.636–639.
Howorka et al.,Kinetics of duplex formation for individual DNAstrands within a single protein nanopore,Proc.Natl.Acad.Sci.USA,98(2001b),pp.12996–13001.
Kasianowicz et al.,Nanometer-scale pores:potential applications foranalyte detection and DNA characterization,Proc.Natl.Acad.Sci.USA(1996)93:13770–13773.
Korchev et al.,Low Conductance States of a Single Ion Channel arenot'Closed',J.Membrane Biol.(1995)147:233-239.
Krasilnikov and Sabirov,Ion Transport Through Channels Formed inLipid Bilayers by Staphylococcus aureus Alpha-Toxin,Gen.Physiol.Biophys.(1989)8:213-222.
Meller et al.,Voltage-driven DNA translocations through a nanopore,Phys.Rev.Lett.,86(2001),pp.3435–3438.
Movileanu et al.,Detecting protein analytes that modulatetransmembrane movement of a polymer chain within a single protein pore,Nat.Biotechnol.,18(2000),pp.1091–1095.
Nakane et al.,A Nanosensor for Transmembrane Capture andIdentification of Single Nucleic Acid Molecules,Biophys.J.(2004)87:615-621.
Noskov et al.,Ion Permeation through the α-Hemolysin Channel:Theoretical Studies Based on Brownian Dynamics and Poisson-Nernst-PlankElectrodiffusion Theory,Biophysical Journal(2004),Vol.87,Issue 4,pp.2299–2309
Rhee and Burns,Nanopore sequencing technology:nanopore preparations,TRENDS in Biotech.(2007)25(4):174-181.
Song et al.,Structure of Staphylococcal α-HemoIysin,a HeptamericTransmembrane Pore,Science(1996)274:1859-1866.
Stoddart et al.,Single-nucleotide discrimination in immobilized DNAoligonucleotides with a biological nanopore,Proceedings of the NationalAcademy of Sciences of the United States of America(2009),Vol.106,Issue 19,pp.7702–7707.
本文引用的每项专利、专利申请、出版物、文件、GENBANK序列、网站和其他公开材料的全部内容通过引用方式并入,包括所有表格、图纸和附图。所有专利和出版物均以引用方式并入本文,所达到的程度被具体地和单独地表示通过引用方式并入。引用上述专利、专利申请、出版物和文件并不表示承认前述任何内容为相关现有技术,也不构成对这些出版物或文件的内容或日期的任何承认。本文提及的所有专利和出版物均表示本发明所属领域的普通技术人员的技术水平。
Claims (17)
1.一种包含变体窄通道α-溶血素亚单位的多肽,其中所述变体窄通道α溶血素亚单位具有至少以下特性:
(a)与选自由以下项组成的组的氨基酸序列的至少75%同一性:
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:
4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8;
(b)相对于SEQ ID NO:1的D127G取代;
(c)相对于SEQ ID NO:1的D128K取代;以及
(d)以下中的一者或多者:
(d1)在对应于SEQ ID NO:1的E111的位置处的具有比天冬酰胺的侧链长的侧链的氨基酸,
(d2)在对应于SEQ ID NO:1的K147的位置处的具有比天冬酰胺的侧链长的侧链的氨基酸,和/或
(d3)在对应于SEQ ID NO:1的M113的位置处的具有比丙氨酸的侧链长的侧链的氨基酸。
2.根据权利要求1所述的多肽,其中所述变体窄通道α溶血素亚单位具有与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中的至少一者的至少80%、至少85%、至少90%、至少95%或更大同一性。
3.根据权利要求1或权利要求2所述的多肽,其中在对应于E111的所述位置处的所述氨基酸选自由以下项组成的组:谷氨酸、赖氨酸、精氨酸和谷氨酰胺。
4.根据权利要求1或权利要求2所述的多肽,其中在对应于E111的所述位置处的所述氨基酸选自由以下项组成的组:谷氨酸和赖氨酸。
5.根据权利要求1或权利要求2所述的多肽,其中对应于E111的氨基酸残基为谷氨酸。
6.根据权利要求1至5中任一项所述的多肽,其中在对应于K147的所述位置处的所述氨基酸选自由以下项组成的组:谷氨酸、赖氨酸、精氨酸和谷氨酰胺。
7.根据权利要求1至5中任一项所述的多肽,其中在对应于K147的所述位置处的所述氨基酸选自由以下项组成的组:谷氨酸和赖氨酸。
8.根据权利要求1至5中任一项所述的多肽,其中在对应于K147的所述位置处的所述氨基酸为赖氨酸。
9.根据权利要求1至8中任一项所述的多肽,其中在对应于M113的所述位置处的所述氨基酸选自由以下项组成的组:亮氨酸、异亮氨酸、缬氨酸或甲硫氨酸。
10.根据权利要求1至8中任一项所述的多肽,其中在对应于M113的所述位置处的所述氨基酸为甲硫氨酸。
11.一种包含选自由以下项组成的组的氨基酸序列的多肽:
(a)具有与SEQ ID NO:1的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含
(a1)相对于SEQ ID NO:1的D127G和D128K取代,以及(a2)SEQ ID NO:1的E111、M113和K147中的每一者;
(b)具有与SEQ ID NO:2的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含SEQ ID NO:2的G127、K128、E111、M113和K147中的每一者;
(c)具有与SEQ ID NO:3的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含SEQ ID NO:3的G127、K128、E111、M113和K147中的每一者;
(d)具有与SEQ ID NO:4的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含
(d1)SEQ ID NO:4的G127和K128中的每一者,
(d2)相对于SEQ ID NO:4的N111E取代,
(d3)相对于SEQ ID NO:4的N147K取代,以及
(d4)相对于SEQ ID NO:4的A113M取代;
(e)具有与SEQ ID NO:5的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含:
(e1)SEQ ID NO:5的G127,
(e2)相对于SEQ ID NO:5的G128K取代,
(e3)相对于SEQ ID NO:5的N111E取代,
(e4)相对于SEQ ID NO:5的N147K取代,以及
(e5)相对于SEQ ID NO:5的A113M取代;
(f)具有与SEQ ID NO:6的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含:
(f1)相对于SEQ ID NO:6的D127G和D128K取代,
(f2)SEQ ID NO:6的E111、K147和M113中的每一者;
(g)具有与SEQ ID NO:7的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含:
(g1)相对于SEQ ID NO:7的D127G和D128K取代,以及(g2)SEQ ID NO:7的E111、M113和K147中的每一者;以及
(h)具有与SEQ ID NO:8的至少75%同一性的氨基酸序列,其中所述氨基酸序列包含:
(h1)相对于SEQ ID NO:8的D127G和D128K取代,以及(h2)SEQ ID NO:8的E111、M113和K147中的每一者。
12.根据权利要求11所述的多肽,其中所述氨基酸序列具有与SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中的至少一者的至少80%、至少85%、至少90%、至少95%或更大同一性。
13.一种窄通道α-溶血素纳米孔,其包含至少1个根据权利要求1至12中任一项所述的多肽。
14.根据权利要求13中任一项所述的窄通道α-溶血素纳米孔,其中所述纳米孔包含至少6个变体窄通道α-溶血素亚单位,所述变体窄通道α-溶血素亚单位包含相对于SEQ IDNO:1的D127G和D128K取代。
15.根据权利要求14所述的窄通道α-溶血素纳米孔,其中所述窄通道α溶血素纳米孔为6:1纳米孔,并且“1”组分附接至DNA聚合酶。
16.一种用于进行核酸边合成边测序(SBS)的系统,所述系统包括:
(a)芯片,其包括多个感测电极;
(b)电化学电阻屏障,其设置在所述芯片的表面上,其中所述屏障具有顺式侧和反式侧;
(c)所述屏障的所述顺式侧上的第一电解质溶液;
(d)所述屏障的所述反式侧上的第二电解质溶液;
(e)多个根据权利要求13至15中任一项所述的窄通道α溶血素纳米孔,其中所述窄通道α溶血素纳米孔设置在所述屏障中,使得所述窄通道α溶血素纳米孔的通道允许所述第一电解质溶液与所述第二电解质溶液之间的离子交换,并且其中所述窄通道α溶血素纳米孔的至少一部分足够接近所述感测电极中的一个,使得所述感测电极可检测流过所述纳米孔的所述通道的电流的至少一个特性;
(f)与所述感测电极电子通信的计算机系统,其中计算系统被适配成记录由所述感测电极检测到的流过所述纳米孔的所述电流的所述特性;
(g)与所述屏障的所述顺式侧上的所述纳米孔缔合的核酸聚合酶,其中所述核酸聚合酶能够催化所述第一电解质溶液中的模板依赖性核酸扩增反应;以及
(f)设置在所述第一电解质溶液中的一组核苷-5'-寡磷酸酯,所述组至少包括带聚合物标签的腺苷核苷-5'-寡磷酸酯、带聚合物标签的鸟嘌呤核苷-5'-寡磷酸酯、带聚合物标签的胞嘧啶核苷-5'-寡磷酸酯、以及带聚合物标签的胸苷核苷-5'-寡磷酸酯或带聚合物标签的尿嘧啶核苷-5'-寡磷酸酯,其中带聚合物标签的核苷-5'-寡磷酸酯中的每一者为所述核苷-5'-寡磷酸酯。
17.一种对模板核酸进行测序的边合成边测序(SBS)方法,所述方法包括:
提供根据权利要求16所述的系统,所述系统具有多个活性纳米孔测序复合体,每个活性纳米孔测序复合体包含:
o所述感测电极中的至少一个;
o插入在所述屏障中的与所述感测电极临近的所述纳米孔中的一个,其中电流流过所述纳米孔,并且由所述感测电极检测所述电流的特性;
o与所述纳米孔缔合的所述核酸聚合酶;以及
o与所述核酸聚合酶复合的所述模板核酸;
在所述活性纳米孔测序复合体处,通过由所述核酸聚合酶催化的模板依赖性核酸扩增反应来将带标签的核苷-5'-寡磷酸酯并入到所述模板核酸的互补核酸中,其中当所述带标签的核苷-5'-寡磷酸酯被并入到所述互补核酸中时,所述带标签的核苷-5'-寡磷酸酯的所述聚合物标签移动到所述纳米孔的所述通道中或与所述纳米孔的所述通道临近,并且其中所述聚合物标签到所述通道中或与所述通道临近的移动改变流过所述纳米孔的所述电流的所述特性;
用所述感测电极检测由所述聚合物标签引起的流过所述纳米孔的所述电流的所述特性的变化,并且将所述变化记录在所述计算机系统上;以及
将每个记录的变化与所述带标签的核苷-5'-寡磷酸酯中的一个相关联,由此生成在该电极处生成的所述互补核酸的序列。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163224282P | 2021-07-21 | 2021-07-21 | |
US63/224282 | 2021-07-21 | ||
PCT/EP2022/070110 WO2023001784A1 (en) | 2021-07-21 | 2022-07-19 | Alpha-hemolysin variants forming narrow channel pores and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117999346A true CN117999346A (zh) | 2024-05-07 |
Family
ID=82932348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280050834.6A Pending CN117999346A (zh) | 2021-07-21 | 2022-07-19 | 形成窄通道孔的α-溶血素变体及其用途 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4373925A1 (zh) |
CN (1) | CN117999346A (zh) |
WO (1) | WO2023001784A1 (zh) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106536483B (zh) | 2014-05-09 | 2020-02-07 | 生物检索技术股份有限公司 | Cosmic猝灭剂 |
WO2016069806A2 (en) | 2014-10-31 | 2016-05-06 | Genia Technologies, Inc. | Alpha-hemolysin variants with altered characteristics |
EP3253867B1 (en) | 2015-02-02 | 2020-05-06 | H. Hoffnabb-La Roche Ag | Polymerase variants |
US10526588B2 (en) | 2015-05-14 | 2020-01-07 | Roche Sequencing Solutions, Inc. | Polymerase variants and uses thereof |
CA3000561C (en) | 2015-09-24 | 2022-03-22 | F. Hoffman-La Roche Ag | Alpha-hemolysin variants |
EP3423574B1 (en) | 2016-02-29 | 2021-03-17 | Genia Technologies, Inc. | Polymerase-template complexes for nanopore sequencing |
CN108699539B (zh) | 2016-02-29 | 2022-11-18 | 吉尼亚科技公司 | 外切核酸酶缺陷的聚合酶 |
US10590480B2 (en) | 2016-02-29 | 2020-03-17 | Roche Sequencing Solutions, Inc. | Polymerase variants |
EP3445775A1 (en) | 2016-04-21 | 2019-02-27 | H. Hoffnabb-La Roche Ag | Alpha-hemolysin variants and uses thereof |
EP3478706B1 (en) | 2016-06-30 | 2022-02-09 | F. Hoffmann-La Roche AG | Long lifetime alpha-hemolysin nanopores |
WO2018054970A2 (en) | 2016-09-22 | 2018-03-29 | F. Hoffmann-La Roche Ag | Pol6 polymerase variants |
CN112041331B (zh) * | 2018-02-28 | 2024-05-28 | 豪夫迈·罗氏有限公司 | α-溶血素变体及其用途 |
-
2022
- 2022-07-19 EP EP22754789.0A patent/EP4373925A1/en active Pending
- 2022-07-19 CN CN202280050834.6A patent/CN117999346A/zh active Pending
- 2022-07-19 WO PCT/EP2022/070110 patent/WO2023001784A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2023001784A1 (en) | 2023-01-26 |
EP4373925A1 (en) | 2024-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230295247A1 (en) | Alpha-hemolysin variants with altered characteristics | |
JP7027334B2 (ja) | アルファ溶血素バリアントおよびその使用 | |
JP6874017B2 (ja) | 変異体ポア | |
EP3766987B1 (en) | Alpha-hemolysin variants | |
KR102472805B1 (ko) | 돌연변이체 포어 | |
JP2020530276A (ja) | 新規タンパク質細孔 | |
CN114605507A (zh) | 突变csgg孔 | |
CN112041331B (zh) | α-溶血素变体及其用途 | |
CN117999346A (zh) | 形成窄通道孔的α-溶血素变体及其用途 | |
US11845779B2 (en) | Mutant aerolysin and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |