KR20180132081A - 돌연변이체 포어 - Google Patents
돌연변이체 포어 Download PDFInfo
- Publication number
- KR20180132081A KR20180132081A KR1020187029957A KR20187029957A KR20180132081A KR 20180132081 A KR20180132081 A KR 20180132081A KR 1020187029957 A KR1020187029957 A KR 1020187029957A KR 20187029957 A KR20187029957 A KR 20187029957A KR 20180132081 A KR20180132081 A KR 20180132081A
- Authority
- KR
- South Korea
- Prior art keywords
- mutant
- pore
- leu
- monomer
- polynucleotide
- Prior art date
Links
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims abstract description 183
- 239000004472 Lysine Substances 0.000 claims abstract description 180
- 239000012491 analyte Substances 0.000 claims abstract description 65
- 239000000178 monomer Substances 0.000 claims description 458
- 239000011148 porous material Substances 0.000 claims description 399
- 102220498565 Serine/threonine-protein kinase N2_E94D_mutation Human genes 0.000 claims description 378
- 102000040430 polynucleotide Human genes 0.000 claims description 314
- 108091033319 polynucleotide Proteins 0.000 claims description 314
- 239000002157 polynucleotide Substances 0.000 claims description 314
- 235000001014 amino acid Nutrition 0.000 claims description 208
- 229940024606 amino acid Drugs 0.000 claims description 203
- 150000001413 amino acids Chemical group 0.000 claims description 187
- 125000003729 nucleotide group Chemical group 0.000 claims description 182
- 239000002773 nucleotide Substances 0.000 claims description 180
- 238000000034 method Methods 0.000 claims description 155
- 102200075749 rs397514044 Human genes 0.000 claims description 153
- 102220483642 Nuclear distribution protein nudE homolog 1_E84Q_mutation Human genes 0.000 claims description 143
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 137
- 102220281611 rs45602040 Human genes 0.000 claims description 105
- 238000006467 substitution reaction Methods 0.000 claims description 97
- 230000035772 mutation Effects 0.000 claims description 77
- 230000004048 modification Effects 0.000 claims description 56
- 238000012986 modification Methods 0.000 claims description 56
- 239000012528 membrane Substances 0.000 claims description 55
- 108090000623 proteins and genes Proteins 0.000 claims description 47
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 43
- 235000018102 proteins Nutrition 0.000 claims description 42
- 102000004169 proteins and genes Human genes 0.000 claims description 42
- 102000014914 Carrier Proteins Human genes 0.000 claims description 39
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 39
- 108091008324 binding proteins Proteins 0.000 claims description 38
- 238000005259 measurement Methods 0.000 claims description 26
- 101710174798 Lysenin Proteins 0.000 claims description 23
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 23
- 239000000126 substance Substances 0.000 claims description 23
- 102220020965 rs80356883 Human genes 0.000 claims description 22
- 238000012163 sequencing technique Methods 0.000 claims description 22
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 20
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 20
- 235000009582 asparagine Nutrition 0.000 claims description 20
- 229960001230 asparagine Drugs 0.000 claims description 20
- 229920001184 polypeptide Polymers 0.000 claims description 20
- 239000004149 tartrazine Substances 0.000 claims description 16
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 14
- 102220532368 Serpin B10_K99Q_mutation Human genes 0.000 claims description 12
- 102220317878 rs1553902353 Human genes 0.000 claims description 11
- 102220294731 rs181236250 Human genes 0.000 claims description 11
- 102220588493 Hemoglobin subunit beta_T51K_mutation Human genes 0.000 claims description 10
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 10
- 229920000642 polymer Polymers 0.000 claims description 10
- 239000004475 Arginine Substances 0.000 claims description 9
- 102220591546 Cysteine-rich hydrophobic domain-containing protein 1_E76S_mutation Human genes 0.000 claims description 9
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 9
- 102220352322 c.232A>C Human genes 0.000 claims description 9
- 102200155724 rs397507514 Human genes 0.000 claims description 9
- 102220041769 rs5030829 Human genes 0.000 claims description 8
- 102220080714 rs797046135 Human genes 0.000 claims description 8
- 102220009454 rs80356863 Human genes 0.000 claims description 8
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 7
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 7
- 235000003704 aspartic acid Nutrition 0.000 claims description 7
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 7
- 102220349156 c.233G>A Human genes 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 7
- 102200010046 rs483352822 Human genes 0.000 claims description 7
- 102220156195 rs749061654 Human genes 0.000 claims description 7
- 102220634571 AP-2 complex subunit alpha-1_E92V_mutation Human genes 0.000 claims description 6
- 102220483736 Amiloride-sensitive sodium channel subunit delta_H83K_mutation Human genes 0.000 claims description 6
- 102220521062 Discoidin, CUB and LCCL domain-containing protein 1_K37Q_mutation Human genes 0.000 claims description 6
- 102220475952 Hydroxycarboxylic acid receptor 1_V47N_mutation Human genes 0.000 claims description 6
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 6
- 239000004473 Threonine Substances 0.000 claims description 6
- 102220466461 Olfactory receptor 13C9_T91S_mutation Human genes 0.000 claims description 5
- 108091034117 Oligonucleotide Proteins 0.000 claims description 5
- 102220502392 Putative C->U-editing enzyme APOBEC-4_E84A_mutation Human genes 0.000 claims description 5
- 239000007864 aqueous solution Substances 0.000 claims description 5
- 102220198313 rs1057519973 Human genes 0.000 claims description 5
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 4
- 229960000310 isoleucine Drugs 0.000 claims description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 102220115271 rs376405759 Human genes 0.000 claims description 4
- 102220176154 rs767304567 Human genes 0.000 claims description 4
- 102200089579 rs786202787 Human genes 0.000 claims description 4
- 102220502795 von Hippel-Lindau disease tumor suppressor_S80N_mutation Human genes 0.000 claims description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 3
- 239000007844 bleaching agent Substances 0.000 claims description 2
- 239000003344 environmental pollutant Substances 0.000 claims description 2
- 239000002360 explosive Substances 0.000 claims description 2
- 229910017053 inorganic salt Inorganic materials 0.000 claims description 2
- 229910021645 metal ion Inorganic materials 0.000 claims description 2
- 230000005012 migration Effects 0.000 claims description 2
- 238000013508 migration Methods 0.000 claims description 2
- 239000003237 recreational drug Substances 0.000 claims description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 2
- 102220050151 rs556977618 Human genes 0.000 claims 10
- 102220638884 MPN domain-containing protein_K45R_mutation Human genes 0.000 claims 6
- 102220076678 rs146651027 Human genes 0.000 claims 5
- 102200091898 rs77050410 Human genes 0.000 claims 4
- 102220148660 rs886059750 Human genes 0.000 claims 4
- 102200067148 rs769650474 Human genes 0.000 claims 3
- WDECIBYCCFPHNR-UHFFFAOYSA-N chrysene Chemical compound C1=CC=CC2=CC=C3C4=CC=CC=C4C=CC3=C21 WDECIBYCCFPHNR-UHFFFAOYSA-N 0.000 claims 2
- 231100000219 mutagenic Toxicity 0.000 claims 1
- 230000003505 mutagenic effect Effects 0.000 claims 1
- 238000006384 oligomerization reaction Methods 0.000 claims 1
- 238000012512 characterization method Methods 0.000 abstract description 12
- 235000018977 lysine Nutrition 0.000 description 148
- 102220495767 Nucleolar and spindle-associated protein 1_E92Q_mutation Human genes 0.000 description 135
- -1 monophosphate nucleoside Chemical class 0.000 description 63
- 108020004414 DNA Proteins 0.000 description 55
- 102000053602 DNA Human genes 0.000 description 53
- 125000003275 alpha amino acid group Chemical group 0.000 description 52
- 125000005647 linker group Chemical group 0.000 description 52
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 41
- 102000004190 Enzymes Human genes 0.000 description 41
- 108090000790 Enzymes Proteins 0.000 description 41
- 239000000523 sample Substances 0.000 description 39
- 229910052739 hydrogen Inorganic materials 0.000 description 33
- 210000004027 cell Anatomy 0.000 description 30
- 230000001976 improved effect Effects 0.000 description 30
- 150000007523 nucleic acids Chemical class 0.000 description 28
- 108060002716 Exonuclease Proteins 0.000 description 27
- 108060004795 Methyltransferase Proteins 0.000 description 27
- 102000013165 exonuclease Human genes 0.000 description 27
- 230000003993 interaction Effects 0.000 description 27
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- 235000018417 cysteine Nutrition 0.000 description 23
- 239000000232 Lipid Bilayer Substances 0.000 description 22
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 22
- 230000001965 increasing effect Effects 0.000 description 20
- 239000010410 layer Substances 0.000 description 20
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 230000000694 effects Effects 0.000 description 18
- 102220239148 rs992728216 Human genes 0.000 description 18
- 125000001424 substituent group Chemical group 0.000 description 17
- 239000002585 base Substances 0.000 description 16
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 16
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- 238000007792 addition Methods 0.000 description 14
- 239000000872 buffer Substances 0.000 description 14
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 14
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 14
- 239000001257 hydrogen Substances 0.000 description 14
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 239000004971 Cross linker Substances 0.000 description 12
- 239000003431 cross linking reagent Substances 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 12
- 150000003839 salts Chemical class 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 229920000858 Cyclodextrin Polymers 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 11
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 11
- 238000005859 coupling reaction Methods 0.000 description 11
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 239000003153 chemical reaction reagent Substances 0.000 description 10
- 230000008878 coupling Effects 0.000 description 10
- 238000010168 coupling process Methods 0.000 description 10
- 229920001223 polyethylene glycol Polymers 0.000 description 10
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 10
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 9
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 9
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 9
- 102220478274 Interleukin enhancer-binding factor 2_K45R_mutation Human genes 0.000 description 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 9
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 9
- 229920001400 block copolymer Polymers 0.000 description 9
- 125000003636 chemical group Chemical group 0.000 description 9
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 9
- 235000013928 guanylic acid Nutrition 0.000 description 9
- 150000002632 lipids Chemical class 0.000 description 9
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 9
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 8
- 239000004471 Glycine Substances 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000009257 reactivity Effects 0.000 description 8
- 229920002477 rna polymer Polymers 0.000 description 8
- 150000003573 thiols Chemical class 0.000 description 8
- 229960004441 tyrosine Drugs 0.000 description 8
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 7
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 7
- 239000002202 Polyethylene glycol Substances 0.000 description 7
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000007385 chemical modification Methods 0.000 description 7
- 235000012000 cholesterol Nutrition 0.000 description 7
- JSRLJPSBLDHEIO-SHYZEUOFSA-N dUMP Chemical compound O1[C@H](COP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 JSRLJPSBLDHEIO-SHYZEUOFSA-N 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000002209 hydrophobic effect Effects 0.000 description 7
- 125000003588 lysine group Chemical class [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 7
- 229960005190 phenylalanine Drugs 0.000 description 7
- 102220253683 rs121913596 Human genes 0.000 description 7
- 238000010561 standard procedure Methods 0.000 description 7
- 235000000346 sugar Nutrition 0.000 description 7
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 7
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 6
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 6
- 125000003277 amino group Chemical group 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 125000003118 aryl group Chemical group 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- ZOOGRGPOEVQQDX-KHLHZJAASA-N cyclic guanosine monophosphate Chemical compound C([C@H]1O2)O[P@](O)(=O)O[C@@H]1[C@H](O)[C@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-KHLHZJAASA-N 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 102220070933 rs794728602 Human genes 0.000 description 6
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 description 5
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 5
- 150000008574 D-amino acids Chemical class 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 5
- 238000012300 Sequence Analysis Methods 0.000 description 5
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 5
- 238000010382 chemical cross-linking Methods 0.000 description 5
- CIKGWCTVFSRMJU-KVQBGUIXSA-N dGDP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 CIKGWCTVFSRMJU-KVQBGUIXSA-N 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 239000013615 primer Substances 0.000 description 5
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 4
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 4
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 4
- WWZKQHOCKIZLMA-UHFFFAOYSA-N Caprylic acid Natural products CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 4
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 description 4
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 4
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 4
- 241000243686 Eisenia fetida Species 0.000 description 4
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 4
- 244000068988 Glycine max Species 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 102100022536 Helicase POLQ-like Human genes 0.000 description 4
- 101000899334 Homo sapiens Helicase POLQ-like Proteins 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- 241000589499 Thermus thermophilus Species 0.000 description 4
- BZDVTEPMYMHZCR-JGVFFNPUSA-N [(2s,5r)-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)CC1 BZDVTEPMYMHZCR-JGVFFNPUSA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- GONOPSZTUGRENK-UHFFFAOYSA-N benzyl(trichloro)silane Chemical compound Cl[Si](Cl)(Cl)CC1=CC=CC=C1 GONOPSZTUGRENK-UHFFFAOYSA-N 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 4
- 235000020958 biotin Nutrition 0.000 description 4
- 239000011616 biotin Substances 0.000 description 4
- FPUGCISOLXNPPC-IOSLPCCCSA-N cordysinin B Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(N)=C2N=C1 FPUGCISOLXNPPC-IOSLPCCCSA-N 0.000 description 4
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 4
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- FUZZWVXGSFPDMH-UHFFFAOYSA-N n-hexanoic acid Natural products CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 4
- 230000003472 neutralizing effect Effects 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 229910052700 potassium Inorganic materials 0.000 description 4
- 239000001103 potassium chloride Substances 0.000 description 4
- 235000011164 potassium chloride Nutrition 0.000 description 4
- 102220070934 rs794728586 Human genes 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000003335 steric effect Effects 0.000 description 4
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- TZCPCKNHXULUIY-RGULYWFUSA-N 1,2-distearoyl-sn-glycero-3-phosphoserine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCCCCCCCCCCCC TZCPCKNHXULUIY-RGULYWFUSA-N 0.000 description 3
- CVKDEEISKBRPEQ-UHFFFAOYSA-N 1-(4-nitrophenyl)pyrrole-2,5-dione Chemical compound C1=CC([N+](=O)[O-])=CC=C1N1C(=O)C=CC1=O CVKDEEISKBRPEQ-UHFFFAOYSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical group Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- DJQYYYCQOZMCRC-UHFFFAOYSA-N 2-aminopropane-1,3-dithiol Chemical group SCC(N)CS DJQYYYCQOZMCRC-UHFFFAOYSA-N 0.000 description 3
- LNBNYDPZMGZMIE-UHFFFAOYSA-N 2-iodo-n-(2,2,2-trifluoroethyl)acetamide Chemical compound FC(F)(F)CNC(=O)CI LNBNYDPZMGZMIE-UHFFFAOYSA-N 0.000 description 3
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 3
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 241000701959 Escherichia virus Lambda Species 0.000 description 3
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 3
- 239000001116 FEMA 4028 Substances 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- ZWZWYGMENQVNFU-UHFFFAOYSA-N Glycerophosphorylserin Natural products OC(=O)C(N)COP(O)(=O)OCC(O)CO ZWZWYGMENQVNFU-UHFFFAOYSA-N 0.000 description 3
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- 102220539335 Prostaglandin D2 receptor 2_E71S_mutation Human genes 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 238000005411 Van der Waals force Methods 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 229960004853 betadex Drugs 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 229920001577 copolymer Polymers 0.000 description 3
- 229940097362 cyclodextrins Drugs 0.000 description 3
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 3
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 3
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- DUWWHGPELOTTOE-UHFFFAOYSA-N n-(5-chloro-2,4-dimethoxyphenyl)-3-oxobutanamide Chemical compound COC1=CC(OC)=C(NC(=O)CC(C)=O)C=C1Cl DUWWHGPELOTTOE-UHFFFAOYSA-N 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000000276 potassium ferrocyanide Substances 0.000 description 3
- 235000019260 propionic acid Nutrition 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 102220281563 rs1555462067 Human genes 0.000 description 3
- 102200101908 rs72554358 Human genes 0.000 description 3
- 239000002356 single layer Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- XOGGUFAVLNCTRS-UHFFFAOYSA-N tetrapotassium;iron(2+);hexacyanide Chemical compound [K+].[K+].[K+].[K+].[Fe+2].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] XOGGUFAVLNCTRS-UHFFFAOYSA-N 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- VVQIIIAZJXTLRE-QMMMGPOBSA-N (2s)-2-amino-6-[(2-methylpropan-2-yl)oxycarbonylamino]hexanoic acid Chemical compound CC(C)(C)OC(=O)NCCCC[C@H](N)C(O)=O VVQIIIAZJXTLRE-QMMMGPOBSA-N 0.000 description 2
- WQAYULVQTJAUMD-UHFFFAOYSA-N 1-(2,4-difluorophenyl)pyrrole-2,5-dione Chemical compound FC1=CC(F)=CC=C1N1C(=O)C=CC1=O WQAYULVQTJAUMD-UHFFFAOYSA-N 0.000 description 2
- ODVRLSOMTXGTMX-UHFFFAOYSA-N 1-(2-aminoethyl)pyrrole-2,5-dione Chemical compound NCCN1C(=O)C=CC1=O ODVRLSOMTXGTMX-UHFFFAOYSA-N 0.000 description 2
- AXTADRUCVAUCRS-UHFFFAOYSA-N 1-(2-hydroxyethyl)pyrrole-2,5-dione Chemical compound OCCN1C(=O)C=CC1=O AXTADRUCVAUCRS-UHFFFAOYSA-N 0.000 description 2
- FPZQYYXSOJSITC-UHFFFAOYSA-N 1-(4-chlorophenyl)pyrrole-2,5-dione Chemical compound C1=CC(Cl)=CC=C1N1C(=O)C=CC1=O FPZQYYXSOJSITC-UHFFFAOYSA-N 0.000 description 2
- BGGCPIFVRJFAKF-UHFFFAOYSA-N 1-[4-(1,3-benzoxazol-2-yl)phenyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1C1=CC=C(C=2OC3=CC=CC=C3N=2)C=C1 BGGCPIFVRJFAKF-UHFFFAOYSA-N 0.000 description 2
- BQTPKSBXMONSJI-UHFFFAOYSA-N 1-cyclohexylpyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1C1CCCCC1 BQTPKSBXMONSJI-UHFFFAOYSA-N 0.000 description 2
- FPUGCISOLXNPPC-UHFFFAOYSA-N 2'-O-Methyladenosine Natural products COC1C(O)C(CO)OC1N1C2=NC=NC(N)=C2N=C1 FPUGCISOLXNPPC-UHFFFAOYSA-N 0.000 description 2
- SXUXMRMBWZCMEN-UHFFFAOYSA-N 2'-O-methyl uridine Natural products COC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-UHFFFAOYSA-N 0.000 description 2
- JUIKUQOUMZUFQT-UHFFFAOYSA-N 2-bromoacetamide Chemical compound NC(=O)CBr JUIKUQOUMZUFQT-UHFFFAOYSA-N 0.000 description 2
- 102220493937 26S proteasome complex subunit SEM1_E167A_mutation Human genes 0.000 description 2
- OQIGMSGDHDTSFA-UHFFFAOYSA-N 3-(2-iodacetamido)-PROXYL Chemical group CC1(C)CC(NC(=O)CI)C(C)(C)N1[O] OQIGMSGDHDTSFA-UHFFFAOYSA-N 0.000 description 2
- NITXODYAMWZEJY-UHFFFAOYSA-N 3-(pyridin-2-yldisulfanyl)propanehydrazide Chemical compound NNC(=O)CCSSC1=CC=CC=N1 NITXODYAMWZEJY-UHFFFAOYSA-N 0.000 description 2
- HGNHBHXFYUYUIA-UHFFFAOYSA-N 3-maleimido-PROXYL Chemical group CC1(C)N([O])C(C)(C)CC1N1C(=O)C=CC1=O HGNHBHXFYUYUIA-UHFFFAOYSA-N 0.000 description 2
- RDIMQHBOTMWMJA-UHFFFAOYSA-N 4-amino-3-hydrazinyl-1h-1,2,4-triazole-5-thione Chemical compound NNC1=NNC(=S)N1N RDIMQHBOTMWMJA-UHFFFAOYSA-N 0.000 description 2
- CYCKHTAVNBPQDB-UHFFFAOYSA-N 4-phenyl-3H-thiazole-2-thione Chemical compound S1C(S)=NC(C=2C=CC=CC=2)=C1 CYCKHTAVNBPQDB-UHFFFAOYSA-N 0.000 description 2
- HBYCCAOSEJEKBC-UHFFFAOYSA-N 5,6,7,8-tetrahydro-1h-quinazoline-2-thione Chemical compound C1CCCC2=NC(S)=NC=C21 HBYCCAOSEJEKBC-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 2
- 241000701844 Bacillus virus phi29 Species 0.000 description 2
- 102220530307 Calcium-transporting ATPase type 2C member 1_E50S_mutation Human genes 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 2
- 229930195711 D-Serine Natural products 0.000 description 2
- LZAZXBXPKRULLB-UHFFFAOYSA-N Diisopropyl disulfide Chemical compound CC(C)SSC(C)C LZAZXBXPKRULLB-UHFFFAOYSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 2
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 2
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- GHAZCVNUKKZTLG-UHFFFAOYSA-N N-ethyl-succinimide Natural products CCN1C(=O)CCC1=O GHAZCVNUKKZTLG-UHFFFAOYSA-N 0.000 description 2
- HDFGOPSGAURCEO-UHFFFAOYSA-N N-ethylmaleimide Chemical compound CCN1C(=O)C=CC1=O HDFGOPSGAURCEO-UHFFFAOYSA-N 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 108091093078 Pyrimidine dimer Proteins 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 2
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000002800 charge carrier Substances 0.000 description 2
- 150000003841 chloride salts Chemical class 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- LEVWYRKDKASIDU-IMJSIDKUSA-N cystine group Chemical group C([C@@H](C(=O)O)N)SSC[C@@H](C(=O)O)N LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- GVPWHKZIJBODOX-UHFFFAOYSA-N dibenzyl disulfide Chemical compound C=1C=CC=CC=1CSSCC1=CC=CC=C1 GVPWHKZIJBODOX-UHFFFAOYSA-N 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000007831 electrophysiology Effects 0.000 description 2
- 238000002001 electrophysiology Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009144 enzymatic modification Effects 0.000 description 2
- 210000003743 erythrocyte Anatomy 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 150000002190 fatty acyls Chemical group 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 229910021389 graphene Inorganic materials 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000000111 isothermal titration calorimetry Methods 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 150000004712 monophosphates Chemical class 0.000 description 2
- YKZNJJGKMUUEMS-UHFFFAOYSA-N n-(2-acetylphenyl)-2-bromoacetamide Chemical compound CC(=O)C1=CC=CC=C1NC(=O)CBr YKZNJJGKMUUEMS-UHFFFAOYSA-N 0.000 description 2
- WWLGGODAOVNIBC-UHFFFAOYSA-N n-(4-acetamidophenyl)-2-bromoacetamide Chemical compound CC(=O)NC1=CC=C(NC(=O)CBr)C=C1 WWLGGODAOVNIBC-UHFFFAOYSA-N 0.000 description 2
- SVPMVGLFGUEUOK-UHFFFAOYSA-N n-benzyl-2-bromo-n-phenylpropanamide Chemical compound C=1C=CC=CC=1N(C(=O)C(Br)C)CC1=CC=CC=C1 SVPMVGLFGUEUOK-UHFFFAOYSA-N 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 230000003606 oligomerizing effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 239000013635 pyrimidine dimer Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 239000004180 red 2G Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- PETSAYFQSGAEQY-UHFFFAOYSA-N ricinine Chemical compound COC=1C=CN(C)C(=O)C=1C#N PETSAYFQSGAEQY-UHFFFAOYSA-N 0.000 description 2
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229920001059 synthetic polymer Polymers 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 239000013638 trimer Substances 0.000 description 2
- MQAYPFVXSPHGJM-UHFFFAOYSA-M trimethyl(phenyl)azanium;chloride Chemical compound [Cl-].C[N+](C)(C)C1=CC=CC=C1 MQAYPFVXSPHGJM-UHFFFAOYSA-M 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- QLUTZSRKFWJIGM-QMMMGPOBSA-N (2r)-2-azaniumyl-3-[(2-nitrophenyl)methylsulfanyl]propanoate Chemical compound OC(=O)[C@@H](N)CSCC1=CC=CC=C1[N+]([O-])=O QLUTZSRKFWJIGM-QMMMGPOBSA-N 0.000 description 1
- AKVBCGQVQXPRLD-SSDOTTSWSA-N (2r)-2-azaniumyloctanoate Chemical compound CCCCCC[C@@H]([NH3+])C([O-])=O AKVBCGQVQXPRLD-SSDOTTSWSA-N 0.000 description 1
- DTERQYGMUDWYAZ-SSDOTTSWSA-N (2r)-6-acetamido-2-azaniumylhexanoate Chemical compound CC(=O)NCCCC[C@@H]([NH3+])C([O-])=O DTERQYGMUDWYAZ-SSDOTTSWSA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- LJHYWUVYIKCPGU-VIFPVBQESA-N (2s)-2-amino-3-[4-(carboxymethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CC(O)=O)C=C1 LJHYWUVYIKCPGU-VIFPVBQESA-N 0.000 description 1
- NLFOHNAFILVHGM-AWEZNQCLSA-N (2s)-2-amino-3-[4-[(2-nitrophenyl)methoxy]phenyl]propanoic acid Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1OCC1=CC=CC=C1[N+]([O-])=O NLFOHNAFILVHGM-AWEZNQCLSA-N 0.000 description 1
- QEQAKQQRJFWPOR-JTQLQIEISA-N (2s)-2-amino-4-(7-hydroxy-2-oxochromen-4-yl)butanoic acid Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2CC[C@H](N)C(O)=O QEQAKQQRJFWPOR-JTQLQIEISA-N 0.000 description 1
- FQFIGHYUHCWZRZ-JTQLQIEISA-N (2s)-2-amino-6-(cyclopentanecarbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)C1CCCC1 FQFIGHYUHCWZRZ-JTQLQIEISA-N 0.000 description 1
- HBMWPJLCTYKAGL-YFKPBYRVSA-N (2s)-2-amino-6-sulfanylhexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCS HBMWPJLCTYKAGL-YFKPBYRVSA-N 0.000 description 1
- SDZGVFSSLGTJAJ-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1[N+]([O-])=O SDZGVFSSLGTJAJ-ZETCQYMHSA-N 0.000 description 1
- CYHRSNOITZHLJN-NSHDSACASA-N (2s)-2-azaniumyl-3-(4-propan-2-ylphenyl)propanoate Chemical compound CC(C)C1=CC=C(C[C@H](N)C(O)=O)C=C1 CYHRSNOITZHLJN-NSHDSACASA-N 0.000 description 1
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 description 1
- YZJSUQQZGCHHNQ-BYPYZUCNSA-N (2s)-6-amino-2-azaniumyl-6-oxohexanoate Chemical compound OC(=O)[C@@H](N)CCCC(N)=O YZJSUQQZGCHHNQ-BYPYZUCNSA-N 0.000 description 1
- VLSDXINSOMDCBK-BQYQJAHWSA-N (E)-1,1'-azobis(N,N-dimethylformamide) Chemical compound CN(C)C(=O)\N=N\C(=O)N(C)C VLSDXINSOMDCBK-BQYQJAHWSA-N 0.000 description 1
- UKGJZDSUJSPAJL-YPUOHESYSA-N (e)-n-[(1r)-1-[3,5-difluoro-4-(methanesulfonamido)phenyl]ethyl]-3-[2-propyl-6-(trifluoromethyl)pyridin-3-yl]prop-2-enamide Chemical compound CCCC1=NC(C(F)(F)F)=CC=C1\C=C\C(=O)N[C@H](C)C1=CC(F)=C(NS(C)(=O)=O)C(F)=C1 UKGJZDSUJSPAJL-YPUOHESYSA-N 0.000 description 1
- LUTLAXLNPLZCOF-UHFFFAOYSA-N 1-Methylhistidine Natural products OC(=O)C(N)(C)CC1=NC=CN1 LUTLAXLNPLZCOF-UHFFFAOYSA-N 0.000 description 1
- MUSPKJVFRAYWAR-XVFCMESISA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)thiolan-2-yl]pyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)S[C@H]1N1C(=O)NC(=O)C=C1 MUSPKJVFRAYWAR-XVFCMESISA-N 0.000 description 1
- HRSBDXXXHGAUJF-QJPTWQEYSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-pent-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CCCC)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 HRSBDXXXHGAUJF-QJPTWQEYSA-N 0.000 description 1
- BZYYTDHSKLHARM-UHFFFAOYSA-N 1-[4-(methylamino)cyclohexyl]pyrrole-2,5-dione 2,2,2-trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.CNC1CCC(CC1)N1C(=O)C=CC1=O BZYYTDHSKLHARM-UHFFFAOYSA-N 0.000 description 1
- LRFHKHHUKGZIGE-UHFFFAOYSA-N 1-benzyl-2,5-dihydropyrrole Chemical compound C=1C=CC=CC=1CN1CC=CC1 LRFHKHHUKGZIGE-UHFFFAOYSA-N 0.000 description 1
- MKRBAPNEJMFMHU-UHFFFAOYSA-N 1-benzylpyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1CC1=CC=CC=C1 MKRBAPNEJMFMHU-UHFFFAOYSA-N 0.000 description 1
- BMQZYMYBQZGEEY-UHFFFAOYSA-M 1-ethyl-3-methylimidazolium chloride Chemical compound [Cl-].CCN1C=C[N+](C)=C1 BMQZYMYBQZGEEY-UHFFFAOYSA-M 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- RRCBDNMEDGJTMQ-UHFFFAOYSA-N 1-phenylpyrrol-2-amine Chemical compound NC1=CC=CN1C1=CC=CC=C1 RRCBDNMEDGJTMQ-UHFFFAOYSA-N 0.000 description 1
- YEKDUBMGZZTUDY-UHFFFAOYSA-N 1-tert-butylpyrrole-2,5-dione Chemical compound CC(C)(C)N1C(=O)C=CC1=O YEKDUBMGZZTUDY-UHFFFAOYSA-N 0.000 description 1
- RFCQJGFZUQFYRF-UHFFFAOYSA-N 2'-O-Methylcytidine Natural products COC1C(O)C(CO)OC1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-UHFFFAOYSA-N 0.000 description 1
- SXUXMRMBWZCMEN-ZOQUXTDFSA-N 2'-O-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-ZOQUXTDFSA-N 0.000 description 1
- RQKDPSTWKKMBPM-XLPZGREQSA-N 2'-deoxy-5-hydroxymethyl-CDP Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 RQKDPSTWKKMBPM-XLPZGREQSA-N 0.000 description 1
- DLHNIFPAUZVLLA-XLPZGREQSA-N 2'-deoxy-5-hydroxymethyl-CTP Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 DLHNIFPAUZVLLA-XLPZGREQSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- 150000003923 2,5-pyrrolediones Chemical class 0.000 description 1
- YNDPLQWWCHOFER-UHFFFAOYSA-N 2-(2-adamantyl)acetamide Chemical compound C1C(C2)CC3CC1C(CC(=O)N)C2C3 YNDPLQWWCHOFER-UHFFFAOYSA-N 0.000 description 1
- OLKQIWCQICCYQS-UHFFFAOYSA-N 2-(4-methoxyphenyl)acetamide Chemical compound COC1=CC=C(CC(N)=O)C=C1 OLKQIWCQICCYQS-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical group OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- JINGUCXQUOKWKH-UHFFFAOYSA-N 2-aminodecanoic acid Chemical compound CCCCCCCCC(N)C(O)=O JINGUCXQUOKWKH-UHFFFAOYSA-N 0.000 description 1
- YZXUCQCJZKJMIR-UHFFFAOYSA-N 2-azaniumyl-3-[4-(trifluoromethoxy)phenyl]propanoate Chemical compound OC(=O)C(N)CC1=CC=C(OC(F)(F)F)C=C1 YZXUCQCJZKJMIR-UHFFFAOYSA-N 0.000 description 1
- CKGCFBNYQJDIGS-UHFFFAOYSA-N 2-azaniumyl-6-(phenylmethoxycarbonylamino)hexanoate Chemical compound OC(=O)C(N)CCCCNC(=O)OCC1=CC=CC=C1 CKGCFBNYQJDIGS-UHFFFAOYSA-N 0.000 description 1
- JVPFOKXICYJJSC-UHFFFAOYSA-N 2-azaniumylnonanoate Chemical compound CCCCCCCC(N)C(O)=O JVPFOKXICYJJSC-UHFFFAOYSA-N 0.000 description 1
- NIFSTJXZBDBHDF-UHFFFAOYSA-N 2-bromo-N-(2-phenylethyl)acetamide Chemical compound BrCC(=O)NCCC1=CC=CC=C1 NIFSTJXZBDBHDF-UHFFFAOYSA-N 0.000 description 1
- UKPMVBQRESJJMN-UHFFFAOYSA-N 2-bromo-n-(2-methylphenyl)butanamide Chemical compound CCC(Br)C(=O)NC1=CC=CC=C1C UKPMVBQRESJJMN-UHFFFAOYSA-N 0.000 description 1
- JSTSRHVJJDTSLL-UHFFFAOYSA-N 2-bromo-n-(4-chlorophenyl)sulfonylbutanamide Chemical compound CCC(Br)C(=O)NS(=O)(=O)C1=CC=C(Cl)C=C1 JSTSRHVJJDTSLL-UHFFFAOYSA-N 0.000 description 1
- YLDILLQKQASWBA-UHFFFAOYSA-N 2-bromo-n-methyl-n-phenylacetamide Chemical compound BrCC(=O)N(C)C1=CC=CC=C1 YLDILLQKQASWBA-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- AAPOELDYPINJTH-UHFFFAOYSA-N 2-iodo-n-(2-phenylethyl)acetamide Chemical compound ICC(=O)NCCC1=CC=CC=C1 AAPOELDYPINJTH-UHFFFAOYSA-N 0.000 description 1
- VZQHLODKEYTJEM-UHFFFAOYSA-N 2-iodo-n-(4-sulfamoylphenyl)acetamide Chemical compound NS(=O)(=O)C1=CC=C(NC(=O)CI)C=C1 VZQHLODKEYTJEM-UHFFFAOYSA-N 0.000 description 1
- ONJROLGQWMBXAP-UHFFFAOYSA-N 2-methyl-1-(2-methylpropyldisulfanyl)propane Chemical compound CC(C)CSSCC(C)C ONJROLGQWMBXAP-UHFFFAOYSA-N 0.000 description 1
- 125000004105 2-pyridyl group Chemical group N1=C([*])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- IUTPJBLLJJNPAJ-UHFFFAOYSA-N 3-(2,5-dioxopyrrol-1-yl)propanoic acid Chemical compound OC(=O)CCN1C(=O)C=CC1=O IUTPJBLLJJNPAJ-UHFFFAOYSA-N 0.000 description 1
- DJBRKGZFUXKLKO-UHFFFAOYSA-N 3-(pyridin-2-yldisulfanyl)propanoic acid Chemical compound OC(=O)CCSSC1=CC=CC=N1 DJBRKGZFUXKLKO-UHFFFAOYSA-N 0.000 description 1
- 125000004179 3-chlorophenyl group Chemical group [H]C1=C([H])C(*)=C([H])C(Cl)=C1[H] 0.000 description 1
- UQTZMGFTRHFAAM-ZETCQYMHSA-N 3-iodo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(I)=C1 UQTZMGFTRHFAAM-ZETCQYMHSA-N 0.000 description 1
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 1
- LMZHZBVAKAMCEG-FJGDRVTGSA-N 4-amino-1-[(2r,3r,4r,5r)-3-amino-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@](O)(N)[C@H](O)[C@@H](CO)O1 LMZHZBVAKAMCEG-FJGDRVTGSA-N 0.000 description 1
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 1
- YAWQLNSJZSCVAG-TURQNECASA-N 5-(3-aminopropyl)-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(CCCN)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YAWQLNSJZSCVAG-TURQNECASA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- BTIWPBKNTZFNRI-XLPZGREQSA-N 5-hydroxymethyldeoxycytidylic acid Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 BTIWPBKNTZFNRI-XLPZGREQSA-N 0.000 description 1
- NGYHUCPPLJOZIX-XLPZGREQSA-N 5-methyl-dCTP Chemical compound O=C1N=C(N)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NGYHUCPPLJOZIX-XLPZGREQSA-N 0.000 description 1
- NJQONZSFUKNYOY-JXOAFFINSA-N 5-methylcytidine 5'-monophosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 NJQONZSFUKNYOY-JXOAFFINSA-N 0.000 description 1
- SHFOWZBOBJJZAP-XLPZGREQSA-N 5-methyldeoxycytidine 5'-(trihydrogen diphosphate) Chemical compound O=C1N=C(N)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 SHFOWZBOBJJZAP-XLPZGREQSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229910018072 Al 2 O 3 Inorganic materials 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- LTARLVHGOGBRHN-AAEUAGOBSA-N Asp-Trp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O LTARLVHGOGBRHN-AAEUAGOBSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- HWNZOVZMFHZHKT-UHFFFAOYSA-N C(C)(C)(C)N1C(C=CC1=O)=O.COC(=O)N1C(C=CC1=O)=O Chemical compound C(C)(C)(C)N1C(C=CC1=O)=O.COC(=O)N1C(C=CC1=O)=O HWNZOVZMFHZHKT-UHFFFAOYSA-N 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- OUYCCCASQSFEME-MRVPVSSYSA-N D-tyrosine Chemical compound OC(=O)[C@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-MRVPVSSYSA-N 0.000 description 1
- 229930195709 D-tyrosine Natural products 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 238000004435 EPR spectroscopy Methods 0.000 description 1
- 101000760806 Eisenia fetida Lysenin Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 101000875449 Escherichia phage lambda Exonuclease Proteins 0.000 description 1
- 101100226347 Escherichia phage lambda exo gene Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- GQTNWYFWSUFFRA-KKUMJFAQSA-N Gln-Met-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GQTNWYFWSUFFRA-KKUMJFAQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- QEJKKJNDDDPSMU-KKUMJFAQSA-N Glu-Tyr-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O QEJKKJNDDDPSMU-KKUMJFAQSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 206010018910 Haemolysis Diseases 0.000 description 1
- 108010006464 Hemolysin Proteins Proteins 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical class ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- FFFHZYDWPBMWHY-UHFFFAOYSA-N L-Homocysteine Natural products OC(=O)C(N)CCS FFFHZYDWPBMWHY-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- FBWIRBFZWNIGJC-LURJTMIESA-N L-dihomomethionine zwitterion Chemical compound CSCCCC[C@H](N)C(O)=O FBWIRBFZWNIGJC-LURJTMIESA-N 0.000 description 1
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 1
- SFSJZXMDTNDWIX-YFKPBYRVSA-N L-homomethionine Chemical compound CSCCC[C@H](N)C(O)=O SFSJZXMDTNDWIX-YFKPBYRVSA-N 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- 102220528081 M1-specific T cell receptor alpha chain_H58S_mutation Human genes 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- UFOWQBYMUILSRK-IHRRRGAJSA-N Met-Lys-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 UFOWQBYMUILSRK-IHRRRGAJSA-N 0.000 description 1
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- 241000361919 Metaphire sieboldi Species 0.000 description 1
- 229910000792 Monel Inorganic materials 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- BRMWTNUJHUMWMS-LURJTMIESA-N N(tele)-methyl-L-histidine Chemical compound CN1C=NC(C[C@H](N)C(O)=O)=C1 BRMWTNUJHUMWMS-LURJTMIESA-N 0.000 description 1
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 1
- FGOFNVXHDGQVBG-UHFFFAOYSA-N N-(2-methoxyphenyl)acetamide Chemical compound COC1=CC=CC=C1NC(C)=O FGOFNVXHDGQVBG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- CIQHWLTYGMYQQR-QMMMGPOBSA-N O(4')-sulfo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OS(O)(=O)=O)C=C1 CIQHWLTYGMYQQR-QMMMGPOBSA-N 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102220520572 Osteoclast-stimulating factor 1_N48S_mutation Human genes 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- UEEVBGHEGJMDDV-AVGNSLFASA-N Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEEVBGHEGJMDDV-AVGNSLFASA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- 102220539619 Piwi-like protein 1_E85Q_mutation Human genes 0.000 description 1
- 102220640643 Polyadenylate-binding protein 1_E84S_mutation Human genes 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 101000606032 Pomacea maculata Perivitellin-2 31 kDa subunit Proteins 0.000 description 1
- 101000606027 Pomacea maculata Perivitellin-2 67 kDa subunit Proteins 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101710086015 RNA ligase Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 229910004298 SiO 2 Inorganic materials 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 102220503470 Superoxide dismutase [Cu-Zn]_H81S_mutation Human genes 0.000 description 1
- 102220566198 Survival motor neuron protein_F70S_mutation Human genes 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- BDYBHQWMHYDRKJ-UNQGMJICSA-N Thr-Phe-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N)O BDYBHQWMHYDRKJ-UNQGMJICSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 1
- MDDYTWOFHZFABW-SZMVWBNQSA-N Trp-Gln-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 MDDYTWOFHZFABW-SZMVWBNQSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- ITUAVBRBGKVBLH-BVSLBCMMSA-N Trp-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ITUAVBRBGKVBLH-BVSLBCMMSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 1
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 1
- NJLQMKZSXYQRTO-FHWLQOOXSA-N Tyr-Glu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NJLQMKZSXYQRTO-FHWLQOOXSA-N 0.000 description 1
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- KZOZXAYPVKKDIO-UFYCRDLUSA-N Tyr-Met-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KZOZXAYPVKKDIO-UFYCRDLUSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- NLTUCYMLOPLUHL-KQYNXXCUSA-N adenosine 5'-[gamma-thio]triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=S)[C@@H](O)[C@H]1O NLTUCYMLOPLUHL-KQYNXXCUSA-N 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 229910001514 alkali metal chloride Inorganic materials 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 150000005005 aminopyrimidines Chemical class 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 239000000823 artificial membrane Substances 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 235000011175 beta-cyclodextrine Nutrition 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 229910021393 carbon nanotube Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000003508 chemical denaturation Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000001887 cyclopentyloxy group Chemical group C1(CCCC1)O* 0.000 description 1
- 125000004186 cyclopropylmethyl group Chemical group [H]C([H])(*)C1([H])C([H])([H])C1([H])[H] 0.000 description 1
- QHWZTVCCBMIIKE-SHYZEUOFSA-N dUDP Chemical compound O1[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 QHWZTVCCBMIIKE-SHYZEUOFSA-N 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 239000000032 diagnostic agent Substances 0.000 description 1
- 229940039227 diagnostic agent Drugs 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 125000004705 ethylthio group Chemical group C(C)S* 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical class N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 125000002795 guanidino group Chemical group C(N)(=N)N* 0.000 description 1
- 239000003228 hemolysin Substances 0.000 description 1
- 230000008588 hemolysis Effects 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000002847 impedance measurement Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 229920000592 inorganic polymer Polymers 0.000 description 1
- 239000011810 insulating material Substances 0.000 description 1
- 239000000138 intercalating agent Substances 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 239000002608 ionic liquid Substances 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000013554 lipid monolayer Substances 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- LLAZQXZGAVBLRX-UHFFFAOYSA-N methyl 2,5-dioxopyrrole-1-carboxylate Chemical compound COC(=O)N1C(=O)C=CC1=O LLAZQXZGAVBLRX-UHFFFAOYSA-N 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- UBLXSCCLLZTJIM-UHFFFAOYSA-N n-(2,6-diethylphenyl)-2-iodoacetamide Chemical compound CCC1=CC=CC(CC)=C1NC(=O)CI UBLXSCCLLZTJIM-UHFFFAOYSA-N 0.000 description 1
- XNWANAKSHOXOIX-UHFFFAOYSA-N n-(2-benzoyl-4-chlorophenyl)-2-iodoacetamide Chemical compound ClC1=CC=C(NC(=O)CI)C(C(=O)C=2C=CC=CC=2)=C1 XNWANAKSHOXOIX-UHFFFAOYSA-N 0.000 description 1
- HZQDHBGMMKYQDP-UHFFFAOYSA-N n-(2-benzoylphenyl)-2-bromoacetamide Chemical compound BrCC(=O)NC1=CC=CC=C1C(=O)C1=CC=CC=C1 HZQDHBGMMKYQDP-UHFFFAOYSA-N 0.000 description 1
- JMHLGEVVEZBSSK-UHFFFAOYSA-N n-(4-acetylphenyl)-2-iodoacetamide Chemical compound CC(=O)C1=CC=C(NC(=O)CI)C=C1 JMHLGEVVEZBSSK-UHFFFAOYSA-N 0.000 description 1
- MSLICLMCQYQNPK-UHFFFAOYSA-N n-(4-bromophenyl)acetamide Chemical compound CC(=O)NC1=CC=C(Br)C=C1 MSLICLMCQYQNPK-UHFFFAOYSA-N 0.000 description 1
- MOMQHMDODREECU-UHFFFAOYSA-N n-(cyclopropylmethyl)-2-iodoacetamide Chemical compound ICC(=O)NCC1CC1 MOMQHMDODREECU-UHFFFAOYSA-N 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- TVIDEEHSOPHZBR-AWEZNQCLSA-N para-(benzoyl)-phenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-AWEZNQCLSA-N 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 125000004194 piperazin-1-yl group Chemical group [H]N1C([H])([H])C([H])([H])N(*)C([H])([H])C1([H])[H] 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- QLNJFJADRCOGBJ-UHFFFAOYSA-N propionamide Chemical compound CCC(N)=O QLNJFJADRCOGBJ-UHFFFAOYSA-N 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 101150056906 recJ gene Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 102220057401 rs141711342 Human genes 0.000 description 1
- 102200070464 rs1555568396 Human genes 0.000 description 1
- 102200057517 rs1800054 Human genes 0.000 description 1
- 102200118188 rs33913712 Human genes 0.000 description 1
- 102200028553 rs61754445 Human genes 0.000 description 1
- 102200070587 rs763615602 Human genes 0.000 description 1
- 102220072337 rs794728990 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 101150072534 sbcB gene Proteins 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 125000006296 sulfonyl amino group Chemical group [H]N(*)S(*)(=O)=O 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- BYGOPQKDHGXNCD-UHFFFAOYSA-N tripotassium;iron(3+);hexacyanide Chemical compound [K+].[K+].[K+].[Fe+3].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] BYGOPQKDHGXNCD-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 230000005641 tunneling Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 101150097442 xthA gene Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43536—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from worms
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/56—Materials from animals other than mammals
- A61K35/62—Leeches; Worms, e.g. cestodes, tapeworms, nematodes, roundworms, earth worms, ascarids, filarias, hookworms, trichinella or taenia
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/116—Nucleic acid detection characterized by the use of physical, structural and functional properties electrical properties of nucleic acids, e.g. impedance, conductivity or resistance
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Tropical Medicine & Parasitology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Gastroenterology & Hepatology (AREA)
- Wood Science & Technology (AREA)
- Toxicology (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Food Science & Technology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Nanotechnology (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 라이세닌의 돌연변이체 형태에 관한 것이다. 본 발명은 또한 라이세닌의 돌연변이체 형태를 사용하는 피분석물의 특성규명에 관한 것이다.
Description
본 발명은 라이세닌(lysenin)의 돌연변이체 형태에 관한 것이다. 본 발명은 또한 라이세닌의 돌연변이체 형태를 사용하는 피분석물 특징화(characterisation)에 관한 것이다
나노포어 감지는 피분석물 분자와 수용체 사이의 개별 결합 또는 상호작용 반응의 관찰에 의존하는 감지 접근법이다. 나노포어 센서는 절연막에 나노미터 치수의 단일 포어를 배치하고, 피분석물 분자의 존재하에 포어를 통해 전압-유도된 이온성 수송을 측정함으로써 생성될 수 있다. 분석물의 신원은 그의 구별되는 전류 특징, 전류 블록의 지속 기간과 범위 및 전류 수준의 변동을 통해 드러난다. 이러한 나노포어 센서는 상업적으로 입수가능하며, 예를 들어 Oxford Nanopore Technologies Ltd에 의해 판매되는 MinIONTM 디바이스는 전자 칩 내에 통합된 복수의 나노포어를 포함한다.
광범위한 응용 분야에 걸쳐 신속하고 저렴한 핵산(예를 들어, DNA 또는 RNA) 서열분석 기술이 현재 필요하다. 현존하는 기술은 증폭 기술에 의존하여 큰 용적의 핵산을 생성하고 신호 검출을 위한 다량의 전문 형광 화학물질이 필요하기 때문에 느리고 주로 비용이 많이 든다. 나노포어 감지는 요구되는 뉴클레오타이드 및 시약의 양을 줄임으로써 신속하고 저렴한 핵산 서열분석을 제공할 수 있는 가능성을 가지고 있다.
나노포어 감지를 사용하는 핵산 서열분석의 필수적인 성분 중 하나는 포어를 통한 핵산 이동 제어이다. 또다른 성분은 핵산 폴리머가 포어를 통해 이동함에 따른 뉴클레오타이드의 식별이다. 과거에는 뉴클레오타이드 식별을 달성하기 위해 핵산이 헤몰라이신의 돌연변이체를 통과했다. 이것은 서열의존적인 것으로 보여지는 전류 특징을 제공했다. 헤몰라이신 포어가 사용될때 관찰된 전류에 많은 수의 뉴클레오타이드가 기여하여, 관찰된 전류와 폴리뉴클레오타이드 간의 직접적인 관계를 보다 도전적으로 만든다는 것이 또한 밝혀졌다.
뉴클레오타이드 식별을 위한 전류 범위는 헤몰라이신 포어의 돌연변이를 통해 향상되었지만, 뉴클레오타이드들 사이의 전류 차이가 더 향상될 수 있다면 서열분석 시스템이 더 높은 성능을 보일 것이다. 또한, 핵산이 포어를 통해 이동될 때, 일부 전류 상태는 높은 편차를 나타낸다는 것이 관찰되었다. 일부 돌연변이체 헤몰라이신 포어는 다른 것보다 높은 편차를 보이는 것으로 나타났다. 이러한 상태의 편차에는 서열 특정 정보가 포함될 수 있지만, 시스템을 간소화하기 위해 편차가 낮은 포어를 생성하는 것이 바람직하다. 또한, 관찰된 전류에 기여하는 뉴클레오타이드의 수를 감소시키는 것이 바람직하다.
라이세닌(efL1로도 알려짐)은 지렁이 줄지렁이(Eisenia fetida)의 체강 유체에서 정제된 포어-형성 독소이다. 그것은 라이세닌-유도된 용혈을 억제하는 스핑고미엘린에 특이적으로 결합한다(Yamaji 등, J. Biol. Chem. 1998; 273(9): 5300-6). 라이세닌 모노머의 결정 구조는 De Colbis 등, Structure, 2012; 20: 1498-1507에 개시되어 있다.
발명의 요약
본 발명자들은 놀랍게도 폴리뉴클레오타이드와 상호작용하는 모노머의 능력을 향상시키기 위해 하나 이상의 변형이 이루어져있는 새로운 돌연변이체 라이세닌 모노머를 확인하였다. 본 발명자들은 놀랍게도 신규한 돌연변이체 모노머를 포함하는 포어가 폴리뉴클레오타이드와 상호작용하는 향상된 능력을 가지며, 따라서 폴리뉴클레오타이드의 서열과 같은 특성을 평가하기 위한 개선된 특성을 나타내는 것을 실증하였다. 돌연변이체 포어는 놀랍게도 개선된 뉴클레오타이드 식별력을 나타낸다. 특히 돌연변이체 포어는 놀랍게도 증가된 전류 범위를 나타내어, 서로 상이한 뉴클레오타이드를 식별별하기 쉬워졌으며, 상태의 편차가 감소하여 신호-대-잡음비가 높아졌다. 또한, 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수가 감소된다. 이것은 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 관찰된 전류와 폴리뉴클레오타이드 사이의 직접적인 관계를 확인하는 것을 용이하게 한다.
본원에 개시된 모든 아미노산 치환, 결실 및/또는 첨가는 달리 언급되지 않는 한, 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머와 관련된다.
서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머에 대한 언급은 서열번호: 14 내지 16에 나타낸 바와 같은 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 포함한다. 아미노산 치환, 결실 및/또는 첨가는 서열번호: 2에 대해 본원에 개시된 치환, 결실 및/또는 첨가와 균등한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 라이세닌 모노머에 대해 이루어졌다.
돌연변이체 모노머는 단리된 모노머로 간주될 수 있다.
따라서, 본 발명은 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 변이체는 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함한다.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 치환체 중 하나 이상을 포함한다:
D35N/S;
S74K/R;
E76D/N;
S78R/K/N/Q;
S80K/R/N/Q;
S82K/R/N/Q;
E84R/K/N/A;
E85N;
S86K/Q;
S89K;
M90K/I/A;
E92D/S;
E94D/Q/G/A/K/R/S/N;
E102N/Q/D/S;
T104R/K/Q;
T106R/K/Q;
R115S;
Q117S; 및
N119S.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 중 하나 이상에 돌연변이를 포함한다:
D35/E94/T106;
K37/E94/E102/T106;
K37/E94/T104/T106;
K37/E94/T106;
K37/E94/E102/T106;
G43/E94/T106;
K45/V47/E92/E94/T106;
K45/V47/E94/T106;
K45/S49/E92/E94/T106;
K45/S49/E94/T106;
K45/E94/T106;
K45/T106;
V47/E94/T106;
V47/V88/E94/T106;
S49/E94/T106;
T51/E94D/T106;
S74/E94;
E76/E94;
S78/E94;
Y79/E94;
S80/E94;
S82/E94;
S82/E94/T106;
H83/E94;
H83/E94/T106;
E85/E94/T106;
S86/E94;
V88/M90/E94/T106;
S89/E94;
M90/E94/T106;
T91/E94/T106;
E92/E94/T106;
T93/E94/T106;
E94/Y96/T106;
E94/S98/K99/T106;
E94/K99/T106;
E94/E102;
E94/T104;
E94/T106;
E94/P108;
E94/P109;
E94/T110;
E94/S111;
E94/T114;
E94/R115;
E94/Q117; 및
E94/E119.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 치환체 중 하나 이상을 포함한다:
E84R/E94D;
E84K/E94D;
E84N/E94D;
E84A/E94Q;
E84K/E94Q 및
E94Q/D121S.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 변이체는 하기 치환체 조합 중 하나를 포함한다:
- E84Q/E85K/E92Q/E94D/E97S/D126G;
- E84Q/E85K/E92Q/E94Q/E97S/D126G; 또는
- E84Q/E85K/E92Q/E94D/E97S/T106K/D126G.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 변이체에서 (a) 서열번호: 2의 34 내지 70번 위치 또는 이들 위치에 상응하는 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되고, (b) 서열번호: 2의 71 내지 107번 위치 또는 이들 위치에 상응하는 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되었다.
본 발명은 또한 하기를 제공한다:
- 라이세닌으로부터 유래된 2개 이상의 공유결합된 모노머를 포함하는 작제물로서, 모노머 중 적어도 하나가 본 발명의 돌연변이체 라이세닌 모노머인, 작제물;
- 본 발명의 돌연변이체 라이세닌 모노머 또는 본 발명의 유전적으로 융합된 작제물을 암호화하는 폴리뉴클레오타이드;
- 본 발명의 충분한 수의 돌연변이체 라이세닌 모노머를 포함하는 라이세닌으로부터 유래된 호모-올리고머성 포어;
- 본 발명의 적어도 하나의 돌연변이체 라이세닌 모노머를 포함하는 라이세닌으로부터 유래된 헤테로-올리고머성 포어;
- 본 발명의 적어도 하나의 작제물을 포함하는 포어;
- (a) 표적 피분석물이 포어를 통해 이동하도록 상기 표적 피분석물을 본 발명의 포어와 접촉시키는 단계; 및 (b) 상기 포어에 대해 상기 피분석물이 이동할 때 하나 이상의 측정값을 취하는 단계로서, 상기 측정값은 상기 표적 피분석물의 하나 이상의 특징을 나타내며, 그렇게 함으로써 상기 표적 피분석물을 특징화하는 단계를 포함하는 표적 피분석물의 특징화 방법;
- 본 발명의 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성하여 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 형성하는 단계를 포함하는, 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 형성하는 방법;
- 본 발명의 포어와 폴리뉴클레오타이드 결합 단백질 사이의 복합체를 포함하는, 표적 폴리뉴클레오타이드를 특징화하기 위한 센서;
- 표적 피분석물을 특징화하기 위해 본 발명의 포어를 사용하는 단계;
- (a) 본 발명의 포어 및 (b) 막을 포함하는, 표적 폴리뉴클레오타이드를 특징화하기 위한 키트;
- (a) 본 발명의 복수의 포어 및 (b) 복수의 폴리뉴클레오타이드 결합 단백질을 포함하는, 샘플내 표적 폴리뉴클레오타이드를 특징화하기 위한 장치;
- 본 발명의 하나 이상의 변형 및/또는 치환을 생성하는 단계를 포함하는, 폴리뉴클레오타이드를 특징화하기 위한 서열번호: 2에 나타낸 서열을 포함하는 라이세닌 모노머의 능력을 개선시키는 방법;
- 라이세닌으로부터 유래된 하나 이상의 모노머에 본 발명의 적어도 하나의 돌연변이체 라이세닌 모노머를 공유결합시키는 단계를 포함하는, 본 발명의 작제물을 생성하는 방법; 및
- 본 발명의 적어도 하나의 돌연변이체 모노머 또는 본 발명의 적어도 하나의 작제물을 본 발명의 충분한 수의 모노머, 본 발명의 작제물 또는 라이세닌으로부터 유래된 모노머로 올리고머화시켜 포어를 형성하는 단계를 포함하는, 본 발명의 포어를 형성하는 방법.
도 1은 라이세닌 돌연변이체 1의 중앙 플롯을 도시한다.
도 2는 라이세닌 돌연변이체 10의 중앙 플롯을 도시한다.
도 3은 라이세닌 돌연변이체-라이세닌-(E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)의 중앙 플롯을 도시한다.
도 4는 E94C(돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드에 의한 라이세닌 돌연변이체- 라이세닌 - (E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9의 중앙 플롯을 도시한다.
도 5는 실시예에 사용된 어댑터를 도시한다. A는 30 iSpC3에 상응한다. B는 서열번호: 19에 상응한다. C는 4 iSp18에 상응한다. D는 서열번호: 20에 상응한다. E는 그의 5' 말단에 부착된 5BNA-G//iBNA-G//iBNA-T//iBNA-T//i-BNA-A를 갖는 서열번호: 21에 상응한다. F는 5' 포스페이트를 갖는 서열번호: 22에 상응한다. G는 서열번호: 24에 상응한다. H는 콜레스테롤에 상응한다.
도 6은 라이세닌의 모노머의 3D 구조를 도시한다. 스핑고미엘린 함유 막과 상호작용할 때, 라이세닌 모노머는 함께 어셈블리되어 중간 예비-포어를 통해 노나머 포어를 형성한다. 어셈블리 과정 동안, 흑색으로 표시된 폴리펩타이드 섹션(서열번호: 2의 아미노산 65 내지 74에 상응함)은 도 7에 도시된 베타 배럴의 바닥 루프로 전환된다. 흑색으로 표시된 폴리펩타이드 섹션의 한쪽 상의 2개의 베타 시트 및 흑색으로 표시된 폴리펩타이드 섹션에 상기 베타 시트를 연결하는 폴리펩타이드 섹션(서열번호: 2의 아미노산 34 내지 64 및 75 내지 107에 상응함)은 도 7에 도시된 포어의 베타 배럴을 형성하도록 연장한다. 이러한 큰 구조적 변화는 모노머 구조를 연구하여 라이세닌 포어의 베타 배럴 영역을 예측하는 것을 어렵게 만든다.
도 7은 라이세닌 포어의 영역을 도시한다. 도 7a는 라이세닌의 노노머 포어의 3D 구조를 도시하고, 도 7b는 라이세닌 포어로부터 취해진 모노머의 구조를 도시한다. 각각의 모노머는 라이세닌 포어의 배럴에 2개의 베타 시트를 제공한다. 베타 시트(서열번호: 2의 아미노산 34 내지 64 및 75 내지 107에 상응하는 아미노산을 함유함)는 포어의 바닥에서 비구조적 루프(서열번호: 2의 위치 65 내지 74에 상응하는 아미노산)에 의해 연결된다.
도 8은 3개의 라이세닌 관련된 단백질의 아미노산 서열(서열번호: 14 내지 16)을 갖는 라이세닌의 아미노산 서열(서열번호: 2)의 정렬이다. 라이세닌과 밀접하게 관련된 서열을 갖는 3개의 라이세닌 동족체는 비-중복 단백질 서열의 데이터베이스를 사용하여 BLAST 검색을 수행함으로써 확인되었다. 라이세닌 관련된 단백질 1(LRP1), 라이세닌 관련된 단백질 2(LRP2) 및 라이세닌 관련된 단백질 3(LRP3)의 단백질 서열은 라이세닌의 서열과 정렬되어 4개의 단백질의 유사성을 보여 주었다. 진한 회색 음영은 동일한 아미노산이 4개의 모든 서열에 존재하는 위치를 나타낸다. LRP1은 라이세닌과 대략 75% 동일하고, LRP2는 라이세닌과 대략 88% 동일하며, 및 LRP3은 라이세닌과 대략 79% 동일하다.
서열목록의 설명
서열번호: 1은 라이세닌 모노머를 암호화하는 폴리뉴클레오타이드 서열을 나타낸다.
서열번호: 2는 라이세닌 모노머의 아미노산 서열을 나타낸다.
서열번호: 3은 Phi29 DNA 폴리머라제를 암호화하는 폴리뉴클레오타이드 서열을 나타낸다.
서열번호: 4는 Phi29 DNA 폴리머라제의 아미노산 서열을 나타낸다.
서열번호: 5는 E. coli로부터의 sbcB 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 E. coli로부터의 엑소뉴클레아제 I 효소(EcoExo I)를 암호화한다.
서열번호: 6은 E. coli로부터의 엑소뉴클레아제 I 효소(EcoExo I)의 아미노산 서열을 나타낸다.
서열번호: 7은 E. coli로부터의 xthA 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 이것은 E. coli로부터 엑소뉴클레아제 Ⅲ 효소를 암호화한다.
서열번호: 8은 E. coli로부터의 엑소뉴클레아제 Ⅲ 효소의 아미노산 서열을 나타낸다. 이 효소는 3'-5' 방향으로 이중 가닥 DNA(dsDNA)의 한 가닥으로부터 5' 모노포스페이트 뉴클레오사이드의 분배적 소화를 수행한다. 가닥 상의 효소 개시는 대략 4개의 뉴클레오타이드의 5' 돌출부(overhang)를 필요로 한다.
서열번호: 9는 T. 테모필러스(thermophilus)로부터의 recJ 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 T. 테모필러스의 RecJ 효소(TthRecJ-cd)를 암호화한다.
서열번호: 10은 T. 테모필러스로부터의 RecJ 효소(TthRecJ-cd)의 아미노산 서열을 나타낸다. 이 효소는 5'-3' 방향으로 ssDNA에서 5' 모노포스페이트 뉴클레오사이드의 진행적 소화를 수행한다. 가닥에서의 효소 개시는 적어도 4개의 뉴클레오타이드를 필요로 한다.
서열번호: 11은 박테리오파아지 람다 exo(redX) 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 박테리오파아지 람다 엑소뉴클레아제를 암호화한다.
서열번호: 12는 박테리오파아지 람다 엑소뉴클레아제의 아미노산 서열을 나타낸다. 그 서열은 삼량체로 어셈블리하는 3개의 동일한 하위단위 중 하나이다. 효소는 5'-3' 방향에서 dsDNA의 한 가닥으로부터 뉴클레오타이드의 고도의 진행적 소화를 수행한다(http://www.neb.com/nebecomm/products/productM0262.asp). 가닥상의 효소 개시는 5' 포스페이트를 갖는 대략 4개의 뉴클레오타이드의 5' 돌출부를 우선적으로 필요로 한다.
서열번호: 13은 Hel308 Mbu의 아미노산 서열을 나타낸다.
서열번호: 14는 라이세닌 관련된 단백질(LRP) 1의 아미노산 서열을 나타낸다.
서열번호: 15는 라이세닌 관련된 단백질(LRP) 2의 아미노산 서열을 나타낸다.
서열번호: 16은 라이세닌 관련된 단백질(LRP) 3의 아미노산 서열을 나타낸다.
서열번호: 17은 활성화된 버전의 파라스포린(parasporin)-2의 아미노산 서열을 나타낸다. 전장 단백질은 아미노 및 카복시 말단에서 절단되어 포어를 형성할 수 있는 활성화된 버전을 형성한다.
서열번호: 18은 Dda 1993의 아미노산 서열을 나타낸다.
서열번호: 19 내지 24는 실시예에서 사용된 폴리뉴클레오타이드 서열을 나타낸다.
도 2는 라이세닌 돌연변이체 10의 중앙 플롯을 도시한다.
도 3은 라이세닌 돌연변이체-라이세닌-(E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)의 중앙 플롯을 도시한다.
도 4는 E94C(돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드에 의한 라이세닌 돌연변이체- 라이세닌 - (E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9의 중앙 플롯을 도시한다.
도 5는 실시예에 사용된 어댑터를 도시한다. A는 30 iSpC3에 상응한다. B는 서열번호: 19에 상응한다. C는 4 iSp18에 상응한다. D는 서열번호: 20에 상응한다. E는 그의 5' 말단에 부착된 5BNA-G//iBNA-G//iBNA-T//iBNA-T//i-BNA-A를 갖는 서열번호: 21에 상응한다. F는 5' 포스페이트를 갖는 서열번호: 22에 상응한다. G는 서열번호: 24에 상응한다. H는 콜레스테롤에 상응한다.
도 6은 라이세닌의 모노머의 3D 구조를 도시한다. 스핑고미엘린 함유 막과 상호작용할 때, 라이세닌 모노머는 함께 어셈블리되어 중간 예비-포어를 통해 노나머 포어를 형성한다. 어셈블리 과정 동안, 흑색으로 표시된 폴리펩타이드 섹션(서열번호: 2의 아미노산 65 내지 74에 상응함)은 도 7에 도시된 베타 배럴의 바닥 루프로 전환된다. 흑색으로 표시된 폴리펩타이드 섹션의 한쪽 상의 2개의 베타 시트 및 흑색으로 표시된 폴리펩타이드 섹션에 상기 베타 시트를 연결하는 폴리펩타이드 섹션(서열번호: 2의 아미노산 34 내지 64 및 75 내지 107에 상응함)은 도 7에 도시된 포어의 베타 배럴을 형성하도록 연장한다. 이러한 큰 구조적 변화는 모노머 구조를 연구하여 라이세닌 포어의 베타 배럴 영역을 예측하는 것을 어렵게 만든다.
도 7은 라이세닌 포어의 영역을 도시한다. 도 7a는 라이세닌의 노노머 포어의 3D 구조를 도시하고, 도 7b는 라이세닌 포어로부터 취해진 모노머의 구조를 도시한다. 각각의 모노머는 라이세닌 포어의 배럴에 2개의 베타 시트를 제공한다. 베타 시트(서열번호: 2의 아미노산 34 내지 64 및 75 내지 107에 상응하는 아미노산을 함유함)는 포어의 바닥에서 비구조적 루프(서열번호: 2의 위치 65 내지 74에 상응하는 아미노산)에 의해 연결된다.
도 8은 3개의 라이세닌 관련된 단백질의 아미노산 서열(서열번호: 14 내지 16)을 갖는 라이세닌의 아미노산 서열(서열번호: 2)의 정렬이다. 라이세닌과 밀접하게 관련된 서열을 갖는 3개의 라이세닌 동족체는 비-중복 단백질 서열의 데이터베이스를 사용하여 BLAST 검색을 수행함으로써 확인되었다. 라이세닌 관련된 단백질 1(LRP1), 라이세닌 관련된 단백질 2(LRP2) 및 라이세닌 관련된 단백질 3(LRP3)의 단백질 서열은 라이세닌의 서열과 정렬되어 4개의 단백질의 유사성을 보여 주었다. 진한 회색 음영은 동일한 아미노산이 4개의 모든 서열에 존재하는 위치를 나타낸다. LRP1은 라이세닌과 대략 75% 동일하고, LRP2는 라이세닌과 대략 88% 동일하며, 및 LRP3은 라이세닌과 대략 79% 동일하다.
서열목록의 설명
서열번호: 1은 라이세닌 모노머를 암호화하는 폴리뉴클레오타이드 서열을 나타낸다.
서열번호: 2는 라이세닌 모노머의 아미노산 서열을 나타낸다.
서열번호: 3은 Phi29 DNA 폴리머라제를 암호화하는 폴리뉴클레오타이드 서열을 나타낸다.
서열번호: 4는 Phi29 DNA 폴리머라제의 아미노산 서열을 나타낸다.
서열번호: 5는 E. coli로부터의 sbcB 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 E. coli로부터의 엑소뉴클레아제 I 효소(EcoExo I)를 암호화한다.
서열번호: 6은 E. coli로부터의 엑소뉴클레아제 I 효소(EcoExo I)의 아미노산 서열을 나타낸다.
서열번호: 7은 E. coli로부터의 xthA 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 이것은 E. coli로부터 엑소뉴클레아제 Ⅲ 효소를 암호화한다.
서열번호: 8은 E. coli로부터의 엑소뉴클레아제 Ⅲ 효소의 아미노산 서열을 나타낸다. 이 효소는 3'-5' 방향으로 이중 가닥 DNA(dsDNA)의 한 가닥으로부터 5' 모노포스페이트 뉴클레오사이드의 분배적 소화를 수행한다. 가닥 상의 효소 개시는 대략 4개의 뉴클레오타이드의 5' 돌출부(overhang)를 필요로 한다.
서열번호: 9는 T. 테모필러스(thermophilus)로부터의 recJ 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 T. 테모필러스의 RecJ 효소(TthRecJ-cd)를 암호화한다.
서열번호: 10은 T. 테모필러스로부터의 RecJ 효소(TthRecJ-cd)의 아미노산 서열을 나타낸다. 이 효소는 5'-3' 방향으로 ssDNA에서 5' 모노포스페이트 뉴클레오사이드의 진행적 소화를 수행한다. 가닥에서의 효소 개시는 적어도 4개의 뉴클레오타이드를 필요로 한다.
서열번호: 11은 박테리오파아지 람다 exo(redX) 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 박테리오파아지 람다 엑소뉴클레아제를 암호화한다.
서열번호: 12는 박테리오파아지 람다 엑소뉴클레아제의 아미노산 서열을 나타낸다. 그 서열은 삼량체로 어셈블리하는 3개의 동일한 하위단위 중 하나이다. 효소는 5'-3' 방향에서 dsDNA의 한 가닥으로부터 뉴클레오타이드의 고도의 진행적 소화를 수행한다(http://www.neb.com/nebecomm/products/productM0262.asp). 가닥상의 효소 개시는 5' 포스페이트를 갖는 대략 4개의 뉴클레오타이드의 5' 돌출부를 우선적으로 필요로 한다.
서열번호: 13은 Hel308 Mbu의 아미노산 서열을 나타낸다.
서열번호: 14는 라이세닌 관련된 단백질(LRP) 1의 아미노산 서열을 나타낸다.
서열번호: 15는 라이세닌 관련된 단백질(LRP) 2의 아미노산 서열을 나타낸다.
서열번호: 16은 라이세닌 관련된 단백질(LRP) 3의 아미노산 서열을 나타낸다.
서열번호: 17은 활성화된 버전의 파라스포린(parasporin)-2의 아미노산 서열을 나타낸다. 전장 단백질은 아미노 및 카복시 말단에서 절단되어 포어를 형성할 수 있는 활성화된 버전을 형성한다.
서열번호: 18은 Dda 1993의 아미노산 서열을 나타낸다.
서열번호: 19 내지 24는 실시예에서 사용된 폴리뉴클레오타이드 서열을 나타낸다.
개시된 생성물 및 방법의 상이한 적용이 당해 분야의 특정 요구에 맞춰질 수 있음을 이해해야 한다. 본 명세서에서 사용된 용어는 단지 본 발명의 특정 구현예를 설명하기 위한 것이며, 단지 본 발명을 제한하고자 하는 것이 아님을 이해해야 한다.
본 명세서 및 첨부된 청구범위에서 사용된 것과 같이, 단수 형태는 내용이 명확하게 달리 지시하지 않는한 복수의 지시대상을 포함한다. 따라서, 예를 들어, "돌연변이체 모노머"에 대한 언급은 "돌연변이체 모노머들"을 포함하고, "치환체"에 대한 언급은 2종 이상의 상기 치환체들을 포함하고, "포어"에 대한 언급은 2종 이상의 상기 포어를 포함하고, "폴리뉴클레오타이드"에 대한 언급은 2종 이상의 상기 폴리뉴클레오타이드를 포함하며, 등등이다.
본 명세서에서, 특정 위치에서 상이한 아미노산이 기호 "/"로 분리되는 경우, /기호 "/"는 "또는"을 의미한다. 예를 들어, P108R/K는 P108R 또는 P108K를 의미한다. 본 명세서에서, 상이한 위치 또는 상이한 치환이 기호 "/"에 의해 분리되는 경우, 기호 "/"는 "및"을 의미한다. 예를 들어, E94/P108은 E94 및 P108을 의미하거나, E94D/P108K는 E94D 및 P108K를 의미한다.
본 명세서에 인용된 모든 공보, 특허 및 특허 출원은 상기한 바와 같이 또는 그 이하의 것을 포함하여 그 전체가 본원에 참고로 포함된다.
돌연변이체 라이세닌 모노머
일 양태에서, 본 발명은 돌연변이체 라이세닌 모노머를 제공한다. 돌연변이체 라이세닌 모노머는 본 발명의 포어를 형성하는데 사용될 수 있다. 돌연변이체 라이세닌 모노머는 야생형 라이세닌 모노머(예를 들어, 서열번호: 2, 서열번호: 14, 서열번호: 15 또는 서열번호: 16)의 서열과 상이한 서열을 갖는 모노머이다. 돌연변이체 라이세닌 모노머는 전형적으로 본 발명의 다른 모노머 또는 라이세닌으로부터의 또는 라이세닌으로부터 유래된 다른 모노머의 존재하에 포어를 형성하는 능력을 보유한다. 따라서, 돌연변이체 모노머는 전형적으로 포어를 형성할 수 있다. 포어를 형성하는 돌연변이체 모노머의 능력을 확인하기 위한 방법은 당해 분야에 잘 알려져 있으며, 실시예에 기재되어 있다. 예를 들어, 전기생리학에 의해 포어의 형성이 측정된다. 포어는 전형적으로, 예를 들어 지질 막 또는 블록 코-폴리머 막일 수 있는 막에 삽입된다. 전기 또는 광학 측정은 막에 삽입된 본 발명의 하나 이상의 모노머를 포함하는 포어와 같은 단일 라이세닌 포어로부터 획득될 수 있다. 전위차가 막을 가로질러 가해질 수 있고, 막을 통과하는 전류 흐름이 검출될 수 있다. 전류 흐름은 전기적 또는 광학적 수단과 같은 임의의 적합한 방법에 의해 검출될 수 있다. 포어가 폴리뉴클레오타이드, 바람직하게는 단일가닥 폴리뉴클레오타이드를 전위시키는 능력은 폴리뉴클레오타이드 결합 단백질, DNA, 연료(예를 들어, MgCl2, ATP) 예비-혼합물을 첨가하고, 전위차(예를 들어, 180mV)를 적용하고, 및 폴리뉴클레오타이드 결합 단백질-제어된 DNA 이동을 검출하기 위해 포어를 통한 전류 흐름을 모니터링함으로써 결정될 수 있다.
돌연변이체 모노머는 포어에 존재할 때 폴리뉴클레오타이드와 상호작용하는 능력이 변경된다. 따라서, 하나 이상의 돌연변이체 모노머를 포함하는 포어는 개선된 뉴클레오타이드 판독 특성을 가지며, 예를 들어 (1) 개선된 폴리뉴클레오타이드 포착 및 (2) 개선된 폴리뉴클레오타이드 인식 또는 식별을 나타낸다. 특히, 돌연변이체 모노머로부터 제조된 포어는 야생형보다 더 쉽게 뉴클레오타이드 및 폴리뉴클레오타이드를 포획한다. 또한, 돌연변이체 모노머로 제조된 포어는 증가된 전류 범위를 나타내어, 서로 상이한 뉴클레오타이드를 쉽게 구별할 수 있게 되고, 상태의 변차가 감소되어 신호-대-잡음비가 높아진다. 또한, 폴리뉴클레오타이드가 돌연변이체로부터 형성된 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수가 감소된다. 이것은 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 관측된 전류와 폴리뉴클레오타이드 사이의 직접적인 관계를 확인하는 것을 용이하게 한다. 돌연변이체의 개선된 뉴클레오타이드 판독 특성은 5개의 주요 기전을 통해, 즉 하기의 변화에 의해 달성된다:
· 입체 장애(아미노산 잔기의 크기를 증가 또는 감소시킴);
· 전하(예를 들어, -ve 전하의 도입 또는 제거 및/또는 +ve 전하의 도입 또는 제거)
· 수소 결합(예를 들어, 염기쌍에 수소 결합할 수 있는 아미노산 도입)
· π 스태킹(예를 들어, 비국소화된 전자 pi 시스템을 통해 상호작용하는 아미노산을 도입함); 및/또는
. (예를 들어 배럴 또는 채널의 크기를 증가시키는 아미노산을 도입하는) 포어의 구조 변경.
상기 5가지 기전 중 임의의 하나 이상이 본 발명의 돌연변이체 모노머로부터 형성된 포어의 개선된 특성을 담당할 수 있다. 예를 들어, 본 발명의 돌연변이체 모노머를 포함하는 포어는 변경된 입체 장애, 변경된 수소 결합 및 변경된 구조의 결과로서 개선된 뉴클레오타이드 판독 특성을 나타낼 수 있다.
본 발명의 돌연변이체 모노머는 서열번호: 2에 나타낸 서열의 변이체를 포함한다. 서열번호: 2는 라이세닌 모노머의 야생형 서열이다. 서열번호: 2의 변이체는 서열번호: 2의 아미노산 서열과 상이한 아미노산 서열을 갖는 폴리펩타이드이다. 전형적으로 변이체는 그의 포어 형성 능력을 보유한다.
S80, T106, T104에서의 치환을 포함하는 하나 이상의 돌연변이체 모노머를 포함하는 포어는 개선된 폴리뉴클레오타이드 포획을 나타낸다. 상기 치환의 특정 예는 S80K/R, T104R/K 및 T106R/K를 포함한다. 이들 위치 중 임의의 하나 이상, 예컨대, 2, 3, 4 또는 5에서 아미노산 측쇄의 양전하를 증가시키는 상기 위치에서의 다른 치환은 돌연변이체 모노머를 포함하는 포어의 특성을 개선시키고, 즉 야생형 포어 또는 E84Q/E85K/E92Q/E97S/D126G와 같은 다른 포획 증진 돌연변이를 포함하는 돌연변이체 모노머를 포함하는 포어, 예를 들어 상기 돌연변이만을 포함하는 돌연변이체 모노머 또는 하기의 돌연변이 E84Q/E85K/E92Q/E94D/E97S/D126G를 포함하는 돌연변이체 모노머와 비교하여, 폴리뉴클레오타이드의 포획을 개선시키는데 사용될 수 있다. 전형적으로, 개선이 E84Q/E85K/E92Q/E97S/D126G 또는 E84Q/E85K/E92Q/E94D/E97S/D126G와 같은 다른 돌연변이를 포함하는 포어에 대해 결정되는 경우, 이들 돌연변이는 시험되는 돌연변이체 모노머, 즉 돌연변이 또는 돌연변이의 조합의 효과가 시험 위치(들)에서 시험되는 모노머/포어와 동일한 기준선 모노머/포어와 관련하여 결정된다. 돌연변이체 모노머 또는 대조군 모노머를 포함하는 포어의 특성은 헤테로올리고머성 포어, 또는 보다 바람직하게는 호모올리고머성 포어를 사용하여 결정될 수 있다. 바람직한 돌연변이 조합의 예는 본 명세서 전반에 걸쳐, 예를 들어 표 9에 기재되어 있다.
D35, K37, K45, V47, S49, E76, S78, S82, V88, S89, M90, T91, E92, E94, Y96, S98, V100, T104에서의 치환을 포함하는 하나 이상의 돌연변이체 모노머를 포함하는 포어는 개선된 폴리뉴클레오타이드 인식 또는 식별력을 나타낸다. 이러한 치환의 특정 예로는 D35N, K37N/S, K45R/K/D/T/Y/N, V47K/R, S49K/R/L, T51KE76S/N, S78N, S82N, V88I, S89Q, M90I/A, T91S, E92D/E, E94D/Q/N, Y96D, S98Q, V100S 및 T104K가 있다. 이러한 돌연변이는 표 9에 설명된 바와 같이 각각 잡음을 감소시키고, 전류 범위를 증가시키며, 및/또는 채널 게이팅을 감소시킬 수 있다. 아미노산 측쇄의 크기를 증가 또는 감소시키고, 전하를 증가 또는 감소시키는 다른 돌연변이는 동일한 수소 결합 형성을 초래하며, 및/또는 서열번호: 2의 지정된 위치 또는 서열번호: 2의 변이체 내의 상응하는 위치에 형성되는 상기 예시적인 돌연변이 중 임의의 하나 이상과 동일한 방식으로 π 스태킹에 영향을 미칠 수 있다. 돌연변이는 개별적으로 또는 조합하여 도입할 수 있다. 예를 들어, 이들 위치 중 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18은 야생형 포어와 비교하여 폴리뉴클레오타이드 인식 또는 식별이 개선되도록 신호 대 잡음을 개선하고, 범위를 증가시키며 및/또는 채널 게이팅을 감소시키는 돌연변이체 모노머를 포함하는 포어, 돌연변이 E84Q/E85K/E92QE97S/D126G를 포함하는 돌연변이체 모노머, 예컨대 상기 돌연변이 단독, 돌연변이 E84Q/E85K/E92Q/E94D/E97S/D126G, 돌연변이 E84Q/E85K/E92Q/E94Q/E97S/D126G 및/또는 돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G을 포함하는 모노머를 포함하는 포어의 특성을 개선하도록 돌연변이될 수 있다. 전형적으로, E84Q/E85K/E92Q/E97S/D126G, E84Q/E85K/E92Q/E94D/E97S/D126G, E84Q/E85K/E92Q/E94Q/E97S/D126G 또는 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G와 같은 다른 돌연변이를 포함하는 포어에 대하여 개선이 측정되는 경우, 상기 돌연변이는 시험되는 돌연변이체 모노머에 또한 존재하며, 즉 돌연변이, 또는 돌연변이 조합의 효과(들)은 시험 위치(들)에서 다른 시험된 모노머/포어와 동일한 기준선 모노머/포어에 대하여 측정된다. 돌연변이체 모노머 또는 대조군 모노머를 포함하는 포어의 특성은 헤테로올리고머성 포어, 또는 보다 바람직하게는 호모올리고머성 포어를 사용하여 결정될 수 있다. 바람직한 돌연변이 조합의 예는 본 명세서 전반에 걸쳐, 예를 들어 표 9에 기재되어 있다.
E94 및/또는 Y96에서 치환체를 포함하는 하나 이상의 돌연변이체 모노머를 포함하는 포어는 폴리뉴클레오타이드가 야생형 포어 또는 돌연변이 E84Q/E85K/E92QE97S/D126G를 포함하는 돌연변이체 모노머를 포함하는 포어와 비교하여, 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수를 감소시킬 수 있다. 예를 들어, 치환 Y96D/E는 판독 헤드의 크기를 줄이기 위해, 바람직하게는 E94Q/D와 조합하여 이루어질 수 있다. 야생형 포어 또는 돌연변이 E84Q/E85K/E92QE97S/D126G를 포함하는 돌연변이체 모노머를 포함하는 포어와 비교하여 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수를 감소시키는 것은 포어의 배럴의 일부를 형성하는 모노머의 2개의 베타 가닥 각각으로부터 짝수의 아미노산(전형적으로 포어의 루멘내에 존재하는 아미노산 및 포어의 루멘으로부터 멀어지게 될 수 있는 인접한 아미노산), 즉, 본원에 기술된 바와 같이, 서열번호: 2의 아미노산 34 내지 65 및 74 내지 107에 상응하는 위치를 결실시킴으로써 달성될 수도 있다.
본 발명의 변형
본 발명은 라이세닌 포어에서 배럴의 구조에 기여하는 베타 시트의 아미노산 서열이 야생형 라이세닌과 비교하여, 및 당해 분야, 예를 들어 WO 2013//153359에 개시된 라이세닌 돌연변이체와 비교하여, 변형되는 돌연변이체 라이세닌 모노머를 제공한다. 본 발명의 변형은 서열번호: 2의 아미노산 34 내지 107, 특히 서열번호: 2의 아미노산 34 내지 65 및 74 내지 107에 상응하는 라이세닌 모모머의 영역에 존재한다. LR1, LR2 및 LR3 모노머의 상응하는 영역은 도 8의 정렬로 도시된다.
본 발명은 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 위치들 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114에서의 1개 이상, 예컨대 2 내지 22개, 3 내지 20개, 4 내지 15개, 5 내지 10개, 6, 7, 8 또는 9개의 변형을 포함한다. 변이체는 임의의 수 및 임의의 위치의 조합에서의 변형을 포함할 수 있다. 일 양태에서, 변형은 아미노산의 치환, 결실 또는 첨가일 수 있으며, 바람직하게는 치환 또는 결실 돌연변이이다. 바람직한 변형은 "추가의 변형"이라는 제목으로 아래에서 논의된다. 돌연변이체 라이세닌 모노머는 서열번호: 2의 다른 위치에서 변형을 포함할 수 있다. 예를 들어, 본 발명의 하나 이상, 예컨대 2 내지 20개, 3 내지 15개, 4 내지 10개 또는 6 내지 8개의 변형에 더해, 돌연변이체 라이세닌 모노머는 당해 분야, 예를 들어 WO 2013/153359에 기술된 서열번호: 2의 하나 또는 그 이상, 예컨대 2 내지 20개, 3 내지 15개, 4 내지 10개 또는 6 내지 8개의 아미노산 치환 또는 결실을 가질 수 있다.
변이체는 바람직하게는 하기 위치 T91, V95, Y96, S98, K99, V100, I101 및 K112 중 하나 이상에서의 변형을 포함한다. 이 변이체는 임의의 수와 위치의 임의의 조합에서 변형될 수 있다. 변형은 바람직하게는 세린(S) 또는 글루타민(Q)에 의한 치환이다. 변이체는 바람직하게는 T91S, V95S, Y96S, S98Q, K99S, V100S, I101S 및 K112S 중 하나 이상을 포함한다. 변이체는 임의의 수 및 이러한 치환의 임의의 조합을 포함할 수 있다.
변이체는 바람직하게는 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93, Y96, S98, K99, P108, P109, T110, S111 및 T114 중 하나 이상에서의 변형을 포함한다. 변이체는 임의의 수 및 위치의 임의의 조합에서의 변형을 포함할 수 있다. 변형은 아스파라긴(N), 트립토판(W), 세린(S), 글루타민(Q), 라이신(K), 아스파르트산(D), 아르기닌(R), 트레오닌(T), 티로신(Y), 류신(L) 또는 이소류신(I)에 의한 치환이다. 변이체는 바람직하게는 하나 이상의 치환체들 K37N/W/S/Q, G43K, K45D/R/N/Q/T/Y, V47K/S/N, S49K/L, T51K, H83S/K, V88I/T, T91K, T93K, Y96D, S98K, K99Q/L, P108K/R, P109K, T110K/R, S111K 및 T114K를 포함한다. 변이체는 바람직하게는 하기 위치 중 하나 이상에서의 변형을 포함한다:
E94/P108;
E94/P109;
E94/T110;
E94/P108;
E94D/T110R;
E94D/S111K;
E94D/T114K;
H83S/E94Q;
E94/K99/T106;
E94/T93/T106;
E94/T91/T106;
H83/E94/T106;
E94/Y96/T106;
K45/E94/T106;
K45/E94/T106;
E94/S98/K99/T106;
K37/E94/T106;
K37/E94/T106;
K37/E94/T106;
K45/E94/T106;
K37/E94/E102/T106;
K37/E94/E102/T106;
K37/E94/T104/T106;
K45/E94/T106;
K45/V47/E94/T106;
V47/E94/T106;
T51/E94/T106;
K45/S49/E94/T106;
S49/E94/T106;
K45/T106;
V47/E94/T106;
G43/E94/T106;
V88/M90/E94/T106;
V47/V88/E94/T106;
K45/S49/E94/E92/T106;
K45/V47/E92/E94/T106; 및
E94/K99/T106.
변이체는 바람직하게는 하기 치환체 중 하나 이상을 포함한다:
E94D/P108K;
E94D/P109K;
E94D/T110K;
E94D/P108R;
E94D/T110R;
E94D/S111K;
E94D/T114K;
H83S/E94Q;
E94D/K99Q/T106K;
E94D/T93K/T106K;
E94D/T91K/T106K;
H83K/E94D/T106K;
E94Q/Y96D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
E94D/S98K/K99L/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
K45N/E94N/T106K;
K37Q/E94D/E102N/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K45Q/E94Q/T106K;
K45T/V47K/E94D/T106K;
V47S/E94D/T106K;
T51K/E94D/T106K;
K45Y/S49K/E94D/T106K;
S49L/E94D/T106K;
K45R/T106K;
V47K/E94D/T106K;
G43K/E94D/T106K;
V88I/M90A/E94D/T106K;
V47N/V88T/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45N/V47K/E92D/E94N/T106K; 및
E94D/K99Q/T106K.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 치환체중 하나 이상을 포함한다:
D35N/S;
S74K/R;
E76D/N;
S78R/K/N/Q;
S80K/R/N/Q;
S82K/R/N/Q;
E84R/K/N/A;
E85N;
S86K/Q;
S89K;
M90K/I/A;
E92D/S;
E94D/Q/G/A/K/R/S/N;
E102N/Q/D/S;
T104R/K/Q;
T106R/K/Q;
R115S;
Q117S; 및
N119S.
변이체는 임의의 수 및 이러한 치환의 임의의 조합을 포함할 수 있다. 변이체는 바람직하게는 치환체 E94D/Q/G/A/K/R/S, S86Q 및 E92S 중 하나 이상, 예컨대 E94D/Q/G/A/K/R/S; S86Q; E92S; E94D/Q/G/A/K/R/S 및 S86Q; E94D/Q/G/A/K/R/S 및 E92S; S86Q 및 E92S; 또는 E94D/Q/G/A/K/R/S, S86Q 및 E92S를 포함한다.
변이체는 바람직하게는 하나 이상의 치환체를 포함한다:
D35N/S;
S74K/R;
E76D/N;
S78R/K/N/Q;
S80K/R/N/Q;
S82K/R/N/Q;
E84R/K/N/A;
E85N;
S86K;
S89K;
M90K/I/A;
E92D;
E94D/Q/K/N;
E102N/Q/D/S;
T104R/K/Q;
T106R/K/Q;
R115S;
Q117S; 및
N119S.
변이체는 임의의 수 및 이들 치환의 조합을 포함할 수 있다.
변이체는 바람직하게는 하기 치환체 중 하나 이상을 포함한다:
E94D/E102N;
E94D/E102Q;
E94D/S80K;
S82K/E94D;
E94D/T106R;
E94D/T106K;
E94D/T104R;
E94D/T104K;
S78R/E94D;
S78K/E94D;
S80R/E94D;
S82R/E94D;
E76D/E94D;
E76N/E94D;
E94D/E102D;
E84R/E94D;
E84K/E94D;
E84N/E94D;
S78N/E94D;
S80N/E94D;
S82N/E94D;
E94D/P108K;
E94D/P109K;
S74K/E94D;
E94D/T110K;
S74R/E94D;
E94D/P108R;
E94D/T110R;
S86K/E94D;
S89K/E94D;
E94D/S111K;
E94D/T114K;
E76N/E94Q;
S78Q/E94Q;
S80Q/E94Q;
S82Q/E94Q;
H83S/E94Q;
E84A/E94Q;
E84K/E94Q;
E94Q/T104Q;
E94Q/T106Q;
E94Q/R115S;
E94Q/Q117S;
E94Q/N119S;
E94Q/D121S;
E76S/E94Q;
E94D/K99Q/T106K;
E94D/T93K/T106K;
E94D/T91K/T106K;
E94D/M90K/T106K;
E85N/E94D/T106K;
H83K/E94D/T106K;
E94Q/Y96D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
E94D/S98K/K99L/T106K;
D35N/E94D/T106K;
D35S/E94D/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
K45N/E94N/T106K;
E92D/E94Q/T106K;
K37Q/E94D/E102N/T106K;
E94Q/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K45Q/E94Q/T106K;
M90I/E94D/T106K;
K45T/V47K/E94D/T106K;
V47S/E94D/T106K;
T51K/E94D/T106K;
K45Y/S49K/E94D/T106K;
S49L/E94D/T106K;
K45R/T106K;
V47K/E94D/T106K;
G43K/E94D/T106K;
V88I/M90A/E94D/T106K;
V47N/V88T/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45N/V47K/E92D/E94N/T106K;
E94D/K99Q/T106K;
S82K/E94D/T106K; 및
Y79S/E94Q.
변이체는 임의의 수 및 이러한 치환의 임의의 조합을 포함할 수 있다.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 중 하나 이상의 돌연변이를 포함한다:
D35/E94/T106;
K37/E94/E102/T106;
K37/E94/T104/T106;;
K37/E94/T106;
K37/E94/E102/T106;
G43/E94/T106;
K45/V47/E92/E94/T106;
K45/V47/E94/T106;
K45/S49/E92/E94/T106;
K45/S49/E94/T106;
K45/E94/T106;
K45/T106;
V47/E94/T106;
V47/V88/E94/T106;
S49/E94/T106;
T51/E94D/T106;
S74/E94;
E76/E94;
S78/E94;
Y79/E94;
S80/E94;
S82/E94;
S82/E94/T106;
H83/E94;
H83/E94/T106;
E85/E94/T106;
S86/E94;
V88/M90/E94/T106;
S89/E94;
M90/E94/T106;
T91/E94/T106;
E92/E94/T106;
T93/E94/T106;
E94/Y96/T106;
E94/S98/K99/T106;
E94/K99/T106;
E94/E102;
E94/T104;
E94/T106;
E94/P108;
E94/P109;
E94/T110;
E94/S111;
E94/T114;
E94/R115;
E94/Q117; 및
E94/E119.
변이체는 바람직하게는 하나 이상의 치환체를 포함한다:
D35N/E94D/T106K;
D35S/E94D/T106K;
K37Q/E94D/E102N/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
G43K/E94D/T106K;
K45N/V47K/E92D/E94N/T106K;
K45T/V47K/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45Y/S49K/E94D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
K45N/E94N/T106K;
K45Q/E94Q/T106K;
K45R/T106K;
V47S/E94D/T106K;
V47K/E94D/T106K;
V47N/V88T/E94D/T106K;
S49L/E94D/T106K;
T51K/E94D/T106K;
S74K/E94D;
S74R/E94D;
E76D/E94D;
E76N/E94D;
E76S/E94Q;
E76N/E94Q;
S78R/E94D;
S78K/E94D;
S78N/E94D;
S78Q/E94Q;
Y79S/E94Q;
S80K/E94D;
S80R/E94D;
S80N/E94D;
S80Q/E94Q;
S82K/E94D;
S82R/E94D;
S82N/E94D;
S82Q/E94Q;
S82K/E94D/T106K;
H83S/E94Q;
H83K/E94D/T106K;
E85N/E94D/T106K;
S86K/E94D;
V88I/M90A/E94D/T106K;
S89K/E94D;
M90K/E94D/T106K;
M90I/E94D/T106K;
T91K/E94D/T106K;
E92D/E94Q/T106K;
T93K/E94D /T106K;
E94Q/Y96D/T106K;
E94D/S98K/K99L/T106K;
E94D/K99Q/T106K;
E94D/E102N;
E94D/E102Q;
E94D/E102D;
E94D/T104R;
E94D/T104K;
E94Q/T104Q;
E94D/T106R;
E94D/T106K;
E94Q/T106Q;
E94Q/T106K;
E94D/P108K;
E94D/P108R;
E94D/P109K;
E94D/T110K;
E94D/T110R;
E94D/S111K;
E94D/T114K;
E94Q/R115S;
E94Q/Q117S; 및
E94Q/N119S.
변이체는 임의의 수 및 상기 치환체의 임의의 조합을 포함할 수 있다.
본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 치환체 중 하나 이상을 포함한다:
E84R/E94D;
E84K/E94D;
E84N/E94D;
E84A/E94Q;
E84K/E94Q 및
E94Q/D121S.
변이체는 임의의 수 및 상기 치환체의 임의의 조합을 포함할 수 있다.
본 발명의 돌연변이체 모노머는 바람직하게는 상기 정의된 변형 및/또는 치환의 임의의 조합을 포함한다. 예시적인 조합은 실시예에 개시되어 있다.
배럴 결실
또 다른 구현예에서, 본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 변이체에서 (a) 서열번호: 2의 34 내지 70번 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되거나, 또는 서열번호: 2의 34 내지 70번 위치에 상응하는 위치에서 아미노산 잔기가 결실되고, (b) 서열번호: 2의 71 내지 107번 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되었거나, 또는 서열번호: 2의 71 내지 107번 위치에 상응하는 위치에서 아미노산 잔기가 결실되었다.
34 내지 70번 위치에서 결실된 아미노산의 수는 71 내지 107번 위치에서 결실된 아미노산의 수와 상이할 수 있다. 34 내지 70번 위치에서 결실된 아미노산의 수는 바람직하게는 71 내지 107번 위치에서 결실된 아미노산의 수와 동일하다.
34 내지 70번 위치의 아미노산 및 71 내지 107번 위치의 아미노산의 임의의 조합은 결실될 수 있다. 결실된 아미노산의 위치는 바람직하게는 표 1 또는 2의 행 또는 표 1 및/또는 2의 하나 초과의 행에 표시된다. 예를 들어, D35 및 V34가 34 내지 70번 위치에서 결실되면, T104 및 I105는 71 내지 107번 위치에서 결실될 수 있다. 마찬가지로, D35, V34, K37 및 I38은 34 내지 70번 위치에서 결실될 수 있으며, E102, H103, T104 및 I105는 71 내지 107번 위치에서 결실될 수 있다. 이는 포어의 배럴을 감싸는 베타 시트 구조를 유지시킨다.
34 내지 70번 위치 및 71 내지 107번 위치에서 결실된 아미노산은 표 1 또는 2의 행에 있을 필요는 없다. 예를 들어, D35 및 V34가 34 내지 70번 위치에서 결실된 경우, I72 및 E71은 71 내지 107번 위치에서 결실될 수 있다.
34 내지 70번 위치에서 결실된 아미노산은 바람직하게는 연속적이다. 71 내지 107번 위치에서 결실된 아미노산은 바람직하게는 연속적이다. 34 내지 70번 위치에서 결실된 아미노산 및 71 내지 107번 위치에서 결실된 아미노산은 바람직하게는 연속적이다.
본 발명은 바람직하게는 하기가 결실된 돌연변이체 모노머를 제공한다:
(ⅰ) N46/V47/T91/T92; 또는
(ii) N48/S49/T91/T92.
숙련자는 본 발명에 따라 결실될 수 있는 아미노산의 다른 조합을 확인할 수 있다. (즉, 임의의 아미노산이 상기 정의된 바와 같이 결실되기 전에) 하기 논의는 서열번호: 2의 잔기의 넘버링을 사용한다.
배럴 결실 변이체는 적합한 경우, 상기 또는 하기 논의된 임의의 변형 및/또는 치환을 추가로 포함한다. "적합한 경우"는 배럴 결실 후 위치가 여전히 돌연변이체 모노머에 존재하는지를 의미한다.
화학적 변형
또 다른 양태에서, 본 발명은 화학적으로-변형된 돌연변이체 라이세닌 모노머를 제공한다. 돌연변이체 모노머는 상기 또는 하기에서 논의된 임의의 것일 수 있다. 그 결과, 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함하는 서열번호: 2의 변이체 또는 상기 논의된 배럴 결실을 포함하는 변이체와 같은 본 발명의 돌연변이체 모노머는, 하기 논의되는 바와 같이 본 발명에 따라 화학적으로-변형될 수 있다.
하기 논의되는 추가의 변형 중 임의의 것을 포함하는 돌연변이체 모노머, 즉 모노머의 능력을 변경시키는 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역, 또는 바람직하게는 폴리뉴클레오타이드와 상호작용하는 영역 내에 하나 이상의 변형을 포함하는 돌연변이체 모노머는 화학적으로 변형될 수 있다. 이들 화학적으로 변형된 모노머는 본 발명의 변형을 포함할 필요는 없으며, 즉 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함할 필요는 없다. 화학적으로-변형된 돌연변이체 모노머는 바람직하게는 서열번호: 2의 하기 위치 (a) E84, E85, E92, E97 및 D126; (b) E85, E97 및 D126 또는 (c) E84 및 E92 중 하나 이상에서의 치환을 포함하는 서열번호: 2의 변이체를 포함한다. 하기에서 논의되는 치환체의 임의의 수와 조합이 생성될 수 있다.
돌연변이체 모노머는 모노머로부터 형성된 포어의 배럴 또는 채널의 직경이 감소되거나 좁아지도록 하는 임의의 방식으로 화학적으로-변형될 수 있다. 이에 대해서는 이하에서 더 상세히 논의된다.
화학적 변형은 바람직하게는 화학 분자가 돌연변이체 모노머에 공유결합되도록 하는 것이다. 화학 분자는 당해 분야에 공지된 임의의 방법을 사용하여 돌연변이체 모노머에 공유결합될 수 있다. 화학 분자는 일반적으로 화학 결합을 통해 부착된다.
돌연변이체 모노머는 바람직하게는 하나 이상의 시스테인에 결합(시스테인 연결)함으로써, 하나 이상의 라이신에 분자 부착함으로써, 하나 이상의 비-천연 아미노산에 분자 부착함으로써 또는 에피토프의 효소변형에 의해 화학적으로 변형된다. 화학적 개질제가 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인은 바람직하게는 치환에 의해 돌연변이체 모노머로 도입된다. 상기 변형을 수행하기 위한 적합한 방법은 당해 분야에 잘 알려져있다. 적합한 비-천연 아미노산은 Liu C. C. and Schultz P. G., Annu. Rev. Biochem., 2010, 79, 413-444의 도 1에서 아미노산 넘버링된 1 내지 71 중 임의의 하나 및 4-아지도-L-페닐알라닌(Faz)를 포함하지만, 이에 한정되지 않는다.
돌연변이체 모노머는 임의의 위치 또는 부위에서 모노머로부터 형성된 포어의 배럴의 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 모노머는 (i) 말레이미드, 예컨대: 4-페닐아조말레이나닐, 1.N-(2-하이드록시에틸)말레이미드, N-사이클로헥실말레이미드, 1.3-말레이미도프로피온산, 1.1-4-아미노페닐-1H-피롤,2,5,디온, 1.1-4-하이드록시페닐-1H-피롤,2,5,디온, N-에틸말레이미드, N-메톡시카르보닐말레이미드, N-tert-부틸말레이미드, N-(2-아미노에틸)말레이미드, 3-말레이미도-프록실, N-(4-클로로페닐)말레이미드, 1-[4-(디메틸아미노)-3,5-디니트로페닐]-1H-피롤-2,5-디온, N-[4-(2-벤즈이미다졸릴)페닐]말레이미드, N-[4-(2-벤조옥사졸릴)페닐]말레이미드, N-(1-나프틸)-말레이미드, N-(2,4-크실릴)말레이미드, N-(2,4-디플루오로페닐)말레이미드, N-(3-클로로-파라-톨일)-말레이미드, 1-(2-아미노-에틸)-피롤-2,5-디온 하이드로클로라이드, 1-사이클로펜틸-3-메틸-2,5-디하이드로 1H-피롤-2,5-디온, 1-(3-아미노프로필)-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 3-메틸-1-[2-옥소-2-(피페라진-1-일)에틸)-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 1-벤질-2,5-디하이드로-1H-피롤-2,5-디온, 3-메틸-1-(3,3,3-트리플루오로프로필)-2,5-디하이드로-1H-피롤-2,5-디온, 1-[4-(메틸아미노)사이클로헥실]-2,5-디하이드로-1H-피롤-2,5-디온 트리플루오로아세트산, SMILES O=C1C=CC(=O)N1CC=2C=CN=CC2, SMILES O=C1C=CC(=O)N1CN2CCNCC2, 1-벤질-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, 1-(2-플루오로페닐)-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, N-(4-페녹시페닐)말레이미드, N-(4-니트로페닐)말레이미드; (ii) 아이오도세타미드, 예컨대, 3-(2-아이오도아세트아미도)-프록실, N-(사이클로프로필메틸)-2-아이오도아세트아미드, 2-아이오도-N-(2-페닐에틸)아세트아미드, 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드, N-(4-아세틸페닐)-2-아이오도아세트아미드, N-(4-(아미노설포닐)페닐)-2-아이오도아세트아미드, N-(1,3-벤조티아졸-2-일)-2-아이오도아세트아미드, N-(2,6-디에틸페닐)-2-아이오도아세트아미드, N-(2-벤조일-4-클로로페닐)-2-아이오도아세트아미드; (ⅲ) 브로모아세트아미드: 예컨대 N-(4-(아세틸아미노)페닐)-2-브로모아세트아미드, N-(2-아세틸페닐)-2-브로모아세트아미드, 2-브로모-N-(2-시아노페닐)아세트아미드, 2-브로모-N-(3-트리플루오로메틸)페닐)아세트아미드, N-(2-벤조일페닐)-2-브로모아세트아미드, 2-브로모-N-(4-플루오로페닐)-3-메틸부탄아미드, N-벤질-2-브로모-N-페닐프로피온아미드, N-(2-브로모-부티릴)-4-클로로-벤젠설폰아미드, 2-브로모-N-메틸-N-페닐아세트아미드, 2-브로모-N-펜에틸-아세트아미드, 2-아다만탄-1-일-2-브로모-N-사이클로헥실-아세트아미드, 2-브로모-N-(2-메틸페닐)부탄아미드, 모노브로모아세트아닐라이드; (ⅳ) 디설파이드, 예컨대: 알드리티올-2, 알드리티올-4, 이소프로필 디설파이드, 1-(이소부틸디설파닐)-2-메틸프로판, 디벤질 디설파이드, 4-아미노페닐 디설파이드, 3-(2-피리딜디티오)프로피온산, 3-(2-피리딜디티오)프로피온산 하이드라자이드, 3-(2-피리딜디티오)프로피온산, N-석신이미딜 에스테르, am6amPDP1-βCD; 및 (v) 티올, 예컨대: 4-페닐티아졸-2-티올, Purpald, 5,6,7,8-테트라하이드로-퀴나졸린-2-티올.
돌연변이체 모노머는 폴리에틸렌 글리콜(PEG), 핵산, 예컨대 DNA, 염료, 형광단 또는 발색단의 부착에 의해 화학적으로 변형될 수 있다. 일부 구현예에서, 돌연변이체 모노머는 모노머 및 표적 피분석물, 표적 뉴클레오타이드 또는 표적 폴리뉴클레오타이드를 포함하는 포어 사이의 상호작용을 촉진시키는 분자 어댑터에 의해 화학적으로 변형된다. 어댑터의 존재는 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드 사이의 호스트-게스트 화학을 향상시키고, 그렇게 함으로써 돌연변이체 모노머로부터 형성된 포어의 서열분석 능력을 향상시킨다.
화학적으로-변형된 돌연변이체 모노머는 바람직하게는 서열번호: 2에 나타낸 서열의 변이체를 포함한다. 변이체는 하기에 정의된다. 상기 변이체는 전형적으로 하나 이상의 잔기가 시스테인, 라이신 또는 비-천연 아미노산으로 대체된 하나 이상의 치환을 포함한다. 비-천연 아미노산으로는 4-아지도-L-페닐알라닌(Faz), 4-아세틸-L-페닐알라닌, 3-아세틸-L-페닐알라닌, 4-아세토아세틸-L-페닐알라닌, O-알릴-L-티로신, 3-(페닐셀라닐)-L-알라닌, O-2-프로핀-1-일-L-티로신, 4-(디하이드록시보릴)-L-페닐알라닌, 4-[(에틸설파닐)카보닐]-L-페닐알라닌, (2S)-2-아미노-3-4-[(프로판-2-일설파닐)카보닐]페닐;프로판산, (2S)-2-아미노-3-4-[(2-아미노-3-설파닐프로파노일)아미노]페닐;프로판산, O-메틸-L-티로신, 4-아미노-L-페닐알라닌, 4-시아노-L-페닐알라닌, 3-시아노-L-페닐알라닌, 4-플루오로-L-페닐알라닌, 4-아이오도-L-페닐알라닌, 4-브로모-L-페닐알라닌, O-(트리플루오로메틸)티로신, 4-니트로-L-페닐알라닌, 3-하이드록시-L-티로신, 3-아미노-L-티로신, 3-아이오도-L-티로신, 4-이소프로필-L-페닐알라닌, 3-(2-나프틸)-L-알라닌, 4-페닐-L-페닐알라닌, (2S)-2-아미노-3-(나프탈렌-2-일아미노)프로판산, 6-(메틸설파닐)노르류신, 6-옥소-L-라이신, D-티로신, (2R)-2-하이드록시-3-(4-하이드록시페닐)프로판산, (2R)-2-암모니오옥타노에이트3-(2,2'-비피리딘-5-일)-D-알라닌, 2-아미노-3-(8-하이드록시-3-퀴놀릴)프로판산, 4-벤조일-L-페닐알라닌, S-(2-니트로벤질)시스테인, (2R)-2-아미노-3-[(2-니트로벤질)설파닐]프로판산, (2S)-2-아미노-3-[(2-니트로벤질)옥시]프로판산, O-(4,5-디메톡시-2-니트로벤질)-L-세린, (2S)-2-아미노-6-([(2-니트로벤질)옥시]카보닐; 아미노)헥산산, O-(2-니트로벤질)-L-티로신, 2-니트로페닐알라닌, 4-[(E)-페닐디아제닐]-L-페닐알라닌, 4-[3-(트리플루오로메틸)-3H-디아지렌-3-일]-D-페닐알라닌, 2-아미노-3-[[5-(디메틸아미노)-1-나프틸]설포닐아미노]프로판산, (2S)-2-아미노-4-(7-하이드록시-2-옥소-2H-크로멘-4-일)부탄산, (2S)-3-[(6-아세틸나프탈렌-2-일)아미노]-2-아미노프로판산, 4-(카복시메틸)페닐알라닌, 3-니트로-L-티로신, O-설포-L-티로신, (2R)-6-아세트아미도-2-암모니오헥사노에이트, 1-메틸히스티딘, 2-아미노노난산, 2-아미노데칸산, L-호모시스테인, 5-설파닐노르발린, 6-설파닐-L-노르류신, 5-(메틸설파닐)-L-노르발린, N6-[(2R,3R)-3-메틸-3,4-디하이드로-2H-피롤-2-일]카보닐;-L-라이신, N6-[(벤질옥시)카보닐]라이신, (2S)-2-아미노-6-[(사이클로펜틸카보닐)아미노]헥산산, N6-[(사이클로펜틸옥시)카보닐]-L-라이신, (2S)-2-아미노-6-[(2R)-테트라하이드로푸란-2-일카보닐]아미노;헥산산, (2S)-2-아미노-8-[(2R,3S)-3-에티닐테트라하이드로푸란-2-일]-8-옥소옥탄산, N6-(tert-부톡시카보닐)-L-라이신, (2S)-2-하이드록시-6-([(2-메틸-2-프로판일)옥시]카보닐;아미노)헥산산, N6-[(알릴옥시)카보닐]라이신, (2S)-2-아미노-6-([(2-아지도벤질)옥시]카보닐;아미노)헥산산, N6-L-프롤일-L-라이신, (2S)-2-아미노-6-[(프로프-2-인-1-일옥시)카보닐]아미노];헥산산 및 N6-[(2-아지도에톡시)카보닐]-L-라이신이 포함되지만, 이에 한정되지 않는다. 가장 바람직한 비-천연 아미노산은 4-아지도-L-페닐알라닌(Faz)이다.
돌연변이체 모노머는 서열번호: 2의 임의의 위치: K37, V47, S49, T55, S86, E92 및 E94에서 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 더욱 바람직하게는, 돌연변이체 모노머는 위치 E92 및/또는 E94에서 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 일 구현예에서, 돌연변이체 모노머는 하나 이상의 시스테인(시스테인 연결), 하나 이상의 라이신 또는 이들 위치에서 하나 이상의 비-천연 아미노산에 분자를 부착시킴으로써 화학적으로 변형된다. 돌연변이체 모노머는 바람직하게는 K37C, V47C, S49C, T55C, S86C, E92C 및 E94C 중 하나 이상을 포함하는 서열번호: 2에 나타낸 서열의 변이체를 포함하며, 여기에서, 하나 이상의 분자가 하나 이상의 도입된 시스테인에 부착된다. 돌연변이체 모노머는 보다 바람직하게는 E92C 및/또는 E94C를 포함하는 서열번호: 2에 나타낸 서열의 변이체를 포함하며, 여기에서 하나 이상의 분자가 도입된 시스테인(들)에 부착된다. 이들 2가지 바람직한 구현예의 각각에서, 하나 이상의 시스테인(Cs)은 하나 이상의 라이신 또는 하나 이상의 비-천연 아미노산, 예컨대 하나 이상의 Faz로 대체될 수 있다.
시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 향상될 수 있다. 예를 들어, 측접하는 아르기닌, 히스티딘 또는 라이신 잔기의 염기성 기는 시스테인 티올 그룹의 pKa를 보다 반응성인 S- 그룹의 pKa로 변화시킬 것이다. 시스테인 잔기의 반응성은 티올 보호기, 예컨대 dTNB에 의해 보호될 수 있다. 이들은 링커가 부착되기 전에 돌연변이체 모노머의 하나 이상의 시스테인 잔기와 반응할 수 있다.
분자는 돌연변이체 모노머에 직접 부착될 수 있다. 분자는 바람직하게는 화학적 가교결합제 또는 펩타이드 링커와 같은 링커를 사용하여 돌연변이체 모노머에 부착된다. 적합한 화학적 가교결합제는 당해 분야에 잘 알려져있다. 바람직한 가교결합제는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디설파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디설파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디설파닐)옥타노에이트를 포함한다. 가장 바람직한 가교결합제는 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP)이다. 전형적으로, 분자는 분자/가교결합제 복합체가 돌연변이체 모노머에 공유결합되기 전에 이중작용성 가교결합제에 공유결합되어 있지만, 이중작용성 가교결합제/모노머 복합체가 분자에 부착되기 전에 이중작용성 가교결합제를 모노머에 공유결합시킬 수도 있다.
링커는 바람직하게는 디티오트레이톨(DTT)에 대하여 저항성이다. 적합한 링커는 아이오도아세트아미드-계 및 말레이미드-계 링커를 포함하지만, 이에 한정되지 않는다.
본 발명의 화학적으로-변형된 돌연변이체 모노머를 포함하는 포어의 이점은 하기에서 보다 상세히 논의된다.
본 발명에 따라 이루어질 수 있는 추가의 화학적 변형은 이하에서 논의된다.
추가 변형
상기 논의된 임의의 돌연변이체 모노머는 적합한 경우(즉, 관련 아미노 위치가 돌연변이체 모노머에 잔류하거나, 또는 또다른 아미노산으로 변형/치환되지 않은 경우) 서열번호: 2의 약 44번 위치 내지 약 126번 위치까지의 영역 내에서 추가의 변형을 가질 수 있다. 이 영역의 적어도 일부는 전형적으로 라이세닌의 막 관통 영역에 기여한다. 이 영역의 적어도 일부는 전형적으로 라이세닌의 배럴 또는 채널에 기여한다. 이 영역의 적어도 일부는 전형적으로 라이세닌의 내벽이나 라이닝에 기여한다.
라이세닌의 막 관통 영역은 서열번호: 2의 44 내지 67번 위치로서 확인되었다(De Colbis 등, Structure, 2012; 20: 1498-1507).
상기 변이체는 바람직하게는 폴리뉴클레오타이드와 상호작용하는 모노머 또는 바람직하게는 영역의 능력을 변경시키는 서열번호: 2의 약 44 내지 약 126번 위치의 영역내에 하나 이상의 변형을 포함한다. 모노머와 폴리뉴클레오타이드 사이의 상호작용은 증가되거나 감소될 수 있다. 모노머와 폴리뉴클레오타이드 사이의 증가된 상호작용은 예를 들어, 돌연변이체 모노머를 포함하는 포어에 의한 폴리뉴클레오타이드의 포획을 용이하게 할 것이다. 영역과 폴리뉴클레오타이드 사이의 감소된 상호작용은 예를 들어, 폴리뉴클레오타이드의 인식 또는 식별력을 개선할 것이다. 폴리뉴클레오타이드의 인식 또는 식별력은 (신호-대-잡음비를 증가시키는) 돌연변이체 모노머를 포함하는 포어의 상태 편차를 감소시키고, 및/또는 돌연변이체 모노머를 포함하는 포어를 통해 폴리뉴클레오타이드가 이동함에 따라 전류에 기여하는 폴리뉴클레오타이드에서 뉴클레오타이드의 수를 감소시킴으로써 개선될 수 있다.
폴리뉴클레오타이드와 상호작용하는 모노머의 능력은 당해 분야에 공지된 방법을 사용하여 결정될 수 있다. 모노머는 임의의 방식, 예를 들어 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스 힘, π-양이온 상호작용 또는 정전기력에 의해 폴리뉴클레오타이드와 상호작용할 수 있다. 예를 들어, 폴리뉴클레오타이드에 결합하는 영역의 능력은 통상적인 결합 분석을 사용하여 측정될 수 있다. 적합한 검정은 형광에-기초한 결합 검정, 핵자기 공명(NMR), 등온 적정 열량측정(ITC) 또는 전자 스핀 공명(ESR) 분광법을 포함하지만, 이에 한정되지는 않는다. 대안적으로, 폴리뉴클레오타이드와 상호작용하기 위한 하나 이상의 돌연변이체 모노머를 포함하는 포어의 능력은 상기 또는 하기에서 논의된 방법 중 임의의 것을 사용하여 결정될 수 있다. 바람직한 검정은 실시예에 기재되어 있다.
하나 이상의 변형은 서열번호: 2의 약 44번 위치 내지 약 126번 위치까지의 영역 내에서 추가로 이루어질 수 있다. 하나 이상의 변형은 바람직하게는 하기 영역 중 임의의 한 영역내에서 이루어진다: 약 40번 위치 내지 약 125번 위치, 약 50번 위치 내지 약 120번 위치, 약 60번 위치 내지 약 110번 위치 및 약 70번 위치 내지 약 100번 위치. 폴리뉴클레오타이드 포획을 개선시키기 위해 하나 이상의 변형이 이루어지면, 보다 바람직하게는 하기 영역 중 임의의 한 영역내에서 이루어진다: 약 44번 위치 내지 약 103번 위치, 약 68번 위치 내지 약 103번 위치, 약 84번 위치 내지 약 103번 위치, 약 44번 위치 내지 약 97번 위치, 약 68번 위치 내지 약 97번 위치 또는 약 84번 위치 내지 약 97번 위치. 폴리뉴클레오타이드 인식 또는 식별력을 개선하기 위해 하나 이상의 변형이 이루어지면, 보다 바람직하게는 하기 영역 중 임의의 한 영역내에서 이루어진다: 약 44번 위치 내지 약 109번 위치, 약 44번 위치 내지 약 97번 위치 또는 약 48번 위치 내지 약 88번 위치. 상기 영역은 바람직하게는 서열번호: 2의 약 44번 위치 내지 67번 위치이다.
하나 이상의 변형이 폴리뉴클레오타이드 인식 또는 식별력을 개선하도록 의도된 경우, 이들은 폴리뉴클레오타이드 포획을 개선시키기 위한 하나 이상의 변형에 부가하여 바람직하게 이루어진다. 이하에 논의된 바와 같이, 이것은 돌연변이체 모노머로부터 형성된 포어가 폴리뉴클레오타이드를 효율적으로 포획하고, 폴리뉴클레오타이드를 특징화, 예컨대 그의 서열을 추정하는 것을 허용한다.
폴리뉴클레오타이드와 상호작용하는 능력을 변경시키는, 특히 폴리뉴클레오타이드를 포획 및/또는 인식 또는 식별하는 능력을 개선시키는 단백질 나노포어의 변형은 당해 분야에 잘 기재되어 있다. 예를 들어, 그러한 변형은 WO 2010/034018 및 WO 2010/055307에 개시되어 있다. 유사한 변형이 본 발명에 따른 라이세닌 모노머에 대해 이루어질 수 있다.
1, 2, 5, 10, 15, 20, 30개 또는 그 이상의 변형과 같은 임의의 수의 변형이 이루어질 수 있다. 폴리뉴클레오타이드와 상호작용하는 모노머의 능력이 변경되는한 임의의 변형(들)이 이루어질 수 있다. 적합한 변형은 아미노산 치환, 아미노산 첨가 및 아미노산 결실을 포함하지만, 이에 한정되지 않는다. 하나 이상의 변형은 바람직하게는 하나 이상의 치환이다. 이에 대해서는 이하에서 자세히 설명한다.
하나 이상의 변형은 바람직하게는 (a) 모노머의 입체 효과를 변경시키거나, 바람직하게는 영역의 입체 효과를 변경시키고, (b) 모노머의 순 전하를 변경시키거나, 또는 바람직하게는 영역의 순 전하를 변경시키고, (c) 폴리뉴클레오타이드와의 수소 결합에 대한 모노머 또는 바람직하게는 영역의 능력을 변경시키거나, (d) 비국소화된 전자 파이 시스템을 통해 상호작용하는 화학 기를 도입 또는 제거하고 및/또는 (e) 모노머의 구조를 변경시키거나, 바람직하게는 영역의 구조를 변경시킨다. 하나 이상의 변형은 보다 바람직하게는 (a) 내지 (e)의 임의의 조합을 초래한다: 예컨대, (a) 및 (b); (a) 및 (c); (a) 및 (d); (a) 및 (e); (b) 및 (c); (b) 및 (d); (b) 및 (e); (c) 및 (d); (c) 및 (e); (d) 및 (e), (a), (b) 및 (c); (a), (b) 및 (d); (a), (b) 및 (e); (a), (c) 및 (d); (a), (c) 및 (e); (a), (d) 및 (e); (b), (c) 및 (d); (b), (c) 및 (e); (b), (d) 및 (e); (c), (d) 및 (e); (a), (b), (c) 및 d); (a), (b), (c) 및 (e); (a), (b), (d) 및 (e); (a), (c), (d) 및 (e); (b), (c), (d) 및 (e); 및 (a), (b), (c) 및 (d).
(a)의 경우, 모노머의 입체 효과가 증가되거나 감소될 수 있다. 입체 효과를 변경시키는 임의의 방법이 본 발명에 따라 사용될 수 있다. 페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 큰 부피의 잔기의 도입은 모노머의 입체 장애를 증가시킨다. 하나 이상의 변형은 바람직하게는 F, W, Y 및 H 중 하나 이상의 도입이다. F, W, Y 및 H의 임의의 조합이 도입될 수 있다. F, W, Y 및 H 중 하나 이상은 첨가에 의해 도입될 수 있다. F, W, Y 및 H 중 하나 이상은 바람직하게는 치환에 의해 도입된다. 이러한 잔기의 도입에 적합한 위치는 하기에서 보다 상세히 논의된다.
페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 큰 부피의 잔기의 제거는 반대로 모노머의 입체 장애를 감소시킨다. 하나 이상의 변형은 바람직하게는 F, W, Y 및 H 중 하나 이상의 제거이다. F, W, Y 및 H의 임의의 조합이 제거될 수 있다. F, W, Y 및 H 중 하나 이상이 결실에 의해 제거될 수 있다. F, W, Y 및 H 중 하나 이상은 바람직하게는 세린(S), 트레오닌(T), 알라닌(A) 및 발린(V)과 같은 보다 작은 측기를 갖는 잔기로 치환함으로써 제거된다.
(b)의 경우 순 전하는 어떤 방식으로든 변경될 수 있다. 순 양전하는 바람직하게는 증가 또는 감소된다. 순 양전하는 임의의 방식으로 증가될 수 있다. 순 양전하는 바람직하게는 하나 이상의 양으로 하전된 아미노산을 도입, 바람직하게는 치환함으로써, 및/또는 하나 이상의 음전하를 중화, 바람직하게는 치환함으로써 증가된다.
순 양전하는 바람직하게는 하나 이상의 양으로 하전된 아미노산을 도입함으로써 증가된다. 하나 이상의 양으로 하전된 아미노산은 첨가에 의해 도입될 수 있다. 하나 이상의 양으로 하전된 아미노산은 바람직하게는 치환에 의해 도입된다. 양으로 하전된 아미노산은 순 양전하를 갖는 아미노산이다. 양으로 하전된 아미노산은 자연-발생적이거나 비-자연-발생적일 수 있다. 양으로 하전된 아미노산은 합성 또는 변형될 수 있다. 예를 들어, 순 양전하를 갖는 변형된 아미노산은 본 발명에 사용하기 위해 구체적으로 설계될 수 있다. 아미노산에 대한 수많은 상이한 유형의 변형이 당해 기술에 잘 알려져있다.
바람직한 자연-발생 양으로 하전된 아미노산에는 히스티딘(H), 라이신(K) 및 아르기닌(R)이 포함되지만, 이에 한정되지는 않는다. 하나 이상의 변형은 바람직하게는 하나 이상의 H, K 및 R의 도입이다. H, K 및 R의 임의의 수 및 조합이 도입될 수 있다. H, K 및 R 중 하나 이상은 첨가에 의해 도입될 수 있다. H, K 및 R 중 하나 이상은 바람직하게는 치환에 의해 도입된다. 이러한 잔기의 도입에 적합한 위치는 하기에서 보다 상세히 논의된다.
자연-발생 아미노산을 첨가하거나 치환하는 방법은 당해 기술에 잘 알려져 있다. 예를 들어, 메티오닌(M)은 모노머를 암호화하는 폴리뉴클레오타이드의 관련된 위치에서 메티오닌(ATG)에 대한 코돈을 아르기닌(AGA)에 대한 코돈으로 대체함으로써 아르기닌(R)으로 치환될 수 있다. 이어서 폴리뉴클레오타이드는 하기 논의되는 바와 같이 발현될 수 있다.
비-자연-발생 아미노산을 첨가 또는 치환하는 방법 또한 당해 분야에 잘 알려져있다. 예를 들어, 비-자연-발생 아미노산은 포어를 발현하는 IVTT 시스템에 합성 아미노아실-tRNA를 포함시킴으로써 도입될 수 있다. 대안적으로, 이들은 특정 아미노산의 합성(즉, 비-자연-발생) 유사체의 존재하에 특정 아미노산에 대해 영양 요구성이 있는 E. coli에서 모노머를 발현시킴으로써 도입될 수 있다. 또한 부분적인 펩타이드 합성을 사용하여 포어를 생산하는 경우, 네이키드 결찰(naked ligation)에 의해 생산될 수 있다.
임의의 아미노산은 양으로 하전된 아미노산으로 치환될 수 있다. 하나 이상의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산은 하나 이상의 양으로 하전된 아미노산으로 치환될 수 있다. 하전되지않은 아미노산은 순 전하를 갖고 있지 않다. 적합한 하전되지않은 아미노산은 시스테인(C), 세린(S), 트레오닌(T), 메티오닌(M), 아스파라긴(N) 및 글루타민(Q)을 포함하지만, 이에 한정되지 않는다. 무극성 아미노산은 무극성 측쇄를 갖는다. 적합한 무극성 아미노산은 글리신(G), 알라닌(A), 프롤린(P), 이소류신(I), 류신(L) 및 발린(V)이 포함되지만, 이에 한정되지 않는다. 방향족 아미노산은 방향족 측쇄를 갖는다. 적합한 방향족 아미노산은 히스티딘(H), 페닐알라닌(F), 트립토판(W) 및 티로신(Y)을 포함하지만, 이에 한정되지 않는다. 바람직하게는, 하나 이상의 음으로 하전된 아미노산은 하나 이상의 양으로 하전된 아미노산으로 치환된다. 적합한 음으로 하전된 아미노산은 아스파르트산(D) 및 글루탐산(E)을 포함하지만, 이에 한정되지 않는다.
바람직한 도입에는 K에 의한 E의 치환, R에 의한 M의 치환, H에 의한 M의 치환, K에 의한 M의 치환, R에 의한 D의 치환, H에 의한 D의 치환, K에 의한 D의 치환, R에 의한 E의 치환, H에 의한 E의 치환, R에 의한 N의 치환, R에 의한 T의 치환 및 R에 의한 G의 치환이 포함되지만, 이에 한정되지 않는다. 가장 바람직하게는 E는 K에 의해 치환된다.
임의의 수의 양으로 하전된 아미노산이 도입되거나 치환될 수 있다. 예를 들어, 1, 2, 5, 10, 15, 20, 25, 30 또는 그 초과의 양으로 하전된 아미노산이 도입되거나 치환될 수 있다.
순 양전하는 하나 이상의 음전하를 중화시킴으로써 보다 바람직하게 증가된다. 하나 이상의 음전하는 치환에 의해 하나 이상의 음으로 하전된 아미노산을 하나 이상의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산으로 치환함으로써 중화될 수 있다. 음전하를 제거하면 순 양전하가 증가한다. 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산은 자연-발생적 또는 비-자연-발생적일 수 있다. 그것들은 합성 또는 변형될 수 있다. 적합한 하전되지않은 아미노산, 무극성 아미노산 및 방향족 아미노산은 상기 논의되었다. 바람직한 치환은 Q에 의한 E의 치환, S에 의한 E의 치환, A에 의한 E의 치환, Q에 의한 D의 치환, N에 의한 E의 치환, N에 의한 D의 치환, G에 의한 D의 치환 및 S에 의한 D의 치환을 포함하지만, 이에 한정되지 않는다.
하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산의 임의의 수 및 조합이 치환될 수 있다. 예를 들어, 1, 2, 5, 10, 15, 20, 25 또는 30개 또는 그 초과의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산이 치환될 수 있다. 음으로 하전된 아미노산은 (1) 하전되지않은 아미노산; (2) 무극성 아미노산; (3) 방향족 아미노산; (4) 하전되지않은 아미노산 및 무극성 아미노산; (5) 하전되지않은 아미노산 및 방향족 아미노산; 및 (5) 무극성 아미노산 및 방향족 아미노산; 또는 (6) 하전되지않은 아미노산, 무극성 아미노산 및 방향족 아미노산에 의해 치환될 수 있다.
하나 이상의 음전하는 1, 2, 3, 또는 4개의 아미노산내와 같은 부근에 하나 이상의 양으로 하전된 아미노산을 도입함으로써, 또는 하나 이상의 음으로 하전된 아미노산에 인접하여 도입함으로써 중화될 수 있다. 양으로 및 음으로 하전된 아미노산의 예가 상기 논의되었다. 양으로 하전된 아미노산은 예를 들어 치환에 의해 상기 논의된 임의의 방식으로 도입될 수 있다.
순 양전하는 바람직하게는 하나 이상의 음으로 하전된 아미노산을 도입하고 /하거나 하나 이상의 양전하를 중화시킴으로써 감소된다. 이것이 수행될 수 있는 방법은 순 양전하를 증가시키는 것과 관련하여 상기 논의에서 분명해질 것이다. 순 양전하를 증가시키는 것과 관련하여 상기 논의된 구현예 모두는 전하가 반대 방향으로 변경되는 것을 제외하고는 순 양전하를 감소시키는데 동등하게 적용된다. 특히, 하나 이상의 양전하는 바람직하게는 하나 이상의 양으로 하전된 아미노산을 하나 이상의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산으로 치환함으로써, 또는 하나 이상의 음으로 하전된 아미노산을 하나 또는 그 이상의 양으로 하전된 아미노산의 1, 2, 3 또는 4개의 아미노산 근처 또는 내에 또는 근접하여 도입함으로써 중화된다.
순 음전하는 바람직하게 증가되거나 감소된다. 순 양전하를 증가 또는 감소시키는 것과 관련하여 상기 논의된 모든 구현예는 순 음전하를 각각 감소시키거나 증가시키는데 동등하게 적용된다.
(c)의 경우, 모노머의 수소 결합에 대한 능력은 어떤 방식으로든 변경될 수 있다. 세린(S), 트레오닌(T), 아스파라긴(N), 글루타민(Q), 티로신(Y) 또는 히스티딘(H)의 도입은 모노머의 수소 결합 능력을 증가시킨다. 하나 이상의 변형은 바람직하게는 S, T, N, Q, Y 및 H 중 하나 이상의 도입이다. S, T, N, Q, Y 및 H의 임의의 조합이 도입될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 첨가에 의해 도입될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 치환에 의해 도입되는 것이 바람직하다. 이러한 잔기의 도입에 적합한 위치는 하기에서 보다 상세히 논의된다.
세린(S), 트레오닌(T), 아스파라긴(N), 글루타민(Q), 티로신(Y) 또는 히스티딘(H)의 제거는 모노머의 수소 결합 능력을 감소시킨다. 하나 이상의 변형은 바람직하게는 하나 이상의 S, T, N, Q, Y 및 H의 제거이다. S, T, N, Q, Y 및 H의 임의의 조합은 제거될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 결실에 의해 제거될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 알라닌(A), 발린(V), 이소류신(I) 및 류신(L)과 같은, 수소 결합이 덜한 다른 아미노산으로 치환함으로써 바람직하게 제거된다.
(d)의 경우, 페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 방향족 잔기의 도입은 모노머의 π 적층을 증가시킨다. 페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 방향족 잔기의 제거는 또한 모노머에서 π 적층을 감소시킨다. 이러한 아미노산은 (a)를 참조하여 상기 논의된 바와 같이 도입되거나 제거될 수 있다.
(e)의 경우, 모노머의 구조를 변경시키는 본 발명에 따라 하나 이상의 변형이 이루어질 수 있다. 예를 들어, 하나 이상의 루프 영역이 제거, 단축 또는 연장될 수 있다. 이것은 전형적으로 폴리뉴클레오타이드가 포어내로 또는 포어외로 진입 또는 유출하는 것을 용이하게 한다. 하나 이상의 루프 영역은 포어의 시스 측, 포어의 트랜스 측 또는 포어의 양측 모두일 수 있다. 대안적으로, 포어의 아미노 말단 및/또는 카복시 말단의 하나 이상의 영역이 연장되거나 결실될 수 있다. 이것은 전형적으로 포어의 크기 및/또는 전하를 변경시킨다.
특정 아미노산의 도입은 하나 이상의 기전을 통해 폴리뉴클레오타이드와 상호작용하는 모노머의 능력을 향상시킬 것이라는 상기 논의로부터 명백해질 것이다. 예를 들어, E를 H로 치환하면, (b)에 따라 (음전하를 중화함으로써) 순 양전하를 증가시킬뿐만 아니라, (c)에 따라 모노머가 수소 결합하는 능력을 증가시킬 것이다.
변이체는 바람직하게는 서열번호: 2의 하기 위치 중 하나 이상에서의 치환을 포함한다: M44, N46, N48, E50, R52, H58, D68, F70, E71, S74, E76, S78, Y79, S80, H81, S82, E84, E85, S86, Q87, S89, M90, E92, E94, E97, E102, H103, T104, T106, R115, Q117, N119, D121 및 D126. 변이체는 바람직하게는 상기 위치들의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 또는 34에서의 치환을 포함한다. 변이체는 바람직하게는 서열번호: 2의 하기 위치 중 하나 이상에서의 치환을 포함한다: D68, E71, S74, E76, S78, S80, S82, E84, E85, S86, Q87, S89, E92, E102, T104, T106, R115, Q117, N119 및 D121. 변이체는 바람직하게는 상기 위치의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20에 치환을 포함한다.
변이체는 바람직하게는 서열번호: 2의 하기 위치들 중 하나 이상에 치환을 포함한다: (a) E84, E85, E92, E97 및 D126; (b) E85, E97 및 D126 또는 (c) E84 및 E92. 변이체로 치환된 아미노산은 그의 자연-발생 또는 비-자연-발생 유도체일 수 있다. 변이체로 치환된 아미노산은 D-아미노산일 수 있다. 상기 열거된 각 위치는 아스파라긴(N), 세린(S), 글루타민(Q), 아르기닌(R), 글리신(G), 티로신(Y), 아스파르트산(D), 류신(L), 라이신(K) 또는 알라닌(A)에 의해 치환될 수 있다.
변이체는 바람직하게는 서열번호: 2의 하기 돌연변이 중 적어도 하나를 포함한다:
(a) 44번 위치의 세린(S);
(b) 46번 위치의 세린(S);
(c) 48번 위치의 세린(S);
(d) 52번 위치의 세린(S);
(e) 58번 위치의 세린(S);
(f) 68번 위치의 세린(S);
(g) 70번 위치의 세린(S);
(h) 71번 위치의 세린(S);
(i) 76번 위치의 세린(S);
(j) 79번 위치의 세린(S);
(k) 81번 위치의 세린(S);
(l) 84번 위치의 세린(S), 아스파르트산(D) 또는 글루타민(Q);
(m) 85번 위치의 세린(S) 또는 라이신(K);
(n) 87번 위치의 세린(S);
(o) 90번 위치의 세린(S);
(p) 92번 위치의 아스파라긴(N) 또는 글루타민(Q);
(q) 94번 위치의 세린(S) 또는 아스파라긴(N);
(r) 97번 위치의 세린(S) 또는 아스파라긴(N);
(s) 102번 위치의 세린(S);
(t) 103번 위치의 세린(S);
(u) 121번 위치의 아스파라긴(N) 또는 세린(S);
(v) 50번 위치의 세린(S);
(w) 94번 위치의 아스파라긴(N) 또는 세린(S);
(x) 97번 위치의 아스파라긴(N) 또는 세린(S);
(y) 121번 위치의 세린(S) 또는 아스파라긴(N);
(z) 126번 위치의 아스파라긴(N) 또는 글루타민(Q) 또는 글리신(G); 및
(aa) 128번 위치의 세린(S) 또는 아스파라긴(N).
변이체는 임의의 수의 돌연변이 (a) 내지 (aa), 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 또는 27개의 돌연변이를 포함할 수 있다. 돌연변이의 바람직한 조합은 이하에서 논의된다. 변이체에 도입된 아미노산은 그의 자연-발생 또는 비-자연-발생 유도체일 수 있다. 변이체에 도입된 아미노산은 D-아미노산일 수 있다.
변이체는 바람직하게는 서열번호: 2의 하기 돌연변이 중 적어도 하나를 포함한다:
(a) 68번 위치의 세린(S);
(b) 71번 위치의 세린(S);
(c) 76번 위치의 세린(S);
(d) 84번 위치의 아스파르트산(D) 또는 글루타민(Q);
(e) 85번 위치의 라이신(K);
(f) 92번 위치의 아스파라긴(N) 또는 글루타민(Q);
(g) 102번 위치의 세린(S);
(h) 121번 위치의 아스파라긴(N) 또는 세린(S);
(i) 50번 위치의 세린(S);
(j) 94번 위치의 아스파라긴(N) 또는 세린(S);
(k) 97번 위치의 아스파라긴(N) 또는 세린(S); 및
(l) 126번 위치의 아스파라긴(N) 또는 글루타민(Q) 또는 글리신(G).
변이체는 임의의 수의 돌연변이 (a) 내지 (l), 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 돌연변이를 포함할 수 있다. 돌연변이의 바람직한 조합은 이하에서 논의된다. 변이체에 도입된 아미노산은 그의 자연-발생 또는 비-자연-발생 유도체일 수 있다. 변이체에 도입된 아미노산은 D-아미노산일 수 있다.
상기 변이체는 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역 이외의 하나 이상의 추가 변형을 포함할 수 있으며, 상기 논의된 영역에서의 변형과 조합하여, 폴리뉴클레오타이드 포획을 향상시키고, 및/또는 폴리뉴클레오타이드 인식 또는 식별을 개선시킨다. 적합한 변형에는 D35, E128, E135, E134 및 E167 중 하나 이상에서의 치환이 포함되지만, 이에 한정되지는 않는다. 특히, 128, 135, 134 및 167번 위치 중 하나 이상에서 E를 치환함으로써 음전하를 제거하면 폴리뉴클레오타이드 포획이 개선된다. 이들 위치 중 하나 이상의 E는 상기 논의된 임의의 방법으로 치환될 수 있다. 바람직하게는 E128, E135, E134 및 E167 모두가 상기한 바와 같이 치환된다. E는 바람직하게는 A로 치환된다. 환언하면, 변이체는 바람직하게는 E128A, E135A, E134A 및 E167A 중 하나 이상 또는 모두를 포함한다. 다른 바람직한 치환체는 D35Q이다.
바람직한 구현예에서, 변이체는 서열번호: 2의 하기 치환체를 포함한다:
i. E84D 및 E85K 중 하나 이상, 예컨대 둘;
ii. E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 2, 3, 4, 5 또는 6개;
iii. E92N, E94N, E97N, D121N 및 D126N 중 하나 이상, 예컨대 2, 3, 4 또는 5개;
iv. E92N, E94N, E97N, D121N, D126N 및 E128N 중 하나 이상, 예컨대 2, 3, 4, 5 또는 6개;
v. E76S, E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
vi. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E50S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
vii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E71S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
viii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E94S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
ix. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E102S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
x. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E128S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
xi. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E135S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
xii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D68S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
xiii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D121S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
xiv. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D134S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;
xv. E84D, E85K 및 E92Q 중 하나 이상, 예컨대 2 또는 3개;
xvi. E84Q, E85K, E92Q, E97S, D126G 및 E135S 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xvii. E85K, E92Q, E94S, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xviii. E76S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xix. E71S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xx. D68S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xxi. E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3 또는 4개;
xxii. E84Q, E85K, E92Q, E97S, H103S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxiii. E84Q, E85K, M90S, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxiv. E84Q, Q87S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxv. E84Q, E85S, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xxvi. E84S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xxvii. H81S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxviii. Y79S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxix. F70S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxx. H58S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxxi. R52S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxxii. N48S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxxiii. N46S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxxiv. M44S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
xxxv. E92Q 및 E97S 중 하나 이상, 예컨대 둘다;
xxxvi. E84Q, E85K, E92Q 및 E97S 중 하나 이상, 예컨대 1, 2, 3 또는 4개;
xxxvii. E84Q 및 E85K 중 하나 이상, 예컨대 둘다;
xxxviii. E84Q, E85K 및 D126G 중 하나 이상, 예컨대 1, 2 또는 3개;
xxxix. E84Q, E85K, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3 또는 4개;
xl. E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2 또는 3개;
xli. E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xlii. E84Q, E85K, E92Q, E97S 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xliii. E84Q, E85K, E92Q, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xliv. E84Q, E85K, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xlv. E84Q, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xlvi. E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;
xlvii. E84D, E85K 및 E92Q 중 하나 이상, 예컨대 1, 2 또는 3개;
xlviii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D121S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
xlix. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D68S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
l. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E135S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
li. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E128S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
lii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E102S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
liii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E94S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
liv. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E71S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
lv. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E50S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
lvi. E76S, E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;
lvii. E92N, E94N, E97N, D121N, D126N 및 E128N 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;
lviii. E92N, E94N, E97N, D121N 및 D126N 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개; 또는
lix. E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개.
상기에서, 제1 문자는 치환된 서열번호: 2의 아미노산을 지칭하며, 숫자는 서열번호: 2내 위치이고, 제2 문자는 제1 문자가 치환될 아미노산을 지칭한다. 따라서, E84D는 84번 위치의 글루탐산(E)을 아스파르트산(D)으로 치환하는 것을 지칭한다.
상기 변이체는 i 내지 lix 중 임의의 하나에서 임의의 치환의 수, 예컨대 1, 2, 3, 4, 5, 6 또는 7개를 포함할 수 있다. 변이체는 바람직하게는 상기 i 내지 lix 중 임의의 하나에 나타낸 모든 치환을 포함한다.
바람직한 구현예에서, 변이체는 상기 i 내지 xv 중 어느 하나의 치환을 포함한다. 변이체는 i 내지 xv 중 임의의 하나의 치환의 임의의 수, 예컨대 1, 2, 3, 4, 5, 6 또는 7개를 포함할 수 있다. 변이체는 바람직하게는 상기 i 내지 xv 중 어느 하나에 나타낸 모든 치환을 포함한다.
하나 이상의 변형이 폴리뉴클레오타이드를 인식 또는 식별하는 모노머의 능력을 개선시키려는 경우, 이들은 바람직하게는 폴리뉴클레오타이드 포획을 개선시키는 상기 논의된 변형예, 예컨대 E84Q, E85K, E92Q, E97S, D126G 및 E167A에 더해 이루어진다.
상기 확인된 영역에 대한 하나 이상의 변형은 상기 영역 내의 하나 이상의 아미노산이 라이세닌의 상동체 또는 파라로그내 상응하는 위치(들)에 존재하는 아미노산으로 치환하는 것과 관련될 수 있다. 라이세닌의 동족체의 4가지 예는 서열번호: 14 내지 17에 제시된다. 이러한 치환의 이점은 동족체 모노머가 또한 포어를 형성하기 때문에 포어를 형성하는 돌연변이체 모노머를 생성할 가능성이 있다는 것이다. 예를 들어, 돌연변이는 서열번호: 2와 서열번호: 14 내지 서열번호: 17 중 임의의 하나 사이에서 상이한 서열번호: 2의 임의의 하나 이상의 위치에서 제조될 수 있다. 이러한 돌연변이는 서열번호: 14 내지 17 중 어느 하나에 있어서의 상응하는 위치로부터의 아미노산, 바람직하게는 서열번호: 14 내지 16 중 어느 하나에서의 아미노산에 의한 서열번호: 2의 아미노산의 치환일 수 있다. 대안적으로, 상기 위치 중 어느 하나의 돌연변이는 임의의 아미노산에 의한 치환, 또는 결실 또는 삽입 돌연변이, 예컨대 1 내지 30개의 아미노산, 예컨대 2 내지 20개, 3 내지 10개 또는 4 내지 8개의 아미노산의 치환, 결실 또는 삽입일 수 있다. 본원에 개시된 돌연변이 및 선행 기술, 예를 들어 WO 2013/153359에 개시된 돌연변이 외에, 서열번호: 2와 서열번호: 14 내지 17의 모든 것, 바람직하게는 서열번호: 14 내지 16의 모든 것 사이에 보존되거나 또는 동일한 아미노산은 바람직하게는 본 발명의 변이체에 보존되거나 존재한다. 보존적 돌연변이는 서열번호: 2와 서열번호: 14 내지 17, 또는 보다 바람직하게는 서열번호: 14 내지 16 사이에서 보존되거나 동일한 상기 위치들 중 임의의 하나 이상에서 이루어질 수 있다.
본 발명은 서열번호: 2에서 특정 위치에 상응하는 라이세닌 모노머의 구조 내의 위치에서 서열번호: 2의 특정 위치로 치환된 것으로서 본원에 기재된 임의의 하나 이상의 아미노산을 포함하는 라이세닌 돌연변이체 모노머를 제공한다. 상응하는 위치는 당해 분야의 표준 기술에 의해 결정될 수 있다. 예를 들어, 위에서 언급한 PILEUP 및 BLAST 알고리즘은 라이세닌 모노머의 서열을 서열번호: 2와 정렬하여 상응하는 잔기를 동정하는데 사용될 수 있다.
돌연변이체 모노머는 전형적으로 야생형 라이세닌 모노머와 동일한 3D 구조, 예컨대 서열번호: 2의 서열을 갖는 라이세닌 모노머와 동일한 3D 구조를 형성하는 능력을 보유한다. 라이세닌 모노머의 3D 구조는 당해 분야에 알려져 있으며, 예를 들어 De Colbis 등, Structure, 2012(20): 1498-1507에 개시되어 있다. 돌연변이체 모노머는 전형적으로 다른 라이세닌 모노머와 함께 호모올리고머성 및/또는 헤테로올리고머성 포어를 형성하는 능력을 보유한다. 돌연변이체 모노머는 전형적으로 포어에 존재할 때 야생형 라이세닌 모노머와 동일한 3D 구조를 형성하도록 리폴딩하는 능력을 보유한다. 라이세닌 포어 내의 라이세닌 모노머의 3D 구조는 본원의 도 7에 도시된다. 본원에 기재된 돌연변이에 추가하여 야생형 라이세닌 서열에서 임의의 수의 돌연변이, 예컨대 2 내지 100개, 3 내지 80개, 4 내지 70개, 5 내지 60개, 10 내지 50개 또는 20 내지 40개의 돌연변이가 이루어질 수 있으며, 단, 라이세닌 돌연변이체 모노머는 본 발명의 돌연변이에 의해 그것에 부여된 개선된 특성 중 하나 이상을 보유한다.
전형적으로, 라이세닌 모노머는 라이세닌 모노머가 다른 동일한 돌연변이체 모노머 또는 상이한 라이세닌 돌연변이체 모노머와 조립되어 포어를 형성할 때 2개의 베타 시트를 라이세닌 포어의 배럴에 제공하는 능력을 보유할 것이다.
변이체는 또한, 바람직하게는 E84Q/E85K/E92Q/E97S/D126G 중 하나 이상 또는, 적합한 경우 E84Q/E85K/E92Q/E97S/D126G 모두를 포함한다. "적합한 경우"는 위치가 여전히 돌연변이체 모노머에 존재하는지 또는 상이한 아미노산으로 변형되지 않았는지를 의미한다.
위에서 논의된 특정 돌연변이 이외에, 변이체는 다른 돌연변이를 포함할 수 있다. 이러한 돌연변이는 폴리뉴클레오타이드와 상호작용하는 모노머의 능력을 반드시 향상시키지는 않는다. 돌연변이는 예를 들어 발현 및/또는 정제를 용이하게 할 수 있다. 서열번호: 2의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게는 아미노산 유사성 또는 동일성에 기반하여 그 서열과 적어도 50% 상동일 것이다. 보다 바람직하게는, 변이체는 전체 서열에 대해 서열번호: 2의 아미노산 서열과의 아미노산 유사성 또는 동일성을 기반으로 하여 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 및 더 바람직하게는 적어도 95%, 97% 또는 99% 상동일 수 있다. 100 또는 그 이상, 예를 들어 125, 150, 175 또는 200 이상의 인접한 아미노산의 스트레치(stretch)에 걸쳐 아미노산 유사성 또는 동일성이 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95%일 수 있다("경질 상동성").
상동성을 결정하기 위해 당해 분야의 표준 방법을 사용할 수 있다. 예를 들어, UWGCG 패키지는 상동성을 계산, 예를 들어 그의 디폴트 설정하는 데 사용할 수 있는 BESTFIT 프로그램을 제공한다(Devereux et al (1984) Nucleic Acids Research 12, p387-395). PILEUP 및 BLAST 알고리즘은 예를 들어 Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S.F et al (1990) J Mol Biol 215:403-10에 기술된 바와 같이, 상동성 또는 라인 업 서열(예컨대 균등한 잔기 또는 상응하는 서열(전형적으로 그들의 디폴트 설정))을 계산하는데 사용될 수 있다. BLAST 분석을 수행하는 소프트웨어는 미국 국립생물공학 정보센터(National Center for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)를 통해 공공연하게 이용가능하다. 유사성은 쌍별 동일성을 사용하거나, BLOSUM62와 같은 평점 매트릭스를 적용하고 균등한 동일성으로 변환하여 측정할 수 있다. 진화된 변화라기보다는 기능성 변화를 나타내기 때문에, 의도적으로 돌연변이된 위치는 상동성을 결정할 때 마스킹된다. 유사성은 예를 들어, 단백질 서열의 포괄적인 데이터베이스에 대한 PSIBLAST를 사용하는 위치-특정 평점 매트릭스의 적용에 의해 보다 민감하게 결정될 수 있다. 진화론적 시간 척도에 걸친 치환 빈도보다는 아미노산의 화학-물리적 특성을 반영하는 상이한 평점 매트릭스가 사용될 수 있다(예를 들어, 전하).
1, 2, 3, 4, 5, 10, 20 또는 30개 이하의 치환과 같은 아미노산 치환이 상기 논의된 것 이외에 서열번호: 2의 아미노산 서열에 대해 이루어질 수 있다. 보존적 치환은 아미노산을 유사한 화학 구조, 유사한 화학적 특성 또는 유사한 측쇄 용적의 다른 아미노산으로 대체한다. 도입된 아미노산은 그들이 대체되는 아미노산에 대하여 유사한 극성, 친수성, 소수성, 염기도, 산도, 중성 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존의 방향족 또는 지방족 아미노산 대신에 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변화는 당해 기술 분야에 잘 알려져 있으며, 하기 표 3에 정의된 20개의 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 갖는 경우, 이는 표 4의 아미노산 측쇄에 대한 친수도 척도를 참고로 결정될 수 있다.
상기 변이체는 아미노산이 라이세닌의 동족체 및 파라로그내에 상응하는 위치(들)의 아미노산으로 대체된 상기 지정된 영역 외의 하나 이상의 치환을 포함할 수 있다. 라이세닌의 동족체의 4가지 예가 서열번호: 14 내지 17에 개시되어 있다.
서열번호: 2의 아미노산 서열의 하나 이상의 아미노산 잔기가 상기 변이체에서 추가로 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개의 잔기가 결실되거나, 그 이상이 될 수 있다.
변이체는 서열번호: 2의 단편을 포함할 수 있다. 이러한 단편은 포어 형성 활성을 보유한다. 이것은 상기에 기재된 바와 같이 분석될 수 있다. 단편은 길이가 적어도 50, 100, 150, 200 또는 250개의 아미노산일 수 있다. 이러한 단편은 본 발명의 포어를 생성하는데 사용될 수 있다. 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역이 본 발명에 따른 하나 이상의 결실에 의해 변형될 수 있기 때문에, 단편은 전체 영역을 함유할 필요는 없다. 따라서, 비변형된 영역의 길이보다 짧은 단편이 본 발명에 의해 구상된다. 단편은 바람직하게는 서열번호: 2의 포어 형성 도메인을 포함한다. 단편은 더욱 바람직하게, 본 발명에 따라 변형된 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역을 포함한다.
하나 이상의 아미노산은 대안적으로 또는 추가로, 상기 기재된 변이체에 첨가될 수 있다. 연장부는 이의 단편을 포함하여, 서열번호: 2의 변이체의 아미노산 서열의 아미노 말단 또는 카복시 말단에 제공될 수 있다. 연장은 매우 짧을 수 있으며, 예를 들어 1 내지 10개의 아미노산 길이일 수 있다. 대안적으로, 연장은 예를 들어 최대 50 또는 100개의 아미노산까지 더 길어질 수 있다. 캐리어 단백질은 본 발명에 따른 아미노산 서열에 융합될 수 있다. 다른 융합 단백질은 이하에 더 상세하게 논의된다.
상기에 논의된 바와 같이, 변이체는 서열번호: 2의 아미노산 서열과는 상이하고 포어를 형성하는 그의 능력을 보유하는 아미노산 서열을 갖는 폴리펩타이드이다. 변이체는 전형적으로 포어 형성을 담당하는 서열번호: 2의 영역, 즉 약 44번 위치 내지 약 126번 위치를 함유하며, 이 영역은 상기 논의된 바와 같이 본 발명에 따라 변형된다. 상기에 논의된 바와 같이, 이 영역의 단편을 포함할 수 있다. 본 발명의 변형에 추가하여, 서열번호: 2의 변이체는 하나 이상의 추가의 변형, 예컨대 치환, 첨가 또는 결실을 포함할 수 있다. 이러한 변형은 바람직하게는 서열번호: 2의 약 1번 위치 내지 약 43번 위치 및 약 127번 위치 내지 약 297번 위치(즉, 본 발명에 따라 변형된 영역 외부)에 해당하는 변이체의 연장부에 위치한다.
돌연변이체 모노머는 예를 들어 히스티딘 잔기(hist 태그), 아스파르트산 잔기(asp 태그), 스트렙타비딘 태그 또는 플래그 태그의 첨가에 의해, 또는 폴리펩타이드가 그러한 서열을 자연적으로 함유하지 않는 세포로부터 그들의 분비를 촉진시키는 신호 서열의 첨가에 의해, 그것의 확인 또는 정제를 돕기 위해 변형될 수 있다. 유전적 태그를 도입하는 대안은 화학적으로 포어의 원상태 또는 조작적 위치에 태그를 화학적으로 반응시키는 것이다. 이것의 예는 겔-이동 시약을 포어 외부에서 조작된 시스테인에 반응시키는 것이다. 이것은 헤몰라이신 헤테로-올리고머를 분리하는 방법으로 실증되었다(Chem Biol. 1997 Jul;4(7):497-505).
돌연변이체 모노머는 노출 표지로 표지될 수 있다. 상기 노출 표지는 포어를 검출할 수 있는 임의의 적합한 표지일 수 있다. 적합한 표지에는 형광 분자, 방사성 동위원소, 예를 들어, 125I, 35S, 효소, 항체, 항원, 폴리뉴클레오타이드, 폴리에틸렌 글리콜(PEGs), 펩타이드 및 리간드, 예컨대 바이오틴이 포함되지만, 이에 한정되지 않는다.
돌연변이체 모노머는 또한 D-아미노산을 사용하여 생산될 수 있다. 예를 들어, 돌연변이체 모노머는 L-아미노산과 D-아미노산의 혼합물을 포함할 수 있다. 이러한 단백질 또는 펩타이드를 생산하는 것은 당해 분야에서 통상적인 것이다.
돌연변이체 모노머는 폴리뉴클레오타이드와의 상호작용을 용이하게 하기 위해 하나 이상의 특정 변형을 포함한다. 돌연변이체 모노머는 또한, 포어 형성을 방해하지 않는한 다른 비-특이적 변형을 함유할 수 있다. 수많은 비-특이적 측쇄 변형이 당해 분야에 공지되어 있고, 돌연변이체 모노머의 측쇄로 제조될 수 있다. 이러한 변형은 예를 들어, 알데히드와의 반응에 이어 NaBH4에 의한 환원, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의한 아실화에 의한, 아미노산의 환원 알킬화를 포함한다.
돌연변이체 모노머는 당해 분야에 공지된 표준 방법을 사용하여 생산될 수 있다. 모노머는 합성적으로 또는 재조합 수단으로 제조될 수 있다. 예를 들어, 모노머는 시험관내 번역 및 전사(IVTT)에 의해 합성될 수 있다. 포어 모노머를 제조하기 위한 적합한 방법은 국제 출원 번호 PCT/GB09/001690(WO 2010/004273으로 공개됨), PCT/GB09/001679(WO 2010/004265로 공개됨) 또는 PCT/GB10/000133(WO 2010/086603)에 논의되어 있다. 막에 포어를 삽입하는 방법은 아래에 논의되어 있다.
돌연변이체 모노머를 암호화하는 폴리뉴클레오타이드 서열은 당해 분야의 표준 방법을 사용하여 유래 및 복제될 수 있다. 이러한 서열은 하기에서 보다 상세히 논의된다. 돌연변이체 모노머를 암호화하는 폴리뉴클레오타이드 서열은 당해 분야의 표준 기술을 사용하여 박테리아 숙주 세포에서 발현될 수 있다. 돌연변이체 모노머는 재조합 발현 벡터로부터의 폴리펩타이드의 원위치 발현에 의해 세포에서 생성될 수 있다. 발현 벡터는 선택적으로 폴리펩타이드의 발현을 조절하기 위해 유도성 프로모터를 운반한다.
돌연변이체 모노머는 포어 생산 유기체로부터의 임의의 단백질 액체 크로마토그래피 시스템에 의한 정제 후, 또는 이하에 기재된 바와 같은 재조합 발현 후 대규모로 생산될 수 있다. 전형적인 단백질 액체 크로마토그래피 시스템은 FPLC, AKTA 시스템, Bio-Cad 시스템, Bio-Rad BioLogic 시스템 및 Gilson HPLC 시스템을 포함한다. 돌연변이체 모노머는 본 발명에 따라 사용하기 위해 자연-발생 또는 인공 막에 삽입될 수 있다. 막에 포어를 삽입하는 방법은 아래에 논의되어 있다.
일부 구현예에서, 돌연변이체 모노머는 화학적으로 변형된다. 돌연변이체 모노머는 임의의 방식으로, 및 임의의 부위에서 화학적으로 변형될 수 있다. 돌연변이체 모노머는 바람직하게는 하나 이상의 시스테인에 분자의 부착(시스테인 연결), 하나 이상의 라이신에 분자의 부착, 하나 이상의 비-천연 아미노산에 분자의 부착, 에피토프의 효소변형 또는 말단의 변형에 의해 화학적으로 변형된다. 상기 변형을 수행하기 위한 적합한 방법은 당해 분야에 잘 알려져있다. 적합한 비-천연 아미노산은 Liu C. C. and Schultz P. G., Annu. Rev. Biochem., 2010, 79, 413-444의 도 1에서 4-아지도-L-페닐알라닌(Faz) 및 1-71로 넘버링된 아미노산 중 임의의 하나를 포함하지만, 이에 한정되지는 않는다. 돌연변이체 모노머는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 모노머는 폴리에틸렌 글리콜(PEG), 핵산, 예컨대 DNA, 염료, 형광단 또는 발색단의 부착에 의해 화학적으로 변형될 수 있다.
일부 구현예에서, 돌연변이체 모노머는 모노머 및 표적 피분석물, 표적 뉴클레오타이드 또는 표적 폴리뉴클레오타이드를 포함하는 포어 사이의 상호작용을 용이하게 하는 분자 어댑터에 의해 화학적으로 변형된다. 어댑터의 존재는 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드의 호스트-게스트 화학을 개선시키고, 그렇게 함으로써 돌연변이체 모노머로부터 형성된 포어의 서열분석 능력을 개선시킨다. 호스트-게스트 화학의 원리는 당해 분야에 잘 알려져있다. 어댑터는 뉴클레오타이드 또는 폴리뉴클레오타이드와의 상호작용을 향상시키는 포어의 물리적 또는 화학적 특성에 영향을 미친다. 어댑터는 포어의 배럴 또는 채널의 전하를 변경시키거나, 뉴클레오타이드 또는 폴리뉴클레오타이드와 특이적으로 상호작용하거나 또는 뉴클레오타이드 또는 폴리뉴클레오타이드에 결합하여, 그렇게 함으로써 포어와의 상호작용을 촉진시킬 수 있다.
분자 어댑터는 바람직하게는 환형 분자, 예를 들어 사이클로덱스트린, 하이브리드화가 가능한 종, DNA 결합제 또는 인터킬레이터, 펩타이드 또는 펩타이드 유사체, 합성 폴리머, 방향족 평면 분자, 작은 양으로-하전된 분자 또는 수소-결합이 가능한 소분자이다.
어댑터는 환형일 수 있다. 환형 어댑터는 바람직하게는 포어와 동일한 대칭을 갖는다.
어댑터는 전형적으로 호스트-게스트 화학을 통해 피분석물, 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용한다. 어댑터는 전형적으로 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있다. 어댑터는 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 하나 이상의 화학기는 바람직하게는 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스 힘, π-양이온 상호작용 및/또는 정전기력에 의해 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용한다. 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있는 하나 이상의 화학기는 바람직하게는 양으로 하전된다. 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있는 하나 이상의 화학기는 보다 바람직하게는 아미노기를 포함한다. 아미노기는 1차, 2차 또는 3차 탄소 원자에 부착될 수 있다. 어댑터는 더욱더 바람직하게는 아미노기의 고리, 예컨대 6, 7, 8 또는 9개의 아미노기의 고리를 포함한다. 어댑터는 가장 바람직하게는 6 또는 9개의 아미노기의 고리를 포함한다. 양성자화된 아미노기의 고리는 뉴클레오타이드 또는 폴리뉴클레오타이드내 음으로 하전된 포스페이트기와 상호작용할 수 있다.
포어 내에서의 어댑터의 정확한 위치결정은 어댑터와 돌연변이체 모노머를 포함하는 포어 사이의 호스트-게스트 화학에 의해 용이하게 될 수 있다. 어댑터는 바람직하게는 포어 내의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 어댑터는 더 바람직하게 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스 힘, π-양이온 상호작용 및/또는 정전기력을 통해 포어 내의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 포어 내의 하나 이상의 아미노산과 상호작용할 수 있는 화학기는 전형적으로 하이드록실 또는 아민이다. 하이드록실기는 1차, 2차 또는 3차 탄소 원자에 부착될 수 있다. 하이드록실기는 포어 내의 하전되지않은 아미노산과 수소 결합을 형성할 수 있다. 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드 사이의 상호작용을 용이하게 하는 임의의 어댑터가 사용될 수 있다.
적합한 어댑터는 사이클로덱스트린, 환형 펩타이드 및 쿠커비투릴(cucurbituril)을 포함하지만, 이에 한정되지는 않는다. 어댑터는 바람직하게는 사이클로덱스트린 또는 이의 유도체이다. 사이클로덱스트린 또는 이의 유도체는 Eliseev, A. V., and Schneider, H-J. (1994) J. Am. Chem. Soc. 116, 6081-6088에 개시된 임의의 것일 수 있다. 어댑터는 더 바람직하게는 헵타키스-6-아미노-β-사이클로덱스트린(am7-βCD), 6-모노데옥시-6-모노아미노-β-사이클로덱스트린(am1-βCD) 또는 헵타키스-(6-데옥시-6-구아니디노)-사이클로덱스트린(gu7-βCD)이다. gu7-βCD의 구아니디노 그룹은 am7-βCD의 1차 아민보다 훨씬 높은 pKa를 가지므로 더 많이 양으로 하전된다. 이 gu7-βCD 어댑터는 포어 내의 뉴클레오타이드의 체류 시간을 증가시키고, 측정된 잔존 전류의 정확도를 높일 뿐만 아니라, 고온 또는 낮은 데이터 수집 속도에서 염기 검출 속도를 증가시키는데 사용될 수 있다.
이하에 더 상세히 논의되는 바와 같이 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP) 가교결합제가 사용되는 경우, 어댑터는 바람직하게는 헵타키스(6-데옥시-6-아미노)-6-N-모노(2-피리딜)디티오프로파노일-β-사이클로덱스트린(am6amPDP1-βCD)이다.
더 적합한 어댑터에는 8개의 당 단위를 포함하는 γ-사이클로덱스트린이 포함된다(따라서 8배 대칭을 가짐). γ-사이클로덱스트린은 링커 분자를 함유할 수 있거나, 또는 상기 논의된 β-사이클로덱스트린의 예에서 사용된 모든 또는 그 이상의 변형된 당 단위를 포함하도록 변형될 수 있다.
분자 어댑터는 바람직하게는 돌연변이체 모노머에 공유결합된다. 어댑터는 당해 분야에 공지된 임의의 방법을 사용하여 포어에 공유결합될 수 있다. 어댑터는 전형적으로 화학적 연결을 통해 부착된다. 분자 어댑터가 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인이 바람직하게는 치환에 의해 돌연변이체로 도입된다. 본 발명의 돌연변이체 모노머는 물론 272 및 283번 위치 중 하나 또는 둘 모두에 시스테인 잔기를 포함할 수 있다. 돌연변이체 모노머는 이들 시스테인 중 하나 또는 둘 모두에 분자 어댑터를 부착시킴으로써 화학적으로 변형될 수 있다. 대안적으로, 돌연변이체 모노머는 하나 이상의 시스테인 또는 다른 위치에 도입된 FAz와 같은 비-천연 아미노산에 분자를 부착시킴으로써 화학적으로 변형될 수 있다.
시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 향상될 수 있다. 예를 들어, 측접하는 아르기닌, 히스티딘 또는 라이신 잔기의 염기성 기는 시스테인 티올 그룹의 pKa를 반응성 S- 그룹의 pKa로 변화시킬 것이다. 시스테인 잔기의 반응성은 dTNB와 같은 티올 보호기에 의해 보호될 수 있다. 이들은 링커가 부착되기 전에 돌연변이체 모노머의 하나 이상의 시스테인 잔기와 반응될 수 있다. 분자는 돌연변이체 모노머에 직접 부착될 수 있다. 분자는 바람직하게는 링커, 예컨대 화학적 가교결합제 또는 펩타이드 링커를 사용하여 돌연변이체 모노머에 부착된다.
적합한 화학적 가교결합제는 당해 분야에 잘 알려져있다. 바람직한 가교결합제는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디설파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디설파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디설파닐)옥타노에이트를 포함한다. 가장 바람직한 가교결합제는 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP)이다. 전형적으로, 분자는 분자/가교결합제 복합체가 돌연변이체 모노머에 공유결합되기 전에 이중작용성 가교결합제에 공유결합되어 있지만, 이중작용성 가교결합제/모노머 복합체가 분자에 부착되기 전에 이중작용성 가교결합제를 모노머에 공유결합시킬 수도 있다.
링커는 바람직하게는 디티오트레이톨(DTT)에 대하여 저항성이다. 적합한 링커는 아이오도아세트아미드-계 및 말레이미드-계 링커를 포함하지만, 이에 한정되지 않는다.
다른 구현예에서, 모노머는 폴리뉴클레오타이드 결합 단백질에 부착될 수 있다. 이것은 본 발명의 방법에 사용될 수 있는 모듈러 서열분석 시스템을 형성한다. 폴리뉴클레오타이드 결합 단백질은 하기에서 논의된다.
폴리뉴클레오타이드 결합 단백질은 돌연변이체 모노머에 공유결합될 수 있다. 단백질은 당해 분야에 공지된 임의의 방법을 사용하여 포어에 공유결합될 수 있다. 모노머와 단백질은 화학적으로 융합되거나 유전적으로 융합될 수 있다. 전체 작제물이 단일 폴리뉴클레오타이드 서열로부터 발현되는 경우 모노머 및 단백질은 유전적으로 융합된다. 포어와 폴리뉴클레오타이드 결합 단백질의 유전적 융합은 국제 출원 제 PCT/GB09/001679호(WO 2010/004265로 공개됨)에서 논의된다.
폴리뉴클레오타이드 결합 단백질이 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인은 바람직하게는 치환에 의해 돌연변이체로 도입된다. 그러한 치환은 전형적으로 동족체 중에서 낮은 보존성을 갖는 루프 영역에서 이루어지므로, 돌연변이 또는 삽입이 용인될 수 있음을 나타낸다. 따라서, 이들은 폴리뉴클레오타이드 결합 단백질을 부착시키는데 적합하다. 이러한 치환은 전형적으로 서열번호: 2의 잔기 1 내지 43 및 127 내지 297에서 이루어진다. 시스테인 잔기의 반응성은 상기 기재된 바와 같은 변형에 의해 향상될 수 있다.
폴리뉴클레오타이드 결합 단백질은 돌연변이체 모노머에 직접 또는 하나 이상의 링커를 통해 부착될 수 있다. 폴리뉴클레오타이드 결합 단백질은 국제 출원 번호 PCT/GB10/000132(WO 2010/086602로 공개됨)에 기재된 하이브리드화 링커를 사용하여 돌연변이체 모노머에 부착될 수 있다. 대안적으로, 펩타이드 링커가 사용될 수 있다. 펩타이드 링커는 아미노산 서열이다. 펩타이드 링커의 길이, 가요성 및 친수성은 전형적으로 모노머 및 분자의 기능을 방해하지 않도록 설계된다. 바람직한 가요성 펩타이드 링커는 2 내지 20개, 예컨대 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산의 연장이다. 보다 바람직한 가요성 링커는 (SG)1, (SG)2, (SG)3, (SG)4, (SG)5 및 (SG)8(여기서, S가 세린이고 G가 글리신임)을 포함한다. 바람직한 경질 링커는 2 내지 30개, 예컨대 4, 6, 8, 16 또는 24개의 프롤린 아미노산의 연장이다. 보다 바람직한 경질 링커는 (P)12(여기서, P가 프롤린임)를 포함한다.
돌연변이체 모노머는 분자 어댑터 및 폴리뉴클레오타이드 결합 단백질로 화학적으로 변형될 수 있다.
돌연변이 라이세닌 모노머 제조
본 발명은 또한 폴리뉴클레오타이드를 특징화하기 위해 서열번호: 2에 나타낸 서열을 포함하는 라이세닌 모노머의 능력을 개선시키는 방법을 제공한다. 상기 방법은 서열번호: 2의 본 발명의 하나 이상의 변형 및/또는 치환을 형성하는 단계를 포함한다. 특징적인 폴리뉴클레오타이드와 관련하여 돌연변이체 라이세닌 모노머와 관련하여 상기 논의된 구현예 중 임의의 것은 본 발명의 방법에 동등하게 적용된다.
작제물
본 발명은 또한 라이세닌으로부터 유도된 2종 이상의 공유결합된 모노머를 포함하로서, 적어도 하나의 모노머가 본 발명의 돌연변이체 라이세닌 모노머인 작제물을 제공한다. 본 발명의 작제물은 포어 형성 능력을 보유한다. 본 발명의 하나 이상의 작제물은 표적 피분석물을 특징화하기 위한 포어를 형성하는데 사용될 수 있다. 본 발명의 하나 이상의 작제물은 표적 폴리뉴클레오타이드를 서열화하는 것과 같이 표적 폴리뉴클레오타이드를 특징화하기 위한 포어를 형성하는데 사용될 수 있다. 작제물은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 모노머를 포함할 수 있다. 2개 이상의 모노머는 동일하거나 상이할 수 있다.
작제물 내의 적어도 모노머는 본 발명의 돌연변이체 모노머이다. 작제물내 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상의 모노머가 본 발명의 돌연변이체 모노머일 수 있다. 작제물 내의 모든 모노머는 바람직하게는 본 발명의 돌연변이체 모노머이다. 돌연변이체 모노머는 동일하거나 상이할 수 있다. 바람직한 구현예에서, 작제물은 본 발명의 2개의 돌연변이체 모노머를 포함한다.
작제물 내의 본 발명의 돌연변이체 모노머는 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 작제물 내의 본 발명의 돌연변이체 모노머의 배럴은 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 길이는 아미노산의 수 및/또는 길이 단위로 측정될 수 있다. 작제물 내의 본 발명의 돌연변이체 모노머는 바람직하게는 상기 기재된 바와 같이 34 내지 70번 위치 및/또는 71 내지 107번 위치에서 결실된 동일한 수의 아미노산을 갖는다.
작제물 내의 다른 모노머는 본 발명의 돌연변이체 모노머일 필요는 없다. 예를 들어, 적어도 하나의 모노머는 서열번호: 2에 나타낸 서열을 포함할 수 있다. 작제물 내의 적어도 하나의 모노머는 서열번호: 2의 파라로그 또는 동족체일 수 있다. 적합한 동족체는 서열번호: 14 내지 17로 나타낸다.
대안적으로, 적어도 하나의 모노머는 서열번호: 2의 변이체를 포함할 수 있으며, 이 변이체는 아미노산 동일성을 기반으로 전체 서열에 대해 서열번호: 2와 적어도 50% 상동성이지만, 본 발명의 돌연변이체 모노머에 의해 요구되는 임의의 특정 돌연변이를 포함하지 않거나, 또는 상기 기재된 바와 같이 아미노산이 결실되어 있지 않다. 더 바람직하게는, 변이체는 전체 서열에 걸쳐 서열번호: 2의 아미노산 서열과 아미노산 동일성을 기반으로 하여 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 및 더 바람직하게는 적어도 95%, 97% 또는 99% 상동성일 수 있다. 상기 변이체는 상기 논의된 단편 또는 임의의 다른 변이체일 수 있다. 본 발명의 작제물은 또한 아미노산 동일성에 기초한 전체 서열에 걸쳐, 서열번호: 14, 15, 16 또는 17에 대해 상기 언급된 상동성의 적어도 50% 상동성 또는 적어도 임의의 다른 상동성 수준인 서열번호: 14, 15, 16 또는 17의 변이체를 포함할 수 있다.
작제물 내의 모든 모노머는 본 발명의 돌연변이체 모노머일 수 있다. 돌연변이체 모노머는 동일하거나 상이할 수 있다. 보다 바람직한 구현예에서, 작제물은 2개의 모노머를 포함하고, 모노머 중 적어도 하나는 본 발명의 돌연변이체 모노머이다.
모노머는 유전적으로 융합될 수 있다. 모노머는 전체 작제물이 단일 폴리뉴클레오타이드 서열로부터 발현되는 경우 유전적으로 융합된다. 모노머의 암호화 서열은 임의의 방법으로 조합되어 작제물을 암호화하는 단일 폴리뉴클레오타이드 서열을 형성할 수 있다. 유전적 융합은 국제 출원 제 PCT/GB09/001679호(WO 2010/004265로 공개됨)에서 논의된다.
모노머는 임의의 배치형태로 유전적으로 융합될 수 있다. 모노머는 말단 아미노산을 통해 융합될 수 있다. 예를 들어, 하나의 모노머의 아미노 말단은 다른 모노머의 카복시 말단에 융합될 수 있다.
2종 이상의 모노머는 직접 유전적으로 함께 융합될 수 있다. 모노머는 바람직하게는 링커를 사용하여 유전적으로 융합된다. 링커는 모노머의 이동도를 제한하도록 설계될 수 있다. 바람직한 링커는 아미노산 서열(즉, 펩타이드 링커)이다. 상기 논의된 임의의 펩타이드 링커가 사용될 수 있다.
펩타이드 링커의 길이, 가요성 및 친수성은 전형적으로 모노머 및 분자의 기능을 교란시키지 않도록 설계된다. 바람직한 가요성 펩타이드 링커는 2 내지 20개, 예컨대 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산의 연장이다. 더 바람직한 가요성 링커는 (SG)1, (SG)2, (SG)3, (SG)4, (SG)5 및 (SG)8(여기서, S가 세린이고 G가 글리신임)이다. 바람직한 경질 링커는 2 내지 30, 예컨대 4, 6, 8, 16 또는 24개의 프롤린 아미노산의 연장이다. 더 바람직한 경질 링커는 P가 프롤린 인(P)12(여기서, P는 프롤린임)를 포함한다.
또 다른 바람직한 구현예에서, 모노머는 화학적으로 융합된다. 모노머는 예를 들어 화학적 가교결합제를 통해 화학적으로 부착되는 경우 화학적으로 융합된다. 위에서 논의된 임의의 화학적 가교결합제가 사용될 수 있다. 링커는 하나 이상의 시스테인 잔기 또는 비-천연 아미노산, 예컨대 돌연변이체 모노머에 도입된 Faz에 부착될 수 있다. 대안적으로, 링커는 작제물 내의 모노머 중 하나의 말단에 부착될 수 있다. 모노머는 전형적으로 서열번호: 2의 잔기 1 내지 43 및 127 내지 297 중 하나 이상을 통해 연결된다.
작제물이 상이한 모노머를 함유하는 경우, 모노머의 과잉의 함량에서 링커의 농도를 유지함으로써 자체에 대한 모노머의 가교결합이 예방될 수 있다. 대안적으로, 2개의 링커가 사용되는 "잠금 및 키" 배열이 사용될 수 있다. 각 링커의 단 하나의 단부가 더 긴 링커를 형성하기 위해 함께 반응할 수 있고, 링커의 다른 단부는 각각 상이한 모노머와 반응할 수 있다. 이러한 링커는 국제 출원 제 PCT/GB10/000132호(WO 2010/086602로 공개됨)에 기재되어 있다.
본 발명은 또한 본 발명의 작제물을 제조하는 방법으로서, 상기 방법은 라이세닌으로부터 유래된 하나 이상의 모노머에 본 발명의 적어도 하나의 돌연변이체 라이세닌 모노머를 공유결합시키는 단계를 포함하는, 방법을 제공한다. 본 발명의 작제물과 관련하여 상기 논의된 임의의 구현예는 작제물을 제조하는 방법에 동등하게 적용된다.
폴리뉴클레오타이드
본 발명은 또한 본 발명의 돌연변이체 모노머를 암호화하는 폴리뉴클레오타이드 서열을 제공한다. 돌연변이체 모노머는 상기 논의된 임의의 것일 수 있다. 폴리뉴클레오타이드 서열은 바람직하게는 전체 서열에 대해 서열번호: 1의 서열과 뉴클레오타이드 동일성을 기반으로 하여 적어도 50%, 60%, 70%, 80%, 90% 또는 95% 상동성 서열을 포함한다. 300 또는 그 이상, 예를 들어 375, 450, 525 또는 600 이상의 인접 뉴클레오타이드("경질 상동성")의 연장에 걸쳐 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95% 뉴클레오타이드 동일성이 있을 수 있다. 상동성은 상기 기재된 바와 같이 계산될 수 있다. 폴리뉴클레오타이드 서열은 유전자 암호의 축 퇴에 기초하여 서열번호: 1과 상이한 서열을 포함할 수 있다.
본 발명은 또한 본 발명의 유전적으로 융합된 작제물 중 임의의 것을 암호화하는 폴리뉴클레오타이드 서열을 제공한다. 폴리뉴클레오타이드는 바람직하게는 상기 기재된 바와 같은 서열번호: 1 또는 그의 변이체에 나타낸 바와 같은 2종 이상의 서열을 포함한다.
폴리뉴클레오타이드 서열은 당해 분야의 표준 방법을 사용하여 유래 및 복제될 수 있다. 야생형 라이세닌을 암호화하는 염색체 DNA는 유기체, 예컨대 줄지렁이(Eisenia fetida)를 생성하는 포어로부터 추출될 수 있다. 포어 모노머를 암호화하는 유전자는 특정 프라이머를 포함하는 PCR을 사용하여 증폭될 수 있다. 이어서, 증폭된 서열은 부위 지향적 돌연변이유발을 겪을 수 있다. 부위 지향적 돌연변이유발의 적합한 방법은 당해 분야에 공지되어 있으며, 예를 들어 결합 연쇄 반응을 포함한다. 본 발명의 작제물을 암호화하는 폴리뉴클레오타이드는 공지된 기술, 예컨대 Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY에 기재된 기술을 사용하여 제조될 수 있다.
이어서, 수득된 폴리뉴클레오타이드 서열은 클로닝 벡터와 같은 재조합 복제 가능 벡터 내로 편입될 수 있다. 벡터는 양립가능한 숙주 세포에서 폴리뉴클레오타이드를 복제하는데 사용될 수 있다. 따라서, 폴리뉴클레오타이드 서열은 폴리뉴클레오타이드를 복제가능한 벡터에 도입하고, 벡터를 양립가능한 숙주 세포에 도입하고, 및 벡터의 복제를 야기하는 조건하에 숙주 세포를 성장시킴으로써 제조될 수 있다. 벡터는 숙주 세포로부터 회수될 수 있다. 폴리뉴클레오타이드의 클로닝을 위한 적합한 숙주 세포는 당해 분야에 공지되어 있으며, 이하에서 보다 상세히 기술된다.
폴리뉴클레오타이드 서열은 적합한 발현 벡터 내로 클로닝될 수 있다. 발현 벡터에서, 폴리뉴클레오타이드 서열은 전형적으로 숙주 세포에 의한 암호화 서열의 발현을 제공할 수 있는 조절 서열에 작동가능하게 연결된다. 이러한 발현 벡터는 포어 하위단위를 발현하는데 사용될 수 있다.
용어 "작동가능하게 연결된"은 기재된 상기 성분이 의도된 방식으로 기능할 수 있는 관계에 있는 병치를 지칭한다. 암호화 서열에 "작동가능하게 연결된" 조절 서열은 조절 서열과 양립가능한 조건 하에서 암호화 서열의 발현이 달성되는 방식으로 결찰된다. 동일하거나 상이한 폴리뉴클레오타이드 서열의 다중 복제본이 벡터에 도입될 수 있다.
발현 벡터는 적합한 숙주 세포에 도입될 수 있다. 따라서, 본 발명의 돌연변이체 모노머 또는 작제물은 폴리뉴클레오타이드 서열을 발현 벡터에 삽입하고,이 벡터를 양립가능한 박테리아 숙주 세포에 도입하고, 및 폴리뉴클레오타이드 서열의 발현을 유도하는 조건하에 숙주 세포를 성장시킴으로써 제조될 수 있다. 재조합적으로-발현된 모노머 또는 작제물은 숙주 세포 막의 포어로 자기-조립될 수 있다. 대안적으로, 이러한 방식으로 생성된 재조합 포어는 숙주 세포로부터 제거되어 다른 막에 삽입될 수 있다. 2개 이상의 상이한 하위단위를 포함하는 포어를 제조할 때, 상이한 하위단위는 상기 기재된 바와 같이 상이한 숙주 세포에서 별도로 발현되고, 숙주 세포로부터 제거되고, 별개의 막, 예컨대 양 적혈구 막 또는 스핑고미엘린을 함유하는 리포좀에서 포어로 조립될 수 있다.
예를 들어, 라이세닌 모노머는 스핑고미엘린 및 하기 지질 중 하나 이상: 포스파티딜세린; POPE; 콜레스테롤; 및 대두 PC를 포함하는 지질 혼합물을 첨가하고, 혼합물을 예를 들어 30℃에서 60분 동안 배양함으로써 올리고머화될 수 있다. 올리고머화된 모노머는 임의의 적합한 방법, 예를 들어 WO2013/153359에 기재된 바와 같은 SDS-PAGE 및 겔 정제에 의해 정제될 수 있다.
벡터는 예를 들어, 복제 기원이 제공된 플라스미드, 바이러스 또는 파아지 벡터, 선택적으로 상기 폴리뉴클레오타이드 서열의 발현을 위한 프로모터 및 선택적으로 프로모터의 조절자일 수 있다. 벡터는 하나 이상의 선택가능한 마커 유전자, 예를 들어 테트라사이클린 저항성 유전자를 함유할 수 있다. 프로모터 및 다른 발현 조절 신호는 발현 벡터가 설계된 숙주 세포와 양립가능하도록 선택될 수 있다. 전형적으로 T7, trc, lac, ara 또는 λL 프로모터가 사용된다.
숙주 세포는 전형적으로 포어 하위단위를 높은 수준으로 발현한다. 폴리뉴클레오타이드 서열로 형질전환된 숙주 세포는 세포를 형질전환하는데 사용되는 발현 벡터와 양립가능하도록 선택될 것이다. 숙주 세포는 전형적으로 박테리아이며, 바람직하게는 에스케리치아 콜라이(Escherichia coli)이다. λDE3 용질원을 갖는 임의의 세포, 예를 들어 C41 (DE3), BL21 (DE3), JM109 (DE3), B834 (DE3), TUNER, Origami 및 Origami B는 T7 프로모터를 포함하는 벡터를 발현할 수 있다. 상기 열거된 조건 외에도, Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20647-52에 인용된 방법 중 임의의 방법이 사용되어, 라이세닌 단백질을 발현시킬 수 있다.
포어
본 발명은 또한 다양한 포어를 제공한다. 본 발명의 포어는 피분석물의 특성을 분석하는데 이상적이다. 본 발명의 포어는 고도의 민감도로 상이한 뉴클레오타이드를 구별할 수 있기 때문에 폴리뉴클레오타이드 서열분석과 같은 특징화에 특히 이상적이다. 핵산을 서열분석하고 단일 염기 변화를 확인하는 것을 포함하여, DNA와 RNA와 같은 핵산을 특징화하기 위해 포어가 사용될 수 있다. 본 발명의 포어는 메틸화된 및 메틸화되지않은 뉴클레오타이드를 구별할 수 있다. 본 발명의 포어의 염기 해상도는 놀랍게도 높다. 포어는 4개의 DNA 뉴클레오타이드의 거의 완전한 분리를 나타낸다. 포어는 포어 내의 체류 시간 및 포어를 통해 흐르는 전류에 기초하여 데옥시시티딘 모노포스페이트(dCMP)와 메틸-dCMP를 구별하기 위해 추가로 사용될 수 있다.
본 발명의 포어는 또한 다양한 조건 하에서 상이한 뉴클레오타이드를 구별할 수 있다. 특히, 포어는 폴리뉴클레오타이드의 서열분석과 같은 특징화에 유리한 조건 하에서 뉴클레오타이드 사이를 구별할 것이다. 본 발명의 포어가 상이한 뉴클레오타이드를 구별할 수 있는 정도는 적용된 전위, 염 농도, 완충액, 온도 및 우레아, 베타인 및 DTT와 같은 첨가제의 존재를 변경함으로써 제어될 수 있다. 이렇게하면 특히 서열분석할 때 포어의 기능을 미세조정할 수 있다. 이에 대해서는 이하에 더 상세히 논의된다. 본 발명의 포어는 또한 뉴클레오타이드 기반으로 뉴클레오타이드보다는 하나 이상의 모노머와의 상호작용으로부터 폴리뉴클레오타이드 폴리머를 동정하는데 사용될 수 있다.
본 발명의 포어는 단리, 실질적으로 단리, 정제 또는 실질적으로 정제될 수 있다. 본 발명의 포어는 지질 또는 다른 포어와 같은 임의의 다른 성분이 완전히 없는 경우 단리되거나 정제된다. 포어는 의도된 용도를 저해하지 않을 캐리어 또는 희석제와 혼합되는 경우 실질적으로 단리된다. 예를 들어, 포어는 지질 또는 다른 포어와 같은 다른 성분의 10% 미만, 5% 미만, 2% 미만 또는 1% 미만을 포함하는 형태로 존재하는 경우 실질적으로 단리되거나 실질적으로 정제된다. 대안적으로, 본 발명의 포어는 지질 이중층에 존재할 수 있다.
본 발명의 포어는 개체 또는 단일 포어로서 존재할 수 있다. 대안적으로, 본 발명의 포어는 상동성 또는 이종성 모집단 또는 복수의 2종 이상의 포어에 존재할 수 있다.
호모-올리고머성 포어
본 발명은 또한 본 발명의 동일한 돌연변이체 모노머를 포함하는 라이세닌으로부터 유래된 호모-올리고머성 포어를 제공한다. 모노머는 아미노산 서열이 동일하다. 본 발명의 호모-올리고머성 포어는 폴리뉴클레오타이드 특징화, 예컨대 서열분석에 이상적이다. 본 발명의 호모-올리고머성 포어는 상기 논의된 임의의 이점을 가질 수 있다. 본 발명의 특정 호모-올리고머성 포어의 이점은 실시예에 나타나 있다.
호모-올리고머성 포어는 임의의 수의 돌연변이체 모노머를 함유할 수 있다. 포어는 전형적으로 2종 이상의 돌연변이체 모노머를 포함한다. 호모-올리고머성 포어는 임의의 수의 돌연변이체 모노머를 함유할 수 있다. 포어는 전형적으로 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 동일한 돌연변이체 모노머, 예컨대 6, 7, 8 또는 9개의 돌연변이체 모노머를 포함한다. 포어는 바람직하게는 8 또는 9개의 동일한 돌연변이체 모노머를 포함한다. 포어는 가장 바람직하게는 9개의 동일한 돌연변이체 모노머를 포함한다. 이 모노머의 수는 본 명세서에서 "충분한 수"로 언급된다.
1개 이상, 예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이체 모노머는 바람직하게는 상기 또는 하기에서 논의한 바와 같이 화학적으로 변형된다.
1개 이상의 돌연변이체 모노머는 바람직하게는 상기 또는 하기에서 논의된 바와 같이 화학적으로 변형된다. 환언하면, 화학적으로 변형된 모노머(및 화학적으로 변형되지 않은 모노머) 중 하나 이상은 각 모노머의 아미노산 서열이 동일하다면 포어가 호모-올리고머성이 되는 것을 방지하지 못한다.
라이세닌 포어를 제조하는 방법은 실시예 및 Yamaji 등, J. Biol. Chem. 1998; 273(9): 5300-6에 기술되어 있다.
헤테로-올리고머성 포어
본 발명은 또한 본 발명의 적어도 하나의 돌연변이체 모노머를 포함하는 라이세닌으로부터 유래된 헤테로-올리고머성 포어로서, 적어도 하나의 모노머가 다른 모노머와 상이한, 헤테로-올리고머성 포어를 제공한다. 모노머는 그의 아미노산 서열의 관점에서 다른 모노머와 상이하다. 본 발명의 헤테로-올리고머성 포어는 폴리뉴클레오타이드 특징화, 예컨대 서열분석에 이상적이다. 헤테로-올리고머성 포어는 당해 분야에 공지된 방법(예를 들어, Protein Sci. 2002 Jul;11(7):1813-24)을 사용하여 제조될 수 있다.
헤테로-올리고머성 포어는 포어를 형성하기에 충분한 모노머를 함유한다. 모노머는 예를 들어 야생형을 포함하는 임의의 유형일 수 있다. 포어는 전형적으로 2개 이상의 모노머를 포함한다. 포어는 전형적으로 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 모노머, 예컨대 6, 7, 8, 9 또는 10개의 모노머를 포함한다. 포어는 바람직하게는 8 또는 9개의 모노머를 포함한다. 포어는 가장 바람직하게는 9개의 모노머를 포함한다. 이 모노머의 수는 본 명세서에서 "충분한 수"로 언급된다.
포어는 본 발명의 돌연변이체 모노머에 의해 요구되는 돌연변이를 가지지 않거나 또는 상기에 기재된 바와 같이 아미노산이 결실되지 않은, 서열번호: 2에 나타낸 서열, 그의 파라로그, 그의 동족체 또는 그의 변이체를 포함하는 적어도 하나의 모노머를 포함할 수 있다. 적합한 변이체는 서열번호: 2, 14, 15, 16 및 17 및 그의 변이체를 포함하는 본 발명의 작제물과 관련하여 상기 논의된 임의의 변이체이다. 이 구현예에서, 잔존 모노머는 바람직하게는 본 발명의 돌연변이체 모노머이다.
바람직한 구현예에서, 포어는 (a) 본 발명의 하나의 돌연변이체 모노머 및 (b) 포어를 형성하기에 충분한 수의 동일한 모노머를 포함하며, 여기에서 (a)에서의 상기 돌연변이체 모노머는 (b)에서의 동일한 모노머와 상이하다. (b)에서의 동일한 모노머는 바람직하게는 본 발명의 돌연변이체 모노머에 의해 요구되는 돌연변이를 갖지 않는 서열번호: 2에 나타낸 서열, 그의 파라로그, 그의 동족체 또는 그의 변이체를 포함한다.
본 발명의 헤테로-올리고머성 포어는 바람직하게는 본 발명의 단 하나의 돌연변이체 라이세닌 모노머만을 포함한다.
또 다른 바람직한 구현예에서, 헤테로-올리고머성 포어 내의 모노머는 모두 본 발명의 돌연변이체 모노머이고, 이들 중 적어도 하나는 다른 것들과 상이하다.
포어 내의 본 발명의 돌연변이체 모노머는 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 포어 내의 본 발명의 돌연변이체 모노머의 배럴은 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 길이는 아미노산의 수 및/또는 길이 단위로 측정될 수 있다. 포어 내의 본 발명의 돌연변이체 모노머는 바람직하게는 34 내지 70번 위치 및/또는 71 내지 107번 위치에서 결실된 동일한 수의 아미노산을 갖는다.
상기 논의된 모든 구현예에서, 하나 이상의 돌연변이체 모노머는 바람직하게는 상기 또는 하기에서 논의된 바와 같이 화학적으로 변형된다. 하나의 모노머에 대한 화학적 변형의 존재는 포어가 헤테로-올리고머가 되지 않게 한다. 적어도 하나의 모노머의 아미노산 서열은 다른 모노머의 서열(들)과 상이해야 한다. 포어를 생성하는 방법은 아래에 더 상세히 논의된다.
작제물-함유 포어
본 발명은 또한 본 발명의 적어도 하나의 작제물을 포함하는 포어를 제공한다. 본 발명의 작제물은 라이세닌으로부터 유래된 2종 이상의 공유결합된 모노머를 포함하며, 여기에서 모노머 중 적어도 하나는 본 발명의 돌연변이체 라이세닌 모노머이다. 환언하면, 작제물은 하나 초과의 모노머를 함유해야 한다. 포어 내의 모노머 중 적어도 2종은 본 발명의 작제물의 형태이다. 모노머는 임의의 유형일 수 있다.
포어는 전형적으로 (a) 2개의 모노머를 포함하는 하나의 작제물 및 (b) 포어를 형성하기에 충분한 수의 모노머를 함유한다. 작제물은 위에 논의된 것 중 임의의 하나일 수 있다. 모노머는 본 발명의 돌연변이체 모노머를 포함하여 상기 논의된 임의의 것일 수 있다.
또 다른 전형적인 포어는 본 발명의 1 초과의 작제물, 예컨대 본 발명의 2, 3 또는 4개의 작제물을 포함한다. 이러한 포어는 포어를 형성하기에 충분한 수의 모노머를 추가로 포함한다. 모노머는 상기 논의된 임의의 것일 수 있다. 본 발명의 추가의 포어는 2개의 모노머를 포함하는 작제물만을 포함한다. 본 발명에 따른 특정 포어는 2개의 모노머를 각각 포함하는 몇개의 작제물을 포함한다. 작제물은 각 작제물로부터 하나의 모노머 만이 포어에 기여하도록 하는 구조를 갖는 포어로 올리고머화할 수 있다. 전형적으로, 작제물의 다른 모노머(즉, 포어를 형성하지 않는 모노머)는 포어의 외부에 있을 것이다.
돌연변이는 상기에 기재된 바와 같이 작제물에 도입될 수 있다. 돌연변이는 교대일 수 있는데, 즉, 돌연변이는 2개의 모노머 작제물 내의 각 모노머에 대해 상이하고, 작제물은 교대로 변형을 일으키는 호모-올리고머로서 조립된다. 환언하면, MutA 및 MutB를 포함하는 모노머가 융합되고 조립되어 A-B:A-B:A-B:A-B 포어를 형성한다. 대안적으로, 돌연변이는 이웃할 수 있으며, 즉 동일한 돌연변이가 작제물 내의 2개의 모노머에 도입되고, 이어서 이것은 상이한 돌연변이체 모노머로 올리고머화된다. 즉, MutA를 포함하는 모노머는 융합된 후, MutB-함유 모노머에 의해 올리고머화되어, A-A:B:B:B:B:B:B를 형성한다.
작제물-함유 포어 내의 하나 이상의 본 발명의 모노머는 상기 또는 하기에서 논의된 바와 같이 화학적으로-변형될 수 있다.
본 발명의 화학적으로-변형된 포어
또 다른 양태에서, 본 발명은 화학적으로-변형된 하나 이상의 돌연변이체 모노머를 포함하는 화학적으로-변형된 라이세닌 포어를 제공하여, 조립된 포어의 배럴/채널의 개방 직경이 하나의 부위에서, 또는 배럴의 길이; 예컨대 2, 3, 4 또는 5개의 부위에 따라 감소되거나 좁아지거나, 또는 조여진다. 포어는 본 발명의 호모-올리고머성 및 헤테로-올리고머성 포어와 관련하여 상기 논의된 임의의 수의 모노머를 포함할 수 있다. 포어는 바람직하게는 9개의 화학적으로-변형된 모노머를 포함한다. 화학적으로-변형된 포어는 상기에 기재된 바와 같이 호모-올리고머성일 수 있다. 환언하면, 화학적으로-변형된 포어 내의 모든 모노머는 동일한 아미노산 서열을 가질 수 있고, 동일한 방식으로 화학적으로 변형될 수 있다. 상기 화학적으로-변형된 포어는 상기에 기재된 바와 같이 헤테로-올리고머성일 수 있다. 환언하면, 포어는 (a) 화학적으로 변형된 단 하나의 모노머, (b) 적어도 2개, 예컨대, 3, 4, 5, 6, 또는 7개의 화학적으로-변형된 모노머가 서로 상이한, 1 초과, 예컨대 2, 3, 4, 5, 6, 7 또는 8개의 화학적으로-변형된 모노머 또는 (c) 적어도 2개, 예컨대 3, 4, 5, 6, 7, 8 또는 9개의 화학적으로-변형된 모노머가 서로 상이한 단독의 화학적으로-변형된 모노머(즉, 모든 모노머는 화학적으로-변형됨)를 포함할 수 있다. 모노머는 그들의 아미노산 서열, 그의 화학적 변형, 또는 그들의 아미노산 서열 및 이들의 화학적 변형의 관점에서 서로 상이할 수 있다. 화학적으로-변형된 모노머(들)은 상기 및/또는 하기에 논의된 임의의 것일 수 있다.
본 발명은 또한 하기 논의된 임의의 방법으로 화학적으로-변형된 돌연변이체 라이세닌 모노머를 제공한다. 돌연변이체 모노머는 상기 또는 하기에서 논의된 임의의 것일 수 있다. 그 결과, 본 발명의 돌연변이체 모노머, 예컨대 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상의 변형을 포함하는 서열번호: 2의 변이체, 또는 상기 논의된 배럴 결실을 포함하는 변이체는 하기 논의되는 바와 같이 본 발명에 따라 화학적으로-변형될 수 있다.
돌연변이체 모노머는 화학적으로-변형되어 조립된 포어의 배럴의 직경이 포어를 통과하는 피분석물의 크기에 의존하는 임의의 감소 인자에 의해 감소되거나 좁아질 수 있다. 수축 구역의 폭은 전형적으로 예를 들어 피분석물이 포어를 통한 이온 유동을 감소시킴으로써 피분석물의 전좌 동안 측정 신호의 파괴 정도를 결정할 것이다. 신호의 파괴가 클수록 전형적으로 측정 감도가 더 커진다. 따라서, 수축 구역은 전위되는 피분석물보다 약간 넓게 선택될 수 있다. 예를 들어 ssDNA의 전좌에 대하여, 수축 구역의 폭은 0.8 내지 3.0nm 범위의 값으로부터 선택될 수 있다.
화학적 변형은 또한 수축 구역의 길이를 결정할 수 있으며, 이 수축 구역은 차례로 측정 신호에 기여하는 폴리머 단위, 예컨대 뉴클레오타이드의 수를 결정할 것이다. 임의의 특정 시간에서 전류 신호에 기여하는 뉴클레오타이드는 k-mer로 언급될 수 있으며, 여기서 k는 정수이고 전체 또는 단편적 수일 수 있다. 4종의 핵 염기를 갖는 폴리뉴클레오타이드를 측정하는 경우, 3-mer는 43개의 잠재적인 신호 수준을 발생시킬 것이다. k의 값이 클수록 더 많은 수의 신호 수준이 발생한다. 전형적으로 측정 신호 데이터의 분석을 단순화하기 때문에 짧은 수축 구역을 제공하는 것이 바람직하다.
화학적 변형은 바람직하게는 화학 분자가 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머에 공유결합되도록 하는 것이다. 화학 분자는 당해 분야에 공지된 임의의 방법을 사용하여 포어, 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머에 공유결합시킬 수 있다. 화학 분자는 일반적으로 화학 결합을 통해 부착된다.
돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 바람직하게는 하나 이상의 시스테인에 대한 분자의 부착(시스테인 연결), 하나 이상의 라이신에 대한 분자의 부착, 하나 이상의 비-천연 아미노산에 대한 분자의 부착 또는 에피토프의 효소 변형에 의해 화학적으로 변형된다. 화학적 개질제가 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인은 바람직하게는 치환에 의해 상기 돌연변이체에 도입된다. 그러한 변형을 수행하기 위한 적합한 방법은 당해 분야에 잘 알려져있다. 적합한 비-천연 아미노산은 Liu C. C. and Schultz P. G., Annu. Rev. Biochem., 2010, 79, 413-444의 도 1에서 1-71로 넘버링된 아미노산 중 임의의 하나 및 4-아지도-L-페닐알라닌(Faz)을 포함하지만 이에 한정되지는 않는다.
돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 임의의 위치 또는 부위에서 조립된 포어의 배럴의 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 모노머는 (i) 말레이미드 예컨대: 4-페닐아조말레이나닐, 1.N-(2-하이드록시에틸)말레이미드, N-사이클로헥실말레이미드, 1.3-말레이미도프로피온산, 1.1-4-아미노페닐-1H-피롤,2,5,디온, 1.1-4-하이드록시페닐-1H-피롤,2,5,디온, N-에틸말레이미드, N-메톡시카보닐말레이미드, N-tert-부틸말레이미드, N-(2-아미노에틸)말레이미드 , 3-말레이미도-프록실, N-(4-클로로페닐)말레이미드, 1-[4-(디메틸아미노)-3,5-디니트로페닐]-1H-피롤-2,5-디온, N-[4-(2-벤즈이미다졸릴)페닐]말레이미드, N-[4-(2-벤즈옥사졸일)페닐]말레이미드, N-(1-나프틸)-말레이미드, N-(2,4-크실릴)말레이미드, N-(2,4-디플루오로페닐)말레이미드, N-(3-클로로-파라-톨릴)-말레이미드, 1-(2-아미노-에틸)-피롤-2,5-디온 하이드로클로라이드, 1-사이클로펜틸-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, 1-(3-아미노프로필)-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 3-메틸-1-[2-옥소-2-(피페라진-1-일)에틸]-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 1-벤질-2,5-디하이드로-1H-피롤-2,5-디온, 3-메틸-1-(3,3,3-트리플루오로프로필)-2,5-디하이드로-1H-피롤-2,5-디온, 1-[4-(메틸아미노)사이클로헥실]-2,5-디하이드로-1H-피롤-2,5-디온 트리플루오로아세트산, SMILES O=C1C=CC(=O)N1CC=2C=CN=CC2, SMILES O=C1C=CC(=O)N1CN2CCNCC2, 1-벤질-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, 1-(2-플루오로페닐)-3-메틸-2,5-디하이드로 1H-피롤-2,5-디온, N-(4-페녹시페닐)말레이미드 , N-(4-니트로페닐)말레이미드 (ii) 아이오도세타미드 예컨대: 3-(2-아이오도아세트아미도)-프록실, N-(사이클로프로필메틸)-2-아이오도아세트아미드, 2-아이오도-N-(2-페닐에틸)아세트아미드, 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드, N-(4-아세틸페닐)-2-아이오도아세트아미드, N-(4-(아미노설포닐)페닐)-2-아이오도아세트아미드, N-(1,3-벤조티아졸-2-일)-2-아이오도아세트아미드, N-(2,6-디에틸페닐)-2-아이오도아세트아미드, N-(2-벤조일-4-클로로페닐)-2-아이오도아세트아미드, (iii) 브로모아세트아미드: 예컨대 N-(4-(아세틸아미노)페닐)-2-브로모아세트아미드, N-(2-아세틸페닐)-2-브로모아세트아미드, 2-브로모-N-(2-시아노페닐)아세트아미드, 2-브로모-N-(3-(트리플루오로메틸)페닐)아세트아미드, N-(2-벤조일페닐)-2-브로모아세트아미드, 2-브로모-N-(4-플루오로페닐)-3-메틸부탄아미드, N-벤질-2-브로모-N-페닐프로피온아미드, N-(2-브로모-부티릴)-4-클로로-벤젠설폰아미드, 2-브로모-N-메틸-N-페닐아세트아미드, 2-브로모-N-펜에틸-아세트아미드, 2-아다만탄-1-일-2-브로모-N-사이클로헥실-아세트아미드, 2-브로모-N-(2-메틸페닐)부탄아미드, 모노브로모아세트아닐라이드, (iv) 디설파이드 예컨대: 알드리티올-2, 알드리티올-4, 이소프로필 디설파이드, 1-(이소부틸디설파닐)-2-메틸프로판, 디벤질 디설파이드, 4-아미노페닐 디설파이드, 3-(2-피리딜디티오)프로피온산, 3-(2-피리딜디티오)프로피온산 하이드라자이드, 3-(2-피리딜디티오)프로피온산 N-석신이미딜 에스테르, am6amPDP1-βCD
및 (v) 티올 예컨대: 4-페닐티아졸-2-티올, Purpald, 5,6,7,8-테트라하이드로-퀴나졸린-2-티올의 부착에 의해 화학적으로 변형될 수 있다.
돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 폴리에틸렌 글리콜(PEG), 핵산, 예컨대 DNA, 염료, 형광단 또는 발색단의 부착에 의해 화학적으로 변형될 수 있다. 일부 구현예에서, 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 모노머 및 표적 피분석물, 표적 뉴클레오타이드 또는 표적 폴리뉴클레오타이드를 포함하는 포어 사이의 상호작용을 용이하게 하는 분자 어댑터로 화학적으로 변형된다. 어댑터의 존재는 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드의 호스트-게스트 화학을 향상시키고, 그렇게 함으로써 돌연변이체 모노머로부터 형성된 포어의 서열분석 능력을 향상시킨다.
돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 임의의 위치: K37, V47, S49, T55, S86, E92, E94에서 조립된 포어의 배럴의 개방 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 더욱 바람직하게는, 돌연변이체 모노머는 위치 E92 및 E94에서 조립된 포어의 배럴의 개방 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 일 구현예에서, 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 이들 위치에서 하나 이상의 시스테인에 분자를 부착(시스테인 연결)시킴으로써 화학적으로 변형된다.
시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 향상될 수 있다. 예를 들어, 측접하는 아르기닌, 히스티딘 또는 라이신 잔기의 염기성 기는 시스테인 티올 그룹의 pKa를 반응성 S- 그룹의 pKa로 변화시킬 것이다. 시스테인 잔기의 반응성은 dTNB와 같은 티올 보호기에 의해 보호될 수 있다. 이들은 링커가 부착되기 전에 돌연변이체 모노머의 하나 이상의 시스테인 잔기와 반응될 수 있다.
분자는 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머에 직접 부착될 수 있다. 분자는 바람직하게는 링커, 예컨대 화학적 가교결합제 또는 펩타이드 링커를 사용하여 돌연변이체 모노머에 부착된다. 적합한 화학적 가교결합제는 당해 분야에 잘 알려져있다. 바람직한 가교결합제는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디설파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디설파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디설파닐)옥타노에이트를 포함한다. 가장 바람직한 가교결합제는 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP)이다. 전형적으로, 분자는 분자/가교결합제 복합체가 돌연변이체 모노머에 공유결합되기 전에 이중작용성 가교결합제에 공유결합되어 있지만, 이중작용성 가교결합제/모노머 복합체가 분자에 부착되기 전에 이중작용성 가교결합제를 모노머에 공유결합시킬 수도 있다.
링커는 바람직하게는 디티오트레이톨(DTT)에 대하여 저항성이다. 적합한 링커는 아이오도아세트아미드-계 및 말레이미드-계 링커를 포함하지만, 이에 한정되지 않는다.
이러한 방식으로 화학적으로-변형된 포어는 (i) 판독 헤드의 선명도 개선, (ii) 염기들간의 개선된 식별력, 및 (iii) 개선된 범위, 즉 개선된 신호대 잡음비의 특정 장점을 나타낸다.
배럴 내의 특정 위치를 화학 분자로 변경함으로써 신규한 판독기-헤드가 도입되거나 오래된 판독기 헤드가 변형될 수 있다. 변형된 분자의 크기로 인해, 판독기 헤드의 물리적 크기가 상당히 변경될 수 있다. 유사하게, 변형된 분자의 화학적 특성으로 인해 판독기-헤드의 특성이 변경될 수 있다. 두 가지 효과의 조합은 염기의 개선된 해상도와 더 나은 식별력을 갖춘 판독기 헤드를 구현하는 것으로 실증되었다. 상이한 위치에서 상이한 염기의 신호에 대한 상대적인 기여도가 변경되었을뿐만 아니라, 극단적인 판독기-헤드 위치는 신호에 대한 이들의 기여도가 훨씬 낮아서 주어진 모멘트에서 분석된 Kmer의 길이가 더 짧은 것을 의미하는 매우 낮은 식별력을 나타낸다. 이 더 선명한 판독기-헤드는 원래의 신호에서 Kmers의 디콘볼루션 프로세스를 더욱 단순화한다.
본 발명의 포어의 제조
본 발명은 또한 본 발명의 포어를 제조하는 방법을 제공한다. 상기 방법은 본 발명의 적어도 하나의 돌연변이체 모노머 또는 본 발명의 적어도 하나의 작제물이 본 발명의 충분한 수의 돌연변이체 라이세닌 모노머, 본 발명의 작제물, 라이세닌 모노머 또는 라이세닌 유래의 모노머와 함께 올리고머화하여 포어를 형성시키는 단계를 포함한다. 상기 방법이 본 발명의 호모-올리고머성 포어의 제조에 관한 것이라면, 상기 방법에 사용된 모든 모노머는 동일한 아미노산 서열을 갖는 본 발명의 돌연변이체 라이세닌 모노머이다. 상기 방법이 본 발명의 헤테로-올리고머성 포어의 제조에 관한 것이라면, 상기 모노머 중 적어도 하나는 다른 것과 상이하다.
전형적으로, 모노머는 상기 기재된 바와 같이 숙주 세포에서 발현되고, 숙주 세포로부터 제거되고, 양성 적혈구 막 또는 스핑고미엘린을 함유하는 리포좀과 같은 별개의 막에서 포어로 조립된다.
예를 들어, 라이세닌 모노머는 스핑고미엘린 및 하기 지질: 포스파티딜 세린; POPE; 콜레스테롤; 및 대두 PC 중 하나 이상을 포함하는 지질 혼합물을 첨가하고, 및 상기 혼합물을 예를 들어 30℃에서 60분 동안 배양함으로써 올리고머화될 수 있다. 올리고머화된 모노머는 임의의 적합한 방법, 예를 들어 WO2013/153359에 기재된 바와 같은 SDS-PAGE 및 겔 정제에 의해 정제될 수 있다.
본 발명의 포어와 관련하여 상기에서 논의된 임의의 구현예는 포어를 생성하는 방법에 동등하게 적용된다.
피분석물의 특징화 방법
본 발명은 표적 피분석물을 특징화하는 방법을 제공한다. 상기 방법은 상기 표적 피분석물이 상기 포어를 통해 이동하도록 상기 표적 피분석물을 본 발명의 포어와 접촉시키는 단계를 포함한다. 포어는 위에 논의된 것들 중 임의의 하나일 수 있다. 이어서, 당해 분야에 공지된 표준 방법을 사용하여 포어에 대해 피분석물이 이동함에 따라 표적 피분석물의 하나 이상의 특징이 측정된다. 표적 피분석물의 하나 이상의 특징은 바람직하게는 피분석물이 포어를 통해 이동함에 따라 측정된다. 단계 (a) 및 (b)는 바람직하게 포어를 가로질러 인가된 전위로 수행된다. 이하에서 보다 상세히 논의되는 바와 같이, 인가된 전위는 전형적으로 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성시킨다. 인가된 전위는 전압 전위일 수 있다. 대안적으로, 인가된 전위는 화학 포텐셜일 수 있다. 이것의 한 예는 양친매성 층에 걸쳐 염 구배를 사용하는 것이다. 염 구배는 Holden 등, J Am Chem Soc. 2007 Jul 11;129(27):8650-5에 개시되어 있다.
본 발명의 방법은 표적 피분석물을 특징화하기 위한 것이다. 본 방법은 적어도 하나의 피분석물을 특징화하기 위한 것이다. 이 방법은 2종 이상의 피분석물의 특징화과 관련될 수 있다. 상기 방법은 임의의 수의 피분석물, 예컨대 2, 5, 10, 15, 20, 30, 40, 50, 100 또는 그 초과의 피분석물을 특징화하는 단계를 포함할 수 있다.
상기 표적 피분석물은 바람직하게는 금속 이온, 무기 염, 폴리머, 아미노산, 펩타이드, 폴리펩타이드, 단백질, 뉴클레오타이드, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 염료, 표백제, 약제, 진단제, 기분전환 약제(recreational drug), 폭발물 또는 환경오염 물질이다. 이 방법은 2종 이상의 단백질, 2개 이상의 뉴클레오타이드 또는 2개 이상의 의약품과 같은 동일한 유형의 2종 이상의 피분석물의 특징화과 관련될 수 있다. 대안적으로, 상기 방법은 하나 이상의 단백질, 하나 이상의 뉴클레오타이드 및 하나 이상의 의약품과 같은 상이한 유형의 2종 이상의 피분석물의 특징화과 관련될 수 있다.
상기 표적 피분석물은 세포로부터 분비될 수 있다. 대안적으로, 상기 표적 피분석물은 세포 내에 존재하는 분석물일 수 있으므로, 본 발명을 수행하기 전에 피분석물을 세포로부터 추출해야한다.
피분석물은 바람직하게는 아미노산, 펩타이드, 폴리펩타이드 및/또는 단백질이다. 아미노산, 펩타이드, 폴리펩타이드 또는 단백질은 자연-발생적 또는 비-자연-발생적일 수 있다. 폴리펩타이드 또는 단백질은 그 안에 합성 또는 변형된 아미노산을 포함할 수 있다. 아미노산에 대한 수많은 상이한 유형의 변형이 당해 분야에 공지되어 있다. 적합한 아미노산 및 이의 변형은 상기에 기재되어 있다. 본 발명의 목적을 위해, 상기 표적 피분석물은 당해 분야에서 이용가능한 임의의 방법에 의해 변형될 수 있는 것으로 이해되어야 한다.
단백질은 효소, 항체, 호르몬, 성장 인자 또는 성장 조절 단백질, 예컨대 사이토카인일 수 있다. 사이토카인은 인터류킨, 바람직하게는 IFN-1, IL-1, IL-2, IL-4, IL-5, IL-6, IL-10, IL-12 및 IL-13, 인터페론, 바람직하게는, IL-γ 및 다른 사이토카인, 예컨대 TNF-α로부터 선택될 수 있다. 단백질은 박테리아 단백질, 진균 단백질, 바이러스 단백질 또는 기생충-유래된 단백질일 수 있다.
상기 표적 피분석물은 바람직하게는 뉴클레오타이드, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드이다. 뉴클레오타이드는 전형적으로 핵 염기, 당 및 적어도 하나의 포스페이트기를 함유한다. 핵 염기는 전형적으로 복소환형이다. 핵 염기는 퓨린 및 피리미딘, 더 구체적으로는 아데닌, 구아닌, 티민, 우라실 및 시토신을 포함하지만, 이에 한정되지 않는다. 당은 전형적으로 펜토스 당이다. 뉴클레오타이드 당은 리보오스 및 데옥시리보스를 포함하지만, 이에 한정되지 않는다. 뉴클레오타이드는 전형적으로 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드이다. 뉴클레오타이드는 전형적으로 모노포스페이트, 디포스페이트 또는 트리포스페이트를 함유한다. 포스페이트는 뉴클레오타이드의 5' 또는 3' 측에 부착될 수 있다.
뉴클레오타이드는 아데노신 모노포스페이트(AMP), 아데노신 디포스페이트(ADP), 아데노신 트리포스페이트(ATP), 구아노신 모노포스페이트(GMP), 구아노신 디포스페이트(GDP), 구아노신 트리포스페이트(GTP), 티미딘 모노포스페이트(TMP), 티미딘 디포스페이트(TDP), 티미딘 트리포스페이트(TTP), 우리딘 모노포스페이트(UMP), 우리딘 디포스페이트(UDP), 우리딘 트리포스페이트(UTP), 시티딘 모노포스페이트(CMP), 시티딘 디포스페이트(CDP), 시티딘 트리포스페이트(CTP), 5-메틸시티딘 모노포스페이트, 5-메틸시티딘 디포스페이트, 5-메틸시티딘 트리포스페이트, 5-하이드록시메틸시티딘 모노포스페이트, 5-하이드록시메틸시티딘 디포스페이트, 5-하이드록시메틸시티딘 트리포스페이트, 환형 아데노신 모노포스페이트(cAMP), 환형 구아노신 모노포스페이트(cGMP), 데옥시아데노신 모노포스페이트(dAMP), 데옥시아데노신 디포스페이트(dADP), 데옥시아데노신 트리포스페이트(dATP), 데옥시구아노신 모노포스페이트(dGMP), 데옥시구아노신 디포스페이트(dGDP), 데옥시구아노신 트리포스페이트(dGTP), 데옥시티미딘 모노포스페이트(dTMP), 데옥시티미딘 디포스페이트(dTDP), 데옥시티미딘 트리포스페이트(dTTP), 데옥시우리딘 모노포스페이트(dUMP), 데옥시우리딘 디포스페이트(dUDP), 데옥시우리딘 트리포스페이트(dUTP), 데옥시시티딘 모노포스페이트(dCMP), 데옥시시티딘 디포스페이트(dCDP) 및 데옥시시티딘 트리포스페이트(dCTP), 5-메틸-2'-데옥시시티딘 모노포스페이트, 5-메틸-2'-데옥시시티딘 디포스페이트, 5-메틸-2'-데옥시시티딘 트리포스페이트, 5-하이드록시메틸-2'-데옥시시티딘 모노포스페이트, 5-하이드록시메틸-2'-데옥시시티딘 디포스페이트 및 5-하이드록시메틸-2'-데옥시시티딘 트리포스페이트를 포함하지만, 이에 한정되지 않는다. 뉴클레오타이드는 바람직하게는 AMP, TMP, GMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다. 뉴클레오타이드는 무염기성(즉, 핵 염기가 결여됨)일 수 있다. 뉴클레오타이드는 추가의 변형을 함유할 수 있다. 특히, 적합한 변형된 뉴클레오타이드는 2'아미노 피리미딘(예컨대, 2'-아미노 시티딘 및 2'-아미노 우리딘), 2'-하이드록실 퓨린(예컨대, 2'-플루오로 피리미딘(예컨대 2'-플루오로시티딘 및 2'플루오로 우리딘), 하이드록실 피리미딘(예컨대 5'-α-P-보라노 우리딘), 2'-O-메틸 뉴클레오타이드(예컨대, 2'-O-메틸 아데노신, 2'-O-메틸 구아노신, 2'-O-메틸 시티딘 및 2'-O-메틸 우리딘), 4'-티오 피리미딘(예컨대 4'-티오 우리딘 및 4'-티오 시티딘) 및 핵염기의 변형을 갖는 뉴클레오타이드(예컨대 5-펜티닐-2'-데옥시 우리딘, 5-(3-아미노프로필)-우리딘 및 1,6-디아미노헥실-N-5-카바모일메틸 우리딘)을 포함하지만, 이에 한정되지 않는다.
올리고뉴클레오타이드는 전형적으로 50개 이하의 뉴클레오타이드, 예컨대 40개 이하, 30개 이하, 20개 이하, 10개 이하 또는 5개 이하의 뉴클레오타이드를 갖는 짧은 뉴클레오타이드 폴리머이다. 올리고뉴클레오타이드는 무염기성 및 변형된 뉴클레오타이드를 포함하는, 상기 논의된 임의의 뉴클레오타이드를 포함할 수 있다. 본 발명의 방법은 바람직하게는 표적 폴리뉴클레오타이드를 특징화하기 위한 것이다. 폴리뉴클레오타이드, 예컨대 핵산은 2종 이상의 뉴클레오타이드를 포함하는 거대분자이다. 폴리뉴클레오타이드 또는 핵산은 임의의 뉴클레오타이드의 임의의 조합을 포함할 수 있다. 뉴클레오타이드는 자연-발생적이거나 인공적일 수 있다. 표적 폴리뉴클레오타이드 내의 하나 이상의 뉴클레오타이드는 산화되거나 메틸화될 수 있다. 표적 폴리뉴클레오타이드의 하나 이상의 뉴클레오타이드가 손상될 수 있다. 예를 들어, 폴리뉴클레오타이드는 피리미딘 이량체를 포함할 수 있다. 이러한 이량체는 전형적으로 자외선에 의한 손상과 관련이 있으며 피부 흑색종의 주요 원인이다. 표적 폴리뉴클레오타이드 내의 하나 이상의 뉴클레오타이드는 예를 들어 표지 또는 태그로 변형될 수 있다. 적합한 라벨은 상기에 기술되어 있다. 표적 폴리뉴클레오타이드는 하나 이상의 스페이서를 포함할 수 있다.
뉴클레오타이드는 상기 정의된 바와 같다. 폴리뉴클레오타이드에 존재하는 뉴클레오타이드는 전형적으로 아데노신 모노포스페이트(AMP), 구아노신 모노포스페이트(GMP), 티미딘 모노포스페이트(TMP), 우리딘 모노포스페이트(UMP), 시티딘 모노포스페이트(CMP), 환형 아데노신 모노포스페이트(cAMP), 환형 구아노신 모노포스페이트(cGMP), 데옥시아데노신 모노포스페이트(dAMP), 데옥시구아노신 모노포스페이트(dGMP), 데옥시티미딘 모노포스페이트(dTMP), 데옥시우리딘 모노포스페이트(dUMP) 및 데옥시시티딘 모노포스페이트(dCMP)를 포함하지만, 이에 한정되지 않는다. 뉴클레오타이드는 바람직하게는 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP, dCMP 및 dUMP로부터 선택된다.
뉴클레오타이드는 무염기성일 수 있다(즉, 핵 염기가 결여됨).
폴리뉴클레오타이드 내의 뉴클레오타이드는 임의의 방식으로 서로 부착될 수 있다. 뉴클레오타이드는 전형적으로 핵산에서와 같이 당 및 포스페이트 기에 의해 부착된다. 뉴클레오타이드는 피리미딘 이량체에서와 같이 그것의 핵염기를 통해 연결될 수 있다.
폴리뉴클레오타이드는 단일 가닥 또는 이중 가닥일 수 있다. 폴리뉴클레오타이드의 적어도 일부는 바람직하게는 이중 가닥이다. 단일 가닥 폴리뉴클레오타이드는 거기에 혼성화된 하나 이상의 프라이머를 가질 수 있고, 따라서 이중 가닥 폴리뉴클레오타이드의 하나 이상의 짧은 영역을 포함할 수 있다. 프라이머는 표적 폴리뉴클레오타이드와 동일한 유형의 폴리뉴클레오타이드일 수 있거나, 상이한 유형의 폴리뉴클레오타이드일 수 있다.
폴리뉴클레오타이드는 핵산, 예컨대 데옥시리보핵산(DNA) 또는 리보핵산(RNA)이다. 표적 폴리뉴클레오타이드는 DNA의 하나의 가닥에 혼성화된 하나의 RNA 가닥을 포함할 수 있다. 폴리뉴클레오타이드는 당해 분야에 공지된 임의의 합성 핵산, 에컨대 펩타이드 핵산(PNA), 글리세롤 핵산(GNA), 트레오스 핵산(TNA), 고정 핵산(LNA) 또는 뉴클레오타이드 측쇄를 갖는 다른 합성 폴리머일 수 있다.
상기 표적 폴리뉴클레오타이드의 전체 또는 일부만이 이 방법을 사용하여 특징화될 수 있다. 표적 폴리뉴클레오타이드는 임의의 길이일 수 있다. 예를 들어, 폴리뉴클레오타이드는 길이가 적어도 10, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 400 또는 적어도 500개의 뉴클레오타이드 쌍일 수 있다. 폴리뉴클레오타이드는 1000개 이상의 뉴클레오타이드 쌍, 5000개 이상의 뉴클레오타이드 쌍 길이 또는 100,000개 이상의 뉴클레오타이드 쌍 길이일 수 있다.
표적 폴리뉴클레오타이드와 같은 표적 피분석물은 임의의 적합한 샘플내에 존재한다. 본 발명은 전형적으로 상기 표적 피분석물, 예컨대 표적 폴리뉴클레오타이드를 함유하거나 포함하는 것으로 알려진 샘플에서 수행된다. 대안적으로, 본 발명은 샘플에서 수행되어, 하나 이상의 표적 피분석물, 예컨대 샘플에서의 존재가 알려지거나 기대되는 하나 이상의 표적 폴리펩타이드의 동일성을 확인할 수 있다.
샘플은 생물학적 샘플일 수 있다. 본 발명은 임의의 유기체 또는 미생물로부터 수득되거나 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 유기체 또는 미생물은 전형적으로 시생누대계(archaean), 원핵 생물 또는 진핵 생물이며, 전형적으로 5개 계: 식물계, 동물계, 균계, 모네라계 및 원생생물계 중 하나에 속한다. 본 발명은 임의의 바이러스로부터 수득되거나 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 샘플은 바람직하게는 유체 샘플이다. 샘플은 전형적으로 환자의 체액을 포함한다. 샘플은 소변, 림프액, 타액, 점액 또는 양수이지만, 혈액, 혈장 또는 혈청이 바람직하다. 전형적으로, 샘플은 인간에서 기원한 것이지만, 대안적으로 말, 소, 양 또는 돼지와 같은 상업적으로 사육된 동물과 같은 다른 포유 동물로부터 기원할 수 있거나, 또는 고양이 또는 개와 같은 애완 동물일 수 있다. 대안적으로 식물 기원의 샘플은 전형적으로 상업 작물, 예컨대 곡물, 콩과 식물, 과일 또는 야채, 예를 들어 밀, 보리, 귀리, 카놀라, 옥수수, 대두, 쌀, 바나나, 사과, 토마토, 감자, 포도, 담배, 콩, 렌즈 콩, 사탕수수, 코코아, 면으로부터 수득된다.
샘플은 비-생물학적 샘플일 수 있다. 비-생물학적 샘플은 바람직하게는 유체 샘플이다. 비-생물학적 샘플의 예로는 외과적 유체, 물, 예컨대 음용수, 해수 또는 강물, 및 실험실 테스트용 시약이 포함된다.
샘플은 전형적으로, 예를 들어 원심 분리에 의해, 또는 적혈구와 같은 원하지 않는 분자 또는 세포를 걸러내는 막을 통과함으로써 분석되기 전에 가공된다. 샘플은 채취 즉시 측정될 수 있다. 샘플은 전형적으로 분석 이전에, 바람직하게는 -70℃ 이하로 저장될 수 있다.
포어는 전형적으로 막에 존재한다. 임의의 막이 본 발명에 따라 사용될 수 있다. 적합한 막은 당해 분야에 잘 알려져있다. 막은 바람직하게는 스핑고미엘린을 포함한다. 막은 바람직하게는 양친매성 층이다. 양친매성 층은 적어도 하나의 친수성 부분 및 적어도 하나의 친유성 또는 소수성 부분을 모두 갖는 인지질과 같은 양친매성 분자로 형성된 층이다. 양친매성 분자는 합성 또는 자연 발생될 수 있다. 단일층을 형성하는 비-자연 발생 양친매성체 및 양친매성 화합물은 당 분야에 공지되어 있고, 예를 들어 블록 코폴리머를 포함한다(Gonzalez-Perez 등, Langmuir, 2009, 25, 10447-10450). 블록 코폴리머는 단일 폴리머 사슬을 생성하기 위해 함께 중합되는 2종 이상의 모노머 하위단위가 있는 폴리머성 물질이다. 블록 코폴리머는 전형적으로 각 모노머 하위단위에 의해 기여되는 특성을 갖는다. 그러나, 블록 코폴리머는 개별 하위단위로부터 형성된 폴리머가 가지지 않는 특유의 특성을 가진다. 모노머 하위단위 중 하나가 소수성(즉, 친유성)이고, 다른 하위단위(들)이 수성 매질에서 친수성이 되도록 블록 코폴리머가 조작될 수 있다. 이 경우, 블록 코-폴리머는 양친매성 특성을 가질 수 있고, 생물학적 막을 모방하는 구조를 형성할 수 있다. 블록 코-폴리머는 디블록(2개의 모노머 하위단위로 이루어짐)일 수 있지만, 2개 이상의 모노머 하위단위로 구성되어 양친매성으로서 행동하는 보다 복잡한 배열을 형성할 수도 있다. 코폴리머는 트리블록, 테트라블록 또는 펜타블록 코폴리머일 수 있다.
양친매성 층은 단일층 또는 이중층일 수 있다. 양친매성 층은 전형적으로 평면 지질 이중층 또는 지지된 이중층이다.
양친매성 층은 전형적으로 지질 이중층이다. 지질 이중층은 세포막의 모델이며, 다양한 실험 연구를 위한 탁월한 플랫폼 역할을 한다. 예를 들어, 지질 이중층은 단일-채널 기록에 의한 막 단백질의 시험관내 연구에 사용될 수 있다. 대안적으로, 지질 이중층은 다양한 범위의 물질의 존재를 검출하는 바이오센서로 사용될 수 있다. 지질 이중층은 임의의 지질 이중층일 수 있다. 적합한 지질 이중층은 평면 지질 이중층, 지지된 이중층 또는 리포좀을 포함하지만, 이에 한정되지 않는다. 적합한 지질 이중층은 바람직하게는 평면 지질 이중층이다. 적합한 지질 이중층은 국제 출원 제 PCT/GB08/000563호(WO 2008/102121로 공개됨), 국제 출원 제 PCT/GB08/004127호(WO 2009/077734로 공개됨) 및 국제 출원 제 PCT/GB2006/001057호(WO 2006/100484로 공개됨)에 개시되어 있다.
지질 이중층을 형성하는 방법은 당해 분야에 공지되어 있다. 적합한 방법은 실시예에 개시되어 있다. 지질 이중층은 통상적으로 Montal과 Mueller의 방법에 의해 형성되며(Proc. Natl. Acad. Sci. USA., 1972; 69: 3561-3566), 지질 단일층은 수용액/공기 계면에서 그 계면에 수직인 개구 쪽을 지나 운반된다.
Montal & Mueller의 방법은 단백질 포어 삽입에 적합한 양질의 지질 이중층을 형성하는 비용-효율적이고 상대적으로 간단한 방법이기 때문에 대중적이다. 이중층 형성의 다른 일반적인 방법은 팁-침지, 이중층 페인팅 및 리포좀 이중층의 패치-클램핑을 포함한다.
바람직한 구현예에서, 지질 이중층은 국제 출원 제 PCT/GB08/004127호(WO 2009/077734로 공개됨)에 기재된 바와 같이 형성된다. 또 다른 바람직한 구현예에서, 막은 고체 상태의 층이다. 고체 상태의 층은 생물학적 기원이 아니다. 환언하면, 고체 상태 층은 생물학적 환경, 예컨대 생물체 또는 세포, 또는 생물학적으로 이용가능한 구조의 합성으로 제조된 버전으로부터 유래되거나 단리되지 않는다. 고체 상태 층은 마이크로전자 재료, 절연 물질, 예컨대 Si3N4, Al2O3 및 SiO, 유기 및 무기 폴리머, 예컨대 폴리아미드, 플라스틱, 예컨대 Teflon® 또는 엘라스토머, 예컨대 2-성분 첨가-경화 실리콘 고무 및 유리를 포함하지만, 이에 한정되지 않는다. 고체 상태 층은 단원자 층, 예컨대 그래핀, 또는 단지 수 원자 두께의 층으로 형성될 수 있다. 적합한 그래핀 층은 국제 출원 제 PCT/US2008/010637호(WO 2009/035647호로 공개됨)에 개시되어 있다.
상기 방법은 (i) 포어를 포함하는 인공 양친매성 층, (ii) 포어를 포함하는 단리된 자연-발생 지질 이중층, 또는 (iii) 내부에 포어가 삽입된 세포를 사용하여 수행된다. 본 방법은 전형적으로 인공 양친매성 층, 예컨대 인공 지질 이중층을 사용하여 수행된다. 상기 층은 포어 이외에 다른 막 및/또는 막 단백질뿐만 아니라 다른 분자를 포함할 수 있다. 적합한 장치 및 조건은 이하에 논의되어 있다. 본 발명의 방법은 전형적으로 시험관내에서 수행된다. 표적 폴리뉴클레오타이드와 같은 피분석물은 막에 커플링될 수 있다. 이는 임의의 공지된 방법을 사용하여 수행될 수 있다. (상기에서 상세히 논의된 바와 같이) 막이 지질 이중층과 같은 양친매성 층인 경우, 표적 폴리뉴클레오타이드와 같은 피분석물은 바람직하게는 막 내에 존재하는 폴리펩타이드 또는 막 내에 존재하는 소수성 앵커를 통해 막에 커플링된다. 소수성 앵커는 바람직하게는 지질, 지방산, 스테롤, 탄소 나노튜브 또는 아미노산이다.
표적 폴리뉴클레오타이드와 같은 피분석물은 막에 직접 커플링될 수 있다. 표적 폴리뉴클레오타이드와 같은 피분석물은 바람직하게는 링커를 통해 막에 커플링된다. 바람직한 링커는 폴리뉴클레오타이드, 폴리에틸렌 글리콜(PEG) 및 폴리펩타이드와 같은 폴리머를 포함하지만, 이에 한정되지는 않는다. 폴리뉴클레오타이드가 막에 직접 커플링되면, 막과 포어의 내부 사이의 거리로 인해 폴리뉴클레오타이드의 단부까지 특징화를 계속할 수 없으므로 일부 데이터가 손실될 것이다. 링커가 사용되는 경우, 폴리뉴클레오타이드는 가공이 완료될 수 있다. 링커가 사용되는 경우, 링커는 임의의 위치에서 폴리뉴클레오타이드에 부착될 수 있다. 링커는 테일(tail) 폴리머에서 폴리뉴클레오타이드에 부착되는 것이 바람직하다.
커플링은 안정적이거나 일시적일 수 있다. 특정 적용을 위해, 커플링의 일시적인 성질이 바람직하다. 안정적인 커플링 분자가 폴리뉴클레오타이드의 5' 또는 3' 말단 중 하나에 직접 부착되면, 이중층과 포어 내부 사이의 거리로 인해 특징화 작업이 폴리뉴클레오타이드의 단부로 이어지지 못하기 때문에 일부 데이터가 손실될 것이다. 커플링이 일시적이면, 커플링된 단부가 무작위로 이중층이 없어지면 폴리뉴클레오타이드가 가공되어 완료될 수 있다. 막과 안정적이거나 일시적인 연결을 형성하는 화학기에 대해서는 이하에서 더 상세히 논의된다. 표적 폴리뉴클레오타이드와 같은 피분석물은 콜레스테롤 또는 지방 아실 사슬을 사용하여 지질 이중층과 같은 양친매성 층에 일시적으로 커플링될 수 있다. 헥사데칸산(hexadecanoic acid)과 같은 6 내지 30개의 탄소 원자의 길이를 갖는 임의의 지방 아실 사슬이 사용될 수 있다.
바람직한 구현예에서, 표적 폴리뉴클레오타이드와 같은 피분석물은 양친매성 층에 커플링된다. 표적 폴리뉴클레오타이드와 같은 피분석물의 합성 지질 이중층에 대한 커플링은 다양한 상이한 테더링 전략으로 이전에 수행되었다. 이것들은 이하에 표 5에 요약되어 있다.
폴리뉴클레오타이드는 티올, 콜레스테롤, 지질 및 바이오틴 기와 같은 반응성 기의 첨가를 위해 쉽게 양립가능한 합성 반응에서 변형된 포스포르아미다이트를 사용하여 작용화될 수 있다. 이러한 상이한 부착 화학은 폴리뉴클레오타이드에 대한 부착 옵션을 제공한다. 각각의 상이한 변형 기는 폴리뉴클레오타이드를 약간 다른 방식으로 테더링하고 커플링은 항상 영구적인 것은 아니므로 폴리뉴클레오타이드에 대한 상이한 체류 시간을 이중층에 제공한다. 일시적 커플링의 이점은 상기에 논의되어 있다.
폴리뉴클레오타이드의 커플링은 또한 반응성 기가 폴리뉴클레오타이드에 첨가될 수 있는 수많은 다른 수단에 의해 달성될 수 있다. DNA의 양 말단에 반응성 기를 추가하는 것은 이전에 보고된 바 있다. 티올 기는 폴리뉴클레오타이드 키나제와 ATPγS를 사용하여 ssDNA의 5'에 첨가될 수 있다(Grant, G. P. and P. Z. Qin (2007). "핵산의 5' 말단에 니트록시드 스핀 라벨을 부착하는 쉬운 방법." Nucleic Acids Res 35(10): e77). 바이오틴, 티올 및 형광단과 같은 화학기의 보다 다양한 선택은 변형된 올리고뉴클레오타이드를 ssDNA의 3'에 통합하기 위해 말단 전달효소를 사용하여 첨가될 수 있다(Kumar, A., P. Tchen, 등 (1988). "말단 데옥시뉴클레오티딜 전이효소를 갖는 합성 올리고뉴클레오타이드 프로브의 비방사성 표지." Anal Biochem 169(2): 376-82).
대안적으로, 반응기는 이미 이중층에 커플링된 것에 상보적인 짧은 DNA 단편을 첨가하는 것으로 간주될 수 있으므로, 혼성화를 통해 부착이 달성될 수 있다. ssDNA의 단편의 결찰은 T4 RNA 리가제 I을 사용하여 보고되었다(Troutt, A. B., M. G. McHeyzer-Williams, 등 (1992). "Ligation-anchored PCR: 단일면 특이성을 갖는 간단한 증폭 기술." Proc Natl Acad Sci U S A 89(20): 9823-5). 대안적으로, ssDNA 또는 dsDNA 중 하나를 네이티브 dsDNA에 결찰되고, 그후 2개의 가닥을 열적 또는 화학적 변성으로 분리할 수 있었다. 네이티브 dsDNA에는 듀플렉스의 한쪽 단부 또는 2개의 모든 단부에 ssDNA를 추가할 수 있거나, 한쪽 단부 또는 2개의 모든 단부에 dsDNA를 추가할 수 있다. 그런 다음 듀플렉스가 용융될 때 5' 말단, 3' 말단 또는 둘 모두에서의 결찰 또는 변형에 ssDNA가 결찰에 사용되는 경우, 또는 dsDNA가 결찰에 사용되는 경우 각각의 단일 가닥은 5' 또는 3' 변형을 가질 것이다. 폴리뉴클레오타이드가 합성 가닥인 경우, 커플링 화학은 폴리뉴클레오타이드의 화학적 합성 동안 편입될 수 있다. 예를 들어, 폴리뉴클레오타이드는 그것에 반응성 기가 부착된 프라이머를 사용하여 합성될 수 있다.
게놈 DNA 섹션의 증폭을 위한 일반적인 기술은 폴리머라제 연쇄 반응(PCR)을 사용하는 것이다. 여기에서 2개의 합성 올리고뉴클레오타이드 프라이머를 사용하여 DNA의 동일한 부문의 수많은 복제본이 생성될 수 있으며, 각 복제본에 대해 듀플렉스의 각 가닥의 5'는 합성 폴리뉴클레오타이드일 것이다. 콜레스테롤, 티올, 바이오틴 또는 지질과 같은 반응성 기를 갖는 안티센스 프라이머를 사용함으로써, 증폭된 상기 표적 DNA의 각 복제본은 커플링을 위한 반응성 기를 함유할 것이다.
본 발명의 방법에 사용되는 포어는 본 발명의 포어(즉, 본 발명의 적어도 하나의 돌연변이체 모노머 또는 본 발명의 적어도 하나의 작제물을 포함하는 포어)이다. 포어는 상기 논의된 방법 중 임의의 방식으로 화학적으로 변형될 수 있다. 포어는 바람직하게는 상기 논의된 바와 같이 표적 피분석물과 상호작용할 수 있는 공유 어댑터로 변형된다.
이 방법은 바람직하게는 표적 폴리뉴클레오타이드를 특징화하기 위한 것이며, 단계 (a)는 표적 폴리뉴클레오타이드를 포어 및 폴리뉴클레오타이드 결합 단백질과 접촉시키는 것을 포함하며, 폴리뉴클레오타이드 결합 단백질이 포어를 통한 표적 폴리뉴클레오타이드의 이동을 조절한다. 폴리뉴클레오타이드 결합 단백질은 폴리뉴클레오타이드에 결합할 수 있고 포어를 통해 그것의 이동을 제어할 수 있는 임의의 단백질일 수 있다. 폴리뉴클레오타이드 결합 단백질이 폴리뉴클레오타이드에 결합하는지의 여부를 결정하는 것은 당해 분야에서 간단하다. 폴리뉴클레오타이드 결합 단백질은 전형적으로 폴리뉴클레오타이드의 적어도 하나의 특성과 상호작용하고, 이를 변형시킨다. 폴리뉴클레오타이드 결합 단백질은 폴리뉴클레오타이드를 절단하여 개별 뉴클레오타이드 또는 뉴클레오타이드의 단쇄, 예컨대 디- 또는 트리뉴클레오타이드를 형성함으로써 폴리뉴클레오타이드를 변형시킬 수 있다. 상기 모이어티는 폴리뉴클레오타이드를 배향시키거나 특정 위치로 이동시킴으로써, 즉 그것의 운동을 제어함으로써 폴리뉴클레오타이드를 변형시킬 수 있다.
폴리뉴클레오타이드 결합 단백질은 바람직하게는 폴리뉴클레오타이드 취급 효소이다. 폴리뉴클레오타이드 취급 효소는 폴리뉴클레오타이드의 적어도 하나의 특성과 상호작용하고 변형시킬 수 있는 폴리펩타이드이다. 효소는 폴리뉴클레오타이드를 절단하여 개별 뉴클레오타이드 또는 뉴클레오타이드의 단쇄, 예컨대 디- 또는 트리뉴클레오타이드를 형성함으로써 변형시킬 수 있다. 효소는 폴리뉴클레오타이드를 배향시키거나 특정 위치로 이동시킴으로써 폴리뉴클레오타이드를 변형시킬 수 있다. 폴리뉴클레오타이드 결합 단백질은 전형적으로 폴리뉴클레오타이드 결합 도메인 및 촉매 도메인을 포함한다. 폴리뉴클레오타이드 취급 효소는 표적 서열을 결합시킬 수 있고 포어를 통해 그것의 이동을 제어할 수 있는한 효소 활성을 나타내지 않아도 된다. 예를 들어, 효소는 그의 효소 활성을 제거하도록 변형될 수 있거나 효소로서 작용하지 못하는 조건 하에서 사용될 수 있다. 이러한 조건에 대해서는 아래에서 더 상세히 논의된다.
폴리뉴클레오타이드 취급 효소는 바람직하게는 핵산 분해 효소로부터 유도된다. 효소의 작제물에 사용되는 폴리뉴클레오타이드 취급 효소는 더욱 바람직하게는 효소 분류(EC) 그룹 3.1.11, 3.1.13, 3.1.14, 3.1.15, 3.1.16, 3.1.21, 3.1.22, 3.1.25, 3.1.26, 3.1.27, 3.1.30 및 3.1.31 중 어느 하나의 구성원으로부터 유도된다. 효소는 국제 출원 제 PCT/GB10/000133호(WO 2010/086603호로 공개됨)에 개시된 임의의 것일 수 있다.
바람직한 효소는 폴리머라제, 엑소뉴클레아제, 헬리카제 및 토포이소머라제, 예컨대 자이라제이다. 적합한 효소는 E. coli 유래의 엑소뉴클레아제 I(서열번호: 6), E. coli 유래의 엑소뉴클레아제 III 효소(서열번호: 8), T. 테모필러스의 RecJ(서열번호: 10) 및 박테리오파아지 람다 엑소뉴클레아제(서열번호: 12) 및 그의 변이체를 포함하지만, 이에 한정되지 않는다. 서열번호: 10에 나타낸 서열을 포함하는 3개의 하위단위 또는 이의 변이체가 상호작용하여 삼량체 엑소뉴클레아제를 형성한다. 효소는 Phi29 DNA 폴리머라제(서열번호: 4) 또는 그의 변이체일 수 있다. 효소는 헬리카제일 수 있거나, 또는 헬리카제로부터 유래될 수 있다. 전형적인 헬리카제는 Hel308, RecD 또는 XPD, 예를 들어 Hel308 Mbu(서열번호: 13) 또는 그의 변이체이다.
효소는 가장 바람직하게는 헬리카제, 예컨대 Hel308 헬리카제, RecD 헬리카제, 예컨대 TraI 헬리카제 또는 TrwC 헬리카제, XPD 헬리카제 또는 Dda 헬리카제로부터 유도된다. 헬리카제는 국제 출원 번호 PCT/GB2012/052579(WO 2013/057495로 공개됨); PCT/GB2012/053274(WO 2013/098562로 공개됨); PCT/GB2012/053273(WO2013098561로 공개됨); PCT/GB2013/051925(WO 2014/013260으로 공개됨); PCT/GB2013/051924(WO 2014/013259로 공개됨); PCT/GB2013/051928(WO 2014/013262로 공개됨) 및 PCT/GB2014/052736에 개시된 임의의 헬리카제, 변형된 헬리카제 또는 헬리카제 작제물일 수 있다.
헬리카제는 바람직하게는 서열번호: 18(Dda)로 나타낸 서열 또는 그의 변이체을 포함한다. 변이체는 막관통(transmembrane) 포어에 대해 이하에 논의된 방법 중 임의의 방법으로 천연 서열과 상이할 수 있다. 서열번호: 18의 바람직한 변이체는 (a) E94C 및 A360C 또는 (b) E94C, A360C, C109A 및 C136A 및 임의로(ΔM1) G1G2(즉, M1의 결실 및 이어서 G1 및 G2의 첨가)를 포함한다.
서열번호: 4, 6, 8, 10, 12, 13 또는 18의 변이체는 서열번호: 4, 6, 8, 10, 12, 13 또는 18의 아미노산 서열과 상이한 아미노산 서열을 갖는 효소이며, 폴리뉴클레오타이드 결합능력을 보유한다. 상기 변이체는 폴리뉴클레오타이드의 결합을 용이하게하고, 및/또는 고염 농도 및/또는 실온에서 그의 활성을 촉진시키는 변형을 포함할 수 있다.
서열번호: 4, 6, 8, 10, 12, 13 또는 18의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게는 아미노산 동일성에 기반하여 그 서열과 적어도 50% 상동성일 것이다. 더욱 바람직하게는, 변이체 폴리펩타이드는 전체 서열에 걸쳐 서열번호: 4, 6, 8, 10, 12, 13 또는 18의 아미노산 서열에 대한 아미노산 동일성을 기반으로 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 및 더 바람직하게는 적어도 95%, 97% 또는 99% 상동성일 수 있다. 200 또는 그 이상, 예를 들어 230, 250, 270 또는 280 이상의 인접 아미노산의 스트레치에 대해 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95%의 아미노산 동일성("경질 상동성")이 있을 수 있다. 상동성은 상기한 바와 같이 결정된다. 상기 변이체는 서열번호: 2와 관련하여 상기 논의된 방법 중 임의의 방법으로 야생형 서열과 상이할 수 있다. 효소는 상기에서 논의된 바와 같이 포어에 공유결합될 수 있다.
나노포어를 사용하여 폴리뉴클레오타이드를 서열분석하기 위한 2개의 주요 전략, 즉 가닥 서열분석과 엑소뉴클레아제 서열분석이 있다. 본 발명의 방법은 가닥 서열분석 또는 엑소뉴클레아제 서열분석과 관련될 수 있다.
가닥 서열분석에서, DNA는 적용된 전위와 함께 또는 반대로 나노포어를 통해 전위된다. 점진적으로 또는 순차적으로 이중가닥 DNA에서 작용하는 엑소뉴클레아제는 인가된 전위하에 걸쳐 포어의 시스 측 상에 사용하여 잔존 단일 가닥을 공급하거나, 역 전위하에 트랜스 측 상에 사용하여 공급할 수 있다. 마찬가지로, 이중 가닥 DNA를 풀어주는 헬리카제도 비슷한 방식으로 사용될 수 있다. 폴리머라제도 사용될 수 있다. 적용된 전위에 대해 가닥 전좌가 필요한 서열분석 적용 분야에도 가능성이 있지만, DNA는 역전되거나 전위가 없는 효소에 의해 먼저 "포착"되어야 한다. 이후에 바인딩이 바뀌면 전위가 바뀌어 가닥이 포어를 통과하여 시스에서 트랜스로 통과하고 전류 흐름에 의해 확장된 형태로 유지된다. 단일 가닥 DNA 엑소뉴클레아제 또는 단일 가닥 DNA 의존성 폴리머라제는 최근 전위된 단일 가닥을 포어를 통해 제어된 단계적인 방식, 트랜스에서 시스 방식으로 끌어 당기는 분자 모터로서 작용할 수 있다.
일 구현예에서, 표적 폴리뉴클레오타이드를 특징화하는 방법은 표적 서열을 포어 및 헬리카제 효소와 접촉시키는 단계를 포함한다. 임의의 헬리카제가 상기 방법에서 사용될 수 있다. 헬리카제는 포어와 관련하여 두 가지 방식으로 작동할 수 있다. 첫째, 본 방법은 바람직하게는 헬리카제를 사용하여, 인가된 전압에 기인한 필드(field)로 포어를 통한 표적 서열의 이동을 제어한다. 이 방식에서 DNA의 5' 말단은 먼저 포어에 포획되고, 효소는 DNA가 포어 안으로 들어가도록 이동을 조절하여 표적 서열이 마지막으로 이중층의 트랜스 측으로 전위될 때까지 필드가 있는 포어를 통과하게 한다. 대안적으로, 본 방법은 바람직하게는 헬리카제 효소가 인가된 전압에 기인한 필드에 대한 포어를 통한 표적 서열의 이동을 제어하도록 수행된다. 이 방식에서 DNA의 3' 말단은 먼저 포어에 포획되고, 효소는 포어를 통해 DNA의 이동을 제어하여 최종적으로 이중층의 시스 측으로 다시 배출될 때까지 인가된 영역에 대해 표적서열이 포어로부터 뽑아 낸다.
엑소뉴클레아제 서열분석에서, 엑소뉴클레아제는 표적 폴리뉴클레오타이드의한 단부로부터 이들 개별 뉴클레오타이드를 방출하고, 이들 개별 뉴클레오타이드는 하기 논의되는 바와 같이 동정된다. 또 다른 구현예에서, 표적 폴리뉴클레오타이드를 특징화하는 방법은 표적 서열을 포어 및 엑소뉴클레아제 효소와 접촉시키는 단계를 포함한다. 상기 논의된 임의의 엑소뉴클레아제 효소가 이 방법에 사용될 수 있다. 상기 효소는 상기에서 논의된 바와 같이 포어에 공유결합될 수 있다.
엑소뉴클레아제는 전형적으로 폴리뉴클레오타이드의 한쪽 말단에 걸리고 그 말단에서 한 번에 하나의 뉴클레오타이드를 서열을 소화하는 효소이다. 엑소뉴클레아제는 5'에서 3' 방향 또는 3'에서 5' 방향으로 폴리뉴클레오타이드를 분해할 수 있다. 엑소뉴클레아제가 결합하는 폴리뉴클레오타이드의 말단은 전형적으로 사용된 효소의 선택 및/또는 당해 분야에 공지된 방법을 사용하여 결정된다. 폴리뉴클레오타이드의 양 말단의 하이드록실기 또는 캡 구조는 전형적으로 폴리뉴클레오타이드의 특정 말단에 대한 엑소뉴클레아제의 결합을 방지하거나 용이하게 하는데 사용될 수 있다.
상기 방법은 폴리뉴클레오타이드를 엑소뉴클레아제와 접촉시켜, 뉴클레오타이드가 상기 논의된 바와 같이 뉴클레오타이드의 비율의 특징화 또는 동정을 가능하게 하는 속도로 폴리뉴클레오타이드의 말단으로부터 소화되도록 하는 단계를 포함한다. 이를 행하는 방법은 당해 분야에 잘 알려져있다. 예를 들어, Edman 분해는 고성능 액체 크로마토그래피(HPLC)를 사용하여 확인될 수 있도록 폴리펩타이드 말단으로부터 단일 아미노산을 연속으로 소화시키는데 사용된다. 상동성 방법이 본 발명에서 사용될 수 있다.
엑소뉴클레아제가 기능하는 속도는 전형적으로 야생형 엑소뉴클레아제의 최적 속도보다 느리다. 본 발명의 방법에서 엑소뉴클레아제 활성의 적합한 속도는 0.5 내지 1000 뉴클레오타이드/초, 0.6 내지 500 뉴클레오타이드/초, 0.7 내지 200 뉴클레오타이드/초, 0.8 내지 100 뉴클레오타이드/초, 0.9 내지 50 뉴클레오타이드/초 또는 초당 1 내지 20 또는 10 뉴클레오타이드/초를 포함한다. 속도는 바람직하게는 1, 10, 100, 500 또는 1000 뉴클레오타이드/초이다. 엑소뉴클레아제 활성의 적합한 속도는 다양한 방법으로 달성될 수 있다. 예를 들어, 감소된 최적 활성 속도를 갖는 변이체 엑소뉴클레아제가 본 발명에 따라 사용될 수 있다.
본 발명의 방법은 표적 폴리뉴클레오타이드와 같은 표적 피분석물의 하나 이상의 특징을 측정하는 단계를 포함한다. 상기 방법은 표적 폴리뉴클레오타이드와 같은 표적 피분석물의 2, 3, 4 또는 5 이상의 특성을 측정하는 단계를 포함할 수 있다. 표적 폴리뉴클레오타이드의 경우, 하나 이상의 특징은 (i) 표적 폴리뉴클레오타이드의 길이, (ii) 표적 폴리뉴클레오타이드의 동일성, (iii) 표적 폴리뉴클레오타이드의 서열, (iv) 상기 표적 폴리뉴클레오타이드의 2차 구조 및 (v) 표적 폴리뉴클레오타이드가 변형되었는지 여부로부터 바람직하게 선택된다. (i) 내지 (v)의 임의의 조합이 본 발명에 따라 측정될 수 있다.
(i)에 있어서, 폴리뉴클레오타이드의 길이는 표적 폴리뉴클레오타이드와 포어 사이의 상호작용 수를 이용하여 측정될 수 있다.
(ii)에 있어서, 폴리뉴클레오타이드의 동일성은 여러 가지 방법으로 측정될 수 있다. 폴리뉴클레오타이드의 동일성은 표적 폴리뉴클레오타이드의 서열의 측정과 함께 또는 표적 폴리뉴클레오타이드의 서열 측정없이 측정될 수 있다. 전자는 간단하며; 폴리뉴클레오타이드는 서열분석되고 이에 의해 동정된다. 후자는 여러 가지 방법으로 수행될 수 있다. 예를 들어, 폴리뉴클레오타이드 내의 특정 모티프의 존재가 측정될 수 있다(폴리뉴클레오타이드의 잔존 서열 측정없이). 대안적으로, 상기 방법에서의 특정 전기적 및/또는 광학적 신호의 측정은 표적 폴리뉴클레오타이드를 특정 공급원으로부터 유래한 것으로 식별할 수 있다.
(iii)에 있어서, 폴리뉴클레오타이드의 서열은 이전에 기재된 바와 같이 결정될 수 있다. 적합한 서열분석 방법, 특히 전기적 측정을 이용하는 방법은 Stoddart D 등, Proc Natl Acad Sci, 12;106(19):7702-7, Lieberman KR et al, J Am Chem Soc. 2010;132(50):17961-72 및 국제 출원 WO 2000/28312에 기재되어 있다.
(iv)에 있어서, 2차 구조는 다양한 방식으로 측정될 수 있다. 예를 들어, 상기 방법이 전기적 측정을 포함하는 경우, 2차 구조는 체류 시간의 변화 또는 포어를 통해 흐르는 전류의 변화를 사용하여 측정될 수 있다. 이것은 단일 가닥 및 이중-가닥 폴리뉴클레오타이드의 영역이 구별되게 한다.
(v)에 있어서, 임의의 변형의 존재 또는 부재가 측정될 수 있다. 상기 방법은 바람직하게는 표적 폴리뉴클레오타이드가 메틸화, 산화, 손상, 하나 이상의 단백질 또는 하나 이상의 라벨, 태그 또는 스페이서에 의해 변형되는지 여부를 결정하는 단계를 포함한다. 특정 변형은 이하에 기재된 방법을 사용하여 측정될 수 있는 포어와의 특정 상호작용을 초래할 것이다. 예를 들어, 메틸시토신은 각각의 뉴클레오타이드와의 상호작용동안 포어를 통해 흐르는 전류에 기초하여 시토신과 구별될 수 있다.
본 발명은 또한 표적 폴리뉴클레오타이드의 서열을 평가하는 방법을 제공한다. 본 발명은 또한 표적 폴리뉴클레오타이드의 서열분석 방법을 제공한다.
다양한 상이한 유형의 측정이 이루어질 수 있다. 여기에는 전기 측정 및 광학 측정이 포함되지만, 이에 한정되지 않는다. 전기 측정으로는 전류 측정, 임피던스 측정, 터널링 측정(Ivanov AP 등, Nano Lett. 2011 Jan 12;11(1):279-85) 및 FET 측정(국제 출원 WO 2005/124888)이 포함된다. 형광 측정을 포함하는 적합한 광학 방법은 J. Am. Chem. Soc. 2009, 131 1652-1653에 개시되어 있다. 광학 측정은 전기 측정과 조합될 수 있다(Soni GV 등, Rev Sci Instrum. 2010 Jan;81(1):014301). 측정은 포어를 통해 흐르는 이온 전류의 측정과 같은 막관통 전류 측정일 수 있다.
전기 측정은 Stoddart D 등, Proc Natl Acad Sci, 12;106(19):7702-7, Lieberman KR et al, J Am Chem Soc. 2010;132(50):17961-72 및 국제 출원 WO-2000/28312에 기재된 바와 같이, 표준 단일 채널 레코딩을 사용하여 수행할 수 있다. 대안적으로, 전기적 측정은 다중-채널 시스템, 예를 들어 국제 출원 WO-2009/077734 및 국제 출원 WO-2011/067559에 기술되어 있다.
바람직한 구현예에서, 상기 방법은:
(a) 표적 폴리뉴클레오타이드가 포어를 통해 이동하고 결합 단백질이 포어를 통해 표적 폴리뉴클레오타이드의 이동을 제어하도록 표적 폴리뉴클레오타이드를 본 발명의 포어 및 폴리뉴클레오타이드 결합 단백질과 접촉시키는 단계; 및
(b) 상기 폴리뉴클레오타이드가 상기 포어에 대해 이동함에 따라 상기 포어를 통과하는 전류를 측정하는 단계로서, 상기 전류는 상기 표적 폴리뉴클레오타이드의 하나 이상의 특징을 나타내며, 그렇게 함으로써 상기 표적 폴리뉴클레오타이드를 특징화하는 단계를 포함한다.
상기 방법은 포어가 막 내로 삽입되는 막/포어 시스템을 조사하기에 적합한 임의의 장치를 사용하여 수행될 수 있다. 상기 방법은 막관통 포어 감지에 적합한 임의의 장치를 사용하여 수행될 수 있다. 예를 들어, 상기 장치는 수용액을 포함하는 챔버 및 상기 챔버를 2개의 섹션으로 분리하는 장벽을 포함한다. 장벽은 포어를 포함하는 막이 형성되는 소구멍을 갖는다.
본 방법은 국제 출원 제 PCT/GB08/000562(WO 2008/102120)에 기재된 장치를 사용하여 수행될 수 있다.
본 방법은 표적 폴리뉴클레오타이드와 같은 피분석물이 포어에 대해 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 따라서, 상기 장치는 또한 전위를 인가하고 상기 막 및 포어를 가로 질러 전기 신호를 측정할 수 있는 전기 회로를 포함할 수 있다. 본 방법은 패치 클램프 또는 전압 클램프를 사용하여 수행될 수 있다. 상기 방법은 바람직하게 전압 클램프의 용도를 포함한다.
본 발명의 방법은 표적 폴리뉴클레오타이드와 같은 피분석물이 포어에 대해 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 막관통 단백질 포어를 통한 이온 전류를 측정하기 위한 적당한 조건은 당해 분야에 공지되어 있으며, 실시예에 개시되어 있다. 이 방법은 전형적으로 막 및 포어를 가로 질러 인가된 전압으로 수행된다. 사용되는 전압은 전형적으로 +2V 내지 -2V, 전형적으로 -400mV 내지 +400mV이다. 사용되는 전압은 바람직하게는 -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20mV 및 0 mV에서 선택되는 하한, 및 +10 mV, + 20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV 및 +400 mV에서 선택되는 상한을 갖는 범위이다. 사용되는 전압은 더 바람직하게는 100mV 내지 240mV의 범위이고, 가장 바람직하게는 120mV 내지 220mV의 범위이다. 증가된 인가된 전위를 사용함으로써 포어에 의한 상이한 뉴클레오타이드 사이의 식별을 증가시키는 것이 가능하다.
상기 방법은 전형적으로 임의의 전하 캐리어, 예컨대 금속 염, 예를 들어 알칼리 금속 염, 할라이드 염, 예를 들어 염화물 염, 예컨대 알칼리 금속 염화물 염의 존재 하에서 수행된다. 전하 캐리어는 이온성 액체 또는 유기 염, 예를 들어 테트라메틸암모늄 염화물, 트리메틸페닐 암모늄 염화물, 페닐트리메틸암모늄 염화물 또는 1-에틸-3-메틸 이미다졸륨 염화물을 포함할 수 있다. 상기 논의된 예시적인 장치에서, 염은 챔버 내의 수용액에 존재한다. 염화칼륨(KCl), 염화나트륨(NaCl) 또는 염화 세슘(CsCl)이 전형적으로 사용된다. KCl이 바람직하다. 염 농도는 포화 상태일 수 있다. 염 농도는 3M 이하일 수 있고, 전형적으로 0.1 내지 2.5M, 0.3 내지 1.9M, 0.5 내지 1.8M, 0.7 내지 1.7M, 0.9 내지 1.6M 또는 1M 내지 1.4M이다. 염 농도는 바람직하게는 150 mM 내지 1 M이다. 상기 방법은 바람직하게는 적어도 0.3 M, 예컨대 적어도 0.4 M, 적어도 0.5 M, 적어도 0.6 M, 적어도 0.8, 적어도 1.0 M, 적어도 1.5 M, 적어도 2.0 M, 적어도 2.5 M 또는 적어도 3.0 M의 염 농도를 사용하여 수행된다. 높은 염 농도는 높은 신호대 잡음비를 제공하고, 정상적인 전류 변동의 배경에 대해 확인되는 뉴클레오타이드의 존재를 나타내는 전류를 허용한다.
본 방법은 전형적으로 완충액의 존재하에 수행된다. 상기 논의된 예시적인 장치에서, 완충액은 챔버 내의 수용액에 존재한다. 임의의 완충제가 본 발명의 방법에 사용될 수 있다. 전형적으로 완충액은 HEPES이다. 또 다른 적합한 완충액은 Tris-HCl 완충액이다. 상기 방법은 전형적으로 4.0 내지 12.0, 4.5 내지 10.0, 5.0 내지 9.0, 5.5 내지 8.8, 6.0 내지 8.7 또는 7.0 내지 8.8 또는 7.5 내지 8.5의 pH에서 수행된다. 사용된 pH는 바람직하게는 약 7.5이다.
본 방법은 0℃ 내지 100℃, 15℃ 내지 95℃, 16℃ 내지 90℃, 17℃ 내지 85℃, 18℃ 내지 80℃, 19℃ 내지 70℃ 또는 20℃ 내지 60℃에서 수행될 수 있다. 상기 방법은 전형적으로 실온에서 수행된다. 상기 방법은 약 37℃와 같은 효소 기능을 지지하는 온도에서 선택적으로 수행된다.
본 방법은 전형적으로 폴리뉴클레오타이드 결합 단백질, 예컨대 헬리카제 또는 엑소뉴클레아제의 작용을 용이하게 하는 유리 뉴클레오타이드 또는 유리 뉴클레오타이드 유사체 및 효소 보조인자의 존재 하에서 수행된다. 유리 뉴클레오타이드는 상기 논의된 임의의 개별 뉴클레오타이드 중 하나 이상일 수 있다. 유리 뉴클레오타이드는 아데노신 모노포스페이트(AMP), 아데노신 디포스페이트(ADP), 아데노신 트리포스페이트(ATP), 구아노신 모노포스페이트(GMP), 구아노신 디포스페이트(GDP), 구아노신 트리포스페이트(GTP), 티미딘 모노포스페이트(TMP), 티미딘 디포스페이트(TDP), 티미딘 트리포스페이트(TTP), 우리딘 모노포스페이트(UMP), 우리딘 디포스페이트(UDP), 우리딘 트리포스페이트(UTP), 시티딘 모노포스페이트(CMP), 시티딘 디포스페이트(CDP), 시티딘 트리포스페이트(CTP), 환형 아데노신 모노포스페이트(cAMP), 환형 구아노신 모노포스페이트(cGMP), 데옥시아데노신 모노포스페이트(dAMP), 데옥시아데노신 디포스페이트(dADP), 데옥시아데노신 트리포스페이트(dATP), 데옥시구아노신 모노포스페이트(dGMP), 데옥시구아노신 디포스페이트(dGDP), 데옥시구아노신 트리포스페이트(dGTP), 데옥시티미딘 모노포스페이트(dTMP), 데옥시티미딘 디포스페이트(dTDP), 데옥시티미딘 트리포스페이트(dTTP), 데옥시우리딘 모노포스페이트(dUMP), 데옥시우리딘 디포스페이트(dUDP), 데옥시우리딘 트리포스페이트(dUTP), 데옥시시티딘 모노포스페이트(dCMP), 데옥시시티딘 디포스페이트(dCDP) 및 데옥시시티딘 트리포스페이트(dCTP)를 포함하지만, 이에 한정되지 않는다. 유리 뉴클레오타이드는 바람직하게는 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다. 유리 뉴클레오타이드는 바람직하게는 아데노신 트리포스페이트(ATP)이다. 효소 보조인자는 헬리카제를 기능시키는 요소이다. 효소 보조인자는 바람직하게는 2가의 금속 양이온이다. 2가 금속 양이온은 바람직하게는 Mg2+, Mn2+, Ca2+ 또는 Co2+이다. 효소 보조인자는 가장 바람직하게는 Mg2+이다.
표적 폴리뉴클레오타이드는 포어 및 폴리뉴클레오타이드 결합 단백질과 임의의 순서로 접촉될 수 있다. 바람직하게는, 표적 폴리뉴클레오타이드가 폴리뉴클레오타이드 결합 단백질 및 포어와 접촉할 때, 표적 폴리뉴클레오타이드는 먼저 폴리뉴클레오타이드 결합 단백질과 복합체를 형성한다. 전압이 포어를 가로 질러 인가되면, 표적 폴리뉴클레오타이드/단백질 복합체는 포어와 복합체를 형성하고 포어를 통한 폴리뉴클레오타이드의 이동을 제어한다.
개별 뉴클레오타이드를 확인하는 방법
본 발명은 또한 개별 뉴클레오타이드를 특징화하는 방법을 제공한다. 환언하면, 표적 피분석물은 개별 뉴클레오타이드이다. 상기 방법은 뉴클레오타이드가 포어와 상호작용하도록 뉴클레오타이드를 본 발명의 포어와 접촉시키는 단계 및 상호작용 동안 포어를 통과하는 전류를 측정함으로써 뉴클레오타이드를 특징화하는 단계를 포함한다. 따라서, 본 발명은 개별 뉴클레오타이드의 나노포어 감지를 포함한다. 본 발명은 또한 상호작용 동안 포어를 통과하는 전류를 측정하여 뉴클레오타이드의 동일성을 결정하는 단계를 포함하는 개별 뉴클레오타이드를 동정하는 방법을 제공한다. 상기 논의된 본 발명의 포어 중 임의의 포어를 사용할 수 있다. 포어는 바람직하게는 상기 논의된 바와 같은 분자 어댑터로 화학적으로 변형된다.
뉴클레오타이드는 뉴클레오타이드에 특이적인 방식으로(즉, 뉴클레오타이드와 관련된 특유의 전류가 포어를 통해 흐르는 것으로 검출된 경우) 포어를 통해 전류가 흐를 경우 존재한다. 뉴클레오타이드에 대한 특정 방식으로 포어를 통해 전류가 흐르지 않으면 뉴클레오타이드는 존재하지 않는다.
본 발명은 포어를 통과하는 전류에 대해 이들이 갖는 상이한 효과에 기초하여 유사한 구조의 뉴클레오타이드를 구별하는 데 사용될 수 있다. 개별 뉴클레오타이드는 포어와 상호작용할 때 그의 전류 진폭으로부터 단일 분자 수준에서 확인될 수 있다. 본 발명은 또한 특정 뉴클레오타이드가 샘플 내에 존재하는지의 여부를 결정하는데 사용될 수 있다. 본 발명은 또한 샘플 중의 특정 뉴클레오타이드의 농도를 측정하는데 사용될 수 있다.
포어는 전형적으로 막에 존재한다. 본 방법은 상기 기재된 임의의 적합한 막/포어 시스템을 사용하여 수행될 수 있다.
개별 뉴클레오타이드는 단일 뉴클레오타이드이다. 개별 뉴클레오타이드는 뉴클레오타이드 결합에 의해 또 다른 뉴클레오타이드 또는 폴리뉴클레오타이드에 결합되지 않는 뉴클레오타이드이다. 뉴클레오타이드 결합은 또 다른 뉴클레오타이드의 당 그룹에 결합된 뉴클레오타이드의 포스페이트 기 중 하나를 포함한다. 개별 뉴클레오타이드는 전형적으로 적어도 5, 적어도 10, 적어도 20, 적어도 50, 적어도 100, 적어도 200, 적어도 500, 적어도 1000 또는 적어도 5000개의 뉴클레오타이드의 또 다른 폴리뉴클레오타이드와의 뉴클레오타이드 결합에 의해 결합되지 않는 것이다. 예를 들어, 개별 뉴클레오타이드는 DNA 또는 RNA 가닥과 같은 표적 폴리뉴클레오타이드 서열로부터 소화되었다. 본 발명의 방법은 임의의 뉴클레오타이드를 동정하는데 사용될 수 있다. 뉴클레오타이드는 상기 논의된 임의의 것일 수 있다.
뉴클레오타이드는 리보핵산(RNA) 또는 데옥시리보핵산(DNA)과 같은 핵산 서열의 소화로부터 유래될 수 있다. 핵산 서열은 당해 분야에 공지된 임의의 방법을 사용하여 소화될 수 있다. 적합한 방법은 효소 또는 촉매를 사용하는 방법을 포함 하지만, 이에 한정되지는 않는다. 핵산의 촉매적 소화는 Deck 등, Inorg. Chem., 2002; 41: 669-677에 개시되어 있다.
단일 폴리뉴클레오타이드로부터의 개별 뉴클레오타이드는 폴리뉴클레오타이드의 전체 또는 일부를 서열분석하기 위해 순차적인 방식으로 포어와 접촉될 수 있다. 서열분석 폴리뉴클레오타이드는 상기에서 더 상세히 논의된다.
뉴클레오타이드는 막의 양측의 포어와 접촉될 수 있다. 뉴클레오타이드는 막의 양측의 포어로 도입될 수 있다. 뉴클레오타이드는 막의 측면과 접촉하여 뉴클레오타이드가 포어를 통해 막의 다른 측면으로 통과하게 할 수 있다. 예를 들어, 뉴클레오타이드는 포어의 단부와 접촉하며, 이는 네이티브 환경에서 뉴클레오타이드가 포어를 통과할 수 있도록 뉴클레오타이드와 같은 이온 또는 소분자가 포어의 배럴 또는 채널로 들어가게 한다. 그와 같은 경우, 뉴클레오타이드는 포어의 배럴 또는 채널을 통해 막을 통과할 때 포어 및/또는 어댑터와 상호작용한다. 대안적으로, 뉴클레오타이드가 막의 측면과 접촉하여, 뉴클레오타이드가 어댑터를 통해 또는 어댑터와 함께 포어와 상호작용할 수 있게 하고, 포어로부터 해리하여 막의 같은 측면 상에 남아있게 할 수 있다. 본 발명은 어댑터의 위치가 고정된 포어를 제공한다. 그 결과, 뉴클레오타이드는 바람직하게는 어댑터가 뉴클레오타이드와 상호작용할 수 있게 하는 포어의 단부와 접촉된다.
뉴클레오타이드는 임의의 방식으로 및 임의의 부위에서 포어와 상호작용할 수 있다. 상기 논의된 바와 같이, 뉴클레오타이드는 바람직하게는 어댑터를 통해 또는 어댑터와 함께 포어에 가역적으로 결합한다. 뉴클레오타이드는 가장 바람직하게는 막을 가로 질러 포어를 통과할 때 어댑터를 통해 또는 어댑터와 함께 가역적으로 포어에 결합한다. 뉴클레오타이드는 또한 막을 통해 포어를 통과할 때 어댑터를 통해 또는 어댑터와 함께 포어의 배럴 또는 채널에 가역적으로 결합할 수 있다.
뉴클레오타이드와 포어 사이의 상호작용 동안, 뉴클레오타이드는 그 뉴클레오타이드에 특이적인 방식으로 포어를 통해 흐르는 전류에 영향을 미친다. 예를 들어, 특정 뉴클레오타이드는 특정한 평균 기간 및 특정 정도로 포어를 통해 흐르는 전류를 감소시킬 것이다. 환언하면, 포어를 통해 흐르는 전류는 특정 뉴클레오타이드에 대해 특유적이다. 특정 뉴클레오타이드가 포어를 통해 흐르는 전류에 미치는 효과를 측정하기 위해 대조군 실험이 수행될 수 있다. 시험 샘플에서 본 발명의 방법을 수행한 결과는 샘플 내의 특정 뉴클레오타이드를 확인하거나 특정 뉴클레오타이드가 샘플에 존재하는지 여부를 결정하기 위해 이와 같은 대조군 실험으로부터 유래된 결과와 비교될 수 있다. 포어를 통해 흐르는 전류가 특정 뉴클레오타이드를 나타내는 방식으로 영향을 받는 빈도를 사용하여 샘플 내의 뉴클레오타이드 농도를 결정할 수 있다. 샘플 내의 상이한 뉴클레오타이드의 비율도 계산될 수 있다. 예를 들어, dCMP 대 메틸-dCMP의 비가 계산될 수 있다.
상기 방법은 상기 논의된 임의의 장치, 샘플 또는 조건의 사용을 포함할 수 있다.
센서를 형성하는 방법
본 발명은 또한 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 형성하는 방법을 제공한다. 상기 방법은 본 발명의 포어와 헬리카제 또는 엑소뉴클레아제와 같은 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성하는 단계를 포함한다. 복합체는 표적 폴리뉴클레오타이드의 존재하에 포어와 단백질을 접촉시킨 다음 포어를 가로 질러 전위를 가함으로써 형성될 수 있다. 인가된 전위는 상술한 바와 같이 화학 포텐셜 또는 전압 포텐셜일 수 있다. 대안적으로, 복합체는 포어를 단백질에 공유결합시킴으로써 형성될 수 있다. 공유결합을 위한 방법은 당해 분야에 공지되어 있으며, 예를 들어 국제 출원 번호 PCT/GB09/001679(WO 2010/004265로 공개됨) 및 PCT/GB10/000133(WO 2010/086603으로 공개됨)에 개시되어 있다. 복합체는 표적 폴리뉴클레오타이드를 특징화하기 위한 센서이다. 상기 방법은 바람직하게는 본 발명의 포어와 헬리카제 사이에 복합체를 형성하는 단계를 포함한다. 상기 논의된 구현예들 중 임의의 것이 본 방법에 동일하게 적용된다.
본 발명은 또한 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 제공한다. 센서는 본 발명의 포어와 폴리뉴클레오타이드 결합 단백질 사이의 복합체를 포함한다. 상기 논의된 구현예들 중 어느 것도 본 발명의 센서에 동일하게 적용된다.
키트
본 발명은 또한 표적 폴리뉴클레오타이드를 특징화, 예컨대 서열분석하기 위한 키트를 제공한다. 키트는 (a) 본 발명의 포어 및 (b) 막을 포함한다. 키트는 바람직하게는 헬리카제 또는 엑소뉴클레아제와 같은 폴리뉴클레오타이드 결합 단백질을 추가로 포함한다. 상기 논의된 구현예 중 임의의 것이 본 발명의 키트에 동등하게 적용 가능하다.
본 발명의 키트는 상기 언급된 임의의 구현예가 수행될 수 있게 하는 하나 이상의 다른 시약 또는 기구를 추가로 포함할 수 있다. 이러한 시약 또는 기기는 하기 중 하나 이상을 포함한다: 적합한 완충액(수용액), 대상체(예컨대, 혈관 또는 바늘을 포함하는 기구)로부터 샘플을 얻는 수단, 폴리뉴클레오타이드 서열을 증폭 및/또는 발현하는 수단, 상기 정의된 막 또는 전압 또는 패치 클램프 장치. 시약이 건조한 상태의 키트에 존재할 수 있으므로 유체 샘플이 시약을 재현탁시킨다. 키트는 또한 선택적으로, 키트가 본 발명의 방법에서 사용될 수 있게 하는 지침, 또는 방법이 사용될 수 있는 환자에 관한 세부 사항을 포함할 수 있다. 키트는 선택적으로 뉴클레오타이드를 포함할 수 있다.
장치
본 발명은 또한 샘플내 표적 폴리뉴클레오타이드를 특징화, 예컨대 샘플화하는 장치를 제공한다. 상기 장치는 (a) 본 발명의 복수의 포어 및 (b) 헬리카제 또는 엑소뉴클레아제와 같은 복수의 폴리뉴클레오타이드 결합 단백질을 포함할 수 있다. 상기 장치는 어레이 또는 칩과 같은 피분석물 분석을 위한 임의의 종래 장치일 수 있다.
어레이 또는 칩은 전형적으로 단일 나노포어가 삽입된 블록 코-폴리머 막과 같은 막의 복수의 웰들을 함유한다. 상기 어레이는 전자 칩 내에 통합될 수 있다.
상기 장치는 바람직하게는 하기를 포함한다:
상기 복수의 포어를 지지할 수 있고 상기 포어 및 단백질을 사용하여 폴리뉴클레오타이드 특징화 또는 서열분석을 수행할 수 있는 센서 디바이스;
- 특징화 또는 서열 분석을 수행하기 위한 물질을 보관하기 위한 적어도 하나의 저장소;
- 상기 적어도 하나의 저장소로부터 상기 센서 디바이스로 물질을 제어가능하게 공급하도록 구성된 유체공학 시스템(fluidics system); 및
- 각각의 샘플을 수용하기 위한 복수의 콘테이너로서, 상기 유체공학 시스템은 상기 컨테이너로부터 상기 센서 디바이스로 상기 샘플을 선택적으로 공급하도록 구성된 콘테이너.
상기 장치는 국제 출원 PCT/GB10/000789(WO 2010/122293로 공개됨), 국제 출원 PCT/GB10/002206(WO 2011/067559로 공개됨) 또는 국제 출원 PCT/US99/25679(WO 00/28312로 공개됨).
하기 실시예는 본 발명을 설명한다.
실시예 1
본 실시예는 복수의 상이한 돌연변이체 라이세닌 나노포어를 통해 DNA의 운동을 제어하기 위해 헬리카제 - T4 Dda - E94C/C109A/C136A/A360C(돌연변이 E94C/C109A/C136A/A360C를 갖는 서열번호: 18)이 어떻게 사용되었는지를 설명한다. 테스트한 모든 나노포어는 DNA가 나노포어를 통해 전위됨에 따라 전류의 변화를 나타냈다. 테스트한 돌연변이체 나노 포어는 1) 증가된 범위, 2) 잡음 감소, 3) 개선된 신호:잡음, 4) 돌연변이 대조군 나노포어와 비교될때 증가된 포획, 또는 5) 기준선과 비교될때 판독 헤드의 변경된 크기를 나타냈다.
재료 및 방법
DNa 작제물 준비
ㆍ 70 uL의 T4 Dda - E94C/C109A/C136A/A360C를 2 mM EDTA가 포함된 70 uL 1x KOAc 완충액으로 완충액 교환(Zeba 컬럼 사용)했다.
ㆍ 70 uL의 T4 Dda - E94C/C109A/C136A/A360C 완충액 교환 혼합물을 70 uL의 2 uM DNA 어댑터에 첨가했다(서열의 세부사항에 대하여 도 5 참조). 이어서, 샘플을 혼합하고 실온에서 5분 동안 배양하였다.
ㆍ 1 uL의 140 mM TMAD를 첨가하고, 샘플을 혼합하고, 실온에서 60분 동안 배양하였다. 이 샘플은 샘플 A로 알려져 있다. 2ul 분취액을 애질런트 분석을 위해 제거했다.
HS/ATP 단계
ㆍ 아래 표의 시약을 혼합하고, 실온에서 25분 동안 배양했다. 이 샘플은 샘플 B로 알려져 있다.
SPRI 정제
ㆍ SPRI 비드 1.1 mL를 샘플 B에 첨가한 다음, 샘플을 혼합하고 5분간 배양하였다.
ㆍ 비드를 펠렛화하고 상층액을 제거하였다. 이어서, 비드를 50 mM Tris·HCl, 2.5 M NaCl, 20% PEG8000으로 세척하였다.
ㆍ 샘플 C는 70 uL의 10 mM Tris.HCl, 20 mM NaCl에서 용출되었다.
효소에 의한 어댑터에 대한 10kb λC의 결찰
ㆍ 하기 표의 시약을 써모사이클러에서 20℃에서 10분간 배양하였다.
ㆍ 반응 혼합물(1x 500ul 분취액)을 200ul의 20% SPRI 비드로 SPRI 정제하고, 750ul의 세정 완충액 1에서 세정하고, 125ul의 용리 완충액 1에서 용출시켰다. 최종 DNA 서열(서열번호: 24)을 DNA로 하이브리드화시켰다. 이 샘플은 샘플 D로 알려져 있다.
전기생리학 실험
전기 측정은 완충액(25mM K 인산염 완충액, 150mM 칼륨 페로시아나이드(II), 150mM 칼륨 페리시아나이드(III), pH 8.0) 내 블록 코-폴리머에 삽입된 단일 라이세닌 나노포어로부터 획득하였다. 블럭 코-폴리머에 삽입된 단일 포어를 얻은 후, 완충액(2 mL, 25 mM K 인산염 완충액, 150 mM 칼륨 페로시아나이드(II), 150 mM 칼륨 페로시아나이드(III), pH 8.0)을 상기 시스템을 통해 흘려서, 임의의 과잉의 라이세닌 나노포어를 제거하였다. 이어서, 150 uL의 500 mM KCl, 25 mM K 인산염, pH 8.0을 시스템을 통해 흘렸다. 10분 후 150uL의 500mM KCl, 25mM K 인산염, pH8.0을 추가로 흘린 후 T4 Dda-E94C/C109A/C136A/A360C, DNA, 연료(MgCl2, ATP) 사전 혼합액(150 μL 총, 샘플 D)를 단일 나노포어 실험 시스템으로 흘렸다. 실험은 180 mV에서 실행되었으며 헬리카제-제어된 DNA 운동을 모니터링했다.
결과
막관통 포어의 영역에 대한 돌연변이의 효과를 측정하기 위해 복수의 상이한 나노포어를 조사하였다. 조사된 돌연변이체 포어는 이들이 비교된 기준선 나노포어와 함께 아래에 열거되어 있다(기준선 포어 1-4). 개선된 나노포어를 확인하기 위해 많은 상이한 파라미터를 조사했다. 1) 개선된 나노포어에서 기준선보다 낮은, 신호의 평균 잡음(잡음이 모든 가닥에 대해 계산된, 가닥의 모든 사건의 표준 편차와 동일한 경우) 2) 신호 내의 전류 레벨의 확산을 측정치이고, 개선된 나노포어에서 기준선보다 높은, 평균 전류 범위, 3) 표에 인용된 잡음에 대한 평균 신호가 모든 가닥에 걸쳐 신호 대 잡음(신호의 평균 잡음으로 나눈 평균 전류 범위)이며, 개선된 나노포어에서 기준선보다 높은 값임 4) 개선된 나노포어에서 기준선보다 높은 DNA의 포획율 및 5) 개선된 나노포어에서 기준선의 판독-헤드의 크기에 따라 증가되거나 감소될 수 있는 판독 헤드 크기.
이하의 각 표는 해당 기준선 나노포어에 대한 관련 데이터를 포함한다: 표 6 = 돌연변이체 1, 표 7 = 돌연변이체 2, 표 8 = 돌연변이체 3 및 표 9 = 돌연변이체 10, 이는 돌연변이된 포어와 비교했다.
라이세닌 돌연변이체 1 = 라이세닌 - (E84Q/E85K/E92Q/E97S/D126G)9(돌연변이 E84Q/E85K/E92Q/E97S/D126G를 갖는 서열번호: 2). (기준선 1)
라이세닌 돌연변이체 2 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/D126G를 갖는 서열번호: 2). (기준선 2)
라이세닌 돌연변이체 3 = 라이세닌 - (E84Q/E85K/E92Q/E94Q/E97S/D126G)9(돌연변이 E84Q/E85K/E92Q/E94Q/E97S/D126G를 갖는 서열번호: 2). (기준선 3)
라이세닌 돌연변이체 4 = 라이세닌 - (E84Q/E85K/S89Q/E92Q/E97S/D126G)9(돌연변이 E84Q/E85K/S89Q/E92Q/E97S/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 5 = 라이세닌 - (E84Q/E85K/T91S/E92Q/E97S/D126G)9(돌연변이 E84Q/E85K/T91S/E92Q/E97S/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 6 = 라이세닌 - (E84Q/E85K/E92Q/E97S/S98Q/D126G)9(돌연변이 E84Q/E85K/E92Q/E97S/S98Q/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 7 = 라이세닌 - (E84Q/E85K/E92Q/E97S/V100S/D126G)9(돌연변이 E84Q/E85K/E92Q/E97S/V100S/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 8 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/S80K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/S80K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 9 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T106R/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106R/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 10 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2). (기준선 4)
라이세닌 돌연변이체 11 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T104R/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T104R/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 12 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T104K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T104K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 13 = 라이세닌 - (S78N/E84Q/E85K/E92Q/E94D/E97S/D126G)9(돌연변이 S78N/E84Q/E85K/E92Q/E94D/E97S/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 14 = 라이세닌 - (S82N/E84Q/E85K/E92Q/E94D/E97S/D126G)9(돌연변이 S82N/E84Q/E85K/E92Q/E94D/E97S/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 15 = 라이세닌 - (E76N/E84Q/E85K/E92Q/E94Q/E97S/D126G)9(돌연변이 E76N/E84Q/E85K/E92Q/E94Q/E97S/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 16 = 라이세닌 - (E76S/E84Q/E85K/E92Q/E94Q/E97S/D126G)9(돌연변이 E76S/E84Q/E85K/E92Q/E94Q/E97S/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 17 = 라이세닌 - (E84Q/E85K/E92Q/E94Q/Y96D/D97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94Q/Y96D/D97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 18 = 라이세닌 - (K45D/E84Q/E85K/E92Q/E94K/D97S/T106K/D126G)9(돌연변이 K45D/E84Q/E85K/E92Q/E94K/D97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 19 = 라이세닌 - (K45R/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 K45R/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 20 = 라이세닌 - (D35N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 D35N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 21 = 라이세닌 - (K37N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 K37N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 22 = 라이세닌 - (K37S/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 K37S/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2.
라이세닌 돌연변이체 23 = 라이세닌 - (E84Q/E85K/E92D/E94Q/D97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92D/E94Q/D97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 24 = 라이세닌 - (E84Q/E85K/E92E/E94Q/D97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92E/E94Q/D97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 25 = 라이세닌 - (K37S/E84Q/E85K/E92Q/E94D/D97S/T104K/T106K/D126G)9(돌연변이 K37S/E84Q/E85K/E92Q/E94D/D97S/T104K/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 26 = 라이세닌 - (E84Q/E85K/M90I/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 E84Q/E85K/M90I/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 27 = 라이세닌 - (K45T/V47K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 K45T/V47K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 28 = 라이세닌 - (T51K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 T51K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 29 = 라이세닌 - (K45Y/S49K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 K45Y/S49K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 30 = 라이세닌 - (S49L/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 S49L/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 31 = 라이세닌 - (E84Q/E85K/V88I/M90A/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 E84Q/E85K/V88I/M90A/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 32 = 라이세닌 - (K45N/S49K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G)9(돌연변이 K45N/S49K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G를 갖는 서열번호: 2).
라이세닌 돌연변이체 33 = 라이세닌 - (K45N/V47K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G)9(돌연변이 K45N/V47K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G를 갖는 서열번호: 2)
판독헤드 분석
라이세닌 돌연변이 1과 10의 경우, 본 발명자들은 모든 가능한 9mer 폴리뉴클레오타이드의 예상 이온 전류 분포 모델을 수득하였다. 모델은 각각의 9mer의 전류 분포의 평균 및 표준 편차를 포함할 수 있다.
본 발명자들은 라이세닌 돌연변이체 1 및 10에 대해 수득된 모델의 구조를 검사하고 비교했다. 도면(도 1 및 2 참조)은 이러한 비교의 예를 제공한다. 각 모델(라이세닌 1 또는 10)의 경우, 본 발명자들은 A, x_2, x_3, x_4, x_5, x_6, x_7, x_8, x_9 형태의 모든 9mer에 대한 분포의 평균을 조합했으며, 여기에서 x_{i}는 {A, C, G, T}로부터 선택된 임의의 폴리뉴클레오타이드를 나타내며, 평균들에 적용된 조합은 중간값을 취한다. 상기 중간 평균은 위치 1의 모든 뉴클레오타이드 {A, C, G, T}와 모든 위치에 대해 반복되어, 9mer의 9 위치 중 어느 위치에 존재할 때 각 뉴클레오타이드의 중앙 효과를 인코딩하는 36개의 중간 값을 얻는다.
도 1(라이세닌 돌연변이체 1) 및 2(라이세닌 돌연변이체 2)는 2개의 상이한 포어에 대해 이 중간 값을 플롯팅한다. 도 1과 도 2의 플롯은 판독 헤드의 각 위치에 있는 모든 염기 사이의 식별력 수준을 보여준다. 식별력이 클수록 특정 위치에서의 전류 기여 수준 차이가 커진다. 위치가 판독 헤드의 일부가 아닌 경우, 해당 위치에서의 전류 기여도는 4개의 모든 염기에서 유사할 것이다. 도 2(라이세닌 돌연변이체 10)은 판독 헤드의 위치 6에서 8에서의 4개의 모든 염기에 대한 유사한 전류 기여도를 보여준다. 도 1(라이세닌 돌연변이체 1)은 판독 헤드의 임의의 위치에서 4개의 모든 염기에 대해 유사한 전류 기여도를 나타내지 않는다. 따라서, 라이세닌 돌연변이체 10은 라이세닌 돌연변이체 1보다 짧은 판독 헤드를 가지고있다. 더 짧은 판독 헤드는 한 번에 신호에 기여하는 염기가 적어서 개선된 기본 호출 정확도를 이끌 수 있으므로 유리할 수 있다.
실시예 2
본 실시예는 배럴/채널의 직경이 감소된 화학적으로 변형된 조립된 포어를 제조하는데 사용되는 프로토콜을 설명한다.
모노머 라이세닌 샘플(약 10umol)은 시스테인 잔기의 최대 반응성 및 고효율 커플링 반응을 보장하기 위해 먼저 감소되었다. 모노머성 라이세닌 샘플(약 10umol)을 1mM 디티오트레이톨(DTT)과 5 내지 15분 동안 배양하였다. 세포 잔해 및 현탁된 응집체를 20,000 rpm으로 10분간 원심 분리하여 펠렛화하였다. 가용성 분획을 회수하고, 7Kd 분자량 컷오프 Zeba 스핀 컬럼(ThermoFisher)을 사용하여 완충액을 1mM Tris, 1mM EDTA, pH 8.0으로 교환하였다.
부착된 분자(예를 들어, 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드)를 적합한 용매, 전형적으로 DMSO에서 100 mM의 농도로 용해시켰다. 이것을 1mM의 최종 농도로 완충액 교환된 라이세닌 모노머 샘플에 첨가하였다. 수득된 용액을 30℃에서 2시간 동안 배양하였다. 이어서 Encapsula Nanosciences(포스파티딜세린(0.325mg/ml): POPE(0.55mg/ml): 콜레스테롤(0.45mg/ml): 대두 PC(0.9mg/ml): 스핑고미엘린(0.275mg/ml))의 5 지질 혼합물 20uL을 첨가하여 변형된 샘플(100 uL)을 올리고머화하였다. 샘플을 30℃에서 60분 동안 배양했다. 이어서, 샘플을 SDS-PAGE에 적용시키고, 국제 출원 번호 PCT/GB2013/050667(WO2013/153359로 공개됨)에 기재된 바와 같이 겔로부터 정제하였다.
실시예 3
본 실시예는 배럴/채널(라이세닌-E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9의 감소된 직경을 갖는 화학적으로 변형된 조립된 라이세닌 포어를 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 갖는 E94C (돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드)와 비교하였다
재료 및 방법
DNa 작제물을 실시예 1에서 기재된 바와 같이 제조하였다. 전기생리학 실험을 실시예 1에 기재된 바와 같이 수행하였다.
결과
전기 생리학 실험은 E94C(돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드를 갖는 화학적으로 변형된 조립된 포어(라이세닌-(E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9가 21pA의 중간 범위를 나타내었음을 보여주며, 이는 중앙값 범위가 12pA인 라이세닌-(E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9보다 컸다. 이러한 중앙값 범위 증가는 kmer의 해상도를 위한 큰 전류 공간을 제공하였다.
도 3은 E94C(돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드를 갖는 (라이세닌-(E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9) 및 4((라이세닌-(E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9가 실시예 1에 기재된 바와 같이 중간 플롯을 나타냈다. 도 4가 도 3과 비교될 때, 상이한 위치에서 상이한 염기의 신호에 대한 상대적 기여도가 변경되었지만, 도 4의 극단적인(7 내지 8번 위치)에서의 판독-헤드 위치는 신호에 대한 이들의 기여도가 훨씬 낮아서 주어진 순간에 분석되는 Kmer의 길이가 더 짧아졌다는 것을 의미하는 매우 적은 식별력을 보여주었다. 이 짧은 판독 헤드는 기본 호출 정확도로 이어질 수 있는, 임의로 한 번에 신호에 기여하는 염기가 적어서 개선될 수 있는 이점이 있다.
실시예 3에 기재된 것과 유사한 실험을 E92C(돌연변이 E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2-페닐에틸)아세트아미드를 갖는 라이세닌-(E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A)9 및 E92C(돌연변이 E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2))를 통해 부착된 1-벤질-2,5-디 하이드로-1H-피롤-2,5-디온을 갖는 라이세닌-(E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A)9 상에서 수행하였다.
<110> OXFORD NANOPORE TECHNOLOGIES LIMITED
<120> MUTANT PORE
<130> N407106WO
<150> GB 1605899.2
<151> 2016-04-06
<150> GB 1608274.5
<151> 2016-05-11
<160> 24
<170> KoPatentIn 3.0
<210> 1
<211> 897
<212> DNA
<213> Eisenia fetida
<400> 1
atgagtgcga aggctgctga aggttatgaa caaatcgaag ttgatgtggt tgctgtgtgg 60
aaggaaggtt atgtgtatga aaatcgtggt agtacctccg tggatcaaaa aattaccatc 120
acgaaaggca tgaagaacgt taatagcgaa acccgtacgg tcaccgcgac gcattctatt 180
ggcagtacca tctccacggg tgacgccttt gaaatcggct ccgtggaagt ttcatattcg 240
catagccacg aagaatcaca agtttcgatg accgaaacgg aagtctacga atcaaaagtg 300
attgaacaca ccattacgat cccgccgacc tcgaagttca cgcgctggca gctgaacgca 360
gatgtcggcg gtgctgacat tgaatatatg tacctgatcg atgaagttac cccgattggc 420
ggtacgcaga gtattccgca agtgatcacc tcccgtgcaa aaattatcgt tggtcgccag 480
attatcctgg gcaagaccga aattcgtatc aaacatgctg aacgcaagga atatatgacc 540
gtggttagcc gtaaatcttg gccggcggcc acgctgggtc acagtaaact gtttaagttc 600
gtgctgtacg aagattgggg cggttttcgc atcaaaaccc tgaatacgat gtattctggt 660
tatgaatacg cgtatagctc tgaccagggc ggtatctact tcgatcaagg caccgacaac 720
ccgaaacagc gttgggccat taataagagc ctgccgctgc gccatggtga tgtcgtgacc 780
tttatgaaca aatacttcac gcgttctggt ctgtgctatg atgacggccc ggcgaccaat 840
gtgtattgtc tggataaacg cgaagacaag tggattctgg aagttgtcgg ctaatga 897
<210> 2
<211> 297
<212> PRT
<213> Eisenia fetida
<400> 2
Met Ser Ala Lys Ala Ala Glu Gly Tyr Glu Gln Ile Glu Val Asp Val
1 5 10 15
Val Ala Val Trp Lys Glu Gly Tyr Val Tyr Glu Asn Arg Gly Ser Thr
20 25 30
Ser Val Asp Gln Lys Ile Thr Ile Thr Lys Gly Met Lys Asn Val Asn
35 40 45
Ser Glu Thr Arg Thr Val Thr Ala Thr His Ser Ile Gly Ser Thr Ile
50 55 60
Ser Thr Gly Asp Ala Phe Glu Ile Gly Ser Val Glu Val Ser Tyr Ser
65 70 75 80
His Ser His Glu Glu Ser Gln Val Ser Met Thr Glu Thr Glu Val Tyr
85 90 95
Glu Ser Lys Val Ile Glu His Thr Ile Thr Ile Pro Pro Thr Ser Lys
100 105 110
Phe Thr Arg Trp Gln Leu Asn Ala Asp Val Gly Gly Ala Asp Ile Glu
115 120 125
Tyr Met Tyr Leu Ile Asp Glu Val Thr Pro Ile Gly Gly Thr Gln Ser
130 135 140
Ile Pro Gln Val Ile Thr Ser Arg Ala Lys Ile Ile Val Gly Arg Gln
145 150 155 160
Ile Ile Leu Gly Lys Thr Glu Ile Arg Ile Lys His Ala Glu Arg Lys
165 170 175
Glu Tyr Met Thr Val Val Ser Arg Lys Ser Trp Pro Ala Ala Thr Leu
180 185 190
Gly His Ser Lys Leu Phe Lys Phe Val Leu Tyr Glu Asp Trp Gly Gly
195 200 205
Phe Arg Ile Lys Thr Leu Asn Thr Met Tyr Ser Gly Tyr Glu Tyr Ala
210 215 220
Tyr Ser Ser Asp Gln Gly Gly Ile Tyr Phe Asp Gln Gly Thr Asp Asn
225 230 235 240
Pro Lys Gln Arg Trp Ala Ile Asn Lys Ser Leu Pro Leu Arg His Gly
245 250 255
Asp Val Val Thr Phe Met Asn Lys Tyr Phe Thr Arg Ser Gly Leu Cys
260 265 270
Tyr Asp Asp Gly Pro Ala Thr Asn Val Tyr Cys Leu Asp Lys Arg Glu
275 280 285
Asp Lys Trp Ile Leu Glu Val Val Gly
290 295
<210> 3
<211> 1830
<212> DNA
<213> Bacteriophage phi-29
<400> 3
atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60
gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120
ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180
cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240
tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300
tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360
gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420
gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480
gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540
tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600
atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660
gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720
gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780
cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840
tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900
accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960
ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020
gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080
aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140
ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200
ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260
acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320
accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380
catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440
ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500
atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560
tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620
gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680
gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740
tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800
tggagccacc cgcagtttga aaaataataa 1830
<210> 4
<211> 608
<212> PRT
<213> Bacteriophage phi-29
<400> 4
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser
565 570 575
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser
580 585 590
Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
595 600 605
<210> 5
<211> 1390
<212> DNA
<213> Escherichia coli
<400> 5
atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60
acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120
aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180
ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240
gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300
ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360
tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420
atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480
ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540
catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600
cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660
attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720
ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780
atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840
gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900
gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960
gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020
ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080
gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140
aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200
aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260
tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320
cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380
gtggcgctgc 1390
<210> 6
<211> 485
<212> PRT
<213> Escherichia coli
<400> 6
Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr
1 5 10 15
Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala
20 25 30
Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val
35 40 45
Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val
50 55 60
Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn
65 70 75 80
Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys
85 90 95
Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr
100 105 110
Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp
115 120 125
Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys
130 135 140
Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly
145 150 155 160
Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu
165 170 175
His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala
180 185 190
Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu
195 200 205
Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro
210 215 220
Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg
225 230 235 240
Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg
245 250 255
Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu
260 265 270
Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr
275 280 285
Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn
290 295 300
Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala
305 310 315 320
Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile
325 330 335
Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala
340 345 350
Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr
355 360 365
Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu
370 375 380
Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp
385 390 395 400
Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro
405 410 415
Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg
420 425 430
Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln
435 440 445
Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu
450 455 460
Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His
465 470 475 480
His His His His His
485
<210> 7
<211> 804
<212> DNA
<213> Escherichia coli
<400> 7
atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60
atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120
atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180
ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240
cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300
ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360
aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420
aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480
atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540
ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600
catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660
gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720
tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780
cccgtctggg cgaccttccg ccgc 804
<210> 8
<211> 268
<212> PRT
<213> Escherichia coli
<400> 8
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro
245 250 255
Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 9
<211> 1275
<212> DNA
<213> Thermus thermophilus
<400> 9
atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60
cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120
ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180
ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240
atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300
attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360
gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420
ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480
catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540
attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600
cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660
ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720
ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780
ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840
cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900
ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960
gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020
gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080
ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140
gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200
ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260
gaaccgctgt tcctg 1275
<210> 10
<211> 425
<212> PRT
<213> Thermus thermophilus
<400> 10
Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro
1 5 10 15
Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg
20 25 30
Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu
35 40 45
Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp
50 55 60
Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu
65 70 75 80
Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr
85 90 95
Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu
100 105 110
Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr
115 120 125
Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys
130 135 140
Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu
145 150 155 160
His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala
165 170 175
Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg
180 185 190
Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val
195 200 205
Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val
210 215 220
Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu
225 230 235 240
Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala
245 250 255
Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg
260 265 270
Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp
275 280 285
Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly
290 295 300
Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro
305 310 315 320
Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro
325 330 335
Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg
340 345 350
Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu
355 360 365
Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro
370 375 380
Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly
385 390 395 400
Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly
405 410 415
Glu Gly Asn Pro Glu Pro Leu Phe Leu
420 425
<210> 11
<211> 738
<212> DNA
<213> Bacteriophage lambda
<400> 11
tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60
gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120
gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180
cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240
ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300
ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360
agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420
aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480
aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540
tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600
cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660
gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720
tccggcagcg gttccgga 738
<210> 12
<211> 226
<212> PRT
<213> Bacteriophage lambda
<400> 12
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 13
<211> 760
<212> PRT
<213> Methanococcoides burtonii
<400> 13
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 14
<211> 300
<212> PRT
<213> Eisenia fetida
<400> 14
Met Ser Ser Ser Thr Val Met Ala Asp Gly Phe Glu Glu Ile Glu Val
1 5 10 15
Asp Val Val Ser Val Trp Lys Glu Gly Tyr Ala Tyr Glu Asn Arg Gly
20 25 30
Asn Ser Ser Val Gln Gln Lys Ile Thr Met Thr Lys Gly Met Lys Asn
35 40 45
Leu Asn Ser Glu Thr Lys Thr Leu Thr Ala Thr His Thr Leu Gly Arg
50 55 60
Thr Leu Lys Val Gly Asp Pro Phe Glu Ile Ala Ser Val Glu Val Ser
65 70 75 80
Tyr Thr Phe Ser His Gln Lys Ser Gln Val Ser Met Thr Gln Thr Glu
85 90 95
Val Tyr Ser Ser Gln Val Ile Glu His Thr Val Thr Ile Pro Pro Asn
100 105 110
Lys Lys Phe Thr Arg Trp Lys Leu Asn Ala Asp Val Gly Gly Thr Gly
115 120 125
Ile Glu Tyr Met Tyr Leu Ile Asp Glu Val Thr Ala Ile Gly Ala Asp
130 135 140
Leu Thr Ile Pro Glu Val Asn Lys Ser Arg Ala Lys Ile Leu Val Gly
145 150 155 160
Arg Gln Ile His Leu Gly Glu Thr Glu Ile Arg Ile Lys His Ala Glu
165 170 175
Arg Lys Glu Tyr Met Thr Val Ile Ser Arg Lys Ser Trp Pro Ala Ala
180 185 190
Thr Leu Gly Asn Ser Asn Leu Phe Lys Phe Val Leu Phe Glu Asp Ser
195 200 205
Ser Gly Ile Arg Ile Lys Thr Leu Asn Thr Met Tyr Pro Gly Tyr Glu
210 215 220
Trp Ala Tyr Ser Ser Asp Gln Gly Gly Ile Tyr Phe Asp Glu Ser Ser
225 230 235 240
Asp Asn Pro Lys Gln Arg Trp Ala Leu Ser Lys Ala Met Pro Leu Arg
245 250 255
His Gly Asp Val Val Thr Phe Arg Asn Asn Phe Phe Thr Asn Ser Gly
260 265 270
Met Cys Tyr Asp Asp Gly Pro Ala Thr Asn Val Tyr Cys Leu Glu Lys
275 280 285
Arg Glu Asp Lys Trp Ile Leu Glu Val Val Asn Thr
290 295 300
<210> 15
<211> 300
<212> PRT
<213> Eisenia fetida
<400> 15
Met Ser Ser Arg Ala Gly Ile Ala Glu Gly Tyr Glu Gln Ile Glu Val
1 5 10 15
Asp Val Val Ala Val Trp Lys Glu Gly Tyr Val Tyr Glu Asn Arg Gly
20 25 30
Ser Thr Ser Val Glu Gln Lys Ile Lys Ile Thr Lys Gly Met Arg Asn
35 40 45
Leu Asn Ser Glu Thr Lys Thr Leu Thr Ala Ser His Ser Ile Gly Ser
50 55 60
Thr Ile Ser Thr Gly Asp Leu Phe Glu Ile Ala Thr Val Asp Val Ser
65 70 75 80
Tyr Ser Tyr Ser His Glu Glu Ser Gln Val Ser Met Thr Glu Thr Glu
85 90 95
Val Tyr Glu Ser Lys Glu Ile Glu His Thr Ile Thr Ile Pro Pro Thr
100 105 110
Ser Lys Phe Thr Arg Trp Gln Leu Asn Ala Asp Val Gly Gly Ala Asp
115 120 125
Ile Glu Tyr Met Tyr Leu Ile Asp Glu Val Thr Pro Ile Gly Gly Thr
130 135 140
Leu Ser Ile Pro Gln Val Ile Lys Ser Arg Ala Lys Ile Leu Val Gly
145 150 155 160
Arg Glu Ile Tyr Leu Gly Glu Thr Glu Ile Arg Ile Lys His Ala Asp
165 170 175
Arg Lys Glu Tyr Met Thr Val Val Ser Arg Lys Ser Trp Pro Ala Ala
180 185 190
Thr Leu Gly His Ser Lys Leu Tyr Lys Phe Val Leu Tyr Glu Asp Met
195 200 205
Tyr Gly Phe Arg Ile Lys Thr Leu Asn Thr Met Tyr Ser Gly Tyr Glu
210 215 220
Tyr Ala Tyr Ser Ser Asp Gln Gly Gly Ile Tyr Phe Asp Gln Gly Ser
225 230 235 240
Asp Asn Pro Lys Gln Arg Trp Ala Ile Asn Lys Ser Leu Pro Leu Arg
245 250 255
His Gly Asp Val Val Thr Phe Met Asn Lys Tyr Phe Thr Arg Ser Gly
260 265 270
Leu Cys Tyr Tyr Asp Gly Pro Ala Thr Asp Val Tyr Cys Leu Asp Lys
275 280 285
Arg Glu Asp Lys Trp Ile Leu Glu Val Val Lys Pro
290 295 300
<210> 16
<211> 300
<212> PRT
<213> Eisenia fetida
<400> 16
Met Ser Ala Thr Ala Val Thr Ala Asp Gly Leu Glu Glu Ile Glu Val
1 5 10 15
Asp Val Val Ala Val Trp Lys Glu Gly Tyr Val Tyr Glu Asn Arg Gly
20 25 30
Asp Thr Ser Val Glu Gln Lys Ile Thr Met Thr Lys Gly Met Lys Asn
35 40 45
Leu Asn Ser Glu Thr Lys Thr Leu Thr Ala Thr His Thr Val Gly Arg
50 55 60
Thr Leu Lys Val Gly Asp Pro Phe Glu Ile Gly Ser Val Glu Val Ser
65 70 75 80
Tyr Ser Phe Ser His Gln Glu Ser Gln Val Ser Met Thr Gln Thr Glu
85 90 95
Val Tyr Ser Ser Gln Val Ile Glu His Thr Val Thr Ile Pro Pro Thr
100 105 110
Ser Lys Phe Thr Arg Trp Lys Leu Asn Ala Asp Val Gly Gly Thr Asp
115 120 125
Ile Glu Tyr Met Tyr Leu Ile Asp Glu Val Thr Pro Ile Ser Val Thr
130 135 140
Gln Thr Ile Pro Gln Val Ile Arg Ser Arg Ala Lys Ile Leu Val Gly
145 150 155 160
Arg Gln Ile His Leu Gly Thr Thr Ala Val Arg Ile Lys His Ala Glu
165 170 175
Arg Gln Glu Tyr Met Thr Val Ile Glu Arg Lys Lys Trp Pro Ala Ala
180 185 190
Thr Leu Gly Lys Ser Asn Leu Phe Lys Phe Val Leu Phe Glu Asp Ser
195 200 205
Ser Gly Thr Arg Ile Lys Thr Leu Asn Thr Met Tyr Pro Gly Tyr Glu
210 215 220
Trp Ala Tyr Ser Ser Asp Gln Gly Gly Val Tyr Phe Asp Glu Ser Ser
225 230 235 240
Asp Asn Pro Lys Gln Arg Trp Ala Leu Ser Lys Ala Leu Pro Leu Arg
245 250 255
His Gly Asp Val Val Thr Phe Met Asn Lys Tyr Phe Thr Asn Ser Gly
260 265 270
Leu Cys Tyr Asp Asp Gly Pro Ala Thr Asn Val Tyr Cys Leu Asp Lys
275 280 285
Arg Glu Asp Lys Trp Ile Leu Glu Val Val Asn Pro
290 295 300
<210> 17
<211> 252
<212> PRT
<213> Bacillus thuringiensis
<400> 17
Met Asp Val Ile Arg Glu Tyr Leu Met Phe Asn Glu Leu Ser Ala Leu
1 5 10 15
Ser Ser Ser Pro Glu Ser Val Arg Ser Arg Phe Ser Ser Ile Tyr Gly
20 25 30
Thr Asn Pro Asp Gly Ile Ala Leu Asn Asn Glu Thr Tyr Phe Asn Ala
35 40 45
Val Lys Pro Pro Ile Thr Ala Gln Tyr Gly Tyr Tyr Cys Tyr Lys Asn
50 55 60
Val Gly Thr Val Gln Tyr Val Asn Arg Pro Thr Asp Ile Asn Pro Asn
65 70 75 80
Val Ile Leu Ala Gln Asp Thr Leu Thr Asn Asn Thr Asn Glu Pro Phe
85 90 95
Thr Thr Thr Ile Thr Ile Thr Gly Ser Phe Thr Asn Thr Ser Thr Val
100 105 110
Thr Ser Ser Thr Thr Thr Gly Phe Lys Phe Thr Ser Lys Leu Ser Ile
115 120 125
Lys Lys Val Phe Glu Ile Gly Gly Glu Val Ser Phe Ser Thr Thr Ile
130 135 140
Gly Thr Ser Glu Thr Thr Thr Glu Thr Ile Thr Val Ser Lys Ser Val
145 150 155 160
Thr Val Thr Val Pro Ala Gln Ser Arg Arg Thr Ile Gln Leu Thr Ala
165 170 175
Lys Ile Ala Lys Glu Ser Ala Asp Phe Ser Ala Pro Ile Thr Val Asp
180 185 190
Gly Tyr Phe Gly Ala Asn Phe Pro Lys Arg Val Gly Pro Gly Gly His
195 200 205
Tyr Phe Trp Phe Asn Pro Ala Arg Asp Val Leu Asn Thr Thr Ser Gly
210 215 220
Thr Leu Arg Gly Thr Val Thr Asn Val Ser Ser Phe Asp Phe Gln Thr
225 230 235 240
Ile Val Gln Pro Ala Arg Ser Leu Leu Asp Glu Gln
245 250
<210> 18
<211> 439
<212> PRT
<213> Enterobacteria phage T4
<400> 18
Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile
1 5 10 15
Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly
20 25 30
Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala
35 40 45
Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His
50 55 60
Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr
65 70 75 80
Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val
85 90 95
Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu
115 120 125
Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn
130 135 140
Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser
145 150 155 160
Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val
165 170 175
Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn
180 185 190
Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly
195 200 205
Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser
210 215 220
Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe
225 230 235 240
Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile
245 250 255
Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln
260 265 270
Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu
275 280 285
Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr
290 295 300
Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile
305 310 315 320
Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr
325 330 335
Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe
340 345 350
Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys
355 360 365
Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe
370 375 380
Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly
385 390 395 400
Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala
405 410 415
Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly
420 425 430
Arg Tyr Asp Val Phe Tyr Val
435
<210> 19
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Adaptor portion B of Fig 5
<400> 19
ggcgtctgct tgggtgttta accttttttt ttttt 35
<210> 20
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Adaptor portion D of Fig 5
<400> 20
ggttgtttct gttggtgctg atattgct 28
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Adaptor portion E of Fig 5
<400> 21
aacacccaag cagacgcctt 20
<210> 22
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Adaptor portion F of Fig 5
<400> 22
gcaatatcag caccaacaga aacaaccttt gaggcgagcg gtcaa 45
<210> 23
<211> 10178
<212> DNA
<213> Artificial Sequence
<220>
<223> 10kb Lambda cDNA
<400> 23
caaagtccat gccatcaaac tgctggtttt cattgatgat gcgggaccag ccatcaacgc 60
ccaccaccgg aacgatgcca ttctgcttat caggaaaggc gtaaatttct ttcgtccacg 120
gattaaggcc gtactggttg gcaacgatca gtaatgcgat gaactgcgca tcgctggcat 180
cacctttaaa tgccgtctgg cgaagagtgg tgatcagttc ctgtgggtcg acagaatcca 240
tgccgacacg ttcagccagc ttcccagcca gcgttgcgag tgcagtactc attcgtttta 300
tacctctgaa tcaatatcaa cctggtggtg agcaatggtt tcaaccatgt accggatgtg 360
ttctgccatg cgctcctgaa actcaacatc gtcatcaaac gcacgggtaa tggatttttt 420
gctggccccg tggcgttgca aatgatcgat gcatagcgat tcaaacaggt gctggggcag 480
gcctttttcc atgtcgtctg ccagttctgc ctctttctct tcacgggcga gctgctggta 540
gtgacgcgcc cagctctgag cctcaagacg atcctgaatg taataagcgt tcatggctga 600
actcctgaaa tagctgtgaa aatatcgccc gcgaaatgcc gggctgatta ggaaaacagg 660
aaagggggtt agtgaatgct tttgcttgat ctcagtttca gtattaatat ccatttttta 720
taagcgtcga cggcttcacg aaacatcttt tcatcgccaa taaaagtggc gatagtgaat 780
ttagtctgga tagccataag tgtttgatcc attctttggg actcctggct gattaagtat 840
gtcgataagg cgtttccatc cgtcacgtaa tttacgggtg attcgttcaa gtaaagattc 900
ggaagggcag ccagcaacag gccaccctgc aatggcatat tgcatggtgt gctccttatt 960
tatacataac gaaaaacgcc tcgagtgaag cgttattggt atgcggtaaa accgcactca 1020
ggcggccttg atagtcatat catctgaatc aaatattcct gatgtatcga tatcggtaat 1080
tcttattcct tcgctaccat ccattggagg ccatccttcc tgaccatttc catcattcca 1140
gtcgaactca cacacaacac catatgcatt taagtcgctt gaaattgcta taagcagagc 1200
atgttgcgcc agcatgatta atacagcatt taatacagag ccgtgtttat tgagtcggta 1260
ttcagagtct gaccagaaat tattaatctg gtgaagtttt tcctctgtca ttacgtcatg 1320
gtcgatttca atttctattg atgctttcca gtcgtaatca atgatgtatt ttttgatgtt 1380
tgacatctgt tcatatcctc acagataaaa aatcgccctc acactggagg gcaaagaaga 1440
tttccaataa tcagaacaag tcggctcctg tttagttacg agcgacattg ctccgtgtat 1500
tcactcgttg gaatgaatac acagtgcagt gtttattctg ttatttatgc caaaaataaa 1560
ggccactatc aggcagcttt gttgttctgt ttaccaagtt ctctggcaat cattgccgtc 1620
gttcgtattg cccatttatc gacatatttc ccatcttcca ttacaggaaa catttcttca 1680
ggcttaacca tgcattccga ttgcagcttg catccattgc atcgcttgaa ttgtccacac 1740
cattgatttt tatcaatagt cgtagtcata cggatagtcc tggtattgtt ccatcacatc 1800
ctgaggatgc tcttcgaact cttcaaattc ttcttccata tatcacctta aatagtggat 1860
tgcggtagta aagattgtgc ctgtctttta accacatcag gctcggtggt tctcgtgtac 1920
ccctacagcg agaaatcgga taaactatta caacccctac agtttgatga gtatagaaat 1980
ggatccactc gttattctcg gacgagtgtt cagtaatgaa cctctggaga gaaccatgta 2040
tatgatcgtt atctgggttg gacttctgct tttaagccca gataactggc ctgaatatgt 2100
taatgagaga atcggtattc ctcatgtgtg gcatgttttc gtctttgctc ttgcattttc 2160
gctagcaatt aatgtgcatc gattatcagc tattgccagc gccagatata agcgatttaa 2220
gctaagaaaa cgcattaaga tgcaaaacga taaagtgcga tcagtaattc aaaaccttac 2280
agaagagcaa tctatggttt tgtgcgcagc ccttaatgaa ggcaggaagt atgtggttac 2340
atcaaaacaa ttcccataca ttagtgagtt gattgagctt ggtgtgttga acaaaacttt 2400
ttcccgatgg aatggaaagc atatattatt ccctattgag gatatttact ggactgaatt 2460
agttgccagc tatgatccat ataatattga gataaagcca aggccaatat ctaagtaact 2520
agataagagg aatcgatttt cccttaattt tctggcgtcc actgcatgtt atgccgcgtt 2580
cgccaggctt gctgtaccat gtgcgctgat tcttgcgctc aatacgttgc aggttgcttt 2640
caatctgttt gtggtattca gccagcactg taaggtctat cggatttagt gcgctttcta 2700
ctcgtgattt cggtttgcga ttcagcgaga gaatagggcg gttaactggt tttgcgctta 2760
ccccaaccaa caggggattt gctgctttcc attgagcctg tttctctgcg cgacgttcgc 2820
ggcggcgtgt ttgtgcatcc atctggattc tcctgtcagt tagctttggt ggtgtgtggc 2880
agttgtagtc ctgaacgaaa accccccgcg attggcacat tggcagctaa tccggaatcg 2940
cacttacggc caatgcttcg tttcgtatca cacaccccaa agccttctgc tttgaatgct 3000
gcccttcttc agggcttaat ttttaagagc gtcaccttca tggtggtcag tgcgtcctgc 3060
tgatgtgctc agtatcaccg ccagtggtat ttatgtcaac accgccagag ataatttatc 3120
accgcagatg gttatctgta tgttttttat atgaatttat tttttgcagg ggggcattgt 3180
ttggtaggtg agagatctga attgctatgt ttagtgagtt gtatctattt atttttcaat 3240
aaatacaatt ggttatgtgt tttgggggcg atcgtgaggc aaagaaaacc cggcgctgag 3300
gccgggttat tcttgttctc tggtcaaatt atatagttgg aaaacaagga tgcatatatg 3360
aatgaacgat gcagaggcaa tgccgatggc gatagtgggt atcatgtagc cgcttatgct 3420
ggaaagaagc aataacccgc agaaaaacaa agctccaagc tcaacaaaac taagggcata 3480
gacaataact accgatgtca tatacccata ctctctaatc ttggccagtc ggcgcgttct 3540
gcttccgatt agaaacgtca aggcagcaat caggattgca atcatggttc ctgcatatga 3600
tgacaatgtc gccccaagac catctctatg agctgaaaaa gaaacaccag gaatgtagtg 3660
gcggaaaagg agatagcaaa tgcttacgat aacgtaagga attattacta tgtaaacacc 3720
aggcatgatt ctgttccgca taattactcc tgataattaa tccttaactt tgcccacctg 3780
ccttttaaaa cattccagta tatcactttt cattcttgcg tagcaatatg ccatctcttc 3840
agctatctca gcattggtga ccttgttcag aggcgctgag agatggcctt tttctgatag 3900
ataatgttct gttaaaatat ctccggcctc atcttttgcc cgcaggctaa tgtctgaaaa 3960
ttgaggtgac gggttaaaaa taatatcctt ggcaaccttt tttatatccc ttttaaattt 4020
tggcttaatg actatatcca atgagtcaaa aagctcccct tcaatatctg ttgcccctaa 4080
gacctttaat atatcgccaa atacaggtag cttggcttct accttcaccg ttgttcggcc 4140
gatgaaatgc atatgcataa catcgtcttt ggtggttccc ctcatcagtg gctctatctg 4200
aacgcgctct ccactgctta atgacattcc tttcccgatt aaaaaatctg tcagatcgga 4260
tgtggtcggc ccgaaaacag ttctggcaaa accaatggtg tcgccttcaa caaacaaaaa 4320
agatgggaat cccaatgatt cgtcatctgc gaggctgttc ttaatatctt caactgaagc 4380
tttagagcga tttatcttct gaaccagact cttgtcattt gttttggtaa agagaaaagt 4440
ttttccatcg attttatgaa tatacaaata attggagcca acctgcaggt gatgattatc 4500
agccagcaga gaattaagga aaacagacag gtttattgag cgcttatctt tccctttatt 4560
tttgctgcgg taagtcgcat aaaaaccatt cttcataatt caatccattt actatgttat 4620
gttctgaggg gagtgaaaat tcccctaatt cgatgaagat tcttgctcaa ttgttatcag 4680
ctatgcgccg accagaacac cttgccgatc agccaaacgt ctcttcaggc cactgactag 4740
cgataacttt ccccacaacg gaacaactct cattgcatgg gatcattggg tactgtgggt 4800
ttagtggttg taaaaacacc tgaccgctat ccctgatcag tttcttgaag gtaaactcat 4860
cacccccaag tctggctatg cagaaatcac ctggctcaac agcctgctca gggtcaacga 4920
gaattaacat tccgtcagga aagcttggct tggagcctgt tggtgcggtc atggaattac 4980
cttcaacctc aagccagaat gcagaatcac tggctttttt ggttgtgctt acccatctct 5040
ccgcatcacc tttggtaaag gttctaagct taggtgagaa catccctgcc tgaacatgag 5100
aaaaaacagg gtactcatac tcacttctaa gtgacggctg catactaacc gcttcataca 5160
tctcgtagat ttctctggcg attgaagggc taaattcttc aacgctaact ttgagaattt 5220
ttgtaagcaa tgcggcgtta taagcattta atgcattgat gccattaaat aaagcaccaa 5280
cgcctgactg ccccatcccc atcttgtctg cgacagattc ctgggataag ccaagttcat 5340
ttttcttttt ttcataaatt gctttaaggc gacgtgcgtc ctcaagctgc tcttgtgtta 5400
atggtttctt ttttgtgctc atacgttaaa tctatcaccg caagggataa atatctaaca 5460
ccgtgcgtgt tgactatttt acctctggcg gtgataatgg ttgcatgtac taaggaggtt 5520
gtatggaaca acgcataacc ctgaaagatt atgcaatgcg ctttgggcaa accaagacag 5580
ctaaagatct cggcgtatat caaagcgcga tcaacaaggc cattcatgca ggccgaaaga 5640
tttttttaac tataaacgct gatggaagcg tttatgcgga agaggtaaag cccttcccga 5700
gtaacaaaaa aacaacagca taaataaccc cgctcttaca cattccagcc ctgaaaaagg 5760
gcatcaaatt aaaccacacc tatggtgtat gcatttattt gcatacattc aatcaattgt 5820
tatctaagga aatacttaca tatggttcgt gcaaacaaac gcaacgaggc tctacgaatc 5880
gagagtgcgt tgcttaacaa aatcgcaatg cttggaactg agaagacagc ggaagctgtg 5940
ggcgttgata agtcgcagat cagcaggtgg aagagggact ggattccaaa gttctcaatg 6000
ctgcttgctg ttcttgaatg gggggtcgtt gacgacgaca tggctcgatt ggcgcgacaa 6060
gttgctgcga ttctcaccaa taaaaaacgc ccggcggcaa ccgagcgttc tgaacaaatc 6120
cagatggagt tctgaggtca ttactggatc tatcaacagg agtcattatg acaaatacag 6180
caaaaatact caacttcggc agaggtaact ttgccggaca ggagcgtaat gtggcagatc 6240
tcgatgatgg ttacgccaga ctatcaaata tgctgcttga ggcttattcg ggcgcagatc 6300
tgaccaagcg acagtttaaa gtgctgcttg ccattctgcg taaaacctat gggtggaata 6360
aaccaatgga cagaatcacc gattctcaac ttagcgagat tacaaagtta cctgtcaaac 6420
ggtgcaatga agccaagtta gaactcgtca gaatgaatat tatcaagcag caaggcggca 6480
tgtttggacc aaataaaaac atctcagaat ggtgcatccc tcaaaacgag ggaaaatccc 6540
ctaaaacgag ggataaaaca tccctcaaat tgggggattg ctatccctca aaacaggggg 6600
acacaaaaga cactattaca aaagaaaaaa gaaaagatta ttcgtcagag aattctggcg 6660
aatcctctga ccagccagaa aacgaccttt ctgtggtgaa accggatgct gcaattcaga 6720
gcggcagcaa gtgggggaca gcagaagacc tgaccgccgc agagtggatg tttgacatgg 6780
tgaagactat cgcaccatca gccagaaaac cgaattttgc tgggtgggct aacgatatcc 6840
gcctgatgcg tgaacgtgac ggacgtaacc accgcgacat gtgtgtgctg ttccgctggg 6900
catgccagga caacttctgg tccggtaacg tgctgagccc ggccaaactc cgcgataagt 6960
ggacccaact cgaaatcaac cgtaacaagc aacaggcagg cgtgacagcc agcaaaccaa 7020
aactcgacct gacaaacaca gactggattt acggggtgga tctatgaaaa acatcgccgc 7080
acagatggtt aactttgacc gtgagcagat gcgtcggatc gccaacaaca tgccggaaca 7140
gtacgacgaa aagccgcagg tacagcaggt agcgcagatc atcaacggtg tgttcagcca 7200
gttactggca actttcccgg cgagcctggc taaccgtgac cagaacgaag tgaacgaaat 7260
ccgtcgccag tgggttctgg cttttcggga aaacgggatc accacgatgg aacaggttaa 7320
cgcaggaatg cgcgtagccc gtcggcagaa tcgaccattt ctgccatcac ccgggcagtt 7380
tgttgcatgg tgccgggaag aagcatccgt taccgccgga ctgccaaacg tcagcgagct 7440
ggttgatatg gtttacgagt attgccggaa gcgaggcctg tatccggatg cggagtctta 7500
tccgtggaaa tcaaacgcgc actactggct ggttaccaac ctgtatcaga acatgcgggc 7560
caatgcgctt actgatgcgg aattacgccg taaggccgca gatgagcttg tccatatgac 7620
tgcgagaatt aaccgtggtg aggcgatccc tgaaccagta aaacaacttc ctgtcatggg 7680
cggtagacct ctaaatcgtg cacaggctct ggcgaagatc gcagaaatca aagctaagtt 7740
cggactgaaa ggagcaagtg tatgacgggc aaagaggcaa ttattcatta cctggggacg 7800
cataatagct tctgtgcgcc ggacgttgcc gcgctaacag gcgcaacagt aaccagcata 7860
aatcaggccg cggctaaaat ggcacgggca ggtcttctgg ttatcgaagg taaggtctgg 7920
cgaacggtgt attaccggtt tgctaccagg gaagaacggg aaggaaagat gagcacgaac 7980
ctggttttta aggagtgtcg ccagagtgcc gcgatgaaac gggtattggc ggtatatgga 8040
gttaaaagat gaccatctac attactgagc taataacagg cctgctggta atcgcaggcc 8100
tttttatttg ggggagaggg aagtcatgaa aaaactaacc tttgaaattc gatctccagc 8160
acatcagcaa aacgctattc acgcagtaca gcaaatcctt ccagacccaa ccaaaccaat 8220
cgtagtaacc attcaggaac gcaaccgcag cttagaccaa aacaggaagc tatgggcctg 8280
cttaggtgac gtctctcgtc aggttgaatg gcatggtcgc tggctggatg cagaaagctg 8340
gaagtgtgtg tttaccgcag cattaaagca gcaggatgtt gttcctaacc ttgccgggaa 8400
tggctttgtg gtaataggcc agtcaaccag caggatgcgt gtaggcgaat ttgcggagct 8460
attagagctt atacaggcat tcggtacaga gcgtggcgtt aagtggtcag acgaagcgag 8520
actggctctg gagtggaaag cgagatgggg agacagggct gcatgataaa tgtcgttagt 8580
ttctccggtg gcaggacgtc agcatatttg ctctggctaa tggagcaaaa gcgacgggca 8640
ggtaaagacg tgcattacgt tttcatggat acaggttgtg aacatccaat gacatatcgg 8700
tttgtcaggg aagttgtgaa gttctgggat ataccgctca ccgtattgca ggttgatatc 8760
aacccggagc ttggacagcc aaatggttat acggtatggg aaccaaagga tattcagacg 8820
cgaatgcctg ttctgaagcc atttatcgat atggtaaaga aatatggcac tccatacgtc 8880
ggcggcgcgt tctgcactga cagattaaaa ctcgttccct tcaccaaata ctgtgatgac 8940
catttcgggc gagggaatta caccacgtgg attggcatca gagctgatga accgaagcgg 9000
ctaaagccaa agcctggaat cagatatctt gctgaactgt cagactttga gaaggaagat 9060
atcctcgcat ggtggaagca acaaccattc gatttgcaaa taccggaaca tctcggtaac 9120
tgcatattct gcattaaaaa atcaacgcaa aaaatcggac ttgcctgcaa agatgaggag 9180
ggattgcagc gtgtttttaa tgaggtcatc acgggatccc atgtgcgtga cggacatcgg 9240
gaaacgccaa aggagattat gtaccgagga agaatgtcgc tggacggtat cgcgaaaatg 9300
tattcagaaa atgattatca agccctgtat caggacatgg tacgagctaa aagattcgat 9360
accggctctt gttctgagtc atgcgaaata tttggagggc agcttgattt cgacttcggg 9420
agggaagctg catgatgcga tgttatcggt gcggtgaatg caaagaagat aaccgcttcc 9480
gaccaaatca accttactgg aatcgatggt gtctccggtg tgaaagaaca ccaacagggg 9540
tgttaccact accgcaggaa aaggaggacg tgtggcgaga cagcgacgaa gtatcaccga 9600
cataatctgc gaaaactgca aataccttcc aacgaaacgc accagaaata aacccaagcc 9660
aatcccaaaa gaatctgacg taaaaacctt caactacacg gctcacctgt gggatatccg 9720
gtggctaaga cgtcgtgcga ggaaaacaag gtgattgacc aaaatcgaag ttacgaacaa 9780
gaaagcgtcg agcgagcttt aacgtgcgct aactgcggtc agaagctgca tgtgctggaa 9840
gttcacgtgt gtgagcactg ctgcgcagaa ctgatgagcg atccgaatag ctcgatgcac 9900
gaggaagaag atgatggcta aaccagcgcg aagacgatgt aaaaacgatg aatgccggga 9960
atggtttcac cctgcattcg ctaatcagtg gtggtgctct ccagagtgtg gaaccaagat 10020
agcactcgaa cgacgaagta aagaacgcga aaaagcggaa aaagcagcag agaagaaacg 10080
acgacgagag gagcagaaac agaaagataa acttaagatt cgaaaactcg ccttaaagcc 10140
ccgcagttac tggattaaac aagcccaaca agccagga 10178
<210> 24
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Adaptor portion G of Fig 5
<400> 24
ttgaccgctc gcctc 15
Claims (51)
- 서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체는 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함하는, 돌연변이체 라이세닌 모노머.
- 청구항 1에 있어서, 상기 변이체가 하기 위치 T91, V95, Y96, S98, K99, V100, I101 및 K112 중 하나 이상에서의 변형을 포함하는, 돌연변이체 라이세닌 모노머.
- 청구항 2에 있어서, 상기 변형은 세린(S) 또는 글루타민(Q)에 의한 치환인, 돌연변이체 라이세닌 모노머.
- 청구항 2 또는 3에 있어서, 상기 변이체가 하기 치환 T91S, V95S, Y96S, S98Q, K99S, V100S, I101S 및 K112S 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머.
- 청구항 1에 있어서, 상기 변이체가 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93, Y96, S98, K99, P108, P109, T110, S111 및 T114 중 하나 이상에서의 변형을 포함하는, 돌연변이체 라이세닌 모노머.
- 청구항 5에 있어서, 상기 변형이 아스파라긴(N), 트립토판(W), 세린(S), 글루타민(Q), 라이신(K), 아스파르트산(D), 아르기닌(R), 트레오닌(T), 티로신(Y), 류신(L) 또는 이소류신(I)에 의한 치환인, 돌연변이체 라이세닌 모노머.
- 청구항 5 또는 6에 있어서, 상기 변이체가 하기 치환 K37N/W/S/Q, G43K, K45D/R/N/Q/T/Y, V47K/S/N, S49K/L, T51K, H83S/K, V88I/T, T91K, T93K, Y96D, S98K, K99Q/L, P108K/R, P109K, T110K/R, S111K 및 T114K 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머.
- 청구항 5 내지 7 중 어느 한 항에 있어서, 상기 변이체가 하기 위치의 조합 중 하나 이상에서의 변형을 포함하는, 돌연변이체 라이세닌 모노머:
E94/P108;
E94/P109;
E94/T110;
E94/P108;
E94D/T110R;
E94D/S111K;
E94D/T114K;
H83S/E94Q;
E94/K99/T106;
E94/T93/T106;
E94/T91/T106;
H83/E94/T106;
E94/Y96/T106;
K45/E94/T106;
K45/E94/T106;
E94/S98/K99/T106;
K37/E94/T106;
K37/E94/T106;
K37/E94/T106;
K45/E94/T106;
K37/E94/E102/T106;
K37/E94/E102/T106;
K37/E94/T104/T106;
K45/E94/T106;
K45/V47/E94/T106;
V47/E94/T106;
T51/E94/T106;
K45/S49/E94/T106;
S49/E94/T106;
K45/T106;
V47/E94/T106;
G43/E94/T106;
V88/M90/E94/T106;
V47/V88/E94/T106;
K45/S49/E94/E92/T106;
K45/V47/E92/E94/T106; 및
E94/K99/T106. - 청구항 8에 있어서, 상기 변이체가 하기 치환의 조합 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
E94D/P108K;
E94D/P109K;
E94D/T110K;
E94D/P108R;
E94D/T110R;
E94D/S111K;
E94D/T114K;
H83S/E94Q;
E94D/K99Q/T106K;
E94D/T93K/T106K;
E94D/T91K/T106K;
H83K/E94D/T106K;
E94Q/Y96D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
E94D/S98K/K99L/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
K45N/E94N/T106K;
K37Q/E94D/E102N/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K45Q/E94Q/T106K;
K45T/V47K/E94D/T106K;
V47S/E94D/T106K;
T51K/E94D/T106K;
K45Y/S49K/E94D/T106K;
S49L/E94D/T106K;
K45R/T106K;
V47K/E94D/T106K;
G43K/E94D/T106K;
V88I/M90A/E94D/T106K;
V47N/V88T/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45N/V47K/E92D/E94N/T106K; 및
E94D/K99Q/T106K. - 서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체가 하기 치환 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
D35N/S;
S74K/R;
E76D/N;
S78R/K/N/Q;
S80K/R/N/Q;
S82K/R/N/Q;
E84R/K/N/A;
E85N;
S86K/Q;
S89K;
M90K/I/A;
E92D/S;
E94D/Q/G/A/K/R/S/N;
E102N/Q/D/S;
T104R/K/Q;
T106R/K/Q;
R115S;
Q117S; 및
N119S. - 청구항 10에 있어서, 상기 변이체가 치환 E94D/Q/G/A/K/R/S, S86Q 및 E92S 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머.
- 청구항 10에 있어서, 상기 변이체가 하기 치환 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
D35N/S;
S74K/R;
E76D/N;
S78R/K/N/Q;
S80K/R/N/Q;
S82K/R/N/Q;
E84R/K/N/A;
E85N;
S86K;
S89K;
M90K/I/A;
E92D;
E94D/Q/K/N;
E102N/Q/D/S;
T104R/K/Q;
T106R/K/Q;
R115S;
Q117S; 및
N119S. - 청구항 12에 있어서, 상기 변이체가 하기 치환의 조합 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
E94D/E102N;
E94D/E102Q;
E94D/S80K;
S82K/E94D;
E94D/T106R;
E94D/T106K;
E94D/T104R;
E94D/T104K;
S78R/E94D;
S78K/E94D;
S80R/E94D;
S82R/E94D;
E76D/E94D;
E76N/E94D;
E94D/E102D;
E84R/E94D;
E84K/E94D;
E84N/E94D;
S78N/E94D;
S80N/E94D;
S82N/E94D;
E94D/P108K;
E94D/P109K;
S74K/E94D;
E94D/T110K;
S74R/E94D;
E94D/P108R;
E94D/T110R;
S86K/E94D;
S89K/E94D;
E94D/S111K;
E94D/T114K;
E76N/E94Q;
S78Q/E94Q;
S80Q/E94Q;
S82Q/E94Q;
H83S/E94Q;
E84A/E94Q;
E84K/E94Q;
E94Q/T104Q;
E94Q/T106Q;
E94Q/R115S;
E94Q/Q117S;
E94Q/N119S;
E94Q/D121S;
E76S/E94Q;
E94D/K99Q/T106K;
E94D/T93K/T106K;
E94D/T91K/T106K;
E94D/M90K/T106K;
E85N/E94D/T106K;
H83K/E94D/T106K;
E94Q/Y96D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
E94D/S98K/K99L/T106K;
D35N/E94D/T106K;
D35S/E94D/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
K45N/E94N/T106K;
E92D/E94Q/T106K;
K37Q/E94D/E102N/T106K;
E94Q/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K45Q/E94Q/T106K;
M90I/E94D/T106K;
K45T/V47K/E94D/T106K;
V47S/E94D/T106K;
T51K/E94D/T106K;
K45Y/S49K/E94D/T106K;
S49L/E94D/T106K;
K45R/T106K;
V47K/E94D/T106K;
G43K/E94D/T106K;
V88I/M90A/E94D/T106K;
V47N/V88T/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45N/V47K/E92D/E94N/T106K;
E94D/K99Q/T106K;
S82K/E94D/T106K; 및
Y79S/E94Q. - 서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체가 하기 위치의 조합 중 하나 이상에서의 돌연변이를 포함하는, 돌연변이체 라이세닌 모노머:
D35/E94/T106;
K37/E94/E102/T106;
K37/E94/T104/T106;
K37/E94/T106;
K37/E94/E102/T106;
G43/E94/T106;
K45/V47/E92/E94/T106;
K45/V47/E94/T106;
K45/S49/E92/E94/T106;
K45/S49/E94/T106;
K45/E94/T106;
K45/T106;
V47/E94/T106;
V47/V88/E94/T106;
S49/E94/T106;
T51/E94D/T106;
S74/E94;
E76/E94;
S78/E94;
Y79/E94;
S80/E94;
S82/E94;
S82/E94/T106;
H83/E94;
H83/E94/T106;
E85/E94/T106;
S86/E94;
V88/M90/E94/T106;
S89/E94;
M90/E94/T106;
T91/E94/T106;
E92/E94/T106;
T93/E94/T106;
E94/Y96/T106;
E94/S98/K99/T106;
E94/K99/T106;
E94/E102;
E94/T104;
E94/T106;
E94/P108;
E94/P109;
E94/T110;
E94/S111;
E94/T114;
E94/R115;
E94/Q117; 및
E94/E119. - 청구항 14에 있어서, 상기 변이체가 하기 치환의 조합 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
D35N/E94D/T106K;
D35S/E94D/T106K;
K37Q/E94D/E102N/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
G43K/E94D/T106K;
K45N/V47K/E92D/E94N/T106K;
K45T/V47K/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45Y/S49K/E94D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
K45N/E94N/T106K;
K45Q/E94Q/T106K;
K45R/T106K;
V47S/E94D/T106K;
V47K/E94D/T106K;
V47N/V88T/E94D/T106K;
S49L/E94D/T106K;
T51K/E94D/T106K;
S74K/E94D;
S74R/E94D;
E76D/E94D;
E76N/E94D;
E76S/E94Q;
E76N/E94Q;
S78R/E94D;
S78K/E94D;
S78N/E94D;
S78Q/E94Q;
Y79S/E94Q;
S80K/E94D;
S80R/E94D;
S80N/E94D;
S80Q/E94Q;
S82K/E94D;
S82R/E94D;
S82N/E94D;
S82Q/E94Q;
S82K/E94D/T106K;
H83S/E94Q;
H83K/E94D/T106K;
E85N/E94D/T106K;
S86K/E94D;
V88I/M90A/E94D/T106K;
S89K/E94D;
M90K/E94D/T106K;
M90I/E94D/T106K;
T91K/E94D/T106K;
E92D/E94Q/T106K;
T93K/E94D /T106K;
E94Q/Y96D/T106K;
E94D/S98K/K99L/T106K;
E94D/K99Q/T106K;
E94D/E102N;
E94D/E102Q;
E94D/E102D;
E94D/T104R;
E94D/T104K;
E94Q/T104Q;
E94D/T106R;
E94D/T106K;
E94Q/T106Q;
E94Q/T106K;
E94D/P108K;
E94D/P108R;
E94D/P109K;
E94D/T110K;
E94D/T110R;
E94D/S111K;
E94D/T114K;
E94Q/R115S;
E94Q/Q117S; 및
E94Q/N119S. - 서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체가 하기 치환 쌍 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
E84R/E94D;
E84K/E94D;
E84N/E94D;
E84A/E94Q;
E84K/E94Q 및
E94Q/D121S. - 청구항 1 내지 16 중 어느 한 항에 있어서, 상기 모노머가 청구항 1 내지 16 중 어느 한 항에 정의된 변형 및/또는 치환의 임의의 수 및 임의의 조합을 포함하는, 돌연변이체 라이세닌 모노머.
- 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체에서 (a) 서열번호: 2의 34 내지 70번 위치에서의 아미노산에 대응하는 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되었고, (b) 서열번호: 2의 71 내지 107번 위치에서의 아미노산에 대응하는 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실된, 돌연변이체 라이세닌 모노머.
- 청구항 18에 있어서, 동일한 수의 아미노산이 (a) 및 (b)에서 결실된, 돌연변이체 라이세닌 모노머.
- 청구항 18 또는 19에 있어서, 결실된 아미노산의 위치는 표 1 또는 2의 행 또는 표 1 및/또는 2의 둘 이상의 행에 표시되는, 돌연변이체 라이세닌 모노머.
- 청구항 18 내지 20 중 어느 한 항에 있어서, 서열번호: 2의 하기 아미노산에 대응하는 아미노산이 결실되는, 돌연변이체 라이세닌 모노머:
(i) N46/V47/T91/T92; 또는
(ii) N48/S49/T91/T92. - 청구항 18 내지 21 중 어느 한 항에 있어서, 상기 변이체는 적당한 경우, 청구항 1 내지 17 중 어느 한 항에 정의된 임의의 변형 및/또는 치환을 추가로 포함하는, 돌연변이체 라이세닌 모노머.
- 청구항 1 내지 22 중 어느 한 항에 있어서, 상기 변이체는
- 서열번호: 2의 하기 위치 (a) E84, E85, E92, E97 및 D126; (b) E85, E97 및 D126 또는 (c) E84 및 E92 중 하나 이상에서의 치환; 또는
- E84Q/E85K/E92Q/E97S/D126G 중 하나 이상 또는, 적합한 경우 E84Q/E85K/E92Q/E97S/D126G 모두에서의 치환
을 추가로 포함하는, 돌연변이체 라이세닌 모노머. - 청구항 23에 있어서, 상기 변이체는 하기 치환의 조합들 중 하나를 포함하는, 돌연변이체 라이세닌 모노머:
- E84Q/E85K/E92Q/E94D/E97S/D126G;
- E84Q/E85K/E92Q/E94Q/E97S/D126G; 또는
- E84Q/E85K/E92Q/E94D/E97S/T106K/D126G. - 청구항 1 내지 24 중 어느 한 항에 있어서, 포어를 형성할 수 있는, 돌연변이체 라이세닌 모노머.
- 청구항 1에 있어서, 상기 변이체는 서열번호: 2에 나타낸 서열과 적어도 70% 동일한 아미노산 서열을 포함하는, 돌연변이체 라이세닌 모노머.
- 라이세닌으로부터 유래된 2개 이상의 공유결합된 모노머들을 포함하는 작제물로서, 모노머 중 적어도 하나가 청구항 1 내지 26 중 어느 한 항에 정의된 돌연변이체 라이세닌 모노머인, 작제물.
- 청구항 27에 있어서, 2개 이상의 모노머가 동일하거나 상이한, 작제물.
- 청구항 27 또는 28에 있어서, 2개 이상의 모노머가 유전적으로 융합된, 작제물.
- 청구항 1 내지 26 중 어느 한 항에 따른 돌연변이체 라이세닌 모노머 또는 청구항 27에 따른 작제물을 암호화하는 폴리뉴클레오타이드.
- 청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 라이세닌 모노머 및/또는 청구항 27 내지 29 중 어느 한 항에 따른 적어도 하나의 작제물을 포함하는 포어.
- 청구항 31에 있어서, 청구항 1 내지 26 중 어느 한 항에 따른 6 내지 12개의 돌연변이체 라이세닌 모노머를 포함하는 호모-올리고머성 포어인, 포어.
- 청구항 31에 있어서, 청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 라이세닌 모노머를 포함하는 헤테로-올리고머성 포어인, 포어.
- 표적 피분석물의 특성규명(characterising) 방법으로서,
(a) 표적 피분석물이 포어를 통해 이동하도록 상기 표적 피분석물을 청구항 31 내지 33 중 어느 한 항의 포어와 접촉시키는 단계; 및
(b) 상기 포어에 대해 상기 피분석물이 이동할 때 하나 이상의 측정값을 취함으로써 상기 표적 피분석물을 특성규명하는 단계로서, 상기 측정값은 상기 표적 피분석물의 하나 이상의 특징을 나타내는, 상기 표적 피분석물을 특성규명하는 단계를 포함하는, 방법. - 청구항 34에 있어서,
(i) 포어가 2개의 구획으로 챔버를 분리시키는 막 내에 존재하고, 각각의 구획은 수용액을 함유하며;
(ii) 단계 (a)는 1개의 구획 내에 상기 피분석물을 제공하는 단계를 포함하며;
(iii) 단계 (b)는 상기 막을 가로지르는 전위차를 인가하는 단계를 포함하며; 그리고/또는
(iv) 단계 (c)는 상기 막을 가로질러 전류 흐름을 측정하는 단계를 포함하는, 방법. - 청구항 34 또는 35에 있어서, 상기 표적 피분석물이 금속 이온, 무기 염, 폴리머, 아미노산, 펩타이드, 폴리펩타이드, 단백질, 뉴클레오타이드, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 염료, 표백제, 약제, 진단제, 기분전환 약제(recreational drug), 폭발물 또는 환경오염 물질인, 방법.
- 청구항 36에 있어서, 상기 표적 피분석물이 표적 폴리뉴클레오타이드인, 방법.
- 청구항 37에 있어서, 상기 단계 (a)는 상기 표적 폴리뉴클레오타이드를 상기 포어 및 폴리뉴클레오타이드 결합 단백질과 접촉시키는 단계를 포함하며, 상기 단백질이 상기 포어를 통한 상기 표적 폴리뉴클레오타이드의 이동을 제어하는, 방법.
- 청구항 37 또는 38에 있어서, 상기 표적 폴리뉴클레오타이드를 특성규명하는 단계는 상기 표적 폴리뉴클레오타이드의 서열을 확립시키거나, 상기 표적 폴리뉴클레오타이드를 서열분석하는 단계를 포함하는, 방법.
- 표적 폴리뉴클레오타이드를 특성규명하기 위한 센서를 형성하는 방법으로서,
청구항 31 내지 33 중 어느 한 항에 따른 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성하는 단계 및 그렇게 함으로써 상기 표적 폴리뉴클레오타이드를 특성규명하기 위한 센서를 형성하는 단계를 포함하는, 방법. - 청구항 40에 있어서, 상기 복합체는 (a) 상기 표적 폴리뉴클레오타이드의 존재하에 상기 포어와 상기 폴리뉴클레오타이드 결합 단백질을 접촉시키고, (a) 상기 포어를 가로지르는 전위를 인가함으로써 형성되는, 방법.
- 청구항 41에 있어서, 상기 전위는 전압 전위 또는 화학 전위인, 방법.
- 청구항 40에 있어서, 상기 복합체는 상기 폴리뉴클레오타이드 결합 단백질에 상기 포어를 공유결합시킴으로써 형성되는, 방법.
- 표적 폴리뉴클레오타이드를 특성규명하기 위한 센서로서,
청구항 31 내지 33 중 어느 한 항에 따른 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 포함하는, 센서. - 표적 피분석물을 특성규명하기 위한, 청구항 31 내지 33 중 어느 한 항에 따른 포어의 용도.
- 표적 폴리뉴클레오타이드를 특성규명하기 위한 키트로서,
(a) 청구항 31 내지 33 중 어느 한 항에 따른 포어 및 (b) 막을 포함하는, 키트. - 청구항 46에 있어서, 상기 키트는 양친매성 층을 포함하는 칩을 추가로 포함하는, 키트.
- 샘플 내 표적 폴리뉴클레오타이드를 특성규명하기 위한 장치로서,
(a) 청구항 31 내지 33 중 어느 한 항에 따른 복수의 포어, 및 (b) 복수의 폴리뉴클레오타이드 결합 단백질을 포함하는, 샘플 내 표적 폴리뉴클레오타이드를 특성규명하기 위한 장치. - 폴리뉴클레오타이드를 특성규명하기 위해 서열번호: 2에 나타낸 서열을 포함하는 라이세닌 모노머의 능력을 개선하는 방법으로서,
청구항 1 내지 26 중 어느 한 항에 정의된 변형 및/또는 치환 중 하나 이상을 형성하는 단계를 포함하는, 방법. - 청구항 27 내지 30 중 어느 한 항에 따른 작제물의 제조 방법으로서,
라이세닌으로부터 유래된 하나 이상의 모노머에 청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 라이세닌 모노머를 공유결합시키는 단계를 포함하는, 방법. - 청구항 31 내지 33 중 어느 한 항에 따른 포어의 형성 방법으로서,
청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 모노머 또는 청구항 27 내지 30 중 어느 한 항에 따른 적어도 하나의 작제물을 충분한 수의 청구항 1 내지 26 중 어느 한 항에 따른 모노머, 청구항 27 내지 30 중 어느 한 항에 따른 작제물 및/또는 라이세닌으로부터 유래된 모노머로 올리고머화시켜, 포어를 형성하는 단계를 포함하는, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB201605899 | 2016-04-06 | ||
GB1605899.2 | 2016-04-06 | ||
GBGB1608274.5A GB201608274D0 (en) | 2016-05-11 | 2016-05-11 | Mutant pore |
GB1608274.5 | 2016-05-11 | ||
PCT/GB2017/050961 WO2017174990A1 (en) | 2016-04-06 | 2017-04-06 | Mutant pore |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180132081A true KR20180132081A (ko) | 2018-12-11 |
KR102472805B1 KR102472805B1 (ko) | 2022-12-01 |
Family
ID=58672620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187029957A KR102472805B1 (ko) | 2016-04-06 | 2017-04-06 | 돌연변이체 포어 |
Country Status (8)
Country | Link |
---|---|
US (2) | US11104709B2 (ko) |
EP (3) | EP4122949B1 (ko) |
JP (2) | JP7364333B2 (ko) |
KR (1) | KR102472805B1 (ko) |
CN (6) | CN118326019A (ko) |
AU (1) | AU2017246690B2 (ko) |
CA (2) | CA3212147A1 (ko) |
WO (1) | WO2017174990A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2836506B1 (en) | 2012-04-10 | 2017-04-19 | Oxford Nanopore Technologies Limited | Mutant lysenin pores |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
AU2015208919B9 (en) | 2014-01-22 | 2021-04-01 | Oxford Nanopore Technologies Limited | Method for attaching one or more polynucleotide binding proteins to a target polynucleotide |
EP3137490B1 (en) | 2014-05-02 | 2021-01-27 | Oxford Nanopore Technologies Limited | Mutant pores |
KR20170042794A (ko) | 2014-09-01 | 2017-04-19 | 브이아이비 브이지더블유 | 돌연변이체 csgg 포어 |
GB201502810D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Method |
US11169138B2 (en) | 2015-04-14 | 2021-11-09 | Katholieke Universiteit Leuven | Nanopores with internal protein adaptors |
KR102222188B1 (ko) | 2016-03-02 | 2021-03-02 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 돌연변이체 기공 |
EP4122949B1 (en) | 2016-04-06 | 2024-06-05 | Oxford Nanopore Technologies plc | Mutant pore |
GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
EP3645552B1 (en) | 2017-06-30 | 2023-06-28 | Vib Vzw | Novel protein pores |
GB202015993D0 (en) * | 2020-10-08 | 2020-11-25 | Oxford Nanopore Tech Ltd | Method |
CN113896776B (zh) * | 2021-10-12 | 2024-02-06 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
GB202216905D0 (en) | 2022-11-11 | 2022-12-28 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013153359A1 (en) * | 2012-04-10 | 2013-10-17 | Oxford Nanopore Technologies Limited | Mutant lysenin pores |
Family Cites Families (107)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6362002B1 (en) | 1995-03-17 | 2002-03-26 | President And Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
US5795782A (en) | 1995-03-17 | 1998-08-18 | President & Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
JP3891620B2 (ja) | 1996-11-14 | 2007-03-14 | 株式会社アイシン・コスモス研究所 | ヘアピン型構造の核酸プローブ分子、及び該核酸プローブ分子を利用した核酸検出方法 |
US20020197614A1 (en) | 1997-05-16 | 2002-12-26 | Mosaic Technologies, Inc. | Electrophoretic analysis of target molecules using adapter molecules |
AU8586298A (en) | 1997-07-25 | 1999-02-16 | University Of Massachusetts | Designed protein pores as components for biosensors |
US6743605B1 (en) | 1998-06-24 | 2004-06-01 | Enzo Life Sciences, Inc. | Linear amplification of specific nucleic acid sequences |
US6150112A (en) | 1998-09-18 | 2000-11-21 | Yale University | Methods for identifying DNA sequences for use in comparison of DNA samples by their lack of polymorphism using Y shape adaptors |
US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
US6426231B1 (en) | 1998-11-18 | 2002-07-30 | The Texas A&M University System | Analyte sensing mediated by adapter/carrier molecules |
NO986133D0 (no) | 1998-12-23 | 1998-12-23 | Preben Lexow | FremgangsmÕte for DNA-sekvensering |
US6627067B1 (en) | 1999-06-22 | 2003-09-30 | President And Fellows Of Harvard College | Molecular and atomic scale evaluation of biopolymers |
AU7901300A (en) | 1999-08-31 | 2001-03-26 | Stefan Bossmann | Method for producing a channel-forming protein |
EP1255772A2 (en) | 2000-02-11 | 2002-11-13 | The Texas A & M University System | Biosensor compositions and methods of use |
WO2001062943A1 (en) | 2000-02-25 | 2001-08-30 | Invitrogen Corporation | Topoisomerase linker-mediated amplification methods |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
AU2002239284A1 (en) | 2000-11-27 | 2002-06-03 | The Regents Of The University Of California | Methods and devices for characterizing duplex nucleic acid molecules |
US6863833B1 (en) | 2001-06-29 | 2005-03-08 | The Board Of Trustees Of The Leland Stanford Junior University | Microfabricated apertures for supporting bilayer lipid membranes |
US20030215881A1 (en) | 2002-05-10 | 2003-11-20 | Hagan Bayley | Stochastic sensing through covalent interactions |
US20040209299A1 (en) | 2003-03-07 | 2004-10-21 | Rubicon Genomics, Inc. | In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA |
AU2004225520A1 (en) | 2003-03-25 | 2004-10-14 | Stratagene | DNA polymerase fusions and uses thereof |
US7163658B2 (en) | 2003-04-23 | 2007-01-16 | Rouvain Bension | Rapid sequencing of polymers |
AU2003904237A0 (en) | 2003-08-08 | 2003-08-21 | Garvan Institute Of Medical Research | Novel translocation assay |
WO2005076010A2 (en) | 2004-02-06 | 2005-08-18 | Council Of Scientific And Industrial Research | Computational method for identifying adhesin and adhesin-like proteins of therapeutic potential |
JP2005253427A (ja) | 2004-03-15 | 2005-09-22 | Aisin Seiki Co Ltd | 核酸検出方法及び核酸単離方法 |
US7238485B2 (en) | 2004-03-23 | 2007-07-03 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
WO2005124888A1 (en) | 2004-06-08 | 2005-12-29 | President And Fellows Of Harvard College | Suspended carbon nanotube field effect transistor |
US20060105461A1 (en) | 2004-10-22 | 2006-05-18 | May Tom-Moy | Nanopore analysis system |
US7867716B2 (en) | 2004-12-21 | 2011-01-11 | The Texas A&M University System | High temperature ion channels and pores |
GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
KR100730350B1 (ko) | 2005-10-17 | 2007-06-19 | 삼성전자주식회사 | 표면처리된 나노포어를 이용한 dna 검출방법 및검출장치 |
GB0523282D0 (en) | 2005-11-15 | 2005-12-21 | Isis Innovation | Methods using pores |
WO2007075987A2 (en) | 2005-12-22 | 2007-07-05 | Pacific Biosciences Of California, Inc. | Active surface coupled polymerases |
US7849581B2 (en) | 2006-05-05 | 2010-12-14 | University Of Utah Research Foundation | Nanopore electrode, nanopore membrane, methods of preparation and surface modification, and use thereof |
US7638034B2 (en) | 2006-09-21 | 2009-12-29 | Los Alamos National Security, Llc | Electrochemical detection of single molecules using abiotic nanopores having electrically tunable dimensions |
EP2122344B8 (en) | 2007-02-20 | 2019-08-21 | Oxford Nanopore Technologies Limited | Lipid bilayer sensor system |
CA2684801C (en) | 2007-04-04 | 2017-10-10 | The Regents Of The University Of California | Compositions, devices, systems, and methods for using a nanopore |
AU2008287286B2 (en) * | 2007-04-13 | 2013-10-10 | The Board Of Regents Of The University Of Oklahoma | Mutants of cholesterol-dependent cytolysins and uses thereof |
GB0716264D0 (en) | 2007-08-21 | 2007-09-26 | Isis Innovation | Bilayers |
EP3540436B1 (en) | 2007-09-12 | 2023-11-01 | President And Fellows Of Harvard College | High-resolution molecular sensor |
GB2453377A (en) | 2007-10-05 | 2009-04-08 | Isis Innovation | Transmembrane protein pores and molecular adapters therefore. |
US8951731B2 (en) | 2007-10-15 | 2015-02-10 | Complete Genomics, Inc. | Sequence analysis using decorated nucleic acids |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
US8231969B2 (en) | 2008-03-26 | 2012-07-31 | University Of Utah Research Foundation | Asymmetrically functionalized nanoparticles |
CN104862383B (zh) | 2008-03-28 | 2019-05-28 | 加利福尼亚太平洋生物科学股份有限公司 | 用于核酸测序的组合物和方法 |
EP2293921A4 (en) | 2008-05-22 | 2013-05-22 | Univ California | MEMBRANE PROBLEMS AND MEMBRANES MADE FROM THESE |
US8652771B2 (en) | 2008-05-28 | 2014-02-18 | University of Souther California | Measurement of succinate in urine samples as a biomarker of kidney damage in diabetic subjects |
WO2010004273A1 (en) | 2008-07-07 | 2010-01-14 | Oxford Nanopore Technologies Limited | Base-detecting pore |
CN103695530B (zh) | 2008-07-07 | 2016-05-25 | 牛津纳米孔技术有限公司 | 酶-孔构建体 |
EP2344891B1 (en) | 2008-09-22 | 2016-03-16 | University Of Washington | Msp nanopores and related methods |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
GB0820927D0 (en) | 2008-11-14 | 2008-12-24 | Isis Innovation | Method |
EP2391655B1 (en) | 2009-01-30 | 2017-10-11 | Oxford Nanopore Technologies Limited | Hybridization linkers |
AU2010209528B2 (en) | 2009-01-30 | 2015-10-01 | Oxford Nanopore Technologies Limited | Adaptors for nucleic acid constructs in transmembrane sequencing |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
AU2010240670B2 (en) | 2009-04-20 | 2015-08-20 | Oxford Nanopore Technologies Limited | Lipid bilayer sensor array |
WO2011067559A1 (en) | 2009-12-01 | 2011-06-09 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument |
CA3116307C (en) | 2010-02-23 | 2023-10-17 | University Of Washington | Artificial mycolic acid membranes |
EP2556085A2 (en) | 2010-04-05 | 2013-02-13 | Bar-Ilan University | Protease-activatable pore-forming polypeptides |
CN103370617B (zh) | 2010-10-01 | 2015-11-25 | 牛津纳米孔技术有限公司 | 生物化学分析设备和旋转阀 |
CN102116783B (zh) | 2010-12-31 | 2013-05-29 | 北京普源精电科技有限公司 | 一种波形显示方法 |
CN102174554A (zh) | 2011-01-24 | 2011-09-07 | 内蒙古民族大学 | 双控双调节原核表达载体系统及其构建方法和用途 |
WO2012107778A2 (en) | 2011-02-11 | 2012-08-16 | Oxford Nanopore Technologies Limited | Mutant pores |
WO2012164270A1 (en) | 2011-05-27 | 2012-12-06 | Oxford Nanopore Technologies Limited | Coupling method |
WO2012166906A1 (en) | 2011-05-31 | 2012-12-06 | Massachusetts Institute Of Technology | Cell-directed synthesis of multifunctional nanopatterns and nanomaterials |
AU2012288629B2 (en) | 2011-07-25 | 2017-02-02 | Oxford Nanopore Technologies Limited | Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores |
JP6457811B2 (ja) | 2011-09-23 | 2019-01-23 | オックスフォード ナノポール テクノロジーズ リミテッド | ポリマー単位を含むポリマーの解析 |
US9758823B2 (en) | 2011-10-21 | 2017-09-12 | Oxford Nanopore Technologies Limited | Enzyme method |
WO2013098561A1 (en) | 2011-12-29 | 2013-07-04 | Oxford Nanopore Technologies Limited | Method for characterising a polynucelotide by using a xpd helicase |
US10385382B2 (en) | 2011-12-29 | 2019-08-20 | Oxford Nanopore Technologies Ltd. | Enzyme method |
CN107828877A (zh) | 2012-01-20 | 2018-03-23 | 吉尼亚科技公司 | 基于纳米孔的分子检测与测序 |
AU2013220156B2 (en) | 2012-02-15 | 2018-08-09 | Oxford Nanopore Technologies Limited | Aptamer method |
TWI655213B (zh) | 2012-07-13 | 2019-04-01 | 目立康股份有限公司 | 自我組織化肽衍生物的製造方法 |
CA2879355C (en) | 2012-07-19 | 2021-09-21 | Oxford Nanopore Technologies Limited | Helicase construct and its use in characterising polynucleotides |
CA2879261C (en) | 2012-07-19 | 2022-12-06 | Oxford Nanopore Technologies Limited | Modified helicases |
US11155860B2 (en) | 2012-07-19 | 2021-10-26 | Oxford Nanopore Technologies Ltd. | SSB method |
WO2014064444A1 (en) | 2012-10-26 | 2014-05-01 | Oxford Nanopore Technologies Limited | Droplet interfaces |
GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
US10179933B2 (en) | 2013-02-07 | 2019-01-15 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Hybrid nanopores and uses thereof for detection of analytes |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
AU2014224432B2 (en) | 2013-03-08 | 2019-10-24 | Oxford Nanopore Technologies Limited | Enzyme stalling method |
ES2724824T3 (es) | 2013-03-13 | 2019-09-16 | Illumina Inc | Métodos para la secuenciación de ácidos nucleicos |
US10613076B2 (en) | 2013-03-14 | 2020-04-07 | The Trustees Of Boston University | Optoelectronic control of solid-state nanopores |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
DK3004378T3 (en) | 2013-05-24 | 2018-03-26 | Illumina Cambridge Ltd | Pyrophosphorolytic sequencing using nanopores |
WO2015051378A1 (en) | 2013-10-04 | 2015-04-09 | University Of Washington Through Its Center For Commercialization | Systems and methods for nanopore-based analysis of nucleic acids |
CN105899678A (zh) | 2013-10-18 | 2016-08-24 | 牛津纳米孔技术公司 | 经修饰的酶 |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
CN105934522B (zh) | 2013-11-26 | 2021-07-20 | 伊鲁米那股份有限公司 | 用于多核苷酸测序的组合物和方法 |
WO2015097289A1 (en) | 2013-12-24 | 2015-07-02 | Vib Vzw | Secretion and functional display of chimeric polypeptides |
AU2015208919B9 (en) | 2014-01-22 | 2021-04-01 | Oxford Nanopore Technologies Limited | Method for attaching one or more polynucleotide binding proteins to a target polynucleotide |
GB201406155D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
US10337060B2 (en) | 2014-04-04 | 2019-07-02 | Oxford Nanopore Technologies Ltd. | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
EP3137490B1 (en) | 2014-05-02 | 2021-01-27 | Oxford Nanopore Technologies Limited | Mutant pores |
US9925679B2 (en) | 2014-05-19 | 2018-03-27 | I+D+M Creative, Llc | Devices and methods for assisting with slicing items |
FR3023394B1 (fr) | 2014-07-02 | 2017-12-29 | Adn Access Data Networks | Dispositif permettant de faciliter l'enseignement de la langue amharique et d'en normaliser l'ecriture |
KR20170042794A (ko) | 2014-09-01 | 2017-04-19 | 브이아이비 브이지더블유 | 돌연변이체 csgg 포어 |
US10266885B2 (en) | 2014-10-07 | 2019-04-23 | Oxford Nanopore Technologies Ltd. | Mutant pores |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
GB201502810D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Method |
US11169138B2 (en) | 2015-04-14 | 2021-11-09 | Katholieke Universiteit Leuven | Nanopores with internal protein adaptors |
EP3387432B1 (en) | 2015-12-08 | 2022-09-28 | Katholieke Universiteit Leuven KU Leuven Research & Development | Modified nanopores, compositions comprising the same, and uses thereof |
KR102222188B1 (ko) | 2016-03-02 | 2021-03-02 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 돌연변이체 기공 |
EP4122949B1 (en) | 2016-04-06 | 2024-06-05 | Oxford Nanopore Technologies plc | Mutant pore |
GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
EP3645552B1 (en) | 2017-06-30 | 2023-06-28 | Vib Vzw | Novel protein pores |
-
2017
- 2017-04-06 EP EP22179411.8A patent/EP4122949B1/en active Active
- 2017-04-06 CN CN202410563199.2A patent/CN118326019A/zh active Pending
- 2017-04-06 EP EP17722128.0A patent/EP3440098B1/en active Active
- 2017-04-06 AU AU2017246690A patent/AU2017246690B2/en active Active
- 2017-04-06 CN CN202410563192.0A patent/CN118272512A/zh active Pending
- 2017-04-06 CA CA3212147A patent/CA3212147A1/en active Pending
- 2017-04-06 WO PCT/GB2017/050961 patent/WO2017174990A1/en active Application Filing
- 2017-04-06 CN CN202310422087.0A patent/CN116514944A/zh active Pending
- 2017-04-06 CN CN201780022553.9A patent/CN109071618A/zh active Pending
- 2017-04-06 EP EP24163939.2A patent/EP4397970A2/en active Pending
- 2017-04-06 KR KR1020187029957A patent/KR102472805B1/ko active IP Right Grant
- 2017-04-06 CA CA3020203A patent/CA3020203A1/en active Pending
- 2017-04-06 US US16/091,746 patent/US11104709B2/en active Active
- 2017-04-06 CN CN202410563197.3A patent/CN118326018A/zh active Pending
- 2017-04-06 JP JP2018552853A patent/JP7364333B2/ja active Active
- 2017-04-06 CN CN202410563195.4A patent/CN118256605A/zh active Pending
-
2021
- 2021-07-26 US US17/384,889 patent/US11939359B2/en active Active
-
2022
- 2022-03-16 JP JP2022041806A patent/JP2022095668A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013153359A1 (en) * | 2012-04-10 | 2013-10-17 | Oxford Nanopore Technologies Limited | Mutant lysenin pores |
KR20150003272A (ko) * | 2012-04-10 | 2015-01-08 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 돌연변이체 리세닌 기공 |
JP2015514128A (ja) * | 2012-04-10 | 2015-05-18 | オックスフォード ナノポール テクノロジーズ リミテッド | 変異体ライセニンポア |
Also Published As
Publication number | Publication date |
---|---|
US20220064230A1 (en) | 2022-03-03 |
EP3440098A1 (en) | 2019-02-13 |
CN116514944A (zh) | 2023-08-01 |
CN118256605A (zh) | 2024-06-28 |
EP3440098B1 (en) | 2022-07-27 |
EP4397970A2 (en) | 2024-07-10 |
EP4122949B1 (en) | 2024-06-05 |
US11939359B2 (en) | 2024-03-26 |
KR102472805B1 (ko) | 2022-12-01 |
US20190202876A1 (en) | 2019-07-04 |
CA3212147A1 (en) | 2017-10-12 |
JP2022095668A (ja) | 2022-06-28 |
CN118326019A (zh) | 2024-07-12 |
AU2017246690B2 (en) | 2022-03-24 |
CA3020203A1 (en) | 2017-10-12 |
CN118326018A (zh) | 2024-07-12 |
CN118272512A (zh) | 2024-07-02 |
EP4122949A1 (en) | 2023-01-25 |
WO2017174990A1 (en) | 2017-10-12 |
JP2019520035A (ja) | 2019-07-18 |
JP7364333B2 (ja) | 2023-10-18 |
AU2017246690A1 (en) | 2018-10-18 |
CN109071618A (zh) | 2018-12-21 |
US11104709B2 (en) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102472805B1 (ko) | 돌연변이체 포어 | |
US11845780B2 (en) | Mutant lysenin pores | |
KR102222192B1 (ko) | 돌연변이체 기공 | |
US20180030526A1 (en) | Hetero-pores | |
US20220127310A1 (en) | Mutant aerolysin and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |