CN114957412A - 一种新型孔蛋白单体及其应用 - Google Patents
一种新型孔蛋白单体及其应用 Download PDFInfo
- Publication number
- CN114957412A CN114957412A CN202210471257.XA CN202210471257A CN114957412A CN 114957412 A CN114957412 A CN 114957412A CN 202210471257 A CN202210471257 A CN 202210471257A CN 114957412 A CN114957412 A CN 114957412A
- Authority
- CN
- China
- Prior art keywords
- mutant
- pore
- seq
- mutation
- target analyte
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108010013381 Porins Proteins 0.000 title claims abstract description 82
- 239000000178 monomer Substances 0.000 title claims abstract description 68
- 102000007739 porin activity proteins Human genes 0.000 title abstract 4
- 230000035772 mutation Effects 0.000 claims abstract description 62
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 56
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 43
- 239000012491 analyte Substances 0.000 claims abstract description 42
- 239000011148 porous material Substances 0.000 claims description 126
- 102000017033 Porins Human genes 0.000 claims description 78
- 125000003729 nucleotide group Chemical group 0.000 claims description 53
- 239000002773 nucleotide Substances 0.000 claims description 52
- 102000039446 nucleic acids Human genes 0.000 claims description 46
- 108020004707 nucleic acids Proteins 0.000 claims description 46
- 150000007523 nucleic acids Chemical class 0.000 claims description 46
- 108060004795 Methyltransferase Proteins 0.000 claims description 36
- 239000012528 membrane Substances 0.000 claims description 26
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 22
- 150000001413 amino acids Chemical class 0.000 claims description 20
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 19
- 108091006146 Channels Proteins 0.000 claims description 18
- 238000005259 measurement Methods 0.000 claims description 13
- 238000012217 deletion Methods 0.000 claims description 12
- 230000037430 deletion Effects 0.000 claims description 12
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 11
- 229920001184 polypeptide Polymers 0.000 claims description 9
- 102220476699 Interleukin-1 receptor-associated kinase 3_F83A_mutation Human genes 0.000 claims description 6
- 102220591670 WW domain-binding protein 2_Y75F_mutation Human genes 0.000 claims description 6
- 102000044158 nucleic acid binding protein Human genes 0.000 claims description 6
- 108700020942 nucleic acid binding protein Proteins 0.000 claims description 6
- 102220193244 rs1057516147 Human genes 0.000 claims description 6
- 102220184129 rs778408190 Human genes 0.000 claims description 6
- 239000004174 erythrosine Substances 0.000 claims description 5
- 108060002716 Exonuclease Proteins 0.000 claims description 4
- 108091070641 Hel308 family Proteins 0.000 claims description 4
- 102000013165 exonuclease Human genes 0.000 claims description 4
- 102220471249 M-phase inducer phosphatase 1_S82A_mutation Human genes 0.000 claims description 3
- 102220509346 Retinoic acid early transcript 1E_Q74L_mutation Human genes 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 3
- 102200158858 rs34435255 Human genes 0.000 claims description 3
- 102220156195 rs749061654 Human genes 0.000 claims description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 2
- 108010017842 Telomerase Proteins 0.000 claims description 2
- 101710183280 Topoisomerase Proteins 0.000 claims description 2
- 108010020764 Transposases Proteins 0.000 claims description 2
- 102000008579 Transposases Human genes 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims description 2
- 238000010168 coupling process Methods 0.000 claims description 2
- 238000005859 coupling reaction Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000007672 fourth generation sequencing Methods 0.000 abstract description 16
- 230000003993 interaction Effects 0.000 abstract description 11
- 230000008569 process Effects 0.000 abstract description 10
- 230000009471 action Effects 0.000 abstract description 3
- 230000006872 improvement Effects 0.000 abstract description 2
- 102000040430 polynucleotide Human genes 0.000 description 71
- 108091033319 polynucleotide Proteins 0.000 description 71
- 239000002157 polynucleotide Substances 0.000 description 71
- 102000053602 DNA Human genes 0.000 description 51
- 108020004414 DNA Proteins 0.000 description 51
- 238000012163 sequencing technique Methods 0.000 description 47
- 238000005516 engineering process Methods 0.000 description 16
- 125000000539 amino acid group Chemical group 0.000 description 12
- 230000005945 translocation Effects 0.000 description 10
- 238000009826 distribution Methods 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 108091093037 Peptide nucleic acid Proteins 0.000 description 8
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 6
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- 102000014914 Carrier Proteins Human genes 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 108091008324 binding proteins Proteins 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 108010081551 glycylphenylalanine Proteins 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 4
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 4
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 4
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 4
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 4
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 4
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 4
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 4
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 4
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 4
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 4
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 4
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 4
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 4
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 4
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 4
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 4
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 4
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 4
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 4
- 239000002808 molecular sieve Substances 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 4
- 150000003904 phospholipids Chemical class 0.000 description 4
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 4
- 229920001059 synthetic polymer Polymers 0.000 description 4
- 208000035657 Abasia Diseases 0.000 description 3
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 239000004971 Cross linker Substances 0.000 description 3
- 108091093094 Glycol nucleic acid Proteins 0.000 description 3
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 3
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- -1 Threose Nucleic Acids Chemical class 0.000 description 3
- 108091046915 Threose nucleic acid Proteins 0.000 description 3
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 150000004676 glycans Chemical class 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 102000035118 modified proteins Human genes 0.000 description 3
- 108091005573 modified proteins Proteins 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- RUQBGIMJQUWXPP-CYDGBPFRSA-N Ala-Leu-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O RUQBGIMJQUWXPP-CYDGBPFRSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 2
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 2
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 2
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 2
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 2
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 2
- GHAHOJDCBRXAKC-IHPCNDPISA-N Asp-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N GHAHOJDCBRXAKC-IHPCNDPISA-N 0.000 description 2
- 241000003077 Caballeronia telluris Species 0.000 description 2
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 2
- XMWNHGKDDIFXQJ-NWLDYVSISA-N Gln-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XMWNHGKDDIFXQJ-NWLDYVSISA-N 0.000 description 2
- VCUNGPMMPNJSGS-JYJNAYRXSA-N Gln-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VCUNGPMMPNJSGS-JYJNAYRXSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 2
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 2
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- UMRIXLHPZZIOML-OALUTQOASA-N Gly-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN UMRIXLHPZZIOML-OALUTQOASA-N 0.000 description 2
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 2
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerol Natural products OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 2
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 2
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 2
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 2
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 2
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 2
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 2
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 2
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 2
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 2
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 2
- GXWRTSIVLSQACD-RCWTZXSCSA-N Pro-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1)O GXWRTSIVLSQACD-RCWTZXSCSA-N 0.000 description 2
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 2
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 2
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- 241001052560 Thallis Species 0.000 description 2
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 2
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 2
- UEFHVUQBYNRNQC-SFJXLCSZSA-N Trp-Phe-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 UEFHVUQBYNRNQC-SFJXLCSZSA-N 0.000 description 2
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 2
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 2
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 2
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 2
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 2
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 2
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 150000001345 alkine derivatives Chemical class 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000032 diagnostic agent Substances 0.000 description 2
- 229940039227 diagnostic agent Drugs 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005684 electric field Effects 0.000 description 2
- 239000003792 electrolyte Substances 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000002360 explosive Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229910017053 inorganic salt Inorganic materials 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 108091005703 transmembrane proteins Proteins 0.000 description 2
- 102000035160 transmembrane proteins Human genes 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 230000005641 tunneling Effects 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 1
- VLSDXINSOMDCBK-BQYQJAHWSA-N (E)-1,1'-azobis(N,N-dimethylformamide) Chemical compound CN(C)C(=O)\N=N\C(=O)N(C)C VLSDXINSOMDCBK-BQYQJAHWSA-N 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- 150000003923 2,5-pyrrolediones Chemical class 0.000 description 1
- QRZUPJILJVGUFF-UHFFFAOYSA-N 2,8-dibenzylcyclooctan-1-one Chemical compound C1CCCCC(CC=2C=CC=CC=2)C(=O)C1CC1=CC=CC=C1 QRZUPJILJVGUFF-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 101710092462 Alpha-hemolysin Proteins 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000701844 Bacillus virus phi29 Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241001518086 Bartonella henselae Species 0.000 description 1
- 241001678070 Caballeronia Species 0.000 description 1
- 241000606678 Coxiella burnetii Species 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- MGAWEOHYNIMOQJ-ACZMJKKPSA-N Cys-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N MGAWEOHYNIMOQJ-ACZMJKKPSA-N 0.000 description 1
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241000192091 Deinococcus radiodurans Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- JUUNNOLZGVYCJT-JYJNAYRXSA-N Gln-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JUUNNOLZGVYCJT-JYJNAYRXSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 108090000862 Ion Channels Proteins 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- SVJRVFPSHPGWFF-DCAQKATOSA-N Lys-Cys-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVJRVFPSHPGWFF-DCAQKATOSA-N 0.000 description 1
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- CRVSHEPROQHVQT-AVGNSLFASA-N Met-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N CRVSHEPROQHVQT-AVGNSLFASA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- YGYAWVDWMABLBF-UHFFFAOYSA-N Phosgene Chemical compound ClC(Cl)=O YGYAWVDWMABLBF-UHFFFAOYSA-N 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- VBZXFFYOBDLLFE-HSHDSVGOSA-N Pro-Trp-Thr Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H]([C@H](O)C)C(O)=O)C(=O)[C@@H]1CCCN1 VBZXFFYOBDLLFE-HSHDSVGOSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 241000205101 Sulfolobus Species 0.000 description 1
- 241000205091 Sulfolobus solfataricus Species 0.000 description 1
- 102000003141 Tachykinin Human genes 0.000 description 1
- 101000865057 Thermococcus litoralis DNA polymerase Proteins 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- DNCUODYZAMHLCV-XGEHTFHBSA-N Thr-Pro-Cys Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N)O DNCUODYZAMHLCV-XGEHTFHBSA-N 0.000 description 1
- 108091011223 Transmembrane protein 121 Proteins 0.000 description 1
- OSYOKZZRVGUDMO-HSCHXYMDSA-N Trp-Lys-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OSYOKZZRVGUDMO-HSCHXYMDSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- IWRMTNJCCMEBEX-AVGNSLFASA-N Tyr-Glu-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O IWRMTNJCCMEBEX-AVGNSLFASA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 229940092524 bartonella henselae Drugs 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 229910021393 carbon nanotube Inorganic materials 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- ROSVUDLPLHNVHN-UHFFFAOYSA-N dibenzocyclooctynol Chemical compound C1#CCCC2=CC=CC=C2C2=C1C=CC=C2O ROSVUDLPLHNVHN-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000002847 impedance measurement Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 239000000138 intercalating agent Substances 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical group 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- KZNICNPSHKQLFF-UHFFFAOYSA-N succinimide Chemical class O=C1CCC(=O)N1 KZNICNPSHKQLFF-UHFFFAOYSA-N 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 108060008037 tachykinin Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种新型孔蛋白单体,一种突变孔及其在表征靶分析物中的应用。特别是,所述的孔蛋白单体包含多位点突变,提供了在纳米孔测序过程中全新的作用模式,对孔蛋白与控速蛋白相互作用界面的稳定性,提高纳米孔测序的分辨率有积极影响。
Description
技术领域
本发明涉及纳米孔测序技术领域,具体涉及一种新型孔蛋白单体及其应用。
背景技术
随着对DNA结构和序列的研究,DNA测序技术不断发展,成为生命科学研究的核心领域,对生物、化学、电学、生命科学、医学等领域的技术发展起到巨大的推动作用。利用纳米孔研究出新型的快速、准确、低成本、高精度及高通量的DNA测序技术是后人类基因组计划的热点之一。
Nanopore sequencing即纳米孔DNA测序技术,又被称为第四代测序技术,是Oxford Nanopore Technologies公司首先推出产品的新一代的测序技术。目前DNA测序最长长度可以达到Mb级别,并可实现天然DNA和RNA测序并可直接获取DNA和RNA的碱基修饰信息。纳米孔检测技术作为一个新型平台,具有低成本、高通量、非标记等优势,可将基因组测序的成本降低到1000美元以下。
纳米孔分析技术起源于Coulter计数器的发明以及单通道电流的记录技术。生理与医学诺贝尔奖获得者Neher和Sakamann在1976年利用膜片钳技术测量膜电势,研究膜蛋白及离子通道,推动了纳米孔测序技术的实际应用进程。1996年,Kasianowicz等提出了利用α-溶血素对DNA测序的新设想,是生物纳米孔单分子测序的里程碑标志。随后,MspA孔蛋白、噬菌体Phi29连接器等生物纳米孔的研究报道,丰富了纳米孔分析技术的研究。Li等在2001年开启了固态纳米孔研究的新时代。受限于半导体和材料工业的发展,固态纳米孔测序进展缓慢。目前以ONT为主流的纳米孔测序公司和商业化产品均采用生物孔作为纳米孔测序的主要实现手段。生物纳米孔发展到今天,以大肠杆菌来源的CsgG蛋白为骨架的单读取头突变孔(对应ONT的R9系列孔)和CsgG-CsgF为骨架的双读取头突变孔(对应ONT的R10系列孔)的单次测序精度已经超过99%,使该技术展示出了强大的应用潜力。
目前,纳米孔测序技术与二代技术相比,测序准确度较低,最高单次测序准确率为99.2%,与二代测序相比具有较大差距。而准确率与孔蛋白直接相关。另外,与测序体系(包括孔蛋白)相关的生化体系对测序精度的影响也至关重要。孔蛋白还涉及到与控速蛋白的相互作用的模式变化,进一步优化孔蛋白与控速蛋白相互作用界面的稳定性,对提高测序数据的一致性和稳定性有积极影响。因此研发新型孔蛋白,进一步提高纳米孔测序的分辨率尤为重要。
发明内容
本发明制备了一种新型突变孔,基于其特定的来源和本申请设计的突变,使得其可以用于纳米孔测序,应用本发明所述的突变孔进行纳米孔测序,可以明显的看出各种不同核苷酸电流信号的差别,具备较高的测序精确度。
具体地,第一方面,提供了一种孔蛋白单体。
所述的孔蛋白单体来自于β变形菌类群,例如卡巴列罗菌属,也叫特产卡伯球藻菌(Caballeronia telluris),序列参见AWB66_04472。
所述的孔蛋白单体包括SEQ ID NO:1的突变体,所述的突变体为与SEQ ID NO:1具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列,所述的突变体包含在SEQ ID NO:1的74-130位具有任何一个或多个氨基酸突变的氨基酸序列。
优选的,所述的突变包含氨基酸的插入、缺失和/或替换。
优选的,所述的突变体包括在SEQ ID NO:1的74-83、75-83、78-83、75-130或78-130位的一个或多个位置处的突变。
优选的,所述的突变体还包括在SEQ ID NO:1的1-73或131-314位的一个或多个位置处的突变。
优选的,所述的突变体包括在SEQ ID NO:1的S78、D80、S82或F83位中的一种或两种以上的组合的突变;进一步优选包含下列任一种或两种以上的组合:
A)S78突变为78V或78Y;
B)D80突变为80N或D80缺失;
C)S82突变为82A、82N或82V;
D)F83突变为83Q或83A。
优选的,所述的突变体还包括在SEQ ID NO:1的Y75和/或S81的突变;进一步优选包含Y75突变为75F,和/或,S81突变为81A。
优选的,所述的突变体还包括在SEQ ID NO:1的Q74、E127和/或D130位中的一种、两种或三种的突变,进一步优选包含Q74突变为74L、E127突变为127R和/或D130突变为130K。
在本发明的一个具体实施方式中,所述的突变位置包括:
(1)对应SEQ ID NO:1的S78、D80、S82和F83的一个或多个位置处具有氨基酸的插入、缺失和/或替换;
(2)SEQ ID NO:1的Y75、S78、D80、S81、S82和F83的一个或多个位置处具有氨基酸的插入、缺失和/或替换;或,
(3)SEQ ID NO:1的Q74、Y75、S78、D80、S81、S82、F83、E127和D130的一个或多个位置处具有氨基酸的插入、缺失和/或替换。
在本发明的一个具体实施方式中,所述的孔蛋白单体的突变体包括以下突变:
(a)SEQ ID NO:1的S78V、D80N、S82A和F83Q;
(b)SEQ ID NO:1的Y75F、S78Y、D80缺失、S81A、S82N和F83A;或,
(c)SEQ ID NO:1的Q74L、Y75F、S78Y、D80缺失、S81A、S82V、F83A、E127R和D130K。
在本发明的一个具体实施方式中,所述的a)中突变体的氨基酸序列包括SEQ IDNO:3或与SEQ ID NO:3具有70%、75%、80%、85%、90%、95%或99%同一性的氨基酸序列。
在本发明的一个具体实施方式中,所述的b)中突变体的氨基酸序列包括SEQ IDNO:4或与SEQ ID NO:4具有70%、75%、80%、85%、90%、95%或99%同一性的氨基酸序列。
在本发明的一个具体实施方式中,所述的c)中突变体的氨基酸序列包括SEQ IDNO:5或与SEQ ID NO:5具有70%、75%、80%、85%、90%、95%或99%同一性的氨基酸序列。
第二方面,提供了一种构建体,所述的构建体包含至少一个上述的孔蛋白单体。其中,所述的构建体保留了形成孔的能力。
优选的,所述的构建体包含来源于Caballeronia telluris的野生型孔蛋白单体(序列参见AWB66_04472)。
优选的,所述的构建体包含如SEQ ID NO:1所示的野生型孔蛋白单体。
优选的,所述构建体包含1-20(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20)个SEQ ID NO:1的突变体,其中所述的突变体相同或不同。
优选的,其中所述构建体含有1-20(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20)个野生型孔蛋白单体。
优选的,其中所述的突变体和突变体、野生型孔蛋白单体和野生型孔蛋白单体、突变体与野生型孔蛋白单体共价连接。
第三方面,提供了一种突变孔,包括至少一个上述的孔蛋白单体。
优选的,所述的突变孔包含来源于Caballeronia telluris的野生型孔蛋白单体(序列参见AWB66_04472)。
优选的,所述的突变孔包含如SEQ ID NO:1所示的野生型孔蛋白单体。
优选的,所述突变孔包含1-20(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20)个SEQ ID NO:1的突变体,其中所述突变体相同或不同。
优选的,其中所述突变孔含有1-20(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20)个野生型孔蛋白单体。
优选的,其中所述的突变体和突变体、野生型孔蛋白单体和野生型孔蛋白单体、突变体与野生型孔蛋白单体共价连接。
在本发明的一个具体实施方式中,所述的共价连接可以采用化学交联剂、线性分子或催化剂连接。所述的化学交联剂包括但不限于马来酰亚胺,活性酯,琥珀酰亚胺,叠氮化物,炔烃(诸如二苯并环辛炔醇(DIBO或DBCO),二氟环炔烃和线性炔烃)等;化学交联剂的长度可以从一个碳(碳酰氯型连接器)到多个埃变化。所述的线性分子包括但不限于聚乙二醇(PEGs),多肽,多糖,脱氧核糖核酸(DNA),肽核酸(PNA),苏糖核酸(TNA),甘油核酸(GNA),饱和的和不饱和的烃,聚酰胺。所述的催化剂包括但不限于TMAD等任何可以使得突变体和突变体、野生型孔蛋白单体和野生型孔蛋白单体、突变体与野生型孔蛋白单体之间产生共价键的催化剂。
优选的,当多核苷酸单链通过包含至少一个SEQ ID NO:1的突变体的突变孔时,其孔内缢缩区形成的读取头结构可在当多核苷酸单链通过突变孔时,导致由不同类型核苷酸的物理或化学性质差异引起的孔阻力差异,例如电流的阻塞,从而短暂地影响流过突变孔的电流强度(每种碱基所影响的电流变化幅度是不同的)。
优选的,所述的突变导致电荷性质或者氨基酸疏水性质变化。
优选的,所述的孔阻力差异是指可用于表征多核苷酸的特征,所述的特征包括多核苷酸的来源、长度、大小、分子量、同一性、序列、二级结构、浓度或多核苷酸是否被修饰。进一步优选的,所述的孔阻力差异是指可用于表征多核苷酸的序列特征,即所述的突变孔可以用于测序,精确的区分多核苷酸的不同碱基。
优选的,所述的多核苷酸可以是天然存在的或人工合成的。进一步优选的,所述的多核苷酸可以是天然的DNA、RNA或者经过修饰的DNA或RNA。
优选的,多核苷酸可以为任意长度。例如,多核苷酸的长度可以是至少10,至少50,至少100,至少150,至少200,至少250,至少300,至少400或至少500个核苷酸或核苷酸对。所述多核苷酸的长度可以为1000个或更多个核苷酸或核苷酸对,5000个或更多个核苷酸或核苷酸对或100000个或更多个核苷酸或核苷酸对。
更进一步优选的,所述的多核苷酸中的一个或多个核苷酸可以是经过修饰的,例如甲基化、氧化、损伤、脱碱基的、蛋白标记、带有标签或多核苷酸序列中间连接一段间隔物。
更进一步优选的,所述人工合成的核酸选自肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁定核酸(LNA)或其他具有核苷侧链的合成聚合物。
优选的,所述的多核苷酸为单链、双链或至少一部分是双链的。
优选的,所述突变孔包含冠状体形成区、缢缩区、环形区域和/或跨膜β桶状体区域。
优选的,其中包含至少一种突变体的突变孔的缢缩区的孔径小于由SEQ ID NO:1所示的野生型孔蛋白单体组成的孔蛋白的缢缩区中的孔径。
优选的,所述突变孔的缢缩区孔道直径为优选的,所述的突变包含在缢缩区的一个或多个位置处的突变。优选的,为促进突变孔在测序过程中能提供良好的信号特征,冠状体形成区域、环形区域和/或跨膜β桶状体区域也可以包含一个或多个位置处的突变。
优选的,所述的突变孔是允许水合离子在施加的电势的驱动下从膜的一侧流向膜的另一侧的结构。进一步优选的,所述的突变孔为纳米孔,所述的纳米孔为跨膜孔。所述跨膜孔为多核苷酸的移动提供了通道。
所述的膜可以为任何现有技术中存在的膜,优选为两性分子层,即一种由具有至少一个亲水性部分和至少一个亲脂性或疏水性部分的两性分子诸如磷脂质形成的层,两性分子可以是合成的或天然存在的。进一步优选的,所述的膜为脂质双层膜。
所述的多核苷酸可以使用任何已知的方法连接到膜上。如果膜是两性分子层,如脂质双分子层,所述多核苷酸优选通过在所述膜中存在的多肽或通过在所述膜中存在的疏水锚被连接到该膜上。其中,疏水锚优选为脂质、脂肪酸、甾醇、碳纳米管或氨基酸。
第四方面,提供了一种用于表征靶分析物的复合物,所述的复合物包括上述的突变孔,以及与其配合使用的控速蛋白。
优选的,所述的控速蛋白包括核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、转录酶、转位酶和/或聚合酶中的一种或多种组合。
进一步优选的,所述的核酸结合蛋白包括但不限于修饰或者野生的真核单链结合蛋白、细菌单链结合蛋白、古生单链结合蛋白、病毒单链结合蛋白或双链结合蛋白中的一种或两种以上的组合。所述的核酸结合蛋白包括但不限于来自Escherichia coli的SSBEco、来自Bartonella henselae的SSBBhe、来自Coxiella burnetii的SSBCbu、来自Thermathogamaritima的SSBTma、来自Helicobacter pylori的SSBHpy、来自Deinococcusradiodurans的SSBDra、来自Thermus aquaticus的SSBTaq、来自Mycobacterium smegmatis的SSBMsm、来自Sulfolobus solfataricus的SSBSso、来自Sulfolobus solfataricus的SSBSso7D、来自Homo sapiens的SSBMHsmt、来自Mycobacterium leprae的SSBMle、来自Bacteriohage T4的gp32T4、来自Bacteriophage RB69的gp32RB69或来自Bacteriohage T7的gp2.5T7。
进一步优选的,所述的聚合酶包括但不限于修饰或者野生的DNA聚合酶,包括但不限于Phi29 DNA聚合酶、Tts DNA聚合酶、M2DNA聚合酶、VENT DNA聚合酶、T5DNA聚合酶、PRD1DNA聚合酶、Bst DNA聚合酶或REPLI-gscDNA聚合酶。
进一步优选的,所述的核酸外切酶包括但不限于修饰或者野生的来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III、来自噬菌体λ核酸外切酶或者来自嗜热栖热菌的RecJ。
进一步优选的,所述的解旋酶可以为任一Hel308家族解旋酶及修饰的Hel308家族解旋酶、RecD解旋酶及其变体、TrwC解旋酶及其变体、Dda解旋酶及其变体、TraI Eco及其变体、XPD Mbu及其变体、Pif1-like解旋酶及其变体。
优选的,所述的解旋酶为Pif1-like解旋酶及其变体,所述的Pif1-like解旋酶选自Pba-PM2、Aph-Acj61、Aph-PX29、Avi-Aeh1、Sph-CBH8、Eph-Pei26、Aph-AM101、PphPspYZU05、Eph-EcS1、Eph-Cronus2或Mph-MP1。
优选的,所述的解旋酶为Mph-MP1变体,所述的Mph-MP1的变体包含E105C和/或A362C突变,更进一步优选的,所述的变体的氨基酸序列如SEQ ID NO:17所示,编码所述的变体的核苷酸序列如SEQ ID NO:18所示。
第五方面,提供了编码上述的孔蛋白单体、上述的构建体、上述的突变孔、或上述的复合物的核酸。
第六方面,提供了包含上述的核酸的载体。
优选的,所述载体包含启动子,所述的启动子可操作地连接到包含编码孔蛋白单体、构建体、突变孔或复合物的核苷酸序列。
优选的,其中所述启动子是诱导型启动子或组成型启动子。
第七方面,提供了包含上述的核酸或载体的宿主细胞。
第八方面,提供了上述的孔蛋白单体、上述的构建体、上述的突变孔、上述的复合物、上述的核酸、上述的载体或宿主细胞在检测靶分析物存在、不存在或一个或多个特征或制备检测靶分析物存在、不存在或一个或多个特征的产品中的应用。
第九方面,提供了一种产生突变孔或其多肽的方法,包括用上述的载体转化所述的宿主细胞,诱导所述宿主细胞表达所述的突变孔或其多肽。
第十方面,提供了一种用于确定靶分析物存在、不存在或一个或多个特征的方法,包括:
a.使靶分析物与上述的突变孔、上述的复合物、或复合物中的突变孔接触,使得所述靶分析物相对于所述突变孔移动;以及
b.在所述靶分析物相对于所述突变孔移动时获取一个或多个测量值,从而确定所述靶分析物的存在、不存在或一个或多个特征。
在本发明的一个具体实施方式中,所述方法包括:所述靶分析物与存在于膜中的所述突变孔相互作用从而使得所述靶分析物相对所述突变孔移动。
在本发明的一个具体实施方式中,靶分析物是核酸分子。
在一个实施例中,所述靶分析物包括多糖、金属离子、无机盐、聚合物、氨基酸、肽、蛋白、核苷酸、寡核苷酸、多核苷酸、染料、药物、诊断剂、爆炸物或环境污染物。
优选地,所述靶分析物包括多核苷酸。优选的,所述的多核苷酸可以是天然存在的或人工合成的。进一步优选的,所述的多核苷酸可以是天然的DNA、RNA或者经过修饰的DNA或RNA。
优选的,多核苷酸可以为任意长度。例如,多核苷酸的长度可以是至少10,至少50,至少100,至少150,至少200,至少250,至少300,至少400或至少500个核苷酸或核苷酸对。所述多核苷酸的长度可以为1000个或更多个核苷酸或核苷酸对,5000个或更多个核苷酸或核苷酸对或100000个或更多个核苷酸或核苷酸对。
更进一步优选的,所述的多核苷酸中的一个或多个核苷酸可以是经过修饰的,例如甲基化、氧化、损伤、脱碱基的、蛋白标记、带有标签或多核苷酸序列中间连接一段间隔物。
更进一步优选的,所述人工合成的核酸选自肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁定核酸(LNA)或其他具有核苷侧链的合成聚合物。
优选的,所述的多核苷酸为单链、双链或至少一部分是双链的。
所述一个或多个特征选自(i)所述多核苷酸的长度;(ii)所述多核苷酸的身份;(iii)所述多核苷酸的序列;(iv)所述多核苷酸的二级结构和(v)所述多核苷酸是否经修饰。
对于(i),可以例如通过确定多核苷酸和突变体/突变孔之间相互作用的数量或多核苷酸和突变体/突变孔之间相互作用的持续时间对多核苷酸的长度进行测量。
对于(ii),可以以多种方式测量多核苷酸的身份,多核苷酸的身份可以结合多核苷酸序列的测量或不结合多核苷酸序列的测量进行测量。前者较为简单;对多核苷酸进行测序进而进行识别。后者可以通过几种不同方式完成。例如,可以测量多核苷酸中特定基序的存在(无需测量多核苷酸的其余序列)。或者,所述方法中特定的电和/或光信号的测量可以识别出所述多核苷酸来自特定来源。
对于(iii),多核苷酸的序列可以如先前所述进行测定。合适的测序方法,特别是使用电学测量方法的测序方法,描述在Stoddart D et al.,ProC Natl Acad Sci,12;106(19)7702-7,Lieberman KR et al,J Am Chem SoC.2010;132(50)17961-72,以及国际申请W02000/28312中。
对于(iv),二级结构可以采用多种方法测量。例如,如果所述方法涉及电学测量方法,则可以使用停留时间的变化或流过孔的电流的变化来测量所述二级结构。这允许区分单链和双链多核苷酸的区域。
对于(v),可以测量是否存在任何修饰。所述方法优选包括,测定多核苷酸是否通过甲基化,氧化,损伤,用一种或多种蛋白或用一种或多种标记,标签或进行无碱基或缺少核碱基和糖的修饰。特定的修饰将导致与所述孔的特异性相互作用,其可以使用下述方法进行测量。例如,甲基胞嘧啶可以基于其与每个核苷酸相互作用期间流过所述孔的电流而与胞嘧啶区分开来。
在本发明的一个具体实施方式中,所述的方法包括将所述靶分析物偶联到膜上;和所述靶分析物与存在于所述膜中的所述突变孔相互作用从而使得所述靶分析物相对所述突变孔移动。
优选的,所述的方法包括在靶分析物与突变孔、复合物、或复合物中的突变孔接触上施加电势差的步骤。
优选的,所述的一个或多个特征通过电测量和/或光学测量进行。
进一步优选的,通过电测量和/或光测量产生电信号和/或光信号,而每种核苷酸对应一种信号水平,继而将电信号和/或光信号转化为核苷酸的特征。
在本发明的一个具体实施方式中,所述的电测量包括但不限于电流测量、阻抗测量、隧道测量、风洞测量或场效应晶体管(FET)测量等等。
本发明所述的电信号选自电流、电压、隧穿、电阻、电位、电导率或横向电测量的测量值。
在本发明的一个具体实施方式中,所述的电信号为穿过所述孔的电流。
优选的,所述的方法还包括应用改进型维特比算法。
具体的,在充满电解液的腔内,带有突变孔的绝缘防渗膜将腔体分成2个小室,如图1,当电压作用于电解液室,离子或其他小分子物质在电场力作用下穿过突变孔,形成稳定的可检测的离子电流。本申请制备的突变孔的尺寸和表面特性,配合施加的电压及溶液条件,可检测不同类型的生物分子。
由于组成DNA的四种碱基腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)的分子结构及体积大小均不同,单链DNA(ssDNA)在控速酶和电场驱使下通过突变孔时,不同碱基的化学性质差异导致穿越突变孔时引起的电流的变化幅度不同,从而得到所测DNA的序列信息。
在一个典型的突变孔测序实验中(图2),突变孔是磷脂膜两侧离子通过的唯一通道。控速酶充当DNA的马达蛋白,拉动DNA链使其以单个核苷酸的步长依次通过突变孔,每当一个核苷酸穿过突变孔,相应的堵孔信号会被记录下来(图3)。通过相应算法分析这些序列相关的电流信号,可以反推出DNA的序列信息。
当然,本申请制备的突变孔也可以实现固态纳米孔测序,可在一定程度上具有高分辨率测序的潜力。
优选的,所述的方法包括改变施加的电势,盐浓度,缓冲液,温度和添加剂如脲,甜菜碱和DTT的存在,控制突变孔区分不同核苷酸的程度。
第十一方面,提供了一种用于确定靶分析物存在、不存在或一个或多个特征的试剂盒,包括所述的孔蛋白单体、所述的构建体、所述的突变孔、所述的复合物、所述的核酸、或所述的载体或宿主细胞,和所述的膜。
第十二方面,提供了一种用于确定靶分析物存在、不存在或一个或多个特征的装置,包括上述的突变孔或上述复合物,和上述的膜。
在一个实施例中,所述靶分析物包括多糖、金属离子、无机盐、聚合物、氨基酸、肽、蛋白、核苷酸、寡核苷酸、多核苷酸、染料、药物、诊断剂、爆炸物或环境污染物。
优选地,所述靶分析物包括多核苷酸。
优选的,所述的多核苷酸可以是天然存在的或人工合成的。进一步优选的,所述的多核苷酸可以是天然的DNA、RNA或者经过修饰的DNA或RNA。
优选的,多核苷酸可以为任意长度。例如,多核苷酸的长度可以是至少10,至少50,至少100,至少150,至少200,至少250,至少300,至少400或至少500个核苷酸或核苷酸对。所述多核苷酸的长度可以为1000个或更多个核苷酸或核苷酸对,5000个或更多个核苷酸或核苷酸对或100000个或更多个核苷酸或核苷酸对。
更进一步优选的,所述的多核苷酸中的一个或多个核苷酸可以是经过修饰的,例如甲基化、氧化、损伤、脱碱基的、蛋白标记、带有标签或多核苷酸序列中间连接一段间隔物。
更进一步优选的,所述人工合成的核酸选自肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁定核酸(LNA)或其他具有核苷侧链的合成聚合物。
优选的,所述的多核苷酸为单链、双链或至少一部分是双链的。
所述一个或多个特征选自(i)所述多核苷酸的长度;(ii)所述多核苷酸的身份;(iii)所述多核苷酸的序列;(iv)所述多核苷酸的二级结构和(v)所述多核苷酸是否经修饰。
本发明所述的“包含”或“包括”在本申请中用于描述蛋白质或核酸的序列时,所述蛋白质或核酸可以是由所述序列组成,或者在所述蛋白质或核酸的一端或两端可以具有额外的氨基酸或核苷酸,但仍然具有本发明所述的活性。
本发明所述的“一个或多个位置处”指1个、2个、3个、4个、5个、6个、7个、8个、9个、10个……或直至全部位置。
本发明所述的“蛋白质”、“多肽”和“肽”在本文中进一步可互换使用,是指氨基酸残基的聚合物以及氨基酸残基的变体和合成类似物。因此,这些术语适用于其中一个或多个氨基酸残基是合成的非天然存在的氨基酸,诸如相应天然存在的氨基酸的化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。多肽还可经历成熟或翻译后修饰过程,这些过程可以包括但不限于:糖基化、蛋白水解裂解、脂化、信号肽裂解、前肽裂解、磷酸化等。
本发明所述的“野生型”是指从天然存在的来源分离的基因或基因产物(例如蛋白)。野生型基因是在群体中最常观测到的基因,因此任意地设计为该基因的“正常”或“野生型”形式。相反,术语“经修饰的”、“突变”或“变体”是指与野生型基因或基因产物(例如蛋白)相比,显示出序列修饰(例如,取代、截短或插入)、翻译后修饰和/或功能性质(例如,特性改变)的基因或基因产物(例如蛋白)。
突变或经修饰的蛋白质、单体或肽也可以任何方式在任何位点进行化学修饰。经修饰的蛋白质、单体或肽的突变体可以通过任何分子的附接进行化学修饰。例如,经修饰的蛋白质、单体或肽的突变体可以通过染料或荧光团的附接进行化学修饰。在一些实施方案中,用促进包含单体或肽的孔与靶核苷酸或靶多核苷酸序列之间的相互作用的分子衔接子化学修饰突变或经修饰的单体或肽。分子衔接子优选为环状分子、环糊精、能够杂交的物质、DNA结合剂或嵌入剂、肽或肽类似物、合成聚合物、芳族平面分子、带正电荷的小分子或能够氢键键合的小分子。
衔接子的存在改善了孔和核苷酸或多核苷酸序列的主-客体化学,从而改善了由突变的单体形成的孔的测序能力。主-客体化学的原理是本领域众所周知的。衔接子对孔的物理或化学性质有影响,这种影响改善了孔与核苷酸或多核苷酸序列的相互作用。衔接子可以改变孔的桶或通道的电荷,或与核苷酸或多核苷酸序列特异性相互作用或结合,从而促进其与孔的相互作用。
本发明所述的“突变孔”是一种蛋白孔,是跨膜蛋白结构,其限定了允许分子和离子从膜的一侧易位到另一侧的通道或孔。离子物质通过孔的易位可以由施加到孔任一侧的电位差驱动。其中分子或离子所通过的通道的最小直径为纳米级(10-9米)。突变孔的跨膜蛋白结构本质上可以是单体或寡聚体。纳米孔内形成蛋白内衬通道的蛋白亚基部分通常包含可包括一个或多个跨膜β-桶和/或α-螺旋部分的二级结构基序。
本发明所述的“控速蛋白”为可以控制靶分析物(例如多核苷酸)相对于突变孔移动速度(例如减慢其移动速度)从而使得此速度能够实现对靶分析物的存在、不存在或一个或多个特征进行检测(例如多核苷酸的测序)的蛋白。突变孔与控速蛋白配合使用用于表征靶分析物。在一个实施例中,控速蛋白减慢多核苷酸穿过突变孔的速度从而实现测序。
本发明所述的“核酸结合蛋白”可以是能够结合多核苷酸并控制其移动通过孔的任何蛋白。核酸结合蛋白通常与多核苷酸相互作用并改性多核苷酸的至少一种性质。其可以通过裂解多核苷酸以形成各单个核苷酸或核苷酸的短链(例如,二核苷酸或三核苷酸)来对其进行改性。也可以通过使多核苷酸定向或将其移动到特定位置来对其进行改性,即,控制它的移动。
有益效果:本发明通过前期大量的筛选工作,最终确定了新的蛋白骨架,形成缢缩区(读取头区域)结构由完全不同的氨基酸残基组成,从而在测序过程中提供全新的作用模式,测序信号区间与以CsgG蛋白为骨架的单读取头突变孔(对应ONT的R9系列孔),信号更清晰,具有不同的信号特征和信号分布模式,具有更优的跳变分布,进一步优化了孔蛋白与控速蛋白相互作用界面的稳定性,提高测序数据的一致性和稳定性,提高了纳米孔测序的分辨率,不只可以区分碱基A、T、C、G、U,甚至可以区分甲基化和未甲基化的核苷酸,脱氧胞嘧啶单磷酸(dCMP)和甲基-dCMP。而且,该突变孔具有更高的与磷脂膜重组的效率。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:纳米孔技术反应池示意图;
图2:纳米孔测序实验示意图;
图3:核苷酸穿过突变孔时相应的堵孔信号示意图;
图4A:野生型通道表面结构模型侧视图;
图4B:野生型通道表面结构模型俯视图;
图4C:野生型通道飘带结构模型;
图5:野生型通道缢缩区氨基酸残基分布和缢缩区直径;
图6:单体缢缩区棍棒模型展示及其放大图;
图7:突变孔1缢缩区关键氨基酸残基分布特征和缢缩区直径;
图8:突变孔1基于同源建模的卡通示意图,区域1对应于冠状体形成区域;区域2对应于缢缩区和环形区域;区域3对应于跨膜β桶状体区域;
图9:BS7-4C3-PLT的结构示意图;
图10:突变体1蛋白多聚体的分子筛纯化结果,箭头指示位置为目标蛋白峰位置,其中,横坐标上方灰色编号为分子筛分离出的各组分编号;
图11A:突变孔1在±180mV电压下开孔电流及其门控特征,其中,y轴坐标=电流(pA),x轴坐标=时间(s);
图11B:突变孔1在+180mV电压下的核酸过孔情况,其中,y轴坐标=电流(pA),x轴坐标=时间(s);
图12:当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔1移位时的示例电流轨迹,轨迹的y轴坐标=电流(pA),x轴坐标=时间(s);
图13:当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔1移位时的示例电流轨迹,轨迹的y轴坐标=电流(pA),x轴坐标=时间(s),中间图为原始信号滤波处理后的结果,虚线箭头指示部分显示了电流轨迹的放大结果;
图14:当解旋酶Mph-MP1-E105C/A362C控制DNA构建体phage10k穿过突变孔1移位时的芯片测试电流轨迹,y轴坐标=电流(pA),x轴坐标=采样点(个);
图15A:突变孔2在±180mV电压下开孔电流及其门控特征,其中,y轴坐标=电流(pA),x轴坐标=时间(s);
图15B:突变孔2在+180mV电压下的核酸过孔情况,其中,y轴坐标=电流(pA),x轴坐标=时间(s);
图16:当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔2移位时的示例电流轨迹,轨迹的y轴坐标=电流(pA),x轴坐标=时间(s);
图17:当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔2移位时的示例电流轨迹,轨迹的y轴坐标=电流(pA),x轴坐标=时间(s),中间图为原始信号滤波处理后的结果,虚线箭头指示部分显示了电流轨迹的放大结果;
图18A:突变孔3在±180mV电压下开孔电流及其门控特征,其中,y轴坐标=电流(pA),x轴坐标=时间(s);
图18B:突变孔3在+180mV电压下的核酸过孔情况,其中,y轴坐标=电流(pA),x轴坐标=时间(s);
图19:当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔3移位时的示例电流轨迹,两条轨迹的y轴坐标=电流(pA),x轴坐标=时间(s);
图20:当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔3移位时的示例电流轨迹,轨迹的y轴坐标=电流(pA),x轴坐标=时间(s),中间图为原始信号滤波处理后的结果,虚线箭头指示部分显示了电流轨迹的放大结果;
图21:突变体1的蛋白多聚体纯化结果,1-5泳道显示的是分子筛层析后分离的不同组分,分别对应图10中编号8-12的SDS-PAGE电泳检测结果,M为marker。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的部分实施例,而不是全部。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1突变体蛋白1的设计
在实施例中,野生型孔蛋白来自Caballeronia telluris,并且该野生型孔蛋白的氨基酸序列如SEQ ID NO:1所示,编码此氨基酸序列的核苷酸序列如SEQ ID NO:2所示。孔蛋白单体的突变体1是野生型孔蛋白在对应SEQ ID NO:1的多处具有突变,具体为S78V、D80N、S82A和F83Q(如SEQ ID NO:3所示)。包括孔蛋白单体的突变体1的蛋白孔为突变孔1。
实施例2突变体蛋白2的设计
在实施例中,野生型孔蛋白来自Caballeronia telluris,并且该野生型孔蛋白的氨基酸序列是SEQ ID NO:1,编码此氨基酸的序列的核苷酸序列如SEQ ID NO:2所示。孔蛋白单体的突变体2是野生型孔蛋白在对应SEQ ID NO:1的多处具有突变,具体为Y75F、S78Y、D80的缺失、S81A、S82N和F83A(如SEQ ID NO:4所示)。包括孔蛋白单体的突变体2的蛋白孔为突变孔2。
实施例3突变体蛋白3的设计
在实施例中,野生型孔蛋白来自Caballeronia telluris,并且该野生型孔蛋白的氨基酸序列是SEQ ID NO:1,编码此氨基酸的序列的核苷酸序列如SEQ ID NO:2所示。孔蛋白单体的突变体3是野生型孔蛋白在对应SEQ ID NO:1的多处具有突变,具体为Q74L、Y75F、S78Y、D80的缺失、S81A、S82V、F83A、E127R和D130K(如SEQ ID NO:5所示)。包括孔蛋白单体的突变体3的蛋白孔为突变孔3。
实施例4突变体1-3蛋白的制备
将孔蛋白单体的突变体1核酸序列(其对应氨基酸序列如SEQ ID NO:3)的重组质粒通过热击法转化到BL21(DE3)感受态细胞,加入0.5ml LB培养基经30℃培养1h后取适量菌液涂布于氨苄抗性固体LB平板,37℃过夜培养,次日挑取单克隆菌落,接种至50ml含有氨苄抗性的液体LB培养基中37℃培养过夜。按1%的接种量转接至氨苄抗性的TB液体培养基中进行扩大培养,37℃、220rpm条件下培养,并连续不断的测量其OD600值。当OD600=2.0-2.2时,将TB培养基中的培养液冷却至16℃,并添加异丙基硫代半乳糖苷(Isopropylβ-D-Thiogalactoside,IPTG)诱导表达,使得终浓度达到0.015mM。诱导表达20-24h后,离心收集菌体。菌体用破碎缓冲液重悬后高压破碎,通过Ni-NTA亲和层析方法进行纯化,收集目的洗脱样品。孔蛋白单体的突变体2-3按如上方法纯化得到,其中,突变体2的氨基酸序列如SEQID NO:4所示,突变体3的氨基酸序列如SEQ ID NO:5所示。
示例性的,图10示出了突变体1的蛋白多聚体的分子筛纯化结果,箭头指示位置为目标蛋白峰寡聚态分布。图21示出了突变体1的多聚体蛋白纯化结果,1-5泳道显示的是分离的不同组分的SDS-PAGE电泳检测结果,具体分别对应组分8-12,更进一步证明组分12为目标纯化蛋白。
实施例5野生型孔蛋白和突变孔1同源建模
采用SWISS MODEL对野生型孔蛋白进行同源建模(模板pdb号4uv3.1),野生型孔蛋白单体的氨基酸如SEQ ID NO:1所示。图4A是预测蛋白结构模型的侧视图,其中颜色较深的部分显示的为一个蛋白单体。图4B是表面结构模型俯视图,其中颜色较深的部分显示的为一个蛋白单体。图4C为飘带结构模型图,颜色较深部分为蛋白单体。
图6显示了单体飘带模型及其缢缩区氨基酸残基分布的棍棒模型,放大显示缢缩区环形区关键氨基酸组成及其编号,其中方框部分是指向蛋白孔道中心区域的氨基酸残基。
采用SWISS MODEL(模板pdb号4uv3.1)对突变孔1进行同源建模。图7显示的是突变孔1缢缩区关键氨基酸残基分布特征和缢缩区直径。棍棒模型显示了突变孔1的孔道狭窄区域的关键氨基酸残基分布,指向孔道中心的氨基酸残基为78位的缬氨酸,81位的丝氨酸,83位的谷氨酰胺。两个孔蛋白单体中间的缢缩区孔道最狭窄区域直径约为最宽区域直径约为中间直径约为
图8显示了突变孔1基于同源建模的卡通示意图,区域1对应于冠状体形成区域,区域2对应于缢缩区和环形区域,区域3对应于跨膜β桶状体区域。
实施例6制备DNA构建体
制备DNA构建体BS7-4C3-PLT。BS7-4C3-PLT的结构如图9所示,序列信息如下所示:
a:30*C3
b:TTTTT TTTTT(SEQ ID NO:6)
c:控速蛋白
d:4*C18
e:AATGT ACTTC GTTCA GTTAC GTATT GCT(SEQ ID NO:7)
f:5’P-GC AATAC GTAAC TGAAC GAAGT TCACTATCGCATTCTCATGA-3’(SEQ ID NO:8)
g:胆固醇标签
h:5’-TCATG AGAAT GCGAT AGTGA–3’(SEQ ID NO:9)
i:5’-AAAAAAAAAAAAAAAAAAAAAAAAAAAA(SEQ ID NO:10)/dSpacer/AAAAAAAAAAAA(SEQ ID NO:11)/dSpacer/AAAAAAAAAAAAAATCTCTGAATCTCTGAATCTCTGAATCTCTAAAAAAAAAAAAGAAAAAAAAAAAACAAAAAAAAAAAATAAAAAAAAAAAAAGCAATACGTAACTGAACGAAGTACATTAAAAAAAAAA(SEQ ID NO:12)-3’
j:5’-ATCCTTTTTTTTTTAATGTACTTCGTTCAGTTACGTATTGCT-3’(SEQ ID NO:13)
k:5’P-TTTTTTTTTTTTATTTTTTTTTTTTGTTTTTTTTTTTTCTTTTTTTTTTTTAGAGATTCAGAGATTCAGAGATTCAGAGATTTTTTTTTTTTTT(SEQ ID NO:14)/dSpacer/TTTTTTTTTTTT(SEQ IDNO:15)/iSpC3/TTTTTTTTTTTTTTTTTTTTTTTTTTTT(SEQ ID NO:16)-3’
C3、C18、dSpacer及iSpC3是指示孔测序分辨率特征而引入的标记(marker)序列。
在本实施例中,图9中的c:控速蛋白为解旋酶Mph-MP1-E105C/A362C(具有突变E105C/A362C),氨基酸序列为SEQ ID NO:17,核酸序列为SEQ ID NO:18。
实施例7突变孔1单孔测序检测
使用突变孔1作为蛋白孔,采用单孔测序的技术方法进行检测。在将氨基酸序列为突变体1的单个孔蛋白插入磷脂双分子层之后,使缓冲液(625mM KCl,10mM HEPES pH 8.0,50mMMgCl2)流经该系统,以除去任何过量的突变体1纳米孔。将DNA构建体BS7-4C3-PLT(1~2nM终浓度)加入所述突变孔1实验系统中,混匀后,使缓冲液(625mM KCl,10mM HEPESpH8.0,50mM MgCl2)流经该系统,以除去任何过量的DNA构建体BS7-4C3-PLT。然后将解旋酶(Mph-MP1-E105C/A362C,15nM终浓度)、燃料(ATP 3mM终浓度)预混物加入单个野生型孔蛋白或突变孔1实验系统中,并在+180mV电压下监测野生型孔蛋白或突变孔1的测序情况。
突变孔1在±180mV电压下开孔。图11A显示突变孔1在±180mV电压下开孔电流及其门控特征。图11B显示突变孔1在+180mV电压下的单链核酸过孔情况。核酸可以过孔。加入单链核酸后,向下的线显示的核酸过孔信号。
采用单孔测序技术方法,通过突变孔1对DNA构建体BS7-4C3-PLT进行测序,完成嵌孔后添加测序体系出现的核酸测序信号。图12示出了当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔1移位时的示例电流轨迹。根据该信号特征,突变孔1可以用来核酸测序。
图13是将图12的部分显示出电流轨迹的放大结果。具有虚线框和箭头的图(中间图)为原始信号滤波处理后的结果(两条轨迹的y轴坐标=电流(pA),x轴坐标=时间(s))。虚线箭头指示部分显示了电流轨迹的放大结果。
图14示出了当解旋酶Mph-MP1-E105C/A362C控制DNA构建体噬菌体基因组文库phage10k穿过突变孔1移位时的芯片测试电流轨迹。根据该信号特征,突变孔1可以用来核酸测序。
野生型孔蛋白无法检测到测序电流。
实施例8突变孔2单孔测序检测
与实施例7测序条件及步骤类似,实施例8采用突变孔2进行空测和过孔检测。
图15A显示突变孔2在±180mV电压下开孔电流及其门控特征。图15B显示突变孔2在+180mV电压下的单链核酸过孔情况。核酸可以过孔。加入单链核酸后,向下的线显示的核酸过孔信号。
采用单孔测序技术方法,通过突变孔2对DNA构建体BS7-4C3-PLT进行测序,完成嵌孔后添加测序体系出现的核酸测序信号。图16示出了当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔2移位时的示例电流轨迹。根据该信号特征,突变孔2可以用来核酸测序。
图17显示出部分电流轨迹的放大结果。具有虚线框和箭头的图为原始信号滤波处理后的结果(两条轨迹的y轴坐标=电流(pA),x轴坐标=时间(s))。虚线箭头指示部分显示了电流轨迹的放大结果。此单独一条信号的区域放大显示图,进一步表明该突变孔2可对核酸测序。
实施例9突变孔3单孔测序检测
与实施例7测序条件及步骤类似,实施例9采用突变孔3进行空测和过孔检测。
图18A显示突变孔3在±180mV电压下开孔电流及其门控特征。图18B显示突变孔3在+180mV电压下的单链核酸过孔情况。核酸可以过孔。加入单链核酸后,向下的线显示的核酸过孔信号。
采用单孔测序技术方法,通过突变孔3对DNA构建体BS7-4C3-PLT进行测序,完成嵌孔后添加测序体系出现的核酸测序信号。图19示出了当解旋酶Mph-MP1-E105C/A362C控制DNA构建体BS7-4C3-PLT穿过突变孔3移位时的示例电流轨迹。根据该信号特征,突变孔3可以用来核酸测序。
图20显示出部分电流轨迹的放大结果。具有虚线框和箭头的图为原始信号滤波处理后的结果(两条轨迹的y轴坐标=电流(pA),x轴坐标=时间(s))。虚线箭头指示部分显示了电流轨迹的放大结果。此单独一条信号的区域放大显示图,进一步表明突变孔3可用来核酸测序。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
序列表
<110> 清华大学
北京齐碳科技有限公司
<120> 一种新型孔蛋白单体及其应用
<130> 1
<160> 18
<170> SIPOSequenceListing 1.0
<210> 1
<211> 314
<212> PRT
<213> Caballeronia telluris
<400> 1
Met Asn Lys Asn Ala Ala Lys Thr Thr Ala Met Arg Thr Thr Leu Ala
1 5 10 15
Ala Met Val Phe Ser Thr Met Leu Leu Thr Gly Cys Val Thr Gln Pro
20 25 30
Met Ala Ser Ala Gly Asn Ala Thr Leu Thr Pro Pro Thr Arg Val Thr
35 40 45
Arg Asp Leu Thr His Leu Pro Pro Pro Lys Gly Arg Ile Thr Ala Ala
50 55 60
Val Tyr Gly Phe Arg Asp Leu Thr Gly Gln Tyr Lys Pro Ser Pro Asp
65 70 75 80
Ser Ser Phe Ser Ser Gln Val Thr Gln Gly Gly Ala Ser Phe Leu Val
85 90 95
Lys Ala Met Arg Asp Ser Gly Trp Phe Thr Pro Val Glu Arg Glu Asn
100 105 110
Leu Gln Asp Leu Leu Thr Glu Arg Lys Ile Met Arg Ala Leu Glu Thr
115 120 125
Pro Asp Asp Lys Asn Arg Val Ile Pro Gln Ile Gly Ala Leu Ala Pro
130 135 140
Ala Ser Ile Val Leu Glu Gly Gly Ile Val Gly Tyr Asp Ser Asn Ile
145 150 155 160
Arg Thr Gly Gly Ala Gly Ile Ala Tyr Leu Gly Ile Ser Ala Ser Gln
165 170 175
Gln Tyr Arg Val Asp Gln Val Thr Val Asn Leu Arg Ala Val Asp Ile
180 185 190
Arg Asn Gly Thr Ile Leu Asn Ser Val Ser Thr Thr Lys Thr Ile Tyr
195 200 205
Ser Ile Gln Ile Asp Thr Gly Val Tyr Arg Phe Ile Gly Phe Lys Asp
210 215 220
Leu Leu Gln Ala Glu Ile Gly Met Thr Arg Asn Glu Pro Gln Gln Leu
225 230 235 240
Cys Val Asn Glu Ala Ile Glu Ser Ala Leu Val His Leu Ile Val Gln
245 250 255
Gly Val Ala Asn Gln Thr Trp Ser Leu Lys Asp Met Lys Asp Trp Tyr
260 265 270
Asp Pro Thr Met Gln Arg Tyr Leu Gln Glu Asn Gln Gly Tyr Ala Gln
275 280 285
Thr Met Glu Ala Val Asn Pro Pro Tyr Asp Pro Ala Lys Val Asp Pro
290 295 300
Pro Lys Ala Val Gly Ser Gly Val Ser Gly
305 310
<210> 2
<211> 945
<212> DNA
<213> Caballeronia telluris
<400> 2
atgaacaaga atgccgcgaa aaccaccgcc atgcgcacga ctctggctgc aatggtcttc 60
tcgacgatgc tgctcacggg ttgcgtgacc cagccgatgg cctcggccgg caacgcgacg 120
ctcacgccgc cgacgcgcgt cacgcgggac ctcacgcacc tgccgccgcc caagggcagg 180
atcaccgccg ccgtgtacgg ctttcgcgac ctgaccggcc agtacaagcc gtcgccagac 240
agttcgttct cgtcgcaggt gacgcagggc ggcgcctcgt tccttgtcaa ggcgatgcgc 300
gattccggct ggttcacgcc ggtcgaacgc gagaaccttc aggacctgct gaccgaacgc 360
aagatcatgc gcgcactgga gacgcccgac gacaagaacc gcgtgatccc gcagatcggc 420
gcgctggcgc ccgcgagcat cgtgctcgaa ggcggcatcg tcggctacga ctcaaatatc 480
cgcacgggcg gagcgggcat cgcgtatctg gggatctcgg cgtcgcagca gtatcgcgtc 540
gatcaggtga cggtgaacct gcgcgccgtg gatatccgca acggcacgat cctcaacagc 600
gtctcgacga ccaagaccat ctattcgatc cagatcgaca ccggcgtgta ccgcttcatc 660
ggcttcaagg atttgctgca ggccgagatc ggaatgacgc gcaacgagcc gcagcagttg 720
tgcgtgaacg aggcgatcga atccgcgctc gtgcacctga tcgtgcaggg tgtggctaac 780
cagacctggt cgctcaagga catgaaggac tggtacgacc cgacgatgca gcgctatctg 840
caggaaaacc agggctacgc gcagacgatg gaagcggtga atccgcccta cgacccggcc 900
aaggtcgatc cgcccaaggc cgttggcagc ggcgtgagcg gttga 945
<210> 3
<211> 314
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Asn Lys Asn Ala Ala Lys Thr Thr Ala Met Arg Thr Thr Leu Ala
1 5 10 15
Ala Met Val Phe Ser Thr Met Leu Leu Thr Gly Cys Val Thr Gln Pro
20 25 30
Met Ala Ser Ala Gly Asn Ala Thr Leu Thr Pro Pro Thr Arg Val Thr
35 40 45
Arg Asp Leu Thr His Leu Pro Pro Pro Lys Gly Arg Ile Thr Ala Ala
50 55 60
Val Tyr Gly Phe Arg Asp Leu Thr Gly Gln Tyr Lys Pro Val Pro Asn
65 70 75 80
Ser Ala Gln Ser Ser Gln Val Thr Gln Gly Gly Ala Ser Phe Leu Val
85 90 95
Lys Ala Met Arg Asp Ser Gly Trp Phe Thr Pro Val Glu Arg Glu Asn
100 105 110
Leu Gln Asp Leu Leu Thr Glu Arg Lys Ile Met Arg Ala Leu Glu Thr
115 120 125
Pro Asp Asp Lys Asn Arg Val Ile Pro Gln Ile Gly Ala Leu Ala Pro
130 135 140
Ala Ser Ile Val Leu Glu Gly Gly Ile Val Gly Tyr Asp Ser Asn Ile
145 150 155 160
Arg Thr Gly Gly Ala Gly Ile Ala Tyr Leu Gly Ile Ser Ala Ser Gln
165 170 175
Gln Tyr Arg Val Asp Gln Val Thr Val Asn Leu Arg Ala Val Asp Ile
180 185 190
Arg Asn Gly Thr Ile Leu Asn Ser Val Ser Thr Thr Lys Thr Ile Tyr
195 200 205
Ser Ile Gln Ile Asp Thr Gly Val Tyr Arg Phe Ile Gly Phe Lys Asp
210 215 220
Leu Leu Gln Ala Glu Ile Gly Met Thr Arg Asn Glu Pro Gln Gln Leu
225 230 235 240
Cys Val Asn Glu Ala Ile Glu Ser Ala Leu Val His Leu Ile Val Gln
245 250 255
Gly Val Ala Asn Gln Thr Trp Ser Leu Lys Asp Met Lys Asp Trp Tyr
260 265 270
Asp Pro Thr Met Gln Arg Tyr Leu Gln Glu Asn Gln Gly Tyr Ala Gln
275 280 285
Thr Met Glu Ala Val Asn Pro Pro Tyr Asp Pro Ala Lys Val Asp Pro
290 295 300
Pro Lys Ala Val Gly Ser Gly Val Ser Gly
305 310
<210> 4
<211> 313
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Asn Lys Asn Ala Ala Lys Thr Thr Ala Met Arg Thr Thr Leu Ala
1 5 10 15
Ala Met Val Phe Ser Thr Met Leu Leu Thr Gly Cys Val Thr Gln Pro
20 25 30
Met Ala Ser Ala Gly Asn Ala Thr Leu Thr Pro Pro Thr Arg Val Thr
35 40 45
Arg Asp Leu Thr His Leu Pro Pro Pro Lys Gly Arg Ile Thr Ala Ala
50 55 60
Val Tyr Gly Phe Arg Asp Leu Thr Gly Gln Phe Lys Pro Tyr Pro Ala
65 70 75 80
Asn Ala Ser Ser Gln Val Thr Gln Gly Gly Ala Ser Phe Leu Val Lys
85 90 95
Ala Met Arg Asp Ser Gly Trp Phe Thr Pro Val Glu Arg Glu Asn Leu
100 105 110
Gln Asp Leu Leu Thr Glu Arg Lys Ile Met Arg Ala Leu Glu Thr Pro
115 120 125
Asp Asp Lys Asn Arg Val Ile Pro Gln Ile Gly Ala Leu Ala Pro Ala
130 135 140
Ser Ile Val Leu Glu Gly Gly Ile Val Gly Tyr Asp Ser Asn Ile Arg
145 150 155 160
Thr Gly Gly Ala Gly Ile Ala Tyr Leu Gly Ile Ser Ala Ser Gln Gln
165 170 175
Tyr Arg Val Asp Gln Val Thr Val Asn Leu Arg Ala Val Asp Ile Arg
180 185 190
Asn Gly Thr Ile Leu Asn Ser Val Ser Thr Thr Lys Thr Ile Tyr Ser
195 200 205
Ile Gln Ile Asp Thr Gly Val Tyr Arg Phe Ile Gly Phe Lys Asp Leu
210 215 220
Leu Gln Ala Glu Ile Gly Met Thr Arg Asn Glu Pro Gln Gln Leu Cys
225 230 235 240
Val Asn Glu Ala Ile Glu Ser Ala Leu Val His Leu Ile Val Gln Gly
245 250 255
Val Ala Asn Gln Thr Trp Ser Leu Lys Asp Met Lys Asp Trp Tyr Asp
260 265 270
Pro Thr Met Gln Arg Tyr Leu Gln Glu Asn Gln Gly Tyr Ala Gln Thr
275 280 285
Met Glu Ala Val Asn Pro Pro Tyr Asp Pro Ala Lys Val Asp Pro Pro
290 295 300
Lys Ala Val Gly Ser Gly Val Ser Gly
305 310
<210> 5
<211> 313
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Met Asn Lys Asn Ala Ala Lys Thr Thr Ala Met Arg Thr Thr Leu Ala
1 5 10 15
Ala Met Val Phe Ser Thr Met Leu Leu Thr Gly Cys Val Thr Gln Pro
20 25 30
Met Ala Ser Ala Gly Asn Ala Thr Leu Thr Pro Pro Thr Arg Val Thr
35 40 45
Arg Asp Leu Thr His Leu Pro Pro Pro Lys Gly Arg Ile Thr Ala Ala
50 55 60
Val Tyr Gly Phe Arg Asp Leu Thr Gly Leu Phe Lys Pro Tyr Pro Ala
65 70 75 80
Val Ala Ser Ser Gln Val Thr Gln Gly Gly Ala Ser Phe Leu Val Lys
85 90 95
Ala Met Arg Asp Ser Gly Trp Phe Thr Pro Val Glu Arg Glu Asn Leu
100 105 110
Gln Asp Leu Leu Thr Glu Arg Lys Ile Met Arg Ala Leu Arg Thr Pro
115 120 125
Lys Asp Lys Asn Arg Val Ile Pro Gln Ile Gly Ala Leu Ala Pro Ala
130 135 140
Ser Ile Val Leu Glu Gly Gly Ile Val Gly Tyr Asp Ser Asn Ile Arg
145 150 155 160
Thr Gly Gly Ala Gly Ile Ala Tyr Leu Gly Ile Ser Ala Ser Gln Gln
165 170 175
Tyr Arg Val Asp Gln Val Thr Val Asn Leu Arg Ala Val Asp Ile Arg
180 185 190
Asn Gly Thr Ile Leu Asn Ser Val Ser Thr Thr Lys Thr Ile Tyr Ser
195 200 205
Ile Gln Ile Asp Thr Gly Val Tyr Arg Phe Ile Gly Phe Lys Asp Leu
210 215 220
Leu Gln Ala Glu Ile Gly Met Thr Arg Asn Glu Pro Gln Gln Leu Cys
225 230 235 240
Val Asn Glu Ala Ile Glu Ser Ala Leu Val His Leu Ile Val Gln Gly
245 250 255
Val Ala Asn Gln Thr Trp Ser Leu Lys Asp Met Lys Asp Trp Tyr Asp
260 265 270
Pro Thr Met Gln Arg Tyr Leu Gln Glu Asn Gln Gly Tyr Ala Gln Thr
275 280 285
Met Glu Ala Val Asn Pro Pro Tyr Asp Pro Ala Lys Val Asp Pro Pro
290 295 300
Lys Ala Val Gly Ser Gly Val Ser Gly
305 310
<210> 6
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tttttttttt 10
<210> 7
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aatgtacttc gttcagttac gtattgct 28
<210> 8
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gcaatacgta actgaacgaa gttcactatc gcattctcat ga 42
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tcatgagaat gcgatagtga 20
<210> 10
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 28
<210> 11
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aaaaaaaaaa aa 12
<210> 12
<211> 132
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aaaaaaaaaa aaaatctctg aatctctgaa tctctgaatc tctaaaaaaa aaaaagaaaa 60
aaaaaaaaca aaaaaaaaaa ataaaaaaaa aaaaagcaat acgtaactga acgaagtaca 120
ttaaaaaaaa aa 132
<210> 13
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atcctttttt ttttaatgta cttcgttcag ttacgtattg ct 42
<210> 14
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tttttttttt ttattttttt tttttgtttt ttttttttct tttttttttt tagagattca 60
gagattcaga gattcagaga tttttttttt tttt 94
<210> 15
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tttttttttt tt 12
<210> 16
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tttttttttt tttttttttt tttttttt 28
<210> 17
<211> 441
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 17
Met Ile Thr Ile Asp Gln Leu Thr Glu Gly Gln Phe Asp Ser Leu Gln
1 5 10 15
Arg Ala Lys Val Leu Ile Gln Glu Ala Thr Lys Asn Asp Gly Asn Trp
20 25 30
Asn His Arg Thr Lys His Leu Thr Ile Asn Gly Pro Ala Gly Thr Gly
35 40 45
Lys Thr Thr Met Met Lys Phe Leu Val Ser Trp Leu Arg Asp Glu Gly
50 55 60
Ile Thr Gly Val Ala Leu Ala Ala Pro Thr His Ala Ala Lys Lys Val
65 70 75 80
Leu Ala Asn Ala Val Gly Glu Glu Val Ser Thr Ile His Ser Ile Leu
85 90 95
Lys Ile Asn Pro Thr Thr Tyr Glu Cys Lys Gln Phe Phe Glu Gln Ser
100 105 110
Ala Pro Pro Asp Leu Ser Lys Ile Arg Ile Leu Ile Cys Glu Glu Cys
115 120 125
Ser Phe Tyr Asp Ile Lys Leu Phe Glu Ile Leu Met Asn Ser Ile Gln
130 135 140
Pro Trp Thr Ile Ile Ile Gly Ile Gly Asp Arg Ala Gln Leu Arg Pro
145 150 155 160
Ala Asp Asp Lys Gly Ile Ser Arg Phe Phe Thr Asp Gln Arg Phe Glu
165 170 175
Gln Thr Tyr Leu Thr Glu Ile Lys Arg Ser Asn Met Pro Ile Ile Glu
180 185 190
Val Ala Thr Glu Ile Arg Asn Gly Gly Trp Ile Arg Glu Asn Ile Ile
195 200 205
Asp Asp Leu Gly Val Lys Gln Asp Lys Ser Val Ser Glu Phe Met Thr
210 215 220
Asn Tyr Phe Lys Val Val Lys Ser Ile Asp Asp Leu Tyr Glu Thr Arg
225 230 235 240
Met Tyr Ala Tyr Thr Asn Asn Ser Val Asp Thr Leu Asn Lys Ile Ile
245 250 255
Arg Lys Lys Leu Tyr Glu Thr Glu Gln Asp Phe Ile Val Gly Glu Pro
260 265 270
Ile Val Met Gln Glu Pro Leu Ile Arg Asp Ile Asn Tyr Glu Gly Lys
275 280 285
Arg Phe Gln Glu Ile Val Phe Asn Asn Gly Glu Tyr Leu Glu Val Ser
290 295 300
Glu Ile Lys Pro Met Glu Ser Val Leu Lys Cys Arg Asn Ile Asp Tyr
305 310 315 320
Gln Leu Val Leu His Tyr Tyr Gln Leu Lys Val Lys Ser Ile Asp Thr
325 330 335
Gly Glu Ser Gly Leu Ile Asn Thr Ile Ser Asp Lys Asn Glu Leu Asn
340 345 350
Lys Phe Tyr Met Phe Leu Gly Lys Val Cys Gln Asp Tyr Lys Ser Gly
355 360 365
Thr Ile Lys Ala Phe Trp Asp Asp Phe Trp Lys Ile Lys Asn Asn Tyr
370 375 380
His Arg Val Lys Pro Leu Pro Val Ser Thr Ile His Lys Gly Gln Gly
385 390 395 400
Ser Thr Val Asp Asn Ser Phe Leu Tyr Thr Pro Cys Ile Thr Lys Tyr
405 410 415
Ala Glu Pro Asp Leu Ala Ser Gln Leu Leu Tyr Val Gly Val Thr Arg
420 425 430
Ala Arg His Asn Val Asn Phe Val Gly
435 440
<210> 18
<211> 1326
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
atgatcacca tcgaccagct gaccgaaggt cagttcgact ctctgcagcg tgctaaagtt 60
ctgatccagg aagctaccaa aaacgacggt aactggaacc accgtaccaa acacctgacc 120
atcaacggtc cggctggtac cggtaaaacc accatgatga aattcctggt ttcttggctg 180
cgtgacgaag gtatcaccgg tgttgctctg gctgctccga cccacgctgc taaaaaagtt 240
ctggctaacg ctgttggtga agaagtttct accatccact ctatcctgaa aatcaacccg 300
accacctacg aatgcaaaca gttcttcgaa cagtctgctc cgccggacct gtctaaaatc 360
cgtatcctga tctgcgaaga atgctctttc tacgacatca aactgttcga aatcctgatg 420
aactctatcc agccgtggac catcatcatc ggtatcggtg accgtgctca gctgcgtccg 480
gctgacgaca aaggtatctc tcgtttcttc accgaccagc gtttcgaaca gacctacctg 540
accgaaatca aacgttctaa catgccgatc atcgaagttg ctaccgaaat ccgtaacggt 600
ggttggattc gtgaaaacat catcgacgac ctgggtgtta aacaggacaa atctgtttct 660
gaatttatga ccaactactt caaagttgtt aaatctatcg acgacctgta cgaaacccgt 720
atgtacgctt acaccaacaa ctctgttgac accctgaaca aaatcatccg taaaaaactg 780
tacgaaaccg aacaggactt catcgttggt gaaccgatcg ttatgcagga accgctgatc 840
cgtgacatca actacgaagg taaacgtttc caggaaatcg ttttcaacaa cggtgaatac 900
ctggaagttt ctgaaatcaa accgatggaa tctgttctga aatgccgtaa catcgactac 960
cagctggttc tgcactacta ccagctgaaa gttaaatcta tcgacaccgg tgaatctggt 1020
ctgatcaaca ccatctctga caaaaacgaa ctgaacaaat tctacatgtt cctgggtaaa 1080
gtttgccagg actacaaatc tggtaccatc aaagcgttct gggacgactt ctggaaaatc 1140
aaaaacaact accaccgtgt taaaccgctg ccggtttcta ccatccacaa aggtcagggt 1200
tctaccgttg acaactcttt cctgtacacc ccgtgcatca ccaaatacgc tgaaccggac 1260
ctggcttctc agctgctgta cgttggtgtt acccgtgctc gtcacaacgt taacttcgtt 1320
ggttaa 1326
Claims (30)
1.一种孔蛋白单体,其特征在于,所述的孔蛋白单体包括SEQ ID NO:1的突变体,所述的突变体为与SEQ ID NO:1具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列,所述的突变体包含在SEQ ID NO:1的74-130位具有任何一个或多个氨基酸突变的氨基酸序列。
2.根据权利要求1所述的孔蛋白单体,其特征在于,所述的突变体包括在SEQ ID NO:1的74-83、75-83、78-83、75-130或78-130位的一个或多个位置处的突变。
3.根据权利要求1或2所述的孔蛋白单体,其特征在于,所述的突变体还包括在SEQ IDNO:1的1-73或131-314位的一个或多个位置处的突变。
4.根据权利要求1-3任一所述的孔蛋白单体,其特征在于,所述的突变体包括在SEQ IDNO:1的S78、D80、S82或F83位中的一种或两种以上的组合的突变;优选包含下列任一种或两种以上的组合:
A)S78突变为78V或78Y;
B)D80突变为80N或D80缺失;
C)S82突变为82A、82N或82V;
D)F83突变为83Q或83A。
5.根据权利要求4所述的孔蛋白单体,其特征在于,所述的突变体还包括在SEQ ID NO:1的Y75和/或S81的突变;优选包含Y75突变为75F,和/或,S81突变为81A。
6.根据权利要求4或5所述的孔蛋白单体,其特征在于,所述的突变体还包括在SEQ IDNO:1的Q74、E127和/或D130位中的一种、两种或三种的突变,优选包含Q74突变为74L、E127突变为127R和/或D130突变为130K。
7.根据权利要求1-6任一所述的孔蛋白单体,其特征在于,所述的突变体包括以下突变:
(a)SEQ ID NO:1的S78V、D80N、S82A和F83Q;
(b)SEQ ID NO:1的Y75F、S78Y、D80缺失、S81A、S82N和F83A;或,
(c)SEQ ID NO:1的Q74L、Y75F、S78Y、D80缺失、S81A、S82V、F83A、E127R和D130K。
8.根据权利要求1-7任一所述的孔蛋白单体,其特征在于,所述的突变体的氨基酸序列包含SEQ ID NO:3-5中的任一项或与SEQ ID NO:3-5中的任一项具有70%、75%、80%、85%、90%、95%或99%同一性的氨基酸序列。
9.一种构建体,其特征在于,所述的构建体包含至少一个权利要求1-8任一所述的孔蛋白单体。
10.一种突变孔,其特征在于,所述的突变孔包括至少一个权利要求1-8任一所述的孔蛋白单体。
11.根据权利要求10所述的突变孔,其特征在于,所述突变孔包含1-20个SEQ ID NO:1的突变体,其中,所述的突变体相同或不同。
12.根据权利要求10或11所述的突变孔,其特征在于,所述的突变孔包含1-20个SEQ IDNO:1所示野生型孔蛋白单体。
13.根据权利要求10-12任一所述的突变孔,其特征在于,其中所述的突变体与突变体、野生型孔蛋白单体与野生型孔蛋白单体、突变体与野生型孔蛋白单体共价连接。
14.根据权利要求10-13任一所述的突变孔,其特征在于,所述突变孔包含冠状体形成区、缢缩区、环形区域和/或跨膜β桶状体区域。
16.一种用于表征靶分析物的复合物,其特征在于,所述的复合物包括权利要求10-15任一所述的突变孔,以及与其配合使用的控速蛋白。
17.根据权利要求16所述的复合物,其特征在于,所述的控速蛋白包括核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、转录酶、转位酶和/或聚合酶中的一种或多种组合。
18.根据权利要求17所述的复合物,其特征在于,所述的解旋酶选自Hel308家族解旋酶及修饰的Hel308家族解旋酶、RecD解旋酶及其变体、TrwC解旋酶及其变体、Dda解旋酶及其变体、TraI Eco及其变体、XPD Mbu及其变体、Pif1-like解旋酶及其变体。
19.根据权利要求18所述的复合物,其特征在于,所述的解旋酶为Pif1-like解旋酶及其变体,优选的,所述的Pif1-like解旋酶选自Pba-PM2、Aph-Acj61、Aph-PX29、Avi-Aeh1、Sph-CBH8、Eph-Pei26、Aph-AM101、PphPspYZU05、Eph-EcS1、Eph-Cronus2或Mph-MP1,进一步优选的,所述的解旋酶为Mph-MP1变体,所述的Mph-MP1的变体包含E105C和/或A362C突变,更优选的,所述的变体的氨基酸序列如SEQ ID NO:17所示,编码所述的变体的核苷酸序列如SEQ ID NO:18所示。
20.编码权利要求1-8任一所述的孔蛋白单体、权利要求9所述的构建体、权利要求10-15任一所述的突变孔、或权利要求16-19任一所述的复合物的核酸。
21.一种包含权利要求20所述的核酸的载体或宿主细胞。
22.权利要求1-8任一所述的孔蛋白单体、权利要求9所述的构建体、权利要求10-15任一所述的突变孔、权利要求16-19任一所述的复合物、权利要求20所述的核酸或权利要求21所述的载体或宿主细胞在检测靶分析物存在、不存在或一个或多个特征或制备检测靶分析物存在、不存在或一个或多个特征的产品中的应用。
23.一种产生突变孔或其多肽的方法,其特征在于,包括用权利要求21所述的载体转化宿主细胞,诱导所述的宿主细胞表达突变孔或其多肽。
24.一种用于确定靶分析物存在、不存在或一个或多个特征的方法,其特征在于,所述的方法包括:
a.使靶分析物与权利要求10-15任一所述的突变孔、或权利要求16-19任一所述的复合物或复合物中的突变孔接触,使得所述靶分析物相对于所述突变孔移动;以及
b.在所述靶分析物相对于所述的突变孔移动时获取一个或多个测量值,从而确定所述靶分析物的存在、不存在或一个或多个特征。
25.根据权利要求24所述的方法,其特征在于,所述的靶分析物与存在于膜中的所述突变孔相互作用从而使得所述靶分析物相对所述突变孔移动。
26.根据权利要求24或25所述的方法,其特征在于,所述的靶分析物是核酸分子。
27.根据权利要求24或25所述的方法,其特征在于,所述的方法包括将所述靶分析物偶联到膜上;和所述靶分析物与存在于所述膜中的所述突变孔相互作用从而使得所述靶分析物相对所述突变孔移动。
28.根据权利要求24或25所述的方法,其特征在于,所述的方法包括在靶分析物与突变孔、复合物、或复合物中的突变孔接触上施加电势差的步骤。
29.一种用于确定靶分析物存在、不存在或一个或多个特征的试剂盒,其特征在于,所述的试剂盒包括权利要求1-8任一所述的孔蛋白单体、权利要求9所述的构建体、权利要求10-15任一所述的突变孔、权利要求16-19任一所述的复合物、权利要求20所述的核酸或权利要求21所述的载体或宿主细胞,和权利要求27所述的膜。
30.一种用于确定靶分析物存在、不存在或一个或多个特征的装置,其特征在于,所述的装置包括权利要求10-15任一所述的突变孔或权利要求16-19任一所述的复合物,和权利要求27所述的膜。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210471257.XA CN114957412B (zh) | 2022-04-28 | 2022-04-28 | 一种新型孔蛋白单体及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210471257.XA CN114957412B (zh) | 2022-04-28 | 2022-04-28 | 一种新型孔蛋白单体及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114957412A true CN114957412A (zh) | 2022-08-30 |
CN114957412B CN114957412B (zh) | 2024-09-17 |
Family
ID=82979278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210471257.XA Active CN114957412B (zh) | 2022-04-28 | 2022-04-28 | 一种新型孔蛋白单体及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114957412B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117886907A (zh) * | 2022-10-14 | 2024-04-16 | 北京普译生物科技有限公司 | 一种pht纳米孔突变体蛋白及其应用 |
WO2024138382A1 (zh) * | 2022-12-27 | 2024-07-04 | 深圳华大生命科学研究院 | 孔蛋白单体、孔蛋白及其突变体和其应用 |
WO2024138512A1 (zh) * | 2022-12-29 | 2024-07-04 | 深圳华大生命科学研究院 | 新型孔蛋白bcp34、其突变体及其应用 |
WO2024138472A1 (zh) * | 2022-12-28 | 2024-07-04 | 青岛华大基因研究院 | 孔蛋白单体、孔蛋白及其突变体和其应用 |
WO2024138473A1 (zh) * | 2022-12-28 | 2024-07-04 | 深圳华大生命科学研究院 | 孔蛋白单体、孔蛋白及其突变体和其应用 |
WO2024138470A1 (zh) * | 2022-12-28 | 2024-07-04 | 深圳华大生命科学研究院 | 纳米孔传感器及其在测序中的应用 |
WO2024138424A1 (zh) * | 2022-12-28 | 2024-07-04 | 深圳华大生命科学研究院 | 纳米孔蛋白及其应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107207570A (zh) * | 2014-09-01 | 2017-09-26 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
US20190071721A1 (en) * | 2016-03-02 | 2019-03-07 | Oxford Nanopore Technologies Limited | Mutant pore |
CN110914290A (zh) * | 2017-06-30 | 2020-03-24 | 弗拉芒区生物技术研究所 | 新颖蛋白孔 |
CN113651876A (zh) * | 2021-08-18 | 2021-11-16 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
CN113754743A (zh) * | 2021-10-12 | 2021-12-07 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
-
2022
- 2022-04-28 CN CN202210471257.XA patent/CN114957412B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107207570A (zh) * | 2014-09-01 | 2017-09-26 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
US20170283470A1 (en) * | 2014-09-01 | 2017-10-05 | Oxford Nanopore Technologies Ltd. | Mutant csgg pores |
US20190071721A1 (en) * | 2016-03-02 | 2019-03-07 | Oxford Nanopore Technologies Limited | Mutant pore |
CN110914290A (zh) * | 2017-06-30 | 2020-03-24 | 弗拉芒区生物技术研究所 | 新颖蛋白孔 |
CN113651876A (zh) * | 2021-08-18 | 2021-11-16 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
CN113754743A (zh) * | 2021-10-12 | 2021-12-07 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
Non-Patent Citations (1)
Title |
---|
NCBI: "NCBI Reference Sequence: WP_087632357.1", NCBI * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117886907A (zh) * | 2022-10-14 | 2024-04-16 | 北京普译生物科技有限公司 | 一种pht纳米孔突变体蛋白及其应用 |
WO2024138382A1 (zh) * | 2022-12-27 | 2024-07-04 | 深圳华大生命科学研究院 | 孔蛋白单体、孔蛋白及其突变体和其应用 |
WO2024138472A1 (zh) * | 2022-12-28 | 2024-07-04 | 青岛华大基因研究院 | 孔蛋白单体、孔蛋白及其突变体和其应用 |
WO2024138473A1 (zh) * | 2022-12-28 | 2024-07-04 | 深圳华大生命科学研究院 | 孔蛋白单体、孔蛋白及其突变体和其应用 |
WO2024138470A1 (zh) * | 2022-12-28 | 2024-07-04 | 深圳华大生命科学研究院 | 纳米孔传感器及其在测序中的应用 |
WO2024138424A1 (zh) * | 2022-12-28 | 2024-07-04 | 深圳华大生命科学研究院 | 纳米孔蛋白及其应用 |
WO2024138512A1 (zh) * | 2022-12-29 | 2024-07-04 | 深圳华大生命科学研究院 | 新型孔蛋白bcp34、其突变体及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN114957412B (zh) | 2024-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114957412B (zh) | 一种新型孔蛋白单体及其应用 | |
CN113480620B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN113754743B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN113912683B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN113773373B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN113896776B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
JP6874017B2 (ja) | 変異体ポア | |
CN113735948B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN104126018B (zh) | 酶方法 | |
CN113651876B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
KR20170042794A (ko) | 돌연변이체 csgg 포어 | |
CN111164096B (zh) | 一种Mmup单体变体及其应用 | |
WO2006024875A2 (en) | Method for determinig protein solubility | |
CN109486919B (zh) | 一种pcr扩增试剂及其应用 | |
US11845779B2 (en) | Mutant aerolysin and uses thereof | |
WO2023060419A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023060422A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023060418A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023050031A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023060421A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023019471A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023060420A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023019470A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN115960182A (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
US20240352516A1 (en) | Mutant of pore protein monomer, protein pore, and use thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |