CN108697499A - 标记的核苷酸类似物、反应混合物以及测序方法和系统 - Google Patents
标记的核苷酸类似物、反应混合物以及测序方法和系统 Download PDFInfo
- Publication number
- CN108697499A CN108697499A CN201680079672.3A CN201680079672A CN108697499A CN 108697499 A CN108697499 A CN 108697499A CN 201680079672 A CN201680079672 A CN 201680079672A CN 108697499 A CN108697499 A CN 108697499A
- Authority
- CN
- China
- Prior art keywords
- nucleotide analog
- label
- compound
- lys
- gly
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 344
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 62
- 239000011541 reaction mixture Substances 0.000 title claims description 13
- 238000013459 approach Methods 0.000 title description 14
- 150000001875 compounds Chemical class 0.000 claims abstract description 319
- 239000002773 nucleotide Substances 0.000 claims abstract description 176
- 239000003550 marker Substances 0.000 claims abstract description 163
- -1 nucleotide compound Chemical class 0.000 claims abstract description 134
- 239000000203 mixture Substances 0.000 claims abstract description 66
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 41
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 34
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 34
- 230000003993 interaction Effects 0.000 claims abstract description 30
- 208000027418 Wounds and injury Diseases 0.000 claims abstract description 5
- 230000006378 damage Effects 0.000 claims abstract description 5
- 208000014674 injury Diseases 0.000 claims abstract description 5
- 239000000975 dye Substances 0.000 claims description 487
- 230000001681 protective effect Effects 0.000 claims description 157
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 154
- 238000005859 coupling reaction Methods 0.000 claims description 93
- 235000020958 biotin Nutrition 0.000 claims description 89
- 230000008878 coupling Effects 0.000 claims description 87
- 238000010168 coupling process Methods 0.000 claims description 87
- 229960002685 biotin Drugs 0.000 claims description 77
- 239000011616 biotin Substances 0.000 claims description 77
- 238000000034 method Methods 0.000 claims description 56
- 239000003153 chemical reaction reagent Substances 0.000 claims description 53
- 239000002777 nucleoside Substances 0.000 claims description 48
- 239000000126 substance Substances 0.000 claims description 45
- 125000003835 nucleoside group Chemical group 0.000 claims description 43
- 125000000217 alkyl group Chemical group 0.000 claims description 40
- 108090001008 Avidin Proteins 0.000 claims description 32
- 108091033319 polynucleotide Proteins 0.000 claims description 31
- 102000040430 polynucleotide Human genes 0.000 claims description 31
- 239000002157 polynucleotide Substances 0.000 claims description 31
- 125000003118 aryl group Chemical group 0.000 claims description 29
- 238000006467 substitution reaction Methods 0.000 claims description 27
- 239000002253 acid Substances 0.000 claims description 24
- 230000001105 regulatory effect Effects 0.000 claims description 24
- 229920000388 Polyphosphate Polymers 0.000 claims description 19
- 239000001205 polyphosphate Substances 0.000 claims description 19
- 235000011176 polyphosphates Nutrition 0.000 claims description 19
- 150000001450 anions Chemical group 0.000 claims description 17
- 125000005647 linker group Chemical group 0.000 claims description 12
- 229920001223 polyethylene glycol Polymers 0.000 claims description 12
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 claims description 11
- 239000002202 Polyethylene glycol Substances 0.000 claims description 11
- 230000003287 optical effect Effects 0.000 claims description 11
- 150000003852 triazoles Chemical class 0.000 claims description 11
- 229920000768 polyamine Polymers 0.000 claims description 10
- 239000000463 material Substances 0.000 claims description 9
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 8
- 241000218636 Thuja Species 0.000 claims description 8
- 125000004429 atom Chemical group 0.000 claims description 7
- 150000002148 esters Chemical class 0.000 claims description 7
- 239000007850 fluorescent dye Substances 0.000 claims description 7
- 238000001668 nucleic acid synthesis Methods 0.000 claims description 7
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 7
- 229910052698 phosphorus Inorganic materials 0.000 claims description 6
- 108010090804 Streptavidin Proteins 0.000 claims description 5
- 235000001674 Agaricus brunnescens Nutrition 0.000 claims description 4
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 4
- 229910006069 SO3H Inorganic materials 0.000 claims description 4
- 125000002619 bicyclic group Chemical group 0.000 claims description 4
- 239000011574 phosphorus Substances 0.000 claims description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 3
- 101150072119 Avr4 gene Proteins 0.000 claims description 3
- 101100437155 Gallus gallus AVR2 gene Proteins 0.000 claims description 3
- 241000269368 Xenopus laevis Species 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 239000003205 fragrance Substances 0.000 claims description 3
- 108010022355 Fibroins Proteins 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims description 2
- 125000002950 monocyclic group Chemical group 0.000 claims description 2
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 claims 4
- 235000010469 Glycine max Nutrition 0.000 claims 2
- 244000068988 Glycine max Species 0.000 claims 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 claims 2
- 239000005864 Sulphur Substances 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 abstract description 74
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 abstract description 48
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 abstract description 47
- 230000035772 mutation Effects 0.000 abstract description 43
- 238000004458 analytical method Methods 0.000 abstract description 5
- 239000000470 constituent Substances 0.000 abstract description 2
- 230000035945 sensitivity Effects 0.000 abstract 1
- 238000010189 synthetic method Methods 0.000 abstract 1
- 239000000306 component Substances 0.000 description 139
- 108010034529 leucyl-lysine Proteins 0.000 description 79
- 239000002585 base Substances 0.000 description 61
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 57
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 45
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 44
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 44
- 108010012581 phenylalanylglutamate Proteins 0.000 description 37
- 239000000543 intermediate Substances 0.000 description 36
- 108010087823 glycyltyrosine Proteins 0.000 description 35
- 108010051110 tyrosyl-lysine Proteins 0.000 description 32
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 28
- 230000006798 recombination Effects 0.000 description 28
- 238000005215 recombination Methods 0.000 description 28
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 26
- 108010078144 glutaminyl-glycine Proteins 0.000 description 24
- 125000001424 substituent group Chemical group 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 22
- 108090000790 Enzymes Proteins 0.000 description 22
- 108010015792 glycyllysine Proteins 0.000 description 20
- 238000010348 incorporation Methods 0.000 description 20
- 230000004048 modification Effects 0.000 description 20
- 238000012986 modification Methods 0.000 description 20
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 19
- 235000021251 pulses Nutrition 0.000 description 19
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 18
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 18
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 18
- 108010092114 histidylphenylalanine Proteins 0.000 description 18
- 108010017391 lysylvaline Proteins 0.000 description 18
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 17
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 17
- 241000880493 Leptailurus serval Species 0.000 description 17
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 17
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 17
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 17
- 108010062796 arginyllysine Proteins 0.000 description 17
- 108010038633 aspartylglutamate Proteins 0.000 description 17
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 16
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 16
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 16
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 16
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 16
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 16
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 16
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 16
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 16
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 16
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 16
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 16
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 16
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 16
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 16
- 108010054155 lysyllysine Proteins 0.000 description 16
- 108010061238 threonyl-glycine Proteins 0.000 description 16
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 15
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 15
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 15
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 15
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 15
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 15
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 15
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 15
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 15
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 15
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 15
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 15
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 15
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 15
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 15
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 15
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 15
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 15
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 15
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 15
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 15
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 15
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 15
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 15
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 15
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 15
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 15
- ITUAVBRBGKVBLH-BVSLBCMMSA-N Trp-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ITUAVBRBGKVBLH-BVSLBCMMSA-N 0.000 description 15
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 15
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 15
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 15
- 108010044940 alanylglutamine Proteins 0.000 description 15
- 150000001413 amino acids Chemical class 0.000 description 15
- 108010068265 aspartyltyrosine Proteins 0.000 description 15
- 229910052802 copper Inorganic materials 0.000 description 15
- 239000010949 copper Substances 0.000 description 15
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 15
- 108010003700 lysyl aspartic acid Proteins 0.000 description 15
- 108010009298 lysylglutamic acid Proteins 0.000 description 15
- 108010015796 prolylisoleucine Proteins 0.000 description 15
- 102000005962 receptors Human genes 0.000 description 15
- 238000003786 synthesis reaction Methods 0.000 description 15
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 15
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 14
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 14
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 14
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 14
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 14
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 14
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 14
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 14
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 14
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 14
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 14
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 14
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 14
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 14
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 14
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 14
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 14
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 14
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 14
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 14
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 14
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 14
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 14
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 14
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 14
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 14
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 14
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 14
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 14
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 14
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 14
- 108010047495 alanylglycine Proteins 0.000 description 14
- 108010057821 leucylproline Proteins 0.000 description 14
- 102000004169 proteins and genes Human genes 0.000 description 14
- 108090000623 proteins and genes Proteins 0.000 description 14
- 239000000758 substrate Substances 0.000 description 14
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 13
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 13
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 13
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 13
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 13
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 13
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 13
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 13
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 13
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 13
- GQTNWYFWSUFFRA-KKUMJFAQSA-N Gln-Met-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GQTNWYFWSUFFRA-KKUMJFAQSA-N 0.000 description 13
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 13
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 13
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 13
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 13
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 13
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 13
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 13
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 13
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 13
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 13
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 13
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 13
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 13
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 13
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 13
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 13
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 13
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 13
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 13
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 13
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 13
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 13
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 13
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 13
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 13
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 13
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 13
- UFOWQBYMUILSRK-IHRRRGAJSA-N Met-Lys-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 UFOWQBYMUILSRK-IHRRRGAJSA-N 0.000 description 13
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 13
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 13
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 13
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 13
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 13
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 13
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 13
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 13
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 13
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 13
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 13
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 13
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 13
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 13
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 13
- 238000006073 displacement reaction Methods 0.000 description 13
- 125000001072 heteroaryl group Chemical group 0.000 description 13
- 108010018006 histidylserine Proteins 0.000 description 13
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 12
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 12
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 12
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 12
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 12
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 12
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 12
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 12
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 12
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 12
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 12
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 12
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 12
- ZAWOJFFMBANLGE-CIUDSAMLSA-N Lys-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N ZAWOJFFMBANLGE-CIUDSAMLSA-N 0.000 description 12
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 12
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 12
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 12
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 12
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 12
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 12
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 12
- 108010064997 VPY tripeptide Proteins 0.000 description 12
- 150000001615 biotins Chemical class 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 12
- 238000002372 labelling Methods 0.000 description 12
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 12
- 229920000642 polymer Polymers 0.000 description 12
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 11
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 11
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 11
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 11
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 11
- 108010085325 histidylproline Proteins 0.000 description 11
- 108010064235 lysylglycine Proteins 0.000 description 11
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 10
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 10
- STDOKNKEXOLSII-SZMVWBNQSA-N Glu-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CCC(=O)O)N STDOKNKEXOLSII-SZMVWBNQSA-N 0.000 description 10
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 10
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 10
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 10
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 10
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 10
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 10
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 10
- 230000002708 enhancing effect Effects 0.000 description 10
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 10
- 108010027338 isoleucylcysteine Proteins 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- 125000003275 alpha amino acid group Chemical group 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000006911 enzymatic reaction Methods 0.000 description 9
- 230000001965 increasing effect Effects 0.000 description 9
- QGKMIGUHVLGJBR-UHFFFAOYSA-M (4z)-1-(3-methylbutyl)-4-[[1-(3-methylbutyl)quinolin-1-ium-4-yl]methylidene]quinoline;iodide Chemical compound [I-].C12=CC=CC=C2N(CCC(C)C)C=CC1=CC1=CC=[N+](CCC(C)C)C2=CC=CC=C12 QGKMIGUHVLGJBR-UHFFFAOYSA-M 0.000 description 8
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 8
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 8
- 108010093581 aspartyl-proline Proteins 0.000 description 8
- 229910052799 carbon Inorganic materials 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- JKPGHIQCHIIRMS-AVGNSLFASA-N Gln-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N JKPGHIQCHIIRMS-AVGNSLFASA-N 0.000 description 7
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 7
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 7
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 7
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 7
- FEZASNVQLJQBHW-CABZTGNLSA-N Trp-Gly-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O)=CNC2=C1 FEZASNVQLJQBHW-CABZTGNLSA-N 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 125000000524 functional group Chemical group 0.000 description 7
- 125000005842 heteroatom Chemical group 0.000 description 7
- 239000001257 hydrogen Substances 0.000 description 7
- 229910052739 hydrogen Inorganic materials 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- VOUUHEHYSHWUHG-UWVGGRQHSA-N (2s)-2-[[2-[[2-[[2-[[(2s)-2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O VOUUHEHYSHWUHG-UWVGGRQHSA-N 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 238000001712 DNA sequencing Methods 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 6
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 6
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 6
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 6
- 125000001118 alkylidene group Chemical group 0.000 description 6
- 150000001408 amides Chemical class 0.000 description 6
- 150000001540 azides Chemical group 0.000 description 6
- 239000013078 crystal Substances 0.000 description 6
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 6
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 6
- 229910052736 halogen Inorganic materials 0.000 description 6
- 230000005257 nucleotidylation Effects 0.000 description 6
- 229910052760 oxygen Inorganic materials 0.000 description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 6
- 238000006116 polymerization reaction Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 229940035893 uracil Drugs 0.000 description 6
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 5
- 239000004475 Arginine Substances 0.000 description 5
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 5
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 5
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 5
- UPUNWAXSLPBMRK-XTWBLICNSA-N Trp-Thr-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UPUNWAXSLPBMRK-XTWBLICNSA-N 0.000 description 5
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 150000001721 carbon Chemical group 0.000 description 5
- 238000012650 click reaction Methods 0.000 description 5
- 108010020688 glycylhistidine Proteins 0.000 description 5
- 108010081551 glycylphenylalanine Proteins 0.000 description 5
- 125000004433 nitrogen atom Chemical group N* 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 125000001273 sulfonato group Chemical group [O-]S(*)(=O)=O 0.000 description 5
- 229910052717 sulfur Inorganic materials 0.000 description 5
- 125000001425 triazolyl group Chemical group 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- 108060002716 Exonuclease Proteins 0.000 description 4
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 4
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 4
- TZRXHJWUDPFEEY-UHFFFAOYSA-N Pentaerythritol Tetranitrate Chemical compound [O-][N+](=O)OCC(CO[N+]([O-])=O)(CO[N+]([O-])=O)CO[N+]([O-])=O TZRXHJWUDPFEEY-UHFFFAOYSA-N 0.000 description 4
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 4
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 4
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 4
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 4
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 4
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 4
- 238000006555 catalytic reaction Methods 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 150000002367 halogens Chemical class 0.000 description 4
- 125000004415 heterocyclylalkyl group Chemical group 0.000 description 4
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 150000003833 nucleoside derivatives Chemical class 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 3
- KAESVJOAVNADME-UHFFFAOYSA-N 1H-pyrrole Natural products C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 3
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 3
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 3
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 3
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 3
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 3
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 3
- 241000724210 Bacillus virus GA1 Species 0.000 description 3
- 241000701844 Bacillus virus phi29 Species 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 3
- IIGHQOPGMGKDMT-SRVKXCTJSA-N Cys-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N IIGHQOPGMGKDMT-SRVKXCTJSA-N 0.000 description 3
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 3
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 3
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 3
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 3
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 3
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 3
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 3
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 3
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 3
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 3
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 3
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 3
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 3
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 3
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 3
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 3
- PGPCENKYTLDIFM-SZMVWBNQSA-N Trp-His-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PGPCENKYTLDIFM-SZMVWBNQSA-N 0.000 description 3
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 3
- 125000002252 acyl group Chemical group 0.000 description 3
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 239000003513 alkali Substances 0.000 description 3
- 150000001345 alkine derivatives Chemical group 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 125000000129 anionic group Chemical group 0.000 description 3
- 125000003710 aryl alkyl group Chemical group 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 3
- ZPWOOKQUDFIEIX-UHFFFAOYSA-N cyclooctyne Chemical compound C1CCCC#CCC1 ZPWOOKQUDFIEIX-UHFFFAOYSA-N 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N ether Substances CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- 125000005677 ethinylene group Chemical group [*:2]C#C[*:1] 0.000 description 3
- 238000000695 excitation spectrum Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 229940029575 guanosine Drugs 0.000 description 3
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 229920002521 macromolecule Polymers 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 3
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- JYEUMXHLPRZUAT-UHFFFAOYSA-N 1,2,3-triazine Chemical compound C1=CN=NN=C1 JYEUMXHLPRZUAT-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- 241000403668 Actinomyces virus Av1 Species 0.000 description 2
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 2
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 2
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 2
- 241000724217 Bacillus phage M2Y Species 0.000 description 2
- 241000701897 Bacillus virus B103 Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- KAKZBPTYRLMSJV-UHFFFAOYSA-N Butadiene Chemical compound C=CC=C KAKZBPTYRLMSJV-UHFFFAOYSA-N 0.000 description 2
- ZLHPWFSAUJEEAN-KBIXCLLPSA-N Cys-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N ZLHPWFSAUJEEAN-KBIXCLLPSA-N 0.000 description 2
- HEPLXMBVMCXTBP-QWRGUYRKSA-N Cys-Phe-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O HEPLXMBVMCXTBP-QWRGUYRKSA-N 0.000 description 2
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 2
- LHRCZIRWNFRIRG-SRVKXCTJSA-N Cys-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O LHRCZIRWNFRIRG-SRVKXCTJSA-N 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical group C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 2
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- JUUNNOLZGVYCJT-JYJNAYRXSA-N Gln-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JUUNNOLZGVYCJT-JYJNAYRXSA-N 0.000 description 2
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 2
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 2
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 2
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 2
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 2
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 2
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 2
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 2
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 2
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 2
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- IECZNARPMKQGJC-XIRDDKMYSA-N Met-Gln-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N IECZNARPMKQGJC-XIRDDKMYSA-N 0.000 description 2
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 2
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 2
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 2
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 2
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- 241000702068 Streptococcus phage Cp-1 Species 0.000 description 2
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 2
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- XDGPTBVOSHKDFT-KKUMJFAQSA-N Tyr-Met-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XDGPTBVOSHKDFT-KKUMJFAQSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- NMPXRFYMZDIBRF-ZOBUZTSGSA-N Val-Asn-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NMPXRFYMZDIBRF-ZOBUZTSGSA-N 0.000 description 2
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 2
- SJLVYVZBFDTRCG-DCAQKATOSA-N Val-Lys-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N SJLVYVZBFDTRCG-DCAQKATOSA-N 0.000 description 2
- 125000005354 acylalkyl group Chemical group 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 150000001335 aliphatic alkanes Chemical class 0.000 description 2
- 125000002947 alkylene group Chemical group 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Chemical compound BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 125000000753 cycloalkyl group Chemical group 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 239000011737 fluorine Substances 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 150000002338 glycosides Chemical class 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000003254 radicals Chemical class 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 238000002165 resonance energy transfer Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 125000000542 sulfonic acid group Chemical group 0.000 description 2
- 125000004434 sulfur atom Chemical group 0.000 description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- RAOIDOHSFRTOEL-UHFFFAOYSA-N tetrahydrothiophene Chemical compound C1CCSC1 RAOIDOHSFRTOEL-UHFFFAOYSA-N 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 125000004417 unsaturated alkyl group Chemical group 0.000 description 2
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 2
- NIANZCQUVKPGSF-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 2,2,2-trifluoroacetate Chemical compound FC(F)(F)C(=O)ON1C(=O)CCC1=O NIANZCQUVKPGSF-UHFFFAOYSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- DWNBOPVKNPVNQG-LURJTMIESA-N (2s)-4-hydroxy-2-(propylamino)butanoic acid Chemical group CCCN[C@H](C(O)=O)CCO DWNBOPVKNPVNQG-LURJTMIESA-N 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 125000004209 (C1-C8) alkyl group Chemical group 0.000 description 1
- 150000000182 1,3,5-triazines Chemical class 0.000 description 1
- OTEKOJQFKOIXMU-UHFFFAOYSA-N 1,4-bis(trichloromethyl)benzene Chemical compound ClC(Cl)(Cl)C1=CC=C(C(Cl)(Cl)Cl)C=C1 OTEKOJQFKOIXMU-UHFFFAOYSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- MKDCJAPHKZPKOU-UHFFFAOYSA-N 1-nitro-2,3-dihydroindole Chemical compound C1=CC=C2N([N+](=O)[O-])CCC2=C1 MKDCJAPHKZPKOU-UHFFFAOYSA-N 0.000 description 1
- 125000004206 2,2,2-trifluoroethyl group Chemical group [H]C([H])(*)C(F)(F)F 0.000 description 1
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 125000002941 2-furyl group Chemical group O1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical class CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 description 1
- BKOOMYPCSUNDGP-UHFFFAOYSA-N 2-methylbut-2-ene Chemical group CC=C(C)C BKOOMYPCSUNDGP-UHFFFAOYSA-N 0.000 description 1
- 125000000094 2-phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000004105 2-pyridyl group Chemical group N1=C([*])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- 125000000175 2-thienyl group Chemical group S1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- 125000000474 3-butynyl group Chemical group [H]C#CC([H])([H])C([H])([H])* 0.000 description 1
- 125000003682 3-furyl group Chemical group O1C([H])=C([*])C([H])=C1[H] 0.000 description 1
- 125000003349 3-pyridyl group Chemical group N1=C([H])C([*])=C([H])C([H])=C1[H] 0.000 description 1
- 125000001541 3-thienyl group Chemical group S1C([H])=C([*])C([H])=C1[H] 0.000 description 1
- JNRLEMMIVRBKJE-UHFFFAOYSA-N 4,4'-Methylenebis(N,N-dimethylaniline) Chemical group C1=CC(N(C)C)=CC=C1CC1=CC=C(N(C)C)C=C1 JNRLEMMIVRBKJE-UHFFFAOYSA-N 0.000 description 1
- ZQWYRGRHXNAOLE-UHFFFAOYSA-N 4,8-disulfonaphthalene-2,6-dicarboxylic acid Chemical class C1=C(C(O)=O)C=C(S(O)(=O)=O)C2=CC(C(=O)O)=CC(S(O)(=O)=O)=C21 ZQWYRGRHXNAOLE-UHFFFAOYSA-N 0.000 description 1
- GJAKJCICANKRFD-UHFFFAOYSA-N 4-acetyl-4-amino-1,3-dihydropyrimidin-2-one Chemical class CC(=O)C1(N)NC(=O)NC=C1 GJAKJCICANKRFD-UHFFFAOYSA-N 0.000 description 1
- 125000000339 4-pyridyl group Chemical group N1=C([H])C([H])=C([*])C([H])=C1[H] 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- KSNXJLQDQOIRIP-UHFFFAOYSA-N 5-iodouracil Chemical compound IC1=CNC(=O)NC1=O KSNXJLQDQOIRIP-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical group [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical class NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 1
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- BBYTXXRNSFUOOX-IHRRRGAJSA-N Arg-Cys-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BBYTXXRNSFUOOX-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- XQFLFQWOBXPMHW-NHCYSSNCSA-N Asp-Val-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XQFLFQWOBXPMHW-NHCYSSNCSA-N 0.000 description 1
- 102000040350 B family Human genes 0.000 description 1
- 108091072128 B family Proteins 0.000 description 1
- 239000007989 BIS-Tris Propane buffer Substances 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 244000187801 Carpobrotus edulis Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- KZBUYRJDOAKODT-UHFFFAOYSA-N Chlorine Chemical compound ClCl KZBUYRJDOAKODT-UHFFFAOYSA-N 0.000 description 1
- QFMCHXSGIZPBKG-ZLUOBGJFSA-N Cys-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N QFMCHXSGIZPBKG-ZLUOBGJFSA-N 0.000 description 1
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 1
- MFMDKTLJCUBQIC-MXAVVETBSA-N Cys-Phe-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MFMDKTLJCUBQIC-MXAVVETBSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 1
- 102100035481 DNA polymerase eta Human genes 0.000 description 1
- 102220626124 DNA polymerase eta_A68V_mutation Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000555268 Dendroides Species 0.000 description 1
- YZGQDNOIGFBYKF-UHFFFAOYSA-N Ethoxyacetic acid Natural products CCOCC(O)=O YZGQDNOIGFBYKF-UHFFFAOYSA-N 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 1
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- JJSVALISDCNFCU-SZMVWBNQSA-N Glu-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JJSVALISDCNFCU-SZMVWBNQSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- FZKFYOXDVWDELO-KBPBESRZSA-N His-Gly-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FZKFYOXDVWDELO-KBPBESRZSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- AJTBOTWDSRSUDV-ULQDDVLXSA-N His-Phe-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O AJTBOTWDSRSUDV-ULQDDVLXSA-N 0.000 description 1
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 1
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000868883 Homo sapiens Transcription factor Sp6 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- UWBDLNOCIDGPQE-GUBZILKMSA-N Ile-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN UWBDLNOCIDGPQE-GUBZILKMSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 101710192606 Latent membrane protein 2 Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- JLYUZRKPDKHUTC-WDSOQIARSA-N Leu-Pro-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JLYUZRKPDKHUTC-WDSOQIARSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- QFGVDCBPDGLVTA-SZMVWBNQSA-N Lys-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 QFGVDCBPDGLVTA-SZMVWBNQSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- YAWKHFKCNSXYDS-XIRDDKMYSA-N Met-Glu-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N YAWKHFKCNSXYDS-XIRDDKMYSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- CRVSHEPROQHVQT-AVGNSLFASA-N Met-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N CRVSHEPROQHVQT-AVGNSLFASA-N 0.000 description 1
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 1
- QLESZRANMSYLCZ-CYDGBPFRSA-N Met-Pro-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QLESZRANMSYLCZ-CYDGBPFRSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 1
- VYXIKLFLGRTANT-HRCADAONSA-N Met-Tyr-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N VYXIKLFLGRTANT-HRCADAONSA-N 0.000 description 1
- 102000002568 Multienzyme Complexes Human genes 0.000 description 1
- 108010093369 Multienzyme Complexes Proteins 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 229910003849 O-Si Inorganic materials 0.000 description 1
- 240000001439 Opuntia Species 0.000 description 1
- 229910003872 O—Si Inorganic materials 0.000 description 1
- 101150054516 PRD1 gene Proteins 0.000 description 1
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- PDUVELWDJZOUEI-IHRRRGAJSA-N Phe-Cys-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PDUVELWDJZOUEI-IHRRRGAJSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 101150022192 PolH gene Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 108700018273 Rad30 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 101100459905 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NCP1 gene Proteins 0.000 description 1
- 101100137166 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RAD30 gene Proteins 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- 229910007161 Si(CH3)3 Inorganic materials 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 101710109576 Terminal protein Proteins 0.000 description 1
- UWHCKJMYHZGTIT-UHFFFAOYSA-N Tetraethylene glycol, Natural products OCCOCCOCCOCCO UWHCKJMYHZGTIT-UHFFFAOYSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- CSZFFQBUTMGHAH-UAXMHLISSA-N Thr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O CSZFFQBUTMGHAH-UAXMHLISSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 1
- 102100032316 Transcription factor Sp6 Human genes 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- OWSRIUBVJOQHNY-IHPCNDPISA-N Trp-Lys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N OWSRIUBVJOQHNY-IHPCNDPISA-N 0.000 description 1
- NESIQDDPEFTWAH-BPUTZDHNSA-N Trp-Met-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O NESIQDDPEFTWAH-BPUTZDHNSA-N 0.000 description 1
- WBZOZLNLXVBCNW-LTHWPDAASA-N Trp-Thr-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)[C@@H](C)O)=CNC2=C1 WBZOZLNLXVBCNW-LTHWPDAASA-N 0.000 description 1
- DYIXEGROAOVQPK-VFAJRCTISA-N Trp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DYIXEGROAOVQPK-VFAJRCTISA-N 0.000 description 1
- RQKMZXSRILVOQZ-GMVOTWDCSA-N Trp-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RQKMZXSRILVOQZ-GMVOTWDCSA-N 0.000 description 1
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- FMOSEWZYZPMJAL-KKUMJFAQSA-N Tyr-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N FMOSEWZYZPMJAL-KKUMJFAQSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 1
- CVXURBLRELTJKO-BWAGICSOSA-N Tyr-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O CVXURBLRELTJKO-BWAGICSOSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 1
- FASACHWGQBNSRO-ZEWNOJEFSA-N Tyr-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FASACHWGQBNSRO-ZEWNOJEFSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- NAHUCETZGZZSEX-IHPCNDPISA-N Tyr-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NAHUCETZGZZSEX-IHPCNDPISA-N 0.000 description 1
- MWUYSCVVPVITMW-IGNZVWTISA-N Tyr-Tyr-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 MWUYSCVVPVITMW-IGNZVWTISA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 1
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 1
- OJOMXGVLFKYDKP-QXEWZRGKSA-N Val-Met-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OJOMXGVLFKYDKP-QXEWZRGKSA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 1
- VBTFUDNTMCHPII-FKBYEOEOSA-N Val-Trp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VBTFUDNTMCHPII-FKBYEOEOSA-N 0.000 description 1
- VBTFUDNTMCHPII-UHFFFAOYSA-N Val-Trp-Tyr Natural products C=1NC2=CC=CC=C2C=1CC(NC(=O)C(N)C(C)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 VBTFUDNTMCHPII-UHFFFAOYSA-N 0.000 description 1
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- 206010048218 Xeroderma Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000012445 acidic reagent Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 150000001266 acyl halides Chemical class 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 230000002152 alkylating effect Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 125000005237 alkyleneamino group Chemical group 0.000 description 1
- 125000005238 alkylenediamino group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 229940111121 antirheumatic drug quinolines Drugs 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 125000005110 aryl thio group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 125000001488 beta-D-galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 description 1
- WQZGKKKJIJFFOK-RWOPYEJCSA-N beta-D-mannose Chemical compound OC[C@H]1O[C@@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-RWOPYEJCSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- HHKZCCWKTZRCCL-UHFFFAOYSA-N bis-tris propane Chemical compound OCC(CO)(CO)NCCCNC(CO)(CO)CO HHKZCCWKTZRCCL-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 239000006184 cosolvent Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- NGKWJWXSMXOXLH-UHFFFAOYSA-N cyclooct-2-yn-1-amine Chemical compound NC1CCCCCC#C1 NGKWJWXSMXOXLH-UHFFFAOYSA-N 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- DIOQZVSQGTUSAI-NJFSPNSNSA-N decane Chemical compound CCCCCCCCC[14CH3] DIOQZVSQGTUSAI-NJFSPNSNSA-N 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000005595 deprotonation Effects 0.000 description 1
- 238000010537 deprotonation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 238000002284 excitation--emission spectrum Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000002060 fluorescence correlation spectroscopy Methods 0.000 description 1
- 238000002875 fluorescence polarization Methods 0.000 description 1
- 238000003682 fluorination reaction Methods 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- XPJRQAIZZQMSCM-UHFFFAOYSA-N heptaethylene glycol Chemical compound OCCOCCOCCOCCOCCOCCOCCO XPJRQAIZZQMSCM-UHFFFAOYSA-N 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 125000004366 heterocycloalkenyl group Chemical group 0.000 description 1
- IIRDTKBZINWQAW-UHFFFAOYSA-N hexaethylene glycol Chemical compound OCCOCCOCCOCCOCCOCCO IIRDTKBZINWQAW-UHFFFAOYSA-N 0.000 description 1
- 125000004836 hexamethylene group Chemical group [H]C([H])([*:2])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[*:1] 0.000 description 1
- 239000004312 hexamethylene tetramine Substances 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 150000002430 hydrocarbons Chemical group 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 206010021198 ichthyosis Diseases 0.000 description 1
- JBFYUZGYRGXSFL-UHFFFAOYSA-N imidazolide Chemical compound C1=C[N-]C=N1 JBFYUZGYRGXSFL-UHFFFAOYSA-N 0.000 description 1
- 239000002955 immunomodulating agent Substances 0.000 description 1
- 230000002584 immunomodulator Effects 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- DZVCFNFOPIZQKX-LTHRDKTGSA-M merocyanine Chemical compound [Na+].O=C1N(CCCC)C(=O)N(CCCC)C(=O)C1=C\C=C\C=C/1N(CCCS([O-])(=O)=O)C2=CC=CC=C2O\1 DZVCFNFOPIZQKX-LTHRDKTGSA-M 0.000 description 1
- 125000001434 methanylylidene group Chemical group [H]C#[*] 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- HRDXJKGNWSUIBT-UHFFFAOYSA-N methoxybenzene Chemical group [CH2]OC1=CC=CC=C1 HRDXJKGNWSUIBT-UHFFFAOYSA-N 0.000 description 1
- XBCXJKGHPABGSD-UHFFFAOYSA-N methyluracil Natural products CN1C=CC(=O)NC1=O XBCXJKGHPABGSD-UHFFFAOYSA-N 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 125000002757 morpholinyl group Chemical group 0.000 description 1
- DIOQZVSQGTUSAI-UHFFFAOYSA-N n-butylhexane Natural products CCCCCCCCCC DIOQZVSQGTUSAI-UHFFFAOYSA-N 0.000 description 1
- 125000003136 n-heptyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 102000026415 nucleotide binding proteins Human genes 0.000 description 1
- 108091014756 nucleotide binding proteins Proteins 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 125000002971 oxazolyl group Chemical group 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 230000020477 pH reduction Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 150000003009 phosphonic acids Chemical class 0.000 description 1
- 125000004437 phosphorous atom Chemical group 0.000 description 1
- 230000008832 photodamage Effects 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 229920001084 poly(chloroprene) Polymers 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000570 polyether Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 239000001120 potassium sulphate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000013404 process transfer Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000001012 protector Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000005344 pyridylmethyl group Chemical group [H]C1=C([H])C([H])=C([H])C(=N1)C([H])([H])* 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 125000001567 quinoxalinyl group Chemical group N1=C(C=NC2=CC=CC=C12)* 0.000 description 1
- 229940047431 recombinate Drugs 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 125000005504 styryl group Chemical group 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 150000005846 sugar alcohols Polymers 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 125000002769 thiazolinyl group Chemical group 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 125000005309 thioalkoxy group Chemical group 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 108010081020 traptavidin Proteins 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
- WCNMEQDMUYVWMJ-JPZHCBQBSA-N wybutoxosine Chemical compound C1=NC=2C(=O)N3C(CC([C@H](NC(=O)OC)C(=O)OC)OO)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WCNMEQDMUYVWMJ-JPZHCBQBSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C09—DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
- C09B—ORGANIC DYES OR CLOSELY-RELATED COMPOUNDS FOR PRODUCING DYES, e.g. PIGMENTS; MORDANTS; LAKES
- C09B69/00—Dyes not provided for by a single group of this subclass
- C09B69/10—Polymeric dyes; Reaction products of dyes with monomers or with macromolecular compounds
- C09B69/108—Polymeric dyes; Reaction products of dyes with monomers or with macromolecular compounds containing a phthalocyanine dye
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/06—Pyrimidine radicals
- C07H19/10—Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
- C07H19/20—Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
- C07H19/207—Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids the phosphoric or polyphosphoric acids being esterified by a further hydroxylic compound, e.g. flavine adenine dinucleotide or nicotinamide-adenine dinucleotide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C09—DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
- C09B—ORGANIC DYES OR CLOSELY-RELATED COMPOUNDS FOR PRODUCING DYES, e.g. PIGMENTS; MORDANTS; LAKES
- C09B69/00—Dyes not provided for by a single group of this subclass
- C09B69/10—Polymeric dyes; Reaction products of dyes with monomers or with macromolecular compounds
- C09B69/105—Polymeric dyes; Reaction products of dyes with monomers or with macromolecular compounds containing a methine or polymethine dye
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Chemical Kinetics & Catalysis (AREA)
Abstract
本发明提供了标记的核苷酸类似物,其包含至少一个亲和素蛋白、至少一个染料标记的化合物和至少一个核苷酸化合物。这些类似物可用于各种基于荧光的分析方法,包括在高密度下大量的高度多重光学反应分析,如单分子实时核酸测序反应。在期望的波长处,所述类似物能够以高灵敏度检测。标记的核苷酸类似物包含调节类似物与DNA聚合酶相互作用的结构组分,从而在测序反应中减少类似物的光损伤并改善类似物的动力学性质和其他性质。还提供了本发明类似物的核苷酸化合物和染料标记的化合物,以及可用于制备化合物和类似物的中间体。还提供了:包含所述化合物的组合物;中间体、化合物和类似物的合成方法;以及突变DNA聚合酶。
Description
相关申请的交叉引用
本申请要求于2015年11月20日提交的美国临时申请No.62/258,416的权益,将其公开内容通过全文引用并入本文。
序列表
本申请包括2016年11月21日创建的名为“1407-00-014WO1_2016-11-21_Seq_list_ST25.txt”的ASCII兼容文本文件中所示出的序列表,该序列表含有136,110字节,将以全文引用的方式并入本文中。
背景技术
新型经修饰的核苷酸试剂的发展、特别是含有荧光标记的核苷酸试剂的产生,增加了核苷酸测序反应的效能,例如提供鉴定单一反应溶液中所有四种碱基的核苷酸测序反应。这种方法已被用于掺入事件(incorporation event)的“实时”检测,其中掺入行为产生能够被检测到的信号事件。在特别优选的方法中,将标记组分偶联至在掺入事件期间被除去的核苷酸部分,从而消除了任何在添加下一个核苷酸之前对于除去这些标记组分的需要。参见(例如)Eid,J.等(2009)Science 323:133-138。
然而,与此同时,下一代测序(包括全基因组测序和再测序、转录组谱分析、表观基因组表征、DNA-蛋白质相互作用分析等)的需求则需要在每单位碱基测序成本较低的条件下提高通量。然而,较高的通量会影响所得的测序数据的质量。例如,在任意酶介导的模板依赖性测序过程中,掺入过程的总体保真度、持续合成能力和/或精确度能够对序列识别产生直接的影响。反过来,较低的精确度可能需要多重覆盖来以高的置信度水平鉴定特定序列。
因此,仍然需要提高分析系统中核苷酸测序反应的性能。具体而言,仍然需要开发在单分子实时测序反应中具有改善的动力学性质并表现出其他理想特征的经修饰的核苷酸试剂。
发明内容
本公开在一个方面通过提供标记的核苷酸类似物来解决这些和其他需求,所述标记的核苷酸类似物包含:
第一亲和素蛋白,其具有四个亚基,各亚基包含一个生物素结合位点;
第一核苷酸化合物,其结合至第一亲和素蛋白,所述第一核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件,其中第一核苷酸化合物包含至少一个亲合力调节元件;以及
第一染料标记的化合物,其结合至第一亲和素蛋白,所述第一染料标记的化合物包含供体染料、受体染料、末端偶联元件和染料化合物接头元件。
在一些实施方案中,标记的核苷酸类似物还包含其他亲和素蛋白、其他核苷酸化合物或其他染料标记的化合物。
在具体实施方案中,一个或多个核苷酸化合物以及一个或多个染料标记的化合物通过一个或多个生物素部分结合至一个或多个亲和素蛋白。
在一些实施方案中,第一核苷酸化合物由结构式(I)表示:
其中
L为核苷酸接头元件,并且其包括亲合力调节元件;
P为多磷酸酯元件;
Nu为核苷元件;
X为多价中央核心元件;
B”为末端偶联元件,并且其包括生物素部分;
n为1至4的整数;并且
o为0或1。
在具体实施方案中,亲合力调节元件为芳香族间隔元件或防护元件。
根据另一方面,本公开提供了标记的核苷酸类似物,其包含:
第一亲和素蛋白,其具有四个亚基,各亚基包含一个生物素结合位点;
第一核苷酸化合物,其结合至第一亲和素蛋白,所述第一核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件;以及
第一染料标记的化合物,其结合至第一亲和素蛋白,所述第一染料标记的化合物包含供体染料、受体染料、末端偶联元件、染料化合物接头元件和防护元件。
在一些实施方案中,标记的核苷酸类似物还包含其他亲和素蛋白、其他核苷酸化合物或其他染料标记的化合物。
在具体实施方案中,一个或多个核苷酸化合物以及一个或多个染料标记的化合物通过生物素部分结合至一个或多个亲和素蛋白。
在一些具体实施方案中,染料标记的化合物包含其他供体染料或受体染料。在其他具体实施方案中,染料化合物接头元件包含防护元件或侧链元件。
在一些实施方案中,第一染料标记的化合物由结构式(IIIA)、(IIIB)、(IIIC)、(IIID)或(IIIE)表示:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各A独立地为受体染料;
各D独立地为供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r独立地为0至8的整数;
其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。
在其他实施方案中,第一染料标记的化合物由结构式(IIIF)表示:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各A独立地为受体染料;
各D独立地为供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r’独立地为0至4的整数;
其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。
还在其他实施方案中,第一染料标记的化合物由结构式(IIIG)表示:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各Dye独立地为受体染料或供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r”独立地为0至8的整数;
s为1至6的整数;并且
t为0或1;
其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。
在另一方面,本公开提供了用于对核酸模板进行测序的反应混合物,其包含:
聚合酶复合物,其包含聚合酶、模板核酸和任选地与模板核酸杂交的引物,其中使聚合酶复合物固定于表面上;以及
测序试剂,其与所述表面接触并包含用于进行核酸合成的试剂,该测序试剂包括本公开的两个或多个标记的核苷酸类似物。
本公开还提供了利用本公开的标记的核苷酸类似物对核酸进行测序的方法和系统。
尽管主要根据核酸聚合酶,特别是DNA聚合酶进行描述,但应该理解,提供改进的核苷酸化合物、染料标记的化合物以及包含上述化合物的标记的核苷酸类似物的方法可以有效地应用于人们可能希望实时直接观察酶反应的其他酶系统。这样的酶系统包括(例如)其他合成酶(例如,RNA聚合酶、逆转录酶、核糖体聚合酶)以及其他酶系统(如激酶、磷酸酶、蛋白酶、核酸酶、连接酶等)。
附图简要说明
图1A和图1B示意性地示出了可以使用本发明的方面进行的示例性核酸测序过程。
图2A示出了与亲和素蛋白防护物相连的双生物素标记的染料组分和两个生物素标记的核苷酸组分。图2B示出了与亲和素蛋白防护物相连的双生物素标记的核苷酸组分和两个生物素标记的染料组分。图2C示出了与亲和素蛋白防护物相连的双生物素标记的染料组分和双生物素标记的核苷酸组分。图2D示出了与两个亲和素蛋白防护物相连的用两个双生物素部分标记的染料组分,其中每个生物素蛋白防护物都与包含双生物素的核苷酸组分相连。
图3A至图3O’示出了本公开的示例性的标记核苷酸类似物。
图4A至图4C示出了缺乏防护元件的示例性染料标记的化合物。
图5A至图5M示出了包括防护元件的本公开的示例性染料标记的化合物。
图6A图示了用于掺入本公开的标记的核苷酸类似物的示例性中间体结构。图6B至图6D示出了对应于图6A的中间体的示例性化学结构。
图6E示出了双生物素标记的、四供体染料(“D4”)防护的中间体化合物的化学合成和该分子的图示。图6F示出了用于本发明的标记的核苷酸类似物的组装中的示例性防护的四供体染料中间体化合物的另一个图示(左)和化学结构(右)。
图7A至图7D概述了用于本公开的标记的核苷酸类似物的合成组装的示例性路线。图7E示出了图7A至图7D所示的一些不同的中间体组分的图示之间的关系以及这些组分的化学结构。图7F示出了来自核苷酸和染料标记的中间体组分和亲和素蛋白的其他的标记的核苷酸类似物结构以及它们的组装。图7G示出了替代的有防护的中间体组分的化学结构,该组分包括四个有防护的供体染料和两个叠氮基(左)。图中还示出了可以从中间体组分生成的示例性标记的核苷酸类似物的图示(右)。
图8描绘了在具有含有DISC的六磷酸类似物的突变体Φ29聚合酶的晶体结构中,与1H-2,3-二氢异喹啉-8-磺基-6-羧酸(“DISC”)基团的相互作用。聚合酶包含E375Y和K512Y置换。
图9描绘了在具有六磷酸类似物的突变体Φ29聚合酶的晶体结构中,与DISC和SG1基团的相互作用。聚合酶包含E375W、K512F和L142R置换。
图10描绘了在具有含有DISC的六磷酸类似物的突变体Φ29聚合酶的晶体结构中,与DISC基团的相互作用。聚合酶包含E375W、K512H和K135R置换。
图11A描绘了在具有含有DSDC的六磷酸类似物的突变体Φ29聚合酶模型中,与DSDC基团的相互作用。聚合酶包含E375Y、D510R和K512Y置换。
图11B描绘了在具有含有DSDC的六磷酸类似物的突变体Φ29聚合酶模型中,与DSDC基团的相互作用。聚合酶包含K135R、E375Y、D510R和K512Y置换。
图12A和图12B示出了使用单核苷酸和二核苷酸类似物测序的精确度的比较。
图13A和图13B示出了使用单核苷酸和二核苷酸类似物的测序动力学的比较。
图14A比较了使用二核苷酸类似物和使用经修饰的单核苷酸类似物进行的测序反应,各自用dG标记。图14B示出了图14A的反应的归一化的脉冲间隔距离值。
图15A至图15C示出了二核苷酸类似物和各种经修饰的单核苷酸类似物的归一化的脉冲间隔距离、总体速率和合并误差。
图16A示出了具有各种阴离子芳香族间隔基的核苷酸类似物的归一化的脉冲间隔距离。图16B示出了IPD分布曲线,而图16C示出于相同类似物的归一化的脉冲宽度。
图17A示出了具有增加数量的侧链的核苷酸类似物的IPD分布曲线。图17B示出了相同类似物的归一化的IPD值。
图18示出了具有阴离子芳香族间隔基的单核苷酸和二核苷酸类似物的IPD分布曲线和归一化的IPD值(内插图)。
图19A图示了本公开的一些示例性类似物结构。图19B示出了归一化的脉冲间隔距离,而图19C示出了本公开的各种核苷酸类似物的聚合速率。
发明详述
标记的核苷酸类似物用于各种不同的应用。这样的应用包括(例如)在进行反应时实时观察单个分子,如单个生物分子。为了便于讨论,本文针对下列优选的用途讨论此类标记的核苷酸类似物,特别是本公开的示例性核苷酸类似物:核酸序列信息的分析,特别是单分子核酸序列分析。
在优选的应用中,实时监测单分子引物延伸反应,以识别正在进行的核苷酸向延伸产物中的掺入,从而阐明潜在的模板序列。在这种单分子实时(或SMRTTM)测序中,在聚合酶介导的模板依赖性引物延伸反应中的核苷酸的掺入过程在其发生时即被监测。在优选的方面,提供了模板/聚合酶引物复合物,其通常固定在光学限制区域内,如零模式波导(ZMW)内,或者在透明衬底、光波导等的表面附近(参见例如,美国专利No.6,917,726和7,170,050以及美国专利申请公开No.2007/0134128,出于所有目的,将上述公开内容以全文引用的方式并入本文)。用针对待使用的标记的核苷酸的适当的激发辐射照射光学限制区域。因为复合物处于光学限制区域或非常小的照射体积内,所以只有直接围绕复合物的反应体积受到激发辐射。因此,那些(例如在掺入事件期间)与复合物相互作用的荧光标记的核苷酸在照射体积内存在充足的时间,从而将其识别为已掺入的。
该测序过程的示意性示意图示于图1A至图1B。如图1A所示,将聚合酶、模板核酸和引物序列的固定化复合物102设置在(例如)零模式波导106的光学限制的观察体积内(如虚线104所示)。作为合适的核苷酸类似物,将(例如)核苷酸108掺入到新生核酸链中,对应于掺入期间观察体积内的标记的核苷酸类似物的保留时间,对其进行照射延长的一段时间,其产生与上述保留相关的信号,例如图1B中的A轨迹所示的信号脉冲112。一旦掺入,与标记的核苷酸类似物的多磷酸酯组分相连的标记物即被释放。当下一个合适的核苷酸类似物(例如核苷酸110)与复合物接触时,该标记物也掺入,从而产生图1B的T轨迹中的相应的信号114。如模板序列的潜在互补性所指示的,通过监测碱基向新生链中的掺入,可以获得模板的序列信息的长序列。
如在PCT国际公开No.WO2009/145828A2中所描述的(出于所有目的,将其全文以引用的方式并入本文),可以通过观察对应于以下反应步骤的明亮阶段和黑暗阶段来确定特定核苷酸的掺入:例如,荧光标记物与聚合酶相关联的反应步骤,以及荧光标记物与酶不相关的步骤。在某些条件下,聚合酶反应系统将显示出两个缓慢的(动力学可观察的)反应步骤,其中各步骤处于明亮阶段。在其他条件下,该系统将显示出两个动力学可观察的反应步骤,其中各步骤处于黑暗阶段。在还一些条件下,该系统将显示四个动力学可观察的(缓慢的)反应步骤,两个缓慢的步骤处于明亮阶段并且两个缓慢的步骤处于黑暗阶段。影响所观察到的动力学的因素包括聚合酶的类型、聚合酶反应条件(包括辅酶因子的类型和水平)以及反应底物。
本文公开的标记的核苷酸类似物(包括其核苷酸和染料标记的组分)包含调节聚合酶反应动力学以改善系统性能的结构特征。因此,本发明核苷酸类似物的改善的性能为这些类似物在各种分析技术中的使用提供了优势。特别地,本公开提供了标记的核苷酸类似物,其在一些情况下,除了其他有利的性质之外,还在SMRTTMDNA测序期间显示出缩短的IPD(脉冲间隔距离)。这些类似物的聚合酶速率相应地增加。通过调节与DNA测序反应中添加的类似物浓度相关的IPD,可以使类似物的浓度降低。类似物浓度的降低相应地降低了来源于类似物在ZMW中的扩散的背景噪声,并因此提高了信噪比。在测序仪器需要更高的激光照射功率的情况下,这些参数和其他参数的改进就显得尤为重要。激光功率的降低转而降低了荧光团的光致漂白和其他相关的光损伤。
虽然使用SMRTTM测序的以上描述对本发明的标记的核苷酸类似物的有效性进行说明,但应该理解,这些类似物以及它们的核苷酸化合物组分和染料标记的化合物组分可以用于任意合适的酶促反应或结合反应,并因此在其他分析技术中将具有更广泛的用途。例如,本公开的标记的核苷酸类似物还可以用于任意类型的结合相互作用的测量,而不仅仅是试剂反应所致的结合相互作用。虽然在优选的实施方案中,如单分子实时核酸测序反应和其他核苷酸依赖性酶促反应,类似物充当酶底物并且由于相互作用而发生化学变化,但是在其他实施方案中,如(例如)标记的核苷酸类似物与抗体、受体或其他亲合剂的结合,作为相互作用的结果,类似物保持不变。可以使用公知的荧光技术和生物化学工艺对酶促反应、结合相互作用或者任意其他类型的反应或相互作用进行测量。此类技术和工艺的实例包括荧光共振能量转移(FRET)、荧光相关光谱、荧光猝灭、荧光偏振、流式细胞术等。
本公开提供了用于本发明的核苷酸化合物和染料标记的化合物的化学式和特定的化学结构。在由其常规的从左向右书写的化学式来说明化学基团的情况下,化学式任选地同样涵盖从右向左书写结构所得到的基团,例如,-CH2O-也旨在叙述-OCH2-;-NHS(O)2-也意图任选地表示-S(O)2NH-,等等。此外,在化合物可以表示为游离酸或游离碱或它们的盐的情况下,具体形式的表示(例如,羧酸或磺酸)也公开了其他形式,例如去质子化的盐形式,例如羧酸盐或磺酸盐。盐的合适的抗衡离子为本领域中众所周知的,并且本发明盐的具体抗衡离子的选择完全在本领域普通技术人员的能力范围内。类似地,在公开了盐的情况下,该结构也公开了游离酸或游离碱形式的化合物。制备盐以及游离酸和游离碱的方法为本领域中众所周知的。
本公开的标记的核苷酸类似物通常意欲用作聚合酶的底物,在核酸测序的情况下尤其是如此。因此,通常如果核苷磷酸盐能够作为任意天然的或经修饰的聚合酶的底物,则本发明的核苷酸或核苷磷酸盐可以包括任意非天然的碱基、糖或磷酸盐。
“羧基部分的活性衍生物”和等效物质是指本发明化合物或者它们的前体或衍生物的组分上的部分,或另一试剂组分上的部分,通过羧基部分(例如,活性酯、酰基卤、酰基咪唑化物等)形式上连接含有氧或其他原子的离去基团。当进行组装时,此类活性部分可用于偶联本发明的核苷酸化合物和染料标记的化合物以及类似物的各种组分。
除非另有说明,否则术语“烷基”(其本身或作为另一个取代基的一部分)是指直链或支链或环状烃基或者它们的组合,其可以为完全饱和的、单不饱和的或多不饱和的,并且可以包括一价、二价和多价基团,其具有指定的碳原子数(即,C1-C10表示一个至十个碳)。饱和烷基的实例包括但不限于诸如甲基、亚甲基、乙基、亚乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、仲丁基、环己基、(环己基)甲基、环丙基甲基之类的基团;(例如)正戊基、正己基、正庚基、正辛基等的同系物和异构体。不饱和烷基为具有一个或多个双键或三键的基团。不饱和烷基的实例包括但不限于乙烯基、2-丙烯基、巴豆基、2-异戊烯基、2-(丁二烯基)、2,4-戊二烯基、3-(1,4-戊二烯基)、乙炔基、1-丙炔基和3-丙炔基、3-丁炔基以及高级同系物和异构体。除非另有说明,否则术语“烷基”包括“亚烷基”、“炔基”和任选的下文更详细定义的那些烷基衍生物,例如“杂烷基”。
除非另有说明,否则术语“杂烷基”(其本身或与另一术语组合)是指稳定的直链或支链或环状烃基或者它们的组合,其包括所述数量的碳原子和至少一个选自由下列构成的组中的杂原子:O、N、Si、P和S,并且其中可以任选地将氮原子和硫原子氧化,并且可以任选地将氮杂原子季铵化。一个或多个杂原于O、N、S、P和Si可以位于杂烷基的任意内部位置处或者位于烷基与分子的其余部分连接的位置处。实例包括但不限于-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-CH2,-S(O)-CH3、-CH2-CH2-S(O)2-CH3、-CH=CH-O-CH3、-Si(CH3)3、-CH2-CH=N-OCH3和-CH=CH-N(CH3)-CH3。多达两个杂原子可以为连续的,如(例如)-CH2-NH-OCH3和CH2-O-Si(CH3)3。类似地,术语“杂亚烷基”其本身或作为另一个取代基的一部分是指衍生自杂烷基的二价基团,可例举但不限于-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。对于杂亚烷基,杂原子还可以占据链末端(例如亚烷氧基、亚烷二氧基、亚烷氨基、亚烷二氨基等)的任一端或两端。
除非另有说明,否则术语“环烷基”和“杂环烷基”(它们本身或与其他术语组合)分别表示“烷基”和“杂烷基”的环状形式。还包括二价和多价物质,如“环亚烷基”。此外,对于杂环烷基,杂原子可以占据杂环与分子的其余部分连接的位置。环烷基的实例包括但不限于环戊基、环己基、1-环己烯基、3-环己烯基、环庚基等。杂环烷基的实例包括但不限于1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。
除非另有说明,否则术语“卤代”或“卤素”(它们本身或作为另一个取代基的一部分)是指氟、氯、溴或碘原子。此外,术语如“卤代烷基”意在包括单卤代烷基和多卤代烷基。例如,术语“卤代(C1-C4)烷基”意在包括但不限于诸如三氟甲基、2,2,2-三氟乙基、4-氯丁基、3-溴丙基等物质。
除非另有说明,否则术语“芳基”是指多不饱和的芳香烃取代基,其可以为单环或多环(优选1至3个环),其稠合在一起或共价连接。术语“杂芳基”是指含有1个至4个选自N、O和S的杂原于的芳基(或环),其中任选地将氮原子和硫原子氧化,并且任选地将一个或多个氮原子季铵化。杂芳基可以通过杂原子连接到分子的其余部分。芳基和杂芳基的非限制性实例包括苯基、1-萘基、2-萘基、4-联苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑基、4-咪唑基、吡嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤基、2-苯并咪唑基、5-引哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5~喹喔啉基、3-喹啉基和6-喹啉基。还包括二价和多价接头物质,如“亚芳基”。上述各芳基和杂芳基环系统的取代基选自下面描述的可接受的取代基。
为简洁起见,当与其他术语(例如,芳氧基、芳硫基、芳烷基)组合使用时,术语“芳基”包括如上定义的芳基和杂芳基环。因此,术语“芳烷基”是指包括这样的基团:其中芳基与烷基(例如,苄基、苯乙基、吡啶基甲基等)相连,所述烷基包括其中的碳原子(例如,亚甲基基团)被(例如)氧原子取代的那些烷基(例如,苯氧甲基、2-吡啶氧基甲基、3-(1-萘氧基)丙基等)。
上述各术语(例如,“烷基”、“杂烷基”、“芳基”和“杂芳基”)包括指定基团的取代和未取代形式。下面提供了各类型的基团的示例性取代基。
烷基和杂烷基的取代基(包括通常称为亚烷基、烯基、杂亚烷基、杂烯基、炔基、环烷基、杂环烷基、环烯基和杂环烯基的那些基团)可以为但不限于选自下列的各种基团的一者或多者:-OR’、=O、=NR’、=N-OR’、-NR’R”、-SR’、-卤素、-SiR’R”R”’、-OC(O)R’、-C(O)R’、-CO2R’、-CONR’R”、-OC(O)NR’R”、-NR”C(O)R’、SO3R’、-NR’-C(O)NR”R”’、-NR”C(O)2R’、-NR-C(NR’R”R”’)=NR””、-NR-C(NR’R”)=NR”’、-S(O)R’、-S(O)2R’、-S(O)2NR’R”、-NRSO2R’、-CN和-NO2,取代基的数量范围为零至(2m”+1),其中m”为该基团中的碳原子总数。R’、R”、R”’和R””各自优选独立地表示氢、取代或未取代的杂烷基、取代或未取代的芳基(例如被1至3个卤素取代的芳基)、取代或未取代的烷基、烷氧基或硫代烷氧基基团或者芳烷基。当本发明的化合物或试剂包含超过一个R基团时,独立地选择各R基团(例如),当R’、R”、R”’和R””基团存在超过一个时,这些基团各自也是一样。当R’和R”连接到相同的氮原子时,可以将R’和R”连同氮原子一起形成5-、6-或7-元环。例如,-NR’R”意在包括但不限于1-吡咯烷基和4-吗啉基。因此,根据上文对取代基的讨论,本领域普通技术人员应当理解,术语“取代的烷基”和“杂烷基”意在包括具有与除氢原子以外的基团结合的碳原子的基团,如卤代烷基(例如,-CF3和-CH2CF3)和酰基(例如,-C(O)CH3、-C(O)CF3、-C(O)CH2OCH3等)。
以上段落中列出的取代基在本文中被称为“烷基取代基”。
类似于对于烷基基团所描述的取代基,芳基和杂芳基的取代基为多样的并且选自(例如):卤素、-OR’、=O、=NR’、=N-OR’、-NR’R”、-SR’、-卤素、-SiR’R”R”’、-OC(O)R’、-C(O)R’、-CO2R’、-CONR’R”、_OC(O)NR’R”、-NR”C(O)R’、-NR’-C(O)NR”R”’、-NR”C(O)2R’、-NR-C(NR’R”)=NR”’、-S(O)R’、-S(O)2R’、SO3R’、-S(O)2NR’R”、-NRSO2R’、-CN和-NO2、-R’、-N3、-CH(Ph)2、氟代(C1-C4)烷氧基和氟代(C1-C4)烷基,取代基的数量范围为零至芳香环系统上的开放化合价的总数;并且其中R’、R”、R”’和R””优选独立地选自卤素、(C1-C8)烷基和杂烷基、未取代的芳基和杂芳基、(未取代的芳基)-(C1-C4)烷基和(未取代的芳基)氧基-(C1-C4)烷基。当本发明的化合物或试剂包含超过一个R基团时,独立地选择各R基团,(例如)当R’、R”、R”’和R””基团存在超过一个时,这些基团各自也是一样。
芳基或杂芳基环的相邻原子上的两个取代基可以任选地被式-T-C(O)-(CRR’)q-U-的取代基所取代,其中T和U独立地为-NR-、-O-、-CRR’-或单键,并且q为0至3的整数。或者,芳基或杂芳基环的相邻原子上的两个取代基可以任选地被式-A-(CH2)r-B-的取代基所取代,其中A和B独立地为-CRR’-、-O-、-NR-、-S-、-S(O)-、-S(O)2-、-S(O)2NR’-或单键,并且r为1至4的整数。如此形成的新环的单键中的一者可以任选地以双键代替。或者,芳基或杂芳基环的相邻原子上的两个取代基可以任选地被式-(CRR’)s-J-(CR”R”’)d-的取代基所取代,其中s和d独立地为0至3的整数,并且J为-O-、-NR’-、-S-、-S(O)-、-S(O)2-或-S(O)2NR’-。取代基R、R’、R”和R”’优选独立地选自氢或者取代或未取代的(C1-C6)-烷基。
以上两段中列出的取代基在本文中被称为“芳基取代基”。
当提及本公开的化合物和类似物的组分时,术语“衍生自……的残基”是指通过第一组分上的第一反应性官能团(例如,多价中央核心元件、染料元件、防护元件、接头元件、末端偶联元件等)和第二组分上的第二反应性官能团(例如,多价中央核心元件、染料元件、防护元件、接头元件、末端偶联元件等)的反应以形成共价键,从而形成的残基。在示例性实施方案中,第一组分上的胺基与第二组分上的活性羧基反应,以形成含有一个或多个酰胺部分的残基。本发明涵盖第一和第二反应性官能团的其他排列。例如,正如本领域普通技术人员所理解的那样,通过众所周知的“点击”反应,叠氮取代的第一组分与炔取代的第二组分的铜催化反应产生含有三唑的残基。参见Kolb等(2001)Angew.Chem.Int.Ed.Engl.40:2004;Evans(2007)Aus.J.Chem.60:384。
在一些实施方案中,可以将点击反应的无铜变型用于偶联第一和第二反应性基团。参见例如,Baskin等(2007)Proc.Natl Acad.Sci.U.S.A.104:16793-97。例如,在没有铜催化剂的情况下,叠氮取代的第一组分可以与连接到第二组分的环炔烃(理想地为环辛炔)进行反应。这种所谓的无铜点击试剂为市售可得的。此类环炔烃的实例包括但不限于二苯并环辛炔-胺、二环[6.1.0]壬-4-炔-9-基或单氟化环辛炔。正如本领域普通技术人员所理解的那样,其他偶联化学也可以有效地用于本公开的化合物的合成中。
铜催化的和无铜的点击反应产生以下示例性连接结构,包括含三唑和环烷基的残基。因此,无论此类残基出现在何处,应该认为此类残基在本文公开的化合物的任意接头或其他亚结构的范围内。
另外,如本领域普通技术人员所理解的那样,可以预想出以上连接结构的变型,例如改变其中烷基接头基团的长度,或者以杂原子或其他插入的化学部分取代所示的结构,其中此类取代不干扰接头基团的功能。
还应该理解,根据情况,如果需要的话,通常可以将刚才描述的反应中的第一和第二反应性官能团的附着位点进行对调。例如,在“点击”反应的情况下,如上所述,第一组分可以为叠氮取代的并且第二组分可以为炔取代的,或者第一组分可以为炔取代的并且第二组分可以为叠氮取代的。反应中的这种变化对于本领域技术人员而言是已知的。
如本文所使用的,列出的整数范围包括该范围内的每个整数。例如,2至6的整数包括整数2、3、4、5和6。
标记的核苷酸类似物
本公开提供了新型标记的核苷酸类似物,其用于酶促反应和其他分子识别事件的测量和分析,如核酸的单分子实时测序。类似物包含至少一个蛋白质防护物(proteinshield),优选亲和素蛋白防护物,其与至少一个核苷酸化合物和至少一个染料标记化合物相连。如本领域众所周知的,亲和素蛋白(包括亲和素、链霉亲和素、蘑菇亲和素(tamavidin)、链霉素亲和素突变体(traptavidin)、热带爪蟾亲和素(xenavidin)、慢生大豆根瘤菌亲和素(bradavidin)、AVR2、AVR4以及它们的同源物)通常包含四个亚基,每个亚基包含一个生物素结合位点。因此,亲和素蛋白可以与一个或多个生物素标记的核苷酸化合物紧密结合,并且与一个或多个生物素标记的含有染料的化合物紧密结合,从而生成经染料标记的、蛋白质防护的核苷酸类似物,其实例描述于美国专利申请公开No.2013/0316912 A1中,该专利公布为美国专利No.9,062,091,出于所有目的,将其通过全文引用并入本文。如图2A至图2C中所示,根据染料组分和核苷酸组分是否分别具有两个或一个生物素标记,先前描述的蛋白质防护的核苷酸类似物可以包含一个或两个染料组分以及一个或两个核苷酸组分。如图2D所示,如果将核苷酸或染料组分设计成桥接多个亲和素四聚体,则这些类似物还可以包含超过一个亲和素蛋白防护物。在图2A至图2D的图示中,染料或核苷酸组分与亲和素亚基之间的直线表示单个生物素标记的组分与一个亲和素亚基的连接,而连接两个亲和素亚基的半圆表示双生物素标记的组分与两个亲和素亚基的连接。
美国专利申请公开No.2015/0050659 A1和美国专利申请公开No.2016/0237279A1描述了受保护的荧光试剂化合物(包括核苷酸类似物化合物和多聚体的受保护的荧光试剂化合物)的其他实例,出于所有目的,将上述美国专利申请通过全文引用并入本文。
图3A至图3O’示出了本公开的示例性染料标记的核苷酸类似物的高级结构。例如,在图3A中,球形组分(330)代表四聚体亲和素蛋白防护物,其含有四个生物素结合位点。在相连的核苷酸和染料标记的化合物组分上的半圆(320)代表双生物素部分。大的、对称的椭圆形球体(310)代表染料元件,而与双叶形结构相连的较小的、对称的球体(350)代表防护元件的侧链,在这种情况下,其充当核苷酸接头内的亲合力调节元件。钥匙形基团(340)相当于核苷酸(即,核苷元件加上多磷酸酯元件)。
图3E示出了本发明的核苷酸化合物和染料标记的化合物的三个其他元件。具体而言,环形结构(360)代表芳香族间隔元件,而六叶形结构(370)代表防护元件。这些组分中的每一者可以充当核苷酸化合物的核苷酸接头内的亲合力调节元件。双叶形结构(380)代表类似物的染料标记的化合物内的光保护性防护元件。将在下面对所有这些组分进行详细描述。对应于以上组分中的每一者以及其他的示例性化学结构也示于图7E和图7G。
图3A至图3O’所示的超结构示出了通过各种染料标记的组分和核苷酸标记的组分与一个或多个亲和素蛋白的组装而得到的广泛的结构多样性。例如,类似物可以包含一个(例如,图3A、图3B、图3C、图3D、图3I、图3M、图3O、图3P和图3F’)、两个(例如,图3E、图3G、图3H、图3K、图3L、图3N、图3Q、图3R至图3E’和图3G’至图3O’)或三个(例如,图3F和图3J)亲和素蛋白,并且如果需要,可以组装甚至更大的超结构。类似物可以包含具有一个(例如,图3E、图3F、图3G、图3J、图3L、图3O至图3W和图3Y至3O’)、两个(例如,图3A、图3B、图3C、图3D、图3H、图3I、图3K、图3M、图3N和图3X)或更多个核苷元件的核苷酸化合物。可以根据需要以各种组合的形式将其他特征包括在内,如位于核苷酸化合物的接头元件内的防护元件和/或芳香族间隔元件(例如阴离子芳香族间隔元件)的应用,以调节相连的结合蛋白质或酶的亲合力和/或动力学;以及染料标记的化合物的防护,该防护可通过防护元件和染料的直接偶联或者通过染料接头中含有防护元件和/或侧链来实现。虽然图3A至图3O’的示例性类似物全部包括通过双生物素部分连接的核苷酸化合物和染料标记的化合物,但是应该理解,如图2A至图2C的结构中那样,类似物也可以有效地由具有单个生物素部分的化合物组装而成。
因此,本发明的标记的核苷酸类似物可包含任意所需数量的亲和素四聚体、核苷酸化合物和染料标记的化合物。例如,类似物可以以任意组合的方式包含1个、2个、3个、4个、6个、10个或甚至更多个这些组分中的每一者。在具体的实施方案中,标记的核苷酸类似物包含1个至4个所述组分中的每一者。在甚至更具体的实施方案中,标记的核苷酸类似物包含1个、2个或3个亲和素蛋白、1个或2个染料标记的化合物以及1个或2个核苷酸化合物。
为了提供期望的吸收和发射的颜色和强度,特别有利的是改变标记的核苷酸类似物中的染料元件的数量和类型。此外,如下面将更详细描述的那样,类似物复合物的染料标记的化合物中的具有重叠光谱的内含物染料使得能够使用更先进的荧光技术,如(例如)荧光共振能量转移,其中将输入光信号从结构内的“供体”染料转移至相邻的“受体”染料,然后发出波长比仅由供体荧光团产生的波长更长的光信号。如果需要,改变单个标记的核苷酸类似物中的荧光染料的数量还能够以有效的方式对输出光信号的强度进行调制。
例如,当将标记的核苷酸类似物用于DNA测序反应时,根据与类似物相关的核苷酸组分改变类似物的颜色或其他光学性质可能是有效的。具体而言,图3A至图3D所示的类似物的核苷酸组分可能仅在碱基基团(例如,dA、dG、dC和dT)的性质方面不同。结合该变化,还可以改变类似物的染料组分,例如如不同的染料结构(310、312、314和316)所示的那样。因此,可以通过每种核苷酸类似物光输出的颜色和/或强度使其成为可唯一识别的。
用于组装本文公开的标记的核苷酸类似物的染料标记的化合物还有利地包含防护元件。如上所述并且如图2A至图2D所示,美国专利申请公开No.2013/0316912 A1已经描述了蛋白质防护的染料标记的聚合酶底物。这些类似物所使用的一些染料标记的组分包含多个受体染料和供体染料,但染料标记的化合物本身不包含防护元件。未防护的染料标记的化合物的实例示于图4A至图4C,其中将受体染料指定为“A”,将供体染料指定为“D”,在这些实例中的末端偶联元件为双生物素,由半圆标示,并且染料化合物接头元件由连接结构的不同组分的线标示。图4B和图4C中所示的化合物的染料化合物接头元件中的小圆点代表由铜催化的点击反应、无铜点击反应或其他合适的偶联反应生成的三唑结构或其他残基。
可以将图4A至图4C的化合物与图5A至图5M所示的化合物(其代表包含一个或多个防护元件的染料标记的化合物)相比较。在图5A至图5M中,还如图3A至图3O’的结构所示的那样,将化合物中的防护元件的侧链指定为不对称的球体结构。
图5A至图5M的化合物示出了在本发明的染料标记的化合物的范围内可能的结构变化的广泛的多样性。具体而言,化合物可以包括但不限于单个的双生物素部分(例如,图5A、图5B和图5C)或双重的双生物素部分(例如,图5D至图5M);化合物可以包括未防护的受体和直接防护的供体(例如,图5B、图5H、图5K和图5L);化合物可以包括直接防护的受体和未防护的供体(例如,图5C、图5F、图5G、图5J和图5M);化合物可以包括直接防护的受体和直接防护的供体两者(例如,图5A和图5I);或者在其染料化合物接头元件中,化合物可以包括具有防护元件和/或侧链的化合物(例如,图5D、图5E、图5F、图5G和图5K)。应该理解的是,一些化合物可以包括以下两者:与受体和/或供体相连的防护元件;以及包括在染料化合物接头元件中的防护元件和/或侧链。还应该理解的是,虽然图5A至图5M的图示可以表示染料、防护件和接头的不同尺寸、形状和/或位置(例如,在图5G中,染料接头中受体防护元件的侧链显示为大于防护元件的侧链),但是图示中所示的任意组分的尺寸、形状和/或位置不应被认为是对实际结构的限制,除非本文中有明确描述。
图3E至图3O’所示的核苷酸类似物示出了染料标记的化合物的进一步多样化,其中染料标记的化合物包含一供体一受体化合物(“D1A1”)(图3I)、二供体一受体化合物(“D2A1”)(图3M)、二供体二受体(“D2A2”)(图3O至图3Q和图3D’)、四供体一受体化合物(“D4A1”)(图3H、图3K和图3L)、四供体二受体化合物(“D4A2”)(图3E至图3G、图3J、图3N、图3R、图3Z、图3A’和图3N’)、四供体四受体化合物(“D4A4”)(图3T、图3W和图3X)、六供体二受体化合物(“D6A2”)(图3S、图3Y、图3C’、图3F’和图3G’)、六供体四受体化合物(“D6A4”)(图3E’)、八供体二受体化合物(“D8A2”)(图3U、图3V、图3B’、图3H’、图3I’、图3J’(其中图3I’和图3J’的核苷酸化合物之间的区别在于受体染料的结构)和图3O’)、十供体四受体化合物(“D10A4”)(图3K’和图3L’)和十二供体二受体化合物(“D12A2”)(图3M’)。如从这些图的染料标记的化合物结构显而易见的是,可以有利地改变供体染料、受体染料和防护元件的位置和数量以获得期望的性质,包括亮度、激发和发射波长、光稳定性以及在涉及DNA聚合酶的自动DNA测序反应中的反应动力学,如下面将进一步详细描述的那样。
为了提供这些组分中每一者的更具体描述,在下面的部分中将详细描述不同的新型核苷酸化合物和染料标记的化合物的结构和功能特性、由这些化合物向新型标记的核苷酸类似物的组装以及这些新型类似物与野生型和突变型DNA聚合酶的相互作用。
核苷酸化合物
如刚才所述,本公开提供了在标记的核苷酸类似物的组装中有用的新型核苷酸化合物,所述标记的核苷酸类似物在酶促反应和其他分子识别事件(如(例如)核酸的单分子实时测序)的测量和分析中是有用的。
因此,在一个方面,本公开由此提供了结构式(I)的化合物:
其中
L为核苷酸接头元件,其包括至少一个亲合力调节元件;
P为多磷酸酯元件;
Nu为核苷元件;
X为多价中央核心元件;
B”为末端偶联元件;
n为1至4的整数;并且
o为0或1。
通常,本公开的“接头”应被广义地认为是包括在给定化合物中的两个或多个组分之间提供合适的共价连接的任意化学部分。接头可以为亲水的(例如,四甘醇、六甘醇、聚乙二醇)或者接头可以为疏水的(例如,己烷、癸烷等)。示例性的接头包括取代或未取代的C6-C30烷基、多元醇类(例如甘油)、聚醚类(例如聚(乙二醇))、聚胺类、氨基酸类(例如聚氨基酸)、肽类、糖类(例如多糖)以及它们的组合。此类接头通常包含直连或支链,其中根据需要,该链可以在任意合适的位置被取代,并且其中任意碳原子可以被任意合适的杂原子所取代。如果需要的话,接头可以包含一个或多个烷基、杂烷基、环烷基、环杂烷基、芳基或杂芳基。
结构式(I)的核苷酸接头元件L更具体地将该结构的多磷酸酯元件连接至多价中央核心元件(如果存在的话),或直接连接至末端偶联元件。在具体的实施方案中,核苷酸接头元件包含C6-C20烷基,该C6-C20烷基任选地以任意组合的方式包含(例如)酰胺键、醚键、亚苯基、三唑基、另一偶联残基等。此外,在结构式(I)的本发明的核苷酸化合物中,核苷酸接头元件包含至少一个亲合力调节元件,其可以为芳香族间隔元件、防护元件或芳香族间隔元件和防护元件两者。
如下面将更详细描述的,本发明的核苷酸化合物的亲合力调节元件可以用于增强本发明的标记的核苷酸类似物与生物分子(如酶或结合蛋白质)之间的相互作用。亲合调节元件可以通过静电的、疏水的、空间的或其他的方式来增强相互作用。在一个示例性实施方案中,将标记的核苷酸类似物(在核苷酸接头元件中包括具有亲合力调节元件的核苷酸化合物)用于单分子核酸测序技术,亲合力调节元件尤其可以增强核苷酸类似物和DNA聚合酶之间的相互作用,由此降低Km或在其他方面影响测序反应的动力学,从而实现类似物在聚合酶上的优化停留时间或其他期望的行为。具体而言,并且无意于受理论的束缚,据认为亲合力调节元件(优选芳香族间隔元件,如阴离子芳香族间隔元件和/或防护元件)有利地与聚合酶的活性位点附近的特定氨基酸残基发生相互作用,并且这些相互作用是改善的动力学性质的原因。
因此,在结构式(I)的化合物的一些实施方案中,核苷酸接头元件包含亲合力调节元件,并且在一些该类化合物中,亲合力调节元件为芳香族间隔元件或防护元件。在一些实施方案中,芳香族间隔元件为取代或未取代的单环、双环或三环芳香族部分。
在更具体的实施方案中,芳香族间隔元件由结构式(II)表示:
其中
A环和B环各自独立地为任选地取代的5至7个原子的环状结构,其中A环或B环中的至少一者为芳香族;并且
A环或B环任选地包含至少一个阴离子取代基。
更具体而言,任选的至少一个阴离子取代基为-SO3H。
在其他具体实施方案中,芳香族间隔元件由结构式(IIA)或(IIB)表示:
其中
A1、A2、A3和A4基团中的一者为并且其他基团为-CH2-或键;并且
R1为H或阴离子取代基并且R2为H或阴离子取代基。
更具体而言,芳香族间隔元件可以由结构式(IIC)或(IIC’)表示:
其中
R1为H或阴离子取代基。
在一些可替代实施方案中,芳香族间隔元件可以由结构式(IV)表示:
其中
R1为H或阴离子取代基。
在一些具体实施方案中,芳香族间隔元件由下列结构式中的一者表示:
根据一些更具体的核苷酸化合物实施方案,所述至少一个亲合力调节元件为阴离子芳香族间隔元件。还更具体而言,阴离子芳族间隔元件为取代的双环或三环阴离子芳香族部分。甚至更具体而言,阴离子芳香族间隔元件由结构式(II)表示:
其中
A环和B环各自独立地为5至7个原子的环状结构,其中A环或B环中的至少一者为芳香族;并且
A环或B环包括至少一个阴离子取代基。在一些该类实施方案中,所述至少一个阴离子取代基为-SO3H。在一些该类实施方案中,阴离子芳香族间隔元件由结构式(IIA)或(IIB)表示:
其中
A1、A2、A3和A4基团中的一者为并且其他基团为-CH2-或键;并且
R1为所述至少一个阴离子取代基并且R2为H或所述至少一个阴离子取代基,包括其中阴离子取代基为-SO3H的实施方案。在一些该类实施方案中,阴离子芳香族间隔元件由结构式(IIC)表示:
在结构式(I)的化合物的一些实施方案中,核苷酸接头元件包括防护元件。如上所述,防护元件可以用作本发明的核苷酸化合物中的亲合力调节元件,从而调节核苷酸化合物与相关酶或结合蛋白之间的相互作用。认为防护元件的具体结构不是关键的,只要结构足够大从而调节标记的类似物与蛋白质或与类似物结合的其他目标分子之间的接触即可。如本文所公开的,防护元件可以使含有这些结构的核苷酸类似物获得改善的动力学利/或其他性质,特别是通过防护元件与酶(如DNA聚合酶)或结合蛋白的相互作用。在本文公开的结构式(I)的核苷酸化合物中,防护元件不包含蛋白质。
在一些实施方案中,本发明的核苷酸化合物的防护元件优选包含防护核心元件,其为防护元件侧链提供多价附着位点,其中防护元件侧链提供防护元件部分的主要体积和电荷密度,并因此被认为是与核苷酸结合蛋白的有利相互作用的原因。
因此,在一些实施方案中,防护元件可以包括合适的核心结构,其能够使多个侧链连接至防护元件核心。在具体实施方案中,防护元件包括以下结构:
其中各y独立地为1至6的整数。
在一些实施方案中,防护核心元件具有“分层”结构,其中每个接头元件包含超过一个防护元件核心。如果需要,连接至不同防护元件核心的侧链可以任选地为不同类型的侧链。在不同层中使用不同的侧链可以在防护元件中提供不同的微环境。根据防护的化合物的所需行为和预期用途,不同的层可以(例如)包含成对的中性或带负电荷的基团。
有效地掺入本公开的核苷酸化合物中的示例性防护元件包括下列非限制性结构:
应该理解的是,如本领域普通技术人员所理解的那样,这些基团可以从任意方向插入到核苷酸接头元件或核苷酸化合物的其他组分内。核苷酸接头元件优选还包含短的烷基或环烷基,如(例如)己基或环己基,以将一个或多个防护元件连接到结构的其余部分,但其他部分可以适用于此目的。例如,接头元件可以选自本文所述的任意接头。在更具体的实施方案中,接头元件可以包含三唑。
就此而言,应当理解的是,在一些实施方案中,如(例如)美国专利申请公开No.2015/0050659 A1中描述的那样,使用“点击”反应或“无铜点击”反应将防护元件合成地组装到核苷酸接头元件中。因此优选使中间体组分标记有叠氮基和乙炔基,其相互反应以形成三唑结构。然而,还应该理解的是,如本领域普通技术人员所理解的那样,可以使用其他连接方法来生成本发明范围内的本发明的类似物。
一些防护元件结构可以包括三个、四个或甚至更多个侧链“层”,例如如下列式子所示:
-Sh(R1)2-Sh(R2)2-Sh(R3)2-;和
-Sh(R1)2-Sh(R2)2-Sh(R3)2-Sh(R4)2;
其中“Sh”为防护核心元件,如(例如) 并且“R1”、“R2”、“R3”和“R4”为侧链。应该理解的是,根据需要,“R1”、“R2”、“R3”和“R4”侧链基团可以以任意组合的方式为相同的或不同的侧链,以实现本发明标记的核苷酸类似物的改进的动力学性质或其他性质。在这些实例中,通过Sh基团从防护元件结构的任一端将防护元件连接至接头元件。
通常,与防护元件一样,认为防护元件的侧链组分的具体结构不是关键的,只要侧链足够大以提供所期望的效果即可。在一些实施方案中,侧链包含聚乙二醇(PEG)。在具体的实施方案中,聚乙二醇侧链包含具有3个至20个重复环氧乙烷单元的聚乙二醇。在更具体的实施方案中,聚乙二醇侧链包含具有4个至10个重复环氧乙烷单元的聚乙二醇。在一些实施方案中,侧链包含带负电荷的组分,如(例如)包含磺酸的组分。在一些实施方案中,侧链包含聚乙二醇和其他组分(如(例如)带负电的组分)的组合。
侧链还可以包含核心结构以提供侧链内的支化。在一些实施方案中,侧链包含取代的苯基。在具体的实施方案中,侧链包含下列结构:
其中各x独立地为1至6的整数。在更具体的实施方案中,各x独立地为1至4的整数。
在一些实施方案中,侧链可以包含树枝状大分子。树枝状大分子(或“树形分子”)为重复支化的分子,其通常围绕核心为对称的,并且可以采用球形三维形态。参见(例如)Astruc等(2010)Chem.Rev.110:1857。将这种结构掺入本发明化合物的防护元件中,能够通过调节标记的核苷酸类似物与一种或多种与核苷酸类似物相关的生物分子之间的接触而提供有利的性质。通过分子一级结构的变化(包括树枝状大分子表面的潜在官能化)改进树枝状大分子的化学和物理性质,使得可以根据需要调节核苷酸类似物的功能特性。如本领域中众所周知的,可以通过使用范围广泛的材料和支化反应的各种技术来合成树枝状大分子,包括下面描述的那些。
有效地掺入本发明的分子侧链的示例性树枝状大分子的结构包括以下结构:
可以通过(例如)(a)链长和链的类型,(b)支化位置和支化度,以及(c)端基呈现形式(中性基团或带电荷基团、疏水基团或亲水基团等)来调整本发明化合物中所使用的树枝状大分子侧链的结构和功能特性。
在一些实施方案中,至少一个侧链包含肽链。
在一些实施方案中,至少一个侧链包含多糖。
侧链的非限制性实例包括下列结构:
(相当于PEG7)和具有其他数量重复单元的聚乙二醇;
以及一些侧链实施方案可以包括任意的上述组分的组合,如(例如)下列聚乙烯和带负电侧链的组合:
在一些实施方案中,侧链的分子量为至少300、350、400、450或甚至更高。在优选的实施方案中,侧链的分子量为至少300。
在结构式(I)的化合物的优选的实施方案中,核苷酸接头元件包含阴离子芳香族间隔元件和防护元件两者,其中这些元件具有本文提供的定义。
结构式(I)的多磷酸酯元件包含焦磷酸盐或磷酸盐的高级同系物,如3聚体、4聚体、5聚体、6聚体、7聚体、8聚体等。因此多磷酸酯元件通常包含2个至10个磷酸盐。在优选的实施方案中,多磷酸酯元素包含4个、5个、6个、7个或8个磷酸盐。在一些实施方案中,亚甲基部分、NH部分或S部分可桥接两个或多个磷原子,从而以PCH2P连接、PNHP连接、PSP连接等代替POP连接。如果需要,可以对多磷酸酯元件进行进一步修饰,例如通过用碳或另一种杂原子来取代任意其他的氧原子,或者通过对任意非桥连的氧进行烷基化或其他类似的修饰。
本公开的核苷酸化合物还包括一个或多个核苷元件。如前所述,在诸如测序反应之类的酶促反应期间,核苷元件起到通过酶(如DNA聚合酶)识别类似物的作用。如本领域已知的,核苷包含核苷碱基。除了天然存在的核糖核酸和脱氧核糖核酸的核苷碱基(即,腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶)以外,本发明的核苷酸化合物和类似物可以任选地包含经修饰的碱基。例如,本文所述的核苷元件可包括至少一个经修饰的碱基部分,其选自但不限于包括下列的组:5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫代尿苷、5-羧甲基氨甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基鸟苷、肌苷、N6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶,N6-腺嘌呤、7-甲基鸟嘌呤、5-甲氨基甲基尿嘧啶、5-甲氧基氨甲基-2-硫代尿嘧啶、β-D-甘露糖基核苷、5′-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯腺嘌呤、尿嘧啶-5-氧基乙酸(v)、丁氧核苷(wybutoxosine)、假尿嘧啶、核苷(queosine)、2-硫代胞嘧啶、5-甲基-2-硫代尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫代尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w、硝基吲哚和2,6-二氨基嘌呤。
通常,本文所描述的核苷元件可以包含核糖或脱氧核糖。在一些实施方案中,核苷元件可以包含经修饰的糖部分,其选自包含下列但不限于此物质的组:阿拉伯糖、2-氟阿拉伯糖、木酮糖和己糖。
本发明的核苷酸化合物和类似物的核苷元件优选包含腺苷、鸟苷、胸苷、尿苷或胞苷,并且优选为脱氧核糖核苷,例如,dA、dG、dT或dC。
结构式(I)的多价中央核心元件为结构的任选组分,其使得多个多磷酸酯元件和核苷元件能够连接至核苷酸化合物。从式(I)的结构可以清楚地看出,当存在多价中央核心元件时,其还起到末端偶联元件的附着位点的作用。
在一些实施方案中,多价中央核心元件包含多胺部分。多胺可以容易地与合适的亲电试剂(如亲电的核苷酸接头元件等)反应以生成核苷酸化合物或它们的中间体。应该理解的是,如本领域普通技术人员所理解的那样,这些反应的顺序可以根据期望的结果而变化。有效地用于本公开的多价中央核心元件中的多胺的非限制性实例包括下列多胺:
然而,本领域技术人员应理解的是,其他多胺可以容易地用于本公开的核苷酸化合物中。
在具体实施方案中,多价中央核心元件包含取代的环己烷,更具体地为1,3,5-三氨基-环已烷。
在其他具体实施方案中,多价中央核心元件包含取代的1,3,5-三嗪。
还在其他具体实施方案中,多价中央核心元件包含取代的苯。
在一些实施方案中,多价中央核心元件包含醚键。在一些实施方案中,多价中央核心元件包含酰基键。这种醚和酰基键的中央核心元件的实例包括下列结构:
如在下文和在美国专利申请公开No.2015/0050659 A1中详细描述的那样,这些结构可以掺入本发明的核苷酸化合物中。特别地,可以用含有乙炔的基团(包括含有环炔的基团)来对醚键的中央核心元件进行修饰,并且可以使用“点击”化学或“无铜点击”化学将乙炔基团偶联至含有叠氮的试剂。同样地,可以使用合适的试剂对含有羧酸根的中央核心元件进行活化,然后根据需要将活化的酰基偶联至合适的亲核试剂。或者或此外,可以使用含有叠氮的基团对中央核心元件进行活化,并且可以使用“点击”化学或“无铜点击”化学将那些基团偶联至含有乙炔的试剂,包括含有环炔的试剂。对于本领域普通技术人员来说,此类反应是很好理解的。
结构式(I)的核苷酸化合物还进一步包括末端偶联元件。在一些实施方案中,末端偶联元件包含生物素。如本领域众所周知的,生物素与亲和素蛋白(如亲和素、链霉亲和素等)以高亲合力结合。在优选的实施方案中,末端偶联元件包含双生物素。将两个生物素部分偶联在双生物素末端偶联元件中的接头可以为任意合适的接头,包括上述接头。接头优选包括多价中央核心元件(如上述结构),从而使两个生物素部分互相偶联并用作末端偶联元件与核苷酸化合物其余部分的连接点。
包含双生物素的示例性末端偶联元件包括下列结构:
在结构式(I)的核苷酸化合物的实施方案中,n为1至4的整数,并且o为0或1。从结构可以清楚地看出,当n为1时,无需包含多价中央核心元件,所以o优选为0。此外,应当理解的是,当n为2至4时,化合物中优选包含多价中央核心元件,所以o应该为1。在具体实施方案中,n为2且o为1。在其他具体实施方案中,n为1且o为0。
在优选的实施方案中,本发明的核苷酸化合物不论是包括芳香族间隔元件、防护元件,还是包括芳香族间隔元件和防护元件两者作为亲合力调节元件,该核苷酸化合物都不包含荧光染料或任何其他可直接检测的标记物。
如从本公开应该理解的,结构式(I)的核苷酸化合物的末端偶联元件通常介导核苷酸化合物与本发明的标记的核苷酸类似物的其他组分的结合。例如,并且如下面将详细描述的,当末端偶联元件为生物素或双生物素时,核苷酸化合物可以以高亲合力与亲和素非共价地结合。在一些方面,本公开因此进一步提供了包含结构式(I)的核苷酸化合物和亲和素的组合物。在这些组合物中,应该理解的是,末端偶联元件不是通过核苷酸化合物与亲和素防护的结合而被共价修饰,并且因此该组合物明显包含原始核苷酸化合物和亲和素防护物作为单独的分子实体。
然而,在本公开的另一方面中,应该考虑的是,核苷酸化合物的末端偶联元件可以包含反应性官能团,其可以共价地结合到第二组分上的互补反应性基团上,例如在经适当修饰的接头元件、防护元件或染料标记的化合物上。与刚刚描述的非共价组合物不同,此类反应生成了由衍生自各组分的反应性基团的残基连接而成的新分子实体。如本说明书其他地方所述,这些残基可以包含(例如)衍生自胺基和适当活化的羧基的酰胺部分或由点击反应产生的残基。
本公开的又一方面提供了合成本发明核苷酸化合物(包括结构式(I)的核苷酸化合物)以及它们的中间体的方法。此类方法可以包括使整个说明书中说明的任意中间体化合物与第二中间体化合物反应以生成本发明的核苷酸化合物或中间体的步骤。示例性的合成途径示于下面的反应方案中、实施例中以及附图中。
染料标记的化合物
在又一方面中,本公开提供了染料标记的化合物,其用于生成本发明的标记的核苷酸类似物。
在根据本公开的这一方面的实施方案中,染料标记的化合物包含:
供体染料;
受体染料;
防护元件;
末端偶联元件;和
染料化合物接头元件;
其中染料化合物接头元件将末端偶联元件共价地连接至供体染料、受体染料或防护元件。
在其他实施方案中,染料标记的化合物为结构式为(IIIA)、(IIIB)、(IIIC)、(IIID)或(IIIE)的化合物:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各A独立地为受体染料;
各D独立地为供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r独立地为0至8的整数;
其中化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。
在具体实施方案中,将至少一个受体染料或至少一个供体染料直接偶联到至少一个防护元件。
在其他具体实施方案中,各r独立地为0至8的整数。
在甚至更多的结构式为(IIIA)、(IIIB)、(IIIC)、(IIID)和(IIIE)的化合物的实施方案中,各r独立地为1或2。
在任意的染料标记的化合物实施方案中,应该理解的是,化合物可以包含超过一个供体染料、超过一个受体染料和/或超过一个防护元件。在具体实施方案中,化合物包含至少两个供体染料,并且在一些此类实施方案中,将各供体染料直接偶联至供体防护元件。更具体而言,化合物可以包含至少四个供体染料,并且在一些此类实施方案中,将各供体染料直接偶联至供体防护元件。甚至更具体而言,化合物可包含至少六个供体染料、至少八个供体染料、至少十个供体染料或甚至至少十二个供体染料。在一些此类实施方案中,可以将各供体染料直接偶联至供体防护元件。
在一些具体实施方案中,化合物包括至少两个受体染料,并且在一些此类实施方案中,将各受体染料直接偶联至受体防护元件。更具体而言,化合物可以包括至少四个受体染料,并且在一些此类实施方案中,可以将各受体染料直接偶联至受体防护元件上。
在一些实施方案中,化合物包括至少两个供体染料和至少两个受体染料。在更具体的实施方案中,可以将各供体染料直接偶联至供体防护元件和/或可以将各受体染料直接偶联至受体防护元件。在一些实施方案中,化合物包括至少四个供体染料和至少两个受体染料、至少六个供体染料和至少两个受体染料、至少八个供体染料和至少两个受体染料、至少十个供体染料和至少两个受体染料或者甚至至少十二个供体染料和至少两个受体染料。
在一些实施方案中,化合物还包括与一个或多个染料化合物接头元件连接而不与供体或受体染料连接的防护元件或侧链元件。特别地,可以将防护元件或侧链元件连接至两个染料化合物接头元件偶联的位置处,从而将防护元件或侧链元件置于连接到不同染料化合物接头元件上的不同染料基团之间。
还在其他实施方案中,染料标记的化合物为结构式(IIIF)的化合物:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各A独立地为受体染料;
各D独立地为供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r’独立地为0至4的整数;
其中化合物包括至少一个防护元件、至少一个受体染料和至少一个供体染料。
在更多的结构式(IIIF)的化合物的具体实施方案中,各r’独立地为0至2的整数。
在更多的结构式(IIIF)的化合物的具体实施方案中,各r’独立地为0或1。
仍在其他实施方案中,染料标记的化合物为结构式(IIIG)的化合物:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各Dye独立地为受体染料或供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r”独立地为0至8的整数;
s为1至6的整数;并且
t为0或1;
其中化合物包括至少一个防护元件、至少一个受体染料和至少一个供体染料。
在结构式(IIIG)的化合物的更具体的实施方案中,各r”独立地为0至4或0至2的整数。
在结构式(IIIG)的化合物的其他更具体的实施方案中,各r”独立地为0或1。
在结构式(IIIG)的化合物的一些实施方案中,s为1至4的整数。
在结构式(IIIG)的化合物的一些实施方案中,化合物包含至少两个供体染料、至少四个供体染料、至少六个供体染料、至少八个供体染料、至少十个供体染料或至少十二个供体染料。在结构式(IIIG)的化合物的其他更具体的实施方案中,化合物包含至少两个受体染料或至少四个受体染料。在结构式(IIIG)的化合物的其他更具体的实施方案中,化合物还包含至少两个防护元件、至少四个防护元件或甚至更多个防护元件。在一些此类实施方案中,将防护元件直接偶联至供体染料或受体染料。
应该理解的是,通过“直接偶联”,供体或受体染料和防护元件相互共价地连接而没有介于中间的功能组分。然而,直接偶联可以包括短的接头基团,例如酰胺键、醚键、短烷基链等,其不会显著地使防护元件与染料分离。
本发明的染料标记的化合物的供体染料和受体染料优选为彼此之间能够发生共振能量转移的发色团。在这点上,当处于电子激发态的供体染料可通过辐射或非辐射能量转移过程将能量转移至受体染料时,认为这对染料为供体染料和受体染料。例如,发射光子的过程和涉及长程电子传递的过程都包含在共振能量转移的含义内。当供体染料和受体染料之间的距离很短时、当供体染料的发射光谱和受体染料的激发光谱充分重叠时以及当供体发射和受体激发的偶极矩彼此相对匹配时,通常发生共振能量转移。美国专利申请公开Nos.2010/0255488和2012/0058469提供了FRET标记的核苷酸和供体-受体配对的实例,出于所有目的,将其全部公开内容通过全文引用并入本文。
本发明的染料标记的化合物的供体染料和受体染料优选为荧光染料。虽然在一些实施方案中,染料的激发光谱和发射光谱可以在红外范围内,但是染料的激发光谱和发射光谱优选在电磁光谱的可见光区域中。本文列出的任意染料均可为作为供体或受体的FRET对的组分。鉴于本公开,通过供体染料、受体染料和任意必要的防护元件和/或染料化合物接头元件上的反应性官能团使供体染料和受体染料结合,完全在本领域技术人员的能力范围内。
各种不同的荧光团为容易获得并适用于本发明的染料标记的化合物的,并且包括荧光素或罗丹明类染料、花青染料等。各种此类染料均为市售可得的,并且包括可购自GEHealthcare(新泽西州皮斯卡塔韦)的Cy染料,如Cy3、Cy5等,或可购自Thermo FisherScientific公司的Alexa系列染料,如Alexa 488、500、514、532、546、555、568、594、610、633、647、660、680、700和750。这些荧光团可以作为单独的荧光团存在,或者它们可以以相互作用的对或组的形式存在,例如作为荧光共振能量转移(FRET)对。
在优选的实施方案中,荧光染料为花青染料,例如下列中公开的任意花青染料:PCT国际公布No.2012/027618;美国专利申请公开No.2012/0058469;美国专利申请公开No.2012/0058482;以及美国专利申请公开No.2012/0052506;出于所有目的,将其各自的公开内容通过全文引用并入本文。另外的有效地掺入本发明的染料标记的化合物的长波杂芳基花青染料公开于美国专利申请公开No.2014/0005404 A1中,出于所有目的,将其全部公开内容通过引用并入本文。
如本文所用,因此术语“花青”是指聚甲炔染料,如基于花青、部花青、苯乙烯基和氧杂菁环的那些染料。花青染料包括(例如)CY3、CY3.5、CY5和CY5.5型染料。
示例性花青染料具有下式结构:
其中A环和B环独立地选自单环、双环或多环芳基或杂芳基部分。Q为取代或未取代的次甲基部分(例如,-(CH=C(Ru))c-CH=),其中c为选自1、2、3、4或5的整数。各Ru、Rw、Rx、Ry和Rz独立地选自各种合适的取代基,并且指数w和z独立地选自0至6的整数。
在一些实施方案中,各Rw和Rz独立地为取代的或未取代的烷基、杂烷基、芳基或杂芳基,Rw和Rz直接偶联至A环或B环,或者通过羰基、酰胺、脲、酯、硫酯、醚、硫醚或氨基键偶联至A环或B环。
在一些实施方案中,各Rx和Ry独立地为烷基或杂烷基,任选地被磺酸、羧酸、膦酸或磷酸取代。
在一些实施方案中,各Ru独立地为氢、烷基或杂烷基。
在上文列出的专利公开中更完全地描述了具体实施方案。本公开的染料标记的化合物中有效地包括的染料为表1所示的染料。
表1:示例性荧光染料。
本发明的染料标记的化合物的防护元件可以为在以上核苷酸化合物的情况下描述的任意防护元件,但不限于此。美国专利申请公开Nos.2015/0050659 A1和2016/0237279A1中也描述了防护元件。
在一些染料标记的化合物实施方案中,防护元件减少了染料标记的化合物或与染料标记的化合物相关的生物分子的光损伤。在一些化合物实施方案中,防护元件提高了染料标记的化合物的亮度。
在具体化合物实施方案中,防护元件包括多个侧链。在一些实施方案中,至少一个侧链的分子量为至少300。在其他实施方案中,所有侧链的分子量为至少300。在一些实施方案中,至少一个侧链包含聚乙二醇。在一些实施方案中,至少一个侧链包含带负电荷的组分。更具体而言,带负电荷的组分可以包含磺酸。在一些实施方案中,至少一个侧链包含取代的苯基,更具体地为下列结构:
其中各x独立地为1至6的整数。甚至更具体而言,各x可以独立地为1至4的整数。在一些实施方案中,至少一个侧链包含三唑,并且在一些实施方案中,至少一个侧链可以包含下列结构:
在一些染料标记的化合物实施方案中,防护元件包含下列结构:
其中各y独立地为1至6的整数。
在其他实施方案中,防护元件包含下列结构:
本发明的染料标记的化合物的防护元件可以另外或可选地包含树枝状大分子结构,包括以上在核苷酸化合物的情况下描述的任意树枝状大分子结构。用于生成本公开的含有树枝状大分子的染料标记的化合物的中间体化合物的实例如下:
该结构包含两个上述G3树枝状侧链和四个供体荧光团及其相关的防护元件。其代表图7G的左图所示的中间体化合物的高度支化的变型。
本发明的染料标记的化合物还进一步包括染料化合物接头元件。如本领域普通技术人员所理解的那样,染料化合物接头元件可以为上文定义的任意接头。染料化合物接头元件用于将一个或多个末端偶联元件与一个或多个供体染料、一个或多个受体染料以及一个或多个防护元件共价连接。如本领域技术人员在基于以下例举的染料标记的化合物的考虑所理解的,在一些化合物实施方案中,可能需要多于一个染料化合物接头元件来连接不同组分。
在一些实施方案中,染料化合物接头元件包含下列结构:
其中各z独立地为1至8的整数。在更具体的实施方案中,各z独立地为1至4的整数。如在本文所述的一些化合物实例中显而易见的,染料化合物接头元件可以进一步包含氨烷基或二氨烷基。染料化合物接头元件可以可选地或额外地包含其他接头基团,例如酰烷基、二酰烷基或任意其他合适的接头基团,包括美国专利申请公开No.2015/0050659 A1和美国专利申请公开No.2016/0237279 A1中描述的支化基团以及上文所述的多价中央核心元件。在一些化合物实施方案中,两个或多个染料化合物接头元件彼此共价地偶联。
在具体实施方案中,染料化合物接头元件包含下列结构:
并且在一些实施方案中包含下列结构:在一些实施方案中,染料化合物接头元件包含下列结构:一些染料化合物连接基元件可以包含超过一个以上结构,并且不同的染料化合物接头元件可以存在于本发明的化合物的单个分子中。
染料标记的化合物还进一步包含末端偶联元件。应该理解的是,末端偶联元件可以为以上在核苷酸化合物的情况下描述的任意末端偶联元件,但不限于此。在一些实施方案中,化合物包含两个末端偶联元件。在一些实施方案中,末端偶联元件包含生物素。在优选的实施方案中,末端偶联元件包含双生物素,并且特别是上文所示的双生物素结构的一者。
包含双生物素末端偶联元件、至少一个受体染料、至少一个供体染料和至少一个染料化合物接头元件的示例性染料标记的化合物包括以下化合物:
其包括一个未防护的供体染料和一个未防护的受体染料;
其包括两个未防护的供体染料和一个未防护的受体染料;
其包括两个未防护的染料和两个未防护的受体染料;
其包括两个未防护的供体染料和一个有防护的受体染料;
其包括两个有防护的供体染料和一个未防护的受体染料;
其包括两个有防护的供体染料和两个未防护的受体染料;
其包括两个未防护的供体染料和两个有防护的受体染料;
其包括两个有防护的供体染料和一个有防护的受体染料;
其包括两个有防护的供体染料和一个有防护的受体染料;以及
其包括两个有防护的供体染料和两个有防护的受体染料。
将其他示例性染料标记的化合物作为示于图3A至图3O’和图7A至图7D、图7F和图7G中的以及图示于图4A至图4C和图5A至图5M的化合物中的标记的核苷酸类似物的组分进行说明。
在优选的实施方案中,本发明的染料标记的化合物不包含多磷酸酯元件或核苷元件。
如以上在本发明的核苷酸化合物的情况下描述的,本发明的染料标记化合物的末端偶联元件通常介导染料标记的化合物与本发明的标记的核苷酸类似物的其他组分的结合。例如,并且已在本公开的其他地方描述,其中末端偶联元件为生物素或双生物素,染料标记的化合物可以以高亲合力与亲和素非共价地结合。在一些方面,本公开因此进一步提供了包括本公开的染料标记的化合物和亲和素的组合物。应该理解的是,在这些组合物中,末端偶联元件不是通过染料标记的化合物与亲和素结合而共价修饰,并且因此该组合物明显包括作为单独的分子实体的原始的染料标记的化合物和亲和素。
然而,在本公开的另一方面,应该考虑染料标记的化合物的末端偶联元件可以包含反应性官能团,其可以共价地结合到第二组分上的互补反应基团上,例如在适当经修饰的接头元件、防护元件或核苷酸化合物上。与刚刚描述的非共价组合物不同,此类反应生成了由衍生自各组分的反应性基团的残基连接而成的新分子实体。如本说明书其他地方所述,这些残基可以包含(例如)衍生自胺基团和适当活化的羧基基团的酰胺部分或由点击反应产生的残基。
本公开的又一方面提供了本发明的染料标记的化合物以及它们的中间体的合成方法。此类方法可以包括使整个说明书中说明的任意中间体化合物与第二中间体化合物反应以生成本发明的核苷酸化合物或中间体的步骤。示例性的合成途径示于下面的反应方案中、实施例中以及附图中。
核苷酸化合物和染料标记的化合物及类似物的合成与组装
另一方面,本公开提供了合成和组装本文公开的化合物和标记的核苷酸类似物的方法。这些化合物和类似物容易用标准化学技术制备。美国专利申请公开No.2015/0050659A1和美国专利申请公开No.2016/0237279 A1中提供了可适用于制备本发明化合物的合成反应的详细实例。例如,可以根据方案1所示的反应来合成示例性防护元件的中央核心:
方案1
例如,根据方案2所示的反应,可以合成防护元件侧链的核心组分:
方案2
例如根据方案3-1或方案3-2,可以合成经核苷六磷酸盐修饰的防护元件:
方案3-1
方案3-2
从上文描述可以理解,方案3-1和3-2中所示的最终结构内的防护元件表示“分层的”防护元件。
在方案3-1的前两个反应循环的初始步骤中所使用的防护核心元件试剂(TFA-Sh-CONHS)可以通过方案1的“Sh”防护核心元件与TFA-NHS反应生成,从而形成下列结构:
SG1-N3的结构为:
PEG7-N3的结构为:
N3-Aba-CONHS的结构为:
NH2-14C-dN6P表示含有末端为氨基的14个碳(或等同的)接头链的六磷酸脱氧核苷酸。这种结构的示例性物质为:
其中碱基为胸腺嘧啶,并且C-14接头链包含酰胺键。
方案4-1至4-3概述了用于生成含有防护元件的试剂的可替代的途径,所述试剂可用于本公开的各种化合物的合成:
方案4-1
方案4-2
方案4-3
根据上述方案制备的防护元件相当于“分层的”防护物,但是如果需要,可以适当地改变合成反应以生成非分层的防护物。
方案5概述了可用于生成方案4-1至4-3的含有叠氮的侧链试剂(例如,R1-N3和R2-N3)的示例性合成反应:
方案5
应该认为所有上述防护组分中间体结构的合理变化都在本公开的范围内。
方案6示出了生成其他叠氮中间体的示例性合成方案:
方案6
方案7-1和7-2示出了用于制备刚刚描述的防护元件的组分的示例性反应:
方案7-1
方案7-2
方案8示出了用于制备本发明核苷酸化合物和染料标记的化合物的变型防护元件的组分的可替代的反应顺序,其中用一当量的烷基化试剂进行初始步骤,从而引发4-羟基处的选择性反应。如本领域已知的,选择性烷基化反应可以更普遍地用于本发明化合物的制备,以实现增加的分子多样性。
方案8
方案9示出了用于制备本发明化合物和标记的核苷酸类似物的树枝状大分子侧链取代基的示例性合成路线。
方案9
在该反应方案中,通过在所示反应的可替代形式中使用下列示例性可替代试剂可以实现结构的进一步可变性:
在方案10的合成途径中示出了作为接头的具有双官能反应性的树枝状大分子的生成,其中可以通过除去Boc基团选择性地对所示产物进行脱保护:
方案10
通常应该理解的是,如本领域技术人员所理解的那样,其他偶联化学也可以证明适用于合成本公开的化合物。因此,可以使用上述合成方案中例举的反应以外的反应,对此没有限制。
图6A图示了有效地掺入本公开的染料标记的化合物和类似物中的示例性的有防护的染料标记的中间体化合物。例如,该特定中间体已被用于生成图5G所示的染料标记的化合物和图3K所示的标记的核苷酸类似物。图6B提供了对应于图6A的图示的示例性化学结构,其包括防护元件,该防护元件包括直接偶联至染料的防护的核心元件、包含两个反应性叠氮基的染料化合物接头元件中间体以及连接在染料化合物接头元件上的另一个小侧链。如将在下面说明,并示于图7A至图7D、图7F和图7G的那样,在该示例性中间体化合物中,可以使用“点击”反应将叠氮基偶联至其他染料标记的中间体化合物或偶联至末端偶联元件,如包含双生物素的末端偶联元件。如果需要,防护元件的侧链可以进一步变化。例如,图6C的示例性化学结构的侧链小于图6B的结构中的侧链,而图6D的侧链大于图6B的结构中的侧链。这些实例中侧链的不同尺寸由图6B和图6D的结构中的较大侧链中包含的一个或多个侧链核心结构引起。此处,再次应该理解的是,虽然图6A示出了两个大侧链和一个小侧链,由此对应于图6B的化学结构,但是不应该将本公开中提供的图示视为对这些图示中所表示的组分的尺寸或确切位置的限制。
图6E示出了另一种示例性有防护的染料标记的中间体化合物的合成方案,该中间体化合物含有四个有防护的供体染料和双生物素结合元件。最终产物也在图示中示出。要注意的是,该中间体化合物含有环辛炔末端基团,因此适于使用无铜点击反应与叠氮取代的组分反应。含有四个有防护的供体染料和两个叠氮末端基团的不同的示例性中间体化合物示于图6F中。
可以使用上述组分(包括核苷酸化合物、染料标记的化合物和用于合成这些化合物的化学中间体)来组装本公开的标记的核苷酸类似物,例如使用图7A至图7D和图7F中概述的步骤。如图7A所示,可以由第一染料标记的中间体化合物开始制备包含dG和dT的示例性标记的核苷酸类似物,第一染料标记的中间体化合物包括两个有防护的供体染料、末端偶联元件(例如,双生物素)以及中间带有反应性端基的染料化合物接头元件。在示例性dG核苷酸类似物的制备中,染料标记的中间体首先与以球形结构表示的亲和素复合。接着将第二个染料标记的中间体化合物偶联至部分地组装的类似物,所述中间体化合物含有由染料化合物接头元件连接的两个未防护的受体染料,所述接头元件中间带有两个反应性端基。使用过量的复合的第一染料标记的中间体和亲和素进行该偶联反应,使得第二染料标记的中间体化合物的两个反应性端基都被两个第一中间体染料标记的化合物的反应性基团所修饰。偶联反应优选为铜催化的或无铜点击反应,但是可以使用其他合适的偶联反应来生成中间体复合物。然后将该复合物(其包括两个亲和素蛋白和染料标记的化合物,该染料标记的化合物包含两个未防护的受体染料、四个有防护的供体染料、三个偶联的染料化合物接头元件和两个双生物素末端偶联元件)与过量的dG核苷酸化合物反应以生成最终的dG类似物产物。图7A和图7B所示的全部类似物中使用的核苷酸化合物包括单个核苷元件(dG、dT、dA或dC)、多磷酸酯元件、包含阴离子芳香族间隔元件和防护元件的核苷酸接头元件以及双生物素末端偶联元件。
可以(例如)通过图7A右侧所示的途径来制备示例性dT核苷酸类似物。根据该途径,首先将第一染料标记的中间体偶联至第二染料标记的中间体化合物,第一染料标记的中间体包括两个有防护的供体染料、末端偶联元件(例如,双生物素)和中间具有反应性端基的染料化合物接头元件,第二染料标记的中间体化合物包括由染料化合物接头元件中间体连接的两个未防护的受体染料,所述接头元件中间体具有两个反应性端基。过量的偶联反应的产物与亲和素蛋白复合,以生成复合物,其包括一个亲和素蛋白和两个部分地偶联的染料标记的化合物中间体。接着将该复合物与过量的来自第一途径的第一亲和素蛋白复合物偶联,所述第一亲和素蛋白复合物包含一个亲和素蛋白和中间具有两个有防护的供体染料的染料标记的复合物。如图所示,该偶联反应的产物包含三个亲和素蛋白和两个上述用于dG类似物的染料标记的化合物。因为dT类似物含有两个染料标记的化合物,而dG类似物仅含有一个染料标记的化合物,所以可以通过各复合物发射的荧光信号强度的差异来相互区分dG类似物和dT类似物。dG类似物和dT类似物中的各染料标记的化合物分别包括四个有防护的供体染料和两个未防护的受体染料。
可以如图7B的示例性途径中概述的那样对dA类似物和dC类似物进行组装。图7B的途径和图7A的途径之间的主要差别在于使用包括两个未防护的供体染料的第一染料标记的中间体化合物。该第一中间体在其他方面与图7A的第一染料标记的中间体(其包括包括有防护的供体染料)相同。相比于图7A的包括两个未防护的受体染料第二中间体,途径中的其他差别为使用包括两个有防护的受体染料的第二染料标记的中间化合物。因为dC类似物含有两个染料标记的化合物,而dA类似物仅含有一个染料标记的化合物,所以可以通过各复合物发射的荧光信号强度的差异来相互区分dA类似物和dC类似物。dA类似物和dC类似物中的各染料标记的化合物分别包括四个未防护的供体染料和两个有防护的受体染料。与dG类似物和dT类似物一样,可以通过各复合物发射的荧光信号的强度差异来相互区分dA类似物和dC类似物。由于有防护的染料的不同微环境,基于不同染料标记的化合物的光谱差异,dG类似物可以与dA类似物相区分,并且dT类似物可以与dC类似物相区分。
图7C和图7D示出了可用于类似物的组装的可替代的途径,所述类似物包含示例性标记的dT、dG、dC和dA核苷酸类似物。图7E提供了图例,用于说明图中的一些示例性图示与那些图中所示的组分的化学结构之间的关系。图7F示出了又一些示例性组分和途径,其已用于制备本公开的标记的核苷酸类似物。
聚合酶
可以优化本文公开的标记的核苷酸类似物并使其适用于特定的聚合酶,特别是通过类似物的核苷酸化合物组分的结构调节。此外,聚合酶本身可以通过定向突变而适用于本公开的类似物。具体而言,各种天然的和经修饰的聚合酶在本领域是已知的,并且这些酶的结构和功能特性是很好理解的。根据与以下物质的系统发育关系,有时可将DNA聚合酶分为六个主类:(例如)大肠杆菌(E.coli)Pol I(A类)、大肠杆菌Pol II(B类)、大肠杆菌PolIII(C类)、广古生菌(Euryarchaeotic)Pol II(D类)、人Polβ(X类)以及大肠杆菌UmuC/DinB和真核生物的RAD30/着色性干皮病的变体(Y类)。关于命名法的综述,参见(例如)Burgers等(2001)“Eukaryotic DNA polymerases:proposal for a revised nomenclature”JBiol Chem.276(47):43487-90。关于聚合酶的综述,参见(例如)Hübscher等(2002)“Eukaryotic DNA Polymerases”Annual Review of Biochemistry Vol.71:133-163;Alba(2001)“Protein Family Review:Replicative DNA Polymerases”Genome Biology 2(1):reviews 3002.1-3002.4;以及Steitz(1999)“DNA polymerases:structural diversityand common mechanisms”J Biol Chem 274:17395-17398。已经确定了许多聚合酶的基本作用机制。数以百计的聚合酶的序列为公众可获得的,并且已经确定其中许多聚合酶的晶体结构,或者可以根据与同源聚合酶的已解析晶体结构的相似性来推断它们的结构。例如,根据本发明的经修饰的亲本酶的优选类型Φ29的晶体结构为可获得的。许多(例如)用于测序、标记和扩增技术的聚合酶为市售可得的。示例性的有用DNA聚合酶包括Taq和其他热稳定聚合酶、外切核酸酶缺陷型Taq聚合酶、大肠杆菌DNA聚合酶I、克列诺片段、逆转录酶、SP6DNA聚合酶、T7 DNA聚合酶、T5 DNA聚合酶、T4 DNA聚合酶、RB69聚合酶等。
特别适用于本发明的类似物的酶包括但不限于重组Φ29型DNA聚合酶。“Φ29型DNA聚合酶”(或“phi29型DNA聚合酶”)为来自Φ29噬菌体或来自相关噬菌体(如Φ29一样,包含用于启动DNA复制的末端蛋白)中的一者的DNA聚合酶。Φ29型DNA聚合酶与Φ29DNA聚合酶(例如,如SEQ ID NO:1中所列的)同源;其实例包括B103、GA-1、PZA、Φ15、BS32、M2Y(例如,如SEQ ID NO:2中所列的;也称为M2)、Nf、G1、Cp-1、PRD1、PZE、SF5、Cp-5、Cp-7、PR4、PR5、PR722、L17、Φ21和AV-1DNA聚合酶,以及它们的嵌合体。例如,经修饰的重组DNA聚合酶可以同源于野生型或外切核酸酶缺陷型Φ29 DNA聚合酶,(例如)如美国专利Nos.5,001,050、5,198,543或5,576,204中所述的。关于命名法,也参见Meijer等(2001)“Φ29Family ofPhages”Microbiology and Molecular Biology Reviews,65(2):261-287。经修饰的重组Φ29-型DNA聚合酶包括相对于天然存在的野生型Φ29型DNA聚合酶的一个或多个突变,例如具有下列效果的一个或多个突变:改变与核苷酸类似物相互作用和/或掺入核苷酸类似物、提高稳定性、增加读取长度、提高精确度、提高光耐受性和/或改变另一聚合酶特性,并且可以包括对野生型Φ29型DNA聚合酶的额外的改变或修饰,如额外的肽或蛋白质序列(例如,用于将聚合酶固定在表面上或以其他方式标记聚合酶)的一个或多个缺失、插入和/或融合。
例如,可用于本发明类似物的重组聚合酶可以与野生型Φ29型聚合酶同源(例如,具有至少60%、至少70%、至少80%、至少90%、至少95%、至少98%或甚至至少99%的同一性),例如与SEQ ID NO:1-6中的一者同源。如使用序列比较算法或通过肉眼观察所测量的,当比较和比对两个序列获得最大一致性时,即确定氨基酸残基具有同一性。优选地,同一性存在于长度为至少约50个残基的序列区域,更优选为至少约100个残基的区域,并且最优选为至少约150个残基的序列区域,或在进行比较的两个序列的全长上。
作为参考,将野生型Φ29聚合酶的氨基酸序列连同几种其他的野生型Φ29型聚合酶的序列一起列于表2中。
表2:示例性野生型Φ29型聚合酶的氨基酸序列
相比于参照聚合酶(例如,野生型Φ29型聚合酶,例如SEQ ID NOs:1-6中的一者),可用于本公开类似物的重组聚合酶(例如,重组Φ29型DNA聚合酶)通常包括一个或多个突变(例如,氨基酸置换、缺失或插入)。取决于特定的突变或突变的组合,聚合酶表现出可用于(例如)单分子测序用途或核酸扩增的一种或多种性质。此类聚合酶在DNA扩增期间使核苷酸和/或核苷酸类似物(例如,本文所述的类似物)掺入到生长的模板拷贝中。对此类聚合酶进行修饰,使得它们相比于相应的野生型或其他亲本聚合酶(例如,通过(例如)突变由其衍生出本发明的经修饰的重组聚合酶的聚合酶)具有一种或多种理想的性质,例如,对本发明的核苷酸类似物的改进的测序性质、增加的读取长度、增强的热稳定性、增强的抗光损伤性、当掺入相关类似物时减少的支化部分的形成、改进的DNA聚合酶复合物稳定性或持续合成能力、增强的共溶剂抗性、降低的外切核酸酶活性、增加的产量、改变的辅因子选择性、提高的精确度、增加或降低的速度和/或改变的动力学性质(例如,聚合酶动力学的一步或多步中速度的降低,其由(例如)聚合酶与核苷酸类似物的增强的相互作用、增强的金属配位作用所引起)。
示例性聚合酶包括重组Φ29型DNA聚合酶,其包括在选自由下列构成的组中的一个或多个位置上的突变(例如,氨基酸置换):A68、C106、A134、K135、L142、Y224、E239、V250、L253、A256、R261、R306、R308、L326、T368、T373、E375、T421、W436、A437、Y439、T441、C448、E466、D476、A484、S487、E508、D510、K512、E515、K539、P558、D570和T571,其中相对于野生型Φ29聚合酶(SEQ ID NO:1)来确定这些位置。任选地,聚合酶包含在两个以上、三个以上、五个以上、10个以上、15个以上、20个以上或者甚至25个以上的这些位置上的突变。本文描述了在这些(和其他)位置处的许多示例性置换。在以下情况下,给出的氨基酸或核苷酸聚合物的编号“相当于选定的氨基酸聚合物或核酸的编号”或者“与选定的氨基酸聚合物或核酸相关”:即给出的任意聚合物组分(氨基酸残基、掺入的核苷酸等)的位置是通过参照选定的氨基酸或核苷酸聚合物中的相同残基位置而指定的,而不是通过给出的聚合物中组分的实际位置而指定的。类似地,在以下情况下,给出的氨基酸或核苷酸聚合物中的给出位置的确定“与选定的氨基酸或核苷酸聚合物有关”:即任意给出的聚合物组分(氨基酸残基、掺入的核苷酸等)的位置是通过参照选定的氨基酸或核苷酸聚合物中的残基名称和位置而指定的,而不是通过给出的聚合物中组分的实际名称和位置而指定的。通常通过比对相关的氨基酸或多核苷酸序列来确定位置的对应性。例如,相对于野生型Φ29聚合酶(SEQ ID NO:1),将野生型M2Y聚合酶(SEQ ID NO:2)的残基K221指定为Y224位。类似地,相对于野生型Φ29聚合酶(SEQ ID NO:1),将野生型M2Y聚合酶(SEQ ID NO:2)的残基L138指定为V141位,由此,相对于SEQ ID NO:1,将M2Y聚合酶中的L138K置换指定为V141K置换。除非另有明确说明,否则通常相对于SEQ ID NO:1来指定本文中的氨基酸位置。
作为一些实例,在E375处的突变可以包含选自由下列构成的组中的氨基酸置换:E375Y(即,酪氨酸残基存在于E375位,其中相对于SEQ ID NO:1来确定位置)、E375F、E375W、E375H和E375M;K512位的突变可以包含选自由下列构成的组中的氨基酸置换:K512Y、K512F、K512H、K512W、K512M和K512R;L253位的突变可以包含L253A置换;A484位的突变可以包含A484E置换;和/或D510位的突变可以包含D510K或D510R置换。其他示例性取代包括(例如)A68S、C106S、A134S、K135Q、K135R、L142R、L142K、Y224K、E239G、V250I、A256S、R261K、R306Q、R308L、L326V、T368S、T373F、T421Y、W436Y、A437G、Y439W、T441I、C448V、E466K、D476H、S487A、E508R、E508Q、E515Q、K539E、P558A、D570S和T571V;本文描述了其他的置换。
本文提到的聚合酶突变可以互相组合并且可以与基本上任何其他可获得的突变和突变策略组合,从而在以下方面得到另外的改进性质:(例如)核苷酸类似物特异性、酶持续合成能力、在聚合酶-DNA-核苷酸复合物中改进的标记的核苷酸的保留时间、光耐受性等。例如,本文中的突变和突变策略可以与下列文献中的教导组合:(例如)美国专利申请公开No.2007/0196846;美国专利申请公开No.2008/0108082、美国专利申请公开No.2010/0075332、美国专利申请公开No.2010/0093555、美国专利申请公开No.2010/0112645、美国专利申请公开No.2011/0189659、美国专利申请公开No.2012/0034602、美围专利申请公开No.2013/0217007、美国专利申请公开No.2014/0094374和美国专利申请公开No.2014/0094375。出于所有目的,将这些申请中的每一个通过全文引用并入本文。突变/突变策略的此类组合可以用于赋予聚合酶以若干同时产生的改进性质(例如,对于所需类似物的增加的效用、增加读取长度、增强的光耐受性、减少的支化部分的形成、增强的特异性、改进的持续合成能力、改变的速率、改进的保留时间、封闭式复合物改进的稳定性、对特定金属辅因子的耐受性等)。此外,可以出于特殊用途的原因对聚合酶进行进一步修饰,如(例如)美国专利申请公开No.2010/0261247和美国专利申请公开No.2010/0260465(出于所有目的,将其中的每一个通过全文引用并入本文)中教导的那样,如当聚合酶结合至表面时,对酶的活性进行改进;和/或如引用文献中教导的或本领域常见的那样,进行包括纯化或处理标记。聚合酶可以包括一个或多个外源或异源特征,例如在聚合酶的N末端区域、在聚合酶的C末端区域和/或在聚合酶内部。此类特征不仅可用于重组聚合酶的纯化和/或聚合酶在基底上的固定,还可以改变聚合酶的一种或多种性质。关于此类特征的结合的其他信息,参见(例如)美国专利申请公开公开Nos.2012/0034602和2014/0094375(出于所有目的,将其中的每一个通过全文引用并入本文)。类似地,本文描述的经修饰的聚合酶可以与其他策略组合使用以改善聚合酶的性质,所述策略例如,如美国专利申请公开号2009/0286245(出于所有目的将其通过全文引用并入本文)中教导的那样,用于控制聚合酶速率常数的反应条件。
如上所述,本文描述的各种突变可以在可用于本发明的重组聚合酶中组合。突变的组合可以为随机的,或者更理想的是以特定突变的特性和所得的聚合酶的所需特征为指导。还可以将另外的突变引入聚合酶中,以弥补其他所需突变的有害作用。例如,W436Y置换可以减少支化部分,但会诱导暂停,Y439W可以减少暂停但也会降低产量,而R261K可以提高产量;因此,W436Y/Y439W/R261K组合可能是理想的。
本文描述了许多示例性突变以及这些突变所赋予的性质,并且显而易见的是,这些突变可以以许多不同组合方式有利地组合。本文还(例如)在表3中提供了示例性组合,以及随后易于衍生出其他有利的组合的策略实例。为了简单起见,讨论了仅使用几个示例性突变的几个示例性组合,但显而易见的是,本文描述的任意突变均可用于此类策略,以生成具有理想性质的聚合酶。
例如,在需要将重组聚合酶掺入本发明的类似物的情况下,可以掺入一个或多个置换,其通过以下作用来增强类似物结合:与末端磷酸盐上芳香族基团的相互作用、与芳香族基团上的带电荷的取代基的相互作用和/或与类似物上其他部分的取代基的相互作用,所述置换例如在下列位置处的氨基酸置换:K135、L142、T373、E375和/或K512,例如K135Q、K135R、L142R、L142K、T373F、E375Y、E375F、E375W、E375H、E375M、D510R、K512Y、K512F、K512H、K512W、K512M和/或K512R。如图8所示,将包括E375Y利K512Y置换的聚合酶中的酪氨酸残基定位成与含有DISC的六磷酸盐类似物上的DISC基团堆叠。此外,135位的赖氨酸与DISC磺酸根基团形成盐桥。如图9所示,在包括E375W、K512F和L142R置换的聚合酶中,将色氨酸环和苯丙氨酸环定位成与DISC基团堆叠,而142位的精氨酸可与类似物上其他位置的SG1基团形成盐桥。如图10所示,在包括E375W、K512H和K135R置换的聚合酶中,将色氨酸环和组氨酸环再次定位成与DISC环相互作用,并且135位的精氨酸与DISC磺酸根基团形成盐桥。如图11A所示,在包括E375Y、K512Y和D510R置换的聚合酶中,酪氨酸残基可以与4,8-二磺基萘-2,6-二羧酸(“DSDC”)间隔基团堆叠。
510位的精氨酸可以与DSDC磺酸根基团中的一者形成盐桥,并且375位的酪氨酸可以与该磺酸根形成氢键。135位的赖氨酸可以与另一个DSDC磺酸根基团形成盐桥,其也可以与512位的酪氨酸形成氢键。类似地,如图11B所示,在包括E375Y、K512Y、D510R和K135R置换的聚合酶中,酪氨酸残基可以与DSDC基团堆叠。510位精氨酸可以与DSDC磺酸根基团中的一者形成盐桥,其也可以与375位的酪氨酸形成氢键。135位的精氨酸可以与另一个DSDC磺酸根基团形成分叉盐桥,其也可以与512位的酪氨酸形成氢键。还可以将其他增强类似物结合的置换(例如A484E)掺入聚合酶中。
在含有Mg++的单分子测序反应中,期望聚合酶掺入类似物的情况下,可以掺入一个或多个改变金属辅因子用途的置换(例如,L253A、L253H、L253C或L253S)。可以通过包含诸如A437G、E508R、E508K、L142K、D510R、D510K和/或V250I之类的置换来提高聚合酶速度。可以通过包含诸如E515Q和/或A134S之类的置换来提高精确度。可以通过包含诸如D570S和/或T571V之类的置换来提高持续合成能力。可以通过包含诸如Y224K、E239G和/或V250I之类的置换来提高稳定性和/或产量。还可以通过(例如)使用M2Y作为亲本聚合酶和/或包括增强稳定性的外源特征(例如,C末端外源特征,例如,His10或其他聚组氨酸标签)来提高稳定性。使用大的类似物(例如,包括蛋白质部分的类似物)会不利地使脉冲宽度变窄并使脉冲间隔距离增大,因此聚合酶中可以包括一个或多个能够增加脉冲宽度(例如,P558A、A256S和/或S487A)的置换,或者能够减小脉冲间隔距离或减少暂停的取代(例如,L142K、R306Q、R308L、T441I、C448V、E466K、D476H和/或E508R)。关于脉冲宽度和脉冲间隔距离的讨论,参见(例如)美国专利申请公开No.2014/0094375(出于所有目的,之前已将其通过全文引用并入本文)。
显而易见的是,涉及重组聚合酶的不同用途需要不同的聚合酶性质以及由此而来的不同的突变组合。如所理解的那样,聚合酶可以表现出前述性质中的一者,或者可以以组合的形式表现出两种或更多种性质。此外,应该理解的是,虽然可以针对特定性质对特定的突变或聚合酶进行描述,但为了便于讨论,突变或聚合酶可以具有未在每种情况下提及的另外的经修饰的性质。还应理解的是,特定的性质是在某些条件下观察到的。例如,当在热失活试验中观测时,稳定性改善突变可以(例如)赋予聚合酶-DNA底物二元复合物(相比于含有缺少该突变的亲本聚合酶的该复合物)以增强的稳定性,或者当在单分子测序反应中观测时,在亲本聚合酶-DNA底物二元复合物的寿命(且由此所致的读取长度)因其稳定性而受限的情况下,所述稳定性改善突变可以赋予增加的读取长度。单个突变(例如,单个氨基酸置换、缺失、插入等)可以引起一种或多种改变的性质,或者所述一种或多种性质可以由两个或多个突变造成,这些突变为赋予理想的活性而共同起作用。
表3提供了示例性突变及其组合的列表,并且本文还描述了其他的示例性突变。基本上,可以将这些突变中的任一者或其任意组合引入聚合酶中,以生成经修饰的重组聚合酶(例如,引入野生型Φ29聚合酶、野生型M2聚合酶、外切核酸酶缺陷型Φ29聚合酶或外切核酸酶缺陷型M2聚合酶,这仅为少数实例)。
表3:引入Φ29 DNA聚合酶中的示例性突变。相对于SEQ ID NO:1来指定位置。
表4和5提供了具有表3的示例性突变组合的示例性重组Φ29聚合酶的氨基酸序列。表4包括分子的聚合酶部分以及一个或多个位于聚合酶的C末端区域的外源特征,而表5仅包括聚合酶部分的氨基酸序列。
表4:包括C末端外源特征的示例性重组Φ29聚合酶的氨基酸序列。相对于SEQ IDNO:1来确定氨基酸位置。
表5:示例性重组Φ29聚合酶的氨基酸序列。相对于SEQ ID NO:1来确定氨基酸位置。
本公开的特征为组合物、试剂盒和系统(例如,测序系统),它们包括此类重组聚合酶(例如)与一种或多种本发明标记的核苷酸类似物的组合,以及使用重组聚合酶的方法(例如,测序方法或形成DNA的方法)。包括这些突变和/或本文其他地方描述的突变的许多其他此类重组聚合酶是显而易见的并且为本公开的特征。
在存在和缺乏核苷三磷酸的情况下,可得到Φ29聚合酶的结构、Φ29聚合酶与末端蛋白复合的结构以及Φ29聚合酶与引物模板DNA复合的结构;分别参见Kamtekar等(2004)“Insights into strand displacement and processivity from the crystalstructure of the protein-primed DNA polymerase of bacteriophageΦ29”Mol.Cell16(4):609-618)、Kamtekar等(2006)“The phi29 DNA polymerase:protein-primerstructure suggests a model for the initiation to elongation transition”EMBOJ.25(6):1335-43和Berman等(2007)“Structures of phi29 DNA polymerase complexedwith substrate:The mechanism of translocation in B-family polymerases”EMBOJ.26:3494-3505。可以(例如)根据与结构已经确定的聚合酶的聚合酶同源性对其他聚合酶或复合物的结构进行建模。或者,可以使用本领域已知的技术来确定给定聚合酶(例如,野生型或经修饰的聚合酶)的结构,其任选地与DNA(例如,模板和/或引物)和/或核苷酸类似物等复合。参见(例如)美国专利申请公开No.2014/0094375及其中的参考文献。
可以将突变引入所需的亲本聚合酶中并且可以使用本领域已知的技术对所得的重组聚合酶进行表达、纯化和表征(例如,为了确定(例如)本发明的类似物的一个或多个特性)。参见(例如)美国专利申请公开Nos.2007/0196846、2008/0108082、2010/0075332、2010/0093555、2010/0112645、2011/0189659、2012/0034602、2013/0217007、2014/0094374和2014/0094375(出于所有目的,之前已通过全文引用并入本文)和其中的参考文献。
用于核酸测序的反应混合物、方法和系统
另一方面,本公开还提供了用于核酸测序中的反应混合物。此类混合物优选包含聚合酶复合物,其包括聚合酶、模板核酸和任选的与模板核酸杂交的引物。理想地构造此类聚合酶复合物用于诸如ZMW的表面之类的表面上的固定。反应混合物还包含与固定有聚合酶复合物的表面相接触的测序试剂。测序试剂包括用于进行核酸合成的核苷酸,特别是上文详细描述的两个或多个标记的核苷酸类似物。例如,美国专利申请公开No.2013/0316912A1提供了涉及反应混合物的进一步细节,包括优选的模板核酸、聚合酶、用于将聚合酶复合物固定至表面的方法、反应条件(包括缓冲液、pH、盐等)。上文描述了可有效地包括在本发明反应混合物中的示例性突变聚合酶,以及包含本发明的经修饰的核苷酸化合物的类似物。
在具体实施方案中,反应混合物的标记的核苷酸类似物包含至少一种染料标记的化合物和至少一个核苷酸化合物,其中上文描述了所述至少一种染料标记的化合物和所述至少一种核苷酸化合物。在更具体的实施方案中,各染料标记的化合物和各核苷酸化合物分别包含双生物素部分。
又一方面,本公开还进一步提供了用于对核酸模板进行测序的方法。在这些方法中,提供了聚合酶复合物,其包括聚合酶、模板核酸和任选的与模板核酸杂交的引物。在一些实施方案中,将聚合酶复合物固定在表面上。将测序试剂添加到聚合酶复合物中,其中所述试剂包括用于进行核酸合成的核苷酸,特别是上文详细描述的两个或更多个标记的核苷酸类似物。通过观察标记的核苷酸类似物与聚合酶复合物的相互作用,从而确定核苷酸在与模板核酸链互补的核酸链上的依次添加。
在具体的方法实施方案中,测序方法的标记的核苷酸类似物包括本公开的至少一种染料标记的化合物和至少一种核苷酸化合物。在更具体的方法实施方案中,所述至少一个染料标记的化合物和所述至少一个核苷酸化合物各自包含双生物素部分。
又一方面,本公开提供了用于测序核酸的系统。此类系统优选包括芯片,该芯片包含连接到其上的多个聚合酶复合物,各聚合酶复合物单独地为光学可分辨的,各聚合酶复合物包含聚合酶、模板核酸和任选地与模板核酸杂交的引物。系统还包含与表面接触的测序试剂。测序试剂包含用于进行核酸合成的试剂,其包括上文详细描述的两个或多个标记的核苷酸类似物。该系统还包括照射系统,用于照射聚合酶复合物;光学检测系统,用于在标记的核苷酸类似物与聚合酶复合物相互作用时检测来自标记的核苷酸类似物的荧光;以及计算机,用于分析由检测系统检测的信号,从而确定核苷酸在与模板核酸链互补的核酸链上的依次添加。例如,美国专利申请公开No.2013/0316912 A1进一步描述了此类系统。
对于相关领域的普通技术人员而言显而易见的是,在不脱离本发明或其任意实施方案的范围的情况下,可以对本文描述的方法和用途进行其他合适的修改和调整。现已详细描述了本发明,通过参照以下实施例将更清楚地理解本发明,这些实施例仅仅是出于说明的目的而包括在内,并不意图限制本发明。
实施例
实施例1.双生物素核苷酸化合物的合成
已经合成了各种含有双生物素接头的核苷酸化合物以用于单分子实时测序反应。已经使用亲和素蛋白将这些化合物与也包含双生物素接头的染料标记的化合物或它们的中间体形式进行组装,从而生成染料标记的核苷酸类似物复合物,例如如实施例2中所述并且如图7A至图7D和图7F所示。已根据这些方法制备的标记的核苷酸类似物的另外的例子图示于图3E至图3O’。在涉及DNA聚合酶的自动DNA测序反应中,许多类似物表现出改进的光稳定性、亮度和反应动力学。也参见美国专利申请公开No.2013/0316912 A1。实施例3中描述了组装的荧光核苷酸试剂复合物在实时测序反应中的应用。
本公开的含有双生物素的核苷酸试剂化合物可以包括两个核苷酸臂,例如如下所示的对照-SG1x4-dG2。如该结构所示,两个核苷酸臂中的每一个可以包含鸟苷核苷、六磷酸盐链、接头基团以及一对防护元件,接头基团包括由“点击”偶联反应生成的三唑部分,各防护元件包含两个侧链(“SG1”侧链,参见上文中的反应方案),每个链包含三个阴离子侧链。已经证明,当掺入荧光核苷酸试剂化合物时,这种防护元件能够防止聚合酶的光损伤并且能够在测序反应中提供其他优点。参见(例如)美国专利申请公开Nos.2015/0050659 A1和2016/0237279 A1。在这里发现这些基团能够调节核苷酸试剂对聚合酶的亲合力和/或使用含有这些基团的核苷酸试剂能够提供聚合酶反应动力学的其他改进。示例性对照-SG1x4-dG2化合物还含有三氨基-环己基多价中央核心元件,其为两个核苷酸臂提供支化点并且也为双生物素基团提供连接位点,三氨基-环己基多价中央核心元件本身包含三氨基三嗪多价中央核心元件,其为分子的双生物素末端偶联元件提供支化点。
对照-SG1x4-dG2
如美国专利申请公开No.2015/0050659 A1通常描述的那样,进行以上试剂化合物的合成。
可选的核苷酸试剂化合物可以包括仅一个核苷酸臂,例如如下所示的对照-SG1x2-dG。在该化合物中,存在单个核苷酸臂,与上文描述的对照-SG1x4-dG2二核苷酸化合物非常相似,其中核苷连接至六磷酸盐链、接头基团和一对防护元件。然而,与二核苷酸结构不同的是,在单核苷酸化合物中,有防护的核苷酸臂直接与携带双生物素末端偶联元件的三氨基三嗪多价中央核心元件偶联。
对照-SG1x2-dG
以下变型结构也含有单个核苷酸臂,但与对照-SG1x2-dG单核苷酸化合物的不同之处在于,包括额外的防护元件对或“层”(对于分层-SG1x4-dG)或两个另外的防护元件对(对于分层-SG1x6-dG)。应该理解的是,在每种情况下,化合物延伸到末端三唑部分之外,以包括核苷酸接头元件的额外的片段、线形多磷酸酯元件和核苷。
另一种变型单核苷酸化合物在每个防护元件内包含分支或“分叉(Split)”,使得另外的阴离子侧链通过支化基团连接至防护元件,所述支化基团偶联至具有多个阴离于侧链的芳香族基团。以下所示的结构Split-SG1x4-dG代表完整的核苷酸试剂化合物,包括完整的核苷酸接头、多磷酸酯元件和核苷(在本实例中为“dG”核苷)。
单核苷酸试剂的又一种变型结构包括试剂的核苷酸臂中的阴离子芳香族“间隔”基团。示例性结构DISC-SG1x2-dG如下所示。如图所示,该结构包括连接在多磷酸酯元件上的“dG”核苷。在其他方面,其与上文所示的对照-SG1x2-dG结构相同,不同之处在于其包括1H-2,3-二氢异喹啉-8-磺基-6-羧酸(“DISC”)间隔元件,该间隔元件插入对照-SG1x2-dG结构的核苷酸接头的酰胺键中的一者。
在核苷酸臂中具有阴离子芳香族间隔基团的其他变型单核苷酸试剂包括这样的化合物,即其包括至少一个防护元件。例如,以下所示的DISC-Split-SG1x4-dA化合物包括DISC-SG1x2-dG的DISC基团与Split-SG1x4-dG的分叉防护基团的组合。在这个特定的实例中,核苷为脱氧腺苷(“dA”)核苷。分子的其余部分(特别是分叉防护元件和双生物素基团)与Split-SG1x4-dG相同。
在含有阴离子芳香族间隔基团的核苷酸化合物中的防护结构的又一种变型中,所述至少一个防护元件可以包括具有另外的阴离子侧链的三重支化结构,例如如以下DISC-Split-SG1x6-dG中所示,从而携带6个磺酸取代的SG1侧链。
可以进一步延伸防护基团的分支,例如如以下DISC-Split-SG1x12-dG中所示,其中侧链包含另外的支化元件,使得侧链能够携带12个磺酸取代的SG1基团。已经使用已知的反应对所有上述结构进行组装,例如使用点击化学、无铜点击化学等,例如如美国专利申请公开No.2015/0050659 A1中详细描述的那样。
对本发明核苷酸化合物的进一步修饰包括将阴离于芳香族间隔基团掺入二核苷酸化合物的两个核苷酸接头元件中,例如如以下DISC2-Split-SG1x12-dG2中所示。
在接头元件和12个SG1防护基团元件两者中都含有阴离子芳香族间隔基团的另一种示例性二核苷酸化合物在下面显示为DISC2-Split-SG1x12(点击)-dG2。DISC2-Split-SG1x12(点击)-dG2与DISC2-Split-SG1x12(酰胺)-dG2的不同之处在于防护元件与核苷酸接头的偶联方式,以及接头中的中央3,4,5-三氧苯甲酰基基团的取向和连接结构。
也已在单核苷酸化合物中比较了刚刚描述的防护基团元件与核苷酸接头的备选偶联方式以及接头中的中央3,4,5-三氧苯甲酰基基团的取向和连接结构,例如如以下DISC-Split-SG1x6-dG和DISC-Split-SG1x6-dG(点击)所示。
将上文描述的核苷酸化合物组装成标记的核苷酸类似物复合物,例如如下文实施例2中所述。然后在DNA测序反应中,对这些荧光核苷酸类似物进行比较,例如如下文实施例3中所述。
实施例2.染料标记的核苷酸类似物的组装
通过将核苷酸化合物与一个或多个亲和素蛋白和一个或多个染料标记的化合物或中间体组合,将上文描述的单核苷酸化合物和二核苷酸化合物组装成染料标记的核苷酸类似物。对于实施例3中描述的大多数动力学实验,使用单个亲和素蛋白和诸如图4A中图示的染料标记的化合物之类的简单的、未防护的染料标记的化合物来组装成核苷酸化合物。可以如美国专利申请公开No.2013/0316912 A1中所述进行此类组装。例如使用图7A至图7D和图7F所示的路径,还组装了更复杂的类似物结构。如实施例3中所述,也已经在动力学测序试验中对这些类似物(如图19A中描绘的类似物)进行了评价。
实施例3.在实时测序反应中染料标记的核苷酸类似物的应用
在具有3000个离散芯的零模式波导(“ZMW”)阵列中进行单分子实时测序反应,该反应使用实施例2中描述的荧光核苷酸类似物。使用高度多路复用共聚焦荧光显微镜观察反应,所述显微镜提供定向的照射分布,例如每个芯为独立的点。参见(例如)美国专利No.7,714,303,出于所有目的将其通过全文引用并入本文。使用EMCCD照相机检测来自各种ZMW的荧光信号,并且对信号进行脉冲识别和碱基判定过程。参见(例如)美围专利No.8,182,993,出于所有目的将其通过全文引用并入本文。通常如Eid,J等Science 323:133-138以及其中包括的相应补充信息所述进行测序。
对于每个测序反应,激光功率为0.5μW/μm2至2.0μW/μm2,相机帧频为100FPS。如2009年3月27日提交的美国专利No.8,236,499所述,模板为约11000kb的环形vD“SMRTbell”模板。如2009年3月30日提交的美国专利No.8,257,954所述,固定在零模式波导中的聚合酶为突变的Φ29聚合酶。反应混合物含有Bis-Tris Propane pH 7.5缓冲液、抗氧化剂、40mM的DTT、120mM的KOAc以控制离子强度;30mM的MgOAc和4%至8%的有机溶剂添加剂。混合物还含有一组对应于A、G、C和T的核苷酸类似物,各自的量为150nM至400nM,并且各自具有独特的染料标记的化合物,其经由亲和素蛋白复合至核苷酸化合物。得到十分钟至120分钟的测序反应影像(movies)。收集关于亮度、动力学(脉冲宽度、脉冲间隔距离(IPD))、光物理学信号稳定性、测序错误类型、读取长度和精确度的数据。
如图12A的测序反应所示,相比于可比的二核苷酸结构(情况2),简单的单核苷酸类似物结构使测序反应的精确度得到大约1%的提高(情况1)。在图12B中对数据进行直接比较,其中归一化的精确度从二核苷酸的0.893(左图)提高到单核苷酸的0.904(右图)。
同时,如图13A和图13B所示,对于四种碱基中的每一种,单核苷酸试剂和二核苷酸试剂的掺入动力学没有显着差异。作为背景技术,通常将单分子实时测序反应的动力学描述为包括可观察的阶段,其通常对应于特定阶段为可观察的时间段。明亮阶段的时间段(例如)可以由信号的脉冲宽度(PW)来表示。黑暗阶段的时间段(例如)可以由信号的脉冲间隔距离(IPD)来表示。对于各核苷酸的添加而言,各时间段的长度将不相同,从而引起这些时间段的时长分布。在一些情况下,将不会检测到时长最短的时间段,从而导致误差,例如在单分子测序中。图13A示出了比较单核苷酸类似物和二核苷酸类似物对于四种碱基(A、C、G和T)中的每一种的IPD分布曲线,其中在各组的顶部指明碱基。在这些图中,x轴与检测器帧相关,1帧等于10毫秒。y轴代表经验累积分布函数(ecdf),其为无单位的值,范围从0到1,该函数描述了以帧为单位看到某一时间段的IPD的概率。
图13B提供了每种情况的归一化IPD值,其中左边为二核苷酸类似物的情况,右边为单核苷酸类似物的情况。最左侧的一对反映出全部四种碱基的累积归一化IPD值,而其后四对反映出每个指明的脱氧核糖核苷酸各自的归一化IPD值。各碱基中的二核苷酸的浓度均为200nM,并且dC中单核苷酸为250nM,而dG、dT和dA中单核苷酸为200nM。如dG的IPD分布的比较中的大箭头所示,单核苷酸略微地比二核苷酸试剂慢。
已经在单分子实时测序反应中测试了实施例1中描述的单核苷酸结构和二核苷酸结构的变型,以比较在测序反应中各种其他的结构特征对染料标记的核苷酸类似物的行为的影响。例如,图14A和图14B示出了下列类似物的掺入动力学:对照类似物(对照-SG1x4-dG2)(情况1);双层类似物(分层-SG1x4-dG)(情况2);分叉侧链类似物(Split-SG1x4-dG)(情况3);以及包含DISC阴离子芳香族间隔基的类似物(DISC-SG1x2-dG)(情况4)。
如在图14A中显而易见的,对于含有G的单核苷酸,上述核苷酸试剂的掺入动力学以这样的顺序增大:对照-SG1x4-dG2<DISC-SG1x2-dG<分层-SG1x4-dG<Split-SG1x4-dG。图14B提供了这些试剂中每种的归一化IPD值的比较。如可由这些数据计算出的,相对于对照组的加速因子为:Split-SG1x4-dG:1.82x;DISC-SG1x2-dG:1.42x;以及分层-SG1x4-dG:1.53x。
图15A至图15C示出了掺入动力学(归一化的IPD)(图15A)、总体速率(图15B)和合并误差(图15C),其针对二核苷酸对照类似物(对照-SG1x4-dG2)(情况1)、具有六个防护基团但没有阴离子芳香族间隔基的单核苷酸类似物(情况2)、具有四个防护基团和阴离子芳香族间隔基的单核苷酸类似物(情况3)以及具有六个防护基团和阴离子芳香族间隔基的单核苷酸类似物(DISC-Split-SG1x6-dG)(情况4)。在每种情况下,试剂均为dG-核苷酸类似物。
从结果中显而易见的是,使类似物中包括阴离子芳香族间隔基团(情况4vs.情况2)或者将类似物中的防护基团的数量从4增加到6(情况4vs.情况3)能够获得改进的动力学,同时使含有这些经修饰的类似物中的IPD值降低约20%。类似物中包含阴离子芳香族间隔基团也能够提高测序的总体速率和精确度。
阴离子芳香族间隔基团的性质还能够影响经修饰的核苷酸类似物在测序反应中的行为。具体而言,如图16A至图16C所示,用4,8-二磺基萘-2,6-二羧酸间隔基(参见下文)取代DISC-Split-SG1x6-dG类似物的DISC间隔基导致动力学慢大约10%(基于IPD值)但脉冲宽度稍宽。
在图16A中示出了含有四种碱基中的每一种的类似物的归一化IPD值,其针对二核苷酸对照类似物(对照-SG1x4-dG2)(情况1)、具有四个防护基团和DISC间隔基团的单核苷酸类似物(DISC-Split-SG1x4-dG)(情况2)、具有六个防护基团和DISC间隔基团的单核苷酸类似物(DISC-Split-SG1x6-dG)(情况3)以及具有六个防护基团和的DSDC间隔基团的单核苷酸类似物(情况4)。在图16B中对G-核苷酸类似物的IPD分布曲线进行了比较,而在图16C中对G-核苷酸类似物的归一化的脉冲宽度进行了比较。
例如,如以上在结构DISC-Split-SG1x12-dG中所示,可以进一步增加防护元件中侧链的数量,以及由此而来的核苷酸邻近的电荷。如图17A和图17B所示,在不同浓度下对单分子实时测序反应中含有该结构的类似物的动力学进行了分析。在这些试验中,在100nM(情况1)、150nM(情况2)或200nM(情况3)下对DISC-Split-SG1x12-dG类似物进行测量,并与200nM下(情况4)的DISC-Split-SG1x6-dG和200nM下的对照-SG1x4-dG2(情况5)进行比较。在图17A中对这些类似物的IPD分布曲线和试验情况进行了比较,而在图17B中对G-核苷酸类似物的归一化IPD值进行了比较。这些数据表明,使侧链的电荷加倍不会引起IPD的明显促进。
另外已经将阴离子芳香族间隔基团掺入两种二核苷酸类似物的两个接头基团中。具体而言,如上所示的DISC2-Split-SG1x12(酰胺)-dG2和DISC2-Split-SG1x12(点击)-dG2两者在两个接头臂的每一个中均含有DISC阴离子芳香族间隔基团。已将含有这些结构的类似物与可比的三重SG单核苷酸类似物DISC-Split-SG1x6-dG(其在核苷酸接头中也包含DISC阴离子芳香族间隔基团)进行比较。还将含有这些结构的类似物与二核苷酸类似物对照-SG1x4-dG2(其在核苷酸接头中缺少阴离子芳香族间隔基团)进行比较。如图18所示,相比于非DISC二核苷酸类似物,两种含有DISC的二核苷酸类似物DISC2-Split-SG1x12(酰胺)-dG2(情况1)和DISC2-Split-SG1x12(点击)-dG2(情况2)没有显示出有效不同的动力学,其中一个显示出略微较短的IPD值,而另一个显示出略微较长的IPD值。如先前所见,含有DISC的单核苷酸类似物DISC-Split-SG1x6-dG(情况3)显示出比任意二核苷酸类似物略微较慢的动力学。
图19A示出了一些另外的含有两种亲和素的标记的核苷酸类似物结构,其使用上述核苷酸化合物和染料标记的化合物组装而成。具体而言,SG1x2-dT_4类似物包含二核苷酸结构,其中每个防护元件仅具有两个侧链且不含阴离子芳香族间隔元件。DISC-Split-SG1x6-dT_2类似物包含单核苷酸结构,其中每个防护元件具有6个侧链,并且在核苷酸接头中具有DISC阴离子芳香族间隔元件。DISC-Split-SG1x6-dT_4为该结构的二核苷酸变型,其每个防护元件具有六个侧链,并且具有DISC阴离子芳香族间隔元件。图19B和图19C示出了相比于在250nM下(情况1)包含具有两个侧链且缺少阴离子芳香族间隔元件的二核苷酸结构的类似物SG1x2-dT_4以及在250nM下(情况2)包含具有六个侧链和DISC阴离子芳香族间隔元件的单核苷酸结构的类似物DISC-Split-SG1x6-dT_2,在100nM(情况3)、150nM(情况4)和250nM(情况5)的浓度下,包含DISC-Split-SG1x6-dT_4二核苷酸变型的类似物的归一化IPD值和聚合速率。由这些数据显而易见的是,除了提高的精确度之外,具有防护元件和阴离子芳香族间隔元件这两者作为亲合力调节元件的单核苷酸化合物具有与包含这些元件的二核苷酸化合物相当的动力学。
本文提到的所有专利、专利出版物和其他公开的参考文献在此通过全文引用并入本文,如同其已经单独地并且特别地通过引用并入本文。
虽然已经提供了具体示例,但是以上描述为说明性的而非限制性的。先前描述的实施方案的特征的任意一者或多者可以以任意的方式与本发明中的任意其他实施方案的特征的一者或多者进行组合。此外,在阅读说明书后,本发明的许多变化对于本领域技术人员而言将变得显而易见。因此,应该通过参考所附的权利要求以及它们的等同物的全部范围来确定本发明的范围。
序列表
<110> 加利福尼亚太平洋生物科学股份有限公司
<120> 标记的核苷酸类似物、反应混合物以及测序方法和系统
<130> 1407-00-014WO1
<150> US 62/258,416
<151> 2015-11-20
<160> 26
<170> PatentIn version 3.5
<210> 1
<211> 575
<212> PRT
<213> 噬菌体Φ-29(Bacteriophage phi-29)
<400> 1
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys
565 570 575
<210> 2
<211> 572
<212> PRT
<213> 噬菌体 M2Y(Bacteriophage M2Y)
<400> 2
Met Ser Arg Lys Met Phe Ser Cys Asp Phe Glu Thr Thr Thr Lys Leu
1 5 10 15
Asp Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Glu Ile Gly Asn Leu
20 25 30
Asp Asn Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met Gln Trp Val
35 40 45
Met Glu Ile Gln Ala Asp Leu Tyr Phe His Asn Leu Lys Phe Asp Gly
50 55 60
Ala Phe Ile Val Asn Trp Leu Glu Gln His Gly Phe Lys Trp Ser Asn
65 70 75 80
Glu Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Lys Met Gly Gln
85 90 95
Trp Tyr Met Ile Asp Ile Cys Phe Gly Tyr Lys Gly Lys Arg Lys Leu
100 105 110
His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe Pro Val Lys
115 120 125
Lys Ile Ala Lys Asp Phe Gln Leu Pro Leu Leu Lys Gly Asp Ile Asp
130 135 140
Tyr His Thr Glu Arg Pro Val Gly His Glu Ile Thr Pro Glu Glu Tyr
145 150 155 160
Glu Tyr Ile Lys Asn Asp Ile Glu Ile Ile Ala Arg Ala Leu Asp Ile
165 170 175
Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser Asp Ser Leu
180 185 190
Lys Gly Phe Lys Asp Ile Leu Ser Thr Lys Lys Phe Asn Lys Val Phe
195 200 205
Pro Lys Leu Ser Leu Pro Met Asp Lys Glu Ile Arg Lys Ala Tyr Arg
210 215 220
Gly Gly Phe Thr Trp Leu Asn Asp Lys Tyr Lys Glu Lys Glu Ile Gly
225 230 235 240
Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ser Gln Met Tyr
245 250 255
Ser Arg Pro Leu Pro Tyr Gly Ala Pro Ile Val Phe Gln Gly Lys Tyr
260 265 270
Glu Lys Asp Glu Gln Tyr Pro Leu Tyr Ile Gln Arg Ile Arg Phe Glu
275 280 285
Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile Lys Lys Asn
290 295 300
Pro Phe Phe Lys Gly Asn Glu Tyr Leu Lys Asn Ser Gly Val Glu Pro
305 310 315 320
Val Glu Leu Tyr Leu Thr Asn Val Asp Leu Glu Leu Ile Gln Glu His
325 330 335
Tyr Glu Leu Tyr Asn Val Glu Tyr Ile Asp Gly Phe Lys Phe Arg Glu
340 345 350
Lys Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr Tyr Val Lys
355 360 365
Thr His Glu Glu Gly Ala Lys Lys Gln Leu Ala Lys Leu Met Leu Asn
370 375 380
Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr Gly Lys Val
385 390 395 400
Pro Tyr Leu Lys Asp Asp Gly Ser Leu Gly Phe Arg Val Gly Asp Glu
405 410 415
Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe Ile Thr Ala
420 425 430
Trp Ala Arg Phe Thr Thr Ile Thr Ala Ala Gln Ala Cys Tyr Asp Arg
435 440 445
Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly Thr Glu Val
450 455 460
Pro Glu Ile Ile Lys Asp Ile Val Asp Pro Lys Lys Leu Gly Tyr Trp
465 470 475 480
Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg Gln Lys Thr
485 490 495
Tyr Ile Gln Asp Ile Tyr Val Lys Glu Val Asp Gly Lys Leu Lys Glu
500 505 510
Cys Ser Pro Asp Glu Ala Thr Thr Thr Lys Phe Ser Val Lys Cys Ala
515 520 525
Gly Met Thr Asp Thr Ile Lys Lys Lys Val Thr Phe Asp Asn Phe Ala
530 535 540
Val Gly Phe Ser Ser Met Gly Lys Pro Lys Pro Val Gln Val Asn Gly
545 550 555 560
Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570
<210> 3
<211> 572
<212> PRT
<213> 噬菌体 B103(Bacteriophage B103)
<400> 3
Met Pro Arg Lys Met Phe Ser Cys Asp Phe Glu Thr Thr Thr Lys Leu
1 5 10 15
Asp Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Glu Ile Gly Asn Leu
20 25 30
Asp Asn Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met Gln Trp Val
35 40 45
Met Glu Ile Gln Ala Asp Leu Tyr Phe His Asn Leu Lys Phe Asp Gly
50 55 60
Ala Phe Ile Val Asn Trp Leu Glu His His Gly Phe Lys Trp Ser Asn
65 70 75 80
Glu Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Lys Met Gly Gln
85 90 95
Trp Tyr Met Ile Asp Ile Cys Phe Gly Tyr Lys Gly Lys Arg Lys Leu
100 105 110
His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe Pro Val Lys
115 120 125
Lys Ile Ala Lys Asp Phe Gln Leu Pro Leu Leu Lys Gly Asp Ile Asp
130 135 140
Tyr His Ala Glu Arg Pro Val Gly His Glu Ile Thr Pro Glu Glu Tyr
145 150 155 160
Glu Tyr Ile Lys Asn Asp Ile Glu Ile Ile Ala Arg Ala Leu Asp Ile
165 170 175
Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser Asp Ser Leu
180 185 190
Lys Gly Phe Lys Asp Ile Leu Ser Thr Lys Lys Phe Asn Lys Val Phe
195 200 205
Pro Lys Leu Ser Leu Pro Met Asp Lys Glu Ile Arg Arg Ala Tyr Arg
210 215 220
Gly Gly Phe Thr Trp Leu Asn Asp Lys Tyr Lys Glu Lys Glu Ile Gly
225 230 235 240
Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ser Gln Met Tyr
245 250 255
Ser Arg Pro Leu Pro Tyr Gly Ala Pro Ile Val Phe Gln Gly Lys Tyr
260 265 270
Glu Lys Asp Glu Gln Tyr Pro Leu Tyr Ile Gln Arg Ile Arg Phe Glu
275 280 285
Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile Lys Lys Asn
290 295 300
Pro Phe Phe Lys Gly Asn Glu Tyr Leu Lys Asn Ser Gly Ala Glu Pro
305 310 315 320
Val Glu Leu Tyr Leu Thr Asn Val Asp Leu Glu Leu Ile Gln Glu His
325 330 335
Tyr Glu Met Tyr Asn Val Glu Tyr Ile Asp Gly Phe Lys Phe Arg Glu
340 345 350
Lys Thr Gly Leu Phe Lys Glu Phe Ile Asp Lys Trp Thr Tyr Val Lys
355 360 365
Thr His Glu Lys Gly Ala Lys Lys Gln Leu Ala Lys Leu Met Phe Asp
370 375 380
Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr Gly Lys Val
385 390 395 400
Pro Tyr Leu Lys Glu Asp Gly Ser Leu Gly Phe Arg Val Gly Asp Glu
405 410 415
Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe Ile Thr Ala
420 425 430
Trp Ala Arg Phe Thr Thr Ile Thr Ala Ala Gln Ala Cys Tyr Asp Arg
435 440 445
Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly Thr Glu Val
450 455 460
Pro Glu Ile Ile Lys Asp Ile Val Asp Pro Lys Lys Leu Gly Tyr Trp
465 470 475 480
Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg Gln Lys Thr
485 490 495
Tyr Ile Gln Asp Ile Tyr Ala Lys Glu Val Asp Gly Lys Leu Ile Glu
500 505 510
Cys Ser Pro Asp Glu Ala Thr Thr Thr Lys Phe Ser Val Lys Cys Ala
515 520 525
Gly Met Thr Asp Thr Ile Lys Lys Lys Val Thr Phe Asp Asn Phe Arg
530 535 540
Val Gly Phe Ser Ser Thr Gly Lys Pro Lys Pro Val Gln Val Asn Gly
545 550 555 560
Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570
<210> 4
<211> 578
<212> PRT
<213> 噬菌体 GA-1(Bacteriophage GA-1)
<400> 4
Met Ala Arg Ser Val Tyr Val Cys Asp Phe Glu Thr Thr Thr Asp Pro
1 5 10 15
Glu Asp Cys Arg Leu Trp Ala Trp Gly Trp Met Asp Ile Tyr Asn Thr
20 25 30
Asp Lys Trp Ser Tyr Gly Glu Asp Ile Asp Ser Phe Met Glu Trp Ala
35 40 45
Leu Asn Ser Asn Ser Asp Ile Tyr Phe His Asn Leu Lys Phe Asp Gly
50 55 60
Ser Phe Ile Leu Pro Trp Trp Leu Arg Asn Gly Tyr Val His Thr Glu
65 70 75 80
Glu Asp Arg Thr Asn Thr Pro Lys Glu Phe Thr Thr Thr Ile Ser Gly
85 90 95
Met Gly Gln Trp Tyr Ala Val Asp Val Cys Ile Asn Thr Arg Gly Lys
100 105 110
Asn Lys Asn His Val Val Phe Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Lys Val Glu Gln Ile Ala Lys Gly Phe Gly Leu Pro Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr Lys Lys Tyr Arg Pro Val Gly Tyr Val Met Asp Asp
145 150 155 160
Asn Glu Ile Glu Tyr Leu Lys His Asp Leu Leu Ile Val Ala Leu Ala
165 170 175
Leu Arg Ser Met Phe Asp Asn Asp Phe Thr Ser Met Thr Val Gly Ser
180 185 190
Asp Ala Leu Asn Thr Tyr Lys Glu Met Leu Gly Val Lys Gln Trp Glu
195 200 205
Lys Tyr Phe Pro Val Leu Ser Leu Lys Val Asn Ser Glu Ile Arg Lys
210 215 220
Ala Tyr Lys Gly Gly Phe Thr Trp Val Asn Pro Lys Tyr Gln Gly Glu
225 230 235 240
Thr Val Tyr Gly Gly Met Val Phe Asp Val Asn Ser Met Tyr Pro Ala
245 250 255
Met Met Lys Asn Lys Leu Leu Pro Tyr Gly Glu Pro Val Met Phe Lys
260 265 270
Gly Glu Tyr Lys Lys Asn Val Glu Tyr Pro Leu Tyr Ile Gln Gln Val
275 280 285
Arg Cys Phe Phe Glu Leu Lys Lys Asp Lys Ile Pro Cys Ile Gln Ile
290 295 300
Lys Gly Asn Ala Arg Phe Gly Gln Asn Glu Tyr Leu Ser Thr Ser Gly
305 310 315 320
Asp Glu Tyr Val Asp Leu Tyr Val Thr Asn Val Asp Trp Glu Leu Ile
325 330 335
Lys Lys His Tyr Asp Ile Phe Glu Glu Glu Phe Ile Gly Gly Phe Met
340 345 350
Phe Lys Gly Phe Ile Gly Phe Phe Asp Glu Tyr Ile Asp Arg Phe Met
355 360 365
Glu Ile Lys Asn Ser Pro Asp Ser Ser Ala Glu Gln Ser Leu Gln Ala
370 375 380
Lys Leu Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Thr Asn Pro Asp
385 390 395 400
Ile Thr Gly Lys Val Pro Tyr Leu Asp Glu Asn Gly Val Leu Lys Phe
405 410 415
Arg Lys Gly Glu Leu Lys Glu Arg Asp Pro Val Tyr Thr Pro Met Gly
420 425 430
Cys Phe Ile Thr Ala Tyr Ala Arg Glu Asn Ile Leu Ser Asn Ala Gln
435 440 445
Lys Leu Tyr Pro Arg Phe Ile Tyr Ala Asp Thr Asp Ser Ile His Val
450 455 460
Glu Gly Leu Gly Glu Val Asp Ala Ile Lys Asp Val Ile Asp Pro Lys
465 470 475 480
Lys Leu Gly Tyr Trp Asp His Glu Ala Thr Phe Gln Arg Ala Arg Tyr
485 490 495
Val Arg Gln Lys Thr Tyr Phe Ile Glu Thr Thr Trp Lys Glu Asn Asp
500 505 510
Lys Gly Lys Leu Val Val Cys Glu Pro Gln Asp Ala Thr Lys Val Lys
515 520 525
Pro Lys Ile Ala Cys Ala Gly Met Ser Asp Ala Ile Lys Glu Arg Ile
530 535 540
Arg Phe Asn Glu Phe Lys Ile Gly Tyr Ser Thr His Gly Ser Leu Lys
545 550 555 560
Pro Lys Asn Val Leu Gly Gly Val Val Leu Met Asp Tyr Pro Phe Ala
565 570 575
Ile Lys
<210> 5
<211> 566
<212> PRT
<213> 噬菌体 AV-1(Bacteriophage AV-1)
<400> 5
Met Val Arg Gln Ser Thr Ile Ala Ser Pro Ala Arg Gly Gly Val Arg
1 5 10 15
Arg Ser His Lys Lys Val Pro Ser Phe Cys Ala Asp Phe Glu Thr Thr
20 25 30
Thr Asp Glu Asp Asp Cys Arg Val Trp Ser Trp Gly Ile Ile Gln Val
35 40 45
Gly Lys Leu Gln Asn Tyr Val Asp Gly Ile Ser Leu Asp Gly Phe Met
50 55 60
Ser His Ile Ser Glu Arg Ala Ser His Ile Tyr Phe His Asn Leu Ala
65 70 75 80
Phe Asp Gly Thr Phe Ile Leu Asp Trp Leu Leu Lys His Gly Tyr Arg
85 90 95
Trp Thr Lys Glu Asn Pro Gly Val Lys Glu Phe Thr Ser Leu Ile Ser
100 105 110
Arg Met Gly Lys Tyr Tyr Ser Ile Thr Val Val Phe Glu Thr Gly Phe
115 120 125
Arg Val Glu Phe Arg Asp Ser Phe Lys Lys Leu Pro Met Ser Val Ser
130 135 140
Ala Ile Ala Lys Ala Phe Asn Leu His Asp Gln Lys Leu Glu Ile Asp
145 150 155 160
Tyr Glu Lys Pro Arg Pro Ile Gly Tyr Ile Pro Thr Glu Gln Glu Lys
165 170 175
Arg Tyr Gln Arg Asn Asp Val Ala Ile Val Ala Gln Ala Leu Glu Val
180 185 190
Gln Phe Ala Glu Lys Met Thr Lys Leu Thr Ala Gly Ser Asp Ser Leu
195 200 205
Ala Thr Tyr Lys Lys Met Thr Gly Lys Leu Phe Ile Arg Arg Phe Pro
210 215 220
Ile Leu Ser Pro Glu Ile Asp Thr Glu Ile Arg Lys Ala Tyr Arg Gly
225 230 235 240
Gly Phe Thr Tyr Ala Asp Pro Arg Tyr Ala Lys Lys Leu Asn Gly Lys
245 250 255
Gly Ser Val Tyr Asp Val Asn Ser Leu Tyr Pro Ser Val Met Arg Thr
260 265 270
Ala Leu Leu Pro Tyr Gly Glu Pro Ile Tyr Ser Glu Gly Ala Pro Arg
275 280 285
Thr Asn Arg Pro Leu Tyr Ile Ala Ser Ile Thr Phe Thr Ala Lys Leu
290 295 300
Lys Pro Asn His Ile Pro Cys Ile Gln Ile Lys Lys Asn Leu Ser Phe
305 310 315 320
Asn Pro Thr Gln Tyr Leu Glu Glu Val Lys Glu Pro Thr Thr Val Val
325 330 335
Ala Thr Asn Ile Asp Ile Glu Leu Trp Lys Lys His Tyr Asp Phe Lys
340 345 350
Ile Tyr Ser Trp Asn Gly Thr Phe Glu Phe Arg Gly Ser His Gly Phe
355 360 365
Phe Asp Thr Tyr Val Asp His Phe Met Glu Ile Lys Lys Asn Ser Thr
370 375 380
Gly Gly Leu Arg Gln Ile Ala Lys Leu His Leu Asn Ser Leu Tyr Gly
385 390 395 400
Lys Phe Ala Thr Asn Pro Asp Ile Thr Gly Lys His Pro Thr Leu Lys
405 410 415
Asp Asn Arg Val Ser Leu Val Met Asn Glu Pro Glu Thr Arg Asp Pro
420 425 430
Val Tyr Thr Pro Met Gly Val Phe Ile Thr Ala Tyr Ala Arg Lys Lys
435 440 445
Thr Ile Ser Ala Ala Gln Asp Asn Tyr Glu Thr Phe Ala Tyr Ala Asp
450 455 460
Thr Asp Ser Leu His Leu Ile Gly Pro Thr Thr Pro Pro Asp Ser Leu
465 470 475 480
Trp Val Asp Pro Val Glu Leu Gly Ala Trp Lys His Glu Ser Ser Phe
485 490 495
Thr Lys Ser Val Tyr Ile Arg Ala Lys Gln Tyr Ala Glu Glu Ile Gly
500 505 510
Gly Lys Leu Asp Val His Ile Ala Gly Met Pro Arg Asn Val Ala Ala
515 520 525
Thr Leu Thr Leu Glu Asp Met Leu His Gly Gly Thr Trp Asn Gly Lys
530 535 540
Leu Ile Pro Val Arg Val Pro Gly Gly Thr Val Leu Lys Asp Thr Thr
545 550 555 560
Phe Thr Leu Lys Ile Asp
565
<210> 6
<211> 568
<212> PRT
<213> 噬菌体 CP-1(Bacteriophage CP-1)
<400> 6
Met Thr Cys Tyr Tyr Ala Gly Asp Phe Glu Thr Thr Thr Asn Glu Glu
1 5 10 15
Glu Thr Glu Val Trp Leu Ser Cys Phe Ala Lys Val Ile Asp Tyr Asp
20 25 30
Lys Leu Asp Thr Phe Lys Val Asn Thr Ser Leu Glu Asp Phe Leu Lys
35 40 45
Ser Leu Tyr Leu Asp Leu Asp Lys Thr Tyr Thr Glu Thr Gly Glu Asp
50 55 60
Glu Phe Ile Ile Phe Phe His Asn Leu Lys Phe Asp Gly Ser Phe Leu
65 70 75 80
Leu Ser Phe Phe Leu Asn Asn Asp Ile Glu Cys Thr Tyr Phe Ile Asn
85 90 95
Asp Met Gly Val Trp Tyr Ser Ile Thr Leu Glu Phe Pro Asp Phe Thr
100 105 110
Leu Thr Phe Arg Asp Ser Leu Lys Ile Leu Asn Phe Ser Ile Ala Thr
115 120 125
Met Ala Gly Leu Phe Lys Met Pro Ile Ala Lys Gly Thr Thr Pro Leu
130 135 140
Leu Lys His Lys Pro Glu Val Ile Lys Pro Glu Trp Ile Asp Tyr Ile
145 150 155 160
His Val Asp Val Ala Ile Leu Ala Arg Gly Ile Phe Ala Met Tyr Tyr
165 170 175
Glu Glu Asn Phe Thr Lys Tyr Thr Ser Ala Ser Glu Ala Leu Thr Glu
180 185 190
Phe Lys Arg Ile Phe Arg Lys Ser Lys Arg Lys Phe Arg Asp Phe Phe
195 200 205
Pro Ile Leu Asp Glu Lys Val Asp Asp Phe Cys Arg Lys His Ile Val
210 215 220
Gly Ala Gly Arg Leu Pro Thr Leu Lys His Arg Gly Arg Thr Leu Asn
225 230 235 240
Gln Leu Ile Asp Ile Tyr Asp Ile Asn Ser Met Tyr Pro Ala Thr Met
245 250 255
Leu Gln Asn Ala Leu Pro Ile Gly Ile Pro Lys Arg Tyr Lys Gly Lys
260 265 270
Pro Lys Glu Ile Lys Glu Asp His Tyr Tyr Ile Tyr His Ile Lys Ala
275 280 285
Asp Phe Asp Leu Lys Arg Gly Tyr Leu Pro Thr Ile Gln Ile Lys Lys
290 295 300
Lys Leu Asp Ala Leu Arg Ile Gly Val Arg Thr Ser Asp Tyr Val Thr
305 310 315 320
Thr Ser Lys Asn Glu Val Ile Asp Leu Tyr Leu Thr Asn Phe Asp Leu
325 330 335
Asp Leu Phe Leu Lys His Tyr Asp Ala Thr Ile Met Tyr Val Glu Thr
340 345 350
Leu Glu Phe Gln Thr Glu Ser Asp Leu Phe Asp Asp Tyr Ile Thr Thr
355 360 365
Tyr Arg Tyr Lys Lys Glu Asn Ala Gln Ser Pro Ala Glu Lys Gln Lys
370 375 380
Ala Lys Ile Met Leu Asn Ser Leu Tyr Gly Lys Phe Gly Ala Lys Ile
385 390 395 400
Ile Ser Val Lys Lys Leu Ala Tyr Leu Asp Asp Lys Gly Ile Leu Arg
405 410 415
Phe Lys Asn Asp Asp Glu Glu Glu Val Gln Pro Val Tyr Ala Pro Val
420 425 430
Ala Leu Phe Val Thr Ser Ile Ala Arg His Phe Ile Ile Ser Asn Ala
435 440 445
Gln Glu Asn Tyr Asp Asn Phe Leu Tyr Ala Asp Thr Asp Ser Leu His
450 455 460
Leu Phe His Ser Asp Ser Leu Val Leu Asp Ile Asp Pro Ser Glu Phe
465 470 475 480
Gly Lys Trp Ala His Glu Gly Arg Ala Val Lys Ala Lys Tyr Leu Arg
485 490 495
Ser Lys Leu Tyr Ile Glu Glu Leu Ile Gln Glu Asp Gly Thr Thr His
500 505 510
Leu Asp Val Lys Gly Ala Gly Met Thr Pro Glu Ile Lys Glu Lys Ile
515 520 525
Thr Phe Glu Asn Phe Val Ile Gly Ala Thr Phe Glu Gly Lys Arg Ala
530 535 540
Ser Lys Gln Ile Lys Gly Gly Thr Leu Ile Tyr Glu Thr Thr Phe Lys
545 550 555 560
Ile Arg Glu Thr Asp Tyr Leu Val
565
<210> 7
<211> 650
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 7
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Arg Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Phe
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
Gly Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Gly Ser Gly Gly Gly
580 585 590
Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile
595 600 605
Glu Trp His Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
610 615 620
Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile Glu Trp His Glu Gly
625 630 635 640
His His His His His His His His His His
645 650
<210> 8
<211> 640
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 8
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Arg Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Ile Ile Thr Ala Ala Gln Ala Val
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Gln Val Arg Gly His
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
His His His His His His His His His His Gly Gly Gly Ser Gly Gly
580 585 590
Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys
595 600 605
Ile Glu Trp His Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly
610 615 620
Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile Glu Trp His Glu
625 630 635 640
<210> 9
<211> 650
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 9
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ser Arg Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Phe Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Phe
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
Gly Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Gly Ser Gly Gly Gly
580 585 590
Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile
595 600 605
Glu Trp His Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
610 615 620
Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile Glu Trp His Glu Gly
625 630 635 640
His His His His His His His His His His
645 650
<210> 10
<211> 640
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 10
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Lys Gly Phe
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe
580 585 590
Phe Glu Ala Gln Lys Ile Glu Trp His Glu Gly Gly Gly Ser Gly Gly
595 600 605
Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys
610 615 620
Ile Glu Trp His Glu Gly His His His His His His His His His His
625 630 635 640
<210> 11
<211> 640
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 11
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe
580 585 590
Phe Glu Ala Gln Lys Ile Glu Trp His Glu Gly Gly Gly Ser Gly Gly
595 600 605
Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys
610 615 620
Ile Glu Trp His Glu Gly His His His His His His His His His His
625 630 635 640
<210> 12
<211> 640
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 12
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Arg Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly His
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
His His His His His His His His His His Gly Gly Gly Ser Gly Gly
580 585 590
Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys
595 600 605
Ile Glu Trp His Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly
610 615 620
Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile Glu Trp His Glu
625 630 635 640
<210> 13
<211> 650
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 13
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Phe Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
Gly Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Gly Ser Gly Gly Gly
580 585 590
Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile
595 600 605
Glu Trp His Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
610 615 620
Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile Glu Trp His Glu Gly
625 630 635 640
His His His His His His His His His His
645 650
<210> 14
<211> 640
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 14
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
His His His His His His His His His His Gly Gly Gly Ser Gly Gly
580 585 590
Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys
595 600 605
Ile Glu Trp His Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly
610 615 620
Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile Glu Trp His Glu
625 630 635 640
<210> 15
<211> 640
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 15
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe
580 585 590
Phe Glu Ala Gln Lys Ile Glu Trp His Glu Gly Gly Gly Ser Gly Gly
595 600 605
Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys
610 615 620
Ile Glu Trp His Glu Gly His His His His His His His His His His
625 630 635 640
<210> 16
<211> 640
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 16
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys Gly
565 570 575
His His His His His His His His His His Gly Gly Gly Ser Gly Gly
580 585 590
Gly Ser Gly Gly Gly Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys
595 600 605
Ile Glu Trp His Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly
610 615 620
Ser Gly Leu Asn Asp Phe Phe Glu Ala Gln Lys Ile Glu Trp His Glu
625 630 635 640
<210> 17
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 17
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Arg Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Phe
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 18
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 18
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Arg Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Ile Ile Thr Ala Ala Gln Ala Val
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Gln Val Arg Gly His
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 19
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 19
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ser Arg Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Phe Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Phe
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 20
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 20
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Lys Gly Phe
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 21
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 21
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 22
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 22
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Arg Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Trp Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly His
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 23
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 23
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Ser Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Phe Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 24
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 24
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Lys Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Val Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Tyr Gly Arg Trp Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 25
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 25
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
<210> 26
<211> 575
<212> PRT
<213> 人工(Artificial)
<220>
<223> 突变重组的Φ29-型 DNA聚合酶
<400> 26
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Asp Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ser Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Gln Asp Phe Lys Leu Thr Val Lys Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Lys
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Gly Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Ile Asn Ser Ala Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Gln Ser Leu Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Ser
355 360 365
Tyr Ile Lys Thr Thr Ser Tyr Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Tyr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Gly Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Lys Ile Pro Asp Val Ile Lys Asp Ile Val His Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Glu His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Arg Val Arg Gly Tyr
500 505 510
Leu Val Gln Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Glu Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Ala Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Ser Val Phe Thr Ile Lys
565 570 575
Claims (187)
1.一种标记的核苷酸类似物,其包含:
第一亲和素蛋白,其具有四个亚基,各亚基包含一个生物素结合位点;
第一核苷酸化合物,其结合至所述第一亲和素蛋白,所述第一核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件,其中所述第一核苷酸化合物包含至少一个亲合力调节元件;以及
第一染料标记的化合物,其结合至所述第一亲和素蛋白,所述第一染料标记的化合物包含供体染料、受体染料、末端偶联元件和染料化合物接头元件。
2.根据权利要求1所述的标记的核苷酸类似物,其中所述第一染料标记的化合物和所述第一核苷酸化合物各自通过生物素部分结合至所述第一亲和素蛋白。
3.根据权利要求1所述的标记的核苷酸类似物,其还包含第二亲和素蛋白和第二核苷酸化合物,其中
所述第二亲和素蛋白通过生物素部分结合至所述第一染料标记的化合物,并且所述第二亲和素蛋白通过生物素部分结合至所述第二核苷酸化合物。
4.根据权利要求1所述的标记的核苷酸类似物,其中所述第一亲和素蛋白为亲和素、链霉亲和素、蘑菇亲和素、链霉亲和素突变体、热带爪蟾亲和素、慢生大豆根瘤菌亲和素、AVR2、AVR4或它们的同源物。
5.根据权利要求1所述的标记的核苷酸类似物,其中所述供体染料和所述受体染料为荧光染料。
6.根据权利要求1所述的标记的核苷酸类似物,其中所述第一核苷酸化合物由结构式(I)表示:
其中
L为所述核苷酸接头元件,并且其包括所述亲合力调节元件;
P为所述多磷酸酯元件;
Nu为所述核苷元件;
X为所述多价中央核心元件;
B”为所述末端偶联元件,并且其包括生物素部分;
n为1至4的整数;并且
o为0或1。
7.根据权利要求6所述的标记的核苷酸类似物,其中所述亲合力调节元件为芳香族间隔元件或防护元件。
8.根据权利要求7所述的标记的核苷酸类似物,其中所述亲合力调节元件为芳香族间隔元件。
9.根据权利要求8所述的标记的核苷酸类似物,其中所述芳香族间隔元件为取代的或未取代的单环、双环或三环芳香族部分。
10.根据权利要求9所述的标记的核苷酸类似物,其中所述芳香族间隔元件由结构式(II)表示:
其中
A环和B环各自独立地为5个至7个原子的环状结构,其中A环或B环的至少一者为芳香族;并且
A环或B环任选地包含至少一个阴离子取代基。
11.根据权利要求10所述的标记的核苷酸类似物,其中任选的至少一个阴离子取代基为-SO3H。
12.根据权利要求10所述的标记的核苷酸类似物,其中所述芳香族间隔元件由结构式(IIA)或(IIB)表示:
其中
A1、A2、A3和A4基团中的一者为并且其他基团为-CH2-或键;并且
R1为H或阴离子取代基并且R2为H或阴离子取代基。
13.根据权利要求12所述的标记的核苷酸类似物,其中所述阴离子取代基为-SO3H。
14.根据权利要求12所述的标记的核苷酸类似物,其中所述芳香族间隔元件由结构式(IIC)或(IIC’)表示:
15.根据权利要求12所述的标记的核苷酸类似物,其中所述芳香族间隔元件由下列结构式中的一者表示:
16.根据权利要求8所述的标记的核苷酸类似物,其中L还包含烷基接头基团,其任选地包含酰胺键。
17.根据权利要求8所述的标记的核苷酸类似物,其中L还包含三唑。
18.根据权利要求8所述的标记的核苷酸类似物,其中B”包含生物素部分。
19.根据权利要求18所述的标记的核苷酸类似物,其中B”包含双生物素部分。
20.根据权利要求8所述的标记的核苷酸类似物,其中o为1。
21.根据权利要求20所述的标记的核苷酸类似物,其中n为2。
22.根据权利要求20所述的标记的核苷酸类似物,其中X包含多胺部分。
23.根据权利要求8所述的标记的核苷酸类似物,其中o为0并且n为1。
24.根据权利要求8所述的标记的核苷酸类似物,其中所述至少一个核苷酸化合物不包含染料。
25.根据权利要求8至24中任一项所述的标记的核苷酸类似物,其中L包含至少一个防护元件。
26.根据权利要求7所述的标记的核苷酸类似物,其中所述亲合力调节元件为防护元件。
27.根据权利要求7所述的标记的核苷酸类似物,其中所述防护元件包含多个侧链。
28.根据权利要求27所述的标记的核苷酸类似物,其中至少一个侧链的分子量为至少300。
29.根据权利要求27所述的标记的核苷酸类似物,其中全部侧链的分子量都为至少300。
30.根据权利要求27所述的标记的核苷酸类似物,其中至少一个侧链包含带负电荷的组分。
31.根据权利要求30所述的标记的核苷酸类似物,其中所述带负电荷的组分包含磺酸。
32.根据权利要求27所述的标记的核苷酸类似物,其中至少一个侧链包含取代的苯基。
33.根据权利要求32所述的标记的核苷酸类似物,其中所述至少一个侧链包含下列结构:
其中各x独立地为1至6的整数。
34.根据权利要求33所述的标记的核苷酸类似物,其中各x独立地为1至4的整数。
35.根据权利要求27所述的标记的核苷酸类似物,其中至少一个侧链包含三唑。
36.根据权利要求27所述的标记的核苷酸类似物,其中至少一个侧链包含下列结构:
37.根据权利要求26所述的标记的核苷酸类似物,其中所述防护元件包含下列结构:
其中各y独立地为1至6的整数。
38.根据权利要求26所述的标记的核苷酸类似物,其中L还包含下列结构:
39.根据权利要求26所述的标记的核苷酸类似物,其中L还包含烷基接头基团,其任选地包含酰胺键。
40.根据权利要求26所述的标记的核苷酸类似物,其中L还包含三唑。
41.根据权利要求26所述的标记的核苷酸类似物,其中B”包含生物素部分。
42.根据权利要求41所述的标记的核苷酸类似物,其中B”包含双生物素部分。
43.根据权利要求26所述的标记的核苷酸类似物,其中o为1。
44.根据权利要求43所述的标记的核苷酸类似物,其中n为2。
45.根据权利要求43所述的标记的核苷酸类似物,其中X包含多胺部分。
46.根据权利要求26所述的标记的核苷酸类似物,其中o为0并且n为1。
47.根据权利要求26所述的标记的核苷酸类似物,其中所述至少一个核苷酸化合物不包含染料。
48.根据权利要求26至47中任一项所述的标记的核苷酸类似物,其中L还包含芳香族间隔元件。
49.一种标记的核苷酸类似物,其包含:
第一亲和素蛋白、第二亲和素蛋白和第三亲和素蛋白,各亲和素蛋白具有四个亚基,并且各亚基包含一个生物素结合位点;
第一核苷酸化合物和第二核苷酸化合物,各核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件,其中所述第一核苷酸化合物或所述第二核苷酸化合物包含至少一个亲合力调节元件;以及
第一染料标记的化合物和第二染料标记的化合物,各染料标记的化合物包含供体染料、受体染料、末端偶联元件和染料化合物接头元件,
其中所述第一亲和素蛋白结合至所述第一核苷酸化合物并结合至所述第一染料标记的化合物,所述第二亲和素蛋白结合至所述第一染料标记的化合物并结合至所述第二染料标记的化合物,并且所述第三亲和素蛋白结合至所述第二染料标记的化合物并结合至所述第二核苷酸化合物。
50.根据权利要求49所述的标记的核苷酸类似物,其中所述第一染料标记的化合物和第二染料标记的化合物以及所述第一核苷酸化合物和第二核苷酸化合物各自通过生物素部分结合至所述第一亲和素蛋白、第二亲和素蛋白和第三亲和素蛋白。
51.一种标记的核苷酸类似物,其包含:
第一亲和素蛋白,其具有四个亚基,各亚基包含一个生物素结合位点;
第一核苷酸化合物,其结合至所述第一亲和素蛋白,所述第一核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件;以及
第一染料标记的化合物,其结合至所述第一亲和素蛋白,所述第一染料标记的化合物包含供体染料、受体染料、末端偶联元件、染料化合物接头元件和防护元件。
52.根据权利要求51所述的标记的核苷酸类似物,其中所述第一染料标记的化合物和所述第一核苷酸化合物各自通过生物素部分结合至所述第一亲和素蛋白。
53.根据权利要求51所述的标记的核苷酸类似物,其还包含第二亲和素蛋白和第二核苷酸化合物,其中
所述第二亲和素蛋白通过生物素部分结合至所述第一染料标记的化合物并且所述第二亲和素蛋白通过生物素部分结合至所述第二核苷酸化合物。
54.根据权利要求51所述的标记的核苷酸类似物,其中所述第一亲和素蛋白为亲和素、链霉亲和素、蘑菇亲和素、链霉亲和素突变体、热带爪蟾亲和素、慢生大豆根瘤菌亲和素、AVR2、AVR4或它们的同源物。
55.根据权利要求51所述的标记的核苷酸类似物,其中所述供体染料和所述受体染料为荧光染料。
56.根据权利要求51所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少两个供体染料。
57.根据权利要求56所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少四个供体染料。
58.根据权利要求51所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少两个受体染料。
59.根据权利要求58所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少四个受体染料。
60.根据权利要求51所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少两个供体染料和至少两个受体染料。
61.根据权利要求51所述的标记的核苷酸类似物,其中所述染料化合物接头元件包含防护元件或侧链元件。
62.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其中所述第一染料标记的化合物的所述防护元件降低所述第一染料标记的化合物或与类似物相关的生物分子的光损伤,或者提高类似物的亮度。
63.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其中所述防护元件包含多个侧链。
64.根据权利要求63所述的标记的核苷酸类似物,其中至少一个侧链的分子量为至少300。
65.根据权利要求63所述的标记的核苷酸类似物,其中全部侧链的分子量都为至少300。
66.根据权利要求63所述的标记的核苷酸类似物,其中至少一个侧链包含聚乙二醇。
67.根据权利要求63所述的标记的核苷酸类似物,其中至少一个侧链包含带负电荷的组分。
68.根据权利要求67所述的标记的核苷酸类似物,其中所述带负电荷的组分包含磺酸。
69.根据权利要求63所述的标记的核苷酸类似物,其中至少一个侧链包含取代的苯基。
70.根据权利要求69所述的标记的核苷酸类似物,其中所述至少一个侧链包含下列结构:
其中各x独立地为1至6的整数。
71.根据权利要求70所述的标记的核苷酸类似物,其中各x独立地为1至4的整数。
72.根据权利要求63所述的标记的核苷酸类似物,其中至少一个侧链包含三唑。
73.根据权利要求63所述的标记的核苷酸类似物,其中至少一个侧链包含下列结构:
74.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其中所述防护元件包含下列结构:
其中各y独立地为1至6的整数。
75.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其中所述防护元件包含下列结构:
76.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其包含至少两个末端偶联元件。
77.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其中所述末端偶联元件包含生物素部分。
78.根据权利要求77所述的标记的核苷酸类似物,其中所述末端偶联元件包含双生物素部分。
79.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其中所述一个或多个受体染料或所述一个或多个供体染料为花青染料。
80.根据权利要求51至61中任一项所述的标记的核苷酸类似物,其中所述至少一个染料标记的化合物不包含核苷。
81.根据权利要求51所述的标记的核苷酸类似物,其中所述第一染料标记的化合物为结构式(IIIA)、(IIIB)、(IIIC)、(IIID)或(IIIE)的化合物:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各A独立地为受体染料;
各D独立地为供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r独立地为0至8的整数;
其中所述化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。
82.根据权利要求81所述的标记的核苷酸类似物,其中各r独立地为0至4的整数。
83.根据权利要求81所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少两个供体染料。
84.根据权利要求83所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少四个供体染料。
85.根据权利要求81所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少两个受体染料。
86.根据权利要求85所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少四个受体染料。
87.根据权利要求81所述的标记的核苷酸类似物,其中所述第一染料标记的化合物包含至少两个供体染料和至少两个受体染料。
88.根据权利要求81所述的标记的核苷酸类似物,其中至少一个染料化合物接头元件包含防护元件或侧链元件。
89.根据权利要求81所述的标记的核苷酸类似物,其中所述至少一个防护元件包含多个侧链。
90.根据权利要求89所述的标记的核苷酸类似物,其中至少一个侧链的分子量为至少300。
91.根据权利要求89所述的标记的核苷酸类似物,其中全部侧链的分子量都为至少300。
92.根据权利要求89所述的标记的核苷酸类似物,其中至少一个侧链包含聚乙二醇。
93.根据权利要求89所述的标记的核苷酸类似物,其中至少一个侧链包含带负电荷的组分。
94.根据权利要求93所述的标记的核苷酸类似物,其中所述带负电荷的组分包含磺酸。
95.根据权利要求89所述的标记的核苷酸类似物,其中至少一个侧链包含取代的苯基。
96.根据权利要求95所述的标记的核苷酸类似物,其中所述至少一个侧链包含下列结构:
其中各x独立地为1至6的整数。
97.根据权利要求96所述的标记的核苷酸类似物,其中各x独立地为1至4的整数。
98.根据权利要求89所述的标记的核苷酸类似物,其中至少一个侧链包含三唑。
99.根据权利要求89所述的标记的核苷酸类似物,其中至少一个侧链包含下列结构:
100.根据权利要求81所述的标记的核苷酸类似物,其中所述至少一个防护元件包含下列结构:
其中各y独立地为1至6的整数。
101.根据权利要求81所述的标记的核苷酸类似物,其中所述至少一个防护元件包含下列结构:
102.根据权利要求81所述的标记的核苷酸类似物,其包含两个末端偶联元件。
103.根据权利要求81所述的标记的核苷酸类似物,其中所述末端偶联元件包含生物素部分。
104.根据权利要求103所述的标记的核苷酸类似物,其中所述末端偶联元件包含双生物素部分。
105.根据权利要求81所述的标记的核苷酸类似物,其中所述至少一个受体染料或所述至少一个供体染料为花青染料。
106.根据权利要求81所述的标记的核苷酸类似物,其中所述第一染料标记的化合物不包含核苷。
107.根据权利要求51所述的标记的核苷酸类似物,其中所述第一染料标记的化合物为结构式(IIIF)的化合物:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各A独立地为受体染料;
各D独立地为供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r’独立地为0至4的整数;
其中所述化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。
108.根据权利要求107所述的标记的核苷酸类似物,其中各r’独立地为0至2的整数。
109.根据权利要求108所述的标记的核苷酸类似物,其中各r’独立地为0或1。
110.根据权利要求107所述的标记的核苷酸类似物,其包含至少两个供体染料。
111.根据权利要求110所述的标记的核苷酸类似物,其包含至少四个供体染料。
112.根据权利要求107所述的标记的核苷酸类似物,其包含至少两个受体染料。
113.根据权利要求112所述的标记的核苷酸类似物,其包含至少四个受体染料。
114.根据权利要求107所述的标记的核苷酸类似物,其包含至少两个供体染料和至少两个受体染料。
115.根据权利要求107所述的标记的核苷酸类似物,其中至少一个染料化合物接头元件包含防护元件或侧链元件。
116.根据权利要求107所述的标记的核苷酸类似物,其中所述至少一个防护元件包含多个侧链。
117.根据权利要求116所述的标记的核苷酸类似物,其中至少一个侧链的分子量为至少300。
118.根据权利要求116所述的标记的核苷酸类似物,其中全部侧链的分子量都为至少300。
119.根据权利要求116所述的标记的核苷酸类似物,其中至少一个侧链包含聚乙二醇。
120.根据权利要求116所述的标记的核苷酸类似物,其中至少一个侧链包含带负电荷的组分。
121.根据权利要求120所述的标记的核苷酸类似物,其中所述带负电荷的组分包含磺酸。
122.根据权利要求116所述的标记的核苷酸类似物,其中至少一个侧链包含取代的苯基。
123.根据权利要求122所述的标记的核苷酸类似物,其中所述至少一个侧链包含下列结构:
其中各x独立地为1至6的整数。
124.根据权利要求123所述的标记的核苷酸类似物,其中各x独立地为1至4的整数。
125.根据权利要求116所述的标记的核苷酸类似物,其中至少一个侧链包含三唑。
126.根据权利要求116所述的标记的核苷酸类似物,其中至少一个侧链包含下列结构:
127.根据权利要求107所述的标记的核苷酸类似物,其中所述至少一个防护元件包含下列结构:
其中各y独立地为1至6的整数。
128.根据权利要求107所述的标记的核苷酸类似物,其中所述至少一个防护元件包含下列结构:
129.根据权利要求107所述的标记的核苷酸类似物,其包含两个末端偶联元件。
130.根据权利要求107所述的标记的核苷酸类似物,其中所述末端偶联元件包含生物素部分。
131.根据权利要求130所述的标记的核苷酸类似物,其中所述末端偶联元件包含双生物素部分。
132.根据权利要求107所述的标记的核苷酸类似物,其中所述至少一个受体染料或所述至少一个供体染料为花青染料。
133.根据权利要求107所述的标记的核苷酸类似物,其中所述第一染料标记的化合物不包含核苷。
134.根据权利要求51所述的标记的核苷酸类似物,其中所述第一染料标记的化合物为结构式(IIIG)的化合物:
其中
各L’独立地为染料化合物接头元件;
各S独立地为防护元件;
各Dye独立地为受体染料或供体染料;
各B”独立地为末端偶联元件;
各p独立地为0或1;并且
各r”独立地为0至8的整数;
s为1至6的整数;并且
t为0或1;
其中所述化合物包含至少一个防护元件、至少一个受体染料和至少一个供体染料。
135.根据权利要求134所述的标记的核苷酸类似物,其中各r”独立地为0至4的整数。
136.根据权利要求135所述的标记的核苷酸类似物,其中各r”独立地为0至2的整数。
137.根据权利要求134所述的标记的核苷酸类似物,其包含至少两个供体染料。
138.根据权利要求137所述的标记的核苷酸类似物,其包含至少四个供体染料。
139.根据权利要求134所述的标记的核苷酸类似物,其包含至少两个受体染料。
140.根据权利要求139所述的标记的核苷酸类似物,其包含至少四个受体染料。
141.根据权利要求134所述的标记的核苷酸类似物,其包含至少两个供体染料和至少两个受体染料。
142.根据权利要求134所述的标记的核苷酸类似物,其中至少一个染料化合物接头元件包含防护元件或侧链元件。
143.根据权利要求134所述的标记的核苷酸类似物,其中所述至少一个防护元件包含多个侧链。
144.根据权利要求143所述的标记的核苷酸类似物,其中至少一个侧链的分子量为至少300。
145.根据权利要求143所述的标记的核苷酸类似物,其中所有侧链的分子量都为至少300。
146.根据权利要求143所述的标记的核苷酸类似物,其中至少一个侧链包含聚乙二醇。
147.根据权利要求143所述的标记的核苷酸类似物,其中至少一个侧链包含带负电荷的组分。
148.根据权利要求147所述的标记的核苷酸类似物,其中所述带负电荷的组分包含磺酸。
149.根据权利要求143所述的标记的核苷酸类似物,其中至少一个侧链包含取代的苯基。
150.根据权利要求149所述的标记的核苷酸类似物,其中所述至少一个侧链包含下列结构:
其中各x独立地为1至6的整数。
151.根据权利要求150所述的标记的核苷酸类似物,其中各x独立地为1至4的整数。
152.根据权利要求143所述的标记的核苷酸类似物,其中至少一个侧链包含三唑。
153.根据权利要求143所述的标记的核苷酸类似物,其中至少一个侧链包含下列结构:
154.根据权利要求134所述的标记的核苷酸类似物,其中所述至少一个防护元件包含下列结构:
其中各y独立地为1至6的整数。
155.根据权利要求134所述的标记的核苷酸类似物,其中所述至少一个防护元件包含下列结构:
156.根据权利要求134所述的标记的核苷酸类似物,其包含两个末端偶联元件。
157.根据权利要求134所述的标记的核苷酸类似物,其中所述末端偶联元件包含生物素部分。
158.根据权利要求157所述的标记的核苷酸类似物,其中所述末端偶联元件包含双生物素部分。
159.根据权利要求134所述的标记的核苷酸类似物,其中所述至少一个受体染料或所述至少一个供体染料为花青染料。
160.根据权利要求134所述的标记的核苷酸类似物,其中所述第一染料标记的化合物不包含核苷。
161.一种标记的核苷酸类似物,其包含:
第一亲和素蛋白、第二亲和素蛋白和第三亲和素蛋白,各亲和素蛋白具有四个亚基,并且各亚基包含一个生物素结合位点;
第一核苷酸化合物和第二核苷酸化合物,各核苷酸化合物包含多磷酸酯元件、核苷元件、任选的多价中央核心元件、末端偶联元件和核苷酸接头元件;以及
第一染料标记的化合物和第二染料标记的化合物,各染料标记的化合物包含供体染料、受体染料、末端偶联元件、染料化合物接头元件和防护元件;
其中所述第一亲和素蛋白结合至所述第一核苷酸化合物并结合至所述第一染料标记的化合物,所述第二亲和素蛋白结合至所述第一染料标记的化合物并结合至所述第二染料标记的化合物,并且所述第三亲和素蛋白结合至所述第二染料标记的化合物并结合至所述第二核苷酸化合物。
162.根据权利要求161所述的标记的核苷酸类似物,其中所述第一染料标记的化合物和第二染料标记的化合物以及所述第一核苷酸化合物和第二核苷酸化合物各自通过生物素部分结合至所述第一亲和素蛋白、第二亲和素蛋白和第三亲和素蛋白。
163.用于对核酸模板进行测序的反应混合物,其包含:
聚合酶复合物,其包含聚合酶、模板核酸和任选地与所述模板核酸杂交的引物,其中使所述聚合酶复合物固定于表面上;以及
测序试剂,其与所述表面接触并包含用于进行包括权利要求1的两个或多个标记的核苷酸类似物的核酸合成的试剂。
164.根据权利要求163所述的反应混合物,其中所述标记的核苷酸类似物包含一个染料标记的化合物和一个核苷酸化合物,其中所述染料标记的化合物和所述核苷酸化合物各自包含生物素部分。
165.用于对核酸模板进行测序的方法,其包括:
提供聚合酶复合物,其包含聚合酶、模板核酸和任选地与所述模板核酸杂交的引物,其中使所述聚合酶复合物固定于表面上;
添加测序试剂,该测序试剂与所述表面接触并包含用于进行核酸合成的试剂,该测序试剂包括权利要求1所述的两个或多个标记的核苷酸类似物;以及
通过观察所述标记的核苷酸类似物与所述聚合酶复合物的相互作用来确定核苷酸在与所述模板核酸链互补的核酸链上的依次添加。
166.根据权利要求165所述的方法,其中至少一个标记的核苷酸类似物包含:
一个核苷酸化合物,其通过生物素部分结合至所述亲和素蛋白;以及
一个染料标记的化合物,其通过生物素部分结合至所述亲和素蛋白。
167.根据权利要求165所述的方法,其中至少一个标记的核苷酸类似物包含:
一个染料标记的化合物,其通过生物素部分结合至所述亲和素蛋白;以及
两个核苷酸化合物,其各自通过生物素部分结合至所述亲和素蛋白。
168.根据权利要求165所述的方法,其中至少一个标记的核苷酸类似物包含:
一个染料标记的化合物和一个核苷酸化合物,其各自通过生物素部分结合至所述亲和素蛋白。
169.根据权利要求165所述的方法,其中至少一个标记的核苷酸类似物包含:
两个亲和素蛋白、两个核苷酸化合物和一个染料标记的化合物;其中
所述染料标记的化合物包含两个生物素部分;
各核苷酸化合物包含一个生物素部分;并且
各亲和素蛋白通过生物素部分结合至所述染料标记的化合物并且各亲和素蛋白通过生物素部分结合至所述核苷酸化合物。
170.根据权利要求165至169中任一项所述的方法,其中所述亲和素蛋白包含链霉亲和素或蘑菇亲和素。
171.根据权利要求165至169中任一项所述的方法,其中所述染料部分为荧光染料。
172.根据权利要求165至169中任一项所述的方法,其中至少一个核苷酸化合物由结构式(I)表示:
其中
L为核苷酸接头元件,其包含所述亲合力调节元件;
P为多磷酸酯元件;
Nu为核苷元件;
X为多价中央核心元件;
B”为末端偶联元件;
n为1至4的整数;并且
o为0或1。
173.根据权利要求172所述的方法,其中所述至少一个亲合力调节元件为芳香族间隔元件或防护元件。
174.根据权利要求172所述的方法,其中B”包含生物素部分。
175.根据权利要求174所述的方法,其中B”包含双生物素部分。
176.根据权利要求172所述的方法,其中o为1。
177.根据权利要求176所述的方法,其中n为2。
178.根据权利要求176所述的方法,其中X包含多胺部分。
179.根据权利要求172所述的方法,其中o为0并且n为1。
180.根据权利要求165至169中任一项所述的方法,其中至少一个染料标记的化合物包含:
供体染料;
受体染料;
防护元件;
末端偶联元件;和
染料化合物接头元件;
其中所述染料化合物接头元件共价地将末端偶联元件连接至所述供体染料、所述受体染料或所述防护元件;并且
其中所述受体染料或所述供体染料直接地偶联至所述防护元件。
181.根据权利要求180所述的方法,其中所述末端偶联元件包含生物素部分。
182.根据权利要求181所述的方法,其中所述末端偶联元件包含双生物素部分。
183.根据权利要求180所述的方法,其中o为1。
184.根据权利要求183所述的方法,其中n为2。
185.根据权利要求183所述的方法,其中X包含多胺部分。
186.根据权利要求180所述的方法,其中o为0并且n为1。
187.一种用于对核酸模板进行测序的系统,其包括:
芯片,其包含结合到所述芯片上的多个聚合酶复合物,各聚合酶复合物分别地为光学可分辨的,各聚合酶复合物包含聚合酶、模板核酸和任选地与所述模板核酸杂交的引物;
测序试剂,其与所述表面接触并包含用于进行核酸合成的试剂,该测序试剂包括权利要求1所述的两个或更多个标记的核苷酸类似物;以及
照射系统,其用于照射所述聚合酶复合物;
光学检测系统,其用于检测在所述标记的核苷酸类似物与所述聚合酶复合物相互作用时,来自所述标记的核苷酸类似物的荧光;以及
计算机,其用于分析由所述检测系统检测到的信号,从而确定核苷酸在与所述模板核酸链互补的核酸链上的依次添加。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110619698.5A CN113321943A (zh) | 2015-11-20 | 2016-11-21 | 标记的核苷酸类似物、反应混合物以及测序方法和系统 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562258416P | 2015-11-20 | 2015-11-20 | |
US62/258,416 | 2015-11-20 | ||
PCT/US2016/063178 WO2017087975A1 (en) | 2015-11-20 | 2016-11-21 | Labeled nucleotide analogs, reaction mixtures, and methods and systems for sequencing |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110619698.5A Division CN113321943A (zh) | 2015-11-20 | 2016-11-21 | 标记的核苷酸类似物、反应混合物以及测序方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108697499A true CN108697499A (zh) | 2018-10-23 |
CN108697499B CN108697499B (zh) | 2021-06-22 |
Family
ID=58719317
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110619698.5A Pending CN113321943A (zh) | 2015-11-20 | 2016-11-21 | 标记的核苷酸类似物、反应混合物以及测序方法和系统 |
CN201680079672.3A Active CN108697499B (zh) | 2015-11-20 | 2016-11-21 | 标记的核苷酸类似物、反应混合物以及测序方法和系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110619698.5A Pending CN113321943A (zh) | 2015-11-20 | 2016-11-21 | 标记的核苷酸类似物、反应混合物以及测序方法和系统 |
Country Status (4)
Country | Link |
---|---|
US (3) | US10781483B2 (zh) |
EP (1) | EP3376997A4 (zh) |
CN (2) | CN113321943A (zh) |
WO (1) | WO2017087975A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111073871A (zh) * | 2019-12-17 | 2020-04-28 | 中国科学院苏州生物医学工程技术研究所 | 热稳定性提高的dna聚合酶突变体及其构建方法和应用 |
WO2020227953A1 (zh) * | 2019-05-15 | 2020-11-19 | 深圳华大智造极创科技有限公司 | 一种基于自发光的单通道测序方法 |
RU2794177C1 (ru) * | 2019-05-15 | 2023-04-12 | Еги Тек (Шэнь Чжэнь) Ко., Лимитед | Способ одноканального секвенирования на основе самолюминесценции |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10544449B2 (en) | 2013-06-14 | 2020-01-28 | Pacific Biosciences Of California, Inc. | Bis-biotinylation tags |
US10781483B2 (en) | 2015-11-20 | 2020-09-22 | Pacific Biosciences Of California, Inc. | Labeled nucleotide analogs, reaction mixtures, and methods and systems for sequencing |
US10676788B2 (en) | 2015-11-20 | 2020-06-09 | Pacific Biosciences Of California, Inc. | Modified nucleotide reagents |
WO2017087974A1 (en) | 2015-11-20 | 2017-05-26 | Pacific Biosciences Of California, Inc. | Protected dye-labeled reagents |
US11162138B2 (en) | 2017-10-30 | 2021-11-02 | Pacific Biosciences Of California, Inc. | Multi-amplitude modular labeled compounds |
EP3729090A4 (en) | 2017-12-22 | 2021-09-22 | Pacific Biosciences Of California, Inc. | MODIFIED BIOTIN-BINDING PROTEINS FOR IMMOBILIZATION |
EP3814531A4 (en) | 2018-06-29 | 2022-04-06 | Pacific Biosciences Of California, Inc. | METHODS AND COMPOSITIONS FOR DELIVERING MOLECULES AND COMPLEXES TO REACTION SITES |
US10768173B1 (en) | 2019-09-06 | 2020-09-08 | Element Biosciences, Inc. | Multivalent binding composition for nucleic acid analysis |
US11287422B2 (en) | 2019-09-23 | 2022-03-29 | Element Biosciences, Inc. | Multivalent binding composition for nucleic acid analysis |
GB2599729A (en) * | 2020-10-12 | 2022-04-13 | Sumitomo Chemical Co | Method comprising light emitting marker |
WO2024124008A2 (en) * | 2022-12-07 | 2024-06-13 | Element Biosciences, Inc. | Cyanine derivatives and related uses |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130316912A1 (en) * | 2012-02-15 | 2013-11-28 | Pacific Biosciences Of California, Inc. | Polymerase enzyme substrates with protein shield |
US20150050659A1 (en) * | 2013-08-05 | 2015-02-19 | Pacific Biosciences Of California, Inc. | Protected fluorescent reagent compounds |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4711955A (en) | 1981-04-17 | 1987-12-08 | Yale University | Modified nucleotides and methods of preparing and using same |
US5001050A (en) | 1989-03-24 | 1991-03-19 | Consejo Superior Investigaciones Cientificas | PHφ29 DNA polymerase |
US5198543A (en) | 1989-03-24 | 1993-03-30 | Consejo Superior Investigaciones Cientificas | PHI29 DNA polymerase |
CA2044616A1 (en) | 1989-10-26 | 1991-04-27 | Roger Y. Tsien | Dna sequencing |
JPH04321043A (ja) | 1991-04-22 | 1992-11-11 | Konica Corp | 熱現像感光材料、画像形成方法、塗布組成物 |
US5654419A (en) | 1994-02-01 | 1997-08-05 | The Regents Of The University Of California | Fluorescent labels and their use in separations |
AU5171696A (en) | 1995-02-27 | 1996-09-18 | Ely Michael Rabani | Device, compounds, algorithms, and methods of molecular characterization and manipulation with molecular parallelism |
US6242246B1 (en) | 1997-12-15 | 2001-06-05 | Somalogic, Inc. | Nucleic acid ligand diagnostic Biochip |
US6153442A (en) | 1998-05-20 | 2000-11-28 | Dade Behring Inc. | Reagents and methods for specific binding assays |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
WO2000036151A1 (en) | 1998-12-14 | 2000-06-22 | Li-Cor, Inc. | A heterogeneous assay for pyrophosphate detection |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US6399335B1 (en) | 1999-11-16 | 2002-06-04 | Advanced Research And Technology Institute, Inc. | γ-phosphoester nucleoside triphosphates |
US6917726B2 (en) | 2001-09-27 | 2005-07-12 | Cornell Research Foundation, Inc. | Zero-mode clad waveguides for performing spectroscopy with confined effective observation volumes |
US7052839B2 (en) | 2001-08-29 | 2006-05-30 | Amersham Biosciences Corp | Terminal-phosphate-labeled nucleotides and methods of use |
US7223541B2 (en) | 2001-08-29 | 2007-05-29 | Ge Healthcare Bio-Sciences Corp. | Terminal-phosphate-labeled nucleotides and methods of use |
DE60235376D1 (de) | 2001-08-29 | 2010-04-01 | Ge Healthcare Bio Sciences | Markierte nukleosidpolyphosphate |
US20090186343A1 (en) | 2003-01-28 | 2009-07-23 | Visigen Biotechnologies, Inc. | Methods for preparing modified biomolecules, modified biomolecules and methods for using same |
US7393640B2 (en) | 2003-02-05 | 2008-07-01 | Ge Healthcare Bio-Sciences Corp. | Terminal-phosphate-labeled nucleotides with new linkers |
US7612197B2 (en) | 2003-05-09 | 2009-11-03 | The United States of America as repesented by the Secretary of the Department of Health and Human Services | Thermolabile hydroxyl protecting groups and methods of use |
GB0327524D0 (en) | 2003-11-26 | 2003-12-31 | Univ Glasgow | Heterocyclic aromatic compounds |
FR2873715B1 (fr) | 2004-07-30 | 2006-11-17 | Centre Nat Rech Scient Cnrse | Utilisation de dendrimeres pour stimuler la croissance cellulaire |
EP1790202A4 (en) | 2004-09-17 | 2013-02-20 | Pacific Biosciences California | APPARATUS AND METHOD FOR ANALYZING MOLECULES |
US7170050B2 (en) | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
CA2631248C (en) | 2005-11-28 | 2016-01-12 | Pacific Biosciences Of California, Inc. | Uniform surfaces for hybrid material substrates and methods for making and using same |
CA2633476C (en) | 2005-12-22 | 2015-04-21 | Pacific Biosciences Of California, Inc. | Active surface coupled polymerases |
CN101365807A (zh) | 2005-12-22 | 2009-02-11 | 加利福尼亚太平洋生物科学股份有限公司 | 用于掺入核苷酸类似物的聚合酶 |
EP1963501A4 (en) | 2005-12-22 | 2009-04-22 | Pacific Biosciences California | PROTEIN ENGINEERING STRATEGIES FOR OPTIMIZING THE ACTIVITY OF PROTEINS FIXED TO SURFACES |
US8524663B2 (en) | 2006-03-03 | 2013-09-03 | New York University | Method for site-specific polyvalent display on polymers |
US20080076189A1 (en) | 2006-03-30 | 2008-03-27 | Visigen Biotechnologies, Inc. | Modified surfaces for the detection of biomolecules at the single molecule level |
EP2089517A4 (en) | 2006-10-23 | 2010-10-20 | Pacific Biosciences California | POLYMERASEENZYME AND REAGENTS FOR ADVANCED NUCKIC ACID SEQUENCING |
WO2008137661A1 (en) | 2007-05-03 | 2008-11-13 | Helicos Biosciences Corporation | Methods and compositions for sequencing a nucleic acid |
US7714303B2 (en) | 2007-05-10 | 2010-05-11 | Pacific Biosciences Of California, Inc. | Methods and systems for analyzing fluorescent materials with reduced authofluorescence |
CA2689626C (en) | 2007-06-06 | 2016-10-25 | Pacific Biosciences Of California, Inc. | Methods and processes for calling bases in sequence by incorporation methods |
US20090118129A1 (en) | 2007-09-28 | 2009-05-07 | Pacific Biosciences Of California, Inc. | Virtual reads for readlength enhancement |
US7960116B2 (en) | 2007-09-28 | 2011-06-14 | Pacific Biosciences Of California, Inc. | Nucleic acid sequencing methods and systems |
CA2707600C (en) | 2007-12-04 | 2018-02-20 | Pacific Biosciences Of California, Inc. | Alternate labeling strategies for single molecule sequencing |
US7842475B2 (en) | 2008-01-08 | 2010-11-30 | Siemens Healthcare Diagnostics Inc. | Stabilization of solid support assay reagents |
US8501922B2 (en) | 2008-02-07 | 2013-08-06 | Pacific Biosciences Of California, Inc. | CIS reactive oxygen quenchers integrated into linkers |
US8652781B2 (en) | 2008-02-12 | 2014-02-18 | Pacific Biosciences Of California, Inc. | Cognate sampling kinetics |
EP2263087B1 (en) | 2008-03-13 | 2017-08-09 | Pacific Biosciences of California, Inc. | Labeled reactants and their uses |
US7973146B2 (en) | 2008-03-26 | 2011-07-05 | Pacific Biosciences Of California, Inc. | Engineered fluorescent dye labeled nucleotide analogs for DNA sequencing |
WO2009120374A2 (en) | 2008-03-28 | 2009-10-01 | Pacific Biosciences Of California, Inc. | Methods and compositions for nucleic acid sample preparation |
US8420366B2 (en) | 2008-03-31 | 2013-04-16 | Pacific Biosciences Of California, Inc. | Generation of modified polymerases for improved accuracy in single molecule sequencing |
EP2274446B1 (en) | 2008-03-31 | 2015-09-09 | Pacific Biosciences of California, Inc. | Two slow-step polymerase enzyme systems and methods |
US8999676B2 (en) | 2008-03-31 | 2015-04-07 | Pacific Biosciences Of California, Inc. | Recombinant polymerases for improved single molecule sequencing |
AU2009251883B2 (en) | 2008-03-31 | 2014-09-11 | Pacific Biosciences Of California, Inc. | Generation of modified polymerases for improved accuracy in single molecule sequencing |
US9127259B2 (en) | 2008-03-31 | 2015-09-08 | Pacific Biosciences Of California, Inc. | Enzymes resistant to photodamage |
EP2326733A2 (en) | 2008-09-05 | 2011-06-01 | Pacific Biosciences of California, Inc. | Engineering polymerases and reaction conditions for modified incorporation properties |
US8481264B2 (en) | 2008-09-19 | 2013-07-09 | Pacific Biosciences Of California, Inc. | Immobilized nucleic acid complexes for sequence analysis |
US8921046B2 (en) | 2008-09-19 | 2014-12-30 | Pacific Biosciences Of California, Inc. | Nucleic acid sequence analysis |
US8367813B2 (en) | 2008-11-17 | 2013-02-05 | Pacific Biosciences Of California, Inc. | Phospholink nucleotides for sequencing applications |
US8252910B2 (en) | 2008-11-19 | 2012-08-28 | Pacific Biosciences Of California, Inc. | Modular nucleotide compositions and uses therefor |
WO2010059880A2 (en) | 2008-11-19 | 2010-05-27 | Pacific Biosciences Of California, Inc. | Photo-induced damage mitigating agents and preparation and methods of use thereof |
WO2010068289A2 (en) | 2008-12-11 | 2010-06-17 | Pacific Biosciences Of California, Inc. | Classification of nucleic acid templates |
US9175338B2 (en) | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
US20100255487A1 (en) | 2009-03-27 | 2010-10-07 | Life Technologies Corporation | Methods and apparatus for single molecule sequencing using energy transfer detection |
WO2010117420A2 (en) | 2009-03-30 | 2010-10-14 | Pacific Biosciences Of California, Inc. | Fret-labeled compounds and uses therefor |
US9051263B2 (en) | 2010-08-25 | 2015-06-09 | Pacific Biosciences Of California, Inc. | Functionalized cyanine dyes (PEG) |
US10023657B2 (en) | 2010-10-01 | 2018-07-17 | Ludwig Institute For Cancer Research Ltd. | Reversible protein multimers, methods for their production and use |
US8906660B2 (en) | 2012-02-01 | 2014-12-09 | Pacific Biosciences Of California, Inc. | Recombinant polymerases with increased phototolerance |
EP2850086B1 (en) | 2012-05-18 | 2023-07-05 | Pacific Biosciences Of California, Inc. | Heteroarylcyanine dyes |
US9315864B2 (en) | 2012-05-18 | 2016-04-19 | Pacific Biosciences Of California, Inc. | Heteroarylcyanine dyes with sulfonic acid substituents |
US9399766B2 (en) | 2012-10-01 | 2016-07-26 | Pacific Biosciences Of California, Inc. | Recombinant polymerases for incorporation of protein shield nucleotide analogs |
US20140094374A1 (en) | 2012-10-01 | 2014-04-03 | Pacific Biosciences Of California, Inc. | Recombinant Polymerases with Increased Readlength and Stability for Single-Molecule Sequencing |
WO2016126941A1 (en) | 2015-02-04 | 2016-08-11 | Pacific Biosciences Of California, Inc. | Multimeric protected fluorescent reagents |
US10781483B2 (en) * | 2015-11-20 | 2020-09-22 | Pacific Biosciences Of California, Inc. | Labeled nucleotide analogs, reaction mixtures, and methods and systems for sequencing |
WO2017087973A1 (en) | 2015-11-20 | 2017-05-26 | Pacific Biosciences Of California, Inc. | Modified nucleotide reagents |
WO2017087974A1 (en) | 2015-11-20 | 2017-05-26 | Pacific Biosciences Of California, Inc. | Protected dye-labeled reagents |
-
2016
- 2016-11-21 US US15/357,966 patent/US10781483B2/en active Active
- 2016-11-21 WO PCT/US2016/063178 patent/WO2017087975A1/en active Application Filing
- 2016-11-21 CN CN202110619698.5A patent/CN113321943A/zh active Pending
- 2016-11-21 CN CN201680079672.3A patent/CN108697499B/zh active Active
- 2016-11-21 EP EP16867352.3A patent/EP3376997A4/en active Pending
-
2020
- 2020-08-28 US US17/006,669 patent/US11466319B2/en active Active
-
2022
- 2022-10-10 US US18/045,436 patent/US12000000B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130316912A1 (en) * | 2012-02-15 | 2013-11-28 | Pacific Biosciences Of California, Inc. | Polymerase enzyme substrates with protein shield |
US20150050659A1 (en) * | 2013-08-05 | 2015-02-19 | Pacific Biosciences Of California, Inc. | Protected fluorescent reagent compounds |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020227953A1 (zh) * | 2019-05-15 | 2020-11-19 | 深圳华大智造极创科技有限公司 | 一种基于自发光的单通道测序方法 |
RU2794177C1 (ru) * | 2019-05-15 | 2023-04-12 | Еги Тек (Шэнь Чжэнь) Ко., Лимитед | Способ одноканального секвенирования на основе самолюминесценции |
CN111073871A (zh) * | 2019-12-17 | 2020-04-28 | 中国科学院苏州生物医学工程技术研究所 | 热稳定性提高的dna聚合酶突变体及其构建方法和应用 |
Also Published As
Publication number | Publication date |
---|---|
CN108697499B (zh) | 2021-06-22 |
US20210147928A1 (en) | 2021-05-20 |
US12000000B2 (en) | 2024-06-04 |
WO2017087975A1 (en) | 2017-05-26 |
EP3376997A4 (en) | 2019-04-24 |
WO2017087975A9 (en) | 2018-07-19 |
US20230366018A1 (en) | 2023-11-16 |
EP3376997A1 (en) | 2018-09-26 |
US10781483B2 (en) | 2020-09-22 |
US11466319B2 (en) | 2022-10-11 |
US20170145496A1 (en) | 2017-05-25 |
CN113321943A (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108472121A (zh) | 受保护的染料标记的试剂 | |
CN108697499A (zh) | 标记的核苷酸类似物、反应混合物以及测序方法和系统 | |
CN108603219A (zh) | 经修饰的核苷酸试剂 | |
US12037641B2 (en) | Modified nucleotide reagents | |
CN109154024A (zh) | 核酸序列测定方法 | |
CN108603227A (zh) | 超分辨率测序 | |
CN110418847A (zh) | 通过非标记的可逆终止子或天然核苷酸的分步测序 | |
CN102782159A (zh) | 将核酸进行测序之组合物与方法 | |
Ehrlich et al. | Exonucleolytic degradation of high-density labeled DNA studied by fluorescence correlation spectroscopy | |
Schulze | Investigating the mechanism of the Hsp90 molecular chaperone using photoinduced electron transfer fluorescence quenching | |
Moreno | The photophysical characterization of the guanine analogue 6-methylisoxanthopterin in DNA oligomers and its application to probing DNA-Protein interactions | |
Brehove | Access to the Genome: A Study of Transcription Factor Binding Within Nucleosomes | |
Bryan | Deciphering the chromatin binding mechanisms of human HP1 variants at the single-molecule level | |
Morgan | DNA-protein nanotechnology: Developing unique biological nanostructures and biological tools | |
Liu | Single-molecule and ensemble studies of DNA replication system | |
Goodman | Investigating cytoskeletal motor mechanisms using DNA nanotechnology | |
O'Brien III | Investigation of the thermodynamic properties of the oligomerization domain of heterogeneous nuclear ribonucleoprotein c | |
Wei | Nucleosome structure and dynamics studied with single-molecule methods | |
Kim | Single-molecule studies of unconventional motor protein myosin VI |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |