KR102210322B1 - Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 - Google Patents
Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 Download PDFInfo
- Publication number
- KR102210322B1 KR102210322B1 KR1020157029177A KR20157029177A KR102210322B1 KR 102210322 B1 KR102210322 B1 KR 102210322B1 KR 1020157029177 A KR1020157029177 A KR 1020157029177A KR 20157029177 A KR20157029177 A KR 20157029177A KR 102210322 B1 KR102210322 B1 KR 102210322B1
- Authority
- KR
- South Korea
- Prior art keywords
- artificial sequence
- dna
- lys
- leu
- description
- Prior art date
Links
- 238000010362 genome editing Methods 0.000 title claims abstract description 23
- 101710163270 Nuclease Proteins 0.000 title claims description 79
- 108091033409 CRISPR Proteins 0.000 claims abstract description 125
- 238000000034 method Methods 0.000 claims abstract description 64
- 230000001965 increasing effect Effects 0.000 claims abstract description 9
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract 3
- 108020004414 DNA Proteins 0.000 claims description 509
- 108020005004 Guide RNA Proteins 0.000 claims description 251
- 210000004027 cell Anatomy 0.000 claims description 108
- 230000035772 mutation Effects 0.000 claims description 70
- 239000002773 nucleotide Substances 0.000 claims description 50
- 125000003729 nucleotide group Chemical group 0.000 claims description 50
- 210000005260 human cell Anatomy 0.000 claims description 45
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 34
- 108020001507 fusion proteins Proteins 0.000 claims description 34
- 102000037865 fusion proteins Human genes 0.000 claims description 34
- 230000000295 complement effect Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 21
- 150000007523 nucleic acids Chemical class 0.000 claims description 19
- 150000001413 amino acids Chemical class 0.000 claims description 18
- 102000039446 nucleic acids Human genes 0.000 claims description 16
- 108020004707 nucleic acids Proteins 0.000 claims description 16
- 102000053602 DNA Human genes 0.000 claims description 9
- 230000001939 inductive effect Effects 0.000 claims description 9
- 230000003197 catalytic effect Effects 0.000 claims description 7
- 238000006467 substitution reaction Methods 0.000 claims description 6
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims description 5
- 102220502946 Geranylgeranyl transferase type-2 subunit alpha_D10N_mutation Human genes 0.000 claims description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims 1
- 108091034117 Oligonucleotide Proteins 0.000 description 193
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 98
- 230000000694 effects Effects 0.000 description 78
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 42
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 42
- 239000013612 plasmid Substances 0.000 description 42
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 41
- 241000282414 Homo sapiens Species 0.000 description 39
- 230000014509 gene expression Effects 0.000 description 38
- 108090000623 proteins and genes Proteins 0.000 description 37
- 230000027455 binding Effects 0.000 description 32
- 238000002474 experimental method Methods 0.000 description 31
- 239000002585 base Substances 0.000 description 27
- 238000003556 assay Methods 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 22
- 230000008685 targeting Effects 0.000 description 21
- 101000582767 Homo sapiens Regucalcin Proteins 0.000 description 20
- 102100030262 Regucalcin Human genes 0.000 description 20
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 20
- 239000013613 expression plasmid Substances 0.000 description 20
- 238000001890 transfection Methods 0.000 description 20
- 108010092854 aspartyllysine Proteins 0.000 description 18
- 230000004927 fusion Effects 0.000 description 18
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 18
- 108010034529 leucyl-lysine Proteins 0.000 description 18
- 230000001404 mediated effect Effects 0.000 description 18
- 125000006850 spacer group Chemical group 0.000 description 18
- 238000003776 cleavage reaction Methods 0.000 description 17
- 102000004169 proteins and genes Human genes 0.000 description 17
- 230000007017 scission Effects 0.000 description 17
- 231100000350 mutagenesis Toxicity 0.000 description 16
- 235000018102 proteins Nutrition 0.000 description 16
- 239000000539 dimer Substances 0.000 description 14
- 238000012350 deep sequencing Methods 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 12
- 238000006471 dimerization reaction Methods 0.000 description 12
- 108010017391 lysylvaline Proteins 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- 241000193996 Streptococcus pyogenes Species 0.000 description 11
- 125000005647 linker group Chemical group 0.000 description 11
- 238000002703 mutagenesis Methods 0.000 description 11
- 230000009437 off-target effect Effects 0.000 description 10
- 108010073969 valyllysine Proteins 0.000 description 10
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 108010054155 lysyllysine Proteins 0.000 description 9
- 230000036438 mutation frequency Effects 0.000 description 9
- 102000040430 polynucleotide Human genes 0.000 description 9
- 108091033319 polynucleotide Proteins 0.000 description 9
- 239000002157 polynucleotide Substances 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- 230000004075 alteration Effects 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 108010025306 histidylleucine Proteins 0.000 description 8
- 108010003700 lysyl aspartic acid Proteins 0.000 description 8
- 230000003505 mutagenic effect Effects 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 7
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 7
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 7
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 7
- 108700008625 Reporter Genes Proteins 0.000 description 7
- 230000005782 double-strand break Effects 0.000 description 7
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 6
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 6
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 6
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 6
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 6
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 6
- 108010047562 NGR peptide Proteins 0.000 description 6
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 6
- 238000010459 TALEN Methods 0.000 description 6
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 6
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 5
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 5
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 5
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 5
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 5
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 5
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 5
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- 108010022012 Fanconi Anemia Complementation Group F protein Proteins 0.000 description 5
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 5
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 5
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 5
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 5
- 230000004570 RNA-binding Effects 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 230000005945 translocation Effects 0.000 description 5
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 4
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 4
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 4
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 4
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 4
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 4
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 4
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 4
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 4
- 102000012216 Fanconi Anemia Complementation Group F protein Human genes 0.000 description 4
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 4
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 4
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 4
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 4
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 4
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 4
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 4
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 4
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- 241000227653 Lycopersicon Species 0.000 description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 4
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 4
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 4
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 4
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 4
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 4
- 102000013609 MutL Protein Homolog 1 Human genes 0.000 description 4
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 4
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 4
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 4
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 4
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 4
- 108010081404 acein-2 Proteins 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 231100000219 mutagenic Toxicity 0.000 description 4
- 231100000243 mutagenic effect Toxicity 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 3
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 3
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 3
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 3
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 3
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 3
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 3
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 3
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 3
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 3
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 3
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 3
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 3
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 3
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 3
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 3
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 3
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 3
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 3
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 3
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 3
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 3
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 3
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 3
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 3
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 3
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 3
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 3
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 3
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 3
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 3
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 3
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 3
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 3
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 3
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 3
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 3
- 238000010453 CRISPR/Cas method Methods 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 102400001368 Epidermal growth factor Human genes 0.000 description 3
- 101800003838 Epidermal growth factor Proteins 0.000 description 3
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 3
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 3
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 3
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 3
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 3
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 3
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 3
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 3
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 3
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 3
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 3
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 3
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 3
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 3
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 3
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 3
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 3
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 3
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 3
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 3
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 3
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 3
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 3
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 3
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 3
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 3
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 3
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 3
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 3
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 3
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 3
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 3
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 3
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 3
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 3
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 3
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 3
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 3
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 3
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 3
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 3
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 3
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 3
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 3
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 3
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 3
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 3
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 3
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 3
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 3
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 3
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 3
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 3
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 3
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 3
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 3
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 3
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 3
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 3
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 3
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 3
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 3
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 3
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 3
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 3
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 3
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 3
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 3
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 3
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 3
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 3
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 3
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 3
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 3
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 3
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 3
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 3
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 3
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 3
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 3
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 3
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 3
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 3
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 3
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 3
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 3
- 206010028400 Mutagenic effect Diseases 0.000 description 3
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 3
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 3
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 3
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 3
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 3
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 3
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 3
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 3
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 3
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 3
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 3
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 3
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 3
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 3
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 3
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 3
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 3
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 3
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 3
- 108010003201 RGH 0205 Proteins 0.000 description 3
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 3
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 3
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 3
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 3
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 3
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 3
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 3
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 3
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 3
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 3
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 3
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 3
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 3
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 3
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 3
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 3
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 3
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 3
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 3
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 3
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 3
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 3
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 3
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 3
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 3
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 3
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 3
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 3
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 3
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 3
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 3
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 3
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 3
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 3
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 3
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 3
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 3
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 3
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 3
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 3
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 3
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 3
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 3
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 3
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 3
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 3
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008045 co-localization Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 229940116977 epidermal growth factor Drugs 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 3
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 3
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 231100000299 mutagenicity Toxicity 0.000 description 3
- 230000007886 mutagenicity Effects 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 108010025488 pinealon Proteins 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 3
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 3
- 230000002792 vascular Effects 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- -1 4 to 12 amino acids Chemical class 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- KPPPLADORXGUFI-KCRXGDJASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(1-hydroxyethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](C(O)C)O[C@H]1N1C(=O)N=C(N)C=C1 KPPPLADORXGUFI-KCRXGDJASA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 2
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 2
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 2
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 2
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 2
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 2
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 2
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 2
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 2
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 2
- 102100021122 DNA damage-binding protein 2 Human genes 0.000 description 2
- 238000007399 DNA isolation Methods 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 201000004939 Fanconi anemia Diseases 0.000 description 2
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 2
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 2
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 2
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 2
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 2
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 2
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 2
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 2
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 2
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 2
- 101001026790 Homo sapiens Tyrosine-protein kinase Fes/Fps Proteins 0.000 description 2
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 2
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 2
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 2
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 2
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 2
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 2
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 2
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 2
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 2
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 2
- 241000589579 Planomicrobium okeanokoites Species 0.000 description 2
- 239000004952 Polyamide Substances 0.000 description 2
- 101710182846 Polyhedrin Proteins 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 2
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 2
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 2
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 2
- 102100037333 Tyrosine-protein kinase Fes/Fps Human genes 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- 101150030763 Vegfa gene Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009438 off-target cleavage Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229920002647 polyamide Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 238000007862 touchdown PCR Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- AZUYLZMQTIKGSC-UHFFFAOYSA-N 1-[6-[4-(5-chloro-6-methyl-1H-indazol-4-yl)-5-methyl-3-(1-methylindazol-5-yl)pyrazol-1-yl]-2-azaspiro[3.3]heptan-2-yl]prop-2-en-1-one Chemical compound ClC=1C(=C2C=NNC2=CC=1C)C=1C(=NN(C=1C)C1CC2(CN(C2)C(C=C)=O)C1)C=1C=C2C=NN(C2=CC=1)C AZUYLZMQTIKGSC-UHFFFAOYSA-N 0.000 description 1
- WGNUTGFETAXDTJ-OOJXKGFFSA-N 2'-O-methylpseudouridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O WGNUTGFETAXDTJ-OOJXKGFFSA-N 0.000 description 1
- IDGZVZJLYFTXSL-UHFFFAOYSA-N 2-[[2-[(2-amino-4-methylpentanoyl)amino]-3-hydroxypropanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CO)C(=O)NC(C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-UHFFFAOYSA-N 0.000 description 1
- MMUBPEFMCTVKTR-IBNKKVAHSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-1h-pyrimidine-2,4-dione Chemical compound C=1NC(=O)NC(=O)C=1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MMUBPEFMCTVKTR-IBNKKVAHSA-N 0.000 description 1
- 241000242764 Aequorea victoria Species 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- FSBCNCKIQZZASN-GUBZILKMSA-N Ala-Arg-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O FSBCNCKIQZZASN-GUBZILKMSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- UBEKKPOFLCVTEZ-UHFFFAOYSA-N Arg-Lys-Val-Ser Chemical compound OCC(C(O)=O)NC(=O)C(C(C)C)NC(=O)C(CCCCN)NC(=O)C(N)CCCN=C(N)N UBEKKPOFLCVTEZ-UHFFFAOYSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- GYOHQKJEQQJBOY-QEJZJMRPSA-N Asn-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N GYOHQKJEQQJBOY-QEJZJMRPSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- YGHCVNQOZZMHRZ-DJFWLOJKSA-N Asn-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N YGHCVNQOZZMHRZ-DJFWLOJKSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 1
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 1
- 101710137105 DNA damage-binding protein 2 Proteins 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 101710135281 DNA polymerase III PolC-type Proteins 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 102100037964 E3 ubiquitin-protein ligase RING2 Human genes 0.000 description 1
- 102000009024 Epidermal Growth Factor Human genes 0.000 description 1
- 101150058673 FANCF gene Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 1
- WGHJXSONOOTTCZ-JYJNAYRXSA-N His-Glu-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WGHJXSONOOTTCZ-JYJNAYRXSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- IDQNVIWPPWAFSY-AVGNSLFASA-N His-His-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O IDQNVIWPPWAFSY-AVGNSLFASA-N 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101001041466 Homo sapiens DNA damage-binding protein 2 Proteins 0.000 description 1
- 101001095815 Homo sapiens E3 ubiquitin-protein ligase RING2 Proteins 0.000 description 1
- 101100263585 Homo sapiens VEGFA gene Proteins 0.000 description 1
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 1
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 1
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 1
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 1
- DEZCWWXTRAKZKJ-UFYCRDLUSA-N Phe-Phe-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DEZCWWXTRAKZKJ-UFYCRDLUSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 101150062997 Rnf2 gene Proteins 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241001633172 Streptococcus thermophilus LMD-9 Species 0.000 description 1
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 1
- 240000002033 Tacca leontopetaloides Species 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- VASYSJHSMSBTDU-LKXGYXEUSA-N Thr-Asn-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O VASYSJHSMSBTDU-LKXGYXEUSA-N 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- RSUXQZNWAOTBQF-XIRDDKMYSA-N Trp-Arg-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RSUXQZNWAOTBQF-XIRDDKMYSA-N 0.000 description 1
- WACMTVIJWRNVSO-CWRNSKLLSA-N Trp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O WACMTVIJWRNVSO-CWRNSKLLSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- NLWCSMOXNKBRLC-WDSOQIARSA-N Trp-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLWCSMOXNKBRLC-WDSOQIARSA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- XXJDYWYVZBHELV-TUSQITKMSA-N Trp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCCCN)C(=O)O)N XXJDYWYVZBHELV-TUSQITKMSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 102000009524 Vascular Endothelial Growth Factor A Human genes 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012574 advanced DMEM Substances 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 239000010426 asphalt Substances 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 208000029664 classic familial adenomatous polyposis Diseases 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 108010026638 endodeoxyribonuclease FokI Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000652 homosexual effect Effects 0.000 description 1
- 102000055691 human APC Human genes 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000013383 initial experiment Methods 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 210000003370 receptor cell Anatomy 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/01—Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1031—Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/21—Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
- C12Y301/21004—Type II site-specific deoxyribonuclease (3.1.21.4)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/00033—Use of viral protein as therapeutic agent other than vaccine, e.g. apoptosis inducing or anti-inflammatory
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/00033—Use of viral protein as therapeutic agent other than vaccine, e.g. apoptosis inducing or anti-inflammatory
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/11—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Virology (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Developing Agents For Electrophotography (AREA)
- Prostheses (AREA)
- Lubricants (AREA)
Abstract
RNA-안내 게놈 편집, 예를 들어, CRISPR/Cas9 시스템을 이용하는 편집의 특이성을 증가시키는 방법.
Description
우선권의 주장
본 출원은 미국 특허법(35 USC §119(e)) 하에서 2013년 3월 15일자로 출원된 미국 특허 출원 제61/799,647호; 2013년 6월 21일자로 출원된 제61/838,178호; 2013년 6월 21일자로 출원된 제61/838,148호; 및 2013년 12월 26일자로 출원된 제61/921,007호의 우선권을 주장한다. 이들 기초출원의 전문은 본 명세서에 참고로 포함된다.
연방정부 지원된 연구 또는 개발
본 발명은 미국국립보건원에 의해 부여된 등록번호 DP1 GM105378의 하에서 정부 지원으로 이루어졌다. 정부는 본 발명에 특정 권리를 가진다.
본 발명의 기술분야
RNA-안내 게놈 편집, 예를 들어, CRISPR/Cas9 시스템을 이용하고, RNA-안내 FokI 뉴클레아제(RFNs), 예를 들어, FokI-dCas9 융합 단백질을 이용하는 편집의 특이성을 증가시키는 방법.
최근의 연구는 군집된, 주기적으로 간격을 둔 짧은 회문구조 반복부(regularly interspaced, short palindromic repeat: CRISPR)/CRISPR-관련(Cas) 시스템(Wiedenheft et al., Nature 482, 331-338 (2012); Horvath et al., Science 327, 167-170 (2010); Terns et al., Curr Opin Microbiol 14, 321-327 (2011))이 박테리아, 효모 및 인간 세포뿐만 아니라 과실파리, 제브라피쉬 및 마우스과 같은 전체 유기체에서 생체내에서 기준 게놈 편집으로서 작용할 수 있다는 것을 입증하였다(Wang et al., Cell 153, 910-918 (2013); Shen et al., Cell Res (2013); Dicarlo et al., Nucleic Acids Res (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Elife 2, e00471 (2013); Hwang et al., Nat Biotechnol 31, 227-229 (2013); Cong et al., Science 339, 819-823 (2013); Mali et al., Science 339, 823-826 (2013c); Cho et al., Nat Biotechnol 31, 230-232 (2013); Gratz et al., Genetics 194(4):1029-35 (2013)) . 스트렙토코커스 피오게네스(S. pyogenes)로부터의 Cas9 뉴클레아제(본 명세서에서 이후에 단순히 Cas9)는 공학적으로 조작된 gRNA의 처음 20개 뉴클레오타이드와 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM), 예를 들어, 서열 NGG 또는 NAG를 매칭하는 PAM 다음에 놓이는 관심 대상의 표적 게놈 DNA 서열의 상보성 가닥 사이의 염기쌍 상보성을 통해 안내될 수 있다(Shen et al., Cell Res (2013); Dicarlo et al., Nucleic Acids Res (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Elife 2, e00471 (2013); Hwang et al., Nat Biotechnol 31, 227-229 (2013); Cong et al., Science 339, 819-823 (2013); Mali et al., Science 339, 823-826 (2013c); Cho et al., Nat Biotechnol 31, 230-232 (2013); Jinek et al., Science 337, 816-821 (2012)). 박테리아에서(Jiang et al., Nat Biotechnol 31, 233-239 (2013)) 그리고 인간 세포에서(Cong et al., Science 339, 819-823 (2013)) 시험관내에서 수행한 이전의 연구(Jinek et al., Science 337, 816-821 (2012))는 Cas9-매개된 절단이, 일부 경우에, gRNA/표적 부위 계면에서, 특히 20개의 뉴클레오타이드(nt) gRNA 상보성 영역의 3' 말단에 위치된 마지막 10 내지 12개의 뉴클레오타이드(nt)에서 단일의 미스매치에 의해 없어질 수 있다는 것을 나타내었다.
다수의 연구는 CRISPR-Cas 뉴클레아제가 5개까지의 미스매치를 용인하고, 여전히 절단할 수 있으며; 활성에 대한 임의의 주어진 단일 또는 조합의 효과를 예측하기가 어렵다는 것을 나타내었다. 종합하면, 이들 뉴클레아제는 상당한 표적을 벗어난 효과를 나타낼 수 있지만, 이들 부위를 예측하기 위해 시험감염시킬 수 있다. CRISPR/Cas 시스템을 이용하여, 예를 들어, RNA-안내 FokI 뉴클레아제(RFNs), 예를 들어, FokI-Cas9 또는 FokI-dCas9-based 융합 단백질을 이용하여 특이성을 증가시키는 방법이 본 명세서에 기재된다.
제1 양태에서, 본 발명은 dCas9의 말단, 예를 들어, N 말단에, 선택적으로 개재 링커(intervening linker), 예를 들어 2 내지 30개의 아미노산, 예를 들어 4 내지 12개의 아미노산, 예를 들어, Gly4Ser으로부터의 링커를 개재해서, 융합된 FokI 촉매적 도메인 서열을 포함하는, FokI-dCas9 융합 단백질을 제공한다. 일부 실시형태에서, FokI 촉매적 도메인은 서열번호 4의 아미노산 388 내지 583 또는 408 내지 583을 포함한다. 일부 실시형태에서, dCas9는 D10, E762, H983, 또는 D986에서; 및 H840 또는 N863에서의 돌연변이를 포함하는 돌연변이; 예를 들어, (i) D10A 또는 D10N; 및 (ii) H840A, H840Y 또는 H840N을 포함한다.
다른 양태에서, 본 발명은 이들 융합 단백질을 암호화하는 핵산, 핵산을 포함하는 벡터 및 핵산, 벡터, 또는 융합 단백질을 보유하거나 또는 발현시키는 숙주 세포를 제공한다.
다른 양태에서, 본 발명은 이중-가닥 DNA 분자에서, 예를 들어, 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법을 제공하며, 상기 방법은,
(a) 2개의 단일 안내 RNA(안내 RNA 둘 다를 이용하는 것이 가닥 둘 다의 표적화를 초래하도록(즉, 하나의 단일 안내 RNA가 제1 가닥을 표적화하고, 다른 하나의 안내 RNA가 상기 상보성 가닥을 표적화하도록) 2개의 단일 안내 RNA가 각각 표적 서열 중 한 가닥에 각각 상보성인 서열을 포함하고, FokI는 각각의 가닥을 절단하여 마주보는 DNA 가닥 상에서 한 쌍의 틈을 생성함으로써 이중-가닥 파손을 유발함), 또는
(b) tracrRNA와 2개의 crRNA(crRNA를 이용하는 것이 가닥 둘 다의 표적화를 초래하도록(즉, 하나의 crRNA는 제1 가닥을 표적화하고, 다른 하나의 crRNA는 상보성 가닥을 표적화함) 2개의 crRNA가 각각 표적 서열 중 한 가닥에 상보성인 서열을 포함하고, FokI는 각각의 가닥을 절단하여 마주보는 DNA 가닥 상에서 한 쌍의 틈을 생성함으로써 이중-가닥 파손을 유발함), 및
본 명세서에 기재된 FokI-dCas9 융합 단백질을 세포 내에서 발현시키는 단계 또는 이들과 세포를 접촉시키는 단계를 포함한다,
다른 양태에서, 본 발명은 세포 내에서 RNA-안내 게놈 편집의 특이성을 증가시키는 방법을 제공하며, 상기 방법은 본 명세서에 기재된 RNA-안내 FokI 뉴클레아제 (RFN) 융합 단백질과 세포를 접촉시키는 단계를 포함한다.
상기 방법은 (a) 2개의 단일 안내 RNA(안내 RNA 둘 다를 이용하는 것이 가닥 둘 다의 표적화를 초래하도록(즉, 하나의 단일 안내 RNA가 제1 가닥을 표적화하고, 다른 하나의 안내 RNA가 상기 상보성 가닥을 표적화하도록) 2개의 단일 안내 RNA가 각각 표적 서열 중 한 가닥에 각각 상보성인 서열을 포함하고, FokI는 각각의 가닥을 절단하여 마주보는 DNA 가닥 상에서 한 쌍의 틈을 생성함으로써 이중-가닥 파손을 유발함), 또는
(b) tracrRNA와 2개의 crRNA(crRNA를 이용하는 것이 가닥 둘 다의 표적화를 초래하도록(즉, 하나의 crRNA는 제1 가닥을 표적화하고, 다른 하나의 crRNA는 상보성 가닥을 표적화함) 2개의 crRNA가 각각 표적 서열 중 한 가닥에 상보성인 서열을 포함하고, FokI는 각각의 가닥을 절단하여 마주보는 DNA 가닥 상에서 한 쌍의 틈을 생성함으로써 이중-가닥 파손을 유발함)를 세포 내에서 발현시키거나 또는 이들을 세포와 접촉시키는 단계를 추가로 포함할 수 있다.
일부 실시형태에서, 2개의 표적 게놈 서열(즉, crRNA 및 단일 안내 RNA의 표적 상보성 영역이 상보적인 서열)은 10 내지 20개의 염기쌍만큼 떨어져 있으며, 바람직하게는 13 내지 17개의 염기쌍만큼 떨어져있다.
일부 실시형태에서, 삽입결실 돌연변이는 두 표적 서열 간에 유도된다.
일부 실시형태에서, 세포 내 RNA-안내 게놈 편집의 특이성은 증가된다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 방법 및 물질은 본 발명에서 사용을 위해 본 명세서에 기재되며; 당업계에 공지된 다른, 적합한 방법 및 물질이 또한 사용될 수 있다. 물질, 방법 및 예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다. 모든 간행물, 특허출원, 특허, 서열, 데이터베이스 엔트리 및 본 명세서에 언급된 다른 참고문헌은 그들의 전문이 참고로 포함된다. 상충되는 경우에, 정의를 포함하는 본 명세서로 조절할 것이다.
본 발명의 다른 특징 및 이점은 다음의 상세한 설명 및 도면으로부터 그리고 청구범위로부터 명확하게 될 것이다.
도 1은 gRNA/Cas9 뉴클레아제 복합체가 그의 표적 DNA 부위에 결합되는 것을 개략적으로 도시한 도면. 가위는 게놈 DNA 표적 부위 상에서 Cas9 뉴클레아제의 대략의 절단 지점을 표시한다. 안내 RNA 상의 뉴클레오타이드의 넘버링은 5'으로부터 3'까지의 역방식으로 진행한다는 것을 주의한다.
도 2a는 gRNA의 5' 상보성 영역을 절단하기 위한 이유를 개략적으로 도시한 도면. 굵은 회색선 = 표적 DNA 부위, 얇은 진한 회색선 구조 = gRNA, 회색 타원 = Cas9 뉴클레아제, 검정색 선은 gRNA와 표적 DNA 부위 사이의 염기쌍을 나타낸다.
도 2b는 EGFP 붕괴 분석의 개략적 개요를 도시한 도면. 오류유발 NHEJ-매개된 수선에 의한 단일 통합 EGFP-PEST 리포터 유전자 내의 표적화된 Cas9-매개된 이중-가닥 파손의 수선은 암호 서열 및 세포 내 형광의 관련된 손실을 붕괴시키는 틀 이동 돌연변이를 야기한다.
도 2c 내지 도 2f는 (c) 단일 미스매치, (d) 인접한 이중 미스매치, (e) 가변적으로 간격을 둔 이중 미스매치, 및 (f) EGFP 리포터 유전자 서열 내 3개의 상이한 표적 부위 상에서 분석된 인접한 미스매치의 증가된 수를 보유하는, sgRNA를 보유하는 RGN의 활성을 도시한 도면. 복제물의 평균 활성(온라인 방법 참조)을 나타내고, 완전히 매칭된 단일 gRNA의 활성에 대해 정규화시킨다. 오차막대(Error bar)는 평균 표준오차를 나타낸다. 각각의 단일 gRNA에서 미스매칭된 위치를 아래쪽의 격자에서 회색으로 강조한다. 3개의 EGFP 표적 부위의 서열은 다음과 같았다:
EGFP 부위 1 GGGCACGGGCAGCTTGCCGGTGG(서열번호 1)
EGFP 부위 2 GATGCCGTTCTTCTGCTTGTCGG(서열번호 2)
EGFP 부위 3 GGTGGTGCAGATGAACTTCAGGG(서열번호 3)
도 2g는 gRNA의 5' 말단에서의 미스매치가 CRISPR/Cas를 3' 미스매치에 더 민감하게 만드는 것을 도시한 도면. 위치의 예외를 지니는 RNA와 DNA 사이의 gRNA 왓슨-크릭(Watson-Crick) 염기쌍은 왓슨-크릭 염기전환을 이용하여 미스매칭되는 "m"으로 표시된다(즉, EGFP 부위#2 M18 내지 19는 위치 18 및 19에서 gRNA를 그의 왓슨-크릭 상대로 바꿈으로써 미스매칭된다. gRNA의 5' 근처의 위치는 일반적으로 매우 잘 용인되지만, 이들 위치에서의 매치는 다른 잔기가 미스매칭될 때 뉴클레아제 활성에 중요하다. 모두 4개의 위치가 미스매칭될 때, 뉴클레아제 활성은 더 이상 검출가능하지 않다. 이는 추가로 이들 5' 위치에서의 매치가 다른 더 3'인 위치에서의 미스매치를 보상하게 할 수 있다는 것을 입증한다. 이들 실험은 코돈 최적화된 형태에 비해 뉴클레아제 활성의 더 낮은 절대 수준을 나타낼 수 있는 Cas9의 비-코돈 최적화된 형태에 의해 수행되었다.
도 2h는 인간 세포-기반 U2OS EGFP 붕괴 분석에서 15 내지 25개의 nt의 범위에 있는 가변 길이 상보성 영역을 보유하는 gRNA에 의해 지시되는 Cas9 뉴클레아제 활성의 효율을 도시한 도면. U6 프로모터로부터의 gRNA의 발현은 5' G의 존재를 필요로 하며, 따라서 표적 DNA 부위(15, 17, 19, 20, 21, 23 및 25개의 nt)에 대해 상보성의 특정 길이를 보유하는 gRNA를 단지 평가할 수 있었다.
도 3a는 Cas9에 의해 매개된 인간 세포에서의 EGFP 붕괴 효율 및 EGFP 리포터 유전자 내 4개의 표적 부위에 대한 전장 또는 단축된 gRNA를 도시한 도면. 상보성 영역 및 대응하는 표적 DNA 부위의 길이를 나타낸다. Ctrl = 상보성 영역을 결여하는 대조군 gRNA.
도 3b는 매칭된 표준 및 tru-RGN에 의해 7개의 상이한 인간 내인성 유전자 표적에서 도입된 표적화된 삽입결실 돌연변이의 효율. 상보성 영역 및 대응하는 표적 DNA 부위의 길이를 나타낸다. 삽입결실 빈도를 T7EI 분석에 의해 측정하였다. Ctrl = 상보성 영역을 결여하는 대조군 gRNA.
도 3c는 EMX1 부위에 대해 표적화된 tru-gRNA 또는 매칭된 전장 gRNA를 이용하여 RGN에 의해 유도된 삽입결실 돌연변이의 DNA 서열을 도시한 도면. gRNA 상보성 영역과 상호작용하는 표적 DNA 부위의 부분은 소문자로 나타내는 PAM 서열의 첫 번째 염기에 의해 회색으로 강조한다. 결실을 회색으로 강조한 파선에 의해 표시하고, 삽입은 회색으로 강조한 이탤릭체로 표시한다. 결실 또는 삽입된 염기의 순 갯수(net number) 및 각각의 서열을 단리시킨 횟수를 우측에 나타낸다.
도 3d는 매칭 표준 및 tru-RGN에 의해 2개의 내인성 인간 유전자에서 도입된 정확한 HDR/ssODN-매개된 변용(alteration)의 효율을 도시한 도면. BamHI 제한 분해 분석을 이용하여 HDR%를 측정하였다(실시예 2에 대한 실험 절차 참조). 대조군 gRNA = 비어있는 U6 프로모터 벡터.
도 3e는 U2OS.EGFP 세포를 고정된 양의 Cas9 발현 플라스미드와 함께 가변적 양의 전장 gRNA 발현 플라스미드(상부) 또는 tru-gRNA 발현 플라스미드(하부)를 이용하여 형질감염시키고, 이어서, 감소된 EGFP 발현으로 세포의 백분율에 대해 분석한 도면. 2회 중복 실험으로부터의 평균값을 평균의 표준 오차로 나타낸다. tru-gRNA에 의해 얻은 데이터는 이들 3개의 EGFP 표적 부위에 대한 tru-gRNA 플라스미드 대신 전장 gRNA 발현 플라스미드에 의해 수행한 실험으로부터의 데이터와 밀접하게 매칭된다는 것을 주의한다.
도 3f는 U2OS.EGFP 세포를 가변적 양의 전장 gRNA 발현 플라스미드(상부) 또는 tru-gRNA 발현 플라스미드(하부)(도 3e의 실험으로부터 각각 tru-gRNA에 대해 결정된 양)와 함께 가변적 양의 Cas9 발현 플라스미드로 형질감염시킨 것을 도시한 도면. 2회 중복 실험으로부터의 평균값을 평균의 표준 오차로 나타낸다. tru-gRNA로부터 얻은 데이터가 이들 3개의 EGFP 표적 부위에 대한 tru-gRNA 대신에 전장 gRNA 발현 플라스미드에 의해 수행한 실험으로부터의 데이터와 밀접하게 매칭된다는 것을 주의한다. 이들 적정의 결과는 EGFP 붕괴 분석에서 사용한 플라스미드의 농도를 실시예 1 및 2에서 수행한다.
도 4a 내지 도 4c는 RNA-안내 FokI 뉴클레아제 및 CRISPR/Cas 아형 Ypest 단백질 4(Csy4)-기반 다중복합 gRNA 발현 시스템을 도시한 도면.
(a) RNA-안내 FokI 뉴클레아제의 개략도. 2개의 FokI-dCas9 융합 단백질을 FokI 이량체화 및 DNA 절단을 용이하게 하기 위해 2개의 상이한 gRNA에 의해 인접한 표적 부위에 동원시켰다.
(b) Csy4-기반 다중복합 gRNA 발현 시스템의 개략도. 2개의 gRNA(임의의 5' 말단 뉴클레오타이드를 지님)를 Csy4 인식 부위에 측접하는 각각의 gRNA와 함께 U6 프로모터로부터의 단일 전사체에서 공동발현시켰다. Csy4를 절단하고 전사체로부터 gRNA를 방출한다. Csy4 인식 부위는 해당 부위에 결합되는 Csy4 뉴클레아제와 함께 gRNA의 3' 말단에 남아있다.
(c) 다중복합, Csy4-기반 시스템의 입증. EGFP 내 인접 부위에 표적화된 2개의 gRNA를 Csy4 및 Cas9 뉴클레아제와 함께 인간 U2OS.EGFP 세포에서 Csy4-기반 시스템을 이용하여 단일 RNA 전사체에서 발현시켰다. 이들 세포에서 유도된 삽입결실 돌연변이의 서열을 나타낸다. 야생형 서열을 상부에서 회색으로 강조한 표적 부위와 밑줄 표시한 내용으로 나타낸 PAM 서열 둘 다로 나타낸다. 결실을 회색 배경에 대해 파선으로 나타내고, 회색 배경에 대해 소문자로 삽입한다. 각각의 서열의 오른쪽에, 삽입(+) 또는 결실(△)의 크기를 명시한다.
도 5a 내지 도 5f는 RNA-안내 FokI 뉴클레아제의 설계 및 최적화를 도시한 도면.
(a) ZFN, TALEN, FokI-dCas9 융합 및 dCas9-FokI 융합의 개략적 도시.
(b) 두 배향 중 하나에서의 절반의 부위에 대해 표적화된 gRNA 쌍과 FokI-dCas9 융합의 EGFP 붕괴 활성의 선별: PAM 내부(좌측 패널) 및 PAM 외부(우측 패널). 절반의 부위를 0 내지 31bp의 범위에 있는 가변적 길이의 스페이서 서열에 의해 분리시켰다. EGFP 붕괴를 유세포 분석기에 의해 정량화시켰다, n = 1. dCas9-FokI 융합 및 동일한 gRNA 쌍에 대한 대응하는 데이터를 도 5e에 나타낸다.
(c) 절반의 부위가 PAM 외부로 배향되고, 스페이서 길이가 10 내지 20 bp의 범위에 있는 표적 부위에 대한 FokI-dCas9-매개된 EGFP 붕괴 활성의 추가적인 평가. EGFP 붕괴를 유세포 분석기에 의해 정량화하였다. 오차 막대는 평균의 표준 오차(s.e.m.), n = 2를 나타낸다.
(d) 스페이서 길이에 따라 그룹화한 (c)로부터의 데이터의 평균 EGFP 붕괴값. 오차 막대는 s.e.m을 나타낸다.
(e) 이들 플롯은 0 내지 31 bp의 간격 및 PAM 내부 및 PAM 외부 배향을 지니는 60종의 gRNA를 지니는 U2OS.EGFP 세포에서 EGFP 붕괴 분석에서 dCas9-FokI 활성에 대한 선별 결과를 나타낸다.
(f) U2OS 세포 내 FokI-dCas9 유도 돌연변이의 서열을 나타낸다. Cas9 또는 FokI-dCas9에 의해 결합되는 23-nt 표적 서열을 회색으로 표지한다. 프로토스페이서 인접 모티프 또는 PAM 서열을 밑줄과 함께 볼드체로 표시한다. 결실을 밝은 회색 배경 상에서 파선으로 표시한다. 삽입을 회색으로 강조한다. 삽입 또는 결실된 염기의 순 개수를 서열 우측의 열에 직접 표시한다.
도 6a 내지 도 6d는 FokI-dCas9 RFN의 이량체화가 효율적인 게놈 편집 활성에 필요하다는 것을 도시한 도면.
(a) 정확하게 표적화된 gRNA 쌍(EGFP 부위 47 및 81에 대해) 및 gRNA 중 하나 또는 다른 하나가 비-EGFP 서열에 대해 표적화된 다른 gRNA로 대체된 쌍(VEGFA 유전자에서)의 존재에서 평가한 두 RFN 쌍의 EGFP 붕괴 활성. EGFP 붕괴를 유세포 분석기에 의해 정량화하였다. EGFP, 향상된 녹색 형광 단백질; VEGFA, 혈관 내피 성장 인자 A. 오차 막대는 평균의 표준 오차(s.e.m.)를 나타낸다, n = 3.
(b) (a)의 EGFP 붕괴 분석에서 사용한 동일 세포로부터의 게놈 DNA를 이용하여 수행한 T7EI 분석에 의한 돌연변이유발 빈도의 정량화. 오차 막대는 s.e.m.을 나타낸다, n = 3.
(c) APC, MLH1 및 VEGFA 유전자 내 부위에 표적화된 RFN의 활성. 각각의 표적에 대해, 본 발명자들은 동족 gRNA의 쌍("좌측" 절반-부위에 대해 단지 하나의 gRNA, 또는 "우측" 절반-부위에 대해 단지 하나의 gRNA)과 함께 FokI-dCas9를 공동발현시켰다. 돌연변이유발률을 T7E1 분석에 의해 측정하였다. APC, 선종성 용종증 콜라이(Adenomatous polyposis coli); MLH1, mutL 상동체 1; VEGFA, 혈관표피성장인자 A. 오차막대는 s.e.m을 나타낸다, n = 3.
(d) 표적 상의 부위에서 그리고 VEGFA 부위 1을 표적화하기 위해 사용한 gRNA 중 하나에 대한5개의 이미 알려진 표적을 벗어난(OT) 부위에서 VEGFA 부위 1에 대패 표적화된 RFN의 돌연변이유발 빈도. 돌연변이 빈도를 심층 서열화(즉, 심층 서열분석)(deep sequencing)에 의해 결정하였다. 각각의 값을 3개의 독립적 형질감염 실험으로부터 모은 게놈 DNA로부터 제조한 단일 심층 서열화 라이브러리로부터 결정하였다. 표적 상의 VEGFA 부위 1(별표로 표시)에 대해 나타낸 값은 이하의 도 4a에 나타낸 것과 동일하며, 이 도면에 제시한 값과 용이한 비교를 위해 여기서만 나타낸다.
도 7a 내지 도 7b. 단일 gRNA와 함께 공동발현시킨 Cas9 틈내기효소(nickase) 또는 FokI-dCas9의 돌연변이유발 활성.
(a) 6개의 상이한 인간 유전자 부위에 대해 표적화된 1 또는 2개의 gRNA의 존재에서 FokI-dCas9(좌측 막대) 또는 Cas9 틈내기효소(중간 막대)에 의해 유도된 삽입결실 돌연변이 빈도. 각각의 유전자 표적에 대해, 본 발명자들은 gRNA 둘 다("좌측" 절반-부위에 대해 단지 하나의 gRNA 또는 "우측" 절반 부위에 대해 단지 다른 하나의 gRNA)에 의한 삽입결실을 평가하였다. 돌연변이 빈도를 심층 서열화에 의해 결정하였다. 보고한 각각의 삽입결실 빈도값을 3개의 독립적 형질감염 실험으로부터 풀링한 게놈 DNA로부터 제조한 단일 심층 서열화 라이브러리로부터 결정하였다. VEGFA, 혈관표피성장인자 A; DDB2, 손상-특이적 DNA 결합 단백질 2; FANCF, 판코니빈혈증, 상보성 그룹 F; FES, 고양이 육종 종양 유전자; RUNX 1, Runt-관련 전사 인자 1.
(b) gRNA에 의해 각각의 표적 부위에 대해 얻은 값을 각각의 단일 gRNA 실험과 또는 대조군 실험(gRNA 없음 및 Cas9 틈내기효소 없음 또는 FokI-dCas9)과 비교한 삽입결실 빈도의 배수적 감소로서 제시한 (a)로부터의 데이터. 이 배수적 감소를 FokI-dCas9(각각의 쌍에서 좌측 막대, 더 밝은 회색)와 Cas9 틈내기효소(각각의 쌍에서 우측 막대, 더 어두운 회색) 둘 다에 대해 계산하였다.
도 8a 내지 도 8c는 단일 Cas9 틈내기효소가 그들의 표적 부위 내로 고효율오 점돌연변이를 도입할 수 있음을 도시한 도면.
FokI-dCas9, Cas9 틈내기효소 또는 td토마토(tdTomato) 대조군의 존재에서 (a) VEGFA, (b) FANCF 및 (c) RUNX1 유전자 표적에 대해 단일 gRNA에 의해 표적화된 절반 부위에서의 각각의 위치에서 발견된 상이한 점돌연변이의 빈도. 심층 서열화에 의해 돌연변이 빈도를 결정하였다. 보고한 각각의 점돌연변이 값을 3가지의 독립적 형질감염 실험으로부터 풀링한 게놈 DNA로부터 제조한 단일 심층 서열화 라이브러리로부터 결정하였다. 이들 실험에 대해 사용한 게놈 DNA를 도 7a 내지 도 7b에서 삽입결실 돌연변이에 대해 분석한 동일한 세포로부터 단리시켰음을 주의한다. VEGFA, 혈관표피성장인자 A; FANCF, 판코니빈혈증, 상보성 그룹 F; RUNX 1, Runt-관련 전사 인자 1.
도 2a는 gRNA의 5' 상보성 영역을 절단하기 위한 이유를 개략적으로 도시한 도면. 굵은 회색선 = 표적 DNA 부위, 얇은 진한 회색선 구조 = gRNA, 회색 타원 = Cas9 뉴클레아제, 검정색 선은 gRNA와 표적 DNA 부위 사이의 염기쌍을 나타낸다.
도 2b는 EGFP 붕괴 분석의 개략적 개요를 도시한 도면. 오류유발 NHEJ-매개된 수선에 의한 단일 통합 EGFP-PEST 리포터 유전자 내의 표적화된 Cas9-매개된 이중-가닥 파손의 수선은 암호 서열 및 세포 내 형광의 관련된 손실을 붕괴시키는 틀 이동 돌연변이를 야기한다.
도 2c 내지 도 2f는 (c) 단일 미스매치, (d) 인접한 이중 미스매치, (e) 가변적으로 간격을 둔 이중 미스매치, 및 (f) EGFP 리포터 유전자 서열 내 3개의 상이한 표적 부위 상에서 분석된 인접한 미스매치의 증가된 수를 보유하는, sgRNA를 보유하는 RGN의 활성을 도시한 도면. 복제물의 평균 활성(온라인 방법 참조)을 나타내고, 완전히 매칭된 단일 gRNA의 활성에 대해 정규화시킨다. 오차막대(Error bar)는 평균 표준오차를 나타낸다. 각각의 단일 gRNA에서 미스매칭된 위치를 아래쪽의 격자에서 회색으로 강조한다. 3개의 EGFP 표적 부위의 서열은 다음과 같았다:
EGFP 부위 1 GGGCACGGGCAGCTTGCCGGTGG(서열번호 1)
EGFP 부위 2 GATGCCGTTCTTCTGCTTGTCGG(서열번호 2)
EGFP 부위 3 GGTGGTGCAGATGAACTTCAGGG(서열번호 3)
도 2g는 gRNA의 5' 말단에서의 미스매치가 CRISPR/Cas를 3' 미스매치에 더 민감하게 만드는 것을 도시한 도면. 위치의 예외를 지니는 RNA와 DNA 사이의 gRNA 왓슨-크릭(Watson-Crick) 염기쌍은 왓슨-크릭 염기전환을 이용하여 미스매칭되는 "m"으로 표시된다(즉, EGFP 부위#2 M18 내지 19는 위치 18 및 19에서 gRNA를 그의 왓슨-크릭 상대로 바꿈으로써 미스매칭된다. gRNA의 5' 근처의 위치는 일반적으로 매우 잘 용인되지만, 이들 위치에서의 매치는 다른 잔기가 미스매칭될 때 뉴클레아제 활성에 중요하다. 모두 4개의 위치가 미스매칭될 때, 뉴클레아제 활성은 더 이상 검출가능하지 않다. 이는 추가로 이들 5' 위치에서의 매치가 다른 더 3'인 위치에서의 미스매치를 보상하게 할 수 있다는 것을 입증한다. 이들 실험은 코돈 최적화된 형태에 비해 뉴클레아제 활성의 더 낮은 절대 수준을 나타낼 수 있는 Cas9의 비-코돈 최적화된 형태에 의해 수행되었다.
도 2h는 인간 세포-기반 U2OS EGFP 붕괴 분석에서 15 내지 25개의 nt의 범위에 있는 가변 길이 상보성 영역을 보유하는 gRNA에 의해 지시되는 Cas9 뉴클레아제 활성의 효율을 도시한 도면. U6 프로모터로부터의 gRNA의 발현은 5' G의 존재를 필요로 하며, 따라서 표적 DNA 부위(15, 17, 19, 20, 21, 23 및 25개의 nt)에 대해 상보성의 특정 길이를 보유하는 gRNA를 단지 평가할 수 있었다.
도 3a는 Cas9에 의해 매개된 인간 세포에서의 EGFP 붕괴 효율 및 EGFP 리포터 유전자 내 4개의 표적 부위에 대한 전장 또는 단축된 gRNA를 도시한 도면. 상보성 영역 및 대응하는 표적 DNA 부위의 길이를 나타낸다. Ctrl = 상보성 영역을 결여하는 대조군 gRNA.
도 3b는 매칭된 표준 및 tru-RGN에 의해 7개의 상이한 인간 내인성 유전자 표적에서 도입된 표적화된 삽입결실 돌연변이의 효율. 상보성 영역 및 대응하는 표적 DNA 부위의 길이를 나타낸다. 삽입결실 빈도를 T7EI 분석에 의해 측정하였다. Ctrl = 상보성 영역을 결여하는 대조군 gRNA.
도 3c는 EMX1 부위에 대해 표적화된 tru-gRNA 또는 매칭된 전장 gRNA를 이용하여 RGN에 의해 유도된 삽입결실 돌연변이의 DNA 서열을 도시한 도면. gRNA 상보성 영역과 상호작용하는 표적 DNA 부위의 부분은 소문자로 나타내는 PAM 서열의 첫 번째 염기에 의해 회색으로 강조한다. 결실을 회색으로 강조한 파선에 의해 표시하고, 삽입은 회색으로 강조한 이탤릭체로 표시한다. 결실 또는 삽입된 염기의 순 갯수(net number) 및 각각의 서열을 단리시킨 횟수를 우측에 나타낸다.
도 3d는 매칭 표준 및 tru-RGN에 의해 2개의 내인성 인간 유전자에서 도입된 정확한 HDR/ssODN-매개된 변용(alteration)의 효율을 도시한 도면. BamHI 제한 분해 분석을 이용하여 HDR%를 측정하였다(실시예 2에 대한 실험 절차 참조). 대조군 gRNA = 비어있는 U6 프로모터 벡터.
도 3e는 U2OS.EGFP 세포를 고정된 양의 Cas9 발현 플라스미드와 함께 가변적 양의 전장 gRNA 발현 플라스미드(상부) 또는 tru-gRNA 발현 플라스미드(하부)를 이용하여 형질감염시키고, 이어서, 감소된 EGFP 발현으로 세포의 백분율에 대해 분석한 도면. 2회 중복 실험으로부터의 평균값을 평균의 표준 오차로 나타낸다. tru-gRNA에 의해 얻은 데이터는 이들 3개의 EGFP 표적 부위에 대한 tru-gRNA 플라스미드 대신 전장 gRNA 발현 플라스미드에 의해 수행한 실험으로부터의 데이터와 밀접하게 매칭된다는 것을 주의한다.
도 3f는 U2OS.EGFP 세포를 가변적 양의 전장 gRNA 발현 플라스미드(상부) 또는 tru-gRNA 발현 플라스미드(하부)(도 3e의 실험으로부터 각각 tru-gRNA에 대해 결정된 양)와 함께 가변적 양의 Cas9 발현 플라스미드로 형질감염시킨 것을 도시한 도면. 2회 중복 실험으로부터의 평균값을 평균의 표준 오차로 나타낸다. tru-gRNA로부터 얻은 데이터가 이들 3개의 EGFP 표적 부위에 대한 tru-gRNA 대신에 전장 gRNA 발현 플라스미드에 의해 수행한 실험으로부터의 데이터와 밀접하게 매칭된다는 것을 주의한다. 이들 적정의 결과는 EGFP 붕괴 분석에서 사용한 플라스미드의 농도를 실시예 1 및 2에서 수행한다.
도 4a 내지 도 4c는 RNA-안내 FokI 뉴클레아제 및 CRISPR/Cas 아형 Ypest 단백질 4(Csy4)-기반 다중복합 gRNA 발현 시스템을 도시한 도면.
(a) RNA-안내 FokI 뉴클레아제의 개략도. 2개의 FokI-dCas9 융합 단백질을 FokI 이량체화 및 DNA 절단을 용이하게 하기 위해 2개의 상이한 gRNA에 의해 인접한 표적 부위에 동원시켰다.
(b) Csy4-기반 다중복합 gRNA 발현 시스템의 개략도. 2개의 gRNA(임의의 5' 말단 뉴클레오타이드를 지님)를 Csy4 인식 부위에 측접하는 각각의 gRNA와 함께 U6 프로모터로부터의 단일 전사체에서 공동발현시켰다. Csy4를 절단하고 전사체로부터 gRNA를 방출한다. Csy4 인식 부위는 해당 부위에 결합되는 Csy4 뉴클레아제와 함께 gRNA의 3' 말단에 남아있다.
(c) 다중복합, Csy4-기반 시스템의 입증. EGFP 내 인접 부위에 표적화된 2개의 gRNA를 Csy4 및 Cas9 뉴클레아제와 함께 인간 U2OS.EGFP 세포에서 Csy4-기반 시스템을 이용하여 단일 RNA 전사체에서 발현시켰다. 이들 세포에서 유도된 삽입결실 돌연변이의 서열을 나타낸다. 야생형 서열을 상부에서 회색으로 강조한 표적 부위와 밑줄 표시한 내용으로 나타낸 PAM 서열 둘 다로 나타낸다. 결실을 회색 배경에 대해 파선으로 나타내고, 회색 배경에 대해 소문자로 삽입한다. 각각의 서열의 오른쪽에, 삽입(+) 또는 결실(△)의 크기를 명시한다.
도 5a 내지 도 5f는 RNA-안내 FokI 뉴클레아제의 설계 및 최적화를 도시한 도면.
(a) ZFN, TALEN, FokI-dCas9 융합 및 dCas9-FokI 융합의 개략적 도시.
(b) 두 배향 중 하나에서의 절반의 부위에 대해 표적화된 gRNA 쌍과 FokI-dCas9 융합의 EGFP 붕괴 활성의 선별: PAM 내부(좌측 패널) 및 PAM 외부(우측 패널). 절반의 부위를 0 내지 31bp의 범위에 있는 가변적 길이의 스페이서 서열에 의해 분리시켰다. EGFP 붕괴를 유세포 분석기에 의해 정량화시켰다, n = 1. dCas9-FokI 융합 및 동일한 gRNA 쌍에 대한 대응하는 데이터를 도 5e에 나타낸다.
(c) 절반의 부위가 PAM 외부로 배향되고, 스페이서 길이가 10 내지 20 bp의 범위에 있는 표적 부위에 대한 FokI-dCas9-매개된 EGFP 붕괴 활성의 추가적인 평가. EGFP 붕괴를 유세포 분석기에 의해 정량화하였다. 오차 막대는 평균의 표준 오차(s.e.m.), n = 2를 나타낸다.
(d) 스페이서 길이에 따라 그룹화한 (c)로부터의 데이터의 평균 EGFP 붕괴값. 오차 막대는 s.e.m을 나타낸다.
(e) 이들 플롯은 0 내지 31 bp의 간격 및 PAM 내부 및 PAM 외부 배향을 지니는 60종의 gRNA를 지니는 U2OS.EGFP 세포에서 EGFP 붕괴 분석에서 dCas9-FokI 활성에 대한 선별 결과를 나타낸다.
(f) U2OS 세포 내 FokI-dCas9 유도 돌연변이의 서열을 나타낸다. Cas9 또는 FokI-dCas9에 의해 결합되는 23-nt 표적 서열을 회색으로 표지한다. 프로토스페이서 인접 모티프 또는 PAM 서열을 밑줄과 함께 볼드체로 표시한다. 결실을 밝은 회색 배경 상에서 파선으로 표시한다. 삽입을 회색으로 강조한다. 삽입 또는 결실된 염기의 순 개수를 서열 우측의 열에 직접 표시한다.
도 6a 내지 도 6d는 FokI-dCas9 RFN의 이량체화가 효율적인 게놈 편집 활성에 필요하다는 것을 도시한 도면.
(a) 정확하게 표적화된 gRNA 쌍(EGFP 부위 47 및 81에 대해) 및 gRNA 중 하나 또는 다른 하나가 비-EGFP 서열에 대해 표적화된 다른 gRNA로 대체된 쌍(VEGFA 유전자에서)의 존재에서 평가한 두 RFN 쌍의 EGFP 붕괴 활성. EGFP 붕괴를 유세포 분석기에 의해 정량화하였다. EGFP, 향상된 녹색 형광 단백질; VEGFA, 혈관 내피 성장 인자 A. 오차 막대는 평균의 표준 오차(s.e.m.)를 나타낸다, n = 3.
(b) (a)의 EGFP 붕괴 분석에서 사용한 동일 세포로부터의 게놈 DNA를 이용하여 수행한 T7EI 분석에 의한 돌연변이유발 빈도의 정량화. 오차 막대는 s.e.m.을 나타낸다, n = 3.
(c) APC, MLH1 및 VEGFA 유전자 내 부위에 표적화된 RFN의 활성. 각각의 표적에 대해, 본 발명자들은 동족 gRNA의 쌍("좌측" 절반-부위에 대해 단지 하나의 gRNA, 또는 "우측" 절반-부위에 대해 단지 하나의 gRNA)과 함께 FokI-dCas9를 공동발현시켰다. 돌연변이유발률을 T7E1 분석에 의해 측정하였다. APC, 선종성 용종증 콜라이(Adenomatous polyposis coli); MLH1, mutL 상동체 1; VEGFA, 혈관표피성장인자 A. 오차막대는 s.e.m을 나타낸다, n = 3.
(d) 표적 상의 부위에서 그리고 VEGFA 부위 1을 표적화하기 위해 사용한 gRNA 중 하나에 대한5개의 이미 알려진 표적을 벗어난(OT) 부위에서 VEGFA 부위 1에 대패 표적화된 RFN의 돌연변이유발 빈도. 돌연변이 빈도를 심층 서열화(즉, 심층 서열분석)(deep sequencing)에 의해 결정하였다. 각각의 값을 3개의 독립적 형질감염 실험으로부터 모은 게놈 DNA로부터 제조한 단일 심층 서열화 라이브러리로부터 결정하였다. 표적 상의 VEGFA 부위 1(별표로 표시)에 대해 나타낸 값은 이하의 도 4a에 나타낸 것과 동일하며, 이 도면에 제시한 값과 용이한 비교를 위해 여기서만 나타낸다.
도 7a 내지 도 7b. 단일 gRNA와 함께 공동발현시킨 Cas9 틈내기효소(nickase) 또는 FokI-dCas9의 돌연변이유발 활성.
(a) 6개의 상이한 인간 유전자 부위에 대해 표적화된 1 또는 2개의 gRNA의 존재에서 FokI-dCas9(좌측 막대) 또는 Cas9 틈내기효소(중간 막대)에 의해 유도된 삽입결실 돌연변이 빈도. 각각의 유전자 표적에 대해, 본 발명자들은 gRNA 둘 다("좌측" 절반-부위에 대해 단지 하나의 gRNA 또는 "우측" 절반 부위에 대해 단지 다른 하나의 gRNA)에 의한 삽입결실을 평가하였다. 돌연변이 빈도를 심층 서열화에 의해 결정하였다. 보고한 각각의 삽입결실 빈도값을 3개의 독립적 형질감염 실험으로부터 풀링한 게놈 DNA로부터 제조한 단일 심층 서열화 라이브러리로부터 결정하였다. VEGFA, 혈관표피성장인자 A; DDB2, 손상-특이적 DNA 결합 단백질 2; FANCF, 판코니빈혈증, 상보성 그룹 F; FES, 고양이 육종 종양 유전자; RUNX 1, Runt-관련 전사 인자 1.
(b) gRNA에 의해 각각의 표적 부위에 대해 얻은 값을 각각의 단일 gRNA 실험과 또는 대조군 실험(gRNA 없음 및 Cas9 틈내기효소 없음 또는 FokI-dCas9)과 비교한 삽입결실 빈도의 배수적 감소로서 제시한 (a)로부터의 데이터. 이 배수적 감소를 FokI-dCas9(각각의 쌍에서 좌측 막대, 더 밝은 회색)와 Cas9 틈내기효소(각각의 쌍에서 우측 막대, 더 어두운 회색) 둘 다에 대해 계산하였다.
도 8a 내지 도 8c는 단일 Cas9 틈내기효소가 그들의 표적 부위 내로 고효율오 점돌연변이를 도입할 수 있음을 도시한 도면.
FokI-dCas9, Cas9 틈내기효소 또는 td토마토(tdTomato) 대조군의 존재에서 (a) VEGFA, (b) FANCF 및 (c) RUNX1 유전자 표적에 대해 단일 gRNA에 의해 표적화된 절반 부위에서의 각각의 위치에서 발견된 상이한 점돌연변이의 빈도. 심층 서열화에 의해 돌연변이 빈도를 결정하였다. 보고한 각각의 점돌연변이 값을 3가지의 독립적 형질감염 실험으로부터 풀링한 게놈 DNA로부터 제조한 단일 심층 서열화 라이브러리로부터 결정하였다. 이들 실험에 대해 사용한 게놈 DNA를 도 7a 내지 도 7b에서 삽입결실 돌연변이에 대해 분석한 동일한 세포로부터 단리시켰음을 주의한다. VEGFA, 혈관표피성장인자 A; FANCF, 판코니빈혈증, 상보성 그룹 F; RUNX 1, Runt-관련 전사 인자 1.
CRISPR RNA-안내 뉴클레아제(RGN)는 게놈 편집에 대한 손쉽고 효율적인 플랫폼으로서 빠르게 나타났다. 마라피니(Marraffini) 및 동료(Jiang et al., Nat Biotechnol 31, 233-239 (2013))는 최근에 박테리아에서 Cas9 RGN 특이성의 체계적인 조사를 수행하였지만, 인간 세포에서 RGN의 특이성은 광범위하게 정의되지 않았다. 인간 및 다른 진핵세포에서 RGN-매개된 표적을 벗어난 효과의 범주를 이해하는 것은, 이들 뉴클레아제가 연구 및 치료 적용을 위해 널리 사용되어야 한다면 결정적으로 필수적일 것이다. 본 발명자들은 Cas9-기반 RGN의 표적을 벗어난 절단을 특성규명하기 위해 인간 세포-기반 수용체 분석을 사용하였다. 단일 및 이중 미스매치는 안내 RNA(gRNA)-DNA 계면을 따라 그들의 위치에 따라서 다른 정도로 용인되었다. 인간 세포에서 내인성 좌위에 대해 표적화된 6개의 RGN 중 4개에 의해 유도된 표적을 벗어난 변용은 부분적으로 미스매치된 부위의 시험에 의해 용이하게 검출되었다. 동정된 표적을 벗어난 부위는 5개까지의 미스매치를 보유하며, 다수는 의도된 표적 상의 부위에서 관찰된 것과 비슷한(또는 더 높은) 빈도로 돌연변이유발된다. 따라서, RGN은 인간 세포에서 불안전하게 매칭된 RNA-DNA 계면에 의할 때조차 고도로 활성이며, 이는 연구 및 치료 적용분야에서 그들의 용도를 혼동하게 할 수 있는 발견이다.
본 명세서에 기재한 결과는 임의의 주어진 RGN의 특이성 프로파일이 단순하지도 또는 간단하지도 않다는 예측을 나타낸다. EGFP 리포터 분석 실험은 단일 및 이중 미스매치가 표적 부위 내에서 그들의 위치(들)에 엄격히 의존하지 않는 인간 세포 내 RGN 활성에 대해 가변적 효과를 가질 수 있다는 것을 나타낸다. 예를 들어, 앞서 공지된 보고와 일치되게, gRNA/DNA 계면의 3' 절반에서의 변용은 일반적으로 5' 절반에서의 변용보다 더 큰 효과를 가지지만(Jiang et al., Nat Biotechnol 31, 233-239 (2013); Cong et al., Science 339, 819-823 (2013); Jinek et al., Science 337, 816-821 (2012)); 그러나, 3' 말단에서의 단일 및 이중 돌연변이는 때때로 또한 잘 용인되는 것으로 나타난 반면, 5' 말단에서의 이중 돌연변이는 활성을 크게 약화시킬 수 있다. 추가로, 임의의 주어진 위치(들)에서 미스매치에 대한 이들 효과의 규모는 부위-의존적인 것으로 나타난다. 모든 가능한 뉴클레오타이드 치환의 시험(본 발명자들의 EGFP 리포터 실험에서 사용한 왓슨-크릭 염기전환을 능가)을 이용한 일련의 다수 RGN의 종합적인 프로파일링은 잠재적인 표적을 벗어난 범위 내로 추가적인 통찰력을 제공하게 할 수 있다. 이와 관련하여, 마라피니와 동료들의 최근에 기재한 박테리아 세포기반 방법(Jiang et al., Nat Biotechnol 31, 233-239 (2013)) 또는 리우(Liu) 및 동료에 의해 앞서 적용된 시험관내 조합적 라이브러리 기반 절단 부위-선택 방법(Pattanayak et al., Nat Methods 8, 765-770 (2011))은 RGN 특이성 프로파일의 더 큰 세트를 생성하는데 유용할 수 있다.
RGN 특이성을 종합적으로 예측함에 있어서 이들 도전에도 불구하고, 1 내지 5개의 미스매치에 의해 표적 상의 부위와 상이한 게놈 부위의 서브세트를 시험함으로써 진정한 표적을 벗어난 RGN을 동정할 수 있었다. 특히, 이들 실험의 조건 하에서, 다수의 이들 표적을 벗어난 부위에서 RGN-유도 돌연변이의 빈도는 의도된 표적 상의 부위에서 관찰된 것과 유사하였고(또는 더 높았고), 이는 T7EI 분석(본 발명자들의 실험실에서 수행한 바와 같이, 신뢰가능한 검출하한 ~2 내지 5% 돌연변이 빈도를 가짐)을 이용하여 이들 부위에서의 돌연변이 검출을 가능하게 한다. 이들 돌연변이율은 매우 높기 때문에, 이는 훨씬 더 낮은 빈도의 ZFN- 및 TALEN-유도 표적을 벗어난 변용을 검출하기 위해 이전에 필요로 되었던 심층 서열화 방법을 이용하여 회피할 수 있었다(Pattanayak et al., Nat Methods 8, 765-770 (2011); Perez et al., Nat Biotechnol 26, 808-816 (2008); Gabriel et al., Nat Biotechnol 29, 816-823 (2011); Hockemeyer et al., Nat Biotechnol 29, 731-734 (2011)). 인간 세포에서의 RGN 표적을 벗어난 돌연변이유발의 분석은 RGN 특이성 예측의 곤란함을 확인하였고 - 모든 단일 및 이중 미스매칭된 표적을 벗어난 부위가 돌연변이의 증거를 나타내지는 않는 반면, 5개만큼의 미스매치를 지니는 일부 부위는 또한 변용을 나타낼 수 있다. 더 나아가, 동정된 진실된 표적을 벗어난 부위는 의도된 표적 서열에 대해 전이 또는 염기전환 차이에 대한 임의의 분명한 바이어스를 나타내지 않는다.
표적을 벗어난 부위로 다수의 RGN을 알 수 있었지만, 이들 부위의 동정은 규모가 포괄적이지도 전장 게놈적(genome-wide)이지도 않았다. 연구한 6개의 RGN에 대해, 인간 게놈 내 잠재적인 표적을 벗어난 서열의 훨씬 더 큰 총수의 매우 작은 서브세트만을 시험하였다. T7EI 분석에 의해 표적을 벗어난 돌연변이의 이러한 매우 다수의 좌위를 시험하는 것은 실행적인 전략이지도 또는 비용 효과적인 전략이지도 않지만, 장래 연구에서의 고속대량 서열화는 매우 다수의 후보 표적을 벗어난 부위에 의문을 가질 수 있게 하며, 진정한 표적을 벗어난 돌연변이를 검출하기 위한 더 민감한 방법을 제공한다. 예를 들어, 이러한 접근은 본 발명자들이 임의의 표적을 벗어난 돌연변이를 아우르지 못한 2개의 RGN에 대해 추가적인 표적을 벗어난 부위를 밝힐 수 있게 한다. 추가로, 세포 내에서 RGN 활성에 영향을 미칠 수 있는 RGN 특이성의 그리고 임의의 후성적(epigenomic) 인자(예를 들어, DNA 메틸화 및 염색질 상태) 둘 다의 개선된 이해가 또한 시험될 필요가 있는 잠재적 부위의 수를 감소시키며, 이에 의해 더 실행적이고 알맞은 표적을 벗어난 RGN의 전장 게놈 평가를 하게 할 수 있다.
다수의 전략은 게놈의 표적을 벗어난 돌연변이의 빈도를 최소화하도록 사용될 수 있다. 예를 들어, RGN 표적 부위의 특이적 선택은 최적화될 수 있으며; 의도된 표적 부위로부터 위치가 5개까지 상이한 표적을 벗어난 부위가 RGN에 의해 효율적으로 돌연변이될 수 있다는 것을 고려하면, 미스매칭 계수화에 의해 판단되는 바와 같은 최소 수의 표적을 벗어난 부위를 지니는 표적 부위를 선택하는 것은 효과적이 될 가능성이 없는 것으로 보이고; 20bp RNA:DNA 상보성 영역 내에서 4 또는 5개의 위치만큼 상이한 수천개의 잠재적인 표적을 벗어난 부위는 전형적으로 인간 게놈에서 서열에 대해 표적화된 임의의 주어진 RGN에 대해 존재할 것이다. 또한 gRNA 상보성 영역의 뉴클레오타이드 함량은 잠재적인 표적을 벗어난 효과 범위에 영향을 미칠 수 있는 가능성이 있다. 예를 들어, 고 GC-함량은 RNA:DNA 혼성체를 안정화시키는 것으로 나타났고(Sugimoto et al., Biochemistry 34, 11211-11216 (1995)) 따라서 gRNA/게놈 DNA 혼성화를 미스매칭에 대해 더 안정하고 더 용인되도록 만드는 것으로 예상될 수 있다. 매우 다수의 gRNA를 이용하는 추가적인 실험은 이들 두 파라미터(게놈 내 미스매칭 부위의 수 및 RNA:DNA 혼성체의 안정성)가 RGN의 전장 게놈 특이성에 영향을 미치는지 여부 및 영향을 미치는 방법을 평가하는데 필요할 것이다. 그러나, 이러한 예측 파라미터가 정의됨에도 불구하고, 이러한 가이드라인을 실행하는 효과가 RGN의 표적화 범위를 추가로 제한한다는 것을 주의하는 것은 중요하다.
RGN-유도 표적을 벗어난 효과를 감소시키기 위한 하나의 잠재적인 일반적 전략은 세포 내에서 발현된 gRNA 및 Cas9 뉴클레아제의 농도를 감소시킬 수 있다. 이 생각은 U2OS.EGFP 세포 내 VEGFA 표적 부위 2 및 3에 대해 RGN을 이용하여 시험되었고; 더 적은 gRNA- 및 Cas9-발현 플라스미드를 형질감염시키는 것은 표적 상의 부위에서 돌연변이율을 감소시켰지만, 상대적 비율의 표적을 벗어난 돌연변이를 인식가능하게 변화시키지 않았다. 이와 일치되게, 표적 상의 돌연변이유발의 절대적인 비율이 U2OS.EGFP 세포에서 보다 더 낮다고 해도, 고수준의 표적을 벗어난 돌연변이유발률이 또한 2개의 다른 인간 세포 유형에서 관찰되었다(HEK293 및 K562 세포). 따라서, 세포 내에서 gRNA 및 Cas9 의 발현 수준의 감소는 표적을 벗어난 효과를 감소시키기 위한 용액을 제공할 가능성이 없다. 더 나아가, 이들 결과는 또한 인간 세포에서 관찰된 고비율의 표적을 벗어난 돌연변이유발이 gRNA 및/또는 Cas9의 과발현에 의해 야기되지 않는다는 것을 시사한다.
상당한 표적을 벗어난 돌연변이유발이 3종의 상이한 인간 세포 유형에서 RGN에 의해 유도될 수 있다는 발견은 이 게놈-편집 플랫폼의 더 광범위한 사용을 위한 중요한 암시를 가진다. 연구 적용을 위해, 고빈도의 표적을 벗어난 돌연변이의 잠재적으로 혼재하는 효과는 특히 원치않는 변용의 이종교배가 시험감염되는 동안의 느린 세대 시간(generation time)으로 배양 세포 또는 유기체를 수반하는 실험을 위해 고려될 필요가 있을 것이다. 이러한 효과를 제어하는 일 방법은 동일한 게놈 변용을 유도하는 상이한 DNA 서열에 대해 다수의 RGN을 이용하는 것일 수 있는데, 표적을 벗어난 효과가 무작위는 아니지만, 대신 표적화된 부위와 관련되기 때문이다. 그러나, 치료적 적용을 위해, 이들 발견은 이들 뉴클레아제가 인간 질환의 치료를 위해 더 장기간에 안정하게 사용되는 것이라면, RGN의 특이성이 신중하게 정해지고/정해지거나 개선될 필요가 있다는 것을 명확하게 나타낸다.
특이성을 개선시키는 방법
본 명세서에 나타내는 바와 같은, 스트렙토코커스 피오게네스 Cas9 단백질에 기반한 CRISPR-Cas RNA-안내 뉴클레아제는 의도된 표적 상의 활성과 비슷하거나 또는 더 높은 상당한 표적을 벗어난 돌연변이유발 효과일 수 있다(실시예 1). 이러한 표적을 벗어난 효과는 연구에 대해, 특히, 잠재적 치료 적용에 대해 문제가 있을 수 있다. 따라서, CRISPR-Cas RNA 안내 뉴클레아제(RGN)의 특이성을 개선시키는 방법이 필요하다.
실시예 1에 기재하는 바와 같이, Cas9 RGN는 인간 세포 내 표적을 벗어난 부위에서 고빈도의 삽입결실 돌연변이를 유도할 수 있다(또한 문헌[Cradick et al., 2013; Fu et al., 2013; Hsu et al., 2013; Pattanayak et al., 2013] 참조). 이들 원치않는 변용은 의도된 표적 상의 부위로부터 5개 미스매치만큼 다른 게놈 서열에서 생길 수 있다(실시예 1 참조). 추가로, gRNA 상보성 영역의 5' 말단에서의 미스매치는 일반적으로 3' 말단에서의 미스매치보다 더 잘 용인되지만, 이런 관련들은 절대적이지 않으며, 부위에 따른 의존을 나타낸다(실시예 1 및 문헌[Fu et al., 2013; Hsu et al., 2013; Pattanayak et al., 2013] 참조). 그 결과, 미스매치의 수 및/또는 위치에 의존하는 컴퓨터 계산 방법은 현재 진정한 표적을 벗어난 부위를 동정하기 위한 예측값으로 제한되었다. 따라서, RNA-안내 뉴클레아제가 연구 및 치료적 적용을 위해 사용되어야 한다면, 표적을 벗어난 돌연변이의 빈도를 감소시키는 방법은 중요한 우위로 남아있다.
이량체화는 Cas9 뉴클레아제의 특이성을 개선시키기 위한 매력적인 잠재적 전략이다. 이는 진정한 이량체 시스템이 아닌 짝지어진 Cas9 틈내기효소 접근과 별개이다. 짝지어진 틈내기효소는 DNA의 2개의 Cas9 틈내기효소를 공동국소화시키고, 이에 의해 정해지지 않은 메커니즘을 통해 고효율 게놈 편집을 유도함으로써 작용한다. 이량체화는 효소적 활성에 필요하지 않기 때문에, 단일 Cas9 틈내기효소는 또한 (알려지지 않은 메커니즘을 통해) 특정 부위에서 고효율로 삽입결실을 유도할 수 있고, 따라서 게놈 내 원치 않는 표적을 벗어난 돌연변이를 잠재적으로 야기할 수 있다.
따라서, RGN의 특이성을 개선시키기 위한 하나의 전략은 D10A 및 H840A 돌연변이를 보유하는 Cas 9의 촉매적 불활성 형태(또는 dCas9로서 알려짐)에 FokI 엔도뉴클레아제 도메인을 융합시키는 것이다. FokI 뉴클레아제 도메인은 이량체로서 기능하고, 따라서 이중-가닥 파손을 유도하기 위해 DNA의 동일 국소 조각에 2개의 서브유닛이 동원되어야 한다. 이 입체형태에서(도 9A 및 실시예 2), 2개의 FokI-dCas9 융합은 2개의 상이한 gRNA를 이용하여 적절한 입체배치에서 동원되어 이중-가닥 파손을 수득한다. 따라서, 이 시스템에서, FokI-dCas9 융합은 단일 RGN의 부위보다 2배 길이인 부위에 결합하며, 따라서 이 시스템은 더 특이적이 되는 것으로 예상된다.
따라서 FokI-dCas9 융합 단백질이 본 명세서에서 제공되되, FokI 서열은 선택적으로 개재 링커, 예를 들어, 2 내지 30개의 아미노산, 예를 들어, 4 내지 12개의 아미노산, 예를 들어, Gly4Ser(서열번호 23) 또는 (Gly4Ser)3의 링커를 개재해서 dCas9에(바람직하게는 dCas9의 아미노-말단 단부이지만, 또한 선택적으로는 카복실 말단에) 융합된다. 일부 실시형태에서, 융합 단백질은 dCas9와 FokI 도메인 사이에 링커를 포함한다. 이들 융합 단백질에서(또는 연쇄된 구조에서의 융합 단백질 사이에서) 사용될 수 있는 링커는 융합 단백질의 기능을 방해하지 않는 임의의 서열을 포함할 수 있다. 바람직한 실시형태에서, 링커는 짧으며, 예를 들어, 2 내지 20개의 아미노산이고, 전형적으로 가요성이다(즉, 글라이신, 알라닌 및 세린과 같이 고자유도를 지니는 아미노산을 포함함). 일부 실시형태에서, 링커는 GGGS(서열번호 22) 또는 GGGGS(서열번호 23)로 이루어진 하나 이상의 단위, 예를 들어, GGGS(서열번호 22) 또는 GGGGS(서열번호 23) 단위의 2, 3, 4개 이상의 반복부를 포함한다. 다른 링커 서열이 또한 사용될 수 있다.
또한 단지 공동-국소화보다는 이량체화가 효율적인 게놈 편집 활성에 필요한 RNA-안내 FokI 뉴클레아제 플랫폼이 본 명세서에 기재된다. 이들 뉴클레아제는 인간 세포 내에서 고도로 효율적인 게놈 편집을 강하게 매개할 수 있으며, 민감한 심층 서열화 방법에 의해 판단되는 바와 같이 표적을 벗어난 돌연변이를 감소시킬 수 있다. 또한 임의의 5' 말단 뉴클레오타이드를 지니는 gRNA의 쌍을 발현시키기 위한 효율적인 시스템, RFN 플랫폼 상에서 더 넓은 표적화 범위를 부여하는 방법이 기재된다. 최종적으로, 단량체 Cas9 틈내기효소는 일반적으로 단일 gRNA의 존재 하에 본 명세서에 기재된 뉴클레아제보다 더 바람직하지 않은 삽입결실 및 점돌연변이를 도입한다. 이들 결과는 가장 높은 가능한 게놈 편집 정확성을 필요로 하는 연구 또는 치료적 적용을 위해 중요하게 될 특징인 잘 특성규명된 이량체 구조 및 짝지어진 Cas9 틈내기효소에 비해 개선된 돌연변이유발 프로파일의 특이성 이점을 지니는 강하고, 사용하기 위운 플랫폼을 정한다.
따라서, 새로운 RNA-안내 FokI 뉴클레아제(RFN) 플랫폼은 인간 세포에서 강하고 고도로 특이성인 게놈 편집을 수행하기 위해 본 명세서에 기재된다. RFN은 활성을 위한 2개의 gRNA를 필요로 하며 이량체로서 기능한다. 놀랍게도, 활성 RFN의 공학적 조작은 FokI 도메인이 유전자 조작된 아연 핑거 또는 전사 활성제-유사 효과기 반복부 배열의 카복시-말단 단부에 융합되는 ZFN 및 TALEN과 상이한 구조인 dCas9 단백질의 아미노-말단 단부에 FokI 뉴클레아제 도메인의 융합을 필요로 하였다. RFN은 또한 (활성이 추가적인 간격에서 가능할 수 있지만, 그러나 일관된 성공이 더 적다고 해도) 각각의 Fok-dCas9/gRNA 복합체에 의해 결합되는 절반의 부위가 14 내지 17 bp의 상대적으로 제한된 개재 스페이서 길이를 지니는 특정 상대적 배향(PAM 외부)을 가지는 것을 필요로 한다.
RFN의 이량체 특성은 표준 단량체 Cas9 뉴클레아제에 대해 중요한 특이성 이점을 제공한다. 이상적인 이량체 시스템에서, 거의 내지 전혀 없는 활성은 절반-부위에 상에서 단량체가 관찰될 것이다. 본 데이터는 단일 gRNA에 의해 지시되는 FokI-dCas9가 RFN 절반 부위에서 돌연변이유발을 매우 적게 유도하거나 또는 거의 유도하지 않는다는 것을 입증한다. 12개의 단일 gRNA(6개의 RFN 표적 부위에 대해)은 공동발현시킨 FokI-dCas9와 함께 시험되고, 삽입결실은 매우 저빈도로(0.0045% 내지 0.47%의 범위), 일부 경우에 NA 또는 뉴클레아제의 발현이 없었던 대조군 세포에서 관찰된 배경 비율만큼 낮은 수준으로 관찰되었다. FokI 뉴클레아제 도메인이 이량체로서 기능하는 것을 고려하면, 단일 gRNA에 의해 관찰된 임의의 삽입결실은 DNA에 대한 FokI-dCas9 이량체의 동원에 기인할 가능성이 있는 것으로 추정된다. 메거니즘에도 불구하고, FokI-dCas9를 12개의 표적 상의 절반의 부위에서 단일 gRNA와 함께 시험하였을 때, 매우 저수준의 돌연변이유발만이 관찰된 것을 고려하면, 임의의 돌연변이유발이 부분적으로 미스매칭된 표적을 벗어난 절반 부위에서 유도될 가능성은 매우 적다. 사실, VEGFA에 표적화된 RFN은 심층 서열화에 의해 판단되는 바와 같은 gRNA 중 하나의 공지된 표적을 벗어난 부위에서 검출가능한 돌연변이를 유도하지 않았다.
RFN이 진정한 이량체 시스템이기 때문에, 그들은 공동국소화에 의존하지만 이량체화를 필요로 하지 않는 짝지어진 틈내기효소 기법 이상으로 다수의 중요한 이점을 소유한다. 우선, 본 명세서에서 직접적 비교는 단일 Cas9 틈내기효소가 일반적으로 동일한 개개 gRNA에 의해 지시되는 FokI-dCas9 융합 단백질보다 더 큰 효율로 삽입결실 돌연변이를 유도한다는 것을 나타낸다. 둘째로, 단량체 Cas9 틈내기효소는 또한 본 발명자들이 이 연구에서 다루지 않은 이전에 알려지지 않은 돌연변이유발 부작용인 고효율로 그들의 표적 절반 부위에서의 염기쌍 치환을 유도할 수 있다. 또한, 직접 비교는 단량체 Cas9 틈내기효소가 동일한 단일 gRNA에 의해 안내되는 FokI-dCas9 융합보다 실질적으로 더 고비율로 이들 원치않는 점돌연변이를 유도한다는 것을 나타낸다. 셋째로, 짝지어진 Cas9 틈내기효소는 이량체 RFN보다 표적 절반 부위의 배향 및 간격에서 더 큰 혼잡함을 나타내고, 따라서 표적을 벗어난 돌연변이가 유도될 부위의 더 큰 잠재적 범위를 가진다. 짝지어진 틈내기효소 절반 부위는 그들의 PAM 내부 또는 PAM 외부에 의해 그리고 0 내지 1000bp 길이의 범위에 있는 스페이서 서열에 의해 배향될 수 있다(Ran et al., Cell 154, 1380-1389 (2013); Mali et al., Nat Biotechnol 31, 833-838 (2013); Cho et al., Genome Res (2013)). Cas9 틈내기효소의 게놈 편집 활성은 효소의 이량체화에 의존하는 것이 아니라, 오히려 단지 두 틈의 공동국소화에 의존하기 때문에, 이런 혼잡함이 존재한다. 대조적으로, RFN은 그들의 특이성이 훨씬 더 엄격하며 -- 절반-부위는 그들의 PAM 외부를 가져야 하고, 효율적인 절단을 위해 2개의 적절하게 위치된 FokI 절단 도메인에 대한 필요에 기인하여 14 내지 17 bp만큼 이격되어 있어야 한다.
FokI
FokI은 DNA 인식 도메인 및 촉매적 (엔도뉴클레아제) 도메인을 포함하는 II형 제한 엔도뉴클레아제이다. 본 명세서에 기재된 융합 단백질은 모든 FokI 또는 단지 촉매적 엔도뉴클레아제 도메인, 예를 들어, 문헌[Li et al., Nucleic Acids Res. 39(1): 359-372 (2011); Cathomen and Joung, Mol. Ther. 16: 1200-1207 (2008)]에 기재된 바와 같은 젠뱅크 등록번호 AAA24927.1의 아미노산 388 내지 583 또는 408 내지 583, 또는 문헌[Miller et al. Nat Biotechnol 25: 778-785 (2007); Szczepek et al., Nat Biotechnol 25: 786-793 (2007); 또는 Bitinaite et al., Proc. Natl. Acad. Sci. USA. 95:10570-10575 (1998)]에 기재된 바와 같은 FokI의 돌연변이 형태를 포함할 수 있다.
FokI의 예시적인 아미노산 서열은 다음과 같다:
FokI을 암호화하는 예시적인 핵산 서열은 다음과 같다:
일부 실시형태에서, 본 명세서에서 사용되는 FokI 뉴클레아제는 서열번호 4에 대해, 예를 들어 서열번호 4의 아미노산 388 내지 583 또는 408 내지 583에 대해 적어도 50% 동일하다. 이들 변이체 뉴클레아제는 DNA를 절단하는 능력을 보유하여야 한다. 일부 실시형태에서, 뉴클레오타이드 서열은 서열번호 4의 아미노산 388 내지 583 또는 408 내지 583에 대해 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100% 동일하다. 일부 실시형태에서, 서열번호 4의 아미노산 388 내지 583 또는 408 내지 583으로부터의 임의의 차이는 비보존적 영역이다.
두 서열의 동일성 백분율을 결정하기 위해, 서열을 최적의 비교 목적을 위해 정렬한다(갭은 최적의 정렬에 필요한 제1 아미노산 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 다에 도입되며, 비-상동성 서열은 비교 목적을 위해 무시될 수 있다). 비교 목적을 위해 정렬된 기준 서열의 길이는 적어도 50%(일부 실시형태에서, 기준 서열 길이의 약 50%, 55%, 60%, 65%, 70%, 75%, 85%, 90%, 95% 또는 100%가 정렬됨)이다. 이어서, 대응하는 위치에서 뉴클레오타이드 또는 잔기가 비교된다. 제1 서열 내 위치가 제2 서열 내 대응하는 위치와 동일한 뉴클레오타이드 또는 잔기에 의해 점유된다면, 분자는 해당 위치에서 동일하다. 두 서열 간의 동일성 백분율은 서열에 의해 공유되는 동일한 위치의 함수이며, 두 서열의 최적의 정렬을 위해 도입될 필요가 있는 갭의 수 및 각각의 갭의 길이를 고려한다.
서열의 비교 및 두 서열 간의 백분율 동일성의 결정은 수학적 알고리즘을 이용하여 수행될 수 있다. 본 출원의 목적을 위해, 두 아미노산 서열 간의 백분율 동일성은 갭 페널티 12, 갭 연장 페널티 4 및 틀이동 갭 페널티 5를 이용하는 블로섬(Blossum) 62 스코어링 매트릭스를 이용하여, GCG 소프트웨어 패키지 내 GAP 프로그램에 포함된 니들만(Needleman) 및 분슈(Wunsch)((1970) J. Mol. Biol. 48:444-453) 알고리즘을 이용하여 결정된다.
Cas9
다수의 박테리아는 Cas9 단백질 변이체를 발현시킨다. 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터의 Cas9는 현재 가장 통상적으로 사용되며; 일부 다른 Cas9 단백질은 스트렙토코커스 피오게네스 Cas9와 고수준의 서열 동일성을 가지며, 동일한 안내 RNA를 사용한다. 다른 것들은 더 다양하며, 상이한 gRNA를 사용하고, 마찬가지로 상이한 PAM 서열을 인식한다(RNA에 의해 구체화되는 서열에 인접한 단백질에 의해 구체화된 2 내지 5개의 뉴클레오타이드 서열). 실린스키(Chylinski) 등은 박테리아의 거대한 군으로부터 Cas9 단백질을 분류하였고(RNA Biology 10:5, 1-12; 2013), 매우 다수의 Cas9 단백질은 본 명세서에 참고로 포함되는 본 명세서의 보충적 도 1에서 그리고 보충적 표 1에서 열거된다. 추가적인 Cas9 단백질은 문헌[Esvelt et al., Nat Methods. 2013 Nov; 10(11):1116-21 및 Fonfara et al., "Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems." Nucleic Acids Res. 2013 Nov 22. [Epub ahead of print] doi:10.1093/nar/gkt1074]에 기재되어 있다.
다양한 종의 Cas9 분자가 본 명세서에 기재된 방법 및 조성물에서 사용될 수 있다.스트렙토코커스 피오게네스 및 스트렙토코커스 써모필루스(S. thermophilus) Cas9 분자는 본 명세서의 다수의 개시내용이지만, 본 명세서에 열거된 종의 Cas9 단백질의, 또는 이로부터 유래되거나 또는 이를 기반으로 한 Cas9 분자가 마찬가지로 사용될 수 있다. 다시 말해서, 본 명세서의 다수의 설명이 스트렙토코커스 피오게네스 및 스트렙토코커스 써모필루스 Cas9 분자를 사용하지만, 다른 종으로부터의 Cas9 분자는 그들을 대신할 수 있다. 이러한 종은 문헌[Chylinski et al., 2013]의 보충적 도 1에 기반하여 만들어진 다음의 표에 제시되는 것을 포함한다.
본 명세서에 기재된 작제물 및 방법은 임의의 해당 Cas9 단백질, 및 그들의 대응하는 안내 RNA 또는 양립가능한 다른 안내 RNA를 포함할 수 있다. 스트렙토코커스 서모필루스 LMD-9 CRISPR1 시스템으로부터의 Cas9는 콩(Cong) 등(Science 339, 819 (2013))에서 인간 세포 내에서 작용하는 것으로 나타났다. 네이세리아 메닝기티디스로부터의 Cas9 오솔로그는 문헌[Hou et al., Proc Natl Acad Sci U S A. 2013 Sep 24;110(39):15644-9 및 Esvelt et al., Nat Methods. 2013 Nov;10(11):1116-21]에 기재되어 있다. 추가적으로 지네크(Jinek) 등은 시험관 내에서, 비록 약간 감소된 효율을 지니기는 하지만, 스트렙토코커스 써모필루스 및 리스테리아 이노쿠아로부터의 Cas9 오솔로그(그러나 상이한 안내 RNA를 사용할 가능성이 있는 네이세리아 메닝기티디스 또는 캄필로박터 제주니로부터의 오솔로그는 아님)가 이중 스트렙토코커스 피오게네스 gRNA에 의해 안내되어 표적 플라스미드 DNA를 절단할 수 있다는 것을 나타내었다.
일부 실시형태에서, 본 발명의 시스템은 촉매적으로 불활성인 단백질의 뉴클레아제 부분을 제공하기 위해 D10, E762, H983 또는 D986 및 H840 또는 N863, 예를 들어, D10A/D10N 및 H840A/H840N/H840Y에서의 돌연변이를 함유하여 박테리아에서 암호화된 바와 같은 또는 포유류 세포에서 발현을 위해 코돈 최적화된 스트렙토코커스 피오게네스로부터의 Cas9 단백질을 이용하며; 이들 위치에서의 치환은 알라닌일 수 있고(그들은 문헌[Nishimasu al., Cell 156, 935-949 (2014)]에서와 같음) 또는 그들은 다른 잔기, 예를 들어, 글루타민, 아스파라긴, 타이로신, 세린 또는 아스팔트산염일 수 있었다, 예를 들어, E762Q, H983N, H983Y, D986N, N863D, N863S 또는 N863H(도 1C). 본 명세서에서 기재되는 방법 및 조성물에서 사용될 수 있는 촉매적으로 불활성인 스트렙토코커스 피오게네스 Cas9의 서열은 다음과 같으며; D10A 및 H840A의 예시적인 돌연변이는 볼드체이며 밑줄 표시되어 있다.
일부 실시형태에서, 본 명세서에서 사용되는 Cas9 뉴클레아제는 스트렙토코커스 피오게네스 Cas9의 서열에 대해 적어도 약 50%, 즉, 서열번호 5에 대해 적어도 50% 동일하다. 일부 실시형태에서, 뉴클레오타이드 서열은 서열번호 5에 대해 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100% 동일하다. 일부 실시형태에서, 서열번호 5로부터의 임의의 차이는 문헌[Chylinski et al., RNA Biology 10:5, 1-12; 2013(예를 들어, 이의 보충적 도 1 및 보충적 표 1); Esvelt et al., Nat Methods. 2013 Nov;10(11):1116-21 및 Fonfara et al., Nucl. Acids Res. (2014) 42 (4): 2577-2590. [Epub ahead of print 2013 Nov 22] doi:10.1093/nar/gkt1074]에 제시된 서열의 서열 정렬에 의해 동정되는 비보존적 영역이다. 상기 제시한 바와 같이 동일성이 결정된다.
안내 RNA(
gRNA
)
안내 RNA는 일반적으로 말해서 2가지 상이한 시스템을 시작한다: 별도의 crRNA 및 tracrRNA를 사용하고 Cas9에 의한 절단을 안내하도록 함께 작용하는 시스템 1, 및 단일 시스템에서 2개의 별도의 안내 RNA를 합하는 키메라 crRNA-tracrRNA 혼성체를 사용하는 시스템 2(단일 안내 RNA 또는 sgRNA로서 지칭됨, 또한 문헌[Jinek et al., Science 2012; 337:816-821] 참조). tracrRNA는 가변적으로 절단될 수 있으며, 길이 범위는 별개의 시스템(시스템 1)과 키메라 gRNA 시스템(시스템 2) 둘 다에서 작용하는 것으로 나타났다. 예를 들어, 일부 실시형태에서, tracrRNA는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40개의 nt만큼 그의 3' 말단으로부터 절단될 수 있다. 일부 실시형태에서, tracrRNA 분자는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40개의 nt만큼 그의 5' 말단으로부터 절단될 수 있다. 대안적으로, tracrRNA 분자는 5'과 3' 말단 둘 다로부터, 예를 들어, 5' 말단 상에서 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개의 nt만큼 그리고 3' 말단 상에서 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40개의 nt만큼 절단될 수 있다. 예를 들어, 문헌[Jinek et al., Science 2012; 337:816-821; Mali et al., Science. 2013 Feb 15;339(6121):823-6; Cong et al., Science. 2013 Feb 15;339(6121):819-23; 및 Hwang and Fu et al., Nat Biotechnol. 2013 Mar;31(3):227-9; Jinek et al., Elife 2, e00471 (2013))] 참조. 시스템 2에 대해, 일반적으로 더 긴 길이의 키메라 gRNA가 더 큰 표적 상의 활성을 나타내었지만, 다양한 길이의 gRNA의 상대적 특이성은 현재 정해지지 않은 채로 남아있으며, 따라서 더 짧은 gRNA를 사용하는 특정 예에서 바람직할 수 있다. 일부 실시형태에서, gRNA는 전사 시작 부위 상류의 약 100 내지 800bp 내에 있는 영역에 상보적이며, 예를 들어, 전사 시작 부위 상류의 약 500bp 내에 있고, 전사 시작 부위를 포함하거나, 또는 전사 시작 부위 하류의 약 100 내지 800bp 내에, 예를 들어, 약 500bp 내를 포함한다. 일부 실시형태에서, 하나 이상의 gRNA를 암호화하는 벡터(예를 들어, 플라스미드), 예를 들어 동일 영역의 표적 유전자 내에서 상이한 부위로 향하는 2, 3, 4, 5개 이상의 gRNA를 암호화하는 플라스미드가 사용된다.
Cas9 뉴클레아제는 안내 RNA, 예를 들어, 단일 gRNA 또는 tracrRNA/crRNA를 이용하고, 게놈 DNA 표적 부위의 상보성 가닥에 대해 상보성인 그의 5'에서 17 내지 20개의 nt를 보유하는, 예를 들어, 서열 NGG의 추가적인 근위의 프로토스페이서 인접 모티프(PAM)를 보유하는 특이적인 17 내지 20개의 nt 게놈 표적으로 안내될 수 있다. 따라서, 본 발명은 문헌[Mali et al., Science 2013 Feb 15; 339(6121):823-6]에 기재된 바와 같은 정상적으로는 트랜스-암호화된 tracrRNA, 예를 들어, 단일 Cas9 안내 RNA에 융합된 crRNA를 프로토스페이서 인접 모티프(PAM), 예를 들어, NGG, NAG, 또는 NNGG의 5' 바로 옆의 표적 서열에 대해 상보성 가닥의, 예를 들어 25 내지 17개, 선택적으로 20개 이하의 뉴클레오타이드(nt), 예를 들어, 20, 19, 18, 또는 17개 nt, 바람직하게는 17 또는 18개의 nt의 표적 서열에 대해 상보성인 5' 말단에서의 서열과 함께 사용하는 것을 포함할 수 있다. 일부 실시형태에서, 단일 Cas9 안내 RNA는 하기 서열들로 이루어진다:
(X17-20)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(서열번호 6);
(X17-20)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(서열번호 7);
(X17-20)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN) (서열번호 8);
(X17-20)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(서열번호 9),
(X17-20)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(서열번호 10);
(X17-20)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(서열번호 11); 또는 (X17-20)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(서열번호 12);
여기서, X17-20은 표적 서열의 17 내지 20개의 연속적 뉴클레오타이드에 대해 상보성인 뉴클레오타이드 서열이다. 단일 안내 RNA를 암호화하는 DNA는 이전에 문헌에 기재되었다(Jinek et al., Science. 337(6096):816-21 (2012) 및 Jinek et al., Elife. 2:e00471 (2013)).
안내 RNA는 Cas9에 대한 리보핵산의 결합을 방해하지 않는 임의의 서열일 수 있는 XN을 포함할 수 있으며, 여기서 (RNA에서의) N은 0 내지 200, 예를 들어, 0 내지 100, 0 내지 50, 또는 0 내지 20일 수 있다.
일부 실시형태에서, 안내 RNA는 3' 말단 상에서 하나 이상의 아데닌(A) 또는 유라실(U) 뉴클레오타이드를 포함한다. 일부 실시형태에서, RNA는 RNA PolIII 전사를 종결시키는 종결 신호로서 사용되는 하나 이상의 T의 선택적 존재의 결과로서 분자의 3' 말단에서 하나 이상의 U, 예를 들어, 1 내지 8개 또는 그 이상의 U(예를 들어, U, UU, UUU, UUUU, UUUUU, UUUUUU, UUUUUUU, UUUUUUUU)를 포함한다.
본 명세서에 기재되는 일부 실시예는 단일 gRNA를 이용하지만, 상기 방법은 또한 이중 gRNA(예를 들어, 자연적으로 생기는 시스템에서 발견되는 crRNA 및 tracrRNA)와 함께 사용될 수 있다. 이 경우에, 단일 tracrRNA는 본 시스템, 예를 들어 하기를 이용하여 발현된 다수의 상이한 crRNA, 및 tracrRNA 서열과 함께 사용될 것이다:
(X17-20)GUUUUAGAGCUA (서열번호 13);
(X17-20)GUUUUAGAGCUAUGCUGUUUUG (서열번호 14); 또는
(X17-20)GUUUUAGAGCUAUGCU (서열번호 15). 이 경우에, crRNA들은 본 명세서에 기재된 방법 및 분자에서 안내 RNA로서 사용되고, tracrRNA는 동일 또는 상이한 DNA 분자로부터 발현될 수 있다. 일부 실시형태에서, 상기 방법은 서열 GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(서열번호 16) 또는 이의 활성 부분(활성 부분은 Cas9 또는 dCas9와 복합체를 형성하는 능력을 보유하는 것임)을 포함하거나 또는 이들로 이루어진 tracrRNA와 세포를 접촉시키는 단계를 포함한다. 일부 실시형태에서, tracrRNA 분자는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40개의 nt에 의해 그의 3' 말단으로부터 절단될 수 있다. 다른 실시형태에서, tracrRNA 분자는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40개의 nt만큼 그의 5' 말단으로부터 절단된다. 대안적으로, tracrRNA 분자는, 예를 들어, 5' 말단 상에서 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개의 nt만큼 그리고 3' 말단 상에서 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40개의 nt만큼 5'과 3' 말단 둘 다로부터 절단될 수 있다. 서열번호 8에 추가로 예시적인 tracrRNA 서열은 하기를 포함한다: UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(서열번호 17) 또는 또는 이의 활성 부분; 또는
AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(서열번호 18) 또는 이의 활성 부분.
일부 실시형태에서, (X17-20)GUUUUAGAGCUAUGCUGUUUUG(서열번호 14)는 crRNA로서 사용되며, 다음의 tracrRNA가 사용된다: GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (서열번호 16) 또는 이의 활성 부분. 일부 실시형태에서, (X17-20)GUUUUAGAGCUA(서열번호 13)는 crRNA로서 사용되며, 다음의 tracrRNA가 사용된다: UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(서열번호 17) 또는 이의 활성 부분. 일부 실시형태에서, (X17-20)GUUUUAGAGCUAUGCU(서열번호 15)는 crRNA로서 사용되며, 다음의 tracrRNA가 사용된다: AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (서열번호 18) 또는 이의 활성 부분.
일부 실시형태에서, gRNA는 표적을 벗어난 효과를 최소화하기 위해 게놈의 나머지에서 임의의 서열과 상이한 적어도 3개 이상의 미스매치인 부위로 표적화된다.
변형된 RNA 올리고뉴클레오타이드, 예컨대 잠긴 핵산(LNA)은 더 바람직한(안정한) 입체형태에서 변형된 올리고뉴클레오타이드를 잠금으로써 RNA-DNA 혼성화의 특이성을 증가시키는 것으로 입증되었다. 예를 들어, 2'-O-메틸 RNA는 올리고뉴클레오타이드 내로 포함될 때 전반적인 열 안정성 및 선택성을 개선시킬 수 있는 2' 산소와 4' 탄소 사이의 추가적인 공유 결합이 있는 변형된 염기이다(화학식 I).
따라서, 일부 실시형태에서, 본 명세서에 개시된 tru-gRNA는 하나 이상의 변형된 RNA 올리고뉴클레오타이드를 포함할 수 있다. 예를 들어, 본 명세서에 기재된 절단된 안내 RNA 분자는 17 내지 18개 또는 17 내지 19개의 nt 중 하나, 일부 또는 모두를 가질 수 있고, 표적 서열에 상보적인 안내 RNA의 5' 영역은 변형되고(예를 들어, 잠긴(2'-O-4'-C 메틸렌 브릿지)), 5'-메틸사이티딘이며, 2'-O-메틸-슈도유리딘이고, 또는 이때 리보스 인산염 백본은 폴리아마이드쇄(펩타이드 핵산), 예를 들어, 합성 리보핵산에 의해 대체되었다.
다른 실시형태에서, tru-gRNA 서열의 뉴클레오타이드의 일부 또는 모두는 변형되고, 예를 들어, 잠긴(2'-O-4'-C 메틸렌 브릿지), 5'-메틸사이티딘, 2'-O-메틸-슈도유리딘일 수 있으며, 또는 이때 리보스 인산염 백본은 폴리아마이드쇄(펩타이드 핵산), 예를 들어, 합성 리보핵산에 의해 대체되었다.
일부 실시형태에서, 단일 안내 RNA 및/또는 crRNA 및/또는 tracrRNA는 3' 말단 상에서 하나 이상의 아데닌(A) 또는 유라실(U) 뉴클레오타이드를 포함할 수 있다.
기존의 Cas9-기반 RGN는 표적화를 관심 대상의 게놈 부위에 안내하기 위한 gRNA-DNA 이형이중가닥(heteroduplex) 형성을 사용한다. 그러나, RNA-DNA 이형이중가닥은 그들의 DNA-DNA 상대보다 더 혼잡한 범위의 구조를 형성할 수 있다. 효과에서, DNA-DNA 이중가닥은 미스매치에 더 민감한데, 이는 DNA-안내된 뉴클레아제가 표적을 벗어난 서열에 용이하게 결합하지 않아서 그들을 RNA-안내 뉴클레아제보다 상대적으로 더 특이적으로 만들 수 있다는 것을 시사한다. 따라서, 본 명세서에 기재된 방법에서 유용한 안내 RNA는 혼성체일 수 있고, 즉, 하나 이상의 데옥시리보뉴클레오타이드, 예를 들어, 짧은 DNA 올리고뉴클레오타이드는 모든 또는 일부의 gRNA, 예를 들어 모든 또는 일부의 gRNA의 상보성 영역을 대체한다. 이 DNA-기반 분자는 단일 gRNA 시스템에서 모든 또는 일부의 gRNA를 대체할 수 있거나 혹은 대안적으로 이중 crRNA/tracrRNA 시스템에서 모든 또는 일부의 crRNA 및/또는 tracrRNA를 대체할 수 있다. DNA를 상보성 영역 내로 혼입시키는 이러한 시스템은 RNA-DNA 이중가닥에 비해 미스매칭에 대해 DNA-DNA 이중가닥의 일반적 불용인에 기인하여 의도된 게놈 DNA 서열을 더 신뢰할 수 있게 표적화하여야 한다. 이러한 이중가닥의 제조방법은 당업계에 공지되어 있으며, 예를 들어, 문헌[Barker et al., BMC Genomics. 2005 Apr 22;6:57; 및 Sugimoto et al., Biochemistry. 2000 Sep 19;39(37):11270-81] 참조.
추가로, 별도의 crRNA와 tracrRNA를 사용하는 시스템에서, 하나 또는 둘 다는 합성일 수 있고, 하나 이상의 변형된(예를 들어, 잠긴) 뉴클레오타이드 또는 데옥시리보뉴클레오타이드를 포함할 수 있다.
세포 상황에서, 이들 합성 gRNA와 Cas9의 복합체는 CRISPR/Cas9 뉴클레아제 시스템의 게놈 전장 특이성을 개선시키기 위해 사용될 수 있었다.
기재된 방법은 본 명세서에 기재된 바와 같은 융합 단백질 + Cas9 gRNA 를 세포 내에서 발현시키는 단계 또는 이들과 세포를 접촉시키는 단계를 포함할 수 있다.
발현 시스템
기재된 융합 단백질을 사용하기 위해, 그들을 암호화하는 핵산으로부터 그들을 발현시키는 것이 바람직할 수 있다. 이는 다양한 방법으로 수행될 수 있다. 예를 들어, 안내 RNA를 암호화하는 핵산은 복제 및/또는 발현을 위해 원핵 또는 진핵세포로 형질전환하기 위한 중간체 벡터 내로 클로닝될 수 있다. 중간체 벡터는 융합 단백질의 생성을 위해 융합 단백질을 암호화하는 핵산의 저장 또는 조작을 위해, 전형적으로 원핵생물 벡터, 예를 들어, 플라스미드 또는 셔틀 벡터 또는 곤충 벡터이다. 융합 단백질을 암호화하는 핵산은 또한 식물 세포, 동물 세포, 바람직하게는 포유류 세포 또는 인간 세포, 진균세포, 박테리아 세포 또는 원생동물 세포에 투여를 위해 발현 벡터 내로 클로닝될 수 있다.
발현을 얻기 위해, 융합 단백질을 암호화하는 서열은 전형적으로 전사를 지시하기 위해 프로모터를 함유하는 발현 벡터 내로 서브클로닝된다. 적합한 박테리아 및 진핵생물 프로모터는 당업계에 잘 공지되어 있으며, 예를 들어, 문헌[Sambrook et al., Molecular Cloning, A Laboratory Manual (3d ed. 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 Current Protocols in Molecular Biology (Ausubel et al., eds., 2010)]에 기재되어 있다. 유전자 조작된 단백질을 발현시키기 위한 박테리아 발현 시스템은, 예를 들어, 이콜라이(E. coli), 바실러스 종(Bacillus sp.) 및 살모넬라(Salmonella)(Palva et al., 1983, Gene 22:229-235)에서 이용가능하다. 이러한 발현 시스템에 대한 키트는 상업적으로 입수가능하다. 포유류 세포, 효모 및 곤충 세포에 대한 진핵생물 발현 시스템은 당업계에 잘 공지되어 있고, 또한 상업적으로 입수가능하다.
핵산의 발현을 지시하기 위해 사용되는 프로모터는 특정 적용에 의존한다. 예를 들어, 강한 구성적 프로모터는 전형적으로 융합 단백질의 발현 및 정제를 위해 사용된다. 대조적으로, 안내 RNA가 유전자 조절을 위해 생체내에서 투여될 때, 안내 RNA의 특정 용도에 따라서 구성적 또는 유도성 프로모터 중 하나가 사용될 수 있다. 추가로, 안내 RNA의 투여를 위한 바람직한 프로모터는 약한 프로모터, 예컨대 유사한 활성을 갖는 HSV TK 또는 프로모터일 수 있다. 프로모터는 또한 전사촉진(transactivation)에 반응성인 구성요소, 예를 들어, 저산소증 반응 구성요소, Gal4 반응 구성요소, lac 리프레서 반응 구성요소 및 소분자 제어 시스템, 예컨대 테트라사이클린-조절 시스템 및 RU-486 시스템을 포함할 수 있다(예를 들어, 문헌[ Gossen & Bujard, 1992, Proc. Natl. Acad. Sci. USA, 89:5547; Oligino et al., 1998, Gene Ther., 5:491-496; Wang et al., 1997, Gene Ther., 4:432-441; Neering et al., 1996, Blood, 88:1147-55; 및 Rendahl et al., 1998, Nat. Biotechnol., 16:757-761] 참조).
프로모터에 추가로, 발현 벡터는 전형적으로 원핵생물 또는 진핵생물인 숙주 세포 내 핵산의 발현에 필요한 모든 추가적인 구성요소를 함유하는 전사 단위 또는 발현 카세트를 함유한다. 따라서 전형적인 발현 카세트는, 예를 들어, gRNA를 암호화하는 핵산 서열에 작동가능하게 연결된 프로모터, 및 예를 들어, 전사체의 효율적인 폴리아데닐화, 전사 종결, 리보솜 결합 부위 또는 번역 종결을 위해 필요한 임의의 신호를 함유한다. 카세트의 추가적인 구성요소는, 예를 들어, 인핸서 및 이종성 스플라이싱된 인트론 신호를 포함할 수 있다.
세포 내로 유전자 정보를 수송하기 위해 사용되는 특정 발현 벡터는 gRNA의 의도된 용도, 예를 들어 식물, 동물, 박테리아, 진균, 원생동물 등에서의 발현과 관련하여 선택된다. 표준 박테리아 발현 벡터는 플라스미드, 예컨대 pBR322 기반 플라스미드, pSKF, pET23D 및 상업적으로 입수가능한 태그-융합 발현 시스템, 예컨대 GST 및 LacZ를 포함한다.
진핵생물 바이러스로부터의 조절 구성요소를 함유하는 발현 벡터는 진핵생물 발현 벡터, 예를 들어, SV40 벡터, 유두종 바이러스 벡터 및 엡스타인-바르 바이러스로부터 유래된 벡터에서 종종 사용된다. 다른 예시적인 진핵생물 벡터는 SV40 초기 프로모터, SV40 후기 프로모터, 메탈로티오네인 프로모터, 뮤린 유방 종양 바이러스 프로모터, 라우스 육종 바이러스 프로모터, 폴리헤드린 프로모터 또는 진핵세포에서의 발현에 효과적인 것으로 나타난 다른 프로모터의 지시 하에서 단백질을 발현시키는 pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, 바큘로바이러스 pDSVE 및 임의의 다른 벡터를 포함한다.
안내 RNA를 발현시키기 위한 벡터는 안내 RNA의 발현을 구동시키기 위한 RNA Pol III 프로모터, 예를 들어, H1, U6 또는 7SK 프로모터를 포함할 수 있다. 이들 인간 프로모터는 플라스미드 형질감염 후에 포유류 세포에서 gRNA를 발현시킨다. 대안적으로, T7 프로모터는, 예를 들어, 시험관내 전사를 위해 사용될 수 있으며, RNA는 시험관내에서 전사 및 정제될 수 있다. 짧은 RNA, 예를 들어, siRNA, shRNA 또는 다른 소 RNA의 발현에 적합한 벡터가 사용될 수 있다. 도 4b에 기재한 Cys4-기반 다중복합 시스템을 이용하여, 다중 gRNA는 (RNA Pol II 또는 Pol III 프로모터에 의해 구동되는) 단일 전사체에서 발현될 수 있다.
일부 발현 시스템은 안정하게 형질감염된 세포주의 선택을 위한 마커, 예컨대 티미딘, 키나제, 하이그로마이신 B, 포스포트랜스퍼라제 및 다이하이드로엽산생성효소 환원효소를 가진다. 고수율 발현 시스템, 예컨대 폴리헤드린 프로모터 또는 다른 강한 바큘로바이러스 프로모터의 지시 하에서 gRNA 암호화 서열을 지니는 곤충 세포에서의 바큘로바이러스 벡터를 이용하는 것이 또한 적합하다.
발현 벡터 내에 전형적으로 포함된 구성요소는 또한 이콜라이에서 기능하는 레플리콘, 재조합 플라스미드를 보유하는 박테리아를 선택을 허용하는 유전자 암호화 항생제 내성 및 재조합 서열을 삽입하게 하는 플라스미드의 비필수 영역 내 독특한 제한 부위를 포함한다.
표준 형질감염 방법은 다량의 단백질을 발현되고, 이어서, 표준 기법을 이용하여 정제되는 박테리아, 포유류, 효모 또는 곤충 세포주를 생성하기 위해 사용된다(예를 들어, 문헌[Colley et al., 1989, J. Biol. Chem., 264:17619-22; Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)] 참조). 진핵생물 및 원핵생물 세포의 형질전환은 표준 기법에 따라 수행된다(예를 들어, 문헌[Morrison, 1977, J. Bacteriol. 132:349-351; Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds, 1983)] 참조).
외래의 뉴클레오타이드 서열을 숙주 세포에 도입하기 위한 임의의 공지된 절차가 이용될 수 있다. 이들은 인산칼슘 형질감염, 폴리브렌(polybrene), 프로토플라스트 융합, 전기천공법, 뉴클레오펙션, 리포솜, 미세주입법, 네이키드 DNA(naked DNA), 플라스미드 벡터, 바이러스 벡터, 에피솜 및 게놈 DNA, cDNA, 합성 DNA 또는 다른 외래 유전자 물질을 숙주 세포 내로 도입하기 위한 통합적이며 임의의 다른 잘 공지된 방법의 사용을 포함한다(예를 들어, 문헌[Sambrook et al.], 상기 참조). 사용되는 특정 유전자 조작 절차는 적어도 하나의 유전자를 gRNA를 발현시킬 수 있는 숙주 세포 내로 성공적으로 도입할 유일한 필요가 있다.
본 발명은 벡터, 및 벡터를 포함하는 세포를 포함한다.
실시예
본 발명은 청구범위에 기재되는 본 발명의 범주를 제한하지 않는 다음의 실시예에서 추가로 기재된다.
실시예 1. RNA-안내 엔도뉴클레아제의 특이성 평가
CRISPR RNA-안내 뉴클레아제(RGN)는 게놈 편집을 위한 손쉽고 효율적인 플랫폼으로서 빠르게 나타났다. 본 실시예는 Cas9-기반 RGN의 표적을 벗어난 절단을 특정규명하기 위한 인간 세포-기반 리포터 분석의 사용을 기재한다.
재료 및 방법
다음의 재료 및 방법을 실시예 1에서 사용하였다.
안내 RNA의 구성
Cas9 표적화를 위해 가변적 20개의 nt 서열을 보유하는 DNA 올리고뉴클레오타이드를 BsmBI-분해된 플라스미드 pMLM3636 내로의 결찰과 양립가능한 4bp 돌출부를 지니는 짧은 이중-가닥 DNA 단편을 생성하기 위해 어닐링시켰다. 이들 어닐링된 올리고뉴클레오타이드의 클로닝은 U6 프로모터의 발현 하에서 20개의 가변 5' 뉴클레오타이드를 지니는 키메라 +103 단일-쇄 안내 RNA를 암호화하는 플라스미드를 생성한다(Hwang et al., Nat Biotechnol 31, 227-229 (2013); Mali et al., Science 339, 823-826 (2013)). 본 연구에서 사용되는 pMLM3636 및 발현 플라스미드 pJDS246(Cas9의 코돈 최적화된 형태를 암호화)는 둘 다 비영리적 플라스미드 유통 서비스 애드진(Addgene)(addgene.org/crispr-cas)을 통해 입수할 수 있다.
EGFP 활성 분석
EGFP-PEST 융합 유전자의 단일 통합 복제물을 보유하는 U2OS.EGF 세포를 앞서 기재한 바와 같이 배양시켰다(Reyon et al., Nat Biotech 30, 460-465 (2012)). 형질감염을 위해, 200,000개의 세포를 제조업자의 프로토콜에 따라 SE 셀라인 4D-뉴클레오펙터((SE Cell Line 4D-Nucleofector)(상표명) 엑스 키트(론자(Lonza))를 이용하여 30ng의 Td-토마토-암호화 플라스미드와 함께 표시량의 gRNA 발현 플라스미드 및 pJDS246으로 뉴클레오펙션시켰다. BD LSRII 유세포분석기를 이용하여 형질감염 후 2일에 세포를 분석하였다. gRNA/Cas9 플라스미드 농도를 최적화하기 위한 형질감염을 3회 중복해서 수행하고 나서, 모든 다른 형질감염을 2회 중복해서 수행하였다.
내인성 인간 게놈 부위의 PCR 증폭 및 서열 확인
퓨전 핫 스타트 II 고충실도 DNA 중합효소(Phusion Hot Start II high-fidelity DNA: NEB)를 이용하여 PCR 반응을 수행하였다. 터치다운 PCR(98℃, 10초; 72 내지 62℃, -1℃/주기, 15초; 72℃, 30 s]10 주기, [98℃, 10초; 62℃, 15초; 72℃, 30초]25 주기)을 이용하여 대부분의 좌위를 성공적으로 증폭시켰다. 남아있는 표적에 대한 PCR을 68℃ 또는 72℃의 일정한 어닐링 온도에서 그리고 필요하다면 3% DMSO 또는 1M 베타인에서 35주기로 수행하였다. 퀴악셀(QIAXCEL) 모세관 전기이동 시스템 상에서 PCR 산물을 분석하여 크기와 순도를 확인하였다. 확인한 산물을 엑소샙-아이티(ExoSap-IT)(애피메트릭스(Affymetrix))로 처리하고 나서, 생어(Sanger) 방법(MGH DNA 시퀀싱 코어(Sequencing Core))에 의해 서열화하여 각각의 표적 부위를 확인하였다.
인간 세포에서 RGN-유도 표적 상의 및 표적을 벗어난 돌연변이 빈도의 결정
U2OS.EGFP 및 K562 세포에 대해, 2 x 105개 세포를 제조업자의 설명서(론자)에 따라 4D-뉴클레오펙터 시스템을 이용하여 250ng의 gRNA 발현 플라스미드 및 비어있는 U6 프로모터 플라스미드(음성 대조군에 대해), 750ng의 Cas9 발현 플라스미드 및 30ng의 td-토마토 발현 플라스미드로 형질감염시켰다. HEK293 세포에 대해, 1.65 x 105개의 세포를 제조업자의 설명서(라이프 테크놀로지즈(Life Technologies))에 따라 리포펙타민 LTX(Lipofectamine LTX) 시약을 이용하여 125ng의 gRNA 발현 플라스미드 또는 비어있는 U6 프로모터 플라스미드(음성 대조군에 대해), 375ng의 Cas9 발현 플라스미드 및 30ng의 td-토마토 발현 플라스미드로 형질감염시켰다. 게놈 DNA를 제조업자의 설명서에 따라 퀴아앰프 DNA 혈액 미니 키트(QIAamp DNA Blood Mini Kit)(퀴아젠(QIAGEN))를 이용하여 형질감염시킨 U2OS.EGFP, HEK293 또는 K562 세포로부터 채취하였다. 표적을 벗어난 후보 부위를 증폭시키는 충분한 게놈 DNA를 생성하기 위해, (U2OS.EGFP 세포에 대해) 3회의 뉴클레오펙션으로부터의 DNA, (K562 세포에 대해) 2회의 뉴클레오펙션 또는 2회의 리포펙타민 LTX 형질감염을 함께 모은 후에 T7EI를 수행하였다. 이를 시험한 각각의 조건에 대해 2회 행함으로써 총 4회 또는 6회의 개개 형질감염을 나타내는 게놈 DNA의 2회 중복 풀을 생성하였다. 이어서, PCR을 상기 기재한 바와 같이 주형으로서 이들 게놈 DNA를 이용하여 수행하고, 제조업자의 설명서에 따라 앰푸어 XP 비즈(Ampure XP beads)(에이전코트(gencourt))를 이용하여 정제하였다. T7EI 분석을 앞서 기재한 바와 같이 수행하였다(Reyon et al., 2012, 상기 참조).
NHEJ-매개된 삽입결실 돌연변이의 DNA 서열화
T7EI 분석을 위해 사용한 정제된 PCR 산물을 제로 블런트(Zero Blunt) TOPO 벡터(Life Technologies)로 클로닝시키고 나서, 플라스미드 DNA를 MGH DNA 오토메이션 코어(Automation Core)에 의해 알칼리 용해 미니프렙 방법을 이용하여 단리시켰다. 생어 방법(MGH DNA 시퀀싱 코어)에 의해 M13 정방향 프라이머(5' - GTAAAACGACGGCCAG - 3'(서열번호 19)를 이용하여 플라스미드를 시퀀싱시켰다.
실시예 1a. 단일 뉴클레오타이드 미스매치
인간 세포에서 RGN의 특이성 결정요인을 정하는 것을 시작하기 위해, 다수의 gRNA/표적 DNA 계면 내의 전체적으로 미스매칭되는 다양한 위치의 효과를 평가하는 대규모 시험을 수행하였다. 이를 위하여, 표적화된 뉴클레아제 활성을 빠르게 정량화할 수 있는 앞서 기재한 정량적 인간 세포-기반 향상 녹색 형광 단백질(EGFP) 붕괴 분석(도 2b)(문헌[Methods above and Reyon et al.], 2012, 상기 참조)을 사용하였다. 이 분석에서, 뉴클레아제-유도 이중-가닥 파손(DSB)의 오류 유발 비-상동성 말단연결(NHEJ)에 의해 도입한 틀이동 삽입/결실(indel) 돌연변이를 불활성화시킴으로써 야기된 인간 U2OS.EGFP 세포 내 형광 신호 손실을 평가함으로써 단일 통합 EGFP 리포터 유전자에 대해 표적화된 뉴클레아제의 활성을 정량화할 수 있다(DSB)(도 2b). 본 명세서에 기재된 연구를 위해, EGFP 내의 상이한 서열에 대해 표적화된 3 내지 100개의 nt 단일 gRNA(sgRNA)를 다음과 같이 사용하였다:
EGFP 부위 1 GGGCACGGGCAGCTTGCCGGTGG(서열번호 1)
EGFP 부위 2 GATGCCGTTCTTCTGCTTGTCGG(서열번호 2)
EGFP 부위 3 GGTGGTGCAGATGAACTTCAGGG(서열번호 3)
각각의 이들 sgRNA는 EGFP 발현의 Cas9-매개를 효율적으로 지시할 수 있다(실시예 1e 및 2a, 및 도 3e(상부) 및 도 3f(상부)).
처음의 실험에서, 3개의 EGFP-표적화된 sgRNA의 상보적 표적화 영역에서 20개 중 19개의 뉴클레오타이드에서 단일 뉴클레오타이드 미스매치의 효과를 시험하였다. 이를 위해서, 변이체 sgRNA를 위치 1 내지 19에서 왓슨-크릭 염기전환 미스매치(3' 내지 5' 방향으로 1 내지 20으로 넘버링; 도 1 참조) 및 시험한 인간 세포에서 Cas9-매개된 EGFP 붕괴를 지시하는 이들 다양한 sgRNA의 능력을 보유하는 각각 3개의 표적부위에 대해 생성하였다(위치 20에서 치환을 보유하는 변이체 sgRNA는 생성되지 않았는데, 이 뉴클레오타이드는 U6 프로모터 서열의 부분이며, 따라서 영향을 미치는 발현을 피하기 위해 구아닌을 남겨야 하기 때문이다).
EGFP 표적 부위 #2에 대해, gRNA의 위치 1 내지 10에서 단일 미스매치는 관련된 Cas9 활성에 대해 극적인 효과를 가지는데(도 2c, 중간 패널), 이는 gRNA의 5' 말단에서의 미스매치가 3' 말단에서의 미스매치보다 더 잘 용인된다는 것을 시사하는 이전의 연구와 일치된다(Jiang et al., Nat Biotechnol 31, 233-239 (2013); Cong et al., Science 339, 819-823 (2013); Jinek et al., Science 337, 816-821 (2012)). 그러나, EGFP 표적 부위 #1 및 #3에 의해, gRNA에서 모든 그러나 소수의 위치에서의 단일 미스매치는 서열의 3' 말단 내에서조차 잘 용인되는 것으로 나타난다. 더 나아가, 이들 두 표적과 상이한 미스매치에 민감한 특이적 위치(도 2c, 상부 패널과 하부 패널을 비교) - 예를 들어, 표적 부위 #1은 위치 2에서 미스매치에 특히 민감한 반면, 표적 부위 #3은 위치 1 및 8에서 미스매치에 가장 민감하였다.
실시예 1b. 다중 미스매치
gRNA/DNA 계면에서 하나 이상의 미스매치의 효과를 시험하기 위해, 인접한 및 분리된 위치에서 이중 왓슨-크릭 염기전환 미스매치를 보유하는 일련의 변이체 sgRNA를 생성하였고, Cas9 뉴클레아제 활성을 지시하는 이들 sgRNA의 능력을 EGFP 붕괴 분석을 이용하여 인간 세포에서 시험하였다. 모두 3개의 표적 부위는 일반적으로 하나 또는 둘 다의 미스매치가 gRNA 표적화 영역의 3' 절반 내에서 생기는 이중 변용에 대해 더 큰 민감성을 나타내었다. 그러나, 이들 효과의 규모는 부위-특이적 변이를 나타내었으며, 표적 부위 #2는 이들 이중 미스매치에 대해 가장 큰 민감성을 나타내고, 표적 부위 #1은 일반적으로 최소로 나타낸다. 용인될 수 있는 인접한 미스매치의 수를 시험하기 위해, sgRNA 표적화 영역의 5' 말단에서 위치 19 내지 15의 범위에 있는 증가된 수의 미스매칭된 위치를 보유하는 변이체 gRNA를 구성하였다(단일 및 이중 미스매치가 더 잘 용인되는 것으로 나타난 경우).
이들 점점 증가하는 미스매칭된 sgRNA의 시험은 모두 3개의 표적 부위에 대해, 3개 이상의 인접한 미스매치의 도입이 RGN 활성의 상당한 손실을 초래한다는 것을 나타내었다. 활성의 갑작스런 감소는 3개의 상이한 EGFP-표적화된 gRNA에 대해 생겼는데, 5' 말단에서 위치 19로부터 시작하는 진행성 미스매치를 만들며 3' 말단쪽으로 이동하는 더 많은 미스매치를 첨가하기 때문이다. 구체적으로, 위치 19 및 19+18에서 미스매치를 함유하는 gRNA는 본질적으로 완전한 활성을 나타내는 반면, 위치 19+18+17, 19+18+17+16 및 19+18+17+16+15 에서 미스매치를 지니는 gRNA는 음성 대조군에 비해 본질적으로 차이를 나타내지 않는다(도 2f). (본 발명자들은 이들 변이체 gRNA에서 위치 20과 미스매치되지 않는데, 이 위치는 gRNA의 발현을 구동시키는 U6 프로모터의 부분이기 때문에 G로서 남아있을 필요가 있기 때문이다).
단축 gRNA 상보성이 더 큰 특이성을 지니는 RGN을 야기할 수 있는 추가적인 증거를 다음의 실험에서 얻었다: 4회의 상이한 EGFP-표적화된 gRNA에 대해(도 2h), 위치 18 및 19에서 이중 미스매치의 도입은 활성에 상당하게 영향을 미치지 않았다. 그러나, 그 다음에 위치 10 및 11에서 이들 gRNA 내로의 다른 이중 미스매치의 도입은 거의 완전한 활성의 손실을 야기한다. 흥미롭게도, 단지 10/11 이중 미스매치의 도입은 활성에 대한 영향만큼 크지 않다.
종합하면, 인간 세포에서의 이들 결과는 RGN의 활성이 gRNA 표적화 서열의 3' 절반에서 미스매치에 대해 더 효과적일 수 있다는 것을 확인한다. 그러나, 데이터는 또한 RGN의 특이성이 복잡하고 표적 부위-의존적이며, 단일 및 이중 미스매치가 종종 하나 이상의 미스매치가 gRNA 표적화 영역의 3' 절반에서 생길 때조차 잘 용인된다는 것을 명확하게 나타낸다. 더 나아가, 이들 데이터는 또한 gRNA/DNA 계면의 5' 절반에서의 모든 미스매치가 반드시 잘 용인되지 않는다는 것을 시사한다.
추가로, 이들 결과는 더 짧은 상보성 영역을 보유하는 gRNA(구체적으로는 ~17개의 nt)가 그들의 활성에서 더 특이적이 될 것이라는 것을 강하게 시사한다. 본 발명자들은 PAM 서열에 의해 부여된 2개의 nt의 특이성과 조합된 17개의 nt가 19 bp 서열의 세부사항, 즉, 인간 세포에서 발견되는 것과 같이 거대하고 복잡한 게놈에서 독특하게 되기에 충분한 길이의 것을 초래한다는 것을 주목한다.
실시예 1c. 표적을 벗어난 돌연변이
내인성 인간 유전자에 표적화된 RGN에 대해 표적을 벗어난 돌연변이가 동정될 수 있는지 여부를 결정하기 위해, VEGFA 유전자에서 셋, EMX1 유전자에서 하나, RNF2 유전자에서 하나 및 FANCF 유전자에서 하나의 상이한 부위를 표적화하는 6개의 sgRNA를 사용하였다. 이들 6개의 sgRNA는 T7 엔도뉴클레아제 I(T7EI) 분석에 의해 검출된 바와 같은 인간 U2OS.EGFP 세포 내 그들 각각의 내인성 좌위에서 Cas9-매개된 삽입결실을 효율적으로 지시하였다(상기 방법). 이들 6개의 RGN 각각에 대해, 이어서, 본 발명자들은 U2OS.EGFP 세포에서 뉴클레아제-유도 NHEJ-매개된 삽입결실 돌연변이의 증거에 대해 수십의 잠재적인 표적을 벗어난 부위(46 내지 64만큼의 수 범위)를 시험하였다. 평가한 좌위는 1 또는 2개의 뉴클레오타이드만큼 상이한 모든 게놈 부위뿐만 아니라 3 내지 6개의 뉴클레오타이드만큼 상이한 게놈 부위의 서브세트를 포함하고, gRNA 표적화 서열의 5' 절반에서 이들 미스매치 중 하나 이상을 갖는 것에 대한 성향을 지녔다. T7EI 분석을 이용하여, VEGFA 부위 1에 대해 4(시험한 53개의 후보 부위를 벗어남), VEGFA 부위 2 대해 12(시험한 46개를 벗어남), VEGFA 부위 3 대해 7(시험한 64개를 벗어남), 및 EMX1 부위에 대해 1개의(시험한 46개를 벗어남) 표적을 벗어난 부위를 용이하게 동정하였다. RNF2 또는 FANCF 유전자 각각에 대해 시험한 43 및 50개의 잠재적 부위 중에서 표적을 벗어난 돌연변이는 검출되지 않았다. 확인한 표적을 벗어난 부위에서 돌연변이의 비율은 매우 높았으며, 의도된 표적 부위에서 관찰한 비율의 5.6% 내지 125%(평균 40%)의 범위에 있었다. 진정한 표적을 벗어난 이들은 표적 부위의 3' 말단에서 미스매치뿐만 아니라 총 5개의 미스매치를 지니는 서열을 포함하였고, 대부분의 표적을 벗어난 부위는 단백질 암호 유전자 내에서 생겼다. 표적을 벗어난 부위의 서브세트의 DNA 서열화는 삽입결실 돌연변이가 RGN 절단 부위에서 생긴다는 추가적인 분자적 확인을 제공하였다(도 8a 내지 도 8c).
실시예 1d. 다른 세포 유형에서 표적을 벗어난 돌연변이
RGN이 U2OS.EGFP 세포에서 고빈도로 표적을 벗어난 돌연변이를 유발할 수 있다는 것이 확립하고, 다음에 이들 뉴클레아제가 또한 다른 유형의 인간 세포에서 이들 효과를 갖는지 여부를 결정하도록 추구하였다. 초기 실험을 위해 U2OS.EGFP 세포를 선택하였는데, TALEN의 활성을 평가하기 위해 이들 세포를 이전에 사용하였지만15, 인간 HEK293 및 K562 세포는 표적화된 뉴클레아제의 활성을 시험하는데 더 광범위하게 사용되었기 때문이다. 따라서, VEGFA 부위 1, 2 및 3에 대해 그리고 EMX1 부위에 대해 표적화된 4개의 RGN의 활성을 또한 HEK293 및 K562 세포 내에서 평가하였다. U2OS.EGFP 세포에서 관찰된 것보다 다소 더 낮은 돌연변이 빈도를 지님에도 불구하고, 각각의 이들 4개의 RGN이 이들 2개의 추가적인 인간 세포주에서의 그들의 의도된 표적 상의 부위에서 NHEJ-매개된 삽입결실 돌연변이를 효율적으로 유도하였다는 것을 발견하였다(T7EI 분석에 의해 평가함). U2OS.EGFP 세포 내에서 본래 동정된 이들 4개의 RGN에 대해 24개의 표적을 벗어난 부위의 평가는 다수가 그들의 대응하는 표적 상의 부위와 유사한 빈도로 HEK293 및 K562 세포에서 다시 돌연변이된다는 것을 나타내었다. 예상한 바와 같이, HEK293 세포로부터의 이들 표적을 벗어난 부위의 서브세트의 DNA 서열화는 변용이 예상한 게놈 좌위에서 생긴다는 추가적인 분자적 증거를 제공하였다. U2OS.EGFP 세포에서 동정한 표적을 벗어난 부위의 HEK293 세포 내에서 4개 그리고 K562 세포 내에서 11개가 검출가능한 돌연변이를 나타내지 않는다 이유를 확실히 알지 못한다. 그러나, 다수의 이들 표적을 벗어난 부위가 또한 U2OS.EGFP 세포에서 상대적으로 더 낮은 돌연변이 빈도를 나타내었다는 것을 주목한다. 따라서, 본 발명자들은 HEK293 및 K562 세포에서 이들 부위의 돌연변이율이 T7EI 분석의 신뢰가능한 검출한계(~2 내지 5%) 미만에 속할 수 있다는 것을 추측하는데, RGN이 일반적으로 본 발명자들의 실험에서의 U2OS.EGFP 세포에 비해 HEK293 및 K562 세포에서 더 낮은 활성을 갖는 것으로 나타났기 때문이다. 종합하면, HEK293 및 K562 세포에서 결과는 RGN에 의해 관찰한 고빈도의 표적을 벗어난 돌연변이가 다수의 인간 세포 유형에서 보이는 일반적인 현상일 것이라는 증거를 제공한다.
실시예 1e. EGFP 붕괴 분석을 위해 사용한 gRNA- 및 Cas9-발현 플라스미드 양의 적정
비상동성 말단 연결을 통한 틀이동 돌연변이의 도입이 EGFP의 발현을 강하게 붕괴시킬 수 있는 위치인 EGFP 뉴클레오타이드 502 상류에 위치된 3개의 상이한 서열(상기 나타낸 EGFP 부위 1 내지 3)에 대해 단일 안내 gRNA(sgRNA)를 생성하였다(Maeder, M.L. et al., Mol Cell 31, 294-301 (2008); Reyon, D. et al., Nat Biotech 30, 460-465 (2012)).
각각 3개의 표적 부위에 대해, gRNA-발현 플라스미드 양의 범위(12.5 내지 250ng)를 구성적으로 발현된 EGFP-PEST 리포터 유전자인 단일 복제물을 보유하는 본 발명자들의 U2OS.EGFP 리포터 세포 내로 Cas9 뉴클레아제의 코돈-최적화된 형태를 발현시키는 750ng의 플라스미드와 함께 처음에 형질감염시켰다. 모두 3개의 RGN는 가장 고농도의 gRNA플라스미드(250ng)에서 EGFP 발현을 효율적으로 붕괴시켰다(도 3e (상부)). 그러나, 표적 부위 #1 및 #3에 대한 RGN은 더 소량의 gRNA-발현 플라스미드가 형질감염될 때 동등한 붕괴 수준을 나타낸 반면, 표적 부위 #2에서의 RGN 활성은 형질감염된 gRNA-발현 플라스미드의 양이 감소되었을 때 바로 하락하였다(도 3e(상부)).
본 발명자들의 U2OS.EGFP 리포터 세포 내로 형질감염된 Cas9-암호화 플라스미드(50 ng 내지 750ng의 범위)의 양을 적정하고 나서, EGFP 붕괴를 분석하였다. 도 3f(상부)에 나타낸 바와 같이, 표적 부위 #1은 EGFP 붕괴 활성의 실질적인 손실 없이 형질감염된 Cas9-암호화 플라스미드 양의 3배 감소를 용인하였다. 그러나, 표적 부위 #2 및 #3을 표적화하는 RGN의 활성은 형질감염된 Cas9 플라스미드 양의 3배 감소로 즉시 줄어들었다(도 3f (상부)). 이들 결과에 기반하여, gRNA-/Cas9-발현 플라스미드의 25ng/250ng, 250ng/750ng 및 200ng/750ng 를 실시예 1a 내지 1d에 기재한 실험에 대해 각각 EGFP 표적 부위 #1, #2 및 #3에 대해 사용하였다.
일부 gRNA/Cas9 조합이 EGFP 발현을 붕괴시키는데 있어서 나머지보다 더 양호하게 작용하는 이유는 이해되지 않으며, 이들 조합 중 일부가 형질감염에 대해 사용되는 플라스미드의 양에 다소 민감한 이유도 이해되지 않는다. 이들 3개의 sgRNA에 대해 게놈 내에 존재하는 표적을 벗어난 부위의 범위가 각각의 그들의 활성에 영향을 미치는 것이 가능하지만, 3개의 sgRNA의 차별적인 거동을 고려하는 이들 특정 표적 부위(표 1) 각각에 대해 1 내지 6개의 bp만큼 상이한 게놈 부위의 수에서의 차이는 알 수 없었다.
실시예
2:
FokI
-
dCas9
융합 단백질과 안내
RNA
쌍의 이용
단량체 CRISPR-Cas9 뉴클레아제는 표적화된 게놈 편집을 위해 널리 사용되지만, 원치않는 표적을 벗어난 돌연변이를 고빈도로 유도할 수 있다. 이 실시예는 연장된 이중-길이 서열을 인식하고, 절단 활성을 위해 2개의 단일 안내 RNA(gRNA)에 엄격하게 의존하는 새로운 이량체 RNA-안내 FokI 뉴클레아제(RFN)를 기재한다. RFN은 고효율로 내인성 인간 유전자에서 DNA 서열을 강하게 편집할 수 있다. 추가적으로, 표적화 범위에서 유용한 이량체 RFN을 제공하는 중요한 진보인 임의의 5' 말단 뉴클레오타이드를 보유하는 gRNA를 발현시키기 위한 방법을 기재한다. 직접 비교에서, 단량체 Cas9 틈내기효소는 일반적으로 매칭된 단일 gRNA에 의해 지시되는 RFN보다 고빈도로 원치않는 삽입결실 및 예상치 못한 중심 점돌연변이를 유도한다. RFN은 이량체화의 특이성 향상과 CRISPR RNA-기반 표적화를 조합하고, 고도로 정확한 게놈 편집을 필요로 하는 연구 및 치료 적용을 위한 중요한 새로운 플랫폼을 제공한다.
재료 및 방법
다음의 재료 및 방법을 실시예 2에서 사용하였다.
단일 및 다중복합
gRNA
발현 플라스미드
단일 또는 다중복합 gRNA를 암호화하는 플라스미드를 어닐링시킨 표적 부위 올리고이중가닥의 단일-단계 결찰(통합된 DNA 기법) 및 BsmBI-분해된 Csy4-측접된 gRNA 백본(pSQT1313; 애드진(Addgene))을 지니는 (다중복합 gRNA에 대한) 불변 영역 올리고이중가닥에서 조립하였다.
플라스미드를 암호화하는 다중복합 gRNA를 1) 제1 표적 부위를 암호화하는 어닐링된 올리고, 2) crRNA, tracrRNA 및 Csy4-결합 부위를 암호화하는 포스포릴화된 어닐링된 올리고, 및 3) BsmBI II형 제한 효소로 분해된 U6-Csy4부위-gRNA 플라스미드 백본 내로 제2 표적 부위를 암호화하는 어닐링된 올리고를 결찰시킴으로써 구성하였다. Csy4 RNA 결합 부위를 gRNA 서열의 3' 및 5' 말단에 부착하고 세포 내에서 Cas9와 함께 발현시켰다. Csy4 RNA 결합 부위 서열 'GUUCACUGCCGUAUAGGCAGCUAAGAAA'(서열번호 20)을 표준 gRNA 서열의 5' 및 3' 말단에 융합시켰다.
이 서열은 Cys4 부위에 의해 측접되는 다중복합 gRNA 서열이다(밑줄). 기능적으로, 하나의 전사체 상에서 다중복합으로 이를 암호화하는 것은 그들을 별도로 암호화하는 것과 동일한 결과를 가져야 한다. Csy4-측접 sgRNA의 모든 쌍을 본 명세서에 기재된 실험에서 다중복합 상황에서 발현시켰지만, sgRNA는 하나의 전사체뿐만 아니라 추가적인 Cys4 서열을 갖는 개개의 sgRNA 상에서 암호화된 Cys4 부위에 의해 분리된 다중복합 sgRNA에서 암호화시킬 수 있다. 이 서열에서, 제1 N20 서열은 한 가닥의 표적 게놈 서열에 상보성인 서열을 나타내고, 제2 N20 서열은 다른 하나의 표적 게놈 서열에 상보성인 서열을 나타낸다.
gRNA를 함유하는 Csy4 인식 부위를 암호화하는 플라스미드를 '2A' 펩타이드 결합에 의해 분리되는 Cas9 및 Csy4 단백질을 암호화하는 플라스미드화 함께 공동형질감염시켰다. 결과는 5' 및 3' 말단에 융합된 Csy4 부위를 지니는 gRNA가 이전에 기재한 U2OS-EGFP 붕괴 분석을 이용하여 인간 세포에서 Cas9-매개된 절단을 지시할 수 있는 채로 남아있다는 것을 나타내었다. 따라서, Csy4 RNA 결합 부위는 gRNA 서열의 3' 말단에 부착될 수 있으며, Cas9와 이들 Csy4 부위-함유 gRNA의 복합체는 세포 내에서 기능성으로 남아있다.
일부 실험에서, Csy4-T2A-FokI-dCas9를 암호화하는 작제물을 사용하였다. FokI-dCas9 융합의 서열을 이하에 나타내며, FokI와 dCas9 사이의 GGGGS(서열번호 23) 링커(밑줄) 및 핵 국소화 서열을 포함한다.
FokI
-
dCas9
아미노산 서열(
FokI
-
G4S
-
dCas9
-
nls
-
3XFLAG
)
FokI-dCas9 뉴클레오타이드 서열(FokI-G4S-dCas9-nls-3XFLAG)
대안적으로, 이하에 나타낸 바와 같이 N-말단과 C-말단의 핵 국소화 신호를 둘 다 함유한 작제물의 인간 코돈 최적화된 형태를 사용하였다.
Nls-FokI-dCas9-nls 아미노산 서열
Nls-FokI-dCas9-nls 뉴클레오타이드 서열
조직 배양
및 형질감염
모든 세포 배양 실험을 HEK 293 세포, U2OS 세포에서 또는 탈안정화된 EGFP 유전자인 안정하게 통합된 단일 복제물을 보유하는 U2OS 세포(U2OS.EGFP 세포)에서 수행하였다. 세포주를 37℃에서 5% CO2와 함께 10% FBS, 2mM 글루타맥스(라이프 테크놀로리지) 및 페니실린/스트렙토마이신으로 보충한 어드밴스트 DMEM(Advanced DMEM)에서 유지하였다. 추가적으로, U2OS.EGFP 세포를 400㎍/㎖의 G418의 존재 하에 배양시켰다.
U2OS 세포 및 U2OS.EGFP 세포를 제조업자의 지침에 따라 론자 4D-뉴클레오펙터의 DN-100을 이용하여 형질감염시켰다. 초기 FokI-dCas9 활성 선별 및 중심 스페이서 길이 분석 실험에서, 750ng의 pCAG-Csy4-FokI-dCas9-nls 뉴클레아제 플라스미드 및 250ng의 gRNA 암호화 플라스미드를 형질감염 대조군으로서 50ng td토마토 발현 플라스미드(클론테크(Clontech))와 함께 형질감염시켰다. U2OS 및 U2OS.EGFP 세포에서의 모든 다른 실험에서, 975ng의 인간 코돈 최적화된 pCAG-Csy4-T2A-nls-hFokI-dCas9-nls(SQT1601) 또는 pCAG-Cas9-D10A 틈내기효소(NW3)를 325ng의 gRNA 벡터 및 10ng의 Td 토마토 발현 플라스미드와 함께 형질감염시켰으며, 형질감염 후 3일에 분석하였다. HEK293 세포를 제조업자의 지침에 따라 리포펙타민(라이프 테크놀로지즈)을 이용하여 750ng의 뉴클레아제 플라스미드, 250ng의 gRNA 발현 플라스미드 및 10ng의 Td 토마토와 함께 형질감염시키고, 형질감염 3일 후에 NHEJ-매개된 돌연변이유발에 대해 분석하였다.
초기 스페이서 활성 선별을 위해 단일 형질감염을 수행하고, 중심 스페이서 길이 분석에 대한 형질감염을 2회 반복하였다. 모든 다른 형질감염을 3회 중복해서 수행하였다.
EGFP
붕괴 분석
U2OS.EGFP 수용체 세포를 이용하여 앞서 기재한 바와 같이 EGFP 붕괴 분석을 수행하였다(실시예 1 및 문헌[Reyon et al., Nat Biotech 30, 460-465 (2012)] 참조). BD 바이오사이언스(BD Biosciences) LSR II 또는 포르테사(Fortessa) FACS 분석기를 이용하여 EGFP 및 td토마토 발현에 대해 세포를 분석하였다.
T7EI
분석에 의한 뉴클레아제- 또는 틈내기효소-유도 돌연변이의 정량화
앞서 기재한 바와 같이 T7E1 분석을 수행하였다(Reyon et al., Nat Biotech 30, 460-465 (2012)). 요약하면, 게놈 DNA를 형질감염 72시간 후에 스치클론(Sciclone) G3 액체-조절 워크스테이션(캘리퍼(Caliper))와 함께 제조업자의 지침에 따라 에이전코트 DNA어드밴스 게놈 DNA 단리 키트(Agencourt DNAdvance Genomic DNA Isolation kit)(벡맨 콜터 게노믹스(Beckman Coulter Genomics))를 이용하여 단리시켰다. 게놈 좌위를 증폭시키기 위한 PCR 반응을 퓨전 핫-스타트 플렉스 DNA 중합효소(뉴질랜드 바이오랩스(New England Biolabs))를 이용하여 수행하였다. 2단계 프로토콜을 이용하여 샘플을 증폭시켰다(98℃, 30초; (98℃, 7초; 72℃, 30초) x 35; 72℃, 5분) 또는 터치다운 PCR 프로토콜((98℃, 10초; 72 내지 62℃, -1℃/주기, 15초; 72℃, 30초) x 10주기, (98℃, 10초; 62℃, 15초; 72℃, 30초) x 25주기). 200ng의 정제된 PCR 앰플리콘을 변성시키고, 혼성화시키고 나서, T7 엔도뉴클레아제 I(뉴 잉글랜드 바이오랩스(New England Biolabs))로 처리하였다. 앞서 기재한 바와 같은 퀴악셀(Qiaxcel) 모세관 전기이동 기기(퀴아젠(Qiagen))을 이용하여 돌연변이 빈도를 정량화하였다(Reyon et al., Nat Biotech 30, 460-465 (2012)).
돌연변이유발된 게놈 DNA의 생어 서열화
T7EI 분석을 위해 사용한 동일한 정제시킨 PCR 산물은 토포-클론드(Topo-cloned)(라이프 테크놀로지)였고, M13 역 프라이머(5'-GTAAAACGACGGCCAG-3'; 서열번호 19)를 이용하여 개개 클론의 플라스미드 DNA를 단리시키고 서열화하였다.
일루미나(Illumina) 라이브러리 제조 및 분석
퓨전 핫-스타트 FLEX DNA 중합효소를 이용하여 짧은 200 내지 350 bp PCR 산물을 증폭시켰다. 제조업자의 지침에 따라 앰퓨어 XP 비드(벡맨 콜터 게놈(Beckman Coulter Genomics))을 이용하여 PCR 산물을 증폭시켰다. 스치클론 G3 액체-조절 워크스테이션 상에서 고속대량 라이브러리 제조 시스템(카파 바이오시스템즈(Kapa Biosystems))을 이용하여 이중-지표(Dual-indexed) TruSeq 일루미나 심층 서열화 라이브러리를 제조하였다. 퀴악셀 모세관 전기이동 기기(퀴아젠)를 이용하여 최종 어댑터 결찰 라이브러리를 정량화시켰다. 150bp의 짝지어진 말단 서열화를 대나-파버 암연구소 분자 생물학 핵심 시설(Dana-Farber Cancer Institute Molecular Biology Core Facilities)에서 수행하였다.
MiSeq 짝지어진-말단 판독을 bwa를 이용하여 인간 게놈 기준 GChr37에 대해 맵핑하였다. 30 초과의 평균 정성 스코어에 의한 판독으로 의도된 표적 또는 후보 표적을 벗어난 뉴클레아제 결합 부위와 중복되는 삽입 또는 결실 돌연변이에 대해 분석하였다. 게놈 분석 툴키트(Genome Analysis Toolkit: GATK) 및 피톤(Python)을 이용하여 돌연변이 분석을 수행하였다.
표적을 벗어난 탐색 알고리즘:
인간 게놈에 걸쳐 슬라이딩 윈도(sliding window)에서의 구체화된 미스매치의 수 미만의 매치를 찾는 표적-부위 매칭 알고리즘을 실행하였다.
실시예 2a. 이량체 RNA-안내 뉴클레아제를 설계하기 위한 이유
이량체화의 특이성 이점을 Cas9 표적화의 용이함과 조합하는 단일 플랫폼을 개발할 수 있다는 가설을 세웠다. 이를 위해서, 잘 특성규명된, 이합체화-의존적 FokI 뉴클레아제 도메인을 RNA-안내 촉매적 불활성 Cas9(dCas9) 단백질에 융합시켰다. FokI-함유 ZFN 및 TALEN과 같이, 이들 융합의 이량체는 그들 사이에 특정 길이 "스페이서" 서열을 지니는 2개의 "절반-부위"로 구성된 표적 부위에 결합될 때 서열-특이적 DNA 절단을 매개할 수 있는 것으로 기대된다(도 4a). 이러한 융합은 그들이 활성을 위해 2개의 gRNA를 필요로 하여야 하기 때문에(도 4a) 그리고 단일 gRNA가 DNA 절단에 필요한 2개의 FokI-함유 융합 단백질을 동원하는데 너무 비효율적이거나 또는 할 수 없는 것으로 추정되기 때문에, 향상된 특이성을 갖는다는 가설을 세웠다. 이러한 이량체 시스템은 표준 단량체 Cas9 뉴클레아제에 비해 개선된 특이성을 나타내며 또한 단일 틈내기효소가 여전히 원치않는 돌연변이유발 효과를 발휘할 수 있는 짝지어진 틈내기효소 시스템 이상의 중요한 특이성 이점을 잠재적으로 가질 것이라는 가설을 세웠다.
실시예 2b. 5' 단부 뉴클레오타이드 제한이 없는 gRNA의 다중복합 발현
기존의 gRNA 발현 방법을 이용하는 이량체 RNA-안내 뉴클레아제에 대한 표적화 범위는 낮다. 두 서열 필요(dCas9에 의해 구체화된 5' NGG의 PAM 서열에 대한 필요 및 대부분의 발현 벡터 내 U6 프로모터의 사용에 의해 겹쳐진 gRNA의 5' 말단에서 G 뉴클레오타이드에 대한 필요)는 전형적으로 dCas9 단량체의 표적화 범위를 제한한다. 그러나, gRNA 내 5' G에 대한 필요가 줄어들 수 있다면, 표적화 범위는 16배만큼 개선된다.
임의의 5' 뉴클레오타이드를 지니는 gRNA의 발현을 가능하게 하는 다중복합 시스템을 개발하기 위해, Csy4 리보뉴클레아제에 대한 절단 부위에 각각 측접하는 2개의 gRNA가(Haurwitz et al., Science 329, 1355-1358 (2010)) U6 프로모터로부터 전사된 단일 RNA 내에서 발현될 수 있는 플라스미드를 구성하였다(도 4b). Csy4는 이 전사체를 가공하여 2개의 gRNA를 방출하는 것으로 예상되었다. Csy4-매개된 절단의 공지된 메커니즘에 기반하여((Haurwitz et al., Science 329, 1355-1358 (2010); Sternberg et al., RNA 18, 661-672 (2012)), 각각의 가공된 gRNA는 해당 부위에 결합된 Cys4 단백질을 지니는 그의 3' 말단 상에서 Csy4 인식 부위를 보유하여야 한다(도 4b). 이 입체배치에서, 임의의 5' 뉴클레오타이드를 지니는 gRNA를 발현시킬 수 있어야 한다. 그것을 사용하여 EGFP 리포터 유전자 내의 부위에 표적화된 2개의 gRNA를 발현시킴으로써 이 시스템은 시험하였다. 인간 세포 내 Csy4 및 Cas9 뉴클레아제와 함께 이 전사체의 공동발현은 EGFP 표적 부위에서의 삽입결실 돌연변이의 도입뿐만 아니라 이들 부위 내의 서열의 결실을 야기하였다(도 4c). 이들 실험은 gRNA가 둘 다 단일 모 RNA 전사체로부터 가공되고 둘 다 인간 세포 내에서의 Cas9 뉴클레아제 활성을 지시할 수 있다는 것을 시사한다.
실시예 2c. 이량체 RNA-안내 뉴클레아제의 구성 및 최적화
FokI 뉴클레아제 도메인 및 dCas9 단백질을 보유하는 2개의 상이한 혼성체 단백질을 구성하였다: FokI 뉴클레아제 도메인이 dCas9의 카복시-말단에 융합된 하나(dCas9-FokI) 및 그것이 아미노-말단에 융합된 다른 하나(FokI-dCas9)(도 5a). dCas9-FokI 단백질은 ZFN 및 TALEN과 구조가 유사하다(도 5a). 이들 융합 중 하나 또는 둘 다가 DNA의 부위 특이적 절단을 매개하는지의 여부를 확인하기 위해, EGFP 리포터 유전자 내로의 NHEJ-매개된 삽입결실의 도입을 빠르고 용이하게 정량화할 수 있는 잘 확립된 인간 세포 기반 분석을 사용하였다(실시예 1에서 상기 기재한 EGFP 붕괴 분석). 효율적인 절단을 위해 필요한 절반-부위의 기하학적 구조는 알려져 있지 않기 때문에, EGFP 내 다양한 부위에 대해 표적화된 60쌍의 gRNA를 설계하였다. 각각의 이들 gRNA 쌍에 의해 표적화된 2개의 절반 부위를 그들의 PAM 서열이 둘 다 스페이서 서열에 직접 인접하거나("PAM 내부" 배향) 또는 전장 표적 부위의 외부 경계에 위치되도록("PAM 외부" 배향) 배향시켰다(도 5b). 추가로, 스페이서 서열은 또한 0 내지 31 bp의 길이로 변하였다(도 5b 및 표 2).
놀랍게도, dCas9-FokI 단백질은 인간 U2OS.EGFP 세포에서 임의의 60개의 gRNA 쌍과 함께 공동 발현될 때, 검출가능한 EGFP 붕괴 활성을 나타내지 않았다(도 5e). 그러나, 동일한 60개의 gRNA 쌍을 지니는 FokI-dCas9 단백질의 선별은 PAM 외부 배향으로 그리고 13 내지 17개 bp의 스페이서 길이 및 26 bp의 스페이서 길이로 구성된 표적 부위 상의 EGFP 붕괴 활성을 나타내었다(13 내지 17 초과의 bp 스페이서 길이의 대략 1회전의 DNA 나선)(도 5b). 10 내지 20 bp 범위에 있는 스페이스 길이를 지니고 PAM 외부 배향으로 절반-부위를 지니는 추가적인 25개 표적 DNA 부위에 대한 FokI-dCas9의 시험은 13 내지 18 bp의 스페이서 길이를 지니는 표적 상에서 효율적인 절단을 입증하였다(도 5c 내지 도 5d). 이들 실험에서, 하나의 부위 각각을 17 또는 18 bp의 스페이서 길이에 대해 시험하였고, 13 bp 스페이서 길이를 지니는 모든 부위가 활성을 나타내지는 않았다. T7EI 분석 및 생어 서열화에 의한 성공적으로 표적화된 부위의 서브세트의 분석은 의도된 위치에서의 삽입결실의 존재를 추가로 확인하였다. 따라서, FokI-dCas9는 관심 대상의 전장 표적 부위를 효율적으로 절단하기 위해 2개의 적절하게 위치된 gRNA에 의해 지시될 수 있다. 단순함을 위해, 2개의 FokI-dCas9 융합과 2개의 gRNA의 복합체는 RNA-안내 FokI 뉴클레아제(RFN)로서 본 명세서에서 지칭된다.
EGFP 수용체 유전자에 의한 초기 발견을 연장시키기 위해 그리고 RFN이 내인성 인간 유전자의 일상적인 게놈 편집을 수행하기 위해 사용될 수 있었는지의 여부를 확인하기 위해, 9개의 상이한 인간 유전자에서 12개의 상이한 표적 부위에 대해 gRNA 쌍을 설계하였다(표 2). 시험한 12개의 RFN 중 11개는 T7EI 분석에 의해 판단되는 바와 같이 인간 U2OS.EGFP 세포 내 그들의 의도된 표적 부위에서 고효율(3 내지 40%의 범위)로 삽입결실을 도입하였다(표 2). HEK293 세포에서 이들 동일한 12개의 RFN 쌍과 유사한 결과를 얻었다(표 2). U2OS.EGFP 세포로부터 성공적으로 표적화된 대립유전자의 생어 서열화는 예상된 절단 부위에서 삽입결실(주로 결실) 범위의 도입을 나타내었다(도 5f). 두 상이한 인간 세포주에서 관찰된 고성공률 및 고효율의 변형은 내인성 인간 유전자를 변형시키기 위한 RFN의 강함을 입증한다.
실시예 2d. RFN은 절단 부위에 대해 연장된 특이성을 가진다
RFN이 이량체화와 관련된 향상된 인식 특이성을 갖는지의 여부를 시험하기 위해, 이들 뉴클레아제가 쌍 내의 gRNA가 둘 다의 존재에 의존하는지의 여부를 시험하였다. 이상적인 이량체 시스템에서, 단일 gRNA는 FokI-dCas9-유도 삽입결실을 효율적으로 지시할 수 없어야 한다. 초기 시험을 수행하기 위해, 인간 U2OS.EGFP 세포에서 표적 부위에 대한 FokI-dCas9-유도 삽입결실을 효율적으로 지시하는 것으로 나타난 EGFP 내 2개의 표적 부위(EGFP 부위 47 및 81)로 향하는 두 쌍의 gRNA를 사용하였다(도 5c). VEGFA 내 관련없는 부위에 대해 표적화된 gRNA를 지니는 이들 두 쌍의 각각에서 하나 또는 다른 하나의 gRNA의 대체는 EGFP 붕괴 활성의 감소(도 6a) 및 T7EI 분석에 의해 판단되는 바와 같은 검출가능하지 않은 수준으로 표적화된 돌연변이의 감소(도 6b)를 초래하였다. 유사하게, 인간 APC, MLH1 및 VEGFA 유전자 내에 FokI-dCas9-매개된 삽입결실을 효율적으로 도입하는 쌍을 이용하여 두 gRNA의 각각 중 단지 하나를 사용하는 효과를 시험하였고(표 2) 또한 T7EI 분석에 의한 검출가능한 RFN-유도 삽입결실의 손실을 관찰하였다(도 6c). 이들 결과는 RFN에 의한 게놈 편집의 효율적인 유도가 전장 표적 부위에 대해 적절한 상보성을 지니는 2개의 gRNA를 필요로 한다는 것을 입증한다.
본 발명자들의 RFN의 활성이 두 gRNA의 발현에 의존한다는 것을 고려하면, 쌍에서 단일 gRNA 중 하나의 알려진 표적을 벗어난 부위에 대한 그들의 돌연변이유발 효과가 무시할만해야 하는 것으로 기대되었다. 이들 직접적 비교를 수행하는 것은 단일 gRNA(그 자체가 또한 이량체 RFN을 표적화하는데 필요한 2개의 gRNA 중 하나로 작용할 수 있음)에 의해 안내된 단량체 Cas9 뉴클레아제에 대한 표적을 벗어난 부위를 알 것을 필요로 한다. 매우 소수의 단량체 Cas9 뉴클레아제 표적을 벗어난 부위가 문헌에서 정의되었지만, 5개의 표적을 벗어난 부위는 본 발명자들이 인간 VEGFA 유전자 내 이량체 RFN 부위를 표적화하기 위해 사용한 gRNA 중 하나에 대해 이전에 동정되었다(실시예 1). 이들 5개의 표적을 벗어난 부위가 VEGFA-표적화된 RFN이 발현된 세포 내 돌연변이의 증거를 나타내었는지의 여부를 확인하기 위해 심층 서열화를 사용하였다(이들은 본 발명자들이 도 6c에서 나타낸 T7EI 분석에 대해 사용한 것과 동일한 세포이다). 모두 5개의 표적을 벗어난 부위에서의 삽입결실 돌연변이의 빈도를 배경과 구별할 수 없었다(도 6d 및 표 3). 이들 결과는 RFN의 사용이 Cas9 뉴클레아제 및 단일 gRNA에 의해 본래 유도된 표적을 벗어난 효과를 본질적으로 제거할 수 있으며, FokI-dCas9와 함께 발현된 단일 gRNA가 삽입결실을 효율적으로 유도하지 않는다는 것을 입증한다. 현재는 추가 부위 상에서 이들의 직접적 비교를 수행할 수는 없지만, 이러한 실험은 이량체 RFN에 대한 절반-부위를 또한 표적화할 수 있는 더 단일의 gRNA 부위에 대해 표적을 벗어난 부위의 동정을 기다려야 할 것이며, 이량체 RFN이 표준 단량체 Cas9 뉴클레아제에 비해 향상된 특이성을 가진다는 결론을 내렸다.
실시예 2e. 단량체 Cas9 틈내기효소는 단일 gRNA/FokI-dCas9 복합체보다 더 고비율의 돌연변이유발을 유도한다
상기 주목한 바와 같이, 짝지어진 Cas9 틈내기효소 접근의 중요한 약점은 단일 단량체 틈내기효소가 특정 표적 부위에서 고빈도로 삽입결실 돌연변이를 도입할 수 있다는 것이다(실시예 1 및 문헌[Ran et al., Cell 154, 1380-1389 (2013); Mali et al., Nat Biotechnol 31, 833-838 (2013); Cho et al., 게놈 Res (2013); 및 Mali et al., Science 339, 823-826 (2013)]). 짝지어진 Cas9 틈내기효소 시스템에서 이량체화-의존도의 이런 결여는 두 단량체 틈내기효소가 게놈 내 다른 곳에서 원치않는 삽입결실 돌연변이를 생성할 수 있기 때문에 표적을 벗어난 효과의 잠재적 공급원이다. RFN이 이량체화-의존적 FokI 뉴클레아제를 이용하는 변용을 도입하기 때문에, 이들 융합은 일반적으로 단량체 Cas9 틈내기효소에 의해 관찰된 것에 비해 단지 하나의 gRNA의 존재에서 바람직하지 않은 삽입결실 활성을 더 적게 나타내야 한다는 가설을 세웠다.
이 가설을 시험하기 위해, FokI-dCas9 및 Cas9 틈내기효소의 활성을 6개의 이량체 인간 유전자 표적 부위에서 단일 gRNA의 존재 하에 비교하였다(총 12개의 절반-부위; 표 4). 한 쌍에서 단지 하나 및/또는 다른 하나의 gRNA에 의해 지시되는 단량체 Cas9 틈내기효소가 이들 표적에서 삽입결실 돌연변이를 유도할 수 있었기 때문에 이들 특정 부위를 선택하였다. 심층 서열화를 이용하여, FokI-dCas9 또는 Cas9 틈내기효소의 게놈 편집 활성을 gRNA 둘 다 또는 단지 하나 또는 다른 하나의 존재 하에 평가하였다. FokI-dCas9와 Cas9 틈내기효소는 둘 다 두 gRNA의 존재에서 고효율로 모두 6개 표적 부위에서 삽입결실을 유도하였다(표 5). 가설로 세운 바와 같이, 12개의 단일 gRNA에 의해 지시되는 단량체 Cas9 틈내기효소는 0.0048% 내지 3.04%의 범위에 있는 빈도로 삽입결실을 유도하였다(도 7a 및 표 5). 대조적으로, 동일한 12개의 단일 gRNA에 의해 지시되는 FokI-dCas9는 0.0045% 내지 0.473%의 범위에 있는 낮은 빈도로 삽입결실을 유도하였다(도 7a 및 표 5). 이들 데이터를 직접 비교함으로써, FokI-dCas9는 12개의 단일 gRNA 중 10개에 대해 Cas9 틈내기효소보다 더 낮은 빈도로 삽입결실을 유도하였다(도 7a 및 표 5). 추가로, FokI-dCas9는 짝지어진 gRNA 비율을 단일 gRNA 비율과 비교할 때 12개의 절반-부위 중 11개에서 Cas9 절단 효소보다 십입결실 빈도의 더 큰 배수적 감소를 나타내었다(도 7b).
심층 서열화 실험은 또한 특정 단량체 Cas9 틈내기효소의 이전에 기재하지 않은 그리고 예상치 못한 부작용, 즉, 그들의 표적 부위 내의 특정 위치에서의 점돌연변이의 도입을 아우르지 못한다. VEGFA 표적의 "우측" 절반-부위에 대한 단일 gRNA와 함께 공동발현시킨 Cas9 틈내기효소는 10.5%의 빈도로 인식 부위의 위치 15에서 염기 치환을 유도하였다(도 8a). FANCF 표적 부위 1(위치 16에서 16.3%의 돌연변이 빈도)의 "우측 절반-부위"로 향하거나(도 8b) 또는 RUNX1 표적 부위의 "우측" 절반-부위(위치 17에서 2%의 돌연변이 빈도)(도 8c)로 향하는 Cas9 틈내기효소 및 단일 gRNA에 의해 유사한 결과를 관찰하였다. 이들 위치에서 점돌연변이는 Cas9 틈내기효소 또는 gRNA가 세포 내에서 발현되지 않은 대조군 샘플 내에서 배경수준 초과로 관찰되지 않았다(도 8a 내지 도 8c). 흥미롭게도, 이 초돌연변이가 관찰된 세 부위 중 둘에 대해, 관찰된 대부분의 치환은 비-표적 DNA 가닥 상에서 C의 G로의 전환이다. 이들 점돌연변이가 관찰되는 위치는 dCas9/gRNA/표적 DNA 복합체에서 시험관내 P1 뉴클레아제에 민감하게 되는 것으로 관찰된 표적 부위의 가닥-분리된 영역 내에 속한다. 중요하게도, 이들 점돌연변이는 FokI-dCas9 단백질 및 동일한 gRNA를 발현시키는 세포 내에서 훨씬 더 낮은 빈도로(5 내지 100배 더 낮음) 생긴다(도 8a 내 지 도 8c). 전반적으로, 단일 gRNA에 의해 지시되는 FokI-dCas9 뉴클레아제는 매칭된 단일 Cas9 틈내기효소보다 더 낮은 빈도로 돌연변이유발 삽입결실 및 점돌연변이를 유도한다는 결론을 내렸다.
실시예 2f. 이량체 RFN는 고특이도를 가진다
2개의 gRNA에 의해 지시되는 이량체 RFN는 인간 세포에서 인식가능한 표적을 벗어난 돌연변이를 유도하는 것으로 예상되지 않는다. 두 절반-부위로 구성된 전장 서열을 절단하기 위한 gRNA의 쌍에 의해 지시된 RFN은 표적 부위에서 DNA의 44개 bp까지를 구체화하는 것으로 예상되었다. 이 길이의 서열은 뜻밖에도 (표적이 이중 게놈 서열에 놓이는 특정 상황을 제외하고) 거의 항상 독특할 것이다. 추가로, 이 전장 부위에 대해 게놈 내에서 거의 밀접하게 매칭된 부위는 대부분의 경우에 다수의 미스매치를 가져야 하며, 결국 RFN 이량체에 의해 활성을 최소화하거나 없애는 것으로 예상된다. 사실, 이 연구에서 RFN에 의해 성공적으로 표적화된 15개의 전장 서열에 대해 0 내지 16개의 미스매치를 보유하는(그리고 14 내지 17 bp 길이의 스페이서를 허용하는) 인간 게놈 내 모든 부위를 동정하였다. 이 분석은 모두 15개의 전장 서열이 독특하며 게놈 내에서 가장 밀접하게 매칭된 부위가 7 내지 12개의 미스매치 범위에 있다는 것을 나타내었다(표 6). 이 수의 미스매치를 함유하는 부위는 RFN에 의해 효율적으로 돌연변이유발되지 않아야 하며, 이 가설을 확인하기 위한 장래의 연구에서 관심대상이 될 것이다. 전반적으로, 이량체 RFN은 인간 세포에서 고특이도를 가져야 하지만, 특이성의 궁극적 특성규명은 전체 게놈에 걸쳐 RFN 특이도를 포괄적으로 정할 수 있는 편견없는 방법의 개발을 기대할 것이다.
참고문헌
다른 실시형태
본 발명이 이의 상세한 설명화 함께 기재되었지만, 앞서 언급한 설명은 예시적인 것이며 첨부하는 청구범위의 범주에 의해서 정해지는 본 발명의 범주를 제한하지 않는 것으로 의도된다는 것이 이해되어야 한다. 다른 양태, 이점 및 변형이 다음의 청구범위의 범주 내에 있다.
SEQUENCE LISTING
<110> THE GENERAL HOSPITAL CORPORATION
<120> USING RNA-GUIDED FOKI NUCLEASES (RFNS) TO INCREASE SPECIFICITY
FOR RNA-GUIDED GENOME EDITING
<130> 00786-0895WO1
<140> PCT/US2014/028630
<141> 2014-03-14
<150> 61/921,007
<151> 2013-12-26
<150> 61/838,148
<151> 2013-06-21
<150> 61/838,178
<151> 2013-06-21
<150> 61/799,647
<151> 2013-03-15
<160> 466
<170> PatentIn version 3.5
<210> 1
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
binding site oligonucleotide
<400> 1
gggcacgggc agcttgccgg tgg 23
<210> 2
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
binding site oligonucleotide
<400> 2
gatgccgttc ttctgcttgt cgg 23
<210> 3
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
binding site oligonucleotide
<400> 3
ggtggtgcag atgaacttca ggg 23
<210> 4
<211> 583
<212> PRT
<213> Planomicrobium okeanokoites
<400> 4
Met Phe Leu Ser Met Val Ser Lys Ile Arg Thr Phe Gly Trp Val Gln
1 5 10 15
Asn Pro Gly Lys Phe Glu Asn Leu Lys Arg Val Val Gln Val Phe Asp
20 25 30
Arg Asn Ser Lys Val His Asn Glu Val Lys Asn Ile Lys Ile Pro Thr
35 40 45
Leu Val Lys Glu Ser Lys Ile Gln Lys Glu Leu Val Ala Ile Met Asn
50 55 60
Gln His Asp Leu Ile Tyr Thr Tyr Lys Glu Leu Val Gly Thr Gly Thr
65 70 75 80
Ser Ile Arg Ser Glu Ala Pro Cys Asp Ala Ile Ile Gln Ala Thr Ile
85 90 95
Ala Asp Gln Gly Asn Lys Lys Gly Tyr Ile Asp Asn Trp Ser Ser Asp
100 105 110
Gly Phe Leu Arg Trp Ala His Ala Leu Gly Phe Ile Glu Tyr Ile Asn
115 120 125
Lys Ser Asp Ser Phe Val Ile Thr Asp Val Gly Leu Ala Tyr Ser Lys
130 135 140
Ser Ala Asp Gly Ser Ala Ile Glu Lys Glu Ile Leu Ile Glu Ala Ile
145 150 155 160
Ser Ser Tyr Pro Pro Ala Ile Arg Ile Leu Thr Leu Leu Glu Asp Gly
165 170 175
Gln His Leu Thr Lys Phe Asp Leu Gly Lys Asn Leu Gly Phe Ser Gly
180 185 190
Glu Ser Gly Phe Thr Ser Leu Pro Glu Gly Ile Leu Leu Asp Thr Leu
195 200 205
Ala Asn Ala Met Pro Lys Asp Lys Gly Glu Ile Arg Asn Asn Trp Glu
210 215 220
Gly Ser Ser Asp Lys Tyr Ala Arg Met Ile Gly Gly Trp Leu Asp Lys
225 230 235 240
Leu Gly Leu Val Lys Gln Gly Lys Lys Glu Phe Ile Ile Pro Thr Leu
245 250 255
Gly Lys Pro Asp Asn Lys Glu Phe Ile Ser His Ala Phe Lys Ile Thr
260 265 270
Gly Glu Gly Leu Lys Val Leu Arg Arg Ala Lys Gly Ser Thr Lys Phe
275 280 285
Thr Arg Val Pro Lys Arg Val Tyr Trp Glu Met Leu Ala Thr Asn Leu
290 295 300
Thr Asp Lys Glu Tyr Val Arg Thr Arg Arg Ala Leu Ile Leu Glu Ile
305 310 315 320
Leu Ile Lys Ala Gly Ser Leu Lys Ile Glu Gln Ile Gln Asp Asn Leu
325 330 335
Lys Lys Leu Gly Phe Asp Glu Val Ile Glu Thr Ile Glu Asn Asp Ile
340 345 350
Lys Gly Leu Ile Asn Thr Gly Ile Phe Ile Glu Ile Lys Gly Arg Phe
355 360 365
Tyr Gln Leu Lys Asp His Ile Leu Gln Phe Val Ile Pro Asn Arg Gly
370 375 380
Val Thr Lys Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu
385 390 395 400
Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile
405 410 415
Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val
420 425 430
Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly
435 440 445
Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile
450 455 460
Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn
465 470 475 480
Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn
485 490 495
Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr
500 505 510
Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe
515 520 525
Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn
530 535 540
Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu
545 550 555 560
Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe
565 570 575
Asn Asn Gly Glu Ile Asn Phe
580
<210> 5
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 5
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 6
<211> 262
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
guide RNA polynucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<220>
<221> modified_base
<222> (63)..(262)
<223> a, c, u, g, unknown or other and this region may encompass
0-200 nucleotides
<400> 6
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cgnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nn 262
<210> 7
<211> 275
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
guide RNA polynucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<220>
<221> modified_base
<222> (76)..(275)
<223> a, c, u, g, unknown or other and this region may encompass
0-200 nucleotides
<400> 7
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60
ggcuaguccg uuaucnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnn 275
<210> 8
<211> 287
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
guide RNA polynucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<220>
<221> modified_base
<222> (88)..(287)
<223> a, c, u, g, unknown or other and this region may encompass
0-200 nucleotides
<400> 8
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnn 287
<210> 9
<211> 296
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
guide RNA polynucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<220>
<221> modified_base
<222> (97)..(296)
<223> a, c, u, g, unknown or other and this region may encompass
0-200 nucleotides
<400> 9
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnn 296
<210> 10
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
guide RNA oligonucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<400> 10
nnnnnnnnnn nnnnnnnnnn guuuaagagc uagaaauagc aaguuuaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 11
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
guide RNA polynucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<400> 11
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 106
<210> 12
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
guide RNA polynucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<400> 12
nnnnnnnnnn nnnnnnnnnn guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 106
<210> 13
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
tracrRNA oligonucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<400> 13
nnnnnnnnnn nnnnnnnnnn guuuuagagc ua 32
<210> 14
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
tracrRNA oligonucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<400> 14
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 15
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
tracrRNA oligonucleotide
<220>
<221> modified_base
<222> (1)..(20)
<223> a, c, u, g, unknown or other and this region may encompass
17-20 nucleotides
<400> 15
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcu 36
<210> 16
<211> 79
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
tracrRNA oligonucleotide
<400> 16
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugc 79
<210> 17
<211> 60
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
tracrRNA oligonucleotide
<400> 17
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60
<210> 18
<211> 64
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
tracrRNA oligonucleotide
<400> 18
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugc 64
<210> 19
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 19
gtaaaacgac ggccag 16
<210> 20
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
Csy4 RNA binding site oligonucleotide
<400> 20
guucacugcc guauaggcag cuaagaaa 28
<210> 21
<211> 252
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
multiplex guide RNA polynucleotide
<220>
<221> modified_base
<222> (21)..(40)
<223> a, c, u, g, unknown or other
<220>
<221> modified_base
<222> (137)..(156)
<223> a, c, u, g, unknown or other
<400> 21
guucacugcc guauaggcag nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcguuc 120
acugccguau aggcagnnnn nnnnnnnnnn nnnnnnguuu uagagcuaga aauagcaagu 180
uaaaauaagg cuaguccguu aucaacuuga aaaaguggca ccgagucggu gcguucacug 240
ccguauaggc ag 252
<210> 22
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
linker peptide
<400> 22
Gly Gly Gly Ser
1
<210> 23
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
linker peptide
<400> 23
Gly Gly Gly Gly Ser
1 5
<210> 24
<211> 1602
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
FokI-dCas9 polypeptide
<400> 24
Met Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
1 5 10 15
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
20 25 30
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
35 40 45
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
50 55 60
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
65 70 75 80
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
85 90 95
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
100 105 110
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
115 120 125
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
130 135 140
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
145 150 155 160
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
165 170 175
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
180 185 190
Gly Glu Ile Asn Phe Gly Gly Gly Gly Ser Asp Lys Lys Tyr Ser Ile
195 200 205
Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp
210 215 220
Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp
225 230 235 240
Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser
245 250 255
Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg
260 265 270
Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser
275 280 285
Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu
290 295 300
Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe
305 310 315 320
Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile
325 330 335
Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu
340 345 350
Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His
355 360 365
Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys
370 375 380
Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn
385 390 395 400
Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg
405 410 415
Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly
420 425 430
Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly
435 440 445
Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys
450 455 460
Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu
465 470 475 480
Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn
485 490 495
Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu
500 505 510
Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu
515 520 525
His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu
530 535 540
Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr
545 550 555 560
Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe
565 570 575
Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val
580 585 590
Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn
595 600 605
Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu
610 615 620
Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
625 630 635 640
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu
645 650 655
Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu
660 665 670
Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser
675 680 685
Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro
690 695 700
Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr
705 710 715 720
Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg
725 730 735
Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu
740 745 750
Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp
755 760 765
Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val
770 775 780
Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys
785 790 795 800
Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile
805 810 815
Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met
820 825 830
Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val
835 840 845
Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser
850 855 860
Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
865 870 875 880
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln
885 890 895
Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala
900 905 910
Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu
915 920 925
Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
930 935 940
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile
945 950 955 960
Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys
965 970 975
Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu
980 985 990
Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
995 1000 1005
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1010 1015 1020
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1025 1030 1035
Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1040 1045 1050
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1055 1060 1065
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1070 1075 1080
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1085 1090 1095
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1100 1105 1110
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1115 1120 1125
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1130 1135 1140
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1145 1150 1155
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1160 1165 1170
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1175 1180 1185
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1190 1195 1200
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1205 1210 1215
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1220 1225 1230
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1235 1240 1245
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1250 1255 1260
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1265 1270 1275
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1280 1285 1290
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1295 1300 1305
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1310 1315 1320
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1325 1330 1335
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1340 1345 1350
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1355 1360 1365
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1370 1375 1380
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1385 1390 1395
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1400 1405 1410
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1415 1420 1425
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1430 1435 1440
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1445 1450 1455
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1460 1465 1470
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1475 1480 1485
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1490 1495 1500
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1505 1510 1515
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1520 1525 1530
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1535 1540 1545
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1550 1555 1560
Ser Gln Leu Gly Gly Asp Gly Ser Pro Lys Lys Lys Arg Lys Val
1565 1570 1575
Ser Ser Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp
1580 1585 1590
Ile Asp Tyr Lys Asp Asp Asp Asp Lys
1595 1600
<210> 25
<211> 4809
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
FokI-dCas9 polynucleotide
<400> 25
atgcaactag tcaaaagtga actggaggag aagaaatctg aacttcgtca taaattgaaa 60
tatgtgcctc atgaatatat tgaattaatt gaaattgcca gaaattccac tcaggataga 120
attcttgaaa tgaaggtaat ggaatttttt atgaaagttt atggatatag aggtaaacat 180
ttgggtggat caaggaaacc ggacggagca atttatactg tcggatctcc tattgattac 240
ggtgtgatcg tggatactaa agcttatagc ggaggttata atctgccaat tggccaagca 300
gatgaaatgc aacgatatgt cgaagaaaat caaacacgaa acaaacatat caaccctaat 360
gaatggtgga aagtctatcc atcttctgta acggaattta agtttttatt tgtgagtggt 420
cactttaaag gaaactacaa agctcagctt acacgattaa atcatatcac taattgtaat 480
ggagctgttc ttagtgtaga agagctttta attggtggag aaatgattaa agccggcaca 540
ttaaccttag aggaagtcag acggaaattt aataacggcg agataaactt tggtggcggt 600
ggatccgata aaaagtattc tattggttta gccatcggca ctaattccgt tggatgggct 660
gtcataaccg atgaatacaa agtaccttca aagaaattta aggtgttggg gaacacagac 720
cgtcattcga ttaaaaagaa tcttatcggt gccctcctat tcgatagtgg cgaaacggca 780
gaggcgactc gcctgaaacg aaccgctcgg agaaggtata cacgtcgcaa gaaccgaata 840
tgttacttac aagaaatttt tagcaatgag atggccaaag ttgacgattc tttctttcac 900
cgtttggaag agtccttcct tgtcgaagag gacaagaaac atgaacggca ccccatcttt 960
ggaaacatag tagatgaggt ggcatatcat gaaaagtacc caacgattta tcacctcaga 1020
aaaaagctag ttgactcaac tgataaagcg gacctgaggt taatctactt ggctcttgcc 1080
catatgataa agttccgtgg gcactttctc attgagggtg atctaaatcc ggacaactcg 1140
gatgtcgaca aactgttcat ccagttagta caaacctata atcagttgtt tgaagagaac 1200
cctataaatg caagtggcgt ggatgcgaag gctattctta gcgcccgcct ctctaaatcc 1260
cgacggctag aaaacctgat cgcacaatta cccggagaga agaaaaatgg gttgttcggt 1320
aaccttatag cgctctcact aggcctgaca ccaaatttta agtcgaactt cgacttagct 1380
gaagatgcca aattgcagct tagtaaggac acgtacgatg acgatctcga caatctactg 1440
gcacaaattg gagatcagta tgcggactta tttttggctg ccaaaaacct tagcgatgca 1500
atcctcctat ctgacatact gagagttaat actgagatta ccaaggcgcc gttatccgct 1560
tcaatgatca aaaggtacga tgaacatcac caagacttga cacttctcaa ggccctagtc 1620
cgtcagcaac tgcctgagaa atataaggaa atattctttg atcagtcgaa aaacgggtac 1680
gcaggttata ttgacggcgg agcgagtcaa gaggaattct acaagtttat caaacccata 1740
ttagagaaga tggatgggac ggaagagttg cttgtaaaac tcaatcgcga agatctactg 1800
cgaaagcagc ggactttcga caacggtagc attccacatc aaatccactt aggcgaattg 1860
catgctatac ttagaaggca ggaggatttt tatccgttcc tcaaagacaa tcgtgaaaag 1920
attgagaaaa tcctaacctt tcgcatacct tactatgtgg gacccctggc ccgagggaac 1980
tctcggttcg catggatgac aagaaagtcc gaagaaacga ttactccatg gaattttgag 2040
gaagttgtcg ataaaggtgc gtcagctcaa tcgttcatcg agaggatgac caactttgac 2100
aagaatttac cgaacgaaaa agtattgcct aagcacagtt tactttacga gtatttcaca 2160
gtgtacaatg aactcacgaa agttaagtat gtcactgagg gcatgcgtaa acccgccttt 2220
ctaagcggag aacagaagaa agcaatagta gatctgttat tcaagaccaa ccgcaaagtg 2280
acagttaagc aattgaaaga ggactacttt aagaaaattg aatgcttcga ttctgtcgag 2340
atctccgggg tagaagatcg atttaatgcg tcacttggta cgtatcatga cctcctaaag 2400
ataattaaag ataaggactt cctggataac gaagagaatg aagatatctt agaagatata 2460
gtgttgactc ttaccctctt tgaagatcgg gaaatgattg aggaaagact aaaaacatac 2520
gctcacctgt tcgacgataa ggttatgaaa cagttaaaga ggcgtcgcta tacgggctgg 2580
ggacgattgt cgcggaaact tatcaacggg ataagagaca agcaaagtgg taaaactatt 2640
ctcgattttc taaagagcga cggcttcgcc aataggaact ttatgcagct gatccatgat 2700
gactctttaa ccttcaaaga ggatatacaa aaggcacagg tttccggaca aggggactca 2760
ttgcacgaac atattgcgaa tcttgctggt tcgccagcca tcaaaaaggg catactccag 2820
acagtcaaag tagtggatga gctagttaag gtcatgggac gtcacaaacc ggaaaacatt 2880
gtaatcgaga tggcacgcga aaatcaaacg actcagaagg ggcaaaaaaa cagtcgagag 2940
cggatgaaga gaatagaaga gggtattaaa gaactgggca gccagatctt aaaggagcat 3000
cctgtggaaa atacccaatt gcagaacgag aaactttacc tctattacct acaaaatgga 3060
agggacatgt atgttgatca ggaactggac ataaaccgtt tatctgatta cgacgtcgat 3120
gccattgtac cccaatcctt tttgaaggac gattcaatcg acaataaagt gcttacacgc 3180
tcggataaga accgagggaa aagtgacaat gttccaagcg aggaagtcgt aaagaaaatg 3240
aagaactatt ggcggcagct cctaaatgcg aaactgataa cgcaaagaaa gttcgataac 3300
ttaactaaag ctgagagggg tggcttgtct gaacttgaca aggccggatt tattaaacgt 3360
cagctcgtgg aaacccgcca aatcacaaag catgttgcac agatactaga ttcccgaatg 3420
aatacgaaat acgacgagaa cgataagctg attcgggaag tcaaagtaat cactttaaag 3480
tcaaaattgg tgtcggactt cagaaaggat tttcaattct ataaagttag ggagataaat 3540
aactaccacc atgcgcacga cgcttatctt aatgccgtcg tagggaccgc actcattaag 3600
aaatacccga agctagaaag tgagtttgtg tatggtgatt acaaagttta tgacgtccgt 3660
aagatgatcg cgaaaagcga acaggagata ggcaaggcta cagccaaata cttcttttat 3720
tctaacatta tgaatttctt taagacggaa atcactctgg caaacggaga gatacgcaaa 3780
cgacctttaa ttgaaaccaa tggggagaca ggtgaaatcg tatgggataa gggccgggac 3840
ttcgcgacgg tgagaaaagt tttgtccatg ccccaagtca acatagtaaa gaaaactgag 3900
gtgcagaccg gagggttttc aaaggaatcg attcttccaa aaaggaatag tgataagctc 3960
atcgctcgta aaaaggactg ggacccgaaa aagtacggtg gcttcgatag ccctacagtt 4020
gcctattctg tcctagtagt ggcaaaagtt gagaagggaa aatccaagaa actgaagtca 4080
gtcaaagaat tattggggat aacgattatg gagcgctcgt cttttgaaaa gaaccccatc 4140
gacttccttg aggcgaaagg ttacaaggaa gtaaaaaagg atctcataat taaactacca 4200
aagtatagtc tgtttgagtt agaaaatggc cgaaaacgga tgttggctag cgccggagag 4260
cttcaaaagg ggaacgaact cgcactaccg tctaaatacg tgaatttcct gtatttagcg 4320
tcccattacg agaagttgaa aggttcacct gaagataacg aacagaagca actttttgtt 4380
gagcagcaca aacattatct cgacgaaatc atagagcaaa tttcggaatt cagtaagaga 4440
gtcatcctag ctgatgccaa tctggacaaa gtattaagcg catacaacaa gcacagggat 4500
aaacccatac gtgagcaggc ggaaaatatt atccatttgt ttactcttac caacctcggc 4560
gctccagccg cattcaagta ttttgacaca acgatagatc gcaaacgata cacttctacc 4620
aaggaggtgc tagacgcgac actgattcac caatccatca cgggattata tgaaactcgg 4680
atagatttgt cacagcttgg gggtgacgga tcccccaaga agaagaggaa agtctcgagc 4740
gactacaaag accatgacgg tgattataaa gatcatgaca tcgattacaa ggatgacgat 4800
gacaagtga 4809
<210> 26
<211> 1401
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
Nls-FokI-dCas9-nls polypeptide
<400> 26
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Ser Asp Tyr Lys Asp
1370 1375 1380
His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp
1385 1390 1395
Asp Asp Lys
1400
<210> 27
<211> 4836
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
Nls-FokI-dCas9-nls polynucleotide
<400> 27
atgcctaaga agaagcggaa ggtgagcagc caacttgtga agtctgaact cgaggagaaa 60
aaatcagagt tgagacacaa gttgaagtac gtgccacacg aatacatcga gcttatcgag 120
atcgccagaa acagtaccca ggataggatc cttgagatga aagtcatgga gttctttatg 180
aaggtctacg gttatagagg aaagcacctt ggcggtagca gaaagcccga tggcgccatc 240
tatactgtcg gatctcctat cgattatggg gtgatcgtgg ataccaaagc ttactcaggc 300
gggtacaact tgcccatagg acaagccgac gagatgcagc ggtatgtcga agagaaccag 360
acgcgcaaca agcacatcaa ccccaatgaa tggtggaaag tgtacccaag tagtgtgact 420
gagttcaagt tcctgtttgt ctccggccac tttaagggca attataaagc tcagctcact 480
agactcaatc acatcacaaa ctgcaacgga gctgtgttgt cagtggagga gctcctgatt 540
ggaggcgaga tgatcaaagc cggcaccctt acactggagg aggtgcggcg gaagttcaac 600
aatggagaga tcaacttcgg tggcggtgga tccgataaaa agtattctat tggtttagcc 660
atcggcacta attccgttgg atgggctgtc ataaccgatg aatacaaagt accttcaaag 720
aaatttaagg tgttggggaa cacagaccgt cattcgatta aaaagaatct tatcggtgcc 780
ctcctattcg atagtggcga aacggcagag gcgactcgcc tgaaacgaac cgctcggaga 840
aggtatacac gtcgcaagaa ccgaatatgt tacttacaag aaatttttag caatgagatg 900
gccaaagttg acgattcttt ctttcaccgt ttggaagagt ccttccttgt cgaagaggac 960
aagaaacatg aacggcaccc catctttgga aacatagtag atgaggtggc atatcatgaa 1020
aagtacccaa cgatttatca cctcagaaaa aagctagttg actcaactga taaagcggac 1080
ctgaggttaa tctacttggc tcttgcccat atgataaagt tccgtgggca ctttctcatt 1140
gagggtgatc taaatccgga caactcggat gtcgacaaac tgttcatcca gttagtacaa 1200
acctataatc agttgtttga agagaaccct ataaatgcaa gtggcgtgga tgcgaaggct 1260
attcttagcg cccgcctctc taaatcccga cggctagaaa acctgatcgc acaattaccc 1320
ggagagaaga aaaatgggtt gttcggtaac cttatagcgc tctcactagg cctgacacca 1380
aattttaagt cgaacttcga cttagctgaa gatgccaaat tgcagcttag taaggacacg 1440
tacgatgacg atctcgacaa tctactggca caaattggag atcagtatgc ggacttattt 1500
ttggctgcca aaaaccttag cgatgcaatc ctcctatctg acatactgag agttaatact 1560
gagattacca aggcgccgtt atccgcttca atgatcaaaa ggtacgatga acatcaccaa 1620
gacttgacac ttctcaaggc cctagtccgt cagcaactgc ctgagaaata taaggaaata 1680
ttctttgatc agtcgaaaaa cgggtacgca ggttatattg acggcggagc gagtcaagag 1740
gaattctaca agtttatcaa acccatatta gagaagatgg atgggacgga agagttgctt 1800
gtaaaactca atcgcgaaga tctactgcga aagcagcgga ctttcgacaa cggtagcatt 1860
ccacatcaaa tccacttagg cgaattgcat gctatactta gaaggcagga ggatttttat 1920
ccgttcctca aagacaatcg tgaaaagatt gagaaaatcc taacctttcg cataccttac 1980
tatgtgggac ccctggcccg agggaactct cggttcgcat ggatgacaag aaagtccgaa 2040
gaaacgatta ctccatggaa ttttgaggaa gttgtcgata aaggtgcgtc agctcaatcg 2100
ttcatcgaga ggatgaccaa ctttgacaag aatttaccga acgaaaaagt attgcctaag 2160
cacagtttac tttacgagta tttcacagtg tacaatgaac tcacgaaagt taagtatgtc 2220
actgagggca tgcgtaaacc cgcctttcta agcggagaac agaagaaagc aatagtagat 2280
ctgttattca agaccaaccg caaagtgaca gttaagcaat tgaaagagga ctactttaag 2340
aaaattgaat gcttcgattc tgtcgagatc tccggggtag aagatcgatt taatgcgtca 2400
cttggtacgt atcatgacct cctaaagata attaaagata aggacttcct ggataacgaa 2460
gagaatgaag atatcttaga agatatagtg ttgactctta ccctctttga agatcgggaa 2520
atgattgagg aaagactaaa aacatacgct cacctgttcg acgataaggt tatgaaacag 2580
ttaaagaggc gtcgctatac gggctgggga cgattgtcgc ggaaacttat caacgggata 2640
agagacaagc aaagtggtaa aactattctc gattttctaa agagcgacgg cttcgccaat 2700
aggaacttta tgcagctgat ccatgatgac tctttaacct tcaaagagga tatacaaaag 2760
gcacaggttt ccggacaagg ggactcattg cacgaacata ttgcgaatct tgctggttcg 2820
ccagccatca aaaagggcat actccagaca gtcaaagtag tggatgagct agttaaggtc 2880
atgggacgtc acaaaccgga aaacattgta atcgagatgg cacgcgaaaa tcaaacgact 2940
cagaaggggc aaaaaaacag tcgagagcgg atgaagagaa tagaagaggg tattaaagaa 3000
ctgggcagcc agatcttaaa ggagcatcct gtggaaaata cccaattgca gaacgagaaa 3060
ctttacctct attacctaca aaatggaagg gacatgtatg ttgatcagga actggacata 3120
aaccgtttat ctgattacga cgtcgatgcc attgtacccc aatccttttt gaaggacgat 3180
tcaatcgaca ataaagtgct tacacgctcg gataagaacc gagggaaaag tgacaatgtt 3240
ccaagcgagg aagtcgtaaa gaaaatgaag aactattggc ggcagctcct aaatgcgaaa 3300
ctgataacgc aaagaaagtt cgataactta actaaagctg agaggggtgg cttgtctgaa 3360
cttgacaagg ccggatttat taaacgtcag ctcgtggaaa cccgccaaat cacaaagcat 3420
gttgcacaga tactagattc ccgaatgaat acgaaatacg acgagaacga taagctgatt 3480
cgggaagtca aagtaatcac tttaaagtca aaattggtgt cggacttcag aaaggatttt 3540
caattctata aagttaggga gataaataac taccaccatg cgcacgacgc ttatcttaat 3600
gccgtcgtag ggaccgcact cattaagaaa tacccgaagc tagaaagtga gtttgtgtat 3660
ggtgattaca aagtttatga cgtccgtaag atgatcgcga aaagcgaaca ggagataggc 3720
aaggctacag ccaaatactt cttttattct aacattatga atttctttaa gacggaaatc 3780
actctggcaa acggagagat acgcaaacga cctttaattg aaaccaatgg ggagacaggt 3840
gaaatcgtat gggataaggg ccgggacttc gcgacggtga gaaaagtttt gtccatgccc 3900
caagtcaaca tagtaaagaa aactgaggtg cagaccggag ggttttcaaa ggaatcgatt 3960
cttccaaaaa ggaatagtga taagctcatc gctcgtaaaa aggactggga cccgaaaaag 4020
tacggtggct tcgatagccc tacagttgcc tattctgtcc tagtagtggc aaaagttgag 4080
aagggaaaat ccaagaaact gaagtcagtc aaagaattat tggggataac gattatggag 4140
cgctcgtctt ttgaaaagaa ccccatcgac ttccttgagg cgaaaggtta caaggaagta 4200
aaaaaggatc tcataattaa actaccaaag tatagtctgt ttgagttaga aaatggccga 4260
aaacggatgt tggctagcgc cggagagctt caaaagggga acgaactcgc actaccgtct 4320
aaatacgtga atttcctgta tttagcgtcc cattacgaga agttgaaagg ttcacctgaa 4380
gataacgaac agaagcaact ttttgttgag cagcacaaac attatctcga cgaaatcata 4440
gagcaaattt cggaattcag taagagagtc atcctagctg atgccaatct ggacaaagta 4500
ttaagcgcat acaacaagca cagggataaa cccatacgtg agcaggcgga aaatattatc 4560
catttgttta ctcttaccaa cctcggcgct ccagccgcat tcaagtattt tgacacaacg 4620
atagatcgca aacgatacac ttctaccaag gaggtgctag acgcgacact gattcaccaa 4680
tccatcacgg gattatatga aactcggata gatttgtcac agcttggggg tgacggatcc 4740
cccaagaaga agaggaaagt ctcgagcgac tacaaagacc atgacggtga ttataaagat 4800
catgacatcg attacaagga tgacgatgac aagtga 4836
<210> 28
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 28
gagctggacg gcgacgtaaa cgg 23
<210> 29
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 29
cgccggacac gctgaacttg tgg 23
<210> 30
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 30
ccggcaagct gcccgtgccc tgg 23
<210> 31
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 31
ggtcagggtg gtcacgaggg tgg 23
<210> 32
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 32
cgaggagctg ttcaccgggg tgg 23
<210> 33
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 33
ccgtccagct cgaccaggat ggg 23
<210> 34
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 34
cgaggagctg ttcaccgggg tgg 23
<210> 35
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 35
gccgtccagc tcgaccagga tgg 23
<210> 36
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 36
ccggcaagct gcccgtgccc tgg 23
<210> 37
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 37
gtaggtcagg gtggtcacga ggg 23
<210> 38
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 38
gggcgaggag ctgttcaccg ggg 23
<210> 39
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 39
ccgtccagct cgaccaggat ggg 23
<210> 40
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 40
agggcgagga gctgttcacc ggg 23
<210> 41
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 41
ccgtccagct cgaccaggat ggg 23
<210> 42
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 42
aagggcgagg agctgttcac cgg 23
<210> 43
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 43
ccgtccagct cgaccaggat ggg 23
<210> 44
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 44
aagggcgagg agctgttcac cgg 23
<210> 45
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 45
gccgtccagc tcgaccagga tgg 23
<210> 46
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 46
cagcgtgtcc ggcgagggcg agg 23
<210> 47
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 47
cttcagggtc agcttgccgt agg 23
<210> 48
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 48
gggcgaggag ctgttcaccg ggg 23
<210> 49
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 49
cgtcgccgtc cagctcgacc agg 23
<210> 50
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 50
agggcgagga gctgttcacc ggg 23
<210> 51
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 51
cgtcgccgtc cagctcgacc agg 23
<210> 52
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 52
aagggcgagg agctgttcac cgg 23
<210> 53
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 53
cgtcgccgtc cagctcgacc agg 23
<210> 54
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 54
ctgaagttca tctgcaccac cgg 23
<210> 55
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 55
gtggtcacga gggtgggcca ggg 23
<210> 56
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 56
aagttcagcg tgtccggcga ggg 23
<210> 57
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 57
cttcagggtc agcttgccgt agg 23
<210> 58
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 58
caagttcagc gtgtccggcg agg 23
<210> 59
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 59
cttcagggtc agcttgccgt agg 23
<210> 60
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 60
ggtgcccatc ctggtcgagc tgg 23
<210> 61
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 61
cgccggacac gctgaacttg tgg 23
<210> 62
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 62
gagctggacg gcgacgtaaa cgg 23
<210> 63
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 63
ggcatcgccc tcgccctcgc cgg 23
<210> 64
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 64
ggagcgcacc atcttcttca agg 23
<210> 65
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 65
ctcgaacttc acctcggcgc ggg 23
<210> 66
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 66
ctgaagttca tctgcaccac cgg 23
<210> 67
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 67
gtcagggtgg tcacgagggt ggg 23
<210> 68
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 68
ggccacaagt tcagcgtgtc cgg 23
<210> 69
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 69
cttcagggtc agcttgccgt agg 23
<210> 70
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 70
ctcgtgacca ccctgaccta cgg 23
<210> 71
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 71
cgtgctgctt catgtggtcg ggg 23
<210> 72
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 72
ccggcaagct gcccgtgccc tgg 23
<210> 73
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 73
gctgaagcac tgcacgccgt agg 23
<210> 74
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 74
agcgtgtccg gcgagggcga ggg 23
<210> 75
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 75
ggtggtgcag atgaacttca ggg 23
<210> 76
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 76
cagcgtgtcc ggcgagggcg agg 23
<210> 77
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 77
ggtggtgcag atgaacttca ggg 23
<210> 78
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 78
caccggggtg gtgcccatcc tgg 23
<210> 79
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 79
cgccggacac gctgaacttg tgg 23
<210> 80
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 80
ggcgagggcg atgccaccta cgg 23
<210> 81
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 81
gggcacgggc agcttgccgg tgg 23
<210> 82
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 82
ctcgtgacca ccctgaccta cgg 23
<210> 83
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 83
agaagtcgtg ctgcttcatg tgg 23
<210> 84
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 84
caactacaag acccgcgccg agg 23
<210> 85
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 85
cgatgccctt cagctcgatg cgg 23
<210> 86
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 86
cccatcctgg tcgagctgga cgg 23
<210> 87
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 87
ggcatcgccc tcgccctcgc cgg 23
<210> 88
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 88
caagttcagc gtgtccggcg agg 23
<210> 89
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 89
ggtggtgcag atgaacttca ggg 23
<210> 90
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 90
gagctggacg gcgacgtaaa cgg 23
<210> 91
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 91
gaccaggatg ggcaccaccc cgg 23
<210> 92
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 92
accatcttct tcaaggacga cgg 23
<210> 93
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 93
cgctcctgga cgtagccttc ggg 23
<210> 94
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 94
ggcgagggcg atgccaccta cgg 23
<210> 95
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 95
cgccggacac gctgaacttg tgg 23
<210> 96
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 96
ttcaagtccg ccatgcccga agg 23
<210> 97
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 97
gtcgtgctgc ttcatgtggt cgg 23
<210> 98
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 98
ttcaagtccg ccatgcccga agg 23
<210> 99
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 99
tcgtgctgct tcatgtggtc ggg 23
<210> 100
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 100
ggccacaagt tcagcgtgtc cgg 23
<210> 101
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 101
cgtcgccgtc cagctcgacc agg 23
<210> 102
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 102
ctcgtgacca ccctgaccta cgg 23
<210> 103
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 103
ccagggcacg ggcagcttgc cgg 23
<210> 104
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 104
cagccacaac gtctatatca tgg 23
<210> 105
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 105
tgtactccag cttgtgcccc agg 23
<210> 106
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 106
ggccacaagt tcagcgtgtc cgg 23
<210> 107
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 107
gccgtccagc tcgaccagga tgg 23
<210> 108
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 108
ggccacaagt tcagcgtgtc cgg 23
<210> 109
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 109
ccgtccagct cgaccaggat ggg 23
<210> 110
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 110
aagttcagcg tgtccggcga ggg 23
<210> 111
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 111
cgtcgccgtc cagctcgacc agg 23
<210> 112
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 112
cgcgccgagg tgaagttcga ggg 23
<210> 113
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 113
gccgtcgtcc ttgaagaaga tgg 23
<210> 114
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 114
ccggcaagct gcccgtgccc tgg 23
<210> 115
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 115
cttcagggtc agcttgccgt agg 23
<210> 116
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 116
caagttcagc gtgtccggcg agg 23
<210> 117
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 117
gccgtccagc tcgaccagga tgg 23
<210> 118
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 118
caagttcagc gtgtccggcg agg 23
<210> 119
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 119
ccgtccagct cgaccaggat ggg 23
<210> 120
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 120
aagttcagcg tgtccggcga ggg 23
<210> 121
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 121
ccgtccagct cgaccaggat ggg 23
<210> 122
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 122
agcgtgtccg gcgagggcga ggg 23
<210> 123
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 123
cgtcgccgtc cagctcgacc agg 23
<210> 124
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 124
ctgaagttca tctgcaccac cgg 23
<210> 125
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 125
ggcatcgccc tcgccctcgc cgg 23
<210> 126
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 126
cagcgtgtcc ggcgagggcg agg 23
<210> 127
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 127
gccgtccagc tcgaccagga tgg 23
<210> 128
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 128
ggccacaagt tcagcgtgtc cgg 23
<210> 129
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 129
gaccaggatg ggcaccaccc cgg 23
<210> 130
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 130
agcgtgtccg gcgagggcga ggg 23
<210> 131
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 131
ccgtccagct cgaccaggat ggg 23
<210> 132
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 132
caactacaag acccgcgccg agg 23
<210> 133
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 133
gcgctcctgg acgtagcctt cgg 23
<210> 134
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 134
caactacaag acccgcgccg agg 23
<210> 135
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 135
cgctcctgga cgtagccttc ggg 23
<210> 136
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 136
gctgaagggc atcgacttca agg 23
<210> 137
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 137
cctcgaactt cacctcggcg cgg 23
<210> 138
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 138
caagttcagc gtgtccggcg agg 23
<210> 139
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 139
gaccaggatg ggcaccaccc cgg 23
<210> 140
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 140
aagttcagcg tgtccggcga ggg 23
<210> 141
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 141
gaccaggatg ggcaccaccc cgg 23
<210> 142
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 142
gaagggcatc gacttcaagg agg 23
<210> 143
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 143
cctcgaactt cacctcggcg cgg 23
<210> 144
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 144
caactacaag acccgcgccg agg 23
<210> 145
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 145
ctggacgtag ccttcgggca tgg 23
<210> 146
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 146
ggagcgcacc atcttcttca agg 23
<210> 147
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 147
agaagtcgtg ctgcttcatg tgg 23
<210> 148
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 148
caagttcagc gtgtccggcg agg 23
<210> 149
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 149
cgtcgccgtc cagctcgacc agg 23
<210> 150
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 150
catgcccgaa ggctacgtcc agg 23
<210> 151
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 151
agaagtcgtg ctgcttcatg tgg 23
<210> 152
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 152
caactacaag acccgcgccg agg 23
<210> 153
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 153
tgaagaagat ggtgcgctcc tgg 23
<210> 154
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 154
ggtgaaccgc atcgagctga agg 23
<210> 155
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 155
cctcgaactt cacctcggcg cgg 23
<210> 156
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 156
ttcaagtccg ccatgcccga agg 23
<210> 157
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 157
gcttcatgtg gtcggggtag cgg 23
<210> 158
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 158
ccgcgccgag gtgaagttcg agg 23
<210> 159
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 159
gccgtcgtcc ttgaagaaga tgg 23
<210> 160
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 160
ggtgaaccgc atcgagctga agg 23
<210> 161
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 161
ctcgaacttc acctcggcgc ggg 23
<210> 162
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 162
gtgaaccgca tcgagctgaa ggg 23
<210> 163
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 163
cctcgaactt cacctcggcg cgg 23
<210> 164
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 164
caagatccgc cacaacatcg agg 23
<210> 165
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 165
gatgccgttc ttctgcttgt cgg 23
<210> 166
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 166
gtgaaccgca tcgagctgaa ggg 23
<210> 167
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 167
ctcgaacttc acctcggcgc ggg 23
<210> 168
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 168
caaggaggac ggcaacatcc tgg 23
<210> 169
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 169
tcagctcgat gcggttcacc agg 23
<210> 170
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 170
catgcccgaa ggctacgtcc agg 23
<210> 171
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 171
gtcgtgctgc ttcatgtggt cgg 23
<210> 172
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 172
caaggaggac ggcaacatcc tgg 23
<210> 173
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 173
cagctcgatg cggttcacca ggg 23
<210> 174
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 174
aaggaggacg gcaacatcct ggg 23
<210> 175
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 175
tcagctcgat gcggttcacc agg 23
<210> 176
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 176
aagttcagcg tgtccggcga ggg 23
<210> 177
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 177
gccgtccagc tcgaccagga tgg 23
<210> 178
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 178
catgcccgaa ggctacgtcc agg 23
<210> 179
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 179
tcgtgctgct tcatgtggtc ggg 23
<210> 180
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 180
aaggaggacg gcaacatcct ggg 23
<210> 181
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 181
cagctcgatg cggttcacca ggg 23
<210> 182
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 182
aggaggacgg caacatcctg ggg 23
<210> 183
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 183
tcagctcgat gcggttcacc agg 23
<210> 184
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 184
atccgccaca acatcgagga cgg 23
<210> 185
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 185
gatgccgttc ttctgcttgt cgg 23
<210> 186
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 186
cagcgtgtcc ggcgagggcg agg 23
<210> 187
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 187
cgtcgccgtc cagctcgacc agg 23
<210> 188
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 188
ccggcaagct gcccgtgccc tgg 23
<210> 189
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 189
cagggtcagc ttgccgtagg tgg 23
<210> 190
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 190
catgcccgaa ggctacgtcc agg 23
<210> 191
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 191
cgtgctgctt catgtggtcg ggg 23
<210> 192
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 192
aggaggacgg caacatcctg ggg 23
<210> 193
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 193
cagctcgatg cggttcacca ggg 23
<210> 194
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 194
caacatcctg gggcacaagc tgg 23
<210> 195
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 195
cgatgccctt cagctcgatg cgg 23
<210> 196
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 196
gctgaagggc atcgacttca agg 23
<210> 197
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 197
gtcgccctcg aacttcacct cgg 23
<210> 198
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 198
ccagaagtac gagcgccgcc cgg 23
<210> 199
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 199
tggcaggtga gtgaggctgc agg 23
<210> 200
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 200
ccgggcggcg ctcgtacttc tggccactgg gcgagcgtct ggcaggtgag tgaggctgca 60
gg 62
<210> 201
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 201
gaatacccat ctgtcagctt cgg 23
<210> 202
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 202
ggcggaacct gagaggcgta agg 23
<210> 203
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 203
ccgaagctga cagatgggta ttctttgacg gggggtaggg gcggaacctg agaggcgtaa 60
gg 62
<210> 204
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 204
aatattcaag cagcaggcac agg 23
<210> 205
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 205
ctcgcgcagg aggctgcagc ggg 23
<210> 206
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 206
cctgtgcctg ctgcttgaat atttccgcct tttagggtgc tcgcgcagga ggctgcagcg 60
gg 62
<210> 207
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 207
cccaaagcct ggccagggag tgg 23
<210> 208
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 208
gccccacagg gcttgaagcc cgg 23
<210> 209
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 209
ccactccctg gccaggcttt ggggaggcct ggagtcatgg ccccacaggg cttgaagccc 60
gg 62
<210> 210
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 210
ccctacttcc gctttcacct tgg 23
<210> 211
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 211
ggaatccctt ctgcagcacc tgg 23
<210> 212
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 212
ccaaggtgaa agcggaagta gggccttcgc gcacctcatg gaatcccttc tgcagcacct 60
gg 62
<210> 213
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 213
cgctccagag ccgtgcgaat ggg 23
<210> 214
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 214
tggaggcaag agggcggctt tgg 23
<210> 215
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 215
cccattcgca cggctctgga gcggcggctg cacaaccagt ggaggcaaga gggcggcttt 60
gg 62
<210> 216
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 216
cgaggagact ggggactgta ggg 23
<210> 217
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 217
ccagctgctg ccttgcctcc agg 23
<210> 218
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 218
ccctacagtc cccagcctcc tcgtcccatg cctccgtctc cagctgctgc cttgcctcca 60
gg 62
<210> 219
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 219
catagctact gattggtggt ggg 23
<210> 220
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 220
ccggcccctc cccagtcagg ggg 23
<210> 221
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 221
cccaccacca atcagtagct atggcgagcc ctgctgtctc cggcccctcc ccagtcaggg 60
gg 62
<210> 222
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 222
ggaaacgtct agatgctcaa cgg 23
<210> 223
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 223
caaaatgtcg ttcgtggcag tgg 23
<210> 224
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 224
ccgttgagca tctagacgtt tccttggctc ttctggcgcc aaaatgtcgt tcgtggcagg 60
gg 62
<210> 225
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 225
ctgttgctgg ccatgccaag cgg 23
<210> 226
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 226
cctgggggcg ggcacctcaa tgg 23
<210> 227
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 227
ccgcttggca tggccagcaa cagcagctcc tgcccgacac ctgggggcgg gcacctcaat 60
gg 62
<210> 228
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 228
ttcggagcga aaaccaagac agg 23
<210> 229
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 229
gagtcccccg ccttcagaag agg 23
<210> 230
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 230
cctgtcttgg ttttcgctcc gaaggtaaaa gaaatcattg agtcccccgc cttcagaaga 60
gg 62
<210> 231
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 231
ggcccggtcg actccgggcc cgg 23
<210> 232
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 232
tgctgggaat cagcagtgtt tgg 23
<210> 233
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 233
ccgggcccgg agtcgaccgg gccgaggcgg aggcgggcct gctgggaatc agcagtgttt 60
gg 62
<210> 234
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 234
gggtgggggg agtttgctcc tgg 23
<210> 235
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 235
tccctcttta gccagagccg ggg 23
<210> 236
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 236
ccaggagcaa actcccccca ccccctttcc aaagcccatt ccctctttag ccagagccgg 60
gg 62
<210> 237
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 237
gccgccggcc ggggaggagg tgg 23
<210> 238
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 238
ggcgagccgc gggcaggggc cgg 23
<210> 239
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 239
ccacctcctc cccggccggc ggcggacagt ggacgcggcg gcgagccgcg ggcaggggcc 60
gg 62
<210> 240
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 240
ccgtctgcac accccggctc tgg 23
<210> 241
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 241
ctcggccacc acagggaagc tgg 23
<210> 242
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
RFN target site oligonucleotide
<400> 242
ccagagccgg ggtgtgcaga cggcagtcac tagggggcgc tcggccacca cagggaagct 60
gg 62
<210> 243
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 243
ggctgtggga agccagcaac 20
<210> 244
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 244
aagccagggg ccaactggag 20
<210> 245
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 245
gcgcgggaat tacagataaa ttaaaa 26
<210> 246
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 246
aggtcccatc ctctcataca tacca 25
<210> 247
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 247
accgcccctt ggcaccac 18
<210> 248
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 248
cggagctcat ctgcttcctg t 21
<210> 249
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 249
ggagcagctg gtcagagggg 20
<210> 250
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 250
gggaaggggg acactgggga 20
<210> 251
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 251
gccctacatc tgctctccct cca 23
<210> 252
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 252
gggccgggaa agagttgctg 20
<210> 253
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 253
gccctacatc tgctctccct cca 23
<210> 254
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 254
gggccgggaa agagttgctg 20
<210> 255
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 255
ggggagggag gctccaggtt 20
<210> 256
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 256
ggcacaatgg ctcccaagca 20
<210> 257
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 257
ccttacccct cccctcactc a 21
<210> 258
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 258
agaagggcgg gccagacagt 20
<210> 259
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 259
atatccttct aggtagcggg cagtagcc 28
<210> 260
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 260
tctcggggga gagcggtaaa 20
<210> 261
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 261
cccaggaaaa gtgccagctc a 21
<210> 262
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 262
tgatggtcac cccaactgga 20
<210> 263
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 263
aaggcggcgc tggcttttt 19
<210> 264
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 264
ccagcacaac ttactcgcac ttga 24
<210> 265
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 265
gggatgcagg gacggtcaag 20
<210> 266
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 266
gccgccccat ccctagagaa a 21
<210> 267
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 267
tccagatggc acattgtcag 20
<210> 268
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 268
agggagcagg aaagtgaggt 20
<210> 269
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 269
agagaagtcg aggaagagag ag 22
<210> 270
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 270
cagcagaaag ttcatggttt cg 22
<210> 271
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 271
tccagatggc acattgtcag 20
<210> 272
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 272
agggagcagg aaagtgaggt 20
<210> 273
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 273
cgatggctcc caagaaacgc 20
<210> 274
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 274
gcaggtagaa tgcacagccg 20
<210> 275
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 275
gcccagagtc aaggaacacg 20
<210> 276
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 276
aggtagtgct tgagaccgcc 20
<210> 277
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 277
catccatcgg cgctttggtc 20
<210> 278
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 278
ccgggaaaga gttgctgcac 20
<210> 279
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 279
ctccccgtct gcagtccatc 20
<210> 280
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 280
cctgcaggga catgtggtga 20
<210> 281
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 281
tagggctaga ggggtgaggc 20
<210> 282
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 282
ccgaggtgaa acaagctgcc 20
<210> 283
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 283
atgagggctc cagatggcac 20
<210> 284
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 284
ttcacccagc ttccctgtgg 20
<210> 285
<211> 1752
<212> DNA
<213> Planomicrobium okeanokoites
<400> 285
atgtttttga gtatggtttc taaaataaga actttcggtt gggttcaaaa tccaggtaaa 60
tttgagaatt taaaacgagt agttcaagta tttgatagaa attctaaagt acataatgaa 120
gtgaaaaata taaagatacc aaccctagtc aaagaaagta agatccaaaa agaactagtt 180
gctattatga atcaacatga tttgatttat acatataaag agttagtagg aacaggaact 240
tcaatacgtt cagaagcacc atgcgatgca attattcaag caacaatagc agatcaagga 300
aataaaaaag gctatatcga taattggtca tctgacggtt ttttgcgttg ggcacatgct 360
ttaggattta ttgaatatat aaataaaagt gattcttttg taataactga tgttggactt 420
gcttactcta aatcagctga cggcagcgcc attgaaaaag agattttgat tgaagcgata 480
tcatcttatc ctccagcgat tcgtatttta actttgctag aagatggaca acatttgaca 540
aagtttgatc ttggcaagaa tttaggtttt agtggagaaa gtggatttac ttctctaccg 600
gaaggaattc ttttagatac tctagctaat gctatgccta aagataaagg cgaaattcgt 660
aataattggg aaggatcttc agataagtac gcaagaatga taggtggttg gctggataaa 720
ctaggattag taaagcaagg aaaaaaagaa tttatcattc ctactttggg taagccggac 780
aataaagagt ttatatccca cgcttttaaa attactggag aaggtttgaa agtactgcgt 840
cgagcaaaag gctctacaaa atttacacgt gtacctaaaa gagtatattg ggaaatgctt 900
gctacaaacc taaccgataa agagtatgta agaacaagaa gagctttgat tttagaaata 960
ttaatcaaag ctggatcatt aaaaatagaa caaatacaag acaacttgaa gaaattagga 1020
tttgatgaag ttatagaaac tattgaaaat gatatcaaag gcttaattaa cacaggtata 1080
tttatagaaa tcaaagggcg attttatcaa ttgaaagacc atattcttca atttgtaata 1140
cctaatcgtg gtgtgactaa gcaactagtc aaaagtgaac tggaggagaa gaaatctgaa 1200
cttcgtcata aattgaaata tgtgcctcat gaatatattg aattaattga aattgccaga 1260
aattccactc aggatagaat tcttgaaatg aaggtaatgg aattttttat gaaagtttat 1320
ggatatagag gtaaacattt gggtggatca aggaaaccgg acggagcaat ttatactgtc 1380
ggatctccta ttgattacgg tgtgatcgtg gatactaaag cttatagcgg aggttataat 1440
ctgccaattg gccaagcaga tgaaatgcaa cgatatgtcg aagaaaatca aacacgaaac 1500
aaacatatca accctaatga atggtggaaa gtctatccat cttctgtaac ggaatttaag 1560
tttttatttg tgagtggtca ctttaaagga aactacaaag ctcagcttac acgattaaat 1620
catatcacta attgtaatgg agctgttctt agtgtagaag agcttttaat tggtggagaa 1680
atgattaaag ccggcacatt aaccttagag gaagtgagac ggaaatttaa taacggcgag 1740
ataaactttt aa 1752
<210> 286
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 286
ggtgagtgag tgtgtgcgtg tgg 23
<210> 287
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 287
gggcgatgcc acctacgg 18
<210> 288
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 288
gagggcgatg ccacctacgg 20
<210> 289
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 289
gcgagggcga tgccacctac gg 22
<210> 290
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 290
ggcgagggcg atgccaccta cgg 23
<210> 291
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 291
gggcgagggc gatgccacct acgg 24
<210> 292
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 292
gagggcgagg gcgatgccac ctacgg 26
<210> 293
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 293
gcgcgggcga gggcgatgcc acctacgg 28
<210> 294
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 294
gcacgggcag cttgccggtg g 21
<210> 295
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 295
gggcacgggc agcttgccgg tgg 23
<210> 296
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 296
gccgttcttc tgcttgtcgg 20
<210> 297
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 297
gatgccgttc ttctgcttgt cgg 23
<210> 298
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 298
gtgcagatga acttcaggg 19
<210> 299
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 299
ggtgcagatg aacttcaggg 20
<210> 300
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 300
ggtggtgcag atgaacttca ggg 23
<210> 301
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 301
gaggagctgt tcaccgggg 19
<210> 302
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 302
gcgaggagct gttcaccggg g 21
<210> 303
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 303
gggcgaggag ctgttcaccg ggg 23
<210> 304
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 304
gtggggggag tttgctcctg g 21
<210> 305
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 305
gggtgggggg agtttgctcc tgg 23
<210> 306
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 306
gagtgagtgt gtgcgtgtgg 20
<210> 307
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 307
ggtgagtgag tgtgtgcgtg tgg 23
<210> 308
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 308
gtccgagcag aagaagaagg g 21
<210> 309
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 309
gagtccgagc agaagaagaa ggg 23
<210> 310
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 310
gatgtagtgt ttccacaggg 20
<210> 311
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
target binding site oligonucleotide
<400> 311
gcagatgtag tgtttccaca ggg 23
<210> 312
<211> 67
<212> DNA
<213> Homo sapiens
<400> 312
gaagctggag gaggaagggc ctgagtccga gcagaagaag aagggctccc atcacatcaa 60
ccggtgg 67
<210> 313
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 313
gaagctggag gagga 15
<210> 314
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 314
tcaaccggtg g 11
<210> 315
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 315
gaagctggag gaggaagg 18
<210> 316
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 316
gggctcccat cacatcaacc ggtgg 25
<210> 317
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 317
gaagctggag gaggaagggc ctga 24
<210> 318
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 318
gaagctggag gagg 14
<210> 319
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 319
gaagctggag gaggaagggc ccatcacatc aaccggtgg 39
<210> 320
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 320
gaagctggag gaggaagggc tcgcacacat caaccggtgg 40
<210> 321
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 321
gaagctggag gaggaagggc cttccatcac atcaaccggt gg 42
<210> 322
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 322
gaagctggag gaggaagggc ctgagtccca tcacatcaac cggtgg 46
<210> 323
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 323
gaagctggag gaggaagggc ctgagtccga gtcccatcac atcaaccggt gg 52
<210> 324
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 324
gaagctggag gaggaagggc ctgagtccga gcagaagtcc catcacatca accggtgg 58
<210> 325
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 325
gaagctggag gaggaagggc ctgagtcctg ccgtttgtag ccatcacatc aaccggtgg 59
<210> 326
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 326
gaagctggag gaggaagggc ctgagtccga gcagaagagc tcccatcaca tcaaccggtg 60
g 61
<210> 327
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 327
gaagctggag gaggaagggc ctgagtccga gcagaagaac tcccatcaca tcaaccggtg 60
g 61
<210> 328
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 328
gaagctggag gaggaagggc ctgagtccga gcagaagaag ggctcccatc acatcaaccg 60
gtgg 64
<210> 329
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 329
gaagctggag gaggaagggc ctgagtccga gcagaagaaa gggctcccat cacatcaacc 60
ggtgg 65
<210> 330
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 330
gaagctggag gaggaagggc ctgagtccga gcagaagaac agaagggctc ccatcacatc 60
aaccggt 67
<210> 331
<211> 67
<212> DNA
<213> Homo sapiens
<400> 331
gaagctggag gaggaagggc ctgagtccga gcagaagaag aagggctccc atcacatcaa 60
ccggtgg 67
<210> 332
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 332
gaagctggag gaggaagggc ctgagtccga g 31
<210> 333
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 333
gaagctggag g 11
<210> 334
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 334
gaagctggag g 11
<210> 335
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 335
gaagctggag gaggaagggc ctgagtgg 28
<210> 336
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 336
gaagctggag gaggaagggc tcccatcaca tcaaccggtg g 41
<210> 337
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 337
gaagctggag gaggaagggc ctgagtccat cacatcaacc ggtgg 45
<210> 338
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 338
gaagctggag gaggaagggc ctgagtccca tcacatcaac cggtgg 46
<210> 339
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 339
gaagctggag gaggaagggc ctgagtccga gcatcacatc aaccggtgg 49
<210> 340
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 340
gaagctggag gaggaagggc ctgagtccga gctcccatca catcaaccgg tgg 53
<210> 341
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 341
gaagctggag gaggaagggc ctgagtccga gcagaagggc tcccatcaca tcaaccggtg 60
g 61
<210> 342
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 342
gaagctggag gaggaagggc ctgagtccga gcagaagaag ggctcccatc acatcaaccg 60
gtgg 64
<210> 343
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 343
gaagctggag gaggaagggc ctgagtccga gcagaaagaa gggctcccat cacatcaacc 60
ggtgg 65
<210> 344
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 344
gaagctggag gaggaagggc ctgagtccga gcagaagaac agaagggctc ccatcacatc 60
aaccggt 67
<210> 345
<211> 187
<212> DNA
<213> Aequorea victoria
<400> 345
tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc 60
agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 120
tcaaggagac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 180
gaaccgc 187
<210> 346
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 346
tcgtgaccac cctgacctac gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 60
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 120
aggacgacgg caactacaag acccgcgcga ggtgaagttc gagggcgaca ccctggtgaa 180
ccgc 184
<210> 347
<211> 159
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 347
tcgtgaccac cctgacctca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 60
gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 120
ctacaagacc cgcgccgagg cgacaccctg gtgaaccgc 159
<210> 348
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 348
tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc 60
agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 120
tcaaggagac ggcaactaca ccctggtgaa ccgc 154
<210> 349
<211> 181
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 349
tcgtgaccac cctgaccgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg 60
acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg 120
acgacggcaa ctacaagacc cgcgcgaggg tcttgttcga gggcgacacc ctggtgaacc 180
g 181
<210> 350
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 350
tcgtgaccac cctgacctac gtgaagttcg agggcgacac cctggtgaac cgc 53
<210> 351
<211> 187
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 351
tcgtgaccac cctgacctac gcctcggcgc gggtcttgta gttgccgtcg tccttgaaga 60
agatggtgcg ctcctggacg tagccttcgg gcatggcgga cttgaagaag tcgtgctgct 120
tcatgtgtcg gggtagcggc tgaagcactg cacgctgaag ttcgagggcg acaccctggt 180
gaaccgc 187
<210> 352
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 352
tcggcgcggg tcttgtagtt gccgtcgtcc ttgaagaaga tggtgcgctc ctggacgtag 60
ccttcgggca tggcggactt gaagaagtcg tgctgcttca tgtggtcggg gtagcggctg 120
aagcactgca caccctggtg aaccgc 146
<210> 353
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 353
tcgtgaccac cctgttcgag ggcgacaccc tggtgaaccg c 41
<210> 354
<211> 92
<212> DNA
<213> Homo sapiens
<400> 354
caggagacga agagcccggg cggcgctcgt acttctggcc actgggcgag cgtctggcag 60
gtgagtgagg ctgcaggcat tgacgtctcc tc 92
<210> 355
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 355
caggagacga agagcccggg cggcgctcgt acttctggcc actggcgaag cgtctggcag 60
gtgagtgagg ctgcaggcat tgacgtctcc tc 92
<210> 356
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 356
caggagacga agagcccggg cggcgctcgt acttctggcc tctggcaggt gagtgaggct 60
gcaggcattg acgtctcctc 80
<210> 357
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 357
caggagacga agagcccggg cggcgctcgt acttctagcg tctggcaggt gagtgaggct 60
gcaggcattg acgtctcctc 80
<210> 358
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 358
caggagacga agagcccggg cggcgctcgt acttcgtctg gcaggtgagt gaggctgcag 60
gcattgacgt ctcctc 76
<210> 359
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 359
caggagacga agagcccggg cggcgctcgt acttctggcc actgtgagtg aggctgcagg 60
cattgacgtc tcctc 75
<210> 360
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 360
caggagacga agagcccggg cggcgctcgt acttctggca ggtgagtgag gctgcaggca 60
ttgacgtctc ctc 73
<210> 361
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 361
caggagacga agagcccggg cggcgctcgt ctggcaggtg agtgaggctg caggcattga 60
cgtctcctc 69
<210> 362
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 362
caggagacga agagcccgtc tggcaggtga gtgaggctgc aggcattgac gtctcctc 58
<210> 363
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 363
accggcggca gcaggtgagt gaggctgcag gcattgacgt ctcctc 46
<210> 364
<211> 92
<212> DNA
<213> Homo sapiens
<400> 364
tgggagagtg gatttccgaa gctgacagat gggtattctt tgaggggggg taggggcgga 60
acctgagagg cgtaaggcgt tgtgaaccct gg 92
<210> 365
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 365
tgggagagtg gatttccgaa gctgacagat gggtattctt tgagtagggg cggaacctga 60
gaggcgtaag gcgttgtgaa ccctgg 86
<210> 366
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 366
tgggagagtg gatttccgaa gctgacagat gggtatgggg ggtaggggcg gaacctgaga 60
ggcgtaaggc gttgtgaacc ctgg 84
<210> 367
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 367
tgggagagtg gatttccgaa gctgacagat gggtattctt ggtaggggcg gaacctgaga 60
ggcgtaaggc gttgtgaacc ctgg 84
<210> 368
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 368
tgggagagtg gatttccgaa gctgacagat gggtattctt tgagggggga acctgagagg 60
cgtaaggcgt tgtgaaccct gg 82
<210> 369
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 369
tgggagagtg gatttccgaa gctgacagat gggtattctt tgggcggaac ctgagaggcg 60
taaggcgttg tgaaccctgg 80
<210> 370
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 370
tgggagagtg gatttccgaa gctgacagat ggggcggaac ctgagaggcg taaggcgttg 60
tgaaccctgg 70
<210> 371
<211> 92
<212> DNA
<213> Homo sapiens
<400> 371
caagctggac tctggccact ccctggccag gctttgggga ggcctggagt catggcccca 60
cagggcttga agcccggggg gccgccattg ac 92
<210> 372
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 372
caagctggac tctggccact ccctggccag gctttatggc cccacagggc ttgaagcccg 60
gggggccgcc attgac 76
<210> 373
<211> 92
<212> DNA
<213> Homo sapiens
<400> 373
agagagtcgc cgtctccaag gtgaaagcgg aagtagggcc ttcgcgcacc tcatggaatc 60
ccttctgcag cacctggatc gcttttccga gc 92
<210> 374
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 374
agagagtcgc cgtctccaag gtgaaagcgg aagtagcgca cctcatggaa tcccttctgc 60
agcacctgga tcgcttttcc gagc 84
<210> 375
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 375
agagagtcgc cgtctccaag gtgaaagcgg aagtagggcc ctcatggaat cccttctgca 60
gcacctggat cgcttttccg agc 83
<210> 376
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 376
agagagtcgc cgtctccaag gtgaaagcgg aagtaggccc tcatggaatc ccttctgcag 60
cacctggatc gcttttccga gc 82
<210> 377
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 377
agagagtcgc cgtctccaag gtgaaagcgg aagtagggcc tcatggaatc ccttctgcag 60
cacctggatc gcttttccga gc 82
<210> 378
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 378
agagagtcgc cgtctccaag gtgaaagcgg aagtagcacc tcatggaatc ccttctgcag 60
cacctggatc gcttttccga gc 82
<210> 379
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 379
agagagtcgc cgtctccaag gtgaaagcgg aaacgcacct catggaatcc cttctgcagc 60
acctggatcg cttttccgag c 81
<210> 380
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 380
agagagtcgc cgtctccaag gtgaaagcgg aagtagggcc ttcgcgcatt ctgcagcacc 60
tggatcgctt ttccgagc 78
<210> 381
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 381
agagagtcgc cgtctccaag gtgaaagcgg aagcctcatg gaatcccttc tgcagcacct 60
ggatcgcttt tccgagc 77
<210> 382
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 382
agagagtcgc cgtctccaag catggaatcc cttctgcagc acctggatcg cttttccgag 60
c 61
<210> 383
<211> 92
<212> DNA
<213> Homo sapiens
<400> 383
tttggtcggc atggccccat tcgcacggct ctggagcggc ggctgcacaa ccagtggagg 60
caagagggcg gctttgggcg gggtccagtt cc 92
<210> 384
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 384
tttggtcggc atggccccat tcgcacggct ctggagcggc ggcgcaacca gtggaggcaa 60
gagggcggct ttgggcgggg tccagttcc 89
<210> 385
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 385
tttggtcggc atggccccat tcgcacggct ctggagcggc ggctaaccag tggaggcaag 60
agggcggctt tgggcggggt ccagttcc 88
<210> 386
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 386
tttggtcggc atggccccat tcgcacggct ctggagcggc ggccagtgga ggcaagaggg 60
cggctttggg cggggtccag ttcc 84
<210> 387
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 387
tttggtcggc atggccccat tcgcacggct ctggagcggc ggctgtggag gcaagagggc 60
ggctttgggc ggggtccagt tcc 83
<210> 388
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 388
tttggtcggc atggccccat tcgcacggct ctggagcggc ggctggaggc aagagggcgg 60
ctttgggcgg ggtccagttc c 81
<210> 389
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 389
tttggtcggc atggccccat tcgcacggct ctggagcggc gggagaggca agagggcggc 60
tttgggcggg gtccagttcc 80
<210> 390
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 390
tttggtcggc atggccccat tcgcacggct ctggagcggc ggcgaggcaa gagggcggct 60
ttgggcgggg tccagttcc 79
<210> 391
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 391
tttggtcggc atggccccat tcgcacggct ctggagcggc ggctggcaag agggcggctt 60
tgggcggggt ccagttcc 78
<210> 392
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 392
tttggtcggc atggccccat tcgcacggct ctggagcggc ggcggcaaga gggcggcttt 60
gggcggggtc cagttcc 77
<210> 393
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 393
tttggtcggc atggccccat tcgcacggct ctggagtgga ggcaagaggg cggctttggg 60
cggggtccag ttcc 74
<210> 394
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 394
tttggtcggc atggccccat tcgcacggct ctggaggcaa gagggcggct ttgggcgggg 60
tccagttcc 69
<210> 395
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 395
tttggtcggc atggccccgt cactgt 26
<210> 396
<211> 260
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 396
tttggtcggc atggccccat tcgcacggct ctggagcggc ggcacactat tgcaatgaaa 60
ataaatttcc tttattagct agaagtgaga tctgaagggg cttcatgatg tccccataat 120
ttttggcaga gggaaaaaga tctcagtggt atttgtgagc cagggcattg gccacaccag 180
ccaccacctt ttgataggca gcctgcacct gaggagtgcg agtggaggca agagggcggc 240
tttgggcggg gtccagttcc 260
<210> 397
<211> 92
<212> DNA
<213> Homo sapiens
<400> 397
gttcaactcg atgaccccac caccaatcag tagctatggc gagccctgct gtctccggcc 60
cctccccagt cagggggccc ccagtgtggg ga 92
<210> 398
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 398
gttcaactcg atgaccccac caccaatcag tagctatcct gctgtctccg gcccctcccc 60
agtcaggggg cccccagtgt gggga 85
<210> 399
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 399
gttcaactcg atgaccccac caccaatcag tagctatgtc tccggcccct ccccagtcag 60
ggggccccca gtgtgggga 79
<210> 400
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 400
gttcaactcg atgaccccac caccaatcag tagctatggc gagccccccc agtcaggggg 60
cccccagtgt gggga 75
<210> 401
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 401
gttcaactcg atgaccccac caccaacctg ctgtctccgg cccctcccca gtcagggggc 60
ccccagtgtg ggga 74
<210> 402
<211> 92
<212> DNA
<213> Homo sapiens
<400> 402
tggctgaagg cacttccgtt gagcatctag acgtttcctt ggctcttctg gcgccaaaat 60
gtcgttcgtg gcaggggtta ttcggcggct gg 92
<210> 403
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 403
tggctgaagg cacttccgtt gagcatctag acgtttcctt ggcgccaaaa tgtcgttcgt 60
ggcaggggtt attcggcggc tgg 83
<210> 404
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 404
tggctgaagg cacttccgtt gagcatctat tctggcgcca aaatgtcgtt cgtggcaggg 60
gttattcggc ggctgg 76
<210> 405
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 405
tggctgaagg cacttccgtt gagcatctag acgtttcctt ggatgtcgtt cgtggcaggg 60
gttattcggc ggctgg 76
<210> 406
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 406
tggctgaagg cacttccgtt gagcatctag acgtttgtcg ttcgtggcag gggttattcg 60
gcggctgg 68
<210> 407
<211> 92
<212> DNA
<213> Homo sapiens
<400> 407
cccttctgac tgtggccgct tggcatggcc agcaacagca gctcctgccc gacacctggg 60
ggcgggcacc tcaatgggta cccggtgcct cc 92
<210> 408
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 408
cccttctgac tgtggccgct tggcatggcc agcaacacct gcccgacacc tgggggcggg 60
cacctcaatg ggtacccggt gcctcc 86
<210> 409
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 409
cccttctgac tgtggccgct tggcatggcc agcaacactg cccgacacct gggggcgggc 60
acctcaatgg gtacccggtg cctcc 85
<210> 410
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 410
cccttctgac tgtggccgct tggcatggcc agcagcccga cacctggggg cgggcacctc 60
aatgggtacc cggtgcctcc 80
<210> 411
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 411
cccttctgac tgtggccgct tggcatggcc aggcccgaca cctgggggcg ggcacctcaa 60
tgggtacccg gtgcctcc 78
<210> 412
<211> 92
<212> DNA
<213> Homo sapiens
<400> 412
tcagaaatag ggggtccagg agcaaactcc ccccaccccc tttccaaagc ccattccctc 60
tttagccaga gccggggtgt gcagacggca gt 92
<210> 413
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 413
tcagaaatag ggggtccagg agcaaactcc ccccaccccc tttccaaaaa gcccattccc 60
tctttagcca gagccggggt gtgcagacgg ca 92
<210> 414
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 414
tcagaaatag ggggtccagg agcaaactcc ccccaccccc tttccgccca ttccctcttt 60
agccagagcc ggggtgtgca gacggcagt 89
<210> 415
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 415
tcagaaatag ggggtccagg agcaaactcc ccccaccccc ttagcccatt ccctctttag 60
ccagagccgg ggtgtgcaga cggcagt 87
<210> 416
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 416
tcagaaatag ggggtccagg agcaaactcc ccccaccccc aaagcccatt ccctctttag 60
ccagagccgg ggtgtgcaga cggcagt 87
<210> 417
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 417
tcagaaatag ggggtccagg agcaaactcc ccccacccca aagcccattc cctctttagc 60
cagagccggg gtgtgcagac ggcagt 86
<210> 418
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 418
tcagaaatag ggggtccagg agcaaactcc ccccaccccc tttccattcc ctctttagcc 60
agagccgggg tgtgcagacg gcagt 85
<210> 419
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 419
tcagaaatag ggggtccagg agcaaactcc ccccaccccc tttcattccc tctttagcca 60
gagccggggt gtgcagacgg cagt 84
<210> 420
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 420
tcagaaatag ggggtccagg agcaaactcc ccccacaaag cccattccct ctttagccag 60
agccggggtg tgcagacggc agt 83
<210> 421
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 421
tcagaaatag ggggtccagg agcaaactcc ccccacccat tccctcttta gccagagccg 60
gggtgtgcag acggcagt 78
<210> 422
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 422
tcagaaatag ggggtccagg agcaaaccaa agcccattcc ctctttagcc agagccgggg 60
tgtgcagacg gcagt 75
<210> 423
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 423
tcagaaatag ggggtccagg agcaaactcc ccccaccccc tctttagcca gagccggggt 60
gtgcagacgg cagt 74
<210> 424
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 424
tcagaaatag ggggtccagg agcaaactcc ccccaccccc tttagccaga gccggggtgt 60
gcagacggca gt 72
<210> 425
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 425
tcagaaatag ggggtccagg caaagcccat tccctcttta gccagagccg gggtgtgcag 60
acggcagt 68
<210> 426
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 426
tcagaaatag ggggtccagg agctctttag ccagagccgg ggtgtgcaga cggcagt 57
<210> 427
<211> 92
<212> DNA
<213> Homo sapiens
<400> 427
ccccagcccc agctaccacc tcctccccgg ccggcggcgg acagtggacg cggcggcgag 60
ccgcgggcag gggccggagc ccgcgcccgg ag 92
<210> 428
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 428
ccccagcccc agctaccacc tcctccccgg ccggcgtgga cgcggcggcg agccgcgggc 60
aggggccgga gcccgcgccc ggag 84
<210> 429
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 429
ccccagcccc agctaccacc tcctccccgg ccggacgcgg cggcgagccg cgggcagggg 60
ccggagcccg cgcccggag 79
<210> 430
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 430
ccccagcccc agctaccacc tcctccccgg ctggacgcgg cggcgagccg cgggcagggg 60
ccggagcccg cgcccggag 79
<210> 431
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 431
ccccagcccc agctaccacc tcctccccgg ccggcggcgg acagccgcgg gcaggggccg 60
gagcccgcgc ccggag 76
<210> 432
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 432
ccccagcccc agctaccacc tcctccccgg acgcggcggc gagccgcggg caggggccgg 60
agcccgcgcc cggag 75
<210> 433
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 433
ccccagcccc agctaccacc tcctccccgg ccggagcccg cgcccgaag 49
<210> 434
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 434
ccccagcccc agctaccacc tcctccccgg ccggcggcgg acagtggagg gggtcggggc 60
tcg 63
<210> 435
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 435
ccccagcccc agctaccacc tcctccccgg ccggag 36
<210> 436
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 436
ccccagcccc agctaccacc tcctccccgg ccggcggcgg ggtggagggg gtcgg 55
<210> 437
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 437
ccccagcccc agctaccacc tcctccccgg ccggcggcgg acacacacgc ggcgtcgcac 60
<210> 438
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 438
ccccagcccc agctaccacc tcctccccgg ccggcggcct gaaacttttc gtc 53
<210> 439
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 439
ccggagcgcg gcgtggaggg ggtcggggct 30
<210> 440
<211> 92
<212> DNA
<213> Homo sapiens
<400> 440
ccattccctc tttagccaga gccggggtgt gcagacggca gtcactaggg ggcgctcggc 60
caccacaggg aagctgggtg aatggagcga gc 92
<210> 441
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 441
ccattccctc tttagccaga gccggggtgt gcagacggca cttagggggc gctcggccac 60
cacagggaag ctgggtgaat ggagcgagc 89
<210> 442
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 442
ccattccctc tttagccaga gccggggtgt gcagacggca ctagggggcg ctcggccacc 60
acagggaagc tgggtgaatg gagcgagc 88
<210> 443
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 443
ccattccctc tttagccaga gccggggtgt gcagacggca gtcagggcgc tcggccacca 60
cagggaagct gggtgaatgg agcgagc 87
<210> 444
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 444
ccattccctc tttagccaga gccggggtgt gcagacggca tagggggcgc tcggccacca 60
cagggaagct gggtgaatgg agcgagc 87
<210> 445
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 445
ccattccctc tttagccaga gccggggtgt gcagacctag ggggcgctcg gccaccacag 60
ggaagctggg tgaatggagc gagc 84
<210> 446
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 446
ccattccctc tttagccaga gccggggtgt gcagacggca gggcgctcgg ccaccacagg 60
gaagctgggt gaatggagcg agc 83
<210> 447
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 447
ccattccctc tttagccaga gccggggtgt gcagactagg gggcgctcgg ccaccacagg 60
gaagctgggt gaatggagcg agc 83
<210> 448
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 448
ccattccctc tttagccaga gccggggtgt gcagctaggg ggcgctcggc caccacaggg 60
aagctgggtg aatggagcga gc 82
<210> 449
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 449
ccattccctc tttagccaga gccggggtgt gcagaagggg gcgctcggcc accacaggga 60
agctgggtga atggagcgag c 81
<210> 450
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 450
ccattccctc tttagccaga gccggggtgt gcactagggg gcgctcggcc accacaggga 60
agctgggtga atggagcgag c 81
<210> 451
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 451
ccattccctc tttagccaga gccggggtgt gcagacggca gttcggccac cacagggaag 60
ctgggtgaat ggagcgagc 79
<210> 452
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 452
ccattccctc tttagccaga gccggggtgt ctagggggcg ctcggccacc acagggaagc 60
tgggtgaatg gagcgagc 78
<210> 453
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 453
ccattccctc tttagccaga gccggggtgt gcaggggcgc tcggccacca cagggaagct 60
gggtgaatgg agcgagc 77
<210> 454
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 454
ccattccctc tttagccaga gccggggtgt gcagggcgct cggccaccac agggaagctg 60
ggtgaatgga gcgagc 76
<210> 455
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 455
ccattccctc tttagccaga gccggggtgt gcagacggca gtcactacac agggaagctg 60
ggtgaatgga gcgagc 76
<210> 456
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 456
ccattccctc tttagccaga gccggggtgt gcagacggct cggccaccac agggaagctg 60
ggtgaatgga gcgagc 76
<210> 457
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 457
ccattccctc tttagccaga gccggggtgt gcagacgctc ggccaccaca gggaagctgg 60
gtgaatggag cgagc 75
<210> 458
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 458
ccattccctc tttagccaga gccggggtgg gggcgctcgg ccaccacagg gaagctgggt 60
gaatggagcg agc 73
<210> 459
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 459
ccattccctc tttagccaga gccggggtgt gcgctcggcc accacaggga agctgggtga 60
atggagcgag c 71
<210> 460
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 460
ccattccctc tttagccaga gccggggtgt gcagacggca gtcacaggga agctgggtga 60
atggagcgag c 71
<210> 461
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 461
ccattccctc tttagccaga gccggggtgt gcagacggcc accacaggga agctgggtga 60
atggagcgag c 71
<210> 462
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 462
ccattccctc tttagccaga gccggggtgt gcagacggca gtcagggaag ctgggtgaat 60
ggagcgagc 69
<210> 463
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 463
ccattccctc tttagccaga gccggggtgt gcaggccacc acagggaagc tgggtgaatg 60
gagcgagc 68
<210> 464
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 464
ccattccctc tttagccaga gccggggtgt gcagaccacc acagggaagc tgggtgaatg 60
gagcgagc 68
<210> 465
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 465
ccattccctc tttagccaga gccggggtgt gcagaccaca gggaagctgg gtgaatggag 60
cgagc 65
<210> 466
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 466
ccattccctc ttagtgactg ctcggccacc acagggaagc tgggtgaatg gagcgagc 58
Claims (19)
- 촉매적으로 불활성인 CRISPR-관련 9(dCas9)의 아미노 말단에 융합된, FokI 촉매적 도메인 서열을 포함하는, RNA-안내 FokI 뉴클레아제(RNA-guided FokI Nuclease: RFN) 융합 단백질.
- 제1항에 있어서, 2 내지 30개의 아미노산의 링커를 포함하는, 융합 단백질.
- 제2항에 있어서, 상기 링커는 Gly4Ser을 포함하는 것인, 융합 단백질.
- 제1항에 있어서, 상기 FokI 촉매적 도메인은 서열번호 4의 아미노산 388 내지 583 또는 408 내지 583을 포함하는 것인, 융합 단백질.
- 제1항에 있어서, 상기 dCas9는 D10, E762, H983 또는 D986; 및 H840 또는 N863에서의 치환 돌연변이를 포함하는 것인, 융합 단백질.
- 제5항에 있어서, 상기 dCas9는
(i) D10A 또는 D10N; 및
(ii) H840A, H840Y 또는 H840N
의 돌연변이를 포함하는 것인, 융합 단백질. - 제1항 내지 제6항 중 어느 한 항의 융합 단백질을 암호화하는 핵산.
- 제7항의 핵산을 포함하는 벡터.
- 제1항 내지 제6항 중 어느 한 항의 융합 단백질을 발현시키는 숙주 세포.
- 제1항 내지 제6항 중 어느 한 항의 RNA-안내 FokI 뉴클레아제(RFN) 융합 단백질 및 0 내지 31개의 뉴클레오타이드만큼 떨어진 2개의 표적 게놈 서열에 대해 RFN을 보내는 안내 RNA들을, 비-인간 세포 내에서 발현시키거나 또는 상기 세포와 접촉시키는 단계를 포함하는, 비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법.
- 제10항에 있어서, 상기 2개의 표적 게놈 서열이 10 내지 20개의 염기쌍만큼 떨어져 있는 것인, 비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법.
- 제10항에 있어서, 상기 안내 RNA는
(a) 2개의 단일 안내 RNA, 또는
(b) tracrRNA와 2개의 crRNA
이되, 상기 2개의 단일 안내 RNA 중 하나의 단일 안내 RNA는 제1 가닥을 표적화하고, 다른 하나의 안내 RNA는 상보성 가닥을 표적화하며, FokI는 각각의 가닥을 절단하여 마주보는 DNA 가닥 상에 한 쌍의 틈을 생성함으로써 이중-가닥 파손을 유발하고,
상기 2개의 crRNA 중 하나의 crRNA는 제1 가닥을 표적화하고, 다른 하나의 crRNA는 상보성 가닥을 표적화하며, FokI는 각각의 가닥을 절단하여 마주보는 DNA 가닥 상에 한 쌍의 틈을 생성함으로써 이중-가닥 파손을 유발하는 것인,
비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법. - 제10항에 있어서, 각각의 상기 2개의 안내 RNA는 표적 게놈 서열의 17 내지 20개의 뉴클레오타이드에 대해 상보적인 상보성 영역을 포함하는 것인, 비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법.
- 제10항에 있어서, 상기 2개의 표적 서열 사이에 삽입결실 돌연변이가 유도되는 것인, 비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법.
- 제10항에 있어서, 세포 내 RNA-안내 게놈 편집의 특이성이 증가되는 것인, 비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법.
- 비-인간 세포를 제1항 내지 제6항 중 어느 한 항의 RNA-안내 FokI 뉴클레아제(RFN) 융합 단백질과 접촉시키는 단계를 포함하는, 비-인간 세포 내 RNA-안내 게놈 편집의 특이성을 증가시키는 방법.
- 제1항에 있어서, 상기 FokI 촉매적 도메인 서열이 개재 링커(intervening linker)로 상기 촉매적으로 불활성인 CRISPR-관련 9(dCas9)의 아미노 말단에 융합된 것인, RNA-안내 FokI 뉴클레아제(RFN) 융합 단백질.
- 제10항에 있어서, 상기 2개의 표적 서열이 각각 3' 말단에 PAM 서열을 갖는 것인, 비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법.
- 제10항에 있어서, 상기 2개의 표적 게놈 서열이 13 내지 17개의 염기쌍만큼 떨어져 있는 것인, 비-인간 세포 내 게놈 서열에서 서열-특이적 파손을 유도하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020217002429A KR102271292B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361799647P | 2013-03-15 | 2013-03-15 | |
US61/799,647 | 2013-03-15 | ||
US201361838178P | 2013-06-21 | 2013-06-21 | |
US201361838148P | 2013-06-21 | 2013-06-21 | |
US61/838,178 | 2013-06-21 | ||
US61/838,148 | 2013-06-21 | ||
US201361921007P | 2013-12-26 | 2013-12-26 | |
US61/921,007 | 2013-12-26 | ||
PCT/US2014/028630 WO2014144288A1 (en) | 2013-03-15 | 2014-03-14 | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217002429A Division KR102271292B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150132395A KR20150132395A (ko) | 2015-11-25 |
KR102210322B1 true KR102210322B1 (ko) | 2021-02-01 |
Family
ID=51537665
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217002427A KR102271291B1 (ko) | 2013-03-15 | 2014-03-14 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
KR1020237038728A KR20230157540A (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
KR1020227018265A KR102602047B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
KR1020217002429A KR102271292B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
KR1020157029177A KR102210322B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
KR1020157029170A KR102210319B1 (ko) | 2013-03-15 | 2014-03-14 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
KR1020217002428A KR102405549B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
KR1020157029171A KR102210323B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217002427A KR102271291B1 (ko) | 2013-03-15 | 2014-03-14 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
KR1020237038728A KR20230157540A (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
KR1020227018265A KR102602047B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
KR1020217002429A KR102271292B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157029170A KR102210319B1 (ko) | 2013-03-15 | 2014-03-14 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
KR1020217002428A KR102405549B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
KR1020157029171A KR102210323B1 (ko) | 2013-03-15 | 2014-03-14 | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 |
Country Status (12)
Country | Link |
---|---|
US (16) | US9567604B2 (ko) |
EP (9) | EP2971041B1 (ko) |
JP (11) | JP6622183B2 (ko) |
KR (8) | KR102271291B1 (ko) |
CN (6) | CN105247066B (ko) |
AU (10) | AU2014227653B2 (ko) |
BR (1) | BR112015023489B1 (ko) |
CA (4) | CA2906553C (ko) |
ES (1) | ES2713503T3 (ko) |
IL (2) | IL289396B2 (ko) |
WO (4) | WO2014144592A2 (ko) |
ZA (1) | ZA201506814B (ko) |
Families Citing this family (359)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8053191B2 (en) | 2006-08-31 | 2011-11-08 | Westend Asset Clearinghouse Company, Llc | Iterative nucleic acid assembly using activation of vector-encoded traits |
EP2625292B1 (en) | 2010-10-07 | 2018-12-05 | The General Hospital Corporation | Biomarkers of cancer |
EP2637780B1 (en) | 2010-11-12 | 2022-02-09 | Gen9, Inc. | Protein arrays and methods of using and making the same |
CA3132011A1 (en) | 2010-11-12 | 2012-06-14 | Gen9, Inc. | Methods and devices for nucleic acids synthesis |
AU2012284365B2 (en) | 2011-07-15 | 2017-04-20 | The General Hospital Corporation | Methods of transcription activator like effector assembly |
EP2734621B1 (en) | 2011-07-22 | 2019-09-04 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
EP3594340B1 (en) | 2011-08-26 | 2021-06-30 | Gen9, Inc. | Compositions and methods for high fidelity assembly of nucleic acids |
US11021737B2 (en) | 2011-12-22 | 2021-06-01 | President And Fellows Of Harvard College | Compositions and methods for analyte detection |
WO2014163886A1 (en) | 2013-03-12 | 2014-10-09 | President And Fellows Of Harvard College | Method of generating a three-dimensional nucleic acid containing matrix |
GB201122458D0 (en) * | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
WO2013139861A1 (en) | 2012-03-20 | 2013-09-26 | Luc Montagnier | Methods and pharmaceutical compositions of the treatment of autistic syndrome disorders |
US9150853B2 (en) | 2012-03-21 | 2015-10-06 | Gen9, Inc. | Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis |
WO2013163263A2 (en) | 2012-04-24 | 2013-10-31 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
TR201806812T4 (tr) | 2012-05-25 | 2018-06-21 | Charpentier Emmanuelle | Rna-yönlendirmeli hedef dna modifikasyonu için ve rna-yönlendirmeli transkripsiyon modifikasyonu için yöntemler ve bileşimler. |
US9890364B2 (en) | 2012-05-29 | 2018-02-13 | The General Hospital Corporation | TAL-Tet1 fusion proteins and methods of use thereof |
JP6509727B2 (ja) | 2012-06-25 | 2019-05-15 | ギンゴー バイオワークス, インコーポレイテッド | 核酸アセンブリおよび高処理シークエンシングのための方法 |
US20150267176A1 (en) * | 2012-10-12 | 2015-09-24 | The General Hospital Corporation | Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins |
KR102243092B1 (ko) | 2012-12-06 | 2021-04-22 | 시그마-알드리치 컴퍼니., 엘엘씨 | Crispr-기초된 유전체 변형과 조절 |
EP2931892B1 (en) | 2012-12-12 | 2018-09-12 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
KR20150105956A (ko) | 2012-12-12 | 2015-09-18 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작 및 치료적 적용을 위한 시스템, 방법 및 조성물의 전달, 유전자 조작 및 최적화 |
EP3919505B1 (en) | 2013-01-16 | 2023-08-30 | Emory University | Uses of cas9-nucleic acid complexes |
EP2954042B1 (en) | 2013-02-07 | 2017-12-06 | The General Hospital Corporation | Tale transcriptional activators |
NZ712727A (en) | 2013-03-14 | 2017-05-26 | Caribou Biosciences Inc | Compositions and methods of nucleic acid-targeting nucleic acids |
WO2014144592A2 (en) | 2013-03-15 | 2014-09-18 | The General Hospital Corporation | Using truncated guide rnas (tru-grnas) to increase specificity for rna-guided genome editing |
US10760064B2 (en) * | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
CN105518146B (zh) | 2013-04-04 | 2022-07-15 | 哈佛学院校长同事会 | 利用CRISPR/Cas系统的基因组编辑的治疗性用途 |
KR102512979B1 (ko) | 2013-06-04 | 2023-03-22 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | Rna-가이드된 전사 조절 |
US9267135B2 (en) | 2013-06-04 | 2016-02-23 | President And Fellows Of Harvard College | RNA-guided transcriptional regulation |
CN114230675A (zh) * | 2013-06-05 | 2022-03-25 | 杜克大学 | Rna指导的基因编辑和基因调节 |
CN105492611A (zh) | 2013-06-17 | 2016-04-13 | 布罗德研究所有限公司 | 用于序列操纵的优化的crispr-cas双切口酶系统、方法以及组合物 |
KR20160044457A (ko) | 2013-06-17 | 2016-04-25 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 탠덤 안내 시스템, 방법 및 조성물의 전달, 조작 및 최적화 |
WO2014204727A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
MX2015017313A (es) | 2013-06-17 | 2016-11-25 | Broad Inst Inc | Suministro, uso y aplicaciones terapéuticas de los sistemas y composiciones crispr-cas, para actuar sobre trastornos y enfermedades utilizando componentes víricos. |
BR112015031608A2 (pt) | 2013-06-17 | 2017-08-22 | Massachusetts Inst Technology | Aplicação e uso dos sistemas crispr-cas, vetores e composições para direcionamento e terapia hepáticos |
US10011850B2 (en) | 2013-06-21 | 2018-07-03 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing |
WO2015006498A2 (en) | 2013-07-09 | 2015-01-15 | President And Fellows Of Harvard College | Therapeutic uses of genome editing with crispr/cas systems |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US20150044772A1 (en) * | 2013-08-09 | 2015-02-12 | Sage Labs, Inc. | Crispr/cas system-based novel fusion protein and its applications in genome editing |
EP3036333B1 (en) | 2013-08-22 | 2022-01-19 | E. I. du Pont de Nemours and Company | Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9322037B2 (en) * | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
CN105637087A (zh) | 2013-09-18 | 2016-06-01 | 科马布有限公司 | 方法、细胞与生物体 |
US10584358B2 (en) | 2013-10-30 | 2020-03-10 | North Carolina State University | Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri |
DK3066201T3 (en) | 2013-11-07 | 2018-06-06 | Editas Medicine Inc | CRISPR-RELATED PROCEDURES AND COMPOSITIONS WITH LEADING GRADES |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
CA2932478A1 (en) | 2013-12-12 | 2015-06-18 | Massachusetts Institute Of Technology | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for genome editing |
CA2932436A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute, Inc. | Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
EP3080271B1 (en) | 2013-12-12 | 2020-02-12 | The Broad Institute, Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
US9994831B2 (en) * | 2013-12-12 | 2018-06-12 | The Regents Of The University Of California | Methods and compositions for modifying a single stranded target nucleic acid |
EP3090044B1 (en) * | 2013-12-26 | 2021-11-03 | The General Hospital Corporation | Multiplex guide rnas |
US10787654B2 (en) | 2014-01-24 | 2020-09-29 | North Carolina State University | Methods and compositions for sequence guiding Cas9 targeting |
DE212015000061U1 (de) | 2014-02-11 | 2017-09-03 | The Regents Of The University Of Colorado, A Body Corporate | CRISPR-ermöglichtes Multiplex Genom Engineering |
US11028388B2 (en) | 2014-03-05 | 2021-06-08 | Editas Medicine, Inc. | CRISPR/Cas-related methods and compositions for treating Usher syndrome and retinitis pigmentosa |
EP3116997B1 (en) | 2014-03-10 | 2019-05-15 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10) |
US11141493B2 (en) | 2014-03-10 | 2021-10-12 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
US11339437B2 (en) | 2014-03-10 | 2022-05-24 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
EP3981876A1 (en) | 2014-03-26 | 2022-04-13 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating sickle cell disease |
CA2944978C (en) | 2014-04-08 | 2024-02-13 | North Carolina State University | Methods and compositions for rna-directed repression of transcription using crispr-associated genes |
AU2015266776A1 (en) | 2014-05-30 | 2016-12-08 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and methods of delivering treatments for latent viral infections |
CN106604994B (zh) | 2014-06-23 | 2021-12-14 | 通用医疗公司 | 通过测序评估的DSBs的全基因组无偏鉴定(GUIDE-Seq) |
US20150376587A1 (en) * | 2014-06-25 | 2015-12-31 | Caribou Biosciences, Inc. | RNA Modification to Engineer Cas9 Activity |
EP3167071B1 (en) * | 2014-07-09 | 2020-10-07 | Gen9, Inc. | Compositions and methods for site-directed dna nicking and cleaving |
AU2015288157A1 (en) | 2014-07-11 | 2017-01-19 | E. I. Du Pont De Nemours And Company | Compositions and methods for producing plants resistant to glyphosate herbicide |
AU2015298571B2 (en) | 2014-07-30 | 2020-09-03 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
WO2016022866A1 (en) | 2014-08-07 | 2016-02-11 | Agilent Technologies, Inc. | Cis-blocked guide rna |
WO2016033298A1 (en) | 2014-08-28 | 2016-03-03 | North Carolina State University | Novel cas9 proteins and guiding features for dna targeting and genome editing |
CN108064129A (zh) | 2014-09-12 | 2018-05-22 | 纳幕尔杜邦公司 | 玉米和大豆中复合性状基因座的位点特异性整合位点的产生和使用方法 |
WO2016049258A2 (en) * | 2014-09-25 | 2016-03-31 | The Broad Institute Inc. | Functional screening with optimized functional crispr-cas systems |
US20170233762A1 (en) * | 2014-09-29 | 2017-08-17 | The Regents Of The University Of California | Scaffold rnas |
AU2015330699B2 (en) * | 2014-10-10 | 2021-12-02 | Editas Medicine, Inc. | Compositions and methods for promoting homology directed repair |
US9816080B2 (en) | 2014-10-31 | 2017-11-14 | President And Fellows Of Harvard College | Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs) |
AU2015342749B2 (en) | 2014-11-07 | 2022-01-27 | Editas Medicine, Inc. | Methods for improving CRISPR/Cas-mediated genome-editing |
KR101828933B1 (ko) * | 2014-11-14 | 2018-02-14 | 기초과학연구원 | 유전체에서 유전자 가위의 비표적 위치를 검출하는 방법 |
US11352666B2 (en) | 2014-11-14 | 2022-06-07 | Institute For Basic Science | Method for detecting off-target sites of programmable nucleases in a genome |
CN104531633A (zh) * | 2014-11-18 | 2015-04-22 | 李云英 | Cas9-scForkI融合蛋白及其应用 |
US10858662B2 (en) | 2014-11-19 | 2020-12-08 | Institute For Basic Science | Genome editing with split Cas9 expressed from two vectors |
JP7068821B2 (ja) | 2014-12-03 | 2022-05-17 | アジレント・テクノロジーズ・インク | 化学修飾を有するガイドrna |
US10975392B2 (en) | 2014-12-05 | 2021-04-13 | Abcam Plc | Site-directed CRISPR/recombinase compositions and methods of integrating transgenes |
AU2015360502A1 (en) | 2014-12-10 | 2017-06-29 | Regents Of The University Of Minnesota | Genetically modified cells, tissues, and organs for treating disease |
EP3230452A1 (en) * | 2014-12-12 | 2017-10-18 | The Broad Institute Inc. | Dead guides for crispr transcription factors |
EP3889260A1 (en) | 2014-12-12 | 2021-10-06 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
US20180179523A1 (en) * | 2014-12-18 | 2018-06-28 | Integrated Dna Technologies, Inc. | Crispr-based compositions and methods of use |
AU2015364282B2 (en) * | 2014-12-18 | 2021-04-15 | Integrated Dna Technologies, Inc. | CRISPR-based compositions and methods of use |
US10190106B2 (en) | 2014-12-22 | 2019-01-29 | Univesity Of Massachusetts | Cas9-DNA targeting unit chimeras |
EP3245232B1 (en) | 2015-01-12 | 2021-04-21 | The Regents of The University of California | Heterodimeric cas9 and methods of use thereof |
EP3250689B1 (en) * | 2015-01-28 | 2020-11-04 | The Regents of The University of California | Methods and compositions for labeling a single-stranded target nucleic acid |
MX2017009506A (es) | 2015-01-28 | 2017-11-02 | Pioneer Hi Bred Int | Polinucleotidos de acido desoxirribonucleico (adn)/acido ribonucleico (arn) hibridos de repeticiones palindromicas cortas agrupadas regularmente separadas (crispr) y sus metodos de uso. |
US10676726B2 (en) | 2015-02-09 | 2020-06-09 | Duke University | Compositions and methods for epigenome editing |
AU2016220088C1 (en) * | 2015-02-18 | 2022-12-08 | Iowa State University Research Foundation, Inc. | Modification of transcriptional repressor binding site in NF-YC4 promoter for increased protein content and resistance to stress |
EP3265559B1 (en) | 2015-03-03 | 2021-01-06 | The General Hospital Corporation | Engineered crispr-cas9 nucleases with altered pam specificity |
EP3274460A1 (en) | 2015-03-27 | 2018-01-31 | E. I. du Pont de Nemours and Company | Soybean u6 small nuclear rna gene promoters and their use in constitutive expression of small rna genes in plants |
AU2016246450B2 (en) | 2015-04-06 | 2022-03-17 | Agilent Technologies, Inc. | Chemically modified guide RNAs for CRISPR/Cas-mediated gene regulation |
AU2016253150B2 (en) | 2015-04-24 | 2022-04-21 | Editas Medicine, Inc. | Evaluation of Cas9 molecule/guide RNA molecule complexes |
CA2988854A1 (en) | 2015-05-08 | 2016-11-17 | President And Fellows Of Harvard College | Universal donor stem cells and related methods |
AU2016261358B2 (en) | 2015-05-11 | 2021-09-16 | Editas Medicine, Inc. | Optimized CRISPR/Cas9 systems and methods for gene editing in stem cells |
US10117911B2 (en) | 2015-05-29 | 2018-11-06 | Agenovir Corporation | Compositions and methods to treat herpes simplex virus infections |
CN108026536A (zh) | 2015-05-29 | 2018-05-11 | 北卡罗来纳州立大学 | 使用crispr核酸筛选细菌、古细菌、藻类和酵母的方法 |
EP3324999A1 (en) | 2015-05-29 | 2018-05-30 | Agenovir Corporation | Compositions and methods for cell targeted hpv treatment |
WO2016196655A1 (en) | 2015-06-03 | 2016-12-08 | The Regents Of The University Of California | Cas9 variants and methods of use thereof |
US20180296537A1 (en) | 2015-06-05 | 2018-10-18 | Novartis Ag | Methods and compositions for diagnosing, treating, and monitoring treatment of shank3 deficiency associated disorders |
EP3307887A1 (en) | 2015-06-09 | 2018-04-18 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for improving transplantation |
ES2961258T3 (es) * | 2015-06-10 | 2024-03-11 | Firmenich & Cie | Líneas celulares para el cribado de receptores de aroma y olor |
US20160362705A1 (en) | 2015-06-12 | 2016-12-15 | Lonza Walkersville, Inc. | Methods for Nuclear Reprogramming Using Synthetic Transcription Factors |
JP7051438B2 (ja) | 2015-06-15 | 2022-04-11 | ノース カロライナ ステート ユニバーシティ | 核酸およびrnaに基づく抗菌剤の効率的な送達のための方法および組成物 |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
CN108290933A (zh) | 2015-06-18 | 2018-07-17 | 布罗德研究所有限公司 | 降低脱靶效应的crispr酶突变 |
WO2017004261A1 (en) | 2015-06-29 | 2017-01-05 | Ionis Pharmaceuticals, Inc. | Modified crispr rna and modified single crispr rna and uses thereof |
US11279928B2 (en) * | 2015-06-29 | 2022-03-22 | Massachusetts Institute Of Technology | Compositions comprising nucleic acids and methods of using the same |
EP3957731A1 (en) * | 2015-07-15 | 2022-02-23 | Rutgers, The State University of New Jersey | Nuclease-independent targeted gene editing platform and uses thereof |
WO2017015637A1 (en) | 2015-07-22 | 2017-01-26 | Duke University | High-throughput screening of regulatory element function with epigenome editing technologies |
EP4339287A3 (en) | 2015-07-31 | 2024-05-22 | Regents Of The University Of Minnesota | Modified cells and methods of therapy |
US20180230450A1 (en) * | 2015-08-03 | 2018-08-16 | President And Fellows Of Harvard College | Cas9 Genome Editing and Transcriptional Regulation |
WO2017024047A1 (en) * | 2015-08-03 | 2017-02-09 | Emendobio Inc. | Compositions and methods for increasing nuclease induced recombination rate in cells |
CA2996001A1 (en) * | 2015-08-25 | 2017-03-02 | Duke University | Compositions and methods of improving specificity in genomic engineering using rna-guided endonucleases |
US9512446B1 (en) | 2015-08-28 | 2016-12-06 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
JP6799586B2 (ja) | 2015-08-28 | 2020-12-16 | ザ ジェネラル ホスピタル コーポレイション | 遺伝子操作CRISPR−Cas9ヌクレアーゼ |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
EP3344771A4 (en) | 2015-08-31 | 2019-03-20 | Agilent Technologies, Inc. | COMPOUNDS AND METHODS FOR GENOME EDITING BASED ON CRISPR / CAS BY HOMOLOGOUS RECOMBINATION |
WO2017044776A1 (en) * | 2015-09-10 | 2017-03-16 | Texas Tech University System | Single-guide rna (sgrna) with improved knockout efficiency |
KR20180043369A (ko) | 2015-09-11 | 2018-04-27 | 더 제너럴 하스피탈 코포레이션 | 뉴클레아제 dsb의 완전한 호출 및 시퀀싱(find-seq) |
EP3786294A1 (en) | 2015-09-24 | 2021-03-03 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
WO2017058751A1 (en) | 2015-09-28 | 2017-04-06 | North Carolina State University | Methods and compositions for sequence specific antimicrobials |
JP2018529353A (ja) | 2015-09-30 | 2018-10-11 | ザ ジェネラル ホスピタル コーポレイション | 配列決定法による切断事象の包括的生体外報告(CIRCLE−seq) |
JP6916188B2 (ja) * | 2015-10-06 | 2021-08-11 | インスティチュート フォー ベーシック サイエンスInstitute For Basic Science | プロトプラストからの全植物体の製造方法 |
EP3362571A4 (en) | 2015-10-13 | 2019-07-10 | Duke University | GENOMIC ENGINEERING WITH TYPE I CRISPRISMS IN EUKARYOTIC CELLS |
IL310721A (en) | 2015-10-23 | 2024-04-01 | Harvard College | Nucleobase editors and their uses |
WO2017070598A1 (en) | 2015-10-23 | 2017-04-27 | Caribou Biosciences, Inc. | Engineered crispr class 2 cross-type nucleic-acid targeting nucleic acids |
CA3004285A1 (en) | 2015-11-03 | 2017-05-11 | President And Fellows Of Harvard College | Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix |
WO2017081288A1 (en) | 2015-11-11 | 2017-05-18 | Lonza Ltd | Crispr-associated (cas) proteins with reduced immunogenicity |
WO2017087979A1 (en) | 2015-11-20 | 2017-05-26 | Washington University | Preparative electrophoretic method for targeted purification of genomic dna fragments |
US10612044B2 (en) | 2015-11-25 | 2020-04-07 | National University Corporation Gunma University | DNA methylation editing kit and DNA methylation editing method |
WO2017106251A1 (en) * | 2015-12-14 | 2017-06-22 | President And Fellows Of Harvard College | Cas discrimination using tuned guide rna |
US11542466B2 (en) | 2015-12-22 | 2023-01-03 | North Carolina State University | Methods and compositions for delivery of CRISPR based antimicrobials |
US20190010495A1 (en) * | 2015-12-28 | 2019-01-10 | Novartis Ag | Compositions and methods for the treatment of hemoglobinopathies |
CA3010754A1 (en) | 2016-01-11 | 2017-07-20 | The Board Of Trustees Of The Leland Stanford Junior University | Chimeric proteins and methods of immunotherapy |
JP7015239B2 (ja) | 2016-01-11 | 2022-03-04 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | キメラタンパク質および遺伝子発現を調節する方法 |
WO2017136794A1 (en) | 2016-02-03 | 2017-08-10 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide rna and its applications |
JP2019513345A (ja) | 2016-02-10 | 2019-05-30 | ザ リージェンツ オブ ザ ユニバーシティ オブ ミシガン | 核酸の検知 |
WO2017143071A1 (en) | 2016-02-18 | 2017-08-24 | The Regents Of The University Of California | Methods and compositions for gene editing in stem cells |
US10538750B2 (en) | 2016-02-29 | 2020-01-21 | Agilent Technologies, Inc. | Methods and compositions for blocking off-target nucleic acids from cleavage by CRISPR proteins |
MX2018011170A (es) * | 2016-03-15 | 2019-05-16 | Apse Inc | Metodos y composiciones para incrementar la produccion de arn bicatenario. |
WO2017161043A1 (en) | 2016-03-16 | 2017-09-21 | The J. David Gladstone Institutes | Methods and compositions for treating obesity and/or diabetes and for identifying candidate treatment agents |
EP3219799A1 (en) | 2016-03-17 | 2017-09-20 | IMBA-Institut für Molekulare Biotechnologie GmbH | Conditional crispr sgrna expression |
WO2017165826A1 (en) | 2016-03-25 | 2017-09-28 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
EP3433364A1 (en) | 2016-03-25 | 2019-01-30 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency |
CN106701765A (zh) * | 2016-04-11 | 2017-05-24 | 广东赤萌医疗科技有限公司 | 用于hiv感染治疗的多核苷酸及其制备药物应用 |
WO2017180915A2 (en) * | 2016-04-13 | 2017-10-19 | Duke University | Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use |
WO2017180694A1 (en) | 2016-04-13 | 2017-10-19 | Editas Medicine, Inc. | Cas9 fusion molecules gene editing systems, and methods of use thereof |
CN116200465A (zh) | 2016-04-25 | 2023-06-02 | 哈佛学院董事及会员团体 | 用于原位分子检测的杂交链反应方法 |
CN107326046A (zh) * | 2016-04-28 | 2017-11-07 | 上海邦耀生物科技有限公司 | 一种提高外源基因同源重组效率的方法 |
US20170332610A1 (en) | 2016-05-20 | 2017-11-23 | Regeneron Pharmaceuticals, Inc. | Methods for breaking immunological tolerance using multiple guide rnas |
WO2017208247A1 (en) | 2016-06-02 | 2017-12-07 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Assay for the removal of methyl-cytosine residues from dna |
CA3026321C (en) | 2016-06-02 | 2023-10-03 | Sigma-Aldrich Co. Llc | Using programmable dna binding proteins to enhance targeted genome modification |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
JP6940117B2 (ja) * | 2016-06-15 | 2021-09-22 | ツールゲン インコーポレイテッドToolgen Incorporated | オンターゲットおよびオフターゲットの多標的システムを用いた標的特異的ヌクレアーゼをスクリーニングするための方法およびその利用 |
EP3474669B1 (en) | 2016-06-24 | 2022-04-06 | The Regents of The University of Colorado, A Body Corporate | Methods for generating barcoded combinatorial libraries |
EP3474849A4 (en) | 2016-06-27 | 2020-07-29 | The Broad Institute, Inc. | COMPOSITIONS AND METHODS FOR DETECTION AND TREATMENT OF DIABETES |
CN109477130B (zh) * | 2016-07-01 | 2022-08-30 | 微软技术许可有限责任公司 | 通过迭代dna编辑的存储 |
US11359234B2 (en) | 2016-07-01 | 2022-06-14 | Microsoft Technology Licensing, Llc | Barcoding sequences for identification of gene expression |
US20180004537A1 (en) | 2016-07-01 | 2018-01-04 | Microsoft Technology Licensing, Llc | Molecular State Machines |
WO2018010516A1 (zh) * | 2016-07-13 | 2018-01-18 | 陈奇涵 | 一种基因组dna特异性编辑方法和应用 |
CN109863143B (zh) * | 2016-07-13 | 2021-10-15 | 威泰克斯制药公司 | 提高基因组编辑效率的方法、组合物和试剂盒 |
WO2018022634A1 (en) * | 2016-07-26 | 2018-02-01 | The General Hospital Corporation | Variants of crispr from prevotella and francisella 1 (cpf1) |
KR101961332B1 (ko) * | 2016-07-28 | 2019-03-22 | 기초과학연구원 | Cas9 단백질 및 가이드 RNA를 포함하는 안질환 치료용 약학 조성물 |
BR112019001783A2 (pt) | 2016-07-29 | 2019-05-07 | Regeneron Pharmaceuticals, Inc. | mamífero não humano, e, métodos para produzir o mamífero não humano e de triagem de um composto. |
BR112019001887A2 (pt) | 2016-08-02 | 2019-07-09 | Editas Medicine Inc | composições e métodos para o tratamento de doença associada a cep290 |
EP3494215A1 (en) | 2016-08-03 | 2019-06-12 | President and Fellows of Harvard College | Adenosine nucleobase editors and uses thereof |
EP3497214B1 (en) | 2016-08-09 | 2023-06-28 | President and Fellows of Harvard College | Programmable cas9-recombinase fusion proteins and uses thereof |
US11905549B2 (en) | 2016-08-10 | 2024-02-20 | Genahead Bio, Inc. | Method for modifying target site in genome of eukaryotic cell, and method for detecting presence or absence of nucleic acid sequence to be detected at target site |
AU2017313912B2 (en) | 2016-08-19 | 2024-01-04 | Whitehead Institute For Biomedical Research | Methods of editing DNA methylation |
WO2018034554A1 (ko) * | 2016-08-19 | 2018-02-22 | 주식회사 툴젠 | 인위적으로 조작된 신생혈관형성 조절 시스템 |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
KR102455249B1 (ko) | 2016-08-24 | 2022-10-17 | 상가모 테라퓨틱스, 인코포레이티드 | 가공된 표적 특이적 뉴클레아제 |
KR102572759B1 (ko) | 2016-08-24 | 2023-08-29 | 상가모 테라퓨틱스, 인코포레이티드 | 조작된 뉴클레아제를 이용하는 유전자 발현의 조절 |
WO2018048194A1 (ko) * | 2016-09-07 | 2018-03-15 | 울산대학교 산학협력단 | dCas9 단백질 및 표적 핵산 서열에 결합하는 gRNA를 이용한 핵산 검출의 민감도 및 특이도 향상용 조성물 및 방법 |
CN109890962A (zh) | 2016-09-07 | 2019-06-14 | 旗舰创业股份有限公司 | 用于调节基因表达的方法和组合物 |
CN107880132B (zh) * | 2016-09-30 | 2022-06-17 | 北京大学 | 一种融合蛋白及使用其进行同源重组的方法 |
CN110023494A (zh) | 2016-09-30 | 2019-07-16 | 加利福尼亚大学董事会 | Rna指导的核酸修饰酶及其使用方法 |
US10669539B2 (en) | 2016-10-06 | 2020-06-02 | Pioneer Biolabs, Llc | Methods and compositions for generating CRISPR guide RNA libraries |
US11242542B2 (en) | 2016-10-07 | 2022-02-08 | Integrated Dna Technologies, Inc. | S. pyogenes Cas9 mutant genes and polypeptides encoded by same |
AU2017339542A1 (en) | 2016-10-07 | 2019-04-11 | Integrated Dna Technologies, Inc. | S. pyogenes Cas9 mutant genes and polypeptides encoded by same |
KR20190067209A (ko) * | 2016-10-14 | 2019-06-14 | 더 제너럴 하스피탈 코포레이션 | 후성적으로 조절되는 부위-특이적 뉴클레아제 |
JP2019530464A (ja) | 2016-10-14 | 2019-10-24 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸塩基エディターのaav送達 |
GB2604416B (en) | 2016-10-18 | 2023-03-15 | Univ Minnesota | Tumor infiltating lymphocytes and methods of therapy |
US20180245065A1 (en) | 2016-11-01 | 2018-08-30 | Novartis Ag | Methods and compositions for enhancing gene editing |
US20180282722A1 (en) * | 2016-11-21 | 2018-10-04 | Massachusetts Institute Of Technology | Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing |
AU2017364084B2 (en) | 2016-11-22 | 2024-07-04 | Integrated Dna Technologies, Inc. | CRISPR/Cpf1 systems and methods |
BR112019011509A2 (pt) * | 2016-12-08 | 2020-01-28 | Intellia Therapeutics Inc | rnas guias modificados |
US11293022B2 (en) | 2016-12-12 | 2022-04-05 | Integrated Dna Technologies, Inc. | Genome editing enhancement |
JP2020502124A (ja) | 2016-12-14 | 2020-01-23 | リガンダル インコーポレイテッド | 核酸および/またはタンパク質ペイロード送達のための組成物および方法 |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
AU2017388379A1 (en) * | 2016-12-28 | 2019-06-06 | Ionis Pharmaceuticals, Inc. | Modified CRISPR RNA and uses thereof |
WO2018129129A1 (en) * | 2017-01-05 | 2018-07-12 | Rutgers, The State University Of New Jersey | Targeted gene editing platform independent of dna double strand break and uses thereof |
WO2018129544A1 (en) | 2017-01-09 | 2018-07-12 | Whitehead Institute For Biomedical Research | Methods of altering gene expression by perturbing transcription factor multimers that structure regulatory loops |
EP3572525A4 (en) * | 2017-01-17 | 2020-09-30 | Institute for Basic Science | PROCESS FOR IDENTIFYING A BASE-EDITING OFF-TARGET SITE BY DNA STRAND BREAKING |
CA3047429A1 (en) | 2017-01-23 | 2018-07-26 | Regeneron Pharmaceuticals, Inc. | Hsd17b13 variants and uses thereof |
TW201839136A (zh) | 2017-02-06 | 2018-11-01 | 瑞士商諾華公司 | 治療血色素異常症之組合物及方法 |
CA3049989A1 (en) * | 2017-02-10 | 2018-08-16 | Zymergen Inc. | A modular universal plasmid design strategy for the assembly and editing of multiple dna constructs for multiple hosts |
WO2018154096A1 (en) | 2017-02-24 | 2018-08-30 | Georg-August-Universität Göttingen Stiftung Öffentlichen Rechts, Universitätsmedizin | Method for re-expression of different hypermethylated genes involved in fibrosis, like hypermethylated rasal,1 and use thereof in treatment of fibrosis as well as kit of parts for re-expression of hypermethylated genes including rasal1 in a subject |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
CN110914310A (zh) | 2017-03-10 | 2020-03-24 | 哈佛大学的校长及成员们 | 胞嘧啶至鸟嘌呤碱基编辑器 |
EP3596217A1 (en) | 2017-03-14 | 2020-01-22 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
IL306092A (en) | 2017-03-23 | 2023-11-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
CN108660161B (zh) * | 2017-03-31 | 2023-05-09 | 中国科学院脑科学与智能技术卓越创新中心 | 基于CRISPR/Cas9技术的制备无嵌合基因敲除动物的方法 |
AU2018250330A1 (en) * | 2017-04-07 | 2019-09-19 | Sage Science, Inc. | Systems and methods for detection of genetic structural variation using integrated electrophoretic DNA purification |
CA3059208A1 (en) | 2017-04-21 | 2018-10-25 | The General Hospital Corporation | Inducible, tunable, and multiplex human gene regulation using crispr-cpf1 |
WO2018195545A2 (en) | 2017-04-21 | 2018-10-25 | The General Hospital Corporation | Variants of cpf1 (cas12a) with altered pam specificity |
WO2018201086A1 (en) | 2017-04-28 | 2018-11-01 | Editas Medicine, Inc. | Methods and systems for analyzing guide rna molecules |
EP3622070A2 (en) | 2017-05-10 | 2020-03-18 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
US20200172895A1 (en) | 2017-05-25 | 2020-06-04 | The General Hospital Corporation | Using split deaminases to limit unwanted off-target base editor deamination |
CN108977442B (zh) * | 2017-06-05 | 2023-01-06 | 广州市锐博生物科技有限公司 | 用于dna编辑的系统及其应用 |
AU2018282072B2 (en) | 2017-06-05 | 2024-06-27 | Regeneron Pharmaceuticals, Inc. | B4GALT1 variants and uses thereof |
WO2018227114A1 (en) | 2017-06-09 | 2018-12-13 | Editas Medicine, Inc. | Engineered cas9 nucleases |
EP3638792A1 (en) | 2017-06-14 | 2020-04-22 | Wisconsin Alumni Research Foundation | Modified guide rnas, crispr-ribonucleotprotein complexes and methods of use |
US20200362355A1 (en) | 2017-06-15 | 2020-11-19 | The Regents Of The University Of California | Targeted non-viral dna insertions |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
EP3645721A1 (en) | 2017-06-30 | 2020-05-06 | Novartis AG | Methods for the treatment of disease with gene editing systems |
WO2019006418A2 (en) | 2017-06-30 | 2019-01-03 | Intima Bioscience, Inc. | ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY |
WO2019014230A1 (en) * | 2017-07-11 | 2019-01-17 | Sigma-Aldrich Co. Llc | USE OF DOMAINS OF PROTEINS INTERACTING WITH NUCLEOSOMES TO IMPROVE THE TARGETED MODIFICATION OF THE GENOME |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
EP3658573A1 (en) | 2017-07-28 | 2020-06-03 | President and Fellows of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace) |
CN115074343A (zh) | 2017-07-31 | 2022-09-20 | 瑞泽恩制药公司 | Cas转基因小鼠胚胎干细胞和小鼠及其应用 |
SG11201911619YA (en) | 2017-07-31 | 2020-01-30 | Regeneron Pharma | Assessment of crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo |
EP3585160A2 (en) * | 2017-07-31 | 2020-01-01 | Regeneron Pharmaceuticals, Inc. | Crispr reporter non-human animals and uses thereof |
CN111278848B (zh) | 2017-08-04 | 2023-06-27 | 北京大学 | 特异性识别甲基化修饰dna碱基的tale rvd及其应用 |
EP3666898A4 (en) | 2017-08-08 | 2021-03-24 | Peking University | GENE INACTIVATION PROCESS |
CA3073448A1 (en) | 2017-08-23 | 2019-02-28 | The General Hospital Corporation | Engineered crispr-cas9 nucleases with altered pam specificity |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
CA3071712C (en) | 2017-09-29 | 2023-02-14 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ttr locus and methods of use |
EP3694993A4 (en) | 2017-10-11 | 2021-10-13 | The General Hospital Corporation | METHOD OF DETECTING A SITE-SPECIFIC AND UNDESIRED GENOMIC DESAMINATION INDUCED BY BASE EDITING TECHNOLOGIES |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
CN107602707B (zh) * | 2017-10-17 | 2021-04-23 | 湖北大学 | 一种特异性调节枯草芽孢杆菌外源基因表达的dcas9-ω融合蛋白及其应用 |
CA3080415A1 (en) | 2017-10-27 | 2019-05-02 | The Regents Of The University Of California | Targeted replacement of endogenous t cell receptors |
WO2019087113A1 (en) | 2017-11-01 | 2019-05-09 | Novartis Ag | Synthetic rnas and methods of use |
US20210180059A1 (en) * | 2017-11-16 | 2021-06-17 | Astrazeneca Ab | Compositions and methods for improving the efficacy of cas9-based knock-in strategies |
KR102339365B1 (ko) | 2017-12-22 | 2021-12-17 | (주)지플러스 생명과학 | 키메라 게놈 조작 분자 및 방법 |
CN109504711A (zh) * | 2018-02-14 | 2019-03-22 | 复旦大学 | 基于CRISPR/cas9和过氧化物酶APEX2系统识别分析特异性基因组位点相互作用DNA的方法 |
WO2019161340A1 (en) | 2018-02-19 | 2019-08-22 | Yale University | Phosphopeptide-encoding oligonucleotide libraries and methods for detecting phosphorylation-dependent molecular interactions |
AU2019236209A1 (en) | 2018-03-14 | 2020-10-01 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
AU2019239880B2 (en) | 2018-03-19 | 2023-11-30 | Regeneron Pharmaceuticals, Inc. | Transcription modulation in animals using CRISPR/Cas systems |
KR20200141470A (ko) | 2018-04-06 | 2020-12-18 | 칠드런'즈 메디컬 센터 코포레이션 | 체세포 재프로그래밍 및 각인의 조정을 위한 조성물 및 방법 |
WO2019204378A1 (en) | 2018-04-17 | 2019-10-24 | The General Hospital Corporation | Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents |
EP3781705A4 (en) | 2018-04-19 | 2022-01-26 | The Regents of the University of California | COMPOSITIONS AND METHODS FOR GENE EDITING |
WO2019213430A1 (en) * | 2018-05-03 | 2019-11-07 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and methods for nicking target dna sequences |
CN108588123A (zh) * | 2018-05-07 | 2018-09-28 | 南京医科大学 | CRISPR/Cas9载体组合在制备基因敲除猪的血液制品中的应用 |
EP3794130A4 (en) | 2018-05-16 | 2022-07-27 | Synthego Corporation | METHODS AND SYSTEMS FOR DESIGN AND USE OF GUIDE RNA |
CN110592141B (zh) * | 2018-06-13 | 2023-07-07 | 中国科学院上海有机化学研究所 | 用于调控基因编辑效率的化合物及其应用 |
US10227576B1 (en) | 2018-06-13 | 2019-03-12 | Caribou Biosciences, Inc. | Engineered cascade components and cascade complexes |
US20210285009A1 (en) | 2018-07-13 | 2021-09-16 | The Regents Of The University Of California | Retrotransposon-based delivery vehicle and methods of use thereof |
KR20210044795A (ko) | 2018-08-15 | 2021-04-23 | 지머젠 인코포레이티드 | 고 처리량 대사 공학에서 CRISPRi의 응용 |
AU2019326408A1 (en) | 2018-08-23 | 2021-03-11 | Sangamo Therapeutics, Inc. | Engineered target specific base editors |
JP2021536250A (ja) | 2018-09-07 | 2021-12-27 | アストラゼネカ・アクチエボラーグAstrazeneca Aktiebolag | 改善されたヌクレアーゼのための組成物及び方法 |
US10711267B2 (en) | 2018-10-01 | 2020-07-14 | North Carolina State University | Recombinant type I CRISPR-Cas system |
US11407995B1 (en) | 2018-10-26 | 2022-08-09 | Inari Agriculture Technology, Inc. | RNA-guided nucleases and DNA binding proteins |
US11434477B1 (en) | 2018-11-02 | 2022-09-06 | Inari Agriculture Technology, Inc. | RNA-guided nucleases and DNA binding proteins |
US11739320B2 (en) | 2018-11-05 | 2023-08-29 | Wisconsin Alumni Research Foundation | Gene correction of Pompe disease and other autosomal recessive disorders via RNA-guided nucleases |
CA3117228A1 (en) | 2018-12-14 | 2020-06-18 | Pioneer Hi-Bred International, Inc. | Novel crispr-cas systems for genome editing |
CN116064550A (zh) | 2018-12-20 | 2023-05-05 | 瑞泽恩制药公司 | 核酸酶介导的重复扩增 |
EP3911746A1 (en) | 2019-01-14 | 2021-11-24 | Institut National de la Santé et de la Recherche Médicale (INSERM) | Methods and kits for generating and selecting a variant of a binding protein with increased binding affinity and/or specificity |
US11946040B2 (en) | 2019-02-04 | 2024-04-02 | The General Hospital Corporation | Adenine DNA base editor variants with reduced off-target RNA editing |
WO2020163856A1 (en) | 2019-02-10 | 2020-08-13 | The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone | Modified mitochondrion and methods of use thereof |
WO2020181101A1 (en) | 2019-03-07 | 2020-09-10 | The Regents Of The University Of California | Crispr-cas effector polypeptides and methods of use thereof |
CA3127814C (en) | 2019-03-18 | 2024-05-14 | Regeneron Pharmaceuticals, Inc. | Crispr/cas dropout screening platform to reveal genetic vulnerabilities associated with tau aggregation |
SG11202108091YA (en) | 2019-03-18 | 2021-08-30 | Regeneron Pharma | Crispr/cas screening platform to identify genetic modifiers of tau seeding or aggregation |
DE112020001306T5 (de) | 2019-03-19 | 2022-01-27 | Massachusetts Institute Of Technology | Verfahren und zusammensetzungen zur editierung von nukleotidsequenzen |
SG11202108451VA (en) | 2019-04-03 | 2021-09-29 | Regeneron Pharma | Methods and compositions for insertion of antibody coding sequences into a safe harbor locus |
CN117178959A (zh) | 2019-04-04 | 2023-12-08 | 瑞泽恩制药公司 | 包括人源化凝血因子12基因座的非人动物 |
KR102487901B1 (ko) | 2019-04-04 | 2023-01-12 | 리제너론 파마슈티칼스 인코포레이티드 | 표적화된 변형의 표적화 벡터로의 무흔적 도입을 위한 방법 |
WO2020208185A1 (en) | 2019-04-12 | 2020-10-15 | Astrazeneca Ab | Compositions and methods for improved gene editing |
AU2020286382A1 (en) | 2019-06-04 | 2021-11-04 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized TTR locus with a beta-slip mutation and methods of use |
CA3137764A1 (en) | 2019-06-07 | 2020-12-10 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized albumin locus |
US11845957B2 (en) | 2019-06-14 | 2023-12-19 | Regeneron Pharmaceuticals, Inc. | Models of tauopathy |
EP3783104A1 (en) * | 2019-08-20 | 2021-02-24 | Kemijski Institut | Coiled-coil mediated tethering of crispr-cas and exonucleases for enhanced genome editing |
CA3153980A1 (en) | 2019-09-13 | 2021-03-18 | Regeneron Pharmaceuticals, Inc. | Transcription modulation in animals using crispr/cas systems delivered by lipid nanoparticles |
CA3147643A1 (en) | 2019-09-23 | 2021-04-01 | Omega Therapeutics, Inc. | Compositions and methods for modulating hepatocyte nuclear factor 4-alpha (hnf4.alpha.) gene expression |
EP3812472B1 (en) | 2019-10-21 | 2022-11-23 | Albert-Ludwigs-Universität Freiburg | A truly unbiased in vitro assay to profile off-target activity of one or more target-specific programmable nucleases in cells (abnoba-seq) |
US11331333B2 (en) | 2019-11-08 | 2022-05-17 | Georg-August-Universität Göttingen Stiftung Öffentichen Rechts, Universitätsmadizin | Treatment of aberrant fibroblast proliferation |
MX2022005572A (es) | 2019-11-08 | 2022-06-09 | Regeneron Pharma | Estrategias crispr y aav para la terapia de retinosquisis juvenil ligada al cromosoma x. |
WO2021108363A1 (en) | 2019-11-25 | 2021-06-03 | Regeneron Pharmaceuticals, Inc. | Crispr/cas-mediated upregulation of humanized ttr allele |
US20230042198A1 (en) * | 2019-11-25 | 2023-02-09 | La Jolla Institute For Immunology | Methods and Compositions for Modulationg Heterochromatin Dysfunction, Genomic Instability, and Associate Conditions |
AU2020401206A1 (en) | 2019-12-11 | 2022-07-14 | Intellia Therapeutics, Inc. | Modified guide RNAs for gene editing |
CN111088357B (zh) * | 2019-12-31 | 2022-09-20 | 深圳大学 | 针对escc的肿瘤标志物及其应用 |
EP4093864A4 (en) * | 2020-01-24 | 2024-04-10 | The General Hospital Corporation | UNCONSTRAINED GENOME TARGETING WITH GENETICALLY MODIFIED CRISPR-CAS9 VARIANTS NEARLY PAM-FREE |
EP4093863A4 (en) * | 2020-01-24 | 2024-04-10 | The General Hospital Corporation | CRISPR-CAS ENZYMES WITH IMPROVED ON-TARGET ACTIVITY |
JP2023515671A (ja) | 2020-03-04 | 2023-04-13 | リジェネロン・ファーマシューティカルズ・インコーポレイテッド | 免疫療法に対する腫瘍細胞の感作のための方法及び組成物 |
WO2021195079A1 (en) | 2020-03-23 | 2021-09-30 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use |
US12029795B2 (en) * | 2020-04-09 | 2024-07-09 | Verve Therapeutics, Inc. | Base editing of PCSK9 and methods of using same for treatment of disease |
CA3182286A1 (en) * | 2020-05-04 | 2021-11-11 | Editas Medicine, Inc. | Selection by essential-gene knock-in |
EP4146797A1 (en) | 2020-05-06 | 2023-03-15 | Orchard Therapeutics (Europe) Limited | Treatment for neurodegenerative diseases |
JP2023525304A (ja) | 2020-05-08 | 2023-06-15 | ザ ブロード インスティテュート,インコーポレーテッド | 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物 |
JP2023526007A (ja) | 2020-05-13 | 2023-06-20 | アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル | β-ヘモグロビン異常症の処置のための塩基編集アプローチ |
WO2021246165A1 (ja) * | 2020-06-03 | 2021-12-09 | 国立大学法人広島大学 | Oasis遺伝子の脱メチル化のための核酸及びそれを用いた脱メチル化方法 |
US20230235315A1 (en) | 2020-07-10 | 2023-07-27 | Horizon Discovery Limited | Method for producing genetically modified cells |
US20230293726A1 (en) | 2020-08-11 | 2023-09-21 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Method for the treatment of wwox associated diseases |
KR102674574B1 (ko) * | 2020-09-02 | 2024-06-13 | 한국과학기술연구원 | Cas9을 위한 신규 tracrRNA 시스템 |
JP2023549042A (ja) | 2020-10-13 | 2023-11-22 | サントル ナショナル ドゥ ラ ルシェルシュ シアンティフィック | 接合およびcrispr/casシステムを組み合わせた標的抗菌性プラスミド並びにその使用 |
CN112430622A (zh) * | 2020-10-26 | 2021-03-02 | 扬州大学 | 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法 |
RU2762831C1 (ru) * | 2020-10-26 | 2021-12-23 | Федеральное государственное бюджетное научное учреждение "Всероссийский научно-исследовательский институт сельскохозяйственной биотехнологии" (ФГБНУ ВНИИСБ) | Молекула рнк-проводника для геномного редактирования протомоторной области гена vrn-a1 однодольных зерновых с применением системы crispr/cas9 |
WO2022120022A1 (en) | 2020-12-02 | 2022-06-09 | Regeneron Pharmaceuticals, Inc. | Crispr sam biosensor cell lines and methods of use thereof |
KR20220082186A (ko) | 2020-12-10 | 2022-06-17 | 한세준 | 유,무선 충전이 가능한 보조배터리형 uv-led살균기 |
JP2024501757A (ja) | 2021-01-05 | 2024-01-15 | ホライズン・ディスカバリー・リミテッド | 遺伝子組換え細胞の製造方法 |
WO2022180153A1 (en) | 2021-02-25 | 2022-09-01 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Allele-specific genome editing of the nr2e3 mutation g56r |
KR20220124652A (ko) | 2021-03-03 | 2022-09-14 | 중앙대학교 산학협력단 | CRISPR/Cas9 시스템을 이용한 유전체 단일염기 편집 방법 및 이의 용도 |
CN113846019B (zh) * | 2021-03-05 | 2023-08-01 | 海南师范大学 | 一种海洋微拟球藻靶向表观基因组遗传调控方法 |
EP4095243A1 (en) | 2021-05-25 | 2022-11-30 | European Molecular Biology Laboratory | System for hybridization-based precision genome cleavage and editing, and uses thereof |
EP4347805A1 (en) | 2021-05-27 | 2024-04-10 | Astrazeneca AB | Cas9 effector proteins with enhanced stability |
KR20240032013A (ko) | 2021-06-10 | 2024-03-08 | 인텔리아 테라퓨틱스, 인크. | 유전자 편집을 위한 내부 링커를 포함하는 변형된 가이드 rna |
US20240254483A1 (en) | 2021-07-30 | 2024-08-01 | Tune Therapeutics, Inc. | Compositions and methods for modulating expression of frataxin (fxn) |
CA3227105A1 (en) | 2021-07-30 | 2023-02-02 | Tune Therapeutics, Inc. | Compositions and methods for modulating expression of methyl-cpg binding protein 2 (mecp2) |
CA3229450A1 (en) | 2021-08-20 | 2023-02-23 | Wisconsin Alumni Research Foundation | Nonviral generation of genome edited chimeric antigen receptor t cells |
CA3230927A1 (en) | 2021-09-10 | 2023-03-16 | Agilent Technologies, Inc. | Guide rnas with chemical modification for prime editing |
EP4409000A1 (en) | 2021-09-28 | 2024-08-07 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Base editing approaches for the treatment of beta-hemoglobinopathies |
WO2023052508A2 (en) | 2021-09-30 | 2023-04-06 | Astrazeneca Ab | Use of inhibitors to increase efficiency of crispr/cas insertions |
WO2023064928A2 (en) | 2021-10-14 | 2023-04-20 | Arsenal Biosciences, Inc. | Immune cells having co-expressed shrnas and logic gate systems |
AU2022368907A1 (en) | 2021-10-20 | 2024-05-02 | University Of Copenhagen | Rejuvenation treatment of age-related white matter loss |
WO2023077053A2 (en) | 2021-10-28 | 2023-05-04 | Regeneron Pharmaceuticals, Inc. | Crispr/cas-related methods and compositions for knocking out c5 |
WO2023081756A1 (en) | 2021-11-03 | 2023-05-11 | The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone | Precise genome editing using retrons |
CA3237303A1 (en) | 2021-11-03 | 2023-05-11 | Intellia Therapeutics, Inc. | Polynucleotides, compositions, and methods for genome editing |
WO2023099591A1 (en) | 2021-12-01 | 2023-06-08 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Methods for increasing fetal hemoglobin content by editing the +55-kb region of the erythroid-specific bcl11a enhancer |
CA3238939A1 (en) | 2021-12-08 | 2023-06-15 | Gaurang Patel | Mutant myocilin disease model and uses thereof |
US20230279442A1 (en) | 2021-12-15 | 2023-09-07 | Versitech Limited | Engineered cas9-nucleases and method of use thereof |
WO2023137472A2 (en) | 2022-01-14 | 2023-07-20 | Tune Therapeutics, Inc. | Compositions, systems, and methods for programming t cell phenotypes through targeted gene repression |
WO2023137471A1 (en) | 2022-01-14 | 2023-07-20 | Tune Therapeutics, Inc. | Compositions, systems, and methods for programming t cell phenotypes through targeted gene activation |
WO2023141487A1 (en) * | 2022-01-20 | 2023-07-27 | Inari Agriculture Technology, Inc. | Improved soybean explant preparation and transformation |
WO2023141602A2 (en) | 2022-01-21 | 2023-07-27 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2023144104A1 (en) | 2022-01-25 | 2023-08-03 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Base editing approaches for the treatment of βeta-thalassemia |
WO2023150620A1 (en) | 2022-02-02 | 2023-08-10 | Regeneron Pharmaceuticals, Inc. | Crispr-mediated transgene insertion in neonatal cells |
WO2023152351A1 (en) | 2022-02-14 | 2023-08-17 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Treatment of liver cancers by disrupting the beta-catenin/tcf-4 binding site located upstream of meg3 in the dlk1/dio3 locus |
WO2023212677A2 (en) | 2022-04-29 | 2023-11-02 | Regeneron Pharmaceuticals, Inc. | Identification of tissue-specific extragenic safe harbors for gene therapy approaches |
WO2023220603A1 (en) | 2022-05-09 | 2023-11-16 | Regeneron Pharmaceuticals, Inc. | Vectors and methods for in vivo antibody production |
WO2023217888A1 (en) | 2022-05-10 | 2023-11-16 | Institut National de la Santé et de la Recherche Médicale | Base editing approaches for correcting the cd39 (cag>tag) mutation in patients suffering from βeta-thalassemia |
WO2023235726A2 (en) | 2022-05-31 | 2023-12-07 | Regeneron Pharmaceuticals, Inc. | Crispr interference therapeutics for c9orf72 repeat expansion disease |
WO2023235725A2 (en) | 2022-05-31 | 2023-12-07 | Regeneron Pharmaceuticals, Inc. | Crispr-based therapeutics for c9orf72 repeat expansion disease |
WO2023250511A2 (en) | 2022-06-24 | 2023-12-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression |
WO2024015881A2 (en) | 2022-07-12 | 2024-01-18 | Tune Therapeutics, Inc. | Compositions, systems, and methods for targeted transcriptional activation |
WO2024020346A2 (en) | 2022-07-18 | 2024-01-25 | Renagade Therapeutics Management Inc. | Gene editing components, systems, and methods of use |
WO2024018056A1 (en) | 2022-07-22 | 2024-01-25 | Institut National de la Santé et de la Recherche Médicale | Base editing approaches for correcting the ivs2-1 (g>a) mutation in patients suffering from βeta-thalassemia |
WO2024026474A1 (en) | 2022-07-29 | 2024-02-01 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle |
US20240067969A1 (en) | 2022-08-19 | 2024-02-29 | Tune Therapeutics, Inc. | Compositions, systems, and methods for regulation of hepatitis b virus through targeted gene repression |
WO2024044723A1 (en) | 2022-08-25 | 2024-02-29 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2024047247A1 (en) | 2022-09-02 | 2024-03-07 | Institut National de la Santé et de la Recherche Médicale | Base editing approaches for the treatment of amyotrophic lateral sclerosis |
WO2024064642A2 (en) | 2022-09-19 | 2024-03-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for modulating t cell function |
WO2024073606A1 (en) | 2022-09-28 | 2024-04-04 | Regeneron Pharmaceuticals, Inc. | Antibody resistant modified receptors to enhance cell-based therapies |
WO2024084025A1 (en) | 2022-10-21 | 2024-04-25 | Keygene N.V. | Rna transfection in plant cells with modified rna |
US20240182561A1 (en) | 2022-11-04 | 2024-06-06 | Regeneron Pharmaceuticals, Inc. | Calcium voltage-gated channel auxiliary subunit gamma 1 (cacng1) binding proteins and cacng1-mediated delivery to skeletal muscle |
WO2024107765A2 (en) | 2022-11-14 | 2024-05-23 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes |
CN115820603B (zh) * | 2022-11-15 | 2024-07-05 | 吉林大学 | 一种基于dCasRx-NSUN6单基因特异性M5C修饰编辑方法 |
WO2024121354A1 (en) | 2022-12-08 | 2024-06-13 | Keygene N.V. | Duplex sequencing with covalently closed dna ends |
WO2024131940A1 (zh) * | 2022-12-23 | 2024-06-27 | 益杰立科(上海)生物科技有限公司 | 融合物及其用途 |
WO2024163678A2 (en) | 2023-02-01 | 2024-08-08 | Tune Therapeutics, Inc. | Fusion proteins and systems for targeted activation of frataxin (fxn) and related methods |
WO2024163683A2 (en) | 2023-02-01 | 2024-08-08 | Tune Therapeutics, Inc. | Systems, compositions, and methods for modulating expression of methyl-cpg binding protein 2 (mecp2) and x-inactive specific transcript (xist) |
WO2024165484A1 (en) | 2023-02-06 | 2024-08-15 | Institut National de la Santé et de la Recherche Médicale | Enrichment of genetically modified hematopoietic stem cells through multiplex base editing |
CN116376975B (zh) * | 2023-02-27 | 2024-05-14 | 中国科学院脑科学与智能技术卓越创新中心 | 激活异染色质基因的方法及应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070020627A1 (en) * | 2002-06-11 | 2007-01-25 | The Scripps Research Institute | Artificial transcription factors |
US20110236894A1 (en) * | 2008-09-26 | 2011-09-29 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
Family Cites Families (164)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4603044A (en) | 1983-01-06 | 1986-07-29 | Technology Unlimited, Inc. | Hepatocyte Directed Vesicle delivery system |
US4957773A (en) | 1989-02-13 | 1990-09-18 | Syracuse University | Deposition of boron-containing films from decaborane |
US5436150A (en) | 1992-04-03 | 1995-07-25 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease |
JP4118327B2 (ja) | 1994-08-20 | 2008-07-16 | ゲンダック・リミテッド | Dna認識のための結合タンパク質におけるまたはそれに関連する改良 |
US20030017149A1 (en) | 1996-10-10 | 2003-01-23 | Hoeffler James P. | Single chain monoclonal antibody fusion reagents that regulate transcription in vivo |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US20020164575A1 (en) | 1999-09-14 | 2002-11-07 | Sangamo Biosciences, Inc., A Delaware Corporation | Gene identification |
EP1236045B1 (en) | 1999-12-06 | 2005-11-09 | Sangamo Biosciences Inc. | Methods of using randomized libraries of zinc finger proteins for the identification of gene function |
WO2001083793A2 (en) | 2000-04-28 | 2001-11-08 | Sangamo Biosciences, Inc. | Targeted modification of chromatin structure |
AU2001257331A1 (en) | 2000-04-28 | 2001-11-12 | Sangamo Biosciences, Inc. | Methods for designing exogenous regulatory molecules |
US20030198627A1 (en) | 2001-09-01 | 2003-10-23 | Gert-Jan Arts | siRNA knockout assay method and constructs |
AU2003219847A1 (en) | 2002-02-21 | 2003-09-09 | The Wistar Institute Of Anatomy And Biology | Methods and compositions for reversibly controlling expression of target genes in cells |
WO2004099366A2 (en) | 2002-10-23 | 2004-11-18 | The General Hospital Corporation | Context sensitive parallel optimization of zinc finger dna binding domains |
US20070134796A1 (en) | 2005-07-26 | 2007-06-14 | Sangamo Biosciences, Inc. | Targeted integration and expression of exogenous nucleic acid sequences |
US7021555B2 (en) | 2004-01-06 | 2006-04-04 | Zoo Med Laboratories, Inc. | Spraying/misting for plants and animals |
US7919277B2 (en) | 2004-04-28 | 2011-04-05 | Danisco A/S | Detection and typing of bacterial strains |
PL1858920T3 (pl) | 2005-02-18 | 2016-12-30 | Białka i kwasy nukleinowe z Escherichia coli związane z zapaleniem opon mózgowych/sepsą | |
WO2007014181A2 (en) | 2005-07-25 | 2007-02-01 | Johns Hopkins University | Site-specific modification of the human genome using custom-designed zinc finger nucleases |
ATE473637T1 (de) * | 2005-08-26 | 2010-07-15 | Danisco | Verwendung der crispr assoziierten gene (cas) |
US7833784B2 (en) | 2005-11-28 | 2010-11-16 | The Scripps Research Institute | Zinc finger binding domains for TNN |
EP2426220B1 (en) | 2006-05-19 | 2016-06-22 | DuPont Nutrition Biosciences ApS | Tagged microorganisms and methods of tagging |
AU2007267887B2 (en) | 2006-05-25 | 2013-05-30 | Sangamo Therapeutics, Inc. | Variant Foki Cleavage Half-Domains |
AU2007258872A1 (en) | 2006-06-16 | 2007-12-21 | Danisco A/S | Bacterium |
US9201063B2 (en) | 2006-11-16 | 2015-12-01 | General Electric Company | Sequential analysis of biological samples |
WO2008093152A1 (en) * | 2007-02-01 | 2008-08-07 | Cellectis | Obligate heterodimer meganucleases and uses thereof |
ES2541693T3 (es) | 2007-03-02 | 2015-07-23 | Dupont Nutrition Biosciences Aps | Cultivos con resistencia mejorada a fagos |
WO2008118394A1 (en) | 2007-03-23 | 2008-10-02 | New York University | Methods of affecting nitrogen assimilation in plants |
JP5258874B2 (ja) | 2007-04-10 | 2013-08-07 | キアゲン ゲゼルシャフト ミット ベシュレンクテル ハフツング | Rna干渉タグ |
WO2008151032A2 (en) | 2007-05-31 | 2008-12-11 | Washington University In St. Louis | Arrays and methods comprising m. smithii gene products |
MX2010003321A (es) | 2007-09-25 | 2010-08-03 | Pastoral Greenhouse Gas Res Lt | Polipeptidos y polinucleotidos del fago qmru y sus usos. |
FR2925918A1 (fr) | 2007-12-28 | 2009-07-03 | Pasteur Institut | Typage et sous-typage moleculaire de salmonella par identification des sequences nucleotidiques variables des loci crispr |
FR2930264B1 (fr) | 2008-04-18 | 2013-02-22 | Gervais Danone Sa | Nouvelle souche de lactobacillus paracasei subsp. paracasei dotee de proprietes antimicrobiennes et immunomodulatrices. |
JP2010017178A (ja) | 2008-06-11 | 2010-01-28 | Sumitomo Chemical Co Ltd | Dnaを定量又は検出する方法 |
JP2010017179A (ja) | 2008-06-11 | 2010-01-28 | Sumitomo Chemical Co Ltd | Dnaを定量又は検出する方法 |
US8546553B2 (en) | 2008-07-25 | 2013-10-01 | University Of Georgia Research Foundation, Inc. | Prokaryotic RNAi-like system and methods of use |
JP2010048566A (ja) | 2008-08-19 | 2010-03-04 | Sumitomo Chemical Co Ltd | Dnaを定量又は検出する方法 |
JP2010068800A (ja) | 2008-08-19 | 2010-04-02 | Sumitomo Chemical Co Ltd | Dnaを定量又は検出する方法 |
US20100076057A1 (en) | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
NZ592994A (en) | 2008-10-21 | 2012-12-21 | Animal Health Trust | Diagnostic test for Streptococcus equi comprising assessing the presence or absence of the S. equi eqbE gene |
WO2010046493A2 (en) | 2008-10-23 | 2010-04-29 | Université de Lausanne | Gene transfer vectors comprising at least one isolated dna molecule having insulator and or boundary properties and methods to identify the same |
WO2010054108A2 (en) | 2008-11-06 | 2010-05-14 | University Of Georgia Research Foundation, Inc. | Cas6 polypeptides and methods of use |
MX337838B (es) | 2008-11-07 | 2016-03-22 | Dupont Nutrition Biosci Aps | Secuencias de repetidos palindromicos cortos regularmente intercalados agrupados de bifidobacterias. |
ES2566496T3 (es) | 2008-11-11 | 2016-04-13 | Alimentary Health Limited | Bifidobacterium longum |
GB2466177A (en) | 2008-12-03 | 2010-06-16 | Arab Science & Technology Found | Bacteriophage selection and breeding |
US8771766B2 (en) | 2008-12-12 | 2014-07-08 | Dupont Nutrition Biosciences Aps | Genetic cluster of strains of Streptococcus thermophilus having unique rheological properties for dairy fermentation |
KR20100093626A (ko) | 2009-02-17 | 2010-08-26 | 서강대학교산학협력단 | 슈도모나스 애루지노사에 대한 파아지 치료 |
EP2414524B1 (en) | 2009-04-03 | 2017-08-23 | Centre National De La Recherche Scientifique | Gene transfer vectors comprising genetic insulator elements and methods to identify genetic insulator elements |
AU2010245304B2 (en) | 2009-04-27 | 2015-06-04 | Pacific Biosciences Of California, Inc. | Real-time sequencing methods and systems |
WO2010144151A2 (en) | 2009-06-12 | 2010-12-16 | Pacific Biosciences Of California, Inc. | Single-molecule real-time analysis of protein synthesis |
WO2011017293A2 (en) | 2009-08-03 | 2011-02-10 | The General Hospital Corporation | Engineering of zinc finger arrays by context-dependent assembly |
CN102648282A (zh) | 2009-09-25 | 2012-08-22 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物和用于产生该植物的方法 |
US9677125B2 (en) | 2009-10-21 | 2017-06-13 | General Electric Company | Detection of plurality of targets in biological samples |
US20110269119A1 (en) | 2009-10-30 | 2011-11-03 | Synthetic Genomics, Inc. | Encoding text into nucleic acid sequences |
ES2751916T3 (es) | 2010-02-08 | 2020-04-02 | Sangamo Therapeutics Inc | Semidominios de escisión genomanipulados |
WO2011101696A1 (en) * | 2010-02-18 | 2011-08-25 | Cellectis | Improved meganuclease recombination system |
US20120027786A1 (en) | 2010-02-23 | 2012-02-02 | Massachusetts Institute Of Technology | Genetically programmable pathogen sense and destroy |
US10087431B2 (en) | 2010-03-10 | 2018-10-02 | The Regents Of The University Of California | Methods of generating nucleic acid fragments |
US10645934B2 (en) | 2010-03-12 | 2020-05-12 | Brookhaven Science Associates/Brookhaven National Laboratory | Enterobacter sp-638 and methods of use thereof |
JP5926242B2 (ja) | 2010-05-10 | 2016-05-25 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | エンドリボヌクレアーゼ組成物およびその使用方法 |
CA2802360A1 (en) | 2010-06-14 | 2011-12-22 | Iowa State University Research Foundation, Inc. | Nuclease activity of tal effector and foki fusion protein |
WO2012047726A1 (en) | 2010-09-29 | 2012-04-12 | The Broad Institute, Inc. | Methods for chromatin immuno-precipitations |
US9951341B2 (en) | 2010-10-20 | 2018-04-24 | Dupont Nutrition Biosciences Aps | Lactococcus CRISPR-Cas sequences |
AU2011319725A1 (en) | 2010-10-27 | 2013-05-30 | Cellectis | Method for increasing the efficiency of double-strand break-induced mutagenesis |
WO2012093833A2 (en) * | 2011-01-03 | 2012-07-12 | Toolgen Incorporation | Genome engineering via designed tal effector nucleases |
US20120214160A1 (en) | 2011-01-14 | 2012-08-23 | Life Technologies Corporation | Methods, compositions, and kits for detecting rare cells |
US20140113376A1 (en) | 2011-06-01 | 2014-04-24 | Rotem Sorek | Compositions and methods for downregulating prokaryotic genes |
DK2543255T4 (da) | 2011-07-04 | 2023-03-20 | Dsm Ip Assets Bv | Antilisteriel blandet kultur og fremgangsmåde til fremstilling af ost |
AU2012284365B2 (en) | 2011-07-15 | 2017-04-20 | The General Hospital Corporation | Methods of transcription activator like effector assembly |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
EP3272356A1 (en) | 2012-02-24 | 2018-01-24 | Fred Hutchinson Cancer Research Center | Compositions and methods for the treatment of hemoglobinopathies |
MX359327B (es) | 2012-02-29 | 2018-09-25 | Sangamo Biosciences Inc | Composiciones y sus usos para tratar y prevenir la enfermedad de huntington. |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
US9523098B2 (en) | 2012-05-02 | 2016-12-20 | Dow Agrosciences Llc | Targeted modification of malate dehydrogenase |
EP2847338B1 (en) | 2012-05-07 | 2018-09-19 | Sangamo Therapeutics, Inc. | Methods and compositions for nuclease-mediated targeted integration of transgenes |
US11120889B2 (en) | 2012-05-09 | 2021-09-14 | Georgia Tech Research Corporation | Method for synthesizing a nuclease with reduced off-site cleavage |
TR201806812T4 (tr) | 2012-05-25 | 2018-06-21 | Charpentier Emmanuelle | Rna-yönlendirmeli hedef dna modifikasyonu için ve rna-yönlendirmeli transkripsiyon modifikasyonu için yöntemler ve bileşimler. |
WO2013188037A2 (en) | 2012-06-11 | 2013-12-19 | Agilent Technologies, Inc | Method of adaptor-dimer subtraction using a crispr cas6 protein |
EP2674501A1 (en) | 2012-06-14 | 2013-12-18 | Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail | Method for detecting and identifying enterohemorrhagic Escherichia coli |
US10025647B2 (en) * | 2012-06-30 | 2018-07-17 | Intel Corporation | Memory poisoning with hints |
EP2872154B1 (en) | 2012-07-11 | 2017-05-31 | Sangamo BioSciences, Inc. | Methods and compositions for delivery of biologics |
CA2879997A1 (en) | 2012-07-25 | 2014-01-30 | The Broad Institute, Inc. | Inducible dna binding proteins and genome perturbation tools and applications thereof |
EP3406715B1 (en) | 2012-09-07 | 2023-12-13 | Corteva Agriscience LLC | Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks |
EP2906956B1 (en) | 2012-10-09 | 2020-11-25 | Liposcience, Inc. | Nmr quantification of branched chain amino acids |
US20150267176A1 (en) * | 2012-10-12 | 2015-09-24 | The General Hospital Corporation | Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins |
US20150315576A1 (en) | 2012-11-01 | 2015-11-05 | Massachusetts Institute Of Technology | Genetic device for the controlled destruction of dna |
KR102243092B1 (ko) * | 2012-12-06 | 2021-04-22 | 시그마-알드리치 컴퍼니., 엘엘씨 | Crispr-기초된 유전체 변형과 조절 |
US20140242664A1 (en) * | 2012-12-12 | 2014-08-28 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
EP2931892B1 (en) | 2012-12-12 | 2018-09-12 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
KR20150105956A (ko) | 2012-12-12 | 2015-09-18 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작 및 치료적 적용을 위한 시스템, 방법 및 조성물의 전달, 유전자 조작 및 최적화 |
US20140189896A1 (en) | 2012-12-12 | 2014-07-03 | Feng Zhang | Crispr-cas component systems, methods and compositions for sequence manipulation |
EP2940140B1 (en) | 2012-12-12 | 2019-03-27 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
AU2013359212B2 (en) | 2012-12-12 | 2017-01-19 | Massachusetts Institute Of Technology | Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
DK2931898T3 (en) | 2012-12-12 | 2016-06-20 | Massachusetts Inst Technology | CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS |
WO2014093701A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
CA2893579A1 (en) | 2012-12-13 | 2014-06-19 | Dow Agrosciences Llc | Dna detection methods for site specific nuclease activity |
SG10201912991WA (en) | 2012-12-17 | 2020-03-30 | Harvard College | Rna-guided human genome engineering |
CA2895212A1 (en) * | 2012-12-19 | 2014-06-26 | Dow Agrosciences Llc | Improved soybean transformation for efficient and high-throughput transgenic event production |
JP2016507228A (ja) | 2013-01-14 | 2016-03-10 | リコンビネティクス・インコーポレイテッドRecombinetics,Inc. | 無角家畜 |
CN103233028B (zh) | 2013-01-25 | 2015-05-13 | 南京徇齐生物技术有限公司 | 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列 |
US20140212869A1 (en) | 2013-01-25 | 2014-07-31 | Agilent Technologies, Inc. | Nucleic Acid Proximity Assay Involving the Formation of a Three-way junction |
WO2014124226A1 (en) | 2013-02-07 | 2014-08-14 | The Rockefeller University | Sequence specific antimicrobials |
EP2954042B1 (en) | 2013-02-07 | 2017-12-06 | The General Hospital Corporation | Tale transcriptional activators |
WO2014127287A1 (en) * | 2013-02-14 | 2014-08-21 | Massachusetts Institute Of Technology | Method for in vivo tergated mutagenesis |
EP2958996B1 (en) | 2013-02-25 | 2019-10-16 | Sangamo Therapeutics, Inc. | Methods and compositions for enhancing nuclease-mediated gene disruption |
WO2014131833A1 (en) | 2013-02-27 | 2014-09-04 | Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) | Gene editing in the oocyte by cas9 nucleases |
BR112015021788B1 (pt) | 2013-03-08 | 2023-02-28 | Oxford Nanopore Technologies Plc | Métodos para mover uma ou mais helicases imobilizadas, para controlar o movimento de um polinucleotídeo alvo, para caracterizar um polinucleotídeo alvo e para controlar o carregamento de uma ou mais helicases em um polinucleotídeo alvo, uso de um poro de transmembrana e de um potencial aplicado e de um ou mais espaçadores, complexo, e, kit |
US10612043B2 (en) | 2013-03-09 | 2020-04-07 | Agilent Technologies, Inc. | Methods of in vivo engineering of large sequences using multiple CRISPR/cas selections of recombineering events |
NZ712727A (en) | 2013-03-14 | 2017-05-26 | Caribou Biosciences Inc | Compositions and methods of nucleic acid-targeting nucleic acids |
WO2014144592A2 (en) | 2013-03-15 | 2014-09-18 | The General Hospital Corporation | Using truncated guide rnas (tru-grnas) to increase specificity for rna-guided genome editing |
US11332719B2 (en) | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
US20140273230A1 (en) | 2013-03-15 | 2014-09-18 | Sigma-Aldrich Co., Llc | Crispr-based genome modification and regulation |
US20140349400A1 (en) | 2013-03-15 | 2014-11-27 | Massachusetts Institute Of Technology | Programmable Modification of DNA |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
CN105209624A (zh) | 2013-03-15 | 2015-12-30 | 明尼苏达大学董事会 | 采用CRISPR/Cas系统的植物基因组的工程改造 |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
AU2014248208C1 (en) | 2013-04-05 | 2023-04-27 | Corteva Agriscience Llc | Methods and compositions for integration of an exogenous sequence within the genome of plants |
US20150056629A1 (en) | 2013-04-14 | 2015-02-26 | Katriona Guthrie-Honea | Compositions, systems, and methods for detecting a DNA sequence |
SG11201508028QA (en) | 2013-04-16 | 2015-10-29 | Regeneron Pharma | Targeted modification of rat genome |
CN103224947B (zh) | 2013-04-28 | 2015-06-10 | 陕西师范大学 | 一种基因打靶系统 |
EP2994531B1 (en) | 2013-05-10 | 2018-03-28 | Sangamo Therapeutics, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
US11414695B2 (en) | 2013-05-29 | 2022-08-16 | Agilent Technologies, Inc. | Nucleic acid enrichment using Cas9 |
US20150067922A1 (en) | 2013-05-30 | 2015-03-05 | The Penn State Research Foundation | Gene targeting and genetic modification of plants via rna-guided genome editing |
US20150315252A1 (en) | 2013-06-11 | 2015-11-05 | Clontech Laboratories, Inc. | Protein enriched microvesicles and methods of making and using the same |
KR20160044457A (ko) | 2013-06-17 | 2016-04-25 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 탠덤 안내 시스템, 방법 및 조성물의 전달, 조작 및 최적화 |
US10011850B2 (en) | 2013-06-21 | 2018-07-03 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing |
CN103343120B (zh) | 2013-07-04 | 2015-03-04 | 中国科学院遗传与发育生物学研究所 | 一种小麦基因组定点改造方法 |
WO2015010114A1 (en) | 2013-07-19 | 2015-01-22 | Larix Bioscience, Llc | Methods and compositions for producing double allele knock outs |
US20150044772A1 (en) | 2013-08-09 | 2015-02-12 | Sage Labs, Inc. | Crispr/cas system-based novel fusion protein and its applications in genome editing |
AU2014312123A1 (en) | 2013-08-29 | 2016-03-17 | Temple University Of The Commonwealth System Of Higher Education | Methods and compositions for RNA-guided treatment of HIV infection |
EP3636750A1 (en) | 2013-09-04 | 2020-04-15 | Csir | Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9074199B1 (en) | 2013-11-19 | 2015-07-07 | President And Fellows Of Harvard College | Mutant Cas9 proteins |
CA2933433C (en) | 2013-12-11 | 2020-11-17 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for the targeted modification of a genome |
KR20160089526A (ko) | 2013-12-12 | 2016-07-27 | 더 브로드 인스티튜트, 인코퍼레이티드 | 입자 전달 성분을 이용한 표적 장애 및 질병에 대한 crispr-cas 시스템 및 조성물의 전달, 이용 및 치료 적용 |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
US20150191744A1 (en) | 2013-12-17 | 2015-07-09 | University Of Massachusetts | Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling |
EP3090044B1 (en) | 2013-12-26 | 2021-11-03 | The General Hospital Corporation | Multiplex guide rnas |
US20160362688A1 (en) | 2014-02-12 | 2016-12-15 | Thomas Jefferson University | Compositions and methods of using microrna inhibitors |
EP3116997B1 (en) | 2014-03-10 | 2019-05-15 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10) |
AU2015229227B2 (en) | 2014-03-14 | 2021-03-18 | University Of Washington | Genomic insulator elements and uses thereof |
WO2015139139A1 (en) | 2014-03-20 | 2015-09-24 | UNIVERSITé LAVAL | Crispr-based methods and products for increasing frataxin levels and uses thereof |
US20170022499A1 (en) | 2014-04-03 | 2017-01-26 | Massachusetts Institute Of Techology | Methods and compositions for the production of guide rna |
AU2015342749B2 (en) | 2014-11-07 | 2022-01-27 | Editas Medicine, Inc. | Methods for improving CRISPR/Cas-mediated genome-editing |
MA41349A (fr) | 2015-01-14 | 2017-11-21 | Univ Temple | Éradication de l'herpès simplex de type i et d'autres virus de l'herpès associés guidée par arn |
MX2017009506A (es) | 2015-01-28 | 2017-11-02 | Pioneer Hi Bred Int | Polinucleotidos de acido desoxirribonucleico (adn)/acido ribonucleico (arn) hibridos de repeticiones palindromicas cortas agrupadas regularmente separadas (crispr) y sus metodos de uso. |
KR102605464B1 (ko) | 2015-01-30 | 2023-11-22 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | 일차 조혈 세포에서의 단백질 전달 |
US10676726B2 (en) | 2015-02-09 | 2020-06-09 | Duke University | Compositions and methods for epigenome editing |
EP3265559B1 (en) | 2015-03-03 | 2021-01-06 | The General Hospital Corporation | Engineered crispr-cas9 nucleases with altered pam specificity |
US20180148711A1 (en) | 2015-05-28 | 2018-05-31 | Coda Biotherapeutics, Inc. | Genome editing vectors |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
WO2017031370A1 (en) | 2015-08-18 | 2017-02-23 | The Broad Institute, Inc. | Methods and compositions for altering function and structure of chromatin loops and/or domains |
US9512446B1 (en) | 2015-08-28 | 2016-12-06 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
JP6799586B2 (ja) | 2015-08-28 | 2020-12-16 | ザ ジェネラル ホスピタル コーポレイション | 遺伝子操作CRISPR−Cas9ヌクレアーゼ |
KR20190067209A (ko) | 2016-10-14 | 2019-06-14 | 더 제너럴 하스피탈 코포레이션 | 후성적으로 조절되는 부위-특이적 뉴클레아제 |
WO2018148256A1 (en) | 2017-02-07 | 2018-08-16 | The Regents Of The University Of California | Gene therapy for haploinsufficiency |
CA3059208A1 (en) | 2017-04-21 | 2018-10-25 | The General Hospital Corporation | Inducible, tunable, and multiplex human gene regulation using crispr-cpf1 |
WO2019222670A1 (en) | 2018-05-17 | 2019-11-21 | The General Hospital Corporation | Ccctc-binding factor variants |
CA3163087A1 (en) | 2019-11-27 | 2021-06-03 | The General Hospital Corporation | System and method for activating gene expression |
WO2021243289A1 (en) | 2020-05-29 | 2021-12-02 | The General Hospital Corporation | Systems and methods for stable and heritable alteration by precision editing (shape) |
-
2014
- 2014-03-14 WO PCT/US2014/029068 patent/WO2014144592A2/en active Application Filing
- 2014-03-14 KR KR1020217002427A patent/KR102271291B1/ko active IP Right Grant
- 2014-03-14 IL IL289396A patent/IL289396B2/en unknown
- 2014-03-14 CN CN201480027950.1A patent/CN105247066B/zh active Active
- 2014-03-14 KR KR1020237038728A patent/KR20230157540A/ko active Application Filing
- 2014-03-14 US US14/213,723 patent/US9567604B2/en active Active
- 2014-03-14 ES ES14764159T patent/ES2713503T3/es active Active
- 2014-03-14 EP EP14764159.1A patent/EP2971041B1/en active Active
- 2014-03-14 AU AU2014227653A patent/AU2014227653B2/en active Active
- 2014-03-14 EP EP18208105.9A patent/EP3467125B1/en active Active
- 2014-03-14 CN CN202110709688.0A patent/CN113563476A/zh active Pending
- 2014-03-14 CA CA2906553A patent/CA2906553C/en active Active
- 2014-03-14 JP JP2016502853A patent/JP6622183B2/ja active Active
- 2014-03-14 AU AU2014239665A patent/AU2014239665B2/en active Active
- 2014-03-14 CA CA2907198A patent/CA2907198C/en active Active
- 2014-03-14 BR BR112015023489-5A patent/BR112015023489B1/pt active IP Right Grant
- 2014-03-14 JP JP2016502976A patent/JP6980380B2/ja active Active
- 2014-03-14 WO PCT/US2014/027335 patent/WO2014152432A2/en active Application Filing
- 2014-03-14 AU AU2014228981A patent/AU2014228981B2/en active Active
- 2014-03-14 US US14/775,869 patent/US10378027B2/en active Active
- 2014-03-14 EP EP21151899.8A patent/EP3865586A1/en active Pending
- 2014-03-14 KR KR1020227018265A patent/KR102602047B1/ko active Application Filing
- 2014-03-14 KR KR1020217002429A patent/KR102271292B1/ko active IP Right Grant
- 2014-03-14 CN CN201480026276.5A patent/CN105408483A/zh active Pending
- 2014-03-14 EP EP20172393.9A patent/EP3744842A1/en not_active Withdrawn
- 2014-03-14 CN CN202010996829.7A patent/CN112301024A/zh active Pending
- 2014-03-14 EP EP21197664.2A patent/EP3988667A1/en active Pending
- 2014-03-14 KR KR1020157029177A patent/KR102210322B1/ko active IP Right Grant
- 2014-03-14 KR KR1020157029170A patent/KR102210319B1/ko active IP Right Grant
- 2014-03-14 EP EP14768877.4A patent/EP2970986B1/en active Active
- 2014-03-14 EP EP14764117.9A patent/EP2970208A4/en not_active Withdrawn
- 2014-03-14 US US14/775,930 patent/US10119133B2/en active Active
- 2014-03-14 CA CA3161835A patent/CA3161835A1/en active Pending
- 2014-03-14 KR KR1020217002428A patent/KR102405549B1/ko active IP Right Grant
- 2014-03-14 US US14/213,479 patent/US9567603B2/en active Active
- 2014-03-14 WO PCT/US2014/028630 patent/WO2014144288A1/en active Application Filing
- 2014-03-14 CA CA2906724A patent/CA2906724A1/en active Pending
- 2014-03-14 EP EP14763916.5A patent/EP2971125B2/en active Active
- 2014-03-14 US US14/776,620 patent/US9885033B2/en active Active
- 2014-03-14 CN CN201910766412.9A patent/CN110540991B/zh active Active
- 2014-03-14 EP EP20171165.2A patent/EP3741868B1/en active Active
- 2014-03-14 WO PCT/US2014/029304 patent/WO2014144761A2/en active Application Filing
- 2014-03-14 CN CN201480026133.4A patent/CN105408497B/zh active Active
- 2014-03-14 JP JP2016502406A patent/JP6657069B2/ja active Active
- 2014-03-14 KR KR1020157029171A patent/KR102210323B1/ko active IP Right Grant
-
2015
- 2015-09-15 ZA ZA2015/06814A patent/ZA201506814B/en unknown
- 2015-09-16 IL IL241671A patent/IL241671B/en unknown
-
2017
- 2017-01-25 US US15/415,431 patent/US10138476B2/en active Active
- 2017-02-10 US US15/430,218 patent/US10415059B2/en active Active
- 2017-07-17 AU AU2017204909A patent/AU2017204909B2/en active Active
-
2018
- 2018-01-12 US US15/870,659 patent/US10844403B2/en active Active
- 2018-06-08 US US16/003,973 patent/US10544433B2/en active Active
-
2019
- 2019-07-01 AU AU2019204675A patent/AU2019204675B2/en active Active
- 2019-08-08 US US16/535,199 patent/US11168338B2/en active Active
- 2019-09-16 US US16/572,248 patent/US11634731B2/en active Active
- 2019-09-27 JP JP2019176599A patent/JP6960438B2/ja active Active
- 2019-11-21 JP JP2019210428A patent/JP6878554B2/ja active Active
-
2020
- 2020-01-24 US US16/751,578 patent/US11098326B2/en active Active
- 2020-02-28 AU AU2020201465A patent/AU2020201465B2/en active Active
- 2020-03-26 JP JP2020055863A patent/JP7053706B2/ja active Active
- 2020-07-23 AU AU2020207840A patent/AU2020207840B2/en active Active
- 2020-11-16 US US17/099,503 patent/US11920152B2/en active Active
-
2021
- 2021-04-28 JP JP2021075869A patent/JP7126588B2/ja active Active
- 2021-05-25 AU AU2021203370A patent/AU2021203370B2/en active Active
- 2021-08-27 JP JP2021138479A patent/JP2021192624A/ja active Pending
- 2021-10-06 US US17/450,135 patent/US12065668B2/en active Active
-
2022
- 2022-03-30 JP JP2022056499A patent/JP7379572B2/ja active Active
- 2022-07-27 AU AU2022209254A patent/AU2022209254A1/en active Pending
- 2022-10-13 AU AU2022252788A patent/AU2022252788A1/en active Pending
-
2023
- 2023-01-30 JP JP2023011473A patent/JP2023061983A/ja active Pending
- 2023-03-06 US US18/178,675 patent/US20230407341A1/en active Pending
- 2023-10-31 JP JP2023186663A patent/JP2024012446A/ja active Pending
-
2024
- 2024-01-18 US US18/415,999 patent/US20240240207A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070020627A1 (en) * | 2002-06-11 | 2007-01-25 | The Scripps Research Institute | Artificial transcription factors |
US20110236894A1 (en) * | 2008-09-26 | 2011-09-29 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
Non-Patent Citations (1)
Title |
---|
Cell, Vol.152, pp.1173-1183 (2013.02.28) 1부.* |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102210322B1 (ko) | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 | |
KR102598856B1 (ko) | 변경된 PAM 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제 | |
AU2016274452C1 (en) | Thermostable Cas9 nucleases | |
KR102647766B1 (ko) | 클래스 ii, 타입 v crispr 시스템 | |
US10011850B2 (en) | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing | |
EP3004339B1 (en) | New compact scaffold of cas9 in the type ii crispr system | |
JP2020103295A (ja) | Cas9ターゲッティングをガイドする配列に関する方法および組成物 | |
AU2017339542A1 (en) | S. pyogenes Cas9 mutant genes and polypeptides encoded by same | |
KR20190104344A (ko) | 열안정성 cas9 뉴클레아제 | |
JP2019523005A (ja) | 部位特異的dna開裂及び修復による標的化原位置タンパク質多様化 | |
Class et al. | Patent application title: NEW COMPACT SCAFFOLD OF CAS9 IN THE TYPE II CRISPR SYSTEM Inventors: Philippe Duchateau (Draveil, FR) Philippe Duchateau (Draveil, FR) Claudia Bertonati (Paris, FR) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |