KR20230091894A - 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 - Google Patents
부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 Download PDFInfo
- Publication number
- KR20230091894A KR20230091894A KR1020237013187A KR20237013187A KR20230091894A KR 20230091894 A KR20230091894 A KR 20230091894A KR 1020237013187 A KR1020237013187 A KR 1020237013187A KR 20237013187 A KR20237013187 A KR 20237013187A KR 20230091894 A KR20230091894 A KR 20230091894A
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- site
- integration
- cell
- artificial sequence
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 111
- 230000008685 targeting Effects 0.000 title abstract description 45
- 239000000203 mixture Substances 0.000 title abstract description 15
- 238000010353 genetic engineering Methods 0.000 title abstract description 14
- 230000010354 integration Effects 0.000 claims abstract description 310
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 176
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 150
- 108010061833 Integrases Proteins 0.000 claims abstract description 89
- 238000010348 incorporation Methods 0.000 claims abstract description 6
- 102100034343 Integrase Human genes 0.000 claims abstract 61
- 108020004414 DNA Proteins 0.000 claims description 504
- 210000004027 cell Anatomy 0.000 claims description 204
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 169
- 102000039446 nucleic acids Human genes 0.000 claims description 124
- 108020004707 nucleic acids Proteins 0.000 claims description 124
- 108020005004 Guide RNA Proteins 0.000 claims description 121
- 101710163270 Nuclease Proteins 0.000 claims description 92
- 102000004190 Enzymes Human genes 0.000 claims description 83
- 108090000790 Enzymes Proteins 0.000 claims description 83
- 230000000694 effects Effects 0.000 claims description 76
- 230000004568 DNA-binding Effects 0.000 claims description 70
- 101000607560 Homo sapiens Ubiquitin-conjugating enzyme E2 variant 3 Proteins 0.000 claims description 69
- 102100039936 Ubiquitin-conjugating enzyme E2 variant 3 Human genes 0.000 claims description 69
- 239000013598 vector Substances 0.000 claims description 61
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 56
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 56
- 102000018120 Recombinases Human genes 0.000 claims description 41
- 108010091086 Recombinases Proteins 0.000 claims description 41
- 230000014509 gene expression Effects 0.000 claims description 39
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 38
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 37
- 230000027455 binding Effects 0.000 claims description 36
- 239000013612 plasmid Substances 0.000 claims description 36
- 102000004169 proteins and genes Human genes 0.000 claims description 34
- 230000001413 cellular effect Effects 0.000 claims description 32
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 30
- XMQFTWRPUQYINF-UHFFFAOYSA-N bensulfuron-methyl Chemical compound COC(=O)C1=CC=CC=C1CS(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 XMQFTWRPUQYINF-UHFFFAOYSA-N 0.000 claims description 24
- 230000000295 complement effect Effects 0.000 claims description 23
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 18
- 230000035772 mutation Effects 0.000 claims description 17
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 17
- 229920001184 polypeptide Polymers 0.000 claims description 16
- 108700004991 Cas12a Proteins 0.000 claims description 13
- 235000006040 Prunus persica var persica Nutrition 0.000 claims description 12
- 108020004999 messenger RNA Proteins 0.000 claims description 12
- 229910052594 sapphire Inorganic materials 0.000 claims description 12
- 239000010980 sapphire Substances 0.000 claims description 12
- 102000053602 DNA Human genes 0.000 claims description 11
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 10
- 230000006798 recombination Effects 0.000 claims description 9
- 238000005215 recombination Methods 0.000 claims description 9
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 8
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 8
- 108091008874 T cell receptors Proteins 0.000 claims description 8
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 8
- 230000001580 bacterial effect Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000032823 cell division Effects 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 238000010839 reverse transcription Methods 0.000 claims description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 6
- 208000028782 Hereditary disease Diseases 0.000 claims description 6
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 claims description 6
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 claims description 6
- 108700008625 Reporter Genes Proteins 0.000 claims description 6
- 208000023940 X-Linked Combined Immunodeficiency disease Diseases 0.000 claims description 6
- 150000001413 amino acids Chemical group 0.000 claims description 6
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 6
- 230000002503 metabolic effect Effects 0.000 claims description 6
- 241000713838 Avian myeloblastosis virus Species 0.000 claims description 5
- 208000024556 Mendelian disease Diseases 0.000 claims description 5
- 241000700605 Viruses Species 0.000 claims description 5
- 230000007812 deficiency Effects 0.000 claims description 5
- 238000013518 transcription Methods 0.000 claims description 5
- 230000035897 transcription Effects 0.000 claims description 5
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 4
- 102000004127 Cytokines Human genes 0.000 claims description 4
- 108090000695 Cytokines Proteins 0.000 claims description 4
- 241000196324 Embryophyta Species 0.000 claims description 4
- 102100021519 Hemoglobin subunit beta Human genes 0.000 claims description 4
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 claims description 4
- 108091008036 Immune checkpoint proteins Proteins 0.000 claims description 4
- 102000015696 Interleukins Human genes 0.000 claims description 4
- 108010063738 Interleukins Proteins 0.000 claims description 4
- 108010038795 estrogen receptors Proteins 0.000 claims description 4
- 208000011580 syndromic disease Diseases 0.000 claims description 4
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 claims description 3
- 208000018565 Hemochromatosis Diseases 0.000 claims description 3
- 208000023105 Huntington disease Diseases 0.000 claims description 3
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 claims description 3
- 208000022292 Tay-Sachs disease Diseases 0.000 claims description 3
- 241001531188 [Eubacterium] rectale Species 0.000 claims description 3
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 claims description 3
- 210000004962 mammalian cell Anatomy 0.000 claims description 3
- 201000006938 muscular dystrophy Diseases 0.000 claims description 3
- 239000002105 nanoparticle Substances 0.000 claims description 3
- 230000037361 pathway Effects 0.000 claims description 3
- 208000007056 sickle cell anemia Diseases 0.000 claims description 3
- 230000019491 signal transduction Effects 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 208000001914 Fragile X syndrome Diseases 0.000 claims description 2
- 101150013707 HBB gene Proteins 0.000 claims description 2
- 108010054147 Hemoglobins Proteins 0.000 claims description 2
- 102000001554 Hemoglobins Human genes 0.000 claims description 2
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 claims description 2
- 208000001826 Marfan syndrome Diseases 0.000 claims description 2
- 201000011252 Phenylketonuria Diseases 0.000 claims description 2
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 claims description 2
- 208000006110 Wiskott-Aldrich syndrome Diseases 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 208000005980 beta thalassemia Diseases 0.000 claims description 2
- 230000015556 catabolic process Effects 0.000 claims description 2
- 238000006731 degradation reaction Methods 0.000 claims description 2
- 201000001386 familial hypercholesterolemia Diseases 0.000 claims description 2
- 102000034287 fluorescent proteins Human genes 0.000 claims description 2
- 108091006047 fluorescent proteins Proteins 0.000 claims description 2
- 150000002632 lipids Chemical class 0.000 claims description 2
- 238000012423 maintenance Methods 0.000 claims description 2
- 210000000822 natural killer cell Anatomy 0.000 claims description 2
- 150000003384 small molecules Chemical class 0.000 claims description 2
- 240000005809 Prunus persica Species 0.000 claims 5
- 102000015694 estrogen receptors Human genes 0.000 claims 2
- 238000003780 insertion Methods 0.000 abstract description 80
- 230000037431 insertion Effects 0.000 abstract description 80
- 238000010362 genome editing Methods 0.000 abstract description 19
- 238000005516 engineering process Methods 0.000 abstract description 8
- 201000010099 disease Diseases 0.000 abstract description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 238000003745 diagnosis Methods 0.000 abstract description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 240
- 102100034353 Integrase Human genes 0.000 description 186
- 102000040430 polynucleotide Human genes 0.000 description 110
- 108091033319 polynucleotide Proteins 0.000 description 110
- 239000002157 polynucleotide Substances 0.000 description 110
- 239000005090 green fluorescent protein Substances 0.000 description 86
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 81
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 81
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 63
- 108091033409 CRISPR Proteins 0.000 description 41
- 235000018102 proteins Nutrition 0.000 description 27
- 102100022726 Nucleolar and coiled-body phosphoprotein 1 Human genes 0.000 description 25
- 101001109620 Homo sapiens Nucleolar and coiled-body phosphoprotein 1 Proteins 0.000 description 24
- 238000007792 addition Methods 0.000 description 23
- 238000001890 transfection Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 21
- 238000013461 design Methods 0.000 description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- 241000282414 Homo sapiens Species 0.000 description 17
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 15
- -1 mCherry Proteins 0.000 description 15
- 238000002073 fluorescence micrograph Methods 0.000 description 14
- 108010051219 Cre recombinase Proteins 0.000 description 12
- 102100021601 Ephrin type-A receptor 8 Human genes 0.000 description 12
- 101000898676 Homo sapiens Ephrin type-A receptor 8 Proteins 0.000 description 12
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 12
- 230000002068 genetic effect Effects 0.000 description 12
- 108010050848 glycylleucine Proteins 0.000 description 12
- 101000855412 Homo sapiens Carbamoyl-phosphate synthase [ammonia], mitochondrial Proteins 0.000 description 11
- 101000983292 Homo sapiens N-fatty-acyl-amino acid synthase/hydrolase PM20D1 Proteins 0.000 description 11
- 101000861263 Homo sapiens Steroid 21-hydroxylase Proteins 0.000 description 11
- 102000012330 Integrases Human genes 0.000 description 11
- 108010013835 arginine glutamate Proteins 0.000 description 11
- 238000003556 assay Methods 0.000 description 11
- 238000004520 electroporation Methods 0.000 description 11
- 101150069374 Serpina1 gene Proteins 0.000 description 10
- 108700019146 Transgenes Proteins 0.000 description 10
- 108010008355 arginyl-glutamine Proteins 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 101000829212 Homo sapiens Serine/arginine repetitive matrix protein 2 Proteins 0.000 description 9
- 102100026873 N-fatty-acyl-amino acid synthase/hydrolase PM20D1 Human genes 0.000 description 9
- 108010092854 aspartyllysine Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 239000013613 expression plasmid Substances 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 8
- 102100023657 Serine/arginine repetitive matrix protein 2 Human genes 0.000 description 8
- 108010044940 alanylglutamine Proteins 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 108010015792 glycyllysine Proteins 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 102100027211 Albumin Human genes 0.000 description 7
- 108010088751 Albumins Proteins 0.000 description 7
- 244000144730 Amygdalus persica Species 0.000 description 7
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 7
- 101000836111 Homo sapiens FACT complex subunit SPT16 Proteins 0.000 description 7
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 238000010459 TALEN Methods 0.000 description 7
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 7
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000002744 homologous recombination Methods 0.000 description 7
- 230000006801 homologous recombination Effects 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- 230000009261 transgenic effect Effects 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 6
- 102100025637 FACT complex subunit SPT16 Human genes 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 108010080629 tryptophan-leucine Proteins 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 5
- 108091093088 Amplicon Proteins 0.000 description 5
- 102100022689 DEP domain-containing protein 4 Human genes 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 5
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 5
- 101001044739 Homo sapiens DEP domain-containing protein 4 Proteins 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- 101800001494 Protease 2A Proteins 0.000 description 5
- 101800001066 Protein 2A Proteins 0.000 description 5
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 5
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 5
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- NOFOAYPPHIUXJR-APNQCZIXSA-N aphidicolin Chemical compound C1[C@@]23[C@@]4(C)CC[C@@H](O)[C@@](C)(CO)[C@@H]4CC[C@H]3C[C@H]1[C@](CO)(O)CC2 NOFOAYPPHIUXJR-APNQCZIXSA-N 0.000 description 5
- SEKZNWAQALMJNH-YZUCACDQSA-N aphidicolin Natural products C[C@]1(CO)CC[C@]23C[C@H]1C[C@@H]2CC[C@H]4[C@](C)(CO)[C@H](O)CC[C@]34C SEKZNWAQALMJNH-YZUCACDQSA-N 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 230000006780 non-homologous end joining Effects 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 230000009437 off-target effect Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 108010020532 tyrosyl-proline Proteins 0.000 description 5
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 4
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 4
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 4
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 4
- 230000033616 DNA repair Effects 0.000 description 4
- 108020004437 Endogenous Retroviruses Proteins 0.000 description 4
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 4
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 4
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 4
- JDAYMLXPUJRSDJ-XIRDDKMYSA-N Glu-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 JDAYMLXPUJRSDJ-XIRDDKMYSA-N 0.000 description 4
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 4
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 4
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 4
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 4
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 4
- 108010047562 NGR peptide Proteins 0.000 description 4
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 4
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 4
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 4
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 4
- 239000002671 adjuvant Substances 0.000 description 4
- 108010011559 alanylphenylalanine Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 4
- 108010078274 isoleucylvaline Proteins 0.000 description 4
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 238000007480 sanger sequencing Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 4
- 238000010361 transduction Methods 0.000 description 4
- 230000026683 transduction Effects 0.000 description 4
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 3
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 3
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 3
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 3
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 3
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 3
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 3
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 3
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 3
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 3
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 3
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 3
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 3
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 3
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 3
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 3
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 3
- 241001123946 Gaga Species 0.000 description 3
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 3
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 3
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 3
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 3
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 3
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 3
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 3
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 3
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 3
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 3
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 101000870806 Homo sapiens G-rich sequence factor 1 Proteins 0.000 description 3
- 101001051313 Homo sapiens Laminin subunit beta-3 Proteins 0.000 description 3
- 101000997662 Homo sapiens Lysosomal acid glucosylceramidase Proteins 0.000 description 3
- 101001111320 Homo sapiens Nestin Proteins 0.000 description 3
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 3
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 3
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 102100024629 Laminin subunit beta-3 Human genes 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 3
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 3
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 3
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 3
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 3
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 3
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 3
- 239000005089 Luciferase Substances 0.000 description 3
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 3
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 3
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 3
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 3
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 3
- 102100033342 Lysosomal acid glucosylceramidase Human genes 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 3
- 229920002873 Polyethylenimine Polymers 0.000 description 3
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 3
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 3
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 3
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 3
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 3
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 3
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 3
- 108010020764 Transposases Proteins 0.000 description 3
- 102000008579 Transposases Human genes 0.000 description 3
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 3
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 3
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 3
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 3
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 3
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 238000000799 fluorescence microscopy Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 3
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 230000009191 jumping Effects 0.000 description 3
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 230000026447 protein localization Effects 0.000 description 3
- 230000012743 protein tagging Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102100036799 Adhesion G-protein coupled receptor V1 Human genes 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 2
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 2
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 2
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 2
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 2
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 2
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 2
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 2
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 2
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 2
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 2
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 2
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 2
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 2
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 2
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 2
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 2
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 2
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 2
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 2
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 2
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 2
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 2
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 2
- 102100035673 Centrosomal protein of 290 kDa Human genes 0.000 description 2
- 101710198317 Centrosomal protein of 290 kDa Proteins 0.000 description 2
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 102100038595 Estrogen receptor Human genes 0.000 description 2
- 102100033506 G-rich sequence factor 1 Human genes 0.000 description 2
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 2
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 2
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 2
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 2
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 2
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 2
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 2
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 2
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 2
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 2
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 2
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 2
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 2
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 2
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 2
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 2
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 description 2
- 108091027305 Heteroduplex Proteins 0.000 description 2
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 2
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 2
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 2
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 2
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 2
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 2
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 2
- 101000864342 Homo sapiens Tyrosine-protein kinase BTK Proteins 0.000 description 2
- 241001213909 Human endogenous retroviruses Species 0.000 description 2
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 2
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 2
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 2
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 2
- 108010015268 Integration Host Factors Proteins 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 2
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 2
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 2
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 2
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 2
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 2
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 102100024014 Nestin Human genes 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 2
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 2
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 2
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 2
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 2
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 2
- PTLMYJOMJLTMCB-KKUMJFAQSA-N Phe-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N PTLMYJOMJLTMCB-KKUMJFAQSA-N 0.000 description 2
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- 102100038223 Phenylalanine-4-hydroxylase Human genes 0.000 description 2
- 101710125939 Phenylalanine-4-hydroxylase Proteins 0.000 description 2
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 2
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 2
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 2
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 2
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 2
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 2
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 2
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 2
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- 108010052160 Site-specific recombinase Proteins 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 2
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 2
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 2
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 2
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 2
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 2
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 2
- LFCQXIXJQXWZJI-BZSNNMDCSA-N Tyr-His-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O LFCQXIXJQXWZJI-BZSNNMDCSA-N 0.000 description 2
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 2
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 2
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 2
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 2
- AKRHKDCELJLTMD-BVSLBCMMSA-N Tyr-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N AKRHKDCELJLTMD-BVSLBCMMSA-N 0.000 description 2
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 2
- 102100029823 Tyrosine-protein kinase BTK Human genes 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 2
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 2
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 2
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000012761 co-transfection Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 210000001808 exosome Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 238000012966 insertion method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 2
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000000386 microscopy Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- 229950010131 puromycin Drugs 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 231100000241 scar Toxicity 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 230000004960 subcellular localization Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 108700029760 synthetic LTSP Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- 101150082072 14 gene Proteins 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- 102100035352 2-oxoisovalerate dehydrogenase subunit alpha, mitochondrial Human genes 0.000 description 1
- 102100035315 2-oxoisovalerate dehydrogenase subunit beta, mitochondrial Human genes 0.000 description 1
- 102100024824 3 beta-hydroxysteroid dehydrogenase type 7 Human genes 0.000 description 1
- KEWSCDNULKOKTG-UHFFFAOYSA-N 4-cyano-4-ethylsulfanylcarbothioylsulfanylpentanoic acid Chemical compound CCSC(=S)SC(C)(C#N)CCC(O)=O KEWSCDNULKOKTG-UHFFFAOYSA-N 0.000 description 1
- 102100028626 4-hydroxyphenylpyruvate dioxygenase Human genes 0.000 description 1
- 108010068327 4-hydroxyphenylpyruvate dioxygenase Proteins 0.000 description 1
- 102100031020 5-aminolevulinate synthase, erythroid-specific, mitochondrial Human genes 0.000 description 1
- 102100032293 A disintegrin and metalloproteinase with thrombospondin motifs 18 Human genes 0.000 description 1
- 101150092476 ABCA1 gene Proteins 0.000 description 1
- 101150087690 ACTB gene Proteins 0.000 description 1
- 108091005568 ADAMTS18 Proteins 0.000 description 1
- 102100039646 ADP-ribosylation factor-like protein 3 Human genes 0.000 description 1
- 102100028359 ADP-ribosylation factor-like protein 6 Human genes 0.000 description 1
- 102000010553 ALAD Human genes 0.000 description 1
- 101150082527 ALAD gene Proteins 0.000 description 1
- 101150037123 APOE gene Proteins 0.000 description 1
- 108700005241 ATP Binding Cassette Transporter 1 Proteins 0.000 description 1
- 102100028161 ATP-binding cassette sub-family C member 2 Human genes 0.000 description 1
- 241000023308 Acca Species 0.000 description 1
- 102100040958 Aconitate hydratase, mitochondrial Human genes 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 102100024438 Adhesion G protein-coupled receptor A3 Human genes 0.000 description 1
- 101710096099 Adhesion G-protein coupled receptor V1 Proteins 0.000 description 1
- 102100033497 Adiponectin receptor protein 1 Human genes 0.000 description 1
- 102100038568 Age-related maculopathy susceptibility protein 2 Human genes 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 1
- AAXVGJXZKHQQHD-LSJOCFKGSA-N Ala-His-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N AAXVGJXZKHQQHD-LSJOCFKGSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- ZVWXMTTZJKBJCI-BHDSKKPTSA-N Ala-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 ZVWXMTTZJKBJCI-BHDSKKPTSA-N 0.000 description 1
- CWRBRVZBMVJENN-UVBJJODRSA-N Ala-Trp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N CWRBRVZBMVJENN-UVBJJODRSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- OAIGZYFGCNNVIE-ZPFDUUQYSA-N Ala-Val-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O OAIGZYFGCNNVIE-ZPFDUUQYSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 102100024086 Aldo-keto reductase family 1 member D1 Human genes 0.000 description 1
- 102100040410 Alpha-methylacyl-CoA racemase Human genes 0.000 description 1
- 108010044434 Alpha-methylacyl-CoA racemase Proteins 0.000 description 1
- 108091023043 Alu Element Proteins 0.000 description 1
- 101710191958 Amino-acid acetyltransferase Proteins 0.000 description 1
- 101710185938 Amino-acid acetyltransferase, mitochondrial Proteins 0.000 description 1
- 102100033715 Apolipoprotein A-I Human genes 0.000 description 1
- 102100030942 Apolipoprotein A-II Human genes 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 102100029470 Apolipoprotein E Human genes 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- 108700040066 Argininosuccinate lyases Proteins 0.000 description 1
- 102100020999 Argininosuccinate synthase Human genes 0.000 description 1
- 102100024081 Aryl-hydrocarbon-interacting protein-like 1 Human genes 0.000 description 1
- 102100031491 Arylsulfatase B Human genes 0.000 description 1
- 102100033890 Arylsulfatase G Human genes 0.000 description 1
- 101150025804 Asl gene Proteins 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- QEQVUHQQYDZUEN-GUBZILKMSA-N Asn-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N QEQVUHQQYDZUEN-GUBZILKMSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- LWXJVHTUEDHDLG-XUXIUFHCSA-N Asn-Leu-Leu-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LWXJVHTUEDHDLG-XUXIUFHCSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- APYNREQHZOGYHV-ACZMJKKPSA-N Asp-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N APYNREQHZOGYHV-ACZMJKKPSA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 1
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 102100035777 BBSome-interacting protein 1 Human genes 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 102100021295 Bardet-Biedl syndrome 1 protein Human genes 0.000 description 1
- 102100021296 Bardet-Biedl syndrome 10 protein Human genes 0.000 description 1
- 102100021297 Bardet-Biedl syndrome 12 protein Human genes 0.000 description 1
- 102100027883 Bardet-Biedl syndrome 2 protein Human genes 0.000 description 1
- 102100027884 Bardet-Biedl syndrome 4 protein Human genes 0.000 description 1
- 102100027878 Bardet-Biedl syndrome 5 protein Human genes 0.000 description 1
- 102100027882 Bardet-Biedl syndrome 7 protein Human genes 0.000 description 1
- 102100022794 Bestrophin-1 Human genes 0.000 description 1
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 1
- 102100026031 Beta-glucuronidase Human genes 0.000 description 1
- 102100027950 Bile acid-CoA:amino acid N-acyltransferase Human genes 0.000 description 1
- 102100028282 Bile salt export pump Human genes 0.000 description 1
- 102100028252 Brain acid soluble protein 1 Human genes 0.000 description 1
- 101150095726 CABP4 gene Proteins 0.000 description 1
- 102000014812 CACNA1F Human genes 0.000 description 1
- 101150029409 CFTR gene Proteins 0.000 description 1
- 102100028228 COUP transcription factor 1 Human genes 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 102100022509 Cadherin-23 Human genes 0.000 description 1
- 102100035344 Cadherin-related family member 1 Human genes 0.000 description 1
- 102100032220 Calcium and integrin-binding family member 2 Human genes 0.000 description 1
- 102100034279 Calcium-binding mitochondrial carrier protein Aralar2 Human genes 0.000 description 1
- 102100030048 Calcium-binding protein 4 Human genes 0.000 description 1
- 101710113083 Carbamoyl-phosphate synthase Proteins 0.000 description 1
- 208000033910 Carbamoyl-phosphate synthetase 1 deficiency Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 208000016615 Central areolar choroidal dystrophy Diseases 0.000 description 1
- 102100034888 Centrosomal protein kizuna Human genes 0.000 description 1
- 102100035693 Centrosomal protein of 19 kDa Human genes 0.000 description 1
- 101710118480 Centrosomal protein of 19 kDa Proteins 0.000 description 1
- 102100034791 Centrosomal protein of 78 kDa Human genes 0.000 description 1
- 101710117840 Centrosomal protein of 78 kDa Proteins 0.000 description 1
- 102100039219 Centrosome-associated protein CEP250 Human genes 0.000 description 1
- 101710110151 Centrosome-associated protein CEP250 Proteins 0.000 description 1
- 102400001244 Cerebellin Human genes 0.000 description 1
- 101800001299 Cerebellin Proteins 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 102100029397 Chloride channel CLIC-like protein 1 Human genes 0.000 description 1
- 102100037637 Cholesteryl ester transfer protein Human genes 0.000 description 1
- 208000032544 Cicatrix Diseases 0.000 description 1
- 102100024297 Cilia- and flagella-associated protein 410 Human genes 0.000 description 1
- 102100031060 Clarin-1 Human genes 0.000 description 1
- 102100034467 Clathrin light chain A Human genes 0.000 description 1
- 102100033538 Clusterin-associated protein 1 Human genes 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 102100024079 Coiled-coil and C2 domain-containing protein 2A Human genes 0.000 description 1
- 102100029136 Collagen alpha-1(II) chain Human genes 0.000 description 1
- 102100034622 Complement factor B Human genes 0.000 description 1
- 102100035432 Complement factor H Human genes 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 102100039484 Cone cGMP-specific 3',5'-cyclic phosphodiesterase subunit alpha' Human genes 0.000 description 1
- 102100029362 Cone-rod homeobox protein Human genes 0.000 description 1
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 description 1
- 102100023376 Corrinoid adenosyltransferase Human genes 0.000 description 1
- 102100023583 Cyclic AMP-dependent transcription factor ATF-6 alpha Human genes 0.000 description 1
- 102100029142 Cyclic nucleotide-gated cation channel alpha-3 Human genes 0.000 description 1
- 102100029140 Cyclic nucleotide-gated cation channel beta-3 Human genes 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 1
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 1
- 102100027417 Cytochrome P450 1B1 Human genes 0.000 description 1
- 102100022028 Cytochrome P450 4V2 Human genes 0.000 description 1
- 102100038698 Cytochrome P450 7B1 Human genes 0.000 description 1
- 102100025717 Cytosolic carboxypeptidase-like protein 5 Human genes 0.000 description 1
- 102100029145 DNA damage-inducible transcript 3 protein Human genes 0.000 description 1
- 102100031867 DNA excision repair protein ERCC-6 Human genes 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 101710150423 DNA nickase Proteins 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 206010011882 Deafness congenital Diseases 0.000 description 1
- 102100029636 Death domain-containing protein 1 Human genes 0.000 description 1
- 102100036511 Dehydrodolichyl diphosphate synthase complex subunit DHDDS Human genes 0.000 description 1
- 102100023319 Dihydrolipoyl dehydrogenase, mitochondrial Human genes 0.000 description 1
- 102100024361 Disintegrin and metalloproteinase domain-containing protein 9 Human genes 0.000 description 1
- 102100022268 DnaJ homolog subfamily C member 18 Human genes 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 102100024108 Dystrophin Human genes 0.000 description 1
- 102100029503 E3 ubiquitin-protein ligase TRIM32 Human genes 0.000 description 1
- 102100037460 E3 ubiquitin-protein ligase Topors Human genes 0.000 description 1
- 102100031814 EGF-containing fibulin-like extracellular matrix protein 1 Human genes 0.000 description 1
- 102100021650 ER membrane protein complex subunit 1 Human genes 0.000 description 1
- 102100031804 Electron transfer flavoprotein-ubiquinone oxidoreductase, mitochondrial Human genes 0.000 description 1
- 102100032053 Elongation of very long chain fatty acids protein 4 Human genes 0.000 description 1
- 102100035090 Elongator complex protein 4 Human genes 0.000 description 1
- 101710167759 Elongator complex protein 4 Proteins 0.000 description 1
- 101000764582 Enterobacteria phage T4 Tape measure protein Proteins 0.000 description 1
- 102100025403 Epoxide hydrolase 1 Human genes 0.000 description 1
- 101000621102 Escherichia phage Mu Portal protein Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 102100027280 Fanconi anemia group A protein Human genes 0.000 description 1
- 241000713800 Feline immunodeficiency virus Species 0.000 description 1
- 241000714165 Feline leukemia virus Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100030771 Ferrochelatase, mitochondrial Human genes 0.000 description 1
- 102100021084 Forkhead box protein C1 Human genes 0.000 description 1
- 102100039820 Frizzled-4 Human genes 0.000 description 1
- 102100030393 G-patch domain and KOW motifs-containing protein Human genes 0.000 description 1
- 108010038179 G-protein beta3 subunit Proteins 0.000 description 1
- 101150066002 GFP gene Proteins 0.000 description 1
- 241000963438 Gaussia <copepod> Species 0.000 description 1
- 102100028953 Gelsolin Human genes 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 1
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- DAAUVRPSZRDMBV-KBIXCLLPSA-N Gln-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DAAUVRPSZRDMBV-KBIXCLLPSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- 206010018364 Glomerulonephritis Diseases 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- VJVAQZYGLMJPTK-QEJZJMRPSA-N Glu-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VJVAQZYGLMJPTK-QEJZJMRPSA-N 0.000 description 1
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 1
- 102100036264 Glucose-6-phosphatase catalytic subunit 1 Human genes 0.000 description 1
- 102100021223 Glucosidase 2 subunit beta Human genes 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- NIOPEYHPOBWLQO-KBPBESRZSA-N Gly-Trp-Glu Chemical compound NCC(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOPEYHPOBWLQO-KBPBESRZSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100035368 Growth/differentiation factor 6 Human genes 0.000 description 1
- 102100035346 Guanine nucleotide-binding protein G(I)/G(S)/G(T) subunit beta-3 Human genes 0.000 description 1
- 102100039261 Guanine nucleotide-binding protein G(t) subunit alpha-1 Human genes 0.000 description 1
- 102100039214 Guanine nucleotide-binding protein G(t) subunit alpha-2 Human genes 0.000 description 1
- 102100033969 Guanylyl cyclase-activating protein 1 Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 102100037931 Harmonin Human genes 0.000 description 1
- 102100028006 Heme oxygenase 1 Human genes 0.000 description 1
- 102100028893 Hemicentin-1 Human genes 0.000 description 1
- 102000048988 Hemochromatosis Human genes 0.000 description 1
- 108700022944 Hemochromatosis Proteins 0.000 description 1
- 102100022816 Hemojuvelin Human genes 0.000 description 1
- 101800000637 Hemokinin Proteins 0.000 description 1
- 102100034629 Hemopexin Human genes 0.000 description 1
- 102100039991 Heparan-alpha-glucosaminide N-acetyltransferase Human genes 0.000 description 1
- 102100031415 Hepatic triacylglycerol lipase Human genes 0.000 description 1
- 102100036284 Hepcidin Human genes 0.000 description 1
- 101150065637 Hfe gene Proteins 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- DVHGLDYMGWTYKW-GUBZILKMSA-N His-Gln-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DVHGLDYMGWTYKW-GUBZILKMSA-N 0.000 description 1
- IMPKSPYRPUXYAP-SZMVWBNQSA-N His-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CN=CN3)N IMPKSPYRPUXYAP-SZMVWBNQSA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- DEOQGJUXUQGUJN-KKUMJFAQSA-N His-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DEOQGJUXUQGUJN-KKUMJFAQSA-N 0.000 description 1
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 1
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 1
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- UIRUVUUGUYCMBY-KCTSRDHCSA-N His-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N UIRUVUUGUYCMBY-KCTSRDHCSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 102100031004 Histidine-tRNA ligase, cytoplasmic Human genes 0.000 description 1
- 102100030634 Homeobox protein OTX2 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000597665 Homo sapiens 2-oxoisovalerate dehydrogenase subunit alpha, mitochondrial Proteins 0.000 description 1
- 101000597680 Homo sapiens 2-oxoisovalerate dehydrogenase subunit beta, mitochondrial Proteins 0.000 description 1
- 101000761592 Homo sapiens 3 beta-hydroxysteroid dehydrogenase type 7 Proteins 0.000 description 1
- 101001083755 Homo sapiens 5-aminolevulinate synthase, erythroid-specific, mitochondrial Proteins 0.000 description 1
- 101000886004 Homo sapiens ADP-ribosylation factor-like protein 3 Proteins 0.000 description 1
- 101000769028 Homo sapiens ADP-ribosylation factor-like protein 6 Proteins 0.000 description 1
- 101000965314 Homo sapiens Aconitate hydratase, mitochondrial Proteins 0.000 description 1
- 101000594506 Homo sapiens Acyl-coenzyme A diphosphatase NUDT19 Proteins 0.000 description 1
- 101000833357 Homo sapiens Adhesion G protein-coupled receptor A3 Proteins 0.000 description 1
- 101000928167 Homo sapiens Adhesion G-protein coupled receptor V1 Proteins 0.000 description 1
- 101001135206 Homo sapiens Adiponectin receptor protein 1 Proteins 0.000 description 1
- 101000808726 Homo sapiens Age-related maculopathy susceptibility protein 2 Proteins 0.000 description 1
- 101000690251 Homo sapiens Aldo-keto reductase family 1 member D1 Proteins 0.000 description 1
- 101000779572 Homo sapiens Alpha-protein kinase 3 Proteins 0.000 description 1
- 101000733802 Homo sapiens Apolipoprotein A-I Proteins 0.000 description 1
- 101000793406 Homo sapiens Apolipoprotein A-II Proteins 0.000 description 1
- 101000889953 Homo sapiens Apolipoprotein B-100 Proteins 0.000 description 1
- 101000784014 Homo sapiens Argininosuccinate synthase Proteins 0.000 description 1
- 101000833576 Homo sapiens Aryl-hydrocarbon-interacting protein-like 1 Proteins 0.000 description 1
- 101000923070 Homo sapiens Arylsulfatase B Proteins 0.000 description 1
- 101000925538 Homo sapiens Arylsulfatase G Proteins 0.000 description 1
- 101000874276 Homo sapiens BBSome-interacting protein 1 Proteins 0.000 description 1
- 101000894722 Homo sapiens Bardet-Biedl syndrome 1 protein Proteins 0.000 description 1
- 101000894732 Homo sapiens Bardet-Biedl syndrome 10 protein Proteins 0.000 description 1
- 101000894739 Homo sapiens Bardet-Biedl syndrome 12 protein Proteins 0.000 description 1
- 101000697700 Homo sapiens Bardet-Biedl syndrome 2 protein Proteins 0.000 description 1
- 101000697660 Homo sapiens Bardet-Biedl syndrome 4 protein Proteins 0.000 description 1
- 101000697666 Homo sapiens Bardet-Biedl syndrome 5 protein Proteins 0.000 description 1
- 101000697669 Homo sapiens Bardet-Biedl syndrome 7 protein Proteins 0.000 description 1
- 101000903449 Homo sapiens Bestrophin-1 Proteins 0.000 description 1
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 description 1
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 description 1
- 101000697858 Homo sapiens Bile acid-CoA:amino acid N-acyltransferase Proteins 0.000 description 1
- 101000935689 Homo sapiens Brain acid soluble protein 1 Proteins 0.000 description 1
- 101000860854 Homo sapiens COUP transcription factor 1 Proteins 0.000 description 1
- 101000899442 Homo sapiens Cadherin-23 Proteins 0.000 description 1
- 101000737767 Homo sapiens Cadherin-related family member 1 Proteins 0.000 description 1
- 101000943456 Homo sapiens Calcium and integrin-binding family member 2 Proteins 0.000 description 1
- 101001091251 Homo sapiens Centrosomal protein kizuna Proteins 0.000 description 1
- 101000851684 Homo sapiens Chimeric ERCC6-PGBD3 protein Proteins 0.000 description 1
- 101000989992 Homo sapiens Chloride channel CLIC-like protein 1 Proteins 0.000 description 1
- 101000880514 Homo sapiens Cholesteryl ester transfer protein Proteins 0.000 description 1
- 101000980066 Homo sapiens Cilia- and flagella-associated protein 410 Proteins 0.000 description 1
- 101000992973 Homo sapiens Clarin-1 Proteins 0.000 description 1
- 101000710244 Homo sapiens Clathrin light chain A Proteins 0.000 description 1
- 101000945060 Homo sapiens Clusterin-associated protein 1 Proteins 0.000 description 1
- 101000910414 Homo sapiens Coiled-coil and C2 domain-containing protein 2A Proteins 0.000 description 1
- 101000771163 Homo sapiens Collagen alpha-1(II) chain Proteins 0.000 description 1
- 101000710032 Homo sapiens Complement factor B Proteins 0.000 description 1
- 101000737574 Homo sapiens Complement factor H Proteins 0.000 description 1
- 101000609790 Homo sapiens Cone cGMP-specific 3',5'-cyclic phosphodiesterase subunit alpha' Proteins 0.000 description 1
- 101000919370 Homo sapiens Cone-rod homeobox protein Proteins 0.000 description 1
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 description 1
- 101001114650 Homo sapiens Corrinoid adenosyltransferase Proteins 0.000 description 1
- 101000905751 Homo sapiens Cyclic AMP-dependent transcription factor ATF-6 alpha Proteins 0.000 description 1
- 101000771071 Homo sapiens Cyclic nucleotide-gated cation channel alpha-3 Proteins 0.000 description 1
- 101000771083 Homo sapiens Cyclic nucleotide-gated cation channel beta-3 Proteins 0.000 description 1
- 101000725164 Homo sapiens Cytochrome P450 1B1 Proteins 0.000 description 1
- 101000896951 Homo sapiens Cytochrome P450 4V2 Proteins 0.000 description 1
- 101000957674 Homo sapiens Cytochrome P450 7B1 Proteins 0.000 description 1
- 101000932585 Homo sapiens Cytosolic carboxypeptidase-like protein 5 Proteins 0.000 description 1
- 101000920783 Homo sapiens DNA excision repair protein ERCC-6 Proteins 0.000 description 1
- 101000865821 Homo sapiens Death domain-containing protein 1 Proteins 0.000 description 1
- 101000928713 Homo sapiens Dehydrodolichyl diphosphate synthase complex subunit DHDDS Proteins 0.000 description 1
- 101000844721 Homo sapiens Deleted in malignant brain tumors 1 protein Proteins 0.000 description 1
- 101000832769 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 9 Proteins 0.000 description 1
- 101000902076 Homo sapiens DnaJ homolog subfamily C member 18 Proteins 0.000 description 1
- 101001053946 Homo sapiens Dystrophin Proteins 0.000 description 1
- 101000634982 Homo sapiens E3 ubiquitin-protein ligase TRIM32 Proteins 0.000 description 1
- 101000662670 Homo sapiens E3 ubiquitin-protein ligase Topors Proteins 0.000 description 1
- 101001065272 Homo sapiens EGF-containing fibulin-like extracellular matrix protein 1 Proteins 0.000 description 1
- 101000896333 Homo sapiens ER membrane protein complex subunit 1 Proteins 0.000 description 1
- 101000920874 Homo sapiens Electron transfer flavoprotein-ubiquinone oxidoreductase, mitochondrial Proteins 0.000 description 1
- 101000921354 Homo sapiens Elongation of very long chain fatty acids protein 4 Proteins 0.000 description 1
- 101001077852 Homo sapiens Epoxide hydrolase 1 Proteins 0.000 description 1
- 101000914673 Homo sapiens Fanconi anemia group A protein Proteins 0.000 description 1
- 101000843611 Homo sapiens Ferrochelatase, mitochondrial Proteins 0.000 description 1
- 101000818310 Homo sapiens Forkhead box protein C1 Proteins 0.000 description 1
- 101000885581 Homo sapiens Frizzled-4 Proteins 0.000 description 1
- 101000918487 Homo sapiens Fumarylacetoacetase Proteins 0.000 description 1
- 101001059150 Homo sapiens Gelsolin Proteins 0.000 description 1
- 101000930910 Homo sapiens Glucose-6-phosphatase catalytic subunit 1 Proteins 0.000 description 1
- 101001040875 Homo sapiens Glucosidase 2 subunit beta Proteins 0.000 description 1
- 101001023964 Homo sapiens Growth/differentiation factor 6 Proteins 0.000 description 1
- 101000888178 Homo sapiens Guanine nucleotide-binding protein G(t) subunit alpha-1 Proteins 0.000 description 1
- 101000888142 Homo sapiens Guanine nucleotide-binding protein G(t) subunit alpha-2 Proteins 0.000 description 1
- 101001068480 Homo sapiens Guanylyl cyclase-activating protein 1 Proteins 0.000 description 1
- 101000805947 Homo sapiens Harmonin Proteins 0.000 description 1
- 101001079623 Homo sapiens Heme oxygenase 1 Proteins 0.000 description 1
- 101000839060 Homo sapiens Hemicentin-1 Proteins 0.000 description 1
- 101000756823 Homo sapiens Hemojuvelin Proteins 0.000 description 1
- 101001067323 Homo sapiens Hemopexin Proteins 0.000 description 1
- 101001035092 Homo sapiens Heparan-alpha-glucosaminide N-acetyltransferase Proteins 0.000 description 1
- 101000941289 Homo sapiens Hepatic triacylglycerol lipase Proteins 0.000 description 1
- 101001021253 Homo sapiens Hepcidin Proteins 0.000 description 1
- 101000843187 Homo sapiens Histidine-tRNA ligase, cytoplasmic Proteins 0.000 description 1
- 101000584400 Homo sapiens Homeobox protein OTX2 Proteins 0.000 description 1
- 101000659224 Homo sapiens Inactive polyglycylase TTLL10 Proteins 0.000 description 1
- 101001044118 Homo sapiens Inosine-5'-monophosphate dehydrogenase 1 Proteins 0.000 description 1
- 101001033642 Homo sapiens Interphotoreceptor matrix proteoglycan 1 Proteins 0.000 description 1
- 101001033697 Homo sapiens Interphotoreceptor matrix proteoglycan 2 Proteins 0.000 description 1
- 101000960200 Homo sapiens Intraflagellar transport protein 140 homolog Proteins 0.000 description 1
- 101001010731 Homo sapiens Intraflagellar transport protein 81 homolog Proteins 0.000 description 1
- 101001047038 Homo sapiens Inward rectifier potassium channel 13 Proteins 0.000 description 1
- 101001042038 Homo sapiens Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 1
- 101001049213 Homo sapiens Kelch-like protein 15 Proteins 0.000 description 1
- 101001008857 Homo sapiens Kelch-like protein 7 Proteins 0.000 description 1
- 101000975472 Homo sapiens Keratin, type I cytoskeletal 12 Proteins 0.000 description 1
- 101001054649 Homo sapiens Latent-transforming growth factor beta-binding protein 2 Proteins 0.000 description 1
- 101001054646 Homo sapiens Latent-transforming growth factor beta-binding protein 3 Proteins 0.000 description 1
- 101001008411 Homo sapiens Lebercilin Proteins 0.000 description 1
- 101000616300 Homo sapiens Leucine zipper transcription factor-like protein 1 Proteins 0.000 description 1
- 101001017847 Homo sapiens Leucine-rich repeat, immunoglobulin-like domain and transmembrane domain-containing protein 3 Proteins 0.000 description 1
- 101000624524 Homo sapiens Leucine-tRNA ligase, cytoplasmic Proteins 0.000 description 1
- 101001122174 Homo sapiens Lipoamide acyltransferase component of branched-chain alpha-keto acid dehydrogenase complex, mitochondrial Proteins 0.000 description 1
- 101001137074 Homo sapiens Long-wave-sensitive opsin 1 Proteins 0.000 description 1
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 1
- 101001043594 Homo sapiens Low-density lipoprotein receptor-related protein 5 Proteins 0.000 description 1
- 101000742901 Homo sapiens Lysophosphatidylserine lipase ABHD12 Proteins 0.000 description 1
- 101000575454 Homo sapiens Major facilitator superfamily domain-containing protein 8 Proteins 0.000 description 1
- 101000990902 Homo sapiens Matrix metalloproteinase-9 Proteins 0.000 description 1
- 101000573510 Homo sapiens McKusick-Kaufman/Bardet-Biedl syndromes putative chaperonin Proteins 0.000 description 1
- 101001120868 Homo sapiens Meckel syndrome type 1 protein Proteins 0.000 description 1
- 101001120864 Homo sapiens Meckelin Proteins 0.000 description 1
- 101000583150 Homo sapiens Membrane-associated phosphatidylinositol transfer protein 3 Proteins 0.000 description 1
- 101001032837 Homo sapiens Metabotropic glutamate receptor 6 Proteins 0.000 description 1
- 101000993462 Homo sapiens Metal transporter CNNM4 Proteins 0.000 description 1
- 101000957756 Homo sapiens Microtubule-associated protein RP/EB family member 2 Proteins 0.000 description 1
- 101000604411 Homo sapiens NADH-ubiquinone oxidoreductase chain 1 Proteins 0.000 description 1
- 101001109052 Homo sapiens NADH-ubiquinone oxidoreductase chain 4 Proteins 0.000 description 1
- 101000632623 Homo sapiens NADH-ubiquinone oxidoreductase chain 6 Proteins 0.000 description 1
- 101000962088 Homo sapiens NBAS subunit of NRZ tethering complex Proteins 0.000 description 1
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 description 1
- 101001124388 Homo sapiens NPC intracellular cholesterol transporter 1 Proteins 0.000 description 1
- 101001109579 Homo sapiens NPC intracellular cholesterol transporter 2 Proteins 0.000 description 1
- 101000996052 Homo sapiens Nicotinamide/nicotinic acid mononucleotide adenylyltransferase 1 Proteins 0.000 description 1
- 101000597428 Homo sapiens Nucleoredoxin-like protein 1 Proteins 0.000 description 1
- 101000586302 Homo sapiens Oncostatin-M-specific receptor subunit beta Proteins 0.000 description 1
- 101000721946 Homo sapiens Oral-facial-digital syndrome 1 protein Proteins 0.000 description 1
- 101000598921 Homo sapiens Orexin Proteins 0.000 description 1
- 101001021103 Homo sapiens Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Proteins 0.000 description 1
- 101000854060 Homo sapiens Oxygen-regulated protein 1 Proteins 0.000 description 1
- 101000621228 Homo sapiens POC1 centriolar protein homolog B Proteins 0.000 description 1
- 101000610652 Homo sapiens Peripherin-2 Proteins 0.000 description 1
- 101000955481 Homo sapiens Phosphatidylcholine translocator ABCB4 Proteins 0.000 description 1
- 101000583553 Homo sapiens Phosphoglucomutase-1 Proteins 0.000 description 1
- 101000929663 Homo sapiens Phospholipid-transporting ATPase ABCA7 Proteins 0.000 description 1
- 101000701363 Homo sapiens Phospholipid-transporting ATPase IC Proteins 0.000 description 1
- 101000611618 Homo sapiens Photoreceptor disk component PRCD Proteins 0.000 description 1
- 101000633511 Homo sapiens Photoreceptor-specific nuclear receptor Proteins 0.000 description 1
- 101000595669 Homo sapiens Pituitary homeobox 2 Proteins 0.000 description 1
- 101000943985 Homo sapiens Potassium voltage-gated channel subfamily V member 2 Proteins 0.000 description 1
- 101001105692 Homo sapiens Pre-mRNA-processing factor 6 Proteins 0.000 description 1
- 101001105683 Homo sapiens Pre-mRNA-processing-splicing factor 8 Proteins 0.000 description 1
- 101001122811 Homo sapiens Pre-mRNA-splicing factor ATP-dependent RNA helicase PRP16 Proteins 0.000 description 1
- 101000611936 Homo sapiens Programmed cell death protein 1 Proteins 0.000 description 1
- 101000610551 Homo sapiens Prominin-1 Proteins 0.000 description 1
- 101000875616 Homo sapiens Protein FAM161A Proteins 0.000 description 1
- 101000738546 Homo sapiens Protein PTHB1 Proteins 0.000 description 1
- 101001062227 Homo sapiens Protein RD3 Proteins 0.000 description 1
- 101000781361 Homo sapiens Protein XRP2 Proteins 0.000 description 1
- 101000726148 Homo sapiens Protein crumbs homolog 1 Proteins 0.000 description 1
- 101001028804 Homo sapiens Protein eyes shut homolog Proteins 0.000 description 1
- 101000893100 Homo sapiens Protein fantom Proteins 0.000 description 1
- 101000994437 Homo sapiens Protein jagged-1 Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 101000659522 Homo sapiens Protein unc-119 homolog A Proteins 0.000 description 1
- 101001072259 Homo sapiens Protocadherin-15 Proteins 0.000 description 1
- 101001123245 Homo sapiens Protoporphyrinogen oxidase Proteins 0.000 description 1
- 101001111714 Homo sapiens RING-box protein 2 Proteins 0.000 description 1
- 101001092166 Homo sapiens RPE-retinal G protein-coupled receptor Proteins 0.000 description 1
- 101000620777 Homo sapiens Rab proteins geranylgeranyltransferase component A 1 Proteins 0.000 description 1
- 101001132256 Homo sapiens Ras-related protein Rab-28 Proteins 0.000 description 1
- 101001106082 Homo sapiens Receptor expression-enhancing protein 6 Proteins 0.000 description 1
- 101001074528 Homo sapiens Regulating synaptic membrane exocytosis protein 1 Proteins 0.000 description 1
- 101001079096 Homo sapiens Regulator of G-protein signaling 9-binding protein Proteins 0.000 description 1
- 101001094531 Homo sapiens Reticulon-4-interacting protein 1, mitochondrial Proteins 0.000 description 1
- 101001132674 Homo sapiens Retina and anterior neural fold homeobox protein 2 Proteins 0.000 description 1
- 101000710852 Homo sapiens Retinal cone rhodopsin-sensitive cGMP 3',5'-cyclic phosphodiesterase subunit gamma Proteins 0.000 description 1
- 101000899806 Homo sapiens Retinal guanylyl cyclase 1 Proteins 0.000 description 1
- 101000945390 Homo sapiens Retinal rod rhodopsin-sensitive cGMP 3',5'-cyclic phosphodiesterase subunit gamma Proteins 0.000 description 1
- 101001078886 Homo sapiens Retinaldehyde-binding protein 1 Proteins 0.000 description 1
- 101000854044 Homo sapiens Retinitis pigmentosa 1-like 1 protein Proteins 0.000 description 1
- 101001104199 Homo sapiens Retinitis pigmentosa 9 protein Proteins 0.000 description 1
- 101000729271 Homo sapiens Retinoid isomerohydrolase Proteins 0.000 description 1
- 101000742938 Homo sapiens Retinol dehydrogenase 12 Proteins 0.000 description 1
- 101000742950 Homo sapiens Retinol dehydrogenase 5 Proteins 0.000 description 1
- 101000665873 Homo sapiens Retinol-binding protein 3 Proteins 0.000 description 1
- 101000731730 Homo sapiens Rho guanine nucleotide exchange factor 18 Proteins 0.000 description 1
- 101000611338 Homo sapiens Rhodopsin Proteins 0.000 description 1
- 101000829506 Homo sapiens Rhodopsin kinase GRK1 Proteins 0.000 description 1
- 101000609947 Homo sapiens Rod cGMP-specific 3',5'-cyclic phosphodiesterase subunit alpha Proteins 0.000 description 1
- 101000609949 Homo sapiens Rod cGMP-specific 3',5'-cyclic phosphodiesterase subunit beta Proteins 0.000 description 1
- 101001106432 Homo sapiens Rod outer segment membrane protein 1 Proteins 0.000 description 1
- 101000901226 Homo sapiens S-arrestin Proteins 0.000 description 1
- 101000650820 Homo sapiens Semaphorin-4A Proteins 0.000 description 1
- 101001041393 Homo sapiens Serine protease HTRA1 Proteins 0.000 description 1
- 101000629622 Homo sapiens Serine-pyruvate aminotransferase Proteins 0.000 description 1
- 101000628575 Homo sapiens Serine/threonine-protein kinase 19 Proteins 0.000 description 1
- 101000979098 Homo sapiens Serine/threonine-protein kinase MAK Proteins 0.000 description 1
- 101000601441 Homo sapiens Serine/threonine-protein kinase Nek2 Proteins 0.000 description 1
- 101000601460 Homo sapiens Serine/threonine-protein kinase Nek4 Proteins 0.000 description 1
- 101001120990 Homo sapiens Short-wave-sensitive opsin 1 Proteins 0.000 description 1
- 101000652369 Homo sapiens Spermatogenesis-associated protein 7 Proteins 0.000 description 1
- 101000716933 Homo sapiens Sterile alpha motif domain-containing protein 11 Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 101000837443 Homo sapiens T-complex protein 1 subunit beta Proteins 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- 101000666429 Homo sapiens Terminal nucleotidyltransferase 5C Proteins 0.000 description 1
- 101000759882 Homo sapiens Tetraspanin-12 Proteins 0.000 description 1
- 101000845196 Homo sapiens Tetratricopeptide repeat protein 8 Proteins 0.000 description 1
- 101000785523 Homo sapiens Tight junction protein ZO-2 Proteins 0.000 description 1
- 101000831496 Homo sapiens Toll-like receptor 3 Proteins 0.000 description 1
- 101000669447 Homo sapiens Toll-like receptor 4 Proteins 0.000 description 1
- 101000904152 Homo sapiens Transcription factor E2F1 Proteins 0.000 description 1
- 101001121409 Homo sapiens Transcription factor Ovo-like 2 Proteins 0.000 description 1
- 101000894525 Homo sapiens Transforming growth factor-beta-induced protein ig-h3 Proteins 0.000 description 1
- 101000844510 Homo sapiens Transient receptor potential cation channel subfamily M member 1 Proteins 0.000 description 1
- 101000631620 Homo sapiens Translocation protein SEC63 homolog Proteins 0.000 description 1
- 101000640713 Homo sapiens Transmembrane protein 126A Proteins 0.000 description 1
- 101000772173 Homo sapiens Tubby-related protein 1 Proteins 0.000 description 1
- 101000658486 Homo sapiens Tubulin polyglutamylase TTLL5 Proteins 0.000 description 1
- 101000610640 Homo sapiens U4/U6 small nuclear ribonucleoprotein Prp3 Proteins 0.000 description 1
- 101000610557 Homo sapiens U4/U6 small nuclear ribonucleoprotein Prp31 Proteins 0.000 description 1
- 101000577737 Homo sapiens U4/U6 small nuclear ribonucleoprotein Prp4 Proteins 0.000 description 1
- 101000659545 Homo sapiens U5 small nuclear ribonucleoprotein 200 kDa helicase Proteins 0.000 description 1
- 101000910482 Homo sapiens Uroporphyrinogen decarboxylase Proteins 0.000 description 1
- 101000805943 Homo sapiens Usher syndrome type-1G protein Proteins 0.000 description 1
- 101000805941 Homo sapiens Usherin Proteins 0.000 description 1
- 101000860430 Homo sapiens Versican core protein Proteins 0.000 description 1
- 101000760747 Homo sapiens Very long-chain specific acyl-CoA dehydrogenase, mitochondrial Proteins 0.000 description 1
- 101000803709 Homo sapiens Vitronectin Proteins 0.000 description 1
- 101000867848 Homo sapiens Voltage-dependent L-type calcium channel subunit alpha-1F Proteins 0.000 description 1
- 101000740765 Homo sapiens Voltage-dependent calcium channel subunit alpha-2/delta-4 Proteins 0.000 description 1
- 101000666127 Homo sapiens Whirlin Proteins 0.000 description 1
- 101001104102 Homo sapiens X-linked retinitis pigmentosa GTPase regulator Proteins 0.000 description 1
- 101001104110 Homo sapiens X-linked retinitis pigmentosa GTPase regulator-interacting protein 1 Proteins 0.000 description 1
- 101000976608 Homo sapiens Zinc finger protein 408 Proteins 0.000 description 1
- 101000785684 Homo sapiens Zinc finger protein 513 Proteins 0.000 description 1
- 101000883219 Homo sapiens cGMP-gated cation channel alpha-1 Proteins 0.000 description 1
- 241000192019 Human endogenous retrovirus K Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 208000035150 Hypercholesterolemia Diseases 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- FHCNLXMTQJNJNH-KBIXCLLPSA-N Ile-Cys-Gln Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)O FHCNLXMTQJNJNH-KBIXCLLPSA-N 0.000 description 1
- VCYVLFAWCJRXFT-HJPIBITLSA-N Ile-Cys-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N VCYVLFAWCJRXFT-HJPIBITLSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- LNJLOZYNZFGJMM-DEQVHRJGSA-N Ile-His-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N LNJLOZYNZFGJMM-DEQVHRJGSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102100021602 Inosine-5'-monophosphate dehydrogenase 1 Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102100039096 Interphotoreceptor matrix proteoglycan 1 Human genes 0.000 description 1
- 102100039092 Interphotoreceptor matrix proteoglycan 2 Human genes 0.000 description 1
- 102100039927 Intraflagellar transport protein 140 homolog Human genes 0.000 description 1
- 102100039343 Intraflagellar transport protein 27 homolog Human genes 0.000 description 1
- 101710119233 Intraflagellar transport protein 27 homolog Proteins 0.000 description 1
- 102100030001 Intraflagellar transport protein 81 homolog Human genes 0.000 description 1
- 102100022843 Inward rectifier potassium channel 13 Human genes 0.000 description 1
- 102100021311 Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Human genes 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 102100024407 Jouberin Human genes 0.000 description 1
- 101710029140 KIAA1549 Proteins 0.000 description 1
- 102100023682 Kelch-like protein 15 Human genes 0.000 description 1
- 102100027789 Kelch-like protein 7 Human genes 0.000 description 1
- 102100023967 Keratin, type I cytoskeletal 12 Human genes 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 102100027017 Latent-transforming growth factor beta-binding protein 2 Human genes 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 102100027443 Lebercilin Human genes 0.000 description 1
- 102100033356 Lecithin retinol acyltransferase Human genes 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- 102100021803 Leucine zipper transcription factor-like protein 1 Human genes 0.000 description 1
- 102100033290 Leucine-rich repeat, immunoglobulin-like domain and transmembrane domain-containing protein 3 Human genes 0.000 description 1
- 102100023339 Leucine-tRNA ligase, cytoplasmic Human genes 0.000 description 1
- 102100027064 Lipoamide acyltransferase component of branched-chain alpha-keto acid dehydrogenase complex, mitochondrial Human genes 0.000 description 1
- 102100035576 Long-wave-sensitive opsin 1 Human genes 0.000 description 1
- 102100021926 Low-density lipoprotein receptor-related protein 5 Human genes 0.000 description 1
- 102000006830 Luminescent Proteins Human genes 0.000 description 1
- 108010047357 Luminescent Proteins Proteins 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- CAVGLNOOIFHJOF-SRVKXCTJSA-N Lys-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N CAVGLNOOIFHJOF-SRVKXCTJSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- MSSABBQOBUZFKZ-IHRRRGAJSA-N Lys-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O MSSABBQOBUZFKZ-IHRRRGAJSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 102100038056 Lysophosphatidylserine lipase ABHD12 Human genes 0.000 description 1
- 102100025613 Major facilitator superfamily domain-containing protein 8 Human genes 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102220486635 Mannose-1-phosphate guanyltransferase beta_S56A_mutation Human genes 0.000 description 1
- 102100030412 Matrix metalloproteinase-9 Human genes 0.000 description 1
- 102100026300 McKusick-Kaufman/Bardet-Biedl syndromes putative chaperonin Human genes 0.000 description 1
- 102100026048 Meckel syndrome type 1 protein Human genes 0.000 description 1
- 102100026047 Meckelin Human genes 0.000 description 1
- 108010093662 Member 11 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102100030351 Membrane-associated phosphatidylinositol transfer protein 3 Human genes 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 1
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 1
- 102100038300 Metabotropic glutamate receptor 6 Human genes 0.000 description 1
- 102100031676 Metal transporter CNNM4 Human genes 0.000 description 1
- 102100026261 Metalloproteinase inhibitor 3 Human genes 0.000 description 1
- 108091062140 Mir-223 Proteins 0.000 description 1
- 108010058682 Mitochondrial Proteins Proteins 0.000 description 1
- 102000006404 Mitochondrial Proteins Human genes 0.000 description 1
- 108010066419 Multidrug Resistance-Associated Protein 2 Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 108010009047 Myosin VIIa Proteins 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- 102100032618 N-acetylglutamate synthase, mitochondrial Human genes 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 102100038625 NADH-ubiquinone oxidoreductase chain 1 Human genes 0.000 description 1
- 102100021506 NADH-ubiquinone oxidoreductase chain 4 Human genes 0.000 description 1
- 102100028386 NADH-ubiquinone oxidoreductase chain 6 Human genes 0.000 description 1
- 102100039210 NBAS subunit of NRZ tethering complex Human genes 0.000 description 1
- 101150079937 NEUROD1 gene Proteins 0.000 description 1
- 102100029565 NPC intracellular cholesterol transporter 1 Human genes 0.000 description 1
- 102100022737 NPC intracellular cholesterol transporter 2 Human genes 0.000 description 1
- 102100034268 Neural retina-specific leucine zipper protein Human genes 0.000 description 1
- 101710181914 Neural retina-specific leucine zipper protein Proteins 0.000 description 1
- 102220532308 Neural retina-specific leucine zipper protein_P51L_mutation Human genes 0.000 description 1
- 108700020297 NeuroD Proteins 0.000 description 1
- 102100032063 Neurogenic differentiation factor 1 Human genes 0.000 description 1
- 102100034451 Nicotinamide/nicotinic acid mononucleotide adenylyltransferase 1 Human genes 0.000 description 1
- 101710202677 Non-specific lipid-transfer protein Proteins 0.000 description 1
- 102000001756 Notch2 Receptor Human genes 0.000 description 1
- 108010029751 Notch2 Receptor Proteins 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102100035399 Nucleoredoxin-like protein 1 Human genes 0.000 description 1
- 102100030098 Oncostatin-M-specific receptor subunit beta Human genes 0.000 description 1
- 102100025410 Oral-facial-digital syndrome 1 protein Human genes 0.000 description 1
- 101710148753 Ornithine aminotransferase Proteins 0.000 description 1
- 102100027177 Ornithine aminotransferase, mitochondrial Human genes 0.000 description 1
- 102100036201 Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Human genes 0.000 description 1
- 108010032788 PAX6 Transcription Factor Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102100022769 POC1 centriolar protein homolog B Human genes 0.000 description 1
- 101150045883 POMGNT1 gene Proteins 0.000 description 1
- 102100037506 Paired box protein Pax-6 Human genes 0.000 description 1
- 102100040375 Peripherin-2 Human genes 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- PDUVELWDJZOUEI-IHRRRGAJSA-N Phe-Cys-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PDUVELWDJZOUEI-IHRRRGAJSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 102100039032 Phosphatidylcholine translocator ABCB4 Human genes 0.000 description 1
- 102100030999 Phosphoglucomutase-1 Human genes 0.000 description 1
- 102100022428 Phospholipid transfer protein Human genes 0.000 description 1
- 102100033616 Phospholipid-transporting ATPase ABCA1 Human genes 0.000 description 1
- 102100036620 Phospholipid-transporting ATPase ABCA7 Human genes 0.000 description 1
- 102100030448 Phospholipid-transporting ATPase IC Human genes 0.000 description 1
- 102100040826 Photoreceptor disk component PRCD Human genes 0.000 description 1
- 102100029533 Photoreceptor-specific nuclear receptor Human genes 0.000 description 1
- 102100036090 Pituitary homeobox 2 Human genes 0.000 description 1
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 1
- 101710189720 Porphobilinogen deaminase Proteins 0.000 description 1
- 101710170827 Porphobilinogen deaminase, chloroplastic Proteins 0.000 description 1
- 102100033492 Potassium voltage-gated channel subfamily V member 2 Human genes 0.000 description 1
- 102100021232 Pre-mRNA-processing factor 6 Human genes 0.000 description 1
- 102100021231 Pre-mRNA-processing-splicing factor 8 Human genes 0.000 description 1
- 102100028729 Pre-mRNA-splicing factor ATP-dependent RNA helicase PRP16 Human genes 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- DIZLUAZLNDFDPR-CIUDSAMLSA-N Pro-Cys-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 DIZLUAZLNDFDPR-CIUDSAMLSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- 101710119292 Probable D-lactate dehydrogenase, mitochondrial Proteins 0.000 description 1
- 102100023084 Probable cationic amino acid transporter Human genes 0.000 description 1
- 101710100896 Probable porphobilinogen deaminase Proteins 0.000 description 1
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 1
- 102100040120 Prominin-1 Human genes 0.000 description 1
- 102100036002 Protein FAM161A Human genes 0.000 description 1
- 102100023602 Protein Hook homolog 1 Human genes 0.000 description 1
- 102100036226 Protein O-linked-mannose beta-1,2-N-acetylglucosaminyltransferase 1 Human genes 0.000 description 1
- 102100037873 Protein PTHB1 Human genes 0.000 description 1
- 102100029276 Protein RD3 Human genes 0.000 description 1
- 102100033154 Protein XRP2 Human genes 0.000 description 1
- 101710098761 Protein alpha-1 Proteins 0.000 description 1
- 102100027331 Protein crumbs homolog 1 Human genes 0.000 description 1
- 102100037166 Protein eyes shut homolog Human genes 0.000 description 1
- 102100040970 Protein fantom Human genes 0.000 description 1
- 102100032702 Protein jagged-1 Human genes 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 102100036228 Protein unc-119 homolog A Human genes 0.000 description 1
- 102100036382 Protocadherin-15 Human genes 0.000 description 1
- 102100029028 Protoporphyrinogen oxidase Human genes 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 102100022881 Rab proteins geranylgeranyltransferase component A 1 Human genes 0.000 description 1
- 102100035582 Ral-GDS-related protein Human genes 0.000 description 1
- 102100034489 Ras-related protein Rab-28 Human genes 0.000 description 1
- 101001000628 Rattus norvegicus Peripheral myelin protein 22 Proteins 0.000 description 1
- 102100021075 Receptor expression-enhancing protein 6 Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100036240 Regulating synaptic membrane exocytosis protein 1 Human genes 0.000 description 1
- 102100030814 Regulator of G-protein signaling 9 Human genes 0.000 description 1
- 102100028148 Regulator of G-protein signaling 9-binding protein Human genes 0.000 description 1
- 241001068263 Replication competent viruses Species 0.000 description 1
- 102100035121 Reticulon-4-interacting protein 1, mitochondrial Human genes 0.000 description 1
- 102100033908 Retina and anterior neural fold homeobox protein 2 Human genes 0.000 description 1
- 102100033844 Retinal cone rhodopsin-sensitive cGMP 3',5'-cyclic phosphodiesterase subunit gamma Human genes 0.000 description 1
- 102100022663 Retinal guanylyl cyclase 1 Human genes 0.000 description 1
- 102100033597 Retinal rod rhodopsin-sensitive cGMP 3',5'-cyclic phosphodiesterase subunit gamma Human genes 0.000 description 1
- 102100028001 Retinaldehyde-binding protein 1 Human genes 0.000 description 1
- 102100035670 Retinitis pigmentosa 1-like 1 protein Human genes 0.000 description 1
- 102100040073 Retinitis pigmentosa 9 protein Human genes 0.000 description 1
- 102100031176 Retinoid isomerohydrolase Human genes 0.000 description 1
- 102100038054 Retinol dehydrogenase 12 Human genes 0.000 description 1
- 102100038053 Retinol dehydrogenase 5 Human genes 0.000 description 1
- 102100032432 Rho guanine nucleotide exchange factor 18 Human genes 0.000 description 1
- 102100040756 Rhodopsin Human genes 0.000 description 1
- 102100023742 Rhodopsin kinase GRK1 Human genes 0.000 description 1
- 102100039177 Rod cGMP-specific 3',5'-cyclic phosphodiesterase subunit alpha Human genes 0.000 description 1
- 102100039174 Rod cGMP-specific 3',5'-cyclic phosphodiesterase subunit beta Human genes 0.000 description 1
- 102100021424 Rod outer segment membrane protein 1 Human genes 0.000 description 1
- 102100022135 S-arrestin Human genes 0.000 description 1
- 108091006697 SLC24A1 Proteins 0.000 description 1
- 108091006418 SLC25A13 Proteins 0.000 description 1
- 108091006299 SLC2A2 Proteins 0.000 description 1
- 108091006976 SLC40A1 Proteins 0.000 description 1
- 108091006246 SLC7A14 Proteins 0.000 description 1
- 108091006730 SLCO1B3 Proteins 0.000 description 1
- 101001053942 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) Diphosphomevalonate decarboxylase Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101000677924 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 40S ribosomal protein S6-A Proteins 0.000 description 1
- 101001114408 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 40S ribosomal protein S6-B Proteins 0.000 description 1
- 101000679735 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L16-A Proteins 0.000 description 1
- 101001128051 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L3 Proteins 0.000 description 1
- 101000733871 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L4-A Proteins 0.000 description 1
- 101000733875 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L4-B Proteins 0.000 description 1
- 101000853650 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L8-A Proteins 0.000 description 1
- 101000853649 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L8-B Proteins 0.000 description 1
- 101000732916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L9-A Proteins 0.000 description 1
- 101000732903 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) 60S ribosomal protein L9-B Proteins 0.000 description 1
- 108091061939 Selfish DNA Proteins 0.000 description 1
- 102100027718 Semaphorin-4A Human genes 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 102100021119 Serine protease HTRA1 Human genes 0.000 description 1
- 102100026842 Serine-pyruvate aminotransferase Human genes 0.000 description 1
- 102100026757 Serine/threonine-protein kinase 19 Human genes 0.000 description 1
- 102100023230 Serine/threonine-protein kinase MAK Human genes 0.000 description 1
- 102100037703 Serine/threonine-protein kinase Nek2 Human genes 0.000 description 1
- 102100037705 Serine/threonine-protein kinase Nek4 Human genes 0.000 description 1
- 241000702208 Shigella phage SfX Species 0.000 description 1
- 102100026557 Short-wave-sensitive opsin 1 Human genes 0.000 description 1
- 102100036947 Sodium/potassium/calcium exchanger 1 Human genes 0.000 description 1
- 102100023537 Solute carrier family 2, facilitated glucose transporter member 2 Human genes 0.000 description 1
- 102100032008 Solute carrier family 40 member 1 Human genes 0.000 description 1
- 102100027239 Solute carrier organic anion transporter family member 1B3 Human genes 0.000 description 1
- 102100030257 Spermatogenesis-associated protein 7 Human genes 0.000 description 1
- 101000942604 Sphingomonas wittichii (strain DC-6 / KACC 16600) Chloroacetanilide N-alkylformylase, oxygenase component Proteins 0.000 description 1
- 101710168938 Sphingosine-1-phosphate phosphatase 2 Proteins 0.000 description 1
- 102100020927 Sterile alpha motif domain-containing protein 11 Human genes 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 102100028679 T-complex protein 1 subunit beta Human genes 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 108700012457 TACSTD2 Proteins 0.000 description 1
- 102000003617 TRPM1 Human genes 0.000 description 1
- 102100038305 Terminal nucleotidyltransferase 5C Human genes 0.000 description 1
- 102100024991 Tetraspanin-12 Human genes 0.000 description 1
- 102100031271 Tetratricopeptide repeat protein 8 Human genes 0.000 description 1
- 101150050472 Tfr2 gene Proteins 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102100026637 Tight junction protein ZO-2 Human genes 0.000 description 1
- 108010031429 Tissue Inhibitor of Metalloproteinase-3 Proteins 0.000 description 1
- 102100024324 Toll-like receptor 3 Human genes 0.000 description 1
- 102100039360 Toll-like receptor 4 Human genes 0.000 description 1
- 108010057666 Transcription Factor CHOP Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102100024026 Transcription factor E2F1 Human genes 0.000 description 1
- 102100026385 Transcription factor Ovo-like 2 Human genes 0.000 description 1
- 102100026143 Transferrin receptor protein 2 Human genes 0.000 description 1
- 102100021398 Transforming growth factor-beta-induced protein ig-h3 Human genes 0.000 description 1
- 102100029006 Translocation protein SEC63 homolog Human genes 0.000 description 1
- 102100033846 Transmembrane protein 126A Human genes 0.000 description 1
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 1
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- WACMTVIJWRNVSO-CWRNSKLLSA-N Trp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O WACMTVIJWRNVSO-CWRNSKLLSA-N 0.000 description 1
- RERIQEJUYCLJQI-QRTARXTBSA-N Trp-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERIQEJUYCLJQI-QRTARXTBSA-N 0.000 description 1
- QUIXRGCMQOXUSV-SZMVWBNQSA-N Trp-Pro-Pro Chemical compound O=C([C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O QUIXRGCMQOXUSV-SZMVWBNQSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 1
- QJIOKZXDGFZQJP-OYDLWJJNSA-N Trp-Trp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QJIOKZXDGFZQJP-OYDLWJJNSA-N 0.000 description 1
- 102100029293 Tubby-related protein 1 Human genes 0.000 description 1
- 102100034856 Tubulin polyglutamylase TTLL5 Human genes 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102100040247 Tumor necrosis factor Human genes 0.000 description 1
- 102100027212 Tumor-associated calcium signal transducer 2 Human genes 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- SEFNTZYRPGBDCY-IHRRRGAJSA-N Tyr-Arg-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O SEFNTZYRPGBDCY-IHRRRGAJSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 1
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- 102100022356 Tyrosine-protein kinase Mer Human genes 0.000 description 1
- 102100040374 U4/U6 small nuclear ribonucleoprotein Prp3 Human genes 0.000 description 1
- 102100040118 U4/U6 small nuclear ribonucleoprotein Prp31 Human genes 0.000 description 1
- 102100028852 U4/U6 small nuclear ribonucleoprotein Prp4 Human genes 0.000 description 1
- 102100036230 U5 small nuclear ribonucleoprotein 200 kDa helicase Human genes 0.000 description 1
- 108010067922 UDP-Glucuronosyltransferase 1A9 Proteins 0.000 description 1
- 102100040198 UDP-glucuronosyltransferase 1-6 Human genes 0.000 description 1
- 102100029152 UDP-glucuronosyltransferase 1A1 Human genes 0.000 description 1
- 101710205316 UDP-glucuronosyltransferase 1A1 Proteins 0.000 description 1
- 102100029161 UDP-glucuronosyltransferase 1A4 Human genes 0.000 description 1
- 101710205490 UDP-glucuronosyltransferase 1A4 Proteins 0.000 description 1
- 102100029159 UDP-glucuronosyltransferase 1A5 Human genes 0.000 description 1
- 101710205342 UDP-glucuronosyltransferase 1A5 Proteins 0.000 description 1
- 102100040213 UDP-glucuronosyltransferase 1A7 Human genes 0.000 description 1
- 101710205340 UDP-glucuronosyltransferase 1A7 Proteins 0.000 description 1
- 102100040210 UDP-glucuronosyltransferase 1A8 Human genes 0.000 description 1
- 102100040212 UDP-glucuronosyltransferase 1A9 Human genes 0.000 description 1
- 101710008381 UGT1A6 Proteins 0.000 description 1
- 108010074998 UGT1A8 UDP-glucuronosyltransferase Proteins 0.000 description 1
- 102100022865 UPF0606 protein KIAA1549 Human genes 0.000 description 1
- 102100031835 Unconventional myosin-VIIa Human genes 0.000 description 1
- 102100024118 Uroporphyrinogen decarboxylase Human genes 0.000 description 1
- 108020000963 Uroporphyrinogen-III synthase Proteins 0.000 description 1
- 102100034397 Uroporphyrinogen-III synthase Human genes 0.000 description 1
- 102100037929 Usher syndrome type-1G protein Human genes 0.000 description 1
- 102100037930 Usherin Human genes 0.000 description 1
- 102100031083 Uteroglobin Human genes 0.000 description 1
- 108090000203 Uteroglobin Proteins 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 102100028437 Versican core protein Human genes 0.000 description 1
- 102100024591 Very long-chain specific acyl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- 102100035140 Vitronectin Human genes 0.000 description 1
- 102100037053 Voltage-dependent calcium channel subunit alpha-2/delta-4 Human genes 0.000 description 1
- 102100038102 Whirlin Human genes 0.000 description 1
- 102100040092 X-linked retinitis pigmentosa GTPase regulator Human genes 0.000 description 1
- 102100040089 X-linked retinitis pigmentosa GTPase regulator-interacting protein 1 Human genes 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 102100023554 Zinc finger protein 408 Human genes 0.000 description 1
- 102100026525 Zinc finger protein 513 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000023445 activated T cell autonomous cell death Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 201000011340 autosomal recessive nonsyndromic deafness 31 Diseases 0.000 description 1
- 208000035257 autosomal recessive nonsyndromic hearing loss 31 Diseases 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960000182 blood factors Drugs 0.000 description 1
- 108010018804 c-Mer Tyrosine Kinase Proteins 0.000 description 1
- 102100038623 cGMP-gated cation channel alpha-1 Human genes 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 208000022843 carbamoyl phosphate synthetase I deficiency disease Diseases 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000009087 cell motility Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000004640 cellular pathway Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 201000000406 cone-rod dystrophy 17 Diseases 0.000 description 1
- 238000004624 confocal microscopy Methods 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 230000024346 drought recovery Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 108010078428 env Gene Products Proteins 0.000 description 1
- 108700004025 env Genes Proteins 0.000 description 1
- 101150030339 env gene Proteins 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 1
- 208000001672 exudative vitreoretinopathy 3 Diseases 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 101150055960 hemB gene Proteins 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 230000007154 intracellular accumulation Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000008606 intracellular interaction Effects 0.000 description 1
- 230000037041 intracellular level Effects 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010084957 lecithin-retinol acyltransferase Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 206010025135 lupus erythematosus Diseases 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 108010045758 lysosomal proteins Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- LBCGUKCXRVUULK-QGZVFWFLSA-N n-[2-(1,3-benzodioxol-5-yl)ethyl]-1-[2-(1h-imidazol-1-yl)-6-methylpyrimidin-4-yl]-d-prolinamide Chemical compound N=1C(C)=CC(N2[C@H](CCC2)C(=O)NCCC=2C=C3OCOC3=CC=2)=NC=1N1C=CN=C1 LBCGUKCXRVUULK-QGZVFWFLSA-N 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 108010000402 nucleolar phosphoprotein p130 Proteins 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 208000009689 optic atrophy 4 Diseases 0.000 description 1
- 208000006042 optic atrophy 5 Diseases 0.000 description 1
- 208000006497 optic atrophy 6 Diseases 0.000 description 1
- 208000012242 optic atrophy 8 Diseases 0.000 description 1
- 210000002220 organoid Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 210000004986 primary T-cell Anatomy 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 230000007026 protein scission Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 108010064950 regulator of g-protein signaling 9 Proteins 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000028617 response to DNA damage stimulus Effects 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108010071065 ribosomal protein 29 Proteins 0.000 description 1
- 102200070544 rs202198133 Human genes 0.000 description 1
- 102220242537 rs762217448 Human genes 0.000 description 1
- 102220340490 rs782578166 Human genes 0.000 description 1
- 230000037390 scarring Effects 0.000 description 1
- 230000037387 scars Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000003001 serine protease inhibitor Substances 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 102000034285 signal transducing proteins Human genes 0.000 description 1
- 108091006024 signal transducing proteins Proteins 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000035892 strand transfer Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 1
- CXVGEDCSTKKODG-UHFFFAOYSA-N sulisobenzone Chemical compound C1=C(S(O)(=O)=O)C(OC)=CC(O)=C1C(=O)C1=CC=CC=C1 CXVGEDCSTKKODG-UHFFFAOYSA-N 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07049—RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
본 개시내용은 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법 및 조성물을 제공한다. PASTE는 표적 게놈으로 통합 부위의 첨가 후, 상기 부위에 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열의 삽입을 포함한다. PASTE는 유전자 편집 기술과 인테그라제 기술을 결합하여 질환의 치료 및 질환의 진단을 위한 게놈에서 유전자의 단방향 혼입을 달성한다.
Description
관련 출원에 대한 상호 참조
이 출원은 2021년 7월 16일에 출원된 미국 가특허 출원 제63/222,550호 및 2020년 10월 21일에 출원된 미국 가특허 출원 제63/094,803호의 이점을 주장한다. 상기 참조된 특허 출원의 전체 내용은 전체가 본원에 참조로 포함된다.
개시 분야
본원에 개시된 주제는 일반적으로 질환의 치료 및 진단을 위한 부위 특이적 표적화(targeting) 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물에 관한 것이다.
CRISPR-Cas(클러스터링된 규칙적인 간격의 짧은 회문(palindromic) 반복-CRISPR 관련 단백질) 면역의 RNA 유도 DNA 표적화 원리를 사용하는 게놈 편집이 널리 활용되어 왔으며, 매우 다양한 적용을 위한 강력한 게놈 편집 수단이 되었다. CRISPR-Cas 시스템의 주요 장점은 프로그램 가능한 DNA 간섭에 대한 최소한의 요구 사항: 맞춤형 이중 RNA 구조에 의해 유도된 Cas9, Cas12, 또는 임의의 프로그램 가능한 뉴클레아제와 같은 엔도뉴클레아제에 있다. Cas9는 표적 가닥을 절단하기 위해 HNH 뉴클레아제 도메인을 사용하는 다중도메인 효소이다. CRISPR/Cas9 단백질-RNA 복합체는 가이드 RNA(가이드 RNA)에 의해 표적에 국소화된 다음, 절단되어 DNA 이중 가닥 파단 (dsDNA 파단, DSB)을 생성한다. 절단 후, DNA 복구 메커니즘은 절단된 가닥을 복구하기 위해 활성화된다. 복구 메커니즘은 일반적으로 두 가지 유형: 비상동성 말단 결합(NHEJ) 또는 상동성 재조합(HR) 중 하나이다. 일반적으로, NHEJ는 복구를 지배하고, 오류가 발생하기 쉽고, 랜덤 indel(삽입 또는 결실)을 생성하여 특히 프레임 시프트 돌연변이를 유발한다. 대조적으로, HR은 보다 정밀한 복구 능력을 가지며 잠재적으로 정확한 치환 또는 삽입을 혼입할 수 있다. HR을 향상시키기 위해, 몇 가지 기술, 예를 들어, DSB에서 그들의 국소화를 시행하기 위해 Cas9 뉴클레아제의 융합 단백질과 상동성 지시된 복구(HDR) 이펙터의 조합, 중첩 상동성 암의 도입 또는 NHEJ의 억제가 시도되었다. 이러한 기술의 대부분은 숙주 DNA 복구 시스템에 의존한다.
최근에, 가이드 프라임 편집자(PE) PEI, PE2 및 PE3과 같은 새로운 가이드화 편집자가 개발되었다(참조: Liu, D. et al., Nature 2019, 576, 149-157). 이들 PE는 Cas 9H 840A 니카아제(Cas9n (H840A))와 융합되는 역전사 효소(RT)이고, 게놈 편집은 프라임 편집 가이드 RNA(pegRNA)를 사용하여 달성된다. 이러한 발전에도 불구하고, 프로그램 가능한 유전자 통합은 여전히 일반적으로 세포 경로 또는 복구 과정에 의존적이다.
따라서, 유전자 편집 및 전달을 위한 보다 효과적인 도구가 필요하다.
요약
본 개시내용은 핵산을 세포 게놈(cell genome)으로 부위 특이적으로 통합(site-specific integration)하는 방법을 제공한다. 상기 방법은 역전사 효소 도메인(reverse transcriptase domain)에 연결된 DNA 결합 뉴클레아제를 세포에 도입함으로써 세포 게놈의 목적하는 위치에 통합 부위를 혼입하는 단계를 포함하고, 여기서 DNA 결합 뉴클레아제는 니카아제 활성; 및 통합 서열에 연결된 프라이머 결합 서열을 포함하는 가이드 RNA(gRNA)를 포함하며, 여기서 gRNA는 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적으로 하고, 여기서 DNA 결합 뉴클레아제는 세포 게놈의 가닥을 니킹(nicking)하고 역전사 효소 도메인은 gRNA의 통합 서열을 니킹된 부위에 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공한다. 상기 방법은 통합 부위에 상보적이거나 회합(associating)된 서열에 연결된 핵산을 포함하는 DNA 또는 RNA 가닥, 및 통합 효소를 세포로 도입함으로써 핵산을 세포 게놈에 통합하는 단계를 추가로 포함하고, 여기서 통합 효소는 통합 부위에 상보적이거나 회합된 서열의 통합, 재조합 또는 역 전사에 의해 통합 부위에서 핵산을 세포 게놈에 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치로 도입한다.
일부 구현예에서, gRNA는 DNA 결합 뉴클레아제에 의해 니킹된 게놈 가닥에 대한 세포 게놈의 상보적인 가닥에 혼성화될 수 있다.
일부 구현예에서, 통합 효소는 펩티드 또는 이를 암호화(encoding)하는 핵산으로서 도입될 수 있다.
일부 구현예에서, DNA 결합 뉴클레아제는 펩티드 또는 이를 암호화하는 핵산으로서 도입될 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 미니서클(minicircle), 플라스미드, mRNA 또는 선형 DNA로서 세포 내로 도입될 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 1000 bp 내지 10,000 bp일 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 10,000 bp 초과일 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA 또는 RNA 가닥은 1000 bp 미만일 수 있다.
일부 구현예에서, 핵산을 포함하는 DNA는 미니서클로서 세포 내로 도입될 수 있다.
일부 구현예에서, 미니서클은 박테리아 기원의 서열을 포함할 수 없다.
일부 구현예에서, DNA 결합 뉴클레아제는 역전사 효소 도메인에 연결될 수 있고, 통합 효소는 링커(linker)를 통해 연결될 수 있다. 링커는 절단 가능할 수 있다. 링커는 비절단 가능할 수 있다. 링커는 역전사 효소에 연결된 DNA 결합 뉴클레아제의 2개의 회합 결합 도메인으로 대체될 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠(Doom), 스카울(Scowl), 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰(Sheen), 문드레아(Mundrea), BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르(Himar) 1), 마리너(모스(mos) 1) 및 미노스에 의해 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
일부 구현예에서, 통합 부위는 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위, Vox 부위, 또는 FRT 부위로부터 선택될 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A, 및 Cas12a/b 니카아제로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소 도메인은 몰로니 뮤린(Moloney Murine) 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT), 및 유박테리움 렉탈레 마투라제 RT(마라톤RT(MarathonRT))로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소 도메인은 야생형 서열에 대한 돌연변이를 포함할 수 있다.
일부 구현예에서, M-MLV 역전사 효소 도메인은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 상기 방법은 제2 니킹 가이드 RNA(ngRNA)를 도입하는 단계를 추가로 포함할 수 있다. ngRNA는 상보적인 가닥 상에서 gRNA 닉의 하류 90 염기에서 니킹을 지시할 수 있다.
일부 구현예에서, gRNA, DNA 결합 뉴클레아제를 암호화하는 핵산, 역전사 효소, 상보적 통합 부위에 연결된 핵산을 포함하는 DNA, 통합 효소, 및 임의로 ngRNA는 단일 반응으로 세포 내로 도입될 수 있다.
일부 구현예에서, gRNA, DNA 결합 뉴클레아제를 암호화하는 핵산, 역전사 효소, 상보적 통합 부위에 연결된 핵산을 포함하는 DNA, 통합 효소, 및 임의로 ngRNA는 바이러스, RNP, mRNA, 지질, 또는 중합체성 나노 입자를 사용하여 도입될 수 있다.
일부 구현예에서, 핵산은 리포터 유전자(reporter gene)일 수 있다. 리포터 유전자는 형광 단백질일 수 있다.
일부 구현예에서, 세포는 분열 세포(dividing cell)일 수 있다.
일부 구현예에서, 세포는 비분열 세포일 수 있다.
일부 구현예에서, 세포 게놈에서 목적하는 위치는 돌연변이된 유전자의 유전자좌(locus)일 수 있다.
일부 구현예에서, 핵산은 소분자의 존재하에서 단백질의 프로그램 가능한 녹다운을 위한 분해 태그(degradation tag)일 수 있다.
일부 구현예에서, 세포는 포유류 세포, 박테리아 세포 또는 식물 세포일 수 있다.
일부 구현예에서, 핵산은 T-세포 또는 자연 살해(NK) 세포로의 통합을 위한 T-세포 수용체(TCR), 키메라 항원 수용체(CAR), 인터류킨, 사이토카인, 또는 면역 체크포인트 유전자(immune checkpoint gene)일 수 있다. TCR, CAR, 인터류킨, 사이토카인, 또는 면역 체크포인트 유전자는 미니서클 DNA를 사용하여 T-세포 또는 NK 세포 게놈의 표적 부위에 혼입될 수 있다.
일부 구현예에서, 핵산은 베타 헤모글로빈(HBB) 유전자일 수 있고, 세포는 조혈 줄기 세포(HSC)일 수 있다. HBB 유전자는 미니서클 DNA를 사용하여 HSC 게놈에서 표적 부위에 혼입될 수 있다. 핵산은 베타 지중해 빈혈(beta thalassemia) 또는 겸상 적혈구 빈혈(sickle cell anemia)을 담당하는 유전자일 수 있다.
일부 구현예에서, 핵산은 대사 유전자일 수 있다. 대사 유전자는 알파-1 항트립신 결핍 또는 오르니틴 트랜스카르바밀라제(OTC) 결핍에 관여할 수 있다. 대사 유전자는 유전된 질환에 관여하는 유전자일 수 있다.
일부 구현예에서, 핵산은 유전된 질환 또는 유전된 증후군에 관여하는 유전자일 수 있다. 유전된 질환은 낭포성 섬유증(cystic fibrosis), 가족성 고콜레스테롤혈증(familial hypercholesterolemia), 아데노신 데아미나제(ADA) 결핍, X-연결 SCID(X-SCID), 위스콧-알드리치 증후군(Wiskott-Aldrich syndrome; WAS), 혈색소 침착증(hemochromatosis), 테이-삭스병(Tay-Sachs), 취약 X 증후군(fragile X syndrome), 헌팅턴병(Huntington's disease), 마르판 증후군(Marfan syndrome), 페닐케톤뇨증(phenylketonuria), 또는 근위축증(muscular dystrophy)일 수 있다.
본 개시내용은 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터(vector)를 제공한다.
일부 구현예에서, 링커는 절단 가능할 수 있다.
일부 구현예에서, 링커는 비-절단 가능할 수 있다.
일부 구현예에서, 링커는 역전사 효소에 연결된 DNA 결합 뉴클레아제의 두 개의 회합 결합 도메인을 포함할 수 있다.
일부 구현예에서, 통합 효소는 조건부 활성화 도메인 또는 조건부 발현 도메인을 포함할 수 있다.
일부 구현예에서, 통합 효소는 에스트로겐 수용체에 융합될 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소는 M-MLV 역전사 효소, AMV-RT, 마라톤RT, 또는 RTX일 수 있다. 역전사 효소는 야생형 M-MLV 역전사 효소에 대해 변형된(modified) M-MLV 역전사 효소일 수 있다. M-MLV 역전사 효소 도메인은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 재조합 효소 또는 인테그라제는 Bxb1 또는 이의 돌연변이체일 수 있다.
본 개시내용은 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터를 포함하는 세포를 제공한다. 세포는 프라이머 결합 서열, 통합 서열, 및 가이드 서열을 포함하는 gRNA를 추가로 포함하며, 여기서 gRNA는 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있다. 세포는 핵산 및 암호화된 인테그라제, 재조합 효소 또는 역전사 효소에 의해 인식된 서열을 포함하는 DNA 미니서클을 추가로 포함한다. 세포는 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)를 추가로 포함하고, 여기서 ngRNA는 gRNA로부터 떨어진 서열을 표적으로 한다.
일부 구현예에서, 미니서클은 박테리아 기원의 서열을 포함할 수 없다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소는 M-MLV 역전사 효소일 수 있다. 역전사 효소는 변형된 M-MLV 역전사 효소일 수 있다. M-MLV 역전사 효소의 아미노산 서열은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 세포는 세포에 ngRNA를 도입하는 단계를 추가로 포함할 수 있다. ngRNA는 +90 ngRNA일 수 있다. +90 ngRNA는 상보적인 가닥 상에서 gRNA 닉의 하류 90 염기에서 니킹을 지시할 수 있다.
본 개시내용은 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 포함하는 폴리펩티드를 제공한다.
일부 구현예에서, 링커는 절단 가능할 수 있다.
일부 구현예에서, 링커는 비-절단 가능할 수 있다.
일부 구현예에서, 통합 효소는 에스트로겐 수용체에 융합될 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 역전사 효소는 M-MLV 역전사 효소, AMV-RT, 마라톤RT, 또는 XRT일 수 있다. 역전사 효소는 야생형 M-MLV 역전사 효소에 대한 변형된 M-MLV일 수 있다. M-MLV 역전사 효소 도메인은 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함할 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
본 개시내용은 니카아제 활성을 포함하는 DNA 결합 뉴클레아제에 특이적으로 결합하는 gRNA를 제공하고, 상기 gRNA는 니킹된 DNA 가닥에 혼성화하는 프라이머 결합 부위, 통합 효소를 위한 인식 부위, 및 세포 게놈에서 표적 부위를 인식하고 DNA 결합 뉴클레아제에 의해 니킹된 가닥에 상보적인 게놈 가닥에 혼성화하는 표적 인식 서열을 포함한다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 프라이머 결합 부위는 니킹된 DNA 가닥의 3' 말단에 혼성화될 수 있다.
일부 구현예에서, 통합 효소를 위한 인식 부위는 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위 및 FRT 부위로부터 선택될 수 있다.
일부 구현예에서, 통합 효소를 위한 인식 부위는 Bxb1 부위일 수 있다.
본 개시내용은 2개 이상의 핵산을 세포 게놈에 부위 특이적으로 통합시키는 방법을 제공한다. 상기 방법은 역전사 효소 도메인에 연결된 DNA 결합 뉴클레아제를 세포에 도입함으로써 세포 게놈의 목적하는 위치에 두 개의 통합 부위를 혼입하는 단계를 포함하고, 여기서 DNA 결합 뉴클레아제는 니카아제 활성, 및 각각 고유한 통합 서열에 연결된 프라이머 결합 서열을 포함하는 2개의 가이드 RNA(gRNA)을 포함하고, 여기서 gRNA는 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적화 하며, 여기서 DNA 결합 뉴클레아제는 세포 게놈의 가닥을 니킹하고, 역전사 효소 도메인은 니킹된 부위로 gRNA의 각 통합 서열을 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공한다. 상기 방법은 핵산을 포함하는 2개 이상의 DNA 또는 RNA를 세포에 도입함으로써 핵산을 통합하는 단계를 추가로 포함하고, 여기서 각 DNA는 직교 통합 부위(orthogonal integration site), 및 통합 효소에 의해 측면화되고, 통합 효소는 통합 부위에 상보적이거나 회합되는 서열의 인테그라제, 재조합 효소 또는 역전사 효소에 의해 통합 부위에서 세포 게놈에 핵산을 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치에 도입한다.
일부 구현예에서, 세포 게놈에 삽입된 두 개의 상이한 통합 부위 각각은 상이한 회문 또는 비회문 중심 디뉴클레오티드를 포함하는 attB 서열일 수 있다.
일부 구현예에서, 세포 게놈에 삽입된 두 개의 상이한 통합 부위 각각은 상이한 회문 또는 비회문 중심 디뉴클레오티드를 포함하는 attP 서열일 수 있다.
일부 구현예에서, 통합 효소는 핵산을 포함하는 두 개 이상의 DNA 또는 RNA 각각이 한 쌍의 직교 attB 부위 서열과 attP 부위 서열의 재조합을 통해 게놈 내로 핵산의 통합을 방향적으로 가능하게 하도록 할 수 있다.
일부 구현예에서, 통합 효소는 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R1, R2, R3, R4, R5, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 통합 효소는 Bxb1 또는 이의 돌연변이체일 수 있다.
일부 구현예에서, 유전자를 포함하는 DNA는 세포 유지 경로, 세포-분열 또는 신호 전달 경로에 관여하는 유전자일 수 있다.
일부 구현예에서, 역전사 효소 도메인은 몰로니 뮤린 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT), 또는 유박테리움 렉탈레 마투라제 RT(마라톤RT)를 포함할 수 있다.
일부 구현예에서, 니카아제 활성을 포함하는 DNA 결합 뉴클레아제는 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, attB 부위 서열 및 attP 부위 서열의 쌍은 서열번호 5 및 서열번호 6, 서열번호 7 및 서열번호 8, 서열번호 9 및 서열번호 10, 서열번호 11 및 서열번호 12, 서열번호 13 및 서열번호 14, 서열번호 15 및 서열번호 16, 서열번호 17 및 서열번호 18, 서열번호 19 및 서열번호 20, 서열번호 21 및 서열번호 22, 서열번호 23 및 서열번호 24, 서열번호 25 및 서열번호 26, 서열번호 27 및 서열번호 28, 서열번호 29 및 서열번호 30, 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 34, 및 서열번호 35 및 서열번호 36으로 이루어진 그룹으로부터 선택될 수 있다.
본 개시내용은 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터를 포함하는 세포를 제공하고, 여기서 DNA 결합 뉴클레아제는 역전사 효소에 C-말단 연결되며, 여기서 역전사 효소는 링커를 통해 재조합 효소 또는 인테그라제에 연결된다. 세포는 프라이머 결합 서열, 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)를 추가로 포함하고, 여기서 gRNA는 니카아제 활성을 포함하는 암호화된 DNA 결합 뉴클레아제와 상호작용할 수 있다. 세포는 핵산을 포함하는 두 개 이상의 DNA 또는 RNA 가닥 및 암호화된 인테그라제 또는 재조합 효소에 의해 인식된 측면에 있는(flanked) attB 부위 서열 및 attP 부위 서열의 쌍을 추가로 포함한다. 세포는 임의로 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)를 추가로 포함하고, 여기서 ngRNA는 gRNA로부터 떨어진 서열을 표적으로 한다.
본 개시내용은 변형된 게놈을 포함하는 세포를 제공하며, 여기서 변형은 세포 내로 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터; 각각 프라이머 결합 서열, 게놈 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 두 개의 가이드 RNA(gRNA); 및 임의로 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA)를 도입함으로써 세포 게놈 내에 두 개의 직교 통합 부위의 혼입을 포함한다.
본 개시내용은 두 개 이상의 핵산을 제90항의 세포의 세포 게놈에 통합하는 방법을 제공하고, 상기 방법은 세포에 각각 핵산과 한 쌍의 측면에 있는 직교 통합 부위 서열을 포함하는 둘 이상의 DNA; 핵산을 포함하는 둘 이상의 DNA의 방향적 연결을 가능하게 하는 통합 부위 서열을 인식할 수 있는 통합 효소; 및 제1 DNA의 5' 직교 통합 서열과 제1 게놈 통합 서열을, 마지막 DNA의 3' 직교 통합 서열과 마지막 게놈 통합 서열을 통합하여 둘 이상의 핵산을 세포 게놈에 혼입시킴으로써 세포 게놈에 핵산의 혼입을 가능하게 함을 도입하는 단계를 포함한다.
본 개시내용은 변형된 게놈을 포함하는 세포를 제공하고, 여기서 상기 변형은 세포에 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터; 각각 프라이머 결합 서열, 게놈 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 두 개의 가이드 RNA(gRNA); 및 임의로 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합시킬 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA); 핵산을 포함하는 둘 이상의 DNA 또는 RNA로서, 각각의 DNA가 직교 통합 부위에 의해 측면에 있는 둘 이상의 DNA 또는 RNA; 및 통합 효소로서, 상기 통합 효소가 통합 부위에서 세포 게놈 내로 핵산을 혼입하는, 통합 효소를 도입함으로써 세포 게놈 내에 두 개의 직교 통합 부위의 혼입을 포함한다.
본원에 기재된 구현예의 측면, 특징, 이점 및 장점은 다음의 설명, 첨부된 청구범위 및 동반되는 다음 도면과 관련하여 명백할 것이다:
도 1은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)의 개념의 개략도를 도시하고;
도 2는 본 교시의 구현예에 따른 프라임 편집 과정을 개략도를 도시하고;
도 3은 본 교시의 구현예에 따른 다양한 플라스미드의 존재하에 HEK293FT 세포주 내의 렌티바이러스 통합 lox71 부위에서 녹색 형광 단백질(GFP)의 퍼센트 통합을 도시하고;
도 4는 본 교시의 구현예에 따른 다양한 길이의 lox71 또는 lox66의 통합을 위한 HEK293FT 게놈의 퍼센트 편집을 도시하고;
도 5a는 본 교시의 구현예에 따른 상이한 PE/Cre 벡터를 갖는 lox71 부위의 퍼센트 편집을 도시하고;
도 5b는 본 교시의 구현예에 따른 HEK293FT 세포 게놈 내의 lox71 부위에서 GFP의 퍼센트 통합을 도시하고;
도 6은 본 교시의 구현예에 따른 게놈에 핵산을 통합하기 위해 Bxb1을 사용하는 개략적인 표현을 도시하고;
도 7은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 Bxb1 프로그램 가능한 첨가(PASTE)를 사용하여 attB 유전자좌 내로의 GFP 또는 Gluc의 퍼센트 통합을 도시하고;
도 8은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 다양한 HEK3 표적화 pegRNA 프로그램 가능한 첨가(PASTE)의 퍼센트 편집을 도시하고;
도 9a는 SUPT16H 마커가 본 교시의 구현예에 따른 PASTE를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9b는 SRRM2 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9c는 LAMNB1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9d는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9e는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9f는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9g는 DEPDC4 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 10a는 본 교시의 구현예에 따른 PASTE를 사용하여 게놈 내의 ACTB N-말단 부위에서 Bxb1 attB 부위의 첨가를 위한 적색의 전기천공 보조 형질감염과 청색의 리포펙타민 보조 형질감염의 비교를 도시하고;
도 10b는 본 교시의 구현예에 따른 PASTE를 사용하여 게놈 내의 ACTB N-말단 부위에서 EGFP 통합을 위한 전기천공 보조 형질감염과 청색의 리포펙타민 보조 형질감염의 비교를 도시하고;
도 11은 본 교시의 구현예에 따른 다양한 HEK3 표적화 pegRNA와 EGFP 및 Gluc의 통합의 다이어그램을 도시하고;
도 12는 본 교시의 구현예에 따른 통합 효소로서 C31을 사용하는 개략도를 도시하고;
도 13은 본 교시의 구현예에 따라 외부 측면 attB 부위를 혼입한 고유한 가이드 RNA를 사용하여 다중 유전자좌에 관심 있는 다수의 유전자를 삽입하는 것을 포함하는 다중화의 개략도를 도시하고;
도 14a는 본 교시의 구현예에 따른 우측 GT-EGFP에 의한 직교 편집의 다이어그램을 도시하고;
도 14b는 본 교시의 구현예에 따른 우측 GA-mCherry에 의한 직교 편집의 다이어그램을 도시하고;
도 15a는 본 교시의 구현예에 따른 ACTB-EGFP 및 NOLC1-mCherry의 다중화의 형광 이미지를 도시하고;
도 15b는 본 교시의 구현예에 따른 ACTB-EGFP 및 LAMNB1-mCherry의 다중화의 형광 이미지를 도시하고;.
도 16a는 9X9 attP 및 attB 중심 디뉴클레오티드 변이체의 차세대 서열분석 결과 및 이들의 편집 백분율을 도시하고, 여기서 잠재적 다중화 적용을 위한 attB/attP 조합의 직교성은 본 교시의 구현예에 따라 도시되고;
도 16b는 본 교시의 구현예에 따른 9X9 attP 및 attB 중심 디뉴클레오티드 변이체의 히트맵 및 이들의 편집 백분율을 도시하고;
도 17은 본 교시의 구현예에 따른 HEK293FT 세포에서 알부민 가이드-pegRNA를 사용하는 세르피나 및 CPS1의 알부민 유전자좌로의 통합을 도시하고;
도 18은 본 교시의 구현예에 따른 T-세포를 조작하기 위한 상이한 핵산의 개략도를 도시하고;
도 19는 본 교시의 구현예에 따른 1차 T-세포 내의 ACTB 유전자좌에서 EGFP 통합을 위한 편집 효율을 도시하고;
도 20은 본 교시의 구현예에 따른 상이한 pegRNA를 갖는 HEK293FT의 TRAC 유전자좌에서의 편집을 도시하고;
도 21a는 본 교시의 구현예에 따른 니킹 가이드 1 및 2를 사용하여 ACTB 유전자좌에서의 attB 통합을 도시하고;
도 21b는 본 교시의 구현예에 따른 니킹 가이드 1 및 2를 사용하여 ACTB 유전자좌에서의 EGFP 통합을 도시하고;
도 21c는 본 교시의 구현예에 따른 ACTB 부위에서 EGFP 통합을 도시하고;
도 22a는 본 교시의 구현예에 따른 간 간세포 암종 세포주 HEPG2에서 PASTE 편집을 도시하고;
도 22b는 본 교시의 구현예에 따른 만성 골수성 백혈병 세포주 K562의 PASTE 편집을 도시하고;
도 23a는 본 교시의 구현예에 따른 표적화 및 비-표적화 가이드에 의한 attB 첨가를 도시하고;
도 23b는 본 교시의 구현예에 따른 표적화 및 비표적화 가이드와 EGFP 통합을 도시하고;
도 23c는 본 교시의 구현예에 따른 돌연변이화된 Bxb1에 대한 EGFP 통합을 도시하고;
도 24a는 본 교시의 구현예에 따른 pegRNA에 대한 설계 파라미터의 개략도를 도시하고;
도 24b는 본 교시의 구현예에 따른 니킹 가이드 RNA에 대한 설계 파라미터의 개략도를 도시하고;
도 25a는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 ACTD 유전자좌에서의 EGFP의 통합을 도시하고;
도 25b는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 LMNB1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25c는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 NOLC1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25d는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이 및 상이한 니킹 가이드를 갖는 GRSF1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25e는 본 교시의 구현예에 따른 돌연변이체 attP 부위와의 EGFP 통합을 도시하고;
도 25f는 본 교시의 구현예에 따른 유전자의 확장된 패널의 PASTE 편집을 도시하고;
도 26a는 본 교시의 구현예에 따른 ACTB 유전자좌에서의 PASTE EGPF 편집을 도시하고;
도 26b는 본 교시의 구현예에 따른 ACTB 유전자좌에서의 HITI EGPF 편집을 도시하고;
도 26c는 본 교시의 구현예에 따른 14개 유전자의 패널을 편집하는 PASTE와 HITI 사이의 비교를 도시하고;
도 26d는 본 교시의 구현예에 따른 PASTE Bxb1 표적외 통합을 도시하고;
도 26e는 본 교시의 구현예에 따른 PASTE Cas9 표적외 통합을 도시하고;
도 26f는 본 교시의 구현예에 따른 상이한 크기의 유전자 삽입물에 대한 EGFP 통합을 도시하고;
도 27a는 본 교시의 구현예에 따른 선택된 attB 및 attP 부위 세트 사이의 직교성을 도시하고;
도 27b는 본 교시의 구현예에 따른 선택된 attB 및 attP 부위 세트 사이의 직교성을 도시하고;
도 27c는 본 교시의 구현예에 따른 조작된 디뉴클레오티드 조합을 사용하는 직교 PASTE 편집을 위한 개략도를 도시하고;
도 28a는 본 교시의 구현예에 따른 PASTE에 의한 ACTB 및 SUPT16H 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28b는 본 교시의 구현예에 따른 PASTE에 의한 NOLC1 및 SRRM2 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28c는 본 교시의 구현예에 따른 PASTE에 의한 LMNB1 및 DEBDC4 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28d는 본 교시의 구현예에 따른 PASTE에 의한 3개의 내인성 부위에서 직교 유전자 통합을 도시하고;
도 28e는 본 교시의 구현예에 따른 PASTE를 통해 3개의 내인성 부위에서 1-플렉스, 2-플렉스, 및 3-플렉스 유전자 삽입을 통한 다중화된 삽입을 도시하고;
도 28f는 본 교시의 구현예에 따른 PASTE를 사용하는 ACTB (EGFP) 및 NOLC1 (mCherry)의 다중화된 유전자 태깅을 갖는 두 개의 단일 세포의 형광 이미지를 도시하고;
도 28g는 본 교시의 구현예에 따른 PASTE를 사용하는 ACTB (EGFP) 및 LMNB1 (mCherry)의 다중화된 유전자 태깅을 갖는 두 개의 단일 세포의 형광 이미지를 도시하고;
도 29a는 본 교시의 구현예에 따른 ACTB 유전자좌에서 Bxb1 attB 부위 삽입의 프라임 편집 효율을 도시하고;
도 29b는 본 교시의 구현예에 따른 ACTB 유전자좌에서 상이한 길이의 Bxb1 attB 부위를 삽입하는 데 있어서의 프라임 편집 효율을 도시하고;
도 29c는 상이한 인테그라제로부터 attB 서열을 삽입하는 프라임 편집 효율을 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29d는 Bxb1 인테그라제 및 Cre 재조합 효소로부터 attB 서열을 삽입하는 프라임 편집 효율을 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29e는 본 교시의 구현예에 따른 가이드 및 표적 서열을 나타내는 ACTB 유전자좌에 PASTE 삽입의 개략도를 도시한다. 도 29e는 출현 순서로 각각 서열번호 428-431을 개시하고;
도 29f는 ACTB 유전자좌의 5' 말단을 표적으로 하는 인테그라제의 패널과 GFP의 PASTE 통합 효율의 비교를 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29g는 본 교시의 구현예에 따른 Bxb1 인테그라제와 Cre 재조합 효소 사이의 GFP 카고 통합 효율의 비교를 도시하고;
도 29h는 본 교시의 구현예에 따른 상이한 프라임 및 인테그라제 성분에 대한 PASTE 편집 활성의 의존성을 도시하고;
도 29i는 본 교시의 구현예에 따른 인테그라제 효율에 대한 단일 벡터 PASTE 시스템(SpCas9-RT-P2A-Bxb1)의 적정을 도시하고;
도 29j는 본 교시의 구현예에 따른 내인성 ACTB 표적에서 PASTE 삽입 효율에 대한 카고 크기의 효과를 도시하고;
도 29k는 본 교시의 구현예에 따른 다수의 카고 크기에 대한 PASTE에 의한 완전한 삽입을 보여주는 겔 전기영동을 도시하고;
도 30a는 생성된 결과적인 attR 및 attL 부위 및 본 교시의 구현예에 따른 통합 접합부를 검정하기 위한 PCR 프라이머를 포함하는, PASTE 통합의 개략도를 도시하고;
도 30b는 ACTB 유전자좌에서 GFP의 PASTE 삽입으로부터 좌측 통합 접합부의 PCR 및 겔 전기영동 판독 값을 도시하고, 여기서 삽입은 프레임내 및 프레임외 GFP 통합 실험뿐만 아니라 비프라임 대조군에 대해 분석되고, PCR 단편의 예상 크기는 본 교시의 구현예에 따라 서브 패널 도 30a의 개략도에 도시된 프라이머를 사용하여 도시되고;
도 30c는 ACTB 유전자좌에서 GFP의 PASTE 삽입으로부터 우측 통합 접합부의 PCR 및 겔 전기영동 판독 값을 도시하고, 여기서 삽입은 프레임내 및 프레임외 GFP 통합 실험뿐만 아니라 비프라임 대조군에 대해 분석되고, PCR 단편의 예상 크기는 본 교시의 구현예에 따라 서브 패널 도 30a의 개략도에 도시된 프라이머를 사용하여 도시되고;
도 30d는 본 교시의 구현예에 따른 ACTB의 N-말단에 대한 PASTE를 통한 GFP의 프레임내 융합을 위한 우측 통합 접합부에 대해 제시된 생어 서열분석을 도시하고;
도 30e는 본 교시의 구현예에 따른 ACTB의 N-말단에 대한 PASTE를 통한 GFP의 프레임내 융합을 위한 좌측 통합 접합부에 대해 제시된 생어 서열분석을 도시하고;
도 31a는 약 1kb GFP 삽입물의 PASTE 통합에 영향을 미치는 다양한 파라미터의 개략도를 도시하고, 여기서 pegRNA 상에서, PBS, RT, 및 attB 길이는 attB 삽입의 효율을 변경할 수 있고, 니킹 가이드 선택은 또한 본 교시의 구현예에 따른 전체 유전자 통합 효율에 영향을 미치고;
도 31b는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합에 대한 PBS 및 RT 길이의 영향을 도시하고;
도 31c는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합에 대한 PBS 및 RT 길이의 영향을 도시하고;
도 31d는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31e는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31f는 본 교시의 구현예에 따른 NOLC1 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31g는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합 효율에 대한 최소한의 PBS, RT, 및 attB 길이의 영향을 도시하고;
도 31h는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합 효율에 대한 최소한의 PBS, RT, 및 attB 길이의 영향을 도시하고;
도 31i는 본 교시의 구현예에 따른 보다 긴 pegRNA 설계와 비교하여 니킹 가이드, 프라임, 및 Bxb1의 존재 및 부재하에 38 bp attB를 함유하는 최소 압축 pegRNA에 의한 LMNB1 유전자좌에서 GFP의 PASTE 통합을 도시하고;
도 32a는 본 교시의 구현예에 따른 두 개의 상이한 니킹 가이드 설계에 의한 ACTB 및 LMNB1 유전자좌에서 PASTE 삽입 효율을 도시하고;
도 32b는 표적 및 비표적화 스페이서 및 본 교시의 구현예에 따른 Bxb1 발현을 포함하거나 포함하지 않는 매칭된 pegRNA에 의한 ACTB 및 LMNB1에서 PASTE 편집 효율을 도시하고;
도 33a는 본 교시의 구현예에 따른 상이한 Bxb1 촉매 돌연변이체에 의한 ACTB 유전자좌에서 GFP의 PASTE 통합을 도시하고;
도 33b는 본 교시의 구현예에 따른 상이한 RT 촉매 돌연변이체에 의한 ACTB 유전자좌에서 GFP의 PASTE의 통합을 도시하고;
도 34a는 본 교시의 구현예에 따른 내인성 게놈 유전자좌의 패널에서 PASTE에 의한 GFP 통합을 도시하고;
도 34b는 본 교시의 구현예에 따른 PASTE를 통해 ACTB 유전자좌에서 상이한 유전자 카고의 패널의 통합을 도시하고;
도 34c는 본 교시의 구현예에 따른 ACTB 유전자좌에서 치료학적으로 관련된 유전자의 통합 효율을 도시하고;
도 34d는 본 교시의 구현예에 따른 ACTB 유전자좌와 SRRM2 유전자좌에서 프레임내 내인성 유전자 태깅에 의한 PASTE를 통한 GFP를 이용하는 내인성 단백질 태깅을 도시하고;
도 34e는 본 교시의 구현예에 따른 NOLC1 유전자좌 및 LMNB1 유전자좌에서 프레임내 내인성 유전자 태깅에 의한 PASTE를 통한 GFP를 이용하는 내인성 단백질 태깅을 도시하고;
도 35는 본 교시의 구현예에 따른 PASTE를 통한 LMNB1 유전자좌에서 상이한 유전자 카고의 패널의 통합을 도시하고;
도 36a는 본 교시의 구현예에 따른 ACTB 유전자좌에서 5kb GFP 주형을 사용하는 16개의 중심 디뉴클레오티드 attB/attP 서열 쌍 모두에 대한 PASTE 통합 효율을 도시하고;
도 36b는 풀링된 attB/attP 디뉴클레오티드 직교성 검정의 개략도를 도시하며, 여기서 각 attB 디뉴클레오티드 서열은 모든 16개의 디뉴클레오티드 서열 및 Bxb1 인테그라제의 바코딩된 풀로 공동-형질감염되고, 상대적 통합 효율은 바코드의 차세대 서열분석에 의해 결정되고, 모든 16개의 attB 디뉴클레오티드는 본 교시의 구현예에 따라 attP 풀에 의해 배열된 형태로 프로파일링되고;
도 36c는 본 교시의 구현예에 따른 풀링된 직교성 검정에 의해 결정된 모든 가능한 attB/attP 디뉴클레오티드 쌍에 대한 상대적 삽입 선호도를 도시하고;
도 36d는 본 교시의 구현예에 따른 ACTB 유전자좌에서 PASTE에 의한 GFP 통합에 대해 평가된 상위 4개의 attB/attP 디뉴클레오티드 쌍의 직교성을 도시하고;
도 37은 풀링된 리포터 검정에 의해 측정된 바와 같은 Bxb1 디뉴클레오티드의 직교성을 도시하고, 여기서 각 웹 로고 모티프는 본 교시의 구현예에 따른 나열된 디뉴클레오티드와 함께 표기된 attB 서열에서 풀에서의 상이한 attP 서열의 상대적 통합을 보여주고;
도 38a는 특정 게놈 유전자좌에서 상이한 카고 세트의 다중화 통합의 개략도를 도시하고, 여기서 3개의 형광 카고(GFP, mCherry, 및 YFP)는 본 교시의 구현예에 따른 프레임내 유전자 태깅을 위한 3개의 상이한 유전자좌(ACTB, LMNB1, NOLC1)에 직교로 삽입되며;
도 38b는 본 교시의 구현예에 따른 ACTB, LMNB1 및 NOLC1 유전자좌에서 형광단 조합의 다중화된 PASTE 삽입의 효율을 도시하고;
도 39a는 본 교시의 구현예에 따른 상동성-독립적 표적화 통합(HITI)에 의한 삽입율과 비교하여 PASTE에 의한 게놈 유전자좌의 패널에서의 GFP 통합 효율을 도시하고;
도 39b는 ACTB 및 LMNB1 표적 부위에서 PASTE와 HITI에 의한 의도하지 않은 indel 생성의 비교를 도시하고, 여기서 의도하지 않은 indel과 비교하여 관찰된 표적 상 EGFP 통합 비율은 본 교시의 구현예에 따라 제시되고;
도 39c는 동일한 표적에서 상동성-지시된 복구(HDR)와 비교하여 ACTB 유전자좌에서 PASTE에 의한 GFP 주형의 통합을 도시하고, 여기서 정량화는 단일 세포 클론 계수에 의한 것이며, 표적화 및 비표적화 가이드는 HDR 삽입용으로 사용되었고, 여기서 PASTE의 경우 표적화 및 비표적화는 본 교시의 구현예에 따라 각각 SpCas9-RT 단백질의 존재 또는 부재를 지칭하고;
도 39d는 ACTB 표적 부위에서 PASTE 및 HDR 기반 EGFP 삽입에 의한 의도하지 않은 indel 생성의 비교를 도시하고, 여기서 생성된 모든 단일-세포 클론에 걸쳐 측정된 평균 indel 비율은 본 교시의 구현예에 따라 제시되고;
도 39e는 본 교시의 구현예에 따른 Bxb1 및 Cas9 표적외 식별 및 검출 검정을 위한 개략도를 도시하고;
도 39f는 본 교시의 구현예에 따른 인간 게놈에서 예측된 Bxb1 표적외 부위에서 GFP 통합 활성을 도시하고;
도 39g는 본 교시의 구현예에 따라 예측된 PASTE ACTB Cas9 가이드 표적외 부위에서의 GFP 통합 활성을 도시하고;
도 39h는 본 교시의 구현예에 따른 예측된 HITI ACTB Cas9 가이드 표적외 부위에서의 GFP 통합 활성을 도시하고;
도 39i는 본 교시의 구현예에 따른 PASTE에 의한 게놈 전체 표적외 통합 부위를 검정하기 위한 차세대 서열분석 방법의 개략도를 도시하고;
도 39j는 게놈 전체 통합 검정을 사용하여 표적 상 ACTB 부위에서 판독치의 정렬을 도시하고, 여기서 예상되는 표적 상 통합 결과는 본 교시의 구현예에 따라 제시되고;
도 39k는 본 교시의 구현예에 따른 PASTE에 대한 3개의 단일 세포 클론 및 무프라임 상태에 대한 3개의 단일 세포 클론에 걸친 표적 상 및 표적외 통합 이벤트의 분석을 도시하고;
도 39l은 PASTE 편집에 의한 대표적인 단일 세포 클론에 대한 통합 이벤트의 맨해튼 플롯을 도시하고, 여기서 표적 상의 부위는 본 교시의 구현예에 따르는 염색체 7 상의 ACTB 유전자에 있고;
도 40a는 본 교시의 구현예에 따른 HepG2 세포 중의 ACTB 및 LMNB1 유전자좌에서 EGFP의 PASTE 및 HITI 매개 삽입에 의해 생성된 indel 비율의 비교를 도시하고;
도 40b는 본 교시의 구현예에 따른 합성 앰플리콘을 사용하여 예측된 Bxb1 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 40c는 본 교시의 구현예에 따른 합성 앰플리콘을 사용하여 예측된 PASTE ACTB Cas9 가이드 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 40d는 본 교시의 구현예에 따라 합성 앰플리콘을 사용하여 예측된 HITI ACTB Cas9 가이드 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 41a는 Bxb1 인테그라제, EGFP의 PASTE 표적화 ACTB 통합, 또는 본 교시의 구현예에 따른 Bxb1 발현 없이 EGFP 삽입을 위한 프라임 편집 표적화 ACTB를 발현하는 HEK293FT 세포에서 다수의 유의한 차등적으로 조절된 유전자를 도시하고;
도 41b는 서열분석된 mRNA 대 유의성(p-값)의 배수 발현 변화를 묘사하는 화산 플롯을 도시하고, 여기서 각각의 점은 고유한 mRNA 전사체를 나타내고, 유의한 전사체는 상향조절(적색) 또는 하향조절(청색)에 따라 음영처리되며, 여기서 배수 발현 변화는 본 교시의 구현예에 따라 ACTB-표적화 가이드-단독 발현(카고 포함)에 대해 측정되며;
도 41c는 Bxb1-단독 조건에 대한 상위 유의하게 상향조절 및 하향조절된 유전자를 도시하고, 여기서 유전자는 Bxb1 단독 발현, GFP-단독 발현, EGFP 삽입을 위한 PASTE 표적화 ACTB, Bxb1 없는 EGFP 발현을 위한 프라임 표적화 ACTB, 및 본 교시의 구현예에 따른 가이드/카고 단독을 위한 백만 개당 계수(cpm)의 상응하는 Z-점수로 도시되고;
도 42a는 세포 주기 억제의 존재하에 PASTE 성능을 개략도를 도시하고, 여기서 세포는 PASTE 또는 Cas9 유도 HDR에 의한 삽입을 위한 플라스미드로 형질감염되고, 아피디콜린으로 처리되어 세포 분열을 정지시키고, 여기서 PASTE 및 HDR의 효율은 본 교시의 구현예에 따라 각각 ddPCR 또는 앰플리콘 서열분석으로 판독되고;
도 42b는 본 교시의 구현예에 따른 앰플리콘 서열분석으로 판독된 세포 분열의 존재 또는 부재하에 두 개의 Cas9 가이드를 갖는 EMX1 유전자좌에서 HDR에 의한 단일 돌연변이의 편집 효율을 도시하고;
도 42c는 본 교시의 구현예에 따른 세포 분열의 존재 또는 부재하에 PASTE를갖는 ACTB 유전자좌에서 최대 13.3kb의 다양한 크기의 GFP 삽입물의 통합 효율을 도시하고;
도 42d는 본 교시의 구현예에 따른 K562 세포에서 두 벡터(PE2 및 Bxb1) 및 단일 벡터(PE2-P2A-Bxb1) 설계에 의한 PASTE 편집 효율을 도시하고;
도 42e는 본 교시의 구현예에 따른 1차 인간 T 세포에서 단일 벡터(PE2-P2A-Bxb1) 설계에 의한 PASTE 편집 효율을 도시하고;
도 42f는 본 교시의 구현예에 따른 ACTB 유전자좌에서 치료학적으로 관련된 유전자의 통합 효율을 도시하고;
도 42g는 PASTE 통합된 도입유전자에 대한 단백질 생산 검정의 개략도를 도시하고, 여기서 세르피나1 및 CPS1 도입유전자는 본 교시의 구현예에 따라 ddPCR 및 발광 모두로 판독하기 위해 HIV 루시페라제로 태깅되고;
도 42h는 본 교시의 구현예에 따른 ACTB 유전자좌에서 HEK293FT 세포에서 세르피나1 및 CPS1 도입유전자의 통합 효율을 도시하고;
도 42i는 본 교시의 구현예에 따른 ACTB 유전자좌에서 HEpG2 세포에서 세르피나1 및 CPS1 도입유전자의 통합 효율을 도시하고;
도 42j는 본 교시의 구현예에 따른 HepG2 세포에서 세르피나1-HIBIT 및 CPS1-HIBIT의 세포내 수준을 도시하고;
도 42k는 본 교시의 구현예에 따른 HepG2 세포에서 세르피나1-HIBIT 및 CPS1-HIBIT의 분비된 수준을 도시하고;
도 43a는 본 교시의 구현예에 따라 5μM 아피디콜린 처리에 의해 차단된 비분열 HEK293FT 세포에서 현저하게 감소된 EMX1 유전자좌의 HDR 매개 편집을 도시하고;
도 43b는 본 교시의 구현예에 따라 5μM 아피디콜린 처리에 의해 차단된 분열 및 비분열 HEK293FT 세포에서 ACTB 유전자좌에서의 PASTE-매개 삽입에 대한 삽입 미니서클 DNA 양의 효과를 도시하고;
도 43c는 본 교시의 구현예에 따른 통합 효율의 용량 의존성을 나타내는, AAV를 통해 전달된 GFP 주형에 의한 ACTB 유전자좌에서의 GFP의 PASTE 통합을 도시하고;
도 44a는 정상 PASTE SV40 NLS를 본 교시의 구현예에 따른 c-Myc NLS/가변 이분파 SV40 NLS 설계와 비교하는 3개의 내인성 유전자좌에서의 PASTE 통합 활성을 도시하고;
도 44b는 정상 PASTE SV40 NLS를 본 교시의 구현예에 따른 c-Myc NLS/가변 이분파 SV40 NLS 설계와 비교하는 상이한 GFP 미니서클 주형 양을 갖는 ACTB 유전자좌에서의 PASTE 통합 활성을 도시하고;
도 45는 본 교시의 구현예에 따른 푸로마이신 성장 선택 마커를 사용하는 PASTE 편집 활성의 개선을 도시하고;
도 46a는 본 교시의 구현예에 따른 단백질 발현 루시페라제 검정으로 측정된 바와 같이 HIBIT 태깅된 세르피나1 및 CPS1 유전자의 통합을 도시하고;
도 46b는 표준화된 HIBIT 래더로 정규화되어 본 교시의 구현예에 따른 단백질 수준의 정확한 정량화를 가능하게 하는 단백질 발현 루시페라제 검정으로 측정된 바와 같이 HIBIT 태깅된 세르피나1 및 CPS1 유전자의 통합을 도시하고;
도 47a는 본 교시의 구현예에 따라, ACTB 유전자좌에서의 EGFP 통합을 위한 링커의 패널 및 역전사 효소(RT) 변형을 갖는 PASTE 작제물의 최적화를 도시하고;
도 47b는 내인성 ACTB 표적에서 PASTE 삽입 효율에 대한 카고 크기의 효과를 도시한다. 카고는 본 교시의 구현예에 따라 고정된 몰량으로 형질감염되었고;
도 48a는 본 교시의 구현예에 따라, ACTB에서 상이한 길이 BxbINT AttB 부위의 삽입을 위한 프라임 편집 효율을 도시하고;
도 48b는 본 교시의 구현예에 따라, 표적화 및 비표적화 가이드와 함께 ACTB에서 BxbINT AttB 부위의 삽입을 위한 프라임 편집 효율을 도시하고;
도 48c는 ACTB에서 상이한 인테그라제(Bxb1, Tp9 및 Btl)의 AttB 부위의 삽입을 위한 프라임 편집 효율을 도시한다. 랜딩 부위의 양 방향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방형; R, 역방향);
도 48d는 본 교시의 구현예에 따라, 니킹 가이드를 포함하거나 포함하지 않는 ACTB에서 EGFP의 삽입을 위한 PASTE 편집 효율을 도시하고;
도 49a는 투여량 적정 및 단백질 최적화에 의한 PASTE 편집의 최적화를 도시한다. ACTB에서 EGFP의 PASTE 통합 효율은 성분의 상이한 투여량의 단일 벡터 전달로 측정된다.
도 49b. ACTB에서 EGFP의 PASTE 통합 효율은 EGFP 주형 벡터에 대한 성분의 상이한 비율의 단일 벡터 전달로 측정된다.
도 49c. 상이한 RT 도메인 융합을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49d. 상이한 RT 도메인 융합 및 링커를 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49e. 돌연변이체 RT 도메인을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49f. 돌연변이된 BxbINT 도메인을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 50a. AAV 형질도입을 통해 전달된 삽입 주형. PASTE 편집 기계는 형질감염을 통해 전달되었고, 주형은 표시된 수준에서 AAV 투약을 통해 공동 전달되었다.
도 50b. 3개의 바이러스 벡터를 갖는 완전한 PASTE 시스템의 AdV 전달의 개략도.
도 50c. HEK293FT 및 HepG2 세포에서 인테그라제, 가이드 및 카고의 AdV 전달의 통합 효율. BxbINT 및 가이드 RNA 또는 카고는 플라스미드 형질감염(Pl), AdV 형질도입(AdV)을 통해 전달되거나, 생략되었다(-). SpCas9-RT는 플라스미드로서만 전달되거나 생략되었다.
도 50d. HEK293FT 및 HepG2 세포에서 모든 PASTE 성분의 AdV 전달.
도 50e. PASTE 성분의 mRNA 및 합성 가이드 전달의 개략도.
도 50f. AdV 또는 플라스미드 카고와 쌍을 이루는, mRNA 및 합성 가이드에 의한 PASTE 시스템 성분의 전달.
도 50g. 합성 가이드 및 AdV 또는 플라스미드 카고에 의한 원형 mRNA의 전달.
도 50h. 1차 인간 T 세포에서 단일 벡터 설계에 의한 PASTE 편집 효율.
도 50i. 1차 인간 간세포에서 단일 벡터 설계에 의한 PASTE 편집 효율.
도 51a. attB 서열의 조합 삽입과 함께 LMNB1의 제1 엑손의 130bp 및 385bp 결실을 갖는 LMNB1 유전자좌에서의 PASTE 편집 효율.
도 51b. PASTE 시스템을 사용한 967 bp 카고의 조합 삽입과 함께 LMNB1의 제1 엑손의 130 bp 결실을 갖는 PASTE 편집 효율.
도 1은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)의 개념의 개략도를 도시하고;
도 2는 본 교시의 구현예에 따른 프라임 편집 과정을 개략도를 도시하고;
도 3은 본 교시의 구현예에 따른 다양한 플라스미드의 존재하에 HEK293FT 세포주 내의 렌티바이러스 통합 lox71 부위에서 녹색 형광 단백질(GFP)의 퍼센트 통합을 도시하고;
도 4는 본 교시의 구현예에 따른 다양한 길이의 lox71 또는 lox66의 통합을 위한 HEK293FT 게놈의 퍼센트 편집을 도시하고;
도 5a는 본 교시의 구현예에 따른 상이한 PE/Cre 벡터를 갖는 lox71 부위의 퍼센트 편집을 도시하고;
도 5b는 본 교시의 구현예에 따른 HEK293FT 세포 게놈 내의 lox71 부위에서 GFP의 퍼센트 통합을 도시하고;
도 6은 본 교시의 구현예에 따른 게놈에 핵산을 통합하기 위해 Bxb1을 사용하는 개략적인 표현을 도시하고;
도 7은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 Bxb1 프로그램 가능한 첨가(PASTE)를 사용하여 attB 유전자좌 내로의 GFP 또는 Gluc의 퍼센트 통합을 도시하고;
도 8은 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 다양한 HEK3 표적화 pegRNA 프로그램 가능한 첨가(PASTE)의 퍼센트 편집을 도시하고;
도 9a는 SUPT16H 마커가 본 교시의 구현예에 따른 PASTE를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9b는 SRRM2 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9c는 LAMNB1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9d는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9e는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9f는 NOLC1 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 9g는 DEPDC4 마커가 본 교시의 구현예에 따른 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하여 EGFP로 태깅되는 세포의 형광 이미지를 도시하고;
도 10a는 본 교시의 구현예에 따른 PASTE를 사용하여 게놈 내의 ACTB N-말단 부위에서 Bxb1 attB 부위의 첨가를 위한 적색의 전기천공 보조 형질감염과 청색의 리포펙타민 보조 형질감염의 비교를 도시하고;
도 10b는 본 교시의 구현예에 따른 PASTE를 사용하여 게놈 내의 ACTB N-말단 부위에서 EGFP 통합을 위한 전기천공 보조 형질감염과 청색의 리포펙타민 보조 형질감염의 비교를 도시하고;
도 11은 본 교시의 구현예에 따른 다양한 HEK3 표적화 pegRNA와 EGFP 및 Gluc의 통합의 다이어그램을 도시하고;
도 12는 본 교시의 구현예에 따른 통합 효소로서 C31을 사용하는 개략도를 도시하고;
도 13은 본 교시의 구현예에 따라 외부 측면 attB 부위를 혼입한 고유한 가이드 RNA를 사용하여 다중 유전자좌에 관심 있는 다수의 유전자를 삽입하는 것을 포함하는 다중화의 개략도를 도시하고;
도 14a는 본 교시의 구현예에 따른 우측 GT-EGFP에 의한 직교 편집의 다이어그램을 도시하고;
도 14b는 본 교시의 구현예에 따른 우측 GA-mCherry에 의한 직교 편집의 다이어그램을 도시하고;
도 15a는 본 교시의 구현예에 따른 ACTB-EGFP 및 NOLC1-mCherry의 다중화의 형광 이미지를 도시하고;
도 15b는 본 교시의 구현예에 따른 ACTB-EGFP 및 LAMNB1-mCherry의 다중화의 형광 이미지를 도시하고;.
도 16a는 9X9 attP 및 attB 중심 디뉴클레오티드 변이체의 차세대 서열분석 결과 및 이들의 편집 백분율을 도시하고, 여기서 잠재적 다중화 적용을 위한 attB/attP 조합의 직교성은 본 교시의 구현예에 따라 도시되고;
도 16b는 본 교시의 구현예에 따른 9X9 attP 및 attB 중심 디뉴클레오티드 변이체의 히트맵 및 이들의 편집 백분율을 도시하고;
도 17은 본 교시의 구현예에 따른 HEK293FT 세포에서 알부민 가이드-pegRNA를 사용하는 세르피나 및 CPS1의 알부민 유전자좌로의 통합을 도시하고;
도 18은 본 교시의 구현예에 따른 T-세포를 조작하기 위한 상이한 핵산의 개략도를 도시하고;
도 19는 본 교시의 구현예에 따른 1차 T-세포 내의 ACTB 유전자좌에서 EGFP 통합을 위한 편집 효율을 도시하고;
도 20은 본 교시의 구현예에 따른 상이한 pegRNA를 갖는 HEK293FT의 TRAC 유전자좌에서의 편집을 도시하고;
도 21a는 본 교시의 구현예에 따른 니킹 가이드 1 및 2를 사용하여 ACTB 유전자좌에서의 attB 통합을 도시하고;
도 21b는 본 교시의 구현예에 따른 니킹 가이드 1 및 2를 사용하여 ACTB 유전자좌에서의 EGFP 통합을 도시하고;
도 21c는 본 교시의 구현예에 따른 ACTB 부위에서 EGFP 통합을 도시하고;
도 22a는 본 교시의 구현예에 따른 간 간세포 암종 세포주 HEPG2에서 PASTE 편집을 도시하고;
도 22b는 본 교시의 구현예에 따른 만성 골수성 백혈병 세포주 K562의 PASTE 편집을 도시하고;
도 23a는 본 교시의 구현예에 따른 표적화 및 비-표적화 가이드에 의한 attB 첨가를 도시하고;
도 23b는 본 교시의 구현예에 따른 표적화 및 비표적화 가이드와 EGFP 통합을 도시하고;
도 23c는 본 교시의 구현예에 따른 돌연변이화된 Bxb1에 대한 EGFP 통합을 도시하고;
도 24a는 본 교시의 구현예에 따른 pegRNA에 대한 설계 파라미터의 개략도를 도시하고;
도 24b는 본 교시의 구현예에 따른 니킹 가이드 RNA에 대한 설계 파라미터의 개략도를 도시하고;
도 25a는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 ACTD 유전자좌에서의 EGFP의 통합을 도시하고;
도 25b는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 LMNB1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25c는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이를 갖는 NOLC1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25d는 본 교시의 구현예에 따라 상이한 PBS 및 RT 길이 및 상이한 니킹 가이드를 갖는 GRSF1 유전자좌에서의 EGFP의 통합을 도시하고;
도 25e는 본 교시의 구현예에 따른 돌연변이체 attP 부위와의 EGFP 통합을 도시하고;
도 25f는 본 교시의 구현예에 따른 유전자의 확장된 패널의 PASTE 편집을 도시하고;
도 26a는 본 교시의 구현예에 따른 ACTB 유전자좌에서의 PASTE EGPF 편집을 도시하고;
도 26b는 본 교시의 구현예에 따른 ACTB 유전자좌에서의 HITI EGPF 편집을 도시하고;
도 26c는 본 교시의 구현예에 따른 14개 유전자의 패널을 편집하는 PASTE와 HITI 사이의 비교를 도시하고;
도 26d는 본 교시의 구현예에 따른 PASTE Bxb1 표적외 통합을 도시하고;
도 26e는 본 교시의 구현예에 따른 PASTE Cas9 표적외 통합을 도시하고;
도 26f는 본 교시의 구현예에 따른 상이한 크기의 유전자 삽입물에 대한 EGFP 통합을 도시하고;
도 27a는 본 교시의 구현예에 따른 선택된 attB 및 attP 부위 세트 사이의 직교성을 도시하고;
도 27b는 본 교시의 구현예에 따른 선택된 attB 및 attP 부위 세트 사이의 직교성을 도시하고;
도 27c는 본 교시의 구현예에 따른 조작된 디뉴클레오티드 조합을 사용하는 직교 PASTE 편집을 위한 개략도를 도시하고;
도 28a는 본 교시의 구현예에 따른 PASTE에 의한 ACTB 및 SUPT16H 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28b는 본 교시의 구현예에 따른 PASTE에 의한 NOLC1 및 SRRM2 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28c는 본 교시의 구현예에 따른 PASTE에 의한 LMNB1 및 DEBDC4 유전자의 GFP 태깅의 형광 이미지를 도시하고;
도 28d는 본 교시의 구현예에 따른 PASTE에 의한 3개의 내인성 부위에서 직교 유전자 통합을 도시하고;
도 28e는 본 교시의 구현예에 따른 PASTE를 통해 3개의 내인성 부위에서 1-플렉스, 2-플렉스, 및 3-플렉스 유전자 삽입을 통한 다중화된 삽입을 도시하고;
도 28f는 본 교시의 구현예에 따른 PASTE를 사용하는 ACTB (EGFP) 및 NOLC1 (mCherry)의 다중화된 유전자 태깅을 갖는 두 개의 단일 세포의 형광 이미지를 도시하고;
도 28g는 본 교시의 구현예에 따른 PASTE를 사용하는 ACTB (EGFP) 및 LMNB1 (mCherry)의 다중화된 유전자 태깅을 갖는 두 개의 단일 세포의 형광 이미지를 도시하고;
도 29a는 본 교시의 구현예에 따른 ACTB 유전자좌에서 Bxb1 attB 부위 삽입의 프라임 편집 효율을 도시하고;
도 29b는 본 교시의 구현예에 따른 ACTB 유전자좌에서 상이한 길이의 Bxb1 attB 부위를 삽입하는 데 있어서의 프라임 편집 효율을 도시하고;
도 29c는 상이한 인테그라제로부터 attB 서열을 삽입하는 프라임 편집 효율을 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29d는 Bxb1 인테그라제 및 Cre 재조합 효소로부터 attB 서열을 삽입하는 프라임 편집 효율을 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29e는 본 교시의 구현예에 따른 가이드 및 표적 서열을 나타내는 ACTB 유전자좌에 PASTE 삽입의 개략도를 도시한다. 도 29e는 출현 순서로 각각 서열번호 428-431을 개시하고;
도 29f는 ACTB 유전자좌의 5' 말단을 표적으로 하는 인테그라제의 패널과 GFP의 PASTE 통합 효율의 비교를 도시하고, 여기서 랜딩 부위의 양쪽 배향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방향; R, 역방향);
도 29g는 본 교시의 구현예에 따른 Bxb1 인테그라제와 Cre 재조합 효소 사이의 GFP 카고 통합 효율의 비교를 도시하고;
도 29h는 본 교시의 구현예에 따른 상이한 프라임 및 인테그라제 성분에 대한 PASTE 편집 활성의 의존성을 도시하고;
도 29i는 본 교시의 구현예에 따른 인테그라제 효율에 대한 단일 벡터 PASTE 시스템(SpCas9-RT-P2A-Bxb1)의 적정을 도시하고;
도 29j는 본 교시의 구현예에 따른 내인성 ACTB 표적에서 PASTE 삽입 효율에 대한 카고 크기의 효과를 도시하고;
도 29k는 본 교시의 구현예에 따른 다수의 카고 크기에 대한 PASTE에 의한 완전한 삽입을 보여주는 겔 전기영동을 도시하고;
도 30a는 생성된 결과적인 attR 및 attL 부위 및 본 교시의 구현예에 따른 통합 접합부를 검정하기 위한 PCR 프라이머를 포함하는, PASTE 통합의 개략도를 도시하고;
도 30b는 ACTB 유전자좌에서 GFP의 PASTE 삽입으로부터 좌측 통합 접합부의 PCR 및 겔 전기영동 판독 값을 도시하고, 여기서 삽입은 프레임내 및 프레임외 GFP 통합 실험뿐만 아니라 비프라임 대조군에 대해 분석되고, PCR 단편의 예상 크기는 본 교시의 구현예에 따라 서브 패널 도 30a의 개략도에 도시된 프라이머를 사용하여 도시되고;
도 30c는 ACTB 유전자좌에서 GFP의 PASTE 삽입으로부터 우측 통합 접합부의 PCR 및 겔 전기영동 판독 값을 도시하고, 여기서 삽입은 프레임내 및 프레임외 GFP 통합 실험뿐만 아니라 비프라임 대조군에 대해 분석되고, PCR 단편의 예상 크기는 본 교시의 구현예에 따라 서브 패널 도 30a의 개략도에 도시된 프라이머를 사용하여 도시되고;
도 30d는 본 교시의 구현예에 따른 ACTB의 N-말단에 대한 PASTE를 통한 GFP의 프레임내 융합을 위한 우측 통합 접합부에 대해 제시된 생어 서열분석을 도시하고;
도 30e는 본 교시의 구현예에 따른 ACTB의 N-말단에 대한 PASTE를 통한 GFP의 프레임내 융합을 위한 좌측 통합 접합부에 대해 제시된 생어 서열분석을 도시하고;
도 31a는 약 1kb GFP 삽입물의 PASTE 통합에 영향을 미치는 다양한 파라미터의 개략도를 도시하고, 여기서 pegRNA 상에서, PBS, RT, 및 attB 길이는 attB 삽입의 효율을 변경할 수 있고, 니킹 가이드 선택은 또한 본 교시의 구현예에 따른 전체 유전자 통합 효율에 영향을 미치고;
도 31b는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합에 대한 PBS 및 RT 길이의 영향을 도시하고;
도 31c는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합에 대한 PBS 및 RT 길이의 영향을 도시하고;
도 31d는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31e는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31f는 본 교시의 구현예에 따른 NOLC1 유전자좌에서 GFP의 PASTE 통합에 대한 attB 길이의 영향을 도시하고;
도 31g는 본 교시의 구현예에 따른 ACTB 유전자좌에서 GFP의 PASTE 통합 효율에 대한 최소한의 PBS, RT, 및 attB 길이의 영향을 도시하고;
도 31h는 본 교시의 구현예에 따른 LMNB1 유전자좌에서 GFP의 PASTE 통합 효율에 대한 최소한의 PBS, RT, 및 attB 길이의 영향을 도시하고;
도 31i는 본 교시의 구현예에 따른 보다 긴 pegRNA 설계와 비교하여 니킹 가이드, 프라임, 및 Bxb1의 존재 및 부재하에 38 bp attB를 함유하는 최소 압축 pegRNA에 의한 LMNB1 유전자좌에서 GFP의 PASTE 통합을 도시하고;
도 32a는 본 교시의 구현예에 따른 두 개의 상이한 니킹 가이드 설계에 의한 ACTB 및 LMNB1 유전자좌에서 PASTE 삽입 효율을 도시하고;
도 32b는 표적 및 비표적화 스페이서 및 본 교시의 구현예에 따른 Bxb1 발현을 포함하거나 포함하지 않는 매칭된 pegRNA에 의한 ACTB 및 LMNB1에서 PASTE 편집 효율을 도시하고;
도 33a는 본 교시의 구현예에 따른 상이한 Bxb1 촉매 돌연변이체에 의한 ACTB 유전자좌에서 GFP의 PASTE 통합을 도시하고;
도 33b는 본 교시의 구현예에 따른 상이한 RT 촉매 돌연변이체에 의한 ACTB 유전자좌에서 GFP의 PASTE의 통합을 도시하고;
도 34a는 본 교시의 구현예에 따른 내인성 게놈 유전자좌의 패널에서 PASTE에 의한 GFP 통합을 도시하고;
도 34b는 본 교시의 구현예에 따른 PASTE를 통해 ACTB 유전자좌에서 상이한 유전자 카고의 패널의 통합을 도시하고;
도 34c는 본 교시의 구현예에 따른 ACTB 유전자좌에서 치료학적으로 관련된 유전자의 통합 효율을 도시하고;
도 34d는 본 교시의 구현예에 따른 ACTB 유전자좌와 SRRM2 유전자좌에서 프레임내 내인성 유전자 태깅에 의한 PASTE를 통한 GFP를 이용하는 내인성 단백질 태깅을 도시하고;
도 34e는 본 교시의 구현예에 따른 NOLC1 유전자좌 및 LMNB1 유전자좌에서 프레임내 내인성 유전자 태깅에 의한 PASTE를 통한 GFP를 이용하는 내인성 단백질 태깅을 도시하고;
도 35는 본 교시의 구현예에 따른 PASTE를 통한 LMNB1 유전자좌에서 상이한 유전자 카고의 패널의 통합을 도시하고;
도 36a는 본 교시의 구현예에 따른 ACTB 유전자좌에서 5kb GFP 주형을 사용하는 16개의 중심 디뉴클레오티드 attB/attP 서열 쌍 모두에 대한 PASTE 통합 효율을 도시하고;
도 36b는 풀링된 attB/attP 디뉴클레오티드 직교성 검정의 개략도를 도시하며, 여기서 각 attB 디뉴클레오티드 서열은 모든 16개의 디뉴클레오티드 서열 및 Bxb1 인테그라제의 바코딩된 풀로 공동-형질감염되고, 상대적 통합 효율은 바코드의 차세대 서열분석에 의해 결정되고, 모든 16개의 attB 디뉴클레오티드는 본 교시의 구현예에 따라 attP 풀에 의해 배열된 형태로 프로파일링되고;
도 36c는 본 교시의 구현예에 따른 풀링된 직교성 검정에 의해 결정된 모든 가능한 attB/attP 디뉴클레오티드 쌍에 대한 상대적 삽입 선호도를 도시하고;
도 36d는 본 교시의 구현예에 따른 ACTB 유전자좌에서 PASTE에 의한 GFP 통합에 대해 평가된 상위 4개의 attB/attP 디뉴클레오티드 쌍의 직교성을 도시하고;
도 37은 풀링된 리포터 검정에 의해 측정된 바와 같은 Bxb1 디뉴클레오티드의 직교성을 도시하고, 여기서 각 웹 로고 모티프는 본 교시의 구현예에 따른 나열된 디뉴클레오티드와 함께 표기된 attB 서열에서 풀에서의 상이한 attP 서열의 상대적 통합을 보여주고;
도 38a는 특정 게놈 유전자좌에서 상이한 카고 세트의 다중화 통합의 개략도를 도시하고, 여기서 3개의 형광 카고(GFP, mCherry, 및 YFP)는 본 교시의 구현예에 따른 프레임내 유전자 태깅을 위한 3개의 상이한 유전자좌(ACTB, LMNB1, NOLC1)에 직교로 삽입되며;
도 38b는 본 교시의 구현예에 따른 ACTB, LMNB1 및 NOLC1 유전자좌에서 형광단 조합의 다중화된 PASTE 삽입의 효율을 도시하고;
도 39a는 본 교시의 구현예에 따른 상동성-독립적 표적화 통합(HITI)에 의한 삽입율과 비교하여 PASTE에 의한 게놈 유전자좌의 패널에서의 GFP 통합 효율을 도시하고;
도 39b는 ACTB 및 LMNB1 표적 부위에서 PASTE와 HITI에 의한 의도하지 않은 indel 생성의 비교를 도시하고, 여기서 의도하지 않은 indel과 비교하여 관찰된 표적 상 EGFP 통합 비율은 본 교시의 구현예에 따라 제시되고;
도 39c는 동일한 표적에서 상동성-지시된 복구(HDR)와 비교하여 ACTB 유전자좌에서 PASTE에 의한 GFP 주형의 통합을 도시하고, 여기서 정량화는 단일 세포 클론 계수에 의한 것이며, 표적화 및 비표적화 가이드는 HDR 삽입용으로 사용되었고, 여기서 PASTE의 경우 표적화 및 비표적화는 본 교시의 구현예에 따라 각각 SpCas9-RT 단백질의 존재 또는 부재를 지칭하고;
도 39d는 ACTB 표적 부위에서 PASTE 및 HDR 기반 EGFP 삽입에 의한 의도하지 않은 indel 생성의 비교를 도시하고, 여기서 생성된 모든 단일-세포 클론에 걸쳐 측정된 평균 indel 비율은 본 교시의 구현예에 따라 제시되고;
도 39e는 본 교시의 구현예에 따른 Bxb1 및 Cas9 표적외 식별 및 검출 검정을 위한 개략도를 도시하고;
도 39f는 본 교시의 구현예에 따른 인간 게놈에서 예측된 Bxb1 표적외 부위에서 GFP 통합 활성을 도시하고;
도 39g는 본 교시의 구현예에 따라 예측된 PASTE ACTB Cas9 가이드 표적외 부위에서의 GFP 통합 활성을 도시하고;
도 39h는 본 교시의 구현예에 따른 예측된 HITI ACTB Cas9 가이드 표적외 부위에서의 GFP 통합 활성을 도시하고;
도 39i는 본 교시의 구현예에 따른 PASTE에 의한 게놈 전체 표적외 통합 부위를 검정하기 위한 차세대 서열분석 방법의 개략도를 도시하고;
도 39j는 게놈 전체 통합 검정을 사용하여 표적 상 ACTB 부위에서 판독치의 정렬을 도시하고, 여기서 예상되는 표적 상 통합 결과는 본 교시의 구현예에 따라 제시되고;
도 39k는 본 교시의 구현예에 따른 PASTE에 대한 3개의 단일 세포 클론 및 무프라임 상태에 대한 3개의 단일 세포 클론에 걸친 표적 상 및 표적외 통합 이벤트의 분석을 도시하고;
도 39l은 PASTE 편집에 의한 대표적인 단일 세포 클론에 대한 통합 이벤트의 맨해튼 플롯을 도시하고, 여기서 표적 상의 부위는 본 교시의 구현예에 따르는 염색체 7 상의 ACTB 유전자에 있고;
도 40a는 본 교시의 구현예에 따른 HepG2 세포 중의 ACTB 및 LMNB1 유전자좌에서 EGFP의 PASTE 및 HITI 매개 삽입에 의해 생성된 indel 비율의 비교를 도시하고;
도 40b는 본 교시의 구현예에 따른 합성 앰플리콘을 사용하여 예측된 Bxb1 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 40c는 본 교시의 구현예에 따른 합성 앰플리콘을 사용하여 예측된 PASTE ACTB Cas9 가이드 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 40d는 본 교시의 구현예에 따라 합성 앰플리콘을 사용하여 예측된 HITI ACTB Cas9 가이드 표적외 부위에서 편집을 검출하기 위한 ddPCR 검정의 검증을 도시하고;
도 41a는 Bxb1 인테그라제, EGFP의 PASTE 표적화 ACTB 통합, 또는 본 교시의 구현예에 따른 Bxb1 발현 없이 EGFP 삽입을 위한 프라임 편집 표적화 ACTB를 발현하는 HEK293FT 세포에서 다수의 유의한 차등적으로 조절된 유전자를 도시하고;
도 41b는 서열분석된 mRNA 대 유의성(p-값)의 배수 발현 변화를 묘사하는 화산 플롯을 도시하고, 여기서 각각의 점은 고유한 mRNA 전사체를 나타내고, 유의한 전사체는 상향조절(적색) 또는 하향조절(청색)에 따라 음영처리되며, 여기서 배수 발현 변화는 본 교시의 구현예에 따라 ACTB-표적화 가이드-단독 발현(카고 포함)에 대해 측정되며;
도 41c는 Bxb1-단독 조건에 대한 상위 유의하게 상향조절 및 하향조절된 유전자를 도시하고, 여기서 유전자는 Bxb1 단독 발현, GFP-단독 발현, EGFP 삽입을 위한 PASTE 표적화 ACTB, Bxb1 없는 EGFP 발현을 위한 프라임 표적화 ACTB, 및 본 교시의 구현예에 따른 가이드/카고 단독을 위한 백만 개당 계수(cpm)의 상응하는 Z-점수로 도시되고;
도 42a는 세포 주기 억제의 존재하에 PASTE 성능을 개략도를 도시하고, 여기서 세포는 PASTE 또는 Cas9 유도 HDR에 의한 삽입을 위한 플라스미드로 형질감염되고, 아피디콜린으로 처리되어 세포 분열을 정지시키고, 여기서 PASTE 및 HDR의 효율은 본 교시의 구현예에 따라 각각 ddPCR 또는 앰플리콘 서열분석으로 판독되고;
도 42b는 본 교시의 구현예에 따른 앰플리콘 서열분석으로 판독된 세포 분열의 존재 또는 부재하에 두 개의 Cas9 가이드를 갖는 EMX1 유전자좌에서 HDR에 의한 단일 돌연변이의 편집 효율을 도시하고;
도 42c는 본 교시의 구현예에 따른 세포 분열의 존재 또는 부재하에 PASTE를갖는 ACTB 유전자좌에서 최대 13.3kb의 다양한 크기의 GFP 삽입물의 통합 효율을 도시하고;
도 42d는 본 교시의 구현예에 따른 K562 세포에서 두 벡터(PE2 및 Bxb1) 및 단일 벡터(PE2-P2A-Bxb1) 설계에 의한 PASTE 편집 효율을 도시하고;
도 42e는 본 교시의 구현예에 따른 1차 인간 T 세포에서 단일 벡터(PE2-P2A-Bxb1) 설계에 의한 PASTE 편집 효율을 도시하고;
도 42f는 본 교시의 구현예에 따른 ACTB 유전자좌에서 치료학적으로 관련된 유전자의 통합 효율을 도시하고;
도 42g는 PASTE 통합된 도입유전자에 대한 단백질 생산 검정의 개략도를 도시하고, 여기서 세르피나1 및 CPS1 도입유전자는 본 교시의 구현예에 따라 ddPCR 및 발광 모두로 판독하기 위해 HIV 루시페라제로 태깅되고;
도 42h는 본 교시의 구현예에 따른 ACTB 유전자좌에서 HEK293FT 세포에서 세르피나1 및 CPS1 도입유전자의 통합 효율을 도시하고;
도 42i는 본 교시의 구현예에 따른 ACTB 유전자좌에서 HEpG2 세포에서 세르피나1 및 CPS1 도입유전자의 통합 효율을 도시하고;
도 42j는 본 교시의 구현예에 따른 HepG2 세포에서 세르피나1-HIBIT 및 CPS1-HIBIT의 세포내 수준을 도시하고;
도 42k는 본 교시의 구현예에 따른 HepG2 세포에서 세르피나1-HIBIT 및 CPS1-HIBIT의 분비된 수준을 도시하고;
도 43a는 본 교시의 구현예에 따라 5μM 아피디콜린 처리에 의해 차단된 비분열 HEK293FT 세포에서 현저하게 감소된 EMX1 유전자좌의 HDR 매개 편집을 도시하고;
도 43b는 본 교시의 구현예에 따라 5μM 아피디콜린 처리에 의해 차단된 분열 및 비분열 HEK293FT 세포에서 ACTB 유전자좌에서의 PASTE-매개 삽입에 대한 삽입 미니서클 DNA 양의 효과를 도시하고;
도 43c는 본 교시의 구현예에 따른 통합 효율의 용량 의존성을 나타내는, AAV를 통해 전달된 GFP 주형에 의한 ACTB 유전자좌에서의 GFP의 PASTE 통합을 도시하고;
도 44a는 정상 PASTE SV40 NLS를 본 교시의 구현예에 따른 c-Myc NLS/가변 이분파 SV40 NLS 설계와 비교하는 3개의 내인성 유전자좌에서의 PASTE 통합 활성을 도시하고;
도 44b는 정상 PASTE SV40 NLS를 본 교시의 구현예에 따른 c-Myc NLS/가변 이분파 SV40 NLS 설계와 비교하는 상이한 GFP 미니서클 주형 양을 갖는 ACTB 유전자좌에서의 PASTE 통합 활성을 도시하고;
도 45는 본 교시의 구현예에 따른 푸로마이신 성장 선택 마커를 사용하는 PASTE 편집 활성의 개선을 도시하고;
도 46a는 본 교시의 구현예에 따른 단백질 발현 루시페라제 검정으로 측정된 바와 같이 HIBIT 태깅된 세르피나1 및 CPS1 유전자의 통합을 도시하고;
도 46b는 표준화된 HIBIT 래더로 정규화되어 본 교시의 구현예에 따른 단백질 수준의 정확한 정량화를 가능하게 하는 단백질 발현 루시페라제 검정으로 측정된 바와 같이 HIBIT 태깅된 세르피나1 및 CPS1 유전자의 통합을 도시하고;
도 47a는 본 교시의 구현예에 따라, ACTB 유전자좌에서의 EGFP 통합을 위한 링커의 패널 및 역전사 효소(RT) 변형을 갖는 PASTE 작제물의 최적화를 도시하고;
도 47b는 내인성 ACTB 표적에서 PASTE 삽입 효율에 대한 카고 크기의 효과를 도시한다. 카고는 본 교시의 구현예에 따라 고정된 몰량으로 형질감염되었고;
도 48a는 본 교시의 구현예에 따라, ACTB에서 상이한 길이 BxbINT AttB 부위의 삽입을 위한 프라임 편집 효율을 도시하고;
도 48b는 본 교시의 구현예에 따라, 표적화 및 비표적화 가이드와 함께 ACTB에서 BxbINT AttB 부위의 삽입을 위한 프라임 편집 효율을 도시하고;
도 48c는 ACTB에서 상이한 인테그라제(Bxb1, Tp9 및 Btl)의 AttB 부위의 삽입을 위한 프라임 편집 효율을 도시한다. 랜딩 부위의 양 방향은 본 교시의 구현예에 따라 프로파일링되고(F, 정방형; R, 역방향);
도 48d는 본 교시의 구현예에 따라, 니킹 가이드를 포함하거나 포함하지 않는 ACTB에서 EGFP의 삽입을 위한 PASTE 편집 효율을 도시하고;
도 49a는 투여량 적정 및 단백질 최적화에 의한 PASTE 편집의 최적화를 도시한다. ACTB에서 EGFP의 PASTE 통합 효율은 성분의 상이한 투여량의 단일 벡터 전달로 측정된다.
도 49b. ACTB에서 EGFP의 PASTE 통합 효율은 EGFP 주형 벡터에 대한 성분의 상이한 비율의 단일 벡터 전달로 측정된다.
도 49c. 상이한 RT 도메인 융합을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49d. 상이한 RT 도메인 융합 및 링커를 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49e. 돌연변이체 RT 도메인을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 49f. 돌연변이된 BxbINT 도메인을 갖는 ACTB에서 EGFP의 PASTE 통합 효율.
도 50a. AAV 형질도입을 통해 전달된 삽입 주형. PASTE 편집 기계는 형질감염을 통해 전달되었고, 주형은 표시된 수준에서 AAV 투약을 통해 공동 전달되었다.
도 50b. 3개의 바이러스 벡터를 갖는 완전한 PASTE 시스템의 AdV 전달의 개략도.
도 50c. HEK293FT 및 HepG2 세포에서 인테그라제, 가이드 및 카고의 AdV 전달의 통합 효율. BxbINT 및 가이드 RNA 또는 카고는 플라스미드 형질감염(Pl), AdV 형질도입(AdV)을 통해 전달되거나, 생략되었다(-). SpCas9-RT는 플라스미드로서만 전달되거나 생략되었다.
도 50d. HEK293FT 및 HepG2 세포에서 모든 PASTE 성분의 AdV 전달.
도 50e. PASTE 성분의 mRNA 및 합성 가이드 전달의 개략도.
도 50f. AdV 또는 플라스미드 카고와 쌍을 이루는, mRNA 및 합성 가이드에 의한 PASTE 시스템 성분의 전달.
도 50g. 합성 가이드 및 AdV 또는 플라스미드 카고에 의한 원형 mRNA의 전달.
도 50h. 1차 인간 T 세포에서 단일 벡터 설계에 의한 PASTE 편집 효율.
도 50i. 1차 인간 간세포에서 단일 벡터 설계에 의한 PASTE 편집 효율.
도 51a. attB 서열의 조합 삽입과 함께 LMNB1의 제1 엑손의 130bp 및 385bp 결실을 갖는 LMNB1 유전자좌에서의 PASTE 편집 효율.
도 51b. PASTE 시스템을 사용한 967 bp 카고의 조합 삽입과 함께 LMNB1의 제1 엑손의 130 bp 결실을 갖는 PASTE 편집 효율.
상세한 설명
명확성을 위해, 다음의 논의는 출원인 교시의 구현예의 다양한 측면을 기재할 것임을 이해할 것이다. 특정 구현예는 철저한 설명 또는 본원에서 논의되는 더 광범위한 측면에 대한 제한으로서 의도되지 않는다는 것을 주시해야 한다. 특정 구현예와 함께 기재된 한 측면은 반드시 그 구현예에 제한되는 것은 아니며, 임의의 다른 구현예(들)와 함께 실시될 수 있다. 본 명세서 전반에 걸쳐 "하나의 구현예", "한 구현예", "예시적 구현예"에 대한 참조는 구현예와 관련하여 기재된 특정 특징, 구조 또는 특성이 본 개시내용의 적어도 하나의 구현예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전반에 걸쳐 여러 곳에서 "하나의 구현예에서", "한 구현예에서" 또는 "예시적 구현예"라는 문구의 출현은 반드시 모두 동일한 구현예를 언급하는 것은 아니지만, 그럴 수도 있다. 더욱이, 특별한 특징, 구조 또는 특성은 본 개시내용으로부터 당업자에게 명백할 수 있는 바와 같이, 하나 이상의 구현예에서 임의의 적절한 방식으로 조합될 수 있다.
일반적 정의
다르게 정의되지 않는 한, 본원에 사용된 기술 및 과학 용어는 본 개시내용이 속하는 기술분야의 숙련가에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 분자 생물학에서 일반적인 용어 및 기술의 정의는 문헌[참조: Molecular Cloning: A Laboratory Manual, 2nd edition (1989) (Sambrook, Fritsch, and Maniatis); Molecular Cloning: A Laboratory Manual, 4th edition (2012) (Green and Sambrook); Current Protocols in Molecular Biology (1987) (F.M. Ausubel et al. eds.); the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.): Antibodies, A Laboratory Manual (1988) (Harlow and Lane, eds.): Antibodies A Laboratory Manual, 2nd edition 2013 (E.A. Greenfield ed.); Animal Cell Culture (1987) (R.I. Freshney, ed.); Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223); Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829); Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710); Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994), March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, N.Y. 1992); and Marten H. Hofker and Jan van Deursen, Transgenic Mouse Methods and Protocols, 2nd edition (2011)]에서 찾을 수 있다.
본원에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 달리 지시하지 않는 한 단수 및 복수의 지시대상을 모두 포함한다. 따라서, 예를 들어, "세포"에 대한 참조는 다수의 이러한 세포를 포함한다.
본원에 사용된 용어 "임의의" 또는 "임의로"는 후속적으로 기재된 이벤트, 상황 또는 치환기가 발생할 수 있거나 발생하지 않을 수 있고, 설명은 이벤트 또는 상황이 발생하는 경우와 그렇지 않은 경우를 포함함을 의미한다.
종점에 의한 수치 범위의 인용은 인용된 종점뿐만 아니라 각각의 범위 내에 포함된 모든 숫자 및 분수를 포함한다.
본원에 사용된 용어 "약" 또는 "대략"은 파라미터, 양, 시간적 지속 시간 등과 같은 측정 가능한 값을 지칭하고, 지정된 값의 및 값으로부터 변형, 예를 들어, 이러한 변형이 본 개시내용에서 수행하기에 적절한 한 지정된 값의 및 값으로부터의 +/- 10% 이하, +/- 5% 이하, +/- 1% 이하, +/- 0.5% 이하, 및 +/- 0.1% 이하의 변형을 포함하는 것을 의미한다. 수식어 "약" 또는 "대략"이 지칭하는 값은 그 자체로 또한 구체적으로 그리고 바람직하게 개시된 것으로 이해되어야 한다.
본원에 인용된 모든 간행물 및 참고문헌은 명백하게 그 전체가 참조로 본원에 포함된다는 점이 주시된다. 본원에서 논의된 간행물은 본 출원의 출원일 이전에 그들의 개시내용을 위해서만 제공된다. 본원의 어떠한 내용도 본 개시내용이 이러한 간행물을 앞서 발생할 자격이 없음을 인정하는 것으로 해석되어서는 안 된다. 또한, 제공된 공개 날짜는 독립적으로 확인될 필요가 있는 실제 공개 날짜와 상이할 수 있다.
개요
본원에 개시된 구현예는 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 사용하는 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법 및 조성물을 제공한다. PASTE의 개념을 설명하는 개략도가 도 1에 도시되어 있다. 이하 더 상세히 논의된 바와 같이, PASTE는 표적 게놈 내로의 통합 부위의 첨가 후 상기 부위에 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열의 삽입을 포함한다. 이 과정은 세포에서 하나 이상의 반응으로 수행될 수 있다. 표적 게놈 내로 통합 부위의 첨가는, 예를 들어, 제한 없이, 프라임 편집, 재조합 아데노 관련 바이러스(rAAV)-매개 핵산 통합, 전사 활성제-유사 이펙터 뉴클레아제(TALENS), 및 아연 핑거 뉴클레아제(ZFN)를 포함하는 유전자 편집 기술을 사용하여 수행된다. 통합 부위에서 도입유전자의 통합은, 예를 들어, 제한 없이, 인테그라제, 재조합 효소 및 역전사 효소를 포함하는 인테그라제 기술을 사용하여 수행된다. 본원에 개시된 부위 특이적 유전 공학에 필요한 성분은 적어도 하나 이상의 뉴클레아제, 하나 이상의 gRNA, 하나 이상의 통합 효소, 및 통합 부위에 상보적이거나 회합되고 세포 게놈에 삽입되는 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열에 연결되는 하나 이상의 서열을 포함한다.
본원에 개시된 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물의 이점은 DNA 손상 반응에 의존하지 않고 큰 요소의 프로그램 가능한 삽입이다.
본원에 개시된 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물의 다른 이점은 다수의 부위에서 프로그램 가능한 삽입을 가능하게 하는 용이한 다중화이다.
본원에 개시된 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물의 다른 이점은 미니서클 주형을 통한 확장 가능한 생산 및 전달이다.
프라임
편집
본 개시내용은 표적 게놈 내로 통합 부위를 첨가하기 위해, 유전자 편집 기술, 예를 들어, 프라임 편집을 사용하는 부위특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. 프라임 편집은 아래에서 더 상세히 논의될 것이다.
프라임 편집은 특정된 DNA 부위에 새로운 유전 정보를 직접 기입하는 다양하고 정밀한 게놈 편집 방법이다. 프라임 편집의 개념을 설명하는 개략적인 다이어그램은 도 2에 도시되어 있다. 문헌[참조: Anzalone, A.V., et al. "Search-and-replace genome editing without double-strand breaks or donor DNA," Nature 576, 149-157 (2019)]을 참조한다. 프라임 편집은 조작된 역전사 효소(RT)에 융합되고 프라임 편집 가이드 RNA(pegRNA)로 프로그래밍된 촉매적으로 손상된 Cas9 엔도뉴클레아제를 사용한다. 당업자는 pegRNA 모두가 표적 부위를 특정하고 목적하는 편집을 암호화한다는 것을 이해할 것이다. 촉매적으로 손상된 Cas9 엔도뉴클레아제는 또한 역전사 효소에 융합되는 Cas9 니카아제를 포함한다. 유전자 편집 동안, 단백질의 Cas9 니카아제 부분은 pegRNA에 의해 DNA 표적 부위로 유도된다. 이어서, 역전사 효소 도메인은 pegRNA를 사용하여 목적하는 편집의 역전사 효소를 주형화하여 DNA를 니킹된 표적 DNA 가닥에 직접 중합한다. 편집된 DNA 가닥은 원래의 DNA 가닥을 대체하여 하나의 편집된 가닥과 하나의 편집되지 않은 가닥을 함유하는 헤테로듀플렉스를 생성한다. 이후, 프라임 편집자(PE)는 편집을 편집되지 않은 가닥에 복사하는 것을 선호하도록 헤테로듀플렉스의 분해를 안내하여 과정을 완료한다.
프라임 편집자는 Cas9 H840A 니카아제에 융합되는 몰로니 뮤린 백혈병 바이러스(M-MLV) 역전사 효소(RT)를 지칭한다. Cas9 니카아제의 C-말단에 RT를 융합하면 더 높은 편집 효율을 초래할 수 있다. 이러한 복합체는 PE1이라고 한다. Cas9(H840A)는 또한 비-M-MLV 역전사 효소, 예를 들어, AMV-RT 또는 XRT(Cas9 (Cas9(H840A)-AMV-RT 또는 XRT)에 연결될 수 있다. 일부 구현예에서, Cas 9(H840A)는 Cas12a/b 또는 Cas9(D10A)로 대체될 수 있다. 최대 약 45배 더 높은 효율을 갖는, M-MLV RT(D200N/L603W/T330P/T306K/W313F)의 펜타돌연변이체에 융합되는 Cas9(야생형), Cas9(H840A), Cas9(D10A) 또는 Cas 12a/b 니카아제는 PE2라고 한다. 일부 구현예에서, M-MLV RT는 하나 이상의 돌연변이를 포함한다: Y8H, P51L, S56A, S67R, E69K, V129P, L139P, T197A, H204R, V223H, T246E, N249D, E286R, Q291I, E302K, E302R, F309N, M320L, P330E, L435G, L435R, N454K, D524A, D524G, D524N, E562Q, D583N, H594Q, E607K, D653N, 및 L671P. 일부 구현예에서, 역전사 효소는 또한 야생형 또는 변형된 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT), 고양이 면역결핍 바이러스 역전사 효소(FIV-RT), FeLV-RT(고양이 백혈병 바이러스 역전사 효소), HIV-RT(인간 면역결핍 바이러스 역전사 효소), 또는 유박테리움 렉탈레 마투라제 RT(마라톤RT)일 수 있다. PE3은 비편집 가닥을 니킹하여 잠재적으로 세포가 편집된 가닥을 주형으로 사용하여 그 가닥을 다시 만들어 HR을 유도하도록 함을 포함한다. 비-편집된 가닥의 니킹은 니킹 가이드 RNA(ngRNA)의 사용을 포함할 수 있다.
비-편집된 가닥을 니킹하면 편집 효율을 증가시킬 수 있다. 예를 들어, 비편집된 가닥을 니킹하면 편집 효율을 약 1.1배, 약 1.3배, 약 1.5배, 약 1.7배, 약 1.9배, 약 2.1배, 약 2.3배, 약 2.5배, 약 2.7배, 약 2.9배, 약 3.1배, 약 3.3배, 약 3.5배, 약 3.7배, 약 3.9배, 4.1배, 약 4.3배, 약 4.5배, 약 4.7배, 약 4.9배, 또는 종점으로서 이들 값들 중 임의의 2개로부터 형성되는 임의의 범위로 증가시킬 수 있다.
최적의 니킹 위치는 게놈 부위에 따라 다르지만, pegRNA 유도 닉으로부터 약 40-90bp 편집의 3'에 위치된 닉은 일반적으로 과도한 indel 형성 없이 편집 효율을 증가시킬 수 있다. 프라임 편집 실행은 pegRNA 매개 닉으로부터 약 50 bp의 비편집 가닥 닉으로 시작하고, indel 주파수가 허용 가능한 수준을 초과하면 대안적인 닉 위치를 시험하도록 한다.
본원에 사용된 용어 "가이드 RNA"(gRNA) 등은 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열의 표적 게놈으로 삽입 또는 결실을 유도하는 RNA를 지칭한다. gRNA는 또한 프라임 편집 가이드 RNA(pegRNA), 니킹 가이드 RNA(ngRNA), 및 단일 가이드 RNA(sgRNA)를 지칭할 수 있다. 일부 구현예에서, 용어 "gRNA 분자"는 gRNA를 암호화하는 핵산을 지칭한다. 일부 구현예에서, gRNA 분자는 천연이다. 일부 구현예에서, gRNA 분자는 비-천연이다. 일부 구현예에서, gRNA 분자는 합성 gRNA 분자이다. gRNA는 게놈의 표적 핵산 또는 서열에 대해 Cas9, Cas 12a/b, Cas9(H840A) 또는 Cas9(D10A) 분자와 같은 뉴클레아제 또는 니카아제를 표적으로 할 수 있다. 일부 구현예에서, gRNA는 역전사 효소 도메인에 결합된 DNA 니카아제에 결합할 수 있다. 본원에 사용된 "변형된 gRNA"는 세포에 도입된 후 비-변형 gRNA 분자와 비교하여 세포에 도입된 후 개선된 반감기를 갖는 gRNA 분자를 지칭한다. 일부 구현예에서, 가이드 RNA는 인테그라제, 트랜스포사제, 또는 재조합 효소에 의한 인식을 위한 삽입 부위 서열의 첨가를 용이하게 할 수 있다.
본원에 사용된 용어 "프라임-편집 가이드 RNA"(pegRNA) 등은 프라이머 결합 부위(PBS)를 포함하는 확장된 단일 가이드 RNA(sgRNA), 역전사 효소(RT) 주형 서열, 및 재조합 효소, 인테그라제, 또는 트랜스포사제에 의해 인식될 수 있는 통합 부위 서열을 지칭한다. pegRNA에 대한 예시적인 설계 파라미터는 도 24a에 도시되어 있다. 예를 들어, PBS는 적어도 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt 또는 그 이상 nt의 길이를 가질 수 있다. 예를 들어, PBS는 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 또는 종점으로서 이들 값들 중 임의의 2개로부터 형성되는 임의의 범위의 길이를 가질 수 있다. 예를 들어, 5은 적어도 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 31nt, 32nt, 33nt, 34nt, 35nt, 36nt, 37nt, 38nt, 39nt, 40nt, 41nt, 42nt, 43nt, 44nt, 45nt, 46nt, 47nt, 48nt, 49nt, 50nt 또는 그 이상 nt의 길이를 가질 수 있다. 예를 들어, RT 주형 서열은 약 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 31nt, 32nt, 33nt, 34nt, 35nt, 36nt, 37nt, 38nt, 39nt, 40nt, 41nt, 42nt, 43nt, 44nt, 45nt, 46nt, 47nt, 48nt, 49nt, 50nt, 또는 종점으로서 이들 값들 중 임의의 2개로부터 형성되는 임의의 범위의 길이를 가질 수 있다.
게놈 편집 동안, 프라이머 결합 부위는 니킹된 DNA 가닥의 3' 말단이 pegRNA에 혼성화되도록 하는 한편, RT 주형은 편집된 유전 정보의 합성을 위한 주형의 역할을 한다. pegRNA는, 예를 들어, 제한 없이, (i) 편집될 표적 뉴클레오티드 서열을 식별하고, (ii) 표적화된 서열을 대체하는 새로운 유전 정보를 암호화할 수 있다. 일부 구현예에서, pegRNA는 (i) 편집될 표적 뉴클레오티드 서열을 식별하고 (ii) 표적화 서열을 대체하는 통합 부위를 암호화할 수 있다.
본원에 사용된 용어 "니킹 가이드 RNA"(ngRNA) 등은 편집된 가닥 및 비-편집된 가닥과 같은 가닥을 니킹할 수 있는 RNA 서열을 지칭한다. ngRNA에 대한 예시적인 설계 파라미터는 도 24b에 도시되어 있다. ngRNA는 gRNA 유도 닉의 부위로부터 약 1nt 이상 떨어진 곳에서 닉을 유도할 수 있다. 예를 들어, ngRNA는 gRNA 유도된 닉의 부위로부터 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120 또는 그 이상 nt 떨어진 곳에서 니킹할 수 있다. 일부 구현예에서, ngRNA는 가이드 서열 서열번호 74를 갖는 서열번호 75를 포함한다. 본원에 사용된 용어 "역전사 효소" 및 "역전사 효소 도메인"은 RNA 전사체를 상보적인 DNA로 역전시킬 수 있는 효소 또는 효소적 활성 도메인을 지칭한다. 역전사 효소 또는 역전사 효소 도메인은 RNA 의존성 DNA 중합 효소이다. 이러한 역전사 효소 도메인은 M-MLV 역전사 효소, 또는 변형된 역전사 효소, 예를 들어, 제한 없이, Superscript® 역전사 효소(Invitrogen; Carlsbad, Carlsbad), Superscript® VILO™ cDNA 합성(Invitrogen; Carlsbad, California), RTX, AMV-RT, 및 Quantiscript 역전사 효소(Qiagen, Hilden, Germany)를 포함하지만, 이에 제한되지 않는다.
본원에 개시된 pegRNA-PE 복합체는 게놈 내의 표적 부위를 인식하고, Cas9는, 예를 들어, 프로토스페이서 인접 모티프(PAM) 가닥을 니킹한다. pegRNA 내의 프라이머 결합 부위(PBS)는 PAM 가닥에 혼성화한다. 편집 서열을 함유하는 PBS에 작동 가능하게 연결된 RT 주형은 표적 부위 내로 DNA에 대한 RT 주형의 역전사를 지시한다. 편집된 3' 플랩 및 편집되지 않은 5' 플랩, 세포 5' 플랩 절단 및 결찰, 및 DNA 복구 사이의 평형은 안정적으로 편집된 DNA를 초래한다. 염기 편집을 최적화하기 위해, Cas9 니카아제를 사용하여 비-편집된 가닥을 니킹함으로써 편집된 가닥을 주형으로 사용하여 DNA 복구를 그 가닥에 지시할 수 있다.
인테그라제
기술
본 개시내용은 인테그라제 기술을 사용하는 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. 인테그라제 기술은 아래에서 더 상세히 논의될 것이다.
본원에 사용된 인테그라제 기술은 프라임 편집 뉴클레아제와 같은 뉴클레아제를 통해 통합 부위에 관심 유전자 또는 관심 핵산 서열의 통합을 지시하는 단백질을 암호화하는 단백질 또는 핵산을 포함한다. 통합을 지시하는 단백질은 통합 효소와 같은 효소일 수 있다. 통합 효소는 통합에 의해 통합 부위에서 게놈 또는 관심 핵산을 세포 게놈에 혼입하는 인테그라제일 수 있다. 통합 효소는 재조합에 의해 통합 부위에서 세포 게놈 내로 게놈 또는 관심 핵산을 혼입하는 재조합 효소일 수 있다. 통합 효소는 역전사에 의해 통합 부위에서 게놈 또는 관심 핵산을 세포 게놈으로 혼입하는 역전사 효소일 수 있다. 통합 효소는 역전위에 의해 통합 부위에서 게놈 또는 관심 핵산을 세포 게놈에 혼입하는 레트로트랜스포사제일 수 있다.
본원에 사용된 용어 "통합 효소"는 세포의 게놈에서, 단일 반응 또는 다중 반응으로 관심 유전자 또는 관심 핵산 서열을 목적하는 위치에 또는 통합 부위에 통합하는데 사용되는 효소 또는 단백질을 지칭한다. 통합 효소의 예는, 예를 들어, 제한 없이, Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, 및 R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제를 포함한다. 일부 구현예에서, 용어 "통합 효소"는 상기 언급된 효소를 암호화하는 핵산(DNA 또는 RNA)을 지칭한다. 일부 구현예에서, Cre 재조합 효소는 Cre 재조합 효소 발현 플라스미드(서열번호 71)로부터 발현된다.
포유류 발현 플라스미드는 하기 표 1에서 찾을 수 있다.
[표 1]
미니서클 카고 유전자 맵은 하기 표 2에서 찾을 수 있다.
일부 구현예에서, C31 파아지의 세린 인테그라제 C31이 통합 효소로서 사용된다. pegRNA와 함께 인테그라제 C31은 의사 attP 통합 부위(서열번호 78)를 삽입하는데 사용될 수 있다. 관심 유전자 또는 핵산 및 attB(서열번호 3) 부위를 함유하는 DNA 미니서클은 관심 유전자 또는 핵산을 세포의 게놈으로 통합시키는데 사용될 수 있다. 이 통합은 C31 인테그라제를 갖는 발현 벡터의 공동 형질감염에 의해 보조될 수 있다.
본원에 사용된 용어 "인테그라제"는 야생형 인테그라제 및 임의의 다양한 돌연변이체 또는 변형된 인테그라제를 포함하는 박테리오파지 유래 인테그라제를 지칭한다. 본원에 사용된 용어 "인테그라제 복합체"는 인테그라제 및 통합 숙주 인자(IF)를 포함하는 복합체를 지칭할 수 있다. 본원에 사용된 용어 "인테그라제 복합체" 등은 또한 인테그라제, 통합 숙주 인자, 및 박테리오파지 X-유래 엑시시오나제(Xis)를 포함하는 복합체를 지칭할 수 있다.
본원에 사용된 용어 "재조합 효소" 등은 재조합 효소 인식 서열 사이의 DNA의 재조합을 매개하는 부위 특이적 효소를 지칭하며, 이는 재조합 효소 인식 서열 사이의 DNA 단편의 절제, 통합, 반전, 또는 교환(예: 전좌)을 초래한다. 재조합 효소는 두 개의 별개의 패밀리: 세린 재조합 효소(예: 레졸바제 및 인버타제) 및 티로신 재조합 효소(예: 인테그라제)로 분류될 수 있다. 세린 재조합 효소의 예는 제한 없이, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, C31, TP901, TG1, BT1, R1, R2, R3, R4, R5, RV1, FC1, MR11, A118, U153 및 gp29를 포함한다. 세린 재조합 효소의 예는 또한, 제한 없이, 재조합 효소, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, 및 미코박테리움 파지로부터의 BxZ2를 포함한다. 티로신 재조합 효소의 예는, 제한 없이, Cre, FLP, R, 람다, HK101, HK022, 및 pSAM2를 포함한다. 세린 및 티로신 재조합 효소 명칭은 재조합 효소가 DNA를 공격하는데 사용하고 가닥 교환 동안 DNA에 공유 결합되는 보존된 친핵성 아미노산 잔기로부터 유래한다.
재조합 효소는 유전자 녹아웃/녹-인의 생성 및 유전자 치료 적용을 포함하는 수많은 적용을 갖는다. 예를 들어, 문헌[Brown et al., "Serine recombinases as tools for genome engineering." Methods, 2011; 53(4):372-9; Hirano et al., "Site-specific recombinases as tools for heterologous gene integration." Appl. Microbiol. Biotechnol. 2011; 92(2):227-39; Chavez and Calos, "Therapeutic applications of the ΦC31 integrase system." Curr . Gene Ther . 2011; 11(5):375-81; Turan and Bode, "Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications." FASEB J. 2011; 25(12):4088-107; Venken and Bellen, "Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase." Methods Mol . Biol . 2012; 859:203-28; Murphy, "Phage recombinases and their applications." Adv . Virus Res. 2012; 83:367-414; Zhang et al., "Conditional gene manipulation: Creating a new biological era." J. Zhejiang Univ. Sci. B. 2012; 13(7):511-24; Karpenshif and Bernstein, "From yeast to mammals: recent advances in genetic control of homologous recombination." DNA Repair (Amst). 2012; 1; 11(10):781-8]을 참조하고, 각각의 전체 내용은 그 전체가 참조로 포함된다.
본원에 제공된 재조합 효소는 본 개시내용의 구현예에서 사용될 수 있는 재조합 효소의 배타적인 예인 것을 의미하지 않는다. 본 개시내용의 방법 및 조성물은 새로운 직교 재조합 효소에 대한 데이터베이스를 마이닝하거나 정의된 DNA 특이성을 갖는 합성 재조합 효소를 설계함으로써 확장될 수 있다(참조: 예를 들어, Groth et al., "Phage integrases: biology and applications." J . Mol . Biol . 2004; 335, 667-678; Gordley et al., "Synthesis of programmable integrases." Proc. Natl . Acad . Sci . USA. 2009; 106, 5053-5058; 각각의 전체 내용은 그 전체가 참고로 포함된다).
본원에 기재된 시스템, 방법, 및 조성물에 유용한 재조합 효소의 다른 예가 당업자에게 공지되어 있고, 발견되거나 생성되는 임의의 새로운 재조합 효소는 본 개시내용의 상이한 구현예에서 사용될 수 있을 것으로 예상된다.
본원에 사용된 용어 "레트로트랜스포사제" 등은 효소, 또는 하나 이상의 효소의 조합을 지칭하고, 여기서 적어도 하나의 효소는 역전사 효소 도메인을 갖는다. 레트로트랜스포사제는 이종 핵산의 긴 서열(예: 3000개 이상의 뉴클레오티드)을 게놈에 삽입할 수 있다. 레트로트랜스포사제의 예는, 예를 들어, 제한 없이, 요소, 예를 들어, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스에 의해 암호화된 레트로트랜스포사제 및 이들의 임의의 돌연변이체를 포함한다
일부 구현예에서, 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열은 상보적 또는 회합된 통합 부위에 연결된 핵산을 암호화하는 RNA 단편, 예를 들어, 레트로트랜스포존을 사용하여 게놈에서 목적하는 위치에 삽입된다. 레트로트랜스포존을 사용하여 게놈의 목적하는 위치에서의 위치에 관심 핵산의 삽입은 레트로트랜스포사제에 의해 보조된다.
본원에 개시된 관심 유전자 및 핵산 서열은 당업계에 공지된 임의의 유전자 및 핵산 서열일 수 있다. 관심 유전자 및 핵산 서열은 치료적 및/또는 진단적 사용을 위한 것일 수 있다. 관심 유전자의 예는, 제한 없이, GBA, BTK, ADA, CNGB3, CNGA3, ATF6, GNAT2, ABCA1, ABCA7, APOE, CETP, LIPC, MMP9, PLTP, VTN, ABCA4, MFSD8, TLR3, TLR4, ERCC6, HMCN1, HTRA1, MCDR4, MCDR5, ARMS2, C2, C3, CFB, CFH, JAG1, NOTCH2, CACNA1F, 세르피나1, TTR, GSN, B2M, APOA2, APOA1, OSMR, ELP4, PAX6, ARG, ASL, PITX2, FOXC1, BBS1, BBS10, BBS2, BBS9, MKKS, MKS1, BBS4, BBS7, TTC8, ARL6, BBS5, BBS12, TRIM32, CEP290, ADIPOR1, BBIP1, CEP19, IFT27, LZTFL1, DMD, BEST1, HBB, CYP4V2, AMACR, CYP7B1, HSD3B7, AKR1D1, OPN1SW, NR2F1, RLBP1, RGS9, RGS9BP, PROM1, PRPH2, GUCY2D, CACD, CHM, ALAD, ASS1, SLC25A13, OTC, ACADVL, ETFDH, TMEM67, CC2D2A, RPGRIP1L, KCNV2, CRX, GUCA1A, CERKL, CDHR1, PDE6C, TTLL5, RPGR, CEP78, C21orf2, C8ORF37, RPGRIP1, ADAM9, POC1B, PITPNM3, RAB28, CACNA2D4, AIPL1, UNC119, PDE6H, OPN1LW, RIMS1, CNNM4, IFT81, RAX2, RDH5, SEMA4A, CORD17, PDE6B, GRK1, SAG, RHO, CABP4, GNB3, SLC24A1, GNAT1, GRM6, TRPM1, LRIT3, TGFBI, TACSTD2, KRT12, OVOL2, CPS1, UGT1A1, UGT1A9, UGT1A8, UGT1A7, UGT1A6, UGT1A5, UGT1A4, CFTR, DLD, EFEMP1, ABCC2, ZNF408, LRP5, FZD4, TSPAN12, EVR3, APOB, SLC2A2, LOC106627981, GBA1, NR2E3, OAT, SLC40A1, F8, F9, UROD, CPOX, HFE, JH, LDLR, EPHX1, TJP2, BAAT, NBAS, LARS1, HAMP, HJV, RS1, ADAMTS18, LRAT, RPE65, LCA5, MERTK, GDF6, RD3, CCT2, CLUAP1, DTHD1, NMNAT1, SPATA7, IFT140, IMPDH1, OTX2, RDH12, TULP1, CRB1, MT-ND4, MT-ND1, MT-ND6, BCKDHA, BCKDHB, DBT, MMAB, ARSB, GUSB, NAGS, NPC1, NPC2, NDP, OPA1, OPA3, OPA4, OPA5, RTN4IP1, TMEM126A, OPA6, OPA8, ACO2, PAH, PRKCSH, SEC63, GAA, UROS, PPOX, HPX, HMOX1, HMBS, MIR223, CYP1B1, LTBP2, AGXT, ATP8B1, ABCB11, ABCB4, FECH, ALAS2, PRPF31, RP1, EYS, TOPORS, USH2A, CNGA1, C2ORF71, RP2, KLHL7, ORF1, RP6, RP24, RP34, ROM1, ADGRA3, AGBL5, AHR, ARHGEF18, CA4, CLCC1, DHDDS, EMC1, FAM161A, HGSNAT, HK1, IDH3B, KIAA1549, KIZ, MAK, NEUROD1, NRL, PDE6A, PDE6G, PRCD, PRPF3, PRPF4, PRPF6, PRPF8, RBP3, REEP6, SAMD11, SLC7A14, SNRNP200, SPP2, ZNF513, NEK2, NEK4, NXNL1, OFD1, RP1L1, RP22, RP29, RP32, RP63, RP9, RGR, POMGNT1, DHX38, ARL3, COL2A1, SLCO1B1, SLCO1B3, KCNJ13, TIMP3, ELOVL4, TFR2, FAH, HPD, MYO7A, CDH23, PCDH15, DFNB31, GPR98, USH1C, USH1G, CIB2, CLRN1, HARS, ABHD12, ADGRV1, ARSG, CEP250, IMPG1, IMPG2, VCAN, G6PC1, ATP7B 및 이들의 임의의 유도체를 포함한다.
본원에 사용된 용어 "레트로트랜스포존", "점핑 유전자", "점핑 핵산" 등은 역전사에 의존하는 세포 이동 가능한 유전 요소를 지칭한다. 레트로트랜스포존은 비복제 적격 세포 기원이며, 외래 핵산 서열을 운반할 수 있다. 레트로트랜스포존은 특정 고전적 특징, 예를 들어, 긴 말단 반복(LTR), 레트로바이러스 프라이머 결합 부위 등을 보유하는 레트로바이러스의 기생충으로서 작용할 수 있다. 그러나, 천연 레트로트랜스포존은 일반적으로 기능적 레트로바이러스 구조 유전자를 함유하지 않고, 이는 일반적으로 복제 적격 바이러스를 산출하기 위해 재결합할 수 있을 것이다. 일부 레트로트랜스포존은 소위 "이기적 DNA" 또는 유전 정보의 예이고, 이는 그 자체를 복제하는 능력을 제외하고 아무 것도 암호화하지 않는다. 레트로트랜스포존은 숙주 세포 내에 가끔 존재하는 레트로바이러스 또는 레트로트랜스포사제를 이용함으로써 그렇게 하여 바이러스 입자 내에서 자체 효율적으로 패키징하여 그것을 새로운 숙주 게놈으로 수송하고, 여기서 그것은 다시 RNA로서 발현된다. 그 RNA 내에서 암호화된 정보는 잠재적으로 점핑 유전자와 함께 운반된다. 레트로트랜스포존은 LTR 레트로트랜스포존 또는 비-LTR 레트로트랜스포존을 포함하는 DNA 트랜스포존 또는 레트로트랜스포존일 수 있다.
비-긴 말단 반복(LTR) 레트로트랜스포존은 진핵 게놈에서 널리 보급되는 이동성 유전 요소의 일종이다. 그들은 두 부류를 포함한다: 아퓨린/아피리미딘 엔도뉴클레아제(APE) 유형 및 제한 효소 유형 엔도뉴클레아제(RLE)-유형. APE 부류 레트로스포존은 두 가지 기능적 도메인으로 구성된다: 엔도뉴클레아제/DNA 결합 도메인, 및 역전사 효소 도메인. RLE 부류는 3개의 기능적 도메인으로 구성된다: DNA 결합 도메인, 역전사 도메인, 및 엔도뉴클레아제 도메인. 비-LTR 레트로트랜스포존의 역전사 효소 도메인은 RNA 서열 주형을 결합하고 그것을 숙주 게놈의 표적 DNA로 역전사함으로써 기능한다. RNA 서열 주형은 트랜스포스파제에 특이적으로 결합된 3' 비번역 영역, 및 일반적으로 트랜스포사제 단백질을 암호화하는 개방 판독 프레임(들)("ORF")을 갖는 가변 5' 영역을 갖는다. RNA 서열 주형은 또한, 레트로트랜스포사제에 특이적으로 결합하는 5' 비번역 영역을 포함할 수 있다. 일부 구현예에서, 비-LTR 트랜스포존은 LINE 레트로트랜스포존, 예를 들어, L1, 및 SINE 레트로트랜스포존, 예를 들어, Alu 서열을 포함할 수 있다. 다른 예는, 예를 들어, 제한 없이, R1, R2, R3, R4 및 R5 레트로-트랜스포존을 포함한다(참조: Moss, W. N. et al., RNA Biol. 2011, 8(5), 714-718; and Burke, W. D. et al., Molecular Biology and Evolution 2003, 20(8), 1260-1270). 트랜스포존은 자율적이거나 비-자율적일 수 있다.
레트로바이러스를 포함하는 LTR 레트로트랜스포존은 인간 게놈의 약 8% 및 마우스 게놈의 10%를 포함하는 전형적인 포유류 게놈의 상당한 부분을 차지한다(참조: Lander et al., 2001, Nature 409, 860-921; Waterson et al., 2002, Nature 420, 520-562). LTR 요소는 레트로트랜스포존, 내인성 레트로바이러스(ERV), 및 HERV 기원을 갖는 반복 요소, 예를 들어, SINE-R을 포함한다. LTR 레트로트랜스포존은 두 개의 효소: 인테그라제 및 레트로트랜스포사제를 암호화하는 영역 측면에 배치되는 두 개의 LTR 서열을 포함한다.
ERV는 고대 생식 세포 감염의 잔재인 인간 내인성 레트로바이러스(HEV)를 포함한다. 대부분의 HEV 프로바이러스가 광범위한 결실 및 돌연변이를 경험하였지만, 일부는 글리코실화된 env 단백질을 포함한 기능성 단백질을 코딩하는 ORFS를 유지했다. env 유전자는 LTR 요소가 세포와 개체 사이에서 확산될 가능성을 부여한다. 실제로, 3개의 개방 판독 프레임(pol, gag 및 env)은 모두 인간에서 식별되었으며, 증거는 ERV가 생식계열에서 활성임을 시사한다. 예를 들어, 문헌(Wang et al., 2010, Genome Res. 20, 19-27)을 참조한다. 또한, HERV-K(HML-2) 그룹을 포함한 몇몇 패밀리가 바이러스 입자를 형성하는 것으로 나타났고, 명백히 손상되지 않은 프로바이러스는 최근 인간 인구의 작은 부분에서 발견되었다. 예를 들어, 문헌(Bannert and Kurth, 2006, Proc. Natl. Acad. USA 101, 14572-14579)을 참조한다.
LTR 레트로트랜스포존은 DNA 트랜스포존에서 관찰된 DNA 절단 및 DNA 가닥 전달의 동일한 단계를 사용하여 게놈의 새로운 부위에 삽입된다. 그러나, DNA 트랜스포존과 대조적으로, LTR 레트로트랜스포존의 재조합은 RNA 중간체를 포함한다. LTR 레트로트랜스포존은 인간 게놈의 약 8%를 차지한다. 예를 들어, 문헌(Lander et al., 2001, Nature 409, 860-921; Hua-Van et al., 2011, Biol. Dir. 6, 19)을 참조한다.
통합 부위
본 개시내용은 표적 게놈에 통합 부위의 첨가를 통해 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. 통합 부위는 아래에서 더 상세히 논의될 것이다.
본원에 사용된 용어 "통합 부위"는 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열이 삽입되는 표적 게놈 내의 부위를 지칭한다. 통합 부위의 예는, 예를 들어, 제한 없이, lox71 부위(서열번호 1), attB 부위(서열번호 3 및 서열번호 43), attP 부위(서열번호 4 및 서열번호 44), attL 부위(서열번호 67), attR 부위(서열번호 68), Vox 부위(서열번호 69), FRT 부위(서열번호 70) 또는 의사 attP 부위(서열번호 78)를 포함한다. 통합 부위는 뉴클레아제, gRNA, 및/또는 통합 효소를 사용하여 세포의 게놈 또는 이의 단편에 삽입될 수 있다. 통합 부위는 프라임 편집자, 예를 들어, 제한 없이, PE1, PE2 및 PE3을 사용하여 세포의 게놈에 삽입될 수 있고, 여기서 통합 부위는 pegRNA 상에 운반된다. pegRNA는 당업계에 공지된 임의의 부위를 표적으로 할 수 있다. pegRNA에 의해 표적화된 부위의 예는, 제한 없이, ACTB, SUPT16H, SRRM2, NOLC1, DEPDC4, NES, LMNB1, AAVS1 유전자좌, CC10, CFTR, 세르피나1, ABCA4, 및 이들의 임의의 유도체를 포함한다. 상보적 통합 부위는 외인성 DNA 또는 RNA에서 관심 유전자 또는 관심 핵산 서열에 작동 가능하게 연결될 수 있다. 일부 구현예에서, 하나의 통합 부위는 표적 게놈에 첨가된다. 일부 구현예에서, 하나 이상의 통합 부위가 표적 게놈에 첨가된다.
관심 있는 다수의 유전자 또는 핵산을 삽입하기 위해, 둘 이상의 통합 부위가 목적하는 위치에 첨가된다. 관심 있는 핵산 서열을 포함하는 다수의 DNA는 통합 서열, 예를 들어, 제한 없이, attB 및 attP에 직교로 측면화된다. 통합 부위는 재조합 효소의 인식 부위 또는 뉴클레오티드 서열을 유의하게 인식하지 못하는 경우, "직교"이다. 따라서, 재조합 효소의 하나의 attB 부위는 상이한 재조합 효소의 attB 부위에 직교할 수 있다. 또한, 재조합 효소의 한 쌍의 attB 및 attP 부위는 동일한 재조합 효소에 의해 인식된 다른 한 쌍의 attB 및 attP 부위에 직교할 수 있다. 한 쌍의 재조합 효소는 서로의 attB 또는 attP 부위 서열의 인식이 있을 때, 본원에 정의된 바와 같이 서로 직교하는 것으로 간주된다.
동일한 재조합 효소 또는 상이한 재조합 효소에 의한 통합 부위 또는 부위의 쌍의 인식 부족은 약 30% 미만일 수 있다. 일부 구현예에서, 동일한 재조합 효소 또는 상이한 재조합 효소에 의한 통합 부위 또는 부위의 쌍의 인식 부족은 약 30% 미만, 약 28% 미만, 약 26% 미만, 약 24% 미만, 약 22% 미만, 약 20% 미만, 약 18% 미만, 약 16% 미만, 약 14% 미만, 약 12% 미만, 약 10% 미만, 약 8% 미만, 약 6% 미만, 약 4% 미만, 약 2% 미만, 약 1%, 또는 종점으로서 이들 값 중 임의의 두 개로부터 형성되는 임의의 범위일 수 있다. 크로스토크는 약 30% 미만일 수 있다. 일부 구현예에서, 크로스토크는 약 30% 미만, 약 28% 미만, 약 26% 미만, 약 24% 미만, 약 22% 미만, 약 20% 미만, 약 18% 미만, 약 16% 미만, 약 14% 미만, 약 12% 미만, 약 10% 미만, 약 8% 미만, 약 6% 미만, 약 4% 미만, 약 2% 미만, 약 1% 미만, 또는 종점으로서 이들 값 중 임의의 2개로부터 형성되는 임의의 범위이다.
일부 구현예에서, attB 및/또는 attP 부위 서열은 중심 디뉴클레오티드 서열을 포함한다. 예를 들어, 중심 디뉴클레오티드는 GT로부터 GA로 변경될 수 있고, attB/attP 부위를 함유하는 GA만이 상호작용하고 서열을 함유하는 GT와 교차 반응하지 않을 것으로 나타났다. 일부 구현예에서, 중심 디뉴클레오티드는 AG, AC, TG, TC, CA, CT, GA, AA, TT, CC, GG, AT, TA, GC, CG 및 GT로 이루어진 그룹으로부터 선택된다.
본원에 사용된 용어 "attB 및 attP 부위 서열의 쌍" 등은 동일한 중심 디뉴클레오티드를 공유하고 재결합할 수 있는 attB 및 attP 부위 서열을 지칭한다. 이는 하나의 세린 인테그라제의 존재하에, 이들 직교 att 부위의 최대 6쌍이 재결합할 수 있음을 의미한다(attPTT는 attBTT와 특이적으로 재결합하고, attPTC는 attBTC와 특이적으로 재결합하고, 등등이다).
일부 구현예에서, 중심 디뉴클레오티드는 비회문성이다. 일부 구현예에서, 중심 디뉴클레오티드는 회문성이다. 일부 구현예에서, 한 쌍의 attB 부위 서열 및 attP 부위 서열은 둘 이상의 상이한 핵산의 방향적 통합을 유도하기 위한 관심 유전자 또는 관심 핵산 서열을 암호화하는 상이한 DNA에 사용된다.
하기 표 3은 상이한 중심 디뉴클레오티드(CD)를 갖는 attB 부위 서열 및 attP 부위 서열의 쌍의 예를 나타낸다.
[표 3]
PASTE
본 개시내용은 PASTE를 사용하는 부위 특이적 유전 공학을 위한 비천연 또는 조작된 시스템, 방법, 및 조성물을 제공한다. PASTE는 아래에서 더 상세히 논의될 것이다.
본원에 개시된 부위 특이적 유전 공학은 관심 있는 하나 이상의 유전자 또는 관심 있는 하나 이상의 핵산 서열을 세포의 게놈에 삽입하기 위한 것이다. 일부 구현예에서, 관심 유전자는 유전 질환, 예를 들어, 제한 없이, 대사 질환, 낭포성 섬유증, 근이영양증, 혈색소 침착증, 테이삭스병, 헌팅톤병, 선천성 난청(Congenital Deafness), 겸상 적혈구 빈혈증, 가족성 고콜레스테롤혈증, 아데노신 데아미나제(ADA) 결핍, X-연결 SCID(X-SCID), 및 위스콧-알드리치 증후군(WAS)에 연루된 돌연변이된 유전자이다. 일부 구현예에서, 관심 유전자 또는 관심 핵산 서열은, 예를 들어, 제한 없이, 유전자의 발현을 결정하기 위한 유전자 분석을 위한 유전자의 상류 또는 하류의 리포터 유전자일 수 있다. 일부 구현예에서, 리포터 유전자는GFP 주형(서열번호 76) 또는 가우시아 루시페라제(G-루시페라제) 주형(서열번호 77)이다. 일부 구현예에서, 관심 유전자 또는 관심 핵산 서열은 식물에서 가뭄 내성, 날씨 강건성, 및 증가된 수율 및 제초제 내성을 향상시키기 위해 유전자를 삽입하기 위해 식물 유전학에 사용될 수 있다. 일부 구현예에서, 관심 유전자 또는 관심 핵산 서열은 관절염(arthritis), 건선(psoriasis), 낭창(lupus), 체강 질환(coeliac disease), 사구체신염(glomerulonephritis), 간염(hepatitis), 및 염증성 장 질환(inflammatory bowel disease)을 포함하지만, 이에 제한되지 않는 면역 질환의 치료를 위한 세포에 단백질(예: 리소좀 효소), 혈액 인자(예: 인자 I, II, V, VII, X, XI, XII 또는 XIII), 막 단백질, 엑손, 세포내 단백질(예: 세포질 단백질, 핵 단백질, 세포 기관 단백질, 예를 들어, 미토콘드리아 단백질 또는 리소좀 단백질), 세포외 단백질, 구조 단백질, 신호전달 단백질, 조절 단백질, 수송 단백질, 감각 단백질, 운동 단백질, 방어 단백질, 또는 저장 단백질, 항염증성 신호전달 분자의 부위 특이적 삽입을 위해 사용될 수 있다.
삽입된 유전자 또는 핵산의 크기는 약 1 bp 내지 약 50,000 bp로 다양할 수 있다. 일부 구현예에서, 삽입된 유전자 또는 핵산의 크기는 약 1 bp, 10 bp, 50 bp, 100 bp, 150 bp, 200 bp, 250 bp, 300 bp, 350 bp, 400 bp, 600 bp, 800 bp, 1000 bp, 1200 bp, 1400 bp, 1600 bp, 1800 bp, 2000 bp, 2200 bp, 2400 bp, 2600 bp, 2800 bp, 3000 bp, 3200 bp, 3400 bp, 3600 bp, 3800 bp, 4000 bp, 4200 bp, 4400 bp, 4600 bp, 4800 bp, 5000 bp, 5200 bp, 5400 bp, 5600 bp, 5800 bp, 6000 bp, 6200,6400 bp, 6600 bp, 6800 bp, 7000 bp, 7200 bp, 7400 bp, 7600 bp, 7800 bp, 8000 bp, 8200 bp, 8400 bp, 8600 bp, 8800 bp, 9000 bp, 9200 bp, 9400 bp, 9600 bp, 9800 bp, 10,000 bp, 10,200 bp, 10,400 bp, 10,600 bp, 10,800 bp, 11,000 bp, 11,200 bp, 11,400 bp, 11,600 bp, 11,800 bp, 12,000 bp, 14,000 bp, 16,000 bp, 18,000 bp, 20,000 bp, 30,000 bp, 40,000 bp, 50,000 bp, 또는 종점으로서 이들 값 중 임의의 2개로부터 형성되는 임의의 범위일 수 있다.
일부 구현예에서, 본원에 개시된 관심 유전자 또는 관심 핵산 서열을 사용하는 부위 특이적 공학은 종양 표적화 또는 동종 생성을 위한 T 세포 및 NK의 공학을 위한 것이다. 이들은 종양 특이성을 위한 수용체 또는 CAR, 항-PDl 항체, 사이토카인 유사 IFN-감마, TNF-알파, IL-15, IL-12, IL-18, IL-21, 및 IL-10, 및 면역 탈출 유전자의 사용을 포함할 수 있다.
본 개시내용에서, 관심 유전자 또는 관심 핵산의 부위 특이적 삽입은 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)를 통해 수행된다. PASTE를 사용하여 관심 유전자 또는 관심 핵산을 삽입하기 위한 성분은, 예를 들어, 제한 없이, 뉴클레아제, 통합 부위를 첨가하는 gRNA, 통합 부위에 상보적이거나 회합된 서열에 연결된 유전자 또는 핵산을 포함하는 DNA 또는 RNA 가닥, 및 통합 효소이다. PASTE를 사용하여 관심 유전자 또는 관심 핵산을 삽입하기 위한 성분은, 예를 들어, 제한 없이, 프라임 편집자 발현, 통합 부위를 첨가하는 pegRNA, 니킹 가이드 RNA, 통합 효소(Cre 또는 세린 재조합 효소), 유전자 및 통합 신호와 함께 관심 유전자 또는 관심 핵산 서열을 포함하는 유전자 도입 벡터이다. 뉴클레아제 및 프라임 편집자는 통합 부위를 게놈에 통합시킨다. 통합 효소는 관심 유전자를 통합 부위에 통합시킨다. 일부 구현예에서, 유전자 및 통합 신호와 함께 관심 유전자 또는 핵산 서열을 포함하는 유전자 도입 벡터는 박테리아 DNA 서열이 없는 DNA 미니서클이다. 일부 구현예에서, 유전자 도입 벡터는 진핵생물 또는 원핵생물 벡터이다.
본원에 사용된 용어 "벡터" 또는 "유전자 도입 벡터"는 숙주 유기체에서 작동 가능하게 연결된 코딩 서열의 발현에 필요한 목적하는 코딩 서열 및 적절한 핵산 서열을 함유하는 재조합 DNA 분자를 지칭한다. 원핵생물에서 발현에 필요한 핵산 서열은 일반적으로, 예를 들어, 제한 없이, 프로모터, 작동자(임의의), 리보솜 결합 부위, 및/또는 다른 서열을 포함한다. 진핵생물 세포는 일반적으로 프로모터(구성적, 유도성 또는 조직 특이적), 인핸서 및 종결 및 폴리아데닐화 신호를 활용하는 것으로 공지되어 있지만, 일부 요소는 결실될 수 있고, 필요한 발현을 희생시키지 않고 다른 요소가 첨가될 수 있다. 유전자 도입 벡터는 링커를 통해 서로 연결된 PE와 통합 효소를 암호화할 수 있다. 링커는 절단 가능한 링커일 수 있다. 예를 들어, 링커를 통해 서로 연결된 PE와 통합 효소를 암호화하는 유전자 도입 벡터는 서열번호 73을 포함하는 pCMV PE2 P2A Cre이다. 일부 구현예에서, 링커는 절단 가능하지 않은 링커일 수 있다. 일부 구현예에서, 뉴클레아제, 프라임 편집자 및/또는 통합 효소는 상이한 벡터에서 암호화될 수 있다.
본 개시내용의 구현예에 따른 단일 부위에 관심 있는 다수의 유전자 또는 핵산 서열을 삽입하는 방법이 도 12에 도시되어 있다. 일부 구현예에서, 다중화는 도 13에 도시된 바와 같은 고유한 pegRNA를 사용하여 다수의 유전자좌에 관심 있는 다중 유전자를 삽입하는 것을 포함한다(참조: Merrick, C. A. et al., ACS Synth. Biol. 2018, 7, 299-310). 본원에서 "다중화"로서 지칭되는, 관심 있는 다중 유전자 또는 관심 있는 핵산의 세포 게놈으로의 삽입은 제1 핵산을 포함하는 DNA 또는 RNA의 5' 말단에 상보적 5' 통합 부위 및 마지막 핵산을 포함하는 DNA 또는 RNA의 3' 말단에 3' 통합 부위의 혼입에 의해 촉진된다. 일부 구현예에서, 다중화를 사용하여 세포 게놈에 삽입되는 관심 게놈 또는 관심 아미노산 서열의 수는 약 1, 2, 3, 4, 5, 6, 7, 8, 9 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 종점으로서 이들 값 중 임의의 두 개로부터 형성되는 임의의 범위일 수 있다.
일부 구현예에서, 다중화는, 예를 들어, 신호전달 캐스케이드, 그의 보조인자와 함께 관심 단백질의 과발현, 신생물 조건에서 돌연변이된 다중 유전자의 삽입, 또는 암의 치료를 위한 다중 CAR의 삽입을 가능하게 한다.
일부 구현예에서, 통합 부위는 비프라임 편집 방법, 예를 들어, rAAV 매개 핵산 통합, TALENS 및 ZFN을 사용하여 게놈에 삽입될 수 있다. 다수의 고유한 특성은 AAV를 인간 유전자 치료를 위한 유망한 벡터로 만든다(참조: Muzyczka, CURRENT TOPICS IN MICROBIOLOGY AND IMMUNOLOGY, 158:97-129 (1992)). 다른 바이러스 벡터와 달리, AAV는 임의의 공지된 인간 질환과 관련되는 것으로 나타나지 않았고, 일반적으로 병원성으로 간주되지 않는다. 야생형 AAV는 부위 특이적 방식으로 숙주 염색체로 통합할 수 있다(참조: M. Kotin et al., PROC. NATL. ACAD. SCI, USA, 87:2211-2215 (1990); R.J. Samulski, EMBO 10(12):3941-3950 (1991)). 이중 가닥 DNA 파괴를 생성하는 대신, AAV는 DNA 변형을 달성하기 위해 내인성 상동 재조합을 자극한다. 또한, 게놈 편집하고 표적화 DSB를 도입하기 위한 전사 활성제-유사 이펙터 뉴클레아제(TALEN) 및 아연-핑거 뉴클레아제(ZFN). TALEN의 특이성은 반복 단위의 위치 12 및 13에 위치된 소위 반복 가변 디잔기(RVD)인 두 개의 다형성 아미노산으로부터 발생한다. TALENS는 FokI 뉴클레아제에 연결되고, 이는 목적하는 위치에서 DNA를 절단한다. ZFN은 맞춤형 부위 특이적 게놈 편집을 위한 인공 제한 효소이다. 아연 핑거 자체는 전사 인자이며, 여기서 각 핑거는 3-4개 염기를 인식한다. 이러한 핑거 모듈을 혼합하고 매칭함으로써, 연구자들은 어느 서열을 표적화할지 맞춤화할 수 있다.
본원에 사용된 바와 같이, 숙주 게놈의 변형을 위한 플라스미드, 핵산 또는 단백질의 세포, 조직 또는 기관으로의 "투여", "도입" 또는 "전달"이라는 용어는 생체내, 시험관내 또는 생체외에서 발생할 수 있는 이러한 투여, 도입 또는 전달을 위한 수송을 지칭한다. 유전자 변형을 위한 플라스미드, DNA, 또는 RNA는 전형적으로 화학적 수단(예: 인산칼슘 형질감염, 폴리에틸렌이민(PEI) 또는 리포펙션), 물리적 수단(전기천공 또는 미세주입), 감염(이는 전형적으로 감염성 제제, 예를 들어, 바이러스(예: AAV Rep 유전자를 발현하는 바쿨로바이러스)의 도입을 의미한다), 형질 도입(미생물학에서, 이는 바이러스에 의한 세포의 안정한 감염, 또는 바이러스 인자(예: 박테리오파지)에 의해 하나의 미생물로부터 다른 미생물로 유전 물질의 전달)에 의해 달성되는 형질감염에 의해 세포에 도입될 수 있다. 재조합 폴리펩티드, 단백질 또는 올리고뉴클레오티드의 발현을 위한 벡터는 세포, 조직, 기관 또는 대상체에서 물리적 수단(예: 인산칼슘 형질감염, 전기천공, 미세주입, 또는 리포펙션)에 의해 수득될 수 있다. 벡터는 담체에 시험관내, 생체외 또는 생체내 전달을 위한 약제학적으로 허용되는 담체로 벡터를 제조함으로써 전달될 수 있다.
본원에 사용된 용어 "형질감염"은 세포에 의한 외인성 핵산 분자의 흡수를 지칭한다. 외인성 핵산이 세포 막에 도입된 경우 세포는 "형질감염된다". 형질감염은 단일 형질감염, 공동 형질감염 또는 다중 형질감염일 수 있다. 수많은 형질감염 기술은 일반적으로 당업계에 공지되어 있다. 예를 들어, 문헌(Graham et al. (1973) Virology, 52: 456)을 참조한다. 이러한 기술은 하나 이상의 외인성 핵산 분자를 적합한 숙주 세포에 도입하는데 사용될 수 있다.
일부 구현예에서, 유전자 편집을 위한 외인성 핵산 분자 및/또는 다른 성분은 단일 형질감염으로 조합되고 전달된다. 다른 구현예에서, 유전자 편집을 위한 외인성 핵산 분자 및/또는 다른 성분은 단일 형질감염으로 조합되고 전달되지 않는다. 일부 구현예에서, 유전자 편집을 위한 외인성 핵산 분자 및/또는 다른 성분은 단일 형질감염으로 조합되고 전달되어, 예를 들어, 제한 없이, 프라임 편집 벡터, 랜딩 부위, 예를 들어, pegRNA를 함유하는 랜딩 부위, 니킹 가이드, 예를 들어, 프라임 편집을 자극하기 위한 니킹 가이드, 발현 벡터, 예를 들어, 상응하는 인테그라제 또는 재조합 효소를 위한 발현 벡터, 미니서클 DNA 카고, 예를 들어, 녹색 형광 단백질(GFP)을 암호화하는 미니서클 DNA 카고, 이들의 임의의 유도체, 및 이들의 임의의 조합을 포함한다. 일부 구현예에서, 관심 유전자 또는 관심 아미노산 서열은 리포좀을 사용하여 도입될 수 있다. 일부 구현예에서, 관심 유전자 또는 관심 아미노산 서열은 적합한 벡터, 예를 들어, 제한 없이, 플라스미드 및 바이러스 벡터를 사용하여 전달될 수 있다. 바이러스 벡터의 예는, 제한 없이, 아데노 관련 바이러스(AAV), 렌티바이러스, 아데노바이러스, 다른 바이러스 벡터, 이들의 유도체, 또는 이들의 조합을 포함한다. 단백질 및 하나 이상의 가이드 RNA는 하나 이상의 벡터, 예를 들어, 플라스미드 또는 바이러스 벡터로 패키징될 수 있다. 일부 구현예에서, 전달은 나노 입자 또는 엑소좀을 통해서이다. 예를 들어, 엑소좀은 RNA 전달에 특히 유용할 수 있다.
일부 구현예에서, 프라임 편집은 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%의 효율로 랜딩 부위를 삽입한다. 일부 구현예에서, 프라임 편집은 약 1%, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 약 30%, 약 31%, 약 32%, 약 33%, 약 34%, 약 35%, 약 36%, 약 37%, 약 38%, 약 39%, 약 40%, 약 41%, 약 42%, 약 43%, 약 44%, 약 45%, 약 46%, 약 47%, 약 48%, 약 49%, 약 50%, 또는 종점으로서 이들 값 중 임의의 두 개로부터 형성되는 임의의 범위의 효율로 랜딩 부위(들)를 삽입한다.
서열
효소, 가이드, 통합 부위 및 플라스미드의 서열은 하기 표 4에서 찾을 수 있다.
[표 4]
삽입 부위의 서열은 이하 표 4에서 찾을 수 있다.
Bxb1 및 RT 돌연변이체의 서열은 하기 표 6에서 찾을 수 있다.
ddPCR 판독에 사용되는 프라이머, 프로브 및 제한 효소의 서열은 하기 표 7에서 찾을 수 있다.
[표 7]
NGS 판독에 사용되는 프라이머의 서열은 하기 표 8에서 찾을 수 있다.
표적외 부위의 서열은 하기 표 9에서 찾을 수 있다.
하기 표 10의 링커 서열.
하기 표 11의 예시적인 융합 서열.
실시예
몇몇 실험예가 고려되지만, 이들 실시예는 비제한적인 것으로 의도된다.
실시예 1
CRE 통합 효율
CRE 통합 효율을 시험하였다. lox71/lox66/Cre 재조합 효소 시스템을 사용하여 GFP로 PASTE의 효능을 시험하기 위해, 렌티바이러스를 사용하여 게놈에 통합된 lox71 서열(서열번호 1)을 갖는 클로날 HEK293FT 세포주를 개발하였다. GFP의 통합은 (1) Cre 재조합 효소 발현 플라스미드를 포함하는 플러스/마이너스 서열번호 71 및 (2) GFP 주형 및 서열번호 2의 lox 66 Cre 부위를 포함하는 서열번호 72에 의한 변형된 HEK293FT 세포주의 형질감염에 의해 시험되었다. 72시간 후에, GFP의 lox71 부위로의 퍼센트 통합을 프로빙하였다. 도 3은 다양한 플라스미드의 존재하에서 HEK293FT 세포주에서 렌티바이러스 통합 lox71 부위에서 GFP의 퍼센트 통합을 도시한다. 절단 가능한 링커 또는 절단 가능하지 않은 링커를 통해 PE2에 연결된 프라임 편집 복합체와 Cre 재조합 효소를 갖는 포유류 발현 벡터인 pCMV PE2 P2A Cre(서열번호 73)이 GFP의 통합을 나타내는 것으로 관찰되었다.
실시예 2
Cre 재조합 효소에 의한 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(PASTE)-Lox 부위의 첨가
lox71(서열번호 1) 또는 lox66(서열번호 2) 서열을 프라임 편집을 사용하여 HEK293FT 세포 게놈에 삽입하여 HEK293FT 게놈으로의 GFP의 통합을 시험하였다. lox71 또는 lox66 서열을 HEK293FT 세포 게놈에 삽입하기 위해, 다양한 길이의 RT 영역에 작동 가능하게 연결된 13개 염기 쌍의 PBS 길이를 갖는 pegRNA를 사용하였다. 하기 플라스미드를 HEK293FT 세포의 형질감염에 사용하였다. 세포를 (1) 프라임 편집 작제물(PE2) 또는 조건부 Cre 발현을 갖는 PE2, (2) HEK3 유전자좌를 표적으로 하는 Lox71 또는 Lox66 pegRNA 및 (3) HEK3 유전자좌를 표적으로 하는 플러스/마이너스 +90 HEK3 니킹 제2 가이드 RNA(+90 ngRNA)로 형질감염시켰다. 72시간 후, HEK3 유전자좌에서 HEK293FT 게놈의 % 편집은 lox71 또는 lox66의 다양한 길이의 통합을 위해 프로빙하였다(도 4 참조). +90 ngRNA(서열번호 75)를 갖는 34개의 염기 쌍 lox71(HEK3 유전자좌 가이드, 서열번호 83; 및 RT 34와 PBS 13을 갖는 Lox71 pegRNA, 서열번호 81) 및 +90 ngRNA(서열번호 75)를 갖는 34개의 염기 쌍 lox66(HEK3 유전자좌 가이드, 서열번호 83; 및 RT 34와 PBS 13을 갖는 Lox66 pegRNA, 서열번호 82)이 가장 높은 % 편집을 갖는 것으로 관찰되었다.
실시예 3
Cre 재조합 효소에 의한 PASTE - 유전자의 통합
13개의 염기 쌍의 PBS 길이 및 34개의 염기 쌍의 삽입 길이를 갖는 lox71 또는 lox66 pegRNA를 사용하여 HEK293F 게놈에서 GFP의 통합을 프로빙하였다. PE와 Cre는 유도성 발현 벡터에서 전달되었고, 2일째에 유도되었다. HEK293FT 세포를 다음 플라스미드로 형질감염시켰다: (1) 프라임 편집 작제물(PE2 또는 조건부 Cre 발현을 갖는 PE2); (2) Lox71 pegRNA; (3) 플러스/마이너스 +90 HEK3 니킹 가이드 RNA; 및 (4) Lox66 부위를 갖는 EGFP 주형. 72시간 후, lox71 부위의 퍼센트 편집 및 GFP의 퍼센트 통합은 다양한 PE/Cre 작제물의 존재하에 lox66 부위를 사용하거나 하지 않고 프로빙하였다. 도 5a는 상이한 PE/Cre 벡터로 lox71 부위의 퍼센트 편집을 요약한다. 도 5b는 HEK293FT 세포 게놈의 lox71 부위에서 GFP의 퍼센트 통합을 요약한다. lox71 부위가 유도성 또는 비-유도성 PE/Cre 발현 시스템의 존재하에 편집되었지만, GFP 통합은 없는 것으로 관찰되었다.
실시예 4
Bxb1 통합 데이터 렌티 리포터
통합 시스템은 표적 유전자가 더 높은 효율로 게놈에 통합될 수 있는 인테그라제 시스템으로 전환되었다. 세린 인테그라제 Bxb1은 Cre 재조합 효소보다 더 활성이고, 표적 유전자의 비가역적 통합을 위해 박테리아 및 포유류 세포에서 매우 효율적인 것으로 나타났다. 도 6은 Bxb1을 사용하는 PASTE 방법론의 개략도를 도시한다(참조: Merrick, C. A. et al., ACS Synth . Biol . 2018, 7, 299-310).
Bxb1 통합 시스템의 효율을 프로빙하기 위해, 렌티바이러스를 사용하여 통합된 attB Bxb1 부위(서열번호 3)를 갖는 클로날 HEK293FT 세포주를 개발하였다. 이어서, 변형된 HEK293FT 세포주를 다음 플라스미드로 옮겼다: (1) 플러스/마이너스 Bxb1 발현 플라스미드 및 (2) attP Bxb1 부위를 갖는 플러스/마이너스 GFP(서열번호 76) 또는 G-Luc(서열번호 77) 미니서클 주형. 72시간 후, HEK293FT 게놈의 attB 부위에 GFP 또는 Gluc의 통합을 프로빙하였다. attB 유전자좌로 GFP 또는 Gluc의 퍼센트 통합은 도 7에 도시되어 있다. GFP 및 Gluc이 HEK293FT 세포에서 attB 부위로의 효율적인 통합을 나타내는 것으로 관찰되었다.
실시예 5
PRIME를 사용하여 인간 게놈에 Bxb1 부위의 첨가
최상의 효율로 HEK293FT 세포주에 통합될 수 있는 attB의 최대 길이를 프로빙하였다. 프라임 편집을 위해 attB(서열번호 3) 또는 그의 역 보체 attP(서열번호 4)의 최상의 길이를 프로빙하기 위해, 다양한 RT 상동성 길이를 갖는 13nt의 PBS 길이를 갖는 pegRNA를 사용하였다. 하기 플라스미드를 HEK293FT에서 형질감염시켰다: (1) 프라임 발현 플라스미드; (2) HEK3 표적화 pegRNA 설계; 및 (3) HEK3 +90 니킹 가이드. 72시간 후, 각각의 attB 작제물의 퍼센트 통합을 프로빙하였다. 도 8은 각각의 HEK3 표적화 pegRNA에서의 % 편집을 도시한다. 44개, 34개 및 26개의 염기쌍을 갖는 attB 및 34개 및 26개의 염기 쌍을 갖는 attB 역 보체가 가장 높은 % 편집을 나타냈음이 관찰되었다.
그런 다음, 통합 PASTE를 HEK29FT 세포에서 GFP로 세포-소기관 마커 단백질을 태깅하면서 시험하였다. PASTE를 사용하여 상이한 세포 배양 웰에서 GFP로 SUPT16H, SRRM2, LAMNB1, NOLC1 및 DEPDC4를 태깅하고 현미경법을 사용하여 세포 내에서 단백질 국소화를 추적하는 데 있어서 PASTE의 유용성을 시험하였다. 도 9a 내지 9g는 각 소기관에 대한 형광 현미경법 결과를 도시한다. SUPT16H-GFP가 핵에서 농축되는 것으로 관찰되었고, SRRM2-GFP는 핵 반점에서 농축되는 것으로 관찰되었으며, LAMNB1-GFP는 핵막에서 농축되는 것으로 관찰되었고, NOLC1-GFP는 원섬유 중심에서 농축되는 것으로 관찰되었고, DEPDC4-GFP는 아그레솜에서 농축되는 것으로 관찰되었다.
플라스미드의 형질감염은 도 10a-10b에 도시된 바와 같이 전기천공을 사용하여 달성될 수 있다.
실시예 6
PASTE에 의한 유전자의 프로그래밍 가능한 통합
PASTE에 의한 Gluc 또는 EGFP의 유전자 통합 효율을 시험하였다. PASTE에 의한 유전자 통합을 가능하게 하기 위해, 다음 HEK3 표적화 pegRNA를 사용하였다: (1) 44 pegRNA: 13nt의 PBS 및 44nt의 RT 상동성; (2) 34 pegRNA: 13nt의 PBS 및 34nt의 RT 상동성; 및 (3) 26 pegRNA: 13nt의 PBS 및 26nt의 RT 상동성.
HEK293 세포주를 다음 플라스미드 HEK293FT로 형질감염시켰다: (1) 프라임 발현 플라스미드; (2) Bxb1 발현 플라스미드; (3) HEK3 표적화 pegRNA 설계; (4) HEK3 +90 니킹 가이드; 및 (5) EGFP 또는 Gluc 미니서클. 72시간 후, Gluc 또는 EGFP의 퍼센트 통합이 관찰되었다. 도 11은 각각의 시험된 HEK3 표적화 pegRNA와 EGFP 및 Gluc의 통합을 도시한다. EGFP 및 Gluc는 PASTE를 사용하여 효율적으로 통합되었음이 관찰되었다.
실시예 7
다중 유전자 통합을 위한 PASTE
다중 유전자를 세포에 부위 특이적 통합하기 위한 PASTE 기술은 직교 attB 및 attP 부위의 사용으로 촉진된다. 중심 디뉴클레오티드는 GT로부터 GA로 변경될 수 있고, attB/attP 부위를 함유하는 GA만dl 상호작용할 수 있고 GT 함유 서열과 교차 반응하지 않는다. 다중화된 PASTE 편집을 위한 직교 attB/attP 쌍을 찾기 위한 디뉴클레오티드 조합의 스크린이 수행될 수 있다. 많은 직교 디뉴클레오티드 조합이 Bxb1 리포터 시스템을 사용하여 발견될 수 있음을 보여주었다.
이를 시험하기 위해, Bxb1을 위한 attBGT 및 attBGA 디뉴클레오티드를 프라임 편집에 의해 ACTB 부위에 첨가했다. EGFP-attPGT DNA 미니서클 및 mCherry-attPGA DNA 미니서클을 도입하여 Bxb1의 존재 또는 부재하에 퍼센트 EGFP 및 mCherry 편집을 시험하였다. EGFP 및 mCherry 편집의 결과를 도 14a-14b에 나타내었다.
우측 GT-EGFP 및 GA-mCherry 쌍과의 직교 편집이 달성되어 세포에서 다중화된 PASTE 편집 능력을 입증하였다.
다중화된 PASTE를 사용하여 동일한 세포에 두 개의 유전자를 도입하여 단일 반응에서 두 개의 상이한 유전자를 태깅하였다. EGFP 및 mCherry는 단일 반응에서 x 세포주에서 ACTB 및 NOLC1의 유전자좌로 태깅하였다. 또한, EGFP 및 mCherry를 ACTB 및 LAMNB1의 유전자좌로 태깅하였다. 세포를 형광 현미경법을 사용하여 시각화하였다. 도 15a-15b는 다중화된 PASTE에 대한 형광 현미경법의 결과를 나타낸다.
attB 및 attP의 9x9 교차에서 9개의 상이한 attB 및 attP 중심 디뉴클레오티드- AA, GA, CA, AG, AC, CC, GT, CT 및 TT(서열번호 7, 8, 23, 24, 19, 20, 25, 26, 27, 28, 9, 10, 15, 16, 17, 18, 5 및 6)-에 의한 다중화 능력을 시험하였다. 편집은 차세대 서열분석을 사용하여 프로빙하였다. attB 및 attP 중심 디뉴클레오티드의 9x9 교차- AA, GA, CA, AG, AC, CC, GT, CT 및 TT-의 결과는 도 16a에 제시되어 있다. attB 및 attP의 직교 쌍만이 가장 높은 편집 백분율을 나타낸다. 이 결과는 또한 도 16b의 히트-맵으로 제시되어 있다.
실시예 8
알부민 및 CPS1의 알부민 유전자좌로의 통합
알부민 가이드를 갖는 12 pegRNA를 PBS에 연결하고, 가변 길이의 역전사 효소 서열, 및 상이한 니킹 가이드 RNA를 사용하여 HEK293FT 세포를 형질감염시켰다. 알부민에서의 % 편집을 차세대 서열분석을 사용하여 프로빙하였다. 알부민 유전자좌에서의 프라임 편집의 결과를 도 17에 나타낸다. 서열번호 79가 세르피나1로 가장 높은 퍼센트 편집을 나타내었고, 서열번호 80이 CPS1로 가장 높은 퍼센트 편집을 나타낸 것으로 관찰되었다.
실시예 9
T-세포 조작
CD8+ T-세포를 조작하기 위해, T-세포에서 PASTE 전달 및 편집의 효율성을 평가할 수 있다(도 18). ACTB 표적화 pegRNA는 EGFP 삽입 주형을 갖는 통합 부위를 삽입하는데 사용될 수 있다. PASTE 성분을 CD8+ T-세포에 전달하기 위해, 전기천공이 자극되지 않은 T-세포를 위한 최적화된 전기천공 프로토콜과 함께 사용될 수 있다. 다수의 플라스미드가 전기천공의 효율을 감소시킬 수 있으므로, 더 적은 벡터를 사용하는 통합된 PASTE 성분을 적용할 수 있다.
5개 벡터, 3개 벡터, 및 2개 벡터 PASTE 시스템은 강력한 T-세포 편집이 3-벡터 접근법을 사용하는 최대 편집으로 달성될 수 있음을 보여준다(도 19). 또한, 전체 플라스미드 양, 세포 수 및 전압/암페어 프로토콜을 포함하는, 전기천공 조건의 확장된 세트를 시험할 수 있다. 또한, T-세포의 자극은 형질도입의 효율 및 PASTE 효율에 영향을 미칠 수 있다. 또한, T-활성제 CD3/CD28 리간드로 자극된 CD4+/CD8+ T 세포 혼합물은 비자극된 세포에 비해 더 높은 PASTE 편집 효율을 가질 수 있다. 전체 전달 속도로부터 PASTE의 효율을 분리하기 위해, PASTE 벡터 상의 mCherry 발현 카세트를 평가하여 성공적으로 형질감염된 T 세포를 분류할 수 있다. 최적화된 파라미터가 달성되면, TRAC, IL2Rα 및 PDCD1 유전자좌를 포함하는 T 세포에서 PASTE를 갖는 10개의 삽입 부위의 패널은 단일 및 다중화된 편집 맥락 모두에서 상이한 삽입(예: EGFP, BFP 및 YFP)을 사용하여 평가될 수 있다. HEK293FT에서 관련 부위의 시험된 서브세트는 EGFP 삽입에 대해 40% 초과의 편집을 달성하였다(도 20). 상이한 TCR 및 CAR 작제물을 갖는 TRAC 유전자좌에서 PASTE의 효율을 평가할 수 있다. T-세포는 성공적으로 형질감염되어 CAR 또는 TCR의 삽입을 달성할 수 있다.
실시예 10
CFTR을 위한 PASTE
CFTR 유전자좌를 위한 PASTE는 HEK293FT 세포에서 시험하여 인간 세포에 대한 상위 수행 pegRNA 및 니킹 설계를 식별할 수 있다. Neuro-2A 세포를 또한 시험하여 마우스 세포에 대한 상위 수행 pegRNA 및 니킹 설계를 식별할 수 있다. 최상의 작제물은 시험관내 마우스 공기 폐 계면(ALI) 오가노이드에서 시험 또는 마우스에서 낭포성 섬유증의 전임상 모델에서의 전달을 위해 적용될 수 있다. 표 12는 CFTR 유전자 조절을 위한 pegRNA, 니킹 가이드 및 미니서클 DNA 특성을 나타낸다.
[표 12]
실시예 11
PASTE를 사용하는 AttB 및 EGPF 통합
ACTB 유전자좌에서 attB 및 EGPF의 통합 효율을 평가하였다(도 21a-21c). Bxb1이 이 부위에 EGFP 주형을 첨가할 수 있는지 여부를 조사하기 위해, 다음 성분 각각을 발현하는 5개의 플라스미드 시스템을 사용하는 전달 접근법이 전개되었다: 1) pegRNA 발현, 2) 니킹 가이드 발현, 3) 프라임 발현(Cas9-RT), 4) Bxb1 발현 및 5) 삽입 주형(이 경우 EGFP). 이 접근법은 서열분석에 의해 측정된 바와 같이, HEK293FT 세포에서 최대 24%의 attB 부위의 편집 효율 및 약 10%의 EGFP의 통합을 산출하는 것으로 밝혀졌다(도 21a-21b). 최적의 활성은 3~4일 내에 달성되며, 모든 성분의 단일 단계 형질감염 또는 전기천공으로 수행될 수 있다. EGFP 플라스미드는 미니서클로 설계되어 목적하지 않은 모든 박테리아 성분을 제거할 수 있기 때문에, Bxb1 재조합 부위에서 최소한의 흉터와 함께 목적하는 유전자만이 삽입된다.
도구를 더 간단하게 사용하기 위해, Bxb1은 P2A 링커를 통해 Cas9-RT 융합에 대한 프라임에 연결되어 PASTE 단백질 발현에 2개가 아닌 단일 플라스미드만이 사용되도록 허용한다. 이러한 최적화는 동일한 수준의 편집을 유지할 수 있어서 도구를 사용하고 전달하는 것을 더 용이하게 한다(도 21c).
실시예 12
상이한 세포 유형에서 프로그램 가능한 EGFP 통합
간 간세포 암종 세포주 HEPG2(도 22a) 및 만성 골수성 백혈병 세포주 K562(도 22b)에서의 프로그램 가능한 EGFP 통합을 평가하였다. K562 및 HEPG2 세포의 ACTB 유전자좌에서 약 15%의 EGFP 통합이 관찰되어 세포 유형 전반에 걸쳐 플랫폼의 견고성을 입증했다.
실시예 13
향상된 PASTE 활성을 위한 Bxb1의 돌연변이유발
향상된 PASTE 활성을 위한 Bxb1의 돌연변이유발을 평가하였다(도 23a-23c). PASTE 활성을 최적화하기 위한 2개의 레버가 존재한다: 1) 인테그라제 활성의 개선및 2) 통합 서열의 프라임 첨가의 향상. 도 23a-23b에 도시된 바와 같이, Bxb1 활성은 PASTE에 의해 첨가된 Bxb1 attB 부위의 약 30%만이 Bxb1에 의해 통합되기 때문에 개선될 수 있다. 이는 Bxb1 효율이 개선될 수 있는 경우, PASTE가 개선될 수 있음을 예시한다. 또한, Bxb1 인테그라제에서의 촉매 잔기는 보존 및 구조 분석을 통해 식별되었고, Bxb1 돌연변이체는 PASTE의 일부로서 시험하기 위해 생성되었다. 도 23b에 도시된 바와 같이, 돌연변이는 통합을 약 20-30% 향상시킬 수 있다.
실시예 14
프라임 편집 통합 효율에 대한 pegRNA PBS 및 RT 길이의 효과
프라임 편집 통합 효율에 대한 pegRNA PBS 및 RT 길이의 효과를 평가하였다(도 25a-25f). PASTE는 최대 약 20%의 편집 비율을 달성하기 위해 ACTB 유전자좌에서 PBS 및 RT 길이를 조정함으로써 최적화될 수 있는 것으로 밝혀졌다(도 25a). attB 부위를 단축시키는 것은 프라임이 더 짧은 서열을 삽입하는 데 더 좋기 때문에 PASTE 기능을 개선하는데 도움이 될 수 있는 것으로 밝혀졌다. PBS, RT 및 attB 길이의 첨가 최적화는 최적 설계가 LMNB1, NOLC1, 및 GRSF1 유전자의 상류 삽입을 위해 발견될 수 있음을 보여주었다(도 25b, 25c 및 25d). attB에 대한 36nt만큼 짧은 길이는 리포터 플라스미드로의 통합을 위해 여전히 기능적인 것으로 밝혀졌다(도 25b 및 25c). attB 서열의 역보완된 버전이 프라임 편집을 통해 더 잘 통합되어 프라임이 삽입하는 서열이 중요하다는 것을 시사하는 것으로 밝혀졌다. attP 부위 돌연변이체와의 EGFP 통합은 특정 돌연변이체가 통합 효율을 현저하게 개선할 수 있음을 보여주었다(도 25e). PASTE는 또한 큰 유전자 패널로 수행하여 ACTB, LMNB1, SUPT16H, SRRM2, NOLC1, KLHL15, GRSF1, DEPDC4, NES, PGM1, CLTA, BASP1 및 DNAJC18의 N-말단에 EGFP를 삽입하였다(도 25f). 약 5% 내지 40%의 편집 비율은 디지털 액적 PCR(ddPCR)을 사용하여 발견되었다.
실시예 15
PASTE 및 HITI 표적 상 및 표적외 활성의 비교
PASTE 및 HITI 표적 상 및 표적외 활성을 비교하였다(도 26a-26f). PASTE 및 HITI는 동일한 가이드 서열을 사용할 때, 각각 약 22% 및 5% 통합 효율을 갖는 것으로 밝혀졌다(도 26a 및 26b). PASTE는 14개의 유전자 편집을 분석할 때 대부분의 부위에서 HITI를 능가하는 것으로 밝혀졌다(도 26c). ddPCR 기반 접근법을 사용하여, PASTE는 Bxb1 표적외 통합(도 26d) 및 Cas9 표적외 통합(도 26e)를 위한 최소 표적외 활성으로 매우 특이적인 것으로 밝혀졌다. 상이한 크기의 삽입물의 분석은 PASTE가 크기 1kb 내지 10kb의 서열을 신뢰성 있게 삽입할 수 있어(도 26f) PASTE가 작업할 수 있는 광범위한 서열 크기를 나타낸다는 것을 보여주었다. 더 큰 크기에서 삽입 효율의 감소도 관찰되었으며, 이는 더 큰 플라스미드 크기에서 HEK293FT 세포로의 플라스미드 전달의 감소에 기인할 가능성이 있었다.
실시예 16
PASTE 및 직교 디뉴클레오티드 attB 및 attP 부위에 의한 다중화
PASTE 및 직교 디뉴클레오티드 attB 및 attP 부위에 의한 다중화를 평가하였다(도 28a-28c). 중심 디뉴클레오티드 모티프의 돌연변이체에 대해 다중 직교 조합이 발견되었다(도 28a 및 28b). 도 28c에 도시된 바와 같이, 프로그램 가능한 다중화 유전자 삽입은 단백질 성분을 동일하게 유지하면서 상이한 pegRNA 및 유전자 삽입물만을 전달하는 PASTE와의 이러한 직교 조합을 사용함으로써 달성될 수 있다(도 8c).
실시예 17
내인성 부위에서 PASTE 다중화 통합
내인성 부위에서 PASTE 다중화 통합을 평가하였다(도 28a-28g). 서열(GLSGQPPRSPSSGSSG(서열번호 426)) 내의 글리신, 세린 및 플로핀의 농축으로 인해 단백질 링커에 이상적인 Bxb1에 의한 통합 후 남겨진 attR 흉터를 위한 판독 프레임이 식별되었다. PegRNA는 N-말단에서 다수의 유전자를 EGFP(ACTB, NOLC1, LMNB1, SUPT16H, SRRM2, 및 DEPDC4)로 태깅하기 위한 attR의 분해를 위해 이 링커 프레임을 사용하여 설계하였다. 이들 유전자가 모두 뚜렷한 단백질 국소화 외관을 갖기 때문에, 현미경 검사가 적절한 유전자 태깅을 확인하기 위해 사용될 수 있다. PASTE는 참조 이미지와 일치하는 단백질 국소화 및 세포에서 단백질의 예상된 국소화로 고효율 유전자 태깅이 가능한 것으로 밝혀졌다(도 28a-28c). 유전자는 또한 다중화된 방식으로 태깅되어 조작된 통합 부위의 직교성을 입증하였다. ACTB, LMNB1, NOLC1 및 GRSF는 단일, 이중-플렉싱 및 삼중-플렉싱의 그룹으로 HEK293FT에 각각 GT, TG, AC 및 CA를 운반하는 직교 pegRNA로 표적화하였다(도 28d-28e). 이러한 디뉴클레오티드는 EGFP, BFP 및 mCherry를 운반하는 주형과 쌍을 이루어 이러한 표지된 유전자의 다색 이미징을 허용하였다. 이러한 다중화 실험을 위한 통합 효율은 약 5% 내지 32%의 범위로 밝혀졌으며, 이는 PASTE에 의한 효율적인 다중 통합을 나타낸다. 이러한 다중화된 통합 실험의 공초점 현미경법을 사용하여, 세포는 이러한 상이한 단백질의 동시 표지와 함께 발견되었다(도 28f-28g).
실시예 18
CRISPR 기반 게놈 편집 및 부위 특이적 통합의 조합
CRISPR 기반 게놈 편집 및 부위 특이적 통합의 조합을 평가하였다.
상이한 attB의 길이 절단을 함유하는 PegRNA를 평가하였다(도 29a). 프라임 편집은 베타-액틴(ACTB) 유전자 유전자좌에서 최대 56bp 서열을 삽입할 수 있는 것으로 밝혀졌고, 31 bp 미만의 길이에서 더 높은 효율을 보였다(도 29a-b). 동족체 랜딩 부위의 통합은 다중 삽입 효소: Bxb1, TP901, 및 phiBT1 파지 세린 인테그라제 및 Cre 재조합 효소에 대해 시험되었다. 프라임 편집은 시험된 모든 랜딩 부위를 10 내지 30% 사이의 효율로 성공적으로 삽입하였다(도 29c-d). 완전한 시스템을 시험하기 위해, 모든 성분을 단일 형질감염으로 조합하여 전달하였다: 프라임 편집 벡터, pegRNA를 함유하는 랜딩 부위, 프라임 편집을 자극하기 위한 니킹 가이드, 상응하는 인테그라제 또는 재조합 효소를 위한 포유류 발현 벡터 및 녹색 형광 단백질(GFP)을 암호화하는 969 bp 미니서클 DNA 카고(도 29e). 4개의 인테그라제 및 재조합 효소 중 GFP 통합 비율을 비교하였고, Bxb1 인테그라제는 표적화 ACTB 유전자좌에서 가장 높은 통합 비율(약 20%)을 가졌고 최적의 성능을 위한 프라임 편집 니킹 가이드를 필요로 하는 것으로 밝혀졌다(도 29f-h). 마지막으로, 형질감염된 성분의 수를 감소시키기 위해, Bxb1은 P2A 단백질 절단 부위를 통해 SpCas9-M-MLV 역전사 효소(PE2) 융합 단백질과 함께 공동 발현되었다. 이러한 조합은 최대 30%의 높은 GFP 삽입 효율을 유지하였다(도 29e). 완전한 시스템, PASTE는 10% 초과의 통합 효율로 9,500 bp만큼 큰 주형의 정밀한 통합을 달성하였고(도 29j-k 및 26e), 전장 카고의 완전한 통합은 생어 서열분석에 의해 확인되었다(도 30a-e).
실시예 19
프라임 편집에 대한 프라임 편집 및 인테그라제 파라미터의 영향
프라임 편집의 통합 효율성에 대한 프라임 편집 및 인테그라제 파라미터의 영향을 평가하였다.
PASTE에 대한 관련 pegRNA 파라미터는 프라이머 결합 부위(PBS), 역전사 주형(RT), 및 attB 부위 길이뿐만 아니라 pegRNA 스페이서 및 니킹 가이드의 상대적 위치 및 효능을 포함한다(도 31a). PBS 및 RT 길이의 범위는 두 개의 유전자좌, ACTB 및 라민 Bl(LMNB1)에서 시험되었고, 효율성을 지배하는 규칙은 유전자좌 사이에서 다양한 것으로 밝혀졌고, 더 짧은 PBS 길이와 더 긴 RT 설계는 ACTB 유전자좌에서 더 높은 편집을 갖고(도 31b), 더 긴 PBS 및 더 짧은 RT 설계는 LMNB1에서 더 잘 수행된다(도 31c).
attB 랜딩 부위의 길이는 두 가지 상충되는 요인, 더 작은 삽입물에 대한 프라임 편집의 더 높은 효율과 더 짧은 attB 길이에서 Bxb1 통합의 감소된 효율의 균형을 유지해야 한다. AttB 길이는 ACTB, LMNB1, 및 핵소체 인단백질 p130(NOLC1)에서 평가되었으며, 최적의 attB 길이는 유전자좌 의존적인 것으로 밝혀졌다. ACTB 유전자좌에서, 긴 attB 길이는 프라임 편집에 의해 삽입될 수 있었고(도 29b), GFP의 삽입에 대한 전체 PASTE 효율은 긴 attB 길이에 대해 가장 높았다(도 31d). 대조적으로, 중간 attB 길이는 LMNB1(도 31e) 및 NOLC1(도 31f)에서 더 높은 전체 통합 효율(>20%)을 가졌고, 더 짧은 ATB 서열을 설치하는 효율성의 증가가 이러한 부위에서 Bxb1 통합의 감소를 극복했음을 나타낸다.
프라임 편집의 PE3 버전은 PE2와 삽입을 향한 플랩 중간체의 바이어스 분해에 대한 첨가 니킹 가이드를 결합한다. PASTE의 편집에 대한 니킹 가이드 선택의 중요성을 시험하기 위해, ACTB 및 LMNB1 유전자좌에서의 편집을 2개의 니킹 가이드 위치로 시험하였다. 차선의 니킹 가이드 위치는 니킹 가이드 부재하의 PASTE 효율의 75% 감소와 일치하여(도 29g) PASTE 효율을 최대 30% 감소시키는 것으로 밝혀졌다(도 32a). pegRNA 스페이서 서열은 PASTE의 편집에 필요한 것으로 밝혀졌고, 비표적화 가이드에 의한 스페이서 서열의 치환은 편집을 제거하는 것으로 밝혀졌다(도 32b).
합리적인 돌연변이는 또한 PE2 작제물의 Bxb1 인테그라제 및 역전사 효소 도메인 모두에 도입되어 PASTE를 추가로 최적화하였다. 이들 돌연변이의 일부가 PASTE에 의해 잘 견디었지만(도 33a-b), 그들 중 어느 것도 PASTE 편집 효율을 개선시키지 않았다.
짧은 RT 및 PBS 길이는 편집에 추가의 개선을 제공할 수 있다. 더 짧은 RT 및 PBS 가이드의 패널은 ACTB 및 LMNB1 유전자좌에서 시험되었고 더 짧은 RT 및 PBS 서열이 ACTB에서 편집을 증가시키지 않았지만(도 31g), 약 40%의 GFP 삽입률에 도달하는 최선의 수행 가이드로 LMNB1에서 편집을 개선시킨 것으로 최고 수행 가이드가 약 40%의 GFP 삽입률에 도달하는 것으로 밝혀졌다(도 31i).
실시예 20
다중 내인성 유전자에서 PASTE 태깅
GFP 삽입 효율은 PASTE 프로그래밍의 다양성을 시험하기 위해 7개의 상이한 유전자 유전자좌- ACTB, SUPT16H, SRRM2, NOLC1, DEPCDC4, NES 및 LMNB1-에서 측정하였다. 최대 22%의 통합 비율의 범위가 발견되었다(도 34a). PASTE는 카고 플라스미드에 대한 상동성 또는 서열 유사성을 요구하지 않기 때문에, 다양한 카고 서열의 통합은 모듈식이고, 상이한 유전자좌에 걸쳐 쉽게 스케일링된다. 크기가 969 bp로부터 4906 bp까지 다양한 6개의 상이한 유전자 카고는 ACTB 및 LMNB1 유전자좌에서 PASTE에 의한 삽입에 대해 시험되었다. 유전자와 삽입 유전자좌에 따라 5%와 22% 사이의 통합 주파수가 발견되었다(도 34b 및 35). 추가로, 7개의 공통 치료 유전자, CEP290, OTC, HBB, PAH, GBA, BTK, 및 ADA의 패널이 ACTB 유전자좌에서 삽입에 대해 평가하였고, 이러한 카고의 효율적인 통합은 5% 내지 20% 사이에서 발견되었다(도 34c).
내인성 유전자 발현의 중단 없이 프레임 내 단백질 태깅 또는 카고 발현을 위한 PASTE의 정확한 삽입을 평가하였다. Bxb1은 카고 통합 후 게놈에 잔류 서열(attL 및 attR이라 함)을 남기기 때문에, 이러한 게놈 흉터는 단백질 링커로서 작용할 수 있다. attR 서열의 프레임은 미니서클 카고에 대한 attP의 전략적 배치를 통해 위치되어 적합한 단백질 링커, GGLSGQPPRSSSGSSG(서열번호 427)를 달성하였다. 이 링커를 사용하여 4개의 유전자(ACTB, SRRM2, NOLC1, 및 LMNBT)를 PASTE를 사용하여 GFP로 태깅하였다. 정확한 유전자 태깅을 평가하기 위해, GFP의 준세포 위치를 면역 형광에 의해 태깅된 유전자 생성물과 비교하였다. 4개의 표적 유전자좌 모두에 대해, GFP는 태깅된 유전자 생성물과 공동-국소화되어 성공적인 태깅을 나타낸다(도 34d-e).
실시예 21
Bxb1 통합을 위한 직교 서열 선호도
Bxb1의 중심 디뉴클레오티드는 통합을 위한 attB 및 attP 부위의 회합에 관여하고, 매칭된 중심 디뉴클레오티드 서열을 변경하면 인테그라제 활성을 수정하고 두 유전자의 삽입을 위한 직교성을 제공할 수 있다. attB/attP 디뉴클레오티드 세트를 확장하면 PASTE에 의한 다중화된 유전자 삽입을 가능하게 할 수 있다. 16개의 디뉴클레오티드 attB/attP 서열 쌍 모두에 걸쳐 PASTE에 의한 ACTB 유전자좌에서의 GFP 통합 효율은 PASTE의 삽입을 위한 최적의 attB/attP 디뉴클레오티드를 찾기 위해 프로파일링되었다. 야생형 GT 서열보다 더 큰 통합 효율을 갖는 여러 디뉴클레오티드가 발견되었다(도 36a). 대부분의 디뉴클레오티드는 야생형 attB/attP 효율과 비교하여 75%의 편집 효율 이상이었으며, 이러한 디뉴클레오티드는 PASTE에 의한 다중화된 유전자 삽입을 위한 직교 채널일 수 있음을 암시한다.
이어서, 매칭된 및 매칭되지 않은 attB/attP 디뉴클레오티드 상호작용의 특이성을 평가하였다. attB/patP 통합을 비교하기 위해 풀링된 검정을 사용하여 확장 가능한 방식으로 모든 디뉴클레오티드 조합 사이의 상호작용을 프로파일링하였다(도 36b). 고유 식별자로 16개의 attP 디뉴클레오티드 플라스미드를 바코딩하고, 이 attP 풀을 Bxb1 인테그라제 발현 벡터 및 단일 attB 디뉴클레오티드 수용체 플라스미드로 공동 형질감염시키고, 생성되는 통합 생성물을 서열분석함으로써, 가능한 모든 attB/attP 쌍의 상대적 통합 효율을 측정하였다(도 36c). 디뉴클레오티드 특이성은 다양한 것으로 밝혀졌으며, 일부 디뉴클레오티드(GG)는 무시할 수 있는 크로스토크와 강한 자기-상호작용을 나타내고, 다른 뉴클레오티드(AA)는 최소한의 자기-선호도를 나타낸다. attP 선호도의 서열 로고(도 37)는 제1 위치에서 C 또는 G를 갖는 디뉴클레오티드가 공유된 제1 염기를 갖는 attB 디뉴클레오티드 서열에 대해 더 강한 선호도가 갖는 반면, 다른 attP 디뉴클레오티드, 특히 제1 위치에 A를 갖는 것들은 제1 attB 염기에 대해 감소된 특이성을 갖는다는 것을 나타냈다.
그런 다음, GA, AG, AC 및 CT 디뉴클레오티드 pegRNA를 ACTB에서 GFP 통합에 대해 시험한 다음, 그들의 상응하는 attP 카고와 쌍을 이루거나 다른 3개의 디뉴클레오티드 attP 서열과 잘못 쌍을 이루었다. 4개의 시험된 디뉴클레오티드는 모두 효율적으로 상응하는 attB/attP 쌍과 쌍을 이룰 때에만 카고를 통합하는 것으로 밝혀졌으며, 잘못 쌍을 이룬 조합에 걸쳐 검출 가능한 통합은 없었다(도 36d).
실시예 22
PASTE에 의한 다중 유전자 통합
매칭된 aatP 카고를 게놈의 특정 부위에 지시하는 직교 pegRNA를 사용하여 세포에서의 다중화를 평가하였다(도 38a). 3개의 상위 디뉴클레오티드 부착 부위 쌍(CT, AG, 및 GA)을 선택하여, ACTB(CT), LMNB1(AG) 및 NOLC1(GA)을 표적으로 하는 pegRNA 및 GFP(CT), mCherry(AG) 및 YFP(GA)를 함유하는 상응하는 미니서클 카고를 설계하였다. 이러한 시약을 세포에 공동 전달시, 5% 내지 25% 통합 범위에서 이들 pegRNA와 카고의 모든 가능한 조합의 단일-플렉스, 이중-플렉스 및 삼중-플렉스 편집이 달성되는 것으로 밝혀졌다(도 38b).
다중화된 유전자 통합을 위한 적용은 세포내 국소화 및 동일한 세포 내의 상호작용을 시각화하기 위해 상이한 단백질을 표지하기 위한 것이다. PASTE는 동일한 세포에서 ACTB(GFP) 및 NOLC1(mCherry) 또는 ACTB(GFP) 및 LMNB1(mCherry)을 동시에 태깅하는데 사용되었다. GFP와 mCherry 형광의 중첩이 관찰되지 않았고, 태깅된 유전자는 ACTB, NOLC1 및 LMNB1 단백질 생성물의 공지된 준세포 국소화를 기반으로 적절한 세포 구획에서 보이는 것으로 확인되었다(도 15a-b).
실시예 23
DSB 기반 삽입 방법과 비교된 PASTE 효율
PASTE 효율은 비교 가능한 DSB 기반 삽입 방법을 초과하는 것으로 밝혀졌다.
PASTE 편집은 NHEJ(즉, 상동성-독립적 표적화 통합, HITI) 또는 HDR 경로 중 하나를 사용하여 DSB-의존성 유전자 통합과 함께 평가하였다. PASTE는 HITI(도 39a-b) 또는 HDR(도 39c-d)보다 더 낫거나 동등한 유전자 삽입 효율을 가졌다. 7개의 상이한 내인성 표적 패널에서, PASTE는 7개 유전자 중 6개에서 HITI 편집을 초과했으며, 7번째 유전자에 대해 유사한 효율을 보였다(도 39a). DSB 생성은 대안적이고 목적하지 않은 편집 결과로서 삽입 또는 결실(indel)로 이어질 수 있기 때문에, 세 가지 방법 모두의 indel 주파수는 차세대 서열분석에 의해 평가되었으며, HEK293FT 및 HepG2 세포 모두에서 HDR 또는 HITI보다 PASTE로 생성된 indel이 훨씬 적다는 것을 발견하여(도 39b, 39d 및 40a), PASTE에 의한 고순도의 유전자 통합 결과를 보여준다.
실시예 24
PASTE 및 HITI 유전자 통합의 표적외 특성화
표적외 편집은 게놈 편집 기술에 사용될 수 있다. 특정 부위에서 PASTE의 특이성은 인간 게놈의 의사-attB 부위로의 Bxb1 통합에 의해 생성된 표적외 및 인간 게놈에서 가이드- 및 Cas9-의존 편집에 의해 생성된 표적외에 기초하여 평가되었다(도 39e). Bxb1은 의사 부착 부위에서 인간 게놈으로의 문서화된 통합이 결여된 반면, 천연 Bxb1 attB 코어 서열과 부분적 유사성을 갖는 잠재적 부위는 계산적으로 식별되었다. 이들 부위에 걸쳐 ddPCR에 의한 Bxb1 통합을 시험하였고, 표적외 활성은 밝혀지지 않았다(도 39f 및 40b-d). ACTB pegRNA를 위한 Cas9 표적외 검정하기 위해, 2개의 잠재적 표적외 부위를 계산적 예측을 통해 식별하였고, PASTE에 대한 표적외 통합은 밝혀지지 않았지만(도 39g 및 40a-d), 부위 중 하나에서 HITI에 의한 실질적인 표적외 활성은 밝혀졌다(도 39h 및 40a-d).
삽입-게놈 접합부의 태깅 및 PCR 증폭을 통해 Cas9 또는 Bxb1로 인한 게놈 전체 표적외를 추가로 평가하였다(도 39i). PASTE 편집 및 음성 대조군 누락 PE2를 갖는 조건에 대해 단일 세포 클론을 단리시켰고, 이들 클론으로부터 삽입 게놈 접합부의 깊은 서열분석은 모두 표적 상 ACTB 부위에 정렬하는 판독을 나타내어 표적외 게놈 삽입이 없음을 확인하였다(도 39j-l).
PASTE에 포함된 역전사 효소와 인테그라제의 발현은 세포 건강에 유해한 영향을 미칠 수 있다. 완전한 PASTE 시스템, PE2만을 갖는 상응하는 가이드 및 카고, 및 Bxb1만을 갖는 상응하는 가이드 및 카고를 형질감염시키고, 전사체 전체 RNA 서열분석을 통해 단백질 발현이 없는 GFP 대조군 형질감염 및 가이드 모두와 비교하여 이러한 효과의 정도를 결정하였다. 프라임 편집의 부재하에 Bxb1 발현은 몇 가지 중요한 표적외를 갖는 것으로 밝혀졌지만, 완전한 PASTE 시스템은 1.5배 이상의 변화를 갖는 하나의 차등적으로 조절된 유전자만을 가졌다(도 41a-b). Bxb1 과발현에 의해 상향조절된 유전자는 TENT5C 및 DDIT3와 같은 스트레스 반응 유전자를 포함하지만, 이러한 변화는 잠재적으로 PASTE 작제물 상의 P2A 링커로부터 Bxb1의 감소된 발현으로 인해 PASTE 시스템의 발현에서는 보이지 않았다(도 41c).
실시예 25
비분열 세포에서의 PASTE 효율
비분열 세포에서의 PASTE 활성을 평가하였다. Cas9 및 HDR 주형 또는 PASTE를 HEK293FT 세포로 형질감염시키고, 세포 분열은 아피디콜린 처리를 통해 정지시켰다(도 42a). 차단된 세포 분열의 본 모델에서, PASTE는 ACTB 유전자좌에서 20%초과의 GFP 유전자 통합 활성을 유지하는 반면, HDR-매개 통합은 제거된 것으로 밝혀졌다(도 42b 및 43a).
실시예 26
치료적 도입유전자의 생산 및 분비
더 큰 도입유전자를 사용하고 추가의 세포주에서 PASTE를 평가하였다.
치료적 도입유전자에 대한 크기 제한을 평가하기 위해, 분열 및 아피디콜린 처리된 세포 모두에서 최대 13.3kb 길이의 카고의 삽입을 평가하였다. 10% 초과의 삽입 효율이 발견되어(도 42c), 모든 전장 인간 cDNA 도입유전자의 약 99.7%의 삽입을 가능하게 하였다. 전달 비효율성 때문에 세포로 큰 삽입물 전달의 감소를 극복하기 위해, 삽입물의 더 많은 DNA 양을 전달하는 것은 유전자 통합 효율을 현저히 개선시키는 것으로 밝혀졌다(도 43b). K562 림프구 라인 및 1차 인간 T 세포에서 PASTE와 같은 첨가 세포 유형에 대한 PASTE 편집도 또한 평가하였다. PE2-P2A-Bxb1(PASTE) 및 PE2와 Bxb1의 별도 전달 모두가 두 세포 유형에서 효율적인 편집을 초래하는 것으로 밝혀졌다(도 42d-e). 마지막으로, 생체내 PASTE의 치료적 전달은 DNA 카고의 바이러스 전달을 필요로 할 수 있으므로, AAV가 Bxb1을 통해 게놈에 통합될 수 있는 페이로드를 함유하는 attP를 전달할 수 있는지 여부가 평가되었다. ACTB 유전자좌를 표적화하면, AAV는 용량 의존적 방식으로 최대 4%의 비율로 인테그라제 매개 삽입을 위한 적합한 주형을 전달할 수 있는 것으로 밝혀졌다(도 42f 및 43c).
PASTE의 효율을 향상시키기 위해, PE2*NLS를 프라임 편집을 위해 혼입하고 다중 유전자좌에서 개선된 PASTE 통합이 발견되었다(도 44a). 게다가, PE2*는 카고 플라스미드의 낮은 적정에서 보다 견고한 통합을 초래하여 플라스미드 8ng만큼 낮은 양의 통합을 입증하였다(도 44b). 불완전한 플라스미드 전달로 인해 PASTE 효율의 감소를 방지하기 위해, 푸로마이신 내성 유전자는 공동-전달되었고 약물 선택의 존재하에 PASTE 효율을 증가시키는 것으로 밝혀졌다(도 45).
프로그램 가능한 유전자 통합은 치료적 단백질 생성물의 발현을 위한 양식을 제공하고, 단백질 생산은 각각 질환 알파-1 항트립신 결핍 및 CPS1 결핍에 관여하는 치료적으로 관련된 단백질 알파-1 안티트립신(세르피나1에 의해 암호화됨) 및 카바모일 포스페이트 합성효소 I(CPS1에 의해 암호화됨)에 대해 평가되었다. 발광 단백질 서브유닛 HiBiT로 유전자 생성물을 태깅함으로써, 도입유전자 생산 및 분비가 PASTE 처리에 응답하여 독립적으로 평가되었다(도 42g). PASTE를 HEK293FT 세포 및 인간 간세포 암종 세포주(HepG2)에서 세르피나1 또는 CPS1 카고로 형질감염시키고, ACTB 유전자좌에서 효율적인 통합이 밝혀졌다(도 42h-i). 이러한 통합은 강력한 단백질 발현, 유전자 도입 생성물의 세포 내 축적(도 42j 및 46a-b), 및 단백질의 배지로의 분비를 초래하였다(도 42k).
실시예 27
최적화된 PASTE 작제물
복잡한 활성을 최적화하기 위해, 대안적인 역전사 효소 융합 및 돌연변이, 역전사 효소 도메인과 인테그라제 사이 및 Cas9와 역전사 효소 도메인 사이의 다양한 링커, 및 역전사 효소 및 BxbINT 도메인 돌연변이체를 포함하는 단백질 변형의 패널을 스크리닝하였다(도 47a 및 도 49c-도 49f). Cas9와 역전사 효소 사이의 48개의 잔기 XTEN 링커 및 Sto7d DNA 결합 도메인에 대한 MMuLV의 융합을 포함하는 다수의 단백질 변형(참조: Oscorbin et al. FEBS Lett. 594. 4338-4356. 2020)은 편집 효율을 향상시켰다(도 47a 및 도 49c-도 49d). 이러한 상위 변형이 역전사 효소-Sto7d 도메인과 BxbINT 사이의 GGGGS 링커(서열번호 420)와 결합되었을 때, 그들은 약 55% 유전자 통합을 생성하여 표적 부위에 직접 인테그라제를 모집하는 중요성을 강조했다(도 47a). 이 최적화된 작제물은 SpCas9-(XTEN-48)-RT-Sto7d-(GGGGS)-BxbINT로 지칭되었다. 최적화된 작제물은 약 20% 통합 효율로 약 36,000 bp만큼 큰 주형의 정확한 통합을 달성하였고(도 47a), 전장 카고의 완전한 통합은 생어 서열분석에 의해 확인되었다.
추가로, 상이한 AttB 길이 절단을 함유하는 pegRNA를 시험하고 프라임 편집이 베타-액틴(ACTB) 유전자 유전자좌에 최대 56 bp 서열을 삽입할 수 있었고, 31 bp 미만의 길이에서 더 높은 효율을 갖는 것으로 밝혀졌다(도 48a-도 48b). Bxb1 (즉, BxbINT), TP901(즉, Tp9INT), 및 phiBTL(즉, Bt1INT) 파지 세린 인테그린을 포함하는 다중 효소의 패널을 평가하였다. 프라임 편집은 10-30% 사이의 효율로 시험된 모든 랜딩 부위를 성공적으로 삽입하였다(도 48c-도 48d).
실시예 28
바이러스 전달 및 생체내 편집
완전한 PASTE 시스템을 바이러스 벡터에 패키징하기 위해, AdV 벡터를 활용하였다(도 50b). 아데노바이러스는 SpCas9-RT-BxbINT 및 가이드 발현을 위한 플라스미드와 함께 BxbINT 매개 삽입, 또는 SpCas9-RT의 플라스미드 전달과 함께 가이드 및 BxbINT의 AdV 전달에 적합한 주형을 전달할 수 있는지에 대해 평가하였고, HEK293FT 및 HepG2 세포에서 EGFP를 운반하는 약 36kb 아데노바이러스 게놈의 10-20% 통합이 달성되었음을 발견하였다(도 50c). 3개의 AdV 벡터에 걸쳐 카고 및 PASTE 시스템 성분의 패키징 및 전달시, 완전한 PASTE 시스템(Cas9-역전사 효소, 인테그라제 및 가이드 RNA, 또는 카고)은 HEK293FT 및 HepG2 세포에서 바이러스 단독 전달과 함께 약 50 내지 60%의 통합으로 아데노바이러스 전달로 치환될 수 있다(도 50d).
PASTE가 생체내 전달에 적합함을 추가로 입증하기 위해, PASTE 단백질 성분의 mRNA 버전 뿐만 아니라 화학적으로 변형된 합성 atgRNA 및 LMNB1 표적에 대한 니킹 가이드가 개발되었다(도 50e). 아데노바이러스 또는 플라스미드를 통한 주형의 전달과 함께 mRNA 및 가이드의 전기천공은 최대 약 23%의 고효율 통합을 산출하였다(도 50e-도 50f). 보다 지속적인 BxbINT 발현은 게놈에서 새로 배치된 AttB 부위로의 통합을 허용할 수 있으므로, 원형 mRNA 발현을 시험하고, 통합 효율을 약 30%로 향상시키는 것으로 밝혀졌다(도 50g-도 50i).
실시예 29
PASTE0에 의한 동시 결실 & 삽입
PASTE 시스템을 사용하여 동시에 하나의 서열을 결실시키고 다른 하나를 삽입하였다. AttB 핵산 서열의 조합된 삽입과 함께 LMNB1의 제1 엑손의 130 bp 및 385 bp 결실을 수행하였다(도 51a). 이 데이터는 PASTE 시스템을 사용하여 DNA 서열을 대체하는 것이 가능함을 보여준다.
PASTE 시스템을 사용하여 967 bp 카고의 조합된 삽입과 함께 LMNB1의 제1 엑손의 130 bp 결실이 또한 수행되었다.
2개의 attP 서열 중 하나를, 상기 기재된 바와 같이, 돌연변이된 AttP를 갖는 미니 서클 주형을 사용하여 삽입하였다. 이 AttP 돌연변이체는 특히 더 짧은 AttB(38-44bp)에 대해 더 나은 통합 동역학 및 효율을 나타낸다. 본 실험에서 사용된 LMNB1 AttB는 38 bp이다(도 51b).
SEQUENCE LISTING
<110> MASSACHUSETTS INSTITUTE OF TECHNOLOGY
<120> SYSTEMS, METHODS, AND COMPOSITIONS FOR SITE-SPECIFIC GENETIC
ENGINEERING USING PROGRAMMABLE ADDITION VIA SITE-SPECIFIC
TARGETING ELEMENTS (PASTE)
<130> 720766: 083474-016PC
<140>
<141>
<150> 63/222,550
<151> 2021-07-16
<160> 431
<170> PatentIn version 3.5
<210> 1
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Lox71
<400> 1
ataacttcgt ataatgtatg ctatacgaac ggta 34
<210> 2
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Lox66
<400> 2
taccgttcgt ataatgtatg ctatacgaag ttat 34
<210> 3
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB
<400> 3
ggccggcttg tcgacgacgg cggtctccgt cgtcaggatc atccgg 46
<210> 4
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP
<400> 4
ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcc 46
<210> 5
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-TT
<400> 5
ggcttgtcga cgacggcgtt ctccgtcgtc aggatcat 38
<210> 6
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-TT
<400> 6
gtggtttgtc tggtcaacca ccgcgttctc agtggtgtac ggtacaaacc ca 52
<210> 7
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-AA
<400> 7
ggcttgtcga cgacggcgaa ctccgtcgtc aggatcat 38
<210> 8
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-AA
<400> 8
gtggtttgtc tggtcaacca ccgcgaactc agtggtgtac ggtacaaacc ca 52
<210> 9
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-CC
<400> 9
ggcttgtcga cgacggcgcc ctccgtcgtc aggatcat 38
<210> 10
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-CC
<400> 10
gtggtttgtc tggtcaacca ccgcgccctc agtggtgtac ggtacaaacc ca 52
<210> 11
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-GG
<400> 11
ggcttgtcga cgacggcggg ctccgtcgtc aggatcat 38
<210> 12
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-GG
<400> 12
gtggtttgtc tggtcaacca ccgcgggctc agtggtgtac ggtacaaacc ca 52
<210> 13
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-TG
<400> 13
ggcttgtcga cgacggcgtg ctccgtcgtc aggatcat 38
<210> 14
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-TG
<400> 14
gtggtttgtc tggtcaacca ccgcgtgctc agtggtgtac ggtacaaacc ca 52
<210> 15
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-GT
<400> 15
ggcttgtcga cgacggcggt ctccgtcgtc aggatcat 38
<210> 16
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-GT
<400> 16
gtggtttgtc tggtcaacca ccgcggtctc agtggtgtac ggtacaaacc ca 52
<210> 17
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-CT
<400> 17
ggcttgtcga cgacggcgct ctccgtcgtc aggatcat 38
<210> 18
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-CT
<400> 18
gtggtttgtc tggtcaacca ccgcgctctc agtggtgtac ggtacaaacc ca 52
<210> 19
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-CA
<400> 19
ggcttgtcga cgacggcgca ctccgtcgtc aggatcat 38
<210> 20
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-CA
<400> 20
gtggtttgtc tggtcaacca ccgcgcactc agtggtgtac ggtacaaacc ca 52
<210> 21
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-TC
<400> 21
ggcttgtcga cgacggcgtc ctccgtcgtc aggatcat 38
<210> 22
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-TC
<400> 22
gtggtttgtc tggtcaacca ccgcgtcctc agtggtgtac ggtacaaacc ca 52
<210> 23
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-GA
<400> 23
ggcttgtcga cgacggcgga ctccgtcgtc aggatcat 38
<210> 24
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-GA
<400> 24
gtggtttgtc tggtcaacca ccgcggactc agtggtgtac ggtacaaacc ca 52
<210> 25
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-AG
<400> 25
ggcttgtcga cgacggcgag ctccgtcgtc aggatcat 38
<210> 26
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-AG
<400> 26
gtggtttgtc tggtcaacca ccgcgagctc agtggtgtac ggtacaaacc ca 52
<210> 27
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-AC
<400> 27
ggcttgtcga cgacggcgac ctccgtcgtc aggatcat 38
<210> 28
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-AC
<400> 28
gtggtttgtc tggtcaacca ccgcgacctc agtggtgtac ggtacaaacc ca 52
<210> 29
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-AT
<400> 29
ggcttgtcga cgacggcgat ctccgtcgtc aggatcat 38
<210> 30
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-AT
<400> 30
gtggtttgtc tggtcaacca ccgcgatctc agtggtgtac ggtacaaacc ca 52
<210> 31
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-GC
<400> 31
ggcttgtcga cgacggcggc ctccgtcgtc aggatcat 38
<210> 32
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-GC
<400> 32
gtggtttgtc tggtcaacca ccgcggcctc agtggtgtac ggtacaaacc ca 52
<210> 33
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-CG
<400> 33
ggcttgtcga cgacggcgcg ctccgtcgtc aggatcat 38
<210> 34
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-CG
<400> 34
gtggtttgtc tggtcaacca ccgcgcgctc agtggtgtac ggtacaaacc ca 52
<210> 35
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttB-TA
<400> 35
ggcttgtcga cgacggcgta ctccgtcgtc aggatcat 38
<210> 36
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttP-TA
<400> 36
gtggtttgtc tggtcaacca ccgcgtactc agtggtgtac ggtacaaacc ca 52
<210> 37
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> C-31-B
<400> 37
tgcgggtgcc agggcgtgcc cttgggctcc ccgggcgcgt actcc 45
<210> 38
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> C31-P
<400> 38
gtgccccaac tggggtaacc tttgagttct ctcagttggg gg 42
<210> 39
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> R4-B
<400> 39
gcgcccaagt tgcccatgac catgccgaag cagtggtaga agggcaccgg cagacac 57
<210> 40
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> R4-P
<400> 40
aggcatgttc cccaaagcga taccacttga agcagtggta ctgcttgtgg gtacactctg 60
cgggtgatga 70
<210> 41
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> BT1-B
<400> 41
gtccttgacc aggtttttga cgaaagtgat ccagatgatc cagctccaca ccccgaacgc 60
<210> 42
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> BT1-P
<400> 42
ggtgctgggt tgttgtctct ggacagtgat ccatgggaaa ctactcagca ccaccaatgt 60
tcc 63
<210> 43
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Bxb-B
<400> 43
tcggccggct tgtcgacgac ggcggtctcc gtcgtcagga tcatccgggc 50
<210> 44
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Bxb-P
<400> 44
gtcgtggttt gtctggtcaa ccaccgcggt ctcagtggtg tacggtacaa accccgac 58
<210> 45
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> TG1-B
<400> 45
gatcagctcc gcgggcaaga ccttctcctt cacggggtgg aaggtc 46
<210> 46
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> TG1-P
<400> 46
tcaaccccgt tccagcccaa cagtgttagt ctttgctctt acccagttgg gcgggatagc 60
ctgcccg 67
<210> 47
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> C1-B
<400> 47
aacgattttc aaaggatcac tgaatcaaaa gtattgctca tccacgcgaa atttttc 57
<210> 48
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> C1-P
<400> 48
aatattttag gtatatgatt ttgtttatta gtgtaaataa cactatgtac ctaaaat 57
<210> 49
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> C370-B
<400> 49
tgtaaaggag actgataatg gcatgtacaa ctatactcgt cggtaaaaag gca 53
<210> 50
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> C370-P
<400> 50
taaaaaaata cagcgttttt catgtacaac tatactagtt gtagtgccta aa 52
<210> 51
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> K38-B
<400> 51
gagcgccgga tcagggagtg gacggcctgg gagcgctaca cgctgtggct gcggtc 56
<210> 52
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> K38-P
<400> 52
ccctaatacg caagtcgata actctcctgg gagcgttgac aacttgcgca ccctga 56
<210> 53
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> RB-B
<400> 53
tctcgtggtg gtggaaggtg ttggtgcggg gttggccgtg gtcgaggtgg ggtggtggta 60
gccattcg 68
<210> 54
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> RV-P
<400> 54
gcacaggtgt agtgtatctc acaggtccac ggttggccgt ggactgctga agaacattcc 60
acgccagga 69
<210> 55
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> SPBC-B
<400> 55
agtgcagcat gtcattaata tcagtacaga taaagctgta tctcctgtga acacaatggg 60
tgcca 65
<210> 56
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> SPBC-P
<400> 56
aaagtagtaa gtatcttaaa aaacagataa agctgtatat taagatactt actac 55
<210> 57
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> TP901-B
<400> 57
tgataattgc caacacaatt aacatctcaa tcaaggtaaa tgctttttcg tttt 54
<210> 58
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> TP901-P
<400> 58
aattgcgagt ttttatttcg tttatttcaa ttaaggtaac taaaaaactc cttt 54
<210> 59
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Wbeta-B
<400> 59
aaggtagcgt caacgatagg tgtaactgtc gtgtttgtaa cggtacttcc aacagctggc 60
gtttcagt 68
<210> 60
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Wbeta-P
<400> 60
tagttttaaa gttggttatt agttactgtg atatttatca cggtacccaa taaccaatga 60
atatttga 68
<210> 61
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> A118-B
<400> 61
tgtaactttt tcggatcaag ctatgaagga cgcaaagagg gaactaaaca cttaatt 57
<210> 62
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> A118-P
<400> 62
ttgtttagtt cctcgttttc tctcgttgga agaagaagaa acgagaaact aaaatta 57
<210> 63
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> BL3-B
<400> 63
caacctgttg acatgtttcc acagacaact cacgtggagg tagtcacggc ttttacgtta 60
gtt 63
<210> 64
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> BL3-P
<400> 64
gagaatactg ttgaacaatg aaaaactagg catgtagaag ttgtttgtgc actaacttta 60
a 61
<210> 65
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MR11-B
<400> 65
acaggtcaac acatcgcagt tatcgaacaa tcttcgaaaa tgtatggagg cacttgtatc 60
aatataggat gtataccttc gaagacactt gtacatgatg gattagaagg caaatccttt 120
<210> 66
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MR11-P
<400> 66
caaaataaaa aacattgatt tttattaact tcttttgtgc ggaactacga acagttcatt 60
aatacgaagt gtacaaactt ccatacaaaa ataaccacga caattaagac gtggtttcta 120
<210> 67
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttL
<400> 67
attatttctc accctga 17
<210> 68
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> AttR
<400> 68
atcatctccc acccgga 17
<210> 69
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Vox
<400> 69
aataggtctg agaacgccca ttctcagacg tatt 34
<210> 70
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> FRT
<400> 70
gaagttccta tactttctag agaataggaa cttc 34
<210> 71
<211> 5881
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Cre Recombinase Expression Plasmid
<400> 71
ggtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 60
agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 120
cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 180
gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 240
catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 300
gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 360
gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 420
atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 480
gcgatggggg cggggggggg gggggcgcgc gccaggcggg gggggggggg gggggggggg 540
gggggggggg gggcgggggg gggcggcggc agccaatcag agcggcgcgc tccgaaagtt 600
tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc 660
gggagtcgct gcgcgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 720
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 780
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 840
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 900
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 960
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 1020
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 1080
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 1140
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 1200
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 1260
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 1320
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 1380
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 1440
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 1500
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc 1560
gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt 1620
gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct 1680
cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tctgagccgc 1740
caccatggcc aatttactga ccgtacacca aaatttgcct gcattaccgg tcgatgcaac 1800
gagtgatgag gttcgcaaga acctgatgga catgttcagg gatcgccagg cgttttctga 1860
gcatacctgg aaaatgcttc tgtccgtttg ccggtcgtgg gcggcatggt gcaagttgaa 1920
taaccggaaa tggtttcccg cagaacctga agatgttcgc gattatcttc tatatcttca 1980
ggcgcgcggt ctggcagtaa aaactatcca gcaacatttg ggccagctaa acatgcttca 2040
tcgtcggtcc gggctgccac gaccaagtga cagcaatgct gtttcactgg ttatgcggcg 2100
gatccgaaaa gaaaacgttg atgccggtga acgtgcaaaa caggctctag cgttcgaacg 2160
cactgatttc gaccaggttc gttcactcat ggaaaatagc gatcgctgcc aggatatacg 2220
taatctggca tttctgggga ttgcttataa caccctgtta cgtatagccg aaattgccag 2280
gatcagggtt aaagatatct cacgtactga cggtgggaga atgttaatcc atattggcag 2340
aacgaaaacg ctggttagca ccgcaggtgt agagaaggca cttagcctgg gggtaactaa 2400
actggtcgag cgatggattt ccgtctctgg tgtagctgat gatccgaata actacctgtt 2460
ttgccgggtc agaaaaaatg gtgttgccgc gccatctgcc accagccagc tatcaactcg 2520
cgccctggaa gggatttttg aagcaactca tcgattgatt tacggcgcta aggatgactc 2580
tggtcagaga tacctggcct ggtctggaca cagtgcccgt gtcggagccg cgcgagatat 2640
ggcccgcgct ggagtttcaa taccggagat catgcaagct ggtggctgga ccaatgtaaa 2700
tattgtcatg aactatatcc gtaacctgga tagtgaaaca ggggcaatgg tgcgcctgct 2760
ggaagatggc gatggaccgg tggaacaaaa acttatttct gaagaagatc tgtgatagcg 2820
gccgcactcc tcaggtgcag gctgcctatc agaaggtggt ggctggtgtg gccaatgccc 2880
tggctcacaa ataccactga gatctttttc cctctgccaa aaattatggg gacatcatga 2940
agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt 3000
gttggaattt tttgtgtctc tcactcggaa ggacatatgg gagggcaaat catttaaaac 3060
atcagaatga gtatttggtt tagagtttgg caacatatgc ccatatgctg gctgccatga 3120
acaaaggttg gctataaaga ggtcatcagt atatgaaaca gccccctgct gtccattcct 3180
tattccatag aaaagccttg acttgaggtt agattttttt tatattttgt tttgtgttat 3240
ttttttcttt aacatcccta aaattttcct tacatgtttt actagccaga tttttcctcc 3300
tctcctgact actcccagtc atagctgtcc ctcttctctt atggagatcc ctcgacctgc 3360
agcccaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 3420
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 3480
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 3540
tcgtgccagc ggatccgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc 3600
ccatcccgcc cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt 3660
tttttattta tgcagaggcc gaggccgcct cggcctctga gctattccag aagtagtgag 3720
gaggcttttt tggaggccta ggcttttgca aaaagctaac ttgtttattg cagcttataa 3780
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 3840
ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgga tccgctgcat 3900
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 3960
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 4020
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 4080
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 4140
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 4200
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 4260
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 4320
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 4380
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 4440
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 4500
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 4560
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 4620
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 4680
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 4740
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 4800
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 4860
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 4920
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 4980
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 5040
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 5100
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 5160
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 5220
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 5280
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 5340
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 5400
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 5460
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 5520
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 5580
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 5640
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 5700
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 5760
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 5820
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 5880
g 5881
<210> 72
<211> 4915
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> GFP-Lox66-Cre expression plasmid
<400> 72
agctctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga tggattgcac 60
gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca 120
atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt 180
gtcaagaccg acctgtccgg tgccctgaat gaactgcaag acgaggcagc gcggctatcg 240
tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga 300
agggactggc tgctattggg cgaagtgccg gggcaggatc tccatgtcat ctacaccttg 360
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 420
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 480
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 540
ccgaactgtt cgccaggctc aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc 600
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 660
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 720
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 780
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaattatta 840
actcgagatc cactagagtg tggcggccgc attcttataa tcagcatcat gatgtggtac 900
cacatcatga tgctgattac ccccaactga gagaactcaa aggttacccc agttggggcg 960
ggcccacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 1020
ttctagttgt ggtttgtcca aactcatcga gctcgagatc tggcgaaggc gatgggggtc 1080
ttgaaggcgt gctggtactc cacgatgccc agctcggtgt tgctgtgcag ctcctccacg 1140
cggcggaagg cgaacatggg gcccccgttc tgcaggatgc tggggtggat ggcgctcttg 1200
aagtgcatgt ggctgtccac cacgaagctg tagtagccgc cgtcgcgcag gctgaaggtg 1260
cgggcgaagc tgcccaccag cacgttatcg cccatggggt gcaggtgctc cacggtggcg 1320
ttgctgcgga tgatcttgtc ggtgaagatc acgctgtcct cggggaagcc ggtgcccacc 1380
accttgaagt cgccgatcac gcggccggcc tcgtagcggt agctgaagct cacgtgcagc 1440
acgccgccgt cctcgtactt ctcgatgcgg gtgttggtgt agccgccgtt gttgatggcg 1500
tgcaggaagg ggttctcgta gccgctgggg taggtgccga agtggtagaa gccgtagccc 1560
atcacgtggc tcagcaggta ggggctgaag gtcagggcgc ctttggtgct cttcatcttg 1620
ttggtcatgc ggccctgctc gggggtgccc tctccgccgc ccaccagctc gaactccacg 1680
ccgttcaggg tgccggtgat gcggcactcg atcttcatgg cgggcatggt ggcgaccggt 1740
agcgctagcg gcttcggata acttcgtata gcatacatta tacgaacggt aagcgctacc 1800
gccggcatac ccaagtgaag ttgctcgcag cttatagtcg cgcccgggga gcccaagggc 1860
acgccctggc accgcggccg ctgagtctcg accatcatca tcatcatcat tgagtttatc 1920
tgggataaca gggtaatgtc atctagggat aacagggtat gtcatctggg ataacagggt 1980
aatgtatcta gggataacag ggtaatgtca tctgggataa cagggtaatg tcatctaggg 2040
ataacagggt atgtcatctg ggataacagg gtaatgtatc tagggataac agggtaatgt 2100
catctgggat aacagggtaa tgtcatctag ggataacagg gtatgtcatc tgggataaca 2160
gggtaatgta tctagggata acagggtaat gtcatctggg ataacagggt aatgtcatct 2220
agggataaca gggtatgtca tctgggataa cagggtaatg tatctaggga taacagggta 2280
atgtcatctg ggataacagg gtaatgtcat ctagggataa cagggtatgt catctgggat 2340
aacagggtaa tgtatctagg gataacaggg taatgtcatc tgggataaca gggtaatgtc 2400
atctagggat aacagggtat gtcatctggg ataacagggt aatgtatcta gggataacag 2460
ggtaatgtca tctgggataa cagggtaatg tcatctaggg ataacagggt aaatgtcatc 2520
tagggataac agggtaatgt catctaggga taacagggta atgtcatctg ggataacagg 2580
gtaatgtcat ctagggataa cagggtaatg tatcgccagc gtcgcacagc atgtttgctt 2640
gtcgccgtcg cgtctgtcac atcttttccg ccagcagtta gggattagcg tcttaagctg 2700
gcgcgaggac caacgtatca gccaggcgaa gctgcttttg agcaccaccc ggatgcctat 2760
cgccaccgtc ggtcgcaatg ttggttttga cgatcaactc tatttctcgc gggtatttaa 2820
aaaatgcacc ggggccagcc cgagcgagtt ccgtgccggt tgtgaagaaa aagtgaatga 2880
tgtagccgtc aagttgtcat aattggtaac gaatcagaca attgacggct tgacggagta 2940
gcatagggtt tgcagaatcc ctgcttcgtc catttgacag gcacattatg catgccgctt 3000
cgccttcgcg cgcgaattga tctgctgcct cgcgcgtttc ggtgatgacg gtgaaaacct 3060
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 3120
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag ccatgaccca 3180
gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga gcagattgta 3240
ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc 3300
atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 3360
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 3420
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 3480
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 3540
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 3600
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 3660
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 3720
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 3780
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 3840
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 3900
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 3960
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 4020
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 4080
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 4140
gggattttgg tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaaagagt 4200
ttgtagaaac gcaaaaaggc catccgtcag gatggccttc tgcttaattt gatgcctggc 4260
agtttatggc gggcgtcctg cccgccaccc tccgggccgt tgcttcgcaa cgttcaaatc 4320
cgctcccggc ggatttgtcc tactcaggag agcgttcacc gacaaacaac agataaaacg 4380
aaaggcccag tctttcgact gagcctttcg ttttatttga tgcctggcag ttccctactc 4440
tcgcatgggg agaccccaca ctaccatcgg cgctacggcg tttcacttct gagttcggca 4500
tggggtcagg tgggaccacc gcgctactgc cgccaggcaa attctgtttt atcagaccgc 4560
ttctgcgttc tgatttaatc tgtatcaggc tgaaaatctt ctctcatccg ccaaaacagc 4620
caagctggag accgtttggc ccccctcgag cacgtagaaa gccagtccgc agaaacggtg 4680
ctgaccccgg atgaatgtca gctactgggc tatctggaca agggaaaacg caagcgcaaa 4740
gagaaagcag gtagcttgca gtgggcttac atggcgatag ctagactggg cggttttatg 4800
gacagcaagc gaaccggaat tgccagctgg ggcgccctct ggtaaggttg ggaagccctg 4860
caaagtaaac tggatggctt tctcgccgcc aaggatctga tggcgcaggg gatca 4915
<210> 73
<211> 10815
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> pCMV-PE2-P2A-Cre
<400> 73
acgcgttgac attgattatt gactagttat taatagtaat caattacggg gtcattagtt 60
catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga 120
ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca 180
atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca 240
gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg 300
cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc 360
tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt 420
ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt 480
ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg 540
acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc tggtttagtg 600
aaccgtcaga tccgctagag atccgcggcc gctaatacga ctcactatag ggagagccgc 660
caccatgaaa cggacagccg acggaagcga gttcgagtca ccaaagaaga agcggaaagt 720
cgacaagaag tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat 780
caccgacgag tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca 840
cagcatcaag aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc 900
cacccggctg aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta 960
tctgcaagag atcttcagca acgagatggc caaggtggac gacagcttct tccacagact 1020
ggaagagtcc ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa 1080
catcgtggac gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa 1140
actggtggac agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat 1200
gatcaagttc cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt 1260
ggacaagctg ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat 1320
caacgccagc ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg 1380
gctggaaaat ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct 1440
gattgccctg agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga 1500
tgccaaactg cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca 1560
gatcggcgac cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct 1620
gctgagcgac atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat 1680
gatcaagaga tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca 1740
gcagctgcct gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg 1800
ctacattgac ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga 1860
aaagatggac ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa 1920
gcagcggacc ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc 1980
cattctgcgg cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga 2040
gaagatcctg accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag 2100
attcgcctgg atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt 2160
ggtggacaag ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa 2220
cctgcccaac gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta 2280
taacgagctg accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag 2340
cggcgagcag aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt 2400
gaagcagctg aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc 2460
cggcgtggaa gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat 2520
caaggacaag gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct 2580
gaccctgaca ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca 2640
cctgttcgac gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag 2700
gctgagccgg aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga 2760
tttcctgaag tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag 2820
cctgaccttt aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca 2880
cgagcacatt gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt 2940
gaaggtggtg gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat 3000
cgaaatggcc agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat 3060
gaagcggatc gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt 3120
ggaaaacacc cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga 3180
tatgtacgtg gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggacgctat 3240
cgtgcctcag agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga 3300
caagaaccgg ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa 3360
ctactggcgg cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac 3420
caaggccgag agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct 3480
ggtggaaacc cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac 3540
taagtacgac gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa 3600
gctggtgtcc gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta 3660
ccaccacgcc cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta 3720
ccctaagctg gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat 3780
gatcgccaag agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa 3840
catcatgaac tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc 3900
tctgatcgag acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc 3960
caccgtgcgg aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca 4020
gacaggcggc ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc 4080
cagaaagaag gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta 4140
ttctgtgctg gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa 4200
agagctgctg gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt 4260
tctggaagcc aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta 4320
ctccctgttc gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca 4380
gaagggaaac gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca 4440
ctatgagaag ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca 4500
gcacaagcac tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat 4560
cctggccgac gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc 4620
catcagagag caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc 4680
tgccgccttc aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga 4740
ggtgctggac gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga 4800
cctgtctcag ctgggaggtg actctggagg atctagcgga ggatcctctg gcagcgagac 4860
accaggaaca agcgagtcag caacaccaga gagcagtggc ggcagcagcg gcggcagcag 4920
caccctaaat atagaagatg agtatcggct acatgagacc tcaaaagagc cagatgtttc 4980
tctagggtcc acatggctgt ctgattttcc tcaggcctgg gcggaaaccg ggggcatggg 5040
actggcagtt cgccaagctc ctctgatcat acctctgaaa gcaacctcta cccccgtgtc 5100
cataaaacaa taccccatgt cacaagaagc cagactgggg atcaagcccc acatacagag 5160
actgttggac cagggaatac tggtaccctg ccagtccccc tggaacacgc ccctgctacc 5220
cgttaagaaa ccagggacta atgattatag gcctgtccag gatctgagag aagtcaacaa 5280
gcgggtggaa gacatccacc ccaccgtgcc caacccttac aacctcttga gcgggctccc 5340
accgtcccac cagtggtaca ctgtgcttga tttaaaggat gcctttttct gcctgagact 5400
ccaccccacc agtcagcctc tcttcgcctt tgagtggaga gatccagaga tgggaatctc 5460
aggacaattg acctggacca gactcccaca gggtttcaaa aacagtccca ccctgtttaa 5520
tgaggcactg cacagagacc tagcagactt ccggatccag cacccagact tgatcctgct 5580
acagtacgtg gatgacttac tgctggccgc cacttctgag ctagactgcc aacaaggtac 5640
tcgggccctg ttacaaaccc tagggaacct cgggtatcgg gcctcggcca agaaagccca 5700
aatttgccag aaacaggtca agtatctggg gtatcttcta aaagagggtc agagatggct 5760
gactgaggcc agaaaagaga ctgtgatggg gcagcctact ccgaagaccc ctcgacaact 5820
aagggagttc ctagggaagg caggcttctg tcgcctcttc atccctgggt ttgcagaaat 5880
ggcagccccc ctgtaccctc tcaccaaacc ggggactctg tttaattggg gcccagacca 5940
acaaaaggcc tatcaagaaa tcaagcaagc tcttctaact gccccagccc tggggttgcc 6000
agatttgact aagccctttg aactctttgt cgacgagaag cagggctacg ccaaaggtgt 6060
cctaacgcaa aaactgggac cttggcgtcg gccggtggcc tacctgtcca aaaagctaga 6120
cccagtagca gctgggtggc ccccttgcct acggatggta gcagccattg ccgtactgac 6180
aaaggatgca ggcaagctaa ccatgggaca gccactagtc attctggccc cccatgcagt 6240
agaggcacta gtcaaacaac cccccgaccg ctggctttcc aacgcccgga tgactcacta 6300
tcaggccttg cttttggaca cggaccgggt ccagttcgga ccggtggtag ccctgaaccc 6360
ggctacgctg ctcccactgc ctgaggaagg gctgcaacac aactgccttg atatcctggc 6420
cgaagcccac ggaacccgac ccgacctaac ggaccagccg ctcccagacg ccgaccacac 6480
ctggtacacg gatggaagca gtctcttaca agagggacag cgtaaggcgg gagctgcggt 6540
gaccaccgag accgaggtaa tctgggctaa agccctgcca gccgggacat ccgctcagcg 6600
ggctgaactg atagcactca cccaggccct aaagatggca gaaggtaaga agctaaatgt 6660
ttatactgat agccgttatg cttttgctac tgcccatatc catggagaaa tatacagaag 6720
gcgtgggtgg ctcacatcag aaggcaaaga gatcaaaaat aaagacgaga tcttggccct 6780
actaaaagcc ctctttctgc ccaaaagact tagcataatc cattgtccag gacatcaaaa 6840
gggacacagc gccgaggcta gaggcaaccg gatggctgac caagcggccc gaaaggcagc 6900
catcacagag actccagaca cctctaccct cctcatagaa aattcatcac cctctggcgg 6960
ctcaaaaaga accgccgacg gcagcgaatt cgagcccaag aagaagagga aagtcggaag 7020
cggagctact aacttcagcc tgctgaagca ggctggcgac gtggaggaga accctggacc 7080
taatttactg accgtacacc aaaatttgcc tgcattaccg gtcgatgcaa cgagtgatga 7140
ggttcgcaag aacctgatgg acatgttcag ggatcgccag gcgttttctg agcatacctg 7200
gaaaatgctt ctgtccgttt gccggtcgtg ggcggcatgg tgcaagttga ataaccggaa 7260
atggtttccc gcagaacctg aagatgttcg cgattatctt ctatatcttc aggcgcgcgg 7320
tctggcagta aaaactatcc agcaacattt gggccagcta aacatgcttc atcgtcggtc 7380
cgggctgcca cgaccaagtg acagcaatgc tgtttcactg gttatgcggc ggatccgaaa 7440
agaaaacgtt gatgccggtg aacgtgcaaa acaggctcta gcgttcgaac gcactgattt 7500
cgaccaggtt cgttcactca tggaaaatag cgatcgctgc caggatatac gtaatctggc 7560
atttctgggg attgcttata acaccctgtt acgtatagcc gaaattgcca ggatcagggt 7620
taaagatatc tcacgtactg acggtgggag aatgttaatc catattggca gaacgaaaac 7680
gctggttagc accgcaggtg tagagaaggc acttagcctg ggggtaacta aactggtcga 7740
gcgatggatt tccgtctctg gtgtagctga tgatccgaat aactacctgt tttgccgggt 7800
cagaaaaaat ggtgttgccg cgccatctgc caccagccag ctatcaactc gcgccctgga 7860
agggattttt gaagcaactc atcgattgat ttacggcgct aaggatgact ctggtcagag 7920
atacctggcc tggtctggac acagtgcccg tgtcggagcc gcgcgagata tggcccgcgc 7980
tggagtttca ataccggaga tcatgcaagc tggtggctgg accaatgtaa atattgtcat 8040
gaactatatc cgtaacctgg atagtgaaac aggggcaatg gtgcgcctgc tggaagatgg 8100
cgattaattt aaacccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 8160
gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 8220
taataaaatg agaaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 8280
ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 8340
gcggtgggct ctatggcttc tgaggcggaa agaaccagct ggggctcgat accgtcgacc 8400
tctagctaga gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg 8460
ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagccta gggtgcctaa 8520
tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac 8580
ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 8640
gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 8700
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 8760
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 8820
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 8880
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 8940
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 9000
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 9060
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 9120
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 9180
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 9240
tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 9300
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 9360
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 9420
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 9480
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 9540
agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 9600
atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 9660
cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 9720
ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 9780
agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 9840
tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 9900
gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 9960
caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 10020
ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 10080
gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 10140
tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 10200
tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 10260
cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 10320
cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 10380
gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 10440
atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 10500
agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 10560
ccccgaaaag tgccacctga cgtcgacgga tcgggagatc gatctcccga tcccctaggg 10620
tcgactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatct gctccctgct 10680
tgtgtgttgg aggtcgctga gtagtgcgcg agcaaaattt aagctacaac aaggcaaggc 10740
ttgaccgaca attgcatgaa gaatctgctt agggttaggc gttttgcgct gcttcgcgat 10800
gtacgggcca gatat 10815
<210> 74
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> +90ngRNA guide sequence
<400> 74
gtcaaccagt atcccggtgc 20
<210> 75
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> +90ngRNA
<400> 75
gtcaaccagt atcccggtgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 76
<211> 4968
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> GFP minicircle template (before cleavage)
<400> 76
tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60
cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120
aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180
gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240
tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300
tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360
ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420
aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480
gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600
gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660
gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720
tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780
gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840
atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900
tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960
gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020
actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080
gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140
agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200
ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260
aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320
cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380
gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440
cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500
cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560
gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680
tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740
catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860
ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920
gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980
cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040
cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100
tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160
catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220
taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280
aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340
tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400
catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460
atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520
taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580
agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640
tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700
acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760
tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820
accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880
gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940
gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000
actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060
tgggctcccc gggcgcgact ataagctgcg agcaacttca cttgggtatg ccggcggtag 3120
cgcttaccgt tcgtataatg tatgctatac gaagttatcc gaagccgcta gcggtggttt 3180
gtctggtcaa ccaccgcggt ctcagtggtg tacggtacaa acccagctac cggtcgccac 3240
catgcccgcc atgaagatcg agtgccgcat caccggcacc ctgaacggcg tggagttcga 3300
gctggtgggc ggcggagagg gcacccccga gcagggccgc atgaccaaca agatgaagag 3360
caccaaaggc gccctgacct tcagccccta cctgctgagc cacgtgatgg gctacggctt 3420
ctaccacttc ggcacctacc ccagcggcta cgagaacccc ttcctgcacg ccatcaacaa 3480
cggcggctac accaacaccc gcatcgagaa gtacgaggac ggcggcgtgc tgcacgtgag 3540
cttcagctac cgctacgagg ccggccgcgt gatcggcgac ttcaaggtgg tgggcaccgg 3600
cttccccgag gacagcgtga tcttcaccga caagatcatc cgcagcaacg ccaccgtgga 3660
gcacctgcac cccatgggcg ataacgtgct ggtgggcagc ttcgcccgca ccttcagcct 3720
gcgcgacggc ggctactaca gcttcgtggt ggacagccac atgcacttca agagcgccat 3780
ccaccccagc atcctgcaga acgggggccc catgttcgcc ttccgccgcg tggaggagct 3840
gcacagcaac accgagctgg gcatcgtgga gtaccagcac gccttcaaga cccccatcgc 3900
cttcgccaga tctcgagctc gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3960
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtgggcccg ccccaactgg 4020
ggtaaccttt gagttctctc agttgggggt aatcagcatc atgatgtggt accacatcat 4080
gatgctgatt ataagaatgc ggccgccaca ctctagtgga tctcgagtta ataattcaga 4140
agaactcgtc aagaaggcga tagaaggcga tgcgctgcga atcgggagcg gcgataccgt 4200
aaagcacgag gaagcggtca gcccattcgc cgccaagctc ttcagcaata tcacgggtag 4260
ccaacgctat gtcctgatag cggtccgcca cacccagccg gccacagtcg atgaatccag 4320
aaaagcggcc attttccacc atgatattcg gcaagcaggc atcgccatgg gtcacgacga 4380
gatcctcgcc gtcgggcatg ctcgccttga gcctggcgaa cagttcggct ggcgcgagcc 4440
cctgatgctc ttcgtccaga tcatcctgat cgacaagacc ggcttccatc cgagtacgtg 4500
ctcgctcgat gcgatgtttc gcttggtggt cgaatgggca ggtagccgga tcaagcgtat 4560
gcagccgccg cattgcatca gccatgatgg atactttctc ggcaggagca aggtgtagat 4620
gacatggaga tcctgccccg gcacttcgcc caatagcagc cagtcccttc ccgcttcagt 4680
gacaacgtcg agcacagctg cgcaaggaac gcccgtcgtg gccagccacg atagccgcgc 4740
tgcctcgtct tgcagttcat tcagggcacc ggacaggtcg gtcttgacaa aaagaaccgg 4800
gcgcccctgc gctgacagcc ggaacacggc ggcatcagag cagccgattg tctgttgtgc 4860
ccagtcatag ccgaatagcc tctccaccca agcggccgga gaacctgcgt gcaatccatc 4920
ttgttcaatc atgcgaaacg atcctcatcc tgtctcttga tcagagct 4968
<210> 77
<211> 4855
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> GLuc minicircle template
<400> 77
tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60
cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120
aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180
gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240
tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300
tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360
ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420
aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480
gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600
gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660
gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720
tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780
gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840
atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900
tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960
gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020
actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080
gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140
agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200
ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260
aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320
cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380
gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440
cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500
cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560
gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680
tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740
catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860
ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920
gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980
cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040
cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100
tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160
catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220
taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280
aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340
tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400
catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460
atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520
taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580
agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640
tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700
acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760
tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820
accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880
gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940
gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000
actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060
tgggctcccc gggcgcgact ataagctgcg agcaacttca cttgggtatg ccggcggtag 3120
cgcttaccgt tcgtataatg tatgctatac gaagttatcc gaagccgcta gcggtggttt 3180
gtctggtcaa ccaccgcggt ctcagtggtg tacggtacaa acccactacc ggtcgccacc 3240
atgggagtca aagttctgtt tgccctgatc tgcatcgctg tggccgaggc caagcccacc 3300
gagaacaacg aagacttcaa catcgtggcc gtggccagca acttcgcgac cacggatctc 3360
gatgctgacc gcgggaagtt gcccggcaag aagctgccgc tggaggtgct caaagagatg 3420
gaagccaatg cccggaaagc tggctgcacc aggggctgtc tgatctgcct gtcccacatc 3480
aagtgcacgc ccaagatgaa gaagttcatc ccaggacgct gccacaccta cgaaggcgac 3540
aaagagtccg cacagggcgg cataggcgag gcgatcgtcg acattcctga gattcctggg 3600
ttcaaggact tggagcccat ggagcagttc atcgcacagg tcgatctgtg tgtggactgc 3660
acaactggct gcctcaaagg gcttgccaac gtgcagtgtt ctgacctgct caagaagtgg 3720
ctgccgcaac gctgtgcgac ctttgccagc aagatccagg gccaggtgga caagatcaag 3780
ggggccggtg gtgactaagc ggagctcgat gagtttggac aaaccacaac tagaatgcag 3840
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt gggcccgccc 3900
caactggggt aacctttgag ttctctcagt tgggggtaat cagcatcatg atgtggtacc 3960
acatcatgat gctgattata agaatgcggc cgccacactc tagtggatct cgagttaata 4020
attcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 4080
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 4140
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 4200
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 4260
acgacgagat cctcgccgtc gggcatgctc gccttgagcc tggcgaacag ttcggctggc 4320
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 4380
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 4440
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 4500
tgtagatgac atggagatcc tgccccggca cttcgcccaa tagcagccag tcccttcccg 4560
cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc agccacgata 4620
gccgcgctgc ctcgtcttgc agttcattca gggcaccgga caggtcggtc ttgacaaaaa 4680
gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag ccgattgtct 4740
gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa cctgcgtgca 4800
atccatcttg ttcaatcatg cgaaacgatc ctcatcctgt ctcttgatca gagct 4855
<210> 78
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> pseudo-attP
<400> 78
ccccaactgg ggtaaccttt gagttctctc agttgggg 38
<210> 79
<211> 194
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Albumin-pegRNA-SERPIN
<400> 79
gactgaaact tcacagaata gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttgg gatagttatg aattcaatct 120
tcaaccctat ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctctg 180
tgaagtttca gtca 194
<210> 80
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Albumin-pegRNA-CPS1
<400> 80
gactgaaact tcacagaata gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttgg gatagttatg aattcaatct 120
tcaaccctat ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctctg 180
tgaagtttc 189
<210> 81
<211> 177
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> 34bp lox71 pegRNA
<400> 81
ggcccagact gagcacgtga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgga ggaagcaggg cttcctttcc 120
tctgccatca taccgttcgt atagcataca ttatacgaag ttatcgtgct cagtctg 177
<210> 82
<211> 177
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> 34bp lox66 pegRNA
<400> 82
ggcccagact gagcacgtga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgga ggaagcaggg cttcctttcc 120
tctgccatca ataacttcgt atagcataca ttatacgaac ggtacgtgct cagtctg 177
<210> 83
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> gRNA2
<400> 83
ggcccagact gagcacgtga 20
<210> 84
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 84
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctgagctgcg 180
agaa 184
<210> 85
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 85
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120
tatcatcatc catggcacaa ttaacatctc aatcaaggta aatgcttgag ctgcgagaa 179
<210> 86
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 86
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120
tatcatcatc catggagcat ttaccttgat tgagatgtta attgtgtgag ctgcgagaa 179
<210> 87
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 87
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120
tatcatcatc catggcaggt ttttgacgaa agtgatccag atgatccagt gagctgcgag 180
aa 182
<210> 88
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 88
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagt cggtgcgacg agcgcggcga 120
tatcatcatc catggctgga tcatctggat cactttcgtc aaaaacctgt gagctgcgag 180
aa 182
<210> 89
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 89
gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 90
<211> 164
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 90
gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggtaccgttc 120
gtatagcata cattatacga agttattgag ctgcgagaat agcc 164
<210> 91
<211> 172
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 91
gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggtaccg ttcgtatagc atacattata cgaagttatt gagctgcgag aa 172
<210> 92
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 92
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120
tcatccatgg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctgag 180
ctgcgagaa 189
<210> 93
<211> 181
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 93
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgagc gcggcgatat catcatccat 120
ggccggatga tcctgacgac ggagaccgcc gtcgtcgaca agccggcctg agctgcgaga 180
a 181
<210> 94
<211> 178
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 94
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgccgcg gcgatatcat catccatggc 120
cggatgatcc tgacgacgga gaccgccgtc gtcgacaagc cggcctgagc tgcgagaa 178
<210> 95
<211> 175
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 95
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg atatcatcat ccatggccgg 120
atgatcctga cgacggagac cgccgtcgtc gacaagccgg cctgagctgc gagaa 175
<210> 96
<211> 171
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 96
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggccggatga 120
tcctgacgac ggagaccgcc gtcgtcgaca agccggcctg agctgcgaga a 171
<210> 97
<211> 194
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 97
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120
tcatccatgg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctgag 180
ctgcgagaat agcc 194
<210> 98
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 98
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctgagctgcg 180
agaatagcc 189
<210> 99
<211> 176
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 99
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggccggatga 120
tcctgacgac ggagaccgcc gtcgtcgaca agccggcctg agctgcgaga atagcc 176
<210> 100
<211> 194
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 100
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcctgc ccatccgcgg cggcacgggg 120
gtcgcagtcg ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc 180
ccgggcggcg gaga 194
<210> 101
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 101
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgccatc cgcggcggca cgggggtcgc 120
agtcgccatg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg 180
cggcggaga 189
<210> 102
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 102
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120
ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg 180
gaga 184
<210> 103
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 103
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggca cgggggtcgc agtcgccatg 120
ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg cggcggaga 179
<210> 104
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 104
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgggg gtcgcagtcg ccatgccgga 120
tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg gaga 174
<210> 105
<211> 199
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 105
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcctgc ccatccgcgg cggcacgggg 120
gtcgcagtcg ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc 180
ccgggcggcg gagacagcg 199
<210> 106
<211> 194
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 106
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgccatc cgcggcggca cgggggtcgc 120
agtcgccatg ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg 180
cggcggagac agcg 194
<210> 107
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 107
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120
ccatgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg 180
gagacagcg 189
<210> 108
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 108
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggca cgggggtcgc agtcgccatg 120
ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcccggg cggcggagac 180
agcg 184
<210> 109
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 109
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgggg gtcgcagtcg ccatgccgga 120
tgatcctgac gacggagacc gccgtcgtcg acaagccggc ccgggcggcg gagacagcg 179
<210> 110
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 110
gcgtggtggg gccgccagcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 111
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 111
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggggatg atcctgacga cggagaccgc cgtcgtcgac aagccggtga gctgcgagaa 180
<210> 112
<211> 178
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 112
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catgggatga tcctgacgac ggagaccgcc gtcgtcgaca agccgtgagc tgcgagaa 178
<210> 113
<211> 176
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 113
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggatgat cctgacgacg gagaccgccg tcgtcgacaa gcctgagctg cgagaa 176
<210> 114
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 114
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggtgatc ctgacgacgg agaccgccgt cgtcgacaag ctgagctgcg agaa 174
<210> 115
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 115
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120
ccatgcggat gatcctgacg acggagaccg ccgtcgtcga caagccggcc gggcggcgga 180
ga 182
<210> 116
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 116
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120
ccatgggatg atcctgacga cggagaccgc cgtcgtcgac aagccggcgg gcggcggaga 180
<210> 117
<211> 178
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 117
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120
ccatggatga tcctgacgac ggagaccgcc gtcgtcgaca agccgcgggc ggcggaga 178
<210> 118
<211> 176
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 118
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120
ccatgatgat cctgacgacg gagaccgccg tcgtcgacaa gcccgggcgg cggaga 176
<210> 119
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 119
gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120
ccgccccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctcctccagg 180
caatacgcg 189
<210> 120
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 120
gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120
ccgccccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctcctccagg 180
caat 184
<210> 121
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 121
gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120
ccgcccggat gatcctgacg acggagaccg ccgtcgtcga caagccggct cctccaggca 180
at 182
<210> 122
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 122
gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120
ccgccggatg atcctgacga cggagaccgc cgtcgtcgac aagccggtcc tccaggcaat 180
<210> 123
<211> 178
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 123
gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120
ccgccgatga tcctgacgac ggagaccgcc gtcgtcgaca agccgtcctc caggcaat 178
<210> 124
<211> 176
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 124
gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120
ccgccatgat cctgacgacg gagaccgccg tcgtcgacaa gcctcctcca ggcaat 176
<210> 125
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 125
gagccgagca cgaggggata cgttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97
<210> 126
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 126
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg atatcatcat ccatggatga 120
tcctgacgac ggagaccgcc gtcgtcgaca agcctgagct gcgagaa 167
<210> 127
<211> 162
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 127
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctatc atcatccatg gatgatcctg 120
acgacggaga ccgccgtcgt cgacaagcct gagctgcgag aa 162
<210> 128
<211> 157
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 128
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcat ccatggatga tcctgacgac 120
ggagaccgcc gtcgtcgaca agcctgagct gcgagaa 157
<210> 129
<211> 163
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 129
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg atatcatcat ccatggatga 120
tcctgacgac ggagaccgcc gtcgtcgaca agcctgagct gcg 163
<210> 130
<211> 158
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 130
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctatc atcatccatg gatgatcctg 120
acgacggaga ccgccgtcgt cgacaagcct gagctgcg 158
<210> 131
<211> 153
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 131
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcat ccatggatga tcctgacgac 120
ggagaccgcc gtcgtcgaca agcctgagct gcg 153
<210> 132
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 132
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgccggg ggtcgcagtc gccatgatga 120
tcctgacgac ggagaccgcc gtcgtcgaca agcccgggcg gcggaga 167
<210> 133
<211> 162
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 133
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgtcg cagtcgccat gatgatcctg 120
acgacggaga ccgccgtcgt cgacaagccc gggcggcgga ga 162
<210> 134
<211> 157
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 134
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagtc gccatgatga tcctgacgac 120
ggagaccgcc gtcgtcgaca agcccgggcg gcggaga 157
<210> 135
<211> 163
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 135
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgccggg ggtcgcagtc gccatgatga 120
tcctgacgac ggagaccgcc gtcgtcgaca agcccgggcg gcg 163
<210> 136
<211> 158
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 136
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgtcg cagtcgccat gatgatcctg 120
acgacggaga ccgccgtcgt cgacaagccc gggcggcg 158
<210> 137
<211> 153
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 137
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagtc gccatgatga tcctgacgac 120
ggagaccgcc gtcgtcgaca agcccgggcg gcg 153
<210> 138
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 138
gagaagcggc gtccggggct agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgctct ttgtccagag tcacagccat 120
accggatgat cctgacgacg gagaccgccg tcgtcgacaa gccggccccc cggacgccgc 180
<210> 139
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 139
gggcacgggg ccatgtacaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcg tcggcagccc gatcccgttg 120
ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcctaca tggccccgt 179
<210> 140
<211> 185
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 140
gtgtcaggtg gggcggggct agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgct ggctcctccc ctggcaccat 120
accggatgat cctgacgacg gagaccgccg tcgtcgacaa gccggccccc cgccccacct 180
gacac 185
<210> 141
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 141
gagtgggtca gacgagcagg agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgat ggagggctgc atgggggagg 120
agtcgccgga tgatcctgac gacggagacc gccgtcgtcg acaagccggc ctgctcgtct 180
gacc 184
<210> 142
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 142
gcagccaccc gctctcggcc cgttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97
<210> 143
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 143
gtgtagtcag gccgctcacc cgttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97
<210> 144
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 144
gctgacaagt ctacggaacc tgttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97
<210> 145
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 145
gctcctccag cgccttgacc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 146
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 146
gctattctcg cagctcacca 20
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 147
agaagcggcg tccggggcta 20
<210> 148
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 148
gggcacgggg ccatgtacaa 20
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 149
gcgtattgcc tggaggatgg 20
<210> 150
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 150
tgtcaggtgg ggcggggcta 20
<210> 151
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 151
agtgggtcag acgagcagga 20
<210> 152
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 152
gctgtctccg ccgcccgcca 20
<210> 153
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 153
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 154
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (148)..(149)
<223> CG, GC, AT, TA, GG, TT, GA, AG, CC, TC, CT, AA, TG, GT, CA,
or AC
<400> 154
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggccgga tgatcctgac gacggagnnc gccgtcgtcg acaagccggc ctgagctgcg 180
agaa 184
<210> 155
<211> 183
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 155
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catgccggat gatcctgacg acggagaccg ccgtcgtcga caagccggcc tgagctgcga 180
gaa 183
<210> 156
<211> 183
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 156
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catgccggat gatcctgacg acggagagcg ccgtcgtcga caagccggcc tgagctgcga 180
gaa 183
<210> 157
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 157
gcgtattgcc tggaggatgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgaac cacgcggcga atgccggcgt 120
ccgccccgga tgatcctgac gacggagtcc gccgtcgtcg acaagccggc ctcctccagg 180
caatacgcg 189
<210> 158
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 158
gctgtctccg ccgcccgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgg cggcacgggg gtcgcagtcg 120
ccatgccgga tgatcctgac gacggagctc gccgtcgtcg acaagccggc ccgggcggcg 180
gagacagcg 189
<210> 159
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 159
gtcacctcca atgactaggg 20
<210> 160
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 160
gggcaaccac aaacccacga 20
<210> 161
<211> 194
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 161
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggctatg ccggatgatc ctgacgacgg agtccgccgt cgtcgacaag ccggccctag 180
ctgagctgcg agaa 194
<210> 162
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 162
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggtgccg gatgatcctg acgacggagt ccgccgtcgt cgacaagccg gccctatgag 180
ctgcgagaa 189
<210> 163
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 163
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggccgga tgatcctgac gacggagtcc gccgtcgtcg acaagccggc ctgagctgcg 180
agaa 184
<210> 164
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 164
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggggatg atcctgacga cggagtccgc cgtcgtcgac aagccgtgag ctgcgagaa 179
<210> 165
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 165
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggtgatc ctgacgacgg agtccgccgt cgtcgacaag ctgagctgcg agaa 174
<210> 166
<211> 169
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 166
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggatcct gacgacggag tccgccgtcg tcgacatgag ctgcgagaa 169
<210> 167
<211> 164
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 167
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggcctga cgacggagtc cgccgtcgtc gtgagctgcg agaa 164
<210> 168
<211> 159
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 168
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggtgacg acggagtccg ccgtcgtgag ctgcgagaa 159
<210> 169
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 169
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggacgac ggagtccgcc gtgagctgcg agaa 154
<210> 170
<211> 149
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 170
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catgggacgg agtccgtgag ctgcgagaa 149
<210> 171
<211> 144
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 171
gctattctcg cagctcacca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggcggag ttgagctgcg agaa 144
<210> 172
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 172
gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120
tcatccatgg taccgttcgt atagcataca ttatacgaag ttattgagct gcgagaatag 180
cc 182
<210> 173
<211> 177
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 173
gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgacg agcgcggcga tatcatcatc 120
catggtaccg ttcgtatagc atacattata cgaagttatt gagctgcgag aatagcc 177
<210> 174
<211> 177
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 174
gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcga cgacgagcgc ggcgatatca 120
tcatccatgg taccgttcgt atagcataca ttatacgaag ttattgagct gcgagaa 177
<210> 175
<211> 159
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 175
gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat catcatccat ggtaccgttc 120
gtatagcata cattatacga agttattgag ctgcgagaa 159
<210> 176
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 176
ccccacgatg gaggggaaga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 177
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 177
ccttctcctg gagccgcgac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 178
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 178
gtggtttgtc tggtcaacca ccgcggtctc agtggtgtac ggtacaaacc ca 52
<210> 179
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 179
tgggtttgta ccgtacacca ctgagaccgc ggtggttgac cagacaaacc ac 52
<210> 180
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 180
gtggtttgtc tggtcaacca ccgcgcgctc agtggtgtac ggtacaaacc ca 52
<210> 181
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 181
tgggtttgta ccgtacacca ctgagcgcgc ggtggttgac cagacaaacc ac 52
<210> 182
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 182
gtggtttgtc tggtcaacca ccgcggcctc agtggtgtac ggtacaaacc ca 52
<210> 183
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 183
tgggtttgta ccgtacacca ctgaggccgc ggtggttgac cagacaaacc ac 52
<210> 184
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 184
gtggtttgtc tggtcaacca ccgcgatctc agtggtgtac ggtacaaacc ca 52
<210> 185
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 185
tgggtttgta ccgtacacca ctgagatcgc ggtggttgac cagacaaacc ac 52
<210> 186
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 186
gtggtttgtc tggtcaacca ccgcgtactc agtggtgtac ggtacaaacc ca 52
<210> 187
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 187
tgggtttgta ccgtacacca ctgagtacgc ggtggttgac cagacaaacc ac 52
<210> 188
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 188
gtggtttgtc tggtcaacca ccgcgggctc agtggtgtac ggtacaaacc ca 52
<210> 189
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 189
tgggtttgta ccgtacacca ctgagcccgc ggtggttgac cagacaaacc ac 52
<210> 190
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 190
gtggtttgtc tggtcaacca ccgcgttctc agtggtgtac ggtacaaacc ca 52
<210> 191
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 191
tgggtttgta ccgtacacca ctgagaacgc ggtggttgac cagacaaacc ac 52
<210> 192
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 192
gtggtttgtc tggtcaacca ccgcggactc agtggtgtac ggtacaaacc ca 52
<210> 193
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 193
tgggtttgta ccgtacacca ctgagtccgc ggtggttgac cagacaaacc ac 52
<210> 194
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 194
gtggtttgtc tggtcaacca ccgcgagctc agtggtgtac ggtacaaacc ca 52
<210> 195
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 195
tgggtttgta ccgtacacca ctgagctcgc ggtggttgac cagacaaacc ac 52
<210> 196
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 196
gtggtttgtc tggtcaacca ccgcgccctc agtggtgtac ggtacaaacc ca 52
<210> 197
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 197
tgggtttgta ccgtacacca ctgagggcgc ggtggttgac cagacaaacc ac 52
<210> 198
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 198
gtggtttgtc tggtcaacca ccgcgtcctc agtggtgtac ggtacaaacc ca 52
<210> 199
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 199
tgggtttgta ccgtacacca ctgaggacgc ggtggttgac cagacaaacc ac 52
<210> 200
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 200
gtggtttgtc tggtcaacca ccgcgctctc agtggtgtac ggtacaaacc ca 52
<210> 201
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 201
tgggtttgta ccgtacacca ctgagagcgc ggtggttgac cagacaaacc ac 52
<210> 202
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 202
gtggtttgtc tggtcaacca ccgcgaactc agtggtgtac ggtacaaacc ca 52
<210> 203
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 203
tgggtttgta ccgtacacca ctgagttcgc ggtggttgac cagacaaacc ac 52
<210> 204
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 204
gtggtttgtc tggtcaacca ccgcgcactc agtggtgtac ggtacaaacc ca 52
<210> 205
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 205
tgggtttgta ccgtacacca ctgagtgcgc ggtggttgac cagacaaacc ac 52
<210> 206
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 206
gtggtttgtc tggtcaacca ccgcgacctc agtggtgtac ggtacaaacc ca 52
<210> 207
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 207
tgggtttgta ccgtacacca ctgaggtcgc ggtggttgac cagacaaacc ac 52
<210> 208
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 208
gtggtttgtc tggtcaacca ccgcgtgctc agtggtgtac ggtacaaacc ca 52
<210> 209
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 209
tgggtttgta ccgtacacca ctgagcacgc ggtggttgac cagacaaacc ac 52
<210> 210
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 210
ggccggcttg tcgacgacgg cggtctccgt cgtcaggatc atccgg 46
<210> 211
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 211
ccggatgatc ctgacgacgg agaccgccgt cgtcgacaag ccggcc 46
<210> 212
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 212
ggccggcttg tcgacgacgg cgaactccgt cgtcaggatc atccgg 46
<210> 213
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 213
ccggatgatc ctgacgacgg agttcgccgt cgtcgacaag ccggcc 46
<210> 214
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 214
ggccggcttg tcgacgacgg cggactccgt cgtcaggatc atccgg 46
<210> 215
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 215
ccggatgatc ctgacgacgg agtccgccgt cgtcgacaag ccggcc 46
<210> 216
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 216
ggccggcttg tcgacgacgg cgcactccgt cgtcaggatc atccgg 46
<210> 217
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 217
ccggatgatc ctgacgacgg agtgcgccgt cgtcgacaag ccggcc 46
<210> 218
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 218
ggccggcttg tcgacgacgg cgtactccgt cgtcaggatc atccgg 46
<210> 219
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 219
ccggatgatc ctgacgacgg agtacgccgt cgtcgacaag ccggcc 46
<210> 220
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 220
ggccggcttg tcgacgacgg cgagctccgt cgtcaggatc atccgg 46
<210> 221
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 221
ccggatgatc ctgacgacgg agctcgccgt cgtcgacaag ccggcc 46
<210> 222
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 222
ggccggcttg tcgacgacgg cgggctccgt cgtcaggatc atccgg 46
<210> 223
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 223
ccggatgatc ctgacgacgg agcccgccgt cgtcgacaag ccggcc 46
<210> 224
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 224
ggccggcttg tcgacgacgg cgcgctccgt cgtcaggatc atccgg 46
<210> 225
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 225
ccggatgatc ctgacgacgg agcgcgccgt cgtcgacaag ccggcc 46
<210> 226
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 226
ggccggcttg tcgacgacgg cgtgctccgt cgtcaggatc atccgg 46
<210> 227
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 227
ccggatgatc ctgacgacgg agcacgccgt cgtcgacaag ccggcc 46
<210> 228
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 228
ggccggcttg tcgacgacgg cgacctccgt cgtcaggatc atccgg 46
<210> 229
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 229
ccggatgatc ctgacgacgg aggtcgccgt cgtcgacaag ccggcc 46
<210> 230
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 230
ggccggcttg tcgacgacgg cggcctccgt cgtcaggatc atccgg 46
<210> 231
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 231
ccggatgatc ctgacgacgg aggccgccgt cgtcgacaag ccggcc 46
<210> 232
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 232
ggccggcttg tcgacgacgg cgccctccgt cgtcaggatc atccgg 46
<210> 233
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 233
ccggatgatc ctgacgacgg agggcgccgt cgtcgacaag ccggcc 46
<210> 234
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 234
ggccggcttg tcgacgacgg cgtcctccgt cgtcaggatc atccgg 46
<210> 235
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 235
ccggatgatc ctgacgacgg aggacgccgt cgtcgacaag ccggcc 46
<210> 236
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 236
ggccggcttg tcgacgacgg cgatctccgt cgtcaggatc atccgg 46
<210> 237
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 237
ccggatgatc ctgacgacgg agatcgccgt cgtcgacaag ccggcc 46
<210> 238
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 238
ggccggcttg tcgacgacgg cgctctccgt cgtcaggatc atccgg 46
<210> 239
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 239
ccggatgatc ctgacgacgg agagcgccgt cgtcgacaag ccggcc 46
<210> 240
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 240
ggccggcttg tcgacgacgg cgttctccgt cgtcaggatc atccgg 46
<210> 241
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 241
ccggatgatc ctgacgacgg agaacgccgt cgtcgacaag ccggcc 46
<210> 242
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 242
ggcttgtcga cgacggcggt ctccgtcgtc aggatcat 38
<210> 243
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 243
atgatcctga cgacggagac cgccgtcgtc gacaagcc 38
<210> 244
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 244
ggcttgtcga cgacggcgaa ctccgtcgtc aggatcat 38
<210> 245
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 245
atgatcctga cgacggagtt cgccgtcgtc gacaagcc 38
<210> 246
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 246
ggcttgtcga cgacggcgga ctccgtcgtc aggatcat 38
<210> 247
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 247
atgatcctga cgacggagtc cgccgtcgtc gacaagcc 38
<210> 248
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 248
ggcttgtcga cgacggcgca ctccgtcgtc aggatcat 38
<210> 249
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 249
atgatcctga cgacggagtg cgccgtcgtc gacaagcc 38
<210> 250
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 250
ggcttgtcga cgacggcgta ctccgtcgtc aggatcat 38
<210> 251
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 251
atgatcctga cgacggagta cgccgtcgtc gacaagcc 38
<210> 252
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 252
ggcttgtcga cgacggcgag ctccgtcgtc aggatcat 38
<210> 253
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 253
atgatcctga cgacggagct cgccgtcgtc gacaagcc 38
<210> 254
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 254
ggcttgtcga cgacggcggg ctccgtcgtc aggatcat 38
<210> 255
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 255
atgatcctga cgacggagcc cgccgtcgtc gacaagcc 38
<210> 256
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 256
ggcttgtcga cgacggcgcg ctccgtcgtc aggatcat 38
<210> 257
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 257
atgatcctga cgacggagcg cgccgtcgtc gacaagcc 38
<210> 258
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 258
ggcttgtcga cgacggcgtg ctccgtcgtc aggatcat 38
<210> 259
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 259
atgatcctga cgacggagca cgccgtcgtc gacaagcc 38
<210> 260
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 260
ggcttgtcga cgacggcgac ctccgtcgtc aggatcat 38
<210> 261
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 261
atgatcctga cgacggaggt cgccgtcgtc gacaagcc 38
<210> 262
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 262
ggcttgtcga cgacggcggc ctccgtcgtc aggatcat 38
<210> 263
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 263
atgatcctga cgacggaggc cgccgtcgtc gacaagcc 38
<210> 264
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 264
ggcttgtcga cgacggcgcc ctccgtcgtc aggatcat 38
<210> 265
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 265
atgatcctga cgacggaggg cgccgtcgtc gacaagcc 38
<210> 266
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 266
ggcttgtcga cgacggcgtc ctccgtcgtc aggatcat 38
<210> 267
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 267
atgatcctga cgacggagga cgccgtcgtc gacaagcc 38
<210> 268
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 268
ggcttgtcga cgacggcgat ctccgtcgtc aggatcat 38
<210> 269
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 269
atgatcctga cgacggagat cgccgtcgtc gacaagcc 38
<210> 270
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 270
ggcttgtcga cgacggcgct ctccgtcgtc aggatcat 38
<210> 271
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 271
atgatcctga cgacggagag cgccgtcgtc gacaagcc 38
<210> 272
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 272
ggcttgtcga cgacggcgtt ctccgtcgtc aggatcat 38
<210> 273
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 273
atgatcctga cgacggagaa cgccgtcgtc gacaagcc 38
<210> 274
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 274
taccgttcgt ataatgtatg ctatacgaag ttat 34
<210> 275
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 275
ataacttcgt atagcataca ttatacgaac ggta 34
<210> 276
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 276
ataacttcgt ataatgtatg ctatacgaac ggta 34
<210> 277
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 277
taccgttcgt atagcataca ttatacgaag ttat 34
<210> 278
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 278
tttaccttga ttgagatgtt aattgtg 27
<210> 279
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 279
cacaattaac atctcaatca aggtaaa 27
<210> 280
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 280
gcgagttttt atttcgttta tttcaattaa ggtaactaaa aaactccttt 50
<210> 281
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 281
aaaggagttt tttagttacc ttaattgaaa taaacgaaat aaaaactcgc 50
<210> 282
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 282
ctggatcatc tggatcactt tcgtcaaaaa cctg 34
<210> 283
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 283
caggtttttg acgaaagtga tccagatgat ccag 34
<210> 284
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 284
ttcgggtgct gggttgttgt ctctggacag tgatccatgg gaaactactc agcacca 57
<210> 285
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 285
tggtgctgag tagtttccca tggatcactg tccagagaca acaacccagc acccgaa 57
<210> 286
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 286
aaaagtgtgg gctgcaggat ctga 24
<210> 287
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 287
ggagctggca gctgtcaatg cc 22
<210> 288
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 288
agtcaatgcc gctctcgtgg a 21
<210> 289
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 289
cagcgggctc agctgatagc a 21
<210> 290
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 290
cggatggcta accaagcggc c 21
<210> 291
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 291
cccggcttcc tttgtcc 17
<210> 292
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 292
gaactccacg ccgttca 17
<210> 293
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 293
cccggcttcc tttgtcc 17
<210> 294
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 294
aaccacaact agaatgcagt ga 22
<210> 295
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 295
cccggcttcc tttgtcc 17
<210> 296
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 296
gaactccacg ccgttca 17
<210> 297
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 297
cccggcttcc tttgtcc 17
<210> 298
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 298
aaccacaact agaatgcagt ga 22
<210> 299
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 299
cccggcttcc tttgtcc 17
<210> 300
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 300
gaactccacg ccgttca 17
<210> 301
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 301
tccttatcac ggtcccgctc g 21
<210> 302
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 302
gaactccacg ccgttca 17
<210> 303
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 303
cgtcgacaac ggtagtg 17
<210> 304
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 304
gaactccacg ccgttca 17
<210> 305
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 305
tcgcgtgatt ctcggaac 18
<210> 306
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 306
gaactccacg ccgttca 17
<210> 307
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 307
gggcggtaag tggttagttt 20
<210> 308
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 308
gaactccacg ccgttca 17
<210> 309
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 309
aagaggcgga gccagta 17
<210> 310
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 310
gaactccacg ccgttca 17
<210> 311
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 311
ctcccttctc ccggtgccc 19
<210> 312
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 312
gaactccacg ccgttca 17
<210> 313
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 313
cccggcttcc tttgtcc 17
<210> 314
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 314
gaactccacg ccgttca 17
<210> 315
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 315
gggcggtaag tggttagttt 20
<210> 316
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 316
gaactccacg ccgttca 17
<210> 317
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 317
cgtcgacaac ggtagtg 17
<210> 318
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 318
gaactccacg ccgttca 17
<210> 319
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 319
aagaggcgga gccagta 17
<210> 320
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 320
gaactccacg ccgttca 17
<210> 321
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 321
ctcccttctc ccggtgccc 19
<210> 322
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 322
gaactccacg ccgttca 17
<210> 323
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 323
tccttatcac ggtcccgctc g 21
<210> 324
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 324
gaactccacg ccgttca 17
<210> 325
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 325
cccggcttcc tttgtcc 17
<210> 326
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 326
ggcctgccag caggagga 18
<210> 327
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 327
cccggcttcc tttgtcc 17
<210> 328
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 328
ggtgtgcagt cacattggta aagcc 25
<210> 329
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 329
cccggcttcc tttgtcc 17
<210> 330
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 330
gatgggtcta gtccagctaa ag 22
<210> 331
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 331
cccggcttcc tttgtcc 17
<210> 332
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 332
gagagacaag gctgcaca 18
<210> 333
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 333
ccaggtgaga gtcagggtag tgttca 26
<210> 334
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 334
gaactccacg ccgttca 17
<210> 335
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 335
agggaccttt gcctgtgtga gtc 23
<210> 336
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 336
gaactccacg ccgttca 17
<210> 337
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 337
tcagctctgt gctgaggcga a 21
<210> 338
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 338
gaactccacg ccgttca 17
<210> 339
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 339
aagccatctc ccagaatatc tgcttagaaa tg 32
<210> 340
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 340
gaactccacg ccgttca 17
<210> 341
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 341
gagaggagca acagtgagca tgatg 25
<210> 342
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 342
gaactccacg ccgttca 17
<210> 343
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 343
aagccatctc ccagaatatc tgcttagaaa tg 32
<210> 344
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 344
gaactccacg ccgttca 17
<210> 345
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 345
gagaggagca acagtgagca tgatg 25
<210> 346
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 346
gaactccacg ccgttca 17
<210> 347
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 347
cccggcttcc tttgtcc 17
<210> 348
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 348
ggctatgaac taatgacccc gt 22
<210> 349
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 349
cccggcttcc tttgtcc 17
<210> 350
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 350
ggcctgccag caggagga 18
<210> 351
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 351
cccggcttcc tttgtcc 17
<210> 352
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 352
ggtgtgcagt cacattggta aagcc 25
<210> 353
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 353
acactctttc cctacacgac gctcttccga tctccgacct cggctcacag cg 52
<210> 354
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 354
acactctttc cctacacgac gctcttccga tctaccgacc tcggctcaca gcg 53
<210> 355
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 355
acactctttc cctacacgac gctcttccga tctgaccgac ctcggctcac agcg 54
<210> 356
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 356
acactctttc cctacacgac gctcttccga tcttgaccga cctcggctca cagcg 55
<210> 357
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 357
acactctttc cctacacgac gctcttccga tctctgaccg acctcggctc acagcg 56
<210> 358
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 358
acactctttc cctacacgac gctcttccga tctactgacc gacctcggct cacagcg 57
<210> 359
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 359
acactctttc cctacacgac gctcttccga tcttactgac cgacctcggc tcacagcg 58
<210> 360
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 360
acactctttc cctacacgac gctcttccga tctgtactga ccgacctcgg ctcacagcg 59
<210> 361
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 361
gtgactggag ttcagacgtg tgctcttccg atctccaccc agccagctcc c 51
<210> 362
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 362
acactctttc cctacacgac gctcttccga tctccggtgg cgcattgcca c 51
<210> 363
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 363
acactctttc cctacacgac gctcttccga tctaccggtg gcgcattgcc ac 52
<210> 364
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 364
acactctttc cctacacgac gctcttccga tctgaccggt ggcgcattgc cac 53
<210> 365
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 365
acactctttc cctacacgac gctcttccga tcttgaccgg tggcgcattg ccac 54
<210> 366
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 366
acactctttc cctacacgac gctcttccga tctctgaccg gtggcgcatt gccac 55
<210> 367
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 367
acactctttc cctacacgac gctcttccga tctactgacc ggtggcgcat tgccac 56
<210> 368
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 368
acactctttc cctacacgac gctcttccga tcttactgac cggtggcgca ttgccac 57
<210> 369
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 369
acactctttc cctacacgac gctcttccga tctgtactga ccggtggcgc attgccac 58
<210> 370
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 370
gtgactggag ttcagacgtg tgctcttccg atctcagagt ccagcttggg ccca 54
<210> 371
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 371
gatattttcc cagctcacca 20
<210> 372
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 372
tctattctcc cagctcccca 20
<210> 373
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 373
agcggcttct gtctctgtga gtgagctggc ggtctccgtc 40
<210> 374
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 374
gactagccca cgctccggtt ctgagccgcg acggcggtct ccg 43
<210> 375
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 375
cccagggtcc catgcgctcc ccggccctga cggcggtctc c 41
<210> 376
<211> 2560
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 376
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
20 25 30
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
35 40 45
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
50 55 60
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
65 70 75 80
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
85 90 95
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
100 105 110
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
115 120 125
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
130 135 140
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
145 150 155 160
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
165 170 175
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
180 185 190
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
195 200 205
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
210 215 220
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
225 230 235 240
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
245 250 255
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
260 265 270
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
275 280 285
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
290 295 300
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
305 310 315 320
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
325 330 335
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
340 345 350
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
355 360 365
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
370 375 380
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
385 390 395 400
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
405 410 415
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
420 425 430
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
435 440 445
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
450 455 460
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
465 470 475 480
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
485 490 495
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
500 505 510
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
515 520 525
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
530 535 540
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
545 550 555 560
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
565 570 575
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
580 585 590
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
595 600 605
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
610 615 620
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
625 630 635 640
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
645 650 655
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
660 665 670
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
675 680 685
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
690 695 700
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
705 710 715 720
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
725 730 735
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
740 745 750
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
755 760 765
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
770 775 780
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
785 790 795 800
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
805 810 815
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
820 825 830
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
835 840 845
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe
850 855 860
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
865 870 875 880
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
885 890 895
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
900 905 910
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
915 920 925
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
930 935 940
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
945 950 955 960
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
965 970 975
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
980 985 990
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
995 1000 1005
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1010 1015 1020
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1025 1030 1035
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1040 1045 1050
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1055 1060 1065
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1070 1075 1080
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1085 1090 1095
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1100 1105 1110
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1115 1120 1125
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1130 1135 1140
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1145 1150 1155
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1160 1165 1170
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1175 1180 1185
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1190 1195 1200
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1205 1210 1215
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1220 1225 1230
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1235 1240 1245
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1250 1255 1260
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1265 1270 1275
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1280 1285 1290
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1295 1300 1305
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1310 1315 1320
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1325 1330 1335
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1340 1345 1350
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1355 1360 1365
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1370 1375 1380
Gly Gly Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu
1385 1390 1395
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser
1400 1405 1410
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
1415 1420 1425
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
1430 1435 1440
Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu
1445 1450 1455
Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly
1460 1465 1470
Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly
1475 1480 1485
Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu
1490 1495 1500
Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser
1505 1510 1515
Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu
1520 1525 1530
Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro
1535 1540 1545
Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
1550 1555 1560
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
1565 1570 1575
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Pro Pro Pro Ser
1580 1585 1590
His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys
1595 1600 1605
Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp
1610 1615 1620
Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg
1625 1630 1635
Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala
1640 1645 1650
Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu
1655 1660 1665
Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser
1670 1675 1680
Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu
1685 1690 1695
Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys
1700 1705 1710
Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln
1715 1720 1725
Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro
1730 1735 1740
Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala
1745 1750 1755
Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala
1760 1765 1770
Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly
1775 1780 1785
Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
1790 1795 1800
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
1805 1810 1815
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr
1820 1825 1830
Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys
1835 1840 1845
Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met
1850 1855 1860
Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr
1865 1870 1875
Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala
1880 1885 1890
Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met
1895 1900 1905
Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe
1910 1915 1920
Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro
1925 1930 1935
Glu Glu Gly Leu Gln His Asn Cys Leu Asp Gly Thr Gly Gly Gly
1940 1945 1950
Gly Val Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Leu Glu Val
1955 1960 1965
Asp Ile Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile
1970 1975 1980
Ser Phe Thr Tyr Asp Asp Asn Gly Lys Thr Gly Arg Gly Ala Val
1985 1990 1995
Ser Glu Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys
2000 2005 2010
Ser Gly Lys Lys Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser
2015 2020 2025
Glu Phe Glu Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser
2030 2035 2040
Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp Tyr
2045 2050 2055
Ala Gly Ser Arg Ala Leu Val Val Ile Arg Leu Ser Arg Val Thr
2060 2065 2070
Asp Ala Thr Thr Ser Pro Glu Arg Gln Leu Glu Ser Cys Gln Gln
2075 2080 2085
Leu Cys Ala Gln Arg Gly Trp Asp Val Val Gly Val Ala Glu Asp
2090 2095 2100
Leu Asp Val Ser Gly Ala Val Asp Pro Phe Asp Arg Lys Arg Arg
2105 2110 2115
Pro Asn Leu Ala Arg Trp Leu Ala Phe Glu Glu Gln Pro Phe Asp
2120 2125 2130
Val Ile Val Ala Tyr Arg Val Asp Arg Leu Thr Arg Ser Ile Arg
2135 2140 2145
His Leu Gln Gln Leu Val His Trp Ala Glu Asp His Lys Lys Leu
2150 2155 2160
Val Val Ser Ala Thr Glu Ala His Phe Asp Thr Thr Thr Pro Phe
2165 2170 2175
Ala Ala Val Val Ile Ala Leu Met Gly Thr Val Ala Gln Met Glu
2180 2185 2190
Leu Glu Ala Ile Lys Glu Arg Asn Arg Ser Ala Ala His Phe Asn
2195 2200 2205
Ile Arg Ala Gly Lys Tyr Arg Gly Ser Leu Pro Pro Trp Gly Tyr
2210 2215 2220
Leu Pro Thr Arg Val Asp Gly Glu Trp Arg Leu Val Pro Asp Pro
2225 2230 2235
Val Gln Arg Glu Arg Ile Leu Glu Val Tyr His Arg Val Val Asp
2240 2245 2250
Asn His Glu Pro Leu His Leu Val Ala His Asp Leu Asn Arg Arg
2255 2260 2265
Gly Val Leu Ser Pro Lys Asp Tyr Phe Ala Gln Leu Gln Gly Arg
2270 2275 2280
Glu Pro Gln Gly Arg Glu Trp Ser Ala Thr Ala Leu Lys Arg Ser
2285 2290 2295
Met Ile Ser Glu Ala Met Leu Gly Tyr Ala Thr Leu Asn Gly Lys
2300 2305 2310
Thr Val Arg Asp Asp Asp Gly Ala Pro Leu Val Arg Ala Glu Pro
2315 2320 2325
Ile Leu Thr Arg Glu Gln Leu Glu Ala Leu Arg Ala Glu Leu Val
2330 2335 2340
Lys Thr Ser Arg Ala Lys Pro Ala Val Ser Thr Pro Ser Leu Leu
2345 2350 2355
Leu Arg Val Leu Phe Cys Ala Val Cys Gly Glu Pro Ala Tyr Lys
2360 2365 2370
Phe Ala Gly Gly Gly Arg Lys His Pro Arg Tyr Arg Cys Arg Ser
2375 2380 2385
Met Gly Phe Pro Lys His Cys Gly Asn Gly Thr Val Ala Met Ala
2390 2395 2400
Glu Trp Asp Ala Phe Cys Glu Glu Gln Val Leu Asp Leu Leu Gly
2405 2410 2415
Asp Ala Glu Arg Leu Glu Lys Val Trp Val Ala Gly Ser Asp Ser
2420 2425 2430
Ala Val Glu Leu Ala Glu Val Asn Ala Glu Leu Val Asp Leu Thr
2435 2440 2445
Ser Leu Ile Gly Ser Pro Ala Tyr Arg Ala Gly Ser Pro Gln Arg
2450 2455 2460
Glu Ala Leu Asp Ala Arg Ile Ala Ala Leu Ala Ala Arg Gln Glu
2465 2470 2475
Glu Leu Glu Gly Leu Glu Ala Arg Pro Ser Gly Trp Glu Trp Arg
2480 2485 2490
Glu Thr Gly Gln Arg Phe Gly Asp Trp Trp Arg Glu Gln Asp Thr
2495 2500 2505
Ala Ala Lys Asn Thr Trp Leu Arg Ser Met Asn Val Arg Leu Thr
2510 2515 2520
Phe Asp Val Arg Gly Gly Leu Thr Arg Thr Ile Asp Phe Gly Asp
2525 2530 2535
Leu Gln Glu Tyr Glu Gln His Leu Arg Leu Gly Ser Val Val Glu
2540 2545 2550
Arg Leu His Thr Gly Met Ser
2555 2560
<210> 377
<211> 7680
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 377
atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtcgac 60
aagaagtaca gcatcggcct ggacatcggc accaactctg tgggctgggc cgtgatcacc 120
gacgagtaca aggtgcccag caagaaattc aaggtgctgg gcaacaccga ccggcacagc 180
atcaagaaga acctgatcgg agccctgctg ttcgacagcg gcgaaacagc cgaggccacc 240
cggctgaaga gaaccgccag aagaagatac accagacgga agaaccggat ctgctatctg 300
caagagatct tcagcaacga gatggccaag gtggacgaca gcttcttcca cagactggaa 360
gagtccttcc tggtggaaga ggataagaag cacgagcggc accccatctt cggcaacatc 420
gtggacgagg tggcctacca cgagaagtac cccaccatct accacctgag aaagaaactg 480
gtggacagca ccgacaaggc cgacctgcgg ctgatctatc tggccctggc ccacatgatc 540
aagttccggg gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac 600
aagctgttca tccagctggt gcagacctac aaccagctgt tcgaggaaaa ccccatcaac 660
gccagcggcg tggacgccaa ggccatcctg tctgccagac tgagcaagag cagacggctg 720
gaaaatctga tcgcccagct gcccggcgag aagaagaatg gcctgttcgg aaacctgatt 780
gccctgagcc tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggatgcc 840
aaactgcagc tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc 900
ggcgaccagt acgccgacct gtttctggcc gccaagaacc tgtccgacgc catcctgctg 960
agcgacatcc tgagagtgaa caccgagatc accaaggccc ccctgagcgc ctctatgatc 1020
aagagatacg acgagcacca ccaggacctg accctgctga aagctctcgt gcggcagcag 1080
ctgcctgaga agtacaaaga gattttcttc gaccagagca agaacggcta cgccggctac 1140
attgacggcg gagccagcca ggaagagttc tacaagttca tcaagcccat cctggaaaag 1200
atggacggca ccgaggaact gctcgtgaag ctgaacagag aggacctgct gcggaagcag 1260
cggaccttcg acaacggcag catcccccac cagatccacc tgggagagct gcacgccatt 1320
ctgcggcggc aggaagattt ttacccattc ctgaaggaca accgggaaaa gatcgagaag 1380
atcctgacct tccgcatccc ctactacgtg ggccctctgg ccaggggaaa cagcagattc 1440
gcctggatga ccagaaagag cgaggaaacc atcaccccct ggaacttcga ggaagtggtg 1500
gacaagggcg cttccgccca gagcttcatc gagcggatga ccaacttcga taagaacctg 1560
cccaacgaga aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtataac 1620
gagctgacca aagtgaaata cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc 1680
gagcagaaaa aggccatcgt ggacctgctg ttcaagacca accggaaagt gaccgtgaag 1740
cagctgaaag aggactactt caagaaaatc gagtgcttcg actccgtgga aatctccggc 1800
gtggaagatc ggttcaacgc ctccctgggc acataccacg atctgctgaa aattatcaag 1860
gacaaggact tcctggacaa tgaggaaaac gaggacattc tggaagatat cgtgctgacc 1920
ctgacactgt ttgaggacag agagatgatc gaggaacggc tgaaaaccta tgcccacctg 1980
ttcgacgaca aagtgatgaa gcagctgaag cggcggagat acaccggctg gggcaggctg 2040
agccggaagc tgatcaacgg catccgggac aagcagtccg gcaagacaat cctggatttc 2100
ctgaagtccg acggcttcgc caacagaaac ttcatgcagc tgatccacga cgacagcctg 2160
acctttaaag aggacatcca gaaagcccag gtgtccggcc agggcgatag cctgcacgag 2220
cacattgcca atctggccgg cagccccgcc attaagaagg gcatcctgca gacagtgaag 2280
gtggtggacg agctcgtgaa agtgatgggc cggcacaagc ccgagaacat cgtgatcgaa 2340
atggccagag agaaccagac cacccagaag ggacagaaga acagccgcga gagaatgaag 2400
cggatcgaag agggcatcaa agagctgggc agccagatcc tgaaagaaca ccccgtggaa 2460
aacacccagc tgcagaacga gaagctgtac ctgtactacc tgcagaatgg gcgggatatg 2520
tacgtggacc aggaactgga catcaaccgg ctgtccgact acgatgtgga cgctatcgtg 2580
cctcagagct ttctgaagga cgactccatc gacaacaagg tgctgaccag aagcgacaag 2640
aaccggggca agagcgacaa cgtgccctcc gaagaggtcg tgaagaagat gaagaactac 2700
tggcggcagc tgctgaacgc caagctgatt acccagagaa agttcgacaa tctgaccaag 2760
gccgagagag gcggcctgag cgaactggat aaggccggct tcatcaagag acagctggtg 2820
gaaacccggc agatcacaaa gcacgtggca cagatcctgg actcccggat gaacactaag 2880
tacgacgaga atgacaagct gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg 2940
gtgtccgatt tccggaagga tttccagttt tacaaagtgc gcgagatcaa caactaccac 3000
cacgcccacg acgcctacct gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct 3060
aagctggaaa gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc 3120
gccaagagcg agcaggaaat cggcaaggct accgccaagt acttcttcta cagcaacatc 3180
atgaactttt tcaagaccga gattaccctg gccaacggcg agatccggaa gcggcctctg 3240
atcgagacaa acggcgaaac cggggagatc gtgtgggata agggccggga ttttgccacc 3300
gtgcggaaag tgctgagcat gccccaagtg aatatcgtga aaaagaccga ggtgcagaca 3360
ggcggcttca gcaaagagtc tatcctgccc aagaggaaca gcgataagct gatcgccaga 3420
aagaaggact gggaccctaa gaagtacggc ggcttcgaca gccccaccgt ggcctattct 3480
gtgctggtgg tggccaaagt ggaaaagggc aagtccaaga aactgaagag tgtgaaagag 3540
ctgctgggga tcaccatcat ggaaagaagc agcttcgaga agaatcccat cgactttctg 3600
gaagccaagg gctacaaaga agtgaaaaag gacctgatca tcaagctgcc taagtactcc 3660
ctgttcgagc tggaaaacgg ccggaagaga atgctggcct ctgccggcga actgcagaag 3720
ggaaacgaac tggccctgcc ctccaaatat gtgaacttcc tgtacctggc cagccactat 3780
gagaagctga agggctcccc cgaggataat gagcagaaac agctgtttgt ggaacagcac 3840
aagcactacc tggacgagat catcgagcag atcagcgagt tctccaagag agtgatcctg 3900
gccgacgcta atctggacaa agtgctgtcc gcctacaaca agcaccggga taagcccatc 3960
agagagcagg ccgagaatat catccacctg tttaccctga ccaatctggg agcccctgcc 4020
gccttcaagt actttgacac caccatcgac cggaagaggt acaccagcac caaagaggtg 4080
ctggacgcca ccctgatcca ccagagcatc accggcctgt acgagacacg gatcgacctg 4140
tctcagctgg gaggtgactc tggaggatct agcggaggat cctctggcag cgagacacca 4200
ggaacaagcg agtcagcaac accagagagc tctggtagcg agacacccgg taccagtgaa 4260
agcgccacgc cagaaagcag tgggagtgag actccgggta catctgaatc agcgacaccg 4320
gaatcaagtg gcggcagcag cggcggcagc agcaccctaa atatagaaga tgagtatcgg 4380
ctacatgaga cctcaaaaga gccagatgtt tctctagggt ccacatggct gtctgatttt 4440
cctcaggcct gggcggaaac cgggggcatg ggactggcag ttcgccaagc tcctctgatc 4500
atacctctga aagcaacctc tacccccgtg tccataaaac aataccccat gtcacaagaa 4560
gccagactgg ggatcaagcc ccacatacag agactgttgg accagggaat actggtaccc 4620
tgccagtccc cctggaacac gcccctgcta cccgttaaga aaccagggac taatgattat 4680
aggcctgtcc aggatctgag agaagtcaac aagcgggtgg aagacatcca ccccaccgtg 4740
cccaaccctt acaacctctt gagcgggccc ccaccgtccc accagtggta cactgtgctt 4800
gatttaaagg atgccttttt ctgcctgaga ctccacccca ccagtcagcc tctcttcgcc 4860
tttgagtgga gagatccaga gatgggaatc tcaggacaat tgacctggac cagactccca 4920
cagggtttca aaaacagtcc caccctgttt aatgaggcac tgcacagaga cctagcagac 4980
ttccggatcc agcacccaga cttgatcctg ctacagtacg tggatgactt actgctggcc 5040
gccacttctg agctagactg ccaacaaggt actcgggccc tgttacaaac cctagggaac 5100
ctcgggtatc gggcctcggc caagaaagcc caaatttgcc agaaacaggt caagtatctg 5160
gggtatcttc taaaagaggg tcagagatgg ctgactgagg ccagaaaaga gactgtgatg 5220
gggcagccta ctccgaagac ccctcgacaa ctaagggagt tcctagggaa ggcaggcttc 5280
tgtcgcctct tcatccctgg gtttgcagaa atggcagccc ccctgtaccc tctcaccaaa 5340
ccggggactc tgtttaattg gggcccagac caacaaaagg cctatcaaga aatcaagcaa 5400
gctcttctaa ctgccccagc cctggggttg ccagatttga ctaagccctt tgaactcttt 5460
gtcgacgaga agcagggcta cgccaaaggt gtcctaacgc aaaaactggg accttggcgt 5520
cggccggtgg cctacctgtc caaaaagcta gacccagtag cagctgggtg gcccccttgc 5580
ctacggatgg tagcagccat tgccgtactg acaaaggatg caggcaagct aaccatggga 5640
cagccactag tcattctggc cccccatgca gtagaggcac tagtcaaaca accccccgac 5700
cgctggcttt ccaacgcccg gatgactcac tatcaggcct tgcttttgga cacggaccgg 5760
gtccagttcg gaccggtggt agccctgaac ccggctacgc tgctcccact gcctgaggaa 5820
gggctgcaac acaactgcct tgatgggaca ggtggcggtg gtgtcaccgt caagttcaag 5880
tacaagggtg aggaacttga agttgatatt agcaaaatca agaaggtttg gcgcgttggt 5940
aaaatgatat cttttactta tgacgacaac ggcaagacag gtagaggggc agtgtctgag 6000
aaagacgccc ccaaggagct gttgcaaatg ttggaaaagt ctgggaaaaa gtctggcggc 6060
tcaaaaagaa ccgccgacgg cagcgaattc gagcccaaga agaagaggaa agtcggaggt 6120
ggcgggagcc caaaaaagaa aagaaaagtg tatccctatg atgtccccga ttatgccggt 6180
tcaagagccc tggtcgtgat tagactgagc cgagtgacag acgccaccac aagtcccgag 6240
agacagctgg aatcatgcca gcagctctgt gctcagcggg gttgggatgt ggtcggcgtg 6300
gcagaggatc tggacgtgag cggggccgtc gatccattcg acagaaagag gaggcccaac 6360
ctggcaagat ggctcgcttt cgaggaacag ccctttgatg tgatcgtcgc ctacagagtg 6420
gaccggctga cccgctcaat tcgacatctc cagcagctgg tgcattgggc tgaggaccac 6480
aagaaactgg tggtcagcgc aacagaagcc cacttcgata ctaccacacc ttttgccgct 6540
gtggtcatcg cactgatggg cactgtggcc cagatggagc tcgaagctat caaggagcga 6600
aacaggagcg cagcccattt caatattagg gccggtaaat acagaggctc cctgccccct 6660
tggggatatc tccctaccag ggtggatggg gagtggagac tggtgccaga ccccgtccag 6720
agagagcgga ttctggaagt gtaccacaga gtggtcgata accacgaacc actccatctg 6780
gtggcacacg acctgaatag acgcggcgtg ctctctccaa aggattattt tgctcagctg 6840
cagggaagag agccacaggg aagagaatgg agtgctactg cactgaagag atctatgatc 6900
agtgaggcta tgctgggtta cgcaacactc aatggcaaaa ctgtccggga cgatgacgga 6960
gcccctctgg tgagggctga gcctattctc accagagagc agctcgaagc tctgcgggca 7020
gaactggtca agactagtcg cgccaaacct gccgtgagca ccccaagcct gctcctgagg 7080
gtgctgttct gcgccgtctg tggagagcca gcatacaagt ttgccggcgg agggcgcaaa 7140
catccccgct atcgatgcag gagcatgggg ttccctaagc actgtggaaa cgggacagtg 7200
gccatggctg agtgggacgc cttttgcgag gaacaggtgc tggatctcct gggtgacgct 7260
gagcggctgg aaaaagtgtg ggtggcagga tctgactccg ctgtggagct ggcagaagtc 7320
aatgccgagc tcgtggatct gacttccctc atcggatctc ctgcatatag agctgggtcc 7380
ccacagagag aagctctgga cgcacgaatt gctgcactcg ctgctagaca ggaggaactg 7440
gagggcctgg aggccaggcc ctctggatgg gagtggcgag aaaccggaca gaggtttggg 7500
gattggtgga gggagcagga caccgcagcc aagaacacat ggctgagatc catgaatgtc 7560
cggctcacat tcgacgtgcg cggtggcctg actcgaacca tcgattttgg cgacctgcag 7620
gagtatgaac agcacctgag actggggtcc gtggtcgaaa gactgcacac tgggatgtcc 7680
<210> 378
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 378
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 379
<211> 576
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 379
Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro
1 5 10 15
Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp
20 25 30
Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile
35 40 45
Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro
50 55 60
Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu
65 70 75 80
Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro
85 90 95
Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln
100 105 110
Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val
115 120 125
Pro Asn Pro Tyr Asn Leu Leu Ser Gly Pro Pro Pro Ser His Gln Trp
130 135 140
Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His
145 150 155 160
Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met
165 170 175
Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys
180 185 190
Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala Asp
195 200 205
Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp
210 215 220
Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg
225 230 235 240
Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys
245 250 255
Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu
260 265 270
Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met
275 280 285
Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly
290 295 300
Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala
305 310 315 320
Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly
325 330 335
Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr
340 345 350
Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe
355 360 365
Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu
370 375 380
Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro
385 390 395 400
Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala
405 410 415
Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val
420 425 430
Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp
435 440 445
Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu
450 455 460
Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala
465 470 475 480
Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp
485 490 495
Gly Thr Gly Gly Gly Gly Val Thr Val Lys Phe Lys Tyr Lys Gly Glu
500 505 510
Glu Leu Glu Val Asp Ile Ser Lys Ile Lys Lys Val Trp Arg Val Gly
515 520 525
Lys Met Ile Ser Phe Thr Tyr Asp Asp Asn Gly Lys Thr Gly Arg Gly
530 535 540
Ala Val Ser Glu Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu
545 550 555 560
Lys Ser Gly Lys Lys Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser
565 570 575
<210> 380
<211> 500
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 380
Ser Arg Ala Leu Val Val Ile Arg Leu Ser Arg Val Thr Asp Ala Thr
1 5 10 15
Thr Ser Pro Glu Arg Gln Leu Glu Ser Cys Gln Gln Leu Cys Ala Gln
20 25 30
Arg Gly Trp Asp Val Val Gly Val Ala Glu Asp Leu Asp Val Ser Gly
35 40 45
Ala Val Asp Pro Phe Asp Arg Lys Arg Arg Pro Asn Leu Ala Arg Trp
50 55 60
Leu Ala Phe Glu Glu Gln Pro Phe Asp Val Ile Val Ala Tyr Arg Val
65 70 75 80
Asp Arg Leu Thr Arg Ser Ile Arg His Leu Gln Gln Leu Val His Trp
85 90 95
Ala Glu Asp His Lys Lys Leu Val Val Ser Ala Thr Glu Ala His Phe
100 105 110
Asp Thr Thr Thr Pro Phe Ala Ala Val Val Ile Ala Leu Met Gly Thr
115 120 125
Val Ala Gln Met Glu Leu Glu Ala Ile Lys Glu Arg Asn Arg Ser Ala
130 135 140
Ala His Phe Asn Ile Arg Ala Gly Lys Tyr Arg Gly Ser Leu Pro Pro
145 150 155 160
Trp Gly Tyr Leu Pro Thr Arg Val Asp Gly Glu Trp Arg Leu Val Pro
165 170 175
Asp Pro Val Gln Arg Glu Arg Ile Leu Glu Val Tyr His Arg Val Val
180 185 190
Asp Asn His Glu Pro Leu His Leu Val Ala His Asp Leu Asn Arg Arg
195 200 205
Gly Val Leu Ser Pro Lys Asp Tyr Phe Ala Gln Leu Gln Gly Arg Glu
210 215 220
Pro Gln Gly Arg Glu Trp Ser Ala Thr Ala Leu Lys Arg Ser Met Ile
225 230 235 240
Ser Glu Ala Met Leu Gly Tyr Ala Thr Leu Asn Gly Lys Thr Val Arg
245 250 255
Asp Asp Asp Gly Ala Pro Leu Val Arg Ala Glu Pro Ile Leu Thr Arg
260 265 270
Glu Gln Leu Glu Ala Leu Arg Ala Glu Leu Val Lys Thr Ser Arg Ala
275 280 285
Lys Pro Ala Val Ser Thr Pro Ser Leu Leu Leu Arg Val Leu Phe Cys
290 295 300
Ala Val Cys Gly Glu Pro Ala Tyr Lys Phe Ala Gly Gly Gly Arg Lys
305 310 315 320
His Pro Arg Tyr Arg Cys Arg Ser Met Gly Phe Pro Lys His Cys Gly
325 330 335
Asn Gly Thr Val Ala Met Ala Glu Trp Asp Ala Phe Cys Glu Glu Gln
340 345 350
Val Leu Asp Leu Leu Gly Asp Ala Glu Arg Leu Glu Lys Val Trp Val
355 360 365
Ala Gly Ser Asp Ser Ala Val Glu Leu Ala Glu Val Asn Ala Glu Leu
370 375 380
Val Asp Leu Thr Ser Leu Ile Gly Ser Pro Ala Tyr Arg Ala Gly Ser
385 390 395 400
Pro Gln Arg Glu Ala Leu Asp Ala Arg Ile Ala Ala Leu Ala Ala Arg
405 410 415
Gln Glu Glu Leu Glu Gly Leu Glu Ala Arg Pro Ser Gly Trp Glu Trp
420 425 430
Arg Glu Thr Gly Gln Arg Phe Gly Asp Trp Trp Arg Glu Gln Asp Thr
435 440 445
Ala Ala Lys Asn Thr Trp Leu Arg Ser Met Asn Val Arg Leu Thr Phe
450 455 460
Asp Val Arg Gly Gly Leu Thr Arg Thr Ile Asp Phe Gly Asp Leu Gln
465 470 475 480
Glu Tyr Glu Gln His Leu Arg Leu Gly Ser Val Val Glu Arg Leu His
485 490 495
Thr Gly Met Ser
500
<210> 381
<211> 11344
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 381
ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60
gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120
tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180
gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240
acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840
agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900
tagggagagc cgccaccatg aaacggacag ccgacggaag cgagttcgag tcaccaaaga 960
agaagcggaa agtcgacaag aagtacagca tcggcctgga catcggcacc aactctgtgg 1020
gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag gtgctgggca 1080
acaccgaccg gcacagcatc aagaagaacc tgatcggagc cctgctgttc gacagcggcg 1140
aaacagccga ggccacccgg ctgaagagaa ccgccagaag aagatacacc agacggaaga 1200
accggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg gacgacagct 1260
tcttccacag actggaagag tccttcctgg tggaagagga taagaagcac gagcggcacc 1320
ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc accatctacc 1380
acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgcggctg atctatctgg 1440
ccctggccca catgatcaag ttccggggcc acttcctgat cgagggcgac ctgaaccccg 1500
acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg 1560
aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga 1620
gcaagagcag acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc 1680
tgttcggaaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag agcaacttcg 1740
acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac gacctggaca 1800
acctgctggc ccagatcggc gaccagtacg ccgacctgtt tctggccgcc aagaacctgt 1860
ccgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc aaggcccccc 1920
tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc ctgctgaaag 1980
ctctcgtgcg gcagcagctg cctgagaagt acaaagagat tttcttcgac cagagcaaga 2040
acggctacgc cggctacatt gacggcggag ccagccagga agagttctac aagttcatca 2100
agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg aacagagagg 2160
acctgctgcg gaagcagcgg accttcgaca acggcagcat cccccaccag atccacctgg 2220
gagagctgca cgccattctg cggcggcagg aagattttta cccattcctg aaggacaacc 2280
gggaaaagat cgagaagatc ctgaccttcc gcatccccta ctacgtgggc cctctggcca 2340
ggggaaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc accccctgga 2400
acttcgagga agtggtggac aagggcgctt ccgcccagag cttcatcgag cggatgacca 2460
acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt 2520
acttcaccgt gtataacgag ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc 2580
ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc 2640
ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag tgcttcgact 2700
ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc cctgggcaca taccacgatc 2760
tgctgaaaat tatcaaggac aaggacttcc tggacaatga ggaaaacgag gacattctgg 2820
aagatatcgt gctgaccctg acactgtttg aggacagaga gatgatcgag gaacggctga 2880
aaacctatgc ccacctgttc gacgacaaag tgatgaagca gctgaagcgg cggagataca 2940
ccggctgggg caggctgagc cggaagctga tcaacggcat ccgggacaag cagtccggca 3000
agacaatcct ggatttcctg aagtccgacg gcttcgccaa cagaaacttc atgcagctga 3060
tccacgacga cagcctgacc tttaaagagg acatccagaa agcccaggtg tccggccagg 3120
gcgatagcct gcacgagcac attgccaatc tggccggcag ccccgccatt aagaagggca 3180
tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg 3240
agaacatcgt gatcgaaatg gccagagaga accagaccac ccagaaggga cagaagaaca 3300
gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc cagatcctga 3360
aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg tactacctgc 3420
agaatgggcg ggatatgtac gtggaccagg aactggacat caaccggctg tccgactacg 3480
atgtggacgc tatcgtgcct cagagctttc tgaaggacga ctccatcgac aacaaggtgc 3540
tgaccagaag cgacaagaac cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga 3600
agaagatgaa gaactactgg cggcagctgc tgaacgccaa gctgattacc cagagaaagt 3660
tcgacaatct gaccaaggcc gagagaggcg gcctgagcga actggataag gccggcttca 3720
tcaagagaca gctggtggaa acccggcaga tcacaaagca cgtggcacag atcctggact 3780
cccggatgaa cactaagtac gacgagaatg acaagctgat ccgggaagtg aaagtgatca 3840
ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac aaagtgcgcg 3900
agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc 3960
tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac aaggtgtacg 4020
acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc gccaagtact 4080
tcttctacag caacatcatg aactttttca agaccgagat taccctggcc aacggcgaga 4140
tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg 4200
gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa 4260
agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag aggaacagcg 4320
ataagctgat cgccagaaag aaggactggg accctaagaa gtacggcggc ttcgacagcc 4380
ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac 4440
tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc ttcgagaaga 4500
atcccatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac ctgatcatca 4560
agctgcctaa gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg 4620
ccggcgaact gcagaaggga aacgaactgg ccctgccctc caaatatgtg aacttcctgt 4680
acctggccag ccactatgag aagctgaagg gctcccccga ggataatgag cagaaacagc 4740
tgtttgtgga acagcacaag cactacctgg acgagatcat cgagcagatc agcgagttct 4800
ccaagagagt gatcctggcc gacgctaatc tggacaaagt gctgtccgcc tacaacaagc 4860
accgggataa gcccatcaga gagcaggccg agaatatcat ccacctgttt accctgacca 4920
atctgggagc ccctgccgcc ttcaagtact ttgacaccac catcgaccgg aagaggtaca 4980
ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc ggcctgtacg 5040
agacacggat cgacctgtct cagctgggag gtgactctgg aggatctagc ggaggatcct 5100
ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt ggcggcagca 5160
gcggcggcag cagcacccta aatatagaag atgagtatcg gctacatgag acctcaaaag 5220
agccagatgt ttctctaggg tccacatggc tgtctgattt tcctcaggcc tgggcggaaa 5280
ccgggggcat gggactggca gttcgccaag ctcctctgat catacctctg aaagcaacct 5340
ctacccccgt gtccataaaa caatacccca tgtcacaaga agccagactg gggatcaagc 5400
cccacataca gagactgttg gaccagggaa tactggtacc ctgccagtcc ccctggaaca 5460
cgcccctgct acccgttaag aaaccaggga ctaatgatta taggcctgtc caggatctga 5520
gagaagtcaa caagcgggtg gaagacatcc accccaccgt gcccaaccct tacaacctct 5580
tgagcgggct cccaccgtcc caccagtggt acactgtgct tgatttaaag gatgcctttt 5640
tctgcctgag actccacccc accagtcagc ctctcttcgc ctttgagtgg agagatccag 5700
agatgggaat ctcaggacaa ttgacctgga ccagactccc acagggtttc aaaaacagtc 5760
ccaccctgtt taatgaggca ctgcacagag acctagcaga cttccggatc cagcacccag 5820
acttgatcct gctacagtac gtggatgact tactgctggc cgccacttct gagctagact 5880
gccaacaagg tactcgggcc ctgttacaaa ccctagggaa cctcgggtat cgggcctcgg 5940
ccaagaaagc ccaaatttgc cagaaacagg tcaagtatct ggggtatctt ctaaaagagg 6000
gtcagagatg gctgactgag gccagaaaag agactgtgat ggggcagcct actccgaaga 6060
cccctcgaca actaagggag ttcctaggga aggcaggctt ctgtcgcctc ttcatccctg 6120
ggtttgcaga aatggcagcc cccctgtacc ctctcaccaa accggggact ctgtttaatt 6180
ggggcccaga ccaacaaaag gcctatcaag aaatcaagca agctcttcta actgccccag 6240
ccctggggtt gccagatttg actaagccct ttgaactctt tgtcgacgag aagcagggct 6300
acgccaaagg tgtcctaacg caaaaactgg gaccttggcg tcggccggtg gcctacctgt 6360
ccaaaaagct agacccagta gcagctgggt ggcccccttg cctacggatg gtagcagcca 6420
ttgccgtact gacaaaggat gcaggcaagc taaccatggg acagccacta gtcattctgg 6480
ccccccatgc agtagaggca ctagtcaaac aaccccccga ccgctggctt tccaacgccc 6540
ggatgactca ctatcaggcc ttgcttttgg acacggaccg ggtccagttc ggaccggtgg 6600
tagccctgaa cccggctacg ctgctcccac tgcctgagga agggctgcaa cacaactgcc 6660
ttgatatcct ggccgaagcc cacggaaccc gacccgacct aacggaccag ccgctcccag 6720
acgccgacca cacctggtac acggatggaa gcagtctctt acaagaggga cagcgtaagg 6780
cgggagctgc ggtgaccacc gagaccgagg taatctgggc taaagccctg ccagccggga 6840
catccgctca gcgggctgaa ctgatagcac tcacccaggc cctaaagatg gcagaaggta 6900
agaagctaaa tgtttatact gatagccgtt atgcttttgc tactgcccat atccatggag 6960
aaatatacag aaggcgtggg tggctcacat cagaaggcaa agagatcaaa aataaagacg 7020
agatcttggc cctactaaaa gccctctttc tgcccaaaag acttagcata atccattgtc 7080
caggacatca aaagggacac agcgccgagg ctagaggcaa ccggatggct gaccaagcgg 7140
cccgaaaggc agccatcaca gagactccag acacctctac cctcctcata gaaaattcat 7200
caccctctgg cggctcaaaa agaaccgccg acggcagcga attcgagccc aagaagaaga 7260
ggaaagtcgg aagcggagct actaacttca gcctgctgaa gcaggctggc gacgtggagg 7320
agaaccctgg acctccaaaa aagaaaagaa aagtgtatcc ctatgatgtc cccgattatg 7380
ccggttcaag agccctggtc gtgattagac tgagccgagt gacagacgcc accacaagtc 7440
ccgagagaca gctggaatca tgccagcagc tctgtgctca gcggggttgg gatgtggtcg 7500
gcgtggcaga ggatctggac gtgagcgggg ccgtcgatcc attcgacaga aagaggaggc 7560
ccaacctggc aagatggctc gctttcgagg aacagccctt tgatgtgatc gtcgcctaca 7620
gagtggaccg gctgacccgc tcaattcgac atctccagca gctggtgcat tgggctgagg 7680
accacaagaa actggtggtc agcgcaacag aagcccactt cgatactacc acaccttttg 7740
ccgctgtggt catcgcactg atgggcactg tggcccagat ggagctcgaa gctatcaagg 7800
agcgaaacag gagcgcagcc catttcaata ttagggccgg taaatacaga ggctccctgc 7860
ccccttgggg atatctccct accagggtgg atggggagtg gagactggtg ccagaccccg 7920
tccagagaga gcggattctg gaagtgtacc acagagtggt cgataaccac gaaccactcc 7980
atctggtggc acacgacctg aatagacgcg gcgtgctctc tccaaaggat tattttgctc 8040
agctgcaggg aagagagcca cagggaagag aatggagtgc tactgcactg aagagatcta 8100
tgatcagtga ggctatgctg ggttacgcaa cactcaatgg caaaactgtc cgggacgatg 8160
acggagcccc tctggtgagg gctgagccta ttctcaccag agagcagctc gaagctctgc 8220
gggcagaact ggtcaagact agtcgcgcca aacctgccgt gagcacccca agcctgctcc 8280
tgagggtgct gttctgcgcc gtctgtggag agccagcata caagtttgcc ggcggagggc 8340
gcaaacatcc ccgctatcga tgcaggagca tggggttccc taagcactgt ggaaacggga 8400
cagtggccat ggctgagtgg gacgcctttt gcgaggaaca ggtgctggat ctcctgggtg 8460
acgctgagcg gctggaaaaa gtgtgggtgg caggatctga ctccgctgtg gagctggcag 8520
aagtcaatgc cgagctcgtg gatctgactt ccctcatcgg atctcctgca tatagagctg 8580
ggtccccaca gagagaagct ctggacgcac gaattgctgc actcgctgct agacaggagg 8640
aactggaggg cctggaggcc aggccctctg gatgggagtg gcgagaaacc ggacagaggt 8700
ttggggattg gtggagggag caggacaccg cagccaagaa cacatggctg agatccatga 8760
atgtccggct cacattcgac gtgcgcggtg gcctgactcg aaccatcgat tttggcgacc 8820
tgcaggagta tgaacagcac ctgagactgg ggtccgtggt cgaaagactg cacactggga 8880
tgtcctaggt ttaaacccgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg 8940
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 9000
cctaataaaa tgagaaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 9060
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 9120
atgcggtggg ctctatggct tctgaggcgg aaagaaccag ctggggctcg ataccgtcga 9180
cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 9240
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tagggtgcct 9300
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 9360
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 9420
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 9480
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 9540
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 9600
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 9660
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 9720
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 9780
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 9840
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 9900
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 9960
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 10020
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 10080
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 10140
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 10200
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 10260
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 10320
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 10380
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 10440
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 10500
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 10560
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 10620
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 10680
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 10740
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 10800
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 10860
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 10920
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 10980
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 11040
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 11100
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 11160
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 11220
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 11280
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 11340
ttcc 11344
<210> 382
<211> 9753
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 382
ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60
gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120
tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180
gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240
acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840
agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900
tagggagagc cgccaccatg aaacggacag ccgacggaag cgagttcgag tcaccaaaga 960
agaagcggaa agtcgacaag aagtacagca tcggcctgga catcggcacc aactctgtgg 1020
gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag gtgctgggca 1080
acaccgaccg gcacagcatc aagaagaacc tgatcggagc cctgctgttc gacagcggcg 1140
aaacagccga ggccacccgg ctgaagagaa ccgccagaag aagatacacc agacggaaga 1200
accggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg gacgacagct 1260
tcttccacag actggaagag tccttcctgg tggaagagga taagaagcac gagcggcacc 1320
ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc accatctacc 1380
acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgcggctg atctatctgg 1440
ccctggccca catgatcaag ttccggggcc acttcctgat cgagggcgac ctgaaccccg 1500
acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg 1560
aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga 1620
gcaagagcag acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc 1680
tgttcggaaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag agcaacttcg 1740
acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac gacctggaca 1800
acctgctggc ccagatcggc gaccagtacg ccgacctgtt tctggccgcc aagaacctgt 1860
ccgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc aaggcccccc 1920
tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc ctgctgaaag 1980
ctctcgtgcg gcagcagctg cctgagaagt acaaagagat tttcttcgac cagagcaaga 2040
acggctacgc cggctacatt gacggcggag ccagccagga agagttctac aagttcatca 2100
agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg aacagagagg 2160
acctgctgcg gaagcagcgg accttcgaca acggcagcat cccccaccag atccacctgg 2220
gagagctgca cgccattctg cggcggcagg aagattttta cccattcctg aaggacaacc 2280
gggaaaagat cgagaagatc ctgaccttcc gcatccccta ctacgtgggc cctctggcca 2340
ggggaaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc accccctgga 2400
acttcgagga agtggtggac aagggcgctt ccgcccagag cttcatcgag cggatgacca 2460
acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt 2520
acttcaccgt gtataacgag ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc 2580
ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc 2640
ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag tgcttcgact 2700
ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc cctgggcaca taccacgatc 2760
tgctgaaaat tatcaaggac aaggacttcc tggacaatga ggaaaacgag gacattctgg 2820
aagatatcgt gctgaccctg acactgtttg aggacagaga gatgatcgag gaacggctga 2880
aaacctatgc ccacctgttc gacgacaaag tgatgaagca gctgaagcgg cggagataca 2940
ccggctgggg caggctgagc cggaagctga tcaacggcat ccgggacaag cagtccggca 3000
agacaatcct ggatttcctg aagtccgacg gcttcgccaa cagaaacttc atgcagctga 3060
tccacgacga cagcctgacc tttaaagagg acatccagaa agcccaggtg tccggccagg 3120
gcgatagcct gcacgagcac attgccaatc tggccggcag ccccgccatt aagaagggca 3180
tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg 3240
agaacatcgt gatcgaaatg gccagagaga accagaccac ccagaaggga cagaagaaca 3300
gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc cagatcctga 3360
aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg tactacctgc 3420
agaatgggcg ggatatgtac gtggaccagg aactggacat caaccggctg tccgactacg 3480
atgtggacgc tatcgtgcct cagagctttc tgaaggacga ctccatcgac aacaaggtgc 3540
tgaccagaag cgacaagaac cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga 3600
agaagatgaa gaactactgg cggcagctgc tgaacgccaa gctgattacc cagagaaagt 3660
tcgacaatct gaccaaggcc gagagaggcg gcctgagcga actggataag gccggcttca 3720
tcaagagaca gctggtggaa acccggcaga tcacaaagca cgtggcacag atcctggact 3780
cccggatgaa cactaagtac gacgagaatg acaagctgat ccgggaagtg aaagtgatca 3840
ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac aaagtgcgcg 3900
agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc 3960
tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac aaggtgtacg 4020
acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc gccaagtact 4080
tcttctacag caacatcatg aactttttca agaccgagat taccctggcc aacggcgaga 4140
tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg 4200
gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa 4260
agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag aggaacagcg 4320
ataagctgat cgccagaaag aaggactggg accctaagaa gtacggcggc ttcgacagcc 4380
ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac 4440
tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc ttcgagaaga 4500
atcccatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac ctgatcatca 4560
agctgcctaa gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg 4620
ccggcgaact gcagaaggga aacgaactgg ccctgccctc caaatatgtg aacttcctgt 4680
acctggccag ccactatgag aagctgaagg gctcccccga ggataatgag cagaaacagc 4740
tgtttgtgga acagcacaag cactacctgg acgagatcat cgagcagatc agcgagttct 4800
ccaagagagt gatcctggcc gacgctaatc tggacaaagt gctgtccgcc tacaacaagc 4860
accgggataa gcccatcaga gagcaggccg agaatatcat ccacctgttt accctgacca 4920
atctgggagc ccctgccgcc ttcaagtact ttgacaccac catcgaccgg aagaggtaca 4980
ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc ggcctgtacg 5040
agacacggat cgacctgtct cagctgggag gtgactctgg aggatctagc ggaggatcct 5100
ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt ggcggcagca 5160
gcggcggcag cagcacccta aatatagaag atgagtatcg gctacatgag acctcaaaag 5220
agccagatgt ttctctaggg tccacatggc tgtctgattt tcctcaggcc tgggcggaaa 5280
ccgggggcat gggactggca gttcgccaag ctcctctgat catacctctg aaagcaacct 5340
ctacccccgt gtccataaaa caatacccca tgtcacaaga agccagactg gggatcaagc 5400
cccacataca gagactgttg gaccagggaa tactggtacc ctgccagtcc ccctggaaca 5460
cgcccctgct acccgttaag aaaccaggga ctaatgatta taggcctgtc caggatctga 5520
gagaagtcaa caagcgggtg gaagacatcc accccaccgt gcccaaccct tacaacctct 5580
tgagcgggct cccaccgtcc caccagtggt acactgtgct tgatttaaag gatgcctttt 5640
tctgcctgag actccacccc accagtcagc ctctcttcgc ctttgagtgg agagatccag 5700
agatgggaat ctcaggacaa ttgacctgga ccagactccc acagggtttc aaaaacagtc 5760
ccaccctgtt taatgaggca ctgcacagag acctagcaga cttccggatc cagcacccag 5820
acttgatcct gctacagtac gtggatgact tactgctggc cgccacttct gagctagact 5880
gccaacaagg tactcgggcc ctgttacaaa ccctagggaa cctcgggtat cgggcctcgg 5940
ccaagaaagc ccaaatttgc cagaaacagg tcaagtatct ggggtatctt ctaaaagagg 6000
gtcagagatg gctgactgag gccagaaaag agactgtgat ggggcagcct actccgaaga 6060
cccctcgaca actaagggag ttcctaggga aggcaggctt ctgtcgcctc ttcatccctg 6120
ggtttgcaga aatggcagcc cccctgtacc ctctcaccaa accggggact ctgtttaatt 6180
ggggcccaga ccaacaaaag gcctatcaag aaatcaagca agctcttcta actgccccag 6240
ccctggggtt gccagatttg actaagccct ttgaactctt tgtcgacgag aagcagggct 6300
acgccaaagg tgtcctaacg caaaaactgg gaccttggcg tcggccggtg gcctacctgt 6360
ccaaaaagct agacccagta gcagctgggt ggcccccttg cctacggatg gtagcagcca 6420
ttgccgtact gacaaaggat gcaggcaagc taaccatggg acagccacta gtcattctgg 6480
ccccccatgc agtagaggca ctagtcaaac aaccccccga ccgctggctt tccaacgccc 6540
ggatgactca ctatcaggcc ttgcttttgg acacggaccg ggtccagttc ggaccggtgg 6600
tagccctgaa cccggctacg ctgctcccac tgcctgagga agggctgcaa cacaactgcc 6660
ttgatatcct ggccgaagcc cacggaaccc gacccgacct aacggaccag ccgctcccag 6720
acgccgacca cacctggtac acggatggaa gcagtctctt acaagaggga cagcgtaagg 6780
cgggagctgc ggtgaccacc gagaccgagg taatctgggc taaagccctg ccagccggga 6840
catccgctca gcgggctgaa ctgatagcac tcacccaggc cctaaagatg gcagaaggta 6900
agaagctaaa tgtttatact gatagccgtt atgcttttgc tactgcccat atccatggag 6960
aaatatacag aaggcgtggg tggctcacat cagaaggcaa agagatcaaa aataaagacg 7020
agatcttggc cctactaaaa gccctctttc tgcccaaaag acttagcata atccattgtc 7080
caggacatca aaagggacac agcgccgagg ctagaggcaa ccggatggct gaccaagcgg 7140
cccgaaaggc agccatcaca gagactccag acacctctac cctcctcata gaaaattcat 7200
caccctctgg cggctcaaaa agaaccgccg acggcagcga attcgagccc aagaagaaga 7260
ggaaagtcta accggtcatc atcaccatca ccattgagtt taaacccgct gatcagcctc 7320
gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 7380
cctggaaggt gccactccca ctgtcctttc ctaataaaat gagaaaattg catcgcattg 7440
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 7500
ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga 7560
aagaaccagc tggggctcga taccgtcgac ctctagctag agcttggcgt aatcatggtc 7620
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 7680
aagcataaag tgtaaagcct agggtgccta atgagtgagc taactcacat taattgcgtt 7740
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 7800
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 7860
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 7920
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 7980
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 8040
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 8100
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 8160
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 8220
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 8280
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 8340
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 8400
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 8460
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 8520
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 8580
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 8640
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 8700
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 8760
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 8820
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 8880
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 8940
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 9000
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 9060
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 9120
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 9180
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 9240
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 9300
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 9360
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 9420
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 9480
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 9540
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 9600
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 9660
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 9720
aaataaacaa ataggggttc cgcgcacatt tcc 9753
<210> 383
<211> 11433
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 383
ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60
gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120
tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180
gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240
acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840
agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900
tagggagagc cgccaccatg cccgcggcta agagggtgaa gcttgacggt ggaaaacgga 960
cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtcgac aagaagtaca 1020
gcatcggcct ggacatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca 1080
aggtgcccag caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga 1140
acctgatcgg agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga 1200
gaaccgccag aagaagatac accagacgga agaaccggat ctgctatctg caagagatct 1260
tcagcaacga gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc 1320
tggtggaaga ggataagaag cacgagcggc accccatctt cggcaacatc gtggacgagg 1380
tggcctacca cgagaagtac cccaccatct accacctgag aaagaaactg gtggacagca 1440
ccgacaaggc cgacctgcgg ctgatctatc tggccctggc ccacatgatc aagttccggg 1500
gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca 1560
tccagctggt gcagacctac aaccagctgt tcgaggaaaa ccccatcaac gccagcggcg 1620
tggacgccaa ggccatcctg tctgccagac tgagcaagag cagacggctg gaaaatctga 1680
tcgcccagct gcccggcgag aagaagaatg gcctgttcgg aaacctgatt gccctgagcc 1740
tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggatgcc aaactgcagc 1800
tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt 1860
acgccgacct gtttctggcc gccaagaacc tgtccgacgc catcctgctg agcgacatcc 1920
tgagagtgaa caccgagatc accaaggccc ccctgagcgc ctctatgatc aagagatacg 1980
acgagcacca ccaggacctg accctgctga aagctctcgt gcggcagcag ctgcctgaga 2040
agtacaaaga gattttcttc gaccagagca agaacggcta cgccggctac attgacggcg 2100
gagccagcca ggaagagttc tacaagttca tcaagcccat cctggaaaag atggacggca 2160
ccgaggaact gctcgtgaag ctgaacagag aggacctgct gcggaagcag cggaccttcg 2220
acaacggcag catcccccac cagatccacc tgggagagct gcacgccatt ctgcggcggc 2280
aggaagattt ttacccattc ctgaaggaca accgggaaaa gatcgagaag atcctgacct 2340
tccgcatccc ctactacgtg ggccctctgg ccaggggaaa cagcagattc gcctggatga 2400
ccagaaagag cgaggaaacc atcaccccct ggaacttcga ggaagtggtg gacaagggcg 2460
cttccgccca gagcttcatc gagcggatga ccaacttcga taagaacctg cccaacgaga 2520
aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtataac gagctgacca 2580
aagtgaaata cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc gagcagaaaa 2640
aggccatcgt ggacctgctg ttcaagacca accggaaagt gaccgtgaag cagctgaaag 2700
aggactactt caagaaaatc gagtgcttcg actccgtgga aatctccggc gtggaagatc 2760
ggttcaacgc ctccctgggc acataccacg atctgctgaa aattatcaag gacaaggact 2820
tcctggacaa tgaggaaaac gaggacattc tggaagatat cgtgctgacc ctgacactgt 2880
ttgaggacag agagatgatc gaggaacggc tgaaaaccta tgcccacctg ttcgacgaca 2940
aagtgatgaa gcagctgaag cggcggagat acaccggctg gggcaggctg agccggaagc 3000
tgatcaacgg catccgggac aagcagtccg gcaagacaat cctggatttc ctgaagtccg 3060
acggcttcgc caacagaaac ttcatgcagc tgatccacga cgacagcctg acctttaaag 3120
aggacatcca gaaagcccag gtgtccggcc agggcgatag cctgcacgag cacattgcca 3180
atctggccgg cagccccgcc attaagaagg gcatcctgca gacagtgaag gtggtggacg 3240
agctcgtgaa agtgatgggc cggcacaagc ccgagaacat cgtgatcgaa atggccagag 3300
agaaccagac cacccagaag ggacagaaga acagccgcga gagaatgaag cggatcgaag 3360
agggcatcaa agagctgggc agccagatcc tgaaagaaca ccccgtggaa aacacccagc 3420
tgcagaacga gaagctgtac ctgtactacc tgcagaatgg gcgggatatg tacgtggacc 3480
aggaactgga catcaaccgg ctgtccgact acgatgtgga cgctatcgtg cctcagagct 3540
ttctgaagga cgactccatc gacaacaagg tgctgaccag aagcgacaag aaccggggca 3600
agagcgacaa cgtgccctcc gaagaggtcg tgaagaagat gaagaactac tggcggcagc 3660
tgctgaacgc caagctgatt acccagagaa agttcgacaa tctgaccaag gccgagagag 3720
gcggcctgag cgaactggat aaggccggct tcatcaagag acagctggtg gaaacccggc 3780
agatcacaaa gcacgtggca cagatcctgg actcccggat gaacactaag tacgacgaga 3840
atgacaagct gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg gtgtccgatt 3900
tccggaagga tttccagttt tacaaagtgc gcgagatcaa caactaccac cacgcccacg 3960
acgcctacct gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct aagctggaaa 4020
gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg 4080
agcaggaaat cggcaaggct accgccaagt acttcttcta cagcaacatc atgaactttt 4140
tcaagaccga gattaccctg gccaacggcg agatccggaa gcggcctctg atcgagacaa 4200
acggcgaaac cggggagatc gtgtgggata agggccggga ttttgccacc gtgcggaaag 4260
tgctgagcat gccccaagtg aatatcgtga aaaagaccga ggtgcagaca ggcggcttca 4320
gcaaagagtc tatcctgccc aagaggaaca gcgataagct gatcgccaga aagaaggact 4380
gggaccctaa gaagtacggc ggcttcgaca gccccaccgt ggcctattct gtgctggtgg 4440
tggccaaagt ggaaaagggc aagtccaaga aactgaagag tgtgaaagag ctgctgggga 4500
tcaccatcat ggaaagaagc agcttcgaga agaatcccat cgactttctg gaagccaagg 4560
gctacaaaga agtgaaaaag gacctgatca tcaagctgcc taagtactcc ctgttcgagc 4620
tggaaaacgg ccggaagaga atgctggcct ctgccggcga actgcagaag ggaaacgaac 4680
tggccctgcc ctccaaatat gtgaacttcc tgtacctggc cagccactat gagaagctga 4740
agggctcccc cgaggataat gagcagaaac agctgtttgt ggaacagcac aagcactacc 4800
tggacgagat catcgagcag atcagcgagt tctccaagag agtgatcctg gccgacgcta 4860
atctggacaa agtgctgtcc gcctacaaca agcaccggga taagcccatc agagagcagg 4920
ccgagaatat catccacctg tttaccctga ccaatctggg agcccctgcc gccttcaagt 4980
actttgacac caccatcgac cggaagaggt acaccagcac caaagaggtg ctggacgcca 5040
ccctgatcca ccagagcatc accggcctgt acgagacacg gatcgacctg tctcagctgg 5100
gaggtgactc tggaggatct agcggaggat cctctggcag cgagacacca ggaacaagcg 5160
agtcagcaac accagagagc agtggcggca gcagcggcgg cagcagcacc ctaaatatag 5220
aagatgagta tcggctacat gagacctcaa aagagccaga tgtttctcta gggtccacat 5280
ggctgtctga ttttcctcag gcctgggcgg aaaccggggg catgggactg gcagttcgcc 5340
aagctcctct gatcatacct ctgaaagcaa cctctacccc cgtgtccata aaacaatacc 5400
ccatgtcaca agaagccaga ctggggatca agccccacat acagagactg ttggaccagg 5460
gaatatggta ccctgccagt ccccctggaa cacgcccctg ctacccgtta agaaaccagg 5520
gactaatgat tataggcctg tccaggatct gagagaagtc aacaagcggg tggaagacat 5580
ccaccccacc gtgcccaacc cttacaacct cttgagcggg ctcccaccgt cccaccagtg 5640
gtacactgtg cttgatttaa aggatgcctt tttctgcctg agactccacc ccaccagtca 5700
gcctctcttc gcctttgagt ggagagatcc agagatggga atctcaggac aattgacctg 5760
gaccagactc ccacagggtt tcaaaaacag tcccaccctg tttaatgagg cactgcacag 5820
agacctagca gacttccgga tccagcaccc agacttgatc ctgctacagt acgtggatga 5880
cttactgctg gccgccactt ctgagctaga ctgccaacaa ggtactcggg ccctgttaca 5940
aaccctaggg aacctcgggt atcgggcctc ggccaagaaa gcccaaattt gccagaaaca 6000
ggtcaagtat ctggggtatc ttctaaaaga gggtcagaga tggctgactg aggccagaaa 6060
agagactgtg atggggcagc ctactccgaa gacccctcga caactaaggg agttcctagg 6120
gaaggcaggc ttctgtcgcc tcttcatccc tgggtttgca gaaatggcag cccccctgta 6180
ccctctcacc aaaccgggga ctctgtttaa ttggggccca gaccaacaaa aggcctatca 6240
agaaatcaag caagctcttc taactgcccc agccctgggg ttgccagatt tgactaagcc 6300
ctttgaactc tttgtcgacg agaagcaggg ctacgccaaa ggtgtcctaa cgcaaaaact 6360
gggaccttgg cgtcggccgg tggcctacct gtccaaaaag ctagacccag tagcagctgg 6420
gtggccccct tgcctacgga tggtagcagc cattgccgta ctgacaaagg atgcaggcaa 6480
gctaaccatg ggacagccac tagtcattct ggccccccat gcagtagagg cactagtcaa 6540
acaacccccc gaccgctggc tttccaacgc ccggatgact cactatcagg ccttgctttt 6600
ggacacggac cgggtccagt tcggaccggt ggtagccctg aacccggcta cgctgctccc 6660
actgcctgag gaagggctgc aacacaactg ccttgatatc ctggccgaag cccacggaac 6720
ccgacccgac ctaacggacc agccgctccc agacgccgac cacacctggt acacggatgg 6780
aagcagtctc ttacaagagg gacagcgtaa ggcgggagct gcggtgacca ccgagaccga 6840
ggtaatctgg gctaaagccc tgccagccgg gacatccgct cagcgggctg aactgatagc 6900
actcacccag gccctaaaga tggcagaagg taagaagcta aatgtttata ctgatagccg 6960
ttatgctttt gctactgccc atatccatgg agaaatatac agaaggcgtg ggtggctcac 7020
atcagaaggc aaagagatca aaaataaaga cgagatcttg gccctactaa aagccctctt 7080
tctgcccaaa agacttagca taatccattg tccaggacat caaaagggac acagcgccga 7140
ggctagaggc aaccggatgg ctgaccaagc ggcccgaaag gcagccatca cagagactcc 7200
agacacctct accctcctca tagaaaattc atcaccctct ggcggctcaa aaagaaccgc 7260
cgacggcagc gaaaaaagaa ccgctgactc tcaacattcc acacctccaa aaaccaagcg 7320
aaaagtggaa ttcgagccca agaagaagag gaaagtcgga agcggagcta ctaacttcag 7380
cctgctgaag caggctggcg acgtggagga gaaccctgga cctccaaaaa agaaaagaaa 7440
agtgtatccc tatgatgtcc ccgattatgc cggttcaaga gccctggtcg tgattagact 7500
gagccgagtg acagacgcca ccacaagtcc cgagagacag ctggaatcat gccagcagct 7560
ctgtgctcag cggggttggg atgtggtcgg cgtggcagag gatctggacg tgagcggggc 7620
cgtcgatcca ttcgacagaa agaggaggcc caacctggca agatggctcg ctttcgagga 7680
acagcccttt gatgtgatcg tcgcctacag agtggaccgg ctgacccgct caattcgaca 7740
tctccagcag ctggtgcatt gggctgagga ccacaagaaa ctggtggtca gcgcaacaga 7800
agcccacttc gatactacca caccttttgc cgctgtggtc atcgcactga tgggcactgt 7860
ggcccagatg gagctcgaag ctatcaagga gcgaaacagg agcgcagccc atttcaatat 7920
tagggccggt aaatacagag gctccctgcc cccttgggga tatctcccta ccagggtgga 7980
tggggagtgg agactggtgc cagaccccgt ccagagagag cggattctgg aagtgtacca 8040
cagagtggtc gataaccacg aaccactcca tctggtggca cacgacctga atagacgcgg 8100
cgtgctctct ccaaaggatt attttgctca gctgcaggga agagagccac agggaagaga 8160
atggagtgct actgcactga agagatctat gatcagtgag gctatgctgg gttacgcaac 8220
actcaatggc aaaactgtcc gggacgatga cggagcccct ctggtgaggg ctgagcctat 8280
tctcaccaga gagcagctcg aagctctgcg ggcagaactg gtcaagacta gtcgcgccaa 8340
acctgccgtg agcaccccaa gcctgctcct gagggtgctg ttctgcgccg tctgtggaga 8400
gccagcatac aagtttgccg gcggagggcg caaacatccc cgctatcgat gcaggagcat 8460
ggggttccct aagcactgtg gaaacgggac agtggccatg gctgagtggg acgccttttg 8520
cgaggaacag gtgctggatc tcctgggtga cgctgagcgg ctggaaaaag tgtgggtggc 8580
aggatctgac tccgctgtgg agctggcaga agtcaatgcc gagctcgtgg atctgacttc 8640
cctcatcgga tctcctgcat atagagctgg gtccccacag agagaagctc tggacgcacg 8700
aattgctgca ctcgctgcta gacaggagga actggagggc ctggaggcca ggccctctgg 8760
atgggagtgg cgagaaaccg gacagaggtt tggggattgg tggagggagc aggacaccgc 8820
agccaagaac acatggctga gatccatgaa tgtccggctc acattcgacg tgcgcggtgg 8880
cctgactcga accatcgatt ttggcgacct gcaggagtat gaacagcacc tgagactggg 8940
gtccgtggtc gaaagactgc acactgggat gtcctaggtt taaacccgct gatcagcctc 9000
gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 9060
cctggaaggt gccactccca ctgtcctttc ctaataaaat gagaaaattg catcgcattg 9120
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 9180
ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga 9240
aagaaccagc tggggctcga taccgtcgac ctctagctag agcttggcgt aatcatggtc 9300
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 9360
aagcataaag tgtaaagcct agggtgccta atgagtgagc taactcacat taattgcgtt 9420
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 9480
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 9540
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 9600
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 9660
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 9720
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 9780
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 9840
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 9900
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 9960
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 10020
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 10080
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 10140
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 10200
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 10260
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 10320
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 10380
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 10440
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 10500
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 10560
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 10620
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 10680
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 10740
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 10800
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 10860
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 10920
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 10980
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 11040
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 11100
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 11160
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 11220
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 11280
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 11340
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 11400
aaataaacaa ataggggttc cgcgcacatt tcc 11433
<210> 384
<211> 11056
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 384
ccgaaaagtg ccacctgacg tcgacggatc gggagatcga tctcccgatc ccctagggtc 60
gactctcagt acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg 120
tgtgttggag gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt 180
gaccgacaat tgcatgaaga atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt 240
acgggccaga tatacgcgtt gacattgatt attgactagt tattaatagt aatcaattac 300
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 360
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 420
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 480
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 540
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 600
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 660
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 720
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 780
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 840
agctggttta gtgaaccgtc agatccgcta gagatccgcg gccgctaata cgactcacta 900
tagggagagc cgccaccatg aaacggacag ccgacggaag cgagttcgag tcaccaaaga 960
agaagcggaa agtcgacaag aagtacagca tcggcctgga catcggcacc aactctgtgg 1020
gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag gtgctgggca 1080
acaccgaccg gcacagcatc aagaagaacc tgatcggagc cctgctgttc gacagcggcg 1140
aaacagccga ggccacccgg ctgaagagaa ccgccagaag aagatacacc agacggaaga 1200
accggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg gacgacagct 1260
tcttccacag actggaagag tccttcctgg tggaagagga taagaagcac gagcggcacc 1320
ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc accatctacc 1380
acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgcggctg atctatctgg 1440
ccctggccca catgatcaag ttccggggcc acttcctgat cgagggcgac ctgaaccccg 1500
acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac cagctgttcg 1560
aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc catcctgtct gccagactga 1620
gcaagagcag acggctggaa aatctgatcg cccagctgcc cggcgagaag aagaatggcc 1680
tgttcggaaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag agcaacttcg 1740
acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac gacctggaca 1800
acctgctggc ccagatcggc gaccagtacg ccgacctgtt tctggccgcc aagaacctgt 1860
ccgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc aaggcccccc 1920
tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc ctgctgaaag 1980
ctctcgtgcg gcagcagctg cctgagaagt acaaagagat tttcttcgac cagagcaaga 2040
acggctacgc cggctacatt gacggcggag ccagccagga agagttctac aagttcatca 2100
agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg aacagagagg 2160
acctgctgcg gaagcagcgg accttcgaca acggcagcat cccccaccag atccacctgg 2220
gagagctgca cgccattctg cggcggcagg aagattttta cccattcctg aaggacaacc 2280
gggaaaagat cgagaagatc ctgaccttcc gcatccccta ctacgtgggc cctctggcca 2340
ggggaaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc accccctgga 2400
acttcgagga agtggtggac aagggcgctt ccgcccagag cttcatcgag cggatgacca 2460
acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt 2520
acttcaccgt gtataacgag ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc 2580
ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc 2640
ggaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag tgcttcgact 2700
ccgtggaaat ctccggcgtg gaagatcggt tcaacgcctc cctgggcaca taccacgatc 2760
tgctgaaaat tatcaaggac aaggacttcc tggacaatga ggaaaacgag gacattctgg 2820
aagatatcgt gctgaccctg acactgtttg aggacagaga gatgatcgag gaacggctga 2880
aaacctatgc ccacctgttc gacgacaaag tgatgaagca gctgaagcgg cggagataca 2940
ccggctgggg caggctgagc cggaagctga tcaacggcat ccgggacaag cagtccggca 3000
agacaatcct ggatttcctg aagtccgacg gcttcgccaa cagaaacttc atgcagctga 3060
tccacgacga cagcctgacc tttaaagagg acatccagaa agcccaggtg tccggccagg 3120
gcgatagcct gcacgagcac attgccaatc tggccggcag ccccgccatt aagaagggca 3180
tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg 3240
agaacatcgt gatcgaaatg gccagagaga accagaccac ccagaaggga cagaagaaca 3300
gccgcgagag aatgaagcgg atcgaagagg gcatcaaaga gctgggcagc cagatcctga 3360
aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg tactacctgc 3420
agaatgggcg ggatatgtac gtggaccagg aactggacat caaccggctg tccgactacg 3480
atgtggacgc tatcgtgcct cagagctttc tgaaggacga ctccatcgac aacaaggtgc 3540
tgaccagaag cgacaagaac cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga 3600
agaagatgaa gaactactgg cggcagctgc tgaacgccaa gctgattacc cagagaaagt 3660
tcgacaatct gaccaaggcc gagagaggcg gcctgagcga actggataag gccggcttca 3720
tcaagagaca gctggtggaa acccggcaga tcacaaagca cgtggcacag atcctggact 3780
cccggatgaa cactaagtac gacgagaatg acaagctgat ccgggaagtg aaagtgatca 3840
ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac aaagtgcgcg 3900
agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc 3960
tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac aaggtgtacg 4020
acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc gccaagtact 4080
tcttctacag caacatcatg aactttttca agaccgagat taccctggcc aacggcgaga 4140
tccggaagcg gcctctgatc gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg 4200
gccgggattt tgccaccgtg cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa 4260
agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag aggaacagcg 4320
ataagctgat cgccagaaag aaggactggg accctaagaa gtacggcggc ttcgacagcc 4380
ccaccgtggc ctattctgtg ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac 4440
tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc ttcgagaaga 4500
atcccatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac ctgatcatca 4560
agctgcctaa gtactccctg ttcgagctgg aaaacggccg gaagagaatg ctggcctctg 4620
ccggcgaact gcagaaggga aacgaactgg ccctgccctc caaatatgtg aacttcctgt 4680
acctggccag ccactatgag aagctgaagg gctcccccga ggataatgag cagaaacagc 4740
tgtttgtgga acagcacaag cactacctgg acgagatcat cgagcagatc agcgagttct 4800
ccaagagagt gatcctggcc gacgctaatc tggacaaagt gctgtccgcc tacaacaagc 4860
accgggataa gcccatcaga gagcaggccg agaatatcat ccacctgttt accctgacca 4920
atctgggagc ccctgccgcc ttcaagtact ttgacaccac catcgaccgg aagaggtaca 4980
ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc ggcctgtacg 5040
agacacggat cgacctgtct cagctgggag gtgactctgg aggatctagc ggaggatcct 5100
ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagctct ggtagcgaga 5160
cacccggtac cagtgaaagc gccacgccag aaagcagtgg gagtgagact ccgggtacat 5220
ctgaatcagc gacaccggaa tcaagtggcg gcagcagcgg cggcagcagc accctaaata 5280
tagaagatga gtatcggcta catgagacct caaaagagcc agatgtttct ctagggtcca 5340
catggctgtc tgattttcct caggcctggg cggaaaccgg gggcatggga ctggcagttc 5400
gccaagctcc tctgatcata cctctgaaag caacctctac ccccgtgtcc ataaaacaat 5460
accccatgtc acaagaagcc agactgggga tcaagcccca catacagaga ctgttggacc 5520
agggaatact ggtaccctgc cagtccccct ggaacacgcc cctgctaccc gttaagaaac 5580
cagggactaa tgattatagg cctgtccagg atctgagaga agtcaacaag cgggtggaag 5640
acatccaccc caccgtgccc aacccttaca acctcttgag cgggccccca ccgtcccacc 5700
agtggtacac tgtgcttgat ttaaaggatg cctttttctg cctgagactc caccccacca 5760
gtcagcctct cttcgccttt gagtggagag atccagagat gggaatctca ggacaattga 5820
cctggaccag actcccacag ggtttcaaaa acagtcccac cctgtttaat gaggcactgc 5880
acagagacct agcagacttc cggatccagc acccagactt gatcctgcta cagtacgtgg 5940
atgacttact gctggccgcc acttctgagc tagactgcca acaaggtact cgggccctgt 6000
tacaaaccct agggaacctc gggtatcggg cctcggccaa gaaagcccaa atttgccaga 6060
aacaggtcaa gtatctgggg tatcttctaa aagagggtca gagatggctg actgaggcca 6120
gaaaagagac tgtgatgggg cagcctactc cgaagacccc tcgacaacta agggagttcc 6180
tagggaaggc aggcttctgt cgcctcttca tccctgggtt tgcagaaatg gcagcccccc 6240
tgtaccctct caccaaaccg gggactctgt ttaattgggg cccagaccaa caaaaggcct 6300
atcaagaaat caagcaagct cttctaactg ccccagccct ggggttgcca gatttgacta 6360
agccctttga actctttgtc gacgagaagc agggctacgc caaaggtgtc ctaacgcaaa 6420
aactgggacc ttggcgtcgg ccggtggcct acctgtccaa aaagctagac ccagtagcag 6480
ctgggtggcc cccttgccta cggatggtag cagccattgc cgtactgaca aaggatgcag 6540
gcaagctaac catgggacag ccactagtca ttctggcccc ccatgcagta gaggcactag 6600
tcaaacaacc ccccgaccgc tggctttcca acgcccggat gactcactat caggccttgc 6660
ttttggacac ggaccgggtc cagttcggac cggtggtagc cctgaacccg gctacgctgc 6720
tcccactgcc tgaggaaggg ctgcaacaca actgccttga tgggacaggt ggcggtggtg 6780
tcaccgtcaa gttcaagtac aagggtgagg aacttgaagt tgatattagc aaaatcaaga 6840
aggtttggcg cgttggtaaa atgatatctt ttacttatga cgacaacggc aagacaggta 6900
gaggggcagt gtctgagaaa gacgccccca aggagctgtt gcaaatgttg gaaaagtctg 6960
ggaaaaagtc tggcggctca aaaagaaccg ccgacggcag cgaattcgag cccaagaaga 7020
agaggaaagt cggaggtggc gggagcccaa aaaagaaaag aaaagtgtat ccctatgatg 7080
tccccgatta tgccggttca agagccctgg tcgtgattag actgagccga gtgacagacg 7140
ccaccacaag tcccgagaga cagctggaat catgccagca gctctgtgct cagcggggtt 7200
gggatgtggt cggcgtggca gaggatctgg acgtgagcgg ggccgtcgat ccattcgaca 7260
gaaagaggag gcccaacctg gcaagatggc tcgctttcga ggaacagccc tttgatgtga 7320
tcgtcgccta cagagtggac cggctgaccc gctcaattcg acatctccag cagctggtgc 7380
attgggctga ggaccacaag aaactggtgg tcagcgcaac agaagcccac ttcgatacta 7440
ccacaccttt tgccgctgtg gtcatcgcac tgatgggcac tgtggcccag atggagctcg 7500
aagctatcaa ggagcgaaac aggagcgcag cccatttcaa tattagggcc ggtaaataca 7560
gaggctccct gcccccttgg ggatatctcc ctaccagggt ggatggggag tggagactgg 7620
tgccagaccc cgtccagaga gagcggattc tggaagtgta ccacagagtg gtcgataacc 7680
acgaaccact ccatctggtg gcacacgacc tgaatagacg cggcgtgctc tctccaaagg 7740
attattttgc tcagctgcag ggaagagagc cacagggaag agaatggagt gctactgcac 7800
tgaagagatc tatgatcagt gaggctatgc tgggttacgc aacactcaat ggcaaaactg 7860
tccgggacga tgacggagcc cctctggtga gggctgagcc tattctcacc agagagcagc 7920
tcgaagctct gcgggcagaa ctggtcaaga ctagtcgcgc caaacctgcc gtgagcaccc 7980
caagcctgct cctgagggtg ctgttctgcg ccgtctgtgg agagccagca tacaagtttg 8040
ccggcggagg gcgcaaacat ccccgctatc gatgcaggag catggggttc cctaagcact 8100
gtggaaacgg gacagtggcc atggctgagt gggacgcctt ttgcgaggaa caggtgctgg 8160
atctcctggg tgacgctgag cggctggaaa aagtgtgggt ggcaggatct gactccgctg 8220
tggagctggc agaagtcaat gccgagctcg tggatctgac ttccctcatc ggatctcctg 8280
catatagagc tgggtcccca cagagagaag ctctggacgc acgaattgct gcactcgctg 8340
ctagacagga ggaactggag ggcctggagg ccaggccctc tggatgggag tggcgagaaa 8400
ccggacagag gtttggggat tggtggaggg agcaggacac cgcagccaag aacacatggc 8460
tgagatccat gaatgtccgg ctcacattcg acgtgcgcgg tggcctgact cgaaccatcg 8520
attttggcga cctgcaggag tatgaacagc acctgagact ggggtccgtg gtcgaaagac 8580
tgcacactgg gatgtcctag gtttaaaccc gctgatcagc ctcgactgtg ccttctagtt 8640
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 8700
ccactgtcct ttcctaataa aatgagaaaa ttgcatcgca ttgtctgagt aggtgtcatt 8760
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 8820
ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc agctggggct 8880
cgataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt 8940
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 9000
cctagggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 9060
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 9120
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 9180
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 9240
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 9300
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 9360
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 9420
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 9480
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 9540
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 9600
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 9660
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 9720
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 9780
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 9840
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 9900
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 9960
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 10020
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 10080
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 10140
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 10200
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 10260
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 10320
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 10380
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 10440
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 10500
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 10560
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 10620
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 10680
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 10740
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 10800
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 10860
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 10920
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 10980
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 11040
ttccgcgcac atttcc 11056
<210> 385
<211> 2367
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 385
tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 60
ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 120
taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 180
tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 240
aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtcgct agctgtacaa 300
aaaagcaggc tttaaaggaa ccaattcagt cgactggatc cggtaccaag gtcgggcagg 360
aagagggcct atttcccatg attccttcat atttgcatat acgatacaag gctgttagag 420
agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat acgtgacgta 480
gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa atggactatc 540
atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc ttgtggaaag 600
gacgaaacac cgctattctc gcagctcacc agttttagag ctagaaatag caagttaaaa 660
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgac gagcgcggcg 720
atatcatcat ccatggccgg atgatcctga cgacggagac cgccgtcgtc gacaagccgg 780
cctgagctgc gagaattttt ttaagcttgg gccgctcgag gtacctctct acatatgaca 840
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 900
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 960
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 1020
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 1080
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 1140
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 1200
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 1260
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 1320
actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 1380
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 1440
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 1500
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 1560
tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 1620
caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 1680
cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 1740
agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 1800
atccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 1860
gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 1920
ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 1980
tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 2040
ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 2100
tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 2160
attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 2220
agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 2280
ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 2340
ggcgaaaact ctcaaggatc ttaccgc 2367
<210> 386
<211> 2280
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 386
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 60
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 120
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 180
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 240
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 300
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 360
accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 420
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 480
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 540
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 600
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 660
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 720
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtcgcta gctgtacaaa 780
aaagcaggct ttaaaggaac caattcagtc gactggatcc ggtaccaagg tcgggcagga 840
agagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 900
gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 960
aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 1020
tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 1080
acgaaacacc gaagccggcc ttgcacatgc gttttagagc tagaaatagc aagttaaaat 1140
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgttt ttttaagctt 1200
gggccgctcg aggtacctct ctacatatga catgtgagca aaaggccagc aaaaggccag 1260
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 1320
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 1380
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 1440
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 1500
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 1560
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 1620
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 1680
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 1740
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 1800
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 1860
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 1920
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 1980
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 2040
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 2100
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 2160
atctggcccc agtgctgcaa tgataccgcg agatccacgc tcaccggctc cagatttatc 2220
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 2280
<210> 387
<211> 6386
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 387
tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt 60
tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
cagctatgac catgaggcgc gccggattcg acattgatta ttgactagtt attaatagta 180
atcaattacg gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac 240
ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac 300
gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt 360
acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat 420
tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga 480
ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg tcgaggtgag 540
ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa ttttgtattt 600
atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc 660
rggsggggsg gggsggggsg rggggsgggg sggggsgagg cggagaggtg cggcggcagc 720
caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc 780
ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc 840
ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt tactcccaca 900
ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg tttaatgacg 960
gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg gccctttgtg 1020
cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg 1080
ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg 1140
cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg ggggctgcga 1200
ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg gtgtgggcgc 1260
gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc acggcccggc 1320
ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg 1380
gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga 1440
ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg 1500
ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga 1560
gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg 1620
cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct 1680
tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg 1740
cagggcgggg ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt 1800
tcatgccttc ttctttttcc tacagatcct taattaataa tacgactcac tatagggggt 1860
cgacccgcca ccatgccaaa aaagaaaaga aaagtgtatc cctatgatgt ccccgattat 1920
gccggttcaa gagccctggt cgtgattaga ctgagccgag tgacagacgc caccacaagt 1980
cccgagagac agctggaatc atgccagcag ctctgtgctc agcggggttg ggatgtggtc 2040
ggcgtggcag aggatctgga cgtgagcggg gccgtcgatc cattcgacag aaagaggagg 2100
cccaacctgg caagatggct cgctttcgag gaacagccct ttgatgtgat cgtcgcctac 2160
agagtggacc ggctgacccg ctcaattcga catctccagc agctggtgca ttgggctgag 2220
gaccacaaga aactggtggt cagcgcaaca gaagcccact tcgatactac cacacctttt 2280
gccgctgtgg tcatcgcact gatgggcact gtggcccaga tggagctcga agctatcaag 2340
gagcgaaaca ggagcgcagc ccatttcaat attagggccg gtaaatacag aggctccctg 2400
cccccttggg gatatctccc taccagggtg gatggggagt ggagactggt gccagacccc 2460
gtccagagag agcggattct ggaagtgtac cacagagtgg tcgataacca cgaaccactc 2520
catctggtgg cacacgacct gaatagacgc ggcgtgctct ctccaaagga ttattttgct 2580
cagctgcagg gaagagagcc acagggaaga gaatggagtg ctactgcact gaagagatct 2640
atgatcagtg aggctatgct gggttacgca acactcaatg gcaaaactgt ccgggacgat 2700
gacggagccc ctctggtgag ggctgagcct attctcacca gagagcagct cgaagctctg 2760
cgggcagaac tggtcaagac tagtcgcgcc aaacctgccg tgagcacccc aagcctgctc 2820
ctgagggtgc tgttctgcgc cgtctgtgga gagccagcat acaagtttgc cggcggaggg 2880
cgcaaacatc cccgctatcg atgcaggagc atggggttcc ctaagcactg tggaaacggg 2940
acagtggcca tggctgagtg ggacgccttt tgcgaggaac aggtgctgga tctcctgggt 3000
gacgctgagc ggctggaaaa agtgtgggtg gcaggatctg actccgctgt ggagctggca 3060
gaagtcaatg ccgagctcgt ggatctgact tccctcatcg gatctcctgc atatagagct 3120
gggtccccac agagagaagc tctggacgca cgaattgctg cactcgctgc tagacaggag 3180
gaactggagg gcctggaggc caggccctct ggatgggagt ggcgagaaac cggacagagg 3240
tttggggatt ggtggaggga gcaggacacc gcagccaaga acacatggct gagatccatg 3300
aatgtccggc tcacattcga cgtgcgcggt ggcctgactc gaaccatcga ttttggcgac 3360
ctgcaggagt atgaacagca cctgagactg gggtccgtgg tcgaaagact gcacactggg 3420
atgtcctagg tcagagctcg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 3480
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 3540
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 3600
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 3660
gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc gagatccact 3720
agttctagcc tcgaggctag agcggccgcc actggccgtc gttttacaac gtcgtgactg 3780
ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 3840
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 3900
cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 3960
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 4020
tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 4080
ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 4140
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 4200
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 4260
tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 4320
aaaatttaac gcgaatttta acaaaatatt aacgcttacr mktymsrtks smcwttymgg 4380
sgaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 4440
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 4500
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 4560
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 4620
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 4680
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 4740
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 4800
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 4860
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 4920
ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 4980
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 5040
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 5100
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 5160
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 5220
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 5280
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 5340
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 5400
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 5460
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 5520
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 5580
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 5640
ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttaggccac 5700
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 5760
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 5820
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 5880
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 5940
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 6000
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 6060
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 6120
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 6180
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 6240
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 6300
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 6360
aggtttcccg actggaaagc gggcag 6386
<210> 388
<211> 6317
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 388
gattcgacat tgattattga ctagttatta atagtaatca attacggggt cattagttca 60
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 120
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 180
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 240
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 300
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 360
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 420
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 480
agcgatgggg gcgggggggg ggggggggcg cgcgccrggs ggggsggggs ggggsgrggg 540
gsggggsggg gsgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 600
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 660
ggcgggagtc gctgcgcgct gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg 720
cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg acggcccttc 780
tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc tgtggctgcg 840
tgaaagcctt gaggggctcc gggagggccc tttgtgcggg gggagcggct cggggggtgc 900
gtgcgtgtgt gtgtgcgtgg ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga 960
gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc 1020
cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg 1080
tgtgtgcgtg ggggggtgag cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct 1140
gcacccccct ccccgagttg ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg 1200
gcgtggcgcg gggctcgccg tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg 1260
ggcggggccg cctcgggccg gggagggctc gggggagggg cgcggcggcc cccggagcgc 1320
cggcggctgt cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat cgtgcgagag 1380
ggcgcaggga cttcctttgt cccaaatctg tgcggagccg aaatctggga ggcgccgccg 1440
caccccctct agcgggcgcg gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg 1500
ggagggcctt cgtgcgtcgc cgcgccgccg tccccttctc cctctccagc ctcggggctg 1560
tccgcggggg gacggctgcc ttcggggggg acggggcagg gcggggttcg gcttctggcg 1620
tgtgaccggc ggctctagag cctctgctaa ccatgttcat gccttcttct ttttcctaca 1680
gatccttaat taataatacg actcactata gggggtcgac ccgccaccat gacagcgcca 1740
aagaaaaaga ggaaggtcat gaccaagaaa gtggccatct atactagagt gagcacaacg 1800
aatcaggccg aggaggggtt ctctattgac gagcaaatcg atcgtctgac caagtacgcg 1860
gaagcaatgg gctggcaagt cagcgacact tacaccgatg ctgggttctc cggcgccaaa 1920
ctggaaaggc ctgccatgca gcggctgatt aacgacattg agaacaaggc ctttgataca 1980
gtgctcgtat acaagctcga caggctcagc cgatctgtgc gggacacgct ttacctcgta 2040
aaggatgttt tcactaagaa taaaatcgac ttcattagcc tgaacgaatc cattgacacc 2100
agctcagcta tgggctctct gttcctgacc atcctgagcg ctatcaatga gtttgagagg 2160
gagaatataa aggagcgcat gacaatggga aagctgggta gagcgaagtc cgggaaatct 2220
atgatgtgga ccaagaccgc ttttggatac taccacaata ggaagacggg cattctggag 2280
atcgtgccct tgcaggcaac catcgttgag cagatcttca ccgactacct gagcggaata 2340
tctctcacga agttgcgaga taagctgaat gagagcggac acattggcaa ggatattcct 2400
tggtcatata gaaccctccg ccaaactctg gataatccgg tgtactgcgg ttacatcaag 2460
ttcaaagaca gcctcttcga gggaatgcat aaacctatca ttccatacga gacatacctg 2520
aaagtccaaa aggaactcga agagcgccag caacagactt acgaacggaa taataatccc 2580
aggcctttcc aggccaaata tatgctgtcc ggcatggcaa gatgcggata ctgcggggca 2640
ccactcaaga ttgtgcttgg ccataaacgg aaggatggaa gcagaaccat gaaatatcac 2700
tgcgcaaacc gctttccaag gaaaacgaag gggattaccg tgtacaatga caacaaaaaa 2760
tgtgatagcg gaacctacga tctgtccaac ttggaaaaca ccgtcattga caatttaatt 2820
ggatttcagg aaaataatga cagccttctg aagattatca acgggaacaa tcagccgatt 2880
ctggacactt catctttcaa aaaacagatc tctcagattg ataagaaaat tcagaaaaat 2940
tccgatttat acctcaatga tttcataacg atggatgagc tgaaggaccg gaccgacagt 3000
ttgcaggccg agaagaaact gctgaaagca aagatctccg agaacaagtt caatgacagt 3060
accgatgtct tcgagttggt gaagacccag ctgggtagta tcccaatcaa cgagttgagc 3120
tatgacaata agaagaagat tgttaataac ctggtgagca aagtggacgt gaccgctgat 3180
aacgtggata ttatcttcaa gttccagctg gcctgagtca gagctcgctg atcagcctcg 3240
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3300
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3360
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3420
tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 3480
agaaccagct ggggctcgag atccactagt tctagcctcg aggctagagc ggccgccact 3540
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 3600
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 3660
ttcccaacag ttgcgcagcc tgaatggcga atgggacgcg ccctgtagcg gcgcattaag 3720
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 3780
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 3840
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 3900
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 3960
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 4020
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 4080
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 4140
gcttacrmkt ymsrtkssmc wttymggsga aatgtgcgcg gaacccctat ttgtttattt 4200
ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 4260
taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt 4320
tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat 4380
gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag 4440
atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg 4500
ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata 4560
cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat 4620
ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc 4680
aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg 4740
ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac 4800
gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact 4860
ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa 4920
gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 4980
ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc 5040
tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 5100
cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac 5160
tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag 5220
atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 5280
tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 5340
tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 5400
ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt 5460
cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 5520
ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 5580
gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 5640
tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 5700
gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 5760
ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 5820
tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 5880
ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 5940
tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 6000
attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag 6060
tcagtgagcg aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg 6120
ccgattcatt aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc 6180
aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt 6240
ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat 6300
gaccatgagg cgcgccg 6317
<210> 389
<211> 6638
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 389
gattcgacat tgattattga ctagttatta atagtaatca attacggggt cattagttca 60
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 120
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 180
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 240
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 300
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 360
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 420
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 480
agcgatgggg gcgggggggg ggggggggcg cgcgccrggs ggggsggggs ggggsgrggg 540
gsggggsggg gsgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 600
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 660
ggcgggagtc gctgcgcgct gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg 720
cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg acggcccttc 780
tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc tgtggctgcg 840
tgaaagcctt gaggggctcc gggagggccc tttgtgcggg gggagcggct cggggggtgc 900
gtgcgtgtgt gtgtgcgtgg ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga 960
gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc 1020
cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg 1080
tgtgtgcgtg ggggggtgag cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct 1140
gcacccccct ccccgagttg ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg 1200
gcgtggcgcg gggctcgccg tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg 1260
ggcggggccg cctcgggccg gggagggctc gggggagggg cgcggcggcc cccggagcgc 1320
cggcggctgt cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat cgtgcgagag 1380
ggcgcaggga cttcctttgt cccaaatctg tgcggagccg aaatctggga ggcgccgccg 1440
caccccctct agcgggcgcg gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg 1500
ggagggcctt cgtgcgtcgc cgcgccgccg tccccttctc cctctccagc ctcggggctg 1560
tccgcggggg gacggctgcc ttcggggggg acggggcagg gcggggttcg gcttctggcg 1620
tgtgaccggc ggctctagag cctctgctaa ccatgttcat gccttcttct ttttcctaca 1680
gatccttaat taataatacg actcactata gggggtcgac ccgccaccat gcccaagaag 1740
aaacggaaag tgatgagccc ctttatcgcc ccggacgtgc ccgagcacct cctggacact 1800
gtgcgcgtct ttctgtacgc ccgtcagagt aaaggacggt cagatggatc tgacgtgtcc 1860
accgaagcac agctcgctgc cggacgggcc cttgttgcct caagaaacgc acaaggggga 1920
gctagatggg tggtggcggg cgaattcgtg gatgtgggca gatcagggtg ggacccgaat 1980
gtgacacgcg ccgacttcga aagaatgatg ggcgaggtgc gcgccggtga gggagacgta 2040
gtggtggtta atgaactgag tcgccttacg aggaagggcg cccacgacgc tctggagatc 2100
gataacgaac tcaaaaaaca cggtgtgcgg ttcatgagcg tgctggaacc attcctggat 2160
accagcaccc caatcggtgt cgcgatcttt gccctgattg ccgcgctcgc taaacaggat 2220
tcagacctta aagctgagcg gctgaagggg gctaaagatg agatcgctgc cttggggggt 2280
gtgcacagct catctgcgcc attcggcatg agggcggtca gaaagaaagt ggataacctg 2340
gtcatatctg ttctggagcc tgatgaggac aacccggacc acgttgagct tgtggaacgg 2400
atggctaaga tgtctttcga aggcgtcagc gataacgcaa ttgccacaac atttgagaag 2460
gagaaaatcc cctctccggg gatggctgag agacgagcca cggagaagag gcttgcttct 2520
attaaggcac ggaggctcaa tggcgccgaa aagccgatca tgtggcgggc gcagacagtt 2580
agatggattc ttaaccatcc cgcgattggt ggattcgcat tcgagcgggt gaaacacgga 2640
aaagcccaca tcaacgtgat acgaagagat cccggcggca aaccccttac ccctcacact 2700
ggtatcctgt ctggatccaa gtggttggaa ctccaggaga agagaagcgg gaaaaatctc 2760
tccgaccgca aaccaggtgc cgaagtggaa cctacgctgc tttccgggtg gagatttctg 2820
ggatgtcgga tatgcggtgg gtcaatgggc cagtcccaag ggggccgtaa gaggaatggg 2880
gacttggctg agggcaatta catgtgtgca aacccaaagg ggcacggcgg tctgagcgtc 2940
aagaggtctg agcttgatga attcgtggca tcaaaagtct gggccaggtt gcgcacggct 3000
gacatggagg atgaacatga ccaagcatgg attgcagctg cagctgaacg gtttgctttg 3060
cagcacgacc tggcgggggt agctgacgag cgacgggagc aacaagctca cctggataac 3120
gttcggagat caataaaaga tctccaggcg gataggaagg caggtctcta cgtgggacgc 3180
gaagaactgg agacctggcg cagtaccgtc ctgcaatata ggagctacga ggctgagtgt 3240
actactaggt tggctgagct ggatgaaaaa atgaatggat ccacccgggt gccttcagaa 3300
tggtttagcg gcgaggaccc aaccgcggaa ggaggcatat gggcgagctg ggatgtctat 3360
gagcgccggg agtttctcag cttttttttg gactccgtaa tggttgacag gggcagacat 3420
cctgaaacca agaaatatat accattgaaa gaccgggtga ccttaaagtg ggcggagctg 3480
ttaaaggaag aggatgaagc aagcgaggcc acagaacggg agctggcagc tctttaggtc 3540
agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 3600
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 3660
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 3720
caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 3780
tctatggctt ctgaggcgga aagaaccagc tggggctcga gatccactag ttctagcctc 3840
gaggctagag cggccgccac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 3900
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 3960
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc 4020
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 4080
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 4140
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 4200
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 4260
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 4320
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 4380
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 4440
gaattttaac aaaatattaa cgcttacrmk tymsrtkssm cwttymggsg aaatgtgcgc 4500
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 4560
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 4620
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 4680
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 4740
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 4800
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 4860
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 4920
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 4980
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 5040
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 5100
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 5160
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 5220
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 5280
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 5340
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 5400
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 5460
taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 5520
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 5580
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 5640
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 5700
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 5760
gcgcagatac caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac 5820
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 5880
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 5940
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 6000
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 6060
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 6120
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 6180
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 6240
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 6300
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 6360
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 6420
ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac 6480
tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt agctcactca ttaggcaccc 6540
caggctttac actttatgct tccggctcgt atgttgtgtg gaattgtgag cggataacaa 6600
tttcacacag gaaacagcta tgaccatgag gcgcgccg 6638
<210> 390
<211> 9530
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 390
taatcagcat catgatgtgg taccacatca tgatgctgat tataagaatg cggccgccac 60
actctagtgg atctcgagtt aataattcag aagaactcgt caagaaggcg atagaaggcg 120
atgcgctgcg aatcgggagc ggcgataccg taaagcacga ggaagcggtc agcccattcg 180
ccgccaagct cttcagcaat atcacgggta gccaacgcta tgtcctgata gcggtccgcc 240
acacccagcc ggccacagtc gatgaatcca gaaaagcggc cattttccac catgatattc 300
ggcaagcagg catcgccatg ggtcacgacg agatcctcgc cgtcgggcat gctcgccttg 360
agcctggcga acagttcggc tggcgcgagc ccctgatgct cttcgtccag atcatcctga 420
tcgacaagac cggcttccat ccgagtacgt gctcgctcga tgcgatgttt cgcttggtgg 480
tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc gcattgcatc agccatgatg 540
gatactttct cggcaggagc aaggtgtaga tgacatggag atcctgcccc ggcacttcgc 600
ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa 660
cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac 720
cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg 780
cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc 840
aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc 900
ctgtctcttg atcagagctt gatcccctgc gccatcagat ccttggcggc gagaaagcca 960
tccagtttac tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg 1020
gttcgcttgc tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag 1080
ctacctgctt tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat 1140
tcatccgggg tcagcaccgt ttctgcggac tggctttcta cgtgctcgag gggggccaaa 1200
cggtctccag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 1260
atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 1320
cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 1380
gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 1440
aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 1500
atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 1560
gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt 1620
ttgcgtttct acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc 1680
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 1740
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 1800
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 1860
aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 1920
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 1980
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 2040
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 2100
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 2160
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 2220
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 2280
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 2340
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 2400
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 2460
gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 2520
gaagagcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata 2580
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 2640
tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 2700
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 2760
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt 2820
cgcgcgcgaa ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc 2880
tgcaaaccct atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca 2940
acttgacggc tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg 3000
ccccggtgca ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc 3060
gaccgacggt ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac 3120
gttggtcctc gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca 3180
gacgcgacgg cgacaagcaa acatgctgtg cgacgctggc gatacattac cctgttatcc 3240
ctagatgaca ttaccctgtt atcccagatg acattaccct gttatcccta gatgacatta 3300
ccctgttatc cctagatgac atttaccctg ttatccctag atgacattac cctgttatcc 3360
cagatgacat taccctgtta tccctagata cattaccctg ttatcccaga tgacataccc 3420
tgttatccct agatgacatt accctgttat cccagatgac attaccctgt tatccctaga 3480
tacattaccc tgttatccca gatgacatac cctgttatcc ctagatgaca ttaccctgtt 3540
atcccagatg acattaccct gttatcccta gatacattac cctgttatcc cagatgacat 3600
accctgttat ccctagatga cattaccctg ttatcccaga tgacattacc ctgttatccc 3660
tagatacatt accctgttat cccagatgac ataccctgtt atccctagat gacattaccc 3720
tgttatccca gatgacatta ccctgttatc cctagataca ttaccctgtt atcccagatg 3780
acataccctg ttatccctag atgacattac cctgttatcc cagatgacat taccctgtta 3840
tccctagata cattaccctg ttatcccaga tgacataccc tgttatccct agatgacatt 3900
accctgttat cccagataaa ctcaatgatg atgatgatga tggtcgagac tcagcggccg 3960
cggtgccagg gcgtgccctt gggctccccg ggcgcgacta taagctgcga gcaacttcac 4020
ttgggtatgc cggcggtagc gctgagggcc tatttcccat gattccttca tatttgcata 4080
tacgatacaa ggctgttaga gagataattg gaattaattt gactgtaaac acaaagatat 4140
tagtacaaaa tacgtgacgt agaaagtaat aatttcttgg gtagtttgca gttttaaaat 4200
tatgttttaa aatggactat catatgctta ccgtaacttg aaagtatttc gatttcttgg 4260
ctttatatat cttgtggaaa ggacgaaaca ccgggtcttc gagaagacct gttttagagc 4320
tagaaatcgt ggttcgcacc gactcggtgc cacagcaagt taaaataagg ctagtccgtt 4380
atcaacttga aaaagtggca ccgagtcggt gcttttttga attcgctagc taggtcttga 4440
aaggagtggg aattggctcc ggtgcccgtc agtgggcaga gcgcacatcg cccacagtcc 4500
ccgagaagtt ggggggaggg gtcggcaatt gatccggtgc ctagagaagg tggcgcgggg 4560
taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt gggggagaac 4620
cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt gccgccagaa 4680
cacaggaccg gttctagagc gctgccacca tggacaagaa gtacagcatc ggcctggaca 4740
tcggcaccaa ctctgtgggc tgggccgtga tcaccgacga gtacaaggtg cccagcaaga 4800
aattcaaggt gctgggcaac accgaccggc acagcatcaa gaagaacctg atcggagccc 4860
tgctgttcga cagcggcgaa acagccgagg ccacccggct gaagagaacc gccagaagaa 4920
gatacaccag acggaagaac cggatctgct atctgcaaga gatcttcagc aacgagatgg 4980
ccaaggtgga cgacagcttc ttccacagac tggaagagtc cttcctggtg gaagaggata 5040
agaagcacga gcggcacccc atcttcggca acatcgtgga cgaggtggcc taccacgaga 5100
agtaccccac catctaccac ctgagaaaga aactggtgga cagcaccgac aaggccgacc 5160
tgcggctgat ctatctggcc ctggcccaca tgatcaagtt ccggggccac ttcctgatcg 5220
agggcgacct gaaccccgac aacagcgacg tggacaagct gttcatccag ctggtgcaga 5280
cctacaacca gctgttcgag gaaaacccca tcaacgccag cggcgtggac gccaaggcca 5340
tcctgtctgc cagactgagc aagagcagac ggctggaaaa tctgatcgcc cagctgcccg 5400
gcgagaagaa gaatggcctg ttcggaaacc tgattgccct gagcctgggc ctgaccccca 5460
acttcaagag caacttcgac ctggccgagg atgccaaact gcagctgagc aaggacacct 5520
acgacgacga cctggacaac ctgctggccc agatcggcga ccagtacgcc gacctgtttc 5580
tggccgccaa gaacctgtcc gacgccatcc tgctgagcga catcctgaga gtgaacaccg 5640
agatcaccaa ggcccccctg agcgcctcta tgatcaagag atacgacgag caccaccagg 5700
acctgaccct gctgaaagct ctcgtgcggc agcagctgcc tgagaagtac aaagagattt 5760
tcttcgacca gagcaagaac ggctacgccg gctacattga cggcggagcc agccaggaag 5820
agttctacaa gttcatcaag cccatcctgg aaaagatgga cggcaccgag gaactgctcg 5880
tgaagctgaa cagagaggac ctgctgcgga agcagcggac cttcgacaac ggcagcatcc 5940
cccaccagat ccacctggga gagctgcacg ccattctgcg gcggcaggaa gatttttacc 6000
cattcctgaa ggacaaccgg gaaaagatcg agaagatcct gaccttccgc atcccctact 6060
acgtgggccc tctggccagg ggaaacagca gattcgcctg gatgaccaga aagagcgagg 6120
aaaccatcac cccctggaac ttcgaggaag tggtggacaa gggcgcttcc gcccagagct 6180
tcatcgagcg gatgaccaac ttcgataaga acctgcccaa cgagaaggtg ctgcccaagc 6240
acagcctgct gtacgagtac ttcaccgtgt ataacgagct gaccaaagtg aaatacgtga 6300
ccgagggaat gagaaagccc gccttcctga gcggcgagca gaaaaaggcc atcgtggacc 6360
tgctgttcaa gaccaaccgg aaagtgaccg tgaagcagct gaaagaggac tacttcaaga 6420
aaatcgagtg cttcgactcc gtggaaatct ccggcgtgga agatcggttc aacgcctccc 6480
tgggcacata ccacgatctg ctgaaaatta tcaaggacaa ggacttcctg gacaatgagg 6540
aaaacgagga cattctggaa gatatcgtgc tgaccctgac actgtttgag gacagagaga 6600
tgatcgagga acggctgaaa acctatgccc acctgttcga cgacaaagtg atgaagcagc 6660
tgaagcggcg gagatacacc ggctggggca ggctgagccg gaagctgatc aacggcatcc 6720
gggacaagca gtccggcaag acaatcctgg atttcctgaa gtccgacggc ttcgccaaca 6780
gaaacttcat gcagctgatc cacgacgaca gcctgacctt taaagaggac atccagaaag 6840
cccaggtgtc cggccagggc gatagcctgc acgagcacat tgccaatctg gccggcagcc 6900
ccgccattaa gaagggcatc ctgcagacag tgaaggtggt ggacgagctc gtgaaagtga 6960
tgggccggca caagcccgag aacatcgtga tcgaaatggc cagagagaac cagaccaccc 7020
agaagggaca gaagaacagc cgcgagagaa tgaagcggat cgaagagggc atcaaagagc 7080
tgggcagcca gatcctgaaa gaacaccccg tggaaaacac ccagctgcag aacgagaagc 7140
tgtacctgta ctacctgcag aatgggcggg atatgtacgt ggaccaggaa ctggacatca 7200
accggctgtc cgactacgat gtggaccata tcgtgcctca gagctttctg aaggacgact 7260
ccatcgacaa caaggtgctg accagaagcg acaagaaccg gggcaagagc gacaacgtgc 7320
cctccgaaga ggtcgtgaag aagatgaaga actactggcg gcagctgctg aacgccaagc 7380
tgattaccca gagaaagttc gacaatctga ccaaggccga gagaggcggc ctgagcgaac 7440
tggataaggc cggcttcatc aagagacagc tggtggaaac ccggcagatc acaaagcacg 7500
tggcacagat cctggactcc cggatgaaca ctaagtacga cgagaatgac aagctgatcc 7560
gggaagtgaa agtgatcacc ctgaagtcca agctggtgtc cgatttccgg aaggatttcc 7620
agttttacaa agtgcgcgag atcaacaact accaccacgc ccacgacgcc tacctgaacg 7680
ccgtcgtggg aaccgccctg atcaaaaagt accctaagct ggaaagcgag ttcgtgtacg 7740
gcgactacaa ggtgtacgac gtgcggaaga tgatcgccaa gagcgagcag gaaatcggca 7800
aggctaccgc caagtacttc ttctacagca acatcatgaa ctttttcaag accgagatta 7860
ccctggccaa cggcgagatc cggaagcggc ctctgatcga gacaaacggc gaaaccgggg 7920
agatcgtgtg ggataagggc cgggattttg ccaccgtgcg gaaagtgctg agcatgcccc 7980
aagtgaatat cgtgaaaaag accgaggtgc agacaggcgg cttcagcaaa gagtctatcc 8040
tgcccaagag gaacagcgat aagctgatcg ccagaaagaa ggactgggac cctaagaagt 8100
acggcggctt cgacagcccc accgtggcct attctgtgct ggtggtggcc aaagtggaaa 8160
agggcaagtc caagaaactg aagagtgtga aagagctgct ggggatcacc atcatggaaa 8220
gaagcagctt cgagaagaat cccatcgact ttctggaagc caagggctac aaagaagtga 8280
aaaaggacct gatcatcaag ctgcctaagt actccctgtt cgagctggaa aacggccgga 8340
agagaatgct ggcctctgcc ggcgaactgc agaagggaaa cgaactggcc ctgccctcca 8400
aatatgtgaa cttcctgtac ctggccagcc actatgagaa gctgaagggc tcccccgagg 8460
ataatgagca gaaacagctg tttgtggaac agcacaagca ctacctggac gagatcatcg 8520
agcagatcag cgagttctcc aagagagtga tcctggccga cgctaatctg gacaaagtgc 8580
tgtccgccta caacaagcac cgggataagc ccatcagaga gcaggccgag aatatcatcc 8640
acctgtttac cctgaccaat ctgggagccc ctgccgcctt caagtacttt gacaccacca 8700
tcgaccggaa gaggtacacc agcaccaaag aggtgctgga cgccaccctg atccaccaga 8760
gcatcaccgg cctgtacgag acacggatcg acctgtctca gctgggaggc gacaagcgac 8820
ctgccgccac aaagaaggct ggacaggcta agaagaagaa agattacaaa gacgatgacg 8880
ataagtaact agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 8940
tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 9000
ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 9060
tggggtgggg caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga 9120
ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg 9180
ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg 9240
aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc 9300
aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca 9360
ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc 9420
ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa 9480
gcttgggccc gccccaactg gggtaacctt tgagttctct cagttggggg 9530
<210> 391
<211> 5722
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 391
tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60
cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120
aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180
gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240
tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300
tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360
ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420
aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480
gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600
gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660
gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720
tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780
gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840
atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900
tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960
gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020
actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080
gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140
agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200
ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260
aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320
cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380
gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440
cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500
cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560
gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680
tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740
catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860
ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920
gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980
cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040
cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100
tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160
catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220
taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280
aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340
tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400
catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460
atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520
taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580
agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640
tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700
acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760
tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820
accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880
gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940
gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000
actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060
tgggctcccc gggcgcggtc ctttgggcgc taactgcgtg cgcgctggga attggcgcta 3120
attgcgcgtg cgcgctggga ctcaaggcgc taactgcgcg tgcgttctgg ggcccggggt 3180
gccgcggcct gggctggggc gaaggcgggc tcggccggaa ggggtggggt cgccgcggct 3240
cccgggcgct tgcgcgcact tcctgcccga gccgctggcc gcccgagggt gtggccgctg 3300
cgtgcgcgcg cgccgacccg gcgctgtttg aaccgggcgg aggcggggct ggcgcccggt 3360
tgggaggggg ttggggcctg gcttcctgcc gcgcgccgcg gggacgcctc cgaccagtgt 3420
ttgcctttta tggtaataac gcggccggcc cggcttcctt tgtccccaat ctgggcgcgc 3480
gccggcgccc cctggcggcc taaggactcg gcgcgccgga agtggccagg gcgggggcga 3540
cctcggctca cagcgcgccc ggctattctc gcagctcgcc accatgcccg ccatgaagat 3600
cgagtgccgc atcaccggca ccctgaacgg cgtggagttc gagctggtgg gcggcggaga 3660
gggcaccccc gagcagggcc gcatgaccaa caagatgaag agcaccaaag gcgccctgac 3720
cttcagcccc tacctgctga gccacgtgat gggctacggc ttctaccact tcggcaccta 3780
ccccagcggc tacgagaacc ccttcctgca cgccatcaac aacggcggct acaccaacac 3840
ccgcatcgag aagtacgagg acggcggcgt gctgcacgtg agcttcagct accgctacga 3900
ggccggccgc gtgatcggcg acttcaaggt ggtgggcacc ggcttccccg aggacagcgt 3960
gatcttcacc gacaagatca tccgcagcaa cgccaccgtg gagcacctgc accccatggg 4020
cgataacgtg ctggtgggca gcttcgcccg caccttcagc ctgcgcgacg gcggctacta 4080
cagcttcgtg gtggacagcc acatgcactt caagagcgcc atccacccca gcatcctgca 4140
gaacgggggc cccatgttcg ccttccgccg cgtggaggag ctgcacagca acaccgagct 4200
gggcatcgtg gagtaccagc acgccttcaa gacccccatc gccttcgcca gatctcgagc 4260
tcgaaccatg gatgatgata tcgccgcgct cgtcgtcgac aacggctccg gcatgtgcaa 4320
ggccggcttc gcgggcgacg atgccccccg ggccgtcttc ccctccatcg tggggcgccc 4380
caggcaccag gtaggggagc tggctgggtg gggcagcccc gggagcgggc gggaggcaag 4440
ggcgctttct ctgcacagga gcctcccggt ttccggggtg ggggctgcgc ccgtgctcag 4500
ggcttcttgt cctttccttc ccagggcgtg atggtgggca tgggtcagaa ggattcctat 4560
gtgggcgacg aggcccagag caagagaggc atcctcaccc tgaagtaccc catcgagcac 4620
ggcatcgtca ccaactggga cgacatggag aaaatctggc accacacctt ctacaatgag 4680
ctgcgtgtgg ctcccgagga gcaccccgtg ctgctgaccg aggcccccct gaaccccaag 4740
gccaaccgcg agaagatgac ccagccccaa ctggggtaac ctttgagttc tctcagttgg 4800
gggtaatcag catcatgatg tggtaccaca tcatgatgct gattataaga atgcggccgc 4860
cacactctag tggatctcga gttaataatt cagaagaact cgtcaagaag gcgatagaag 4920
gcgatgcgct gcgaatcggg agcggcgata ccgtaaagca cgaggaagcg gtcagcccat 4980
tcgccgccaa gctcttcagc aatatcacgg gtagccaacg ctatgtcctg atagcggtcc 5040
gccacaccca gccggccaca gtcgatgaat ccagaaaagc ggccattttc caccatgata 5100
ttcggcaagc aggcatcgcc atgggtcacg acgagatcct cgccgtcggg catgctcgcc 5160
ttgagcctgg cgaacagttc ggctggcgcg agcccctgat gctcttcgtc cagatcatcc 5220
tgatcgacaa gaccggcttc catccgagta cgtgctcgct cgatgcgatg tttcgcttgg 5280
tggtcgaatg ggcaggtagc cggatcaagc gtatgcagcc gccgcattgc atcagccatg 5340
atggatactt tctcggcagg agcaaggtgt agatgacatg gagatcctgc cccggcactt 5400
cgcccaatag cagccagtcc cttcccgctt cagtgacaac gtcgagcaca gctgcgcaag 5460
gaacgcccgt cgtggccagc cacgatagcc gcgctgcctc gtcttgcagt tcattcaggg 5520
caccggacag gtcggtcttg acaaaaagaa ccgggcgccc ctgcgctgac agccggaaca 5580
cggcggcatc agagcagccg attgtctgtt gtgcccagtc atagccgaat agcctctcca 5640
cccaagcggc cggagaacct gcgtgcaatc catcttgttc aatcatgcga aacgatcctc 5700
atcctgtctc ttgatcagag ct 5722
<210> 392
<211> 15424
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 392
tcgacggtat cgataagctt gatatcgaat tcctgcagcc cgggggatcc actagttcta 60
gagcggccgc caccgcggtg gagctccagc ttttgttccc tttagtgagg gttaatttcg 120
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 180
ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 240
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 300
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 360
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 420
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 480
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 540
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 600
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 660
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 720
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 780
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 840
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 900
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 960
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 1020
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 1080
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 1140
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 1200
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 1260
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 1320
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 1380
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 1440
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 1500
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 1560
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 1620
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 1680
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 1740
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 1800
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 1860
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 1920
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 1980
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 2040
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 2100
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 2160
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 2220
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 2280
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 2340
atcacgaggc cctttcgtct tcaagaattc tcatgtttga cagcttatca tcgataagct 2400
ttaatgcggt agtttatcac agttaaattg ctaacgcagt caggcaccgt gtatgaaatc 2460
taacaatgcg ctcatcgtca tcctcggcac cgtcaccctg gatgctgtag gcataggctt 2520
ggttatgccg gtactgccgg gcctcttgcg ggatatcgtc cattccgaca gcatcgccag 2580
tcactatggc gtgctgctag cgctatatgc gttgatgcaa tttctatgcg cacccgttct 2640
cggagcactg tccgaccgct ttggccgccg cccagtcctg ctcgcttcgc tacttggagc 2700
cactatcgac tacgcgatca tggcgaccac acccgtcctg tggatccggc gcacaccaaa 2760
aacgtcactt ttgccacatc cgtcgcttac atgtgttccg ccacacttgc aacatcacac 2820
ttccgccaca ctactacgtc acccgccccg ttcccacgcc ccgcgccacg tcacaaactc 2880
caccccctca ttatcatatt ggcttcaatc caaaataaat catcaataat ataccttatt 2940
ttggattgaa gccaatatga taatgagggg gtggagtttg tgacgtggcg cggggcgtgg 3000
gaacggggcg ggtgacgtag gttttagggc ggagtaactt gtatgtgttg ggaattgtag 3060
ttttcttaaa atgggaagtt acgtaacgtg ggaaaacgga agtgacgatt tgaggaagtt 3120
gtgggttttt tggctttcgt ttctgggcgt aggttcgcgt gcggttttct gggtgttttt 3180
tgtggacttt aaccgttacg tcatttttta gtcctatata tactcgctct gcacttggcc 3240
cttttttaca ctgtgactga ttgagctggt gccgtgtcga gtggtgtttt tttaataggt 3300
tttctttttt actggtaagg ctgactgtta ggctgccgct gtgaagcgct gtatgttgtt 3360
ctggagcggg agggtgctat tttgcctagg caggagggtt tttcaggtgt ttatgtgttt 3420
ttctctccta ttaattttgt tatacctcct atgggggctg taatgttgtc tctacgcctg 3480
cgggtatgta ttcccccggg ctatttcggt cgctttttag cactgaccga tgaatcaacc 3540
tgatgtgttt accgagtctt acattatgac tccggacatg accgaggagc tgtcggtggt 3600
gctttttaat cacggtgacc agttttttta cggtcacgcc ggcatggccg tagtccgtct 3660
tatgcttata agggttgttt ttcctgttgt aagacaggct tctaatgttt aaatgttttt 3720
ttgttatttt attttgtgtt tatgcagaaa cccgcagaca tgtttgagag aaaaatggtg 3780
tctttttctg tggtggttcc ggagcttacc tgcctttatc tgcatgagca tgactacgat 3840
gtgctttctt ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata 3900
tcgccgccca tgcaacaaag cttacatcgg ggctacgctg gttagcatag ctccgagtat 3960
gcgtgtcata atcagtgtgg gttcttttgt caaggttcct ggcggggaag tggccgcgct 4020
ggtccgtgca gacctgcacg attatgttca gctggccctg cgaagggacc tacgggatcg 4080
cggtattttt gttaatgttc cgcttttgaa tcttatacag gtctgtgagg aacctgaatt 4140
tttgcaatca tgattcgctg cttgaggctg aaggtggagg gcgctctgga gcagattttt 4200
acaatggccg gacttaatat tcgggatttg cttagagata tattgagaag gtggcgagat 4260
gagaattatt tgggcatggt tgaaggtgct ggaatgttta tagaggagat tcaccctgaa 4320
gggtttagcc tttacgtcca cttggacgtg agggccgttt gccttttgga agccattgtg 4380
caacatctta caaatgccat tatctgttct ttggctgtag agtttgacca cgccaccgga 4440
ggggagcgcg ttcacttaat agatcttcat tttgaggttt tggataatct tttggaataa 4500
aaaaaaaaac atggttcttc cagctcttcc cgctcctccc gtgtgtgact cgcagaacga 4560
atgtgtaggt tggctgggtg tggcttattc tgcggtggtg gatgttatca gggcagcggc 4620
gcatgaagga gtttacatag aacccgaagc cagggggcgc ctggatgctt tgagagagtg 4680
gatatactac aactactaca cagagcgatc taagcggcga gaccggagac gcagatctgt 4740
ttgtcacgcc cgcacctggt tttgcttcag gaaatatgac tacgtccggc gttccatttg 4800
gcatgacact acgaccaaca cgatctcggt tgtctcggcg cactccgtac agtagggatc 4860
gtctacctcc ttttgagaca gaaacccgcg ctaccatact ggaggatcat ccgctgctgc 4920
ccgaatgtaa cactttgaca atgcacaacg tgagttacgt gcgaggtctt ccctgcagtg 4980
tgggatttac gctgattcag gaatgggttg ttccctggga tatggttcta acgcgggagg 5040
agcttgtaat cctgaggaag tgtatgcacg tgtgcctgtg ttgtgccaac attgatatca 5100
tgacgagcat gatgatccat ggttacgagt cctgggctct ccactgtcat tgttccagtc 5160
ccggttccct gcagtgtata gccggcgggc aggttttggc cagctggttt aggatggtgg 5220
tggatggcgc catgtttaat cagaggttta tatggtaccg ggaggtggtg aattacaaca 5280
tgccaaaaga ggtaatgttt atgtccagcg tgtttatgag gggtcgccac ttaatctacc 5340
tgcgcttgtg gtatgatggc cacgtgggtt ctgtggtccc cgccatgagc tttggataca 5400
gcgccttgca ctgtgggatt ttgaacaata ttgtggtgct gtgctgcagt tactgtgctg 5460
atttaagtga gatcagggtg cgctgctgtg cccggaggac aaggcgcctt atgctgcggg 5520
cggtgcgaat catcgctgag gagaccactg ccatgttgta ttcctgcagg acggagcggc 5580
ggcggcagca gtttattcgc gcgctgctgc agcaccaccg ccctatcctg atgcacgatt 5640
atgactctac ccccatgtag gcgtggactt ctccttcgcc gcccgttaag caaccgcaag 5700
ttggacagca gcctgtggct cagcagctgg acagcgacat gaacttaagt gagctgcccg 5760
gggagtttat taatatcact gatgagcgtt tggctcgaca ggaaaccgtg tggaatataa 5820
cacctaagaa tatgtctgtt acccatgata tgatgctttt taaggccagc cggggagaaa 5880
ggactgtgta ctctgtgtgt tgggagggag gtggcaggtt gaatactagg gttctgtgag 5940
tttgattaag gtacggtgat ctgtataagc tatgtggtgg tggggctata ctactgaatg 6000
aaaaatgact tgaaattttc tgcaattgaa aaataaacac gttgaaacat aacacaaacg 6060
attctttatt cttgggcaat gtatgaaaaa gtgtaagagg atgtggcaaa tatttcatta 6120
atgtagttgt ggccagacca gtcccatgaa aatgacatag agtatgcact tggagttgtg 6180
tctcctgttt cctgtgtacc gtttagtgta atggttagtg ttacaggttt agttttgtct 6240
ccgtttaagt aaacttgact gacaatgtta cttttggcag ttttaccgtg agattttgga 6300
taagctgata ggttaggcat aaatccaaca gcgtttgtat aggctgtgcc ttcagtaaga 6360
tctccatttc taaagttcca atattctggg tccaggaagg aattgtttag tagcactcca 6420
ttttcgtcaa atcttataat aagatgagca ctttgaactg ttccagatat tggagccaaa 6480
ctgcctttaa cagccaaaac tgaaactgta gcaagtattt gactgccaca ttttgttaag 6540
accaaagtga gtttagcatc tttctctgca tttagtctac agttaggaga tggagctggt 6600
gtggtccaca aagttagctt atcattattt ttgtttccta ctgtaatggc acctgtgctg 6660
tcaaaactaa ggccagttcc tagtttagga accatagcct tgtttgaatc aaattctagg 6720
ccatggccaa tttttgtttt gaggggattt gtgtttggtg cattaggtga accaaattca 6780
agcccatctc ctgcattaat ggctatggct gtagcgtcaa acatcaaccc cttggcagtg 6840
cttaggttaa cctcaagctt tttggaattg tttgaagctg taaacaagta aaggcctttg 6900
ttgtagttaa tatccaagtt gtgggctgag tttataaaaa gagggccctg tcctagtctt 6960
agatttagtt ggttttgagc atcaaacgga taactaacat caagtataag gcgtctgttt 7020
tgagaatcaa tccttagtcc tcctgctaca ttaagttgca tattgccttg tgaatcaaaa 7080
cccaaggctc cagtaacttt agtttgcaag gaagtattat taatagtcac acctggacca 7140
gttgctacgg tcaaagtgtt taggtcgtct gttacatgca aaggagcccc gtactttagt 7200
cctagttttc cattttgtgt ataaatgggc tctttcaagt caatgcccaa gctaccagtg 7260
gcagtagtta gagggggtga ggcagtgata gtaagggtac tgctatcggt ggtggtgagg 7320
gggcctgatg tttgcagggc tagctttcct tctgacactg tgaggggtcc ttgggtggca 7380
atgctaagtt tggagtcgtg cacggttagc ggggcctgtg attgcatggt gagtgtgttg 7440
cccgcgacca ttagaggtgc ggcggcagcc acagttaggg cttctgaggt aactgtgagg 7500
ggtgcagata tttccaggtt tatgtttgac ttggtttttt tgagaggtgg gctcacagtg 7560
gttacatttt gggaggtaag gttgccggcc tcgtccagag agaggccgtt gcccattttg 7620
agcgcaagca tgccattgga ggtaactaga ggttcggata ggcgcaaaga gagtacccca 7680
gggggactct cttgaaaccc attgggggat acaaagggag gagtaagaaa aggcacagtt 7740
ggaggaccgg tttccgtgtc atatggatac acggggttga aggtatcttc agacggtctt 7800
gcgcgcttca tctgcaacaa catgaagata gtgggtgcgg atggacagga acaggaggaa 7860
actgacattc catttagatt gtggagaaag tttgcagcca ggaggaagct gcaataccag 7920
agctgggagg agggcaagga ggtgctgctg aataaactgg acagaaattt gctaactgat 7980
tttaagtaag tgatgcttta ttattttttt ttattagtta aagggaataa gatccccggg 8040
tactctagtt aattaactag aggatcttga tgtaatccaa ggttaggaca gttgcaaatc 8100
acagtgagaa cacagggtcc cctgtcccgc tcaactagca gggggcgctg ggtaaactcc 8160
cgaatcaggc tacgggcaag ctctccctgg gcggtaagcc ggacgccgtg cgccgggccc 8220
tcgatatgat cctcgggcaa ttcaaagtag caaaactcac cggagtcgcg ggcaaagcac 8280
ttgtggcggc gacagtggac caggtgtttc aggcgcagtt gctctgcctc tccacttaac 8340
attcagtcgt agccgtccgc cgagtccttt accgcgtcaa agttaggaat aaattgatcc 8400
ggatagtggc cgggaggtcc cgagaagggg ttaaagtaga ccgatggcac aaactcctca 8460
ataaattgca gagttccaat gcctccagag cgcggctcag aggacgaggt ctgcagagtt 8520
aggattgcct gacgaggcgt gaatgaagga cggccggcgc cgccgatctg aaatgtcccg 8580
tccggacgga gaccaagcga ggagctcacc gactcgtcgt tgagctgaat acctcgccct 8640
ctgattgtca ggtgagttat accctgcccg ggcgaccgca ccctgtgacg aaagccgccc 8700
gcaagctgcg cccctgagtt agtcatctga acttcggcct gggcgtctct gggaagtacc 8760
acagtggtgg gagcgggact ttcctggtac accagggcag cgggccaact acggggatta 8820
aggttattac gaggtgtggt ggtaatagcc gcctgttcca agagaattcg gtttcggtgg 8880
gcgcggattc cgttgacccg ggatatcatg tggggtcccg cgctcatgta gtttattcgg 8940
gttgagtagt cttgggcagc tccagccgca agtcccattt gtggctggta actccacatg 9000
tagggcgtgg gaatttcctt gctcataatg gcgctgacga caggtgctgg cgccgggtgt 9060
ggccgctgga gatgacgtag ttttcgcgct taaatttgag aaagggcgcg aaactagtcc 9120
ttaagagtca gcgcgcagta tttactgaag agagcctccg cgtcttccag cgtgcgccga 9180
agctgatctt cgcttttgtg atacaggcag ctgcgggtga gggatcgcag agacctgttt 9240
tttattttca gctcttgttc ttggcccctg ctctgttgaa atatagcata cagagtggga 9300
aaaatcctgt ttctaagctc gcgggtcgat acgggttcgt tgggcgccag acgcagcgct 9360
cctcctcctg ctgctgccgc cgctgtggat ttcttgggct ttgtcagagt cttgctatcc 9420
ggtcgccttt gcttctgtgt ggccgctgct gttgctgccg ctgccgctgc cgccggtgca 9480
gtatgggctg tagagatgac ggtagtaatg caggatgtta cgggggaagg ccacgccgtg 9540
atggtagaga agaaagcggc gggcgaagga gatgttgccc ccacagtctt gcaagcaagc 9600
aactatggcg ttcttgtgcc cgcgccatga gcggtagcct tggcgctgtt gttgctcttg 9660
ggctaacggc ggcggctgct tggacttacc ggccctggtt ccagtggtgt cccatctacg 9720
gttgggtcgg cgaacgggca gtgccggcgg cgcctgagga gcggaggttg tagccatgct 9780
ggaaccggtt gccgatttct ggggcgccgg cgaggggaat gcgaccgagg gtgacggtgt 9840
ttcgtctgac acctcttcga cctcggaagc ttcctcgtct aggctctccc agtcttccat 9900
catgtcctcc tcctcctcgt ccaaaacctc ctctgcctga ctgtcccagt attcctcctc 9960
gtccgtgggt ggcggcggca gctgcagctt ctttttgggt gccatcctgg gaagcaaggg 10020
cccgcggctg ctgctgatag ggctgcggcg gcggggggat tgggttgagc tcctcgccgg 10080
actgggggtc caagtaaacc ccccgtccct ttcgtagcag aaactcttgg cgggctttgt 10140
tgatggcttg caattggcca agaatgtggc cctgggtaat gacgcaggcg gtaagctccg 10200
catttggcgg gcgggattgg tcttcgtaga acctaatctc gtgggcgtgg tagtcctcag 10260
gtacaaattt gcgaaggtaa gccgacgtcc acagccccgg agtgagtttc aaccccggag 10320
ccgcggactt ttcgtcaggc gagggaccct gcagctcaaa ggtaccgata atttgacttt 10380
cgttaagcag ctgcgaattg caaaccaggg agcggtgcgg ggtgcatagg ttgcagcgac 10440
agtgacactc cagtagaccg tcaccgctca cgtcttccat tatgtcagag tggtaggcaa 10500
ggtagttggc tagctgcaga aggtagcagt ggccccaaag cggcggaggg cattcgcggt 10560
acttaatggg cacaaagtcg ctaggaagtg cacagcaggt ggcgggcaag attcctgagc 10620
gctctaggat aaagttccta aagttctgca acatgctttg actggtgaag tctggcagac 10680
cctgttgcag ggttttaagc aggcgttcgg ggaaaatgat gtccgccagg tgcgcggcca 10740
cggagcgctc gttgaaggcc gtccataggt ccttcaagtt ttgctttagc agtttctgca 10800
gctccttgag gttgcactcc tccaagcact gctgccaaac gcccatggcc gtctgccagg 10860
tgtagcatag aaataagtaa acgcagtcgc ggacgtagtc gcggcgcgcc tcgcccttga 10920
gcgtggaatg aagcacgttt tgcccaaggc ggttttcgtg caaaattcca aggtaggaga 10980
ccaggttgca gagctccacg ttggagatct tgcaggcctg gcgtacgtag ccctgtcgaa 11040
aggtgtagtg caatgtttcc tctagcttgc gctgcatctc cgggtcagca aagaaccgct 11100
gcatgcactc aagctccacg gtaacgagca ctgcggccat cattagtttg cgtcgctcct 11160
ccaagtcggc aggctcgcgc gtttgaagcc agcgcgctag ctgctcgtcg ccaactgcgg 11220
gtaggccctc ctctgtttgt tcttgcaaat ttgcatccct ctccaggggc tgcgcacggc 11280
gcacgatcag ctcactcatg actgtgctca tgaccttggg gggtaggtta agtgccgggt 11340
aggcaaagtg ggtgacctcg atgctgcgtt ttagtacggc taggcgcgcg ttgtcaccct 11400
cgagttccac caacactcca gagtgacttt cattttcgct gttttcctgt tgcagagcgt 11460
ttgccgcgcg cttctcgtcg cgtccaagac cctcaaagat ttttggcact tcgttgagcg 11520
aggcgatatc aggtatgaca gcgccctgcc gcaaggccag ctgcttgtcc gctcggctgc 11580
ggttggcacg gcaggatagg ggtatcttgc agttttggaa aaagatgtga taggtggcaa 11640
gcacctctgg cacggcaaat acggggtaga agttgaggcg cgggttgggc tcgcatgtgc 11700
cgttttcttg gcgtttgggg ggtacgcgcg gtgagaatag gtggcgttcg taggcaaggc 11760
tgacatccgc tatggcgagg ggcacatcgc tgcgctcttg caacgcgtcg cagataatgg 11820
cgcactggcg ctgcagatgc ttcaacagca cgtcgtctcc cacatctagg tagtcgccat 11880
gcctttcgtc cccccgcccg acttgttcct cgtttgcctc tgcgttgtcc tggtcttgct 11940
ttttatcctc tgttggtact gagcggtcct cgtcgtcttc gcttacaaaa cctgggtcct 12000
gctcgataat cacttcctcc tcctcaagcg ggggtgcctc gacggggaag gtggtaggcg 12060
cgttggcggc atcggtggag gcggtggtgg cgaactcaga gggggcggtt aggctgtcct 12120
tcttctcgac tgactccatg atctttttct gcctatagga gaaggaaatg gccagtcggg 12180
aagaggagca gcgcgaaacc acccccgagc gcggacgcgg tgcggcgcga cgtcccccaa 12240
ccatggagga cgtgtcgtcc ccgtccccgt cgccgccgcc tccccgggcg cccccaaaaa 12300
agcggatgag gcggcgtatc gagtccgagg acgaggaaga ctcatcacaa gacgcgctgg 12360
tgccgcgcac acccagcccg cggccatcga cctcggcggc ggatttggcc attgcgccca 12420
agaagaaaaa gaagcgccct tctcccaagc ccgagcgccc gccatcacca gaggtaatcg 12480
tggacagcga ggaagaaaga gaagatgtgg cgctacaaat ggtgggtttc agcaacccac 12540
cggtgctaat caagcatggc aaaggaggta agcgcacagt gcggcggctg aatgaagacg 12600
acccagtggc gcgtggtatg cggacgcaag aggaagagga agagcccagc gaagcggaaa 12660
gtgaaattac ggtgatgaac ccgctgagtg tgccgatcgt gtctgcgtgg gagaagggca 12720
tggaggctgc gcgcgcgctg atggacaagt accacgtgga taacgatcta aaggcgaact 12780
tcaaactact gcctgaccaa gtggaagctc tggcggccgt atgcaagacc tggctgaacg 12840
aggagcaccg cgggttgcag ctgaccttca ccagcaacaa gacctttgtg acgatgatgg 12900
ggcgattcct gcaggcgtac ctgcagtcgt ttgcagaggt gacctacaag catcacgagc 12960
ccacgggctg cgcgttgtgg ctgcaccgct gcgctgagat cgaaggcgag cttaagtgtc 13020
tacacggaag cattatgata aataaggagc acgtgattga aatggatgtg acgagcgaaa 13080
acgggcagcg cgcgctgaag gagcagtcta gcaaggccaa gatcgtgaag aaccggtggg 13140
gccgaaatgt ggtgcagatc tccaacaccg acgcaaggtg ctgcgtgcac gacgcggcct 13200
gtccggccaa tcagttttcc ggcaagtctt gcggcatgtt cttctctgaa ggcgcaaagg 13260
ctcaggtggc ttttaagcag atcaaggctt ttatgcaggc gctgtatcct aacgcccaga 13320
ccgggcacgg tcaccttttg atgccactac ggtgcgagtg caactcaaag cctgggcacg 13380
cgcccttttt gggaaggcag ctaccaaagt tgactccgtt cgccctgagc aacgcggagg 13440
acctggacgc ggatctgatc tccgacaaga gcgtgctggc cagcgtgcac cacccggcgc 13500
tgatagtgtt ccagtgctgc aaccctgtgt atcgcaactc gcgcgcgcag ggcggaggcc 13560
ccaactgcga cttcaagata tcggcgcccg acctgctaaa cgcgttggtg atggtgcgca 13620
gcctgtggag tgaaaacttc accgagctgc cgcggatggt tgtgcctgag tttaagtgga 13680
gcactaaaca ccagtatcgc aacgtgtccc tgccagtggc gcatagcgat gcgcggcaga 13740
acccctttga tttttaaacg gcgcagacgg caagggtggg ggtaaataat cacccgagag 13800
tgtacaaata aaagcatttg cctttattga aagtgtctct agtacattat ttttacatgt 13860
ttttcaagtg acaaaaagaa gtggcgctcc taatctgcgc actgtggctg cggaagtagg 13920
gcgagtggcg ctccaggaag ctgtagagct gttcctggtt gcgacgcagg gtgggctgta 13980
cctggggact gttgagcatg gagttgggta ccccggtaat aaggttcatg gtggggttgt 14040
gatccatggg agtttggggc cagttggcaa aggcgtggag aaacatgcag cagaatagtc 14100
cacaggcggc cgagttgggc ccctgtacgc tttgggtgga cttttccagc gttatacagc 14160
ggtcggggga agaagcaatg gcgctacggc gcaggagtga ctcgtactca aactggtaaa 14220
cctgcttgag tcgctggtca gaaaagccaa agggctcaaa gaggtagcat gtttttgagt 14280
gcgggttcca ggcaaaggcc atccagtgta cgcccccagt ctcggtccga gactcgaacc 14340
gggggtcccg cgactcaacc cttggaaaat aaccctccgg ctacagggag cgagccactt 14400
aatgctttcg ctttccagcc taaccgctta cgctgcgcgc ggccagtggc caaaaaagct 14460
agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag cactcccccg ttgtctgacg 14520
tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg atcacggcgg acggccggat 14580
acggggctcg aaccccggtc gtccgccatg atacccttgc gaatttatcc accagaccac 14640
ggaagagtgc ccgcttacag gctctccttt tgcacggtag agcgtcaacg attgcgcgcg 14700
cctgaccggc cagagcgtcc cgaccatgga gcactttttg ccgctgcgca acatctggaa 14760
ccgcgtccgc gactttccgc gcgcctccac caccgccgcc ggcatcacct ggatgtccag 14820
gtacatctac ggatatcatc gccttatgtt ggaagatctc gcccccggag ccccggccac 14880
cctacgctgg cccctctacc gccagccgcc gccgcacttt ttggtgggat accagtacct 14940
ggtgcggact tgcaacgact acgtatttga ctcgagggct tactcgcgtc tcaggtacac 15000
cgagctctcg cagccgggtc accagaccgt taactggtcc gttatggcca actgcactta 15060
caccatcaac acgggcgcat accaccgctt tgtggacatg gatgacttcc agtctaccct 15120
cacgcaggtg cagcaggcca tattagccga gcgcgttgtc gccgacctag ccctgcttca 15180
gccgatgagg ggcttcgggg tcacacgcat gggaggaaga gggcgccacc tacggccaaa 15240
ctccgccgcc gccgcagcga tagatgcaag agatgcagga caagaggaag gagaagaaga 15300
agtgccggta gaaaggctca tgcaagacta ctacaaagac ctgcgccgat gtcaaaacga 15360
agcctggggc atggccgacc gcctgcgcat tcagcaggcc ggacccaagg acatggtgct 15420
tctg 15424
<210> 393
<211> 3849
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 393
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 60
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 120
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 180
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 240
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 300
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 360
catttccccg aaaagtgcca cctaaattgt aagcgttaat attttgttaa aattcgcgtt 420
aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta 480
taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc 540
actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg 600
cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact 660
aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt 720
ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc 780
ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc 840
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 900
attacgccag ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 960
ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 1020
ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta 1080
gccatgctct aggaagagta ccattgacgt caataatgac gtatgttccc atagtaacgc 1140
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 1200
cagtacatca agtgtatcag tggtttgtct ggtcaaccac cgcggtctca gtggtgtacg 1260
gtacaaaccc agctaccggt cgccaccatg cccgccatga agatcgagtg ccgcatcacc 1320
ggcaccctga acggcgtgga gttcgagctg gtgggcggcg gagagggcac ccccgagcag 1380
ggccgcatga ccaacaagat gaagagcacc aaaggcgccc tgaccttcag cccctacctg 1440
ctgagccacg tgatgggcta cggcttctac cacttcggca cctaccccag cggctacgag 1500
aaccccttcc tgcacgccat caacaacggc ggctacacca acacccgcat cgagaagtac 1560
gaggacggcg gcgtgctgca cgtgagcttc agctaccgct acgaggccgg ccgcgtgatc 1620
ggcgacttca aggtggtggg caccggcttc cccgaggaca gcgtgatctt caccgacaag 1680
atcatccgca gcaacgccac cgtggagcac ctgcacccca tgggcgataa cgtgctggtg 1740
ggcagcttcg cccgcacctt cagcctgcgc gacggcggct actacagctt cgtggtggac 1800
agccacatgc acttcaagag cgccatccac cccagcatcc tgcagaacgg gggccccatg 1860
ttcgccttcc gccgcgtgga ggagctgcac agcaacaccg agctgggcat cgtggagtac 1920
cagcacgcct tcaagacccc catcgccttc gccagatctc gagctcgatg agtttggaca 1980
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2040
tttatttgtg ggcccgggat cttcctagag catggctacg tagataagta gcatggcggg 2100
ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 2160
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 2220
gcctcagtga gcgagcgagc gcgcagctgc attaatgaat cggccaacgc gcggggagag 2280
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 2340
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 2400
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 2460
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 2520
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 2580
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 2640
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 2700
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 2760
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 2820
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 2880
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 2940
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 3000
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 3060
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 3120
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 3180
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 3240
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 3300
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 3360
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 3420
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 3480
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 3540
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 3600
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 3660
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 3720
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 3780
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 3840
gctcttgcc 3849
<210> 394
<211> 7336
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 394
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggctct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caacctctct gagggcattc gcgagtggtg ggcgctgaaa cctggagccc cgaagcccaa 1980
agccaaccag caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct 2040
cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct 2100
cgagcacgac aaggcctacg accagcagct gcaggcgggt gacaatccgt acctgcggta 2160
taaccacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga 2280
ggaaggcgct aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc 2340
tccagactcc tctacgggca tcggcaagaa aggccaacag cccgccagaa aaagactcaa 2400
ttttggtcag actggcgact cagagtcagt tccagaccct caacctctcg gagaacctcc 2460
agcagcgccc tctggtgtgg gacctaatac aatggctgca ggcggtggcg caccaatggc 2520
agacaataac gaaggcgccg acggagtggg tagttcctcg ggaaattggc attgcgattc 2580
cacatggctg ggcgacagag tcatcaccac cagcacccga acctgggccc tgcccaccta 2640
caacaaccac ctctacaagc aaatctccaa cgggacatcg ggaggagcca ccaacgacaa 2700
cacctacttc ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca 2760
cttttcacca cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag 2820
actcagcttc aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa 2880
gaccatcgcc aataacctca ccagcaccat ccaggtgttt acggactcgg agtaccagct 2940
gccgtacgtt ctcggctctg cccaccaggg ctgcctgcct ccgttcccgg cggacgtgtt 3000
catgattccc cagtacggct acctaacact caacaacggt agtcaggccg tgggacgctc 3060
ctccttctac tgcctggaat actttccttc gcagatgctg agaaccggca acaacttcca 3120
gtttacttac accttcgagg acgtgccttt ccacagcagc tacgcccaca gccagagctt 3180
ggaccggctg atgaatcctc tgattgacca gtacctgtac tacttgtctc ggactcaaac 3240
aacaggaggc acggcaaata cgcagactct gggcttcagc caaggtgggc ctaatacaat 3300
ggccaatcag gcaaagaact ggctgccagg accctgttac cgccaacaac gcgtctcaac 3360
gacaaccggg caaaacaaca atagcaactt tgcctggact gctgggacca aataccatct 3420
gaatggaaga aattcattgg ctaatcctgg catcgctatg gcaacacaca aagacgacga 3480
ggagcgtttt tttcccagta acgggatcct gatttttggc aaacaaaatg ctgccagaga 3540
caatgcggat tacagcgatg tcatgctcac cagcgaggaa gaaatcaaaa ccactaaccc 3600
tgtggctaca gaggaatacg gtatcgtggc agataacttg cagcagcaaa acacggctcc 3660
tcaaattgga actgtcaaca gccagggggc cttacccggt atggtctggc agaaccggga 3720
cgtgtacctg cagggtccca tctgggccaa gattcctcac acggacggca acttccaccc 3780
gtctccgctg atgggcggct ttggcctgaa acatcctccg cctcagatcc tgatcaagaa 3840
cacgcctgta cctgcggatc ctccgaccac cttcaaccag tcaaagctga actctttcat 3900
cacgcaatac agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaggaaaa 3960
cagcaagcgc tggaaccccg agatccagta cacctccaac tactacaaat ctacaagtgt 4020
ggactttgct gttaatacag aaggcgtgta ctctgaaccc cgccccattg gcacccgtta 4080
cctcacccgt aatctgtaat tgcctgttaa tcaataaacc ggttgattcg tttcagttga 4140
actttggtct ctgcgaaggg cgaattcgtt taaacctgca ggactagagg tcctgtatta 4200
gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct gggtatttaa 4260
gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc gcagccgcca 4320
agccgaattc tgcagatatc catcacactg gcggccgctc gactagagcg gccgccaccg 4380
cggtggagct ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca 4440
tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 4500
gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 4560
gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 4620
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 4680
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4740
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4800
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4860
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4920
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4980
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5040
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5100
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5160
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5220
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 5280
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 5340
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 5400
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 5460
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 5520
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 5580
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5640
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5700
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5760
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5820
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5880
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5940
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 6000
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 6060
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 6120
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 6180
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 6240
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 6300
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 6360
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 6420
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 6480
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 6540
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctaaattg 6600
taagcgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta 6660
accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt 6720
tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 6780
aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa 6840
gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 6900
ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 6960
gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 7020
ccgcgcttaa tgcgccgcta cagggcgcgt cccattcgcc attcaggctg cgcaactgtt 7080
gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg 7140
ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga 7200
cggccagtga gcgcgcgtaa tacgactcac tatagggcga attgggtacc gggccccccc 7260
tcgatcgagg tcgacggtat cgggggagct cgcagggtct ccattttgaa gcgggaggtt 7320
tgaacgcgca gccgcc 7336
<210> 395
<211> 969
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 395
ccccaactgg ggtaaccttt gggctccccg ggcgcgacta taagctgcga gcaacttcac 60
ttgggtatgc cggcggtagc gcttaccgtt cgtataatgt atgctatacg aagttatccg 120
aagccgctag cggtggtttg tctggtcaac caccgcggtc tcagtggtgt acggtacaaa 180
cccagctacc ggtcgccacc atgcccgcca tgaagatcga gtgccgcatc accggcaccc 240
tgaacggcgt ggagttcgag ctggtgggcg gcggagaggg cacccccgag cagggccgca 300
tgaccaacaa gatgaagagc accaaaggcg ccctgacctt cagcccctac ctgctgagcc 360
acgtgatggg ctacggcttc taccacttcg gcacctaccc cagcggctac gagaacccct 420
tcctgcacgc catcaacaac ggcggctaca ccaacacccg catcgagaag tacgaggacg 480
gcggcgtgct gcacgtgagc ttcagctacc gctacgaggc cggccgcgtg atcggcgact 540
tcaaggtggt gggcaccggc ttccccgagg acagcgtgat cttcaccgac aagatcatcc 600
gcagcaacgc caccgtggag cacctgcacc ccatgggcga taacgtgctg gtgggcagct 660
tcgcccgcac cttcagcctg cgcgacggcg gctactacag cttcgtggtg gacagccaca 720
tgcacttcaa gagcgccatc caccccagca tcctgcagaa cgggggcccc atgttcgcct 780
tccgccgcgt ggaggagctg cacagcaaca ccgagctggg catcgtggag taccagcacg 840
ccttcaagac ccccatcgcc ttcgccagat ctcgagctcg atgagtttgg acaaaccaca 900
actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 960
gtgggcccg 969
<210> 396
<211> 4769
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 396
tgatcccctg cgccatcaga tccttggcgg cgagaaagcc atccagttta ctttgcaggg 60
cttcccaacc ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa 120
aaccgcccag tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc 180
gcttgcgttt tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg 240
tttctgcgga ctggctttct acgtgctcga ggggggccaa acggtctcca gcttggctgt 300
tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 360
ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 420
aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 480
gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 540
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 600
gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 660
gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc tacaaactct 720
tttgtttatt tttctaaata cattcaaata tgtatccgct catgaccaaa atcccttaac 780
gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 840
atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 900
tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 960
gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 1020
actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 1080
gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 1140
agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 1200
ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 1260
aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 1320
cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 1380
gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 1440
cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 1500
cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 1560
gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 1620
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 1680
tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 1740
catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 1800
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 1860
ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 1920
gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 1980
cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 2040
cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 2100
tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 2160
catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 2220
taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 2280
aacatgctgt gcgacgctgg cgatacatta ccctgttatc cctagatgac attaccctgt 2340
tatcccagat gacattaccc tgttatccct agatgacatt accctgttat ccctagatga 2400
catttaccct gttatcccta gatgacatta ccctgttatc ccagatgaca ttaccctgtt 2460
atccctagat acattaccct gttatcccag atgacatacc ctgttatccc tagatgacat 2520
taccctgtta tcccagatga cattaccctg ttatccctag atacattacc ctgttatccc 2580
agatgacata ccctgttatc cctagatgac attaccctgt tatcccagat gacattaccc 2640
tgttatccct agatacatta ccctgttatc ccagatgaca taccctgtta tccctagatg 2700
acattaccct gttatcccag atgacattac cctgttatcc ctagatacat taccctgtta 2760
tcccagatga cataccctgt tatccctaga tgacattacc ctgttatccc agatgacatt 2820
accctgttat ccctagatac attaccctgt tatcccagat gacataccct gttatcccta 2880
gatgacatta ccctgttatc ccagatgaca ttaccctgtt atccctagat acattaccct 2940
gttatcccag atgacatacc ctgttatccc tagatgacat taccctgtta tcccagataa 3000
actcaatgat gatgatgatg atggtcgaga ctcagcggcc gcggtgccag ggcgtgccct 3060
tgggctcccc gggcgcgatg cccgccatga agatcgagtg ccgcatcacc ggcaccctga 3120
acggcgtgga gttcgagctg gtgggcggcg gagagggcac ccccgagcag ggccgcatga 3180
ccaacaagat gaagagcacc aaaggcgccc tgaccttcag cccctacctg ctgagccacg 3240
tgatgggcta cggcttctac cacttcggca cctaccccag cggctacgag aaccccttcc 3300
tgcacgccat caacaacggc ggctacacca acacccgcat cgagaagtac gaggacggcg 3360
gcgtgctgca cgtgagcttc agctaccgct acgaggccgg ccgcgtgatc ggcgacttca 3420
aggtggtggg caccggcttc cccgaggaca gcgtgatctt caccgacaag atcatccgca 3480
gcaacgccac cgtggagcac ctgcacccca tgggcgataa cgtgctggtg ggcagcttcg 3540
cccgcacctt cagcctgcgc gacggcggct actacagctt cgtggtggac agccacatgc 3600
acttcaagag cgccatccac cccagcatcc tgcagaacgg gggccccatg ttcgccttcc 3660
gccgcgtgga ggagctgcac agcaacaccg agctgggcat cgtggagtac cagcacgcct 3720
tcaagacccc catcgccttc gccagatctc gagctcgagg tggtttgtct ggtcaaccac 3780
cgcggtctca gtggtgtacg gtacaaaccc accccaactg gggtaacctt tgagttctct 3840
cagttggggg taatcagcat catgatgtgg taccacatca tgatgctgat tataagaatg 3900
cggccgccac actctagtgg atctcgagtt aataattcag aagaactcgt caagaaggcg 3960
atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga ggaagcggtc 4020
agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta tgtcctgata 4080
gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc cattttccac 4140
catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcctcgc cgtcgggcat 4200
gctcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct cttcgtccag 4260
atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga tgcgatgttt 4320
cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc gcattgcatc 4380
agccatgatg gatactttct cggcaggagc aaggtgtaga tgacatggag atcctgcccc 4440
ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct 4500
gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ttgcagttca 4560
ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 4620
cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc 4680
ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac 4740
gatcctcatc ctgtctcttg atcagagct 4769
<210> 397
<211> 797
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 397
ccccaactgg ggtaaccttt gggctccccg ggcgcgatgg tgagcaaggg cgaggaggat 60
aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 120
ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 180
gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat cctgtcccct 240
cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 300
aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 360
gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 420
ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 480
gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 540
aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac ctacaaggcc 600
aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga catcacctcc 660
cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg ccactccacc 720
ggcggcatgg acgagctgta caagggtggt ttgtctggtc aaccaccgcg agctcagtgg 780
tgtacggtac aaaccca 797
<210> 398
<211> 815
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 398
ccccaactgg ggtaaccttt gggctccccg ggcgcggccg ccaccatggt gtccaagggt 60
gaggaacttt ttaccggagt ggtgccgata ctggtagagc tggatggcga cgtaaacggg 120
cacaagttca gtgtacgggg agagggcgag ggcgacgcta cgaatgggaa attgactttg 180
aaatttattt gcaccacggg caaattgccg gtcccgtggc caactttggt tacgaccttg 240
acctatggcg ttcagtgttt ctcacggtac ccagaccaca tgaaacagca tgactttttt 300
aagtcagcga tgccggaggg atatgtgcaa gaacggacta tctcatttaa agatgatggc 360
acatataaga caagagcgga agtcaaattc gaaggggaca ccctcgtcaa tcgaatagaa 420
ctcaagggaa tagacttcaa agaagatggt aatatactgg ggcacaaact cgaatacaat 480
ttcaacagtc ataacgtcta catcactgcc gacaaacaaa aaaatgggat caaagcgaac 540
ttcaaaatcc gacataatgt cgaggatggg agcgtccaac tggcagacca ttaccagcaa 600
aatactccaa taggtgatgg tccagtgctt ttgccagata atcattatct tagctatcag 660
agcaagttga gtaaggatcc gaatgaaaag cgagatcaca tggtcttgct ggagtttgtt 720
acggcggctg gtatcacact tggtatggat gaattgtaca agggtggttt gtctggtcaa 780
ccaccgcgga ctcagtggtg tacggtacaa accca 815
<210> 399
<211> 1660
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 399
ccccaactgg ggtaaccttt gggctccccg ggcgcggcca ccatgaaatg ggttactttc 60
atatctctgt tgtttttgtt ttcctctagt tccagggcca tgccgtcttc tgtctcgtgg 120
ggcatcctcc tgctggcagg cctgtgctgc ctggtccctg tctccctggc tgaggatccc 180
cagggagatg ctgcccagaa gacagataca tcccaccatg atcaggatca cccaaccttc 240
aacaagatca cccccaacct ggctgagttc gccttcagcc tataccgcca gctggcacac 300
cagtccaaca gcaccaatat cttcttctcc ccagtgagca tcgctacagc ctttgcaatg 360
ctctccctgg ggaccaaggc tgacactcac gatgaaatcc tggagggcct gaatttcaac 420
ctcacggaga ttccggaggc tcagatccat gaaggcttcc aggaactcct ccgtaccctc 480
aaccagccag acagccagct ccagctgacc accggcaatg gcctgttcct cagcgagggc 540
ctgaagctag tggataagtt tttggaggat gttaaaaagt tgtaccactc agaagccttc 600
actgtcaact tcggggacac cgaagaggcc aagaaacaga tcaacgatta cgtggagaag 660
ggtactcaag ggaaaattgt ggatttggtc aaggagcttg acagagacac agtttttgct 720
ctggtgaatt acatcttctt taaaggcaaa tgggagagac cctttgaagt caaggacacc 780
gaggaagagg acttccacgt ggaccaggtg accaccgtga aggtgcctat gatgaagcgt 840
ttaggcatgt ttaacatcca gcactgtaag aagctgtcca gctgggtgct gctgatgaaa 900
tacctgggca atgccaccgc catcttcttc ctgcctgatg aggggaaact acagcacctg 960
gaaaatgaac tcacccacga tatcatcacc aagttcctgg aaaatgaaga cagaaggtct 1020
gccagcttac atttacccaa actgtccatt actggaacct atgatctgaa gagcgtcctg 1080
ggtcaactgg gcatcactaa ggtcttcagc aatggggctg acctctccgg ggtcacagag 1140
gaggcacccc tgaagctctc caaggccgtg cataaggctg tgctgaccat cgacgagaaa 1200
gggactgaag ctgctggggc catgttttta gaggccatac ccatgtctat cccccccgag 1260
gtcaagttca acaaaccctt tgtcttctta atgattgaac aaaataccaa gtctcccctc 1320
ttcatgggaa aagtggtgaa tcccacccaa aaataagaat tctaactaga gctcgctgat 1380
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 1440
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 1500
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 1560
gggaggattg ggaagagaat agcaggcatg ctggggagcg agctcgaggt ggtttgtctg 1620
gtcaaccacc gcggtctcag tggtgtacgg tacaaaccca 1660
<210> 400
<211> 4906
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 400
ccccaactgg ggtaaccttt gggctccccg ggcgcggcca ccatgaaatg ggttactttc 60
atatctctgt tgtttttgtt ttcctctagt tccagggcca tgacgaggat tttgacagct 120
ttcaaagtgg tgaggacact gaagactggt tttggcttta ccaatgtgac tgcacaccaa 180
aaatggaaat tttcaagacc tggcatcagg ctcctttctg tcaaggcaca gacagcacac 240
attgtcctgg aagatggaac taagatgaaa ggttactcct ttggccatcc atcctctgtt 300
gctggtgaag tggtttttaa tactggcctg ggagggtacc cagaagctat tactgaccct 360
gcctacaaag gacagattct cacaatggcc aaccctatta ttgggaatgg tggagctcct 420
gatactactg ctctggatga actgggactt agcaaatatt tggagtctaa tggaatcaag 480
gtttcaggtt tgctggtgct ggattatagt aaagactaca accactggct ggctaccaag 540
agtttagggc aatggctaca ggaagaaaag gttcctgcaa tttatggagt ggacacaaga 600
atgctgacta aaataattcg ggataagggt accatgcttg ggaagattga atttgaaggt 660
cagcctgtgg attttgtgga tccaaataaa cagaatttga ttgctgaggt ttcaaccaag 720
gatgtcaaag tgtacggcaa aggaaacccc acaaaagtgg tagctgtaga ctgtgggatt 780
aaaaacaatg taatccgcct gctagtaaag cgaggagctg aagtgcactt agttccctgg 840
aaccatgatt tcaccaagat ggagtatgat gggattttga tcgcgggagg accggggaac 900
ccagctcttg cagaaccact aattcagaat gtcagaaaga ttttggagag tgatcgcaag 960
gagccattgt ttggaatcag tacaggaaac ttaataacag gattggctgc tggtgccaaa 1020
acctacaaga tgtccatggc caacagaggg cagaatcagc ctgttttgaa tatcacaaac 1080
aaacaggctt tcattactgc tcagaatcat ggctatgcct tggacaacac cctccctgct 1140
ggctggaaac cactttttgt gaatgtcaac gatcaaacaa atgaggggat tatgcatgag 1200
agcaaaccct tcttcgctgt gcagttccac ccagaggtca ccccggggcc aatagacact 1260
gagtacctgt ttgattcctt tttctcactg ataaagaaag gaaaagctac caccattaca 1320
tcagtcttac cgaagccagc actagttgca tctcgggttg aggtttccaa agtccttatt 1380
ctaggatcag gaggtctgtc cattggtcag gctggagaat ttgattactc aggatctcaa 1440
gctgtaaaag ccatgaagga agaaaatgtc aaaactgttc tgatgaaccc aaacattgca 1500
tcagtccaga ccaatgaggt gggcttaaag caagcggata ctgtctactt tcttcccatc 1560
acccctcagt ttgtcacaga ggtcatcaag gcagaacagc cagatgggtt aattctgggc 1620
atgggtggcc agacagctct gaactgtgga gtggaactat tcaagagagg tgtgctcaag 1680
gaatatggtg tgaaagtcct gggaacttca gttgagtcca ttatggctac ggaagacagg 1740
cagctgtttt cagataaact aaatgagatc aatgaaaaga ttgctccaag ttttgcagtg 1800
gaatcgattg aggatgcact gaaggcagca gacaccattg gctacccagt gatgatccgt 1860
tccgcctatg cactgggtgg gttaggctca ggcatctgtc ccaacagaga gactttgatg 1920
gacctcagca caaaggcctt tgctatgacc aaccaaattc tggtggagaa gtcagtgaca 1980
ggttggaaag aaatagaata tgaagtggtt cgagatgctg atgacaattg tgtcactgtc 2040
tgtaacatgg aaaatgttga tgccatgggt gttcacacag gtgactcagt tgttgtggct 2100
cctgcccaga cactctccaa tgccgagttt cagatgttga gacgtacttc aatcaatgtt 2160
gttcgccact tgggcattgt gggtgaatgc aacattcagt ttgcccttca tcctacctca 2220
atggaatact gcatcattga agtgaatgcc agactgtccc gaagctctgc tctggcctca 2280
aaagccactg gctacccatt ggcattcatt gctgcaaaga ttgccctagg aatcccactt 2340
ccagaaatta agaacgtcgt atccgggaag acatcagcct gttttgaacc tagcctggat 2400
tacatggtca ccaagattcc ccgctgggat cttgaccgtt ttcatggaac atctagccga 2460
attggtagct ctatgaaaag tgtaggagag gtcatggcta ttggtcgtac ctttgaggag 2520
agtttccaga aagctttacg gatgtgccac ccatctatag aaggtttcac tccccgtctc 2580
ccaatgaaca aagaatggcc atctaattta gatcttagaa aagagttgtc tgaaccaagc 2640
agcacgcgta tctatgccat tgccaaggcc attgatgaca acatgtccct tgatgagatt 2700
gagaagctca catacattga caagtggttt ttgtataaga tgcgtgatat tttaaacatg 2760
gaaaagacac tgaaaggcct caacagtgag tccatgacag aagaaaccct gaaaagggca 2820
aaggagattg ggttctcaga taagcagatt tcaaaatgcc ttgggctcac tgaggcccag 2880
acaagggagc tgaggttaaa gaaaaacatc cacccttggg ttaaacagat tgatacactg 2940
gctgcagaat acccatcagt aacaaactat ctctatgtta cctacaatgg tcaggagcat 3000
gatgtcaatt ttgatgacca tggaatgatg gtgctaggct gtggtccata tcacattggc 3060
agcagtgtgg aatttgattg gtgtgctgtc tctagtatcc gcacactgcg tcaacttggc 3120
aagaagacgg tggtggtgaa ttgcaatcct gagactgtga gcacagactt tgatgagtgt 3180
gacaaactgt actttgaaga gttgtccttg gagagaatcc tagacatcta ccatcaggag 3240
gcatgtggtg gctgcatcat atcagttgga ggccagattc caaacaacct ggcagttcct 3300
ctatacaaga atggtgtcaa gatcatgggc acaagccccc tgcagatcga cagggctgag 3360
gatcgctcca tcttctcagc tgtcttggat gagctgaagg tggctcaggc accttggaaa 3420
gctgttaata ctttgaatga agcactggaa tttgcaaagt ctgtggacta cccctgcttg 3480
ttgaggcctt cctatgtttt gagtgggtct gctatgaatg tggtattctc tgaggatgag 3540
atgaaaaaat tcctagaaga ggcgactaga gtttctcagg agcacccagt ggtgctgaca 3600
aaatttgttg aaggggcccg agaagtagaa atggacgctg ttggcaaaga tggaagggtt 3660
atctctcatg ccatctctga acatgttgaa gatgcaggtg tccactcggg agatgccact 3720
ctgatgctgc ccacacaaac catcagccaa ggggccattg aaaaggtgaa ggatgctacc 3780
cggaagattg caaaggcttt tgccatctct ggtccattca acgtccaatt tcttgtcaaa 3840
ggaaatgatg tcttggtgat tgagtgtaac ttgagagctt ctcgatcctt cccctttgtt 3900
tccaagactc ttggggttga cttcattgat gtggccacca aggtgatgat tggagagaat 3960
gttgatgaga aacatcttcc aacattggac catcccataa ttcctgctga ctatgttgca 4020
attaaggctc ccatgttttc ctggccccgg ttgagggatg ctgaccccat tctgagatgt 4080
gagatggctt ccactggaga ggtggcttgc tttggtgaag gtattcatac agccttccta 4140
aaggcaatgc tttccacagg atttaagata ccccagaaag gcatcctgat aggcatccag 4200
caatcattcc ggccaagatt ccttggtgtg gctgaacaat tacacaatga aggtttcaag 4260
ctgtttgcca cggaagccac atcagactgg ctcaacgcca acaatgtccc tgccacccca 4320
gtggcatggc cgtctcaaga aggacagaat cccagcctct cttccatcag aaaattgatt 4380
agagatggca gcattgacct agtgattaac cttcccaaca acaacactaa atttgtccat 4440
gataattatg tgattcggag gacagctgtt gatagtggaa tccctctcct cactaatttt 4500
caggtgacca aactttttgc tgaagctgtg cagaaatctc gcaaggtgga ctccaagagt 4560
cttttccact acaggcagta cagtgctgga aaagcagcat aggaattcta actagagctc 4620
gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 4680
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 4740
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 4800
gcaaggggga ggattgggaa gagaatagca ggcatgctgg ggagcgagct cgaggtggtt 4860
tgtctggtca accaccgcgg tctcagtggt gtacggtaca aaccca 4906
<210> 401
<211> 4882
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 401
ccccaactgg ggtaaccttt gggctccccg ggcgcgacta taagctgcga gcaacttcac 60
ttgggtatgc cggcggtagc gcttaccgtt cgtataatgt atgctatacg aagttatccg 120
aagccgctag cggtggtttg tctggtcaac caccgcggtc tcagtggtgt acggtacaaa 180
cccacccgag agaccatgca gaggtcgcct ctggaaaagg ccagcgttgt ctccaaactt 240
ttctttagct ggactagacc catccttcgt aaaggataca gacagcgcct ggaattgtca 300
gacatatacc aaatcccttc tgttgattct gctgacaatc tatctgaaaa attggaaaga 360
gaatgggata gagagctggc ttcaaagaaa aatcctaaac tcattaatgc ccttcggcga 420
tgttttttct ggagatttat gttctatgga atctttttat atttagggga agtcaccaaa 480
gcagtacagc ctctcttact gggaagaatc atagcttcct atgacccgga taacaaggag 540
gaacgctcta tcgcgattta tctaggcata ggcttatgcc ttctctttat tgtgaggaca 600
ctgctcctac acccagccat ttttggcctt catcacattg gaatgcagat gagaatagct 660
atgtttagtt tgatttataa gaagacttta aagctgtcaa gccgtgttct agataaaata 720
agtattggac aacttgttag tctcctttcc aacaacctga acaaatttga tgaaggactt 780
gcattggcac atttcgtgtg gatcgctcct ttgcaagtgg cactcctcat ggggctaatc 840
tgggagttgt tacaggcgtc tgccttctgt ggacttggtt tcctgatagt ccttgccctt 900
tttcaggctg ggctagggag aatgatgatg aagtacagag atcagagagc tgggaagatc 960
agtgaaagac ttgtgattac ctcagaaatg attgaaaata tccaatctgt taaggcatac 1020
tgctgggaag aagcaatgga aaaaatgatt gaaaacttaa gacaaacaga actgaaactg 1080
actcggaagg cagcctatgt gagatacttc aatagctcag ccttcttctt ctcagggttc 1140
tttgtggtgt ttttatctgt gcttccctat gcactaatca aaggaatcat cctccggaaa 1200
atattcacca ccatctcatt ctgcattgtt ctgcgcatgg cggtcactcg gcaatttccc 1260
tgggctgtac aaacatggta tgactctctt ggagcaataa acaaaataca ggatttctta 1320
caaaagcaag aatataagac attggaatat aacttaacga ctacagaagt agtgatggag 1380
aatgtaacag ccttctggga ggagggattt ggggaattat ttgagaaagc aaaacaaaac 1440
aataacaata gaaaaacttc taatggtgat gacagcctct tcttcagtaa tttctcactt 1500
cttggtactc ctgtcctgaa agatattaat ttcaagatag aaagaggaca gttgttggcg 1560
gttgctggat ccactggagc aggcaagact tcacttctaa tggtgattat gggagaactg 1620
gagccttcag agggtaaaat taagcacagt ggaagaattt cattctgttc tcagttttcc 1680
tggattatgc ctggcaccat taaagaaaat atcatctttg gtgtttccta tgatgaatat 1740
agatacagaa gcgtcatcaa agcatgccaa ctagaagagg acatctccaa gtttgcagag 1800
aaagacaata tagttcttgg agaaggtgga atcacactga gtggaggtca acgagcaaga 1860
atttctttag caagagcagt atacaaagat gctgatttgt atttattaga ctctcctttt 1920
ggatacctag acgtattgac tgagaaggag atcttcgagt cctgcgtttg caagcttatg 1980
gccaataaga caagaatcct ggttacaagt aagatggagc acctgaagaa ggccgataag 2040
attctgatcc tgcacgaggg atcttcatac ttctacggca ctttcagcga gcttcagaac 2100
ttgcaacctg atttctctag caagcttatg ggctgcgact cctttgatca gttctctgcc 2160
gagcgtcgca actccattct gaccgaaaca ctgcataggt tttccctcga gggcgacgca 2220
ccagtgtctt ggactgagac taagaagcag agcttcaagc aaaccggcga attcggtgag 2280
aagagaaaga acagtatcct gaaccccatt aattcaattc ggaagttcag tatcgttcag 2340
aaaacgcctc ttcagatgaa cgggattgag gaagactcag acgaaccgct tgaaaggcga 2400
ctctcattgg ttcctgacag tgaacaaggg gaagctattc tcccccggat ttcagtaatt 2460
tccacaggtc cgactctgca agcccggaga agacaatccg tgttgaatct tatgacccat 2520
tccgtgaatc aggggcaaaa tatccataga aagactactg cctctacgag gaaggtatcc 2580
cttgcacccc aagccaatct gacggagctc gacatctact ctcgccgcct gtcccaggag 2640
acaggactgg agattagcga ggagatcaat gaagaggatc tgaaagaatg tttcttcgac 2700
gacatggaat ccatccctgc cgtcacgacg tggaatacct atttgcgtta catcacggta 2760
cataaaagtc tgatattcgt cctgatctgg tgtcttgtga tcttcctcgc tgaagtcgca 2820
gccagcctgg tcgttctttg gctgctcggg aataccccct tgcaggataa gggaaactcc 2880
acccactctc ggaacaatag ttacgccgtc atcattactt ccacttcctc atactacgta 2940
ttctatatat atgtcggggt cgctgataca ctgctggcca tgggcttctt tcgcggcctg 3000
ccgctcgtcc acacgctgat aactgtctcc aagatcttgc atcataagat gctgcactca 3060
gtgctgcagg ctccaatgag tacactgaat actcttaagg ctggcggcat cctgaaccgc 3120
tttagtaagg acatcgccat acttgacgat ctcttgcccc tgacaatctt cgattttatt 3180
caactccttt tgatcgttat cggggcgatc gctgtggttg ctgtgttgca gccatatata 3240
ttcgtagcta ctgttcccgt catcgtcgcg ttcatcatgc tccgtgccta ctttctgcag 3300
acgtcccaac agctgaagca gctcgagagc gagggacggt cccccatatt tacgcacttg 3360
gtaactagtc tgaaggggct gtggactctg agagcatttg gtcgacaacc atatttcgag 3420
accctctttc ataaggccct caacctgcac accgcgaatt ggtttctgta tttgagtacg 3480
ttgcggtggt ttcagatgcg catcgagatg atattcgtga tattctttat cgcagtcaca 3540
tttatcagca tcctgactac gggcgaggga gagggtcgcg tgggcatcat actcacgctc 3600
gctatgaaca ttatgagcac cctgcaatgg gccgtgaata gctctatcga cgttgacagt 3660
cttatgcgat ctgtgagccg agtctttaag ttcattgaca tgccaacaga aggtaaacct 3720
accaagtcaa ccaaaccata caagaatggc caactctcga aagttatgat tattgagaat 3780
tcacacgtga agaaagatga catctggccc tcagggggcc aaatgactgt caaagatctc 3840
acagcaaaat acacagaagg tggaaatgcc atattagaga acatttcctt ctcaataagt 3900
cctggccaga gggtgggcct cttgggaaga actggatcag ggaagagtac tttgttatca 3960
gcttttttga gactactgaa cactgaagga gaaatccaga tcgatggtgt gtcttgggat 4020
tcaataactt tgcaacagtg gaggaaagcc tttggagtga taccacagaa agtatttatt 4080
ttttctggaa catttagaaa aaacttggat ccctatgaac agtggagtga tcaagaaata 4140
tggaaagttg cagatgaggt tgggctcaga tctgtgatag aacagtttcc tgggaagctt 4200
gactttgtcc ttgtggatgg gggctgtgtc ctaagccatg gccacaagca gttgatgtgc 4260
ttggctagat ctgttctcag taaggcgaag atcttgctgc ttgatgaacc cagtgctcat 4320
ttggatccag taacatacca aataattaga agaactctaa aacaagcatt tgctgattgc 4380
acagtaattc tctgtgaaca caggatagaa gcaatgctgg aatgccaaca atttttggtc 4440
atagaagaga acaaagtgcg gcagtacgat tccatccaga aactgctgaa cgagaggagc 4500
ctcttccggc aagccatcag cccctccgac agggtgaagc tctttcccca ccggaactca 4560
agcaagtgca agtctaagcc ccagattgct gctctgaaag aggagacaga agaagaggtg 4620
caagatacaa ggctttagac ccgctgatca gcctcgactg tgccttctag ttgccagcca 4680
tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 4740
ctttcctaat aaaatgagaa aattgcatcg cattgtctga gtaggtgtca ttctattctg 4800
gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 4860
ggggatgcgg tgggctctat gg 4882
<210> 402
<211> 1594
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 402
ccccaactgg ggtaaccttt gggctccccg ggcgcggttc cggatccgga gagggcaggg 60
gatctctcct tacttgtggc gacgtggagg agaaccccgg ccccatgagc atcggcctcc 120
tgtgctgtgc agccttgtct ctcctgtggg caggtccagt gaatgctggt gtcactcaga 180
ccccaaaatt ccaggtcctg aagacaggac agagcatgac actgcagtgt gcccaggata 240
tgaaccatga atacatgtcc tggtatcgac aagacccagg catggggctg aggctgattc 300
attactcagt tggtgctggt atcactgacc aaggagaagt ccccaatggc tacaatgtct 360
ccagatcaac cacagaggat ttcccgctca ggctgctgtc ggctgctccc tcccagacat 420
ctgtgtactt ctgtgccagc agttacgtcg ggaacaccgg ggagctgttt tttggagaag 480
gctctaggct gaccgtactg gaggacctga aaaacgtgtt cccacccgag gtcgctgtgt 540
ttgagccatc agaagcagag atctcccaca cccaaaaggc cacactggta tgcctggcca 600
caggcttcta ccccgaccac gtggagctga gctggtgggt gaatgggaag gaggtgcaca 660
gtggggtcag cacagacccg cagcccctca aggagcagcc cgccctcaat gactccagat 720
actgcctgag cagccgcctg agggtctcgg ccaccttctg gcagaacccc cgcaaccact 780
tccgctgtca agtccagttc tacgggctct cggagaatga cgagtggacc caggataggg 840
ccaaacccgt cacccagatc gtcagcgccg aggcctgggg tagagcagac tgtggcttca 900
cctccgagtc ttaccagcaa ggggtcctgt ctgccaccat cctctatgag atcttgctag 960
ggaaggccac cttgtatgcc gtgctggtca gtgccctcgt gctgatggct atggtcaaga 1020
gaaaggattc cagaggccgg gccaagcggt ccggatccgg agccaccaac ttcagcctgc 1080
tgaagcaggc cggcgacgtg gaggagaacc ccggccccat ggagaccctc ttgggcctgc 1140
ttatcctttg gctgcagctg caatgggtga gcagcaaaca ggaggtgacg cagattcctg 1200
cagctctgag tgtcccagaa ggagaaaact tggttctcaa ctgcagtttc actgatagcg 1260
ctatttacaa cctccagtgg tttaggcagg accctgggaa aggtctcaca tctctgttgc 1320
ttattcagtc aagtcagaga gagcaaacaa gtggaagact taatgcctcg ctggataaat 1380
catcaggacg tagtacttta tacattgcag cttctcagcc tggtgactca gccacctacc 1440
tctgtgctgt gaggcccctg tacggaggaa gctacatacc tacatttgga agaggaacca 1500
gccttattgt tcatccgtat atccagaacc ctgaccctgc gggtggtttg tctggtcaac 1560
caccgcggtc tcagtggtgt acggtacaaa ccca 1594
<210> 403
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 403
ttgagcgggc ccccaccgt 19
<210> 404
<211> 393
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 404
atgactcact atcaggcctt gcttttggac acggaccggg tccagttcgg accggtggta 60
gccctgaacc cggctacgct gctcccactg cctgaggaag ggctgcaaca caactgcctt 120
gatgggacag gtggcggtgg tgtcaccgtc aagttcaagt acaagggtga ggaacttgaa 180
gttgatatta gcaaaatcaa gaaggtttgg cgcgttggta aaatgatatc ttttacttat 240
gacgacaacg gcaagacagg tagaggggca gtgtctgaga aagacgcccc caaggagctg 300
ttgcaaatgt tggaaaagtc tgggaaaaag tctggcggct caaaaagaac cgccgacggc 360
agcgaattcg agcccaagaa gaagaggaaa gtc 393
<210> 405
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 405
cgacgacggc g 11
<210> 406
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 406
tttatttgtg ggcccg 16
<210> 407
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 407
tcgagtgccg catca 15
<210> 408
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 408
aaagtggtga ggacact 17
<210> 409
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 409
aacccacccg agaga 15
<210> 410
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 410
ggaagcggag ctactaactt cagcctgctg aagcaggctg gcgacgtgga ggagaaccct 60
ggacct 66
<210> 411
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 411
gggggaggag gttctggagg cggaggctcc ggaggcggag ggtca 45
<210> 412
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 412
ggaggtggcg ggagc 15
<210> 413
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 413
cccgcaccag cgcct 15
<210> 414
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 414
gaggcagctg ccaaggaagc cgctgccaag gaggcggccg caaag 45
<210> 415
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 415
agtgggagcg agacccctgg gactagcgag tcagctacac ccgaaagc 48
<210> 416
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 416
ggggggtcag gtggatccgg cggaagtggc ggatccggtg gatctggcgg cagt 54
<210> 417
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 417
gaagctgctg ctaag 15
<210> 418
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 418
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 419
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 419
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 420
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 420
Gly Gly Gly Gly Ser
1 5
<210> 421
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 421
Pro Ala Pro Ala Pro
1 5
<210> 422
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 422
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10 15
<210> 423
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 423
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 424
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 424
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser
<210> 425
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 425
Glu Ala Ala Ala Lys
1 5
<210> 426
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 426
Gly Leu Ser Gly Gln Pro Pro Arg Ser Pro Ser Ser Gly Ser Ser Gly
1 5 10 15
<210> 427
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 427
Gly Gly Leu Ser Gly Gln Pro Pro Arg Ser Pro Ser Ser Gly Ser Ser
1 5 10 15
Gly
<210> 428
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 428
gacgagcgcg gcgauaucau cauccauggc cggaugaucc ugacgacgga gaccgccguc 60
gucgacaagc cggccugagc ugcgagaa 88
<210> 429
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 429
gaagccggcc uugcacaugc 20
<210> 430
<211> 95
<212> DNA
<213> Homo sapiens
<400> 430
gcgcgcccgg ctattctcgc agctcaccat ggatgatgat atcgccgcgc tcgtcgtcga 60
caacggctcc ggcatgtgca aggccggctt cgcgg 95
<210> 431
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 431
accacucgac gcucuuaucg 20
Claims (91)
- 핵산을 세포 게놈(cell genome)으로 부위 특이적으로 통합(site-specific integration)하는 방법으로서, 상기 방법이
(a) 세포에
i. 역전사 효소 도메인(reverse transcriptase domain)에 연결된 DNA 결합 뉴클레아제로서, 상기 DNA 결합 뉴클레아제가 니카아제 활성을 포함하는, DNA 결합 뉴클레아제; 및
ii. 통합 서열에 연결된 프라이머 결합 서열을 포함하는 가이드 RNA(gRNA)로서, 상기 gRNA가 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적화(targeting)하며, 상기 DNA 결합 뉴클레아제가 세포 게놈의 가닥을 니킹(nicking)하고 상기 역전사 효소 도메인이 gRNA의 통합 서열을 니킹된 부위에 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공하는, 가이드 RNA(gRNA)를 도입함으로써 세포 게놈의 목적하는 위치에 통합 부위를 혼입하는 단계; 및
(b) 세포에
i. 상기 통합 부위에 상보적이거나 회합(associating)되는 서열에 연결된 핵산을 포함하는 DNA 또는 RNA 가닥; 및
ii. 통합 효소로서, 상기 통합 효소가 통합 부위에 상보적이거나 회합되는 서열의 통합, 재조합, 또는 역전사에 의해 통합 부위에서 핵산을 세포 게놈에 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치에 도입하는, 통합 효소를 도입함으로써 세포 게놈에 핵산을 통합하는 단계를 포함하는, 방법. - 제1항에 있어서, 상기 gRNA가 DNA 결합 뉴클레아제에 의해 니킹된 게놈 가닥에 대한 세포 게놈의 상보적인 가닥에 혼성화되는, 방법.
- 제1항 또는 제2항에 있어서, 상기 통합 효소가 통합 효소를 암호화(encoding)하는 펩티드 또는 핵산으로서 도입되는, 방법.
- 제1항 내제 제3항 중 어느 한 항에 있어서, 상기 DNA 결합 뉴클레아제가 DNA 결합 뉴클레아제를 암호화하는 펩티드 또는 핵산으로서 도입되는, 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 미니서클(minicircle), 플라스미드, mRNA 또는 선형 DNA로서 세포에 도입되는, 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 1000 bp 내지 36,000 bp인, 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 36,000 bp 초과인, 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA 또는 RNA 가닥이 1000 bp 미만인, 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 핵산을 포함하는 상기 DNA가 미니서클로서 세포에 도입되는, 방법.
- 제9항에 있어서, 상기 미니서클이 박테리아 기원의 서열을 포함하지 않는, 방법.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 역전사 효소 도메인에 연결된 상기 DNA 결합 뉴클레아제와 상기 통합 효소가 링커(linker)를 통해 연결되는, 방법.
- 제11항에 있어서, 상기 링커가 절단 가능한, 방법.
- 제11항에 있어서, 상기 링커가 절단 가능하지 않은, 방법.
- 제11항에 있어서, 상기 링커가 역전사 효소에 연결된 DNA 결합 뉴클레아제의 2개의 회합 결합 도메인으로 대체될 수 있는, 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, 베네딕트, KSSJEB, 패티P, 둠(Doom), 스카울(Scowl), 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스에 의해 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 통합 부위가 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위, Vox 부위, 또는 FRT 부위인, 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a/b 니카아제로부터 선택되는, 방법.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 역전사 효소 도메인이 몰로니 뮤린(Moloney Murine) 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX), 조류 골수모세포증 바이러스 역전사 효소(AMV-RT) 및 유박테리움 렉탈레 마투라제 RT (마라톤RT)로 이루어진 그룹으로부터 선택되는, 방법.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 역전사 효소 도메인이 야생형 서열에 대한 돌연변이를 포함하는, 방법.
- 제19항에 있어서, 상기 M-MLV 역전사 효소 도메인이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 방법.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 제2 니킹 가이드 RNA(ngRNA)를 도입하는 단계를 추가로 포함하는, 방법.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 gRNA, DNA 결합 뉴클레아제를 암호화하는 상기 핵산, 상기 역전사 효소, 상보적 또는 회합된 통합 부위에 연결된 핵산을 포함하는 상기 DNA, 상기 통합 효소 및 임의로 상기 ngRNA가 단일 반응으로 세포에 도입되는, 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 gRNA, DNA 결합 뉴클레아제를 암호화하는 상기 핵산, 상기 역전사 효소, 상보적 통합 부위에 연결된 핵산을 포함하는 상기 DNA, 상기 통합 효소 및 임의로 상기 ngRNA가 바이러스, RNP, mRNA, 지질, 또는 중합체성 나노 입자를 사용하여 도입되는, 방법.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 핵산이 리포터 유전자(reporter gene)인, 방법.
- 제25항에 있어서, 상기 리포터 유전자가 형광 단백질인, 방법.
- 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 세포가 분열 세포(dividing cell)인, 방법.
- 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 세포가 비분열 세포인, 방법.
- 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 세포 게놈에서 목적하는 위치가 돌연변이된 유전자의 유전자좌(locus)인, 방법.
- 제1항에 있어서, 상기 핵산이 소분자의 존재하에 단백질의 프로그램 가능한 녹다운을 위한 분해 태그(degradation tag)인, 방법.
- 제1항에 있어서, 상기 세포가 포유류 세포, 박테리아 세포 또는 식물 세포인, 방법.
- 제1항에 있어서, 상기 핵산이 T-세포 또는 자연 살해(NK) 세포에 통합하기 위한 T-세포 수용체(TCR), 키메라 항원 수용체(CAR), 인터류킨, 사이토카인, 또는 면역 체크포인트 유전자(immune checkpoint gene)인, 방법.
- 제32항에 있어서, 상기 TCR, 상기 CAR, 상기 인터류킨, 상기 사이토카인 또는 상기 면역 체크포인트 유전자가 미니서클 DNA를 사용하여 T-세포 또는 NK 세포 게놈의 표적 부위로 혼입되는, 방법.
- 제1항에 있어서, 상기 핵산이 베타 헤모글로빈(HBB) 유전자이고, 상기 세포가 조혈 줄기 세포(HSC)인, 방법.
- 제34항에 있어서, 상기 HBB 유전자가 미니서클 DNA를 사용하여 HSC 게놈에서 표적 부위에 혼입되는, 방법.
- 제34항에 있어서, 상기 핵산이 베타 지중해 빈혈(beta thalassemia) 또는 겸상 적혈구 빈혈(sickle cell anemia)을 담당하는 유전자인, 방법.
- 제1항에 있어서, 상기 핵산이 대사 유전자인, 방법.
- 제37항에 있어서, 상기 대사 유전자가 알파-1 항트립신 결핍 또는 오르니틴 트랜스카르바밀라제(OTC) 결핍에 관여하는, 방법.
- 제37항 또는 제38항에 있어서, 상기 대사 유전자가 유전된 질환에 관여하는 유전자인, 방법.
- 제1항에 있어서, 상기 핵산이 유전된 질환 또는 유전된 증후군에 관여하는 유전자인, 방법.
- 제40항에 있어서, 상기 유전된 질환이 낭포성 섬유증(cystic fibrosis), 가족성 고콜레스테롤혈증(familial hypercholesterolemia), 아데노신 데아미나제(ADA) 결핍, X-연결 SCID(X-SCID), 위스콧-알드리치 증후군(Wiskott-Aldrich syndrome; WAS), 혈색소 침착증(hemochromatosis), 테이-삭스병(Tay-Sachs), 취약 X 증후군(fragile X syndrome), 헌팅턴병(Huntington's disease), 마르판 증후군(Marfan syndrome), 페닐케톤뇨증(phenylketonuria), 또는 근위축증(muscular dystrophy)인, 방법.
- 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터(vector).
- 제42항에 있어서, 상기 링커가 절단 가능한, 벡터.
- 제42항에 있어서, 상기 링커가 절단 가능하지 않은, 벡터.
- 제42항에 있어서, 상기 링커가 역전사 효소에 연결된 DNA 결합 뉴클레아제의 두 개의 회합 결합 도메인을 포함하는, 벡터.
- 제42항에 있어서, 상기 통합 효소가 조건부 활성화 도메인 또는 조건부 발현 도메인을 포함하는, 벡터.
- 제46항에 있어서, 상기 통합 효소가 에스트로겐 수용체에 융합되는, 벡터.
- 제42항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택되는, 벡터.
- 제42항에 있어서, 상기 역전사 효소가 M-MLV 역전사 효소, AMV-RT, 마라톤RT (MarathonRT) 또는 RTX인, 벡터.
- 제49항에 있어서, 상기 역전사 효소가 야생형 M-MLV 역전사 효소에 대해 변형된(modified) M-MLV 역전사 효소인, 벡터.
- 제49항에 있어서, 상기 M-MLV 역전사 효소 도메인이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 벡터.
- 제42항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 돌연변이체로 이루어진 그룹으로부터 선택되는, 벡터.
- 제52항에 있어서, 상기 재조합 효소 또는 인테그라제가 Bxb1 또는 이의 돌연변이체인, 벡터.
- 다음을 포함하는 세포:
(a) 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터;
(b) 프라이머 결합 서열, 통합 서열 및 가이드 서열을 포함하는 gRNA로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, gRNA;
(c) 핵산 및 상기 암호화된 인테그라제, 재조합 효소 또는 역전사 효소에 의해 인식된 서열을 포함하는 DNA 미니서클 및
(d) 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA). - 제54항에 있어서, 상기 미니서클이 박테리아 기원의 서열을 포함하지 않는, 세포.
- 제54항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰(Sheen), 문드레아(Mundrea), BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르(Himar) 1), 마리너(모스(mos) 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 세포.
- 제54항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 세포.
- 제54항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a로 이루어진 그룹으로부터 선택되는, 세포.
- 제54항에 있어서, 상기 역전사 효소가 M-MLV 역전사 효소인, 세포.
- 제59항에 있어서, 상기 역전사 효소가 변형된 M-MLV 역전사 효소인, 세포.
- 제59항에 있어서, M-MLV 역전사 효소의 상기 아미노산 서열이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 세포.
- 제54항 내지 제61항 중 어느 한 항에 있어서, ngRNA를 추가로 포함하는, 세포.
- 링커를 통해 통합 효소에 연결된 역전사 효소에 C-말단 연결된 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 포함하는 폴리펩티드.
- 제63항에 있어서, 상기 링커가 절단 가능한, 폴리펩티드.
- 제63항에 있어서, 상기 링커가 절단 가능하지 않은, 폴리펩티드.
- 제63항에 있어서, 상기 통합 효소가 에스트로겐 수용체에 융합되는, 폴리펩티드.
- 제63항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A, 및 Cas12a/b/c/d/e/f/g/h/i/j로 이루어진 그룹으로부터 선택되는, 폴리펩티드.
- 제63항에 있어서, 상기 역전사 효소가 M-MLV 역전사 효소, AMV-RT, 마라톤RT, 또는 XRT인, 폴리펩티드.
- 제68항에 있어서, 상기 역전사 효소가 야생형 M-MLV 역전사 효소에 대해 변형된 M-MLV인, 폴리펩티드.
- 제69항에 있어서, 상기 M-MLV 역전사 효소 도메인이 D200N, T306K, W313F, T330P 및 L603W로 이루어진 그룹으로부터 선택된 하나 이상의 돌연변이를 포함하는, 폴리펩티드.
- 제63항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, R1, R2, R3, R4, R5, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R2, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 폴리펩티드.
- 제63항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 폴리펩티드.
- 니카아제 활성을 포함하는 DNA 결합 뉴클레아제에 특이적으로 결합하는 gRNA로서, 상기 gRNA가
(a) 니킹된 DNA 가닥에 혼성화되는 프라이머 결합 부위;
(b) 통합 효소에 대한 인식 부위; 및
(c) 세포 게놈에서 표적 부위를 인식하고 DNA 결합 뉴클레아제에 의해 니킹된 가닥에 상보적인 게놈 가닥에 혼성화되는 표적 인식 서열을 포함하는, gRNA. - 제73항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A, 및 Cas12a/b/c/d/e/f/g/h/i/j로 이루어진 그룹으로부터 선택되는, gRNA.
- 제73항에 있어서, 상기 프라이머 결합 부위가 니킹된 DNA 가닥의 3' 말단에 혼성화되는, gRNA.
- 제73항에 있어서, 통합 효소에 대한 상기 인식 부위가 attB 부위, attP 부위, attL 부위, attR 부위, lox71 부위 및 FRT 부위로부터 선택되는, gRNA.
- 제73항에 있어서, 통합 효소에 대한 상기 인식 부위가 Bxb1 부위인, gRNA.
- 둘 이상의 핵산을 세포 게놈으로 부위 특이적으로 통합하는 방법으로서, 상기 방법이
(a) 세포에
i. 역전사 효소 도메인에 연결된 DNA 결합 뉴클레아제로서, 상기 DNA 결합 뉴클레아제가 니카아제 활성을 포함하는, DNA 결합 뉴클레아제; 및
ii. 각각 프라이머 결합 서열을 포함하고, 고유한 통합 서열에 연결된 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 DNA 결합 뉴클레아제와 상호작용하고 세포 게놈에서 목적하는 위치를 표적화하며, 상기 DNA 결합 뉴클레아제가 세포 게놈의 가닥을 니킹하고 상기 역전사 효소 도메인이 gRNA의 통합 서열 각각을 니킹된 부위에 혼입하여 세포 게놈의 목적하는 위치에 통합 부위를 제공하는, 두 개의 가이드 RNA(gRNA)를 도입함으로써 세포 게놈의 목적하는 위치에 두 개의 통합 부위를 혼입하는 단계; 및
(b) 세포에
i. 핵산을 포함하는 2개 이상의 DNA 또는 RNA로서, 각 DNA가 직교 통합 부위(orthogonal integration site)에 의해 측면에 있는(flanked), 2개 이상의 DNA 또는 RNA; 및
ii. 통합 효소로서, 상기 통합 효소가 통합 부위에 상보적이거나 회합되는 서열의 인테그라제, 재조합 효소, 또는 역전사 효소에 의해 통합 부위에서 핵산을 세포 게놈에 혼입하여 핵산을 세포의 세포 게놈의 목적하는 위치에 도입하는, 통합 효소를 도입함으로써 핵산을 통합하는 단계를 포함하는, 방법. - 제78항에 있어서, 세포 게놈에 삽입된 상기 두 개의 상이한 통합 부위 각각이 상이한 회문(palindromic) 또는 비회문 중심 디뉴클레오티드를 포함하는 attB 서열인, 방법.
- 제78항에 있어서, 세포 게놈에 삽입된 상기 두 개의 상이한 통합 부위 각각이 상이한 회문 또는 비회문 중심 디뉴클레오티드를 포함하는 attP 서열인, 방법.
- 제78항에 있어서, 상기 통합 효소가 핵산을 포함하는 2개 이상의 DNA 또는 RNA 각각이 한 쌍의 직교 attB 부위 서열 및 attP 부위 서열의 재조합을 통해 게놈으로 핵산의 통합을 방향적으로 가능하게 하도록 하는, 방법.
- 제78항에 있어서, 상기 통합 효소가 Cre, Dre, Vika, Bxb1, C31, RDF, FLP, BT1, TP901-1, A118, FC1, C1, MR11, TG1, 370.1, Wβ, BL3, SPBc, K38, 피치스, 베라크루즈, 레베우카, 테이아, KSSJEB, 패티P, 둠, 스카울, 로클리, 스위처, Bob3, 트루브, 아브로게이트, 앵글피시, 사파이어, 스키폴, 컨셉II, 뮤줌, 세베루스, 에어미드, 베네딕트, 힌더, 아이클리레드, 쉰, 문드레아, BxZ2, RV, R1, R2, R3, R4, R5, L1, Tol2 Tc1, Tc3, 마리너(히마르 1), 마리너(모스 1) 및 미노스로 암호화된 레트로트랜스포사제, 및 이들의 임의의 돌연변이체로 이루어진 그룹으로부터 선택되는, 방법.
- 제78항에 있어서, 상기 통합 효소가 Bxb1 또는 이의 돌연변이체인, 방법.
- 제78항에 있어서, 유전자를 포함하는 상기 DNA가 세포 유지 경로, 세포 분열 또는 신호 전달 경로에 관여하는 유전자인, 방법.
- 제78항에 있어서, 상기 역전사 효소 도메인이 몰로니 뮤린 백혈병 바이러스(M-MLV) 역전사 효소 도메인, 전사 제노폴리머라제(RTX) 또는 조류 골수모세포증 바이러스 역전사 효소(AMV-RT)를 포함하는, 방법.
- 제78항에 있어서, 니카아제 활성을 포함하는 상기 DNA 결합 뉴클레아제가 Cas9-D10A, Cas9-H840A 및 Cas12a/b로 이루어진 그룹으로부터 선택되는, 방법.
- 제78항에 있어서, 상기 attB 부위 서열 및 attP 부위 서열의 쌍이 서열번호 5 및 서열번호 6, 서열번호 7 및 서열번호 8, 서열번호 9 및 서열번호 10, 서열번호 11 및 서열번호 12, 서열번호 13 및 서열번호 14, 서열번호 15 및 서열번호 16, 서열번호 17 및 서열번호 18, 서열번호 19 및 서열번호 20, 서열번호 21 및 서열번호 22, 서열번호 23 및 서열번호 24, 서열번호 25 및 서열번호 26, 서열번호 27 및 서열번호 28, 서열번호 29 및 서열번호 30, 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 34, 및 서열번호 35 및 서열번호 36으로 이루어진 그룹으로부터 선택되는, 방법.
- 다음을 포함하는 세포:
(a) 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되며, 상기 역전사 효소가 링커를 통해 재조합 효소 또는 인테그라제에 연결되는, 벡터;
(b) 프라이머 결합 서열, 통합 서열 및 가이드 서열을 포함하는 두 개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 DNA 결합 뉴클레아제와 상호작용할 수 있는, 두 개의 가이드 RNA(gRNA);
(c) 핵산 및 상기 암호화된 인테그라제 또는 재조합 효소에 의해 인식된 측면에 있는 attB 부위 서열 및 attP 부위 서열의 쌍을 포함하는 2개 이상의 DNA 또는 RNA 가닥; 및 임의로
(d) 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA). - 변형된 게놈을 포함하는 세포로서, 상기 변형이 상기 세포에
(a) 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터;
(b) 각각 프라이머 결합 서열, 게놈 통합 서열, 및 가이드 서열을 포함하는 2개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 2개의 가이드 RNA(gRNA); 및 임의로,
(c) 니카아제 활성을 포함하는 암호화된 뉴클레아제를 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA)를 도입함으로써 세포 게놈 내에 두 개의 직교 통합 부위의 혼입을 포함하는, 세포. - 둘 이상의 핵산을 제90항의 세포의 세포 게놈에 통합하는 방법으로서, 상기 방법이 상기 세포에
(a) 각각 핵산 및 한 쌍의 측면에 있는 직교 통합 부위 서열을 포함하는 두 개 이상의 DNA;
(b) 핵산을 포함한 두 개 이상의 DNA의 방향적 연결을 가능하게 하는 통합 부위 서열을 인식할 수 있는 통합 효소; 및
(c) 제1 DNA의 5' 직교 통합 서열을 제1 게놈 통합 서열과 통합하고, 마지막 DNA의 3' 직교 통합 서열을 마지막 게놈 통합 서열과 통합하여 둘 이상의 핵산을 세포 게놈에 혼입함으로써 핵산을 세포 게놈에 도입할 수 있도록 함을 포함하는, 방법. - 변형된 게놈을 포함하는 세포로서, 상기 변형된 게놈의 변형이 상기 세포에
(a) 니카아제 활성을 포함하는 DNA 결합 뉴클레아제를 암호화하는 핵산을 포함하는 벡터로서, 상기 DNA 결합 뉴클레아제가 역전사 효소에 C-말단 연결되는, 벡터;
(b) 각각 프라이머 결합 서열, 게놈 통합 서열 및 가이드 서열을 포함하는 2개의 가이드 RNA(gRNA)로서, 상기 gRNA가 니카아제 활성을 포함하는 암호화된 뉴클레아제와 상호작용할 수 있는, 2개의 가이드 RNA(gRNA); 및 임의로
(c) 니카아제 활성을 포함하는 암호화된 뉴클레아제에 결합할 수 있는 니킹 가이드 RNA(ngRNA)로서, 상기 ngRNA가 gRNA로부터 떨어진 서열을 표적으로 하는, 니킹 가이드 RNA(ngRNA);
(d) 핵산을 포함하는 2개 이상의 DNA 또는 RNA로서, 각각의 DNA가 직교 통합 부위에 의해 측면에 있는, 2개 이상의 DNA 또는 RNA; 및
(e) 통합 효소로서, 상기 통합 효소가 핵산을 통합 부위에서 세포 게놈 내로 혼입하는, 통합 효소를 도입함으로써 세포 게놈 내에 2개의 직교 통합 부위의 혼입을 포함하는, 세포.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063094803P | 2020-10-21 | 2020-10-21 | |
US63/094,803 | 2020-10-21 | ||
US202163222550P | 2021-07-16 | 2021-07-16 | |
US63/222,550 | 2021-07-16 | ||
PCT/US2021/056006 WO2022087235A1 (en) | 2020-10-21 | 2021-10-21 | Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste) |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230091894A true KR20230091894A (ko) | 2023-06-23 |
Family
ID=78821040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237013187A KR20230091894A (ko) | 2020-10-21 | 2021-10-21 | 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 |
Country Status (10)
Country | Link |
---|---|
US (6) | US20220145293A1 (ko) |
EP (1) | EP4232583A1 (ko) |
JP (1) | JP2023546597A (ko) |
KR (1) | KR20230091894A (ko) |
CN (1) | CN116419975A (ko) |
AU (1) | AU2021364781A1 (ko) |
CA (1) | CA3196116A1 (ko) |
IL (1) | IL301368A (ko) |
MX (1) | MX2023004383A (ko) |
WO (1) | WO2022087235A1 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2021364781A1 (en) | 2020-10-21 | 2023-06-01 | Massachusetts Institute Of Technology | Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste) |
GB202113933D0 (en) * | 2021-09-29 | 2021-11-10 | Genome Res Ltd | Methods for gene editing |
WO2023076898A1 (en) * | 2021-10-25 | 2023-05-04 | The Broad Institute, Inc. | Methods and compositions for editing a genome with prime editing and a recombinase |
AU2022375820A1 (en) * | 2021-11-01 | 2024-06-13 | Tome Biosciences, Inc. | Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo |
WO2023114992A1 (en) * | 2021-12-17 | 2023-06-22 | Massachusetts Institute Of Technology | Programmable insertion approaches via reverse transcriptase recruitment |
WO2023122764A1 (en) | 2021-12-22 | 2023-06-29 | Tome Biosciences, Inc. | Co-delivery of a gene editor construct and a donor template |
WO2023205744A1 (en) * | 2022-04-20 | 2023-10-26 | Tome Biosciences, Inc. | Programmable gene insertion compositions |
US20230407280A1 (en) | 2022-04-20 | 2023-12-21 | Massachusetts Institute Of Technology | Programmable gene editing using guide rna pair |
US20230383274A1 (en) | 2022-04-20 | 2023-11-30 | Massachusetts Institute Of Technology | Site specific genetic engineering utilizing trans-template rnas |
WO2023215831A1 (en) * | 2022-05-04 | 2023-11-09 | Tome Biosciences, Inc. | Guide rna compositions for programmable gene insertion |
WO2023225670A2 (en) * | 2022-05-20 | 2023-11-23 | Tome Biosciences, Inc. | Ex vivo programmable gene insertion |
WO2024020346A2 (en) | 2022-07-18 | 2024-01-25 | Renagade Therapeutics Management Inc. | Gene editing components, systems, and methods of use |
WO2024020587A2 (en) * | 2022-07-22 | 2024-01-25 | Tome Biosciences, Inc. | Pleiopluripotent stem cell programmable gene insertion |
WO2024100604A1 (en) | 2022-11-09 | 2024-05-16 | Juno Therapeutics Gmbh | Methods for manufacturing engineered immune cells |
WO2024138194A1 (en) | 2022-12-22 | 2024-06-27 | Tome Biosciences, Inc. | Platforms, compositions, and methods for in vivo programmable gene insertion |
CN117720672B (zh) * | 2024-02-07 | 2024-04-30 | 深锐(天津)生物医学有限公司 | 先导编辑系统及其应用 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
MY170059A (en) | 2012-12-17 | 2019-07-02 | Harvard College | Rna-guided human genome engineering |
NZ712727A (en) | 2013-03-14 | 2017-05-26 | Caribou Biosciences Inc | Compositions and methods of nucleic acid-targeting nucleic acids |
US20140349400A1 (en) * | 2013-03-15 | 2014-11-27 | Massachusetts Institute Of Technology | Programmable Modification of DNA |
US10563225B2 (en) | 2013-07-26 | 2020-02-18 | President And Fellows Of Harvard College | Genome engineering |
US9340800B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | Extended DNA-sensing GRNAS |
US9388430B2 (en) * | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
CA2952613A1 (en) | 2014-06-17 | 2015-12-23 | Poseida Therapeutics, Inc. | A method for directing proteins to specific loci in the genome and uses thereof |
US10059940B2 (en) | 2015-01-27 | 2018-08-28 | Minghong Zhong | Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents |
WO2016205728A1 (en) | 2015-06-17 | 2016-12-22 | Massachusetts Institute Of Technology | Crispr mediated recording of cellular events |
US11447768B2 (en) | 2016-03-01 | 2022-09-20 | University Of Florida Research Foundation, Incorporated | Molecular cell diary system |
EP3443088B1 (en) | 2016-04-13 | 2024-09-18 | Editas Medicine, Inc. | Grna fusion molecules, gene editing systems, and methods of use thereof |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
EP4431607A2 (en) | 2016-09-09 | 2024-09-18 | The Board of Trustees of the Leland Stanford Junior University | High-throughput precision genome editing |
US11274033B2 (en) | 2016-09-12 | 2022-03-15 | MEMS Drive (Nanjing) Co., Ltd. | MEMS actuation systems and methods |
JP2020510439A (ja) | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
WO2019051097A1 (en) | 2017-09-08 | 2019-03-14 | The Regents Of The University Of California | RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME |
US11578323B2 (en) | 2017-12-14 | 2023-02-14 | Bayer Healthcare Llc | RNA-programmable endonuclease systems and their use in genome editing and other applications |
BR112021003380A2 (pt) | 2018-08-28 | 2021-05-18 | Flagship Pioneering Innovations Vi, Llc | métodos e composições para modulação de um genoma |
WO2020191249A1 (en) * | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
US10837021B1 (en) | 2019-06-06 | 2020-11-17 | Inscripta, Inc. | Curing for recursive nucleic acid-guided cell editing |
MX2022002613A (es) | 2019-09-03 | 2022-06-02 | Myeloid Therapeutics Inc | Metodos y composiciones para la integracion del genoma. |
WO2021072328A1 (en) | 2019-10-10 | 2021-04-15 | The Broad Institute, Inc. | Methods and compositions for prime editing rna |
EP4085141A4 (en) * | 2019-12-30 | 2024-03-06 | The Broad Institute, Inc. | GENOME EDITING USING ACTIVATED, FULLY ACTIVE CRISPR COMPLEXES OF REVERSE TRANSCRIPTASE |
AU2021236683A1 (en) | 2020-03-19 | 2022-11-17 | Intellia Therapeutics, Inc. | Methods and compositions for directed genome editing |
MX2022014008A (es) | 2020-05-08 | 2023-02-09 | Broad Inst Inc | Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo. |
US11299731B1 (en) * | 2020-09-15 | 2022-04-12 | Inscripta, Inc. | CRISPR editing to embed nucleic acid landing pads into genomes of live cells |
JP2023543803A (ja) | 2020-09-24 | 2023-10-18 | ザ ブロード インスティテュート,インコーポレーテッド | プライム編集ガイドrna、その組成物、及びその使用方法 |
AU2021364781A1 (en) | 2020-10-21 | 2023-06-01 | Massachusetts Institute Of Technology | Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste) |
JP2023549125A (ja) | 2020-11-05 | 2023-11-22 | ユニバーシティ オブ ワシントン | プライム編集に基づく精密なゲノムの削除と置換方法 |
-
2021
- 2021-10-21 AU AU2021364781A patent/AU2021364781A1/en active Pending
- 2021-10-21 MX MX2023004383A patent/MX2023004383A/es unknown
- 2021-10-21 US US17/451,734 patent/US20220145293A1/en not_active Abandoned
- 2021-10-21 CA CA3196116A patent/CA3196116A1/en active Pending
- 2021-10-21 IL IL301368A patent/IL301368A/en unknown
- 2021-10-21 EP EP21819624.4A patent/EP4232583A1/en active Pending
- 2021-10-21 KR KR1020237013187A patent/KR20230091894A/ko unknown
- 2021-10-21 JP JP2023524355A patent/JP2023546597A/ja active Pending
- 2021-10-21 WO PCT/US2021/056006 patent/WO2022087235A1/en active Application Filing
- 2021-10-21 CN CN202180072013.8A patent/CN116419975A/zh active Pending
-
2022
- 2022-01-28 US US17/649,308 patent/US11572556B2/en active Active
- 2022-12-14 US US18/066,233 patent/US11834658B2/en active Active
- 2022-12-14 US US18/066,223 patent/US11827881B2/en active Active
-
2023
- 2023-10-16 US US18/487,610 patent/US20240076662A1/en active Pending
- 2023-10-16 US US18/487,744 patent/US11952571B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20220154224A1 (en) | 2022-05-19 |
US20230279391A1 (en) | 2023-09-07 |
US11952571B2 (en) | 2024-04-09 |
US11572556B2 (en) | 2023-02-07 |
EP4232583A1 (en) | 2023-08-30 |
JP2023546597A (ja) | 2023-11-06 |
US11834658B2 (en) | 2023-12-05 |
WO2022087235A1 (en) | 2022-04-28 |
AU2021364781A1 (en) | 2023-06-01 |
US20240067961A1 (en) | 2024-02-29 |
US11827881B2 (en) | 2023-11-28 |
US20240076662A1 (en) | 2024-03-07 |
MX2023004383A (es) | 2023-05-04 |
CN116419975A (zh) | 2023-07-11 |
US20220145293A1 (en) | 2022-05-12 |
US20230135673A1 (en) | 2023-05-04 |
IL301368A (en) | 2023-05-01 |
CA3196116A1 (en) | 2022-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230091894A (ko) | 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 | |
AU2018229561B2 (en) | Recombinant adenoviruses and use thereof | |
US20030119104A1 (en) | Chromosome-based platforms | |
US6156567A (en) | Truncated transcriptionally active cytomegalovirus promoters | |
US6090393A (en) | Recombinant canine adenoviruses, method for making and uses thereof | |
KR20230019843A (ko) | 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물 | |
US10704061B2 (en) | Lentiviral vectors | |
KR20210056329A (ko) | 신규 cas12b 효소 및 시스템 | |
KR101982360B1 (ko) | 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도 | |
DK2718440T3 (en) | NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF | |
US20040003420A1 (en) | Modified recombinase | |
KR102516697B1 (ko) | 조작된 캐스케이드 구성성분 및 캐스케이드 복합체 | |
CN110684804B (zh) | 递送外源rnp的慢病毒载体及其制备方法 | |
KR20210080375A (ko) | 암 면역요법을 위한 재조합 폭스바이러스 | |
AU782960B2 (en) | Conditional gene trapping construct for the disruption of genes | |
KR102614328B1 (ko) | T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스 | |
KR20190138274A (ko) | 클로스트리디움 박테리아의 변형을 위한 최적화된 유전 툴 | |
KR102584628B1 (ko) | T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
AU2017252409A1 (en) | Compositions and methods for nucleic acid expression and protein secretion in bacteroides | |
JP2023025182A (ja) | T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム | |
CN115968300A (zh) | 用于体内转导的载体和方法 | |
CN114729387A (zh) | 遗传修饰真菌和与其相关方法和用途 | |
EP1395612A2 (en) | Modified recombinase | |
KR20240029020A (ko) | Dna 변형을 위한 crispr-트랜스포손 시스템 |