KR102606174B1 - 트리플 가이드 서열을 지닌 crispr/cas9를 사용한 엑손 스키핑 변형을 위한 최적화된 전략 - Google Patents
트리플 가이드 서열을 지닌 crispr/cas9를 사용한 엑손 스키핑 변형을 위한 최적화된 전략 Download PDFInfo
- Publication number
- KR102606174B1 KR102606174B1 KR1020197022753A KR20197022753A KR102606174B1 KR 102606174 B1 KR102606174 B1 KR 102606174B1 KR 1020197022753 A KR1020197022753 A KR 1020197022753A KR 20197022753 A KR20197022753 A KR 20197022753A KR 102606174 B1 KR102606174 B1 KR 102606174B1
- Authority
- KR
- South Korea
- Prior art keywords
- delete delete
- promoter
- sequence encoding
- sequence
- grna
- Prior art date
Links
- 108091033409 CRISPR Proteins 0.000 title abstract description 112
- 238000010354 CRISPR gene editing Methods 0.000 title abstract description 3
- 238000012986 modification Methods 0.000 title description 13
- 230000004048 modification Effects 0.000 title description 12
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 399
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 claims abstract description 149
- 230000014509 gene expression Effects 0.000 claims abstract description 144
- 108010069091 Dystrophin Proteins 0.000 claims abstract description 125
- 210000003205 muscle Anatomy 0.000 claims description 119
- 102000001039 Dystrophin Human genes 0.000 claims description 112
- 150000007523 nucleic acids Chemical class 0.000 claims description 81
- 102000039446 nucleic acids Human genes 0.000 claims description 74
- 108020004707 nucleic acids Proteins 0.000 claims description 74
- 238000000034 method Methods 0.000 claims description 51
- 230000008685 targeting Effects 0.000 claims description 41
- 201000006938 muscular dystrophy Diseases 0.000 claims description 37
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 30
- 108020005067 RNA Splice Sites Proteins 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 17
- 230000001939 inductive effect Effects 0.000 claims description 12
- 239000003814 drug Substances 0.000 claims description 11
- 241000702421 Dependoparvovirus Species 0.000 claims description 10
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims 1
- 108700026220 vif Genes Proteins 0.000 claims 1
- 230000035772 mutation Effects 0.000 abstract description 103
- 238000012217 deletion Methods 0.000 abstract description 31
- 230000037430 deletion Effects 0.000 abstract description 31
- 238000010362 genome editing Methods 0.000 abstract description 29
- 241000282472 Canis lupus familiaris Species 0.000 abstract description 20
- 230000001404 mediated effect Effects 0.000 abstract description 18
- 208000026350 Inborn Genetic disease Diseases 0.000 abstract description 4
- 208000016361 genetic disease Diseases 0.000 abstract description 4
- 238000011577 humanized mouse model Methods 0.000 abstract description 3
- 108090000623 proteins and genes Proteins 0.000 description 170
- 210000004027 cell Anatomy 0.000 description 138
- 239000013598 vector Substances 0.000 description 106
- 102000004169 proteins and genes Human genes 0.000 description 69
- 235000018102 proteins Nutrition 0.000 description 68
- 208000024891 symptom Diseases 0.000 description 67
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 62
- 239000000203 mixture Substances 0.000 description 60
- 239000013607 AAV vector Substances 0.000 description 58
- 108020004414 DNA Proteins 0.000 description 57
- 101710163270 Nuclease Proteins 0.000 description 54
- 241000699670 Mus sp. Species 0.000 description 47
- 201000010099 disease Diseases 0.000 description 39
- 238000012360 testing method Methods 0.000 description 33
- 239000013612 plasmid Substances 0.000 description 32
- 239000000047 product Substances 0.000 description 32
- 230000002068 genetic effect Effects 0.000 description 31
- 239000002773 nucleotide Substances 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 230000001105 regulatory effect Effects 0.000 description 30
- 241000701161 unidentified adenovirus Species 0.000 description 30
- 241000282414 Homo sapiens Species 0.000 description 28
- 238000012384 transportation and delivery Methods 0.000 description 28
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 25
- 238000003780 insertion Methods 0.000 description 25
- 230000037431 insertion Effects 0.000 description 25
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 24
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 23
- 208000035475 disorder Diseases 0.000 description 23
- 101150015424 dmd gene Proteins 0.000 description 23
- 108020004705 Codon Proteins 0.000 description 22
- 108010034529 leucyl-lysine Proteins 0.000 description 22
- 241000699666 Mus <mouse, genus> Species 0.000 description 21
- 239000002585 base Substances 0.000 description 21
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 21
- 208000023105 Huntington disease Diseases 0.000 description 20
- 238000001727 in vivo Methods 0.000 description 19
- 239000013603 viral vector Substances 0.000 description 19
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 18
- 238000002347 injection Methods 0.000 description 18
- 239000007924 injection Substances 0.000 description 18
- 102000002804 Ataxia Telangiectasia Mutated Proteins Human genes 0.000 description 17
- 241000700605 Viruses Species 0.000 description 17
- 239000003623 enhancer Substances 0.000 description 17
- 230000006870 function Effects 0.000 description 17
- 210000001087 myotubule Anatomy 0.000 description 17
- 238000003757 reverse transcription PCR Methods 0.000 description 17
- 238000011282 treatment Methods 0.000 description 17
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 16
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 16
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 16
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 16
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 16
- 241000649045 Adeno-associated virus 10 Species 0.000 description 16
- 241000649046 Adeno-associated virus 11 Species 0.000 description 16
- 102100022437 Myotonin-protein kinase Human genes 0.000 description 16
- 238000003776 cleavage reaction Methods 0.000 description 16
- 238000000338 in vitro Methods 0.000 description 16
- 230000007017 scission Effects 0.000 description 16
- 210000002027 skeletal muscle Anatomy 0.000 description 16
- 210000001519 tissue Anatomy 0.000 description 16
- 102100035673 Centrosomal protein of 290 kDa Human genes 0.000 description 15
- 108010002947 Connectin Proteins 0.000 description 15
- 102100026260 Titin Human genes 0.000 description 15
- 238000003745 diagnosis Methods 0.000 description 15
- 108090000765 processed proteins & peptides Proteins 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 230000003612 virological effect Effects 0.000 description 15
- 108091079001 CRISPR RNA Proteins 0.000 description 14
- 101710198317 Centrosomal protein of 290 kDa Proteins 0.000 description 14
- 108700024394 Exon Proteins 0.000 description 14
- 102000003970 Vinculin Human genes 0.000 description 14
- 108090000384 Vinculin Proteins 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 210000005260 human cell Anatomy 0.000 description 14
- 238000007918 intramuscular administration Methods 0.000 description 14
- 239000007927 intramuscular injection Substances 0.000 description 14
- 238000010255 intramuscular injection Methods 0.000 description 14
- 230000033001 locomotion Effects 0.000 description 14
- 201000009340 myotonic dystrophy type 1 Diseases 0.000 description 14
- 230000000750 progressive effect Effects 0.000 description 14
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 13
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 13
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- 239000000835 fiber Substances 0.000 description 13
- 230000001965 increasing effect Effects 0.000 description 13
- 125000006850 spacer group Chemical group 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 208000003019 Neurofibromatosis 1 Diseases 0.000 description 12
- 108010044940 alanylglutamine Proteins 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 210000000663 muscle cell Anatomy 0.000 description 12
- 238000004806 packaging method and process Methods 0.000 description 12
- 210000002966 serum Anatomy 0.000 description 12
- 201000009342 Limb-girdle muscular dystrophy Diseases 0.000 description 11
- 206010068871 Myotonic dystrophy Diseases 0.000 description 11
- 206010028980 Neoplasm Diseases 0.000 description 11
- 208000024834 Neurofibromatosis type 1 Diseases 0.000 description 11
- 238000003556 assay Methods 0.000 description 11
- 238000010367 cloning Methods 0.000 description 11
- 230000006378 damage Effects 0.000 description 11
- 238000010172 mouse model Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- 238000001262 western blot Methods 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 10
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 108010062796 arginyllysine Proteins 0.000 description 10
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 10
- 108010049041 glutamylalanine Proteins 0.000 description 10
- 210000004962 mammalian cell Anatomy 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 10
- 102000005962 receptors Human genes 0.000 description 10
- 108020003175 receptors Proteins 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 241000282412 Homo Species 0.000 description 9
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 9
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 9
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 9
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- 230000001580 bacterial effect Effects 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 230000007547 defect Effects 0.000 description 9
- 230000002950 deficient Effects 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 239000002502 liposome Substances 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 208000002761 neurofibromatosis 2 Diseases 0.000 description 9
- 230000001177 retroviral effect Effects 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 9
- 238000010453 CRISPR/Cas method Methods 0.000 description 8
- 102000003869 Frataxin Human genes 0.000 description 8
- 108090000217 Frataxin Proteins 0.000 description 8
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 8
- 208000010428 Muscle Weakness Diseases 0.000 description 8
- 206010028289 Muscle atrophy Diseases 0.000 description 8
- 206010028372 Muscular weakness Diseases 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 210000004556 brain Anatomy 0.000 description 8
- 244000309466 calf Species 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 description 8
- 210000002414 leg Anatomy 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 208000022032 neurofibromatosis type 2 Diseases 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 7
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 7
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 7
- 208000009905 Neurofibromatoses Diseases 0.000 description 7
- 108010085839 Neurofibromin 2 Proteins 0.000 description 7
- 102000007517 Neurofibromin 2 Human genes 0.000 description 7
- 150000001413 amino acids Chemical group 0.000 description 7
- 239000011575 calcium Substances 0.000 description 7
- 229910052791 calcium Inorganic materials 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 230000034994 death Effects 0.000 description 7
- 239000003937 drug carrier Substances 0.000 description 7
- 238000012744 immunostaining Methods 0.000 description 7
- 108010017391 lysylvaline Proteins 0.000 description 7
- 201000000585 muscular atrophy Diseases 0.000 description 7
- 210000004165 myocardium Anatomy 0.000 description 7
- 201000004931 neurofibromatosis Diseases 0.000 description 7
- 108010031719 prolyl-serine Proteins 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 206010039722 scoliosis Diseases 0.000 description 7
- 241001430294 unidentified retrovirus Species 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 6
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 102000014450 RNA Polymerase III Human genes 0.000 description 6
- 108010078067 RNA Polymerase III Proteins 0.000 description 6
- 238000012300 Sequence Analysis Methods 0.000 description 6
- 241000193996 Streptococcus pyogenes Species 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 210000000170 cell membrane Anatomy 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 210000004081 cilia Anatomy 0.000 description 6
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 description 6
- 230000007812 deficiency Effects 0.000 description 6
- 230000006735 deficit Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 230000000977 initiatory effect Effects 0.000 description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010009298 lysylglutamic acid Proteins 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 230000002028 premature Effects 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 210000002235 sarcomere Anatomy 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 108010005652 splenotritin Proteins 0.000 description 6
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 6
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 6
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- 206010003591 Ataxia Diseases 0.000 description 5
- 206010003594 Ataxia telangiectasia Diseases 0.000 description 5
- 208000032170 Congenital Abnormalities Diseases 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 208000037150 Dysferlin-related limb-girdle muscular dystrophy R2 Diseases 0.000 description 5
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 5
- 102000004533 Endonucleases Human genes 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- 208000024412 Friedreich ataxia Diseases 0.000 description 5
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 5
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 5
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 5
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- 201000003533 Leber congenital amaurosis Diseases 0.000 description 5
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 5
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 5
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 5
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 5
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 5
- 102000003792 Metallothionein Human genes 0.000 description 5
- 108090000157 Metallothionein Proteins 0.000 description 5
- 201000001085 Miyoshi muscular dystrophy 1 Diseases 0.000 description 5
- 208000021642 Muscular disease Diseases 0.000 description 5
- 201000009623 Myopathy Diseases 0.000 description 5
- 108010052185 Myotonin-Protein Kinase Proteins 0.000 description 5
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 5
- 108010029485 Protein Isoforms Proteins 0.000 description 5
- 102000001708 Protein Isoforms Human genes 0.000 description 5
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 description 5
- 206010043189 Telangiectasia Diseases 0.000 description 5
- 210000001766 X chromosome Anatomy 0.000 description 5
- 239000004480 active ingredient Substances 0.000 description 5
- 108010008355 arginyl-glutamine Proteins 0.000 description 5
- 201000009563 autosomal recessive limb-girdle muscular dystrophy type 2B Diseases 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 210000003414 extremity Anatomy 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 108010079547 glutamylmethionine Proteins 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 210000002443 helper t lymphocyte Anatomy 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 238000003364 immunohistochemistry Methods 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 238000001964 muscle biopsy Methods 0.000 description 5
- 210000005036 nerve Anatomy 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- 208000009056 telangiectasis Diseases 0.000 description 5
- 238000002560 therapeutic procedure Methods 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 102000000872 ATM Human genes 0.000 description 4
- 102000007469 Actins Human genes 0.000 description 4
- 108010085238 Actins Proteins 0.000 description 4
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 4
- 101150065175 Atm gene Proteins 0.000 description 4
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 4
- 108090000565 Capsid Proteins Proteins 0.000 description 4
- 208000031229 Cardiomyopathies Diseases 0.000 description 4
- 208000015374 Central core disease Diseases 0.000 description 4
- 102100023321 Ceruloplasmin Human genes 0.000 description 4
- 206010008748 Chorea Diseases 0.000 description 4
- 206010010356 Congenital anomaly Diseases 0.000 description 4
- 230000004543 DNA replication Effects 0.000 description 4
- 206010012289 Dementia Diseases 0.000 description 4
- 102100032248 Dysferlin Human genes 0.000 description 4
- 241000589601 Francisella Species 0.000 description 4
- 206010017577 Gait disturbance Diseases 0.000 description 4
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 4
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 4
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 4
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 4
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 4
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 4
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 4
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 4
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 4
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 4
- 206010019280 Heart failures Diseases 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- 241001112693 Lachnospiraceae Species 0.000 description 4
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 4
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 4
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 4
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 4
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 4
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 4
- 102000043131 MHC class II family Human genes 0.000 description 4
- 108091054438 MHC class II family Proteins 0.000 description 4
- 208000034819 Mobility Limitation Diseases 0.000 description 4
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 4
- 208000029578 Muscle disease Diseases 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108010069196 Neural Cell Adhesion Molecules Proteins 0.000 description 4
- 102100023616 Neural cell adhesion molecule L1-like protein Human genes 0.000 description 4
- 206010033799 Paralysis Diseases 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 4
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 4
- 108010071690 Prealbumin Proteins 0.000 description 4
- 241000605861 Prevotella Species 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 238000010240 RT-PCR analysis Methods 0.000 description 4
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 4
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 4
- 102000054727 Serum Amyloid A Human genes 0.000 description 4
- 108700028909 Serum Amyloid A Proteins 0.000 description 4
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 4
- 108020005202 Viral DNA Proteins 0.000 description 4
- 239000011543 agarose gel Substances 0.000 description 4
- 239000012736 aqueous medium Substances 0.000 description 4
- 239000007864 aqueous solution Substances 0.000 description 4
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 4
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 210000004413 cardiac myocyte Anatomy 0.000 description 4
- 239000000969 carrier Substances 0.000 description 4
- 101150055766 cat gene Proteins 0.000 description 4
- 201000007303 central core myopathy Diseases 0.000 description 4
- 208000012601 choreatic disease Diseases 0.000 description 4
- 230000001149 cognitive effect Effects 0.000 description 4
- 210000002808 connective tissue Anatomy 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 206010012601 diabetes mellitus Diseases 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 208000016354 hearing loss disease Diseases 0.000 description 4
- 210000005003 heart tissue Anatomy 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 210000004379 membrane Anatomy 0.000 description 4
- 230000037230 mobility Effects 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 210000004197 pelvis Anatomy 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 230000002265 prevention Effects 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000029058 respiratory gaseous exchange Effects 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 230000003007 single stranded DNA break Effects 0.000 description 4
- 210000001057 smooth muscle myoblast Anatomy 0.000 description 4
- 230000035882 stress Effects 0.000 description 4
- 208000011580 syndromic disease Diseases 0.000 description 4
- 238000012385 systemic delivery Methods 0.000 description 4
- -1 t-globin Proteins 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 239000003981 vehicle Substances 0.000 description 4
- 230000009184 walking Effects 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 3
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 3
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 3
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 3
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 3
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 3
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 3
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 3
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 3
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 3
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 3
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 3
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 3
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 3
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 3
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 3
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 3
- 108091032955 Bacterial small RNA Proteins 0.000 description 3
- 201000006935 Becker muscular dystrophy Diseases 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- 101150078156 Cep290 gene Proteins 0.000 description 3
- 108060005980 Collagenase Proteins 0.000 description 3
- 102000029816 Collagenase Human genes 0.000 description 3
- 206010056370 Congestive cardiomyopathy Diseases 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 206010011878 Deafness Diseases 0.000 description 3
- 201000010046 Dilated cardiomyopathy Diseases 0.000 description 3
- 206010013887 Dysarthria Diseases 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 3
- 101150103820 Fxn gene Proteins 0.000 description 3
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 3
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 3
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 3
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 3
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 3
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 3
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 3
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 3
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 3
- IIMZHVKZBGSEKZ-SZMVWBNQSA-N Gln-Trp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O IIMZHVKZBGSEKZ-SZMVWBNQSA-N 0.000 description 3
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 3
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 3
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 3
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 3
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 3
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 3
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 3
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 3
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 3
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 3
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 3
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 3
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 3
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 3
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 3
- 102000002265 Human Growth Hormone Human genes 0.000 description 3
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 3
- 206010020844 Hyperthermia malignant Diseases 0.000 description 3
- 206010020880 Hypertrophy Diseases 0.000 description 3
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 3
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 3
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 3
- 108090001061 Insulin Proteins 0.000 description 3
- 102000004877 Insulin Human genes 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- 102000003996 Interferon-beta Human genes 0.000 description 3
- 108090000467 Interferon-beta Proteins 0.000 description 3
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 3
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 3
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 3
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 3
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 3
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 3
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 3
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- 208000018717 Malignant hyperthermia of anesthesia Diseases 0.000 description 3
- 108091022875 Microtubule Proteins 0.000 description 3
- 102000029749 Microtubule Human genes 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 201000004404 Neurofibroma Diseases 0.000 description 3
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 3
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- 206010035664 Pneumonia Diseases 0.000 description 3
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 102000001424 Ryanodine receptors Human genes 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 3
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 3
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 3
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 3
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 3
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 3
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 3
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 3
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 3
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 3
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 3
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 3
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 3
- 108010084541 asialoorosomucoid Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 239000001506 calcium phosphate Substances 0.000 description 3
- 229910000389 calcium phosphate Inorganic materials 0.000 description 3
- 235000011010 calcium phosphates Nutrition 0.000 description 3
- 230000000747 cardiac effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 210000003793 centrosome Anatomy 0.000 description 3
- 229960002424 collagenase Drugs 0.000 description 3
- 238000009223 counseling Methods 0.000 description 3
- 229940109239 creatinine Drugs 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 230000001086 cytosolic effect Effects 0.000 description 3
- 239000002612 dispersion medium Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011833 dog model Methods 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 230000004064 dysfunction Effects 0.000 description 3
- 210000002889 endothelial cell Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 210000001508 eye Anatomy 0.000 description 3
- 230000004424 eye movement Effects 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 108700004026 gag Genes Proteins 0.000 description 3
- 230000005021 gait Effects 0.000 description 3
- 108010017007 glucose-regulated proteins Proteins 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 101150028578 grp78 gene Proteins 0.000 description 3
- 230000010370 hearing loss Effects 0.000 description 3
- 231100000888 hearing loss Toxicity 0.000 description 3
- 208000019622 heart disease Diseases 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 210000001624 hip Anatomy 0.000 description 3
- 230000008935 histological improvement Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 229940125396 insulin Drugs 0.000 description 3
- 238000007912 intraperitoneal administration Methods 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 201000007004 malignant hyperthermia Diseases 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 210000004688 microtubule Anatomy 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 230000001338 necrotic effect Effects 0.000 description 3
- 210000000653 nervous system Anatomy 0.000 description 3
- 230000000926 neurological effect Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000030648 nucleus localization Effects 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- PHEDXBVPIONUQT-RGYGYFBISA-N phorbol 13-acetate 12-myristate Chemical group C([C@]1(O)C(=O)C(C)=C[C@H]1[C@@]1(O)[C@H](C)[C@H]2OC(=O)CCCCCCCCCCCCC)C(CO)=C[C@H]1[C@H]1[C@]2(OC(C)=O)C1(C)C PHEDXBVPIONUQT-RGYGYFBISA-N 0.000 description 3
- 102000020233 phosphotransferase Human genes 0.000 description 3
- 238000000554 physical therapy Methods 0.000 description 3
- 108010040003 polyglutamine Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000009598 prenatal testing Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 108091052345 ryanodine receptor (TC 1.A.3.1) family Proteins 0.000 description 3
- 210000002363 skeletal muscle cell Anatomy 0.000 description 3
- 230000007958 sleep Effects 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000009747 swallowing Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 108020005075 5S Ribosomal RNA Proteins 0.000 description 2
- 206010000234 Abortion spontaneous Diseases 0.000 description 2
- 208000010370 Adenoviridae Infections Diseases 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 2
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 2
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 2
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 2
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 2
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 2
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 2
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- XSXVLWBWIPKUSN-UHFFFAOYSA-N Asp-Leu-Glu-Asp Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(O)=O)C(O)=O XSXVLWBWIPKUSN-UHFFFAOYSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 206010003694 Atrophy Diseases 0.000 description 2
- 101800000407 Brain natriuretic peptide 32 Proteins 0.000 description 2
- 102400000667 Brain natriuretic peptide 32 Human genes 0.000 description 2
- 101800002247 Brain natriuretic peptide 45 Proteins 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 206010007559 Cardiac failure congestive Diseases 0.000 description 2
- 208000002177 Cataract Diseases 0.000 description 2
- 108010022452 Collagen Type I Proteins 0.000 description 2
- 102000012422 Collagen Type I Human genes 0.000 description 2
- 102000004420 Creatine Kinase Human genes 0.000 description 2
- 108010042126 Creatine kinase Proteins 0.000 description 2
- 102000007623 Dystroglycans Human genes 0.000 description 2
- 108010071885 Dystroglycans Proteins 0.000 description 2
- 108700041152 Endoplasmic Reticulum Chaperone BiP Proteins 0.000 description 2
- 102100021451 Endoplasmic reticulum chaperone BiP Human genes 0.000 description 2
- 102100039328 Endoplasmin Human genes 0.000 description 2
- 241000214054 Equine rhinitis A virus Species 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 2
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 2
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 2
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 2
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 2
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 2
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 2
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 2
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 2
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 2
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 2
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 2
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 2
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 2
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 2
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 2
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 2
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 2
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 2
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 2
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 2
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 2
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 2
- ZGXGVBYEJGVJMV-HJGDQZAQSA-N Glu-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O ZGXGVBYEJGVJMV-HJGDQZAQSA-N 0.000 description 2
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- 108010062347 HLA-DQ Antigens Proteins 0.000 description 2
- 108010067802 HLA-DR alpha-Chains Proteins 0.000 description 2
- 101150112743 HSPA5 gene Proteins 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 241000700721 Hepatitis B virus Species 0.000 description 2
- 102100037907 High mobility group protein B1 Human genes 0.000 description 2
- 101710168537 High mobility group protein B1 Proteins 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101000715664 Homo sapiens Centrosomal protein of 290 kDa Proteins 0.000 description 2
- 101001053946 Homo sapiens Dystrophin Proteins 0.000 description 2
- 241001135569 Human adenovirus 5 Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 102000016252 Huntingtin Human genes 0.000 description 2
- 108050004784 Huntingtin Proteins 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 2
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 2
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 2
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 2
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- SHVFUCSSACPBTF-VGDYDELISA-N Ile-Ser-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SHVFUCSSACPBTF-VGDYDELISA-N 0.000 description 2
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 2
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 2
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 2
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 2
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 description 2
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 description 2
- 201000006347 Intellectual Disability Diseases 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 102000000588 Interleukin-2 Human genes 0.000 description 2
- 102000010789 Interleukin-2 Receptors Human genes 0.000 description 2
- 108010038453 Interleukin-2 Receptors Proteins 0.000 description 2
- 201000008645 Joubert syndrome Diseases 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 2
- 108010071324 Livagen Proteins 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 2
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 2
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 2
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 2
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 2
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- 108091054437 MHC class I family Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000026139 Memory disease Diseases 0.000 description 2
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 2
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 2
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 2
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 2
- 241000713333 Mouse mammary tumor virus Species 0.000 description 2
- 208000029549 Muscle injury Diseases 0.000 description 2
- 206010052904 Musculoskeletal stiffness Diseases 0.000 description 2
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 208000011644 Neurologic Gait disease Diseases 0.000 description 2
- 206010060860 Neurological symptom Diseases 0.000 description 2
- 108010065395 Neuropep-1 Proteins 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 102000016387 Pancreatic elastase Human genes 0.000 description 2
- 108010067372 Pancreatic elastase Proteins 0.000 description 2
- 241001631646 Papillomaviridae Species 0.000 description 2
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 2
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 2
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241001672814 Porcine teschovirus 1 Species 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 2
- BARPGRUZBKFJMA-SRVKXCTJSA-N Pro-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BARPGRUZBKFJMA-SRVKXCTJSA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- 108010071563 Proto-Oncogene Proteins c-fos Proteins 0.000 description 2
- 102000007568 Proto-Oncogene Proteins c-fos Human genes 0.000 description 2
- 241000205156 Pyrococcus furiosus Species 0.000 description 2
- 108010054530 RGDN peptide Proteins 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 230000006819 RNA synthesis Effects 0.000 description 2
- 101000868151 Rattus norvegicus Somatotropin Proteins 0.000 description 2
- 208000004756 Respiratory Insufficiency Diseases 0.000 description 2
- 101100111629 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR2 gene Proteins 0.000 description 2
- 208000006938 Schwannomatosis Diseases 0.000 description 2
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 2
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 2
- 208000032023 Signs and Symptoms Diseases 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 108700026226 TATA Box Proteins 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 2
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 2
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 2
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 206010068872 Toe walking Diseases 0.000 description 2
- 102000009190 Transthyretin Human genes 0.000 description 2
- 102100029290 Transthyretin Human genes 0.000 description 2
- 102000004903 Troponin Human genes 0.000 description 2
- 108090001027 Troponin Proteins 0.000 description 2
- 102000013394 Troponin I Human genes 0.000 description 2
- 108010065729 Troponin I Proteins 0.000 description 2
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 2
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 2
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 2
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 2
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 2
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 2
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 2
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 2
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 2
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 2
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- 108010051583 Ventricular Myosins Proteins 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 210000004504 adult stem cell Anatomy 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 2
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000003429 antifungal agent Substances 0.000 description 2
- 229940121375 antifungal agent Drugs 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108010024668 arginyl-glutamyl-aspartyl-valine Proteins 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 230000006793 arrhythmia Effects 0.000 description 2
- 206010003119 arrhythmia Diseases 0.000 description 2
- 230000037444 atrophy Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 229940124748 beta 2 agonist Drugs 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 230000014461 bone development Effects 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 230000001886 ciliary effect Effects 0.000 description 2
- 230000009194 climbing Effects 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 208000011425 congenital myotonic dystrophy Diseases 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 208000006111 contracture Diseases 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000001054 cortical effect Effects 0.000 description 2
- 210000004292 cytoskeleton Anatomy 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 238000002567 electromyography Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 108700004025 env Genes Proteins 0.000 description 2
- 210000002683 foot Anatomy 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000009395 genetic defect Effects 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 239000003862 glucocorticoid Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 238000011532 immunohistochemical staining Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 102000006495 integrins Human genes 0.000 description 2
- 108010044426 integrins Proteins 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 238000010253 intravenous injection Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 230000000366 juvenile effect Effects 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 210000003127 knee Anatomy 0.000 description 2
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 238000002483 medication Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 108010090114 methionyl-tyrosyl-lysine Proteins 0.000 description 2
- 208000015994 miscarriage Diseases 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 210000003097 mucus Anatomy 0.000 description 2
- 230000004118 muscle contraction Effects 0.000 description 2
- 230000004220 muscle function Effects 0.000 description 2
- 206010028320 muscle necrosis Diseases 0.000 description 2
- 108010065781 myosin light chain 2 Proteins 0.000 description 2
- HPNRHPKXQZSDFX-OAQDCNSJSA-N nesiritide Chemical compound C([C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)CNC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CO)C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 HPNRHPKXQZSDFX-OAQDCNSJSA-N 0.000 description 2
- 208000007538 neurilemmoma Diseases 0.000 description 2
- 201000009494 neurilemmomatosis Diseases 0.000 description 2
- 208000018360 neuromuscular disease Diseases 0.000 description 2
- 229940021182 non-steroidal anti-inflammatory drug Drugs 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000036407 pain Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 239000002644 phorbol ester Substances 0.000 description 2
- 150000003904 phospholipids Chemical class 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 108700004029 pol Genes Proteins 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920000155 polyglutamine Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000001566 pro-viral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 208000026526 progressive weakness Diseases 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000002510 pyrogen Substances 0.000 description 2
- 239000003642 reactive oxygen metabolite Substances 0.000 description 2
- 230000010837 receptor-mediated endocytosis Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 201000004193 respiratory failure Diseases 0.000 description 2
- 210000003019 respiratory muscle Anatomy 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 230000009183 running Effects 0.000 description 2
- 208000019116 sleep disease Diseases 0.000 description 2
- 208000026473 slurred speech Diseases 0.000 description 2
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 2
- 210000000278 spinal cord Anatomy 0.000 description 2
- 208000000995 spontaneous abortion Diseases 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 210000003699 striated muscle Anatomy 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- GETQZCLCWQTVFV-UHFFFAOYSA-N trimethylamine Chemical compound CN(C)C GETQZCLCWQTVFV-UHFFFAOYSA-N 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 210000000689 upper leg Anatomy 0.000 description 2
- 238000009423 ventilation Methods 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 230000004580 weight loss Effects 0.000 description 2
- QBYIENPQHBMVBV-HFEGYEGKSA-N (2R)-2-hydroxy-2-phenylacetic acid Chemical compound O[C@@H](C(O)=O)c1ccccc1.O[C@@H](C(O)=O)c1ccccc1 QBYIENPQHBMVBV-HFEGYEGKSA-N 0.000 description 1
- VLPIATFUUWWMKC-SNVBAGLBSA-N (2r)-1-(2,6-dimethylphenoxy)propan-2-amine Chemical compound C[C@@H](N)COC1=C(C)C=CC=C1C VLPIATFUUWWMKC-SNVBAGLBSA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- XYWBPLHHAZLXAI-ASHKBJFXSA-N (2s)-2-[[(2s)-2-[[(2s)-4-amino-2-[[(2s)-2-amino-3-methylbutanoyl]amino]-4-oxobutanoyl]amino]-3-carboxypropanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)C(C)C XYWBPLHHAZLXAI-ASHKBJFXSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- MKJIEFSOBYUXJB-HOCLYGCPSA-N (3S,11bS)-9,10-dimethoxy-3-isobutyl-1,3,4,6,7,11b-hexahydro-2H-pyrido[2,1-a]isoquinolin-2-one Chemical compound C1CN2C[C@H](CC(C)C)C(=O)C[C@H]2C2=C1C=C(OC)C(OC)=C2 MKJIEFSOBYUXJB-HOCLYGCPSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 101800000504 3C-like protease Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical group C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108091034151 7SK RNA Proteins 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241000649044 Adeno-associated virus 9 Species 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 206010060931 Adenovirus infection Diseases 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 206010001541 Akinesia Diseases 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 1
- ZRGNRZLDMUACOW-HERUPUMHSA-N Ala-Cys-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N ZRGNRZLDMUACOW-HERUPUMHSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 208000007848 Alcoholism Diseases 0.000 description 1
- 201000004384 Alopecia Diseases 0.000 description 1
- 102100033312 Alpha-2-macroglobulin Human genes 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 206010003062 Apraxia Diseases 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Natural products CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- OTUQSEPIIVBYEM-IHRRRGAJSA-N Arg-Asn-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OTUQSEPIIVBYEM-IHRRRGAJSA-N 0.000 description 1
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- YHSNASXGBPAHRL-BPUTZDHNSA-N Arg-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N YHSNASXGBPAHRL-BPUTZDHNSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- HIMXTOIXVXWHTB-DCAQKATOSA-N Arg-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HIMXTOIXVXWHTB-DCAQKATOSA-N 0.000 description 1
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 1
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 1
- AZHXYLJRGVMQKW-UMPQAUOISA-N Arg-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N)O AZHXYLJRGVMQKW-UMPQAUOISA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 1
- IHUJUZBUOFTIOB-QEJZJMRPSA-N Asn-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N IHUJUZBUOFTIOB-QEJZJMRPSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- OFQPMRDJVWLMNJ-CIUDSAMLSA-N Asn-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N OFQPMRDJVWLMNJ-CIUDSAMLSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 1
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- VOGCFWDZYYTEOY-DCAQKATOSA-N Asn-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N VOGCFWDZYYTEOY-DCAQKATOSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- XFJKRRCWLTZIQA-XIRDDKMYSA-N Asn-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N XFJKRRCWLTZIQA-XIRDDKMYSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- UPAGTDJAORYMEC-VHWLVUOQSA-N Asn-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N UPAGTDJAORYMEC-VHWLVUOQSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- KSZHWTRZPOTIGY-AVGNSLFASA-N Asn-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KSZHWTRZPOTIGY-AVGNSLFASA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 1
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 1
- JRBVWZLHBGYZNY-QEJZJMRPSA-N Asp-Gln-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRBVWZLHBGYZNY-QEJZJMRPSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- LDGUZSIPGSPBJP-XVYDVKMFSA-N Asp-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LDGUZSIPGSPBJP-XVYDVKMFSA-N 0.000 description 1
- JOCQXVJCTCEFAZ-CIUDSAMLSA-N Asp-His-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O JOCQXVJCTCEFAZ-CIUDSAMLSA-N 0.000 description 1
- CMCIMCAQIULNDJ-CIUDSAMLSA-N Asp-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N CMCIMCAQIULNDJ-CIUDSAMLSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- TZBJAXGYGSIUHQ-XUXIUFHCSA-N Asp-Leu-Leu-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O TZBJAXGYGSIUHQ-XUXIUFHCSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- ZRUBWRCKIVDCFS-XPCJQDJLSA-N Asp-Leu-Thr-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZRUBWRCKIVDCFS-XPCJQDJLSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 1
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 201000004569 Blindness Diseases 0.000 description 1
- 206010005885 Blunted affect Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 208000000380 Cafe-au-Lait Spots Diseases 0.000 description 1
- 208000020446 Cardiac disease Diseases 0.000 description 1
- 206010007572 Cardiac hypertrophy Diseases 0.000 description 1
- 208000006029 Cardiomegaly Diseases 0.000 description 1
- 206010007748 Cataract cortical Diseases 0.000 description 1
- 206010007764 Cataract subcapsular Diseases 0.000 description 1
- 201000003728 Centronuclear myopathy Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008025 Cerebellar ataxia Diseases 0.000 description 1
- 206010008072 Cerebellar syndrome Diseases 0.000 description 1
- 101710163595 Chaperone protein DnaK Proteins 0.000 description 1
- 208000037088 Chromosome Breakage Diseases 0.000 description 1
- 241001112695 Clostridiales Species 0.000 description 1
- 101150117670 Cnbp gene Proteins 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- 206010010947 Coordination abnormal Diseases 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- NLCZGISONIGRQP-DCAQKATOSA-N Cys-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N NLCZGISONIGRQP-DCAQKATOSA-N 0.000 description 1
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- FEJCUYOGOBCFOQ-ACZMJKKPSA-N Cys-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N FEJCUYOGOBCFOQ-ACZMJKKPSA-N 0.000 description 1
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 1
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 1
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 1
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 1
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 1
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 1
- GDNWBSFSHJVXKL-GUBZILKMSA-N Cys-Lys-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O GDNWBSFSHJVXKL-GUBZILKMSA-N 0.000 description 1
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 1
- MXZYQNJCBVJHSR-KATARQTJSA-N Cys-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O MXZYQNJCBVJHSR-KATARQTJSA-N 0.000 description 1
- NMWZMKLDGZXRKP-BZSNNMDCSA-N Cys-Phe-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NMWZMKLDGZXRKP-BZSNNMDCSA-N 0.000 description 1
- XCDDSPYIMNXECQ-NAKRPEOUSA-N Cys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS XCDDSPYIMNXECQ-NAKRPEOUSA-N 0.000 description 1
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 1
- XSELZJJGSKZZDO-UBHSHLNASA-N Cys-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XSELZJJGSKZZDO-UBHSHLNASA-N 0.000 description 1
- PNEAWXSKCKCHDK-XIRDDKMYSA-N Cys-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CS)N)C(O)=O)C1=CN=CN1 PNEAWXSKCKCHDK-XIRDDKMYSA-N 0.000 description 1
- OEDPLIBVQGRKGZ-AVGNSLFASA-N Cys-Tyr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O OEDPLIBVQGRKGZ-AVGNSLFASA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 206010012335 Dependence Diseases 0.000 description 1
- 206010012559 Developmental delay Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 208000007590 Disorders of Excessive Somnolence Diseases 0.000 description 1
- 206010013642 Drooling Diseases 0.000 description 1
- 102000004168 Dysferlin Human genes 0.000 description 1
- 108090000620 Dysferlin Proteins 0.000 description 1
- 208000012661 Dyskinesia Diseases 0.000 description 1
- 206010013952 Dysphonia Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 206010072269 Egocentrism Diseases 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 206010014970 Ephelides Diseases 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 206010015727 Extensor plantar response Diseases 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 208000015220 Febrile disease Diseases 0.000 description 1
- 241000188330 Feline adenovirus Species 0.000 description 1
- MBMLMWLHJBBADN-UHFFFAOYSA-N Ferrous sulfide Chemical class [Fe]=S MBMLMWLHJBBADN-UHFFFAOYSA-N 0.000 description 1
- 206010061159 Foot deformity Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 208000001613 Gambling Diseases 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 1
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- LLVXTGUTDYMJLY-GUBZILKMSA-N Gln-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LLVXTGUTDYMJLY-GUBZILKMSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- PCKOTDPDHIBGRW-CIUDSAMLSA-N Gln-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N PCKOTDPDHIBGRW-CIUDSAMLSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- LLRJEFPKIIBGJP-DCAQKATOSA-N Gln-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LLRJEFPKIIBGJP-DCAQKATOSA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 1
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- KSKFIECUYMYWNS-AVGNSLFASA-N Gln-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N KSKFIECUYMYWNS-AVGNSLFASA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- MSHXWFKYXJTLEZ-CIUDSAMLSA-N Gln-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MSHXWFKYXJTLEZ-CIUDSAMLSA-N 0.000 description 1
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 1
- LVRKAFPPFJRIOF-GARJFASQSA-N Gln-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N LVRKAFPPFJRIOF-GARJFASQSA-N 0.000 description 1
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 1
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 1
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 1
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- KFHASAPTUOASQN-JYJNAYRXSA-N Gln-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KFHASAPTUOASQN-JYJNAYRXSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 1
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- YJSCHRBERYWPQL-DCAQKATOSA-N Gln-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N YJSCHRBERYWPQL-DCAQKATOSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- CMFBOXUBWMZZMD-BPUTZDHNSA-N Gln-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CMFBOXUBWMZZMD-BPUTZDHNSA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- BETSEXMYBWCDAE-SZMVWBNQSA-N Gln-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BETSEXMYBWCDAE-SZMVWBNQSA-N 0.000 description 1
- VXAIXLOYBPMZPT-JBACZVJFSA-N Gln-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VXAIXLOYBPMZPT-JBACZVJFSA-N 0.000 description 1
- VCUNGPMMPNJSGS-JYJNAYRXSA-N Gln-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VCUNGPMMPNJSGS-JYJNAYRXSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- RSUVOPBMWMTVDI-XEGUGMAKSA-N Glu-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(O)=O)C)C(O)=O)=CNC2=C1 RSUVOPBMWMTVDI-XEGUGMAKSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- BUVMZWZNWMKASN-QEJZJMRPSA-N Glu-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 BUVMZWZNWMKASN-QEJZJMRPSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 1
- COSBSYQVPSODFX-GUBZILKMSA-N Glu-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N COSBSYQVPSODFX-GUBZILKMSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 1
- NPMSEUWUMOSEFM-CIUDSAMLSA-N Glu-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N NPMSEUWUMOSEFM-CIUDSAMLSA-N 0.000 description 1
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 1
- MCGNJCNXIMQCMN-DCAQKATOSA-N Glu-Met-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(O)=O MCGNJCNXIMQCMN-DCAQKATOSA-N 0.000 description 1
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 1
- ZSIDREAPEPAPKL-XIRDDKMYSA-N Glu-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N ZSIDREAPEPAPKL-XIRDDKMYSA-N 0.000 description 1
- OLTHVCNYJAALPL-BHYGNILZSA-N Glu-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OLTHVCNYJAALPL-BHYGNILZSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- QOOFKCCZZWTCEP-AVGNSLFASA-N Glu-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QOOFKCCZZWTCEP-AVGNSLFASA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 1
- XIJOPMSILDNVNJ-ZVZYQTTQSA-N Glu-Val-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIJOPMSILDNVNJ-ZVZYQTTQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 208000002705 Glucose Intolerance Diseases 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- VOCMRCVMAPSSAL-IUCAKERBSA-N Gly-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN VOCMRCVMAPSSAL-IUCAKERBSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 108050008753 HNH endonucleases Proteins 0.000 description 1
- 102000000310 HNH endonucleases Human genes 0.000 description 1
- 208000035211 Heart Murmurs Diseases 0.000 description 1
- 101710178376 Heat shock 70 kDa protein Proteins 0.000 description 1
- 101710152018 Heat shock cognate 70 kDa protein Proteins 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 102100022130 High mobility group protein B3 Human genes 0.000 description 1
- 208000007446 Hip Dislocation Diseases 0.000 description 1
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IDQKGZWUPVOGPZ-GUBZILKMSA-N His-Cys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IDQKGZWUPVOGPZ-GUBZILKMSA-N 0.000 description 1
- MWXBCJKQRQFVOO-DCAQKATOSA-N His-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CN=CN1)N MWXBCJKQRQFVOO-DCAQKATOSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 1
- DGYNAJNQMBFYIF-SZMVWBNQSA-N His-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 DGYNAJNQMBFYIF-SZMVWBNQSA-N 0.000 description 1
- IDQNVIWPPWAFSY-AVGNSLFASA-N His-His-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O IDQNVIWPPWAFSY-AVGNSLFASA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 1
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- KHUFDBQXGLEIHC-BZSNNMDCSA-N His-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 KHUFDBQXGLEIHC-BZSNNMDCSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 1
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 1
- BMZLDCQIWUHVRS-DCAQKATOSA-N His-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CN=CN1 BMZLDCQIWUHVRS-DCAQKATOSA-N 0.000 description 1
- SLFSYFJKSIVSON-SRVKXCTJSA-N His-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SLFSYFJKSIVSON-SRVKXCTJSA-N 0.000 description 1
- WYSJPCTWSBJFCO-AVGNSLFASA-N His-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N WYSJPCTWSBJFCO-AVGNSLFASA-N 0.000 description 1
- FBCURAVMSXNOLP-JYJNAYRXSA-N His-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBCURAVMSXNOLP-JYJNAYRXSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 1
- RXKFKJVJVHLRIE-XIRDDKMYSA-N His-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CN=CN3)N RXKFKJVJVHLRIE-XIRDDKMYSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- UXZMINKIEWBEQU-SZMVWBNQSA-N His-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N UXZMINKIEWBEQU-SZMVWBNQSA-N 0.000 description 1
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 1
- SWBUZLFWGJETAO-KKUMJFAQSA-N His-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O SWBUZLFWGJETAO-KKUMJFAQSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- GYXDQXPCPASCNR-NHCYSSNCSA-N His-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N GYXDQXPCPASCNR-NHCYSSNCSA-N 0.000 description 1
- 108010027412 Histocompatibility Antigens Class II Proteins 0.000 description 1
- 102000018713 Histocompatibility Antigens Class II Human genes 0.000 description 1
- 101100443349 Homo sapiens DMD gene Proteins 0.000 description 1
- 101001006375 Homo sapiens High mobility group nucleosome-binding domain-containing protein 4 Proteins 0.000 description 1
- 101001045794 Homo sapiens High mobility group protein B3 Proteins 0.000 description 1
- 101000583839 Homo sapiens Muscleblind-like protein 1 Proteins 0.000 description 1
- 101000785063 Homo sapiens Serine-protein kinase ATM Proteins 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 241000598171 Human adenovirus sp. Species 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 229920002153 Hydroxypropyl cellulose Polymers 0.000 description 1
- 241000282620 Hylobates sp. Species 0.000 description 1
- 208000029084 Hyperlordosis Diseases 0.000 description 1
- 206010066364 Hypersexuality Diseases 0.000 description 1
- 206010021118 Hypotonia Diseases 0.000 description 1
- 206010021133 Hypoventilation Diseases 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- RSDHVTMRXSABSV-GHCJXIJMSA-N Ile-Asn-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N RSDHVTMRXSABSV-GHCJXIJMSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- YBGTWSFIGHUWQE-MXAVVETBSA-N Ile-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CN=CN1 YBGTWSFIGHUWQE-MXAVVETBSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- BZUOLKFQVVBTJY-SLBDDTMCSA-N Ile-Trp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BZUOLKFQVVBTJY-SLBDDTMCSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108700002232 Immediate-Early Genes Proteins 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010065973 Iron Overload Diseases 0.000 description 1
- 102000008133 Iron-Binding Proteins Human genes 0.000 description 1
- 108010035210 Iron-Binding Proteins Proteins 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- USTCFDAQCLDPBD-XIRDDKMYSA-N Leu-Asn-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N USTCFDAQCLDPBD-XIRDDKMYSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- LKXANTUNFMVCNF-IHPCNDPISA-N Leu-His-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LKXANTUNFMVCNF-IHPCNDPISA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- YFGWNAROEYWGNL-GUBZILKMSA-N Lys-Gln-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YFGWNAROEYWGNL-GUBZILKMSA-N 0.000 description 1
- GUYHHBZCBQZLFW-GUBZILKMSA-N Lys-Gln-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N GUYHHBZCBQZLFW-GUBZILKMSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 1
- QFGVDCBPDGLVTA-SZMVWBNQSA-N Lys-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 QFGVDCBPDGLVTA-SZMVWBNQSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- URBJRJKWSUFCKS-AVGNSLFASA-N Lys-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N URBJRJKWSUFCKS-AVGNSLFASA-N 0.000 description 1
- ZCWWVXAXWUAEPZ-SRVKXCTJSA-N Lys-Met-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZCWWVXAXWUAEPZ-SRVKXCTJSA-N 0.000 description 1
- SPNKGZFASINBMR-IHRRRGAJSA-N Lys-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N SPNKGZFASINBMR-IHRRRGAJSA-N 0.000 description 1
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- ZJSXCIMWLPSTMG-HSCHXYMDSA-N Lys-Trp-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJSXCIMWLPSTMG-HSCHXYMDSA-N 0.000 description 1
- KQAREVUPVXMNNP-WDSOQIARSA-N Lys-Trp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O KQAREVUPVXMNNP-WDSOQIARSA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- NROQVSYLPRLJIP-PMVMPFDFSA-N Lys-Trp-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NROQVSYLPRLJIP-PMVMPFDFSA-N 0.000 description 1
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 1
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 1
- XATKLFSXFINPSB-JYJNAYRXSA-N Lys-Tyr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O XATKLFSXFINPSB-JYJNAYRXSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 101150022636 MAFB gene Proteins 0.000 description 1
- 102000043129 MHC class I family Human genes 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 102000000422 Matrix Metalloproteinase 3 Human genes 0.000 description 1
- 201000008643 Meckel syndrome Diseases 0.000 description 1
- 208000003351 Melanosis Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 1
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 1
- IYXDSYWCVVXSKB-CIUDSAMLSA-N Met-Asn-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IYXDSYWCVVXSKB-CIUDSAMLSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- NCFZHKMKRCYQBJ-CIUDSAMLSA-N Met-Cys-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NCFZHKMKRCYQBJ-CIUDSAMLSA-N 0.000 description 1
- HLYIDXAXQIJYIG-CIUDSAMLSA-N Met-Gln-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HLYIDXAXQIJYIG-CIUDSAMLSA-N 0.000 description 1
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 1
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 1
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- TZHFJXDKXGZHEN-IHRRRGAJSA-N Met-His-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O TZHFJXDKXGZHEN-IHRRRGAJSA-N 0.000 description 1
- MXEASDMFHUKOGE-ULQDDVLXSA-N Met-His-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MXEASDMFHUKOGE-ULQDDVLXSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- OCRSGGIJBDUXHU-WDSOQIARSA-N Met-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OCRSGGIJBDUXHU-WDSOQIARSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 1
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 1
- ANCPZNHGZUCSSC-ULQDDVLXSA-N Met-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 ANCPZNHGZUCSSC-ULQDDVLXSA-N 0.000 description 1
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 1
- CKAVKDJBSNTJDB-SRVKXCTJSA-N Met-Val-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCSC CKAVKDJBSNTJDB-SRVKXCTJSA-N 0.000 description 1
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 1
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 102000006404 Mitochondrial Proteins Human genes 0.000 description 1
- 108010058682 Mitochondrial Proteins Proteins 0.000 description 1
- 206010061296 Motor dysfunction Diseases 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100443350 Mus musculus Dmd gene Proteins 0.000 description 1
- 101001053945 Mus musculus Dystrophin Proteins 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 101100476480 Mus musculus S100a8 gene Proteins 0.000 description 1
- 208000007379 Muscle Hypotonia Diseases 0.000 description 1
- 206010050031 Muscle strain Diseases 0.000 description 1
- 206010049816 Muscle tightness Diseases 0.000 description 1
- 102100030965 Muscleblind-like protein 1 Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 206010029148 Nephrolithiasis Diseases 0.000 description 1
- 208000009668 Neurobehavioral Manifestations Diseases 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 208000036700 Oculomotor apraxia Diseases 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 208000005141 Otitis Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 206010034620 Peripheral sensory neuropathy Diseases 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- UEEVBGHEGJMDDV-AVGNSLFASA-N Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEEVBGHEGJMDDV-AVGNSLFASA-N 0.000 description 1
- QPQDWBAJWOGAMJ-IHPCNDPISA-N Phe-Asp-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 QPQDWBAJWOGAMJ-IHPCNDPISA-N 0.000 description 1
- FSPGBMWPNMRWDB-AVGNSLFASA-N Phe-Cys-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FSPGBMWPNMRWDB-AVGNSLFASA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- RLUMIJXNHJVUCO-JBACZVJFSA-N Phe-Gln-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 RLUMIJXNHJVUCO-JBACZVJFSA-N 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- DZVXMMSUWWUIQE-ACRUOGEOSA-N Phe-His-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N DZVXMMSUWWUIQE-ACRUOGEOSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 1
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- 101800001016 Picornain 3C-like protease Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 108010015078 Pregnancy-Associated alpha 2-Macroglobulins Proteins 0.000 description 1
- 206010036590 Premature baby Diseases 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 101800000596 Probable picornain 3C-like protease Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 208000001431 Psychomotor Agitation Diseases 0.000 description 1
- 101710185720 Putative ethidium bromide resistance protein Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 208000022583 Qualitative or quantitative defects of dysferlin Diseases 0.000 description 1
- 208000037328 Qualitative or quantitative defects of sarcoglycan Diseases 0.000 description 1
- IWYDHOAUDWTVEP-UHFFFAOYSA-N R-2-phenyl-2-hydroxyacetic acid Natural products OC(=O)C(O)C1=CC=CC=C1 IWYDHOAUDWTVEP-UHFFFAOYSA-N 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- 108700005079 Recessive Genes Proteins 0.000 description 1
- 102000052708 Recessive Genes Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241001068263 Replication competent viruses Species 0.000 description 1
- 241001068295 Replication defective viruses Species 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 206010038743 Restlessness Diseases 0.000 description 1
- 201000007737 Retinal degeneration Diseases 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 206010053694 Saccadic eye movement Diseases 0.000 description 1
- 108010083379 Sarcoglycans Proteins 0.000 description 1
- 102000006308 Sarcoglycans Human genes 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- FZNNGIHSIPKFRE-QEJZJMRPSA-N Ser-Trp-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZNNGIHSIPKFRE-QEJZJMRPSA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 102100020824 Serine-protein kinase ATM Human genes 0.000 description 1
- 102000007365 Sialoglycoproteins Human genes 0.000 description 1
- 108010032838 Sialoglycoproteins Proteins 0.000 description 1
- 208000008630 Sialorrhea Diseases 0.000 description 1
- 108010051611 Signal Recognition Particle Proteins 0.000 description 1
- 102000013598 Signal recognition particle Human genes 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000008063 Small Heat-Shock Proteins Human genes 0.000 description 1
- 108010088928 Small Heat-Shock Proteins Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 208000000875 Spinal Curvatures Diseases 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 208000032978 Structural Congenital Myopathies Diseases 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 206010042464 Suicide attempt Diseases 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 208000008206 Talipes Cavus Diseases 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 206010043298 Testicular atrophy Diseases 0.000 description 1
- 101001081186 Tetrahymena pyriformis High mobility group protein Proteins 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- VOGXLRKCWFLJBY-HSHDSVGOSA-N Thr-Arg-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VOGXLRKCWFLJBY-HSHDSVGOSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- DXNUZQGVOMCGNS-SWRJLBSHSA-N Thr-Gln-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O DXNUZQGVOMCGNS-SWRJLBSHSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- CJXURNZYNHCYFD-WDCWCFNPSA-N Thr-Lys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CJXURNZYNHCYFD-WDCWCFNPSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- QFCQNHITJPRQTB-IEGACIPQSA-N Thr-Lys-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O QFCQNHITJPRQTB-IEGACIPQSA-N 0.000 description 1
- UXUAZXWKIGPUCH-RCWTZXSCSA-N Thr-Met-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O UXUAZXWKIGPUCH-RCWTZXSCSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- GQPQJNMVELPZNQ-GBALPHGKSA-N Thr-Ser-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O GQPQJNMVELPZNQ-GBALPHGKSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 201000000509 Tibial muscular dystrophy Diseases 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 102000004338 Transferrin Human genes 0.000 description 1
- 108090000901 Transferrin Proteins 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 229940123445 Tricyclic antidepressant Drugs 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000005937 Tropomyosin Human genes 0.000 description 1
- 108010030743 Tropomyosin Proteins 0.000 description 1
- BDWDMRSGCXEDMR-WFBYXXMGSA-N Trp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BDWDMRSGCXEDMR-WFBYXXMGSA-N 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 1
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 1
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 1
- MWHOLXNKRKRQQH-XIRDDKMYSA-N Trp-Asp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N MWHOLXNKRKRQQH-XIRDDKMYSA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- PKUJMYZNJMRHEZ-XIRDDKMYSA-N Trp-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKUJMYZNJMRHEZ-XIRDDKMYSA-N 0.000 description 1
- JWGRSJCYCXEIKH-QEJZJMRPSA-N Trp-Glu-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N JWGRSJCYCXEIKH-QEJZJMRPSA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- VISUNEBASWEMCU-SZMVWBNQSA-N Trp-Glu-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VISUNEBASWEMCU-SZMVWBNQSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- YYXIWHBHTARPOG-HJXMPXNTSA-N Trp-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YYXIWHBHTARPOG-HJXMPXNTSA-N 0.000 description 1
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- CMXACOZDEJYZSK-XIRDDKMYSA-N Trp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N CMXACOZDEJYZSK-XIRDDKMYSA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 1
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 1
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 1
- OFTGYORHQMSPAI-PJODQICGSA-N Trp-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O OFTGYORHQMSPAI-PJODQICGSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- XGFOXYJQBRTJPO-PJODQICGSA-N Trp-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XGFOXYJQBRTJPO-PJODQICGSA-N 0.000 description 1
- PKZIWSHDJYIPRH-JBACZVJFSA-N Trp-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKZIWSHDJYIPRH-JBACZVJFSA-N 0.000 description 1
- DVLHKUWLNKDINO-PMVMPFDFSA-N Trp-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DVLHKUWLNKDINO-PMVMPFDFSA-N 0.000 description 1
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 1
- GLNADSQYFUSGOU-GPTZEZBUSA-J Trypan blue Chemical compound [Na+].[Na+].[Na+].[Na+].C1=C(S([O-])(=O)=O)C=C2C=C(S([O-])(=O)=O)C(/N=N/C3=CC=C(C=C3C)C=3C=C(C(=CC=3)\N=N\C=3C(=CC4=CC(=CC(N)=C4C=3O)S([O-])(=O)=O)S([O-])(=O)=O)C)=C(O)C2=C1N GLNADSQYFUSGOU-GPTZEZBUSA-J 0.000 description 1
- 101150110111 Ttn gene Proteins 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- QOIKZODVIPOPDD-AVGNSLFASA-N Tyr-Cys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOIKZODVIPOPDD-AVGNSLFASA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- YIKDYZDNRCNFQB-KKUMJFAQSA-N Tyr-His-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O YIKDYZDNRCNFQB-KKUMJFAQSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- HNERGSKJJZQGEA-JYJNAYRXSA-N Tyr-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HNERGSKJJZQGEA-JYJNAYRXSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 108091026822 U6 spliceosomal RNA Proteins 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 1
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 1
- HLBHFAWNMAQGNO-AVGNSLFASA-N Val-His-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N HLBHFAWNMAQGNO-AVGNSLFASA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- OJOMXGVLFKYDKP-QXEWZRGKSA-N Val-Met-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OJOMXGVLFKYDKP-QXEWZRGKSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 108091034135 Vault RNA Proteins 0.000 description 1
- 108010065472 Vimentin Proteins 0.000 description 1
- 102100035071 Vimentin Human genes 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 108700029631 X-Linked Genes Proteins 0.000 description 1
- 108091029474 Y RNA Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- VRGWBRLULZUWAJ-XFFXIZSCSA-N [(2s)-2-[(1r,3z,5s,8z,12z,15s)-5,17-dihydroxy-4,8,12,15-tetramethyl-16-oxo-18-bicyclo[13.3.0]octadeca-3,8,12,17-tetraenyl]propyl] acetate Chemical compound C1\C=C(C)/CC\C=C(C)/CC[C@H](O)\C(C)=C/C[C@@H]2C([C@@H](COC(C)=O)C)=C(O)C(=O)[C@]21C VRGWBRLULZUWAJ-XFFXIZSCSA-N 0.000 description 1
- 208000028752 abnormal posture Diseases 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 235000011054 acetic acid Nutrition 0.000 description 1
- 210000001361 achilles tendon Anatomy 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 208000011589 adenoviridae infectious disease Diseases 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 230000016571 aggressive behavior Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 201000007930 alcohol dependence Diseases 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 102000013640 alpha-Crystallin B Chain Human genes 0.000 description 1
- 108010051585 alpha-Crystallin B Chain Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 238000002669 amniocentesis Methods 0.000 description 1
- 230000003444 anaesthetic effect Effects 0.000 description 1
- 229940035676 analgesics Drugs 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000000730 antalgic agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 201000010788 atrophy of testis Diseases 0.000 description 1
- 230000002567 autonomic effect Effects 0.000 description 1
- 230000001042 autoregulative effect Effects 0.000 description 1
- 210000003050 axon Anatomy 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 231100000871 behavioral problem Toxicity 0.000 description 1
- 208000013404 behavioral symptom Diseases 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 239000003012 bilayer membrane Substances 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 208000030303 breathing problems Diseases 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- RMRJXGBAOAMLHD-IHFGGWKQSA-N buprenorphine Chemical compound C([C@]12[C@H]3OC=4C(O)=CC=C(C2=4)C[C@@H]2[C@]11CC[C@]3([C@H](C1)[C@](C)(O)C(C)(C)C)OC)CN2CC1CC1 RMRJXGBAOAMLHD-IHFGGWKQSA-N 0.000 description 1
- 229960001736 buprenorphine Drugs 0.000 description 1
- 210000001217 buttock Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229940087373 calcium oxide Drugs 0.000 description 1
- 230000028956 calcium-mediated signaling Effects 0.000 description 1
- BPKIGYQJPYCAOW-FFJTTWKXSA-I calcium;potassium;disodium;(2s)-2-hydroxypropanoate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].C[C@H](O)C([O-])=O BPKIGYQJPYCAOW-FFJTTWKXSA-I 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- FFGPTBGBLSHEPO-UHFFFAOYSA-N carbamazepine Chemical compound C1=CC2=CC=CC=C2N(C(=O)N)C2=CC=CC=C21 FFGPTBGBLSHEPO-UHFFFAOYSA-N 0.000 description 1
- 229960000623 carbamazepine Drugs 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- IVUMCTKHWDRRMH-UHFFFAOYSA-N carprofen Chemical compound C1=CC(Cl)=C[C]2C3=CC=C(C(C(O)=O)C)C=C3N=C21 IVUMCTKHWDRRMH-UHFFFAOYSA-N 0.000 description 1
- 229960003184 carprofen Drugs 0.000 description 1
- 101150102092 ccdB gene Proteins 0.000 description 1
- 101150062912 cct3 gene Proteins 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 206010008129 cerebral palsy Diseases 0.000 description 1
- 210000004720 cerebrum Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 230000001055 chewing effect Effects 0.000 description 1
- 230000008131 children development Effects 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 210000001136 chorion Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000024321 chromosome segregation Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 230000003920 cognitive function Effects 0.000 description 1
- 231100000870 cognitive problem Toxicity 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 231100000867 compulsive behavior Toxicity 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000029511 cortical cataract Diseases 0.000 description 1
- 239000003246 corticosteroid Substances 0.000 description 1
- 229960001334 corticosteroids Drugs 0.000 description 1
- 210000003792 cranial nerve Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000000120 cytopathologic effect Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 229960001145 deflazacort Drugs 0.000 description 1
- FBHSPRKOSMHSIF-GRMWVWQJSA-N deflazacort Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@@H]2[C@@H]1[C@@H]1C[C@H]3OC(C)=N[C@@]3(C(=O)COC(=O)C)[C@@]1(C)C[C@@H]2O FBHSPRKOSMHSIF-GRMWVWQJSA-N 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000007933 dermal patch Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- UGMCXQCYOVCMTB-UHFFFAOYSA-K dihydroxy(stearato)aluminium Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[Al](O)O UGMCXQCYOVCMTB-UHFFFAOYSA-K 0.000 description 1
- 201000011257 dilated cardiomyopathy 1B Diseases 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 201000009338 distal myopathy Diseases 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 206010013932 dyslexia Diseases 0.000 description 1
- 208000019258 ear infection Diseases 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 208000023455 early-onset myopathy with fatal cardiomyopathy Diseases 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001667 episodic effect Effects 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 210000001097 facial muscle Anatomy 0.000 description 1
- 208000004996 familial dilated cardiomyopathy Diseases 0.000 description 1
- 229960004887 ferric hydroxide Drugs 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 210000004744 fore-foot Anatomy 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- VRGWBRLULZUWAJ-UHFFFAOYSA-N fusaproliferin Natural products C1C=C(C)CCC=C(C)CCC(O)C(C)=CCC2C(C(COC(C)=O)C)=C(O)C(=O)C21C VRGWBRLULZUWAJ-UHFFFAOYSA-N 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 101150098622 gag gene Proteins 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 238000002695 general anesthesia Methods 0.000 description 1
- 231100000722 genetic damage Toxicity 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 230000001738 genotoxic effect Effects 0.000 description 1
- 231100000734 genotoxic potential Toxicity 0.000 description 1
- 150000002309 glutamines Chemical class 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 210000004013 groin Anatomy 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000003676 hair loss Effects 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 230000003067 hemagglutinative effect Effects 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 102000057878 human DMD Human genes 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001863 hydroxypropyl cellulose Substances 0.000 description 1
- 235000010977 hydroxypropyl cellulose Nutrition 0.000 description 1
- 206010020765 hypersomnia Diseases 0.000 description 1
- 230000001969 hypertrophic effect Effects 0.000 description 1
- 230000008076 immune mechanism Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000003365 immunocytochemistry Methods 0.000 description 1
- 230000005022 impaired gait Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 150000007529 inorganic bases Chemical class 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 239000007925 intracardiac injection Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000008810 intracellular oxidative stress Effects 0.000 description 1
- 210000001739 intranuclear inclusion body Anatomy 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- IEECXTSVVFWGSE-UHFFFAOYSA-M iron(3+);oxygen(2-);hydroxide Chemical compound [OH-].[O-2].[Fe+3] IEECXTSVVFWGSE-UHFFFAOYSA-M 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- JJWLVOIRVHMVIS-UHFFFAOYSA-N isopropylamine Chemical compound CC(C)N JJWLVOIRVHMVIS-UHFFFAOYSA-N 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 208000028756 lack of coordination Diseases 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N lactose group Chemical group OC1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@H](O2)CO)[C@H](O1)CO GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 210000004717 laryngeal muscle Anatomy 0.000 description 1
- 201000003723 learning disability Diseases 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 101150039067 maf-1 gene Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 238000009607 mammography Methods 0.000 description 1
- 229960002510 mandelic acid Drugs 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000003923 mental ability Effects 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 229960003404 mexiletine Drugs 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000004065 mitochondrial dysfunction Effects 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 230000020654 modulation by virus of host translation Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 230000017311 musculoskeletal movement, spinal reflex action Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 101150008049 mx gene Proteins 0.000 description 1
- 210000003007 myelin sheath Anatomy 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 210000003365 myofibril Anatomy 0.000 description 1
- 230000001114 myogenic effect Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 210000000944 nerve tissue Anatomy 0.000 description 1
- 230000003188 neurobehavioral effect Effects 0.000 description 1
- 230000000626 neurodegenerative effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 231100000957 no side effect Toxicity 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- 206010029864 nystagmus Diseases 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 229940127240 opiate Drugs 0.000 description 1
- 210000004789 organ system Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000007530 organic bases Chemical class 0.000 description 1
- 230000000399 orthopedic effect Effects 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 238000002496 oximetry Methods 0.000 description 1
- 230000036284 oxygen consumption Effects 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008775 paternal effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 230000001991 pathophysiological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000000578 peripheral nerve Anatomy 0.000 description 1
- 201000005528 peripheral nervous system neoplasm Diseases 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 108091008695 photoreceptors Proteins 0.000 description 1
- 230000001830 phrenic effect Effects 0.000 description 1
- 230000037081 physical activity Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 210000004991 placental stem cell Anatomy 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 201000009104 prediabetes syndrome Diseases 0.000 description 1
- 229960005205 prednisolone Drugs 0.000 description 1
- OIGNJSKKLXVSLS-VWUMJDOOSA-N prednisolone Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OIGNJSKKLXVSLS-VWUMJDOOSA-N 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 206010036601 premature menopause Diseases 0.000 description 1
- 238000009101 premedication Methods 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- MFDFERRIHVXMIY-UHFFFAOYSA-N procaine Chemical compound CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 MFDFERRIHVXMIY-UHFFFAOYSA-N 0.000 description 1
- 229960004919 procaine Drugs 0.000 description 1
- 208000037821 progressive disease Diseases 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 229930185346 proliferin Natural products 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000009023 proprioceptive sensation Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 230000008141 pubertal development Effects 0.000 description 1
- 230000009325 pulmonary function Effects 0.000 description 1
- 210000003314 quadriceps muscle Anatomy 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000022983 regulation of cell cycle Effects 0.000 description 1
- 230000021014 regulation of cell growth Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004202 respiratory function Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 230000004258 retinal degeneration Effects 0.000 description 1
- 230000004243 retinal function Effects 0.000 description 1
- 210000000844 retinal pigment epithelial cell Anatomy 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108040009109 ribonuclease MRP activity proteins Proteins 0.000 description 1
- 230000004434 saccadic eye movement Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 208000010532 sarcoglycanopathy Diseases 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 210000003786 sclera Anatomy 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000001044 sensory neuron Anatomy 0.000 description 1
- 201000005572 sensory peripheral neuropathy Diseases 0.000 description 1
- 230000009528 severe injury Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 210000002832 shoulder Anatomy 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 201000009890 sinusitis Diseases 0.000 description 1
- 208000022925 sleep disturbance Diseases 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 208000026841 staggering gait Diseases 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000001429 stepping effect Effects 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 108091007196 stromelysin Proteins 0.000 description 1
- 230000002739 subcortical effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 230000002889 sympathetic effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 231100001044 testicular atrophy Toxicity 0.000 description 1
- 229960005333 tetrabenazine Drugs 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229940033663 thimerosal Drugs 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 239000003029 tricyclic antidepressant agent Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- 231100000588 tumorigenic Toxicity 0.000 description 1
- 230000000381 tumorigenic effect Effects 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 230000006107 tyrosine sulfation Effects 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 238000001291 vacuum drying Methods 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000007497 verbal memory Effects 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 210000005048 vimentin Anatomy 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
- A61P21/04—Drugs for disorders of the muscular or neuromuscular system for myasthenia gravis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4707—Muscular dystrophy
- C07K14/4708—Duchenne dystrophy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/0657—Cardiomyocytes; Heart cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/0658—Skeletal muscle cells, e.g. myocytes, myotubes, myoblasts
- C12N5/0659—Satellite cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/066—Tenocytes; Tendons, Ligaments
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/0661—Smooth muscle cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0696—Artificially induced pluripotent stem cells, e.g. iPS
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/33—Alteration of splicing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/50—Biochemical production, i.e. in a transformed host cell
- C12N2330/51—Specially adapted vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Rheumatology (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physical Education & Sports Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Neurology (AREA)
- General Chemical & Material Sciences (AREA)
- Virology (AREA)
- Developmental Biology & Embryology (AREA)
- Transplantation (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
Abstract
CRISPR/Cas9-매개된 게놈 편집은 유전 질환, 예컨대, 듀켄씨 근 이영양증(DMD)을 치료하기 위한 임상 효능을 보유하며, 이러한 질환은 디스트로핀 유전자내 돌연변이에 의해 유발된다. 본원에서는, 동일한 DMD 가이드 RNA의 발현을 구동시키는 3개의 프로모터를 사용하여, 보다 견고하고 안전한 형태의 게놈 편집을 엑손 50내 결실을 지닌 DMD에 대한 사람화된 마우스 모델, 및 △Ex50-MD 개내에서 달성하였다.
Description
우선권 청구
본 출원은 2017년 12월 8일자로 출원된, 미국 가특허원 일련번호 제62/596,298호, 2017년 8월 11일자로 출원된 미국 가특허원 일련번호 제62/544,499호, 및 2017년 1월 5일자로 출원된 미국 가특허원 일련 번호 제62/442,606호의 우선권을 청구하며, 이의 전체 내용은 이의 전문이 본원에 참고로 포함된다.
연방 기금 지원 조항
본 발명은 국립 보건원에 의해 부여된 보조금 번호 제U54 HD 087351호 하의 정부 지원으로 이루어졌다. 정부는 본 발명에 특정 권리를 갖는다.
서열 목록
본 출원은 ASCII 양식으로 전자적으로 제출되고 이의 전문이 본원에 참고로 포함된 서열 목록을 포함한다. 2018년 1월 5일자로 생성된, 상기 ASCII 카피는 UTFD_P3178WO.txt으로 명명되며 크기는 1,316,974 바이트(byte)이다.
개시내용의 분야
본 개시내용은 분자 생물학, 의약 및 유전학 분야에 관한 것이다. 보다 특히, 본 개시내용은 엑손-스키핑 시도를 사용하여 생체내(in vivo)에서 돌연변이를 수정하기 위한 유전자 편집(genome editing)을 위한 조성물 및 이의 용도에 관한 것이다.
배경
근 이영양증(MD)은 운동을 제어하는 골격근의 점진적 약화 및 퇴화를 특징으로 하는 30개 이상의 유전 질환의 그룹이다. 듀켄씨 근 이영양증(Duchenne muscular dystrophy: DMD)은 5000명의 소년 중 대략 1명에게 영향을 미치는 MD의 가장 심각한 형태 중 하나이며 점진적 근육 약화 및 조기성숙 사망을 특징으로 한다. 심근증 및 심부전은 DMD의 일반적이고, 치유불가능하며 치명적인 특징이다. 질환은 근본적인 세포골격을 지닌 세포 표면에서 디스트로글리칸 복합체를 연결하는 대형 세포내 단백질인, 디스트로핀(DMD)을 암호화함으로써, 수축 동안에 근세포 막의 완전성(integrity)을 유지하는 유전자내에서의 돌연변이에 의해 유발된다. 디스트로핀 유전자내에서의 돌연변이는 디스트로핀의 발현의 손실을 야기하여, 근막 허약(muscle membrane fragility) 및 점전적인 근육 소모를 유발한다.
요약
근아세포 이송, 바이러스 전달, 및 올리고뉴클레오타이드-매개된 엑손 스키핑(exon skipping)을 포함하는 다양한 시도를 통하여 치유법을 찾는 집중적인 노력에도 불구하고, 특정 유형의 근 이영양증은 치유되지 않고 남아있다. 본 발명자들은 최근에 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복 서열(clustered regularly interspaced short palindromic repeat)/Cas9(CRISPR/Cas9)-매개된 유전자 편집을 사용하여 DMD에 대한 모델인, 출산후 mdx 마우스내에서의 디스트로핀 유전자(DMD) 돌연변이를 수정하였다. 유전자-편집 성분의 생체내(in vivo) AAV-매개된 전달은 mdx 마우스의 심장 및 골격근 세포내에서 엑손 스키핑에 의해 돌연변이 게놈 서열을 성공적으로 제거하였다. 상이한 방식의 AAV9 전달을 사용하여, 본 발명자는 mdx 마우스의 심장 및 골격근내에서 디스트로핀 단백질 발현을 회복시켰다. mdx 마우스 모델 및 근편집기(myoediting machinery)의 AAV 전달을 사용한 교정 엑손 23은 생체내 돌연변이를 포함하는 게놈 영역내 몇가지 절단부(cut)를 사용한 엑손 스키핑 시도의 개념 증명을 나타내는데 유용하였다. 그러나, 게놈 편집 및 DMD에 대한 보다 효율적이고 안전한 시도는 이러한 질환에서 개입하기 위한 보다 강력한 수단을 제공할 수 있다.
일부 구현예에서, 핵산은 제1 게놈 표적 서열(genomic target sequence)을 표적화하는 제1 DMD 가이드 RNA를 암호화하는 서열, 제2 게놈 표적 서열을 표적화하는 제2 DMD 가이드 RNA를 암호화하는 서열, 제1 프로모터를 암호화하는 서열(여기서 제1 프로모터는 제1 DMA 가이드 RNA를 암호화하는 서열의 발현을 구동시킨다), 및 제2 프로모터를 암호화하는 서열(여기서 제1 프로모터는 제2 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시킨다)를 포함하며, 여기서 제1 게놈 표적 서열 및 제2 게놈 표적 서열 각각은 디스트로핀 스플라이스 수용체 부위(dystrophin splice acceptor site)를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열 및 제2 프로모터를 암호화하는 서열은 동일하다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열 및 제2 프로모터를 암호화하는 서열은 동일하지 않다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열 및 제2 프로모터를 암호화하는 서열은 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성(sequence identity)을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열 및 제2 게놈 표적 서열은 동일하다. 일부 구현예에서, 제1 게놈 표적 서열 및 제2 게놈 표적 서열은 동일하지 않다. 일부 구현예에서, 제1 게놈 표적 서열 및 제2 게놈 표적 서열은 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열 및 제2 게놈 표적 서열은 상보성이다. 일부 구현예에서, 핵산은 제3 게놈 표적 서열을 표적화하는 제3 DMD 가이드 RNA를 암호화하는 서열, 및 제3 프로모터를 암호화하는 서열을 추가로 포함하며, 여기서 제3 프로모터는 제3 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키고, 여기서 제3 게놈 표적 서열은 디스트로핀 스플라이스 수용체 부위를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 및 제3 프로모터를 암호화하는 서열 중 적어도 2개는 동일하다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 및 제3 프로모터를 암호화하는 서열 중 적어도 2개는 동일하지 않다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 및 제3 프로모터를 암호화하는 서열 중 적어도 2개는 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 및 제3 게놈 표적 서열 중 적어도 2개는 동일하다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 및 제3 게놈 표적 서열 중 적어도 2개는 동일하지 않다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 및 제3 게놈 표적 서열 중 적어도 2개는 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 및 제3 게놈 표적 서열 중 적어도 2개는 상보성이다. 일부 구현예에서, 핵산은 제4 게놈 표적 서열을 표적화하는 제4 DMD 가이드 RNA를 암호화하는 서열, 및 제4 프로모터를 암호화하는 서열을 추가로 포함하며, 여기서 제4 프로모터는 DMD 가이드 RNA를 발현하는 제4 서열의 발현을 구동시키고, 여기서 제4 게놈 표적 서열은 디스트로핀 스플라이스 부위를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 및 제4 프로모터를 암호화하는 서열 중 적어도 2개는 동일하다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 및 제4 프로모터를 암호화하는 서열 중 적어도 2개는 동일하지 않다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 및 제4 프로모터를 암호화하는 서열 중 적어도 2개는 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 및 제4 게놈 표적 서열 중 적어도 2개는 동일하다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 및 제4 게놈 표적 서열 중 적어도 2개는 동일하지 않다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 및 제4 게놈 표적 서열 중 적어도 2개는 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 및 제4 게놈 표적 서열 중 적어도 2개는 상보성이다. 일부 구현예에서, 핵산은 제5 게놈 표적 서열을 표적화하는 제5 DMD 가이드 RNA를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열을 추가로 포함하며, 여기서 제5 프로모터는 제5 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키고, 여기서 제5 게놈 표적 서열은 디스트로핀 스플라이스 수용체 부위를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 2개는 동일하다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 2개는 동일하지 않다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 2개는 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 제4 게놈 표적 서열, 및 제5 게놈 표적 서열 중 적어도 2개는 동일하다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 제4 게놈 표적 서열, 및 제5 게놈 표적 서열 중 적어도 2개는 동일하지 않다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 제4 게놈 표적 서열, 및 제5 게놈 표적 서열 중 적어도 2개는 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%의 서열 동일성을 공유한다. 일부 구현예에서, 제1 게놈 표적 서열, 제2 게놈 표적 서열, 제3 게놈 표적 서열, 제4 게놈 표적 서열, 및 제5 게놈 표적 서열 중 적어도 2개는 상보성이다. 일부 구현예에서, 핵산은 게놈 표적 서열을 표적화하는 추가의 DMD 가이드 RNA를 암호화하는 적어도 하나의 서열, 및 적어도 하나의 추가의 프로모터를 추가로 포함하고, 여기서 추가의 프로모터는 추가의 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키고, 여기서 추가의 게놈 표적 서열은 디스트로핀 스플라이스 수용체 부위를 포함한다. 일부 구현예에서, 디스트로핀 스플라이스 수용체 부위는 엑손 51의 5' 스플라이스 수용체 부위를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열 또는 제2 프로모터를 암호화하는 서열은 구성적 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 제1 프로모터 또는 제2 프로모터는 구성적 프로모터를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 하나는 구성적 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 제1 프로모터, 제2 프로모터, 제3 프로모터, 제4 프로모터, 및 제5 프로모터 중 적어도 하나는 구성적 프로모터를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열 또는 제2 프로모터를 암호화하는 서열은 유도성 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 제1 프로모터, 제2 프로모터, 제3 프로모터, 제4 프로모터, 및 제5 프로모터 중 적어도 하나는 유도성 프로모터를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열 또는 제2 프로모터를 암호화하는 서열은 세포-형 특이적인 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 하나는 세포-형 특이적인 프로모터를 포함한다. 일부 구현예에서, 세포형 특이적인 프로모터는 근육-특이적인 프로모터를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열 또는 제2 프로모터를 암호화하는 서열은 U6 프로모터, H1 프로모터, 또는 7SK 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 하나는 U6 프로모터, H1 프로모터, 또는 7SK 프로모터를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 하나는 U6 프로모터를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 하나는 H1 프로모터를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열, 제2 프로모터를 암호화하는 서열, 제3 프로모터를 암호화하는 서열, 제4 프로모터를 암호화하는 서열, 및 제5 프로모터를 암호화하는 서열 중 적어도 하나는 7SK 프로모터를 포함한다. 일부 구현예에서, 제1 DMD 가이드 RNA를 암호화하는 서열, 제2 DMD 가이드 RNA를 암호화하는 서열, 및 제3 DMD 가이드 RNA를 암호화하는 서열은 동일하고, 5' 스플라이스 수용체 부위는 엑손 51의 5' 스플라이스 수용체 부위를 포함한다. 일부 구현예에서, 제1 프로모터를 암호화하는 서열은 U6 프로모터를 암호화하는 서열을 포함하고, 제2 프로모터를 암호화하는 서열은 H1 프로모터를 암호화하는 서열을 포함하고 제3 프로모터를 암호화하는 서열은 7SK 프로모터를 포함한다. 일부 구현예에서, 핵산은 DNA 서열을 포함한다. 일부 구현예에서, 핵산은 RNA 서열을 포함한다. 일부 구현예에서, 핵산은 역위된 말단 반복물(inverted terminal repeat: ITR)을 암호화하는 하나 이상의 서열을 추가로 포함한다. 일부 구현예에서, 핵산은 5' 역위된 말단 반복물(ITR) 및 3' ITR을 암호화하는 서열을 추가로 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 아데노-관련 바이러스(adeno-associated virus: AAV)로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR를 암호화하는 서열은 혈청형 2(AAV2)의 아데노-관련 바이러스(AAV)로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 및 3' ITR을 암호화하는 서열이 AAV2로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 혈청형 4(AAV4)의 아데노-관련 바이러스(AAV)로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 및 3' ITR을 암호화하는 서열이 AAV4로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 145개의 뉴클레오타이드를 포함하거나 이로 이루어진다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 115개의 뉴클레오타이드를 포함하거나 이로 이루어진다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 141개의 뉴클레오타이드를 포함하거나 이로 이루어진다. 일부 구현예에서, 핵산은 폴리아데노신(폴리 A) 서열을 추가로 포함한다. 일부 구현예에서, 폴리 A 서열은 미니 폴리 A 서열이다. 일부 구현예에서, 제1 DMD 가이드 RNA를 암호화하는 서열 또는 제2 DMD 가이드 RNA를 암호화하는 서열은 서열 번호: 60 내지 382, 706 내지 708 및 712 내지 789 중 어느 하나의 서열을 포함한다. 일부 구현예에서, 제1 DMD 가이드 RNA를 암호화하는 서열 또는 제2 DMD 가이드 RNA를 암호화하는 서열은 서열 번호: 714의 서열을 포함한다.
제1 게놈 표적 서열을 표적화하는 제1 DMD 가이드 RNA를 암호화하는 서열, 제2 게놈 표적 서열을 표적화하는 제2 DMD 가이드 RNA를 암호화하는 서열, 제1 프로모터를 암호화하는 서열을 포함하는 핵산을 포함하는 벡터가 또한 제공되며, 여기서 제1 프로모터는 제1 DMD 가이드 RNA를 암호화하는 서열, 및 제2 프로모터를 암호화하는 서열의 발현을 구동시키고 여기서 제1 프로모터는 제2 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키며, 여기서 제1 게놈 표적 서열 및 제2 게놈 표적 서열 각각은 디스트로핀 스플라이스 수용체 부위를 포함한다. 일부 구현예에서, 벡터는 전이 인자(transposable element)의 역위된 말단 반복물을 암호화하는 서열을 포함한다. 일부 구현예에서, 전이 인자는 트랜스포손(transposon)이다. 일부 구현예에서, 트랜스포손은 Tn7 트랜스포손이다. 일부 구현예에서, 벡터는 비-바이러스 벡터(non-viral vector)이다. 일부 구현예에서, 비-바이러스 벡터는 플라스미드이다. 일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 바이러스 벡터는 아데노-관련 바이러스(AAV) 벡터이다. 일부 구현예에서, AAV 벡터는 복제-결함성 또는 조건적으로 복제 결함성이다. 일부 구현예에서, AAV 벡터는 재조합 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 혈청형 1(AAV1), 2(AAV2), 3(AAV3), 4(AAV4), 5(AAV5), 6(AAV6), 7(AAV7), 8(AAV8), 9(AAV9), 10(AAV10), 11(AAV11) 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 혈청형 9(AAV9)의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 혈청형 2(AAV2)의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 AAV2로부터 단리되거나 유래된 서열 및 AAV9로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 AAV4로부터 단리되거나 유래된 서열 및 AAV9로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 벡터는 포유동물 세포내에서의 발현을 위해 최적화된다. 일부 구현예에서, 벡터는 사람 세포내에서의 발현을 위해 최적화된다. 일부 구현예에서, 벡터는 서열 번호: 914, 서열 번호: 915, 서열 번호: 916, 또는 서열 번호: 917의 서열을 포함한다.
또한 프로모터를 암호화하는 서열 및 Cas9 또는 이의 뉴클레아제 도메인(domain)을 암호화하는 서열을 포함하는 핵산이 제공되며, 여기서 프로모터를 암호화하는 서열은 근육-특이적인 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 근육-특이적인 프로모터를 암호화하는 서열은 CK8 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 근육-특이적인 프로모터를 암호화하는 서열은 CK8e 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열은 에스. 피오게네스(S. pyogenes) Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열로부터 단리되거나 유래된다. 일부 구현예에서, Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열은 에스. 아우레우스(S. aureus) Cas9 또는 이의 뉴클레아제 도메인으로부터 단리되거나 유래된다. 일부 구현예에서, Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열은 포유동물내에서의 발현을 위해 코돈 최적화(codon optimized)된다. 일부 구현예에서, Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열은 사람내에서의 발현을 위해 코돈 최적화된다. 일부 구현예에서, 핵산은 폴리A 서열을 추가로 포함한다. 일부 구현예에서, 폴리A 서열은 미니 폴리A 서열이다. 일부 구현예에서, 핵산은 역위된 말단 반복물(ITR)을 암호화하는 하나 이상의 서열을 추가로 포함한다. 일부 구현예에서, 핵산은 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 및 3' ITR을 암호화하는 서열을 추가로 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 아데노-관련 바이러스(AAV)로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 혈청형 2(AAV2)의 아데노-관련 바이러스(AAV)로부터 단리되거나 유래된다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 및 3' ITR을 암호화하는 서열이 AAV2로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열은 혈청형 4(AAV4)의 아데노-관련 바이러스(AAV)로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 및 3' ITR을 암호화하는 서열이 AAV4로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 및 3' ITR을 암호화하는 서열은 145개의 뉴클레오타이드, 115개의 뉴클레오타이드, 또는 141개의 뉴클레오타이드를 포함하거나 이로 이루어진다. 일부 구현예에서, 핵산은 핵 국재화 신호를 추가로 포함한다. 일부 구현예에서, 핵산은 포유동물 세포내에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 사람 세포내에서의 발현을 위해 최적화된다.
프로모터를 암호화하는 서열 및 Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열을 포함하는 핵산을 포함하는 벡터가 또한 제공되며, 여기서 프로모터를 암호화하는 서열은 근육-특이적인 프로모터, 예컨대, CK8 또는 CK8e 프로모터를 암호화하는 서열을 포함한다. 일부 구현예에서, 벡터는 전이 인자의 역위된 말단 반복물(ITR)을 암호화하는 서열을 추가로 포함한다. 일부 구현예에서, 전이 인자는 트랜스포손이다. 일부 구현예에서, 트랜스포손은 Tn7 트랜스포손이다. 일부 구현예에서, 벡터는 T7 트랜스포손의 5' ITR을 암호화하는 서열 및 T7 트랜스포손의 3' ITR을 암호화하는 서열을 추가로 포함한다. 일부 구현예에서, 벡터는 비-바이러스 벡터이다. 일부 구현예에서, 비-바이러스 벡터는 플라스미드이다. 일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 바이러스 벡터는 아데노-관련 바이러스(AAV) 벡터이다. 일부 구현예에서, AAV 벡터는 복제-결함성 또는 조건적으로 복제 결함성이다. 일부 구현예에서, AAV 벡터는 재조합 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 혈청형 1(AAV1), 2(AAV2), 3(AAV3), 4(AAV4), 5(AAV5), 6(AAV6), 7(AAV7), 8(AAV8), 9(AAV9), 10(AAV10), 11(AAV11) 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 혈청형 9(AAV9)의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 혈청형 2(AAV2)의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 AAV2로부터 단리되거나 유래된 서열 및 AAV9로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 혈청형 4(AAV4)의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, AAV 벡터는 AAV4로부터 단리되거나 유래된 서열 및 AAV9로부터 단리되거나 유래된 서열을 포함한다. 일부 구현예에서, 여기서 벡터는 포유동물 세포내에서의 발현을 위해 최적화된다. 일부 구현예에서, 벡터는 사람 세포내에서의 발현을 위해 최적화된다. 일부 구현예에서, 벡터는 서열 번호: 899, 서열 번호: 900, 서열 번호: 901, 또는 서열 번호: 902의 핵산 서열을 포함한다.
또한, 본 개시내용의 하나 이상의 핵산을 포함하는 세포가 제공된다. 일부 구현예에서, 세포는 사람 세포이다. 일부 구현예에서, 세포는 근육 세포 또는 위성 세포(satellite cell)이다. 일부 구현예에서, 세포는 유도된 다능성 줄기(induced pluripotent stem: iPS) 세포이다.
또한 본 개시내용의 하나 이상의 핵산을 포함하는 조성물이 제공된다. 일부 구현예에서, 조성물은 약제학적으로 허용되는 담체를 추가로 포함한다.
또한 본 개시내용의 하나 이상의 핵산을 포함하는 세포를 포함하는 조성물이 제공된다. 일부 구현예에서, 조성물은 약제학적으로 허용되는 담체를 추가로 포함한다.
또한 본 개시내용의 하나 이상의 벡터를 포함하는 조성물이 제공된다. 일부 구현예에서, 조성물은 약제학적으로 허용되는 담체를 추가로 포함한다.
또한 본 개시내용의 하나 이상의 벡터를 포함하는 조성물을 포함하는 세포가 제공된다. 일부 구현예에서, 세포는 사람 세포이다. 일부 구현예에서, 세포는 근육 세포 또는 위성 세포이다. 일부 구현예에서, 세포는 유도된 다능성 줄기(iPS) 세포이다.
일부 구현예에서, 조성물은 (i) 제1 게놈 표적 서열을 표적화하는 제1 DMD 가이드 RNA를 암호화하는 서열, 제2 게놈 표적 서열을 표적화하는 제2 DMD 가이드 RNA를 암호화하는 서열, 제1 프로모터를 암호화하는 서열을 포함하는 제1 핵산 서열(여기서 제1 프로모터는 제1 DMD 가이드 RNA를 암호화하는 서열, 및 제2 프로모터를 암호화하는 서열의 발현을 구동시키고 여기서 제1 프로모터는 제2 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키며, 여기서 제1 게놈 표적 서열 및 제2 게놈 표적 서열은 각각 디스트로핀 스플라이스 수용체를 포함한다) 및 (ii) 프로모터를 암호화하는 서열 및 Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열을 포함하는 제2 핵산 서열(여기서 프로모터를 암호화하는 서열은 근육-특이적인 프로모터, 예컨대, CK8 또는 CK8e 프로모터를 암호화하는 서열을 포함한다)을 포함한다. 일부 구현예에서, 조성물은 약제학적으로 허용되는 담체를 추가로 포함한다.
일부 구현예에서, 조성물은 (i) 제1 게놈 표적 서열을 표적화하는 제1 DMD 가이드 RNA를 암호화하는 서열, 제2 게놈 표적 서열을 표적화하는 제2 DMD 가이드 RNA를 암호화하는 서열, 제1 프로모터를 암호화하는 서열을 포함하는 핵산 서열을 포함하는 제1 벡터(여기서 제1 프로모터는 제1 DMD 가이드 RNA를 암호화하는 서열, 및 제2 프로모터를 암호화하는 서열의 발현을 구동시키고 여기서 제1 프로모터는 제2 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키며, 여기서 제1 게놈 표적 서열 및 제2 게놈 표적 서열 각각은 디스트로핀 스플라이스 수용체를 포함한다) 및 (ii) 프로모터를 암호화하는 서열 및 Cas9 또는 이의 뉴클레아제 도메인을 암호화하는 서열을 포함하는 핵산 서열을 포함하는 제2 벡터(여기서 프로모터를 암호화하는 서열은 근육-특이적인 프로모터, 예컨대 CK8 또는 CK8e 프로모터를 암호화하는 서열을 포함한다)를 포함한다. 일부 구현예에서, 제1 벡터 및 제2 벡터 중 적어도 하나는 AAV이다. 일부 구현예에서, 조성물은 또한 약제학적으로 허용되는 담체를 추가로 포함한다.
또한, 디스트로핀 결함을 수정하기 위한 방법이 제공되며, 이러한 방법은 세포를 본 개시내용의 하나 이상의 조성물과 제1 DMD 가이드 RNA, 제2 DMD 가이드 RNA 및 Cas9 단백질 또는 이의 뉴클레아제 도메인의 발현에 적합한 조건 하에서 접촉시킴을 포함하며, 여기서 제1 DMD 가이드 RNA 또는 제2 DMD 가이드 RNA 중 적어도 하나는 Cas9 단백질 또는 이의 뉴클레아제 도메인과 함께 복합체를 형성함으로써 적어도 하나의 DMD 가이드 RNA-Cas9 복합체를 형성하며, 여기서 적어도 하나의 DMD 가이드 RNA-Cas9 복합체는 디스트로핀 스플라이스 부위를 파괴하고 DMD 엑손의 선택적인 스키핑(skipping)을 유도한다.
또한, 디스트로핀 결함을 수정하기 위한 방법이 제공되며, 이러한 방법은 세포를 본 개시내용의 하나 이상의 조성물과 제1 DMD 가이드 RNA, 제2 DMD 가이드 RNA 및 Cas9 단백질 또는 이의 뉴클레아제 도메인의 발현에 적합한 조건 하에서 접촉시킴을 포함하며, 여기서 제1 DMD 가이드 RNA 또는 제2 DMD 가이드 RNA 중 적어도 하나는 Cas9 단백질 또는 이의 뉴클레아제 도메인과 함께 복합체를 형성함으로써 적어도 하나의 DMD 가이드 RNA-Cas9 복합체를 형성하고, 여기서 적어도 하나의 DMD 가이드 RNA-Cas9 복합체는 디스트로핀 판독 프레임의 재프레임화(reframing)를 유도한다. 일부 구현예에서, 디스트로핀 판독 프레임의 재프레임화는 삽입을 유도한다. 일부 구현예에서, 삽입은 단일 아데노신 뉴클레오타이드를 포함하거나 이로 이루어진다.
또한, DMD 엑손의 선택적인 스키핑을 유도하는 방법이 제공되며, 이러한 방법은 세포를 본 개시내용의 하나 이상의 조성물과 제1 DMD 가이드 RNA, 제2 DMD 가이드 RNA 및 Cas9 단백질 또는 이의 뉴클레아제 도메인의 발현에 적합한 조건 하에서 접촉시킴을 포함하고, 여기서 제1 DMD 가이드 RNA 또는 제2 DMD 가이드 RNA중 적어도 하나는 Cas9 단백질 또는 이의 뉴클레아제 도메인과 함께 복합체를 형성함으로써 적어도 하나의 DMD 가이드 RNA-Cas9 복합체를 형성하고, 여기서 적어도 하나의 DMD 가이드 RNA-Cas9 복합체는 디스트로핀 스플라이스 부위를 파괴하고 DMD 액손의 선택적인 스키핑을 유도한다.
또한 디스트로핀 판독 프레임에서 재프레임화 사건(reframing event)을 유도하는 방법이 제공되며, 이러한 방법은 세포를 본 개시내용의 하나 이상의 조성물과 제1 DMD 가이드 RNA, 제2 DMD 가이드 RNA 및 Cas9 단백질 또는 이의 뉴클레아제 도메인의 발현에 적합한 조건 하에서 접촉시킴을 포함하며, 여기서 제1 DMD 가이드 RNA 또는 제2 DMD 가이드 RNA 중 적어도 하나는 Cas9 단백질 또는 이의 뉴클레아제 도메인과 복합체를 형성함으로써 적어도 하나의 DMD 가이드 RNA-Cas9 복합체를 형성하고, 여기서 적어도 하나의 DMD 가이드 RNA-Cas9 복합체는 디스트로핀 스플라이스 부위를 파괴하고 DMD 엑손의 선택적인 스키핑을 유도한다. 일부 구현예에서, 적어도 하나의 DMD 가이드 RNA-Cas9 복합체는 디스트로핀 스플라이스 부위를 파괴하고 사람 DMD 유전자의 엑손 51의 선택적인 스키핑을 유도한다.
또한, 이를 필요로 하는 대상체에게 치료학적 유효량의 하나 이상의 본 개시내용의 조성물을 투여함을 포함하여, 상기 대상체에서 근 이영양증을 치료하는 방법이 제공된다. 일부 구현예에서, 조성물은 국소 투여된다. 일부 구현예에서, 조성물은 근육 조직으로 직접 투여된다. 일부 구현예에서, 조성물은 근육내 주입 또는 주사에 의해 투여된다. 일부 구현예에서, 근육 조직은 전경골근(tibialis anterior) 조직, 사두근 조직, 비장근 조직, 횡격막 조직, 또는 심장 조직을 포함한다. 일부 구현예에서, 조성물은 심장내 주사에 의해 투여된다. 일부 구현예에서, 조성물은 전신계적으로 투여된다. 일부 구현예에서, 조성물은 정맥내 주입 또는 주사에 의해 투여된다. 일부 구현예에서, 조성물의 투여 후, 대상체는 정상의 디스트로핀-양성 근섬유, 및 중심화된 핵(centralized nucleus)을 함유하는 모자이크 디스트로핀-양성 근섬유(mosaic dystrophin-positive myofiber), 또는 이의 조합을 나타낸다. 일부 구현예에서, 조성물의 투여 후, 대상체는 조성물의 투여 전 정상의 디스트로핀-양성 근섬유의 부재 또는 이의 풍부함(abundance)의 수준과 비교하여 정상의 디스트포린-양성 근섬유의 풍부함의 수준에 있어서의 발생 또는 증가를 나타낸다. 일부 구현예에서, 조성물의 투여 후, 대상체는 조성물의 투여 전 중심화된 핵을 함유하는 모자이크 디스트로핀-양성 근섬유의 부재 또는 이의 풍부함의 수준과 비교하여 중심화된 핵을 함유하는 모자이크 디스트로핀-양성 근섬유의 발생 또는 이의 풍부함의 수준에 있어서의 증가를 나타낸다. 일부 구현예에서, 조성물의 투여 후, 대상체는 조성물의 투여 전 혈청 CK 수준과 비교하여 감소된 혈청 CK 수준을 나타낸다. 일부 구현예에서, 조성물의 투여 후, 대상체는 조성물의 투여 전 악력(grip strength)과 비교하여 증진된 악력을 나타낸다. 일부 구현예에서, 대상체는 신생아, 영아, 어린이, 청소년, 또는 성인이다. 일부 구현예에서, 대상체는 근 이영양증을 갖는다. 일부 구현예에서, 대상체는 근 이영양증에 대한 유전 담체이다. 일부 구현예에서, 대상체는 남성이다. 일부 구현예에서, 대상체는 여성이다. 일부 구현예에서, 대상체가 무증상인것으로 나타나며, 여기서 유전적 진단은 DMD 유전자 생성물의 기능을 손상시키는 DMD 유전자 중 하나의 또는 둘 모두의 카피(copy) 내에서의 돌연변이를 나타낸다. 일부 구현예에서, 대상체는 근 이영양증의 조기 신호 또는 증상을 나타낸다. 일부 구현예에서, 근 이영양증의 조기 신호 또는 증상은 근육량의 손실 또는 근위 근육 약화를 포함한다. 일부 구현예에서, 근육량의 손실 또는 근위 근육 약화는 다리(들) 및/또는 골반 중 하나 또는 둘 다에 이어서, 하나 이상의 상체 근육(들)에서 발생한다. 일부 구현예에서, 근 이영양증의 조기 신호 또는 증상은 가성비대(pseudohypertrophy), 낮은 인내력, 직립 곤란성(difficulty standing), 보행 곤란성(difficulty walking), 계단 오르기의 곤란성 또는 이의 조합을 추가로 포함한다. 일부 구현예에서, 대상체는 근 이영양증의 점진적인 신호 또는 증상을 나타낸다. 일부 구현예에서, 근 이영양증의 점진적인 신호 또는 증상은 근육 조직 소모성, 근육 조직의 지방으로의 교체, 또는 근육 조직의 섬유성 조직으로의 교체를 포함한다. 일부 구현예에서, 대상체는 근 이영양증의 말기 신호 또는 증상을 나타낸다. 일부 구현예에서, 근 이영양증의 말기 신호 또는 증상은 비정상적인 골 발달, 척추 만곡, 운동 손실, 및 마비를 포함한다. 일부 구현예에서, 대상체는 근 이영양증의 신경학적 신호 또는 증상을 나타낸다. 일부 구현예에서, 근 이영양증의 신경학적 신호 또는 증상은 지적 손상 및 마비를 포함한다. 일부 구현예에서, 조성물의 투여는 대상체가 근 이영양증의 하나 이상의 진전된, 말기 또는 신경학적 신호 또는 증상을 나타내기 전에 일어난다. 일부 구현예에서, 대상체는 10세 미만, 5세 미만, 또는 2세 미만이다.
또한, 이를 필요로 하는 대상체에서 근 이영양증을 치료하기 위한 본 개시내용의 하나 이상의 조성물의 치료학적 유효량의 용도가 제공된다.
본원의 명세서에서 사용된 바와 같은, 단수("a" 또는 "an")는 하나 이상을 의미할 수 있다. 청구항(들)내에서 본원에 사용된 바와 같이, 단어 "포함하는"과 함께 사용하는 경우, 단어 단수("a" 또는 "an")는 하나 보다는 하나 이상을 의미할 수 있다.
청구범위에서 용어 "또는"의 사용은, 본 개시내용은 대안 및 "및/또는" 만을 지칭하는 정의를 뒷받침하지만, 대안 만을 지칭하기 위해 명쾌하게 나타내거나 대안이 상호 배타적이지 않는 한, "및/또는"을 의미하기 위해 사용된다. 본원에 사용된 바와 같은 "다른"은 적어도 2개 이상을 의미한다.
본 출원 전반에 걸쳐서, 용어 "약"은 값이 장치, 값을 측정하기 위해 사용된 방법, 또는 연구 대상체 중에 존재하는 것에 대한 오차의 고유한 변화를 포함하는 것을 나타내기 위해 사용된다. 이러한 고유한 변화는 기술된 값의 ±10%의 변화일 수 있다.
본 출원 전반에 걸쳐서, 달리 나타내지 않는 한, 뉴클레오타이드 서열은 5'로부터 3'로 나열되고, 아미노산 서열은 N-말단으로부터 C-말단으로 나열된다.
본 발명의 다른 목적, 특징 및 장점은 다음의 상세한 설명으로부터 명백해질 것이다. 그러나, 상세한 설명 및 구체적인 실시예는, 본 발명의 취지 및 영역내의 다양한 변화 및 변형이 이러한 상세한 설명으로부터 당해 분야의 기술자에게 명백해질 것이므로, 본 발명의 바람직한 구현예를 나타내지만, 단지 예시로서 제공됨이 이해되어야 한다.
특허 또는 출원 파일은 컬러로 작성된 적어도 하나의 도면을 함유한다. 컬러 도면(들)을 지닌 이러한 특허 또는 출원의 사본은 신청과 필수한 요금의 지불 시 사무국에 의해 제공될 것이다.
다음의 도면은 본 명세서의 일부를 형성하며 본 개시내용의 특정의 양태를 추가로 입증하기 위해 포함된다. 본 개시내용은 본원에 나타낸 구체적인 구현예의 상세한 설명과 함께 하나 이상의 이러한 도면을 참고함으로써 보다 잘 이해될 수 있다.
도 1의 A 내지 F. "사람화된"-△Ex50 마우스 모델. (도 1의 A) 사람화된 마우스 모델을 생성하기 위한 CRISPR/Cas9-매개된 게놈 편집 시도를 나타내는 전략. (도 1의 B) 엑손 50(△Ex50)의 결실을 입증하기 위한 RT-PCR 분석. (도 1의 C) 엑손 50 결실 및 프레임 외부(out-of-frame) 서열의 생성을 입증하기 위한 RT-PCR 생성물의 서열(핵산 서열 = 서열 번호: 1; 아미노산 서열 = 서열 번호: 2). (도 1의 E) 전경골근 및 심장 조직내 디스트로핀 및 빈쿨린 발현의 웨스턴 블롯 분석(Western blot analysis). (도 1의 F) 근육 손상 및 근막 누출을 반영하는 근 이영양증의 마커인, 혈청 CK의 수준은 야생형(WT), △Ex50 및 mdx 마우스에서 측정하였다. (도 1의 D) 헤마톡실린 및 에오신(H&E) 염색, 및 디스트로핀 항체를 사용한 면역조직화학에 의한 심장 및 골격근의 조직화학. 기준자(scale bar): 50 μm.
도 2의 A 및 B. 엑손 51 스키핑. (도 2의 A) 근육내 주사 후 3주째에 △Ex50 마우스로부터의 RNA의 RT-PCR은 엑손 51(Ex50-51로 명명됨, 하부 밴드)의 결실을 나타낸다. (도 2의 B) △Ex50-51 밴드의 RT-PCR 생성물의 서열은 엑손 49가 엑손 51(핵산 서열 = 서열 번호: 3; 아미노산 서열 = 서열 번호: 4)을 배제한 엑손 52에 직접 스플라이싱됨을 입증하였다.
도 3의 A 내지 G. 근육내 주사 후 3주째에 트리플리케이트(triplicate) gRNA 전략을 사용한 디스트로핀 발현의 수정. (도 3의 A) △Ex50 마우스 모델에서 판독 프레임을 수정하기 위한 CRISPR/Cas9-매개된 게놈 편집 시도를 나타내는 전략. (도 3의 B) 스플라이스 수용체 부위 (sgRNA-ex51-SA) 서열을 표적화하는 sgRNA 및 sgRNA 결합 위치의 개략도. 도 3의 B는 나타난 순서로 서열 번호: 954 내지 957을 각각 나타낸다. (도 3의 C) AAV 주사 플라스미드 및 전략의 개략도. sgRNA-ex51-SA 및 sgRNA-ex51-SD에 대해 rAAV9-sgRNA 플라스미드를 사용하는 이중 가이드 전략. sgRNA-ex51-SA의 3개의 카피를 함유하는 rAAV9-sgRNA 플라스미드를 사용한 트리플리케이트. SpCas9를 발현시키기 위한 근육 크레아틴 키나제 8(CK8) 프로모터. sgRNA를 발현시키기 위한 RNA 폴리머라제 III에 대한 U6, H1 및 7SK 프로모터. (도 3의 D) 전경골근 근육의 디스트로핀 면역조직화학 염색. (도 3의 E) 부위에 의해 표준화된 디스트포린 양성 섬유의 정량화. (도 3의 F) 근육내 주사 후 3주째에 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. (도 3의 G) 빈쿨린에 대한 표준화 후 디스트로핀 발현의 정량화. 데이타는 평균 ± SEM으로 나타낸다. **P<0.005. 기준자: 50 μm
도 4의 A 및 B. 3주 후 주사된 근육의 조직학적 개선. (도 4의 A) 헤마톡실린 및 에오신(H&E) 염색에 의한 전경근골 근육의 조직화학. (도 4의 B) 섬유 크기 및 빈도 퍼센트의 정량화. 데이타는 평균 ± SEM으로 나타낸다. 기준자: 50 μm. 제공된 섬유 크기에 대한 4개의 데이타 점의 각각의 세트는 좌에서 우로 △50-CTL, WT-CTL, △50-AAV-TriSA 및 △50-AAV-SA+SD이다.
도 5. 사람 293 세포 및 마우스 10T 세포에서 sgRNA의 스크린. 2% 아가로즈 겔 상에서 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널). M은 크기 마커 레인(size marker lane)을 나타낸다. bp는 마커 밴드의 길이를 나타낸다.
도 6. 전체 전경골근 근육의 디스트로핀 면역조직화학 염색
도 7의 A 및 B. △Ex50 마우스에서 CRISPR/Cas9-매개된 게놈 편집에 대한 전략. (도 7의 A) △Ex50 마우스 모델에서 판독 프레임을 수정하기 위한 CRISPR/Cas9-매개된 게놈 편집 시도를 나타내는 전략. (도 7의 B) 스플라이스 수용체 부위(sgRNA-ex51-SA2) 서열을 표적화하는 sgRNA 및 sgRNA 결합 위치의 개략적 도시. 도 7의 B는 나타난 순서로, 서열 번호: 958 내지 959를 각각 나타낸다.
도 8의 A 내지 F. 마우스 및 사람 세포에서 sgRNA 게놈 분석(도 8의 A) Cas9를 10T1/2 세포내에서 마우스 sgRNA-sgRNA-51-SA2의 존재 또는 부재하에 발현시키고 유전자 편집은 형광성-기반한 세포 분류(FACS)(+) 및 비-분류된 세포(-)에서T7E1 검정에 의해 모니터링하였다. GFP는 대조군으로서 사용하였다. 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널)를 2% 아가로즈 겔 위에 나타낸다. 검정색 화살촉은 소화되지 않은 771bp PCR 밴드를 나타낸다. 하부 패널에서 녹색 화살촉은 T7E1 검정에 의한 절단 밴드를 나타낸다. M은 크기 마커 레인을 나타낸다. bp는 마커 밴드의 길이를 나타낸다. (도 8의 B) 10T1/2 세포내에서 엑손 51 표적 부위를 따라 생성된 PCR 앰플리콘(amplicon)의 게놈 K 서열분석(Genomic deep sequencing analysis). 대표적인 삽입-결실(indel)의 서열은 삽입(녹색으로 강조함) 및 결실(적색으로 강조함)을 나타내는 sgRNA 서열(청색으로 나타냄)과 함께 정렬하였다(나타낸 순서로, 각각 서열 번호: 960 내지 966). 선은 sgRNA의 부위에 위치한 예측된 엑손 스플라이싱 인핸서(ESE) 서열을 나타낸다. 검정색 화살표는 절단 부위를 나타낸다. (도 8의 C) sgRNA의 부위에 위치하는 예측된 엑손 스플라이싱 인핸서(ESE)를 지닌 마우스 엑손 51 서열(서열 번호: 967)은 적색으로 나타낸다. sgRNA의 부위에 위치한 예측된 엑손 스플라이싱 인핸서(ESE)를 지닌 사람 엑손 51 서열(서열 번호: 968)은 적색으로 나타낸다. (도 8의 D) 엑손 51의 마우스 및 사람 ESE 부위는 ESEfinder3을 사용하여 예측하였다. (도 8의 E) Cas9를 293 T 사람 세포내에서 마우스 sgRNA-sgRNA-51-SA2 의 존재 또는 부재하에 발현시키고 유전자 편집을 형광성-기반 세포 분류된(FACS)(+) 및 분류되지 않은 세포(-) 내에서 T7E1 검정으로 모니터링하였다. GFP를 대조군으로서 사용하였다. 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널)을 2% 아가로즈 겔에서 나타낸다. 검정색 화살촉은 소화된 771bp PCR 밴드를 나타낸다. 하부 패널에서 녹색 화살촉은 T7E1 검정에 의한 절단 밴드를 나타낸다. M은 크기 마커 레인을 나타낸다. bp는 마커 밴드의 길이를 나타낸다. (도 8의 F) 대표적인 삽입-결실의 서열을 결실 및 삽입을 나타내는 sgRNA 서열(청색으로 나타냄)과 함께 정렬하였다(나타낸 순서로 각각 서열 번호: 969 내지 978). 검정색 화살촉은 절단 부위를 나타낸다.
도 9의 A 및 B. AAV 주사 플라스미드 및 전략의 개략적 도시. (도 9의 A) SpCas9를 발현하는 근육 크레아틴 키나제 8(CK8) 프로모터. (도 9의 B) sgRNA-ex51-SA2의 3개의 카피를 함유하는 rAAV9-sgRNA 플라스미드를 사용한 트리플리케이트. sgRNA를 발현하기 위한 RNA 폴리머라제 III에 대한 U6, H1 및 7SK 프로모터.
도 10의 A 및 B. 생체내 Dmd 유전자 편집. (도 10의 A) 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널)은 AAV9-sgRNA-SA2 및 AAV9-Cas9 발현 벡터를 사용한 근육내 주사 후 3주째에 WT 및 △Ex50 마우스로부터의 TA(전경골근) 근육 샘플의 2% 아가로즈 겔에서 나타낸다. 대조군에게는 AAV9-sgRNA-SA2가 아닌 AAV9-Cas9 만을 주사하였다. 상부 패널에서 검정색 화살촉은 771bp PCR 밴드를 나타낸다. 하부 패널에서 녹색 화살촉은 T7E1 검정에 의해 절단 밴드로 나타낸다. M은 크기 마커 레인을 나타낸다. bp는 마커 밴드의 길이를 나타낸다. N=4. (도 10의 B) AAV9-sgRNA-51-SA2 및 AAV9-Cas9를 주사한 △Ex50 마우스에서 엑손 51 표적 부위에 따라 생성된 PCR 앰플리콘의 게놈 K 서열 분석. 대표적인 삽입-결실의 서열은 삽입(녹색으로 강조함) 및 결실(적색으로 강조함)을 나타내는 sgRNA 서열(청색으로 나타냄)과 함께 정렬하였다. (나타낸 순서로 각각 서열 번호: 979 내지 1014). 검정색 화살촉은 절단 부위를 나타낸다. n=3.
도 11의 A 내지 D. 판독 프레임의 수정의 RT-PCR 분석. (도 11의 A) sgRNA-51-SA2 및 Cas9 발현 벡터의 근육내 주사 후 3주째에 야생형(WT) 및 △Ex50 마우스의 전경골근 근육으로부터 RNA의 RT-PCR. 하부 디스트로핀 밴드는 엑손 51의 결실을 나타낸다. 엑손 48 및 53내 프라이머 위치가 나타나 있다(Fw, Rv). (도 11의 B) 사건의 퍼센트는 TOPO-TA 생성된 클론의 RT-PCR 서열 분석을 사용하여 AAV9-sgRNA-51-SA2 처리 후 엑손 51에서 검출하였다. 각각의 4개의 상이한 샘플에 대해, 본 발명자는 40개 클론을 생성하고 서열화하였다. RT-PCR 생성물을 4개 그룹으로 나누었다: 편집되지 않음(NE), 엑손51-스킵됨(SK), 재프레임됨(RF) 및 프레임 벗어남(OF). (도 11의 C) △Ex50-51 마우스 디스트로핀 하부 밴드의 RT-PCR 생성물의 서열은 엑손 49가 엑손 51을 배제한, 엑손 52에 직접 스플라이스되었음을 입증하였다. 재프레임된 △Ex50(△Ex50-RF)의 RT-PCR 생성물의 서열. 도 11의 C는 나타낸 순서로, 각각 서열 번호: 1015 내지 1022를 개시한다. (도 11의 D) 편집되지 않은 Ex50(NE) 및 △Ex50-RF를 함유하는 상부 밴드로부터의 RT-PCR 생성물의 K 서열 분석. 삽입(녹색으로 강조함) 및 결실(적색으로 나타냄)을 나타내는 RT-PCR 생성물의 서열. n=4. 데이타는 평균 ± SEM을 나타낸다. 도 11의 D는 나타낸 순서로, 각각 서열 번호: 1023 내지 1026을 나타낸다.
도 12의 A 내지 D. AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 근육내 주사는 디스트로핀 발현을 수정한다. (도 12의 A) △Ex50 마우스의 전경골근 근육에 sgRNA 및 Cas9를 암호화하는 AAV9 벡터를 주사하고 디스트로핀에 대한 면역염색에 의해 3주 후 분석하였다. 야생형 대조군(WT-CTL) 마우스 및 △Ex50 마우스 대조군(△Ex50-CTL)에 sgRNA의 부재하에서 AAV9-Cas9 만을 주사하였다. WT-CTL과 비교하여 △Ex50-CTL 마우스 및 처리된 △Ex50 마우스(△Ex50-AAV9-sgRNA-51-SA2 및 AAV9-Cas9)에서 디스트로핀-양성 근섬유의 퍼센트를 각각의 패널에 나타낸다. (도 12의 B) 전경골근 근육의 헤마톡실린 및 에오신(H&E) 염색. (도 12의 C) 근육내 주사 후 3주째에 전경골근 근육내 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. (도 12의 D) 빈쿨린에 대한 표준화 후 블롯으로부터 디스트로핀 발현의 정량화. 별표는 비-특이적인 면역반응성 밴드를 나타낸다. AAV9-sgRNA-51-SA2의 경우 n=5. 기준자: 50μm
도 13. △Ex50 마우스 모델에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 근육내 주사 후 디스트로핀 발현의 구제(rescue). 전체 전경골근 근육의 디스트로핀 면역조직화학. CTL 마우스에게 AAV9-sgRNA-51-SA2의 부재하에 AAV9-Cas9 만을 주사하였다. n=5
도 14. 3주 후 주사된 근육의 조직학적 개선. 헤마톡실린 및 에오신(H&E) 염색에 의한 전경골근 근육의 조직화학.
도 15의 A 및 B. △Ex50 마우스 모델에서 sgRNA의 단일 카피 또는 트리플 카피를 발현하는 상이한 AAV9와 조합된 AAV9-Cas9의 근육내 주사 후 디스트로핀 발현의 구제. (도 15의 A) RNA 폴리머라제 III에 대한 U6, H1 및 7SK 프로모터를 각각 개별적으로 사용하여 단일 카피(AAV9-U6-sgRNA-51-SA2; AAV9-H1-sgRNA-51-SA2; AAV9-7SK-sgRNA-51-SA2) 또는 트리플 카피내에서 sgRNA를 발현시켰다. (도 15의 B) 전체 전경골근 근육의 디스트로핀 면역조직화학. 대조군(CTL) 마우스에게 AAV9-sgRNA-51-SA2의 부재하에서 AAV9-Cas9 만을 주사하였다.
도 16의 A 및 B. △Ex50 마우스내에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전신계 전달 후 4주째에 디스트로핀 발현의 구제. (도 16의 A) AAV9-sgRNA-51의 전신계 주사 후 8주째에 전경골근(TA), 삼두박근, 횡격막 및 심장 근육의 디스트로핀 면역염색. (도 16의 B) TA, 삼두박근, 횡격막 근육 및 심장에서 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. 기준자: 50μm.
도 17의 A 및 B. △Ex50 마우스에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전신계 전달 후 8주째에 디스트로핀 발현의 구제. (도 17의 A) AAV9-sgRNA-51의 전신계 주사 후 8주째에 전경골근(TA), 삼두박근, 횡격막근 및 심장 근육의 디스트로핀 면역염색. (도 17의 B) TA, 삼두박근, 횡격막 근육 및 심장에서 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. 각각의 그룹에 대해 n=5. 기준자: 50μm.
도 18의 A 및 B. △Ex50 마우스에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전신계 전달 후 4주째에 기능 개선. (도 18의 A) 야생형(WT) 마우스, 대조군 △Ex50 마우스 및 AAV9-sgRNA-51(△Ex50-AAV9-sgRNA-51)로 처리한 △Ex50 마우스를 악력 시험에 적용시켜 근육 성능(힘의 그램)을 측정하였다. (도 18의 B) 혈청 크레아티닌 키나제(CK)를 WT, △Ex50 및 △Ex50-AAV9-sgRNA-51 마우스에서 측정하였다. n=5. 별표는 비-특이적인 면역반응성 밴드를 나타낸다. 데이타는 평균 ± SEM으로 나타낸다.
도 19. △Ex50-MD 개(dog)에서 근육내 주사 후 6주째에 디스트로핀 발현의 수정. 야생형 개(Nathan), 처리되지 않은 △Ex50-MD 개, 및 대측성 주사되지 않은 및 AAV9-Cas9-sgRNA 주사된 2마리의 △Ex50-MD 개(Norman 및 Newton)의 두개 경골근의 디스트로핀 면역조직화학 염색. 기준자: 50μm.
도 20의 A 및 B. △Ex50-MD 개에서 근육내 주사 후 6주째에 디스트로핀 발현의 수정. (도 20의 A) 야생형 개(Nathan), 처리되지 않은 △Ex50-MD 개, 및 대측성 주사되지 않은 및 AAV9-Cas9-sgRNA 주사된 2마리의 △Ex50-MD 개(Norman 및 Newton)의 두개 경골근의 디스트로핀(DMD) 및 빈쿨린(VCL)의 웨스턴 블롯 분석. (도 20의 B) 빈쿨린에 대한 표준화 후 2개의 독립적인 블롯으로부터의 디스트로핀 발현의 정량화.
도 21. △Ex50-MD 개에서 6주 후 주사된 근육의 조직학적 개선. 야생형 개(Nathan), 대측성 주사되지 않은 및 AAV9-Cas9-sgRNA 주사된 △Ex50-MD 개(Norman 및 Newton)의 두개 경골근의 헤마톡실린 및 에오신(H&E) 염색에 의한 조직화학. 기준자: 50 μm.
상세한 설명
DMD는 사람에서 확인된 4,000개 이상의 독립적인 돌연변이를 지닌 신규한 돌연변이 증후군이다(world-wide web at dmd.nl). 대부분의 환자 돌연변이는 핫스팟(hotspot)에서 밀집하는 결실을 포함하므로, 특정의 엑손을 스키핑하기 위한 치료학적 시도를 환자의 거대 그룹에 적용한다. 엑손 스키핑 시도의 근거는 DMD 환자와 베커 근 이영양증(Becker muscular dystrophy: BMD) 환자 사이의 유전적 차이를 기반으로 한다. DMD 환자에서, 디스트로핀 mRNA의 판독 프레임은 붕괴되어 미성숙하게 절두된(truncated), 비-기능성 디스트로핀 단백질을 생성한다. BMD 환자는 판독 프레임을 유지하는 DMD 유전자내 돌연변이를 가짐으로써 내부적으로 결실되지만, 부분적으로 기능성인 디스트로핀의 생산을 허용함으로써 DMD 환자와 비교하여 훨씬 더 온화한 질환 증상을 야기한다.
DMD를 치료하기 위한 조성물 및 방법이 본원에 제공된다. 일부 구현예에서, AAV 작제물이 제공되며, 여기서 AAV 작제물은 각각 DMD 가이드 RNA의 발현을 구동시키는 3개의 프로모터를 암호화하는 핵산을 포함한다. 본원에 개시된 조성물 및 방법을 사용하여, 보다 견고하고 안전한 형태의 게놈 편집을 엑손 50내에서 및 △Ex50-MD 개내에서 결실을 지닌 DMD에 대한 사람화된 마우스 모델에서 달성하였다. 개시내용의 이러한 및 다른 양태는 하기에 재현되어 있다.
I. 듀켄씨 근 이영양증
A. 배경
듀켄씨 근 이영양증(DMD)은 5000명의 소년 중 대략 1명에게 영향을 미치는, 근 이영양증의 열성 X-관련된 형태(X-linked form)이며, 이는 근육 변성 및 조기성숙 사망을 야기한다. 이러한 장애는 사람 X 염색체 상에 위치한 유전자 디스트로핀(참고: 진뱅크(GenBank) 수탁 번호 NC_000023.11)내 돌연변이에 의해 유발되며, 상기 염색체는 단백질 디스트로핀(진뱅크 수탁 번호 AAA53189; 서열 번호: 5)을 암호화하고, 이의 서열은 하기에 재현되어 있다:
사람에서, 디스트로핀 mRNA는 79개의 엑손을 함유한다. 디스트로핀 mRNA는 대안적으로 스플라이싱되어 다양한 동형을 생성하는 것으로 알려져 있다. 예시적인 디스트로핀 동형은 표 1에 나열되어 있다.
[표 1]
쥐 디스트로핀 단백질은 다음의 아미노산 서열(유니프롯(Uniprot) 수탁 번호 P11531, 서열 번호: 869)을 갖는다:
디스트로핀은 세포막의 디스트로글리칸 복합체(DGC)에 대해 구조적 안정성을 제공하는 근 조직내의 중요한 성분이다. 성별 둘 다는 돌연변이를 유발할 수 있으므로, 여성은 질환의 골격근 형태에 거의 영향받지 않는다.
돌연변이는 자연적으로 및 흔히 변한다. 큰 유전적 결실이 사례의 약 60 내지 70%에서 발견되며, 큰 중복은 사례의 약 10%에서 발견되며, 점 돌연변이 또는 다른 작은 변화가 사례의 약 15 내지 30%를 차지한다. 일부 7000개의 돌연변이를 실험한 블라덴(Bladen) 등(Bladen et al. (2015))은 총 5,682개의 큰 돌연변이(전체 돌연변이 중 80%)를 분류하였으며, 이중 4,894(86%)가 결실(1개의 엑손 또는 그 이상)이고 784개(14%)가 중복((1개 엑손 또는 그 이상)이었다. 1,445개의 작은 돌연변이(1개의 엑손보다 작음, 모든 돌연변이의 20%)가 존재하였으며, 이중 358개(25%)는 작은 결실이었고, 132개(9%)는 작은 삽입인 반면, 199개(14%)는 스플라이스 부위에 영향을 미쳤다. 점 돌연변이는 총756개(작은 돌연변이의 52%)이며 726개(50%)는 넌센스 돌연변이(nonsense mutation)이고 30개(2%)는 미스센스 돌연변이(missense mutation)이었다. 최종적으로, 22개(0.3%)의 인트론내(mid-intronic) 돌연변이가 관찰되었다. 또한, 돌연변이는 정지 코돈 판독 치료요법(stop codon read-through therapy(총 돌연변이의 10%) 및 엑손 스키핑 치료요법(엑손 skipping therapy)(결실의 80% 및 총 돌연변이의 55%)을 포함하는 DMD에 대한 신규한 유전 치료요법으로부터 잠재적으로 유리할 수 있는 데이타베이스내에서 확인되었다.
B. 증상
증상은 일반적으로 2 내지 3세 연령 사이의 소년에서 나타나며 영아 초기에서 가시화될 수 있다. 증상이 영아 초기까지 나타나지 않는다고 해도, 실험실 시험은 출생시 활성 돌연변이를 수반한 어린이를 확인할 수 있다. 근육량의 손실과 관련된 다리 및 골반의 진행성 근위근 약화가 처음 관찰된다. 궁극적으로 이러한 약화는 팔, 목, 및 다른 부위로 확산된다. 조기 신호는 가성비대(종아리 및 삼각근의 비대), 낮은 지구력, 및 보조없이 직립의 곤란성 또는 계단 오르기의 불능을 포함할 수 있다. 상태가 진행됨에 따라, 근 조직은 소모성을 경험하며 궁극적으로 지방 및 섬유 조직(섬유증)으로 대체된다. 10세까지, 걷기를 보조하기 위해 브레이스(brace)를 필요로 할 수 있지만 대부분의 환자는 12세까지 휠체어에 의존한다. 말기 증상은 척추의 만곡을 포함하는, 골격 기형을 야기하는 비정상적인 골 발달을 포함할 수 있다. 근육의 진행성 악화로 인하여, 운동 손실이 발생하여, 궁극적으로 마비를 초래한다. 지적 장애가 존재할 수 있거나 존재하지 않을 수 있지만, 존재하는 경우, 어린이가 나이가 들어감에 따라 점진적으로 악화되지는 않는다. DMD로 고통받은 남성에 대한 평균 기대 수명은 대략 25세이다.
진행성, 신경근 장애인, 듀켄씨 근 이영양증의 주요 증상은 근 소모와 관련된 근육 약화이며, 수의근, 특히, 엉덩이, 골반 부위, 넙적다리, 어깨, 및 종아리의 수의근이 처음으로 영향을 받는다. 근육 약화는 또한 후에, 팔, 목, 및 다른 부위에서 발생한다. 종아리는 흔히 비대해진다. 증상은 일반적으로 6세 이전에 나타나며 영아 초기에 나타날 수 있다. 다른 육체적 증상은 다음과 같다:
1. 부자연스러운 방식의 걷기, 걸음(stepping), 또는 달리기 - (환자는 증가된 종아리 근 긴장으로 인하여, 이들의 전족부에서 걷는 경향이 있다. 또한, 발가락 걷기(toe walking)가 무릎 신근 약화에 대한 보상 적응이다.)
2. 빈번한 넘어짐.
3. 피로.
4. 운동 기술(달리기, 호핑(hopping), 점핑(jumping))의 곤란.
5. 가능하게는 엉덩이-굴근의 단축을 초래하는, 요추 과전만증(lumbar hyperlordosis). 이는 전반적인 자세 및 걷기, 걸음, 또는 달리기 방식에 영향을 미친다.
6. 아킬레스 건 및 슬건(hamstring)의 근 수축은 연결 조직내 단축된 근 섬유 및 피브로스(fibrose)로 인하여 기능성을 손상시킨다.
7. 점진적인 걷기 곤란성.
8. 근 섬유 변형.
9. 혀 및 종아리 근육의 가성비대(비대). 근 조직은 궁극적으로 지방 및 연결 조직으로 대체되므로, 용어 가성비대가 된다.
10. 고 위험의 신경행동 장애(예컨대, ADHD), 학습 장애(난독증), 및 특수한 인지 기술(특히, 단기간 언어 기억)에 있어서 비-진행성 약화, 이는 뇌 속에 디스트로핀의 부재 또는 기능장애의 결과인 것으로 여겨진다.
11. 걷기 능력의 궁극적인 상실(일반적으로 12세까지).
12. 골격 변형(일부 경우에 척추측만증 포함).
13. 눕거나 앉는 자세로부터 곤란한 일어나기.
이러한 상태는 환자가 자신의 제1 단계에 들어가는 순간으로부터 임상적으로 관찰될 수 있으며, 걷는 능력은 일반적으로 소년이 9세 내지 12세 사이에서 완전히 와해된다. DMD로 고통받은 대부분의 남성은 21세까지 필수적으로 "목 아래로부터 마비"된다. 근 소비는 다리 및 골반에서 시작한 후, 어깨 및 목의 근육으로 진행하고, 이후, 팔 근육 및 호흡 근육의 손실로 이어진다. 종아리 근육 비대(가성비대)가 매우 명백하다. 심근증이 특히 (확장된 심근병증) 일반적이지만, 울혈성 심부전 또는 부정맥(불규칙적인 심박동)은 단지 가끔 일어난다.
양성 고워스 신호(Gowers' sign)는 하체 근육의 보다 심각한 손상을 반영한다. 어린이는 상체를 사용하여 스스로 일어나는 것을 돕는다: 첫째로 자신의 팔 및 무릎에 의존하여 일어난 후, 자신의 손으로 다리를 들어서 똑바로 일어남으로써 "걷는다". 고통을 받는 어린이는 일반적으로 보다 더 쉽게 피곤해하며 이들의 또래보다 전반적으로 힘이 거의 없다. 혈류 속의 크레아틴 키나제(CPK-MM) 수준이 극도로 높다. 근전도검사(EMG)는 약화가 신경에 대한 손상에 의해서라기 보다는 근육 조직의 파괴에 의해 유발됨을 나타낸다. 유전적 시험은 Xp21 유전자내 유전적 오류를 나타낼 수 있다. 근육 생검(면역조직화학 또는 면역블롯팅) 또는 유전적 시험(혈액 시험)은 유전적 시험에 있어서의 개선이 종종 이를 불필요하게 하지만, 디스트로핀의 부재를 확인한다.
DMD 환자는 다음으로부터 고통을 받을 수 있다:
1. 비정상적인 심근(심근병증).
2. 울혈성 심부전 또는 불규칙적인 심박동(부정맥).
3. 심장 및 등의 기형(척추측만증).
4. 종아리, 궁둥이, 및 어깨의 비대 근육(대략 4 또는 5세). 이러한 근육은 궁극적으로 지방 및 연결 조직으로 대체된다(가성비대).
5. 근육량의 손실(위축증).
6. 발뒷꿈치, 다리에서의 근 수축.
7. 근육 변형.
8. 폐렴 및 폐내로 유입되는 음식물 또는 유체의 삼킴을 포함하는, 호흡 장애(질환의 마지막 단계).
C. 원인
듀켄씨 근 이영양증(DMD)은 X 염색체의 짧은 아암(short arm)에 위치하는, 유전자자리 Xp21에서 디스트로핀 유전자의 돌연변이에 의해 유발된다. 디스트로핀은 많은 소단위를 함유하는 단백질 복합체를 통해, 기본적인 기저 라미나(underlying basal lamina)(세포외 매트릭스)에 각각의 근섬유의 세포골격을 연결시키는데 관여한다. 다스트로핀의 부재는 과도한 칼슘이 근섬유막(세포 막)을 침투하도록 한다. 칼슘 및 신호전달 경로(signaling pathway)에 있어서의 변경은 물이 미토콘드리아내로 도입되도록 하며, 미토콘드리아는 이후 파열한다.
골격근 이영양증에서, 미토콘드리아 기능장애는 스트레스-유도된 세포질성 칼슘 신호의 증폭 및 스트레스-유도된 반응성-산소종(ROS) 생산의 증폭을 일으킨다. 몇가지 경로를 포함하고 명확하게 이해되지 않는 복잡한 캐스캐이딩(cascading) 공정에서, 세포내 증가된 산화 스트레스는 근섬유막을 손상시키고 최종적으로 세포의 사멸을 야기시킨다. 근섬유는 괴사를 겪으며 궁극적으로 지방질 및 연결 조직으로 대체된다.
DMD는 X-연결된 열성 패턴으로 유전된다. 여성은 전형적으로 질환에 대한 매개체일 것이지만 남성은 영향을 받지 않을 것이다. 전형적으로, 여성 매개체는 그들이 영향받은 아들을 가질 때까지 돌연변이를 지니고 있는지 인지하지 못할 것이다. 매개체 엄마의 아들은 그의 엄마로부터 결함이 있는 유전자를 유전시킬 확률이 50%이다. 매개체 엄마의 딸은 매개체가 될 확률이 50%이고, 유전자의 2개의 정상 카피를 가질 확률이 50%이다. 모든 경우에서, 영향받지 않은 아버지는 정상의 Y를 그의 아들에게 전달하거나 정상의 X를 그의 딸에게 전달할 것이다. DMD와 같은, X-연결된 열성 조건의 여성 매개체는 X-불활성화의 이들의 패턴에 따른 증상을 나타낼 수 있다.
프레임 엑손 외부의 병치(juxtaposing)에 의해 개방 판독 프레인(ORF)을 파괴하는, 사람 DMD 유전자의 엑손 51 앞쪽의 엑손 결실은 사람 DMD 돌연변이의 가장 일반적인 유형을 나타낸다. 엑손 51의 스키핑은 원칙적으로 엑손 결실된 DMD 환자의 13%에서 DMD ORF를 회복한다.
듀켄씨 근 이영양증은 5000명의 남성 유아 중 1명의 발생율을 갖는다. 디스트로핀 유전자내 돌연변이는 상속될 수 있거나 생식세포 전달 동안 자발적으로 발생할 수 있다. 예시적이지만 비-제한적인 돌연변이 및 상응하는 모델의 표는 하기에 나타낸다:
[표 2]
D. 진단
유전 상담은 장애의 가계력을 지닌 사람들을 상담한다. 듀켄씨 근 이영양증은 임신 동안 수행된 유전 연구에 의해 약 95% 정확도로 검출될 수 있다.
DNA 시험. 디스트로핀 유전자의 근육-특이적인 동형은 79개의 엑손으로 구성되며, DNA 시험 및 분석은 일반적으로 영향받은 엑손 또는 엑손들의 특이한 유형의 돌연변이를 확인할 수 있다.
근육 생검. DNA 시험이 돌연변이를 발견하지 못한 경우, 근육 생검 시험을 수행할 수 있다. 근 조직의 작은 샘플을 추출(일반적으로 침(needle) 대신에 스캘펠(scalpel)을 사용)하고 디스트로핀의 존재를 나타내는 염료를 적용한다. 단백질의 완전한 부재는 상태를 나타낸다.
과거 수년에 걸쳐 이러한 상태를 유발하는 많은 돌연변이를 보다 더 검출하는 DNA 시험이 개발되어 왔으며, 근육 생검은 듀켄의 존재를 확인하기 위해 자주 요구되지는 않는다.
태아 검사. DMD는 X-연결된 열성 유전자에 의해 운반된다. 남성은 단지 하나의 X 염색체를 가지므로, 돌연변이된 유전자의 하나의 카피는 DMD를 유발할 것이다. 아버지는 이들의 아들에게 X-연결된 특성을 이전시킬 수 없으므로, 돌연변이는 어머니에 의해 이전된다.
어머니가 매개체인 경우, 및 따라서, 그녀의 2개의 X 염색체 중 하나가 DMD 돌연변이를 갖는 경우, 여성 아이가 그녀의 2개의 X 염색체 중 하나로서 이러한 돌연변이를 유전시킬 것이며, 매개체가 될 것이다. 남성 어린이가 그의 하나의 X 염색체로서 이러한 돌연변이를 유전시키고 따라서 DMD를 가지게 될 확률은 50%이다.
태아 검사는 이들의 미출생 아이가 가장 흔한 돌연변이를 가지고 있는지를 물을 수 있다. DMD에 관여하는 많은 돌연변이가 존재하며, 일부는 확인되어 있지 않으므로, 태아 검사는 DMD를 지닌 가족 구성원이 확인된 돌연변이를 갖는 경우에유전 시험 만을 작업한다.
침습적 시험(invasive testing) 전에, 태아 성별의 결정은 중요하다; 남성은 때때로 이러한 X-연결된 질환에 의해 영향받지만, 여성 DMD는 극도로 드물다. 이는 16주째에 초음파 스캔에 의해서 또는 보다 최근에는 자유 태아 DNA 시험(free fetal DNA testing)에 의해 달성할 수 있다. 융모막 융모 샘플링(Chorion villus sampling: CVS)을 11 내지 14주째에 수행할 수 있으며, 1%의 유산 위험성을 갖는다. 양수천자를 15주 후 수행할 수 있으며 0.5%의 유산 위험성을 갖는다. 태아 혈액 샘플링은 약 18주째에 수행할 수 있다. 명확하지 않은 유전 시험 결과의 경우에 다른 선택사항은 태아 근육 생검이다.
E. 치료
현재 DMD의 치유는 존재하지 않으며, 진행중인 의학적 요구는 규제 기관에 의해 인식되어 왔다. 특정의 돌연변이에 대한 엑손 스키핑 치료를 사용한 1 내지 2a 상 시험이 위축을 중지시키고 걷기에 있어서 작은 임상적 개선을 생성하였다. 치료는 일반적으로 증상의 발생을 제어함으로써 삶의 질을 극대화하는데 목표를 두고 있으며 다음을 포함할 수 있다:
1. 코르티코스테로이드, 예를 들면, 프레드니솔론 및 데플라자코트는 에너지 및 힘을 증가시키고 일부 증상의 중증도를 지연시킨다.
2. 무작위적인 제어 시험은 베타-2-효능제가 근육 강도를 증가시키지만 질환 진행을 변형시키지 않음을 나타내었다. 베타2-효능제에서 대부분의 RCT에 대한 후속 조치 시간은 단지 대략 12개월이므로 이러한 시간 프레임을 초과하여 추론될 수 없다.
3. 수영과 같은, 가볍고, 충돌이 없는(non-jarring) 육체 활동이 추천된다. 비활동(예를 들면, 장기 요양)은 근육 질환을 악화시킬 수 있다.
4. 물리적 요법은 근육 강도, 유연성, 및 기능을 유지시키는데 도움이 된다.
5. 정형외과 기기(예를 들면, 브레이스(brace) 및 휠체어)는 이동성 및 자가-보호능을 개선시킬 수 있다. 수면 동안 적소에서 발목을 유지시키는 형태-고정 제거가능한 다리 브레이스(form-fitting removable leg brace)는 구축(contracture)의 발생을 지연시킬 수 있다.
6. 질환이 진행됨에 따라 적절한 호흡 지지대가 중요하다.
DMD에 대한 종합적인 다영역(multi-disciplinary) 보호 표준/안내서가 질병관리예방 센터(Centers for Disease Control and Prevention: CDC)에 의해 개발되었으며, www.treat-nmd.eu/dmd/care/diagnosis-management-DMD에서 이용가능하다.
DMD는 일반적으로 이들의 전문이 참고로 포함된, Bushby et al., Lancet Neurol., 9(1): 77-93 (2010) 및 Bushby et al., Lancet Neurol., 9(2): 177-198 (2010)에 요약된 바와 같이, 5 단계를 통해 진행한다. 잠복기 단계 동안에, 환자는 전형적으로 발달 지연을 나타내지만, 보행 장애는 없다. 조기 보행 단계 동안에, 환자는 전형적으로 고워 신호(Gowers' sign), 동요성 보행(waddling gait), 및 발가락 걷기를 나타낸다. 말기 보행 단계 동안에, 환자는 전형적으로 점점 더 힘든 보행을 나타내고 계단을 오르고 바닥을 올라가는 능력을 상실하기 시작한다. 조기 비-보행 단계 동안에, 환자는 전형적으로 일정 시간 동안 자가-추진(self-propel)할 수 있고, 자세를 유지할 수 있으며, 척추 측만증으로 발달할 수 있다. 말기 비-보행 단계 동안에, 상체 기능 및 자제 유지가 크게 제한된다.
일부 구현예에서, 치료는 질환의 잠복 단계에서 시작된다. 일부 구현예에서, 치료는 조기 보행 단계에서 시작된다. 일부 구현예에서, 치료는 말기 보행 단계에서 시작된다. 구현예에서, 치료는 조기 비-보행 단계 동안에 시작된다. 구현예에서, 치료는 말기 비-보행 단계 동안에 시작된다.
1. 물리적 치료요법
물리적 치료요법은 환자가 이들의 최대 물리적 잠재능에 도달할 수 있도록 하는 것과 관련된다. 이의 목표는:
1. 경우에 따라 스트레치(stretch) 및 운동 프로그램을 개발함으로써 구축(contracture) 및 기형의 발달을 최소화시키고,
2. 브레이싱(bracing) 및 내구성 의약 장치를 추천함으로써 물리적 특성의 다른 2차적인 합병증을 예상하고 최소화하며,
3. 호흡 기능을 모니터링하고 호흡 연습으로 보조하는 기술 및 분비물을 세정하는 방법을 충고하는 것이다.
2. 호흡 보조
조절가능한 용적(양)의 공기를 각각의 숨(breath)으로 사람에게 전달하는 현대의 "용적 환기기(volume ventilator)/호흡기(respirator)"는 호흡 문제와 관련된 근 위축증을 지닌 사람의 치료시 가치가 있다. 산소호흡기는 이를 통해 공기가 직접 전달되는 침습성 기관내 또는 기관절개술 튜브를 필요로 할 수 있지만, 일부 사람들의 경우 안면 마스크 또는 마우스피스(mouthpiece)를 통한 비-침습성 전달이 충분하다. 긍정적인 기도압 기기(positive airway pressure machine), 특히 바이-레벨(bi-level)의 것은 때때로 후자의 방식으로 사용된다. 호흡 장치는 이동성을 위해 외부 배터리를 지닌 전동 휠체어의 바닥 또는 후면위의 통풍 트레이(ventilator tray) 위에 용이하게 고정할 수 있다.
통풍기 처리는 호흡 근육이 붕괴되기 시작할 수 있는 경우 10대 중반 내지 후반에 시작할 수 있다. 폐활량이 정상의 40% 이하로 강하하게 되면, 용적 환풍기/호흡기를 수면 시간 동안 사용할 수 있으며, 이때에 사람은 대부분 환기 하에 존재하여야 하는 경향이 있다("폐포저환(hypoventilating)"). 수면 동안 폐포저환(hypoventilation)은 산소측정법 연구 및 모세 혈관 가스를 사용한 수면 장애의 절저한 병력에 의해 측정된다(참고: 폐 기능 시험(Pulmonary Function Testing)). 기침 보조 장치는 포지티브 공기압, 이후에 점액을 증가시키기 위한 네가티브 압력을 사용한 폐의 과다팽창에 의해 폐내에 과도한 점액으로 도움을 줄 수 있다. 폐활량이 정상의 30 퍼센트 미만으로 지속적으로 강하하는 경우, 용적 환기기/호흡기가 또한 추가의 보조를 위해 낮동안 필요할 수 있다. 개인은 필요한 경우 낮 동안 환기기/호흡기를 사용하여 시간의 양을 증가시킬 것이다.
F. 예후
듀켄씨 근 이영양증은 모든 모든 수의근에 영향을 미치고 말기 단계에 심장 및 호흡 근육에 관여하는 진행성 질환이다. 수명 예측은 현재 대략 25세인 것으로 추정되고 있지만, 이는 환자에 따라 변한다. 의약에서의 최근의 진전은 고통을 받는 사람의 수명을 연장시키고 있다. 모든 근육 질환에 초점을 맞추고 있는 선도하는 영국 자선단체(leading UK charity)인, 근 이영양증 캠페인(Muscular Dystrophy Campaign)은 "높은 표준의 건강 관리로, 보호듀켄씨 근 이영양증을 지닌 어린 남자는 흔히 이들의 30대 까지 잘 살고 있다"라고 기술하고 있다.
드믄 경우에, DMD를 지닌 개인은 휠체어 및 침대, 호흡 보조기(ventilator support)(기관절개술 또는 마우스피스를 통한), 기도 세정, 및 필요한 경우, 심장 의약의 사용으로 40대 또는 50대 초반까지 생존하는 것으로 관찰되었다. 만년 케어(later-life care)를 위해 필요한 후원의 조기 계획은 DMD를 지닌 개인 삶에 있어서 보다 긴 지속성을 나타내었다.
기이하게도, 듀켄씨 근 이영양증의 mdx 마우스 모델에서, 디스트로핀의 결핍은 증가된 칼슘 수준 및 골격근 근괴사와 관련되어 있다. 내재 후두근(intrinsic laryngeal muscle: ILM)은 보호되어 있으며 근괴사를 겪지 않는다. ILM은 다른 근육과 비교하여 칼슘 변화를 취급하는 보다 우수한 능력을 제안하는 칼슘 조절 시스템 프로파일을 가지고 있으며, 이는 이들의 독특한 병리생리학적 특성에 대한 기계론적 통찰력을 제공할 수 있다. ILM은 다양한 임상 시나리오에서 근 소모성의 예방 및 치료를 위한 새로운 전략의 개발을 촉진시킬 수 있다.
II. 게놈 편집으로부터 유리한 다른 질환
DMD의 치료에 있어서의 적용을 발견한 것 외에도, 본 발명자의 다중-가이드 시도는 이러한 개입이 기본 원인의 유전적 결합의 수정을 야기할 수 있는 다른 질환 상태에 유리하게 적용될 수 있다. 이들 중 일부는 하기에 간략하게 기술된다.
지대 근 이영양증(Limb Girdle Muscular Dystrophy). 지대 근 이영양증(limb-girdle muscular dystrophy: LGMD) 또는 에르브 근 이영양증(Erb's muscular dystrophy)은 희귀한 근 이영양증의 유전적으로 및 임상적으로 이질성인 그룹이다. 이는 주로 엉덩이 및 어깨 근육에 영향을 미치는 진행성 근육 소모를 특징으로 한다. LGMD는 상염색체 패턴의 유전성을 가지며 현재 알려진 치료는 없다. 지대 근 이영양증(LGMD)을 지닌 개인의 증상은 일반적으로 걷기, 계단의 오르내림 및 의자에서 일어나기에 곤란성을 갖는다. 규칙적으로 위로 굽이거나 아래로 굽히는 것의 곤란성이 또한 일반적이다. 특정 물체를 들어올리는 것의 곤란성 뿐만 아니라 팔을 머리 밖으로 또는 위로 올리는 것의 곤란성 또한 LGMD의 일반적인 표시이다. 궁극적으로 걷고/뛰는 능력이 악화된다.
진행이 일부 환자에서는 다른 이들보다 더 신속하지만, 질환은 필연적으로 시간이 경과함에 따라 악화한다. 궁극적으로, 질환은 얼굴에 위치한 것과 같은 다른 근육에 영향을 미칠 수 있다. 질환은 일반적으로 증상이 발병한 몇년 안에 휠체어에 의지하게 되지만, 환자간에 가변성이 크며, 일부 환자는 이동성을 유지한다.
근육 약화는 일반적으로 대칭적이고, 몸 중심부 쪽이며, 서서히 진행한다. 대부분의 경우에, 통증은 LGMD으로는 나타나지 않고 정신 기능도 영향받지 않는다. LGMD는 어린 시기, 청소년기, 젊은 성년기 또는 심지어 그 후에 시작될 수 있으며, 발병 나이는 일반적으로 10 내지 30세이다. 여성 및 남성 둘 다가 동등하게 영향을 받으며, 지대 근 이영양증이 어린 시기에 시작되면 진행은 보다 빠르고 질환이 보다더 불능인 것으로 여겨진다. 장애가 청소년기 또는 성년에 시작되면 질환은 일반적으로 심각하지 않고 보다 느리게 진행된다. 표시에서 감각 신경병증 또는 자율신경계 또는 교감 신경 기능장애는 없다.
LGMD의 유전학의 측면에서, 이는 우성 또는 열성의 유전적 결함으로 유전될 수 있지만, 유전된 장애이다. 결함의 결과는 근육이 정상적인 근육 기능에 필요한 특정의 단백질을 적절하게 형성할 수 없다는 것이다. 몇가지 상이한 단백질이 영향받을 수 있으며, 부재하거나 결함이 있는 특정의 단백질은 특정 유형의 근 이영양증을 확인한다. LGMD에서 영향받은 단백질 중에는 α, β, γ 및 δ 사르코글리칸(sarcoglycan)이 있다. 사르코글리카노패씨(sarcoglycanopathy)는 유전자 치료요법으로 가능하게 처리할 수 있다.
다이스페리돌연변이증(Dysferlinopathy). 다이스페린돌연변이증은 다이소페린 유전자내 돌연변이로 인한 기능성 다이스페린 단백질의 결핍에 의해 유발된 상염색체 열성 신경근육 장애이다. 다이스페린돌연변이증은 점진적인 근육 소모를 특징으로 하며 가장 흔하게는 진단시 근육 개입의 초기 패턴에 따라, 지대 근 이영양증 2B형(LGMD2B) 또는 미요시형 근병증(Miyoshi muscular dystrophy) 1(MMD1; 원위 근 이영양증)로 임상적으로 진단된다. 다이스페린돌연변이증은 희귀 질환이며, 이의 정확한 발병률은 아직 측정되지 않았다.
다이스페린돌연변이증의 증상은 일반적으로 16세와 25세 사이의 초기 성년에서 나타나며 주로 사지 및 지대(엉덩이 및 어깨)의 골결근에 영향을 미치며, 심장 및 횡격막과 같은 주요 근육은 영향받지 않는 채로 남는다. 대부분의 다이스페린돌연변이증 환자는 진단받은지 10 내지 20년 내에 걸어다닐 수 없게 되지만, 기대 수명은 정상이다. 질환의 발병 및 진행 나이에 있어서 큰 다양성이 존재한다.
LGMD2B 및 MMD1이 둘 다 다이스페린 결핍증에 의해 유발되지만, LGMD2B의 진단은 약화가 근위 근육(넙적다리 및 상부 팔)에서 초기에 존재는 경우 이루어지나, MMD1의 진단은 약화가 초기에 원위 근육(종아리 및 하부 팔)에 존재하는 경우에 이루어진다. 둘 다의 경우에서, 약화는 궁극적으로 원위 및 근위 근육 둘 다를 포함하도록 진행된다. LGMD2B 및 MMD1 둘 다는 진단하기 매우 어려우며, 환자는 흔히 다이스페린돌연변이증으로 성공적으로 진단되기 전에 여러번 오진된다.
"다이스페린돌연변이증"은 단순하게 다이스페린 단백질인, LGMD2B의 부재를 지칭하며 미요시형 근병증 1은 다이스페린 유전자내 돌연변이가 검출될 수 있는 경우에만 확인된 진단이다. 환자는 다이스페린돌연변이증에 대해 특이적인 임상 연구 및 시험에 참여하기 위한 유전 진단을 받는 것이 필수이다. 제인 파운데이션(Jain Foundation)은 지대 근 이영양증을 지닌 환자가 시험을 체계화하고 비용을 충당함으로써 유전 진단을 달성하도록 하는데 돕는 비-영리단체(non-profit family organization)(www.jain-foundation.org)이다.
티틴 근질환(Titin Myopathy). 코넥틴으로 또한 공지된 티틴은 사람에서 TTN 유전자에 의해 암호화된 단백질이다. 티틴은 근육의 수동적 탄력성에 관여하는 분자 스프링으로서 기능하는, 길이가 1 μm를 초과하는 거대 단백질이다. 이는 구조화되지 않은 펩타이드 서열에 의해 연결된 244개의 개별적으로 폴딩된 단백질 도메인으로 구성된다. 이러한 도메인은 단백질이 스트레치된 경우 폴딩되어 있지 않으며 긴장 상태가 제거된 경우 재폴딩(refolding)된다.
티틴은 가로무늬 근 조직의 수축에 중요하다. 이는 근절(sarcomere)에서 Z 라인을 M 라인에 연결시킨다. 단백질은 Z 라인에서의 힘 전달 및 I 밴드 영역에서의 긴장 상태에 기여한다. 이는 긴장상태에서 근절의 운동 범위를 제한하므로, 근육의 수동적 강직에 기여한다. 상이한 유형의 근육(예컨대, 심장 및 골격) 사이의 티틴의 서열내 변이는 이러한 근육의 기계적 특징에 있어서의 차이와 관련되어 왔다.
티틴은 가로무늬근의 큰 풍부한 단백질이다. 티틴의 주요 기능은 두꺼운 필라멘트를 안정화하고 이를 얇은 필라멘트들 사이의 중앙에 두어, 근절의 오버스트레칭(overstretching)을 방지하고, 이것이 스트레치된 후 스프링과 같이 근절을 되돌린다(recoil). N-말단 Z-디스크 영역 및 C-말단 M-라인 영역은 근절의 Z-라인 및 M-라인 각각에 결합함으로써, 단일 티틴 분자는 근절의 길이의 1/2에 걸쳐 존재하도록 한다. 티틴은 또한 근육-관련된 단백질에 대한 결합 부위를 함유함으로써 이는 근 세포내에서 수축성 기계장치의 조립을 위한 부착 주형(adhesion template)으로서 제공된다. 이는 또한 염색체에 대한 구조 단백질로서 확인되었다. 고려할만한 가변성은 티틴의 I-밴드, M-라인 및 Z-디스크 영역에 존재한다. I-밴드 영역내 가변성은 상이한 티틴 동형의 탄력성에 있어서의 차이에 기여하므로, 상이한 근육 유형의 탄력성에 있어서의 차이에 기여한다. 확인된 많은 티틴 변이체 중에서, 완전한 전사체 정보가 이용가능한 5개가 기재되어 있다.
이러한 유전자의 특수한 긴 서열내 어디에서도 돌연변이는 예비성숙 정지 코돈 또는 다른 결함을 유발할 수 있다. 티틴 돌연변이는 조기 호흡 부전을 지닌 유전성 근육병증, 치명적인 심근증을 지닌 조기 발병 근질환, 심장 질환을 지닌 코어 근질환(core myopathy), 중심핵 근육병증, 지대 근 이영양증 2J형, 가족 확장형 심근병증 9, 비대 심근병증 및 경골 근 이영양증과 관련되어 있다. 추가의 연구는 또한 임의의 이영양증 또는 근병의 비 유전적으로 연결된 형태는 TTN 유전자에서의 돌연변이에 의해 유발되는 것으로부터 안전하게 배제될 수 있다. 확장성 심근병증 환자에서의 절두 돌연변이(truncating mutation)는 A 영역내에서 가장 흔하게 발견되며; 상부 I 영역내 절두가 A 영역의 해독을 전체적으로 방지하는 것으로 예측될 수 있지만, 대안적인 스플라이싱은 조숙 정지 코돈에 직면하지 않는 일부 전사체를 생성하며, 이의 효과를 완화시킨다. 티틴에 대한 자가항체는 자가면역 질환 피부경화증을 지닌 환자에서 생산된다.
리아노딘 수용체내 돌연변이(슈도엑손을 지닌 돌연변이)에 의해 유발된 선천성 근질환 "중심 코어 질환". 중심 코어 근질환으로 또한 공지된 중심 코어 질환(CCD)은 상염색체 우성의 선천성 근질환(선천적인 근육 장애)이다. 이는 1956년에 샤이(Shy) 및 마기(Magee)에 의해 최초로 기술되었다. 이는 현미경 하에서 근원섬유의 외관에 의해 특징화된다.
CCD의 증상은 다양하지만, 일반적으로 출생시 긴장 저하(감소된 근 긴장), 어린이 발달시 가벼운 지연(사례들 사이에서 크게 변할 수 있음), 안면 근육의 약화, 및 척추 측만증 및 고관절 탈구와 같은 골격 기형을 포함한다.
증상은 출생시 존재할 수 있거나 삶의 임의의 단계에서 나타낼 수 있다. 성년이 중년이 될 때까지 증상을 보이지 않은 사람의 수가 증가하는 것으로 여겨진다. 일반적으로 진행성은 아니지만, 다시 징후학의 느린 임상적으로 유의적인 진행을 경험하는 사람의 수가 증가하는 것으로 여겨진다. 이러한 사례는 가설적으로 리아노딘 수용체 기능부전의 많은 수의 유전자 돌연변이에 기인하며 연속적인 연구로 실제 임상 변이체임이 밝혀질 수 있다.
진단은 근육으로부터의 생검(조직 샘플)에서 대표적인 증상 및 외관의 조합에 대해 이루어진다. 명칭은 광학 현미경에서 생검의 대표적인 외관으로부터 유래하며, 여기서 근육 세포는 미토콘드리아 및 특정 효소가 없는 코어를 갖는다. 호흡 부전은 작은 비율의 사례에서 발달한다. 크레아틴 키나제 및 근전도 검사(EMG)는 정상인 경향이 있다.
중심 코어 질환은 상염색체 우성 양식으로 유전된다. 대부분의 사례는 리아노딘 수용체 1형(RYR1) 유전자에서 입증가능한 돌연변이를 가지며, 이는 흔히 드 노보(de novo)(새로이 발달한)이다. CCD를 지닌 사람은 일반적으로 마취되는 경우 악성 고열(MH)의 위험이 있다.
특수한 치료는 존재하지 않지만 마취제를 트리거링(triggering)하는 것은 피해지며 RYR1 돌연변이는 친척들을 MH에 대해 민감하도록 할 수 있으므로 친척들을 RYR1 돌연변이에 대해 스크리닝한다.
근긴장성 이영양증. 근긴장성 이영양증은 근육 기능에 영향을 미치는 장기간의 유전 장애이다. 증상은 점진적으로 악화되는 근육 손실 및 약화를 포함한다. 근육은 종종 수축하며 완화될 수 없다. 다른 증상은 백내장, 지적 장애, 및 심장 전도 문제를 포함할 수 있다. 남성에서는 조기 대머리일 수 있고 아이를 가질 수 없다.
근긴장성 이영양증은 전형적으로 개인의 부모로부터 유전되는 상염색체-우성 장애이다. 2개의 주요 유형이 존재한다: DMPK 유전자내 돌연변이에 기인한 1형(DM1) 및 CNBP 유전자내 돌연변이로 인한 2형(DM2). 장애는 일반적으로 각각의 세대에서 악화된다. DM1의 유형은 출생시 명확해질 수 있다. DM2는 일반적으로 보다 가볍다. 이들은 근 이영양증의 유형들이다. 진단은 유전 시험으로 확인된다.
치유법은 없다. 치료는 브레이스 또는 휠체어, 심장박동기, 및 비-침습성 양압 환기법(non-invasive positive pressure ventilation)을 포함할 수 있다. 의약 멕실레틴 또는 카바마제핀이 때때로 도움이 된다. 통증은 발생하는 경우 트리사이클릭 항우울제 및 비스테로이드성 소염 약물(NSAID)로 치료할 수 있다.
근긴장성 이영양증은 세계적으로 8,000명의 사람 중 1명 이상에게 영향을 미친다. 근긴장성 이영양증은 어떠한 나이에서도 발생할 수 있지만, 전형적으로 20대 및 30대에서 발병한다. 이는 성년에서 시작하는 근 이영양증의 가장 일반적인 형태이다. 이는 1909년에 최초로 기술되었으며 1형의 근본 원인은 1992년에 측정되었다.
증상 및 신호의 표시는 형태(DM1/DM2), 증증도 및 심지어 특수한 DM2 표현형에 의해 현저하게 변한다. DM2에 대한 DM1 증상은 실행 기능(예컨대, 조직화, 집중력, 단어-찾기) 및 과다수면과 함께 문제점을 포함한다. 수행 비정상은 DM2보다 DM1에서 보다 일반적이지만, 모든 사람들은 매년 ECG를 받도록 권고받는다. 유형 둘 다는 또한 인슐린 내성과 관련되어 있다. 근긴장성 이영양증은 청색 점 외관을 지닌 피질 백내장 또는 후 낭밑 백내장을 가질 수 있다.
DM2는 일반적으로 DM1보다 더 가벼우며, 일반적으로 보다 적은 DM2 사람이 DM1 사람보다 보조 장치를 필요로 한다. 또한, DM1에서 아기에게 영향을 미치는 심각한 선천적 형태는 DM2에서 발견되지 않았으며 증상의 조기 발병은 의학 문헌에서 보다 젊은 사람에서 나타나는 것으로 드믈게 인식되어 있다.
증상은 영아로부터 성인까지 임의의 시기에 나타날 수 있다. DM은 손, 발, 목, 또는 얼굴의 근육에서 일반적으로 시작하는, 일반적인 약화를 유발한다. 이는 심장을 포함하는, 다른 근육 그룹을 포함하도록 서서히 진행한다. DM은 또한 광범위한 다른 기관 시스템에도 영향을 미친다.
근긴장 이영양증은 상염색체 우성 패턴으로 유전되는 유전 상태이므로 평균적으로 매개체 자식의 50%에 걸쳐 전달될 것이다. 근긴장 이영양증은 몇가지 트리뉴클레오타이드 반복 장애 중 하나이다. DNA의 특정 부위는 2개 또는 3개의 뉴클레오타이드의 반복된 서열을 갖는다.
근긴장 이영양증(DM)은 유전된 질환이다. DM의 심각한 형태인, 선천적인 근긴장성 이영양증은 DM을 가진 어머니의 신생아에서 나타날 수 있다. 선천성 근긴장 이영양증은 비교적 드믈다고 일컬어지지만, 모체 유전자를 통해 유전될 수 있다. 선천성은 상태가 출생으로부터 존재함을 의미한다.
DM1에서, 영향받은 유전자는 DMPK으로 불리며, 이는 골격근내에서 주로 발현된 단백질인, 근긴장 이영양증 단백질 키나제를 암호화한다. 유전자는 19번 염색체의 롱 아암(long arm)에 위치한다.
DM1에서, DMPK 유전자내 사이토신-티민-구아닌(CTG) 트리플 반복물(triplet repeat)의 확장이 존재한다. 5개와 37개 사이의 반복물은 정상인 것으로 고려되지만, 38개와 49개 사이의 반복물을 지닌 개인은 전-돌연변이(pre-mutation)를 가지는 것으로 고려되고 어린이가 추가로 확장된 반복물을 지니므로, 따라서 증후성 질환을 가질 위험이 있는 것으로 고려된다. 50개 이상의 반복물을 지닌 개인은 일부 주목된 예외를 제외하고는, 거의 변함없이 증후성이다. 보다 긴 반복물은 일반적으로 조기 발병 및 보다 심각한 질환과 관련되어 있다.
37개 이상의 반복물을 지닌 DMPK 대립형질은 불안정하며 추가의 트리뉴클레오타이드 반복물은 유사분열 및 감수분열시 세포 분열 동안 삽입될 수 있다. 결과적으로, 전돌연변이 또는 돌연변이를 지닌 개인의 어린이는 이들의 부모보다 더 긴 DMPK 대립형질을 물려받으므로 영향받기가 더 쉬운 경향이 있거나, 예상되는 것으로서 알려진 현상인, 상태의 조기 발생 및 보다 큰 중증도를 나타낸다. 흥미롭게도, 상태의 부계 전달(paternal transmission)은 아마도 확장된 반복물을 지닌 정자에 대한 선택 압력으로 인하여, 매우 특수하지만, 기대는 모계 유전의 경우에서보다 덜 심각한 경향이 있다.
확장된 트리뉴클레오타이드 반복물 영역으로부터의 RNA는 C-G 염기쌍 사이의 강력한 수소 결합으로 인하여 핵질내 헤어핀 루프(intranucleoplasmic hairpin loop)를 형성하며, 이는 스플라이싱 조절인자 MBNL1을 봉쇄하여 이를 GFP로 및 프로브 올리고뉴클레오타이드를 적색-형광성 염료 시아닌5(Cys5)로 표지함으로써 독특한 병소(foci)를 형성함이 입증되었다.
DM2는 3번 염색체 상의 ZNF9 유전자의 결함에 의해 유발된다. 특수한 결함은 ZNF9 유전자내 사이토신-티민-구아노신(CCTG) 테트라뉴클레오타이드의 반복물이다. 이는 4개 뉴클레오타이드의 반복물을 포함하므로, 이는 트리뉴클레오타이드 반복물 장애가 아니라, 오히려 테트라뉴클레오타이드 반복물 장애이다.
DM2에 대한 반복물 확장은 DM1보다 훨씬 더 커서, 75 내지 11,000개 이상의 반복물의 범위이다. DM1에서와 달리, DM2내 반복된 DNA 확장의 크기는 발병 연령 또는 질환 중증도에 있어서의 차이를 만드는 것으로 여겨지지 않는다. 기대는 DM2에서 거의 유의적이지 않는 것으로 여겨지며 가장 최근의 고찰은 DM2의 특징으로서 약한 기대만을 보고하고 있다.
프리드라이히 운동실조증(Friedreich's ataxia). 프리드라이히 운동실조증은 신경계에 대해 진행성 손상을 유발하는 상염색체 열성 유전 질환이다. 이는 보행 장애와 같은 불량한 조정력의 초기 증상을 나타내며; 이는 또한 척추측만증, 심장 질환 및 당뇨병을 초래할 수 있지만, 인지 기능에 영향을 미치지 않는다. 질환은 휠체어가 이동성을 위해 필요할 때까지 진행된다. 일반적인 집단에서 발생빈도는 50,000명 중 대략 1명이다.
특수한 유전적 돌연변이(FXN 유전자내 인트론 GAA 트리플 반복물의 확장)는 미토콘드리아 단백질 프라탁신의 감소된 발현을 초래한다. 시간이 지남에 따라 이러한 결핍증은 전술한 손상뿐만 아니라, 세포 대사에 있어서의 영향으로 인하여 빈번한 피로를 유발한다.
프리드라이히 운동실조증의 운동 실조는 척수(spinal cord), 특히 팔과 다리의 근육 운동을 지시하는데 필수적인(소뇌와의 연결을 통해) 감각 뉴우런내에서 신경 조직의 변성으로부터 야기된다. 척수는 보다 얇아지고 신경 세포는 이들의 미엘린 초(myelin sheath)(신경 임펄스를 수행하는 것을 돕는 일부 신경 세포 위를 덮고 있는 인슐레이팅) 중 일부를 손실한다.
증상은 전형적으로 5세 내지 15세의 연령에서 때때로 시작하지만, 말기 발병 FA는 20대 또는 30대에서 발생할 수 있다. 증상은 팔과 다리의 근육 약화, 조정력의 상실, 시각 손상, 청력 손상, 불분명 발음, 척추의 만곡, 높은 족저궁(발의 마분족 기형(pes cavus deformity of the foot)), 당뇨병(프리드라이히 운동실조증을 지닌 사람의 대략 20%는 탄수화물 불내성으로 진행되고 10%는 진성 당뇨병으로 진행된다) 및 심장 장애(예컨대, 심방 세동, 및 귀결되는 심계항진(빠른 심박수) 및 비대 심장 근육병증)의 임의의 조합을 포함하지만, 필수적으로 모두는 아니다.
이는 22세 전에 진행성 비틀거림(staggering) 또는 헛디디는 발걸음(stumbling gait) 및 빈번한 넘어짐으로 나타난다. 하체가 보다 심각하게 관련되어 있다. 증상은 느리고 진행성이다. 장기간 관찰은 많은 환자들이 환자의 성년 초기에 증상의 정체기(plateau)에 도달함을 나타낸다. 평균적으로, 질환을 지닌채 10 내지 15년 후, 환자는 일반적으로 휠체어를 사용하게 되며 일상 생활의 모든 활동에 보조를 필요로 한다.
다음의 물리적 신호가 신체 검사에서 검출될 수 있고: 소뇌 기능이상(cerebellar sign), 예컨대, 안구진탕증, 빠른 안구 도약 운동(fast saccadic eye movement), 몸통 운동실조증(truncal ataxia), 구음 장애, 운동거리조절이상(dysmetria); 하위 운동 뉴우런 병변, 예컨대, 깊은 힘줄 반사 결여; 추체로징후, 예컨대, 신근 발바닥 반응, 및 말단 약화(distal weakness)가 일반적으로 발견된다: 등 척추 측면(dorsal column aspect), 예컨대, 진동 및 자기수용성 감각의 손실이 일어난다. 심장 관여는 환자 중 91%에서 발생하며, 심장 비대(확장 심근병증까지), 대칭성 비대, 심장 잡음, 및 전도 결함을 포함한다. 사망의 중간 연령은 35세이지만, 여성은 남성에서 63%와 비교하여 100%의 20세 생존율로 보다 우수한 예후를 갖는다. 사례의 20%의 경우는 진성 당뇨병과 관련된 것으로 밝혀졌다.
프리드라이히 운동실조증은 FXN 유전자가 증폭된 고유 GAA 반복물(트리뉴클레오타이드 반복물 확장의 예)를 함유하는 경우 발생하는 상염색체 열성 장애이다. FXN 유전자는 단백질 프라탁신을 암호화한다. GAA 반복물 확장은 프라탁신 수준이 감소되도록 한다. 프라탁신은 철-황 클러스터를 형성시키는데 관여하는 철-결합 단백질이다. 프라탁신 결핍증의 하나의 결과는 많은 단백질에 대해 손상을 유발할 수 있는 미토콘드리아 철 오버로드(overload)이다. 정상의 생리학에서 프라탁신의 정확한 역활은 명확하지 않게 남아있다. 유전자는 9번 염색체에 상에 위치한다.
돌연변이체 유전자는 제1 인트론내에 확장된 GAA 트리플 반복물을 함유하며; 소수의 가계(pedigree)에서, 점 돌연변이가 검출되었다. 결함은 인트론내에 위치하므로(이는 전사와 해독 사이의 mRNA 전사체로부터 제거된다), 이러한 돌연변이는 비정상적인 프라탁신 단백질의 생산을 야기하지 않는다. 대신에, 돌연변이는 위치-효과 다양성(position-effect variegation)과 유사한 방식으로 헤테로크로마틴 구조의 유도를 통해 유전자 사일런싱을 유발한다(즉, 돌연변이는 유전자의 전사를 감소시킨다).
프라탁신의 발현을 감소시키는 것 외에도, GAA 반복물의 긴 관(tract)은 생체내 효모 연구에서 염색체 파괴를 유도한다.
헌팅톤 질환(Huntington's disease). 헌팅톤 무도병으로 또한 알려진, 헌팅톤 질환(HD)은 뇌 세포의 사멸을 야기하는 유전 장애이다. 조기 증상은 흔히 분위기 또는 정신 능력의 미묘한 문제점이다. 조정력의 일반적인 결여 및 불안정 보행이 종종 따라온다. 질환이 진전되면서, 조정되지 않는 저키 신체 운동(jerky body movement)이 보다 명백해진다. 육체적 능력은 조정된 운동이 어려워지고 사람이 말할 수 없을 때까지 점진적으로 악화된다. 정신 능력은 일반적으로 치매로 쇠퇴한다. 구체적인 증상은 사람들 사이에서 어느 정도 변한다. 증상은 일반적으로 30 내지 50세에 시작하지만, 어떠한 나이에서도 시작할 수 있다. 질환은 각각의 후속 세대에서의 삶 중 조기에 발달할 수 있다. 사례의 약 8%가 20세 이전의 연령에서 시작하며 전형적으로 파킨슨 질환(Parkinson's disease)과 보다 유사한 증상을 나타낸다. HD를 지닌 사람은 흔히 이들의 문제의 정도를 과소평가한다.
HD는 전형적으로 새로운 돌연변이로 인하여 사례의 10%가 사람의 부모로부터 유전된다. 질환은 헌팅틴(Huntingtin)으로 불리는 유전자의 개인의 2개 카피 중 하나에서 상염색체 우성 돌연변이에 의해 유발되다. 이는 영향받은 사람의 어린이가 질환의 50% 유전 확률을 가짐을 의미한다. 헌팅틴 유전자는 "헌팅틴"으로 또한 불리는 단백질에 대한 유전 정보를 제공한다. 헌팅틴 단백질을 암호화하는 유전자내에서 CAG(사이토신-아데닌-구아닌) 트리플 반복물의 확장은 비정상적인 단백질을 생성하며, 이는 완전히 이해되어 있지 않은 메카니즘을 통해, 뇌 속의 세포를 점진적으로 손상시킨다. 진단은 유전자 시험에 의해 수행하며, 이는 증상이 존재하는지의 여부에 상관없이 어느 시점에서도 수행할 수 있다. 이러한 사실은 심각한 윤리적 토론을 불러 일으킨다: 개인이 시험을 선택하기에 충분히 성숙한 것으로 고려되는 연령; 환자가 이들의 어린이를 시험할 권리를 가지는지의 여부; 및 시험 결과의 기밀 유지 및 폭로.
HD에 대한 치유법은 없다. 풀-타임 치유(full-time care)는 질환의 말기 단계에서 요구된다. 치료는 일부 증상을 완화시킬 수 있고 일부 경우에 삶의 질을 개선시킬 수 있다. 운동 문제의 치료를 위한 가장 우수한 증거는 테트라베나진을 사용하는 것이다. HD는 유럽 가계의 100,000명의 사람 중 약 4 내지 15명에 영향을 미친다. 이는 일본인 중에서는 드믈며 아프리카에서는 알려지지 않은 비율로 발생한다. 질환은 남성 및 여성에게 동등하게 영향을 미친다. 폐렴, 심장 질환, 및 낙상으로 인한 육체적 손상과 같은 합병증은 기대 수명을 감소시킨다. 자살은 사례의 약 9%에서 사망의 원인이다. 사망은 전형적으로 질환이 최초로 검출된 때로부터 15년 내지 20년에 발생한다.
헌팅톤 질환의 증상은 35세 내지 44세의 나이에서 가장 일반적으로 인식할 수 있게 되지만, 이들은 유아로부터 노인까지 임의의 나이에 시작될 수 있다. 초기 단계에서, 인격, 인지, 및 신체 기능에 있어서 미묘한 변화가 있다. 신체적 증상은 일반적으로 초기 단계에서 이들 자신이 인식하기에 충분히 심각하지 않다. 헌팅톤 질환을 지닌 거의 모든 사람은 궁극적으로 유사한 신체적 증상을 나타내지만, 발병, 진행 및, 인식 및 거동 증상의 정도는 개인 사이에서 유의적으로 변한다.
대부분의 특징적인 초기 신체적 증상은 무도병이라고 불리는 덜컥거리는, 무작위의 조절될 수 없는 운동이다. 무도병은 초기에는 일반적인 불안함, 작은 의도적이지 않게 개시되거나 완료되지 않은 운동, 조정력, 또는 느린 도약 안구 운동으로 나타날 수 있다. 이러한 작은 운동 불능은 일반적으로 적어도 3년까지 운동 기능장애의 보다 명백한 신호에 앞서 나타난다. 강직, 뒤틀린 운동 또는 비정상적인 자세와 같은 증상의 명확한 출현은 장애가 진행됨에 따라 나타난다. 이는 운동에 관여하는 뇌내 시스템이 영향받은 신호이다. 정신운동 기능은 크게 손상을 입게되므로, 근육 조절에 필요한 임의의 작용도 영향을 받는다. 일반적인 결과는 신체적 불안정, 비정상적인 안면 표현, 및 저작, 연하(swallowing), 및 말하기의 곤란성이다. 섭식 곤란성은 일반적으로 체중 감소를 유발하고 영양실조를 초래한다. 수면 장애는 또한 증상과 관련되어 있다. 청소년 HD는 일반적으로 보다 신속하게 진행하고 무도병이 약하게 나타나는데, 나타난다고 해도, 강직이 우세한 증상이 된다는 점에서 이러한 증상과는 상이하다. 발작 또한 이러한 형태의 HD의 일반적인 증상이다.
인지 능력은 점진적으로 손상된다. 계획, 인지 유연성, 추상적 사고, 규칙 습득, 적절한 행동의 개시, 및 부적절한 행동의 억제를 포함하는 실행 기능이 특히 영향을 받는다. 질환이 진행됨에 따라, 기억 결함이 나타나는 경향이 있다. 보고된 손상은 단기간 기억 결함 내지 장기간 기억 곤란성, 예컨대, 에피소드(episodic)(개인의 삶의 기억), 과정(활동을 수행하는 방법의 신체 기억) 및 작동 기억의 결손의 범위이다. 인지 문제는 시간이 경과하면서 악화되는 경향이 있고, 궁극적으로 치매를 초래한다. 이러한 패턴의 결손은 이를 피질 치매, 예컨대, 알츠하이머병의 대표적인 효과와 구별하기 위해 겉질밑 치매 증후군(subcortical dementia syndrome)으로 불리어 왔다.
보고된 신경정신병적 징후는 흥분, 우울, 감소된 감정의 표시(둔화 정동(blunted affect)), 자기중심성, 공격성, 및 강박 행동이며, 이중 후자는 탐닉, 예컨대, 알코올중독, 도박, 및 성욕과다증을 유발하거나 악화시킬 수 있다. 다른 사람의 부정적인 표현을 인식하는데 있어서의 곤란성이 또한 관찰된다. 이러한 증상의 유병률은 연구에 따라 크게 가변적이며, 정신 질환의 평생 유병률에 대한 추정된 비율은 33% 내지 76%이다. 많은 환자 및 이들의 가족의 경우, 이러한 증상은 질환의 가장 스트레스적인 국면 중에 있으며, 흔히 일상생활 기능에 영향을 미치고 보호시설에 대한 근거를 구성한다. 자살 고려(Suicidal thoughts) 및 자살 시도는 일반적인 집단에서보다 더 일반적이다. 흔히 개인은 무도병, 인지 및 감정 손상의 감소된 인식을 갖는다.
돌연변이체 헌팅틴은 신체 전체에서 발현되며 뇌 외부의 이러한 발현에 의해 직접 유발된 말초 조직내 비정상과 관련되어 있다. 이러한 비정상은 근 위축증, 심부전, 손상된 글루코즈 내성, 체중 손실, 골다공증, 및 정소 위축을 포함한다.
보든 사람은 헌팅틴 유전자(HTT)의 2개의 카피를 가지며, 이는 단백질 헌팅틴(HTT)을 암호화한다. 유전자는 또한 HD 및 IT15로 불리며, 이는 '흥미있는 전사체 15'를 나타낸다. 이러한 유전자의 일부는 트리뉴클레오타이드 반복물로 불리는 반복된 단면이며, 이는 개인 사이에서 길이가 상이하며 세대 사이에서도 길이가 변할 수 있다. 반복물ㅇ; 건강한 유전자 내에 존재하는 경우, 동적 돌연변이는 반복물 횟수를 증가시켜 결함성 유전자를 생성할 수 있다. 이러한 반복된 단면의 길이가 특정의 역치에 도달하면, 이는 돌연변이체 헌팅틴 단백질(mHTT)로 불리는, 변경된 형태의 단백질을 생산한다. 이러한 단백질의 상이한 기능은 궁극적으로 질환 증상을 유발하는 병리학적 변화의 원인이다. 헌팅톤 질환 돌연변이는 유전적으로 우성이며 거의 완전하게 침투성(penetrant)이고: 개인의 HTT 대립형질의 돌연변이는 질환을 유발한다. 이는 성별에 따라 유전되지 않으나, 유전자의 반복된 단면의 길이 및 따라서 이의 중증도는 영향받은 부모의 성별에 의해 영향받을 수 있다.
HD는 정상 범위를 벗어나는 유전자의 반복된 단면의 길이에 의해 유발되는 몇가지 트리뉴클레오타이드 반복물 장애 중 하나이다. HTT 유전자는 4p16.3에서 4번 염색체의 짧은 아암(short arm)에 위치한다. HTT는 트리뉴클레오타이드 반복물로 알려진, 3개의 DNA 염기―사이토신-아데닌-구아닌(CAG)―반복된 다수의 횟수(즉, ... CAGCAGCAG ...)를 함유한다. CAG는 아미노산 글루타민에 대한 3문자 유전 코드(코돈)이므로, 일련의 이들은 폴리글루타민 관(tract)(또는 폴리Q 관), 및 유전자의 반복된 부분, 폴리Q 영역으로 알려진 글루타민 쇄의 생산을 야기한다.
일반적으로, 사람들은 세포질성 단백질 헌팅틴의 생산을 야기하는 폴리Q 영역내 36개 이하의 반복된 글루타민을 갖는다. 그러나, 36개 이상의 글루타민의 서열은 상이한 특징을 갖는 단백질의 생산을 야기한다. 돌연변이체 헌팅틴(mHTT)으로 불리는 이러한 변경된 형태는 특정 유형의 뉴우런의 쇠퇴율(decay rate)을 증가시킨다. 뇌의 영역은 이러한 유형의 뉴우런에 있어서 상이한 양 및 의존도를 가지며, 상응하게 영향받는다. 일반적으로, CAG 반복물의 수는 이러한 과정이 얼마나 영향받는지와 관련되어 있으며, 증상의 발병 연령의 약 60%의 변화의 이유가 된다. 나머지 변화는 환경 및 HD의 메카니즘을 변경시키는 다른 유전자에 기인한다. 36 내지 39개 반복물은 증상의 훨씬 나중의 발병 및 보다 느린 진행과 함께, 감소된 침투형의 질환을 야기한다. 일부 경우에 발병은 증상이 전혀 인식되지 않을 정도로 늦을 수 있다. 매우 큰 반복물 수와 함께, HD는 완전한 침투도(penetrance)를 가지며 이후 이것은 청소년 HD, 운동불능-강직, 또는 웨스트팔 변이체(Westphal variant) HD로서 지칭되는 경우, 20세 이하에서 발생할 수 있다. 이는 HD 매개체의 약 7%를 차지한다.
모세혈관확장성 운동실조(Ataxia telangiectasia). 모세혈관확장성-운동 실조 증후군 또는 루이스-바 증후군(Louis-Bar syndrome)으로 또한 지칭되는, 모세혈관확장성-운동실조(AT 또는 A-T)는 중증 장애를 유발하는 희귀한, 신경변성, 상염색체 열성 질환이다. 운동실조증은 불량한 조화 및 작은 확장된 혈관에 대한 모세혈관확장증을 지칭하며, 이들 둘 다는 질환의 특징이다.
A-T는 신체의 많은 부분에 영향을 미친다. 이는 대뇌를 포함하는 뇌의 특정 부위에 손상을 입혀, 운동 및 조화의 곤란성을 유발한다. 이는 면역계를 약화시켜, 감염에 대한 질병소질을 유발한다. 이는 파괴된 DNA의 복구(repair)를 방지하며, 암의 위험을 증가시킨다.
증상은 가장 흔히 우선 어린이가 걷기 시작할 때 유아기(걸음마 단계)에서 나타난다. 이들이 일반적으로 정상 나이에서 걷기 시작하지만, 이들은 갇거나, 계속해서 서서 있거나 앉을 때 떨리거나 흔들리고, 거의 이들이 술을 마셨을 경우와 같이 여겨질 수 있다. 유치원 연령 후반 및 학령 초기에, 이들은 한곳에서 다른 곳으로 자연적인 방식으로 이들의 눈을 움직이는데 곤란성으로 발달한다(눈돌림실행증). 이들은 불분명 발음 또는 발음 장애, 및 연하 문제로 발달한다. 일부는 증가된 수의 기도 감염(귀 감염, 축농증, 기관지염, 및 폐렴)을 갖는다. 모든 어린이가 동일한 방식 또는 동일한 비율로 발달하지 않으므로, 이는 A-T가 적절히 진단되기 전에 몇년이 될 수 있다. A-T를 지닌 대부분의 어린이는 생애의 첫번째 4 내지 5년 동안 안정한 신경학적 증상을 가지지만, 학령 초기에 증가하는 문제를 나타내기 시작한다.
A-T는 ATM 유전자내 결함에 의해 유발되며, 이는 DNA내 이중 가닥 브레이크(break)를 포함하는 다수 형태의 스트레스에 대한 세포 반응을 유지하는데 관여한다. 단순한 용어로, ATM 유전자에 의해 생산된 단백질은 DNA내 브레이크가 존재함을 인식하여, 다른 단백질을 보충함으로써 브레이크를 고정시키고 복구가 완료될 때까지 세포가 새로운 DNA를 만드는 것을 중지시킨다.
영향받은 개인 중에서, 및 상이한 연령에서 A-T의 특징의 중증도에 있어서 실질적인 가변성이 존재한다. 다음의 증상 또는 문제는 A-T의 일반적이거나 중요한 특징이다:
조기에 명백하지만 학령기 내지 10대 초반에 악화되는 운동실조증(운동 제어의 곤란성).
눈돌림실행증(한곳으로부터 다른 곳으로 시선을 이동하는 경우 머리 및 눈 운동의 조화의 곤란성).
불수의 운동.
눈의 흰자(공막) 위의 모세혈관확장증은 이들이 충혈되도록 한다. 이는 영아에서는 명백하지 않으며 5 내지 8세에 먼저 명백해질 수 있다. 모세관확장증은 또한 피부의 태양-노출된 부위에서 나타난다.
특히 귀, 부비동 및 폐의 감염과 관련된 문제.
암의 증가된 발생률(주로, 그러나 전적으로는 아니지만, 림프종 및 백혈병).
지연된 발병 또는 불완전한 사춘기 발달, 및 매우 이른 폐경.
느린 성장율(체중 및/또는 신장).
이들이 피곤하거나 활동에 집중하는 경우 특히 유아기에 침흘림.
눌어증(불분명하거나, 느리거나 또는 왜곡된 발음 소리).
청소년기 또는 이후의 당뇨병.
모발 및 피부에서 조숙 변화.
많은 어린이들은 뇌성마비를 가진 것으로 초기에 잘못진단된다. A-T의 진단은 손상된 걸음걸이, 손 조화, 발음 및 눈 운동의 신경학적 증상이 나타나거나 악화되는 경우, 및 모세혈관확장증이 나타나는 경우 학령전 연령까지 이루어지지 않을 수 있다. A-T는 매우 희귀해서, 의사는 증상, 또는 진단 방법에 친숙하지 않을 수 있다. 모세혈관확장증의 말기 외관은 진단에 대한 장벽일 수 있다. 이는 의사가 A-T를 증상 및 신호의 조기 안전성으로 인한 가능성으로서 고려하기 전에 일정 시간 걸릴 수 있다.
A-T는 ATM(돌연변이된 ATM 세린/트레오닌 키나제 또는 모세혈관확장성 운동실조증) 유전자내 돌연변이에 의해 유발되며, 이러한 유전자는 1995년에 클로닝되었다. ATM은 사람 11번 염색체(11q22.3)에 위치하며 게놈 DNA의 150kb에 걸쳐 확산된 69개의 엑손으로 이루어져 있다.
A-T의 유전 방식은 상염색체 열성이다. 각각의 부모가 매개체인데, 이는 이들은 A-T 유전자(ATM) 중 하나의 정상 카피 및 돌연변이된 하나의 카피를 가짐을 의미한다. 어린이가 돌연변이된 A-T 유전자를 각각의 부모로부터 유전받는 경우 A-T가 발생하므로, 2명의 매개체 부모를 지닌 가족에서, 부모에게 태어난 어린이가 장애를 가질 확률은 4명중 1명이다. 출생전 진단(및 매개체 검출)은 영향받은 어린이의 2개 ATM 유전자내 오류(돌연변이)가 확인된 경우 가족에서 수행될 수 있다. 이를 수행하는 공정은 복잡할 수 있으며, 시간을 요하므로, 수태(conception) 전에 배열되어야 한다.
관련되지 않은 사람(예를 들면, 알려진 A-T 매개체의 배우자)의 ATM 유전자내 돌연변이를 찾는 것은 유의적인 챌린지를 나타낸다. 유전자는 흔히 기능에 영향을 미치지 않는 변이체 스펠링(variant spelling)(다형체)를 가진다. ATM과 같은 큰 유전자에서, 이러한 변이체 스펠링은 발생할 수 있으며 의사는 항상 특정 변이체가 질환을 유발할지 또는 유발하지 않을 지를 예측할 수 없다. 유전 상담은 시험될 수 있거나 시험될 수 없는 것 및 시험 결과가 해석되어야 할 방법을 A-T 환자의 가족 구성원이 이해하는 것을 도울 수 있다.
A-T를 지닌 사람의 부모와 같은 A-T의 매개체는 ATM 유전자의 하나의 돌연변이된 카피 및 하나의 정상 카피를 갖는다. 이들은 일반적으로 건강하지만, 여성에서 유방암의 증가된 위험이 존재한다. 이러한 발견은 다양한 상이한 방식으로 확인되었으며 현재의 연구의 대상이다. 개인이 다른 위험 인자(예컨대, 유방암의 가족력)을 가지므로 추가의 시험이 나타내지 않는 한, 표준 감시(일반적인 연령 스케줄에서 매달 자기 시험 및 유방조영술 포함)가 추천된다.
신경 섬유종증 1 및 2형. 신경섬유종증(NF)은 종양이 신경계에서 성장하는 3개 조건의 그룹이다. 3개의 유형은 신경섬유종증 1형(NF1), 신경섬유종증 2형(NF2), 및 신경초종증이다. NF1에서 증상은 피부 위의 연갈색 점, 겨드랑이 및 서해부내 주근깨, 신경내 작은 범프(bump), 및 척추측만증을 포함한다. NF2에서 청력 손실, 어린 나이의 백내장, 균형 문제, 살색 피부 덮개, 및 근육 소모가 존재할 수 있다. 종양은 일반적으로 비-암성이다.
원인은 특정 유전자내 유전적 돌연변이이다. 사례의 1/2에서 이는 개인의 부모로부터 유전되지만 나머지에서 이들은 조기 발달 동안에 발생한다. 종양은 뉴우런보다는 오히려 신경계내 지지 세포를 포함한다. NF1에서 종양은 신경섬유종(말초 신경의 종양)이지만 NF2 및 신경초존증에서 슈반 세포의 종양은 보다 일반적이다. 진단은 전형적으로 신호 및 증상을 기반으로 하며 때때로 유전자 시험에 의해 뒷받침된다.
알려진 예방 또는 치유법은 존재하지 않는다. 수술은 문제를 유발하거나 암성이 되는 종양을 제거하기 위해 수행될 수 있다. 방사선 및 화학치료요법은 또한 암이 발생하는 경우 사용할 수 있다. 달팽이관 이식 또는 청각 뇌간 이식은 청각 손실된 일부에게 도움을 줄 수 있다.
미국에서 3,500명의 사람 중 약 1명이 NF1을 가지며 25,000명 중 1명이 NF2를 갖는다. 남성 및 여성은 동일한 빈도로 영향을 받는다. NF1에서 증상은 출생시 보다 흔하고 달리는 10세 전에 발달한다. 상태는 시간에 따라 전형적으로 악화되지만 NF1을 지닌 사람은 정상의 기대 수명을 갖는다. NF2에서 증상은 초기 성인까지 명백해지지 않을 수 있다. NF2는 조기 사망 위험을 증가시킨다. 상태에 대한 설명은 1세기 만큼 거술러 올라간다.
젊은 시절의 신경섬유종증(NF1)은 학습 및 행동 문제를 유발할 수 있으며, NF1을 가진 어린이의 약 60%가 학교에서 약한 형태의 곤란성을 갖는다. 개인이 가질 수 있는 신호 측면은 다음과 같다: 6개 이상의 연갈색 피부과학적 점("담갈색 반점("cafe-au-lait spots)"), 적어도 2개의 신경섬유종, 눈 홍채에서 적어도 2개의 성장, 및 척추의 비정상적인 성장(척추측만증).
신경섬유종증은 상염색체 우성 장애이며, 이는 영향받은 유전자의 하나의 카피만이 장애가 발달하는데 필요함을 의미한다. 따라서, 부모 중 1명만이 신경섬유종증을 가진 경우, 그 또는 그녀의 자식은 이러한 상태로 발달할 확률이 또한 50%이다. 영향받은 자식은 심지어 심각한 형태의 장애를 지닌 부모로부터 유전된다해도 약한 NF1을 가질 수 있다. 2개 유형의 신경섬유종증이 존재한다. 신경섬유종증 I형은 양성일 수 있고 신경 및 다른 조직을 압착함으로써 심각한 손상을 유발할 수 있는 종양(신경섬유종)으로의 신경 조직 성장을 특징으로 한다. 신경섬유종증 II형은 쌍방 청신경집종(신경집종으로 또한 알려진 내이신경 또는 뇌 신경 8(CN VIII))을 나타내며, 흔히 청각 손실을 야기한다.
고통스러운 신경집종이 척추 및 말초 신경에서 발달하는 신경초종증.
레베르 선천성 흑암시(Leber congenital amaurosis)에서의 CEP290 돌연변이. 290 kDa의 중심체 단백질은 사람에서 CEP290 유전자에 의해 암호화된 단백질이다. CEP290은 12번 염색체의 Q 아암(arm)에 위치한다. 유전자 CEP290은 중심체 및 섬모 발달에 중요한 역활하는 중심체 단백질이다. 이러한 유전자는 망막의 뒤(광 및 색상을 검출한다)에서 광수용체 및 신장, 뇌 및 신체의 많은 다른 기관에서 중요한 역활을 하는 세포 막의 작은 안테나-유사 돌출부(antenna-like projection)인, 1차 섬모의 형성에서 필수적이다. CEP290 유전자 전사체의 녹 다운 수준(knocking down level)은 배양물 속의 망막 색소 상피 세포내 섬모발생의 현저한 억제를 야기하였으며, 이는 CEP290이 섬모 형성에 얼마나 중요한지를 입증한다.
분자 수준에서, CEP290은 1차 섬모 형성시 중요한 조절 및 구조적 역활을 담당하는 것으로 나타났다. 최근 연구는 CEP290을 섬모의 미소관 코어와 덮고 있는 섬모막 사이의 구조적 연결부로서 작용할 수 있는 미소관 및 막 결합 단백질로서 연루시켰다. CEP290 질환의 rd16 마우스 모델에서 CEP290의 미소관 결합 도메인의 파괴는 신속하고 놀라운 망막 변성을 야기하는 것으로 밝혀졌으며, 질환에서 CEP290 미소관 결합의 중요성을 입증한다. 섬모발생을 촉진하는데 있어서 CEP290의 역활은 CEP290 단백질의 말단에서 발현된 자가-조절 도메인 및 억제 단백질 CP110과 CEP290의 상호작용을 통해 억제된다.
CEP290 유전자의 발견은 연구자가 망막 기능에서 중요한 다른 유전자인, LCA5를 찾도록 하였다. 이러한 2개 유전자의 유전자 대체를 포함하는 임상 시험은 필라델피아에서 시작하였으며, 여기서 연구자들은 레베르 선천성 흑암시(Leber Congenital Amaurosis)가 하루에 치유될 것으로 희망하고 있다.
이러한 유전자는 SMC 염색체 분리 ATP아제에 대해 상동성을 갖는 영역인 13개의 추정된 코일화된-코일 도메인(coiled-coil 도메인), 6개의 KID 모티프, 3개의 트로포마이오신 상동성 도메인 및 ATP/GTP 결합 부위 모티프를 지닌 단백질을 암호화한다. 단백질은 중심체 및 섬모에 국재화되어 있으며, N-글리코실화, 타이로신 설페이트화, 포스포릴화, N-미리스토일화, 및 아미드화에 대한 부위를 갖는다.
이러한 유전자내 돌연변이는 주버트 증후군(Joubert syndrome) 및 신결석증, 및 최근에 LCA10으로 불리는, 흔한 형태의 레베르 선천성 흑암시와 관련되어 왔다. 이러한 단백질에 대한 항체의 존재는 몇가지 형태의 암과 관련되어 있다.
이러한 유전자내 돌연변이는 레베르 선천성 흑암시로 알려진 질환인, 영아 및 어린이 실명을 초래한다. 오늘 현재로, CEP290내에 35개의 상이한 돌연변이가 LCA를 유발하는데 관여하고 있다. CEP290 내 다른 돌연변이는 또한 많은 증후군 중 일부인, 멕켈 증후군(Meckel Syndrome) 및 주버트 증후군(Joubert Syndrome)을 유발하는 것으로 확인되었다. 결함이 있는 CEP290 유전자는 비정상적인 섬모로 인하여 이러한 장애의 원인이다. 유전자내 하나의 돌연변이가 어떻게 특히 이들 중 많은 것이 중추 신경계에 영향을 미치는, 이렇게 많은 상이한 유형의 증후군을 유발할 수 있는지는 알려져 있지 않다.
III. CRISPR 시스템
A. CRISPR
CRISPR(집단화된 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복 서열)은 염기 서열의 짧은 반복물을 함유하는 DNA 유전자자리(loci)이다. 각각의 반복물은 바이러스에 대한 앞서의 노출로부터 "스페이서 DNA"의 짧은 분절(segment)을 수반한다. CRISPR는 서열분석된 유박테리아(eubacteria) 게놈의 대략 40% 및 서열분석된 고세균의 90%에서 발견된다. CRISPR는 흔히 CRISPR과 관련된 단백질을 암호화하는 Cas 유전자와 관련되어 있다. CRISPR/Cas 시스템은 플라스미드 및 파아지와 같은 외부 유전 성분에 대해 내성을 부여하는 원핵세포 면역 시스템이며 후천성 면역성의 형태를 제공한다. CRISPR 스페이서는 진핵세포 유기체내에서 RNAi와 같은 이러한 외인성 유전 성분을 인식하여 사일런싱시킨다.
CRISPR 반복물은 크기가 24 내지 48개 염기쌍의 범위이다. 이들은 일반적으로 일부 다이애드 대칭(dyad symmetry)을 나타내며, 헤어핀과 같은 2차 구조의 형성을 내포하지만, 실제로는 팔린드롬성(palindromic)이 아니다. 반복물은 유사한 길이의 스페이서에 의해 분리된다. 일부 스페이서가 원핵세포 게놈(자가-표적화 스페이서)와 일치하지만, 일부 CRISPR 스페이서 서열은 플라스미드 및 파아지로부터의 서열과 정확하게 일치한다. 새로운 스페이터는 파아지 감염에 대한 반응시 신속하게 첨가될 수 있다.
B. Cas 뉴클레아제
CRISPR-관련된(cas) 유전자는 CRISPR 반복물-스페이서 배열과 흔히 관련되어 있다. 2013년 현재로, 40개 이상의 상이한 Cas 단백질 계열이 기술되었다. 이들 단백질 계열 중에서, Cas1은 상이한 CRISPR/Cas 시스템 중에서 편재하는 것으로 여겨진다. cas 유전자와 반복물 구조의 특수한 조합을 사용하여 8개의 CRISPR 서브형(Ecoli, Ypest, Nmeni, Dvulg, Tneap, Hmari, Apern, 및 Mtube)을 정의하였으며, 이들 중 일부는 반복물-관련 미스테리 단백질(RAMP)을 암호화하는 추가의 유전자 모듈과 관련되어 있다. 1개 이상의 CRISPR 서브형이 단일 게놈에서 발생할 수 있다. CRISPR/Cas 서브형의 산발적인 분포는 이러한 시스템이 미생물 진화 동안 수평의 유전자 이동에 적용됨을 시사하고 있다.
외인성 DNA는 Cas 유전자에 의해 암호화된 단백질에 의해 작은 성분(~30개의 염기쌍 길이)으로 명백하게 프로세싱되며, 이는 이후에 어느 정도 리더 서열(leader sequence) 근처의 CRISPR 유전자자리로 삽입된다. CRISPR 유전자자리로부터의 RNA는 구성적으로 발현되어 Cas 단백질에 의해 플랭킹 반복 서열을 지닌 개개의 외인성으로 유도된 서열 성분으로 구성된 작은 RNA로 프로세싱된다. RNA는 다른 Cas 단백질을 가이드하여 RNA 또는 DNA 수준에서 외인성 유전 성분을 사일런싱한다. 증거는 CRISPR 서브형 중에서 기능적 다양성을 시사한다. Cse(Cas 서브형 Ecoli) 단백질(이. 콜라이(E. coli) 내에서 CasA-E로 불림)은 CRISPR RNA 전사체를 이러한 캐스케이드(cascade)가 보유한 스페이스-반복물 단위로 프로세싱하는, 기능성 복합체인, 캐스케이드를 형성한다. 다른 원핵세포에서, Cas6는 CRISPR 전사체를 프로세싱한다. 흥미롭게도, 이. 콜라이내에서 CRISPR-기반 파아지 불활성화는 캐스케이드 및 Cas3을 필요로 하지만, Cas1 및 Cas2는 필요로 하지 않는다. 피로코쿠스 푸리오수스(Pyrococcus furiosus) 및 다른 원핵세포에서 발견된 Cmr(Cas RAMP 모듈) 단백질은 상보성 표적 RNA를 인식하여 이를 절단하는 작은 CRISPR RNA와 기능성 복합체를 형성한다. RNA-가이드된 CRISPR 효소는 V형 제한 효소로 분류된다.
Cas9는 DNA를 2개의 활성 절단 부위로 절단하기 위해 구체화된 효소인, 뉴클레아제이며, 하나의 부위는 이중 나선의 각각의 가닥에 대한 것이다. 팀은 이들이 하나 또는 둘 모두의 부위를 상실시킬 수 있지만 이의 표적 DNA에 국재화하는 Cas9의 능력은 보존함을 입증하였다. Jinek et al. (2012)은 tracrRNA 및 스페이서 RNA를 "단일-가이드 RNA" 분자로 조합하였으며, 이는 Cas9와 혼합되어, 정확한 DNA 표적을 발견하여 절단할 수 있고, 이러한 합성 가이드 RNA는 유전자 편집에 사용된다.
Cas9 단백질은 병원성 및 공생 세균에서 매우 풍부하다. CRISPR/Cas-매개된 유전자 조절은 특히 진핵세포 숙주와의 세균 상호작용 동안에 내인성 세균 유전자의 조절에 기여할 수 있다. 예를 들면, 프란시셀라 노비시다(Francisella novicida)의 Cas 단백질 Cas9는 유일하고, 작은, CRISPR/Cas-관련 RNA(scaRNA)를 사용하여 에프. 노비시다(F. novicida)에 중요한 세균 지단백질을 암호화하는 내인성 전사체를 억제함으로써 숙주 반응을 약화시키고 발병력을 촉진시킨다. Wang et al. (2013)은 Cas9 mRNA 및 sgRNA의 돌연변이를 지닌 생식세포(접합체) 내로의 동시주사가 돌연변이를 지닌 마우스를 생성하였음을 입증하였다. Cas9 DNA 서열의 전달이 또한 고려된다.
시스템 CRISPR/Cas는 3개의 부류로 분리된다. 부류 1은 CRISPR RNA(crRNA)와 함께 수개의 Cas 단백질을 사용하여 기능성 엔도뉴클레아제를 구축한다. 부류 2 CRISPR 시스템은 crRNA를 지닌 단일 Cas 단백질을 사용한다. Cpf1은 최근에 부류 II, 1,300개 아미노산 단백질을 함유하는 V형 CRISPR/Cas 시스템으로 확인되었다. 또한, 이의 전문이 참고로 포함된, 미국 특허 공보 제2014/0068797호를 참고한다.
일부 구현예에서, 본 개시내용의 조성물은 스타필로코쿠스 아우레우스(Staphylococcus aureus)(유니프롯(UniProt) 수탁 번호 J7RUA5)로부터의 Cas9의 작은 버젼을 포함한다. Cas9의 작은 버젼은 야생형 또는 완전한 길이의 Cas9에 비해 이점을 제공한다. 일부 구현예에서 Cas9는 spCas9(AddGene)이다.
C. Cpf1 뉴클레아제
프레보텔라(Prevotella) 및 프란시셀라(Francisella) 1 또는 CRISPR/Cpf1은 CRISPR/Cas9 시스템과 일부 유사성을 공유하는 DNA-편집 기술이다. Cpf1은 부류 II CRISPR/Cas 시스템의 RNA-가이드된 엔도뉴클레아제이다. 이러한 후천성 면역 메카니즘은 프레보텔라(Prevotella) 및 프란시셀라(Francisella) 세균에서 발견된다. 이는 바이러스로부터의 유전적 손상을 방지한다. Cpf1 유전자는 가이드 RNA를 사용하여 바이러스 DNA를 발견하고 이를 절단하는 CRISPR 유전자자리와 관련되어 있다. Cpf1은 Cas9보다 더 작고 단순한 엔도뉴클레아제이며, CRISPR/Cas9 시스템 제한 중 일부를 극복한다.
Cpf1은 많은 세균 종에서 나타난다. 게놈 편집에 대한 도구로 개발된 궁극적인 Cpf1 엔도뉴클레아제는 이를 지닌 것으로 알려진 처음 16개 종 중 1개로부터 입수되었다.
구현예에서, Cpf1은 하기 나타낸 서열을 갖는, 악시드아미노코쿠스(Acidaminococcus)(종 BV3L6, 유니프롯 수탁 번호 U2UMQ6; 서열 번호: 870)로부터의 Cpf1 효소이다:
일부 구현예에서, Cpf1은 하기 나타낸 서열을 갖는, 라크노스피라세아에(Lachnospiraceae)(종 ND2006, 유니프롯 수탁 번호 A0A182DWE3; 서열 번호: 871)로부터의 Cpf1 효소이다:
일부 구현예에서, Cpf1은 포유동물 세포내에서 발현을 위해 최적화된 코돈이다. 일부 구현예에서, Cpf1은 사람 세포 또는 마우스 세포내에서 발현을 위해 최적화된 코돈이다.
Cpf1 유전자자리는 혼합된 알파/베타 도메인, RuvC-I에 이은 나선 영역, RuvC-II 및 아연 핑거-유사 도메인을 함유한다. Cpf1 단백질은 Cas9의 RuvC 도메인과 유사한 RuvC-유사 엔도뉴클레아제 도메인을 갖는다. 또한, Cpf1은 HNH 엔도뉴클레아제 도메인을 가지지 않으며, Cpf1의 N-말단은 Cas9의 알파-나선 인식 로브(recognition lobe)를 가지지 않는다.
Cpf1 CRISPR-Cas 도메인 구조는 Cpf1이 기능적으로 유일하며, 부류 2, V형 CRISPR 시스템으로 분류됨을 나타낸다. Cpf1 유전자자리는 II형 시스템으로부터 보다는 I형 및 III형과 보다 유사한 Cas1, Cas2 및 Cas4 단백질을 암호화한다. 데이타베이스 조사는 많은 세균 종에서 Cpf1-계열 단백질의 풍부함을 시사한다.
기능성 Cpf1은 tracrRNA를 필요로 하지 않으므로, crRNA 만이 요구된다. 이는 Cpf1이 Cas9보다 더 작을 뿐 아니라 더 작은 sgRNA 분자(대략 Cas9와 같이 많은 뉴클레오타이드의 대략 1/2)를 가지므로 유전자 편집에 유리하다.
Cpf1-crRNA 복합체는 Cas9에 의해 표적화된 G가 풍부한 PAM과는 대조적으로, 프로토스페이서 인접 모티프 5'-YTN-3'(여기서 "Y"는 피리미딘이고 "N"은 임의의 뉴클레아제이다) 또는 5'-TTN-3'의 확인에 의해 표적 DNA 또는 RNA를 절단한다. PAM의 확인 후, Cpf1은 4 또는 5개의 뉴클레오타이드 오버행(overhang)의 점착성(sticky)-말단-유사 DNA 이중 가닥 브레이크를 도입한다.
CRISPR/Cpf1 시스템은 Cpf1 효소 및 이중 나선 상의 정확한 점에서 복합체를 발견하고 위치시켜 표적 DNA를 절단하는 가이드 RNA로 이루어져 있다. CRISPR/Cpf1 시스템 활성은 3개의 단계를 갖는다:
적응, 이 동안 Cas1 및 Cas2 단백질은 DNA의 작은 단편의 CRISPR 배열로의 적응을 촉진시킨다;
crRNA의 형성: Cas 단백질을 가이드하기 위해 성숙한 crRNA를 생산하는 예비-cr-RNA의 프로세싱; 및
방해, 여기서 Cpf1은 crRNA에 결합하여 표적 DNA 서열을 확인하여 절단하는 이원 복합체(binary complex)를 형성한다.
D. gRNA
RNA 가이드된 단백질로서, Cas9는 DNA 표적의 인식을 지시하기 위해 짧은 RNA를 필요로 한다. Cas9는 PAM 서열 NGG를 함유하는 DNA 서열을 우선적으로 질문하지만, 이는 여기에 프로토스페이서(protospacer) 표적없이 결합할 수 있다. 그러나, Cas9-gRNA 복합체는 gRNA에 밀접하게 일치하여 이중 가닥 브레이크를 생성함을 필요로 한다. 세균내에서 CRISPR 서열은 다중 RNA로 발현된 후 프로세싱되어 RNA에 대한 가이드 가닥을 생성한다. 진핵세포 시스템은 CRISPR RNA를 프로세싱하는데 필요한 단백질 중 일부를 결여하므로 합성 작제물 gRNA는 RNA 폴리머라제 III형 프로모터 U6을 사용하여 발현된 단일 RNA로 표적화하는 Cas9에 대한 RNA의 필수적인 조각을 조합하기 위해 생성되었다. 합성 gRNA는 최대 길이로 100bp를 약간 초과하며 PAM 서열 NGG 바로 앞의 20개의 프로토스페이서 뉴클레오타이드를 표적화하는 부위를 함유한다; gRNA는 PAM 서열을 함유하지 않는다.
일부 구현예에서, gRNA는 야생형 디스트로핀 유전자내 부위를 표적화한다. 일부 구현예에서, gRNA는 돌연변이체 디스트로핀 유전자내 부위를 표적화한다. 일부 구현예에서, gRNA는 디스트로핀 인트론을 표적화한다. 일부 구현예에서, gRNA는 디스트로핀 엑손을 표적화한다. 일부 구현예에서, 발현된 디스트로핀 엑손내 부위를 표적화하며 표 1에 나타낸 하나 이상의 디스트로핀 동형 내에 존재한다. 구현예에서, gRNA는 디스트로핀 스플라이스 부위를 표적화한다. 일부 구현예에서, gRNA는 디스트로핀 유전자상의 스플라이스 공여체 부위를 표적화한다. 구현예에서, gRNA는 디스트포린 유전자 상의 스플라이스 수용체 부위를 표적화한다.
구현예에서, 가이드 RNA는 돌연변이체 DMD 엑손을 표적화한다. 일부 구현예에서, 돌연변이체 엑손은 엑손 23 또는 51이다. 일부 구현예에서, 가이드 RNA는 디스트로핀 유전자의 엑손 1, 23, 41, 44, 46, 47, 48, 49, 50, 51, 52, 53, 54, 또는 55 중 적어도 하나를 표적화한다. 구현예에서, 가이드 RNA는 디스트로핀 유전자의 인트론 44, 45, 50, 51, 52, 53, 54, 또는 55 중 적어도 하나를 표적화한다. 바람직한 구현예에서, 가이드 RNA는 엑손 51 또는 엑손 23의 스키핑(skipping)을 유도하도록 설계되어 있다. 구현예에서, gRNA는 엑손 51 또는 엑손 23의 스플라이스 수용체 부위에 대해 표적화된다.
본원에 개시된 다양한 조성물 및 방법에 사용하기에 적합한 gRNA는 서열 번호: 383 내지 705, 709 내지 711, 715 내지 717, 790 내지 862, 864로 제공된다.(표 7, 9, 11, 13, 및 15). 바람직한 구현예에서, gRNA는 서열 번호: 790 내지 서열 번호: 862 중 어느 하나로부터 선택된다.
일부 구현예에서, 본 개시내용의 gRNA는 DMD 유전자에 상응하는 암호화 서열 또는 비-암호화 서열내 표적 서열에 대해 상보성인 서열을 포함하므로, 표적 서열에 대해 하이브리드화된다. 일부 구현예에서, Cpf1에 대한 gRNA는 직접적인 반복물 스캐폴드(scaffold) 서열에 이은 가이드 서열의 24개 뉴클레오타이드를 함유하는 단일의 crRNA를 포함한다. 일부 구현예에서, crRNA의 "가이드" 서열은 표적 서열에 대해 상보성인 gRNA의 서열을 포함한다. 일부 구현예에서, 본 개시내용의 crRNA는 표적 서열에 대해 상보성이 아닌 gRNA의 서열을 포함한다. 본 개시내용의 "스캐폴드" 서열은 gRNA를 Cpf1 폴리펩타이드에 연결시킨다. 본 개시내용의 "스캐폴드" 서열은 gRNA-Cas9 작제물의 tracrRNA 서열과 동등하지 않다.
일부 구현예에서, 핵산은 gRNA를 암호화하는 하나 이상의 서열을 포함할 수 있다. 일부 구현예에서, 핵산은 gRNA를 암호화하는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개의 서열을 포함할 수 있다. 일부 구현예에서, 서열 모두는 동일한 gRNA를 암호화한다. 일부 구현예에서, 서열 모두는 상이한 gRNA를 암호화한다. 일부 구현예에서, 서열 중 적어도 2개는 동일한 gRNA을 암호화하는데, 예를 들면, 서열의 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개는 동일한 gRNA를 암호화한다.
E. Cas9 대 Cpf1
Cas9는 DNA를 절단하기 위해 2개의 RNA 분자를 필요로 하지만 Cpf1은 하나의 DNA 분자를 필요로 한다. 단백질은 또한 상이한 위치에서 DNA를 절단하여, 편집 부위를 선택하는 경우 연구자에게 추가의 선택사항을 제공한다. Cas9는 동일한 위치에서 DNA 분자내 가닥 둘 다를 절단하여, '평활(blunt)' 말단을 남긴다. Cpf1은 다른 것보다 더 긴 하나의 가닥을 남김으로써, 함께 작업하기 보다 용이한 '점착성' 말단을 생성한다. Cpf1은 Cas9와 비교하여, 절단 부위에서 새로운 서열을 보다 더 삽입할 수 있는 것으로 여겨진다. CRISPR/Cas9 시스템은 유전자를 효율적으로 무능화시키지만, 이는 유전자를 삽입시키거나 녹-인(knock-in)을 생성하기 위한 도전이다. Cpf1은 tracrRNA를 결여하며, T가 풍부한 PAM을 활용하며 엇갈린(staggered) DNA DSB를 통해 DNA를 절단시킨다.
요약하면, Cpf1 시스템과 Cas9 시스템 사이의 중요한 차이는 Cpf1이 상이한 PAM을 인식하여, 새로운 표적화 가능성을 가능하도록 하며, Cas9에 의해 생산된 평활 말단 대신에, 4 내지 5 nt 길이의 점착성 말단을 생성하며, 유전자 삽입의 효능 및 NHEJ 또는 HDR 동안의 특이성을 향상시키고, 표적 DNA를 PAM으로부터 더 멀리, Cas9 절단 부위로부터 더 멀리 절단하여, DNA를 절단하기 위한 새로운 가능성이 가능하도록 한다.
[표 3]
F. CRISPR-매개된 유전자 편집
CRISPR/Cpf1 또는 CRISPR/Cas9를 사용하여 DMD 유전자를 편집하는데 있어서 제1 단계는 게놈 표적 서열을 확인하는 것이다. 본 개시내용의 gRNA에 대한 게놈 표적은 임의의 ~24개 뉴클레오타이드 DNA 서열일 수 있으며, 단 서열은 게놈의 나머지와 비교하여 유일하다. 일부 구현예에서, 게놈 표적 서열은 사람 디스트로핀 유전자의 엑손 51, 엑손 45, 엑손 44, 엑손 53, 엑손 46, 엑손 52, 엑손 50, 엑손 43, 엑손 6, 엑손 7, 엑손 8, 및/또는 엑손 55내 서열에 상응한다. 일부 구현예에서, 게놈 표적 서열은 사람 디스트로핀 유전자의 엑손 51, 엑손 45, 엑손 44, 엑손 53, 엑손 46, 엑손 52, 엑손 50, 엑손 43, 엑손 6, 엑손 7, 엑손 8, 및/또는 엑손 55내의 5' 또는 3' 스플라이스 부위이다. 일부 구현예에서, 게놈 표적 서열은 사람 디스트로핀 유전자의 엑손 51, 엑손 45, 엑손 44, 엑손 53, 엑손 46, 엑손 52, 엑손 50, 엑손 43, 엑손 6, 엑손 7, 엑손 8, 및/또는 엑손 55의 바로 상부 또는 하부의 인트론내 서열에 상응한다. 예시적인 게놈 표적 서열은 표 6, 8, 10, 12, 및 14에서 찾을 수 있다.
DMD 유전자를 편집하는 다음 단계는 표적화될 유전자 영역내 모든 프로토스페이서 인접 모티프(Protospacer Adjacent Motif: PAM) 서열을 확인하는 것이다. 표적 서열은 PAM의 바로 상부에 위치하여야 한다. 일단 모든 가능한 PAM 서열 및 추정된 표적 부위가 확인되면, 다음 단계는 가장 효율적인 표적 위의 절개(on-target cleavage)를 생성하는 경향이 있다. gRNA 표적화 서열은 표적 서열과 일치할 필요가 있고, gRNA 표적화 서열은 게놈내 추가의 부위와 일치하지 않아야 한다. 바람직한 구현예에서, gRNA 표적화 서열은 게놈내 어느 곳에서도 상동성이 없는 표적에 대해 완전한 상동성을 갖는다. 일부 구현예에서, 제공된 gRNA 표적화 서열은 부분 상동성이 존재하는 게놈 전체에서 추가의 부위를 가질 것이다. 이러한 부위는 "오프-표적(off-target)"으로 불리며 gRNA를 설계하는 경우 고려되어야 한다. 일반적으로, 오프-표적 부위는 PAM 서열 근처에서 불일치가 발생하는 경우 효율적으로 절단되지 않으므로, 상동성을 지니지 않는 gRNA 또는 PAM 서열에 근접하여 불일치를 지닌 것은 최대 특이성을 가질 것이다. "오프-표적 활성" 외에도, 목적한 표적 서열의 절단을 최대화하는 인자("온-표적 활성(on-target activity)")이 고려되어야만 한다. 각각 표적 DNA에 대해 100% 상동성을 갖는, 2개의 gRNA 표적화 서열이 동등한 절개 효능을 생성하지 않을 수 있음은 당해 분야의 기술자에게 알려져 있다. 실제로, 절개 효율은 선택된 표적 서열내에 특이적인 뉴클레오타이드에 의존하여 증가하거나 감소할 수 있다. 각각의 잠재적인 gRNA 표적화 서열의 온-표적 및 오프-표적 활성의 엄밀한 검사는 최고의 gRNA를 설계하는데 필요하다. 잠재적인 PAM 및 표적 서열을 위치시키고 관련된 gRNA를 이들의 예측된 온-표적 및 오프-표적 활성(예컨대, CRISPRdirect, www.crispr.dbcls.jp에서 이용가능함)을 기반으로 하여 관련된 gRNA를 순위매길 수 있는 수 개의 gRNA 설계 프로그램이 개발되었다.
다음 단계는 목적한 gRNA를 합성하고 클로닝하는 것이다. 표적화 올리고는 합성하고, 어닐링(annealing)하여, 표준 제한-연결 클로닝을 사용함으로써 gRNA 스캐폴드를 함유하는 플라스미드내로 삽입할 수 있다. 그러나, 정확한 클로닝 전략은 선택되는 gRNA 벡터에 의존할 것이다. Cpf1에 대한 gRNA는 Cas9에 대한 gRNA보다 특히 더 단순하며, 직접적인 반복물 스캐폴드 서열에 이은 가이드 서열의 ~24개 뉴클레오타이드를 함유하는 단일 crRNA로 단지 이루어진다.
각각의 gRNA는 이후에 하나 이상의 표적 세포 주내에서 입증되어야 한다. 예를 들면, Cas9 또는 Cpf1 및 gRNA가 세포내로 전달된 후, 게놈 표적 영역은 PCR을 사용하여 증폭될 수 있고 당해 분야의 기술자에게 공지된 방법에 따라 서열분석될 수 있다.
일부 구현예에서, 유전자 편집은 시험관내 또는 생체외에서 수행될 수 있다. 일부 구현예에서, 세포는 시험관내 또는 생체외에서 Cas9 또는 Cpf1 및 디스트로핀 스플라이스 부위를 표적화하는 gRNA와 접촉된다. 일부 구현예에서, 세포는 Cas9 또는 Cpf1 및 가이드 RNA를 암호화하는 하나 이상의 핵산과 접촉된다. 일부 구현예에서, 하나 이상의 핵산은 예를 들면, 지질감염 또는 전기천공을 사용하여 세포내로 도입된다. 유전자 편집은 또한 접합체내에서 수행될 수 있다. 구현예에서, 접합체는 Cas9 또는 Cpf1을 암호화하는 하나 이상의 핵산 및 디스트로핀 스플라이스 부위를 표적화하는 gRNA와 함께 주사될 수 있다. 접합체는 후속적으로 숙주내로 주사될 수 있다.
구현예에서, Cas9 또는 Cpf1은 벡터 상에 제공된다. 구현예에서, 벡터는 에스. 피오게네스(S. pyogenes)로부터 유래된 Cas9(SpCas9, 서열 번호: 872)를 함유한다. 구현예에서, 벡터는 에스. 아우레우스(S. aureus)로부터 유래된 Cas9(SaCas9, 서열 번호: 873)를 함유한다. 구현예에서, 벡터는 라크노스피라세아에(Lachnospiraceae) 세균으로부터 유래된 Cpf1 서열을 함유한다. 예를 들면, 유니프롯 수탁 번호 A0A182DWE3; 서열 번호: 871을 참고한다. 구현예에서, 벡터는 악시드아미노코쿠스 세균으로부터 유래된 Cpf1 서열을 함유한다. 예를 들면, 유니프롯 수탁 번호 U2UMQ6; 서열 번호: 870을 참고한다. 일부 구현예에서, Cas9 또는 Cpf1 서열은 사람 세포 또는 마우스 세포에서 발현을 위해 최적화된 코돈이다. 일부 구현예에서, 벡터는 또한 GFP와 같은 형광성 단백질을 암호화하는 서열을 함유하며, 이는 Cas 9 또는 Cpf1-발현 세포가 형광성 활성화된 세포 분류(fluorescence activated cell sorting: FACS)를 사용하여 분류되도록 한다. 일부 구현예에서, 벡터는 아데노-관련 바이러스 벡터와 같은 바이러스 벡터이다.
구현예에서, gRNA는 벡터 상에 제공된다. 일부 구현예에서, 벡터는 아데노-관련 바이러스 벡터와 같은 바이러스 벡터이다. 구현예에서, Cas9 또는 Cpf1 및 가이드 RNA는 동일한 벡터 상에 제공된다. 구현예에서, Cas9 또는 Cpf1 및 가이드 RNA는 상이한 벡터 상에 제공된다.
일부 구현예에서, 세포는 단일-가닥 DNA 올리고뉴클레오타이드와 추가로 접촉함으로써 상동성 지시된 복구를 수행한다. 일부 구현예에서, 작은 INDEL은 디스트로핀의 단백질 판독 프레임을 회복한다("재프레임화(reframing)" 전략). 재프레임화 전략이 사용된 경우, 세포는 단일 gRNA와 접촉할 수 있다. 구현예에서, 스플라이스 공여체 또는 스플라이스 수용체 부위는 파괴되며, 이는 단백질 판독 프레임의 엑손 스키핑 및 복원을 야기한다("엑손 스키핑" 전략). 엑손 스키핑 전략이 사용되는 경우, 세포는 2개 이상의 gRNA와 접촉할 수 있다.
시험관내 또는 생체외 Cas9 또는 Cpf1-매개된 DNA 절단의 효능은 당해 분야에 공지된 기술, 예컨대, T7 E1 검정을 사용하여 평가할 수 있다. DMD 발현의 회복은 당해 분야의 기술자에게 공지된 기술, 예컨대, RT-PCR, 웨스턴 블롯팅, 및 면역세포화학을 사용하여 확인할 수 있다.
일부 구현예에서, 시험관내 또는 생체외 유전자 편집은 근육 및 위성(satellite) 세포에서 수행한다. 일부 구현예에서, 유전자 편집은 iPSC 또는 iCM 세포에서 수행한다. 구현예에서, iPSC 세포는 유전자 편집 후 분화된다. 예를 들면, iPSC 세포는 편집 후 근육 세포 또는 위성 세포로 분화될 수 있다. 구현예에서, iPSC 세포는 심장 근육 세포, 골격 근육 세포, 또는 평활근 세포로 분화된다. 구현예에서, iPSC 세포는 심근세포로 분화된다. iPSC 세포는 당해 분야의 기술자에게 공지된 방법에 따라 분화하도록 유도될 수 있다.
일부 구현예에서, 세포와 Cas9 또는 Cpf1 및 gRNA의 접촉은 디스트로핀 발현을 회복한다. 구현예에서, 시험관내 또는 생체외에서 편집된 세포, 또는 이로부터 유래된 세포는 야생형 세포와 비교가능한 디스트로핀 단백질의 수준을 나타낸다. 구현예에서, 편집된 세포 또는 이로부터 유래된 세포는 디스트로핀을 야생형 디스트로핀 발현 수준의 사이에서 50%, 60%, 70%, 80%, 90%, 95% 또는 임의의 퍼센트의 수준으로 발현한다. 구현예에서, 시험관내 또는 생체외 편집된 세포, 또는 이로부터 유래된 세포는 야생형 세포의 것과 비교가능한 미토콘드리아 수를 갖는다. 구현예에서, 편집된 세포, 또는 이로부터 유래된 세포는 야생형 세포와 같은 많은 미토콘드리아 사이에서 50%, 60%, 70%, 80%, 90%, 95% 또는 임의의 퍼센트를 갖는다. 구현예에서, 편집된 세포, 또는 이로부터 유래된 세포는 편집되지 않는 세포와 비교하여 기본선에서 산소 소비율(OCR)의 증가를 나타낸다.
G. RNA Pol III 및 Pol III 프로모터
진핵세포에서, RNA 폴리머라제 III(또한 Pol III으로 지칭됨)은 DNA를 전사하여 리보솜 5S rRNA, tRNA 및 다른 작은 RNA를 합성한다. RNA Pol III에 의해 전사된 유전자는 이의 발현이 모든 세포형 및 대부분의 환경 조건에서 요구되는 "하우스키핑(housekeeping)" 유전자의 범주에 속한다. 따라서, Pol III 전사의 조절은 세포 성장 및 세포 주기의 조절에 주로 묶여있으므로, RNA 폴리머라제 II보다 더 적은 조절 단백질을 필요로 한다. 그러나, 스트레스 조건 하에서, 단백질 Maf1은 Pol III 활성을 억제한다.
전사 공정(임의의 폴리머라제에 의한)에서, 3개의 주요 단계가 존재한다: (i) 유전자의 프로모터에서 RNA 폴리머라제 복합체의 작제를 필요로 하는 개시; (ii) 연장, RNA 전사체의 합성; 및 (iii) 종결, RNA 전사 및 RNA 폴리머라제 복합체의 분해의 마무리.
RNA Pol III의 제어하에서의 프로모터는 리보솜 5S rRNA, tRNA에 대한 것 및 약간의 다른 작은 RNA, 예컨대 U6 스플라이시오솜(spliceosomal) RNA, RNase P 및 RNase MRP RNA, 7SL RNA(시그날 인식 입자의 RNA 성분), Vault RNA, Y RNA, SINE(짧은 산재된 반복적 성분(short interspersed repetitive element)), 7SK RNA, 2개의 마이크로RNA, 수개의 작은 핵 RNA 및 수개의 적은 조절 안티센스 RNA를 포함한다.
IV. 핵산 전달
위에 논의된 바와 같이, 특정의 구현예에서, 발현 카세트를 사용하여 후속적인 정제 및 세포/대상체로의 전달을 위해, 또는 유전-기반 전달 시도에서 직접 사용하기 위한, 전사 인자 생성물을 발현한다. Cas9 또는 Cpf1을 암호화하는 하나 이상의 핵산 및 디스트로핀 스플라이스 부위를 표적화하는 적어도 하나의 DMD 가이드 RNA를 함유하는 발현 벡터가 본원에 제공된다. 일부 구현예에서, Cas9 또는 Cpf1을 암호화하는 핵산 및 적어도 하나의 가이드 RNA를 암호화하는 핵산은 동일한 벡터 상에 제공된다. 추가의 구현예에서, Cas9 또는 Cpf1을 암호화하는 핵산 및 적어도 하나의 가이드 RNA를 암호화하는 핵산은 별도의 벡터에 제공된다.
발현은 적절한 신호가 벡터 내에 제공됨을 필요로 하며, 세포내에서 목적한 유전자의 발현을 구동시키는 바이러스 및 포유동물 공급원 둘 다로부터의 인핸서/프로모터와 같은 다양한 조절 성분을 포함한다. 전령 RNA 안전성 및 숙주 세포내에서의 해독성(translatability)을 최적화하도록 설계된 성분이 또한 정의된다. 생성물을 발현하는 영구적이고, 안정한 세포 클론을 확립하기 위한 다수의 우성 약물 선택 마커를 사용하기 위한 조건은, 약물 선택 마커의 발현을 폴리펩타이드의 발현에 연결시키는 성분이므로, 또한 제공된다.
A. 조절 성분
본 출원 전반에 걸쳐서, 용어 "발현 카세트"는 서열을 암호화하는 핵산 중 일부 또는 모두가 전사되고 해독될 수 있는, 즉, 프로모터의 제어하에 있는 유전자 생성물을 암호화하는 핵산을 함유하는 임의의 유형의 유전 작제물을 포함함을 의미한다. "프로모터"는 세포의 합성기에 의해 인식되거나, 유전자의 특이적인 전사를 개시하는데 필요한 DNA 서열을 지칭한다. 어구 "전사 제어 하에"는 프로모터가 핵산과 관련한 정확한 위치 및 배향으로 있어서 RNA 폴리머라제 개시 및 유전자의 발현을 제어함을 의미한다. "발현 벡터"는 복제될 수 있는 유전 작제물 내에 포함됨으로써 하나 이상의 복제 오리진(origin of replication), 전사 종결 신호, 폴리-A 영역, 선택가능한 마커, 및 다목적 클로닝 부위를 포함하는 발현 카세트를 포함함을 의미한다.
용어 프로모터는 RNA 폴리머라제 II에 대한 개시 부위 주변에 군집되는 전사 제어 모듈의 그룹을 지칭하기 위해 본원에서 사용될 것이다. 프로모터가 구조화되는 방법에 대한 사고의 대부분은 HSV 티미딘 키나제(tk) 및 SV40 조기 전사 단위에 대한 것을 포함하는 수개의 프로모터의 분석으로부터 유래한다. 보다 최근의 연구에 의해 강화된 이러한 연구는 프로모터가 별개의 기능적 모듈로 구성되며, 각각은 대략 7 내지 20 bp의 DNA로 이루어지고, 전사 활성인자 또는 리프레서(repressor) 단백질에 대한 하나 이상의 인식 부위를 함유함을 입증하였다.
각각의 프로모터내 적어도 하나의 모듈은 RNA 합성을 위한 출발 부위를 위치시키도록 기능한다. 이의 가장 잘 알려진 예는 TATA 박스이지만, TATA 박스를 결여하고 있는 일부 프로모터, 예컨대, 포유동물 말단 데옥시뉴클레오티딜 트랜스퍼라제 유전자에 대한 프로모터 및 SV40 레이트 유전자(late gene)에 대한 프로모터에서, 출발 부위 자체에 놓여있는 별개의 성분은 개시의 위치를 고정시키는 것을 돕는다.
일부 구현예에서, 본 개시내용의 Cas9 또는 Cpf1 작제물은 근육-세포 특이적인 프로모터에 의해 발현된다. 이러한 근육-세포 특이적인 프로모터는 구성적으로 활성일 수 있거나 유도성 프로모터일 수 있다.
추가의 프로모터 성분은 전사 개시의 빈도를 조절한다. 전형적으로, 다수의 프로모터가 최근에 출발 부위의 하부의 기능성 성분을 또한 함유하는 것으로 밝혀졌지만, 이는 출발 부위의 상부의 30 내지 110 bp 영역에 위치한다, 프로모터 성분 사이의 간격(spacing)은 성분이 역위되거나 서로에 대해 이동하는 경우 보존된다. tk 프로모터에서, 프로모터 성분 사이의 간격은 활성이 감소되기 시작하기 전에 50 bp 떨어져서 증가될 수 있다. 프로모터에 따라서, 이는 개개 성분이 동시-협동적으로 또는 별도로 전사를 활성화시키기 위해 기능할 수 있는 것으로 나타난다.
특정의 구현예에서, 사람 사이토메갈로바이러스(CMV) 이미디어트 얼리(immediate early) 유전자 프로모터, SV40 얼리 프로모터, 로우스 육종 바이러스 롱 말단 반복물(Rous sarcoma virus long terminal repeat), 랫트 인슐린 프로모터 및 글리세르알데하이드-3-포스페이트 데하이드로게나제와 같은 바이러스 프로모터를 사용하여 목적한 암호화 서열의 고-수준 발현을 수득할 수 있다. 목적한 암호화 서열의 발현을 달성하기 위해 당해 분야에 잘 알려진 다른 바이러스 또는 포유동물 세포 또는 세균 파아지 프로모터의 사용이 또한 고려되며, 단, 발현 수준은 제공된 목적에 충분하다. 잘 알려진 특성의 프로모터를 사용함으로써, 형질감염 및 형질전환 후 목적한 단백질의 발현 수준 및 패턴을 최적화시킬 수 있다. 또한, 특이적인 생리학적 신호에 대한 반응시 조절되는 프로모터의 선택은 유전자 생성물의 유도성 발현을 허용할 수 있다.
인핸서는 DNA의 동일한 분자에서 먼 위치에 위치하는 프로모터로부터 전사를 증가시키는 유전 성분이다. 인핸서는 프로모터와 매우 유사하게 구조화된다. 즉, 이들은 많은 개개 성분으로 구성되며, 이들 각각은 하나 이상의 전사 단백질에 결합한다. 인핸서와 프로모터 사이의 기본적인 차이는 작동성(operational)이다. 전체적으로 인핸서 영역은 먼 거리에서 전사를 자극할 수 있어야만 하며; 이는 프로모터 영역 또는 이의 구성성분 인자일 필요가 없다. 다른 한편, 프로모터는 특수한 부위 및 특히 배향에서 RNA 합성의 개시를 지시하는 하나 이상의 인자를 가져야만 하는 반면, 인핸서는 이러한 특이성을 결여하고 있다. 프로모터 및 인핸서는 흔히 매우 유사한 모듈러 조직화(modular organization)를 갖는 것으로 여겨지는, 오버랩핑(overlapping) 및 연속적이다.
하기는 발현 작제물내 관심있는 유전자를 암호화하는 핵산과 함께 사용될 수 있는 프로모터/인핸서 및 유도성 프로모터/인핸서의 목록이다. 또한, 임의의 프로모터/인핸서 조합(진핵세포 프로모터 데이타 베이스 EPDB에 따라)을 또한 사용하여 유전자의 발현을 구동시킬 수 있다. 진핵 세포는 적절한 세균 폴리머라제가 전달 복합체의 일부로서 또는 추가의 유전 발현 작제물로서 제공되는 경우 특정의 세균 프로모터로부터 세포질성 전사를 뒷받침할 수 있다.
프로모터 및/또는 인핸서는 예를 들면, 면역글로불린 경쇄, 면역글로불린 중쇄, T-세포 수용체, HLA DQ a 및/또는 DQ β, β-인터페론, 인터루킨-2, 인터루킨-2 수용체, MHC 부류 II 5, MHC 부류 II HLA-Dra, β-액틴, 근육 크레아틴 키나제(MCK), 프레알부민(트랜스티레틴), 엘라스타제 I, 메탈로티오네인(MTII), 콜라게나제, 알부민, α-페토단백질, t-글로빈, β-글로빈, c-fos, c-HA-ras, 인슐린, 신경 세포 부착 분자(NCAM), α1-안티트리파인, H2B(TH2B) 히스톤, 마우스 및/또는 제I형 콜라겐, 글루코즈-관련 단백질(GRP94 및 GRP78), 랫트 성장 호르몬, 사람 혈청 아밀로이드 A(SAA), 트로포닌 I(TN I), 혈소판-유래 성장 인자(PDGF), 듀켄씨 근 이영양증, SV40, 폴리오마, 레트로바이러스, 파필로마 바이러스, B형 간염 바이러스, 사람 면역결핍증 바이러스, 사이토메갈로바이러스(CMV), 및 긴팔 원숭이 백혈병 바이러스(gibbon ape leukemia virus)일 수 있다.
일부 구현예에서, 유도성 인자가 사용될 수 있다. 일부 구현예에서, 유도성 인자는 예를 들면, MTII, MMTV(마우스 유방 종양 바이러스), β-인터페론, 아데노바이러스 5 E2, 콜라게나제, 스트로멜라이신, SV40, 쥐 MX 유전자, GRP78 유전자, α-2-마크로글로불린, 비멘틴, MHC 부류 I 유전자 H-2kb, HSP70, 프롤리페린, 종양 괴사 인자, 및/또는 갑상선 자극 호르몬 유전자이다. 일부 구현예에서, 유도인자는 포르볼 에스테르(TFA), 중금속, 글루코코르티코이드, 폴리(rI)x, 폴리(rc), ElA, 포르볼 에스테르(TPA), 인터페론, 뉴캐슬 질환 바이러스(Newcastle Disease Virus), A23187, IL-6, 혈청, 인터페론, SV40 거대 T 항원, PMA, 및/또는 갑상선 호르몬이다. 본원에 기술된 유도성 인자 중 어느 것도 본원에 기술된 유도인자 중 어느 것과 함께 사용될 수 있다.
특히 관심있는 것은 근육 특이적인 프로모터이다. 이는 미오신 경쇄-2 프로모터, α-액틴 프로모터, 트로포닌 1 프로모터; Na+/Ca2+ 교환체(exchanger) 프로모터, 디스트로핀 프로모터, α7 인테그린 프로모터, 뇌 나트륨뇨설의 펩타이드 프로모터 및 αB-크리스탈린/소 열 쇼크 단백질(small heat shock) 단백질 프로모터, α-마이오신 중쇄 프로모터 및 ANF 프로모터를 포함한다. 일부 구현예에서, 근육 특이적인 프로모터는 CK8 프로모터이다. CK8 프로모터는 다음의 서열(서열 번호: 874)을 갖는다:
일부 구현예에서, 근육-세포 세포 특이적인 프로모터는 CK8e로 불리는 CK8 프로모터의 변이체이다. CK8e 프로모터는 다음의 서열(서열 번호: 875)을 갖는다:
cDNA 삽입체를 사용하는 경우, 유전자 전사체의 적절한 폴리아데닐화를 달성하기 위한 폴리아데닐화 신호를 포함하는 것이 전형적으로 바람직할 것이다. 사람 성장 호르몬 및 SV40 폴리아데닐화 신호와 같은 임의의 폴리아데닐화 서열을 사용할 수 있다. 또한 발현 카세트의 인자로서 터미네이터가 고려된다. 이러한 인자는 전령 수준을 향상시키고 카세트로부터 다른 서열내로를 통해 판독물을 최소화시키는 작용을 할 수 있다.
B. 2A 펩타이드
일부 구현예에서, 곤충 바이러스 토세아 아시그나(Thosea asigna)로부터의 2A-유사 자가-절단하는 도메인(TaV 2A 펩타이드)(서열 번호: 876, EGRGSLLTCGDVEENPGP)을 사용한다. 이러한 2A-유사 도메인은 진핵세포에 걸쳐서 기능하여 아미노산의 절단이 2A-유사 펩타이드 도메인내에 공-해독적으로 발생하도록 유발하는 것으로 밝혀졌다. 따라서, TaV 2A 펩타이드의 포함은 단일 mRNA 전사체로부터 다중 단백질의 발현을 허용한다. 중요하게는, TaV의 도메인은 진핵세포 시스템에서 시험하는 경우 99% 이상의 절단 활성을 나타낸다. 다른 허용되는 2A-유사 펩타이드는 말 비염 A 바이러스(ERAV) 2A 펩타이드(서열 번호: 877; QCTNYALLKLAGDVESNPGP), 돼지 테스초바이러스(porcine teschovirus)-1(PTV1) 2A 펩타이드(서열 번호: 878; ATNFSLLKQAGDVEENPGP) 및 수족구 질환 바이러스(FMDV) 2A 펩타이드(서열 번호: 879; PVKQLLNFDLLKLAGDVESNPGP) 또는 이의 변형된 버젼을 포함하나, 이에 한정되지 않는다.
일부 구현예에서, 2A 펩타이드는 리포터 및 Cas9 또는 Cpf1을 동시에 발현시키기 위해 사용된다. 리포터는 예를 들면, GFP일 수 있다.
사용될 수 있는 다른 자가-절단 펩타이드는 핵 포함 단백질 (Nia) 프로테아제, P1 프로테아제, 3C 프로테아제, L 프로테아제, 3C-유사 프로테아제, 또는 이의 변형된 버젼을 포함하나, 이에 한정되지 않는다.
C. 발현 벡터의 전달
발현 벡터가 세포내로 도입될 수 있는 다수의 방법이 존재한다. 특정의 구현예에서, 발현 작제물은 바이러스 게놈으로부터 기원한 바이러스 또는 가공된 작제물(engineered construct)을 포함한다. 수용체-매개된 세포내이입을 통해 세포내로 도입하고, 숙주 세포 게놈내로 통합되며 바이러스 유전자를 안정하고 효율적으로 발현시키는 특정의 바이러스의 능력은 이들을 포유동물 세포내로의 외부 유전자의 전달을 위한 매력적인 후보물이 되도록 한다. 이들은 외부 DNA 서열에 대해 비교적 낮은 능력을 가지며 제한된 숙주 스펙트럼을 갖는다. 또한, 허용되는 세포에서 이들의 종양원성의 잠재적인 및 세포병리학적 효과는 안전성 관심을 상승시킨다. 이들은 단지 8 kB 이하의 외부 유전 물질을 수용하지만 다양한 세포주 및 실험실 동물내에 용이하게 도입될 수 있다.
생체내(in vivo) 전달을 위한 바람직한 방법들 중 하나는 아데노바이러스 발현 벡터의 사용을 포함한다. "아데노바이러스 발현 벡터"는 작제물의 패키징을 뒷받침하고 (b) 여기에 클로닝된 안티센스 폴리뉴클레오타이드를 발현하기에 충분한 아데노바이러스 서열을 함유하는 작제물을 포함함을 의미한다. 이러한 맥락에서, 발현은 유전자 생성물이 합성되는 것을 필요로 하지 않는다.
발현 벡터는 아데노바이러스의 유전적으로 가공된 형태를 포함한다. 아데노바이러스의 유전 기구화의 지식, 36 kB의, 선형의 이중-가닥 DNA 바이러스는 아데노바이러스 DNA의 큰 조각을 7 kB 이하의 외부 서열로 치환하도록 한다. 레트로바이러스와는 대조적으로, 숙주 세포의 아데노바이러스 감염은 아데노바이러스 DNA가 잠재적인 유전독성없이 에피솜 방식으로 복제할 수 있기 때문에 염색체 통합을 생성하지 않는다. 또한, 아데노바이러스는 구조적으로 안정하며, 집중적인 증폭 후 게놈 재배열이 검출되지 않는다. 아데노바이러스는 이들의 세포 주기 단계와는 상관없이 모든 내피 세포를 실질적으로 감염시킬 수 있다. 지금까지, 아데노바이러스 감염은 사람에서 급성 호흡성 질환과 같은 가벼운 질환에만 연결된 것으로 나타난다.
아데노바이러스는 이의 중간-크기의 게놈, 조작의 용이성, 높은 역가(titer), 광범위한 표적 세포 범위 및 고 감염성으로 인하여 유전자 전달 벡터로서 사용하기에 특히 적합하다. 바이러스 게놈의 말단 둘 다는 100 내지 200개의 염기쌍의 역위된 반복물(ITR)을 포함하며, 이는 바이러스 DNA 복제 및 패키지에 필수적인 시스(cis) 인자이다. 게놈의 얼리(E) 및 레이트(L) 영역은 바이러스 DNA 복제의 발생에 의해 분할된 상이한 전사 단위를 함유한다. E1 영역(E1A 및 E1B)은 바이러스 게놈 및 소수의 세포 유전자의 전사의 조절에 관여하는 단백질을 암호화한다. E2 영역(E2A 및 E2B)의 발현은 바이러스 DNA 복제를 위한 단백질의 합성을 야기한다. 이러한 단백질은 DNA 복제, 레이트 유전자 발현 및 숙주 세포 셧-오프(shut-off)에 관여한다. 대부분의 바이러스 캡시드 단백질을 포함하는 레이트 유전자의 생성물은 주요 레이트 프로모터(MLP)에 의해 비롯된 단일 주요 전사체의 유의적인 프로세싱 후에만 발현된다. MLP, (16.8 m.u.에 위치)는 특히 말기 감염 상 동안에 효율적이며, 이러한 프로모터로부터 비롯된 mRNA 모두는 이들을 해독용의 바람직한 mRNA로 만드는 5□-트리파타이트 리더(tripartite leader: TPL) 서열을 지닌다. 하나의 시스템에서, 재조합 아데노바이러스는 셔틀 벡터와 프로바이러스 벡터 사이의 동종 재조합으로부터 생성된다. 2개의 프로바이러스 벡터 사이의 가능한 재조합으로 인하여, 야생형 아데노바이러스는 이러한 공정으로부터 생성될 수 있다. 따라서, 개개 플라크(plaque)로부터 바이러스의 단일 클론을 단리하고 이의 게놈 구조를 시험하는 것이 중요하다.
복제 결핍성인, 현재의 아데노바이러스 벡터의 생성 및 증식은 293으로 지정된 유일한 헬퍼 세포주에 의존하며, 이는 사람 배아 신장 세포로부터 Ad5 DNA 단편에 의해 형질전환되어 E1 단백질을 구성적으로 발현한다. E3 영역이 아데노바이러스 게놈으로부터 불필요하므로, 현재의 아데노바이러스 벡터는, 293 세포의 도움으로, E1, D3 또는 둘 다의 영역에서 외부 DNA를 운반한다. 특성상, 아데노바이러스는 야생형 게놈의 대략 105%를 패키지할 수 있으며, 약 2의 추가 kb의 DNA에 대한 능력을 제공한다. E1 및 E3 영역에서 교체가능한 DNA의 대략 5.5 kb와 조합함으로써, 현재의 아데노바이러스 벡터의 최대 능력은 7.5 kb 미만, 벡터의 총 길이의 약 15%이다. 80% 이상의 아데노바이러스 게놈은 벡터 골격내에 남아있으며 벡터-유래된 세포독성의 공급원이다. 또한, E1-결실된 바이러스의 복제 결핍성은 불완전하다.
헬퍼 세포주는 사람 배아 신장 세포, 근육 세포, 조혈 세포 또는 다른 사람 배아 간엽성 또는 내피 세포와 같은 사람 세포로부터 유래될 수 있다. 대안적으로, 헬퍼 세포는 사람 아데노바이러스에 대해 허용성인 다른 포유동물 종의 세포로부터 유래될 수 있다. 이러한 세포는 예컨대, 베로 세포(Vero cell) 또는 다른 원숭이 배아 간엽 또는 내피 세포를 포함한다. 상기 기술한 바와 같이, 바람직한 헬퍼 세포주는 293이다.
293개의 세포를 배양하고 아데노바이러스를 증식하는 개선된 방법은 당해 분야에 알려져 있다. 하나의 양식에서, 천연 세포 집합체는 개개 세포를 100 내지 200 ml의 배지를 함유하는 1 리터들이의 실리콘화된 스피너 플라스크(siliconized spinner flask)(Techne, 영국 캠프릿지 소재)내로 접종함으로써 성장시킨다. 40 rpm에서 교반한 후, 세포 생존능을 트립판 블루로 평가한다. 다른 양식으로, 피브라-셀 미세담체(Fibra-Cel microcarrier)(Bibby Sterlin, 영국 스톤 소재)(5 g/l)를 다음과 같이 사용한다. 5 ml의 배지 속에 재현탁된 세포 접종물을 250 ml의 에를렌마이어 플라스크(Erlenmeyer flask) 속의 담체(50 ml)에 가하고 1 내지 4시간 동안 이따금씩 교반하면서 정지 상으로 둔다. 이후에, 배지를 50 ml의 신선한 배지로 교체하고 진탕을 개시한다. 바이러스 생산을 위해, 세포를 약 80% 합치성(confluence)으로 성장하도록 한 후, 배지를 교체(최종 용적의 25%까지)하고 아데노바이러스를 0.05의 MOI에서 가한다. 배양물을 밤새 정지상으로 둔 후, 용적을 100%로 증가시키고 진탕을 다른 72시간 동안 개시하였다.
본 개시내용의 아데노바이러스는 복제 결함성이거나, 적어도 조건적으로 복제 결함성이다. 아데노바이러스는 42개의 상이한 공지된 혈청형 또는 서브 그룹 A 내지 F 중의 어느 것일 수 있다. 서브그룹 C의 아데노바이러스 5형은 본 개시내용에서 사용하기 위한 조건적 복제-결함성 아데노바이러스 벡터를 수득하기 위한 바람직한 출발 물질이다.
상술한 바와 같이, 본 개시내용에 따른 대표적인 벡터는 복제 결함성이고 아데노바이러스 E1 영역을 가지지 않을 것이다. 따라서, 이는 목적한 유전자를 암호화하는 폴리뉴클레오타이드를 E1-암호화 서열이 제거된 위치에 도입시키는 것이 가장 편리할 것이다. 그러나, 아데노바이러스 서열내 작제물의 삽입 위치는 중요하지 않다. 목적한 유전자를 암호화하는 폴리뉴클레오타이드는 또한 E3 대체 벡터내 결실된 E3 영역 대신에, 또는 헬퍼 세포주 또는 헬퍼 바이러스가 E4 결함을 보충하는 E4 영역에서 삽입될 수 있다.
아데노바이러스는 성장 및 조작하기 용이하고 시험관내 및 생체내에서 광범위한 숙주 범위를 나타낸다. 바이러스의 이러한 그룹은 고 역가, 예컨대, ml당 109 내지 1012개의 플라크-형성 단위로 수득될 수 있으며 고도로 감염성이다. 아데노바이러스의 생애 주기는 숙주 세포 게놈내로의 통합을 필요로 하지 않다. 아데노바이러스 벡터에 의해 전달된 외부 유전자는 에피솜이므로, 숙주 세포에 대해 낮는 유전독성을 갖는다. 야생형 아데노바이러스를 사용한 백신접종의 연구에서 부작용을 보고되어 있지 않으며, 이는 생체내 유전자 전달 벡터에서와 같이 이들의 안전성 및 치료학적 효능을 입증한다.
아데노바이러스 벡터는 진핵세포 유전자 발현 및 백신 발달에 사용되어 왔다. 동물 연구는 재조합 아데노바이러스가 유전자 치료요법에 사용될 수 있음을 시사한다. 재조합 아데노바이러스를 상이한 조직에 투여하는데 있어서의 연구는 기관 점적주입법, 근육 주사, 말초 정맥내 주사 및 뇌내로의 정위 접종(stereotactic inoculation)을 포함한다.
레트로바이러스는 역-전사의 공정에 의해 감염된 세포내에서 이들의 RNA를 이중-가닥 DNA로 전환시키는 능력에 의해 특징화된 단일-가닥 RNA 바이러스의 그룹이다. 수득되는 DNA는 이후에 프로바이러스로서 세포 염색체내로 안정하게 통합되어 바이러스 단백질의 합성을 지시한다. 통합은 수용체 세포 및 이의 자손에서 바이러스 유전자 서열의 보유를 야기한다. 레트로바이러스 게놈은 캡시드 단백질, 폴리머라제 효소, 및 엔벨로프 성분 각각을 암호화하는 3개의 유전자, gag, pol, 및 env를 함유한다. gag 유전자로부터 상부에서 발견된 서열은 비리온(virion)내로 게놈을 패키징하기 위한 신호를 함유한다. 2개의 긴 말단 반복물(LTR) 서열은 바이러스 게놈의 5' 및 3' 말단에 존재한다. 이는 강력한 프로모터 및 인핸서 서열을 함유하며 또한 숙주 세포 게놈내 통합을 위해 요구된다.
레트로바이러스 벡터를 작제하기 위해, 목적한 유전자를 암호화하는 핵산은 특정의 바이러스 서열 대신에 바이러스 게놈내로 삽입되어 복제-결함성인 바이러스를 생산한다. 비리온을 생산하기 위해, gag, pol, 및 env 유전자를 함유하지만 LTR 및 패키징 성분이 없는 패키징 세포주가 작제된다. 레트로바이러스 LTR 및 패키징 서열과 함께, cDNA를 함유하는 재조합 플라스미드가 이러한 세포주내로 도입된 경우(예를 들면, 인산칼슘 침전에 의해), 패키징 서열은 재조합체 플라스미드의 RNA 전사체가 바이러스 입자내로 패키지되도록 하며, 이는 이후 배양 배지내로 분비된다. 이후 재조합 레트로바이러스를 함유하는 배지를 수집하고, 임의로 농축시키며 유전자 전달을 위해 사용한다. 레트로바이러스 벡터는 광범위하게 다양한 세포형을 감염시킬 수 있다. 그러나, 통합 및 안정한 발현은 숙주 세포의 분열을 요구한다.
레트로바이러스 벡터를 특이적으로 표적화하도록 설계된 새로운 시도가 락토즈 잔기를 바이러스 엔벨로프에 화학적 첨가함으로써 레트로바이러스의 화학적 변형을 기반으로 최근에 개발되었다. 이러한 변형은 시알로글리코단백질 수용체를 통해 간세포의 특이적인 감염을 허용할 수 있었다.
재조합 레트로바이러스를 표적화하기 위한 상이한 시도를 사용할 수 있으며, 여기서 레트로바이러스 엔벨로프 단백질에 대한 및 특이적인 세포 수용체에 대한 바이오티닐화된 항체가 사용된다. 항체는 스트렙타비딘을 사용함으로써 바이오틴 성분을 통해 커플링된다. 주요 조직적합성 복합체 제I 부류 및 제II 부류 항원에 대한 항체를 사용하여, 시험관내 동종지향성 바이러스로 이러한 표면 항원을 생성하는 다양한 사람 세포의 감염이 입증되어 왔다(Roux et al., 1989).
본 개시내용의 모든 양태에서 레트로바이러스 벡터의 사용에 대한 특정의 제한이 있다. 예를 들면, 레트로바이러스 벡터는 일반적으로 세포 게놈내에 무작위 부위로 통합된다. 이는 숙주 유전자의 중단을 통해 또는 플랭킹(flanking) 유전자의 기능을 방해할 수 있는 바이러스 조절 서열의 삽입을 통해 삽입 돌연변이유발을 초래할 수 있다. 결함이 있는 레트로바이러스 벡터를 사용한 다른 관심은 패키징 세포내에서 야생형 복제-적격성(replication-competent) 바이러스의 잠재적인 출현이다. 이는 재조합 사건으로부터 생성될 수 있으며, 여기서 재조합 바이러스로부터의 온전한- 서열은 숙주 세포 게놈내 통합된 gag, pol, env 서열로부터 상부에 삽입된다. 그러나, 재조합 경향성을 크게 감소시켜야 하는 새로운 패키징 세포주가 현재 이용가능하다(참고: 예를 들면, Markowitz et al., 1988; Hersdorffer et al., 1990).
다른 바이러스 벡터는 본 개시내용에서 발현 작제물로서 사용될 수 있다. 박시니아 바이러스 아데노-관련 바이러스(AAV) 및 헤르페스바이러스와 같은 바이러스로부터 유래된 벡터를 사용할 수 있다. 이들은 다양한 포유동물 세포에 대한 수개의 매력적인 특징을 제공한다.
구현예에서, AAV 벡터는 복제-결합성이거나 조건적으로 복제 결함성이다. 구현예에서, AAV 벡터는 재조합 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다.
일부 구현예에서, 단일의 바이러스 벡터를 사용하여 Cas9 또는 Cpf1을 암호화하는 핵산 및 적어도 하나의 gRNA를 세포로 전달하는데 사용된다. 일부 구현예에서, Cas9 또는 Cpf1은 제1 바이러스 벡터를 사용하여 세포로 제공되며 적어도 하나의 gRNA는 제2 바이러스 벡터를 사용하여 세포로 제공된다.
일부 구현예에서, 단일 바이러스 벡터를 사용하여 Cas9 또는 Cpf1를 암호화하는 핵산 및 적어도 하나의 gRNA를 세포로 전달한다. 일부 구현예에서, Cas9 또는 Cpf1는 제1 바이러스 벡터를 사용하여 세포로 제공되며 적어도 하나의 gRNA는 제2 바이러스 벡터를 사용하여 세포로 제공된다. 센스 또는 안티센스 유전자 작제물의 발현을 시행하기 위하여, 발현 작제물을 세포내로 전달하여야만 한다. 세포는 근육 세포, 성상 세포, 메산기오블라스트(mesangioblast), 골수 유래된 세포, 기질 세포 또는 간엽 줄기 세포일 수 있다. 구현예에서, 세포는 심근 세포, 골격근 세포, 또는 평활근 세포이다. 구현예에서, 세포는 전경골근, 사두근, 비장근, 횡격막 또는 심장내 세포이다. 일부 구현예에서, 세포는 유도된 다능성 줄기 세포(iPSC) 또는 내부 세포 괴세포(inner cell mass cell: iCM)이다. 추가의 구현예에서, 세포는 사람 iPSC 또는 사람 iCM이다. 일부 구현예에서, 본 개시내용의 사람 iPSC 또는 사람 iCM은 배양된 줄기 세포주, 성체 줄기 세포, 태반 줄기 세포, 또는 사람 배아의 파괴를 필요로 하지 않는 성체 또는 배아 줄기 세포의 다른 공급원으로부터 유래될 수 있다. 세포로의 전달은 세포주를 형질전환하기 위한 실험실 과정에서와 같이 시험관내, 또는 생체내 또는 생체외(ex vivo), 특정의 질환 상태의 치료에서와 같이 달성될 수 있다. 하나의 전달 메카니즘은 바이러스 감염을 통하며 여기서 발현 작제물은 감염성 바이러스 입자내에서 캡시드화(encapsidating)된다.
배양된 포유동물 세포내로 발현 작제물을 전달하기 위한 수개의 비-바이러스 방법은 또한 본 개시내용에 의해 고려된다. 이는 인산칼슘 침전, DEAE-덱스트란, 전기천공, 직접적인 미세주입, DNA-로딩된 리포좀 및 리포펙타민-DNA 복합체, 세포 초음파, 고속 미세투사물(high velocity microprojectile)을 사용한 유전자 충격(gene bombardment), 및 수용체-매개된 형질감염을 포함한다. 이러한 기술 중 일부는 생체내 또는 생체외 사용을 위해 성공적으로 채택될 수 있다.
일단 발현 작제물이 세포내로 전달되면, 목적한 유전자를 암호화하는 핵산을 상이한 부위에 위치시키고 발현시킬 수 있다. 특정의 구현예에서, 유전자를 암호화하는 핵산은 세포의 게놈내로 안정하게 통합될 수 있다. 이러한 통합은 동종 재조합(유전자 대체)을 통해 동종 위치 및 배향으로 존재할 수 있거나 무작위의, 비-특이적인 위치(유전자 증강)내에 통합될 수 있다. 여전히 추가의 구현예에서, 핵산은 DNA의 별도의, 에피솜 분절로서 세포내에서 안정하게 유지될 수 있다. 이러한 핵산 분절 또는 "에피솜"은 숙주 세포 주기와는 별도로 또는 숙주 세포 주기와 동기화된 유지 및 복제를 허용하기에 충분한 서열을 암호화한다. 발현 작제물이 세포로 전달되는 방법 및 세포내에서 핵산이 유지되는 위치는 사용된 발현 작제물의 유형에 의존적이다.
여전히 다른 구현예에서, 발현 작제물은 네이키드(naked) 재조합 DNA 또는 플라스미드로 단순이 이루어질 수 있다. 작제물의 전달은 세포막을 물리적으로 또는 화학적으로 투과하는 상기 언급된 임의의 방법에 의해 수행할 수 있다. 이는 특히 시험관내 전달에 적용가능하지만 생체내 용도에도 또한 적용될 수 있다. Dubensky et al. (1984)은 인산칼슘 침전물 형태의 폴리오마바이러스 DNA를 성체 및 새로이 태어난 마우스의 간 및 비장내로 성공적으로 주사하여 활성 바이러스 복제 및 급성 감염을 입증하였다. 벤베니스티(Benvenisty) 및 네쉬프(Neshif) (1986)는 또한 인산칼슘-침전된 플라스미드의 직접적인 복강내 주사가 형질감염된 유전자의 발현을 야기함을 입증하였다. 목적한 유전자를 암호화하는 DNA는 또한 생체내에서 유사한 방식으로 형질전달되어 유전자 생성물을 발현할 수 있다.
네이키드 DNA 발현 작제물을 세포내로 형질감염시키는 여전히 다른 구현예에는 입자 충격이 포함될 수 있다. 이러한 방법은 DNA-코팅된 미세투사물을 고속으로 가속화하여 이들이 세포막을 뚫고 세포를 사멸시키지 않으면서 세포내로 도입하도록 하는 능력에 의존한다. 작은 입자를 가속화하는 수개의 장치가 개발되어 왔다. 하나의 이러한 장치는 전류를 생성하기 위한 고압 방전에 의존하며, 이는 궁극적으로 원동력을 제공한다. 사용된 미세투사물은 텅스텐 또는 금 비드(bead)와 같은 생물학적으로 불활성인 물질로 이루어졌다.
일부 구현예에서, 발현 작제물은 대상체의 간, 피부, 및/또는 근육 조직으로 직접 전달된다. 이는 총(gun)과 표적 기관 사이의 개입 조직(intervening tissue)을 제거하기 위해, 즉, 생체외 치료를 위해 조직 또는 세포의 외과적 노출을 필요로 할 수 있다. 다시, 특수한 유전자를 암호화하는 DNA는 본 방법을 통해 전달될 수 있고 본 개시내용에 여전히 혼입될 수 있다.
추가의 구현예에서, 발현 작제물은 리포좀 내에 인트랩(entrap)될 수 있다. 리포좀은 인지질 이층막 및 내부 수성 매질에 의해 특징화된 소낭 구조이다. 다중라멜라 리포좀(Multilamellar liposome)은 수성 매질에 의해 분리된 다수의 지질 층을 갖는다. 이들은 인지질이 과도한 수용액 속에 현탁되는 경우 자발적으로 형성한다. 지질 성분은 밀폐된 구조를 형성하기 전에 자가-재배열을 겪고 지질 이층 사이에 물과 용해된 용질을 인트랩한다. 또한 리포펙타민-DNA 복합체가 고려된다.
시험관내 외부 DNA의 리포좀-매개된 핵산 전달 및 발현은 매우 성공적이었다. 리포펙타민 2000TM으로 공지된 시약은 광범위하게 사용되며 상업적으로 이용가능하다.
특정의 구현예에서, 리포좀은 세포 막과의 융합을 촉진시키고 리포좀-캡슐화된 DNA의 세포 도입을 촉진하기 위해 헤마글루틴화 바이러스(hemagglutinating virus: HVJ)와 복합체화될 수 있다. 다른 구현예에서, 리포좀은 핵형의 비-히스톤 염색체 단백질(HMG-1)과 함께 복합체화되거나 사용될 수 있다. 여전히 추가의 구현예에서, 리포좀은 HVJ 및 HMG-1 둘 다와 함께 복합체화되거나 사용될 수 있다. 이러한 발현 작제물이 시험관내 및 생체내에서 핵산의 전달 및 발현에 성공적으로 사용되어 왔다는 점에서, 이들은 본 개시내용에 적용가능하다. 세균 프로모터가 DNA 작제물에 사용되는 경우, 이는 또한 적절한 세균 폴리머라제를 리포좀내에 포함시키는 것이 바람직할 것이다.
특수한 유전자를 암호화하는 핵산을 세포내로 전달하는데 사용될 수 있는 다른 발현 작제물은 수용체-매개된 전달 비히클이다. 이는 대부분의 모든 진핵 세포내에서 수용체-매개된 세포내이입에 의해 거대분자의 선택적인 흡수를 이용한다. 다양한 수용체의 세포형-특이적인 분포로 인하여, 전달은 매우 특이적일 수 있다.
수용체-매개된 유전자 표적화 비히클은 일반적으로 2개의 구성성분으로 이루어진다: 세포 수용체-특이적인 리간드 및 DNA-결합제. 수개의 리간드는 수용체-매개된 유전자 전달을 위해 사용되어 왔다. 대부분의 집중적으로 특징화된 리간드는 아시알로오로소무코이드(asialoorosomucoid: ASOR) 및 트랜스페린이다. ASOR과 동일한 수용체를 인식하는, 합성 네오글리코단백질을 유전자 전달 비히클로서 사용하여 왔으며 상피 성장 인자(EGF) 또한 편평 암종 세포로 유전자를 전달하기 위해 사용되어 왔다.
D. AAV-Cas9 벡터
일부 구현예에서, Cas9는 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, AAV 벡터는 야생형 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, AAV 벡터는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다.
예시적인 AAV-Cas9 벡터는 Cas9 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물)를 함유한다. 일부 구현예에서, ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 완전한 길이 및/또는 야생형 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 절두된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 연장된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 동일한 AAV 혈청형에 대한 야생형 서열과 비교하여 서열 변이를 포함하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 서열 변이는 하나 이상의 치환, 결실, 삽입, 역위, 또는 전좌를 포함한다. 일부 구현예에서, ITR은 적어도 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 길이가 110 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 120 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 130 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 140 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 150 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 115, 145, 또는 141개의 염기쌍이다. 일부 구현예에서, ITR은 서열 번호: 880, 서열 번호: 881, 서열 번호: 882, 서열 번호: 883 및 서열 번호: 946으로부터 선택된 서열을 갖는다.
일부 구현예에서, AAV-Cas9 벡터는 하나 이상의 핵 국재화 신호(NLS)를 함유할 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 1, 2, 3, 4, 또는 5개의 핵 국재화 신호를 함유한다. 예시적인 NLS는 c-myc NLS(서열 번호: 884), SV40 NLS(서열 번호: 885), hnRNPAI M9 NLS(서열 번호: 886), 뉴클레오플라스민 NLS(서열 번호: 887), 임포르틴-알파로부터의 IBB 도메인의 서열 RMRKFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (서열 번호: 888), 근종 T 단백질의 서열 VSRKRPRP(서열 번호: 889) 및 PPKKARED(서열 번호: 890), 사람 p53의 서열 PQPKKKPL(서열 번호: 891), 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열 번호: 892), 인플루엔자 바이러스 NS1의 서열 DRLRR(서열 번호: 893) 및 PKQKKRK(서열 번호: 894), 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열 번호: 895) 및 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열 번호: 896)을 함유한다. 추가의 허용되는 핵 국재화 신호는 2부 핵 국재화 서열, 예컨대, 사람 폴리(ADP-리보스)폴리머라제의 서열 KRKGDEVDGVDEVAKKKSKK (서열 번호: 897) 또는 스테로이드 호르몬 수용체(사람) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (서열 번호: 898)을 포함한다.
일부 구현예에서, AAV-Cas9 벡터는 벡터의 패키징 및 Cas9의 발현을 촉진하는 추가의 인자를 포함할 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 폴리A 서열을 포함할 수 있다. 일부 구현예에서, 폴리A 서열은 미니-폴리A 서열일 수 있다. 일부 구현예에서, AAV-CAs9 벡터는 전이 인자(transposable element)를 포함할 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 조절인자 인자를 포함할 수 있다. 일부 구현예에서, 조절인자 인자는 활성인자 또는 억제인자이다.
일부 구현예에서, AAV-Cas9는 하나 이상의 프로모터를 함유할 수 있다. 일부 구현예에서, 하나 이상의 프로모터는 Cas9의 발현을 구동한다. 일부 구현예에서, 하나 이상의 프로모터는 근육-특이적인 프로모터이다. 예시적인 근육-특이적인 프로모터는 미오신 경쇄-2 프로모터, α-액틴 프로모터, 트로포닌 1 프로모터, Na+/Ca2+ 교환인자 프로모터, 디스트로핀 프로모터, α7 인테그린 프로모터, 뇌 나트륨뇨설의 펩타이드 프로모터, αB-결정성/소 열 쇼크 단백질 프로모터, α-미오신 중쇄 프로모터, ANF 프로모터, CK8 프로모터 및 CK8e 프로모터를 포함한다.
일부 구현예에서, AAV-Cas9 벡터는 효모, 세균, 곤충 세포, 또는 포유동물 세포내에서 생산을 위해 최적화될 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 사람 세포내에서의 발현을 위해 최적화될 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 바쿨로바이러스 발현 시스템내에서의 발현을 위해 최적화될 수 있다.
일부 구현예에서, AAV-Cas9 벡터는 표 4에 나타낸 바와 같이, 서열 번호: 899, 서열 번호: 900, 서열 번호: 901, 또는 서열 번호: 902로부터 선택된 서열을 포함한다.
[표 4]
서열 번호: 899 내지 902를 포함하는 구현예를 포함하는, 본 개시내용의 유전자 편집 작제물의 일부 구현예에서, 작제물은 프로모터 및 뉴클레아제를 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 CK8e 프로모터 및 Cas9 뉴클레아제를 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 CK8e 프로모터 및 스타필로코쿠스 피오게네스(Staphylococcus pyogenes)로부터의 Cas9 뉴클레아제("SpCas9")를 포함하거나 이로 이루어진다. 일부 구현예에서, CK8e 프로모터는
(서열 번호: 875)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, SpCas9 뉴클레아제는
(서열 번호: 872)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 적어도 2개의 역위된 말단 반복물(ITR) 서열을 추가로 포함한다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 혈청형2(AAV2)의 AAV로부터 단리되거나 유래된 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 (서열 번호:880)의 뉴클레오타이드를 포함하거나 이로 이루어진 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 적어도 2개의 ITR 서열을 추가로 포함하고, 여기서 제1 ITR 서열은
(서열 번호: 881)의 뉴클레오타이드 서열을 포함하거나 이로 이루어지고 제2 ITR 서열은
(서열 번호: 882)의 뉴클레오타이드의 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제 및 제2 ITR을 암호화하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제 및 제2 AAV2 ITR을 암호화하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제 및 제2 ITR을 포함하거나 이로 이루어진 작제물은 폴리 A 서열을 추가로 포함한다. 일부 구현예에서, 폴리A 서열은 미니폴리A 서열을 포함하거나 이로 이루어진다. 본 개시내용의 예시적인 미니폴리A 서열은
(서열 번호: 903)의 뉴크렐오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 미니폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제를 암호화하는 서열, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어지고, 적어도 하나의 핵 국재화 신호를 추가로 포함한다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하는 작제물은, 적어도 2개의 핵 국재화 신호를 추가로 포함한다. 본 개시내용의 예시적인 핵 국재화 신호는 (서열 번호: 887)의 뉴클레오타이드 서열, 또는 (서열 번호: 885)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국재화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 서열, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하는 작제물은 정지 코돈을 추가로 포함한다. 정지 코돈은 TAG(서열 번호: 904), TAA(서열 번호: 905), 또는 TGA(서열 번호: 906)의 서열을 가질 수 있다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 정지 코돈, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어지는 작제물은 전이 인자 역위된 반복물을 추가로 포함한다. 본 개시내용의 예시적인 전이 인자 역위된 반복물은
(서열 번호: 907)의 뉴클레오타이드 서열 및/또는
(서열 번호: 908)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 서열 번호: 907의 서열을 갖는 제1 전이 인자 역위된 반복물, 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열, 제2 AAV2 ITR, 및 서열 번호: 908의 서열을 갖는 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 5' 내지 3', 제1 전이 인자 역위된 반복물, 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진 작제물은 조절 서열을 추가로 포함한다. 본 개시내용의 예시적인 조절 서열은
(서열 번호: 909)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열, 제2 ITR, 조절 서열 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 서열 번호: 907의 서열을 갖는 제1 전이 인자 역위된 반복물, 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열, 제2 AAV2 ITR, 서열 번호: 909의 서열을 갖는 조절 서열, 및 서열 번호: 908의 서열을 갖는 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 하나 이상의 스페이서 서열을 추가로 포함할 수 있다. 본 개시내용의 예시적인 스페이서 서열은 이들 사이의 모든 범위를 포함하는, 1 내지 1500개 뉴클레오타이드의 길이를 갖는다. 일부 구현예에서, 스페이서 서열은 5'로부터 3'로 ITR, 프로모터, 핵 국재화 서열, 뉴클레아제, 정지 코돈, 폴리A 서열, 전이 인자 역위된 반복물, 및/또는 조절 인자에 위치할 수 있다. 일부 구현예에서, 작제물은 서열 번호: 899, 서열 번호: 900, 서열 번호: 901, 또는 서열 번호: 902를 포함하거나 이로 이루어진 서열을 가질 수 있다.
E. AAV-sgRNA 벡터
일부 구현예에서, gRNA를 암호화하는 적어도 제1 서열 및 gRNA를 암호화하는 제2 서열는 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, 적어도 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열은 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, 적어도 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열은 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, 적어도 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열은 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, gRNA를 암호화하는 다수의 서열은 AAV 벡터내로 패키지된다. 예를 들면, gRNA를 암호화하는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 서열이 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, gRNA를 암호화하는 각각의 서열은 상이하다. 일부 구현예에서, gRNA를 암호화하는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 서열 모두는 동일하다.
일부 구현예에서, AAV 벡터는 야생형 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 하나 이상의 돌연변이를 함유한다. 일부 구현예에서, AAV 벡터는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다.
예시적인 AAV-sgRNA 벡터는 sgRNA 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물) 서열을 함유한다. 일부 구현예에서, ITR는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, ITR은 제1 혈청형의 AAV 벡터로부터 단리되거나 유래되고 AAV-sgRNA 벡터의 캡시드 단백질을 암호화하는 서열은 제2 혈청형의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하지 않다. 일부 구현예에서, 제1 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제2 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고 제2 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고 제2 혈청형은 AAV9이다.
예시적인 AAV-sgRNA 벡터는 gRNA 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물) 서열을 함유한다. 일부 구현예에서, ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, 제1 ITR은 제1 혈청형의 AAV 벡터로부터 단리되거나 유래되고, 제2 ITR은 제2 혈청형의 AAV 벡터로부터 단리되거나 유래되고 AAV-sgRNA 벡터의 캡시드 단백질을 암호화하는 서열은 제3 혈청형의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하지 않다. 일부 구현예에서, 제1 혈청형, 제2 혈청형, 및 제3 혈청형은 동일하다. 일부 구현예에서, 제1 혈청형, 제2 혈청형, 및 제3 혈청형은 동일하지 않다. 일부 구현예에서, 제1 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제2 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제3 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고, 제2 혈청형은 AAV4이며 제3 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고, 제2 혈청형은 AAV4이며 제3 혈청형은 AAV9이다. 예시적인 AAV-sgRNA 벡터는 sgRNA 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물) 서열을 포함한다. 일부 구현예에서, ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 전체 길이 및/또는 야생형 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 절두된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 신장된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 동일한 AAV 혈청형에 대한 야생형 서열과 비교하여 서열 변이를 포함하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 서열 변이는 하나 이상의 치환, 결실, 삽입, 역위, 또는 전좌를 포함한다. 일부 구현예에서, ITR은 적어도 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 길이가 110 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 120 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 130 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 140 ± 10개 염기쌍이다. 일부 구현예에서, ITR은 길이가 150 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 115, 145, 또는 141개의 염기쌍이다. 일부 구현예에서, ITR은 서열 번호: 880, 서열 번호: 881, 서열 번호: 882, 또는 서열 번호: 883으로부터 선택된 서열을 갖는다.
일부 구현예에서, AAV-sgRNA 벡터는 벡터의 패키징 및 sgRNA의 발현을 촉진시키는 추가의 인자를 포함할 수 있다. 일부 구현예에서, AAV-sgRNA 벡터는 전이 인자를 포함할 수 있다. 일부 구현예에서, AAV-sgRNA 벡터는 조절 인자를 포함할 수 있다. 일부 구현예에서, 조절 인자는 활성인자 또는 억제인자를 포함한다. 일부 구현예에서, AAV-sgRNA 서열은 비-기능성이거나 "스터퍼(stuffer)" 서열을 포함할 수 있다. 본 개시내용의 예시적인 스터퍼 서열은 포유동물(사람 포함)의 게놈 서열에 대해 일부(비-제로 퍼센트의) 동일성(identity) 또는 상동성(homology)을 가질 수 있다. 대안적으로, 본 개시내용의 예시적인 스터퍼 서열은 포유동물(사람 포함)의 게놈 서열에 대한 동일성 또는 상동성을 가지지 않을 수 있다. 본 개시내용의 예시적인 스터퍼 서열은 대상체에게 AAV 벡터의 투여 후 전사되지 않거나 해독되지 않은 천연적으로 발생하는 비-암호화 서열 또는 서열을 포함하거나 이로 이루어질 수 있다.
일부 구현예에서, AAV-sgRNA 벡터는 효모, 세균, 곤충 세포, 또는 포유동물 세포내에서 생산하기 위해 최적화될 수 있다. 일부 구현예에서, AAV-sgRNA 벡터는 사람 세포내에서 발현을 위해 최적화될 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 바큘로바이러스 발현 시스템내에서 발현하기 위해 최적화될 수 있다.
일부 구현예에서, AAV-sgRNA 벡터는 적어도 하나의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 2개의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 3개의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 4개의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 5개의 프로모터를 포함한다. 예시적인 프로모터는 예를 들면, 면역글로불린 경쇄, 면역글로불린 중쇄, T-세포 수용체, HLA DQ a 및/또는 DQ β, β-인터페론, 인터루킨-2, 인터루킨-2 수용체, MHC 제II 부류 5, MHC 제II 부류 HLA-Dra, β-액틴, 근육 크레아틴 키나제(MCK), 프레알부민(트랜스티레틴), 엘라스타제 I, 메탈로티오네인(MTII), 콜라게나제, 알부민, α-페토단백질, t-글로빈, β-글로빈, c-fos, c-HA-ras, 인슐린, 신경 세포 부착 분자(NCAM), α1-안티트리파인, H2B(TH2B) 히스톤, 마우스 및/또는 제I형 콜라겐, 글루코즈-조절된 단백질(GRP94 및 GRP78), 랫트 성장 호르몬, 사람 혈청 아밀로이드 A(SAA), 트로포닌 I(TN I), 혈소판-유래 성장 인자(PDGF), 듀켄씨 근 이영양증, SV40, 폴리오마, 레트로바이러스, 파필로마 바이러스, B형 간염 바이러스, 사람 면역결핍증 바이러스, 사이토메갈로바이러스(CMV), 및 긴팔 원숭이 백혈병 바이러스를 포함한다. 추가의 예시적인 프로모터는 U6 프로모터, H1 프로모터, 및 7SK 프로모터를 포함한다.
일부 구현예에서, gRNA를 암호화하는 서열은 서열 번호: 383-705, 709-711, 715-717, 790-862, 및 864로부터 선택된 서열을 포함한다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열 및 gRNA를 암호화하는 제2 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키며 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시킨다. 일부 구현예에서, 제1 및 제2 프로모터는 동일하다. 일부 구현예에서, 제1 및 제2 프로모터는 상이하다. 일부 구현예에서, 제1 및 제2 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, gRNA를 암호화하는 제1 서열 및 gRNA를 암호화하는 제2 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열 및 gRNA를 암호화하는 제2 서열은 동일하지 않다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키고, 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시키며, 제3 프로모터는 gRNA를 암호화하는 제3 서열의 발현을 구동시킨다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터 중 적어도 2개는 동일하다. 일부 구현예에서, 각각의 제1, 제2, 및 제3 프로모터는 상이하다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, 제1 프로모터는 U6 프로모터이다. 일부 구현예에서, 제2 프로모터는 H1 프로모터이다. 일부 구현예에서, 제3 프로모터는 7SK 프로모터이다. 일부 구현예에서, 제1 프로모터는 U6 프로모터이고, 제2 프로모터는 H1 프로모터이며, 제3 프로모터는 7SK 프로모터이다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열은 동일하지 않다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키고, 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시키며, 제3 프로모터는 gRNA를 암호화하는 제3 서열의 발현을 구동시키고, 제4 프로모터는 gRNA를 암호화하는 제4 서열을 발현을 구동시킨다. 일부 구현예에서, 제1, 제2, 제3, 및 제4 프로모터 중 적어도 2개는 동일하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 및 제4 프로모터는 상이하다. 일부 구현예에서, 각각의 제1, 제2, 제3 및 제4 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열은 동일하지 않다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키고, 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시키며, 제3 프로모터는 gRNA를 암호화하는 제3 서열의 발현을 구동시키고, 제4 프로모터는 gRNA를 암호화하는 제4 서열의 발현을 구동시키며, 제5 프로모터는 gRNA를 암호화하는 제5 서열의 발현을 구동시킨다. 일부 구현예에서, 제1, 제2, 제3, 제4, 및 제5 프로모터 중 적어도 2개는 동일하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 제4, 및 제5 프로모터는 상이하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 및 제4 프로모터는 상이하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 제4 및 제5 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열은 동일하지 않다.
일부 구현예에서, AAV-sgRNA 벡터는 서열 번호: 910, 서열 번호: 911, 서열 번호: 912, 또는 서열 번호: 913로부터 선택된 서열을 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 서열 번호: 914, 서열 번호: 915, 서열 번호: 916, 또는 서열 번호: 917으로부터 선택된 서열을 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 서열 번호: 918, 서열 번호: 919, 서열 번호: 920, 또는 서열 번호: 921로부터 선택된 서열을 포함한다. 예시적인 AAV-sgRNA 벡터는 표 5에 제공된다.
[표 5]
서열 번호: 910 내지 921을 포함하는 구현예를 포함하는, 본 개시내용의 유전자 편집 작제물의 일부 구현예에서, 작제물은 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하거나 이로 이루어진다. 본 개시내용의 gRNA를 포함하는 예시적인 서열은 서열 번호: 383-705, 709-711, 715-717, 790-862, 864이다. 일부 구현예에서, gRNA를 암호화하는 서열은 CACTAGAGTAACAGTCTGAC(서열 번호: 708)이다. 일부 구현예에서, gRNA를 암호화하는 서열은 CACCAGAGTAACAGTCTGAG(서열 번호: 714)이다. 일부 구현예에서, gRNA를 암호화하는 서열은 CACCAGAGTAACAGTCTGAC(서열 번호: 863)이다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 서열 번호: 863의 gRNA를 암호화하는 제3 서열을 포함한다. 본 개시내용의 예시적인 프로모터는 (서열 번호: 922)의 서열을 갖는 U6 프로모터, (서열 번호: 923)의 서열을 갖는 H1 프로모터, 및 (서열 번호: 924)의 서열을 갖는 7SK 프로모터를 포함한다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터는 U6 프로모터(서열 번호: 922), H1 프로모터(서열 번호: 923), 및 7SK 프로모터(서열 번호: 924)로부터 각각 개별적으로 선택된다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터는 U6 프로모터(서열 번호: 922), 및 H1 프로모터(서열 번호: 923)로부터 각각 개별적으로 선택된다. 일부 구현예에서, 작제물은 5'로부터 3'로, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은, 5'로부터 3'로, U6 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 서열 번호: 863의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하는 작제물은 또한 적어도 2개의 역위된 말단 반복물(ITR) 서열을 포함한다. 일부 구현예에서, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하는 작제물은 또한 혈청형 2의 AAV(AAV2)를 포함하는 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 구현예에서, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하는 작제물은 적어도 2개의 ITR 서열을 추가로 포함하며, 여기서 제1 ITR 서열은 혈청형 4의 AAV(AAV4)로부터 단리되거나 유래되고 제2 ITR 서열은 혈청형 2의 AAV(AAV2)로부터 단리되거나 유래된다. 예시적인 ITR 서열은 (서열 번호: 881), (서열 번호: 883), (서열 번호: 946), 및 (서열 번호: 882)이다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, 및 gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 및 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호:: 863의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, U6, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, U6, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 및 제2 ITR을 포함하는 작제물은 폴리 A 서열을 추가로 포함한다. 일부 구현예에서, 폴리A 서열은 미니폴리A 서열을 포함하거나 이로 이루어진다. 본 개시내용의 예시적인 미니폴리A 서열은 TAGCAATAAAGGATCGTTTATTTTCATTGGAAGCGTGTGTTGGTTTTTTGATCAGGCGCG(서열 번호: 903)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하는 작제물은 전이 인자 역위된 반복물을 추가로 포함한다. 본 개시내용의 예시적인 전이 인자 역위된 반복물은 (서열 번호: 907)의 뉴클레오타이드 서열 및/또는
(서열 번호: 908)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열 , 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 제2 전이 인자 역위된 반복물을 포함하는 작제물은 조절 서열을 추가로 포함한다. 본 개시내용의 예시적인 조절 서열은 (서열 번호: 909)
의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하는 작제물은 스터퍼 서열(stuffer sequence)을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 하나 이상의 스페이서 서열을 추가로 포함할 수 있다. 본 개시내용의 예시적인 스페이서 서열은 이들 사이의 모든 범위를 포함하는 1 내지 1500개의 뉴클레오타이드의 길이를 갖는다. 일부 구현예에서, 스페이서 서열은 ITR, 프로모터, gRNA을 암호화하는 서열, 폴리A 서열, 전이 인자 역위된 반복물, 스터퍼 서열, 및/또는 조절 인자에 대해 5'로부터 3'로의 위치에서 위치할 수 있다.
V. 약제학적 조성물 및 전달 방법
임상 적용을 위해, 약제학적 조성물은 의도된 적용을 위해 적절한 형태로 제조한다. 일반적으로, 이는 발열 물질 뿐만 아니라 사람 또는 동물에 유해할 수 있는 다른 불순물도 필수적으로 포함하지 않는 조성물을 제조함을 포함한다.
적절한 염 및 완충제는 약물, 단백질 또는 전달 벡터가 안정하도록 하고 표적 세포에 의해 흡수되도록 하기 위해 사용된다. 본 개시내용의 수성 조성물은 약제학적으로 허용되는 담체 또는 수성 매질 속에 용해되거나 분산된, 유효량의 약물, 벡터 또는 단백질을 포함한다. 어구 "약제학적으로 또는 약리학적으로 허용되는"은 동물 또는 사람에게 투여되는 경우 부작용, 알레르기, 또는 다른 부적당한 반응을 생성하지 않는 분자 실체 및 조성물을 지칭한다. 본원에 사용된 바와 같이, "약제학적으로 허용되는 담체"는 사람에게 투여하기에 적합한 약제와 같은 약제를 제형화하는데 사용하기 위해 허용가능한 용매, 완충제, 용액, 분산 매질, 코팅, 항세균제 항진균제, 등장성 제제 및 흡수 지연제를 포함한다. 약제학적으로 활성인 물질에 대한 이러한 매질 및 제제의 용도는 당해 분야에 잘 공지되어 있다. 본 개시내용의 활성 성분과 비혼화성이 아닌 임의의 통상적인 매질 또는 제제, 치료학적 조성물에서 이의 용도를 사용할 수 있다. 보충적인 활성 성분은 또한 조성물내로 혼입될 수 있으며, 단 이들은 조성물의 벡터 또는 세포를 불활성화시키지 않는다.
일부 구현예에서, 본 개시내용의 활성 조성물은 전통적인 약제학적 제제를 포함할 수 있다. 본 개시내용에 따른 이러한 조성물의 투여는 표적 조직이 이러한 경로를 통해 이용가능한 한, 그러나 일반적으로는 전신 투여를 포함하는 임의의 일반적인 경로를 통할 수 있다. 이는 경구, 비강, 또는 볼내를 포함한다. 대안적으로, 투여는 피내, 피하, 근육내, 복강내 또는 정맥내 주사에 의해, 또는 근육 조직내로의 직접 주사에 의해 이루어질 수 있다. 이러한 조성물은 일반적으로 상술한 바와 같은, 약제학적으로 허용되는 조성물로서 투여될 수 있다.
활성 화합물은 또한 비경구적으로 또는 복강내 투여될 수 있다. 설명의 방식으로, 유리 염기 또는 약리학적으로 허용되는 염의 용액은 하이드록시프로필셀룰로즈와 같은 표면활성제와 적합하게 혼합된 물 속에서 제조할 수 있다. 분산제는 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 이의 혼합물 및 오일 속에서 제조할 수 있다. 저장 및 사용의 통상의 조건 하에서, 이러한 제제는 일반적으로 미생물의 성장을 방지하기 위한 방부제를 함유한다.
주사가능한 용도에 적합한 약제학적 형태는 예를 들면, 멸균 주사가능한 용액 또는 분산액의 일시적인 제조를 위한 멸균 수용액 또는 분산액 및 멸균 분말을 포함한다. 일반적으로, 이러한 제제는 용이한 주사가능성이 존재하는 정도로 멸균성이고 유체이다. 제제는 제조 및 저장 조건 하에서 안정하여야 하고 세균 및 진균과 같은, 미생물의 오염 작용에 대해 보존되어야 한다. 적절한 용매 또는 분산 매질은 예를 들면, 물, 에탄올, 폴리올(예를 들면, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 이의 적합한 혼합물, 및 식물성 오일을 함유할 수 있다. 적절한 유동성은 예를 들면, 레시틴과 같은 코팅을 사용함으로써, 분산액의 경우에 필요한 입자 크기의 유지에 의해 및 표면활성제의 사용에 의해 유지될 수 있다. 미생물의 작용의 방지는 다양한 항세균제 및 항진균제, 예를 들면, 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 유발할 수 있다. 많은 경우에, 등장성 제제, 예를 들면, 슈가 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 주사가능한 조성물의 연장된 흡수는 흡수를 지연시키는 제제, 예를 들면, 알루미늄 모노스테아레이트 및 젤라틴을 조성물에서 사용함으로써 유발할 수 있다.
멸균 주사가능한 용액은 경우에 따라 임의의 다른 성분(예를 들면, 상기 열거된 바와 같음)과 함께 적절한 양의 활성 성분을 용매 내에 혼입시킨 후, 여과된 멸균에 의해 제조할 수 있다. 일반적으로, 분산액은 멸균된 다양한 활성 성분을 기본 분산 매질 및 예컨대, 상기 나열된 바와 같은, 목절한 다른 성분을 함유하는 멸균 비히클 내로 혼입시킴으로써 제조한다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우에, 바람직한 제조 방법은 활성 성분(들)의 분말 및 이의 앞서 멸균-여과된 용액으로부터 임의의 추가의 목적한 성분의 분말을 수득하는 진공-건조 및 동결-건조 기술을 포함한다.
일부 구현예에서, 본 개시내용의 조성물은 중성 또는 염 형태로 제형화된다. 약제학적으로 허용되는 염은 예를 들면, 무기 산(예컨대, 염화수소산 또는 인산), 또는 유기산(예컨대, 아세트산, 옥살산, 타르타르산, 만델산 등) 등으로부터 유래된 산 부가염(단백질의 유리 아미노 그룹으로 형성됨)을 포함한다. 단백질의 유리 카복실 그룹과 함께 형성된 염은 또한 무기 염기(예컨대, 나트륨, 칼륨, 암모늄, 칼슘, 또는 수산화 제2철) 또는 유기 염기(예컨대, 이소프로필아민, 트리메틸아민, 히스티딘, 프로카인) 등으로부터 유래될 수 있다.
제형화시, 용액은 바람직하게는 투여 제형과 혼용성인 방식으로 및 치료학적으로 효과적인 양으로 투여된다. 제형은 주사가능한 용액, 약물 방출 캅셀 등과 같은 다양한 투여형으로 용이하게 투여될 수 있다. 수용액으로의 비경구 투여를 위해, 예를 들면, 용액은 일반적으로 적합하게 완충되고 액체 희석제는 우선 예를 들면 충분한 염수 또는 글루코즈로 등장성이 되도록 한다. 이러한 수용액은 예를 들면, 정맥내, 근육내, 피하 및 복강내 투여를 위해 사용될 수 있다. 바람직하게는, 멸균 수성 매질은 당해 분야의 기술자에게 공지된 바와 같이, 특히 본 개시내용의 측면에서 사용된다. 설명하기 위하여, 단일 용량은 1 ml의 등장성 NaCl 용액 속에 용해시키고 1000 ml의 대량피하주사 유액에 첨가되거나 적절한 주입 부위에 주입된다(참고: 예를 들면, "Remington's Pharmaceutical Sciences" 15th Edition, pages 1035-1038 및 1570-1580). 투여량의 일부 변화는 치료되는 대상체의 상태에 따라 필수적으로 일어날 것이다. 투여에 관여하는 개인은 어떠한 상황에서도 개인 대상체에 대해 적절한 용량을 결정할 것이다. 또한, 사람 투여를 위해, 제제는 생물학 표준(Biologics standards)의 FDA 사무국에 의해 요구된 바와 같은 멸균성, 발열원성, 일반적인 안전성 및 순도 표준을 충족시켜야 한다.
일부 구현예에서, 본원에 기술된 Cas9 또는 Cpf1 및 gRNA는 입양 세포 전달(ACT)를 사용하여 환자에게 전달될 수 있다. 입양 세포 전달시, 하나 이상의 발현 작제물은 환자(자가조직의)로부터 또는 환자 이외의 1명 이상의 개인(들)(동종이계)로부터 유래되는 세포에 대해 생체외 제공된다. 세포는 후속적으로 환자에게 도입되거나 재도입된다. 따라서, 일부 구현예에서, Cas9 또는 Cpf1을 암호화하는 하나 이상의 핵산 및 디스트로핀 스플라이스 부위를 표적화하는 가이드 RNA는 세포가 환자에게 도입되거나 재도입되기 전에 생체외로 세포에 제공된다.
다음의 표는 본원에 개시된 조성물 및 방법과 함께 사용하기 위한 예시적인 프라이머 및 게놈성 표적화 서열을 제공한다.
[표 6]
* 이러한 표에서, 대문자는 유전자의 엑손 서열에 대해 정렬하는 뉴클레오타이드를 나타낸다. 소문자는 유전자의 인트론 서열에 대해 정렬하는 뉴클레오타이드를 나타낸다.
[표 7]
* 당해 표에서, 대문자는 유전자의 엑손 서열에 대해 정렬하는 sgRNA 뉴클레오타이드를 나타낸다. 소문자는 유전자의 인트론 서열에 대해 정렬하는 sgRNA 뉴클레오타이드를 나타낸다.
VI. 서열 표
[표 8]
[표 9]
[표 10]
[표 11]
[표 12]
[표 13]
[표 14]
[표 15]
다음의 도면은 본 명세서의 일부를 형성하며 본 개시내용의 특정의 양태를 추가로 입증하기 위해 포함된다. 본 개시내용은 본원에 나타낸 구체적인 구현예의 상세한 설명과 함께 하나 이상의 이러한 도면을 참고함으로써 보다 잘 이해될 수 있다.
도 1의 A 내지 F. "사람화된"-△Ex50 마우스 모델. (도 1의 A) 사람화된 마우스 모델을 생성하기 위한 CRISPR/Cas9-매개된 게놈 편집 시도를 나타내는 전략. (도 1의 B) 엑손 50(△Ex50)의 결실을 입증하기 위한 RT-PCR 분석. (도 1의 C) 엑손 50 결실 및 프레임 외부(out-of-frame) 서열의 생성을 입증하기 위한 RT-PCR 생성물의 서열(핵산 서열 = 서열 번호: 1; 아미노산 서열 = 서열 번호: 2). (도 1의 E) 전경골근 및 심장 조직내 디스트로핀 및 빈쿨린 발현의 웨스턴 블롯 분석(Western blot analysis). (도 1의 F) 근육 손상 및 근막 누출을 반영하는 근 이영양증의 마커인, 혈청 CK의 수준은 야생형(WT), △Ex50 및 mdx 마우스에서 측정하였다. (도 1의 D) 헤마톡실린 및 에오신(H&E) 염색, 및 디스트로핀 항체를 사용한 면역조직화학에 의한 심장 및 골격근의 조직화학. 기준자(scale bar): 50 μm.
도 2의 A 및 B. 엑손 51 스키핑. (도 2의 A) 근육내 주사 후 3주째에 △Ex50 마우스로부터의 RNA의 RT-PCR은 엑손 51(Ex50-51로 명명됨, 하부 밴드)의 결실을 나타낸다. (도 2의 B) △Ex50-51 밴드의 RT-PCR 생성물의 서열은 엑손 49가 엑손 51(핵산 서열 = 서열 번호: 3; 아미노산 서열 = 서열 번호: 4)을 배제한 엑손 52에 직접 스플라이싱됨을 입증하였다.
도 3의 A 내지 G. 근육내 주사 후 3주째에 트리플리케이트(triplicate) gRNA 전략을 사용한 디스트로핀 발현의 수정. (도 3의 A) △Ex50 마우스 모델에서 판독 프레임을 수정하기 위한 CRISPR/Cas9-매개된 게놈 편집 시도를 나타내는 전략. (도 3의 B) 스플라이스 수용체 부위 (sgRNA-ex51-SA) 서열을 표적화하는 sgRNA 및 sgRNA 결합 위치의 개략도. 도 3의 B는 나타난 순서로 서열 번호: 954 내지 957을 각각 나타낸다. (도 3의 C) AAV 주사 플라스미드 및 전략의 개략도. sgRNA-ex51-SA 및 sgRNA-ex51-SD에 대해 rAAV9-sgRNA 플라스미드를 사용하는 이중 가이드 전략. sgRNA-ex51-SA의 3개의 카피를 함유하는 rAAV9-sgRNA 플라스미드를 사용한 트리플리케이트. SpCas9를 발현시키기 위한 근육 크레아틴 키나제 8(CK8) 프로모터. sgRNA를 발현시키기 위한 RNA 폴리머라제 III에 대한 U6, H1 및 7SK 프로모터. (도 3의 D) 전경골근 근육의 디스트로핀 면역조직화학 염색. (도 3의 E) 부위에 의해 표준화된 디스트포린 양성 섬유의 정량화. (도 3의 F) 근육내 주사 후 3주째에 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. (도 3의 G) 빈쿨린에 대한 표준화 후 디스트로핀 발현의 정량화. 데이타는 평균 ± SEM으로 나타낸다. **P<0.005. 기준자: 50 μm
도 4의 A 및 B. 3주 후 주사된 근육의 조직학적 개선. (도 4의 A) 헤마톡실린 및 에오신(H&E) 염색에 의한 전경근골 근육의 조직화학. (도 4의 B) 섬유 크기 및 빈도 퍼센트의 정량화. 데이타는 평균 ± SEM으로 나타낸다. 기준자: 50 μm. 제공된 섬유 크기에 대한 4개의 데이타 점의 각각의 세트는 좌에서 우로 △50-CTL, WT-CTL, △50-AAV-TriSA 및 △50-AAV-SA+SD이다.
도 5. 사람 293 세포 및 마우스 10T 세포에서 sgRNA의 스크린. 2% 아가로즈 겔 상에서 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널). M은 크기 마커 레인(size marker lane)을 나타낸다. bp는 마커 밴드의 길이를 나타낸다.
도 6. 전체 전경골근 근육의 디스트로핀 면역조직화학 염색
도 7의 A 및 B. △Ex50 마우스에서 CRISPR/Cas9-매개된 게놈 편집에 대한 전략. (도 7의 A) △Ex50 마우스 모델에서 판독 프레임을 수정하기 위한 CRISPR/Cas9-매개된 게놈 편집 시도를 나타내는 전략. (도 7의 B) 스플라이스 수용체 부위(sgRNA-ex51-SA2) 서열을 표적화하는 sgRNA 및 sgRNA 결합 위치의 개략적 도시. 도 7의 B는 나타난 순서로, 서열 번호: 958 내지 959를 각각 나타낸다.
도 8의 A 내지 F. 마우스 및 사람 세포에서 sgRNA 게놈 분석(도 8의 A) Cas9를 10T1/2 세포내에서 마우스 sgRNA-sgRNA-51-SA2의 존재 또는 부재하에 발현시키고 유전자 편집은 형광성-기반한 세포 분류(FACS)(+) 및 비-분류된 세포(-)에서T7E1 검정에 의해 모니터링하였다. GFP는 대조군으로서 사용하였다. 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널)를 2% 아가로즈 겔 위에 나타낸다. 검정색 화살촉은 소화되지 않은 771bp PCR 밴드를 나타낸다. 하부 패널에서 녹색 화살촉은 T7E1 검정에 의한 절단 밴드를 나타낸다. M은 크기 마커 레인을 나타낸다. bp는 마커 밴드의 길이를 나타낸다. (도 8의 B) 10T1/2 세포내에서 엑손 51 표적 부위를 따라 생성된 PCR 앰플리콘(amplicon)의 게놈 K 서열분석(Genomic deep sequencing analysis). 대표적인 삽입-결실(indel)의 서열은 삽입(녹색으로 강조함) 및 결실(적색으로 강조함)을 나타내는 sgRNA 서열(청색으로 나타냄)과 함께 정렬하였다(나타낸 순서로, 각각 서열 번호: 960 내지 966). 선은 sgRNA의 부위에 위치한 예측된 엑손 스플라이싱 인핸서(ESE) 서열을 나타낸다. 검정색 화살표는 절단 부위를 나타낸다. (도 8의 C) sgRNA의 부위에 위치하는 예측된 엑손 스플라이싱 인핸서(ESE)를 지닌 마우스 엑손 51 서열(서열 번호: 967)은 적색으로 나타낸다. sgRNA의 부위에 위치한 예측된 엑손 스플라이싱 인핸서(ESE)를 지닌 사람 엑손 51 서열(서열 번호: 968)은 적색으로 나타낸다. (도 8의 D) 엑손 51의 마우스 및 사람 ESE 부위는 ESEfinder3을 사용하여 예측하였다. (도 8의 E) Cas9를 293 T 사람 세포내에서 마우스 sgRNA-sgRNA-51-SA2 의 존재 또는 부재하에 발현시키고 유전자 편집을 형광성-기반 세포 분류된(FACS)(+) 및 분류되지 않은 세포(-) 내에서 T7E1 검정으로 모니터링하였다. GFP를 대조군으로서 사용하였다. 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널)을 2% 아가로즈 겔에서 나타낸다. 검정색 화살촉은 소화된 771bp PCR 밴드를 나타낸다. 하부 패널에서 녹색 화살촉은 T7E1 검정에 의한 절단 밴드를 나타낸다. M은 크기 마커 레인을 나타낸다. bp는 마커 밴드의 길이를 나타낸다. (도 8의 F) 대표적인 삽입-결실의 서열을 결실 및 삽입을 나타내는 sgRNA 서열(청색으로 나타냄)과 함께 정렬하였다(나타낸 순서로 각각 서열 번호: 969 내지 978). 검정색 화살촉은 절단 부위를 나타낸다.
도 9의 A 및 B. AAV 주사 플라스미드 및 전략의 개략적 도시. (도 9의 A) SpCas9를 발현하는 근육 크레아틴 키나제 8(CK8) 프로모터. (도 9의 B) sgRNA-ex51-SA2의 3개의 카피를 함유하는 rAAV9-sgRNA 플라스미드를 사용한 트리플리케이트. sgRNA를 발현하기 위한 RNA 폴리머라제 III에 대한 U6, H1 및 7SK 프로모터.
도 10의 A 및 B. 생체내 Dmd 유전자 편집. (도 10의 A) 소화되지 않은 PCR 생성물(상부 패널) 및 T7E1 소화(하부 패널)은 AAV9-sgRNA-SA2 및 AAV9-Cas9 발현 벡터를 사용한 근육내 주사 후 3주째에 WT 및 △Ex50 마우스로부터의 TA(전경골근) 근육 샘플의 2% 아가로즈 겔에서 나타낸다. 대조군에게는 AAV9-sgRNA-SA2가 아닌 AAV9-Cas9 만을 주사하였다. 상부 패널에서 검정색 화살촉은 771bp PCR 밴드를 나타낸다. 하부 패널에서 녹색 화살촉은 T7E1 검정에 의해 절단 밴드로 나타낸다. M은 크기 마커 레인을 나타낸다. bp는 마커 밴드의 길이를 나타낸다. N=4. (도 10의 B) AAV9-sgRNA-51-SA2 및 AAV9-Cas9를 주사한 △Ex50 마우스에서 엑손 51 표적 부위에 따라 생성된 PCR 앰플리콘의 게놈 K 서열 분석. 대표적인 삽입-결실의 서열은 삽입(녹색으로 강조함) 및 결실(적색으로 강조함)을 나타내는 sgRNA 서열(청색으로 나타냄)과 함께 정렬하였다. (나타낸 순서로 각각 서열 번호: 979 내지 1014). 검정색 화살촉은 절단 부위를 나타낸다. n=3.
도 11의 A 내지 D. 판독 프레임의 수정의 RT-PCR 분석. (도 11의 A) sgRNA-51-SA2 및 Cas9 발현 벡터의 근육내 주사 후 3주째에 야생형(WT) 및 △Ex50 마우스의 전경골근 근육으로부터 RNA의 RT-PCR. 하부 디스트로핀 밴드는 엑손 51의 결실을 나타낸다. 엑손 48 및 53내 프라이머 위치가 나타나 있다(Fw, Rv). (도 11의 B) 사건의 퍼센트는 TOPO-TA 생성된 클론의 RT-PCR 서열 분석을 사용하여 AAV9-sgRNA-51-SA2 처리 후 엑손 51에서 검출하였다. 각각의 4개의 상이한 샘플에 대해, 본 발명자는 40개 클론을 생성하고 서열화하였다. RT-PCR 생성물을 4개 그룹으로 나누었다: 편집되지 않음(NE), 엑손51-스킵됨(SK), 재프레임됨(RF) 및 프레임 벗어남(OF). (도 11의 C) △Ex50-51 마우스 디스트로핀 하부 밴드의 RT-PCR 생성물의 서열은 엑손 49가 엑손 51을 배제한, 엑손 52에 직접 스플라이스되었음을 입증하였다. 재프레임된 △Ex50(△Ex50-RF)의 RT-PCR 생성물의 서열. 도 11의 C는 나타낸 순서로, 각각 서열 번호: 1015 내지 1022를 개시한다. (도 11의 D) 편집되지 않은 Ex50(NE) 및 △Ex50-RF를 함유하는 상부 밴드로부터의 RT-PCR 생성물의 K 서열 분석. 삽입(녹색으로 강조함) 및 결실(적색으로 나타냄)을 나타내는 RT-PCR 생성물의 서열. n=4. 데이타는 평균 ± SEM을 나타낸다. 도 11의 D는 나타낸 순서로, 각각 서열 번호: 1023 내지 1026을 나타낸다.
도 12의 A 내지 D. AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 근육내 주사는 디스트로핀 발현을 수정한다. (도 12의 A) △Ex50 마우스의 전경골근 근육에 sgRNA 및 Cas9를 암호화하는 AAV9 벡터를 주사하고 디스트로핀에 대한 면역염색에 의해 3주 후 분석하였다. 야생형 대조군(WT-CTL) 마우스 및 △Ex50 마우스 대조군(△Ex50-CTL)에 sgRNA의 부재하에서 AAV9-Cas9 만을 주사하였다. WT-CTL과 비교하여 △Ex50-CTL 마우스 및 처리된 △Ex50 마우스(△Ex50-AAV9-sgRNA-51-SA2 및 AAV9-Cas9)에서 디스트로핀-양성 근섬유의 퍼센트를 각각의 패널에 나타낸다. (도 12의 B) 전경골근 근육의 헤마톡실린 및 에오신(H&E) 염색. (도 12의 C) 근육내 주사 후 3주째에 전경골근 근육내 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. (도 12의 D) 빈쿨린에 대한 표준화 후 블롯으로부터 디스트로핀 발현의 정량화. 별표는 비-특이적인 면역반응성 밴드를 나타낸다. AAV9-sgRNA-51-SA2의 경우 n=5. 기준자: 50μm
도 13. △Ex50 마우스 모델에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 근육내 주사 후 디스트로핀 발현의 구제(rescue). 전체 전경골근 근육의 디스트로핀 면역조직화학. CTL 마우스에게 AAV9-sgRNA-51-SA2의 부재하에 AAV9-Cas9 만을 주사하였다. n=5
도 14. 3주 후 주사된 근육의 조직학적 개선. 헤마톡실린 및 에오신(H&E) 염색에 의한 전경골근 근육의 조직화학.
도 15의 A 및 B. △Ex50 마우스 모델에서 sgRNA의 단일 카피 또는 트리플 카피를 발현하는 상이한 AAV9와 조합된 AAV9-Cas9의 근육내 주사 후 디스트로핀 발현의 구제. (도 15의 A) RNA 폴리머라제 III에 대한 U6, H1 및 7SK 프로모터를 각각 개별적으로 사용하여 단일 카피(AAV9-U6-sgRNA-51-SA2; AAV9-H1-sgRNA-51-SA2; AAV9-7SK-sgRNA-51-SA2) 또는 트리플 카피내에서 sgRNA를 발현시켰다. (도 15의 B) 전체 전경골근 근육의 디스트로핀 면역조직화학. 대조군(CTL) 마우스에게 AAV9-sgRNA-51-SA2의 부재하에서 AAV9-Cas9 만을 주사하였다.
도 16의 A 및 B. △Ex50 마우스내에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전신계 전달 후 4주째에 디스트로핀 발현의 구제. (도 16의 A) AAV9-sgRNA-51의 전신계 주사 후 8주째에 전경골근(TA), 삼두박근, 횡격막 및 심장 근육의 디스트로핀 면역염색. (도 16의 B) TA, 삼두박근, 횡격막 근육 및 심장에서 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. 기준자: 50μm.
도 17의 A 및 B. △Ex50 마우스에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전신계 전달 후 8주째에 디스트로핀 발현의 구제. (도 17의 A) AAV9-sgRNA-51의 전신계 주사 후 8주째에 전경골근(TA), 삼두박근, 횡격막근 및 심장 근육의 디스트로핀 면역염색. (도 17의 B) TA, 삼두박근, 횡격막 근육 및 심장에서 디스트로핀(DMD) 및 빈쿨린(VCL) 발현의 웨스턴 블롯 분석. 각각의 그룹에 대해 n=5. 기준자: 50μm.
도 18의 A 및 B. △Ex50 마우스에서 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전신계 전달 후 4주째에 기능 개선. (도 18의 A) 야생형(WT) 마우스, 대조군 △Ex50 마우스 및 AAV9-sgRNA-51(△Ex50-AAV9-sgRNA-51)로 처리한 △Ex50 마우스를 악력 시험에 적용시켜 근육 성능(힘의 그램)을 측정하였다. (도 18의 B) 혈청 크레아티닌 키나제(CK)를 WT, △Ex50 및 △Ex50-AAV9-sgRNA-51 마우스에서 측정하였다. n=5. 별표는 비-특이적인 면역반응성 밴드를 나타낸다. 데이타는 평균 ± SEM으로 나타낸다.
도 19. △Ex50-MD 개(dog)에서 근육내 주사 후 6주째에 디스트로핀 발현의 수정. 야생형 개(Nathan), 처리되지 않은 △Ex50-MD 개, 및 대측성 주사되지 않은 및 AAV9-Cas9-sgRNA 주사된 2마리의 △Ex50-MD 개(Norman 및 Newton)의 두개 경골근의 디스트로핀 면역조직화학 염색. 기준자: 50μm.
도 20의 A 및 B. △Ex50-MD 개에서 근육내 주사 후 6주째에 디스트로핀 발현의 수정. (도 20의 A) 야생형 개(Nathan), 처리되지 않은 △Ex50-MD 개, 및 대측성 주사되지 않은 및 AAV9-Cas9-sgRNA 주사된 2마리의 △Ex50-MD 개(Norman 및 Newton)의 두개 경골근의 디스트로핀(DMD) 및 빈쿨린(VCL)의 웨스턴 블롯 분석. (도 20의 B) 빈쿨린에 대한 표준화 후 2개의 독립적인 블롯으로부터의 디스트로핀 발현의 정량화.
도 21. △Ex50-MD 개에서 6주 후 주사된 근육의 조직학적 개선. 야생형 개(Nathan), 대측성 주사되지 않은 및 AAV9-Cas9-sgRNA 주사된 △Ex50-MD 개(Norman 및 Newton)의 두개 경골근의 헤마톡실린 및 에오신(H&E) 염색에 의한 조직화학. 기준자: 50 μm.
상세한 설명
DMD는 사람에서 확인된 4,000개 이상의 독립적인 돌연변이를 지닌 신규한 돌연변이 증후군이다(world-wide web at dmd.nl). 대부분의 환자 돌연변이는 핫스팟(hotspot)에서 밀집하는 결실을 포함하므로, 특정의 엑손을 스키핑하기 위한 치료학적 시도를 환자의 거대 그룹에 적용한다. 엑손 스키핑 시도의 근거는 DMD 환자와 베커 근 이영양증(Becker muscular dystrophy: BMD) 환자 사이의 유전적 차이를 기반으로 한다. DMD 환자에서, 디스트로핀 mRNA의 판독 프레임은 붕괴되어 미성숙하게 절두된(truncated), 비-기능성 디스트로핀 단백질을 생성한다. BMD 환자는 판독 프레임을 유지하는 DMD 유전자내 돌연변이를 가짐으로써 내부적으로 결실되지만, 부분적으로 기능성인 디스트로핀의 생산을 허용함으로써 DMD 환자와 비교하여 훨씬 더 온화한 질환 증상을 야기한다.
DMD를 치료하기 위한 조성물 및 방법이 본원에 제공된다. 일부 구현예에서, AAV 작제물이 제공되며, 여기서 AAV 작제물은 각각 DMD 가이드 RNA의 발현을 구동시키는 3개의 프로모터를 암호화하는 핵산을 포함한다. 본원에 개시된 조성물 및 방법을 사용하여, 보다 견고하고 안전한 형태의 게놈 편집을 엑손 50내에서 및 △Ex50-MD 개내에서 결실을 지닌 DMD에 대한 사람화된 마우스 모델에서 달성하였다. 개시내용의 이러한 및 다른 양태는 하기에 재현되어 있다.
I. 듀켄씨 근 이영양증
A. 배경
듀켄씨 근 이영양증(DMD)은 5000명의 소년 중 대략 1명에게 영향을 미치는, 근 이영양증의 열성 X-관련된 형태(X-linked form)이며, 이는 근육 변성 및 조기성숙 사망을 야기한다. 이러한 장애는 사람 X 염색체 상에 위치한 유전자 디스트로핀(참고: 진뱅크(GenBank) 수탁 번호 NC_000023.11)내 돌연변이에 의해 유발되며, 상기 염색체는 단백질 디스트로핀(진뱅크 수탁 번호 AAA53189; 서열 번호: 5)을 암호화하고, 이의 서열은 하기에 재현되어 있다:
사람에서, 디스트로핀 mRNA는 79개의 엑손을 함유한다. 디스트로핀 mRNA는 대안적으로 스플라이싱되어 다양한 동형을 생성하는 것으로 알려져 있다. 예시적인 디스트로핀 동형은 표 1에 나열되어 있다.
[표 1]
쥐 디스트로핀 단백질은 다음의 아미노산 서열(유니프롯(Uniprot) 수탁 번호 P11531, 서열 번호: 869)을 갖는다:
디스트로핀은 세포막의 디스트로글리칸 복합체(DGC)에 대해 구조적 안정성을 제공하는 근 조직내의 중요한 성분이다. 성별 둘 다는 돌연변이를 유발할 수 있으므로, 여성은 질환의 골격근 형태에 거의 영향받지 않는다.
돌연변이는 자연적으로 및 흔히 변한다. 큰 유전적 결실이 사례의 약 60 내지 70%에서 발견되며, 큰 중복은 사례의 약 10%에서 발견되며, 점 돌연변이 또는 다른 작은 변화가 사례의 약 15 내지 30%를 차지한다. 일부 7000개의 돌연변이를 실험한 블라덴(Bladen) 등(Bladen et al. (2015))은 총 5,682개의 큰 돌연변이(전체 돌연변이 중 80%)를 분류하였으며, 이중 4,894(86%)가 결실(1개의 엑손 또는 그 이상)이고 784개(14%)가 중복((1개 엑손 또는 그 이상)이었다. 1,445개의 작은 돌연변이(1개의 엑손보다 작음, 모든 돌연변이의 20%)가 존재하였으며, 이중 358개(25%)는 작은 결실이었고, 132개(9%)는 작은 삽입인 반면, 199개(14%)는 스플라이스 부위에 영향을 미쳤다. 점 돌연변이는 총756개(작은 돌연변이의 52%)이며 726개(50%)는 넌센스 돌연변이(nonsense mutation)이고 30개(2%)는 미스센스 돌연변이(missense mutation)이었다. 최종적으로, 22개(0.3%)의 인트론내(mid-intronic) 돌연변이가 관찰되었다. 또한, 돌연변이는 정지 코돈 판독 치료요법(stop codon read-through therapy(총 돌연변이의 10%) 및 엑손 스키핑 치료요법(엑손 skipping therapy)(결실의 80% 및 총 돌연변이의 55%)을 포함하는 DMD에 대한 신규한 유전 치료요법으로부터 잠재적으로 유리할 수 있는 데이타베이스내에서 확인되었다.
B. 증상
증상은 일반적으로 2 내지 3세 연령 사이의 소년에서 나타나며 영아 초기에서 가시화될 수 있다. 증상이 영아 초기까지 나타나지 않는다고 해도, 실험실 시험은 출생시 활성 돌연변이를 수반한 어린이를 확인할 수 있다. 근육량의 손실과 관련된 다리 및 골반의 진행성 근위근 약화가 처음 관찰된다. 궁극적으로 이러한 약화는 팔, 목, 및 다른 부위로 확산된다. 조기 신호는 가성비대(종아리 및 삼각근의 비대), 낮은 지구력, 및 보조없이 직립의 곤란성 또는 계단 오르기의 불능을 포함할 수 있다. 상태가 진행됨에 따라, 근 조직은 소모성을 경험하며 궁극적으로 지방 및 섬유 조직(섬유증)으로 대체된다. 10세까지, 걷기를 보조하기 위해 브레이스(brace)를 필요로 할 수 있지만 대부분의 환자는 12세까지 휠체어에 의존한다. 말기 증상은 척추의 만곡을 포함하는, 골격 기형을 야기하는 비정상적인 골 발달을 포함할 수 있다. 근육의 진행성 악화로 인하여, 운동 손실이 발생하여, 궁극적으로 마비를 초래한다. 지적 장애가 존재할 수 있거나 존재하지 않을 수 있지만, 존재하는 경우, 어린이가 나이가 들어감에 따라 점진적으로 악화되지는 않는다. DMD로 고통받은 남성에 대한 평균 기대 수명은 대략 25세이다.
진행성, 신경근 장애인, 듀켄씨 근 이영양증의 주요 증상은 근 소모와 관련된 근육 약화이며, 수의근, 특히, 엉덩이, 골반 부위, 넙적다리, 어깨, 및 종아리의 수의근이 처음으로 영향을 받는다. 근육 약화는 또한 후에, 팔, 목, 및 다른 부위에서 발생한다. 종아리는 흔히 비대해진다. 증상은 일반적으로 6세 이전에 나타나며 영아 초기에 나타날 수 있다. 다른 육체적 증상은 다음과 같다:
1. 부자연스러운 방식의 걷기, 걸음(stepping), 또는 달리기 - (환자는 증가된 종아리 근 긴장으로 인하여, 이들의 전족부에서 걷는 경향이 있다. 또한, 발가락 걷기(toe walking)가 무릎 신근 약화에 대한 보상 적응이다.)
2. 빈번한 넘어짐.
3. 피로.
4. 운동 기술(달리기, 호핑(hopping), 점핑(jumping))의 곤란.
5. 가능하게는 엉덩이-굴근의 단축을 초래하는, 요추 과전만증(lumbar hyperlordosis). 이는 전반적인 자세 및 걷기, 걸음, 또는 달리기 방식에 영향을 미친다.
6. 아킬레스 건 및 슬건(hamstring)의 근 수축은 연결 조직내 단축된 근 섬유 및 피브로스(fibrose)로 인하여 기능성을 손상시킨다.
7. 점진적인 걷기 곤란성.
8. 근 섬유 변형.
9. 혀 및 종아리 근육의 가성비대(비대). 근 조직은 궁극적으로 지방 및 연결 조직으로 대체되므로, 용어 가성비대가 된다.
10. 고 위험의 신경행동 장애(예컨대, ADHD), 학습 장애(난독증), 및 특수한 인지 기술(특히, 단기간 언어 기억)에 있어서 비-진행성 약화, 이는 뇌 속에 디스트로핀의 부재 또는 기능장애의 결과인 것으로 여겨진다.
11. 걷기 능력의 궁극적인 상실(일반적으로 12세까지).
12. 골격 변형(일부 경우에 척추측만증 포함).
13. 눕거나 앉는 자세로부터 곤란한 일어나기.
이러한 상태는 환자가 자신의 제1 단계에 들어가는 순간으로부터 임상적으로 관찰될 수 있으며, 걷는 능력은 일반적으로 소년이 9세 내지 12세 사이에서 완전히 와해된다. DMD로 고통받은 대부분의 남성은 21세까지 필수적으로 "목 아래로부터 마비"된다. 근 소비는 다리 및 골반에서 시작한 후, 어깨 및 목의 근육으로 진행하고, 이후, 팔 근육 및 호흡 근육의 손실로 이어진다. 종아리 근육 비대(가성비대)가 매우 명백하다. 심근증이 특히 (확장된 심근병증) 일반적이지만, 울혈성 심부전 또는 부정맥(불규칙적인 심박동)은 단지 가끔 일어난다.
양성 고워스 신호(Gowers' sign)는 하체 근육의 보다 심각한 손상을 반영한다. 어린이는 상체를 사용하여 스스로 일어나는 것을 돕는다: 첫째로 자신의 팔 및 무릎에 의존하여 일어난 후, 자신의 손으로 다리를 들어서 똑바로 일어남으로써 "걷는다". 고통을 받는 어린이는 일반적으로 보다 더 쉽게 피곤해하며 이들의 또래보다 전반적으로 힘이 거의 없다. 혈류 속의 크레아틴 키나제(CPK-MM) 수준이 극도로 높다. 근전도검사(EMG)는 약화가 신경에 대한 손상에 의해서라기 보다는 근육 조직의 파괴에 의해 유발됨을 나타낸다. 유전적 시험은 Xp21 유전자내 유전적 오류를 나타낼 수 있다. 근육 생검(면역조직화학 또는 면역블롯팅) 또는 유전적 시험(혈액 시험)은 유전적 시험에 있어서의 개선이 종종 이를 불필요하게 하지만, 디스트로핀의 부재를 확인한다.
DMD 환자는 다음으로부터 고통을 받을 수 있다:
1. 비정상적인 심근(심근병증).
2. 울혈성 심부전 또는 불규칙적인 심박동(부정맥).
3. 심장 및 등의 기형(척추측만증).
4. 종아리, 궁둥이, 및 어깨의 비대 근육(대략 4 또는 5세). 이러한 근육은 궁극적으로 지방 및 연결 조직으로 대체된다(가성비대).
5. 근육량의 손실(위축증).
6. 발뒷꿈치, 다리에서의 근 수축.
7. 근육 변형.
8. 폐렴 및 폐내로 유입되는 음식물 또는 유체의 삼킴을 포함하는, 호흡 장애(질환의 마지막 단계).
C. 원인
듀켄씨 근 이영양증(DMD)은 X 염색체의 짧은 아암(short arm)에 위치하는, 유전자자리 Xp21에서 디스트로핀 유전자의 돌연변이에 의해 유발된다. 디스트로핀은 많은 소단위를 함유하는 단백질 복합체를 통해, 기본적인 기저 라미나(underlying basal lamina)(세포외 매트릭스)에 각각의 근섬유의 세포골격을 연결시키는데 관여한다. 다스트로핀의 부재는 과도한 칼슘이 근섬유막(세포 막)을 침투하도록 한다. 칼슘 및 신호전달 경로(signaling pathway)에 있어서의 변경은 물이 미토콘드리아내로 도입되도록 하며, 미토콘드리아는 이후 파열한다.
골격근 이영양증에서, 미토콘드리아 기능장애는 스트레스-유도된 세포질성 칼슘 신호의 증폭 및 스트레스-유도된 반응성-산소종(ROS) 생산의 증폭을 일으킨다. 몇가지 경로를 포함하고 명확하게 이해되지 않는 복잡한 캐스캐이딩(cascading) 공정에서, 세포내 증가된 산화 스트레스는 근섬유막을 손상시키고 최종적으로 세포의 사멸을 야기시킨다. 근섬유는 괴사를 겪으며 궁극적으로 지방질 및 연결 조직으로 대체된다.
DMD는 X-연결된 열성 패턴으로 유전된다. 여성은 전형적으로 질환에 대한 매개체일 것이지만 남성은 영향을 받지 않을 것이다. 전형적으로, 여성 매개체는 그들이 영향받은 아들을 가질 때까지 돌연변이를 지니고 있는지 인지하지 못할 것이다. 매개체 엄마의 아들은 그의 엄마로부터 결함이 있는 유전자를 유전시킬 확률이 50%이다. 매개체 엄마의 딸은 매개체가 될 확률이 50%이고, 유전자의 2개의 정상 카피를 가질 확률이 50%이다. 모든 경우에서, 영향받지 않은 아버지는 정상의 Y를 그의 아들에게 전달하거나 정상의 X를 그의 딸에게 전달할 것이다. DMD와 같은, X-연결된 열성 조건의 여성 매개체는 X-불활성화의 이들의 패턴에 따른 증상을 나타낼 수 있다.
프레임 엑손 외부의 병치(juxtaposing)에 의해 개방 판독 프레인(ORF)을 파괴하는, 사람 DMD 유전자의 엑손 51 앞쪽의 엑손 결실은 사람 DMD 돌연변이의 가장 일반적인 유형을 나타낸다. 엑손 51의 스키핑은 원칙적으로 엑손 결실된 DMD 환자의 13%에서 DMD ORF를 회복한다.
듀켄씨 근 이영양증은 5000명의 남성 유아 중 1명의 발생율을 갖는다. 디스트로핀 유전자내 돌연변이는 상속될 수 있거나 생식세포 전달 동안 자발적으로 발생할 수 있다. 예시적이지만 비-제한적인 돌연변이 및 상응하는 모델의 표는 하기에 나타낸다:
[표 2]
D. 진단
유전 상담은 장애의 가계력을 지닌 사람들을 상담한다. 듀켄씨 근 이영양증은 임신 동안 수행된 유전 연구에 의해 약 95% 정확도로 검출될 수 있다.
DNA 시험. 디스트로핀 유전자의 근육-특이적인 동형은 79개의 엑손으로 구성되며, DNA 시험 및 분석은 일반적으로 영향받은 엑손 또는 엑손들의 특이한 유형의 돌연변이를 확인할 수 있다.
근육 생검. DNA 시험이 돌연변이를 발견하지 못한 경우, 근육 생검 시험을 수행할 수 있다. 근 조직의 작은 샘플을 추출(일반적으로 침(needle) 대신에 스캘펠(scalpel)을 사용)하고 디스트로핀의 존재를 나타내는 염료를 적용한다. 단백질의 완전한 부재는 상태를 나타낸다.
과거 수년에 걸쳐 이러한 상태를 유발하는 많은 돌연변이를 보다 더 검출하는 DNA 시험이 개발되어 왔으며, 근육 생검은 듀켄의 존재를 확인하기 위해 자주 요구되지는 않는다.
태아 검사. DMD는 X-연결된 열성 유전자에 의해 운반된다. 남성은 단지 하나의 X 염색체를 가지므로, 돌연변이된 유전자의 하나의 카피는 DMD를 유발할 것이다. 아버지는 이들의 아들에게 X-연결된 특성을 이전시킬 수 없으므로, 돌연변이는 어머니에 의해 이전된다.
어머니가 매개체인 경우, 및 따라서, 그녀의 2개의 X 염색체 중 하나가 DMD 돌연변이를 갖는 경우, 여성 아이가 그녀의 2개의 X 염색체 중 하나로서 이러한 돌연변이를 유전시킬 것이며, 매개체가 될 것이다. 남성 어린이가 그의 하나의 X 염색체로서 이러한 돌연변이를 유전시키고 따라서 DMD를 가지게 될 확률은 50%이다.
태아 검사는 이들의 미출생 아이가 가장 흔한 돌연변이를 가지고 있는지를 물을 수 있다. DMD에 관여하는 많은 돌연변이가 존재하며, 일부는 확인되어 있지 않으므로, 태아 검사는 DMD를 지닌 가족 구성원이 확인된 돌연변이를 갖는 경우에유전 시험 만을 작업한다.
침습적 시험(invasive testing) 전에, 태아 성별의 결정은 중요하다; 남성은 때때로 이러한 X-연결된 질환에 의해 영향받지만, 여성 DMD는 극도로 드물다. 이는 16주째에 초음파 스캔에 의해서 또는 보다 최근에는 자유 태아 DNA 시험(free fetal DNA testing)에 의해 달성할 수 있다. 융모막 융모 샘플링(Chorion villus sampling: CVS)을 11 내지 14주째에 수행할 수 있으며, 1%의 유산 위험성을 갖는다. 양수천자를 15주 후 수행할 수 있으며 0.5%의 유산 위험성을 갖는다. 태아 혈액 샘플링은 약 18주째에 수행할 수 있다. 명확하지 않은 유전 시험 결과의 경우에 다른 선택사항은 태아 근육 생검이다.
E. 치료
현재 DMD의 치유는 존재하지 않으며, 진행중인 의학적 요구는 규제 기관에 의해 인식되어 왔다. 특정의 돌연변이에 대한 엑손 스키핑 치료를 사용한 1 내지 2a 상 시험이 위축을 중지시키고 걷기에 있어서 작은 임상적 개선을 생성하였다. 치료는 일반적으로 증상의 발생을 제어함으로써 삶의 질을 극대화하는데 목표를 두고 있으며 다음을 포함할 수 있다:
1. 코르티코스테로이드, 예를 들면, 프레드니솔론 및 데플라자코트는 에너지 및 힘을 증가시키고 일부 증상의 중증도를 지연시킨다.
2. 무작위적인 제어 시험은 베타-2-효능제가 근육 강도를 증가시키지만 질환 진행을 변형시키지 않음을 나타내었다. 베타2-효능제에서 대부분의 RCT에 대한 후속 조치 시간은 단지 대략 12개월이므로 이러한 시간 프레임을 초과하여 추론될 수 없다.
3. 수영과 같은, 가볍고, 충돌이 없는(non-jarring) 육체 활동이 추천된다. 비활동(예를 들면, 장기 요양)은 근육 질환을 악화시킬 수 있다.
4. 물리적 요법은 근육 강도, 유연성, 및 기능을 유지시키는데 도움이 된다.
5. 정형외과 기기(예를 들면, 브레이스(brace) 및 휠체어)는 이동성 및 자가-보호능을 개선시킬 수 있다. 수면 동안 적소에서 발목을 유지시키는 형태-고정 제거가능한 다리 브레이스(form-fitting removable leg brace)는 구축(contracture)의 발생을 지연시킬 수 있다.
6. 질환이 진행됨에 따라 적절한 호흡 지지대가 중요하다.
DMD에 대한 종합적인 다영역(multi-disciplinary) 보호 표준/안내서가 질병관리예방 센터(Centers for Disease Control and Prevention: CDC)에 의해 개발되었으며, www.treat-nmd.eu/dmd/care/diagnosis-management-DMD에서 이용가능하다.
DMD는 일반적으로 이들의 전문이 참고로 포함된, Bushby et al., Lancet Neurol., 9(1): 77-93 (2010) 및 Bushby et al., Lancet Neurol., 9(2): 177-198 (2010)에 요약된 바와 같이, 5 단계를 통해 진행한다. 잠복기 단계 동안에, 환자는 전형적으로 발달 지연을 나타내지만, 보행 장애는 없다. 조기 보행 단계 동안에, 환자는 전형적으로 고워 신호(Gowers' sign), 동요성 보행(waddling gait), 및 발가락 걷기를 나타낸다. 말기 보행 단계 동안에, 환자는 전형적으로 점점 더 힘든 보행을 나타내고 계단을 오르고 바닥을 올라가는 능력을 상실하기 시작한다. 조기 비-보행 단계 동안에, 환자는 전형적으로 일정 시간 동안 자가-추진(self-propel)할 수 있고, 자세를 유지할 수 있으며, 척추 측만증으로 발달할 수 있다. 말기 비-보행 단계 동안에, 상체 기능 및 자제 유지가 크게 제한된다.
일부 구현예에서, 치료는 질환의 잠복 단계에서 시작된다. 일부 구현예에서, 치료는 조기 보행 단계에서 시작된다. 일부 구현예에서, 치료는 말기 보행 단계에서 시작된다. 구현예에서, 치료는 조기 비-보행 단계 동안에 시작된다. 구현예에서, 치료는 말기 비-보행 단계 동안에 시작된다.
1. 물리적 치료요법
물리적 치료요법은 환자가 이들의 최대 물리적 잠재능에 도달할 수 있도록 하는 것과 관련된다. 이의 목표는:
1. 경우에 따라 스트레치(stretch) 및 운동 프로그램을 개발함으로써 구축(contracture) 및 기형의 발달을 최소화시키고,
2. 브레이싱(bracing) 및 내구성 의약 장치를 추천함으로써 물리적 특성의 다른 2차적인 합병증을 예상하고 최소화하며,
3. 호흡 기능을 모니터링하고 호흡 연습으로 보조하는 기술 및 분비물을 세정하는 방법을 충고하는 것이다.
2. 호흡 보조
조절가능한 용적(양)의 공기를 각각의 숨(breath)으로 사람에게 전달하는 현대의 "용적 환기기(volume ventilator)/호흡기(respirator)"는 호흡 문제와 관련된 근 위축증을 지닌 사람의 치료시 가치가 있다. 산소호흡기는 이를 통해 공기가 직접 전달되는 침습성 기관내 또는 기관절개술 튜브를 필요로 할 수 있지만, 일부 사람들의 경우 안면 마스크 또는 마우스피스(mouthpiece)를 통한 비-침습성 전달이 충분하다. 긍정적인 기도압 기기(positive airway pressure machine), 특히 바이-레벨(bi-level)의 것은 때때로 후자의 방식으로 사용된다. 호흡 장치는 이동성을 위해 외부 배터리를 지닌 전동 휠체어의 바닥 또는 후면위의 통풍 트레이(ventilator tray) 위에 용이하게 고정할 수 있다.
통풍기 처리는 호흡 근육이 붕괴되기 시작할 수 있는 경우 10대 중반 내지 후반에 시작할 수 있다. 폐활량이 정상의 40% 이하로 강하하게 되면, 용적 환풍기/호흡기를 수면 시간 동안 사용할 수 있으며, 이때에 사람은 대부분 환기 하에 존재하여야 하는 경향이 있다("폐포저환(hypoventilating)"). 수면 동안 폐포저환(hypoventilation)은 산소측정법 연구 및 모세 혈관 가스를 사용한 수면 장애의 절저한 병력에 의해 측정된다(참고: 폐 기능 시험(Pulmonary Function Testing)). 기침 보조 장치는 포지티브 공기압, 이후에 점액을 증가시키기 위한 네가티브 압력을 사용한 폐의 과다팽창에 의해 폐내에 과도한 점액으로 도움을 줄 수 있다. 폐활량이 정상의 30 퍼센트 미만으로 지속적으로 강하하는 경우, 용적 환기기/호흡기가 또한 추가의 보조를 위해 낮동안 필요할 수 있다. 개인은 필요한 경우 낮 동안 환기기/호흡기를 사용하여 시간의 양을 증가시킬 것이다.
F. 예후
듀켄씨 근 이영양증은 모든 모든 수의근에 영향을 미치고 말기 단계에 심장 및 호흡 근육에 관여하는 진행성 질환이다. 수명 예측은 현재 대략 25세인 것으로 추정되고 있지만, 이는 환자에 따라 변한다. 의약에서의 최근의 진전은 고통을 받는 사람의 수명을 연장시키고 있다. 모든 근육 질환에 초점을 맞추고 있는 선도하는 영국 자선단체(leading UK charity)인, 근 이영양증 캠페인(Muscular Dystrophy Campaign)은 "높은 표준의 건강 관리로, 보호듀켄씨 근 이영양증을 지닌 어린 남자는 흔히 이들의 30대 까지 잘 살고 있다"라고 기술하고 있다.
드믄 경우에, DMD를 지닌 개인은 휠체어 및 침대, 호흡 보조기(ventilator support)(기관절개술 또는 마우스피스를 통한), 기도 세정, 및 필요한 경우, 심장 의약의 사용으로 40대 또는 50대 초반까지 생존하는 것으로 관찰되었다. 만년 케어(later-life care)를 위해 필요한 후원의 조기 계획은 DMD를 지닌 개인 삶에 있어서 보다 긴 지속성을 나타내었다.
기이하게도, 듀켄씨 근 이영양증의 mdx 마우스 모델에서, 디스트로핀의 결핍은 증가된 칼슘 수준 및 골격근 근괴사와 관련되어 있다. 내재 후두근(intrinsic laryngeal muscle: ILM)은 보호되어 있으며 근괴사를 겪지 않는다. ILM은 다른 근육과 비교하여 칼슘 변화를 취급하는 보다 우수한 능력을 제안하는 칼슘 조절 시스템 프로파일을 가지고 있으며, 이는 이들의 독특한 병리생리학적 특성에 대한 기계론적 통찰력을 제공할 수 있다. ILM은 다양한 임상 시나리오에서 근 소모성의 예방 및 치료를 위한 새로운 전략의 개발을 촉진시킬 수 있다.
II. 게놈 편집으로부터 유리한 다른 질환
DMD의 치료에 있어서의 적용을 발견한 것 외에도, 본 발명자의 다중-가이드 시도는 이러한 개입이 기본 원인의 유전적 결합의 수정을 야기할 수 있는 다른 질환 상태에 유리하게 적용될 수 있다. 이들 중 일부는 하기에 간략하게 기술된다.
지대 근 이영양증(Limb Girdle Muscular Dystrophy). 지대 근 이영양증(limb-girdle muscular dystrophy: LGMD) 또는 에르브 근 이영양증(Erb's muscular dystrophy)은 희귀한 근 이영양증의 유전적으로 및 임상적으로 이질성인 그룹이다. 이는 주로 엉덩이 및 어깨 근육에 영향을 미치는 진행성 근육 소모를 특징으로 한다. LGMD는 상염색체 패턴의 유전성을 가지며 현재 알려진 치료는 없다. 지대 근 이영양증(LGMD)을 지닌 개인의 증상은 일반적으로 걷기, 계단의 오르내림 및 의자에서 일어나기에 곤란성을 갖는다. 규칙적으로 위로 굽이거나 아래로 굽히는 것의 곤란성이 또한 일반적이다. 특정 물체를 들어올리는 것의 곤란성 뿐만 아니라 팔을 머리 밖으로 또는 위로 올리는 것의 곤란성 또한 LGMD의 일반적인 표시이다. 궁극적으로 걷고/뛰는 능력이 악화된다.
진행이 일부 환자에서는 다른 이들보다 더 신속하지만, 질환은 필연적으로 시간이 경과함에 따라 악화한다. 궁극적으로, 질환은 얼굴에 위치한 것과 같은 다른 근육에 영향을 미칠 수 있다. 질환은 일반적으로 증상이 발병한 몇년 안에 휠체어에 의지하게 되지만, 환자간에 가변성이 크며, 일부 환자는 이동성을 유지한다.
근육 약화는 일반적으로 대칭적이고, 몸 중심부 쪽이며, 서서히 진행한다. 대부분의 경우에, 통증은 LGMD으로는 나타나지 않고 정신 기능도 영향받지 않는다. LGMD는 어린 시기, 청소년기, 젊은 성년기 또는 심지어 그 후에 시작될 수 있으며, 발병 나이는 일반적으로 10 내지 30세이다. 여성 및 남성 둘 다가 동등하게 영향을 받으며, 지대 근 이영양증이 어린 시기에 시작되면 진행은 보다 빠르고 질환이 보다더 불능인 것으로 여겨진다. 장애가 청소년기 또는 성년에 시작되면 질환은 일반적으로 심각하지 않고 보다 느리게 진행된다. 표시에서 감각 신경병증 또는 자율신경계 또는 교감 신경 기능장애는 없다.
LGMD의 유전학의 측면에서, 이는 우성 또는 열성의 유전적 결함으로 유전될 수 있지만, 유전된 장애이다. 결함의 결과는 근육이 정상적인 근육 기능에 필요한 특정의 단백질을 적절하게 형성할 수 없다는 것이다. 몇가지 상이한 단백질이 영향받을 수 있으며, 부재하거나 결함이 있는 특정의 단백질은 특정 유형의 근 이영양증을 확인한다. LGMD에서 영향받은 단백질 중에는 α, β, γ 및 δ 사르코글리칸(sarcoglycan)이 있다. 사르코글리카노패씨(sarcoglycanopathy)는 유전자 치료요법으로 가능하게 처리할 수 있다.
다이스페리돌연변이증(Dysferlinopathy). 다이스페린돌연변이증은 다이소페린 유전자내 돌연변이로 인한 기능성 다이스페린 단백질의 결핍에 의해 유발된 상염색체 열성 신경근육 장애이다. 다이스페린돌연변이증은 점진적인 근육 소모를 특징으로 하며 가장 흔하게는 진단시 근육 개입의 초기 패턴에 따라, 지대 근 이영양증 2B형(LGMD2B) 또는 미요시형 근병증(Miyoshi muscular dystrophy) 1(MMD1; 원위 근 이영양증)로 임상적으로 진단된다. 다이스페린돌연변이증은 희귀 질환이며, 이의 정확한 발병률은 아직 측정되지 않았다.
다이스페린돌연변이증의 증상은 일반적으로 16세와 25세 사이의 초기 성년에서 나타나며 주로 사지 및 지대(엉덩이 및 어깨)의 골결근에 영향을 미치며, 심장 및 횡격막과 같은 주요 근육은 영향받지 않는 채로 남는다. 대부분의 다이스페린돌연변이증 환자는 진단받은지 10 내지 20년 내에 걸어다닐 수 없게 되지만, 기대 수명은 정상이다. 질환의 발병 및 진행 나이에 있어서 큰 다양성이 존재한다.
LGMD2B 및 MMD1이 둘 다 다이스페린 결핍증에 의해 유발되지만, LGMD2B의 진단은 약화가 근위 근육(넙적다리 및 상부 팔)에서 초기에 존재는 경우 이루어지나, MMD1의 진단은 약화가 초기에 원위 근육(종아리 및 하부 팔)에 존재하는 경우에 이루어진다. 둘 다의 경우에서, 약화는 궁극적으로 원위 및 근위 근육 둘 다를 포함하도록 진행된다. LGMD2B 및 MMD1 둘 다는 진단하기 매우 어려우며, 환자는 흔히 다이스페린돌연변이증으로 성공적으로 진단되기 전에 여러번 오진된다.
"다이스페린돌연변이증"은 단순하게 다이스페린 단백질인, LGMD2B의 부재를 지칭하며 미요시형 근병증 1은 다이스페린 유전자내 돌연변이가 검출될 수 있는 경우에만 확인된 진단이다. 환자는 다이스페린돌연변이증에 대해 특이적인 임상 연구 및 시험에 참여하기 위한 유전 진단을 받는 것이 필수이다. 제인 파운데이션(Jain Foundation)은 지대 근 이영양증을 지닌 환자가 시험을 체계화하고 비용을 충당함으로써 유전 진단을 달성하도록 하는데 돕는 비-영리단체(non-profit family organization)(www.jain-foundation.org)이다.
티틴 근질환(Titin Myopathy). 코넥틴으로 또한 공지된 티틴은 사람에서 TTN 유전자에 의해 암호화된 단백질이다. 티틴은 근육의 수동적 탄력성에 관여하는 분자 스프링으로서 기능하는, 길이가 1 μm를 초과하는 거대 단백질이다. 이는 구조화되지 않은 펩타이드 서열에 의해 연결된 244개의 개별적으로 폴딩된 단백질 도메인으로 구성된다. 이러한 도메인은 단백질이 스트레치된 경우 폴딩되어 있지 않으며 긴장 상태가 제거된 경우 재폴딩(refolding)된다.
티틴은 가로무늬 근 조직의 수축에 중요하다. 이는 근절(sarcomere)에서 Z 라인을 M 라인에 연결시킨다. 단백질은 Z 라인에서의 힘 전달 및 I 밴드 영역에서의 긴장 상태에 기여한다. 이는 긴장상태에서 근절의 운동 범위를 제한하므로, 근육의 수동적 강직에 기여한다. 상이한 유형의 근육(예컨대, 심장 및 골격) 사이의 티틴의 서열내 변이는 이러한 근육의 기계적 특징에 있어서의 차이와 관련되어 왔다.
티틴은 가로무늬근의 큰 풍부한 단백질이다. 티틴의 주요 기능은 두꺼운 필라멘트를 안정화하고 이를 얇은 필라멘트들 사이의 중앙에 두어, 근절의 오버스트레칭(overstretching)을 방지하고, 이것이 스트레치된 후 스프링과 같이 근절을 되돌린다(recoil). N-말단 Z-디스크 영역 및 C-말단 M-라인 영역은 근절의 Z-라인 및 M-라인 각각에 결합함으로써, 단일 티틴 분자는 근절의 길이의 1/2에 걸쳐 존재하도록 한다. 티틴은 또한 근육-관련된 단백질에 대한 결합 부위를 함유함으로써 이는 근 세포내에서 수축성 기계장치의 조립을 위한 부착 주형(adhesion template)으로서 제공된다. 이는 또한 염색체에 대한 구조 단백질로서 확인되었다. 고려할만한 가변성은 티틴의 I-밴드, M-라인 및 Z-디스크 영역에 존재한다. I-밴드 영역내 가변성은 상이한 티틴 동형의 탄력성에 있어서의 차이에 기여하므로, 상이한 근육 유형의 탄력성에 있어서의 차이에 기여한다. 확인된 많은 티틴 변이체 중에서, 완전한 전사체 정보가 이용가능한 5개가 기재되어 있다.
이러한 유전자의 특수한 긴 서열내 어디에서도 돌연변이는 예비성숙 정지 코돈 또는 다른 결함을 유발할 수 있다. 티틴 돌연변이는 조기 호흡 부전을 지닌 유전성 근육병증, 치명적인 심근증을 지닌 조기 발병 근질환, 심장 질환을 지닌 코어 근질환(core myopathy), 중심핵 근육병증, 지대 근 이영양증 2J형, 가족 확장형 심근병증 9, 비대 심근병증 및 경골 근 이영양증과 관련되어 있다. 추가의 연구는 또한 임의의 이영양증 또는 근병의 비 유전적으로 연결된 형태는 TTN 유전자에서의 돌연변이에 의해 유발되는 것으로부터 안전하게 배제될 수 있다. 확장성 심근병증 환자에서의 절두 돌연변이(truncating mutation)는 A 영역내에서 가장 흔하게 발견되며; 상부 I 영역내 절두가 A 영역의 해독을 전체적으로 방지하는 것으로 예측될 수 있지만, 대안적인 스플라이싱은 조숙 정지 코돈에 직면하지 않는 일부 전사체를 생성하며, 이의 효과를 완화시킨다. 티틴에 대한 자가항체는 자가면역 질환 피부경화증을 지닌 환자에서 생산된다.
리아노딘 수용체내 돌연변이(슈도엑손을 지닌 돌연변이)에 의해 유발된 선천성 근질환 "중심 코어 질환". 중심 코어 근질환으로 또한 공지된 중심 코어 질환(CCD)은 상염색체 우성의 선천성 근질환(선천적인 근육 장애)이다. 이는 1956년에 샤이(Shy) 및 마기(Magee)에 의해 최초로 기술되었다. 이는 현미경 하에서 근원섬유의 외관에 의해 특징화된다.
CCD의 증상은 다양하지만, 일반적으로 출생시 긴장 저하(감소된 근 긴장), 어린이 발달시 가벼운 지연(사례들 사이에서 크게 변할 수 있음), 안면 근육의 약화, 및 척추 측만증 및 고관절 탈구와 같은 골격 기형을 포함한다.
증상은 출생시 존재할 수 있거나 삶의 임의의 단계에서 나타낼 수 있다. 성년이 중년이 될 때까지 증상을 보이지 않은 사람의 수가 증가하는 것으로 여겨진다. 일반적으로 진행성은 아니지만, 다시 징후학의 느린 임상적으로 유의적인 진행을 경험하는 사람의 수가 증가하는 것으로 여겨진다. 이러한 사례는 가설적으로 리아노딘 수용체 기능부전의 많은 수의 유전자 돌연변이에 기인하며 연속적인 연구로 실제 임상 변이체임이 밝혀질 수 있다.
진단은 근육으로부터의 생검(조직 샘플)에서 대표적인 증상 및 외관의 조합에 대해 이루어진다. 명칭은 광학 현미경에서 생검의 대표적인 외관으로부터 유래하며, 여기서 근육 세포는 미토콘드리아 및 특정 효소가 없는 코어를 갖는다. 호흡 부전은 작은 비율의 사례에서 발달한다. 크레아틴 키나제 및 근전도 검사(EMG)는 정상인 경향이 있다.
중심 코어 질환은 상염색체 우성 양식으로 유전된다. 대부분의 사례는 리아노딘 수용체 1형(RYR1) 유전자에서 입증가능한 돌연변이를 가지며, 이는 흔히 드 노보(de novo)(새로이 발달한)이다. CCD를 지닌 사람은 일반적으로 마취되는 경우 악성 고열(MH)의 위험이 있다.
특수한 치료는 존재하지 않지만 마취제를 트리거링(triggering)하는 것은 피해지며 RYR1 돌연변이는 친척들을 MH에 대해 민감하도록 할 수 있으므로 친척들을 RYR1 돌연변이에 대해 스크리닝한다.
근긴장성 이영양증. 근긴장성 이영양증은 근육 기능에 영향을 미치는 장기간의 유전 장애이다. 증상은 점진적으로 악화되는 근육 손실 및 약화를 포함한다. 근육은 종종 수축하며 완화될 수 없다. 다른 증상은 백내장, 지적 장애, 및 심장 전도 문제를 포함할 수 있다. 남성에서는 조기 대머리일 수 있고 아이를 가질 수 없다.
근긴장성 이영양증은 전형적으로 개인의 부모로부터 유전되는 상염색체-우성 장애이다. 2개의 주요 유형이 존재한다: DMPK 유전자내 돌연변이에 기인한 1형(DM1) 및 CNBP 유전자내 돌연변이로 인한 2형(DM2). 장애는 일반적으로 각각의 세대에서 악화된다. DM1의 유형은 출생시 명확해질 수 있다. DM2는 일반적으로 보다 가볍다. 이들은 근 이영양증의 유형들이다. 진단은 유전 시험으로 확인된다.
치유법은 없다. 치료는 브레이스 또는 휠체어, 심장박동기, 및 비-침습성 양압 환기법(non-invasive positive pressure ventilation)을 포함할 수 있다. 의약 멕실레틴 또는 카바마제핀이 때때로 도움이 된다. 통증은 발생하는 경우 트리사이클릭 항우울제 및 비스테로이드성 소염 약물(NSAID)로 치료할 수 있다.
근긴장성 이영양증은 세계적으로 8,000명의 사람 중 1명 이상에게 영향을 미친다. 근긴장성 이영양증은 어떠한 나이에서도 발생할 수 있지만, 전형적으로 20대 및 30대에서 발병한다. 이는 성년에서 시작하는 근 이영양증의 가장 일반적인 형태이다. 이는 1909년에 최초로 기술되었으며 1형의 근본 원인은 1992년에 측정되었다.
증상 및 신호의 표시는 형태(DM1/DM2), 증증도 및 심지어 특수한 DM2 표현형에 의해 현저하게 변한다. DM2에 대한 DM1 증상은 실행 기능(예컨대, 조직화, 집중력, 단어-찾기) 및 과다수면과 함께 문제점을 포함한다. 수행 비정상은 DM2보다 DM1에서 보다 일반적이지만, 모든 사람들은 매년 ECG를 받도록 권고받는다. 유형 둘 다는 또한 인슐린 내성과 관련되어 있다. 근긴장성 이영양증은 청색 점 외관을 지닌 피질 백내장 또는 후 낭밑 백내장을 가질 수 있다.
DM2는 일반적으로 DM1보다 더 가벼우며, 일반적으로 보다 적은 DM2 사람이 DM1 사람보다 보조 장치를 필요로 한다. 또한, DM1에서 아기에게 영향을 미치는 심각한 선천적 형태는 DM2에서 발견되지 않았으며 증상의 조기 발병은 의학 문헌에서 보다 젊은 사람에서 나타나는 것으로 드믈게 인식되어 있다.
증상은 영아로부터 성인까지 임의의 시기에 나타날 수 있다. DM은 손, 발, 목, 또는 얼굴의 근육에서 일반적으로 시작하는, 일반적인 약화를 유발한다. 이는 심장을 포함하는, 다른 근육 그룹을 포함하도록 서서히 진행한다. DM은 또한 광범위한 다른 기관 시스템에도 영향을 미친다.
근긴장 이영양증은 상염색체 우성 패턴으로 유전되는 유전 상태이므로 평균적으로 매개체 자식의 50%에 걸쳐 전달될 것이다. 근긴장 이영양증은 몇가지 트리뉴클레오타이드 반복 장애 중 하나이다. DNA의 특정 부위는 2개 또는 3개의 뉴클레오타이드의 반복된 서열을 갖는다.
근긴장 이영양증(DM)은 유전된 질환이다. DM의 심각한 형태인, 선천적인 근긴장성 이영양증은 DM을 가진 어머니의 신생아에서 나타날 수 있다. 선천성 근긴장 이영양증은 비교적 드믈다고 일컬어지지만, 모체 유전자를 통해 유전될 수 있다. 선천성은 상태가 출생으로부터 존재함을 의미한다.
DM1에서, 영향받은 유전자는 DMPK으로 불리며, 이는 골격근내에서 주로 발현된 단백질인, 근긴장 이영양증 단백질 키나제를 암호화한다. 유전자는 19번 염색체의 롱 아암(long arm)에 위치한다.
DM1에서, DMPK 유전자내 사이토신-티민-구아닌(CTG) 트리플 반복물(triplet repeat)의 확장이 존재한다. 5개와 37개 사이의 반복물은 정상인 것으로 고려되지만, 38개와 49개 사이의 반복물을 지닌 개인은 전-돌연변이(pre-mutation)를 가지는 것으로 고려되고 어린이가 추가로 확장된 반복물을 지니므로, 따라서 증후성 질환을 가질 위험이 있는 것으로 고려된다. 50개 이상의 반복물을 지닌 개인은 일부 주목된 예외를 제외하고는, 거의 변함없이 증후성이다. 보다 긴 반복물은 일반적으로 조기 발병 및 보다 심각한 질환과 관련되어 있다.
37개 이상의 반복물을 지닌 DMPK 대립형질은 불안정하며 추가의 트리뉴클레오타이드 반복물은 유사분열 및 감수분열시 세포 분열 동안 삽입될 수 있다. 결과적으로, 전돌연변이 또는 돌연변이를 지닌 개인의 어린이는 이들의 부모보다 더 긴 DMPK 대립형질을 물려받으므로 영향받기가 더 쉬운 경향이 있거나, 예상되는 것으로서 알려진 현상인, 상태의 조기 발생 및 보다 큰 중증도를 나타낸다. 흥미롭게도, 상태의 부계 전달(paternal transmission)은 아마도 확장된 반복물을 지닌 정자에 대한 선택 압력으로 인하여, 매우 특수하지만, 기대는 모계 유전의 경우에서보다 덜 심각한 경향이 있다.
확장된 트리뉴클레오타이드 반복물 영역으로부터의 RNA는 C-G 염기쌍 사이의 강력한 수소 결합으로 인하여 핵질내 헤어핀 루프(intranucleoplasmic hairpin loop)를 형성하며, 이는 스플라이싱 조절인자 MBNL1을 봉쇄하여 이를 GFP로 및 프로브 올리고뉴클레오타이드를 적색-형광성 염료 시아닌5(Cys5)로 표지함으로써 독특한 병소(foci)를 형성함이 입증되었다.
DM2는 3번 염색체 상의 ZNF9 유전자의 결함에 의해 유발된다. 특수한 결함은 ZNF9 유전자내 사이토신-티민-구아노신(CCTG) 테트라뉴클레오타이드의 반복물이다. 이는 4개 뉴클레오타이드의 반복물을 포함하므로, 이는 트리뉴클레오타이드 반복물 장애가 아니라, 오히려 테트라뉴클레오타이드 반복물 장애이다.
DM2에 대한 반복물 확장은 DM1보다 훨씬 더 커서, 75 내지 11,000개 이상의 반복물의 범위이다. DM1에서와 달리, DM2내 반복된 DNA 확장의 크기는 발병 연령 또는 질환 중증도에 있어서의 차이를 만드는 것으로 여겨지지 않는다. 기대는 DM2에서 거의 유의적이지 않는 것으로 여겨지며 가장 최근의 고찰은 DM2의 특징으로서 약한 기대만을 보고하고 있다.
프리드라이히 운동실조증(Friedreich's ataxia). 프리드라이히 운동실조증은 신경계에 대해 진행성 손상을 유발하는 상염색체 열성 유전 질환이다. 이는 보행 장애와 같은 불량한 조정력의 초기 증상을 나타내며; 이는 또한 척추측만증, 심장 질환 및 당뇨병을 초래할 수 있지만, 인지 기능에 영향을 미치지 않는다. 질환은 휠체어가 이동성을 위해 필요할 때까지 진행된다. 일반적인 집단에서 발생빈도는 50,000명 중 대략 1명이다.
특수한 유전적 돌연변이(FXN 유전자내 인트론 GAA 트리플 반복물의 확장)는 미토콘드리아 단백질 프라탁신의 감소된 발현을 초래한다. 시간이 지남에 따라 이러한 결핍증은 전술한 손상뿐만 아니라, 세포 대사에 있어서의 영향으로 인하여 빈번한 피로를 유발한다.
프리드라이히 운동실조증의 운동 실조는 척수(spinal cord), 특히 팔과 다리의 근육 운동을 지시하는데 필수적인(소뇌와의 연결을 통해) 감각 뉴우런내에서 신경 조직의 변성으로부터 야기된다. 척수는 보다 얇아지고 신경 세포는 이들의 미엘린 초(myelin sheath)(신경 임펄스를 수행하는 것을 돕는 일부 신경 세포 위를 덮고 있는 인슐레이팅) 중 일부를 손실한다.
증상은 전형적으로 5세 내지 15세의 연령에서 때때로 시작하지만, 말기 발병 FA는 20대 또는 30대에서 발생할 수 있다. 증상은 팔과 다리의 근육 약화, 조정력의 상실, 시각 손상, 청력 손상, 불분명 발음, 척추의 만곡, 높은 족저궁(발의 마분족 기형(pes cavus deformity of the foot)), 당뇨병(프리드라이히 운동실조증을 지닌 사람의 대략 20%는 탄수화물 불내성으로 진행되고 10%는 진성 당뇨병으로 진행된다) 및 심장 장애(예컨대, 심방 세동, 및 귀결되는 심계항진(빠른 심박수) 및 비대 심장 근육병증)의 임의의 조합을 포함하지만, 필수적으로 모두는 아니다.
이는 22세 전에 진행성 비틀거림(staggering) 또는 헛디디는 발걸음(stumbling gait) 및 빈번한 넘어짐으로 나타난다. 하체가 보다 심각하게 관련되어 있다. 증상은 느리고 진행성이다. 장기간 관찰은 많은 환자들이 환자의 성년 초기에 증상의 정체기(plateau)에 도달함을 나타낸다. 평균적으로, 질환을 지닌채 10 내지 15년 후, 환자는 일반적으로 휠체어를 사용하게 되며 일상 생활의 모든 활동에 보조를 필요로 한다.
다음의 물리적 신호가 신체 검사에서 검출될 수 있고: 소뇌 기능이상(cerebellar sign), 예컨대, 안구진탕증, 빠른 안구 도약 운동(fast saccadic eye movement), 몸통 운동실조증(truncal ataxia), 구음 장애, 운동거리조절이상(dysmetria); 하위 운동 뉴우런 병변, 예컨대, 깊은 힘줄 반사 결여; 추체로징후, 예컨대, 신근 발바닥 반응, 및 말단 약화(distal weakness)가 일반적으로 발견된다: 등 척추 측면(dorsal column aspect), 예컨대, 진동 및 자기수용성 감각의 손실이 일어난다. 심장 관여는 환자 중 91%에서 발생하며, 심장 비대(확장 심근병증까지), 대칭성 비대, 심장 잡음, 및 전도 결함을 포함한다. 사망의 중간 연령은 35세이지만, 여성은 남성에서 63%와 비교하여 100%의 20세 생존율로 보다 우수한 예후를 갖는다. 사례의 20%의 경우는 진성 당뇨병과 관련된 것으로 밝혀졌다.
프리드라이히 운동실조증은 FXN 유전자가 증폭된 고유 GAA 반복물(트리뉴클레오타이드 반복물 확장의 예)를 함유하는 경우 발생하는 상염색체 열성 장애이다. FXN 유전자는 단백질 프라탁신을 암호화한다. GAA 반복물 확장은 프라탁신 수준이 감소되도록 한다. 프라탁신은 철-황 클러스터를 형성시키는데 관여하는 철-결합 단백질이다. 프라탁신 결핍증의 하나의 결과는 많은 단백질에 대해 손상을 유발할 수 있는 미토콘드리아 철 오버로드(overload)이다. 정상의 생리학에서 프라탁신의 정확한 역활은 명확하지 않게 남아있다. 유전자는 9번 염색체에 상에 위치한다.
돌연변이체 유전자는 제1 인트론내에 확장된 GAA 트리플 반복물을 함유하며; 소수의 가계(pedigree)에서, 점 돌연변이가 검출되었다. 결함은 인트론내에 위치하므로(이는 전사와 해독 사이의 mRNA 전사체로부터 제거된다), 이러한 돌연변이는 비정상적인 프라탁신 단백질의 생산을 야기하지 않는다. 대신에, 돌연변이는 위치-효과 다양성(position-effect variegation)과 유사한 방식으로 헤테로크로마틴 구조의 유도를 통해 유전자 사일런싱을 유발한다(즉, 돌연변이는 유전자의 전사를 감소시킨다).
프라탁신의 발현을 감소시키는 것 외에도, GAA 반복물의 긴 관(tract)은 생체내 효모 연구에서 염색체 파괴를 유도한다.
헌팅톤 질환(Huntington's disease). 헌팅톤 무도병으로 또한 알려진, 헌팅톤 질환(HD)은 뇌 세포의 사멸을 야기하는 유전 장애이다. 조기 증상은 흔히 분위기 또는 정신 능력의 미묘한 문제점이다. 조정력의 일반적인 결여 및 불안정 보행이 종종 따라온다. 질환이 진전되면서, 조정되지 않는 저키 신체 운동(jerky body movement)이 보다 명백해진다. 육체적 능력은 조정된 운동이 어려워지고 사람이 말할 수 없을 때까지 점진적으로 악화된다. 정신 능력은 일반적으로 치매로 쇠퇴한다. 구체적인 증상은 사람들 사이에서 어느 정도 변한다. 증상은 일반적으로 30 내지 50세에 시작하지만, 어떠한 나이에서도 시작할 수 있다. 질환은 각각의 후속 세대에서의 삶 중 조기에 발달할 수 있다. 사례의 약 8%가 20세 이전의 연령에서 시작하며 전형적으로 파킨슨 질환(Parkinson's disease)과 보다 유사한 증상을 나타낸다. HD를 지닌 사람은 흔히 이들의 문제의 정도를 과소평가한다.
HD는 전형적으로 새로운 돌연변이로 인하여 사례의 10%가 사람의 부모로부터 유전된다. 질환은 헌팅틴(Huntingtin)으로 불리는 유전자의 개인의 2개 카피 중 하나에서 상염색체 우성 돌연변이에 의해 유발되다. 이는 영향받은 사람의 어린이가 질환의 50% 유전 확률을 가짐을 의미한다. 헌팅틴 유전자는 "헌팅틴"으로 또한 불리는 단백질에 대한 유전 정보를 제공한다. 헌팅틴 단백질을 암호화하는 유전자내에서 CAG(사이토신-아데닌-구아닌) 트리플 반복물의 확장은 비정상적인 단백질을 생성하며, 이는 완전히 이해되어 있지 않은 메카니즘을 통해, 뇌 속의 세포를 점진적으로 손상시킨다. 진단은 유전자 시험에 의해 수행하며, 이는 증상이 존재하는지의 여부에 상관없이 어느 시점에서도 수행할 수 있다. 이러한 사실은 심각한 윤리적 토론을 불러 일으킨다: 개인이 시험을 선택하기에 충분히 성숙한 것으로 고려되는 연령; 환자가 이들의 어린이를 시험할 권리를 가지는지의 여부; 및 시험 결과의 기밀 유지 및 폭로.
HD에 대한 치유법은 없다. 풀-타임 치유(full-time care)는 질환의 말기 단계에서 요구된다. 치료는 일부 증상을 완화시킬 수 있고 일부 경우에 삶의 질을 개선시킬 수 있다. 운동 문제의 치료를 위한 가장 우수한 증거는 테트라베나진을 사용하는 것이다. HD는 유럽 가계의 100,000명의 사람 중 약 4 내지 15명에 영향을 미친다. 이는 일본인 중에서는 드믈며 아프리카에서는 알려지지 않은 비율로 발생한다. 질환은 남성 및 여성에게 동등하게 영향을 미친다. 폐렴, 심장 질환, 및 낙상으로 인한 육체적 손상과 같은 합병증은 기대 수명을 감소시킨다. 자살은 사례의 약 9%에서 사망의 원인이다. 사망은 전형적으로 질환이 최초로 검출된 때로부터 15년 내지 20년에 발생한다.
헌팅톤 질환의 증상은 35세 내지 44세의 나이에서 가장 일반적으로 인식할 수 있게 되지만, 이들은 유아로부터 노인까지 임의의 나이에 시작될 수 있다. 초기 단계에서, 인격, 인지, 및 신체 기능에 있어서 미묘한 변화가 있다. 신체적 증상은 일반적으로 초기 단계에서 이들 자신이 인식하기에 충분히 심각하지 않다. 헌팅톤 질환을 지닌 거의 모든 사람은 궁극적으로 유사한 신체적 증상을 나타내지만, 발병, 진행 및, 인식 및 거동 증상의 정도는 개인 사이에서 유의적으로 변한다.
대부분의 특징적인 초기 신체적 증상은 무도병이라고 불리는 덜컥거리는, 무작위의 조절될 수 없는 운동이다. 무도병은 초기에는 일반적인 불안함, 작은 의도적이지 않게 개시되거나 완료되지 않은 운동, 조정력, 또는 느린 도약 안구 운동으로 나타날 수 있다. 이러한 작은 운동 불능은 일반적으로 적어도 3년까지 운동 기능장애의 보다 명백한 신호에 앞서 나타난다. 강직, 뒤틀린 운동 또는 비정상적인 자세와 같은 증상의 명확한 출현은 장애가 진행됨에 따라 나타난다. 이는 운동에 관여하는 뇌내 시스템이 영향받은 신호이다. 정신운동 기능은 크게 손상을 입게되므로, 근육 조절에 필요한 임의의 작용도 영향을 받는다. 일반적인 결과는 신체적 불안정, 비정상적인 안면 표현, 및 저작, 연하(swallowing), 및 말하기의 곤란성이다. 섭식 곤란성은 일반적으로 체중 감소를 유발하고 영양실조를 초래한다. 수면 장애는 또한 증상과 관련되어 있다. 청소년 HD는 일반적으로 보다 신속하게 진행하고 무도병이 약하게 나타나는데, 나타난다고 해도, 강직이 우세한 증상이 된다는 점에서 이러한 증상과는 상이하다. 발작 또한 이러한 형태의 HD의 일반적인 증상이다.
인지 능력은 점진적으로 손상된다. 계획, 인지 유연성, 추상적 사고, 규칙 습득, 적절한 행동의 개시, 및 부적절한 행동의 억제를 포함하는 실행 기능이 특히 영향을 받는다. 질환이 진행됨에 따라, 기억 결함이 나타나는 경향이 있다. 보고된 손상은 단기간 기억 결함 내지 장기간 기억 곤란성, 예컨대, 에피소드(episodic)(개인의 삶의 기억), 과정(활동을 수행하는 방법의 신체 기억) 및 작동 기억의 결손의 범위이다. 인지 문제는 시간이 경과하면서 악화되는 경향이 있고, 궁극적으로 치매를 초래한다. 이러한 패턴의 결손은 이를 피질 치매, 예컨대, 알츠하이머병의 대표적인 효과와 구별하기 위해 겉질밑 치매 증후군(subcortical dementia syndrome)으로 불리어 왔다.
보고된 신경정신병적 징후는 흥분, 우울, 감소된 감정의 표시(둔화 정동(blunted affect)), 자기중심성, 공격성, 및 강박 행동이며, 이중 후자는 탐닉, 예컨대, 알코올중독, 도박, 및 성욕과다증을 유발하거나 악화시킬 수 있다. 다른 사람의 부정적인 표현을 인식하는데 있어서의 곤란성이 또한 관찰된다. 이러한 증상의 유병률은 연구에 따라 크게 가변적이며, 정신 질환의 평생 유병률에 대한 추정된 비율은 33% 내지 76%이다. 많은 환자 및 이들의 가족의 경우, 이러한 증상은 질환의 가장 스트레스적인 국면 중에 있으며, 흔히 일상생활 기능에 영향을 미치고 보호시설에 대한 근거를 구성한다. 자살 고려(Suicidal thoughts) 및 자살 시도는 일반적인 집단에서보다 더 일반적이다. 흔히 개인은 무도병, 인지 및 감정 손상의 감소된 인식을 갖는다.
돌연변이체 헌팅틴은 신체 전체에서 발현되며 뇌 외부의 이러한 발현에 의해 직접 유발된 말초 조직내 비정상과 관련되어 있다. 이러한 비정상은 근 위축증, 심부전, 손상된 글루코즈 내성, 체중 손실, 골다공증, 및 정소 위축을 포함한다.
보든 사람은 헌팅틴 유전자(HTT)의 2개의 카피를 가지며, 이는 단백질 헌팅틴(HTT)을 암호화한다. 유전자는 또한 HD 및 IT15로 불리며, 이는 '흥미있는 전사체 15'를 나타낸다. 이러한 유전자의 일부는 트리뉴클레오타이드 반복물로 불리는 반복된 단면이며, 이는 개인 사이에서 길이가 상이하며 세대 사이에서도 길이가 변할 수 있다. 반복물ㅇ; 건강한 유전자 내에 존재하는 경우, 동적 돌연변이는 반복물 횟수를 증가시켜 결함성 유전자를 생성할 수 있다. 이러한 반복된 단면의 길이가 특정의 역치에 도달하면, 이는 돌연변이체 헌팅틴 단백질(mHTT)로 불리는, 변경된 형태의 단백질을 생산한다. 이러한 단백질의 상이한 기능은 궁극적으로 질환 증상을 유발하는 병리학적 변화의 원인이다. 헌팅톤 질환 돌연변이는 유전적으로 우성이며 거의 완전하게 침투성(penetrant)이고: 개인의 HTT 대립형질의 돌연변이는 질환을 유발한다. 이는 성별에 따라 유전되지 않으나, 유전자의 반복된 단면의 길이 및 따라서 이의 중증도는 영향받은 부모의 성별에 의해 영향받을 수 있다.
HD는 정상 범위를 벗어나는 유전자의 반복된 단면의 길이에 의해 유발되는 몇가지 트리뉴클레오타이드 반복물 장애 중 하나이다. HTT 유전자는 4p16.3에서 4번 염색체의 짧은 아암(short arm)에 위치한다. HTT는 트리뉴클레오타이드 반복물로 알려진, 3개의 DNA 염기―사이토신-아데닌-구아닌(CAG)―반복된 다수의 횟수(즉, ... CAGCAGCAG ...)를 함유한다. CAG는 아미노산 글루타민에 대한 3문자 유전 코드(코돈)이므로, 일련의 이들은 폴리글루타민 관(tract)(또는 폴리Q 관), 및 유전자의 반복된 부분, 폴리Q 영역으로 알려진 글루타민 쇄의 생산을 야기한다.
일반적으로, 사람들은 세포질성 단백질 헌팅틴의 생산을 야기하는 폴리Q 영역내 36개 이하의 반복된 글루타민을 갖는다. 그러나, 36개 이상의 글루타민의 서열은 상이한 특징을 갖는 단백질의 생산을 야기한다. 돌연변이체 헌팅틴(mHTT)으로 불리는 이러한 변경된 형태는 특정 유형의 뉴우런의 쇠퇴율(decay rate)을 증가시킨다. 뇌의 영역은 이러한 유형의 뉴우런에 있어서 상이한 양 및 의존도를 가지며, 상응하게 영향받는다. 일반적으로, CAG 반복물의 수는 이러한 과정이 얼마나 영향받는지와 관련되어 있으며, 증상의 발병 연령의 약 60%의 변화의 이유가 된다. 나머지 변화는 환경 및 HD의 메카니즘을 변경시키는 다른 유전자에 기인한다. 36 내지 39개 반복물은 증상의 훨씬 나중의 발병 및 보다 느린 진행과 함께, 감소된 침투형의 질환을 야기한다. 일부 경우에 발병은 증상이 전혀 인식되지 않을 정도로 늦을 수 있다. 매우 큰 반복물 수와 함께, HD는 완전한 침투도(penetrance)를 가지며 이후 이것은 청소년 HD, 운동불능-강직, 또는 웨스트팔 변이체(Westphal variant) HD로서 지칭되는 경우, 20세 이하에서 발생할 수 있다. 이는 HD 매개체의 약 7%를 차지한다.
모세혈관확장성 운동실조(Ataxia telangiectasia). 모세혈관확장성-운동 실조 증후군 또는 루이스-바 증후군(Louis-Bar syndrome)으로 또한 지칭되는, 모세혈관확장성-운동실조(AT 또는 A-T)는 중증 장애를 유발하는 희귀한, 신경변성, 상염색체 열성 질환이다. 운동실조증은 불량한 조화 및 작은 확장된 혈관에 대한 모세혈관확장증을 지칭하며, 이들 둘 다는 질환의 특징이다.
A-T는 신체의 많은 부분에 영향을 미친다. 이는 대뇌를 포함하는 뇌의 특정 부위에 손상을 입혀, 운동 및 조화의 곤란성을 유발한다. 이는 면역계를 약화시켜, 감염에 대한 질병소질을 유발한다. 이는 파괴된 DNA의 복구(repair)를 방지하며, 암의 위험을 증가시킨다.
증상은 가장 흔히 우선 어린이가 걷기 시작할 때 유아기(걸음마 단계)에서 나타난다. 이들이 일반적으로 정상 나이에서 걷기 시작하지만, 이들은 갇거나, 계속해서 서서 있거나 앉을 때 떨리거나 흔들리고, 거의 이들이 술을 마셨을 경우와 같이 여겨질 수 있다. 유치원 연령 후반 및 학령 초기에, 이들은 한곳에서 다른 곳으로 자연적인 방식으로 이들의 눈을 움직이는데 곤란성으로 발달한다(눈돌림실행증). 이들은 불분명 발음 또는 발음 장애, 및 연하 문제로 발달한다. 일부는 증가된 수의 기도 감염(귀 감염, 축농증, 기관지염, 및 폐렴)을 갖는다. 모든 어린이가 동일한 방식 또는 동일한 비율로 발달하지 않으므로, 이는 A-T가 적절히 진단되기 전에 몇년이 될 수 있다. A-T를 지닌 대부분의 어린이는 생애의 첫번째 4 내지 5년 동안 안정한 신경학적 증상을 가지지만, 학령 초기에 증가하는 문제를 나타내기 시작한다.
A-T는 ATM 유전자내 결함에 의해 유발되며, 이는 DNA내 이중 가닥 브레이크(break)를 포함하는 다수 형태의 스트레스에 대한 세포 반응을 유지하는데 관여한다. 단순한 용어로, ATM 유전자에 의해 생산된 단백질은 DNA내 브레이크가 존재함을 인식하여, 다른 단백질을 보충함으로써 브레이크를 고정시키고 복구가 완료될 때까지 세포가 새로운 DNA를 만드는 것을 중지시킨다.
영향받은 개인 중에서, 및 상이한 연령에서 A-T의 특징의 중증도에 있어서 실질적인 가변성이 존재한다. 다음의 증상 또는 문제는 A-T의 일반적이거나 중요한 특징이다:
조기에 명백하지만 학령기 내지 10대 초반에 악화되는 운동실조증(운동 제어의 곤란성).
눈돌림실행증(한곳으로부터 다른 곳으로 시선을 이동하는 경우 머리 및 눈 운동의 조화의 곤란성).
불수의 운동.
눈의 흰자(공막) 위의 모세혈관확장증은 이들이 충혈되도록 한다. 이는 영아에서는 명백하지 않으며 5 내지 8세에 먼저 명백해질 수 있다. 모세관확장증은 또한 피부의 태양-노출된 부위에서 나타난다.
특히 귀, 부비동 및 폐의 감염과 관련된 문제.
암의 증가된 발생률(주로, 그러나 전적으로는 아니지만, 림프종 및 백혈병).
지연된 발병 또는 불완전한 사춘기 발달, 및 매우 이른 폐경.
느린 성장율(체중 및/또는 신장).
이들이 피곤하거나 활동에 집중하는 경우 특히 유아기에 침흘림.
눌어증(불분명하거나, 느리거나 또는 왜곡된 발음 소리).
청소년기 또는 이후의 당뇨병.
모발 및 피부에서 조숙 변화.
많은 어린이들은 뇌성마비를 가진 것으로 초기에 잘못진단된다. A-T의 진단은 손상된 걸음걸이, 손 조화, 발음 및 눈 운동의 신경학적 증상이 나타나거나 악화되는 경우, 및 모세혈관확장증이 나타나는 경우 학령전 연령까지 이루어지지 않을 수 있다. A-T는 매우 희귀해서, 의사는 증상, 또는 진단 방법에 친숙하지 않을 수 있다. 모세혈관확장증의 말기 외관은 진단에 대한 장벽일 수 있다. 이는 의사가 A-T를 증상 및 신호의 조기 안전성으로 인한 가능성으로서 고려하기 전에 일정 시간 걸릴 수 있다.
A-T는 ATM(돌연변이된 ATM 세린/트레오닌 키나제 또는 모세혈관확장성 운동실조증) 유전자내 돌연변이에 의해 유발되며, 이러한 유전자는 1995년에 클로닝되었다. ATM은 사람 11번 염색체(11q22.3)에 위치하며 게놈 DNA의 150kb에 걸쳐 확산된 69개의 엑손으로 이루어져 있다.
A-T의 유전 방식은 상염색체 열성이다. 각각의 부모가 매개체인데, 이는 이들은 A-T 유전자(ATM) 중 하나의 정상 카피 및 돌연변이된 하나의 카피를 가짐을 의미한다. 어린이가 돌연변이된 A-T 유전자를 각각의 부모로부터 유전받는 경우 A-T가 발생하므로, 2명의 매개체 부모를 지닌 가족에서, 부모에게 태어난 어린이가 장애를 가질 확률은 4명중 1명이다. 출생전 진단(및 매개체 검출)은 영향받은 어린이의 2개 ATM 유전자내 오류(돌연변이)가 확인된 경우 가족에서 수행될 수 있다. 이를 수행하는 공정은 복잡할 수 있으며, 시간을 요하므로, 수태(conception) 전에 배열되어야 한다.
관련되지 않은 사람(예를 들면, 알려진 A-T 매개체의 배우자)의 ATM 유전자내 돌연변이를 찾는 것은 유의적인 챌린지를 나타낸다. 유전자는 흔히 기능에 영향을 미치지 않는 변이체 스펠링(variant spelling)(다형체)를 가진다. ATM과 같은 큰 유전자에서, 이러한 변이체 스펠링은 발생할 수 있으며 의사는 항상 특정 변이체가 질환을 유발할지 또는 유발하지 않을 지를 예측할 수 없다. 유전 상담은 시험될 수 있거나 시험될 수 없는 것 및 시험 결과가 해석되어야 할 방법을 A-T 환자의 가족 구성원이 이해하는 것을 도울 수 있다.
A-T를 지닌 사람의 부모와 같은 A-T의 매개체는 ATM 유전자의 하나의 돌연변이된 카피 및 하나의 정상 카피를 갖는다. 이들은 일반적으로 건강하지만, 여성에서 유방암의 증가된 위험이 존재한다. 이러한 발견은 다양한 상이한 방식으로 확인되었으며 현재의 연구의 대상이다. 개인이 다른 위험 인자(예컨대, 유방암의 가족력)을 가지므로 추가의 시험이 나타내지 않는 한, 표준 감시(일반적인 연령 스케줄에서 매달 자기 시험 및 유방조영술 포함)가 추천된다.
신경 섬유종증 1 및 2형. 신경섬유종증(NF)은 종양이 신경계에서 성장하는 3개 조건의 그룹이다. 3개의 유형은 신경섬유종증 1형(NF1), 신경섬유종증 2형(NF2), 및 신경초종증이다. NF1에서 증상은 피부 위의 연갈색 점, 겨드랑이 및 서해부내 주근깨, 신경내 작은 범프(bump), 및 척추측만증을 포함한다. NF2에서 청력 손실, 어린 나이의 백내장, 균형 문제, 살색 피부 덮개, 및 근육 소모가 존재할 수 있다. 종양은 일반적으로 비-암성이다.
원인은 특정 유전자내 유전적 돌연변이이다. 사례의 1/2에서 이는 개인의 부모로부터 유전되지만 나머지에서 이들은 조기 발달 동안에 발생한다. 종양은 뉴우런보다는 오히려 신경계내 지지 세포를 포함한다. NF1에서 종양은 신경섬유종(말초 신경의 종양)이지만 NF2 및 신경초존증에서 슈반 세포의 종양은 보다 일반적이다. 진단은 전형적으로 신호 및 증상을 기반으로 하며 때때로 유전자 시험에 의해 뒷받침된다.
알려진 예방 또는 치유법은 존재하지 않는다. 수술은 문제를 유발하거나 암성이 되는 종양을 제거하기 위해 수행될 수 있다. 방사선 및 화학치료요법은 또한 암이 발생하는 경우 사용할 수 있다. 달팽이관 이식 또는 청각 뇌간 이식은 청각 손실된 일부에게 도움을 줄 수 있다.
미국에서 3,500명의 사람 중 약 1명이 NF1을 가지며 25,000명 중 1명이 NF2를 갖는다. 남성 및 여성은 동일한 빈도로 영향을 받는다. NF1에서 증상은 출생시 보다 흔하고 달리는 10세 전에 발달한다. 상태는 시간에 따라 전형적으로 악화되지만 NF1을 지닌 사람은 정상의 기대 수명을 갖는다. NF2에서 증상은 초기 성인까지 명백해지지 않을 수 있다. NF2는 조기 사망 위험을 증가시킨다. 상태에 대한 설명은 1세기 만큼 거술러 올라간다.
젊은 시절의 신경섬유종증(NF1)은 학습 및 행동 문제를 유발할 수 있으며, NF1을 가진 어린이의 약 60%가 학교에서 약한 형태의 곤란성을 갖는다. 개인이 가질 수 있는 신호 측면은 다음과 같다: 6개 이상의 연갈색 피부과학적 점("담갈색 반점("cafe-au-lait spots)"), 적어도 2개의 신경섬유종, 눈 홍채에서 적어도 2개의 성장, 및 척추의 비정상적인 성장(척추측만증).
신경섬유종증은 상염색체 우성 장애이며, 이는 영향받은 유전자의 하나의 카피만이 장애가 발달하는데 필요함을 의미한다. 따라서, 부모 중 1명만이 신경섬유종증을 가진 경우, 그 또는 그녀의 자식은 이러한 상태로 발달할 확률이 또한 50%이다. 영향받은 자식은 심지어 심각한 형태의 장애를 지닌 부모로부터 유전된다해도 약한 NF1을 가질 수 있다. 2개 유형의 신경섬유종증이 존재한다. 신경섬유종증 I형은 양성일 수 있고 신경 및 다른 조직을 압착함으로써 심각한 손상을 유발할 수 있는 종양(신경섬유종)으로의 신경 조직 성장을 특징으로 한다. 신경섬유종증 II형은 쌍방 청신경집종(신경집종으로 또한 알려진 내이신경 또는 뇌 신경 8(CN VIII))을 나타내며, 흔히 청각 손실을 야기한다.
고통스러운 신경집종이 척추 및 말초 신경에서 발달하는 신경초종증.
레베르 선천성 흑암시(Leber congenital amaurosis)에서의 CEP290 돌연변이. 290 kDa의 중심체 단백질은 사람에서 CEP290 유전자에 의해 암호화된 단백질이다. CEP290은 12번 염색체의 Q 아암(arm)에 위치한다. 유전자 CEP290은 중심체 및 섬모 발달에 중요한 역활하는 중심체 단백질이다. 이러한 유전자는 망막의 뒤(광 및 색상을 검출한다)에서 광수용체 및 신장, 뇌 및 신체의 많은 다른 기관에서 중요한 역활을 하는 세포 막의 작은 안테나-유사 돌출부(antenna-like projection)인, 1차 섬모의 형성에서 필수적이다. CEP290 유전자 전사체의 녹 다운 수준(knocking down level)은 배양물 속의 망막 색소 상피 세포내 섬모발생의 현저한 억제를 야기하였으며, 이는 CEP290이 섬모 형성에 얼마나 중요한지를 입증한다.
분자 수준에서, CEP290은 1차 섬모 형성시 중요한 조절 및 구조적 역활을 담당하는 것으로 나타났다. 최근 연구는 CEP290을 섬모의 미소관 코어와 덮고 있는 섬모막 사이의 구조적 연결부로서 작용할 수 있는 미소관 및 막 결합 단백질로서 연루시켰다. CEP290 질환의 rd16 마우스 모델에서 CEP290의 미소관 결합 도메인의 파괴는 신속하고 놀라운 망막 변성을 야기하는 것으로 밝혀졌으며, 질환에서 CEP290 미소관 결합의 중요성을 입증한다. 섬모발생을 촉진하는데 있어서 CEP290의 역활은 CEP290 단백질의 말단에서 발현된 자가-조절 도메인 및 억제 단백질 CP110과 CEP290의 상호작용을 통해 억제된다.
CEP290 유전자의 발견은 연구자가 망막 기능에서 중요한 다른 유전자인, LCA5를 찾도록 하였다. 이러한 2개 유전자의 유전자 대체를 포함하는 임상 시험은 필라델피아에서 시작하였으며, 여기서 연구자들은 레베르 선천성 흑암시(Leber Congenital Amaurosis)가 하루에 치유될 것으로 희망하고 있다.
이러한 유전자는 SMC 염색체 분리 ATP아제에 대해 상동성을 갖는 영역인 13개의 추정된 코일화된-코일 도메인(coiled-coil 도메인), 6개의 KID 모티프, 3개의 트로포마이오신 상동성 도메인 및 ATP/GTP 결합 부위 모티프를 지닌 단백질을 암호화한다. 단백질은 중심체 및 섬모에 국재화되어 있으며, N-글리코실화, 타이로신 설페이트화, 포스포릴화, N-미리스토일화, 및 아미드화에 대한 부위를 갖는다.
이러한 유전자내 돌연변이는 주버트 증후군(Joubert syndrome) 및 신결석증, 및 최근에 LCA10으로 불리는, 흔한 형태의 레베르 선천성 흑암시와 관련되어 왔다. 이러한 단백질에 대한 항체의 존재는 몇가지 형태의 암과 관련되어 있다.
이러한 유전자내 돌연변이는 레베르 선천성 흑암시로 알려진 질환인, 영아 및 어린이 실명을 초래한다. 오늘 현재로, CEP290내에 35개의 상이한 돌연변이가 LCA를 유발하는데 관여하고 있다. CEP290 내 다른 돌연변이는 또한 많은 증후군 중 일부인, 멕켈 증후군(Meckel Syndrome) 및 주버트 증후군(Joubert Syndrome)을 유발하는 것으로 확인되었다. 결함이 있는 CEP290 유전자는 비정상적인 섬모로 인하여 이러한 장애의 원인이다. 유전자내 하나의 돌연변이가 어떻게 특히 이들 중 많은 것이 중추 신경계에 영향을 미치는, 이렇게 많은 상이한 유형의 증후군을 유발할 수 있는지는 알려져 있지 않다.
III. CRISPR 시스템
A. CRISPR
CRISPR(집단화된 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복 서열)은 염기 서열의 짧은 반복물을 함유하는 DNA 유전자자리(loci)이다. 각각의 반복물은 바이러스에 대한 앞서의 노출로부터 "스페이서 DNA"의 짧은 분절(segment)을 수반한다. CRISPR는 서열분석된 유박테리아(eubacteria) 게놈의 대략 40% 및 서열분석된 고세균의 90%에서 발견된다. CRISPR는 흔히 CRISPR과 관련된 단백질을 암호화하는 Cas 유전자와 관련되어 있다. CRISPR/Cas 시스템은 플라스미드 및 파아지와 같은 외부 유전 성분에 대해 내성을 부여하는 원핵세포 면역 시스템이며 후천성 면역성의 형태를 제공한다. CRISPR 스페이서는 진핵세포 유기체내에서 RNAi와 같은 이러한 외인성 유전 성분을 인식하여 사일런싱시킨다.
CRISPR 반복물은 크기가 24 내지 48개 염기쌍의 범위이다. 이들은 일반적으로 일부 다이애드 대칭(dyad symmetry)을 나타내며, 헤어핀과 같은 2차 구조의 형성을 내포하지만, 실제로는 팔린드롬성(palindromic)이 아니다. 반복물은 유사한 길이의 스페이서에 의해 분리된다. 일부 스페이서가 원핵세포 게놈(자가-표적화 스페이서)와 일치하지만, 일부 CRISPR 스페이서 서열은 플라스미드 및 파아지로부터의 서열과 정확하게 일치한다. 새로운 스페이터는 파아지 감염에 대한 반응시 신속하게 첨가될 수 있다.
B. Cas 뉴클레아제
CRISPR-관련된(cas) 유전자는 CRISPR 반복물-스페이서 배열과 흔히 관련되어 있다. 2013년 현재로, 40개 이상의 상이한 Cas 단백질 계열이 기술되었다. 이들 단백질 계열 중에서, Cas1은 상이한 CRISPR/Cas 시스템 중에서 편재하는 것으로 여겨진다. cas 유전자와 반복물 구조의 특수한 조합을 사용하여 8개의 CRISPR 서브형(Ecoli, Ypest, Nmeni, Dvulg, Tneap, Hmari, Apern, 및 Mtube)을 정의하였으며, 이들 중 일부는 반복물-관련 미스테리 단백질(RAMP)을 암호화하는 추가의 유전자 모듈과 관련되어 있다. 1개 이상의 CRISPR 서브형이 단일 게놈에서 발생할 수 있다. CRISPR/Cas 서브형의 산발적인 분포는 이러한 시스템이 미생물 진화 동안 수평의 유전자 이동에 적용됨을 시사하고 있다.
외인성 DNA는 Cas 유전자에 의해 암호화된 단백질에 의해 작은 성분(~30개의 염기쌍 길이)으로 명백하게 프로세싱되며, 이는 이후에 어느 정도 리더 서열(leader sequence) 근처의 CRISPR 유전자자리로 삽입된다. CRISPR 유전자자리로부터의 RNA는 구성적으로 발현되어 Cas 단백질에 의해 플랭킹 반복 서열을 지닌 개개의 외인성으로 유도된 서열 성분으로 구성된 작은 RNA로 프로세싱된다. RNA는 다른 Cas 단백질을 가이드하여 RNA 또는 DNA 수준에서 외인성 유전 성분을 사일런싱한다. 증거는 CRISPR 서브형 중에서 기능적 다양성을 시사한다. Cse(Cas 서브형 Ecoli) 단백질(이. 콜라이(E. coli) 내에서 CasA-E로 불림)은 CRISPR RNA 전사체를 이러한 캐스케이드(cascade)가 보유한 스페이스-반복물 단위로 프로세싱하는, 기능성 복합체인, 캐스케이드를 형성한다. 다른 원핵세포에서, Cas6는 CRISPR 전사체를 프로세싱한다. 흥미롭게도, 이. 콜라이내에서 CRISPR-기반 파아지 불활성화는 캐스케이드 및 Cas3을 필요로 하지만, Cas1 및 Cas2는 필요로 하지 않는다. 피로코쿠스 푸리오수스(Pyrococcus furiosus) 및 다른 원핵세포에서 발견된 Cmr(Cas RAMP 모듈) 단백질은 상보성 표적 RNA를 인식하여 이를 절단하는 작은 CRISPR RNA와 기능성 복합체를 형성한다. RNA-가이드된 CRISPR 효소는 V형 제한 효소로 분류된다.
Cas9는 DNA를 2개의 활성 절단 부위로 절단하기 위해 구체화된 효소인, 뉴클레아제이며, 하나의 부위는 이중 나선의 각각의 가닥에 대한 것이다. 팀은 이들이 하나 또는 둘 모두의 부위를 상실시킬 수 있지만 이의 표적 DNA에 국재화하는 Cas9의 능력은 보존함을 입증하였다. Jinek et al. (2012)은 tracrRNA 및 스페이서 RNA를 "단일-가이드 RNA" 분자로 조합하였으며, 이는 Cas9와 혼합되어, 정확한 DNA 표적을 발견하여 절단할 수 있고, 이러한 합성 가이드 RNA는 유전자 편집에 사용된다.
Cas9 단백질은 병원성 및 공생 세균에서 매우 풍부하다. CRISPR/Cas-매개된 유전자 조절은 특히 진핵세포 숙주와의 세균 상호작용 동안에 내인성 세균 유전자의 조절에 기여할 수 있다. 예를 들면, 프란시셀라 노비시다(Francisella novicida)의 Cas 단백질 Cas9는 유일하고, 작은, CRISPR/Cas-관련 RNA(scaRNA)를 사용하여 에프. 노비시다(F. novicida)에 중요한 세균 지단백질을 암호화하는 내인성 전사체를 억제함으로써 숙주 반응을 약화시키고 발병력을 촉진시킨다. Wang et al. (2013)은 Cas9 mRNA 및 sgRNA의 돌연변이를 지닌 생식세포(접합체) 내로의 동시주사가 돌연변이를 지닌 마우스를 생성하였음을 입증하였다. Cas9 DNA 서열의 전달이 또한 고려된다.
시스템 CRISPR/Cas는 3개의 부류로 분리된다. 부류 1은 CRISPR RNA(crRNA)와 함께 수개의 Cas 단백질을 사용하여 기능성 엔도뉴클레아제를 구축한다. 부류 2 CRISPR 시스템은 crRNA를 지닌 단일 Cas 단백질을 사용한다. Cpf1은 최근에 부류 II, 1,300개 아미노산 단백질을 함유하는 V형 CRISPR/Cas 시스템으로 확인되었다. 또한, 이의 전문이 참고로 포함된, 미국 특허 공보 제2014/0068797호를 참고한다.
일부 구현예에서, 본 개시내용의 조성물은 스타필로코쿠스 아우레우스(Staphylococcus aureus)(유니프롯(UniProt) 수탁 번호 J7RUA5)로부터의 Cas9의 작은 버젼을 포함한다. Cas9의 작은 버젼은 야생형 또는 완전한 길이의 Cas9에 비해 이점을 제공한다. 일부 구현예에서 Cas9는 spCas9(AddGene)이다.
C. Cpf1 뉴클레아제
프레보텔라(Prevotella) 및 프란시셀라(Francisella) 1 또는 CRISPR/Cpf1은 CRISPR/Cas9 시스템과 일부 유사성을 공유하는 DNA-편집 기술이다. Cpf1은 부류 II CRISPR/Cas 시스템의 RNA-가이드된 엔도뉴클레아제이다. 이러한 후천성 면역 메카니즘은 프레보텔라(Prevotella) 및 프란시셀라(Francisella) 세균에서 발견된다. 이는 바이러스로부터의 유전적 손상을 방지한다. Cpf1 유전자는 가이드 RNA를 사용하여 바이러스 DNA를 발견하고 이를 절단하는 CRISPR 유전자자리와 관련되어 있다. Cpf1은 Cas9보다 더 작고 단순한 엔도뉴클레아제이며, CRISPR/Cas9 시스템 제한 중 일부를 극복한다.
Cpf1은 많은 세균 종에서 나타난다. 게놈 편집에 대한 도구로 개발된 궁극적인 Cpf1 엔도뉴클레아제는 이를 지닌 것으로 알려진 처음 16개 종 중 1개로부터 입수되었다.
구현예에서, Cpf1은 하기 나타낸 서열을 갖는, 악시드아미노코쿠스(Acidaminococcus)(종 BV3L6, 유니프롯 수탁 번호 U2UMQ6; 서열 번호: 870)로부터의 Cpf1 효소이다:
일부 구현예에서, Cpf1은 하기 나타낸 서열을 갖는, 라크노스피라세아에(Lachnospiraceae)(종 ND2006, 유니프롯 수탁 번호 A0A182DWE3; 서열 번호: 871)로부터의 Cpf1 효소이다:
일부 구현예에서, Cpf1은 포유동물 세포내에서 발현을 위해 최적화된 코돈이다. 일부 구현예에서, Cpf1은 사람 세포 또는 마우스 세포내에서 발현을 위해 최적화된 코돈이다.
Cpf1 유전자자리는 혼합된 알파/베타 도메인, RuvC-I에 이은 나선 영역, RuvC-II 및 아연 핑거-유사 도메인을 함유한다. Cpf1 단백질은 Cas9의 RuvC 도메인과 유사한 RuvC-유사 엔도뉴클레아제 도메인을 갖는다. 또한, Cpf1은 HNH 엔도뉴클레아제 도메인을 가지지 않으며, Cpf1의 N-말단은 Cas9의 알파-나선 인식 로브(recognition lobe)를 가지지 않는다.
Cpf1 CRISPR-Cas 도메인 구조는 Cpf1이 기능적으로 유일하며, 부류 2, V형 CRISPR 시스템으로 분류됨을 나타낸다. Cpf1 유전자자리는 II형 시스템으로부터 보다는 I형 및 III형과 보다 유사한 Cas1, Cas2 및 Cas4 단백질을 암호화한다. 데이타베이스 조사는 많은 세균 종에서 Cpf1-계열 단백질의 풍부함을 시사한다.
기능성 Cpf1은 tracrRNA를 필요로 하지 않으므로, crRNA 만이 요구된다. 이는 Cpf1이 Cas9보다 더 작을 뿐 아니라 더 작은 sgRNA 분자(대략 Cas9와 같이 많은 뉴클레오타이드의 대략 1/2)를 가지므로 유전자 편집에 유리하다.
Cpf1-crRNA 복합체는 Cas9에 의해 표적화된 G가 풍부한 PAM과는 대조적으로, 프로토스페이서 인접 모티프 5'-YTN-3'(여기서 "Y"는 피리미딘이고 "N"은 임의의 뉴클레아제이다) 또는 5'-TTN-3'의 확인에 의해 표적 DNA 또는 RNA를 절단한다. PAM의 확인 후, Cpf1은 4 또는 5개의 뉴클레오타이드 오버행(overhang)의 점착성(sticky)-말단-유사 DNA 이중 가닥 브레이크를 도입한다.
CRISPR/Cpf1 시스템은 Cpf1 효소 및 이중 나선 상의 정확한 점에서 복합체를 발견하고 위치시켜 표적 DNA를 절단하는 가이드 RNA로 이루어져 있다. CRISPR/Cpf1 시스템 활성은 3개의 단계를 갖는다:
적응, 이 동안 Cas1 및 Cas2 단백질은 DNA의 작은 단편의 CRISPR 배열로의 적응을 촉진시킨다;
crRNA의 형성: Cas 단백질을 가이드하기 위해 성숙한 crRNA를 생산하는 예비-cr-RNA의 프로세싱; 및
방해, 여기서 Cpf1은 crRNA에 결합하여 표적 DNA 서열을 확인하여 절단하는 이원 복합체(binary complex)를 형성한다.
D. gRNA
RNA 가이드된 단백질로서, Cas9는 DNA 표적의 인식을 지시하기 위해 짧은 RNA를 필요로 한다. Cas9는 PAM 서열 NGG를 함유하는 DNA 서열을 우선적으로 질문하지만, 이는 여기에 프로토스페이서(protospacer) 표적없이 결합할 수 있다. 그러나, Cas9-gRNA 복합체는 gRNA에 밀접하게 일치하여 이중 가닥 브레이크를 생성함을 필요로 한다. 세균내에서 CRISPR 서열은 다중 RNA로 발현된 후 프로세싱되어 RNA에 대한 가이드 가닥을 생성한다. 진핵세포 시스템은 CRISPR RNA를 프로세싱하는데 필요한 단백질 중 일부를 결여하므로 합성 작제물 gRNA는 RNA 폴리머라제 III형 프로모터 U6을 사용하여 발현된 단일 RNA로 표적화하는 Cas9에 대한 RNA의 필수적인 조각을 조합하기 위해 생성되었다. 합성 gRNA는 최대 길이로 100bp를 약간 초과하며 PAM 서열 NGG 바로 앞의 20개의 프로토스페이서 뉴클레오타이드를 표적화하는 부위를 함유한다; gRNA는 PAM 서열을 함유하지 않는다.
일부 구현예에서, gRNA는 야생형 디스트로핀 유전자내 부위를 표적화한다. 일부 구현예에서, gRNA는 돌연변이체 디스트로핀 유전자내 부위를 표적화한다. 일부 구현예에서, gRNA는 디스트로핀 인트론을 표적화한다. 일부 구현예에서, gRNA는 디스트로핀 엑손을 표적화한다. 일부 구현예에서, 발현된 디스트로핀 엑손내 부위를 표적화하며 표 1에 나타낸 하나 이상의 디스트로핀 동형 내에 존재한다. 구현예에서, gRNA는 디스트로핀 스플라이스 부위를 표적화한다. 일부 구현예에서, gRNA는 디스트로핀 유전자상의 스플라이스 공여체 부위를 표적화한다. 구현예에서, gRNA는 디스트포린 유전자 상의 스플라이스 수용체 부위를 표적화한다.
구현예에서, 가이드 RNA는 돌연변이체 DMD 엑손을 표적화한다. 일부 구현예에서, 돌연변이체 엑손은 엑손 23 또는 51이다. 일부 구현예에서, 가이드 RNA는 디스트로핀 유전자의 엑손 1, 23, 41, 44, 46, 47, 48, 49, 50, 51, 52, 53, 54, 또는 55 중 적어도 하나를 표적화한다. 구현예에서, 가이드 RNA는 디스트로핀 유전자의 인트론 44, 45, 50, 51, 52, 53, 54, 또는 55 중 적어도 하나를 표적화한다. 바람직한 구현예에서, 가이드 RNA는 엑손 51 또는 엑손 23의 스키핑(skipping)을 유도하도록 설계되어 있다. 구현예에서, gRNA는 엑손 51 또는 엑손 23의 스플라이스 수용체 부위에 대해 표적화된다.
본원에 개시된 다양한 조성물 및 방법에 사용하기에 적합한 gRNA는 서열 번호: 383 내지 705, 709 내지 711, 715 내지 717, 790 내지 862, 864로 제공된다.(표 7, 9, 11, 13, 및 15). 바람직한 구현예에서, gRNA는 서열 번호: 790 내지 서열 번호: 862 중 어느 하나로부터 선택된다.
일부 구현예에서, 본 개시내용의 gRNA는 DMD 유전자에 상응하는 암호화 서열 또는 비-암호화 서열내 표적 서열에 대해 상보성인 서열을 포함하므로, 표적 서열에 대해 하이브리드화된다. 일부 구현예에서, Cpf1에 대한 gRNA는 직접적인 반복물 스캐폴드(scaffold) 서열에 이은 가이드 서열의 24개 뉴클레오타이드를 함유하는 단일의 crRNA를 포함한다. 일부 구현예에서, crRNA의 "가이드" 서열은 표적 서열에 대해 상보성인 gRNA의 서열을 포함한다. 일부 구현예에서, 본 개시내용의 crRNA는 표적 서열에 대해 상보성이 아닌 gRNA의 서열을 포함한다. 본 개시내용의 "스캐폴드" 서열은 gRNA를 Cpf1 폴리펩타이드에 연결시킨다. 본 개시내용의 "스캐폴드" 서열은 gRNA-Cas9 작제물의 tracrRNA 서열과 동등하지 않다.
일부 구현예에서, 핵산은 gRNA를 암호화하는 하나 이상의 서열을 포함할 수 있다. 일부 구현예에서, 핵산은 gRNA를 암호화하는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개의 서열을 포함할 수 있다. 일부 구현예에서, 서열 모두는 동일한 gRNA를 암호화한다. 일부 구현예에서, 서열 모두는 상이한 gRNA를 암호화한다. 일부 구현예에서, 서열 중 적어도 2개는 동일한 gRNA을 암호화하는데, 예를 들면, 서열의 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개는 동일한 gRNA를 암호화한다.
E. Cas9 대 Cpf1
Cas9는 DNA를 절단하기 위해 2개의 RNA 분자를 필요로 하지만 Cpf1은 하나의 DNA 분자를 필요로 한다. 단백질은 또한 상이한 위치에서 DNA를 절단하여, 편집 부위를 선택하는 경우 연구자에게 추가의 선택사항을 제공한다. Cas9는 동일한 위치에서 DNA 분자내 가닥 둘 다를 절단하여, '평활(blunt)' 말단을 남긴다. Cpf1은 다른 것보다 더 긴 하나의 가닥을 남김으로써, 함께 작업하기 보다 용이한 '점착성' 말단을 생성한다. Cpf1은 Cas9와 비교하여, 절단 부위에서 새로운 서열을 보다 더 삽입할 수 있는 것으로 여겨진다. CRISPR/Cas9 시스템은 유전자를 효율적으로 무능화시키지만, 이는 유전자를 삽입시키거나 녹-인(knock-in)을 생성하기 위한 도전이다. Cpf1은 tracrRNA를 결여하며, T가 풍부한 PAM을 활용하며 엇갈린(staggered) DNA DSB를 통해 DNA를 절단시킨다.
요약하면, Cpf1 시스템과 Cas9 시스템 사이의 중요한 차이는 Cpf1이 상이한 PAM을 인식하여, 새로운 표적화 가능성을 가능하도록 하며, Cas9에 의해 생산된 평활 말단 대신에, 4 내지 5 nt 길이의 점착성 말단을 생성하며, 유전자 삽입의 효능 및 NHEJ 또는 HDR 동안의 특이성을 향상시키고, 표적 DNA를 PAM으로부터 더 멀리, Cas9 절단 부위로부터 더 멀리 절단하여, DNA를 절단하기 위한 새로운 가능성이 가능하도록 한다.
[표 3]
F. CRISPR-매개된 유전자 편집
CRISPR/Cpf1 또는 CRISPR/Cas9를 사용하여 DMD 유전자를 편집하는데 있어서 제1 단계는 게놈 표적 서열을 확인하는 것이다. 본 개시내용의 gRNA에 대한 게놈 표적은 임의의 ~24개 뉴클레오타이드 DNA 서열일 수 있으며, 단 서열은 게놈의 나머지와 비교하여 유일하다. 일부 구현예에서, 게놈 표적 서열은 사람 디스트로핀 유전자의 엑손 51, 엑손 45, 엑손 44, 엑손 53, 엑손 46, 엑손 52, 엑손 50, 엑손 43, 엑손 6, 엑손 7, 엑손 8, 및/또는 엑손 55내 서열에 상응한다. 일부 구현예에서, 게놈 표적 서열은 사람 디스트로핀 유전자의 엑손 51, 엑손 45, 엑손 44, 엑손 53, 엑손 46, 엑손 52, 엑손 50, 엑손 43, 엑손 6, 엑손 7, 엑손 8, 및/또는 엑손 55내의 5' 또는 3' 스플라이스 부위이다. 일부 구현예에서, 게놈 표적 서열은 사람 디스트로핀 유전자의 엑손 51, 엑손 45, 엑손 44, 엑손 53, 엑손 46, 엑손 52, 엑손 50, 엑손 43, 엑손 6, 엑손 7, 엑손 8, 및/또는 엑손 55의 바로 상부 또는 하부의 인트론내 서열에 상응한다. 예시적인 게놈 표적 서열은 표 6, 8, 10, 12, 및 14에서 찾을 수 있다.
DMD 유전자를 편집하는 다음 단계는 표적화될 유전자 영역내 모든 프로토스페이서 인접 모티프(Protospacer Adjacent Motif: PAM) 서열을 확인하는 것이다. 표적 서열은 PAM의 바로 상부에 위치하여야 한다. 일단 모든 가능한 PAM 서열 및 추정된 표적 부위가 확인되면, 다음 단계는 가장 효율적인 표적 위의 절개(on-target cleavage)를 생성하는 경향이 있다. gRNA 표적화 서열은 표적 서열과 일치할 필요가 있고, gRNA 표적화 서열은 게놈내 추가의 부위와 일치하지 않아야 한다. 바람직한 구현예에서, gRNA 표적화 서열은 게놈내 어느 곳에서도 상동성이 없는 표적에 대해 완전한 상동성을 갖는다. 일부 구현예에서, 제공된 gRNA 표적화 서열은 부분 상동성이 존재하는 게놈 전체에서 추가의 부위를 가질 것이다. 이러한 부위는 "오프-표적(off-target)"으로 불리며 gRNA를 설계하는 경우 고려되어야 한다. 일반적으로, 오프-표적 부위는 PAM 서열 근처에서 불일치가 발생하는 경우 효율적으로 절단되지 않으므로, 상동성을 지니지 않는 gRNA 또는 PAM 서열에 근접하여 불일치를 지닌 것은 최대 특이성을 가질 것이다. "오프-표적 활성" 외에도, 목적한 표적 서열의 절단을 최대화하는 인자("온-표적 활성(on-target activity)")이 고려되어야만 한다. 각각 표적 DNA에 대해 100% 상동성을 갖는, 2개의 gRNA 표적화 서열이 동등한 절개 효능을 생성하지 않을 수 있음은 당해 분야의 기술자에게 알려져 있다. 실제로, 절개 효율은 선택된 표적 서열내에 특이적인 뉴클레오타이드에 의존하여 증가하거나 감소할 수 있다. 각각의 잠재적인 gRNA 표적화 서열의 온-표적 및 오프-표적 활성의 엄밀한 검사는 최고의 gRNA를 설계하는데 필요하다. 잠재적인 PAM 및 표적 서열을 위치시키고 관련된 gRNA를 이들의 예측된 온-표적 및 오프-표적 활성(예컨대, CRISPRdirect, www.crispr.dbcls.jp에서 이용가능함)을 기반으로 하여 관련된 gRNA를 순위매길 수 있는 수 개의 gRNA 설계 프로그램이 개발되었다.
다음 단계는 목적한 gRNA를 합성하고 클로닝하는 것이다. 표적화 올리고는 합성하고, 어닐링(annealing)하여, 표준 제한-연결 클로닝을 사용함으로써 gRNA 스캐폴드를 함유하는 플라스미드내로 삽입할 수 있다. 그러나, 정확한 클로닝 전략은 선택되는 gRNA 벡터에 의존할 것이다. Cpf1에 대한 gRNA는 Cas9에 대한 gRNA보다 특히 더 단순하며, 직접적인 반복물 스캐폴드 서열에 이은 가이드 서열의 ~24개 뉴클레오타이드를 함유하는 단일 crRNA로 단지 이루어진다.
각각의 gRNA는 이후에 하나 이상의 표적 세포 주내에서 입증되어야 한다. 예를 들면, Cas9 또는 Cpf1 및 gRNA가 세포내로 전달된 후, 게놈 표적 영역은 PCR을 사용하여 증폭될 수 있고 당해 분야의 기술자에게 공지된 방법에 따라 서열분석될 수 있다.
일부 구현예에서, 유전자 편집은 시험관내 또는 생체외에서 수행될 수 있다. 일부 구현예에서, 세포는 시험관내 또는 생체외에서 Cas9 또는 Cpf1 및 디스트로핀 스플라이스 부위를 표적화하는 gRNA와 접촉된다. 일부 구현예에서, 세포는 Cas9 또는 Cpf1 및 가이드 RNA를 암호화하는 하나 이상의 핵산과 접촉된다. 일부 구현예에서, 하나 이상의 핵산은 예를 들면, 지질감염 또는 전기천공을 사용하여 세포내로 도입된다. 유전자 편집은 또한 접합체내에서 수행될 수 있다. 구현예에서, 접합체는 Cas9 또는 Cpf1을 암호화하는 하나 이상의 핵산 및 디스트로핀 스플라이스 부위를 표적화하는 gRNA와 함께 주사될 수 있다. 접합체는 후속적으로 숙주내로 주사될 수 있다.
구현예에서, Cas9 또는 Cpf1은 벡터 상에 제공된다. 구현예에서, 벡터는 에스. 피오게네스(S. pyogenes)로부터 유래된 Cas9(SpCas9, 서열 번호: 872)를 함유한다. 구현예에서, 벡터는 에스. 아우레우스(S. aureus)로부터 유래된 Cas9(SaCas9, 서열 번호: 873)를 함유한다. 구현예에서, 벡터는 라크노스피라세아에(Lachnospiraceae) 세균으로부터 유래된 Cpf1 서열을 함유한다. 예를 들면, 유니프롯 수탁 번호 A0A182DWE3; 서열 번호: 871을 참고한다. 구현예에서, 벡터는 악시드아미노코쿠스 세균으로부터 유래된 Cpf1 서열을 함유한다. 예를 들면, 유니프롯 수탁 번호 U2UMQ6; 서열 번호: 870을 참고한다. 일부 구현예에서, Cas9 또는 Cpf1 서열은 사람 세포 또는 마우스 세포에서 발현을 위해 최적화된 코돈이다. 일부 구현예에서, 벡터는 또한 GFP와 같은 형광성 단백질을 암호화하는 서열을 함유하며, 이는 Cas 9 또는 Cpf1-발현 세포가 형광성 활성화된 세포 분류(fluorescence activated cell sorting: FACS)를 사용하여 분류되도록 한다. 일부 구현예에서, 벡터는 아데노-관련 바이러스 벡터와 같은 바이러스 벡터이다.
구현예에서, gRNA는 벡터 상에 제공된다. 일부 구현예에서, 벡터는 아데노-관련 바이러스 벡터와 같은 바이러스 벡터이다. 구현예에서, Cas9 또는 Cpf1 및 가이드 RNA는 동일한 벡터 상에 제공된다. 구현예에서, Cas9 또는 Cpf1 및 가이드 RNA는 상이한 벡터 상에 제공된다.
일부 구현예에서, 세포는 단일-가닥 DNA 올리고뉴클레오타이드와 추가로 접촉함으로써 상동성 지시된 복구를 수행한다. 일부 구현예에서, 작은 INDEL은 디스트로핀의 단백질 판독 프레임을 회복한다("재프레임화(reframing)" 전략). 재프레임화 전략이 사용된 경우, 세포는 단일 gRNA와 접촉할 수 있다. 구현예에서, 스플라이스 공여체 또는 스플라이스 수용체 부위는 파괴되며, 이는 단백질 판독 프레임의 엑손 스키핑 및 복원을 야기한다("엑손 스키핑" 전략). 엑손 스키핑 전략이 사용되는 경우, 세포는 2개 이상의 gRNA와 접촉할 수 있다.
시험관내 또는 생체외 Cas9 또는 Cpf1-매개된 DNA 절단의 효능은 당해 분야에 공지된 기술, 예컨대, T7 E1 검정을 사용하여 평가할 수 있다. DMD 발현의 회복은 당해 분야의 기술자에게 공지된 기술, 예컨대, RT-PCR, 웨스턴 블롯팅, 및 면역세포화학을 사용하여 확인할 수 있다.
일부 구현예에서, 시험관내 또는 생체외 유전자 편집은 근육 및 위성(satellite) 세포에서 수행한다. 일부 구현예에서, 유전자 편집은 iPSC 또는 iCM 세포에서 수행한다. 구현예에서, iPSC 세포는 유전자 편집 후 분화된다. 예를 들면, iPSC 세포는 편집 후 근육 세포 또는 위성 세포로 분화될 수 있다. 구현예에서, iPSC 세포는 심장 근육 세포, 골격 근육 세포, 또는 평활근 세포로 분화된다. 구현예에서, iPSC 세포는 심근세포로 분화된다. iPSC 세포는 당해 분야의 기술자에게 공지된 방법에 따라 분화하도록 유도될 수 있다.
일부 구현예에서, 세포와 Cas9 또는 Cpf1 및 gRNA의 접촉은 디스트로핀 발현을 회복한다. 구현예에서, 시험관내 또는 생체외에서 편집된 세포, 또는 이로부터 유래된 세포는 야생형 세포와 비교가능한 디스트로핀 단백질의 수준을 나타낸다. 구현예에서, 편집된 세포 또는 이로부터 유래된 세포는 디스트로핀을 야생형 디스트로핀 발현 수준의 사이에서 50%, 60%, 70%, 80%, 90%, 95% 또는 임의의 퍼센트의 수준으로 발현한다. 구현예에서, 시험관내 또는 생체외 편집된 세포, 또는 이로부터 유래된 세포는 야생형 세포의 것과 비교가능한 미토콘드리아 수를 갖는다. 구현예에서, 편집된 세포, 또는 이로부터 유래된 세포는 야생형 세포와 같은 많은 미토콘드리아 사이에서 50%, 60%, 70%, 80%, 90%, 95% 또는 임의의 퍼센트를 갖는다. 구현예에서, 편집된 세포, 또는 이로부터 유래된 세포는 편집되지 않는 세포와 비교하여 기본선에서 산소 소비율(OCR)의 증가를 나타낸다.
G. RNA Pol III 및 Pol III 프로모터
진핵세포에서, RNA 폴리머라제 III(또한 Pol III으로 지칭됨)은 DNA를 전사하여 리보솜 5S rRNA, tRNA 및 다른 작은 RNA를 합성한다. RNA Pol III에 의해 전사된 유전자는 이의 발현이 모든 세포형 및 대부분의 환경 조건에서 요구되는 "하우스키핑(housekeeping)" 유전자의 범주에 속한다. 따라서, Pol III 전사의 조절은 세포 성장 및 세포 주기의 조절에 주로 묶여있으므로, RNA 폴리머라제 II보다 더 적은 조절 단백질을 필요로 한다. 그러나, 스트레스 조건 하에서, 단백질 Maf1은 Pol III 활성을 억제한다.
전사 공정(임의의 폴리머라제에 의한)에서, 3개의 주요 단계가 존재한다: (i) 유전자의 프로모터에서 RNA 폴리머라제 복합체의 작제를 필요로 하는 개시; (ii) 연장, RNA 전사체의 합성; 및 (iii) 종결, RNA 전사 및 RNA 폴리머라제 복합체의 분해의 마무리.
RNA Pol III의 제어하에서의 프로모터는 리보솜 5S rRNA, tRNA에 대한 것 및 약간의 다른 작은 RNA, 예컨대 U6 스플라이시오솜(spliceosomal) RNA, RNase P 및 RNase MRP RNA, 7SL RNA(시그날 인식 입자의 RNA 성분), Vault RNA, Y RNA, SINE(짧은 산재된 반복적 성분(short interspersed repetitive element)), 7SK RNA, 2개의 마이크로RNA, 수개의 작은 핵 RNA 및 수개의 적은 조절 안티센스 RNA를 포함한다.
IV. 핵산 전달
위에 논의된 바와 같이, 특정의 구현예에서, 발현 카세트를 사용하여 후속적인 정제 및 세포/대상체로의 전달을 위해, 또는 유전-기반 전달 시도에서 직접 사용하기 위한, 전사 인자 생성물을 발현한다. Cas9 또는 Cpf1을 암호화하는 하나 이상의 핵산 및 디스트로핀 스플라이스 부위를 표적화하는 적어도 하나의 DMD 가이드 RNA를 함유하는 발현 벡터가 본원에 제공된다. 일부 구현예에서, Cas9 또는 Cpf1을 암호화하는 핵산 및 적어도 하나의 가이드 RNA를 암호화하는 핵산은 동일한 벡터 상에 제공된다. 추가의 구현예에서, Cas9 또는 Cpf1을 암호화하는 핵산 및 적어도 하나의 가이드 RNA를 암호화하는 핵산은 별도의 벡터에 제공된다.
발현은 적절한 신호가 벡터 내에 제공됨을 필요로 하며, 세포내에서 목적한 유전자의 발현을 구동시키는 바이러스 및 포유동물 공급원 둘 다로부터의 인핸서/프로모터와 같은 다양한 조절 성분을 포함한다. 전령 RNA 안전성 및 숙주 세포내에서의 해독성(translatability)을 최적화하도록 설계된 성분이 또한 정의된다. 생성물을 발현하는 영구적이고, 안정한 세포 클론을 확립하기 위한 다수의 우성 약물 선택 마커를 사용하기 위한 조건은, 약물 선택 마커의 발현을 폴리펩타이드의 발현에 연결시키는 성분이므로, 또한 제공된다.
A. 조절 성분
본 출원 전반에 걸쳐서, 용어 "발현 카세트"는 서열을 암호화하는 핵산 중 일부 또는 모두가 전사되고 해독될 수 있는, 즉, 프로모터의 제어하에 있는 유전자 생성물을 암호화하는 핵산을 함유하는 임의의 유형의 유전 작제물을 포함함을 의미한다. "프로모터"는 세포의 합성기에 의해 인식되거나, 유전자의 특이적인 전사를 개시하는데 필요한 DNA 서열을 지칭한다. 어구 "전사 제어 하에"는 프로모터가 핵산과 관련한 정확한 위치 및 배향으로 있어서 RNA 폴리머라제 개시 및 유전자의 발현을 제어함을 의미한다. "발현 벡터"는 복제될 수 있는 유전 작제물 내에 포함됨으로써 하나 이상의 복제 오리진(origin of replication), 전사 종결 신호, 폴리-A 영역, 선택가능한 마커, 및 다목적 클로닝 부위를 포함하는 발현 카세트를 포함함을 의미한다.
용어 프로모터는 RNA 폴리머라제 II에 대한 개시 부위 주변에 군집되는 전사 제어 모듈의 그룹을 지칭하기 위해 본원에서 사용될 것이다. 프로모터가 구조화되는 방법에 대한 사고의 대부분은 HSV 티미딘 키나제(tk) 및 SV40 조기 전사 단위에 대한 것을 포함하는 수개의 프로모터의 분석으로부터 유래한다. 보다 최근의 연구에 의해 강화된 이러한 연구는 프로모터가 별개의 기능적 모듈로 구성되며, 각각은 대략 7 내지 20 bp의 DNA로 이루어지고, 전사 활성인자 또는 리프레서(repressor) 단백질에 대한 하나 이상의 인식 부위를 함유함을 입증하였다.
각각의 프로모터내 적어도 하나의 모듈은 RNA 합성을 위한 출발 부위를 위치시키도록 기능한다. 이의 가장 잘 알려진 예는 TATA 박스이지만, TATA 박스를 결여하고 있는 일부 프로모터, 예컨대, 포유동물 말단 데옥시뉴클레오티딜 트랜스퍼라제 유전자에 대한 프로모터 및 SV40 레이트 유전자(late gene)에 대한 프로모터에서, 출발 부위 자체에 놓여있는 별개의 성분은 개시의 위치를 고정시키는 것을 돕는다.
일부 구현예에서, 본 개시내용의 Cas9 또는 Cpf1 작제물은 근육-세포 특이적인 프로모터에 의해 발현된다. 이러한 근육-세포 특이적인 프로모터는 구성적으로 활성일 수 있거나 유도성 프로모터일 수 있다.
추가의 프로모터 성분은 전사 개시의 빈도를 조절한다. 전형적으로, 다수의 프로모터가 최근에 출발 부위의 하부의 기능성 성분을 또한 함유하는 것으로 밝혀졌지만, 이는 출발 부위의 상부의 30 내지 110 bp 영역에 위치한다, 프로모터 성분 사이의 간격(spacing)은 성분이 역위되거나 서로에 대해 이동하는 경우 보존된다. tk 프로모터에서, 프로모터 성분 사이의 간격은 활성이 감소되기 시작하기 전에 50 bp 떨어져서 증가될 수 있다. 프로모터에 따라서, 이는 개개 성분이 동시-협동적으로 또는 별도로 전사를 활성화시키기 위해 기능할 수 있는 것으로 나타난다.
특정의 구현예에서, 사람 사이토메갈로바이러스(CMV) 이미디어트 얼리(immediate early) 유전자 프로모터, SV40 얼리 프로모터, 로우스 육종 바이러스 롱 말단 반복물(Rous sarcoma virus long terminal repeat), 랫트 인슐린 프로모터 및 글리세르알데하이드-3-포스페이트 데하이드로게나제와 같은 바이러스 프로모터를 사용하여 목적한 암호화 서열의 고-수준 발현을 수득할 수 있다. 목적한 암호화 서열의 발현을 달성하기 위해 당해 분야에 잘 알려진 다른 바이러스 또는 포유동물 세포 또는 세균 파아지 프로모터의 사용이 또한 고려되며, 단, 발현 수준은 제공된 목적에 충분하다. 잘 알려진 특성의 프로모터를 사용함으로써, 형질감염 및 형질전환 후 목적한 단백질의 발현 수준 및 패턴을 최적화시킬 수 있다. 또한, 특이적인 생리학적 신호에 대한 반응시 조절되는 프로모터의 선택은 유전자 생성물의 유도성 발현을 허용할 수 있다.
인핸서는 DNA의 동일한 분자에서 먼 위치에 위치하는 프로모터로부터 전사를 증가시키는 유전 성분이다. 인핸서는 프로모터와 매우 유사하게 구조화된다. 즉, 이들은 많은 개개 성분으로 구성되며, 이들 각각은 하나 이상의 전사 단백질에 결합한다. 인핸서와 프로모터 사이의 기본적인 차이는 작동성(operational)이다. 전체적으로 인핸서 영역은 먼 거리에서 전사를 자극할 수 있어야만 하며; 이는 프로모터 영역 또는 이의 구성성분 인자일 필요가 없다. 다른 한편, 프로모터는 특수한 부위 및 특히 배향에서 RNA 합성의 개시를 지시하는 하나 이상의 인자를 가져야만 하는 반면, 인핸서는 이러한 특이성을 결여하고 있다. 프로모터 및 인핸서는 흔히 매우 유사한 모듈러 조직화(modular organization)를 갖는 것으로 여겨지는, 오버랩핑(overlapping) 및 연속적이다.
하기는 발현 작제물내 관심있는 유전자를 암호화하는 핵산과 함께 사용될 수 있는 프로모터/인핸서 및 유도성 프로모터/인핸서의 목록이다. 또한, 임의의 프로모터/인핸서 조합(진핵세포 프로모터 데이타 베이스 EPDB에 따라)을 또한 사용하여 유전자의 발현을 구동시킬 수 있다. 진핵 세포는 적절한 세균 폴리머라제가 전달 복합체의 일부로서 또는 추가의 유전 발현 작제물로서 제공되는 경우 특정의 세균 프로모터로부터 세포질성 전사를 뒷받침할 수 있다.
프로모터 및/또는 인핸서는 예를 들면, 면역글로불린 경쇄, 면역글로불린 중쇄, T-세포 수용체, HLA DQ a 및/또는 DQ β, β-인터페론, 인터루킨-2, 인터루킨-2 수용체, MHC 부류 II 5, MHC 부류 II HLA-Dra, β-액틴, 근육 크레아틴 키나제(MCK), 프레알부민(트랜스티레틴), 엘라스타제 I, 메탈로티오네인(MTII), 콜라게나제, 알부민, α-페토단백질, t-글로빈, β-글로빈, c-fos, c-HA-ras, 인슐린, 신경 세포 부착 분자(NCAM), α1-안티트리파인, H2B(TH2B) 히스톤, 마우스 및/또는 제I형 콜라겐, 글루코즈-관련 단백질(GRP94 및 GRP78), 랫트 성장 호르몬, 사람 혈청 아밀로이드 A(SAA), 트로포닌 I(TN I), 혈소판-유래 성장 인자(PDGF), 듀켄씨 근 이영양증, SV40, 폴리오마, 레트로바이러스, 파필로마 바이러스, B형 간염 바이러스, 사람 면역결핍증 바이러스, 사이토메갈로바이러스(CMV), 및 긴팔 원숭이 백혈병 바이러스(gibbon ape leukemia virus)일 수 있다.
일부 구현예에서, 유도성 인자가 사용될 수 있다. 일부 구현예에서, 유도성 인자는 예를 들면, MTII, MMTV(마우스 유방 종양 바이러스), β-인터페론, 아데노바이러스 5 E2, 콜라게나제, 스트로멜라이신, SV40, 쥐 MX 유전자, GRP78 유전자, α-2-마크로글로불린, 비멘틴, MHC 부류 I 유전자 H-2kb, HSP70, 프롤리페린, 종양 괴사 인자, 및/또는 갑상선 자극 호르몬 유전자이다. 일부 구현예에서, 유도인자는 포르볼 에스테르(TFA), 중금속, 글루코코르티코이드, 폴리(rI)x, 폴리(rc), ElA, 포르볼 에스테르(TPA), 인터페론, 뉴캐슬 질환 바이러스(Newcastle Disease Virus), A23187, IL-6, 혈청, 인터페론, SV40 거대 T 항원, PMA, 및/또는 갑상선 호르몬이다. 본원에 기술된 유도성 인자 중 어느 것도 본원에 기술된 유도인자 중 어느 것과 함께 사용될 수 있다.
특히 관심있는 것은 근육 특이적인 프로모터이다. 이는 미오신 경쇄-2 프로모터, α-액틴 프로모터, 트로포닌 1 프로모터; Na+/Ca2+ 교환체(exchanger) 프로모터, 디스트로핀 프로모터, α7 인테그린 프로모터, 뇌 나트륨뇨설의 펩타이드 프로모터 및 αB-크리스탈린/소 열 쇼크 단백질(small heat shock) 단백질 프로모터, α-마이오신 중쇄 프로모터 및 ANF 프로모터를 포함한다. 일부 구현예에서, 근육 특이적인 프로모터는 CK8 프로모터이다. CK8 프로모터는 다음의 서열(서열 번호: 874)을 갖는다:
일부 구현예에서, 근육-세포 세포 특이적인 프로모터는 CK8e로 불리는 CK8 프로모터의 변이체이다. CK8e 프로모터는 다음의 서열(서열 번호: 875)을 갖는다:
cDNA 삽입체를 사용하는 경우, 유전자 전사체의 적절한 폴리아데닐화를 달성하기 위한 폴리아데닐화 신호를 포함하는 것이 전형적으로 바람직할 것이다. 사람 성장 호르몬 및 SV40 폴리아데닐화 신호와 같은 임의의 폴리아데닐화 서열을 사용할 수 있다. 또한 발현 카세트의 인자로서 터미네이터가 고려된다. 이러한 인자는 전령 수준을 향상시키고 카세트로부터 다른 서열내로를 통해 판독물을 최소화시키는 작용을 할 수 있다.
B. 2A 펩타이드
일부 구현예에서, 곤충 바이러스 토세아 아시그나(Thosea asigna)로부터의 2A-유사 자가-절단하는 도메인(TaV 2A 펩타이드)(서열 번호: 876, EGRGSLLTCGDVEENPGP)을 사용한다. 이러한 2A-유사 도메인은 진핵세포에 걸쳐서 기능하여 아미노산의 절단이 2A-유사 펩타이드 도메인내에 공-해독적으로 발생하도록 유발하는 것으로 밝혀졌다. 따라서, TaV 2A 펩타이드의 포함은 단일 mRNA 전사체로부터 다중 단백질의 발현을 허용한다. 중요하게는, TaV의 도메인은 진핵세포 시스템에서 시험하는 경우 99% 이상의 절단 활성을 나타낸다. 다른 허용되는 2A-유사 펩타이드는 말 비염 A 바이러스(ERAV) 2A 펩타이드(서열 번호: 877; QCTNYALLKLAGDVESNPGP), 돼지 테스초바이러스(porcine teschovirus)-1(PTV1) 2A 펩타이드(서열 번호: 878; ATNFSLLKQAGDVEENPGP) 및 수족구 질환 바이러스(FMDV) 2A 펩타이드(서열 번호: 879; PVKQLLNFDLLKLAGDVESNPGP) 또는 이의 변형된 버젼을 포함하나, 이에 한정되지 않는다.
일부 구현예에서, 2A 펩타이드는 리포터 및 Cas9 또는 Cpf1을 동시에 발현시키기 위해 사용된다. 리포터는 예를 들면, GFP일 수 있다.
사용될 수 있는 다른 자가-절단 펩타이드는 핵 포함 단백질 (Nia) 프로테아제, P1 프로테아제, 3C 프로테아제, L 프로테아제, 3C-유사 프로테아제, 또는 이의 변형된 버젼을 포함하나, 이에 한정되지 않는다.
C. 발현 벡터의 전달
발현 벡터가 세포내로 도입될 수 있는 다수의 방법이 존재한다. 특정의 구현예에서, 발현 작제물은 바이러스 게놈으로부터 기원한 바이러스 또는 가공된 작제물(engineered construct)을 포함한다. 수용체-매개된 세포내이입을 통해 세포내로 도입하고, 숙주 세포 게놈내로 통합되며 바이러스 유전자를 안정하고 효율적으로 발현시키는 특정의 바이러스의 능력은 이들을 포유동물 세포내로의 외부 유전자의 전달을 위한 매력적인 후보물이 되도록 한다. 이들은 외부 DNA 서열에 대해 비교적 낮은 능력을 가지며 제한된 숙주 스펙트럼을 갖는다. 또한, 허용되는 세포에서 이들의 종양원성의 잠재적인 및 세포병리학적 효과는 안전성 관심을 상승시킨다. 이들은 단지 8 kB 이하의 외부 유전 물질을 수용하지만 다양한 세포주 및 실험실 동물내에 용이하게 도입될 수 있다.
생체내(in vivo) 전달을 위한 바람직한 방법들 중 하나는 아데노바이러스 발현 벡터의 사용을 포함한다. "아데노바이러스 발현 벡터"는 작제물의 패키징을 뒷받침하고 (b) 여기에 클로닝된 안티센스 폴리뉴클레오타이드를 발현하기에 충분한 아데노바이러스 서열을 함유하는 작제물을 포함함을 의미한다. 이러한 맥락에서, 발현은 유전자 생성물이 합성되는 것을 필요로 하지 않는다.
발현 벡터는 아데노바이러스의 유전적으로 가공된 형태를 포함한다. 아데노바이러스의 유전 기구화의 지식, 36 kB의, 선형의 이중-가닥 DNA 바이러스는 아데노바이러스 DNA의 큰 조각을 7 kB 이하의 외부 서열로 치환하도록 한다. 레트로바이러스와는 대조적으로, 숙주 세포의 아데노바이러스 감염은 아데노바이러스 DNA가 잠재적인 유전독성없이 에피솜 방식으로 복제할 수 있기 때문에 염색체 통합을 생성하지 않는다. 또한, 아데노바이러스는 구조적으로 안정하며, 집중적인 증폭 후 게놈 재배열이 검출되지 않는다. 아데노바이러스는 이들의 세포 주기 단계와는 상관없이 모든 내피 세포를 실질적으로 감염시킬 수 있다. 지금까지, 아데노바이러스 감염은 사람에서 급성 호흡성 질환과 같은 가벼운 질환에만 연결된 것으로 나타난다.
아데노바이러스는 이의 중간-크기의 게놈, 조작의 용이성, 높은 역가(titer), 광범위한 표적 세포 범위 및 고 감염성으로 인하여 유전자 전달 벡터로서 사용하기에 특히 적합하다. 바이러스 게놈의 말단 둘 다는 100 내지 200개의 염기쌍의 역위된 반복물(ITR)을 포함하며, 이는 바이러스 DNA 복제 및 패키지에 필수적인 시스(cis) 인자이다. 게놈의 얼리(E) 및 레이트(L) 영역은 바이러스 DNA 복제의 발생에 의해 분할된 상이한 전사 단위를 함유한다. E1 영역(E1A 및 E1B)은 바이러스 게놈 및 소수의 세포 유전자의 전사의 조절에 관여하는 단백질을 암호화한다. E2 영역(E2A 및 E2B)의 발현은 바이러스 DNA 복제를 위한 단백질의 합성을 야기한다. 이러한 단백질은 DNA 복제, 레이트 유전자 발현 및 숙주 세포 셧-오프(shut-off)에 관여한다. 대부분의 바이러스 캡시드 단백질을 포함하는 레이트 유전자의 생성물은 주요 레이트 프로모터(MLP)에 의해 비롯된 단일 주요 전사체의 유의적인 프로세싱 후에만 발현된다. MLP, (16.8 m.u.에 위치)는 특히 말기 감염 상 동안에 효율적이며, 이러한 프로모터로부터 비롯된 mRNA 모두는 이들을 해독용의 바람직한 mRNA로 만드는 5□-트리파타이트 리더(tripartite leader: TPL) 서열을 지닌다. 하나의 시스템에서, 재조합 아데노바이러스는 셔틀 벡터와 프로바이러스 벡터 사이의 동종 재조합으로부터 생성된다. 2개의 프로바이러스 벡터 사이의 가능한 재조합으로 인하여, 야생형 아데노바이러스는 이러한 공정으로부터 생성될 수 있다. 따라서, 개개 플라크(plaque)로부터 바이러스의 단일 클론을 단리하고 이의 게놈 구조를 시험하는 것이 중요하다.
복제 결핍성인, 현재의 아데노바이러스 벡터의 생성 및 증식은 293으로 지정된 유일한 헬퍼 세포주에 의존하며, 이는 사람 배아 신장 세포로부터 Ad5 DNA 단편에 의해 형질전환되어 E1 단백질을 구성적으로 발현한다. E3 영역이 아데노바이러스 게놈으로부터 불필요하므로, 현재의 아데노바이러스 벡터는, 293 세포의 도움으로, E1, D3 또는 둘 다의 영역에서 외부 DNA를 운반한다. 특성상, 아데노바이러스는 야생형 게놈의 대략 105%를 패키지할 수 있으며, 약 2의 추가 kb의 DNA에 대한 능력을 제공한다. E1 및 E3 영역에서 교체가능한 DNA의 대략 5.5 kb와 조합함으로써, 현재의 아데노바이러스 벡터의 최대 능력은 7.5 kb 미만, 벡터의 총 길이의 약 15%이다. 80% 이상의 아데노바이러스 게놈은 벡터 골격내에 남아있으며 벡터-유래된 세포독성의 공급원이다. 또한, E1-결실된 바이러스의 복제 결핍성은 불완전하다.
헬퍼 세포주는 사람 배아 신장 세포, 근육 세포, 조혈 세포 또는 다른 사람 배아 간엽성 또는 내피 세포와 같은 사람 세포로부터 유래될 수 있다. 대안적으로, 헬퍼 세포는 사람 아데노바이러스에 대해 허용성인 다른 포유동물 종의 세포로부터 유래될 수 있다. 이러한 세포는 예컨대, 베로 세포(Vero cell) 또는 다른 원숭이 배아 간엽 또는 내피 세포를 포함한다. 상기 기술한 바와 같이, 바람직한 헬퍼 세포주는 293이다.
293개의 세포를 배양하고 아데노바이러스를 증식하는 개선된 방법은 당해 분야에 알려져 있다. 하나의 양식에서, 천연 세포 집합체는 개개 세포를 100 내지 200 ml의 배지를 함유하는 1 리터들이의 실리콘화된 스피너 플라스크(siliconized spinner flask)(Techne, 영국 캠프릿지 소재)내로 접종함으로써 성장시킨다. 40 rpm에서 교반한 후, 세포 생존능을 트립판 블루로 평가한다. 다른 양식으로, 피브라-셀 미세담체(Fibra-Cel microcarrier)(Bibby Sterlin, 영국 스톤 소재)(5 g/l)를 다음과 같이 사용한다. 5 ml의 배지 속에 재현탁된 세포 접종물을 250 ml의 에를렌마이어 플라스크(Erlenmeyer flask) 속의 담체(50 ml)에 가하고 1 내지 4시간 동안 이따금씩 교반하면서 정지 상으로 둔다. 이후에, 배지를 50 ml의 신선한 배지로 교체하고 진탕을 개시한다. 바이러스 생산을 위해, 세포를 약 80% 합치성(confluence)으로 성장하도록 한 후, 배지를 교체(최종 용적의 25%까지)하고 아데노바이러스를 0.05의 MOI에서 가한다. 배양물을 밤새 정지상으로 둔 후, 용적을 100%로 증가시키고 진탕을 다른 72시간 동안 개시하였다.
본 개시내용의 아데노바이러스는 복제 결함성이거나, 적어도 조건적으로 복제 결함성이다. 아데노바이러스는 42개의 상이한 공지된 혈청형 또는 서브 그룹 A 내지 F 중의 어느 것일 수 있다. 서브그룹 C의 아데노바이러스 5형은 본 개시내용에서 사용하기 위한 조건적 복제-결함성 아데노바이러스 벡터를 수득하기 위한 바람직한 출발 물질이다.
상술한 바와 같이, 본 개시내용에 따른 대표적인 벡터는 복제 결함성이고 아데노바이러스 E1 영역을 가지지 않을 것이다. 따라서, 이는 목적한 유전자를 암호화하는 폴리뉴클레오타이드를 E1-암호화 서열이 제거된 위치에 도입시키는 것이 가장 편리할 것이다. 그러나, 아데노바이러스 서열내 작제물의 삽입 위치는 중요하지 않다. 목적한 유전자를 암호화하는 폴리뉴클레오타이드는 또한 E3 대체 벡터내 결실된 E3 영역 대신에, 또는 헬퍼 세포주 또는 헬퍼 바이러스가 E4 결함을 보충하는 E4 영역에서 삽입될 수 있다.
아데노바이러스는 성장 및 조작하기 용이하고 시험관내 및 생체내에서 광범위한 숙주 범위를 나타낸다. 바이러스의 이러한 그룹은 고 역가, 예컨대, ml당 109 내지 1012개의 플라크-형성 단위로 수득될 수 있으며 고도로 감염성이다. 아데노바이러스의 생애 주기는 숙주 세포 게놈내로의 통합을 필요로 하지 않다. 아데노바이러스 벡터에 의해 전달된 외부 유전자는 에피솜이므로, 숙주 세포에 대해 낮는 유전독성을 갖는다. 야생형 아데노바이러스를 사용한 백신접종의 연구에서 부작용을 보고되어 있지 않으며, 이는 생체내 유전자 전달 벡터에서와 같이 이들의 안전성 및 치료학적 효능을 입증한다.
아데노바이러스 벡터는 진핵세포 유전자 발현 및 백신 발달에 사용되어 왔다. 동물 연구는 재조합 아데노바이러스가 유전자 치료요법에 사용될 수 있음을 시사한다. 재조합 아데노바이러스를 상이한 조직에 투여하는데 있어서의 연구는 기관 점적주입법, 근육 주사, 말초 정맥내 주사 및 뇌내로의 정위 접종(stereotactic inoculation)을 포함한다.
레트로바이러스는 역-전사의 공정에 의해 감염된 세포내에서 이들의 RNA를 이중-가닥 DNA로 전환시키는 능력에 의해 특징화된 단일-가닥 RNA 바이러스의 그룹이다. 수득되는 DNA는 이후에 프로바이러스로서 세포 염색체내로 안정하게 통합되어 바이러스 단백질의 합성을 지시한다. 통합은 수용체 세포 및 이의 자손에서 바이러스 유전자 서열의 보유를 야기한다. 레트로바이러스 게놈은 캡시드 단백질, 폴리머라제 효소, 및 엔벨로프 성분 각각을 암호화하는 3개의 유전자, gag, pol, 및 env를 함유한다. gag 유전자로부터 상부에서 발견된 서열은 비리온(virion)내로 게놈을 패키징하기 위한 신호를 함유한다. 2개의 긴 말단 반복물(LTR) 서열은 바이러스 게놈의 5' 및 3' 말단에 존재한다. 이는 강력한 프로모터 및 인핸서 서열을 함유하며 또한 숙주 세포 게놈내 통합을 위해 요구된다.
레트로바이러스 벡터를 작제하기 위해, 목적한 유전자를 암호화하는 핵산은 특정의 바이러스 서열 대신에 바이러스 게놈내로 삽입되어 복제-결함성인 바이러스를 생산한다. 비리온을 생산하기 위해, gag, pol, 및 env 유전자를 함유하지만 LTR 및 패키징 성분이 없는 패키징 세포주가 작제된다. 레트로바이러스 LTR 및 패키징 서열과 함께, cDNA를 함유하는 재조합 플라스미드가 이러한 세포주내로 도입된 경우(예를 들면, 인산칼슘 침전에 의해), 패키징 서열은 재조합체 플라스미드의 RNA 전사체가 바이러스 입자내로 패키지되도록 하며, 이는 이후 배양 배지내로 분비된다. 이후 재조합 레트로바이러스를 함유하는 배지를 수집하고, 임의로 농축시키며 유전자 전달을 위해 사용한다. 레트로바이러스 벡터는 광범위하게 다양한 세포형을 감염시킬 수 있다. 그러나, 통합 및 안정한 발현은 숙주 세포의 분열을 요구한다.
레트로바이러스 벡터를 특이적으로 표적화하도록 설계된 새로운 시도가 락토즈 잔기를 바이러스 엔벨로프에 화학적 첨가함으로써 레트로바이러스의 화학적 변형을 기반으로 최근에 개발되었다. 이러한 변형은 시알로글리코단백질 수용체를 통해 간세포의 특이적인 감염을 허용할 수 있었다.
재조합 레트로바이러스를 표적화하기 위한 상이한 시도를 사용할 수 있으며, 여기서 레트로바이러스 엔벨로프 단백질에 대한 및 특이적인 세포 수용체에 대한 바이오티닐화된 항체가 사용된다. 항체는 스트렙타비딘을 사용함으로써 바이오틴 성분을 통해 커플링된다. 주요 조직적합성 복합체 제I 부류 및 제II 부류 항원에 대한 항체를 사용하여, 시험관내 동종지향성 바이러스로 이러한 표면 항원을 생성하는 다양한 사람 세포의 감염이 입증되어 왔다(Roux et al., 1989).
본 개시내용의 모든 양태에서 레트로바이러스 벡터의 사용에 대한 특정의 제한이 있다. 예를 들면, 레트로바이러스 벡터는 일반적으로 세포 게놈내에 무작위 부위로 통합된다. 이는 숙주 유전자의 중단을 통해 또는 플랭킹(flanking) 유전자의 기능을 방해할 수 있는 바이러스 조절 서열의 삽입을 통해 삽입 돌연변이유발을 초래할 수 있다. 결함이 있는 레트로바이러스 벡터를 사용한 다른 관심은 패키징 세포내에서 야생형 복제-적격성(replication-competent) 바이러스의 잠재적인 출현이다. 이는 재조합 사건으로부터 생성될 수 있으며, 여기서 재조합 바이러스로부터의 온전한- 서열은 숙주 세포 게놈내 통합된 gag, pol, env 서열로부터 상부에 삽입된다. 그러나, 재조합 경향성을 크게 감소시켜야 하는 새로운 패키징 세포주가 현재 이용가능하다(참고: 예를 들면, Markowitz et al., 1988; Hersdorffer et al., 1990).
다른 바이러스 벡터는 본 개시내용에서 발현 작제물로서 사용될 수 있다. 박시니아 바이러스 아데노-관련 바이러스(AAV) 및 헤르페스바이러스와 같은 바이러스로부터 유래된 벡터를 사용할 수 있다. 이들은 다양한 포유동물 세포에 대한 수개의 매력적인 특징을 제공한다.
구현예에서, AAV 벡터는 복제-결합성이거나 조건적으로 복제 결함성이다. 구현예에서, AAV 벡터는 재조합 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된 서열을 포함한다.
일부 구현예에서, 단일의 바이러스 벡터를 사용하여 Cas9 또는 Cpf1을 암호화하는 핵산 및 적어도 하나의 gRNA를 세포로 전달하는데 사용된다. 일부 구현예에서, Cas9 또는 Cpf1은 제1 바이러스 벡터를 사용하여 세포로 제공되며 적어도 하나의 gRNA는 제2 바이러스 벡터를 사용하여 세포로 제공된다.
일부 구현예에서, 단일 바이러스 벡터를 사용하여 Cas9 또는 Cpf1를 암호화하는 핵산 및 적어도 하나의 gRNA를 세포로 전달한다. 일부 구현예에서, Cas9 또는 Cpf1는 제1 바이러스 벡터를 사용하여 세포로 제공되며 적어도 하나의 gRNA는 제2 바이러스 벡터를 사용하여 세포로 제공된다. 센스 또는 안티센스 유전자 작제물의 발현을 시행하기 위하여, 발현 작제물을 세포내로 전달하여야만 한다. 세포는 근육 세포, 성상 세포, 메산기오블라스트(mesangioblast), 골수 유래된 세포, 기질 세포 또는 간엽 줄기 세포일 수 있다. 구현예에서, 세포는 심근 세포, 골격근 세포, 또는 평활근 세포이다. 구현예에서, 세포는 전경골근, 사두근, 비장근, 횡격막 또는 심장내 세포이다. 일부 구현예에서, 세포는 유도된 다능성 줄기 세포(iPSC) 또는 내부 세포 괴세포(inner cell mass cell: iCM)이다. 추가의 구현예에서, 세포는 사람 iPSC 또는 사람 iCM이다. 일부 구현예에서, 본 개시내용의 사람 iPSC 또는 사람 iCM은 배양된 줄기 세포주, 성체 줄기 세포, 태반 줄기 세포, 또는 사람 배아의 파괴를 필요로 하지 않는 성체 또는 배아 줄기 세포의 다른 공급원으로부터 유래될 수 있다. 세포로의 전달은 세포주를 형질전환하기 위한 실험실 과정에서와 같이 시험관내, 또는 생체내 또는 생체외(ex vivo), 특정의 질환 상태의 치료에서와 같이 달성될 수 있다. 하나의 전달 메카니즘은 바이러스 감염을 통하며 여기서 발현 작제물은 감염성 바이러스 입자내에서 캡시드화(encapsidating)된다.
배양된 포유동물 세포내로 발현 작제물을 전달하기 위한 수개의 비-바이러스 방법은 또한 본 개시내용에 의해 고려된다. 이는 인산칼슘 침전, DEAE-덱스트란, 전기천공, 직접적인 미세주입, DNA-로딩된 리포좀 및 리포펙타민-DNA 복합체, 세포 초음파, 고속 미세투사물(high velocity microprojectile)을 사용한 유전자 충격(gene bombardment), 및 수용체-매개된 형질감염을 포함한다. 이러한 기술 중 일부는 생체내 또는 생체외 사용을 위해 성공적으로 채택될 수 있다.
일단 발현 작제물이 세포내로 전달되면, 목적한 유전자를 암호화하는 핵산을 상이한 부위에 위치시키고 발현시킬 수 있다. 특정의 구현예에서, 유전자를 암호화하는 핵산은 세포의 게놈내로 안정하게 통합될 수 있다. 이러한 통합은 동종 재조합(유전자 대체)을 통해 동종 위치 및 배향으로 존재할 수 있거나 무작위의, 비-특이적인 위치(유전자 증강)내에 통합될 수 있다. 여전히 추가의 구현예에서, 핵산은 DNA의 별도의, 에피솜 분절로서 세포내에서 안정하게 유지될 수 있다. 이러한 핵산 분절 또는 "에피솜"은 숙주 세포 주기와는 별도로 또는 숙주 세포 주기와 동기화된 유지 및 복제를 허용하기에 충분한 서열을 암호화한다. 발현 작제물이 세포로 전달되는 방법 및 세포내에서 핵산이 유지되는 위치는 사용된 발현 작제물의 유형에 의존적이다.
여전히 다른 구현예에서, 발현 작제물은 네이키드(naked) 재조합 DNA 또는 플라스미드로 단순이 이루어질 수 있다. 작제물의 전달은 세포막을 물리적으로 또는 화학적으로 투과하는 상기 언급된 임의의 방법에 의해 수행할 수 있다. 이는 특히 시험관내 전달에 적용가능하지만 생체내 용도에도 또한 적용될 수 있다. Dubensky et al. (1984)은 인산칼슘 침전물 형태의 폴리오마바이러스 DNA를 성체 및 새로이 태어난 마우스의 간 및 비장내로 성공적으로 주사하여 활성 바이러스 복제 및 급성 감염을 입증하였다. 벤베니스티(Benvenisty) 및 네쉬프(Neshif) (1986)는 또한 인산칼슘-침전된 플라스미드의 직접적인 복강내 주사가 형질감염된 유전자의 발현을 야기함을 입증하였다. 목적한 유전자를 암호화하는 DNA는 또한 생체내에서 유사한 방식으로 형질전달되어 유전자 생성물을 발현할 수 있다.
네이키드 DNA 발현 작제물을 세포내로 형질감염시키는 여전히 다른 구현예에는 입자 충격이 포함될 수 있다. 이러한 방법은 DNA-코팅된 미세투사물을 고속으로 가속화하여 이들이 세포막을 뚫고 세포를 사멸시키지 않으면서 세포내로 도입하도록 하는 능력에 의존한다. 작은 입자를 가속화하는 수개의 장치가 개발되어 왔다. 하나의 이러한 장치는 전류를 생성하기 위한 고압 방전에 의존하며, 이는 궁극적으로 원동력을 제공한다. 사용된 미세투사물은 텅스텐 또는 금 비드(bead)와 같은 생물학적으로 불활성인 물질로 이루어졌다.
일부 구현예에서, 발현 작제물은 대상체의 간, 피부, 및/또는 근육 조직으로 직접 전달된다. 이는 총(gun)과 표적 기관 사이의 개입 조직(intervening tissue)을 제거하기 위해, 즉, 생체외 치료를 위해 조직 또는 세포의 외과적 노출을 필요로 할 수 있다. 다시, 특수한 유전자를 암호화하는 DNA는 본 방법을 통해 전달될 수 있고 본 개시내용에 여전히 혼입될 수 있다.
추가의 구현예에서, 발현 작제물은 리포좀 내에 인트랩(entrap)될 수 있다. 리포좀은 인지질 이층막 및 내부 수성 매질에 의해 특징화된 소낭 구조이다. 다중라멜라 리포좀(Multilamellar liposome)은 수성 매질에 의해 분리된 다수의 지질 층을 갖는다. 이들은 인지질이 과도한 수용액 속에 현탁되는 경우 자발적으로 형성한다. 지질 성분은 밀폐된 구조를 형성하기 전에 자가-재배열을 겪고 지질 이층 사이에 물과 용해된 용질을 인트랩한다. 또한 리포펙타민-DNA 복합체가 고려된다.
시험관내 외부 DNA의 리포좀-매개된 핵산 전달 및 발현은 매우 성공적이었다. 리포펙타민 2000TM으로 공지된 시약은 광범위하게 사용되며 상업적으로 이용가능하다.
특정의 구현예에서, 리포좀은 세포 막과의 융합을 촉진시키고 리포좀-캡슐화된 DNA의 세포 도입을 촉진하기 위해 헤마글루틴화 바이러스(hemagglutinating virus: HVJ)와 복합체화될 수 있다. 다른 구현예에서, 리포좀은 핵형의 비-히스톤 염색체 단백질(HMG-1)과 함께 복합체화되거나 사용될 수 있다. 여전히 추가의 구현예에서, 리포좀은 HVJ 및 HMG-1 둘 다와 함께 복합체화되거나 사용될 수 있다. 이러한 발현 작제물이 시험관내 및 생체내에서 핵산의 전달 및 발현에 성공적으로 사용되어 왔다는 점에서, 이들은 본 개시내용에 적용가능하다. 세균 프로모터가 DNA 작제물에 사용되는 경우, 이는 또한 적절한 세균 폴리머라제를 리포좀내에 포함시키는 것이 바람직할 것이다.
특수한 유전자를 암호화하는 핵산을 세포내로 전달하는데 사용될 수 있는 다른 발현 작제물은 수용체-매개된 전달 비히클이다. 이는 대부분의 모든 진핵 세포내에서 수용체-매개된 세포내이입에 의해 거대분자의 선택적인 흡수를 이용한다. 다양한 수용체의 세포형-특이적인 분포로 인하여, 전달은 매우 특이적일 수 있다.
수용체-매개된 유전자 표적화 비히클은 일반적으로 2개의 구성성분으로 이루어진다: 세포 수용체-특이적인 리간드 및 DNA-결합제. 수개의 리간드는 수용체-매개된 유전자 전달을 위해 사용되어 왔다. 대부분의 집중적으로 특징화된 리간드는 아시알로오로소무코이드(asialoorosomucoid: ASOR) 및 트랜스페린이다. ASOR과 동일한 수용체를 인식하는, 합성 네오글리코단백질을 유전자 전달 비히클로서 사용하여 왔으며 상피 성장 인자(EGF) 또한 편평 암종 세포로 유전자를 전달하기 위해 사용되어 왔다.
D. AAV-Cas9 벡터
일부 구현예에서, Cas9는 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, AAV 벡터는 야생형 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, AAV 벡터는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다.
예시적인 AAV-Cas9 벡터는 Cas9 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물)를 함유한다. 일부 구현예에서, ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 완전한 길이 및/또는 야생형 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 절두된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 연장된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 동일한 AAV 혈청형에 대한 야생형 서열과 비교하여 서열 변이를 포함하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 서열 변이는 하나 이상의 치환, 결실, 삽입, 역위, 또는 전좌를 포함한다. 일부 구현예에서, ITR은 적어도 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 길이가 110 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 120 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 130 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 140 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 150 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 115, 145, 또는 141개의 염기쌍이다. 일부 구현예에서, ITR은 서열 번호: 880, 서열 번호: 881, 서열 번호: 882, 서열 번호: 883 및 서열 번호: 946으로부터 선택된 서열을 갖는다.
일부 구현예에서, AAV-Cas9 벡터는 하나 이상의 핵 국재화 신호(NLS)를 함유할 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 1, 2, 3, 4, 또는 5개의 핵 국재화 신호를 함유한다. 예시적인 NLS는 c-myc NLS(서열 번호: 884), SV40 NLS(서열 번호: 885), hnRNPAI M9 NLS(서열 번호: 886), 뉴클레오플라스민 NLS(서열 번호: 887), 임포르틴-알파로부터의 IBB 도메인의 서열 RMRKFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (서열 번호: 888), 근종 T 단백질의 서열 VSRKRPRP(서열 번호: 889) 및 PPKKARED(서열 번호: 890), 사람 p53의 서열 PQPKKKPL(서열 번호: 891), 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열 번호: 892), 인플루엔자 바이러스 NS1의 서열 DRLRR(서열 번호: 893) 및 PKQKKRK(서열 번호: 894), 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열 번호: 895) 및 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열 번호: 896)을 함유한다. 추가의 허용되는 핵 국재화 신호는 2부 핵 국재화 서열, 예컨대, 사람 폴리(ADP-리보스)폴리머라제의 서열 KRKGDEVDGVDEVAKKKSKK (서열 번호: 897) 또는 스테로이드 호르몬 수용체(사람) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (서열 번호: 898)을 포함한다.
일부 구현예에서, AAV-Cas9 벡터는 벡터의 패키징 및 Cas9의 발현을 촉진하는 추가의 인자를 포함할 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 폴리A 서열을 포함할 수 있다. 일부 구현예에서, 폴리A 서열은 미니-폴리A 서열일 수 있다. 일부 구현예에서, AAV-CAs9 벡터는 전이 인자(transposable element)를 포함할 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 조절인자 인자를 포함할 수 있다. 일부 구현예에서, 조절인자 인자는 활성인자 또는 억제인자이다.
일부 구현예에서, AAV-Cas9는 하나 이상의 프로모터를 함유할 수 있다. 일부 구현예에서, 하나 이상의 프로모터는 Cas9의 발현을 구동한다. 일부 구현예에서, 하나 이상의 프로모터는 근육-특이적인 프로모터이다. 예시적인 근육-특이적인 프로모터는 미오신 경쇄-2 프로모터, α-액틴 프로모터, 트로포닌 1 프로모터, Na+/Ca2+ 교환인자 프로모터, 디스트로핀 프로모터, α7 인테그린 프로모터, 뇌 나트륨뇨설의 펩타이드 프로모터, αB-결정성/소 열 쇼크 단백질 프로모터, α-미오신 중쇄 프로모터, ANF 프로모터, CK8 프로모터 및 CK8e 프로모터를 포함한다.
일부 구현예에서, AAV-Cas9 벡터는 효모, 세균, 곤충 세포, 또는 포유동물 세포내에서 생산을 위해 최적화될 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 사람 세포내에서의 발현을 위해 최적화될 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 바쿨로바이러스 발현 시스템내에서의 발현을 위해 최적화될 수 있다.
일부 구현예에서, AAV-Cas9 벡터는 표 4에 나타낸 바와 같이, 서열 번호: 899, 서열 번호: 900, 서열 번호: 901, 또는 서열 번호: 902로부터 선택된 서열을 포함한다.
[표 4]
서열 번호: 899 내지 902를 포함하는 구현예를 포함하는, 본 개시내용의 유전자 편집 작제물의 일부 구현예에서, 작제물은 프로모터 및 뉴클레아제를 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 CK8e 프로모터 및 Cas9 뉴클레아제를 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 CK8e 프로모터 및 스타필로코쿠스 피오게네스(Staphylococcus pyogenes)로부터의 Cas9 뉴클레아제("SpCas9")를 포함하거나 이로 이루어진다. 일부 구현예에서, CK8e 프로모터는
(서열 번호: 875)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, SpCas9 뉴클레아제는
(서열 번호: 872)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 적어도 2개의 역위된 말단 반복물(ITR) 서열을 추가로 포함한다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 혈청형2(AAV2)의 AAV로부터 단리되거나 유래된 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 (서열 번호:880)의 뉴클레오타이드를 포함하거나 이로 이루어진 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 구현예에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 적어도 2개의 ITR 서열을 추가로 포함하고, 여기서 제1 ITR 서열은
(서열 번호: 881)의 뉴클레오타이드 서열을 포함하거나 이로 이루어지고 제2 ITR 서열은
(서열 번호: 882)의 뉴클레오타이드의 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제 및 제2 ITR을 암호화하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제 및 제2 AAV2 ITR을 암호화하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제 및 제2 ITR을 포함하거나 이로 이루어진 작제물은 폴리 A 서열을 추가로 포함한다. 일부 구현예에서, 폴리A 서열은 미니폴리A 서열을 포함하거나 이로 이루어진다. 본 개시내용의 예시적인 미니폴리A 서열은
(서열 번호: 903)의 뉴크렐오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 미니폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제를 암호화하는 서열, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어지고, 적어도 하나의 핵 국재화 신호를 추가로 포함한다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하는 작제물은, 적어도 2개의 핵 국재화 신호를 추가로 포함한다. 본 개시내용의 예시적인 핵 국재화 신호는 (서열 번호: 887)의 뉴클레오타이드 서열, 또는 (서열 번호: 885)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국재화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 서열, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 폴리 A 서열 및 제2 ITR을 포함하는 작제물은 정지 코돈을 추가로 포함한다. 정지 코돈은 TAG(서열 번호: 904), TAA(서열 번호: 905), 또는 TGA(서열 번호: 906)의 서열을 가질 수 있다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 정지 코돈, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열 및 제2 AAV2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어지는 작제물은 전이 인자 역위된 반복물을 추가로 포함한다. 본 개시내용의 예시적인 전이 인자 역위된 반복물은
(서열 번호: 907)의 뉴클레오타이드 서열 및/또는
(서열 번호: 908)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 서열 번호: 907의 서열을 갖는 제1 전이 인자 역위된 반복물, 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열, 제2 AAV2 ITR, 및 서열 번호: 908의 서열을 갖는 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 5' 내지 3', 제1 전이 인자 역위된 반복물, 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진 작제물은 조절 서열을 추가로 포함한다. 본 개시내용의 예시적인 조절 서열은
(서열 번호: 909)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 프로모터를 암호화하는 서열, 제1 핵 국제화 신호를 암호화하는 서열, 뉴클레아제를 암호화하는 서열, 제2 핵 국제화 신호를 암호화하는 서열, 정지 코돈, 폴리 A 서열, 제2 ITR, 조절 서열 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 서열 번호: 907의 서열을 갖는 제1 전이 인자 역위된 반복물, 제1 AAV2 ITR, CK8e 프로모터를 암호화하는 서열, 서열 번호: 885의 서열을 갖는 핵 국재화 신호, SpCas9 뉴클레아제를 암호화하는 서열, 서열 번호: 887의 서열을 갖는 핵 국재화 신호, 정지 코돈, 미니폴리 A 서열, 제2 AAV2 ITR, 서열 번호: 909의 서열을 갖는 조절 서열, 및 서열 번호: 908의 서열을 갖는 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 하나 이상의 스페이서 서열을 추가로 포함할 수 있다. 본 개시내용의 예시적인 스페이서 서열은 이들 사이의 모든 범위를 포함하는, 1 내지 1500개 뉴클레오타이드의 길이를 갖는다. 일부 구현예에서, 스페이서 서열은 5'로부터 3'로 ITR, 프로모터, 핵 국재화 서열, 뉴클레아제, 정지 코돈, 폴리A 서열, 전이 인자 역위된 반복물, 및/또는 조절 인자에 위치할 수 있다. 일부 구현예에서, 작제물은 서열 번호: 899, 서열 번호: 900, 서열 번호: 901, 또는 서열 번호: 902를 포함하거나 이로 이루어진 서열을 가질 수 있다.
E. AAV-sgRNA 벡터
일부 구현예에서, gRNA를 암호화하는 적어도 제1 서열 및 gRNA를 암호화하는 제2 서열는 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, 적어도 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열은 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, 적어도 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열은 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, 적어도 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열은 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, gRNA를 암호화하는 다수의 서열은 AAV 벡터내로 패키지된다. 예를 들면, gRNA를 암호화하는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 서열이 AAV 벡터내로 패키지될 수 있다. 일부 구현예에서, gRNA를 암호화하는 각각의 서열은 상이하다. 일부 구현예에서, gRNA를 암호화하는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 서열 모두는 동일하다.
일부 구현예에서, AAV 벡터는 야생형 AAV 벡터이다. 일부 구현예에서, AAV 벡터는 하나 이상의 돌연변이를 함유한다. 일부 구현예에서, AAV 벡터는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다.
예시적인 AAV-sgRNA 벡터는 sgRNA 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물) 서열을 함유한다. 일부 구현예에서, ITR는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, ITR은 제1 혈청형의 AAV 벡터로부터 단리되거나 유래되고 AAV-sgRNA 벡터의 캡시드 단백질을 암호화하는 서열은 제2 혈청형의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하지 않다. 일부 구현예에서, 제1 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제2 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고 제2 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고 제2 혈청형은 AAV9이다.
예시적인 AAV-sgRNA 벡터는 gRNA 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물) 서열을 함유한다. 일부 구현예에서, ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, 제1 ITR은 제1 혈청형의 AAV 벡터로부터 단리되거나 유래되고, 제2 ITR은 제2 혈청형의 AAV 벡터로부터 단리되거나 유래되고 AAV-sgRNA 벡터의 캡시드 단백질을 암호화하는 서열은 제3 혈청형의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하다. 일부 구현예에서, 제1 혈청형 및 제2 혈청형은 동일하지 않다. 일부 구현예에서, 제1 혈청형, 제2 혈청형, 및 제3 혈청형은 동일하다. 일부 구현예에서, 제1 혈청형, 제2 혈청형, 및 제3 혈청형은 동일하지 않다. 일부 구현예에서, 제1 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제2 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제3 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고, 제2 혈청형은 AAV4이며 제3 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11이다. 일부 구현예에서, 제1 혈청형은 AAV2이고, 제2 혈청형은 AAV4이며 제3 혈청형은 AAV9이다. 예시적인 AAV-sgRNA 벡터는 sgRNA 서열을 포함하는 중심 서열 영역을 플랭킹하는 2개의 ITR(역위된 말단 반복물) 서열을 포함한다. 일부 구현예에서, ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이의 임의의 조합의 AAV 벡터로부터 단리되거나 유래된다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 전체 길이 및/또는 야생형 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 절두된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 AAV 혈청형에 대한 신장된 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 동일한 AAV 혈청형에 대한 야생형 서열과 비교하여 서열 변이를 포함하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 서열 변이는 하나 이상의 치환, 결실, 삽입, 역위, 또는 전좌를 포함한다. 일부 구현예에서, ITR은 적어도 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 염기쌍을 포함하거나 이로 이루어진다. 일부 구현예에서, ITR은 길이가 110 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 120 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 130 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 140 ± 10개 염기쌍이다. 일부 구현예에서, ITR은 길이가 150 ± 10개의 염기쌍이다. 일부 구현예에서, ITR은 길이가 115, 145, 또는 141개의 염기쌍이다. 일부 구현예에서, ITR은 서열 번호: 880, 서열 번호: 881, 서열 번호: 882, 또는 서열 번호: 883으로부터 선택된 서열을 갖는다.
일부 구현예에서, AAV-sgRNA 벡터는 벡터의 패키징 및 sgRNA의 발현을 촉진시키는 추가의 인자를 포함할 수 있다. 일부 구현예에서, AAV-sgRNA 벡터는 전이 인자를 포함할 수 있다. 일부 구현예에서, AAV-sgRNA 벡터는 조절 인자를 포함할 수 있다. 일부 구현예에서, 조절 인자는 활성인자 또는 억제인자를 포함한다. 일부 구현예에서, AAV-sgRNA 서열은 비-기능성이거나 "스터퍼(stuffer)" 서열을 포함할 수 있다. 본 개시내용의 예시적인 스터퍼 서열은 포유동물(사람 포함)의 게놈 서열에 대해 일부(비-제로 퍼센트의) 동일성(identity) 또는 상동성(homology)을 가질 수 있다. 대안적으로, 본 개시내용의 예시적인 스터퍼 서열은 포유동물(사람 포함)의 게놈 서열에 대한 동일성 또는 상동성을 가지지 않을 수 있다. 본 개시내용의 예시적인 스터퍼 서열은 대상체에게 AAV 벡터의 투여 후 전사되지 않거나 해독되지 않은 천연적으로 발생하는 비-암호화 서열 또는 서열을 포함하거나 이로 이루어질 수 있다.
일부 구현예에서, AAV-sgRNA 벡터는 효모, 세균, 곤충 세포, 또는 포유동물 세포내에서 생산하기 위해 최적화될 수 있다. 일부 구현예에서, AAV-sgRNA 벡터는 사람 세포내에서 발현을 위해 최적화될 수 있다. 일부 구현예에서, AAV-Cas9 벡터는 바큘로바이러스 발현 시스템내에서 발현하기 위해 최적화될 수 있다.
일부 구현예에서, AAV-sgRNA 벡터는 적어도 하나의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 2개의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 3개의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 4개의 프로모터를 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 적어도 5개의 프로모터를 포함한다. 예시적인 프로모터는 예를 들면, 면역글로불린 경쇄, 면역글로불린 중쇄, T-세포 수용체, HLA DQ a 및/또는 DQ β, β-인터페론, 인터루킨-2, 인터루킨-2 수용체, MHC 제II 부류 5, MHC 제II 부류 HLA-Dra, β-액틴, 근육 크레아틴 키나제(MCK), 프레알부민(트랜스티레틴), 엘라스타제 I, 메탈로티오네인(MTII), 콜라게나제, 알부민, α-페토단백질, t-글로빈, β-글로빈, c-fos, c-HA-ras, 인슐린, 신경 세포 부착 분자(NCAM), α1-안티트리파인, H2B(TH2B) 히스톤, 마우스 및/또는 제I형 콜라겐, 글루코즈-조절된 단백질(GRP94 및 GRP78), 랫트 성장 호르몬, 사람 혈청 아밀로이드 A(SAA), 트로포닌 I(TN I), 혈소판-유래 성장 인자(PDGF), 듀켄씨 근 이영양증, SV40, 폴리오마, 레트로바이러스, 파필로마 바이러스, B형 간염 바이러스, 사람 면역결핍증 바이러스, 사이토메갈로바이러스(CMV), 및 긴팔 원숭이 백혈병 바이러스를 포함한다. 추가의 예시적인 프로모터는 U6 프로모터, H1 프로모터, 및 7SK 프로모터를 포함한다.
일부 구현예에서, gRNA를 암호화하는 서열은 서열 번호: 383-705, 709-711, 715-717, 790-862, 및 864로부터 선택된 서열을 포함한다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열 및 gRNA를 암호화하는 제2 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키며 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시킨다. 일부 구현예에서, 제1 및 제2 프로모터는 동일하다. 일부 구현예에서, 제1 및 제2 프로모터는 상이하다. 일부 구현예에서, 제1 및 제2 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, gRNA를 암호화하는 제1 서열 및 gRNA를 암호화하는 제2 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열 및 gRNA를 암호화하는 제2 서열은 동일하지 않다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키고, 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시키며, 제3 프로모터는 gRNA를 암호화하는 제3 서열의 발현을 구동시킨다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터 중 적어도 2개는 동일하다. 일부 구현예에서, 각각의 제1, 제2, 및 제3 프로모터는 상이하다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, 제1 프로모터는 U6 프로모터이다. 일부 구현예에서, 제2 프로모터는 H1 프로모터이다. 일부 구현예에서, 제3 프로모터는 7SK 프로모터이다. 일부 구현예에서, 제1 프로모터는 U6 프로모터이고, 제2 프로모터는 H1 프로모터이며, 제3 프로모터는 7SK 프로모터이다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, 및 gRNA를 암호화하는 제3 서열은 동일하지 않다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키고, 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시키며, 제3 프로모터는 gRNA를 암호화하는 제3 서열의 발현을 구동시키고, 제4 프로모터는 gRNA를 암호화하는 제4 서열을 발현을 구동시킨다. 일부 구현예에서, 제1, 제2, 제3, 및 제4 프로모터 중 적어도 2개는 동일하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 및 제4 프로모터는 상이하다. 일부 구현예에서, 각각의 제1, 제2, 제3 및 제4 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, 및 gRNA를 암호화하는 제4 서열은 동일하지 않다.
일부 구현예에서, AAV 벡터는 gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열을 포함하고, 제1 프로모터는 gRNA를 암호화하는 제1 서열의 발현을 구동시키고, 제2 프로모터는 gRNA를 암호화하는 제2 서열의 발현을 구동시키며, 제3 프로모터는 gRNA를 암호화하는 제3 서열의 발현을 구동시키고, 제4 프로모터는 gRNA를 암호화하는 제4 서열의 발현을 구동시키며, 제5 프로모터는 gRNA를 암호화하는 제5 서열의 발현을 구동시킨다. 일부 구현예에서, 제1, 제2, 제3, 제4, 및 제5 프로모터 중 적어도 2개는 동일하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 제4, 및 제5 프로모터는 상이하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 및 제4 프로모터는 상이하다. 일부 구현예에서, 각각의 제1, 제2, 제3, 제4 및 제5 프로모터는 H1 프로모터, U6 프로모터, 및 7SK 프로모터로부터 선택된다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열은 동일하다. 일부 구현예에서, gRNA를 암호화하는 제1 서열, gRNA를 암호화하는 제2 서열, gRNA를 암호화하는 제3 서열, gRNA를 암호화하는 제4 서열, 및 gRNA를 암호화하는 제5 서열은 동일하지 않다.
일부 구현예에서, AAV-sgRNA 벡터는 서열 번호: 910, 서열 번호: 911, 서열 번호: 912, 또는 서열 번호: 913로부터 선택된 서열을 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 서열 번호: 914, 서열 번호: 915, 서열 번호: 916, 또는 서열 번호: 917으로부터 선택된 서열을 포함한다. 일부 구현예에서, AAV-sgRNA 벡터는 서열 번호: 918, 서열 번호: 919, 서열 번호: 920, 또는 서열 번호: 921로부터 선택된 서열을 포함한다. 예시적인 AAV-sgRNA 벡터는 표 5에 제공된다.
[표 5]
서열 번호: 910 내지 921을 포함하는 구현예를 포함하는, 본 개시내용의 유전자 편집 작제물의 일부 구현예에서, 작제물은 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하거나 이로 이루어진다. 본 개시내용의 gRNA를 포함하는 예시적인 서열은 서열 번호: 383-705, 709-711, 715-717, 790-862, 864이다. 일부 구현예에서, gRNA를 암호화하는 서열은 CACTAGAGTAACAGTCTGAC(서열 번호: 708)이다. 일부 구현예에서, gRNA를 암호화하는 서열은 CACCAGAGTAACAGTCTGAG(서열 번호: 714)이다. 일부 구현예에서, gRNA를 암호화하는 서열은 CACCAGAGTAACAGTCTGAC(서열 번호: 863)이다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 서열 번호: 863의 gRNA를 암호화하는 제3 서열을 포함한다. 본 개시내용의 예시적인 프로모터는 (서열 번호: 922)의 서열을 갖는 U6 프로모터, (서열 번호: 923)의 서열을 갖는 H1 프로모터, 및 (서열 번호: 924)의 서열을 갖는 7SK 프로모터를 포함한다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터는 U6 프로모터(서열 번호: 922), H1 프로모터(서열 번호: 923), 및 7SK 프로모터(서열 번호: 924)로부터 각각 개별적으로 선택된다. 일부 구현예에서, 제1, 제2, 및 제3 프로모터는 U6 프로모터(서열 번호: 922), 및 H1 프로모터(서열 번호: 923)로부터 각각 개별적으로 선택된다. 일부 구현예에서, 작제물은 5'로부터 3'로, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 작제물은, 5'로부터 3'로, U6 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 제2 서열, 7SK 프로모터, 및 서열 번호: 863의 gRNA를 암호화하는 제3 서열을 포함한다. 일부 구현예에서, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하는 작제물은 또한 적어도 2개의 역위된 말단 반복물(ITR) 서열을 포함한다. 일부 구현예에서, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하는 작제물은 또한 혈청형 2의 AAV(AAV2)를 포함하는 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 구현예에서, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, 및 gRNA를 암호화하는 제3 서열을 포함하는 작제물은 적어도 2개의 ITR 서열을 추가로 포함하며, 여기서 제1 ITR 서열은 혈청형 4의 AAV(AAV4)로부터 단리되거나 유래되고 제2 ITR 서열은 혈청형 2의 AAV(AAV2)로부터 단리되거나 유래된다. 예시적인 ITR 서열은 (서열 번호: 881), (서열 번호: 883), (서열 번호: 946), 및 (서열 번호: 882)이다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, 및 gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 및 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호:: 863의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, U6, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 및 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, U6, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 및 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 및 제2 ITR을 포함하는 작제물은 폴리 A 서열을 추가로 포함한다. 일부 구현예에서, 폴리A 서열은 미니폴리A 서열을 포함하거나 이로 이루어진다. 본 개시내용의 예시적인 미니폴리A 서열은 TAGCAATAAAGGATCGTTTATTTTCATTGGAAGCGTGTGTTGGTTTTTTGATCAGGCGCG(서열 번호: 903)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 5'로부터 3'로 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하는 작제물은 전이 인자 역위된 반복물을 추가로 포함한다. 본 개시내용의 예시적인 전이 인자 역위된 반복물은 (서열 번호: 907)의 뉴클레오타이드 서열 및/또는
(서열 번호: 908)의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열 , 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로, 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 제2 전이 인자 역위된 반복물을 포함하는 작제물은 조절 서열을 추가로 포함한다. 본 개시내용의 예시적인 조절 서열은 (서열 번호: 909)
의 뉴클레오타이드 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, 및 gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 미니폴리A 서열, 및 제2 ITR을 포함하는 작제물은 스터퍼 서열(stuffer sequence)을 포함한다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 및 제2 ITR을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, gRNA를 암호화하는 제1 서열, 제2 프로모터, gRNA를 암호화하는 제2 서열, 제3 프로모터, gRNA를 암호화하는 제3 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, gRNA를 암호화하는 제1 서열, H1 프로모터, gRNA를 암호화하는 제2 서열, 7SK 프로모터, gRNA를 암호화하는 제3 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, 제1 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제2 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 제3 프로모터, 서열 번호: 863의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 708의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 5'로부터 3'로 제1 전이 인자 역위된 반복물, 제1 ITR, U6 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, H1 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 7SK 프로모터, 서열 번호: 714의 gRNA를 암호화하는 서열, 스터퍼 서열, 미니폴리A 서열, 제2 ITR, 조절 서열, 및 제2 전이 인자 역위된 반복물을 포함하거나 이로 이루어진다. 일부 구현예에서, 작제물은 하나 이상의 스페이서 서열을 추가로 포함할 수 있다. 본 개시내용의 예시적인 스페이서 서열은 이들 사이의 모든 범위를 포함하는 1 내지 1500개의 뉴클레오타이드의 길이를 갖는다. 일부 구현예에서, 스페이서 서열은 ITR, 프로모터, gRNA을 암호화하는 서열, 폴리A 서열, 전이 인자 역위된 반복물, 스터퍼 서열, 및/또는 조절 인자에 대해 5'로부터 3'로의 위치에서 위치할 수 있다.
V. 약제학적 조성물 및 전달 방법
임상 적용을 위해, 약제학적 조성물은 의도된 적용을 위해 적절한 형태로 제조한다. 일반적으로, 이는 발열 물질 뿐만 아니라 사람 또는 동물에 유해할 수 있는 다른 불순물도 필수적으로 포함하지 않는 조성물을 제조함을 포함한다.
적절한 염 및 완충제는 약물, 단백질 또는 전달 벡터가 안정하도록 하고 표적 세포에 의해 흡수되도록 하기 위해 사용된다. 본 개시내용의 수성 조성물은 약제학적으로 허용되는 담체 또는 수성 매질 속에 용해되거나 분산된, 유효량의 약물, 벡터 또는 단백질을 포함한다. 어구 "약제학적으로 또는 약리학적으로 허용되는"은 동물 또는 사람에게 투여되는 경우 부작용, 알레르기, 또는 다른 부적당한 반응을 생성하지 않는 분자 실체 및 조성물을 지칭한다. 본원에 사용된 바와 같이, "약제학적으로 허용되는 담체"는 사람에게 투여하기에 적합한 약제와 같은 약제를 제형화하는데 사용하기 위해 허용가능한 용매, 완충제, 용액, 분산 매질, 코팅, 항세균제 항진균제, 등장성 제제 및 흡수 지연제를 포함한다. 약제학적으로 활성인 물질에 대한 이러한 매질 및 제제의 용도는 당해 분야에 잘 공지되어 있다. 본 개시내용의 활성 성분과 비혼화성이 아닌 임의의 통상적인 매질 또는 제제, 치료학적 조성물에서 이의 용도를 사용할 수 있다. 보충적인 활성 성분은 또한 조성물내로 혼입될 수 있으며, 단 이들은 조성물의 벡터 또는 세포를 불활성화시키지 않는다.
일부 구현예에서, 본 개시내용의 활성 조성물은 전통적인 약제학적 제제를 포함할 수 있다. 본 개시내용에 따른 이러한 조성물의 투여는 표적 조직이 이러한 경로를 통해 이용가능한 한, 그러나 일반적으로는 전신 투여를 포함하는 임의의 일반적인 경로를 통할 수 있다. 이는 경구, 비강, 또는 볼내를 포함한다. 대안적으로, 투여는 피내, 피하, 근육내, 복강내 또는 정맥내 주사에 의해, 또는 근육 조직내로의 직접 주사에 의해 이루어질 수 있다. 이러한 조성물은 일반적으로 상술한 바와 같은, 약제학적으로 허용되는 조성물로서 투여될 수 있다.
활성 화합물은 또한 비경구적으로 또는 복강내 투여될 수 있다. 설명의 방식으로, 유리 염기 또는 약리학적으로 허용되는 염의 용액은 하이드록시프로필셀룰로즈와 같은 표면활성제와 적합하게 혼합된 물 속에서 제조할 수 있다. 분산제는 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 이의 혼합물 및 오일 속에서 제조할 수 있다. 저장 및 사용의 통상의 조건 하에서, 이러한 제제는 일반적으로 미생물의 성장을 방지하기 위한 방부제를 함유한다.
주사가능한 용도에 적합한 약제학적 형태는 예를 들면, 멸균 주사가능한 용액 또는 분산액의 일시적인 제조를 위한 멸균 수용액 또는 분산액 및 멸균 분말을 포함한다. 일반적으로, 이러한 제제는 용이한 주사가능성이 존재하는 정도로 멸균성이고 유체이다. 제제는 제조 및 저장 조건 하에서 안정하여야 하고 세균 및 진균과 같은, 미생물의 오염 작용에 대해 보존되어야 한다. 적절한 용매 또는 분산 매질은 예를 들면, 물, 에탄올, 폴리올(예를 들면, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 이의 적합한 혼합물, 및 식물성 오일을 함유할 수 있다. 적절한 유동성은 예를 들면, 레시틴과 같은 코팅을 사용함으로써, 분산액의 경우에 필요한 입자 크기의 유지에 의해 및 표면활성제의 사용에 의해 유지될 수 있다. 미생물의 작용의 방지는 다양한 항세균제 및 항진균제, 예를 들면, 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 유발할 수 있다. 많은 경우에, 등장성 제제, 예를 들면, 슈가 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 주사가능한 조성물의 연장된 흡수는 흡수를 지연시키는 제제, 예를 들면, 알루미늄 모노스테아레이트 및 젤라틴을 조성물에서 사용함으로써 유발할 수 있다.
멸균 주사가능한 용액은 경우에 따라 임의의 다른 성분(예를 들면, 상기 열거된 바와 같음)과 함께 적절한 양의 활성 성분을 용매 내에 혼입시킨 후, 여과된 멸균에 의해 제조할 수 있다. 일반적으로, 분산액은 멸균된 다양한 활성 성분을 기본 분산 매질 및 예컨대, 상기 나열된 바와 같은, 목절한 다른 성분을 함유하는 멸균 비히클 내로 혼입시킴으로써 제조한다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우에, 바람직한 제조 방법은 활성 성분(들)의 분말 및 이의 앞서 멸균-여과된 용액으로부터 임의의 추가의 목적한 성분의 분말을 수득하는 진공-건조 및 동결-건조 기술을 포함한다.
일부 구현예에서, 본 개시내용의 조성물은 중성 또는 염 형태로 제형화된다. 약제학적으로 허용되는 염은 예를 들면, 무기 산(예컨대, 염화수소산 또는 인산), 또는 유기산(예컨대, 아세트산, 옥살산, 타르타르산, 만델산 등) 등으로부터 유래된 산 부가염(단백질의 유리 아미노 그룹으로 형성됨)을 포함한다. 단백질의 유리 카복실 그룹과 함께 형성된 염은 또한 무기 염기(예컨대, 나트륨, 칼륨, 암모늄, 칼슘, 또는 수산화 제2철) 또는 유기 염기(예컨대, 이소프로필아민, 트리메틸아민, 히스티딘, 프로카인) 등으로부터 유래될 수 있다.
제형화시, 용액은 바람직하게는 투여 제형과 혼용성인 방식으로 및 치료학적으로 효과적인 양으로 투여된다. 제형은 주사가능한 용액, 약물 방출 캅셀 등과 같은 다양한 투여형으로 용이하게 투여될 수 있다. 수용액으로의 비경구 투여를 위해, 예를 들면, 용액은 일반적으로 적합하게 완충되고 액체 희석제는 우선 예를 들면 충분한 염수 또는 글루코즈로 등장성이 되도록 한다. 이러한 수용액은 예를 들면, 정맥내, 근육내, 피하 및 복강내 투여를 위해 사용될 수 있다. 바람직하게는, 멸균 수성 매질은 당해 분야의 기술자에게 공지된 바와 같이, 특히 본 개시내용의 측면에서 사용된다. 설명하기 위하여, 단일 용량은 1 ml의 등장성 NaCl 용액 속에 용해시키고 1000 ml의 대량피하주사 유액에 첨가되거나 적절한 주입 부위에 주입된다(참고: 예를 들면, "Remington's Pharmaceutical Sciences" 15th Edition, pages 1035-1038 및 1570-1580). 투여량의 일부 변화는 치료되는 대상체의 상태에 따라 필수적으로 일어날 것이다. 투여에 관여하는 개인은 어떠한 상황에서도 개인 대상체에 대해 적절한 용량을 결정할 것이다. 또한, 사람 투여를 위해, 제제는 생물학 표준(Biologics standards)의 FDA 사무국에 의해 요구된 바와 같은 멸균성, 발열원성, 일반적인 안전성 및 순도 표준을 충족시켜야 한다.
일부 구현예에서, 본원에 기술된 Cas9 또는 Cpf1 및 gRNA는 입양 세포 전달(ACT)를 사용하여 환자에게 전달될 수 있다. 입양 세포 전달시, 하나 이상의 발현 작제물은 환자(자가조직의)로부터 또는 환자 이외의 1명 이상의 개인(들)(동종이계)로부터 유래되는 세포에 대해 생체외 제공된다. 세포는 후속적으로 환자에게 도입되거나 재도입된다. 따라서, 일부 구현예에서, Cas9 또는 Cpf1을 암호화하는 하나 이상의 핵산 및 디스트로핀 스플라이스 부위를 표적화하는 가이드 RNA는 세포가 환자에게 도입되거나 재도입되기 전에 생체외로 세포에 제공된다.
다음의 표는 본원에 개시된 조성물 및 방법과 함께 사용하기 위한 예시적인 프라이머 및 게놈성 표적화 서열을 제공한다.
[표 6]
* 이러한 표에서, 대문자는 유전자의 엑손 서열에 대해 정렬하는 뉴클레오타이드를 나타낸다. 소문자는 유전자의 인트론 서열에 대해 정렬하는 뉴클레오타이드를 나타낸다.
[표 7]
* 당해 표에서, 대문자는 유전자의 엑손 서열에 대해 정렬하는 sgRNA 뉴클레오타이드를 나타낸다. 소문자는 유전자의 인트론 서열에 대해 정렬하는 sgRNA 뉴클레오타이드를 나타낸다.
VI. 서열 표
[표 8]
[표 9]
[표 10]
[표 11]
[표 12]
[표 13]
[표 14]
[표 15]
VII. 실시예
다음의 실시예는 본 개시내용의 바람직한 구현예를 입증하기 위해 포함된다. 다음의 실시예에 개시된 기술은 본 개시내용의 실시에서 잘 기능하도록 본 발명자에 의해 발견된 기술을 나타내며, 따라서 이의 실시를 위한 바람직한 방식을 구성하는 것으로 고려될 수 있음이 당해 분야의 기술자에게 인식되어야 한다. 그러나, 당해 분야의 기술자는 본 개시내용의 측면에서 많은 변화가 개시된 구체적인 구현예에서 이루어질 수 있고 본 개시내용의 취지 및 영역으로부터 벗어남이 없이 동일하거나 유사한 결과를 여전히 수득할 수 있음을 인식하여야 한다.
실시예 1 - 물질 및 방법
연구 승인. 본 연구에서 동물을 포함하는 모든 실험 과정은 텍사스 대학 사우쓰웨스턴 의학 센터 기관의 동물 보호 및 사용 위원회(University of Texas Southwestern Medical Center's Institutional Animal Care and Use Committee)에 의해 검토되고 승인되었다.
마우스에서 CRISPR/Cas9-매개된 엑손 50 결실. 마우스 Dmd 유전자자리의 엑손 50 서열 주변의 2개의 단일-가이드 RNA(sgRNA) 특이적인 인트론 영역을 다음의 프라이머를 사용하여 벡터 px330 내로 클로닝하였다: Dmd 엑손 50_F1: 5'-CACCGAAATGATGAGTGAAGTTATAT-3'(서열 번호: 926); Dmd 엑손 50_R1: 5'- AAACATATAACTTCACTCATCATTTC-3'(서열 번호: 927); Dmd 엑손 50_F2: 5' CACCGGTTTGTTCAAAAGCGTGGCT-3'(서열 번호: 928); Dmd 엑손 50_R2: 5'- AAACAGCCACGCTTTTGAACAAAC-3'(서열 번호: 929).
sgRNA의 시험관내 전사를 위해, T7 프로모터 서열을 다음의 프라이머를 사용하여 PCR에 의해 sgRNA 주형(template)에 가하였다: Dmd 엑손 50_T7-F1: GAATTGTAATACGACTCACTATAGGAATGATGAGTGAAGTTATAT(서열 번호: 930); Dmd 엑손 50_T7-F2: GAATTGTAATACGACTCACTATAGGGTTTGTTCAAAAGCGTGGCT(서열 번호: 931); Dmd 엑손 50_T7-Rv: AAAAGCACCGACTCGGTGCCAC(서열 번호: 932).
겔 정제된 PCR 생성물을 MEGAshortscript T7 키트(Life Technologies)를 사용하여 시험관내 전사를 위한 주형으로서 사용하였다. sgRNA를 MEGAclear 키트(Life Technologies)로 정제하고 뉴클레아제가 들어있지 않는 물(Ambion)로 용출시켰다. 가이드 RNA의 농도를 NanoDrop 장치(Thermo Scientific)로 측정하였다.
△Ex50 마우스의 유전형 분석. △Ex50 마우스를 표적화된 영역: Geno50-F: 5'-GGATTGACTGAAATGATGGCCAAGG-3'(서열 번호: 937); Geno50-R: 5'-CTGCCACGATTACTCTGCTTCCAG-3'(서열 번호: 938)을 포함하는 프라이머를 사용하여 유전형분석하였다. 꼬리 생검물(tail biopsies)을 100 μL의 25-mM NaOH, 0.2-mM EDTA(pH 12)에서 20분 동안 95℃에서 소화시켰다. 꼬리를 약하게 원심분리한 후 100 μL의 40-mM 트리스·HCl(pH 5)을 가하고 혼합하여 균질화하였다. 2 마이크로리터의 당해 반응물을 하기 프라이머를 사용한 후속적인 PCR 반응에 사용한 후, 겔 전기영동하였다.
플라스미드. 2A-EGFP 및 sgRNA의 골격와 함께 사람 코돈 최적화된 SpCas9 유전자를 함유하는 pSpCas9(BB)-2A-GFP(PX458) 플라스미드는 Addgene(플라스미드 #48138)으로부터 구입하였다. AAV TRIPSR 플라스미드는 더크 그림(Dirk Grimm) 박사(하이델베르크 대학 병원)로부터 입수하였다. sgRNA의 클로닝을 BbsI 부위를 사용하여 수행하였다. pGL3-CK8e 플라스미드는 스티브 하우스카(Stephen Hauschka) 박사(워싱턴 대학 생화학부, 미국 시애틀 소재)로부터 입수하였다. AAV-miniCMV-Cas9-shortPolyA 플라스미드는 딕 그림 박사(하이델베르크 대학 병원)로부터 입수하였다. 본 원고에 사용된 최종 AAV9-CK8-CRISPR/Cas9 벡터를 생성하기 위해, AAV-miniCMV-Cas9-short-PolyA를 PacI 및 NheI 효소로 분해하여 miniCMV 프로모터를 제거하였다. CK8 프로모터를 PacI 및 NheI 부위 서열을 함유하는 프라이머를 사용하여 pGL3-CK8e 플라스미드로부터 증폭시키고 소화된 벡터내로 클로닝하여 AAV-CK8-Cas9-shortPolyA 플라스미드를 생성하였다.
엑손 51을 스키핑하기 위한 sgRNA 확인 및 클로닝. Dmd 엑손 51 가이드 RNA를 crispr.mit.edu를 사용하여 정의하였다. 가이드 서열을 다음의 프라이머를 사용하여, 펭 창(Feng Zhang)로부터의 선물인 Addgene 플라스미드 #42230(6)내로 클로닝하였다: Dmd 엑손 51_F1: 5'-CACCGAGAGTAACAGTCTGACTGG -3'(서열 번호: 942); Dmd 엑손 51_R1: 5'-AAACGTCAGACTGTTACTCTAGTGC-3'(서열 번호: 943); Dmd 엑손 51_F2: 5'-CACCGCACTAGAGTAACAGTCTGAC-3'(서열 번호: 944); Dmd 엑손 51_R2: 5'- AAACCCAGTCAGACTGTTACTCTC-3'(서열 번호: 945). 가이드 서열을 AAV 골격내로 클로닝하기 전에 10T1/2 세포를 사용하여 배양물 속에서 시험하였다.
골든 게이트 시스템(Golden Gate system)을 사용한 AAV 골격내에서 트리플리케이트 sgRNA 조립. AAV TRISPR 골격 클로닝 시스템의 조립은 골든 게이트 조립의 2개의 연속 단계에 의존한다. gRNA의 공여체 플라스미드내로의 제1 단계 조립. 올리고뉴클레오타이드의 어닐링은 2.5 μl의 각각의 올리고(0.5 μM), 5 μl의 NE완충제 2(NEB) 및 40 μL의 ddH2O를 함유하는 반응물을 95℃로 5분 동안 가열 블록(heating block)을 사용하여 가열함으로써 수행한다. 공여체 플라스미드 혼합물 40 fmol(~100 ng) 목적 골격(destination backbone)내로의 조립 반응을 위해, 1 μL의 어닐링(annealing)되고, 희석된 올리고, 0.75 μL의 Esp3I, 1 μL의 완충제 탕고(tango)(둘 다 Thermo Scientific), 1 μL의 T4 DNA 리가제(400 U/μL)(NEB) 뿐만 아니라 ATP 및 DTT를 1 mM의 최종 농도에서 총 10 μL의 용적으로. 써모사이클러(thermocycler)를 사용하여, 25 내지 50회 주기의 37℃/3분에 이은 20℃/5분을 수행한다. 제한 효소 및 리가제를 80℃에서 20분 동안 가열하여 변성시킨다. 화학-적격성(chemo-competent) 세균의 형질전환을 위해 3 μL의 당해 반응물을 SOC(37℃, 800 rpm, 40분)에 회수하고 클로람페니콜(25 μg/mL)을 함유하는 LB-한천 플레이트에 스프레딩(spreading)한다. sgRNA를 암호화하는 어닐링된 올리고뉴클레오타이드를 음성 선택 마커 ccdB(클로닝 동안 배경을 감소시키기 위함) 뿐만 아니라 클로람페니콜 내성 유전자도 수반하는 공여체 플라스미드 내로 클로닝한다. 정확한 조립을 시험하기 위해 플라스미드를 프라이머 Dono-R-5'-GTATGTTGTGTGGAATTGTGAG-3'(서열 번호: 948)를 사용하여 서열분석하였다. 제2 단계는 U6, H1 또는 7SK 프로모터의 전사 제어 하에서 하나의 sgRNA의 발현을 구동시키는 3개의 이러한 공여체 플라스미드를 AAV ITR을 수반하는 수용체 플라스미드와 함께 제2 골든 게이트 조립 속에 혼주하는 것이다. 조립 반응은 모든 4개의 플라스미드를 함유할 것이다: 공여체 플라스미드-#1-U6-sgRNA, 공여체 플라스미드-#2-H1-sgRNA, 공여체 플라스미드-#3-7SK-sgRNA 및 ITR을 함유하는 수용체 플라스미드. BbsI를 사용한 소화는 각각의 단편(U6, H1, 7SK, 수용체 골격)에 대해 독특한 오버행(overhang)을 생성할 것이다. 연결 과정 동안, 이러한 오버행은 어닐링되어 3개의 카세트가 서로 일치하는 경우, 환형 플라스미드 만이 수득된다.
혈청 크레아티닌 키나제(CK) 측정. 마우스 혈청 CK를 UT 사우쓰웨스턴 의학 센터(UT Southwestern Medical Center)에서 대사 표현형 코어에 의해 측정하였다. 혈액은 턱밑 정맥으로부터 수집하고 혈청 CK 수준은 VITROS 화학 7 제품 CK 슬라이드에 의해 측정하여 VITROS 250 화학 시스템을 사용하여 CK 활성을 정량적으로 측정하였다.
생체내 개 연구 . 근육내(IM) 주사를 환기된 일반적인 마취 하에서 1개월령의 △E50 MD 개에서 수행하였다. 1회 단일 주사를 좌측 두개골 근육의 4개의 상이한 부위에서 수행하였다. 모든 개에게 아편제(부프레노르핀)의 예비 투약, 수술전후 항생작용 및 수술후 4일의 진통제(카르프로펜)을 제공하였다. 2마리의 영향받은 개에게 근편집 성분(myoediting component)인, AAV-Cas9 및 AAV-sgRNA-ex51와 혼합된 rAAV를 제공하였으며, 이는 주사된 근육당 1E13vg의 최종 농도로 수유된 링거액 속에서 제조하였다.
실시예 2 - 결과
DMD의 사람화된 모델. DMD 환자에서 가장 일반적인 핫 스팟 돌연변이(hot spot mutation) 영역은 엑손 45 내지 51 사이의 영역이며, 엑손 51의 스키핑은 환자의 최대 그룹(13 내지 14%)을 치료하는데 사용될 수 있었다. 생체내에서 CRISPR/Cas9-매개된 엑손 51 스키핑을 시험하기 위하여, 본 발명자들은 2개의 sgRNA에 의해 지시된 CRISPR/Cas9 시스템을 사용하여 엑손 50을 결실시킴으로써 사람 "핫 스폿" 영역을 모사하는 마우스 모델을 생성하였다(도 1의 A). 엑손 50의 결실은 DNA 서열분석으로 확인하였다(도 1의 B). 엑손 50의 결실은 골격근 및 심장내 디스트로핀 단백질의 부재를 초래하는 프레임 밖의 디스트로핀 유전자에 놓여있다(도 1의 C 내지 E). 엑손 50을 결여하는 마우스는 2개월령까지 현저한 이영양성 근육 변화를 나타내었다(도 1의 E). 델타-엑손 50 마우스의 혈청 분석은 근육 손상의 지표인 크레아티닌 키나제(CK) 수준에서 유의적인 증가를 나타내었다(도 1의 F). 이와 함께, 디스트로핀 단백질 발현, 근육 조직학 및 혈청 CK 수준은 △Ex50 마우스 모델의 이영양성 표현형을 입증하였다.
엑손 51을 스킵하기 위한 단일 절단 전략을 사용한 디스트로핀 발현의 회복. 에스. 피오게네스(S. pyogenes) Cas9는 이중 가닥 DNA 브레이크를 생성하기 위해 PAM 서열로서 NAG/NGG를 필요로 한다. 흥미롭게도, 엑손의 공통의 스플라이스 수용체 및 공여체 부위는 NAG 또는 NGG를 함유한다(도 3의 B). 따라서, △Ex50 마우스 모델에서 판독 프레임 및 디스트로핀 발현을 수정하기 위하여, 발명자는 엑손 51의 스플라이스 수용체 및 공여체 부위를 표적화하여, 이를 결실시킴으로써, 프레임내 디스트로핀 단백질을 재생성하는 sgRNA를 생성하였다. sgRNA 가이드가 효율적으로 절단되는지를 시험하기 위하여, 본 발명자들은 우선 마우스 및 사람 세포주에서 이들의 효능을 평가하였다(도 5). DMD 판독 프레임을 수정하는 가장 효율적인 방법을 측정하기 위하여, 본 발명자들은 2개의 상이한 전략을 비교하였다: (1) 스플라이스 수용체 부위를 표적화하는 제1 sgRNA(sgRNA-SA)의 하나의 카피 및 공여체 수용체 부위를 표적화하는 제2 sgRNA(sgRNA-SD)의 하나의 카피를 rAAV9-sgRNA 벡터내로 클로닝하는 이중-가이드 전략; (2) 본 발명자가 동일한 sgRNA(sgRNA-SA)의 3개 카피를 rAAV9-sgRNA 벡터로 클로닝한 트리플리케이트 전략(도 3의 C). sgRNA-SA의 각각의 카피의 발현을 상이한 RNA 프로모터(U6, H1 및 7SK)로 구동시켰다. 본 발명자는 AAV-Cas9 벡터(CK8-Cas9-shortPolyA)를 사용하여 AAV-Cas9를 생성하였으며, 이는 CK8 프로모터를 사용하여 골격근 및 심장 조직내에서 사람화된 SpCas9의 발현을 특이적으로 구동시켰다. AAV를 사용한 P12 마우스의 근육내(IM) 주사 후, 근육 조직을 분석하였다. AAV-Tri-SA 및 AAV-SA+SD를 주입한 △Ex50 마우스로부터의 RNA의 RT-PCR은 엑손 51의 결실(△Ex50-51)이 엑손 49 내지 52로부터의 스플라이싱을 허용하였음을 나타내었다(도 2의 A, 하부 밴드). △Ex50-51 밴드의 RT-PCR 생성물의 서열분석은 엑손 49가 엑손 52로 스플라이싱됨을 확인하였다(도 2의 B). 예측하지 못하게도, RT-PCR 분석은 sgRNA-SA(AAV-Tri-SA)의 트리플리케이트 버젼이 2개의 sgRNAs - sgRNA-SA 및 sgRNA-SD(AAV-SA+SD)을 사용하는 바와 같이 효율적임을 나타내었다.
AAV-Tri-SA 편집 전략의 효율을 추가로 평가하기 위하여, 본 발명자는 전체 근육 단면 전반에 걸쳐서 디스트로핀을 발현하는 섬유의 수를 평가하기 위해 주사된 근육의 조직학적 분석을 수행하였다. 흥미롭게도, AAV-Tri-SA를 주사한 △Ex50 마우스로부터의 근육 동결단면의 디스트로핀 면역염색은 AAV-SA+SD를 주사한 △Ex50 마우스로부터의 근육(평균 31 ± 0.1%)과 비교하여 유의적으로 보다 큰 수의 디스트로핀-양성 섬유를 나타내었다(평균 43 ± 0.9%)(도 3의 D 내지 E, 도 6). 웨스턴 블롯 분석은 골격근내 디스트로핀 발현의 회복을 입증하였다(도 3의 F 내지 G). 근육의 헤마톡실린 및 에오신(H&E) 염색은 괴사성 근섬유와 같은 근 이영양증의 조직병리학적 특징이 AAV 전달 후 3주째에 TA 근육에 있어서 감소되었음을 나타내었다(도 4의 A). 근섬유 부위의 분포의 정량적 분석은 △Ex50 근육과 비교하여 AAV-Tri-SA 및 AAV-SA-SD 치료된 근육 둘 다에 대한 섬유 크기에 있어서 명확한 증가를 나타내었다(도 4의 B). 그러나, AAV-Tri-SA 치료된 근육은 AAV-SA+SD 치료된 근육과 비교하여 작은 섬유(<500 μm)의 빈도에 있어서 보다 높은 감소를 나타내었다. 이와 함께, 이러한 결과는 엑손 51의 스플라이스 수용체 부위를 AAV-Tri-SA를 사용한 하나의 단일 절단으로 표적화하는 것이 DMD에서 디스트로핀 발현을 회복하는데 매우 효율적임을 입증한다. 이러한 시도는 엑손 스키핑에 의해 수정될 수 있는 많은 장애에 대해 유용성을 갖는다.
단일 DNA 절단 게놈 편집 전략의 조절. sgRNA에 의해 가이드된 에스. 피오게네스(S. pyogenes) Cas9는 PAM 다음의 표적화된 게놈 유전자자리에 결합하여 PAM 서열에 앞서 이중 가닥 DNA 브레이크(DSB)의 3개의 뉴클레오타이드를 생성한다. 스플라이스 수용체 부위를 표적화함에 의한 방법의 효능을 추가로 평가하기 위하여, 본 발명자들은 엑손 51 스플라이스 수용체 부위에 인접한 영역을 표적화하는, 제2 sgRNA 트리플 가이드 작제물(sgRNA-ex51-SA2)을 설계하였다. 이러한 gRNA는 엑손내로 추가의 PAM 서열 3개 뉴클레오타이드를 사용하여 엑손 51에 대한 스플라이스 수용체 부위에 근접한 DSB를 생성하였다(도 7의 A 및 도 7의 B). 스플라이스 수용체 영역의 인근에서의 및 엑손 서열내에서의 절단은 재프레임화(reframing) 사건 및 엑손 스키핑 사건을 생성하였다. 더욱이, 종에 걸쳐서 인트로 서열보다 다 높은 전환을 나타내는 엑손 서열내 sgRNA를 설계하는 것은 다른 종에 대한 sgRNA의 해독을 촉진시킨다.
sgRNA-ex51-SA2와 커플링된 Cas9의 DNA 절단 활성을 미스매치-특이적인 T7 엔도뉴클레아제 I(T7E1) 검정을 사용하여 10T1/2 마우스 섬유아세포에서 평가하였다(도 8의 A). sgRNA-51-SA2와 커플링된 Cas9에 의해 생성된 돌연변이 유형을 시험하기 위해, 게놈 K-서열분석 분석(genomic deep-sequencing analysis)을 수행하였다. 서열분석 분석은 돌연변이의 9.3%가 PAM 서열의 3개 뉴클레오타이드 3'에 위치한 단일 아데노신(A) 삽입을 함유하였음을 나타내었다. 또한, 돌연변이의 7.3%는 엑손 51에 대한 스플라이스 수용체 부위 및 고도로-예측된 엑손 스플라이싱 인핸서 부위를 덮는 결실을 함유하였다(도 8의 B). sgRNA-ex51-SA2는 Dmd 유전자의 고도로 보존된 영역에 상응하며(도 8의 C 내지 D), 본 발명자는 293T 세포내에서 사람 Dmd 유전자자리를 절단하는 Cas9 및 사람 sgRNA-51의 능력을 시험하였다. T7E1 검정은 예측된 부위에서 명확한 절개를 나타내었다(도 8의 E). 유사하게, 서열 분석은 사람 sgRNA-ex51-SA2와 커플링된 Cas9가 절단 부위 주변에 동일한 아데노신(A) 삽입 및 상이한 범위의 결실을 생성하였음을 나타내었다(도 8의 F).
골격근 및 심장 조직에 대한 Cas9 및 sgRNA-ex51-SA2의 생체내 전달을 위하여, 아데노-관련 바이러스 9(AAV9)를 사용하였으며, 이는 이러한 조직에 대해 우선적인 향성(preferential tropism)을 나타낸다. 근육-특이적인 발현을 추가로 향상시키기 위하여, AAV9-Cas9 벡터(CK8e-Cas9-shortPolyA)를 사용하였으며, 이는 CK8e 프로모터로 지칭된 근육-특이적인 CK 조절 카세트를 함유하고, 이는 근육 및 심장에서의 발현에 대해 고도로 특이적이다(도 9의 A). 이와 함께, 이러한 436 bp 근육-특이적인 카세트 및 4101 bp Cas9 cDNA는 AAV9의 패키징 제한내에 있다. 각각의 sgRNA의 발현은 3개의 RNA 폴리머라제 III 프로모터(U6, H1 및 7SK) 중 하나에 의해 구동되었다(도 9의 B).
단일 DNA 절단에 의한 △Ex50 마우스내 디스트로핀 판독 프레임의 수정. sgRNA-ex51-SA2를 트리플 카피(AAV-Tri-SA2)로, Cas9(AAV-Cas9)와 함께, 근육내(IM) 주사에 의해 마우스에 전달하였다. 주사 후, 근육 조직을 분석하였다. 생체내 표적화 효능은 엑손 48 및 53내 서열에 대한 프라이머를 사용한 RT-PCR 및 표적화된 게놈 영역에 대한 T7E1 검정에 의해 평가하였다. 효율적인 표적 절개가 달성되었는지의 여부를 시험하기 위하여, 본 발명자는 표적 부위에 걸친 771 bp 영역을 증폭시키고 이를 T7EI 검정을 사용하여 분석하였다(도 10의 A). 상응하는 sgRNA를 사용한 SpCas9의 활성은 표적 부위에서 분석하였다. T7EI 검정은 AAV-Cas9 및 AAV9-sgRNA-51-SA2의 전달 후 Dmd 유전자자리의 돌연변이유발을 나타내었다(도 10의 A). Cas9 및 sgRNA-발현 AAV9를 주사한 △Ex50 마우스에서 생성된 돌연변이의 유형을 시험하기 위하여, 표적 부위에 걸친 게놈 PCR 증폭 생성물을 앰플리콘 K-서열분석 분석으로 분석하였다. 표적화된 영역의 K 서열분석은 총 판독물의 27.9%가 표적화된 게놈 부위에서의 변화를 함유하였음을 나타내었다(도 10의 B). 평균적으로, 확인된 돌연변이의 15%는 시험관내에서 마우스 10T1/2 및 사람 293 세포에서 관찰된 동일한 A 삽입을 함유하였다. 이러한 방법을 사용하여 확인한 결실은 엑손 51에 대한 고도로-예측된 엑손 스플라이싱 인핸서 부위를 포함하였다(도 10의 B).
AAV9-Cas9 및 AAV9-sgRNA-51을 근육내 주사한 △Ex50 마우스의 근육으로부터의 RNA의 RT-PCR 생성물은 엑손 51의 결실(△Ex50-51)이 엑손 49 내지 52로부터의 스플라이싱을 허용하였음을 나타내었다(도 11의 A, 하부 밴드). △Ex50-51 밴드의 RT-PCR 생성물을 서열분석함으로써, 엑손 49가 엑손 52로 스플라잉되었음을 확인하였다. 본 발명자의 유전자 편집 전략에 의해 도입된 돌연변이를 추가로 정의하기 위하여, 4개 샘플로부터의 RT-PCR 증폭 생성물을 겔 정제없이 토포이소머라제-기반 티미딘 대 아데노신(TOPO-TA) 클로닝에 적용시킨 후 서열분석하였다. 놀랍게도, 각각의 샘플로부터의 40개 클론의 서열 분석은 서열분석된 클론의 15%에서 확인된 엑손 51-스키핑된 cDNA 생성물(△Ex50-51) 외에도, AAV9-Cas9 및 AAV9-sgRNA-51를 주사한 △Ex50 마우스는 높은 빈도의 재프레임화 사건을 나타내었다. 서열분석된 클론 중, 63%는 엑손 51의 서열내 단일 뉴클레오타이드 삽입을 함유하였다(도 11의 B 내지 C). 관찰된 가장 우성인 삽입 돌연변이는 A 삽입이다.
겔에서, A 삽입은 편집되지 않은 cDNA 생성물로부터 크기가 구별되지 않았으므로, K-서열분석 분석을 수행하여 다른 작은 삽입과 비교한 당해 삽입의 풍부함을 측정하였다. 편집되지 않은 cDNA 생성물 및 재프레임된 cDNA 생성물을 함유하는 상부 밴드의 K-서열분석은 총 판독물의 69.22%가 A 삽입을 지닌 재프레임된 cDNA 생성물을 함유하였고, 17.71%가 편집되지 않은 cDNA 생성물을 함유하였으며, 나머지가 작은 결실 및 삽입을 함유하였음을 나타내었다(도 11의 D). 주사하지 않은 △Ex50 마우스의 K-서열분석 분석은 A 삽입이 Cas9-생성된 편집의 결과임을 확인하였다. 이러한 앰플리콘 K-서열분석 결과는 TOPO-TA 클로닝 및 서열분석으로부터의 결과를 확인하였다. 이와 함께, RT-PCR 분석은 AAV9-Cas9 및 AAV9-sgRNA-51-SA2를 주사한 △Ex50 마우스가 고도로 보존된 엑손 스플라이싱 인핸서 영역내 결실로부터 생성되는 엑손 51 스키핑 사건 외에 엑손 51의 서열내 A 삽입을 함유하는 cDNA 생성물을 사용한 고 빈도의 재프레임화 사건을 나타내었다.
Cas9 및 sgRNA-51-SA2의 근육내 AAV9 전달 후 디스트로핀 발현의 회복.
놀랍게도, AAV-Tri-SA2를 주사한 △Ex50 마우스로부터의 근육 동결단면의 디스트로핀 면역염색은 평균적으로 정상 섬유의 99% 회복을 지닌 유의적으로 보다 높은 수의 디스트로핀-양성 섬유를 나타내었다(도 12의 A, 도 13). 웨스턴 블롯 분석은 골격근내 디스트로핀 발현의 회복을 확인하였다.(도 12의 C, 도 12의 D). 근육의 헤마톡실린 및 에오신(H&E) 염색은 근 이영양증의 조직병리학적 특징, 예컨대, 괴사성 근섬유가 AAV 전달후 3주째에 TA 근육내에서 수정되었음을 확인하였다(도 12의 B 및 도 14). 명백한 sgRNA 설계를 사용한 이러한 방법은 가장 일반적인 디스트로핀 돌연변이를 지닌 환자에 대한 직접 적용능을 지닌 DMD 수정의 효능에 있어서 주요 진전을 나타낸다.
sgRNA의 단일 카피 또는 트리플 카피를 발현하는 상이한 AAV9와 조합된 AAV9-Cas9의 근육내 주사 후 디스트로핀 발현의 구제.
생체내에서 sgRNA-ex51-SA2의 트리플 프로모터 발현의 이점을 평가하기 위하여, 상이한 작제물을 시험하였으며, 여기서 sgRNA 발현은 단일 RNA 폴리머라제 III 프로모터(U6 또는 H1 또는 7SK) 및, 별도로 3개의 RNA 폴리머라제 III 프로모터(U6, H1 및 7SK)에 의해 구동시켰다(도 15의 A). 본 발명자들은 sgRNA-ex51-SA2를 U6 프로모터(AAV9-U6-sgRNA-51-SA2), H1 프로모터(AAV9-H1-sgRNA-51-SA2), 7SK 프로모터(AAV9-7SK-sgRNA-51-SA2) 및 트리플 카피(AAV9-트리플-sgRNA-51-SA2)에 의해 별도로 구동된 단일 카피 속에 전달하였다. AAV9를 사용한 P12 마우스의 근육내(IM) 주사 후, 근육 조직을 분석하였다. 예측치못하게도, AAV9-트리플-sgRNA-51-SA2를 주사한 △Ex50 마우스로부터의 근육 동결단면의 디스트로핀 면역염색은 각각 평균 70%; 40% 및 50%의 정상 섬유의 회복을 지닌 AAV9-U6-sgRNA-51-SA2, AAV-H1-sgRNA-51-SA2 및 AAV-7SK-sgRNA-51-SA2를 주사한 △Ex50 마우스와 비교하여 정상 섬유의 평균 95% 회복을 지닌 유의적으로 높은 수의 디스트로핀-양성 섬유를 나타내었다(도 15의 B).
AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전신계 전달 후 근육 구조 및 기능의 구제. P4 △Ex50 마우스에게로 AAV9-Cas9 및 AAV9-sgRNA-51-SA2의 전달은 4 및 8주 주사 후 유전자-편집된 △Ex50 마우스에서 심장, 삼두박근, 전경골근(TA) 근육, 및 횡격막내에서 광범위한 디스트로핀 발현을 수득하였다(도 16의 A 및 도 17의 A). 웨스턴 블롯 분석은 골격 및 심장근내 디스트로핀 발현의 회복을 확인하였다(도 16의 B 및 도 17의 B). 악력 시험은 또한 △Ex50 대조군 마우스(야생형 대조군 92.6±1.63; △Ex50 대조군 50.5±1.85; △Ex50-AAV9-sgRNA-51 79.7±2.63)와 비교하여 복강내 AAV9 주사 후 4주째에 △Ex50 마우스의 근육 강도에 있어서 유의적인 증가를 나타내었다(도 18의 A). 일관되게, AAV9-sgRNA-51-SA2 유전자-편집된 △Ex50 마우스는 또한 △Ex50 대조군 마우스와 비교하여 혈청 CK 농도에 있어서 유의적인 감소를 나타내었다(도 18의 B).
듀켄씨 근 이영양증의 개 모델에 있어서 디스트로핀 발현의 수정. 이러한 새로운 시도의 효능 및 치료학적 잠재능을 추가로 평가하기 위하여, 본 발명자는 DMD의 개 모델인, △E50-MD 개에서 질환-유발 돌연변이의 수정을 시험하였으며, 이러한 모델은 엑손 50의 결실을 생성하는 엑손 50의 5' 공여체 스플라이스 부위내 미스센스(missense) 돌연변이를 지닌다(Walmsley et al., 2010). △E50-MD 개는 사람에서 가장 일반적인 DMD 돌연변이를 영구적으로 수정하려는 시도로서의 유전자-편집의 시험을 위한 이상적인 개 모델이다.
본 발명자는 스플라이스 수용체 영역의 동일한 게놈 유전자자리를 표적화하는 sgRNA(sgRNA-ex51-SA2)를 사용하였다. sgRNA-ex51-SA2 서열은 고도로 보존되어 있다. 마우스 sgRNA-ex51-SA2 및 개 sgRNA-ex51-SA2(sgRNA-D-ex51-SA2)의 표적 서열은 하나의 단일 뉴클레오타이드에 의해서만 상이하다(표 4). 본 발명자는 트리플 카피(AAV-D-Tri-SA2) 내에 sgRNA-D-ex51-SA2를 전달하였다. AAV를 1개월령 개에게 근육내(IM) 주사한 후, 근육 조직을 분석하였다. 놀랍게도, AAV-Tri-SA2를 주사한 △Ex50 마우스로부터의 근육 동결단면의 디스트로핀 면역염색은 유의적으로 보다 큰 수의 디스트로핀-양성 섬유를 나타내었다(도 19). 웨스턴 블롯 분석은 골격근내 디스트로핀 발현의 회복을 확인하였다(도 20). 근육의 헤마톡실린 및 에오신(H&E) 염색은 괴사성 근섬유와 같은 근 이영양증(muscular dystrophy)의 조직병리학적 특징이 AAV 전달 후 6주째에 두개 경골 근육에서 감소되었음을 나타내었다(도 21). 명백한 sgRNA 설계를 사용한 이러한 방법은 가장 일반적인 디스트로핀 돌연변이를 지닌 환자에 대한 직접적으로 적용할 수 있는 DMD 수정의 효능에 있어서 주요 진전을 나타낸다.
본원에 개시되고 청구된 조성물 및/또는 방법 모두는 본 개시내용의 측면에서 과도한 실험없이 이루어지고 실행될 수 있다. 본 개시내용의 조성물 및 방법이 바람직한 구현예의 측면에서 기술되었지만, 변형이 본 개시내용의 개념, 취지 및 영역으로부터 벗어남이 없이, 본원에 기술된 조성물 및/또는 방법 및 방법의 단계 또는 단계의 순서에 적용될 수 있음이 당해 분야의 기술자에게 명백할 것이다. 보다 구체적으로, 화학적으로 및 생리학적으로 둘 다 관련된 특정 제제가 본원에 기술된 제제를 대체할 수 있지만 동일하거나 유사한 결과가 달성될 수 있음이 명백할 것이다. 당해 분야의 기술자에게 명백한 모든 이러한 유사한 대체 및 변형은 첨부된 청구범위에 정의된 바와 같이 개시내용의 취지, 영역 및 개념내에 있는 것으로 고려되어야 한다.
VII.
참고문헌
다음의 참고문헌은 본원에 나타낸 것들을 보충하는 예시적인 과정 또는 다른 세부사항을 제공하는 정도로, 본원에 참고로 구체적으로 포함된다.
SEQUENCE LISTING
<110> The Board of Regents of The University of Texas System
<120> OPTIMIZED STRATEGY FOR EXON SKIPPING MODIFICATIONS
USING CRISPR/CAS9 WITH TRIPLE GUIDE SEQUENCES
<130> IPA190825-US
<150> 62/596,298
<151> 2017-12-08
<150> 62/544,449
<151> 2017-08-11
<150> 62/442,606
<151> 2017-01-05
<160> 1026
<170> PatentIn version 3.5
<210> 1
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 1
tataaggaaa aaccaagcac tcagccagtg aagctgccag tcagactgtt actctagtga 60
cac 63
<210> 2
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 2
Tyr Lys Glu Lys Pro Ser Thr Gln Pro Val Lys Leu Pro Val Arg Leu
1 5 10 15
Leu Leu
<210> 3
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 3
ccagtgaagg caacactg 18
<210> 4
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 4
Gln Pro Val Lys Ala Thr
1 5
<210> 5
<211> 3685
<212> PRT
<213> Homo sapiens
<400> 5
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Gly Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Leu Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Gln Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala
3410 3415 3420
Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu
3425 3430 3435
His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser
3440 3445 3450
Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
3455 3460 3465
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser
3470 3475 3480
Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu
3485 3490 3495
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
3500 3505 3510
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys
3515 3520 3525
Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro
3530 3535 3540
Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu
3545 3550 3555
Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu
3560 3565 3570
Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser
3575 3580 3585
Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu
3590 3595 3600
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu
3605 3610 3615
Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly
3620 3625 3630
Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
3635 3640 3645
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu
3650 3655 3660
Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys
3665 3670 3675
Pro Met Arg Glu Asp Thr Met
3680 3685
<210> 6
<211> 14069
<212> DNA
<213> Homo sapiens
<400> 6
cgttaaatgc aaacgctgct ctggctcatg tgtttgctcc gaggtatagg ttttgttcga 60
ctgacgtatc agatagtcag agtggttacc acaccgacgt tgtagcagct gcataataaa 120
tgactgaaag aatcatgtta ggcatgccca cctaacctaa cttgaatcat gcgaaagggg 180
agctgttgga attcaaatag actttctggt tcccagcagt cggcagtaat agaatgcttt 240
caggaagatg acagaatcag gagaaagatg ctgttttgca ctatcttgat ttgttacagc 300
agccaactta ttggcatgat ggagtgacag gaaaaacagc tggcatggaa gatgaaagag 360
aagatgttca aaagaaaaca ttcacaaaat gggtaaatgc acaattttct aagtttggga 420
agcagcatat tgagaacctc ttcagtgacc tacaggatgg gaggcgcctc ctagacctcc 480
tcgaaggcct gacagggcaa aaactgccaa aagaaaaagg atccacaaga gttcatgccc 540
tgaacaatgt caacaaggca ctgcgggttt tgcagaacaa taatgttgat ttagtgaata 600
ttggaagtac tgacatcgta gatggaaatc ataaactgac tcttggtttg atttggaata 660
taatcctcca ctggcaggtc aaaaatgtaa tgaaaaatat catggctgga ttgcaacaaa 720
ccaacagtga aaagattctc ctgagctggg tccgacaatc aactcgtaat tatccacagg 780
ttaatgtaat caacttcacc accagctggt ctgatggcct ggctttgaat gctctcatcc 840
atagtcatag gccagaccta tttgactgga atagtgtggt ttgccagcag tcagccacac 900
aacgactgga acatgcattc aacatcgcca gatatcaatt aggcatagag aaactactcg 960
atcctgaaga tgttgatacc acctatccag ataagaagtc catcttaatg tacatcacat 1020
cactcttcca agttttgcct caacaagtga gcattgaagc catccaggaa gtggaaatgt 1080
tgccaaggcc acctaaagtg actaaagaag aacattttca gttacatcat caaatgcact 1140
attctcaaca gatcacggtc agtctagcac agggatatga gagaacttct tcccctaagc 1200
ctcgattcaa gagctatgcc tacacacagg ctgcttatgt caccacctct gaccctacac 1260
ggagcccatt tccttcacag catttggaag ctcctgaaga caagtcattt ggcagttcat 1320
tgatggagag tgaagtaaac ctggaccgtt atcaaacagc tttagaagaa gtattatcgt 1380
ggcttctttc tgctgaggac acattgcaag cacaaggaga gatttctaat gatgtggaag 1440
tggtgaaaga ccagtttcat actcatgagg ggtacatgat ggatttgaca gcccatcagg 1500
gccgggttgg taatattcta caattgggaa gtaagctgat tggaacagga aaattatcag 1560
aagatgaaga aactgaagta caagagcaga tgaatctcct aaattcaaga tgggaatgcc 1620
tcagggtagc tagcatggaa aaacaaagca atttacatag agttttaatg gatctccaga 1680
atcagaaact gaaagagttg aatgactggc taacaaaaac agaagaaaga acaaggaaaa 1740
tggaggaaga gcctcttgga cctgatcttg aagacctaaa acgccaagta caacaacata 1800
aggtgcttca agaagatcta gaacaagaac aagtcagggt caattctctc actcacatgg 1860
tggtggtagt tgatgaatct agtggagatc acgcaactgc tgctttggaa gaacaactta 1920
aggtattggg agatcgatgg gcaaacatct gtagatggac agaagaccgc tgggttcttt 1980
tacaagacat ccttctcaaa tggcaacgtc ttactgaaga acagtgcctt tttagtgcat 2040
ggctttcaga aaaagaagat gcagtgaaca agattcacac aactggcttt aaagatcaaa 2100
atgaaatgtt atcaagtctt caaaaactgg ccgttttaaa agcggatcta gaaaagaaaa 2160
agcaatccat gggcaaactg tattcactca aacaagatct tctttcaaca ctgaagaata 2220
agtcagtgac ccagaagacg gaagcatggc tggataactt tgcccggtgt tgggataatt 2280
tagtccaaaa acttgaaaag agtacagcac agatttcaca ggctgtcacc accactcagc 2340
catcactaac acagacaact gtaatggaaa cagtaactac ggtgaccaca agggaacaga 2400
tcctggtaaa gcatgctcaa gaggaacttc caccaccacc tccccaaaag aagaggcaga 2460
ttactgtgga ttctgaaatt aggaaaaggt tggatgttga tataactgaa cttcacagct 2520
ggattactcg ctcagaagct gtgttgcaga gtcctgaatt tgcaatcttt cggaaggaag 2580
gcaacttctc agacttaaaa gaaaaagtca atgccataga gcgagaaaaa gctgagaagt 2640
tcagaaaact gcaagatgcc agcagatcag ctcaggccct ggtggaacag atggtgaatg 2700
agggtgttaa tgcagatagc atcaaacaag cctcagaaca actgaacagc cggtggatcg 2760
aattctgcca gttgctaagt gagagactta actggctgga gtatcagaac aacatcatcg 2820
ctttctataa tcagctacaa caattggagc agatgacaac tactgctgaa aactggttga 2880
aaatccaacc caccacccca tcagagccaa cagcaattaa aagtcagtta aaaatttgta 2940
aggatgaagt caaccggcta tcaggtcttc aacctcaaat tgaacgatta aaaattcaaa 3000
gcatagccct gaaagagaaa ggacaaggac ccatgttcct ggatgcagac tttgtggcct 3060
ttacaaatca ttttaagcaa gtcttttctg atgtgcaggc cagagagaaa gagctacaga 3120
caatttttga cactttgcca ccaatgcgct atcaggagac catgagtgcc atcaggacat 3180
gggtccagca gtcagaaacc aaactctcca tacctcaact tagtgtcacc gactatgaaa 3240
tcatggagca gagactcggg gaattgcagg ctttacaaag ttctctgcaa gagcaacaaa 3300
gtggcctata ctatctcagc accactgtga aagagatgtc gaagaaagcg ccctctgaaa 3360
ttagccggaa atatcaatca gaatttgaag aaattgaggg acgctggaag aagctctcct 3420
cccagctggt tgagcattgt caaaagctag aggagcaaat gaataaactc cgaaaaattc 3480
agaatcacat acaaaccctg aagaaatgga tggctgaagt tgatgttttt ctgaaggagg 3540
aatggcctgc ccttggggat tcagaaattc taaaaaagca gctgaaacag tgcagacttt 3600
tagtcagtga tattcagaca attcagccca gtctaaacag tgtcaatgaa ggtgggcaga 3660
agataaagaa tgaagcagag ccagagtttg cttcgagact tgagacagaa ctcaaagaac 3720
ttaacactca gtgggatcac atgtgccaac aggtctatgc cagaaaggag gccttgaagg 3780
gaggtttgga gaaaactgta agcctccaga aagatctatc agagatgcac gaatggatga 3840
cacaagctga agaagagtat cttgagagag attttgaata taaaactcca gatgaattac 3900
agaaagcagt tgaagagatg aagagagcta aagaagaggc ccaacaaaaa gaagcgaaag 3960
tgaaactcct tactgagtct gtaaatagtg tcatagctca agctccacct gtagcacaag 4020
aggccttaaa aaaggaactt gaaactctaa ccaccaacta ccagtggctc tgcactaggc 4080
tgaatgggaa atgcaagact ttggaagaag tttgggcatg ttggcatgag ttattgtcat 4140
acttggagaa agcaaacaag tggctaaatg aagtagaatt taaacttaaa accactgaaa 4200
acattcctgg cggagctgag gaaatctctg aggtgctaga ttcacttgaa aatttgatgc 4260
gacattcaga ggataaccca aatcagattc gcatattggc acagacccta acagatggcg 4320
gagtcatgga tgagctaatc aatgaggaac ttgagacatt taattctcgt tggagggaac 4380
tacatgaaga ggctgtaagg aggcaaaagt tgcttgaaca gagcatccag tctgcccagg 4440
agactgaaaa atccttacac ttaatccagg agtccctcac attcattgac aagcagttgg 4500
cagcttatat tgcagacaag gtggacgcag ctcaaatgcc tcaggaagcc cagaaaatcc 4560
aatctgattt gacaagtcat gagatcagtt tagaagaaat gaagaaacat aatcagggga 4620
aggaggctgc ccaaagagtc ctgtctcaga ttgatgttgc acagaaaaaa ttacaagatg 4680
tctccatgaa gtttcgatta ttccagaaac cagccaattt tgagcagcgt ctacaagaaa 4740
gtaagatgat tttagatgaa gtgaagatgc acttgcctgc attggaaaca aagagtgtgg 4800
aacaggaagt agtacagtca cagctaaatc attgtgtgaa cttgtataaa agtctgagtg 4860
aagtgaagtc tgaagtggaa atggtgataa agactggacg tcagattgta cagaaaaagc 4920
agacggaaaa tcccaaagaa cttgatgaaa gagtaacagc tttgaaattg cattataatg 4980
agctgggagc aaaggtaaca gaaagaaagc aacagttgga gaaatgcttg aaattgtccc 5040
gtaagatgcg aaaggaaatg aatgtcttga cagaatggct ggcagctaca gatatggaat 5100
tgacaaagag atcagcagtt gaaggaatgc ctagtaattt ggattctgaa gttgcctggg 5160
gaaaggctac tcaaaaagag attgagaaac agaaggtgca cctgaagagt atcacagagg 5220
taggagaggc cttgaaaaca gttttgggca agaaggagac gttggtggaa gataaactca 5280
gtcttctgaa tagtaactgg atagctgtca cctcccgagc agaagagtgg ttaaatcttt 5340
tgttggaata ccagaaacac atggaaactt ttgaccagaa tgtggaccac atcacaaagt 5400
ggatcattca ggctgacaca cttttggatg aatcagagaa aaagaaaccc cagcaaaaag 5460
aagacgtgct taagcgttta aaggcagaac tgaatgacat acgcccaaag gtggactcta 5520
cacgtgacca agcagcaaac ttgatggcaa accgcggtga ccactgcagg aaattagtag 5580
agccccaaat ctcagagctc aaccatcgat ttgcagccat ttcacacaga attaagactg 5640
gaaaggcctc cattcctttg aaggaattgg agcagtttaa ctcagatata caaaaattgc 5700
ttgaaccact ggaggctgaa attcagcagg gggtgaatct gaaagaggaa gacttcaata 5760
aagatatgaa tgaagacaat gagggtactg taaaagaatt gttgcaaaga ggagacaact 5820
tacaacaaag aatcacagat gagagaaagc gagaggaaat aaagataaaa cagcagctgt 5880
tacagacaaa acataatgct ctcaaggatt tgaggtctca aagaagaaaa aaggctctag 5940
aaatttctca tcagtggtat cagtacaaga ggcaggctga tgatctcctg aaatgcttgg 6000
atgacattga aaaaaaatta gccagcctac ctgagcccag agatgaaagg aaaataaagg 6060
aaattgatcg ggaattgcag aagaagaaag aggagctgaa tgcagtgcgt aggcaagctg 6120
agggcttgtc tgaggatggg gccgcaatgg cagtggagcc aactcagatc cagctcagca 6180
agcgctggcg ggaaattgag agcaaatttg ctcagtttcg aagactcaac tttgcacaaa 6240
ttcacactgt ccgtgaagaa acgatgatgg tgatgactga agacatgcct ttggaaattt 6300
cttatgtgcc ttctacttat ttgactgaaa tcactcatgt ctcacaagcc ctattagaag 6360
tggaacaact tctcaatgct cctgacctct gtgctaagga ctttgaagat ctctttaagc 6420
aagaggagtc tctgaagaat ataaaagata gtctacaaca aagctcaggt cggattgaca 6480
ttattcatag caagaagaca gcagcattgc aaagtgcaac gcctgtggaa agggtgaagc 6540
tacaggaagc tctctcccag cttgatttcc aatgggaaaa agttaacaaa atgtacaagg 6600
accgacaagg gcgatttgac agatctgttg agaaatggcg gcgttttcat tatgatataa 6660
agatatttaa tcagtggcta acagaagctg aacagtttct cagaaagaca caaattcctg 6720
agaattggga acatgctaaa tacaaatggt atcttaagga actccaggat ggcattgggc 6780
agcggcaaac tgttgtcaga acattgaatg caactgggga agaaataatt cagcaatcct 6840
caaaaacaga tgccagtatt ctacaggaaa aattgggaag cctgaatctg cggtggcagg 6900
aggtctgcaa acagctgtca gacagaaaaa agaggctaga agaacaaaag aatatcttgt 6960
cagaatttca aagagattta aatgaatttg ttttatggtt ggaggaagca gataacattg 7020
ctagtatccc acttgaacct ggaaaagagc agcaactaaa agaaaagctt gagcaagtca 7080
agttactggt ggaagagttg cccctgcgcc agggaattct caaacaatta aatgaaactg 7140
gaggacccgt gcttgtaagt gctcccataa gcccagaaga gcaagataaa cttgaaaata 7200
agctcaagca gacaaatctc cagtggataa aggtttccag agctttacct gagaaacaag 7260
gagaaattga agctcaaata aaagaccttg ggcagcttga aaaaaagctt gaagaccttg 7320
aagagcagtt aaatcatctg ctgctgtggt tatctcctat taggaatcag ttggaaattt 7380
ataaccaacc aaaccaagaa ggaccatttg acgttcagga aactgaaata gcagttcaag 7440
ctaaacaacc ggatgtggaa gagattttgt ctaaagggca gcatttgtac aaggaaaaac 7500
cagccactca gccagtgaag aggaagttag aagatctgag ctctgagtgg aaggcggtaa 7560
accgtttact tcaagagctg agggcaaagc agcctgacct agctcctgga ctgaccacta 7620
ttggagcctc tcctactcag actgttactc tggtgacaca acctgtggtt actaaggaaa 7680
ctgccatctc caaactagaa atgccatctt ccttgatgtt ggaggtacct gctctggcag 7740
atttcaaccg ggcttggaca gaacttaccg actggctttc tctgcttgat caagttataa 7800
aatcacagag ggtgatggtg ggtgaccttg aggatatcaa cgagatgatc atcaagcaga 7860
aggcaacaat gcaggatttg gaacagaggc gtccccagtt ggaagaactc attaccgctg 7920
cccaaaattt gaaaaacaag accagcaatc aagaggctag aacaatcatt acggatcgaa 7980
ttgaaagaat tcagaatcag tgggatgaag tacaagaaca ccttcagaac cggaggcaac 8040
agttgaatga aatgttaaag gattcaacac aatggctgga agctaaggaa gaagctgagc 8100
aggtcttagg acaggccaga gccaagcttg agtcatggaa ggagggtccc tatacagtag 8160
atgcaatcca aaagaaaatc acagaaacca agcagttggc caaagacctc cgccagtggc 8220
agacaaatgt agatgtggca aatgacttgg ccctgaaact tctccgggat tattctgcag 8280
atgataccag aaaagtccac atgataacag agaatatcaa tgcctcttgg agaagcattc 8340
ataaaagggt gagtgagcga gaggctgctt tggaagaaac tcatagatta ctgcaacagt 8400
tccccctgga cctggaaaag tttcttgcct ggcttacaga agctgaaaca actgccaatg 8460
tcctacagga tgctacccgt aaggaaaggc tcctagaaga ctccaaggga gtaaaagagc 8520
tgatgaaaca atggcaagac ctccaaggtg aaattgaagc tcacacagat gtttatcaca 8580
acctggatga aaacagccaa aaaatcctga gatccctgga aggttccgat gatgcagtcc 8640
tgttacaaag acgtttggat aacatgaact tcaagtggag tgaacttcgg aaaaagtctc 8700
tcaacattag gtcccatttg gaagccagtt ctgaccagtg gaagcgtctg cacctttctc 8760
tgcaggaact tctggtgtgg ctacagctga aagatgatga attaagccgg caggcaccta 8820
ttggaggcga ctttccagca gttcagaagc agaacgatgt acatagggcc ttcaagaggg 8880
aattgaaaac taaagaacct gtaatcatga gtactcttga gactgtacga atatttctga 8940
cagagcagcc tttggaagga ctagagaaac tctaccagga gcccagagag ctgcctcctg 9000
aggagagagc ccagaatgtc actcggcttc tacgaaagca ggctgaggag gtcaatactg 9060
agtgggaaaa attgaacctg cactccgctg actggcagag aaaaatagat gagacccttg 9120
aaagactcca ggaacttcaa gaggccacgg atgagctgga cctcaagctg cgccaagctg 9180
aggtgatcaa gggatcctgg cagcccgtgg gcgatctcct cattgactct ctccaagatc 9240
acctcgagaa agtcaaggca cttcgaggag aaattgcgcc tctgaaagag aacgtgagcc 9300
acgtcaatga ccttgctcgc cagcttacca ctttgggcat tcagctctca ccgtataacc 9360
tcagcactct ggaagacctg aacaccagat ggaagcttct gcaggtggcc gtcgaggacc 9420
gagtcaggca gctgcatgaa gcccacaggg actttggtcc agcatctcag cactttcttt 9480
ccacgtctgt ccagggtccc tgggagagag ccatctcgcc aaacaaagtg ccctactata 9540
tcaaccacga gactcaaaca acttgctggg accatcccaa aatgacagag ctctaccagt 9600
ctttagctga cctgaataat gtcagattct cagcttatag gactgccatg aaactccgaa 9660
gactgcagaa ggccctttgc ttggatctct tgagcctgtc agctgcatgt gatgccttgg 9720
accagcacaa cctcaagcaa aatgaccagc ccatggatat cctgcagatt attaattgtt 9780
tgaccactat ttatgaccgc ctggagcaag agcacaacaa tttggtcaac gtccctctct 9840
gcgtggatat gtgtctgaac tggctgctga atgtttatga tacgggacga acagggagga 9900
tccgtgtcct gtcttttaaa actggcatca tttccctgtg taaagcacat ttggaagaca 9960
agtacagata ccttttcaag caagtggcaa gttcaacagg attttgtgac cagcgcaggc 10020
tgggcctcct tctgcatgat tctatccaaa ttccaagaca gttgggtgaa gttgcatcct 10080
ttgggggcag taacattgag ccaagtgtcc ggagctgctt ccaatttgct aataataagc 10140
cagagatcga agcggccctc ttcctagact ggatgagact ggaaccccag tccatggtgt 10200
ggctgcccgt cctgcacaga gtggctgctg cagaaactgc caagcatcag gccaaatgta 10260
acatctgcaa agagtgtcca atcattggat tcaggtacag gagtctaaag cactttaatt 10320
atgacatctg ccaaagctgc tttttttctg gtcgagttgc aaaaggccat aaaatgcact 10380
atcccatggt ggaatattgc actccgacta catcaggaga agatgttcga gactttgcca 10440
aggtactaaa aaacaaattt cgaaccaaaa ggtattttgc gaagcatccc cgaatgggct 10500
acctgccagt gcagactgtc ttagaggggg acaacatgga aactcccgtt actctgatca 10560
acttctggcc agtagattct gcgcctgcct cgtcccctca gctttcacac gatgatactc 10620
attcacgcat tgaacattat gctagcaggc tagcagaaat ggaaaacagc aatggatctt 10680
atctaaatga tagcatctct cctaatgaga gcatagatga tgaacatttg ttaatccagc 10740
attactgcca aagtttgaac caggactccc ccctgagcca gcctcgtagt cctgcccaga 10800
tcttgatttc cttagagagt gaggaaagag gggagctaga gagaatccta gcagatcttg 10860
aggaagaaaa caggaatctg caagcagaat atgaccgtct aaagcagcag cacgaacata 10920
aaggcctgtc cccactgccg tcccctcctg aaatgatgcc cacctctccc cagagtcccc 10980
gggatgctga gctcattgct gaggccaagc tactgcgtca acacaaaggc cgcctggaag 11040
ccaggatgca aatcctggaa gaccacaata aacagctgga gtcacagtta cacaggctaa 11100
ggcagctgct ggagcaaccc caggcagagg ccaaagtgaa tggcacaacg gtgtcctctc 11160
cttctacctc tctacagagg tccgacagca gtcagcctat gctgctccga gtggttggca 11220
gtcaaacttc ggactccatg ggtgaggaag atcttctcag tcctccccag gacacaagca 11280
cagggttaga ggaggtgatg gagcaactca acaactcctt ccctagttca agaggaagaa 11340
atacccctgg aaagccaatg agagaggaca caatgtagga agtcttttcc acatggcaga 11400
tgatttgggc agagcgatgg agtccttagt atcagtcatg acagatgaag aaggagcaga 11460
ataaatgttt tacaactcct gattcccgca tggtttttat aatattcata caacaaagag 11520
gattagacag taagagttta caagaaataa atctatattt ttgtgaaggg tagtggtatt 11580
atactgtaga tttcagtagt ttctaagtct gttattgttt tgttaacaat ggcaggtttt 11640
acacgtctat gcaattgtac aaaaaagtta taagaaaact acatgtaaaa tcttgatagc 11700
taaataactt gccatttctt tatatggaac gcattttggg ttgtttaaaa atttataaca 11760
gttataaaga aagattgtaa actaaagtgt gctttataaa aaaaagttgt ttataaaaac 11820
ccctaaaaac aaaacaaaca cacacacaca cacatacaca cacacacaca aaactttgag 11880
gcagcgcatt gttttgcatc cttttggcgt gatatccata tgaaattcat ggctttttct 11940
ttttttgcat attaaagata agacttcctc taccaccaca ccaaatgact actacacact 12000
gctcatttga gaactgtcag ctgagtgggg caggcttgag ttttcatttc atatatctat 12060
atgtctataa gtatataaat actatagtta tatagataaa gagatacgaa tttctataga 12120
ctgacttttt ccatttttta aatgttcatg tcacatccta atagaaagaa attacttcta 12180
gtcagtcatc caggcttacc tgcttggtct agaatggatt tttcccggag ccggaagcca 12240
ggaggaaact acaccacact aaaacattgt ctacagctcc agatgtttct cattttaaac 12300
aactttccac tgacaacgaa agtaaagtaa agtattggat ttttttaaag ggaacatgtg 12360
aatgaataca caggacttat tatatcagag tgagtaatcg gttggttggt tgattgattg 12420
attgattgat acattcagct tcctgctgct agcaatgcca cgatttagat ttaatgatgc 12480
ttcagtggaa atcaatcaga aggtattctg accttgtgaa catcagaagg tattttttaa 12540
ctcccaagca gtagcaggac gatgataggg ctggagggct atggattccc agcccatccc 12600
tgtgaaggag taggccactc tttaagtgaa ggattggatg attgttcata atacataaag 12660
ttctctgtaa ttacaactaa attattatgc cctcttctca cagtcaaaag gaactgggtg 12720
gtttggtttt tgttgctttt ttagatttat tgtcccatgt gggatgagtt tttaaatgcc 12780
acaagacata atttaaaata aataaacttt gggaaaaggt gtaaaacagt agccccatca 12840
catttgtgat actgacaggt atcaacccag aagcccatga actgtgtttc catcctttgc 12900
atttctctgc gagtagttcc acacaggttt gtaagtaagt aagaaagaag gcaaattgat 12960
tcaaatgtta caaaaaaacc cttcttggtg gattagacag gttaaatata taaacaaaca 13020
aacaaaaatt gctcaaaaaa gaggagaaaa gctcaagagg aaaagctaag gactggtagg 13080
aaaaagcttt actctttcat gccattttat ttctttttga tttttaaatc attcattcaa 13140
tagataccac cgtgtgacct ataattttgc aaatctgtta cctctgacat caagtgtaat 13200
tagcttttgg agagtgggct gacatcaagt gtaattagct tttggagagt gggttttgtc 13260
cattattaat aattaattaa ttaacatcaa acacggcttc tcatgctatt tctacctcac 13320
tttggttttg gggtgttcct gataattgtg cacacctgag ttcacagctt caccacttgt 13380
ccattgcgtt attttctttt tcctttataa ttctttcttt ttccttcata attttcaaaa 13440
gaaaacccaa agctctaagg taacaaatta ccaaattaca tgaagatttg gtttttgtct 13500
tgcatttttt tcctttatgt gacgctggac cttttcttta cccaaggatt tttaaaactc 13560
agatttaaaa caaggggtta ctttacatcc tactaagaag tttaagtaag taagtttcat 13620
tctaaaatca gaggtaaata gagtgcataa ataattttgt tttaatcttt ttgtttttct 13680
tttagacaca ttagctctgg agtgagtctg tcataatatt tgaacaaaaa ttgagagctt 13740
tattgctgca ttttaagcat aattaatttg gacattattt cgtgttgtgt tctttataac 13800
caccaagtat taaactgtaa atcataatgt aactgaagca taaacatcac atggcatgtt 13860
ttgtcattgt tttcaggtac tgagttctta cttgagtatc ataatatatt gtgttttaac 13920
accaacactg taacatttac gaattatttt tttaaacttc agttttactg cattttcaca 13980
acatatcaga cttcaccaaa tatatgcctt actattgtat tatagtactg ctttactgtg 14040
tatctcaata aagcacgcag ttatgttac 14069
<210> 7
<211> 3677
<212> PRT
<213> Homo sapiens
<400> 7
Met Glu Asp Glu Arg Glu Asp Val Gln Lys Lys Thr Phe Thr Lys Trp
1 5 10 15
Val Asn Ala Gln Phe Ser Lys Phe Gly Lys Gln His Ile Glu Asn Leu
20 25 30
Phe Ser Asp Leu Gln Asp Gly Arg Arg Leu Leu Asp Leu Leu Glu Gly
35 40 45
Leu Thr Gly Gln Lys Leu Pro Lys Glu Lys Gly Ser Thr Arg Val His
50 55 60
Ala Leu Asn Asn Val Asn Lys Ala Leu Arg Val Leu Gln Asn Asn Asn
65 70 75 80
Val Asp Leu Val Asn Ile Gly Ser Thr Asp Ile Val Asp Gly Asn His
85 90 95
Lys Leu Thr Leu Gly Leu Ile Trp Asn Ile Ile Leu His Trp Gln Val
100 105 110
Lys Asn Val Met Lys Asn Ile Met Ala Gly Leu Gln Gln Thr Asn Ser
115 120 125
Glu Lys Ile Leu Leu Ser Trp Val Arg Gln Ser Thr Arg Asn Tyr Pro
130 135 140
Gln Val Asn Val Ile Asn Phe Thr Thr Ser Trp Ser Asp Gly Leu Ala
145 150 155 160
Leu Asn Ala Leu Ile His Ser His Arg Pro Asp Leu Phe Asp Trp Asn
165 170 175
Ser Val Val Cys Gln Gln Ser Ala Thr Gln Arg Leu Glu His Ala Phe
180 185 190
Asn Ile Ala Arg Tyr Gln Leu Gly Ile Glu Lys Leu Leu Asp Pro Glu
195 200 205
Asp Val Asp Thr Thr Tyr Pro Asp Lys Lys Ser Ile Leu Met Tyr Ile
210 215 220
Thr Ser Leu Phe Gln Val Leu Pro Gln Gln Val Ser Ile Glu Ala Ile
225 230 235 240
Gln Glu Val Glu Met Leu Pro Arg Pro Pro Lys Val Thr Lys Glu Glu
245 250 255
His Phe Gln Leu His His Gln Met His Tyr Ser Gln Gln Ile Thr Val
260 265 270
Ser Leu Ala Gln Gly Tyr Glu Arg Thr Ser Ser Pro Lys Pro Arg Phe
275 280 285
Lys Ser Tyr Ala Tyr Thr Gln Ala Ala Tyr Val Thr Thr Ser Asp Pro
290 295 300
Thr Arg Ser Pro Phe Pro Ser Gln His Leu Glu Ala Pro Glu Asp Lys
305 310 315 320
Ser Phe Gly Ser Ser Leu Met Glu Ser Glu Val Asn Leu Asp Arg Tyr
325 330 335
Gln Thr Ala Leu Glu Glu Val Leu Ser Trp Leu Leu Ser Ala Glu Asp
340 345 350
Thr Leu Gln Ala Gln Gly Glu Ile Ser Asn Asp Val Glu Val Val Lys
355 360 365
Asp Gln Phe His Thr His Glu Gly Tyr Met Met Asp Leu Thr Ala His
370 375 380
Gln Gly Arg Val Gly Asn Ile Leu Gln Leu Gly Ser Lys Leu Ile Gly
385 390 395 400
Thr Gly Lys Leu Ser Glu Asp Glu Glu Thr Glu Val Gln Glu Gln Met
405 410 415
Asn Leu Leu Asn Ser Arg Trp Glu Cys Leu Arg Val Ala Ser Met Glu
420 425 430
Lys Gln Ser Asn Leu His Arg Val Leu Met Asp Leu Gln Asn Gln Lys
435 440 445
Leu Lys Glu Leu Asn Asp Trp Leu Thr Lys Thr Glu Glu Arg Thr Arg
450 455 460
Lys Met Glu Glu Glu Pro Leu Gly Pro Asp Leu Glu Asp Leu Lys Arg
465 470 475 480
Gln Val Gln Gln His Lys Val Leu Gln Glu Asp Leu Glu Gln Glu Gln
485 490 495
Val Arg Val Asn Ser Leu Thr His Met Val Val Val Val Asp Glu Ser
500 505 510
Ser Gly Asp His Ala Thr Ala Ala Leu Glu Glu Gln Leu Lys Val Leu
515 520 525
Gly Asp Arg Trp Ala Asn Ile Cys Arg Trp Thr Glu Asp Arg Trp Val
530 535 540
Leu Leu Gln Asp Ile Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln
545 550 555 560
Cys Leu Phe Ser Ala Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys
565 570 575
Ile His Thr Thr Gly Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu
580 585 590
Gln Lys Leu Ala Val Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser
595 600 605
Met Gly Lys Leu Tyr Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys
610 615 620
Asn Lys Ser Val Thr Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala
625 630 635 640
Arg Cys Trp Asp Asn Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln
645 650 655
Ile Ser Gln Ala Val Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr
660 665 670
Val Met Glu Thr Val Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val
675 680 685
Lys His Ala Gln Glu Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg
690 695 700
Gln Ile Thr Val Asp Ser Glu Ile Arg Lys Arg Leu Asp Val Asp Ile
705 710 715 720
Thr Glu Leu His Ser Trp Ile Thr Arg Ser Glu Ala Val Leu Gln Ser
725 730 735
Pro Glu Phe Ala Ile Phe Arg Lys Glu Gly Asn Phe Ser Asp Leu Lys
740 745 750
Glu Lys Val Asn Ala Ile Glu Arg Glu Lys Ala Glu Lys Phe Arg Lys
755 760 765
Leu Gln Asp Ala Ser Arg Ser Ala Gln Ala Leu Val Glu Gln Met Val
770 775 780
Asn Glu Gly Val Asn Ala Asp Ser Ile Lys Gln Ala Ser Glu Gln Leu
785 790 795 800
Asn Ser Arg Trp Ile Glu Phe Cys Gln Leu Leu Ser Glu Arg Leu Asn
805 810 815
Trp Leu Glu Tyr Gln Asn Asn Ile Ile Ala Phe Tyr Asn Gln Leu Gln
820 825 830
Gln Leu Glu Gln Met Thr Thr Thr Ala Glu Asn Trp Leu Lys Ile Gln
835 840 845
Pro Thr Thr Pro Ser Glu Pro Thr Ala Ile Lys Ser Gln Leu Lys Ile
850 855 860
Cys Lys Asp Glu Val Asn Arg Leu Ser Gly Leu Gln Pro Gln Ile Glu
865 870 875 880
Arg Leu Lys Ile Gln Ser Ile Ala Leu Lys Glu Lys Gly Gln Gly Pro
885 890 895
Met Phe Leu Asp Ala Asp Phe Val Ala Phe Thr Asn His Phe Lys Gln
900 905 910
Val Phe Ser Asp Val Gln Ala Arg Glu Lys Glu Leu Gln Thr Ile Phe
915 920 925
Asp Thr Leu Pro Pro Met Arg Tyr Gln Glu Thr Met Ser Ala Ile Arg
930 935 940
Thr Trp Val Gln Gln Ser Glu Thr Lys Leu Ser Ile Pro Gln Leu Ser
945 950 955 960
Val Thr Asp Tyr Glu Ile Met Glu Gln Arg Leu Gly Glu Leu Gln Ala
965 970 975
Leu Gln Ser Ser Leu Gln Glu Gln Gln Ser Gly Leu Tyr Tyr Leu Ser
980 985 990
Thr Thr Val Lys Glu Met Ser Lys Lys Ala Pro Ser Glu Ile Ser Arg
995 1000 1005
Lys Tyr Gln Ser Glu Phe Glu Glu Ile Glu Gly Arg Trp Lys Lys
1010 1015 1020
Leu Ser Ser Gln Leu Val Glu His Cys Gln Lys Leu Glu Glu Gln
1025 1030 1035
Met Asn Lys Leu Arg Lys Ile Gln Asn His Ile Gln Thr Leu Lys
1040 1045 1050
Lys Trp Met Ala Glu Val Asp Val Phe Leu Lys Glu Glu Trp Pro
1055 1060 1065
Ala Leu Gly Asp Ser Glu Ile Leu Lys Lys Gln Leu Lys Gln Cys
1070 1075 1080
Arg Leu Leu Val Ser Asp Ile Gln Thr Ile Gln Pro Ser Leu Asn
1085 1090 1095
Ser Val Asn Glu Gly Gly Gln Lys Ile Lys Asn Glu Ala Glu Pro
1100 1105 1110
Glu Phe Ala Ser Arg Leu Glu Thr Glu Leu Lys Glu Leu Asn Thr
1115 1120 1125
Gln Trp Asp His Met Cys Gln Gln Val Tyr Ala Arg Lys Glu Ala
1130 1135 1140
Leu Lys Gly Gly Leu Glu Lys Thr Val Ser Leu Gln Lys Asp Leu
1145 1150 1155
Ser Glu Met His Glu Trp Met Thr Gln Ala Glu Glu Glu Tyr Leu
1160 1165 1170
Glu Arg Asp Phe Glu Tyr Lys Thr Pro Asp Glu Leu Gln Lys Ala
1175 1180 1185
Val Glu Glu Met Lys Arg Ala Lys Glu Glu Ala Gln Gln Lys Glu
1190 1195 1200
Ala Lys Val Lys Leu Leu Thr Glu Ser Val Asn Ser Val Ile Ala
1205 1210 1215
Gln Ala Pro Pro Val Ala Gln Glu Ala Leu Lys Lys Glu Leu Glu
1220 1225 1230
Thr Leu Thr Thr Asn Tyr Gln Trp Leu Cys Thr Arg Leu Asn Gly
1235 1240 1245
Lys Cys Lys Thr Leu Glu Glu Val Trp Ala Cys Trp His Glu Leu
1250 1255 1260
Leu Ser Tyr Leu Glu Lys Ala Asn Lys Trp Leu Asn Glu Val Glu
1265 1270 1275
Phe Lys Leu Lys Thr Thr Glu Asn Ile Pro Gly Gly Ala Glu Glu
1280 1285 1290
Ile Ser Glu Val Leu Asp Ser Leu Glu Asn Leu Met Arg His Ser
1295 1300 1305
Glu Asp Asn Pro Asn Gln Ile Arg Ile Leu Ala Gln Thr Leu Thr
1310 1315 1320
Asp Gly Gly Val Met Asp Glu Leu Ile Asn Glu Glu Leu Glu Thr
1325 1330 1335
Phe Asn Ser Arg Trp Arg Glu Leu His Glu Glu Ala Val Arg Arg
1340 1345 1350
Gln Lys Leu Leu Glu Gln Ser Ile Gln Ser Ala Gln Glu Thr Glu
1355 1360 1365
Lys Ser Leu His Leu Ile Gln Glu Ser Leu Thr Phe Ile Asp Lys
1370 1375 1380
Gln Leu Ala Ala Tyr Ile Ala Asp Lys Val Asp Ala Ala Gln Met
1385 1390 1395
Pro Gln Glu Ala Gln Lys Ile Gln Ser Asp Leu Thr Ser His Glu
1400 1405 1410
Ile Ser Leu Glu Glu Met Lys Lys His Asn Gln Gly Lys Glu Ala
1415 1420 1425
Ala Gln Arg Val Leu Ser Gln Ile Asp Val Ala Gln Lys Lys Leu
1430 1435 1440
Gln Asp Val Ser Met Lys Phe Arg Leu Phe Gln Lys Pro Ala Asn
1445 1450 1455
Phe Glu Gln Arg Leu Gln Glu Ser Lys Met Ile Leu Asp Glu Val
1460 1465 1470
Lys Met His Leu Pro Ala Leu Glu Thr Lys Ser Val Glu Gln Glu
1475 1480 1485
Val Val Gln Ser Gln Leu Asn His Cys Val Asn Leu Tyr Lys Ser
1490 1495 1500
Leu Ser Glu Val Lys Ser Glu Val Glu Met Val Ile Lys Thr Gly
1505 1510 1515
Arg Gln Ile Val Gln Lys Lys Gln Thr Glu Asn Pro Lys Glu Leu
1520 1525 1530
Asp Glu Arg Val Thr Ala Leu Lys Leu His Tyr Asn Glu Leu Gly
1535 1540 1545
Ala Lys Val Thr Glu Arg Lys Gln Gln Leu Glu Lys Cys Leu Lys
1550 1555 1560
Leu Ser Arg Lys Met Arg Lys Glu Met Asn Val Leu Thr Glu Trp
1565 1570 1575
Leu Ala Ala Thr Asp Met Glu Leu Thr Lys Arg Ser Ala Val Glu
1580 1585 1590
Gly Met Pro Ser Asn Leu Asp Ser Glu Val Ala Trp Gly Lys Ala
1595 1600 1605
Thr Gln Lys Glu Ile Glu Lys Gln Lys Val His Leu Lys Ser Ile
1610 1615 1620
Thr Glu Val Gly Glu Ala Leu Lys Thr Val Leu Gly Lys Lys Glu
1625 1630 1635
Thr Leu Val Glu Asp Lys Leu Ser Leu Leu Asn Ser Asn Trp Ile
1640 1645 1650
Ala Val Thr Ser Arg Ala Glu Glu Trp Leu Asn Leu Leu Leu Glu
1655 1660 1665
Tyr Gln Lys His Met Glu Thr Phe Asp Gln Asn Val Asp His Ile
1670 1675 1680
Thr Lys Trp Ile Ile Gln Ala Asp Thr Leu Leu Asp Glu Ser Glu
1685 1690 1695
Lys Lys Lys Pro Gln Gln Lys Glu Asp Val Leu Lys Arg Leu Lys
1700 1705 1710
Ala Glu Leu Asn Asp Ile Arg Pro Lys Val Asp Ser Thr Arg Asp
1715 1720 1725
Gln Ala Ala Asn Leu Met Ala Asn Arg Gly Asp His Cys Arg Lys
1730 1735 1740
Leu Val Glu Pro Gln Ile Ser Glu Leu Asn His Arg Phe Ala Ala
1745 1750 1755
Ile Ser His Arg Ile Lys Thr Gly Lys Ala Ser Ile Pro Leu Lys
1760 1765 1770
Glu Leu Glu Gln Phe Asn Ser Asp Ile Gln Lys Leu Leu Glu Pro
1775 1780 1785
Leu Glu Ala Glu Ile Gln Gln Gly Val Asn Leu Lys Glu Glu Asp
1790 1795 1800
Phe Asn Lys Asp Met Asn Glu Asp Asn Glu Gly Thr Val Lys Glu
1805 1810 1815
Leu Leu Gln Arg Gly Asp Asn Leu Gln Gln Arg Ile Thr Asp Glu
1820 1825 1830
Arg Lys Arg Glu Glu Ile Lys Ile Lys Gln Gln Leu Leu Gln Thr
1835 1840 1845
Lys His Asn Ala Leu Lys Asp Leu Arg Ser Gln Arg Arg Lys Lys
1850 1855 1860
Ala Leu Glu Ile Ser His Gln Trp Tyr Gln Tyr Lys Arg Gln Ala
1865 1870 1875
Asp Asp Leu Leu Lys Cys Leu Asp Asp Ile Glu Lys Lys Leu Ala
1880 1885 1890
Ser Leu Pro Glu Pro Arg Asp Glu Arg Lys Ile Lys Glu Ile Asp
1895 1900 1905
Arg Glu Leu Gln Lys Lys Lys Glu Glu Leu Asn Ala Val Arg Arg
1910 1915 1920
Gln Ala Glu Gly Leu Ser Glu Asp Gly Ala Ala Met Ala Val Glu
1925 1930 1935
Pro Thr Gln Ile Gln Leu Ser Lys Arg Trp Arg Glu Ile Glu Ser
1940 1945 1950
Lys Phe Ala Gln Phe Arg Arg Leu Asn Phe Ala Gln Ile His Thr
1955 1960 1965
Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
1970 1975 1980
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His
1985 1990 1995
Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro
2000 2005 2010
Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu
2015 2020 2025
Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg
2030 2035 2040
Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala
2045 2050 2055
Thr Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu
2060 2065 2070
Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln
2075 2080 2085
Gly Arg Phe Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr
2090 2095 2100
Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe
2105 2110 2115
Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys Tyr
2120 2125 2130
Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln
2135 2140 2145
Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln
2150 2155 2160
Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu Gly
2165 2170 2175
Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp
2180 2185 2190
Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn Ile Leu Ser Glu Phe
2195 2200 2205
Gln Arg Asp Leu Asn Glu Phe Val Leu Trp Leu Glu Glu Ala Asp
2210 2215 2220
Asn Ile Ala Ser Ile Pro Leu Glu Pro Gly Lys Glu Gln Gln Leu
2225 2230 2235
Lys Glu Lys Leu Glu Gln Val Lys Leu Leu Val Glu Glu Leu Pro
2240 2245 2250
Leu Arg Gln Gly Ile Leu Lys Gln Leu Asn Glu Thr Gly Gly Pro
2255 2260 2265
Val Leu Val Ser Ala Pro Ile Ser Pro Glu Glu Gln Asp Lys Leu
2270 2275 2280
Glu Asn Lys Leu Lys Gln Thr Asn Leu Gln Trp Ile Lys Val Ser
2285 2290 2295
Arg Ala Leu Pro Glu Lys Gln Gly Glu Ile Glu Ala Gln Ile Lys
2300 2305 2310
Asp Leu Gly Gln Leu Glu Lys Lys Leu Glu Asp Leu Glu Glu Gln
2315 2320 2325
Leu Asn His Leu Leu Leu Trp Leu Ser Pro Ile Arg Asn Gln Leu
2330 2335 2340
Glu Ile Tyr Asn Gln Pro Asn Gln Glu Gly Pro Phe Asp Val Gln
2345 2350 2355
Glu Thr Glu Ile Ala Val Gln Ala Lys Gln Pro Asp Val Glu Glu
2360 2365 2370
Ile Leu Ser Lys Gly Gln His Leu Tyr Lys Glu Lys Pro Ala Thr
2375 2380 2385
Gln Pro Val Lys Arg Lys Leu Glu Asp Leu Ser Ser Glu Trp Lys
2390 2395 2400
Ala Val Asn Arg Leu Leu Gln Glu Leu Arg Ala Lys Gln Pro Asp
2405 2410 2415
Leu Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr
2420 2425 2430
Val Thr Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile
2435 2440 2445
Ser Lys Leu Glu Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala
2450 2455 2460
Leu Ala Asp Phe Asn Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu
2465 2470 2475
Ser Leu Leu Asp Gln Val Ile Lys Ser Gln Arg Val Met Val Gly
2480 2485 2490
Asp Leu Glu Asp Ile Asn Glu Met Ile Ile Lys Gln Lys Ala Thr
2495 2500 2505
Met Gln Asp Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu Leu Ile
2510 2515 2520
Thr Ala Ala Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln Glu Ala
2525 2530 2535
Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg Ile Gln Asn Gln Trp
2540 2545 2550
Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg Gln Gln Leu Asn
2555 2560 2565
Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala Lys Glu Glu
2570 2575 2580
Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu Ser Trp
2585 2590 2595
Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile Thr
2600 2605 2610
Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn
2615 2620 2625
Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr
2630 2635 2640
Ser Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile
2645 2650 2655
Asn Ala Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu
2660 2665 2670
Ala Ala Leu Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu
2675 2680 2685
Asp Leu Glu Lys Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr
2690 2695 2700
Ala Asn Val Leu Gln Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu
2705 2710 2715
Asp Ser Lys Gly Val Lys Glu Leu Met Lys Gln Trp Gln Asp Leu
2720 2725 2730
Gln Gly Glu Ile Glu Ala His Thr Asp Val Tyr His Asn Leu Asp
2735 2740 2745
Glu Asn Ser Gln Lys Ile Leu Arg Ser Leu Glu Gly Ser Asp Asp
2750 2755 2760
Ala Val Leu Leu Gln Arg Arg Leu Asp Asn Met Asn Phe Lys Trp
2765 2770 2775
Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile Arg Ser His Leu Glu
2780 2785 2790
Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu Ser Leu Gln Glu
2795 2800 2805
Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser Arg Gln
2810 2815 2820
Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln Asn Asp
2825 2830 2835
Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro Val
2840 2845 2850
Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
2855 2860 2865
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu
2870 2875 2880
Pro Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys
2885 2890 2895
Gln Ala Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His
2900 2905 2910
Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu
2915 2920 2925
Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg
2930 2935 2940
Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu
2945 2950 2955
Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu
2960 2965 2970
Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn
2975 2980 2985
Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro
2990 2995 3000
Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu
3005 3010 3015
Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala
3020 3025 3030
His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser
3035 3040 3045
Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro
3050 3055 3060
Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro
3065 3070 3075
Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val
3080 3085 3090
Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
3095 3100 3105
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp
3110 3115 3120
Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp
3125 3130 3135
Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu
3140 3145 3150
Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp
3155 3160 3165
Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr
3170 3175 3180
Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu
3185 3190 3195
Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln
3200 3205 3210
Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu
3215 3220 3225
Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val
3230 3235 3240
Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys
3245 3250 3255
Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe
3260 3265 3270
Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro
3275 3280 3285
Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala
3290 3295 3300
Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr
3305 3310 3315
Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe
3320 3325 3330
Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
3335 3340 3345
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp
3350 3355 3360
Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe
3365 3370 3375
Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu
3380 3385 3390
Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp
3395 3400 3405
Pro Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp
3410 3415 3420
Asp Thr His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu
3425 3430 3435
Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro
3440 3445 3450
Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys
3455 3460 3465
Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro
3470 3475 3480
Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu
3485 3490 3495
Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln
3500 3505 3510
Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys Gly Leu
3515 3520 3525
Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr Ser Pro Gln
3530 3535 3540
Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg
3545 3550 3555
Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu Asp
3560 3565 3570
His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln Leu
3575 3580 3585
Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr Thr Val
3590 3595 3600
Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro
3605 3610 3615
Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly
3620 3625 3630
Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu
3635 3640 3645
Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg
3650 3655 3660
Gly Arg Asn Thr Pro Gly Lys Pro Met Arg Glu Asp Thr Met
3665 3670 3675
<210> 8
<211> 13993
<212> DNA
<213> Homo sapiens
<400> 8
tcctggcatc agttactgtg ttgactcact cagtgttggg atcactcact ttccccctac 60
aggactcaga tctgggaggc aattaccttc ggagaaaaac gaataggaaa aactgaagtg 120
ttactttttt taaagctgct gaagtttgtt ggtttctcat tgtttttaag cctactggag 180
caataaagtt tgaagaactt ttaccaggtt ttttttatcg ctgccttgat atacactttt 240
caaaatgctt tggtgggaag aagtagagga ctgttatgaa agagaagatg ttcaaaagaa 300
aacattcaca aaatgggtaa atgcacaatt ttctaagttt gggaagcagc atattgagaa 360
cctcttcagt gacctacagg atgggaggcg cctcctagac ctcctcgaag gcctgacagg 420
gcaaaaactg ccaaaagaaa aaggatccac aagagttcat gccctgaaca atgtcaacaa 480
ggcactgcgg gttttgcaga acaataatgt tgatttagtg aatattggaa gtactgacat 540
cgtagatgga aatcataaac tgactcttgg tttgatttgg aatataatcc tccactggca 600
ggtcaaaaat gtaatgaaaa atatcatggc tggattgcaa caaaccaaca gtgaaaagat 660
tctcctgagc tgggtccgac aatcaactcg taattatcca caggttaatg taatcaactt 720
caccaccagc tggtctgatg gcctggcttt gaatgctctc atccatagtc ataggccaga 780
cctatttgac tggaatagtg tggtttgcca gcagtcagcc acacaacgac tggaacatgc 840
attcaacatc gccagatatc aattaggcat agagaaacta ctcgatcctg aagatgttga 900
taccacctat ccagataaga agtccatctt aatgtacatc acatcactct tccaagtttt 960
gcctcaacaa gtgagcattg aagccatcca ggaagtggaa atgttgccaa ggccacctaa 1020
agtgactaaa gaagaacatt ttcagttaca tcatcaaatg cactattctc aacagatcac 1080
ggtcagtcta gcacagggat atgagagaac ttcttcccct aagcctcgat tcaagagcta 1140
tgcctacaca caggctgctt atgtcaccac ctctgaccct acacggagcc catttccttc 1200
acagcatttg gaagctcctg aagacaagtc atttggcagt tcattgatgg agagtgaagt 1260
aaacctggac cgttatcaaa cagctttaga agaagtatta tcgtggcttc tttctgctga 1320
ggacacattg caagcacaag gagagatttc taatgatgtg gaagtggtga aagaccagtt 1380
tcatactcat gaggggtaca tgatggattt gacagcccat cagggccggg ttggtaatat 1440
tctacaattg ggaagtaagc tgattggaac aggaaaatta tcagaagatg aagaaactga 1500
agtacaagag cagatgaatc tcctaaattc aagatgggaa tgcctcaggg tagctagcat 1560
ggaaaaacaa agcaatttac atagagtttt aatggatctc cagaatcaga aactgaaaga 1620
gttgaatgac tggctaacaa aaacagaaga aagaacaagg aaaatggagg aagagcctct 1680
tggacctgat cttgaagacc taaaacgcca agtacaacaa cataaggtgc ttcaagaaga 1740
tctagaacaa gaacaagtca gggtcaattc tctcactcac atggtggtgg tagttgatga 1800
atctagtgga gatcacgcaa ctgctgcttt ggaagaacaa cttaaggtat tgggagatcg 1860
atgggcaaac atctgtagat ggacagaaga ccgctgggtt cttttacaag acatccttct 1920
caaatggcaa cgtcttactg aagaacagtg cctttttagt gcatggcttt cagaaaaaga 1980
agatgcagtg aacaagattc acacaactgg ctttaaagat caaaatgaaa tgttatcaag 2040
tcttcaaaaa ctggccgttt taaaagcgga tctagaaaag aaaaagcaat ccatgggcaa 2100
actgtattca ctcaaacaag atcttctttc aacactgaag aataagtcag tgacccagaa 2160
gacggaagca tggctggata actttgcccg gtgttgggat aatttagtcc aaaaacttga 2220
aaagagtaca gcacagattt cacaggctgt caccaccact cagccatcac taacacagac 2280
aactgtaatg gaaacagtaa ctacggtgac cacaagggaa cagatcctgg taaagcatgc 2340
tcaagaggaa cttccaccac cacctcccca aaagaagagg cagattactg tggattctga 2400
aattaggaaa aggttggatg ttgatataac tgaacttcac agctggatta ctcgctcaga 2460
agctgtgttg cagagtcctg aatttgcaat ctttcggaag gaaggcaact tctcagactt 2520
aaaagaaaaa gtcaatgcca tagagcgaga aaaagctgag aagttcagaa aactgcaaga 2580
tgccagcaga tcagctcagg ccctggtgga acagatggtg aatgagggtg ttaatgcaga 2640
tagcatcaaa caagcctcag aacaactgaa cagccggtgg atcgaattct gccagttgct 2700
aagtgagaga cttaactggc tggagtatca gaacaacatc atcgctttct ataatcagct 2760
acaacaattg gagcagatga caactactgc tgaaaactgg ttgaaaatcc aacccaccac 2820
cccatcagag ccaacagcaa ttaaaagtca gttaaaaatt tgtaaggatg aagtcaaccg 2880
gctatcaggt cttcaacctc aaattgaacg attaaaaatt caaagcatag ccctgaaaga 2940
gaaaggacaa ggacccatgt tcctggatgc agactttgtg gcctttacaa atcattttaa 3000
gcaagtcttt tctgatgtgc aggccagaga gaaagagcta cagacaattt ttgacacttt 3060
gccaccaatg cgctatcagg agaccatgag tgccatcagg acatgggtcc agcagtcaga 3120
aaccaaactc tccatacctc aacttagtgt caccgactat gaaatcatgg agcagagact 3180
cggggaattg caggctttac aaagttctct gcaagagcaa caaagtggcc tatactatct 3240
cagcaccact gtgaaagaga tgtcgaagaa agcgccctct gaaattagcc ggaaatatca 3300
atcagaattt gaagaaattg agggacgctg gaagaagctc tcctcccagc tggttgagca 3360
ttgtcaaaag ctagaggagc aaatgaataa actccgaaaa attcagaatc acatacaaac 3420
cctgaagaaa tggatggctg aagttgatgt ttttctgaag gaggaatggc ctgcccttgg 3480
ggattcagaa attctaaaaa agcagctgaa acagtgcaga cttttagtca gtgatattca 3540
gacaattcag cccagtctaa acagtgtcaa tgaaggtggg cagaagataa agaatgaagc 3600
agagccagag tttgcttcga gacttgagac agaactcaaa gaacttaaca ctcagtggga 3660
tcacatgtgc caacaggtct atgccagaaa ggaggccttg aagggaggtt tggagaaaac 3720
tgtaagcctc cagaaagatc tatcagagat gcacgaatgg atgacacaag ctgaagaaga 3780
gtatcttgag agagattttg aatataaaac tccagatgaa ttacagaaag cagttgaaga 3840
gatgaagaga gctaaagaag aggcccaaca aaaagaagcg aaagtgaaac tccttactga 3900
gtctgtaaat agtgtcatag ctcaagctcc acctgtagca caagaggcct taaaaaagga 3960
acttgaaact ctaaccacca actaccagtg gctctgcact aggctgaatg ggaaatgcaa 4020
gactttggaa gaagtttggg catgttggca tgagttattg tcatacttgg agaaagcaaa 4080
caagtggcta aatgaagtag aatttaaact taaaaccact gaaaacattc ctggcggagc 4140
tgaggaaatc tctgaggtgc tagattcact tgaaaatttg atgcgacatt cagaggataa 4200
cccaaatcag attcgcatat tggcacagac cctaacagat ggcggagtca tggatgagct 4260
aatcaatgag gaacttgaga catttaattc tcgttggagg gaactacatg aagaggctgt 4320
aaggaggcaa aagttgcttg aacagagcat ccagtctgcc caggagactg aaaaatcctt 4380
acacttaatc caggagtccc tcacattcat tgacaagcag ttggcagctt atattgcaga 4440
caaggtggac gcagctcaaa tgcctcagga agcccagaaa atccaatctg atttgacaag 4500
tcatgagatc agtttagaag aaatgaagaa acataatcag gggaaggagg ctgcccaaag 4560
agtcctgtct cagattgatg ttgcacagaa aaaattacaa gatgtctcca tgaagtttcg 4620
attattccag aaaccagcca attttgagca gcgtctacaa gaaagtaaga tgattttaga 4680
tgaagtgaag atgcacttgc ctgcattgga aacaaagagt gtggaacagg aagtagtaca 4740
gtcacagcta aatcattgtg tgaacttgta taaaagtctg agtgaagtga agtctgaagt 4800
ggaaatggtg ataaagactg gacgtcagat tgtacagaaa aagcagacgg aaaatcccaa 4860
agaacttgat gaaagagtaa cagctttgaa attgcattat aatgagctgg gagcaaaggt 4920
aacagaaaga aagcaacagt tggagaaatg cttgaaattg tcccgtaaga tgcgaaagga 4980
aatgaatgtc ttgacagaat ggctggcagc tacagatatg gaattgacaa agagatcagc 5040
agttgaagga atgcctagta atttggattc tgaagttgcc tggggaaagg ctactcaaaa 5100
agagattgag aaacagaagg tgcacctgaa gagtatcaca gaggtaggag aggccttgaa 5160
aacagttttg ggcaagaagg agacgttggt ggaagataaa ctcagtcttc tgaatagtaa 5220
ctggatagct gtcacctccc gagcagaaga gtggttaaat cttttgttgg aataccagaa 5280
acacatggaa acttttgacc agaatgtgga ccacatcaca aagtggatca ttcaggctga 5340
cacacttttg gatgaatcag agaaaaagaa accccagcaa aaagaagacg tgcttaagcg 5400
tttaaaggca gaactgaatg acatacgccc aaaggtggac tctacacgtg accaagcagc 5460
aaacttgatg gcaaaccgcg gtgaccactg caggaaatta gtagagcccc aaatctcaga 5520
gctcaaccat cgatttgcag ccatttcaca cagaattaag actggaaagg cctccattcc 5580
tttgaaggaa ttggagcagt ttaactcaga tatacaaaaa ttgcttgaac cactggaggc 5640
tgaaattcag cagggggtga atctgaaaga ggaagacttc aataaagata tgaatgaaga 5700
caatgagggt actgtaaaag aattgttgca aagaggagac aacttacaac aaagaatcac 5760
agatgagaga aagcgagagg aaataaagat aaaacagcag ctgttacaga caaaacataa 5820
tgctctcaag gatttgaggt ctcaaagaag aaaaaaggct ctagaaattt ctcatcagtg 5880
gtatcagtac aagaggcagg ctgatgatct cctgaaatgc ttggatgaca ttgaaaaaaa 5940
attagccagc ctacctgagc ccagagatga aaggaaaata aaggaaattg atcgggaatt 6000
gcagaagaag aaagaggagc tgaatgcagt gcgtaggcaa gctgagggct tgtctgagga 6060
tggggccgca atggcagtgg agccaactca gatccagctc agcaagcgct ggcgggaaat 6120
tgagagcaaa tttgctcagt ttcgaagact caactttgca caaattcaca ctgtccgtga 6180
agaaacgatg atggtgatga ctgaagacat gcctttggaa atttcttatg tgccttctac 6240
ttatttgact gaaatcactc atgtctcaca agccctatta gaagtggaac aacttctcaa 6300
tgctcctgac ctctgtgcta aggactttga agatctcttt aagcaagagg agtctctgaa 6360
gaatataaaa gatagtctac aacaaagctc aggtcggatt gacattattc atagcaagaa 6420
gacagcagca ttgcaaagtg caacgcctgt ggaaagggtg aagctacagg aagctctctc 6480
ccagcttgat ttccaatggg aaaaagttaa caaaatgtac aaggaccgac aagggcgatt 6540
tgacagatct gttgagaaat ggcggcgttt tcattatgat ataaagatat ttaatcagtg 6600
gctaacagaa gctgaacagt ttctcagaaa gacacaaatt cctgagaatt gggaacatgc 6660
taaatacaaa tggtatctta aggaactcca ggatggcatt gggcagcggc aaactgttgt 6720
cagaacattg aatgcaactg gggaagaaat aattcagcaa tcctcaaaaa cagatgccag 6780
tattctacag gaaaaattgg gaagcctgaa tctgcggtgg caggaggtct gcaaacagct 6840
gtcagacaga aaaaagaggc tagaagaaca aaagaatatc ttgtcagaat ttcaaagaga 6900
tttaaatgaa tttgttttat ggttggagga agcagataac attgctagta tcccacttga 6960
acctggaaaa gagcagcaac taaaagaaaa gcttgagcaa gtcaagttac tggtggaaga 7020
gttgcccctg cgccagggaa ttctcaaaca attaaatgaa actggaggac ccgtgcttgt 7080
aagtgctccc ataagcccag aagagcaaga taaacttgaa aataagctca agcagacaaa 7140
tctccagtgg ataaaggttt ccagagcttt acctgagaaa caaggagaaa ttgaagctca 7200
aataaaagac cttgggcagc ttgaaaaaaa gcttgaagac cttgaagagc agttaaatca 7260
tctgctgctg tggttatctc ctattaggaa tcagttggaa atttataacc aaccaaacca 7320
agaaggacca tttgacgttc aggaaactga aatagcagtt caagctaaac aaccggatgt 7380
ggaagagatt ttgtctaaag ggcagcattt gtacaaggaa aaaccagcca ctcagccagt 7440
gaagaggaag ttagaagatc tgagctctga gtggaaggcg gtaaaccgtt tacttcaaga 7500
gctgagggca aagcagcctg acctagctcc tggactgacc actattggag cctctcctac 7560
tcagactgtt actctggtga cacaacctgt ggttactaag gaaactgcca tctccaaact 7620
agaaatgcca tcttccttga tgttggaggt acctgctctg gcagatttca accgggcttg 7680
gacagaactt accgactggc tttctctgct tgatcaagtt ataaaatcac agagggtgat 7740
ggtgggtgac cttgaggata tcaacgagat gatcatcaag cagaaggcaa caatgcagga 7800
tttggaacag aggcgtcccc agttggaaga actcattacc gctgcccaaa atttgaaaaa 7860
caagaccagc aatcaagagg ctagaacaat cattacggat cgaattgaaa gaattcagaa 7920
tcagtgggat gaagtacaag aacaccttca gaaccggagg caacagttga atgaaatgtt 7980
aaaggattca acacaatggc tggaagctaa ggaagaagct gagcaggtct taggacaggc 8040
cagagccaag cttgagtcat ggaaggaggg tccctataca gtagatgcaa tccaaaagaa 8100
aatcacagaa accaagcagt tggccaaaga cctccgccag tggcagacaa atgtagatgt 8160
ggcaaatgac ttggccctga aacttctccg ggattattct gcagatgata ccagaaaagt 8220
ccacatgata acagagaata tcaatgcctc ttggagaagc attcataaaa gggtgagtga 8280
gcgagaggct gctttggaag aaactcatag attactgcaa cagttccccc tggacctgga 8340
aaagtttctt gcctggctta cagaagctga aacaactgcc aatgtcctac aggatgctac 8400
ccgtaaggaa aggctcctag aagactccaa gggagtaaaa gagctgatga aacaatggca 8460
agacctccaa ggtgaaattg aagctcacac agatgtttat cacaacctgg atgaaaacag 8520
ccaaaaaatc ctgagatccc tggaaggttc cgatgatgca gtcctgttac aaagacgttt 8580
ggataacatg aacttcaagt ggagtgaact tcggaaaaag tctctcaaca ttaggtccca 8640
tttggaagcc agttctgacc agtggaagcg tctgcacctt tctctgcagg aacttctggt 8700
gtggctacag ctgaaagatg atgaattaag ccggcaggca cctattggag gcgactttcc 8760
agcagttcag aagcagaacg atgtacatag ggccttcaag agggaattga aaactaaaga 8820
acctgtaatc atgagtactc ttgagactgt acgaatattt ctgacagagc agcctttgga 8880
aggactagag aaactctacc aggagcccag agagctgcct cctgaggaga gagcccagaa 8940
tgtcactcgg cttctacgaa agcaggctga ggaggtcaat actgagtggg aaaaattgaa 9000
cctgcactcc gctgactggc agagaaaaat agatgagacc cttgaaagac tccaggaact 9060
tcaagaggcc acggatgagc tggacctcaa gctgcgccaa gctgaggtga tcaagggatc 9120
ctggcagccc gtgggcgatc tcctcattga ctctctccaa gatcacctcg agaaagtcaa 9180
ggcacttcga ggagaaattg cgcctctgaa agagaacgtg agccacgtca atgaccttgc 9240
tcgccagctt accactttgg gcattcagct ctcaccgtat aacctcagca ctctggaaga 9300
cctgaacacc agatggaagc ttctgcaggt ggccgtcgag gaccgagtca ggcagctgca 9360
tgaagcccac agggactttg gtccagcatc tcagcacttt ctttccacgt ctgtccaggg 9420
tccctgggag agagccatct cgccaaacaa agtgccctac tatatcaacc acgagactca 9480
aacaacttgc tgggaccatc ccaaaatgac agagctctac cagtctttag ctgacctgaa 9540
taatgtcaga ttctcagctt ataggactgc catgaaactc cgaagactgc agaaggccct 9600
ttgcttggat ctcttgagcc tgtcagctgc atgtgatgcc ttggaccagc acaacctcaa 9660
gcaaaatgac cagcccatgg atatcctgca gattattaat tgtttgacca ctatttatga 9720
ccgcctggag caagagcaca acaatttggt caacgtccct ctctgcgtgg atatgtgtct 9780
gaactggctg ctgaatgttt atgatacggg acgaacaggg aggatccgtg tcctgtcttt 9840
taaaactggc atcatttccc tgtgtaaagc acatttggaa gacaagtaca gatacctttt 9900
caagcaagtg gcaagttcaa caggattttg tgaccagcgc aggctgggcc tccttctgca 9960
tgattctatc caaattccaa gacagttggg tgaagttgca tcctttgggg gcagtaacat 10020
tgagccaagt gtccggagct gcttccaatt tgctaataat aagccagaga tcgaagcggc 10080
cctcttccta gactggatga gactggaacc ccagtccatg gtgtggctgc ccgtcctgca 10140
cagagtggct gctgcagaaa ctgccaagca tcaggccaaa tgtaacatct gcaaagagtg 10200
tccaatcatt ggattcaggt acaggagtct aaagcacttt aattatgaca tctgccaaag 10260
ctgctttttt tctggtcgag ttgcaaaagg ccataaaatg cactatccca tggtggaata 10320
ttgcactccg actacatcag gagaagatgt tcgagacttt gccaaggtac taaaaaacaa 10380
atttcgaacc aaaaggtatt ttgcgaagca tccccgaatg ggctacctgc cagtgcagac 10440
tgtcttagag ggggacaaca tggaaactcc cgttactctg atcaacttct ggccagtaga 10500
ttctgcgcct gcctcgtccc ctcagctttc acacgatgat actcattcac gcattgaaca 10560
ttatgctagc aggctagcag aaatggaaaa cagcaatgga tcttatctaa atgatagcat 10620
ctctcctaat gagagcatag atgatgaaca tttgttaatc cagcattact gccaaagttt 10680
gaaccaggac tcccccctga gccagcctcg tagtcctgcc cagatcttga tttccttaga 10740
gagtgaggaa agaggggagc tagagagaat cctagcagat cttgaggaag aaaacaggaa 10800
tctgcaagca gaatatgacc gtctaaagca gcagcacgaa cataaaggcc tgtccccact 10860
gccgtcccct cctgaaatga tgcccacctc tccccagagt ccccgggatg ctgagctcat 10920
tgctgaggcc aagctactgc gtcaacacaa aggccgcctg gaagccagga tgcaaatcct 10980
ggaagaccac aataaacagc tggagtcaca gttacacagg ctaaggcagc tgctggagca 11040
accccaggca gaggccaaag tgaatggcac aacggtgtcc tctccttcta cctctctaca 11100
gaggtccgac agcagtcagc ctatgctgct ccgagtggtt ggcagtcaaa cttcggactc 11160
catgggtgag gaagatcttc tcagtcctcc ccaggacaca agcacagggt tagaggaggt 11220
gatggagcaa ctcaacaact ccttccctag ttcaagagga agaaataccc ctggaaagcc 11280
aatgagagag gacacaatgt aggaagtctt ttccacatgg cagatgattt gggcagagcg 11340
atggagtcct tagtatcagt catgacagat gaagaaggag cagaataaat gttttacaac 11400
tcctgattcc cgcatggttt ttataatatt catacaacaa agaggattag acagtaagag 11460
tttacaagaa ataaatctat atttttgtga agggtagtgg tattatactg tagatttcag 11520
tagtttctaa gtctgttatt gttttgttaa caatggcagg ttttacacgt ctatgcaatt 11580
gtacaaaaaa gttataagaa aactacatgt aaaatcttga tagctaaata acttgccatt 11640
tctttatatg gaacgcattt tgggttgttt aaaaatttat aacagttata aagaaagatt 11700
gtaaactaaa gtgtgcttta taaaaaaaag ttgtttataa aaacccctaa aaacaaaaca 11760
aacacacaca cacacacata cacacacaca cacaaaactt tgaggcagcg cattgttttg 11820
catccttttg gcgtgatatc catatgaaat tcatggcttt ttcttttttt gcatattaaa 11880
gataagactt cctctaccac cacaccaaat gactactaca cactgctcat ttgagaactg 11940
tcagctgagt ggggcaggct tgagttttca tttcatatat ctatatgtct ataagtatat 12000
aaatactata gttatataga taaagagata cgaatttcta tagactgact ttttccattt 12060
tttaaatgtt catgtcacat cctaatagaa agaaattact tctagtcagt catccaggct 12120
tacctgcttg gtctagaatg gatttttccc ggagccggaa gccaggagga aactacacca 12180
cactaaaaca ttgtctacag ctccagatgt ttctcatttt aaacaacttt ccactgacaa 12240
cgaaagtaaa gtaaagtatt ggattttttt aaagggaaca tgtgaatgaa tacacaggac 12300
ttattatatc agagtgagta atcggttggt tggttgattg attgattgat tgatacattc 12360
agcttcctgc tgctagcaat gccacgattt agatttaatg atgcttcagt ggaaatcaat 12420
cagaaggtat tctgaccttg tgaacatcag aaggtatttt ttaactccca agcagtagca 12480
ggacgatgat agggctggag ggctatggat tcccagccca tccctgtgaa ggagtaggcc 12540
actctttaag tgaaggattg gatgattgtt cataatacat aaagttctct gtaattacaa 12600
ctaaattatt atgccctctt ctcacagtca aaaggaactg ggtggtttgg tttttgttgc 12660
ttttttagat ttattgtccc atgtgggatg agtttttaaa tgccacaaga cataatttaa 12720
aataaataaa ctttgggaaa aggtgtaaaa cagtagcccc atcacatttg tgatactgac 12780
aggtatcaac ccagaagccc atgaactgtg tttccatcct ttgcatttct ctgcgagtag 12840
ttccacacag gtttgtaagt aagtaagaaa gaaggcaaat tgattcaaat gttacaaaaa 12900
aacccttctt ggtggattag acaggttaaa tatataaaca aacaaacaaa aattgctcaa 12960
aaaagaggag aaaagctcaa gaggaaaagc taaggactgg taggaaaaag ctttactctt 13020
tcatgccatt ttatttcttt ttgattttta aatcattcat tcaatagata ccaccgtgtg 13080
acctataatt ttgcaaatct gttacctctg acatcaagtg taattagctt ttggagagtg 13140
ggctgacatc aagtgtaatt agcttttgga gagtgggttt tgtccattat taataattaa 13200
ttaattaaca tcaaacacgg cttctcatgc tatttctacc tcactttggt tttggggtgt 13260
tcctgataat tgtgcacacc tgagttcaca gcttcaccac ttgtccattg cgttattttc 13320
tttttccttt ataattcttt ctttttcctt cataattttc aaaagaaaac ccaaagctct 13380
aaggtaacaa attaccaaat tacatgaaga tttggttttt gtcttgcatt tttttccttt 13440
atgtgacgct ggaccttttc tttacccaag gatttttaaa actcagattt aaaacaaggg 13500
gttactttac atcctactaa gaagtttaag taagtaagtt tcattctaaa atcagaggta 13560
aatagagtgc ataaataatt ttgttttaat ctttttgttt ttcttttaga cacattagct 13620
ctggagtgag tctgtcataa tatttgaaca aaaattgaga gctttattgc tgcattttaa 13680
gcataattaa tttggacatt atttcgtgtt gtgttcttta taaccaccaa gtattaaact 13740
gtaaatcata atgtaactga agcataaaca tcacatggca tgttttgtca ttgttttcag 13800
gtactgagtt cttacttgag tatcataata tattgtgttt taacaccaac actgtaacat 13860
ttacgaatta tttttttaaa cttcagtttt actgcatttt cacaacatat cagacttcac 13920
caaatatatg ccttactatt gtattatagt actgctttac tgtgtatctc aataaagcac 13980
gcagttatgt tac 13993
<210> 9
<211> 3685
<212> PRT
<213> Homo sapiens
<400> 9
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Gly Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Gln Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala
3410 3415 3420
Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu
3425 3430 3435
His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser
3440 3445 3450
Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
3455 3460 3465
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser
3470 3475 3480
Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu
3485 3490 3495
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
3500 3505 3510
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys
3515 3520 3525
Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro
3530 3535 3540
Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu
3545 3550 3555
Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu
3560 3565 3570
Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser
3575 3580 3585
Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu
3590 3595 3600
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu
3605 3610 3615
Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly
3620 3625 3630
Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
3635 3640 3645
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu
3650 3655 3660
Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys
3665 3670 3675
Pro Met Arg Glu Asp Thr Met
3680 3685
<210> 10
<211> 14000
<212> DNA
<213> Homo sapiens
<400> 10
atgctgtctg tgaagctgaa tctgtgagaa cacctcacta ttcacggcaa ccggagtgga 60
agaaacaggt gcaaaaagat tgtgtgtttg tctgcttttg tgaggctggt cagagattct 120
gtgcctgctt tatctgtgct tggctatgac tctacctcca ggtttaccat accccataga 180
atgtgtaaga gaaaagtacc aacagggaaa tcagcaaaaa gctttcctat gaaggtgtgt 240
agccagcctc cgcagaattt gaaatgtctg aggtctcatc tgatgaaaga gaagatgttc 300
aaaagaaaac attcacaaaa tgggtaaatg cacaattttc taagtttggg aagcagcata 360
ttgagaacct cttcagtgac ctacaggatg ggaggcgcct cctagacctc ctcgaaggcc 420
tgacagggca aaaactgcca aaagaaaaag gatccacaag agttcatgcc ctgaacaatg 480
tcaacaaggc actgcgggtt ttgcagaaca ataatgttga tttagtgaat attggaagta 540
ctgacatcgt agatggaaat cataaactga ctcttggttt gatttggaat ataatcctcc 600
actggcaggt caaaaatgta atgaaaaata tcatggctgg attgcaacaa accaacagtg 660
aaaagattct cctgagctgg gtccgacaat caactcgtaa ttatccacag gttaatgtaa 720
tcaacttcac caccagctgg tctgatggcc tggctttgaa tgctctcatc catagtcata 780
ggccagacct atttgactgg aatagtgtgg tttgccagca gtcagccaca caacgactgg 840
aacatgcatt caacatcgcc agatatcaat taggcataga gaaactactc gatcctgaag 900
atgttgatac cacctatcca gataagaagt ccatcttaat gtacatcaca tcactcttcc 960
aagttttgcc tcaacaagtg agcattgaag ccatccagga agtggaaatg ttgccaaggc 1020
cacctaaagt gactaaagaa gaacattttc agttacatca tcaaatgcac tattctcaac 1080
agatcacggt cagtctagca cagggatatg agagaacttc ttcccctaag cctcgattca 1140
agagctatgc ctacacacag gctgcttatg tcaccacctc tgaccctaca cggagcccat 1200
ttccttcaca gcatttggaa gctcctgaag acaagtcatt tggcagttca ttgatggaga 1260
gtgaagtaaa cctggaccgt tatcaaacag ctttagaaga agtattatcg tggcttcttt 1320
ctgctgagga cacattgcaa gcacaaggag agatttctaa tgatgtggaa gtggtgaaag 1380
accagtttca tactcatgag gggtacatga tggatttgac agcccatcag ggccgggttg 1440
gtaatattct acaattggga agtaagctga ttggaacagg aaaattatca gaagatgaag 1500
aaactgaagt acaagagcag atgaatctcc taaattcaag atgggaatgc ctcagggtag 1560
ctagcatgga aaaacaaagc aatttacata gagttttaat ggatctccag aatcagaaac 1620
tgaaagagtt gaatgactgg ctaacaaaaa cagaagaaag aacaaggaaa atggaggaag 1680
agcctcttgg acctgatctt gaagacctaa aacgccaagt acaacaacat aaggtgcttc 1740
aagaagatct agaacaagaa caagtcaggg tcaattctct cactcacatg gtggtggtag 1800
ttgatgaatc tagtggagat cacgcaactg ctgctttgga agaacaactt aaggtattgg 1860
gagatcgatg ggcaaacatc tgtagatgga cagaagaccg ctgggttctt ttacaagaca 1920
tccttctcaa atggcaacgt cttactgaag aacagtgcct ttttagtgca tggctttcag 1980
aaaaagaaga tgcagtgaac aagattcaca caactggctt taaagatcaa aatgaaatgt 2040
tatcaagtct tcaaaaactg gccgttttaa aagcggatct agaaaagaaa aagcaatcca 2100
tgggcaaact gtattcactc aaacaagatc ttctttcaac actgaagaat aagtcagtga 2160
cccagaagac ggaagcatgg ctggataact ttgcccggtg ttgggataat ttagtccaaa 2220
aacttgaaaa gagtacagca cagatttcac aggctgtcac caccactcag ccatcactaa 2280
cacagacaac tgtaatggaa acagtaacta cggtgaccac aagggaacag atcctggtaa 2340
agcatgctca agaggaactt ccaccaccac ctccccaaaa gaagaggcag attactgtgg 2400
attctgaaat taggaaaagg ttggatgttg atataactga acttcacagc tggattactc 2460
gctcagaagc tgtgttgcag agtcctgaat ttgcaatctt tcggaaggaa ggcaacttct 2520
cagacttaaa agaaaaagtc aatgccatag agcgagaaaa agctgagaag ttcagaaaac 2580
tgcaagatgc cagcagatca gctcaggccc tggtggaaca gatggtgaat gagggtgtta 2640
atgcagatag catcaaacaa gcctcagaac aactgaacag ccggtggatc gaattctgcc 2700
agttgctaag tgagagactt aactggctgg agtatcagaa caacatcatc gctttctata 2760
atcagctaca acaattggag cagatgacaa ctactgctga aaactggttg aaaatccaac 2820
ccaccacccc atcagagcca acagcaatta aaagtcagtt aaaaatttgt aaggatgaag 2880
tcaaccggct atcaggtctt caacctcaaa ttgaacgatt aaaaattcaa agcatagccc 2940
tgaaagagaa aggacaagga cccatgttcc tggatgcaga ctttgtggcc tttacaaatc 3000
attttaagca agtcttttct gatgtgcagg ccagagagaa agagctacag acaatttttg 3060
acactttgcc accaatgcgc tatcaggaga ccatgagtgc catcaggaca tgggtccagc 3120
agtcagaaac caaactctcc atacctcaac ttagtgtcac cgactatgaa atcatggagc 3180
agagactcgg ggaattgcag gctttacaaa gttctctgca agagcaacaa agtggcctat 3240
actatctcag caccactgtg aaagagatgt cgaagaaagc gccctctgaa attagccgga 3300
aatatcaatc agaatttgaa gaaattgagg gacgctggaa gaagctctcc tcccagctgg 3360
ttgagcattg tcaaaagcta gaggagcaaa tgaataaact ccgaaaaatt cagaatcaca 3420
tacaaaccct gaagaaatgg atggctgaag ttgatgtttt tctgaaggag gaatggcctg 3480
cccttgggga ttcagaaatt ctaaaaaagc agctgaaaca gtgcagactt ttagtcagtg 3540
atattcagac aattcagccc agtctaaaca gtgtcaatga aggtgggcag aagataaaga 3600
atgaagcaga gccagagttt gcttcgagac ttgagacaga actcaaagaa cttaacactc 3660
agtgggatca catgtgccaa caggtctatg ccagaaagga ggccttgaag ggaggtttgg 3720
agaaaactgt aagcctccag aaagatctat cagagatgca cgaatggatg acacaagctg 3780
aagaagagta tcttgagaga gattttgaat ataaaactcc agatgaatta cagaaagcag 3840
ttgaagagat gaagagagct aaagaagagg cccaacaaaa agaagcgaaa gtgaaactcc 3900
ttactgagtc tgtaaatagt gtcatagctc aagctccacc tgtagcacaa gaggccttaa 3960
aaaaggaact tgaaactcta accaccaact accagtggct ctgcactagg ctgaatggga 4020
aatgcaagac tttggaagaa gtttgggcat gttggcatga gttattgtca tacttggaga 4080
aagcaaacaa gtggctaaat gaagtagaat ttaaacttaa aaccactgaa aacattcctg 4140
gcggagctga ggaaatctct gaggtgctag attcacttga aaatttgatg cgacattcag 4200
aggataaccc aaatcagatt cgcatattgg cacagaccct aacagatggc ggagtcatgg 4260
atgagctaat caatgaggaa cttgagacat ttaattctcg ttggagggaa ctacatgaag 4320
aggctgtaag gaggcaaaag ttgcttgaac agagcatcca gtctgcccag gagactgaaa 4380
aatccttaca cttaatccag gagtccctca cattcattga caagcagttg gcagcttata 4440
ttgcagacaa ggtggacgca gctcaaatgc ctcaggaagc ccagaaaatc caatctgatt 4500
tgacaagtca tgagatcagt ttagaagaaa tgaagaaaca taatcagggg aaggaggctg 4560
cccaaagagt cctgtctcag attgatgttg cacagaaaaa attacaagat gtctccatga 4620
agtttcgatt attccagaaa ccagccaatt ttgagcagcg tctacaagaa agtaagatga 4680
ttttagatga agtgaagatg cacttgcctg cattggaaac aaagagtgtg gaacaggaag 4740
tagtacagtc acagctaaat cattgtgtga acttgtataa aagtctgagt gaagtgaagt 4800
ctgaagtgga aatggtgata aagactggac gtcagattgt acagaaaaag cagacggaaa 4860
atcccaaaga acttgatgaa agagtaacag ctttgaaatt gcattataat gagctgggag 4920
caaaggtaac agaaagaaag caacagttgg agaaatgctt gaaattgtcc cgtaagatgc 4980
gaaaggaaat gaatgtcttg acagaatggc tggcagctac agatatggaa ttgacaaaga 5040
gatcagcagt tgaaggaatg cctagtaatt tggattctga agttgcctgg ggaaaggcta 5100
ctcaaaaaga gattgagaaa cagaaggtgc acctgaagag tatcacagag gtaggagagg 5160
ccttgaaaac agttttgggc aagaaggaga cgttggtgga agataaactc agtcttctga 5220
atagtaactg gatagctgtc acctcccgag cagaagagtg gttaaatctt ttgttggaat 5280
accagaaaca catggaaact tttgaccaga atgtggacca catcacaaag tggatcattc 5340
aggctgacac acttttggat gaatcagaga aaaagaaacc ccagcaaaaa gaagacgtgc 5400
ttaagcgttt aaaggcagaa ctgaatgaca tacgcccaaa ggtggactct acacgtgacc 5460
aagcagcaaa cttgatggca aaccgcggtg accactgcag gaaattagta gagccccaaa 5520
tctcagagct caaccatcga tttgcagcca tttcacacag aattaagact ggaaaggcct 5580
ccattccttt gaaggaattg gagcagttta actcagatat acaaaaattg cttgaaccac 5640
tggaggctga aattcagcag ggggtgaatc tgaaagagga agacttcaat aaagatatga 5700
atgaagacaa tgagggtact gtaaaagaat tgttgcaaag aggagacaac ttacaacaaa 5760
gaatcacaga tgagagaaag cgagaggaaa taaagataaa acagcagctg ttacagacaa 5820
aacataatgc tctcaaggat ttgaggtctc aaagaagaaa aaaggctcta gaaatttctc 5880
atcagtggta tcagtacaag aggcaggctg atgatctcct gaaatgcttg gatgacattg 5940
aaaaaaaatt agccagccta cctgagccca gagatgaaag gaaaataaag gaaattgatc 6000
gggaattgca gaagaagaaa gaggagctga atgcagtgcg taggcaagct gagggcttgt 6060
ctgaggatgg ggccgcaatg gcagtggagc caactcagat ccagctcagc aagcgctggc 6120
gggaaattga gagcaaattt gctcagtttc gaagactcaa ctttgcacaa attcacactg 6180
tccgtgaaga aacgatgatg gtgatgactg aagacatgcc tttggaaatt tcttatgtgc 6240
cttctactta tttgactgaa atcactcatg tctcacaagc cctattagaa gtggaacaac 6300
ttctcaatgc tcctgacctc tgtgctaagg actttgaaga tctctttaag caagaggagt 6360
ctctgaagaa tataaaagat agtctacaac aaagctcagg tcggattgac attattcata 6420
gcaagaagac agcagcattg caaagtgcaa cgcctgtgga aagggtgaag ctacaggaag 6480
ctctctccca gcttgatttc caatgggaaa aagttaacaa aatgtacaag gaccgacaag 6540
ggcgatttga cagatctgtt gagaaatggc ggcgttttca ttatgatata aagatattta 6600
atcagtggct aacagaagct gaacagtttc tcagaaagac acaaattcct gagaattggg 6660
aacatgctaa atacaaatgg tatcttaagg aactccagga tggcattggg cagcggcaaa 6720
ctgttgtcag aacattgaat gcaactgggg aagaaataat tcagcaatcc tcaaaaacag 6780
atgccagtat tctacaggaa aaattgggaa gcctgaatct gcggtggcag gaggtctgca 6840
aacagctgtc agacagaaaa aagaggctag aagaacaaaa gaatatcttg tcagaatttc 6900
aaagagattt aaatgaattt gttttatggt tggaggaagc agataacatt gctagtatcc 6960
cacttgaacc tggaaaagag cagcaactaa aagaaaagct tgagcaagtc aagttactgg 7020
tggaagagtt gcccctgcgc cagggaattc tcaaacaatt aaatgaaact ggaggacccg 7080
tgcttgtaag tgctcccata agcccagaag agcaagataa acttgaaaat aagctcaagc 7140
agacaaatct ccagtggata aaggtttcca gagctttacc tgagaaacaa ggagaaattg 7200
aagctcaaat aaaagacctt gggcagcttg aaaaaaagct tgaagacctt gaagagcagt 7260
taaatcatct gctgctgtgg ttatctccta ttaggaatca gttggaaatt tataaccaac 7320
caaaccaaga aggaccattt gacgttcagg aaactgaaat agcagttcaa gctaaacaac 7380
cggatgtgga agagattttg tctaaagggc agcatttgta caaggaaaaa ccagccactc 7440
agccagtgaa gaggaagtta gaagatctga gctctgagtg gaaggcggta aaccgtttac 7500
ttcaagagct gagggcaaag cagcctgacc tagctcctgg actgaccact attggagcct 7560
ctcctactca gactgttact ctggtgacac aacctgtggt tactaaggaa actgccatct 7620
ccaaactaga aatgccatct tccttgatgt tggaggtacc tgctctggca gatttcaacc 7680
gggcttggac agaacttacc gactggcttt ctctgcttga tcaagttata aaatcacaga 7740
gggtgatggt gggtgacctt gaggatatca acgagatgat catcaagcag aaggcaacaa 7800
tgcaggattt ggaacagagg cgtccccagt tggaagaact cattaccgct gcccaaaatt 7860
tgaaaaacaa gaccagcaat caagaggcta gaacaatcat tacggatcga attgaaagaa 7920
ttcagaatca gtgggatgaa gtacaagaac accttcagaa ccggaggcaa cagttgaatg 7980
aaatgttaaa ggattcaaca caatggctgg aagctaagga agaagctgag caggtcttag 8040
gacaggccag agccaagctt gagtcatgga aggagggtcc ctatacagta gatgcaatcc 8100
aaaagaaaat cacagaaacc aagcagttgg ccaaagacct ccgccagtgg cagacaaatg 8160
tagatgtggc aaatgacttg gccctgaaac ttctccggga ttattctgca gatgatacca 8220
gaaaagtcca catgataaca gagaatatca atgcctcttg gagaagcatt cataaaaggg 8280
tgagtgagcg agaggctgct ttggaagaaa ctcatagatt actgcaacag ttccccctgg 8340
acctggaaaa gtttcttgcc tggcttacag aagctgaaac aactgccaat gtcctacagg 8400
atgctacccg taaggaaagg ctcctagaag actccaaggg agtaaaagag ctgatgaaac 8460
aatggcaaga cctccaaggt gaaattgaag ctcacacaga tgtttatcac aacctggatg 8520
aaaacagcca aaaaatcctg agatccctgg aaggttccga tgatgcagtc ctgttacaaa 8580
gacgtttgga taacatgaac ttcaagtgga gtgaacttcg gaaaaagtct ctcaacatta 8640
ggtcccattt ggaagccagt tctgaccagt ggaagcgtct gcacctttct ctgcaggaac 8700
ttctggtgtg gctacagctg aaagatgatg aattaagccg gcaggcacct attggaggcg 8760
actttccagc agttcagaag cagaacgatg tacatagggc cttcaagagg gaattgaaaa 8820
ctaaagaacc tgtaatcatg agtactcttg agactgtacg aatatttctg acagagcagc 8880
ctttggaagg actagagaaa ctctaccagg agcccagaga gctgcctcct gaggagagag 8940
cccagaatgt cactcggctt ctacgaaagc aggctgagga ggtcaatact gagtgggaaa 9000
aattgaacct gcactccgct gactggcaga gaaaaataga tgagaccctt gaaagactcc 9060
aggaacttca agaggccacg gatgagctgg acctcaagct gcgccaagct gaggtgatca 9120
agggatcctg gcagcccgtg ggcgatctcc tcattgactc tctccaagat cacctcgaga 9180
aagtcaaggc acttcgagga gaaattgcgc ctctgaaaga gaacgtgagc cacgtcaatg 9240
accttgctcg ccagcttacc actttgggca ttcagctctc accgtataac ctcagcactc 9300
tggaagacct gaacaccaga tggaagcttc tgcaggtggc cgtcgaggac cgagtcaggc 9360
agctgcatga agcccacagg gactttggtc cagcatctca gcactttctt tccacgtctg 9420
tccagggtcc ctgggagaga gccatctcgc caaacaaagt gccctactat atcaaccacg 9480
agactcaaac aacttgctgg gaccatccca aaatgacaga gctctaccag tctttagctg 9540
acctgaataa tgtcagattc tcagcttata ggactgccat gaaactccga agactgcaga 9600
aggccctttg cttggatctc ttgagcctgt cagctgcatg tgatgccttg gaccagcaca 9660
acctcaagca aaatgaccag cccatggata tcctgcagat tattaattgt ttgaccacta 9720
tttatgaccg cctggagcaa gagcacaaca atttggtcaa cgtccctctc tgcgtggata 9780
tgtgtctgaa ctggctgctg aatgtttatg atacgggacg aacagggagg atccgtgtcc 9840
tgtcttttaa aactggcatc atttccctgt gtaaagcaca tttggaagac aagtacagat 9900
accttttcaa gcaagtggca agttcaacag gattttgtga ccagcgcagg ctgggcctcc 9960
ttctgcatga ttctatccaa attccaagac agttgggtga agttgcatcc tttgggggca 10020
gtaacattga gccaagtgtc cggagctgct tccaatttgc taataataag ccagagatcg 10080
aagcggccct cttcctagac tggatgagac tggaacccca gtccatggtg tggctgcccg 10140
tcctgcacag agtggctgct gcagaaactg ccaagcatca ggccaaatgt aacatctgca 10200
aagagtgtcc aatcattgga ttcaggtaca ggagtctaaa gcactttaat tatgacatct 10260
gccaaagctg ctttttttct ggtcgagttg caaaaggcca taaaatgcac tatcccatgg 10320
tggaatattg cactccgact acatcaggag aagatgttcg agactttgcc aaggtactaa 10380
aaaacaaatt tcgaaccaaa aggtattttg cgaagcatcc ccgaatgggc tacctgccag 10440
tgcagactgt cttagagggg gacaacatgg aaactcccgt tactctgatc aacttctggc 10500
cagtagattc tgcgcctgcc tcgtcccctc agctttcaca cgatgatact cattcacgca 10560
ttgaacatta tgctagcagg ctagcagaaa tggaaaacag caatggatct tatctaaatg 10620
atagcatctc tcctaatgag agcatagatg atgaacattt gttaatccag cattactgcc 10680
aaagtttgaa ccaggactcc cccctgagcc agcctcgtag tcctgcccag atcttgattt 10740
ccttagagag tgaggaaaga ggggagctag agagaatcct agcagatctt gaggaagaaa 10800
acaggaatct gcaagcagaa tatgaccgtc taaagcagca gcacgaacat aaaggcctgt 10860
ccccactgcc gtcccctcct gaaatgatgc ccacctctcc ccagagtccc cgggatgctg 10920
agctcattgc tgaggccaag ctactgcgtc aacacaaagg ccgcctggaa gccaggatgc 10980
aaatcctgga agaccacaat aaacagctgg agtcacagtt acacaggcta aggcagctgc 11040
tggagcaacc ccaggcagag gccaaagtga atggcacaac ggtgtcctct ccttctacct 11100
ctctacagag gtccgacagc agtcagccta tgctgctccg agtggttggc agtcaaactt 11160
cggactccat gggtgaggaa gatcttctca gtcctcccca ggacacaagc acagggttag 11220
aggaggtgat ggagcaactc aacaactcct tccctagttc aagaggaaga aatacccctg 11280
gaaagccaat gagagaggac acaatgtagg aagtcttttc cacatggcag atgatttggg 11340
cagagcgatg gagtccttag tatcagtcat gacagatgaa gaaggagcag aataaatgtt 11400
ttacaactcc tgattcccgc atggttttta taatattcat acaacaaaga ggattagaca 11460
gtaagagttt acaagaaata aatctatatt tttgtgaagg gtagtggtat tatactgtag 11520
atttcagtag tttctaagtc tgttattgtt ttgttaacaa tggcaggttt tacacgtcta 11580
tgcaattgta caaaaaagtt ataagaaaac tacatgtaaa atcttgatag ctaaataact 11640
tgccatttct ttatatggaa cgcattttgg gttgtttaaa aatttataac agttataaag 11700
aaagattgta aactaaagtg tgctttataa aaaaaagttg tttataaaaa cccctaaaaa 11760
caaaacaaac acacacacac acacatacac acacacacac aaaactttga ggcagcgcat 11820
tgttttgcat ccttttggcg tgatatccat atgaaattca tggctttttc tttttttgca 11880
tattaaagat aagacttcct ctaccaccac accaaatgac tactacacac tgctcatttg 11940
agaactgtca gctgagtggg gcaggcttga gttttcattt catatatcta tatgtctata 12000
agtatataaa tactatagtt atatagataa agagatacga atttctatag actgactttt 12060
tccatttttt aaatgttcat gtcacatcct aatagaaaga aattacttct agtcagtcat 12120
ccaggcttac ctgcttggtc tagaatggat ttttcccgga gccggaagcc aggaggaaac 12180
tacaccacac taaaacattg tctacagctc cagatgtttc tcattttaaa caactttcca 12240
ctgacaacga aagtaaagta aagtattgga tttttttaaa gggaacatgt gaatgaatac 12300
acaggactta ttatatcaga gtgagtaatc ggttggttgg ttgattgatt gattgattga 12360
tacattcagc ttcctgctgc tagcaatgcc acgatttaga tttaatgatg cttcagtgga 12420
aatcaatcag aaggtattct gaccttgtga acatcagaag gtatttttta actcccaagc 12480
agtagcagga cgatgatagg gctggagggc tatggattcc cagcccatcc ctgtgaagga 12540
gtaggccact ctttaagtga aggattggat gattgttcat aatacataaa gttctctgta 12600
attacaacta aattattatg ccctcttctc acagtcaaaa ggaactgggt ggtttggttt 12660
ttgttgcttt tttagattta ttgtcccatg tgggatgagt ttttaaatgc cacaagacat 12720
aatttaaaat aaataaactt tgggaaaagg tgtaaaacag tagccccatc acatttgtga 12780
tactgacagg tatcaaccca gaagcccatg aactgtgttt ccatcctttg catttctctg 12840
cgagtagttc cacacaggtt tgtaagtaag taagaaagaa ggcaaattga ttcaaatgtt 12900
acaaaaaaac ccttcttggt ggattagaca ggttaaatat ataaacaaac aaacaaaaat 12960
tgctcaaaaa agaggagaaa agctcaagag gaaaagctaa ggactggtag gaaaaagctt 13020
tactctttca tgccatttta tttctttttg atttttaaat cattcattca atagatacca 13080
ccgtgtgacc tataattttg caaatctgtt acctctgaca tcaagtgtaa ttagcttttg 13140
gagagtgggc tgacatcaag tgtaattagc ttttggagag tgggttttgt ccattattaa 13200
taattaatta attaacatca aacacggctt ctcatgctat ttctacctca ctttggtttt 13260
ggggtgttcc tgataattgt gcacacctga gttcacagct tcaccacttg tccattgcgt 13320
tattttcttt ttcctttata attctttctt tttccttcat aattttcaaa agaaaaccca 13380
aagctctaag gtaacaaatt accaaattac atgaagattt ggtttttgtc ttgcattttt 13440
ttcctttatg tgacgctgga ccttttcttt acccaaggat ttttaaaact cagatttaaa 13500
acaaggggtt actttacatc ctactaagaa gtttaagtaa gtaagtttca ttctaaaatc 13560
agaggtaaat agagtgcata aataattttg ttttaatctt tttgtttttc ttttagacac 13620
attagctctg gagtgagtct gtcataatat ttgaacaaaa attgagagct ttattgctgc 13680
attttaagca taattaattt ggacattatt tcgtgttgtg ttctttataa ccaccaagta 13740
ttaaactgta aatcataatg taactgaagc ataaacatca catggcatgt tttgtcattg 13800
ttttcaggta ctgagttctt acttgagtat cataatatat tgtgttttaa caccaacact 13860
gtaacattta cgaattattt ttttaaactt cagttttact gcattttcac aacatatcag 13920
acttcaccaa atatatgcct tactattgta ttatagtact gctttactgt gtatctcaat 13980
aaagcacgca gttatgttac 14000
<210> 11
<211> 3681
<212> PRT
<213> Homo sapiens
<400> 11
Met Ser Glu Val Ser Ser Asp Glu Arg Glu Asp Val Gln Lys Lys Thr
1 5 10 15
Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe Gly Lys Gln His
20 25 30
Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg Arg Leu Leu Asp
35 40 45
Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys Glu Lys Gly Ser
50 55 60
Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala Leu Arg Val Leu
65 70 75 80
Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser Thr Asp Ile Val
85 90 95
Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp Asn Ile Ile Leu
100 105 110
His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met Ala Gly Leu Gln
115 120 125
Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val Arg Gln Ser Thr
130 135 140
Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr Thr Ser Trp Ser
145 150 155 160
Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His Arg Pro Asp Leu
165 170 175
Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala Thr Gln Arg Leu
180 185 190
Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly Ile Glu Lys Leu
195 200 205
Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp Lys Lys Ser Ile
210 215 220
Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro Gln Gln Val Ser
225 230 235 240
Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg Pro Pro Lys Val
245 250 255
Thr Lys Glu Glu His Phe Gln Leu His His Gln Met His Tyr Ser Gln
260 265 270
Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg Thr Ser Ser Pro
275 280 285
Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala Ala Tyr Val Thr
290 295 300
Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln His Leu Glu Ala
305 310 315 320
Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu Ser Glu Val Asn
325 330 335
Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu Ser Trp Leu Leu
340 345 350
Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile Ser Asn Asp Val
355 360 365
Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly Tyr Met Met Asp
370 375 380
Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu Gln Leu Gly Ser
385 390 395 400
Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu Glu Thr Glu Val
405 410 415
Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu Cys Leu Arg Val
420 425 430
Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val Leu Met Asp Leu
435 440 445
Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu Thr Lys Thr Glu
450 455 460
Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly Pro Asp Leu Glu
465 470 475 480
Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu Gln Glu Asp Leu
485 490 495
Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His Met Val Val Val
500 505 510
Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala Leu Glu Glu Gln
515 520 525
Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys Arg Trp Thr Glu
530 535 540
Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys Trp Gln Arg Leu
545 550 555 560
Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser Glu Lys Glu Asp
565 570 575
Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp Gln Asn Glu Met
580 585 590
Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala Asp Leu Glu Lys
595 600 605
Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys Gln Asp Leu Leu
610 615 620
Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr Glu Ala Trp Leu
625 630 635 640
Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln Lys Leu Glu Lys
645 650 655
Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr Gln Pro Ser Leu
660 665 670
Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val Thr Thr Arg Glu
675 680 685
Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro Pro Pro Pro Pro
690 695 700
Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile Arg Lys Arg Leu
705 710 715 720
Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr Arg Ser Glu Ala
725 730 735
Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys Glu Gly Asn Phe
740 745 750
Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg Glu Lys Ala Glu
755 760 765
Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala Gln Ala Leu Val
770 775 780
Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser Ile Lys Gln Ala
785 790 795 800
Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys Gln Leu Leu Ser
805 810 815
Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile Ile Ala Phe Tyr
820 825 830
Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr Ala Glu Asn Trp
835 840 845
Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr Ala Ile Lys Ser
850 855 860
Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu Ser Gly Leu Gln
865 870 875 880
Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala Leu Lys Glu Lys
885 890 895
Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val Ala Phe Thr Asn
900 905 910
His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg Glu Lys Glu Leu
915 920 925
Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr Gln Glu Thr Met
930 935 940
Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr Lys Leu Ser Ile
945 950 955 960
Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu Gln Arg Leu Gly
965 970 975
Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln Gln Ser Gly Leu
980 985 990
Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys Lys Ala Pro Ser
995 1000 1005
Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu Glu Ile Glu Gly
1010 1015 1020
Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu His Cys Gln Lys
1025 1030 1035
Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile Gln Asn His Ile
1040 1045 1050
Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp Val Phe Leu Lys
1055 1060 1065
Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile Leu Lys Lys Gln
1070 1075 1080
Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile Gln Thr Ile Gln
1085 1090 1095
Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln Lys Ile Lys Asn
1100 1105 1110
Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu Thr Glu Leu Lys
1115 1120 1125
Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln Gln Val Tyr Ala
1130 1135 1140
Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys Thr Val Ser Leu
1145 1150 1155
Gln Lys Asp Leu Ser Glu Met His Glu Trp Met Thr Gln Ala Glu
1160 1165 1170
Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys Thr Pro Asp Glu
1175 1180 1185
Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala Lys Glu Glu Ala
1190 1195 1200
Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr Glu Ser Val Asn
1205 1210 1215
Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln Glu Ala Leu Lys
1220 1225 1230
Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln Trp Leu Cys Thr
1235 1240 1245
Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu Val Trp Ala Cys
1250 1255 1260
Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala Asn Lys Trp Leu
1265 1270 1275
Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu Asn Ile Pro Gly
1280 1285 1290
Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser Leu Glu Asn Leu
1295 1300 1305
Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile Arg Ile Leu Ala
1310 1315 1320
Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu Leu Ile Asn Glu
1325 1330 1335
Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu Leu His Glu Glu
1340 1345 1350
Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser Ile Gln Ser Ala
1355 1360 1365
Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln Glu Ser Leu Thr
1370 1375 1380
Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala Asp Lys Val Asp
1385 1390 1395
Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile Gln Ser Asp Leu
1400 1405 1410
Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys Lys His Asn Gln
1415 1420 1425
Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln Ile Asp Val Ala
1430 1435 1440
Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe Arg Leu Phe Gln
1445 1450 1455
Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu Ser Lys Met Ile
1460 1465 1470
Leu Asp Glu Val Lys Met His Leu Pro Ala Leu Glu Thr Lys Ser
1475 1480 1485
Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn His Cys Val Asn
1490 1495 1500
Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu Val Glu Met Val
1505 1510 1515
Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys Gln Thr Glu Asn
1520 1525 1530
Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu Lys Leu His Tyr
1535 1540 1545
Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys Gln Gln Leu Glu
1550 1555 1560
Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys Glu Met Asn Val
1565 1570 1575
Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu Leu Thr Lys Arg
1580 1585 1590
Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp Ser Glu Val Ala
1595 1600 1605
Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys Gln Lys Val His
1610 1615 1620
Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu Lys Thr Val Leu
1625 1630 1635
Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu Ser Leu Leu Asn
1640 1645 1650
Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu Glu Trp Leu Asn
1655 1660 1665
Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr Phe Asp Gln Asn
1670 1675 1680
Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala Asp Thr Leu Leu
1685 1690 1695
Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys Glu Asp Val Leu
1700 1705 1710
Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg Pro Lys Val Asp
1715 1720 1725
Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala Asn Arg Gly Asp
1730 1735 1740
His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser Glu Leu Asn His
1745 1750 1755
Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr Gly Lys Ala Ser
1760 1765 1770
Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser Asp Ile Gln Lys
1775 1780 1785
Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln Gly Val Asn Leu
1790 1795 1800
Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu Asp Asn Glu Gly
1805 1810 1815
Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn Leu Gln Gln Arg
1820 1825 1830
Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys Ile Lys Gln Gln
1835 1840 1845
Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp Leu Arg Ser Gln
1850 1855 1860
Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln Trp Tyr Gln Tyr
1865 1870 1875
Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu Asp Asp Ile Glu
1880 1885 1890
Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp Glu Arg Lys Ile
1895 1900 1905
Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys Glu Glu Leu Asn
1910 1915 1920
Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu Asp Gly Ala Ala
1925 1930 1935
Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser Lys Arg Trp Arg
1940 1945 1950
Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg Leu Asn Phe Ala
1955 1960 1965
Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu
1970 1975 1980
Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr
1985 1990 1995
Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu
2000 2005 2010
Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe
2015 2020 2025
Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln
2030 2035 2040
Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala
2045 2050 2055
Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys Leu Gln Glu Ala
2060 2065 2070
Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr
2075 2080 2085
Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu Lys Trp Arg
2090 2095 2100
Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr Glu
2105 2110 2115
Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu
2120 2125 2130
His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile
2135 2140 2145
Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu
2150 2155 2160
Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln
2165 2170 2175
Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys
2180 2185 2190
Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn Ile
2195 2200 2205
Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe Val Leu Trp Leu
2210 2215 2220
Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu Glu Pro Gly Lys
2225 2230 2235
Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val Lys Leu Leu Val
2240 2245 2250
Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys Gln Leu Asn Glu
2255 2260 2265
Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile Ser Pro Glu Glu
2270 2275 2280
Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr Asn Leu Gln Trp
2285 2290 2295
Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln Gly Glu Ile Glu
2300 2305 2310
Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys Lys Leu Glu Asp
2315 2320 2325
Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp Leu Ser Pro Ile
2330 2335 2340
Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn Gln Glu Gly Pro
2345 2350 2355
Phe Asp Val Gln Glu Thr Glu Ile Ala Val Gln Ala Lys Gln Pro
2360 2365 2370
Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His Leu Tyr Lys Glu
2375 2380 2385
Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu Glu Asp Leu Ser
2390 2395 2400
Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln Glu Leu Arg Ala
2405 2410 2415
Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser
2420 2425 2430
Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro Val Val Thr Lys
2435 2440 2445
Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser Ser Leu Met Leu
2450 2455 2460
Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala Trp Thr Glu Leu
2465 2470 2475
Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile Lys Ser Gln Arg
2480 2485 2490
Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu Met Ile Ile Lys
2495 2500 2505
Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg Pro Gln Leu
2510 2515 2520
Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys Thr Ser
2525 2530 2535
Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg Ile
2540 2545 2550
Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg
2555 2560 2565
Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu
2570 2575 2580
Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys
2585 2590 2595
Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln
2600 2605 2610
Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln
2615 2620 2625
Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu
2630 2635 2640
Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys Val His Met Ile
2645 2650 2655
Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile His Lys Arg Val
2660 2665 2670
Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His Arg Leu Leu Gln
2675 2680 2685
Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala Trp Leu Thr Glu
2690 2695 2700
Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala Thr Arg Lys Glu
2705 2710 2715
Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu Leu Met Lys Gln
2720 2725 2730
Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His Thr Asp Val Tyr
2735 2740 2745
His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg Ser Leu Glu
2750 2755 2760
Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp Asn Met
2765 2770 2775
Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile Arg
2780 2785 2790
Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu
2795 2800 2805
Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu
2810 2815 2820
Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln
2825 2830 2835
Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr
2840 2845 2850
Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe
2855 2860 2865
Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu
2870 2875 2880
Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn Val Thr Arg
2885 2890 2895
Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr Glu Trp Glu Lys
2900 2905 2910
Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr
2915 2920 2925
Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp
2930 2935 2940
Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro
2945 2950 2955
Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys
2960 2965 2970
Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val
2975 2980 2985
Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile
2990 2995 3000
Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr
3005 3010 3015
Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln
3020 3025 3030
Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe
3035 3040 3045
Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro
3050 3055 3060
Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys
3065 3070 3075
Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp
3080 3085 3090
Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu
3095 3100 3105
Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser
3110 3115 3120
Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp
3125 3130 3135
Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile
3140 3145 3150
Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro
3155 3160 3165
Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp
3170 3175 3180
Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly
3185 3190 3195
Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr
3200 3205 3210
Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg
3215 3220 3225
Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln
3230 3235 3240
Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser
3245 3250 3255
Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu
3260 3265 3270
Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
3275 3280 3285
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala
3290 3295 3300
Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile
3305 3310 3315
Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys
3320 3325 3330
Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met
3335 3340 3345
His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu
3350 3355 3360
Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr
3365 3370 3375
Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val
3380 3385 3390
Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu
3395 3400 3405
Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala Ser Ser Pro Gln
3410 3415 3420
Leu Ser His Asp Asp Thr His Ser Arg Ile Glu His Tyr Ala Ser
3425 3430 3435
Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn Asp
3440 3445 3450
Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile
3455 3460 3465
Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln
3470 3475 3480
Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu
3485 3490 3495
Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn
3500 3505 3510
Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu
3515 3520 3525
His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro
3530 3535 3540
Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala
3545 3550 3555
Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln
3560 3565 3570
Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg
3575 3580 3585
Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn
3590 3595 3600
Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp
3605 3610 3615
Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser
3620 3625 3630
Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr
3635 3640 3645
Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe
3650 3655 3660
Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys Pro Met Arg Glu
3665 3670 3675
Asp Thr Met
3680
<210> 12
<211> 9771
<212> DNA
<213> Homo sapiens
<400> 12
taatgagatc aggaggaaca ttcgacctga gaaagacaga ttgcaatgac tgagatgatt 60
ttgctaattt tttttccagc ctatttcctt aatgctgtaa ggaggcaaaa gttgcttgaa 120
cagagcatcc agtctgccca ggagactgaa aaatccttac acttaatcca ggagtccctc 180
acattcattg acaagcagtt ggcagcttat attgcagaca aggtggacgc agctcaaatg 240
cctcaggaag cccagaaaat ccaatctgat ttgacaagtc atgagatcag tttagaagaa 300
atgaagaaac ataatcaggg gaaggaggct gcccaaagag tcctgtctca gattgatgtt 360
gcacagaaaa aattacaaga tgtctccatg aagtttcgat tattccagaa accagccaat 420
tttgagcagc gtctacaaga aagtaagatg attttagatg aagtgaagat gcacttgcct 480
gcattggaaa caaagagtgt ggaacaggaa gtagtacagt cacagctaaa tcattgtgtg 540
aacttgtata aaagtctgag tgaagtgaag tctgaagtgg aaatggtgat aaagactgga 600
cgtcagattg tacagaaaaa gcagacggaa aatcccaaag aacttgatga aagagtaaca 660
gctttgaaat tgcattataa tgagctggga gcaaaggtaa cagaaagaaa gcaacagttg 720
gagaaatgct tgaaattgtc ccgtaagatg cgaaaggaaa tgaatgtctt gacagaatgg 780
ctggcagcta cagatatgga attgacaaag agatcagcag ttgaaggaat gcctagtaat 840
ttggattctg aagttgcctg gggaaaggct actcaaaaag agattgagaa acagaaggtg 900
cacctgaaga gtatcacaga ggtaggagag gccttgaaaa cagttttggg caagaaggag 960
acgttggtgg aagataaact cagtcttctg aatagtaact ggatagctgt cacctcccga 1020
gcagaagagt ggttaaatct tttgttggaa taccagaaac acatggaaac ttttgaccag 1080
aatgtggacc acatcacaaa gtggatcatt caggctgaca cacttttgga tgaatcagag 1140
aaaaagaaac cccagcaaaa agaagacgtg cttaagcgtt taaaggcaga actgaatgac 1200
atacgcccaa aggtggactc tacacgtgac caagcagcaa acttgatggc aaaccgcggt 1260
gaccactgca ggaaattagt agagccccaa atctcagagc tcaaccatcg atttgcagcc 1320
atttcacaca gaattaagac tggaaaggcc tccattcctt tgaaggaatt ggagcagttt 1380
aactcagata tacaaaaatt gcttgaacca ctggaggctg aaattcagca gggggtgaat 1440
ctgaaagagg aagacttcaa taaagatatg aatgaagaca atgagggtac tgtaaaagaa 1500
ttgttgcaaa gaggagacaa cttacaacaa agaatcacag atgagagaaa gcgagaggaa 1560
ataaagataa aacagcagct gttacagaca aaacataatg ctctcaagga tttgaggtct 1620
caaagaagaa aaaaggctct agaaatttct catcagtggt atcagtacaa gaggcaggct 1680
gatgatctcc tgaaatgctt ggatgacatt gaaaaaaaat tagccagcct acctgagccc 1740
agagatgaaa ggaaaataaa ggaaattgat cgggaattgc agaagaagaa agaggagctg 1800
aatgcagtgc gtaggcaagc tgagggcttg tctgaggatg gggccgcaat ggcagtggag 1860
ccaactcaga tccagctcag caagcgctgg cgggaaattg agagcaaatt tgctcagttt 1920
cgaagactca actttgcaca aattcacact gtccgtgaag aaacgatgat ggtgatgact 1980
gaagacatgc ctttggaaat ttcttatgtg ccttctactt atttgactga aatcactcat 2040
gtctcacaag ccctattaga agtggaacaa cttctcaatg ctcctgacct ctgtgctaag 2100
gactttgaag atctctttaa gcaagaggag tctctgaaga atataaaaga tagtctacaa 2160
caaagctcag gtcggattga cattattcat agcaagaaga cagcagcatt gcaaagtgca 2220
acgcctgtgg aaagggtgaa gctacaggaa gctctctccc agcttgattt ccaatgggaa 2280
aaagttaaca aaatgtacaa ggaccgacaa gggcgatttg acagatctgt tgagaaatgg 2340
cggcgttttc attatgatat aaagatattt aatcagtggc taacagaagc tgaacagttt 2400
ctcagaaaga cacaaattcc tgagaattgg gaacatgcta aatacaaatg gtatcttaag 2460
gaactccagg atggcattgg gcagcggcaa actgttgtca gaacattgaa tgcaactggg 2520
gaagaaataa ttcagcaatc ctcaaaaaca gatgccagta ttctacagga aaaattggga 2580
agcctgaatc tgcggtggca ggaggtctgc aaacagctgt cagacagaaa aaagaggcta 2640
gaagaacaaa agaatatctt gtcagaattt caaagagatt taaatgaatt tgttttatgg 2700
ttggaggaag cagataacat tgctagtatc ccacttgaac ctggaaaaga gcagcaacta 2760
aaagaaaagc ttgagcaagt caagttactg gtggaagagt tgcccctgcg ccagggaatt 2820
ctcaaacaat taaatgaaac tggaggaccc gtgcttgtaa gtgctcccat aagcccagaa 2880
gagcaagata aacttgaaaa taagctcaag cagacaaatc tccagtggat aaaggtttcc 2940
agagctttac ctgagaaaca aggagaaatt gaagctcaaa taaaagacct tgggcagctt 3000
gaaaaaaagc ttgaagacct tgaagagcag ttaaatcatc tgctgctgtg gttatctcct 3060
attaggaatc agttggaaat ttataaccaa ccaaaccaag aaggaccatt tgacgttcag 3120
gaaactgaaa tagcagttca agctaaacaa ccggatgtgg aagagatttt gtctaaaggg 3180
cagcatttgt acaaggaaaa accagccact cagccagtga agaggaagtt agaagatctg 3240
agctctgagt ggaaggcggt aaaccgttta cttcaagagc tgagggcaaa gcagcctgac 3300
ctagctcctg gactgaccac tattggagcc tctcctactc agactgttac tctggtgaca 3360
caacctgtgg ttactaagga aactgccatc tccaaactag aaatgccatc ttccttgatg 3420
ttggaggtac ctgctctggc agatttcaac cgggcttgga cagaacttac cgactggctt 3480
tctctgcttg atcaagttat aaaatcacag agggtgatgg tgggtgacct tgaggatatc 3540
aacgagatga tcatcaagca gaaggcaaca atgcaggatt tggaacagag gcgtccccag 3600
ttggaagaac tcattaccgc tgcccaaaat ttgaaaaaca agaccagcaa tcaagaggct 3660
agaacaatca ttacggatcg aattgaaaga attcagaatc agtgggatga agtacaagaa 3720
caccttcaga accggaggca acagttgaat gaaatgttaa aggattcaac acaatggctg 3780
gaagctaagg aagaagctga gcaggtctta ggacaggcca gagccaagct tgagtcatgg 3840
aaggagggtc cctatacagt agatgcaatc caaaagaaaa tcacagaaac caagcagttg 3900
gccaaagacc tccgccagtg gcagacaaat gtagatgtgg caaatgactt ggccctgaaa 3960
cttctccggg attattctgc agatgatacc agaaaagtcc acatgataac agagaatatc 4020
aatgcctctt ggagaagcat tcataaaagg gtgagtgagc gagaggctgc tttggaagaa 4080
actcatagat tactgcaaca gttccccctg gacctggaaa agtttcttgc ctggcttaca 4140
gaagctgaaa caactgccaa tgtcctacag gatgctaccc gtaaggaaag gctcctagaa 4200
gactccaagg gagtaaaaga gctgatgaaa caatggcaag acctccaagg tgaaattgaa 4260
gctcacacag atgtttatca caacctggat gaaaacagcc aaaaaatcct gagatccctg 4320
gaaggttccg atgatgcagt cctgttacaa agacgtttgg ataacatgaa cttcaagtgg 4380
agtgaacttc ggaaaaagtc tctcaacatt aggtcccatt tggaagccag ttctgaccag 4440
tggaagcgtc tgcacctttc tctgcaggaa cttctggtgt ggctacagct gaaagatgat 4500
gaattaagcc ggcaggcacc tattggaggc gactttccag cagttcagaa gcagaacgat 4560
gtacataggg ccttcaagag ggaattgaaa actaaagaac ctgtaatcat gagtactctt 4620
gagactgtac gaatatttct gacagagcag cctttggaag gactagagaa actctaccag 4680
gagcccagag agctgcctcc tgaggagaga gcccagaatg tcactcggct tctacgaaag 4740
caggctgagg aggtcaatac tgagtgggaa aaattgaacc tgcactccgc tgactggcag 4800
agaaaaatag atgagaccct tgaaagactc caggaacttc aagaggccac ggatgagctg 4860
gacctcaagc tgcgccaagc tgaggtgatc aagggatcct ggcagcccgt gggcgatctc 4920
ctcattgact ctctccaaga tcacctcgag aaagtcaagg cacttcgagg agaaattgcg 4980
cctctgaaag agaacgtgag ccacgtcaat gaccttgctc gccagcttac cactttgggc 5040
attcagctct caccgtataa cctcagcact ctggaagacc tgaacaccag atggaagctt 5100
ctgcaggtgg ccgtcgagga ccgagtcagg cagctgcatg aagcccacag ggactttggt 5160
ccagcatctc agcactttct ttccacgtct gtccagggtc cctgggagag agccatctcg 5220
ccaaacaaag tgccctacta tatcaaccac gagactcaaa caacttgctg ggaccatccc 5280
aaaatgacag agctctacca gtctttagct gacctgaata atgtcagatt ctcagcttat 5340
aggactgcca tgaaactccg aagactgcag aaggcccttt gcttggatct cttgagcctg 5400
tcagctgcat gtgatgcctt ggaccagcac aacctcaagc aaaatgacca gcccatggat 5460
atcctgcaga ttattaattg tttgaccact atttatgacc gcctggagca agagcacaac 5520
aatttggtca acgtccctct ctgcgtggat atgtgtctga actggctgct gaatgtttat 5580
gatacgggac gaacagggag gatccgtgtc ctgtctttta aaactggcat catttccctg 5640
tgtaaagcac atttggaaga caagtacaga taccttttca agcaagtggc aagttcaaca 5700
ggattttgtg accagcgcag gctgggcctc cttctgcatg attctatcca aattccaaga 5760
cagttgggtg aagttgcatc ctttgggggc agtaacattg agccaagtgt ccggagctgc 5820
ttccaatttg ctaataataa gccagagatc gaagcggccc tcttcctaga ctggatgaga 5880
ctggaacccc agtccatggt gtggctgccc gtcctgcaca gagtggctgc tgcagaaact 5940
gccaagcatc aggccaaatg taacatctgc aaagagtgtc caatcattgg attcaggtac 6000
aggagtctaa agcactttaa ttatgacatc tgccaaagct gctttttttc tggtcgagtt 6060
gcaaaaggcc ataaaatgca ctatcccatg gtggaatatt gcactccgac tacatcagga 6120
gaagatgttc gagactttgc caaggtacta aaaaacaaat ttcgaaccaa aaggtatttt 6180
gcgaagcatc cccgaatggg ctacctgcca gtgcagactg tcttagaggg ggacaacatg 6240
gaaactcccg ttactctgat caacttctgg ccagtagatt ctgcgcctgc ctcgtcccct 6300
cagctttcac acgatgatac tcattcacgc attgaacatt atgctagcag gctagcagaa 6360
atggaaaaca gcaatggatc ttatctaaat gatagcatct ctcctaatga gagcatagat 6420
gatgaacatt tgttaatcca gcattactgc caaagtttga accaggactc ccccctgagc 6480
cagcctcgta gtcctgccca gatcttgatt tccttagaga gtgaggaaag aggggagcta 6540
gagagaatcc tagcagatct tgaggaagaa aacaggaatc tgcaagcaga atatgaccgt 6600
ctaaagcagc agcacgaaca taaaggcctg tccccactgc cgtcccctcc tgaaatgatg 6660
cccacctctc cccagagtcc ccgggatgct gagctcattg ctgaggccaa gctactgcgt 6720
caacacaaag gccgcctgga agccaggatg caaatcctgg aagaccacaa taaacagctg 6780
gagtcacagt tacacaggct aaggcagctg ctggagcaac cccaggcaga ggccaaagtg 6840
aatggcacaa cggtgtcctc tccttctacc tctctacaga ggtccgacag cagtcagcct 6900
atgctgctcc gagtggttgg cagtcaaact tcggactcca tgggtgagga agatcttctc 6960
agtcctcccc aggacacaag cacagggtta gaggaggtga tggagcaact caacaactcc 7020
ttccctagtt caagaggaag aaatacccct ggaaagccaa tgagagagga cacaatgtag 7080
gaagtctttt ccacatggca gatgatttgg gcagagcgat ggagtcctta gtatcagtca 7140
tgacagatga agaaggagca gaataaatgt tttacaactc ctgattcccg catggttttt 7200
ataatattca tacaacaaag aggattagac agtaagagtt tacaagaaat aaatctatat 7260
ttttgtgaag ggtagtggta ttatactgta gatttcagta gtttctaagt ctgttattgt 7320
tttgttaaca atggcaggtt ttacacgtct atgcaattgt acaaaaaagt tataagaaaa 7380
ctacatgtaa aatcttgata gctaaataac ttgccatttc tttatatgga acgcattttg 7440
ggttgtttaa aaatttataa cagttataaa gaaagattgt aaactaaagt gtgctttata 7500
aaaaaaagtt gtttataaaa acccctaaaa acaaaacaaa cacacacaca cacacataca 7560
cacacacaca caaaactttg aggcagcgca ttgttttgca tccttttggc gtgatatcca 7620
tatgaaattc atggcttttt ctttttttgc atattaaaga taagacttcc tctaccacca 7680
caccaaatga ctactacaca ctgctcattt gagaactgtc agctgagtgg ggcaggcttg 7740
agttttcatt tcatatatct atatgtctat aagtatataa atactatagt tatatagata 7800
aagagatacg aatttctata gactgacttt ttccattttt taaatgttca tgtcacatcc 7860
taatagaaag aaattacttc tagtcagtca tccaggctta cctgcttggt ctagaatgga 7920
tttttcccgg agccggaagc caggaggaaa ctacaccaca ctaaaacatt gtctacagct 7980
ccagatgttt ctcattttaa acaactttcc actgacaacg aaagtaaagt aaagtattgg 8040
atttttttaa agggaacatg tgaatgaata cacaggactt attatatcag agtgagtaat 8100
cggttggttg gttgattgat tgattgattg atacattcag cttcctgctg ctagcaatgc 8160
cacgatttag atttaatgat gcttcagtgg aaatcaatca gaaggtattc tgaccttgtg 8220
aacatcagaa ggtatttttt aactcccaag cagtagcagg acgatgatag ggctggaggg 8280
ctatggattc ccagcccatc cctgtgaagg agtaggccac tctttaagtg aaggattgga 8340
tgattgttca taatacataa agttctctgt aattacaact aaattattat gccctcttct 8400
cacagtcaaa aggaactggg tggtttggtt tttgttgctt ttttagattt attgtcccat 8460
gtgggatgag tttttaaatg ccacaagaca taatttaaaa taaataaact ttgggaaaag 8520
gtgtaaaaca gtagccccat cacatttgtg atactgacag gtatcaaccc agaagcccat 8580
gaactgtgtt tccatccttt gcatttctct gcgagtagtt ccacacaggt ttgtaagtaa 8640
gtaagaaaga aggcaaattg attcaaatgt tacaaaaaaa cccttcttgg tggattagac 8700
aggttaaata tataaacaaa caaacaaaaa ttgctcaaaa aagaggagaa aagctcaaga 8760
ggaaaagcta aggactggta ggaaaaagct ttactctttc atgccatttt atttcttttt 8820
gatttttaaa tcattcattc aatagatacc accgtgtgac ctataatttt gcaaatctgt 8880
tacctctgac atcaagtgta attagctttt ggagagtggg ctgacatcaa gtgtaattag 8940
cttttggaga gtgggttttg tccattatta ataattaatt aattaacatc aaacacggct 9000
tctcatgcta tttctacctc actttggttt tggggtgttc ctgataattg tgcacacctg 9060
agttcacagc ttcaccactt gtccattgcg ttattttctt tttcctttat aattctttct 9120
ttttccttca taattttcaa aagaaaaccc aaagctctaa ggtaacaaat taccaaatta 9180
catgaagatt tggtttttgt cttgcatttt tttcctttat gtgacgctgg accttttctt 9240
tacccaagga tttttaaaac tcagatttaa aacaaggggt tactttacat cctactaaga 9300
agtttaagta agtaagtttc attctaaaat cagaggtaaa tagagtgcat aaataatttt 9360
gttttaatct ttttgttttt cttttagaca cattagctct ggagtgagtc tgtcataata 9420
tttgaacaaa aattgagagc tttattgctg cattttaagc ataattaatt tggacattat 9480
ttcgtgttgt gttctttata accaccaagt attaaactgt aaatcataat gtaactgaag 9540
cataaacatc acatggcatg ttttgtcatt gttttcaggt actgagttct tacttgagta 9600
tcataatata ttgtgtttta acaccaacac tgtaacattt acgaattatt tttttaaact 9660
tcagttttac tgcattttca caacatatca gacttcacca aatatatgcc ttactattgt 9720
attatagtac tgctttactg tgtatctcaa taaagcacgc agttatgtta c 9771
<210> 13
<211> 2344
<212> PRT
<213> Homo sapiens
<400> 13
Met Thr Glu Met Ile Leu Leu Ile Phe Phe Pro Ala Tyr Phe Leu Asn
1 5 10 15
Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser Ile Gln Ser Ala Gln
20 25 30
Glu Thr Glu Lys Ser Leu His Leu Ile Gln Glu Ser Leu Thr Phe Ile
35 40 45
Asp Lys Gln Leu Ala Ala Tyr Ile Ala Asp Lys Val Asp Ala Ala Gln
50 55 60
Met Pro Gln Glu Ala Gln Lys Ile Gln Ser Asp Leu Thr Ser His Glu
65 70 75 80
Ile Ser Leu Glu Glu Met Lys Lys His Asn Gln Gly Lys Glu Ala Ala
85 90 95
Gln Arg Val Leu Ser Gln Ile Asp Val Ala Gln Lys Lys Leu Gln Asp
100 105 110
Val Ser Met Lys Phe Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln
115 120 125
Arg Leu Gln Glu Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu
130 135 140
Pro Ala Leu Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln
145 150 155 160
Leu Asn His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser
165 170 175
Glu Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
180 185 190
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu Lys
195 200 205
Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys Gln Gln
210 215 220
Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys Glu Met Asn
225 230 235 240
Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu Leu Thr Lys Arg
245 250 255
Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp Ser Glu Val Ala Trp
260 265 270
Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys Gln Lys Val His Leu Lys
275 280 285
Ser Ile Thr Glu Val Gly Glu Ala Leu Lys Thr Val Leu Gly Lys Lys
290 295 300
Glu Thr Leu Val Glu Asp Lys Leu Ser Leu Leu Asn Ser Asn Trp Ile
305 310 315 320
Ala Val Thr Ser Arg Ala Glu Glu Trp Leu Asn Leu Leu Leu Glu Tyr
325 330 335
Gln Lys His Met Glu Thr Phe Asp Gln Asn Val Asp His Ile Thr Lys
340 345 350
Trp Ile Ile Gln Ala Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys
355 360 365
Pro Gln Gln Lys Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn
370 375 380
Asp Ile Arg Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu
385 390 395 400
Met Ala Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile
405 410 415
Ser Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
420 425 430
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser Asp
435 440 445
Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln Gly Val
450 455 460
Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu Asp Asn Glu
465 470 475 480
Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn Leu Gln Gln Arg
485 490 495
Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys Ile Lys Gln Gln Leu
500 505 510
Leu Gln Thr Lys His Asn Ala Leu Lys Asp Leu Arg Ser Gln Arg Arg
515 520 525
Lys Lys Ala Leu Glu Ile Ser His Gln Trp Tyr Gln Tyr Lys Arg Gln
530 535 540
Ala Asp Asp Leu Leu Lys Cys Leu Asp Asp Ile Glu Lys Lys Leu Ala
545 550 555 560
Ser Leu Pro Glu Pro Arg Asp Glu Arg Lys Ile Lys Glu Ile Asp Arg
565 570 575
Glu Leu Gln Lys Lys Lys Glu Glu Leu Asn Ala Val Arg Arg Gln Ala
580 585 590
Glu Gly Leu Ser Glu Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln
595 600 605
Ile Gln Leu Ser Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln
610 615 620
Phe Arg Arg Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr
625 630 635 640
Met Met Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro
645 650 655
Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
660 665 670
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu
675 680 685
Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu
690 695 700
Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys Lys Thr Ala
705 710 715 720
Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys Leu Gln Glu Ala
725 730 735
Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr Lys
740 745 750
Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu Lys Trp Arg Arg Phe
755 760 765
His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln
770 775 780
Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys Tyr
785 790 795 800
Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr
805 810 815
Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser
820 825 830
Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn
835 840 845
Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg
850 855 860
Leu Glu Glu Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn
865 870 875 880
Glu Phe Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro
885 890 895
Leu Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
900 905 910
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys Gln
915 920 925
Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile Ser Pro
930 935 940
Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr Asn Leu Gln
945 950 955 960
Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln Gly Glu Ile Glu
965 970 975
Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys Lys Leu Glu Asp Leu
980 985 990
Glu Glu Gln Leu Asn His Leu Leu Leu Trp Leu Ser Pro Ile Arg Asn
995 1000 1005
Gln Leu Glu Ile Tyr Asn Gln Pro Asn Gln Glu Gly Pro Phe Asp
1010 1015 1020
Val Gln Glu Thr Glu Ile Ala Val Gln Ala Lys Gln Pro Asp Val
1025 1030 1035
Glu Glu Ile Leu Ser Lys Gly Gln His Leu Tyr Lys Glu Lys Pro
1040 1045 1050
Ala Thr Gln Pro Val Lys Arg Lys Leu Glu Asp Leu Ser Ser Glu
1055 1060 1065
Trp Lys Ala Val Asn Arg Leu Leu Gln Glu Leu Arg Ala Lys Gln
1070 1075 1080
Pro Asp Leu Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr
1085 1090 1095
Gln Thr Val Thr Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr
1100 1105 1110
Ala Ile Ser Lys Leu Glu Met Pro Ser Ser Leu Met Leu Glu Val
1115 1120 1125
Pro Ala Leu Ala Asp Phe Asn Arg Ala Trp Thr Glu Leu Thr Asp
1130 1135 1140
Trp Leu Ser Leu Leu Asp Gln Val Ile Lys Ser Gln Arg Val Met
1145 1150 1155
Val Gly Asp Leu Glu Asp Ile Asn Glu Met Ile Ile Lys Gln Lys
1160 1165 1170
Ala Thr Met Gln Asp Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu
1175 1180 1185
Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln
1190 1195 1200
Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg Ile Gln Asn
1205 1210 1215
Gln Trp Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg Gln Gln
1220 1225 1230
Leu Asn Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala Lys
1235 1240 1245
Glu Glu Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu
1250 1255 1260
Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys
1265 1270 1275
Ile Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln
1280 1285 1290
Thr Asn Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg
1295 1300 1305
Asp Tyr Ser Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu
1310 1315 1320
Asn Ile Asn Ala Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu
1325 1330 1335
Arg Glu Ala Ala Leu Glu Glu Thr His Arg Leu Leu Gln Gln Phe
1340 1345 1350
Pro Leu Asp Leu Glu Lys Phe Leu Ala Trp Leu Thr Glu Ala Glu
1355 1360 1365
Thr Thr Ala Asn Val Leu Gln Asp Ala Thr Arg Lys Glu Arg Leu
1370 1375 1380
Leu Glu Asp Ser Lys Gly Val Lys Glu Leu Met Lys Gln Trp Gln
1385 1390 1395
Asp Leu Gln Gly Glu Ile Glu Ala His Thr Asp Val Tyr His Asn
1400 1405 1410
Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg Ser Leu Glu Gly Ser
1415 1420 1425
Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp Asn Met Asn Phe
1430 1435 1440
Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile Arg Ser His
1445 1450 1455
Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu Ser Leu
1460 1465 1470
Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser
1475 1480 1485
Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln
1490 1495 1500
Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu
1505 1510 1515
Pro Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr
1520 1525 1530
Glu Gln Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg
1535 1540 1545
Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu
1550 1555 1560
Arg Lys Gln Ala Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn
1565 1570 1575
Leu His Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu
1580 1585 1590
Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys
1595 1600 1605
Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly
1610 1615 1620
Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys
1625 1630 1635
Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His
1640 1645 1650
Val Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu
1655 1660 1665
Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp
1670 1675 1680
Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His
1685 1690 1695
Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser
1700 1705 1710
Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys
1715 1720 1725
Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp
1730 1735 1740
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn
1745 1750 1755
Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg
1760 1765 1770
Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala
1775 1780 1785
Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro
1790 1795 1800
Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp
1805 1810 1815
Arg Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys
1820 1825 1830
Val Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly
1835 1840 1845
Arg Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile
1850 1855 1860
Ser Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe
1865 1870 1875
Lys Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu
1880 1885 1890
Gly Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly
1895 1900 1905
Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg
1910 1915 1920
Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala
1925 1930 1935
Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp
1940 1945 1950
Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys His
1955 1960 1965
Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
1970 1975 1980
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser
1985 1990 1995
Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr
2000 2005 2010
Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val
2015 2020 2025
Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg
2030 2035 2040
Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr
2045 2050 2055
Val Leu Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn
2060 2065 2070
Phe Trp Pro Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser
2075 2080 2085
His Asp Asp Thr His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu
2090 2095 2100
Ala Glu Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile
2105 2110 2115
Ser Pro Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile Gln His
2120 2125 2130
Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro Arg
2135 2140 2145
Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly
2150 2155 2160
Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn
2165 2170 2175
Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys
2180 2185 2190
Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr Ser
2195 2200 2205
Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu
2210 2215 2220
Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu
2225 2230 2235
Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu Arg
2240 2245 2250
Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr
2255 2260 2265
Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser
2270 2275 2280
Gln Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser
2285 2290 2295
Met Gly Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr
2300 2305 2310
Gly Leu Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser
2315 2320 2325
Ser Arg Gly Arg Asn Thr Pro Gly Lys Pro Met Arg Glu Asp Thr
2330 2335 2340
Met
<210> 14
<211> 9914
<212> DNA
<213> Homo sapiens
<400> 14
taatgagatc aggaggaaca ttcgacctga gaaagacaga ttgcaatgac tgagatgatt 60
ttgctaattt tttttccagc ctatttcctt aatgtacgtg atattgtgat tgattttcat 120
gcagagatcc ctgatcctat agttttgttt gctatttatt tttctccttc acattttttt 180
tctatcaaca gagctgaatg agtgccagga agctgcgaaa tctgtcttac aaaaaggctg 240
taaggaggca aaagttgctt gaacagagca tccagtctgc ccaggagact gaaaaatcct 300
tacacttaat ccaggagtcc ctcacattca ttgacaagca gttggcagct tatattgcag 360
acaaggtgga cgcagctcaa atgcctcagg aagcccagaa aatccaatct gatttgacaa 420
gtcatgagat cagtttagaa gaaatgaaga aacataatca ggggaaggag gctgcccaaa 480
gagtcctgtc tcagattgat gttgcacaga aaaaattaca agatgtctcc atgaagtttc 540
gattattcca gaaaccagcc aattttgagc agcgtctaca agaaagtaag atgattttag 600
atgaagtgaa gatgcacttg cctgcattgg aaacaaagag tgtggaacag gaagtagtac 660
agtcacagct aaatcattgt gtgaacttgt ataaaagtct gagtgaagtg aagtctgaag 720
tggaaatggt gataaagact ggacgtcaga ttgtacagaa aaagcagacg gaaaatccca 780
aagaacttga tgaaagagta acagctttga aattgcatta taatgagctg ggagcaaagg 840
taacagaaag aaagcaacag ttggagaaat gcttgaaatt gtcccgtaag atgcgaaagg 900
aaatgaatgt cttgacagaa tggctggcag ctacagatat ggaattgaca aagagatcag 960
cagttgaagg aatgcctagt aatttggatt ctgaagttgc ctggggaaag gctactcaaa 1020
aagagattga gaaacagaag gtgcacctga agagtatcac agaggtagga gaggccttga 1080
aaacagtttt gggcaagaag gagacgttgg tggaagataa actcagtctt ctgaatagta 1140
actggatagc tgtcacctcc cgagcagaag agtggttaaa tcttttgttg gaataccaga 1200
aacacatgga aacttttgac cagaatgtgg accacatcac aaagtggatc attcaggctg 1260
acacactttt ggatgaatca gagaaaaaga aaccccagca aaaagaagac gtgcttaagc 1320
gtttaaaggc agaactgaat gacatacgcc caaaggtgga ctctacacgt gaccaagcag 1380
caaacttgat ggcaaaccgc ggtgaccact gcaggaaatt agtagagccc caaatctcag 1440
agctcaacca tcgatttgca gccatttcac acagaattaa gactggaaag gcctccattc 1500
ctttgaagga attggagcag tttaactcag atatacaaaa attgcttgaa ccactggagg 1560
ctgaaattca gcagggggtg aatctgaaag aggaagactt caataaagat atgaatgaag 1620
acaatgaggg tactgtaaaa gaattgttgc aaagaggaga caacttacaa caaagaatca 1680
cagatgagag aaagcgagag gaaataaaga taaaacagca gctgttacag acaaaacata 1740
atgctctcaa ggatttgagg tctcaaagaa gaaaaaaggc tctagaaatt tctcatcagt 1800
ggtatcagta caagaggcag gctgatgatc tcctgaaatg cttggatgac attgaaaaaa 1860
aattagccag cctacctgag cccagagatg aaaggaaaat aaaggaaatt gatcgggaat 1920
tgcagaagaa gaaagaggag ctgaatgcag tgcgtaggca agctgagggc ttgtctgagg 1980
atggggccgc aatggcagtg gagccaactc agatccagct cagcaagcgc tggcgggaaa 2040
ttgagagcaa atttgctcag tttcgaagac tcaactttgc acaaattcac actgtccgtg 2100
aagaaacgat gatggtgatg actgaagaca tgcctttgga aatttcttat gtgccttcta 2160
cttatttgac tgaaatcact catgtctcac aagccctatt agaagtggaa caacttctca 2220
atgctcctga cctctgtgct aaggactttg aagatctctt taagcaagag gagtctctga 2280
agaatataaa agatagtcta caacaaagct caggtcggat tgacattatt catagcaaga 2340
agacagcagc attgcaaagt gcaacgcctg tggaaagggt gaagctacag gaagctctct 2400
cccagcttga tttccaatgg gaaaaagtta acaaaatgta caaggaccga caagggcgat 2460
ttgacagatc tgttgagaaa tggcggcgtt ttcattatga tataaagata tttaatcagt 2520
ggctaacaga agctgaacag tttctcagaa agacacaaat tcctgagaat tgggaacatg 2580
ctaaatacaa atggtatctt aaggaactcc aggatggcat tgggcagcgg caaactgttg 2640
tcagaacatt gaatgcaact ggggaagaaa taattcagca atcctcaaaa acagatgcca 2700
gtattctaca ggaaaaattg ggaagcctga atctgcggtg gcaggaggtc tgcaaacagc 2760
tgtcagacag aaaaaagagg ctagaagaac aaaagaatat cttgtcagaa tttcaaagag 2820
atttaaatga atttgtttta tggttggagg aagcagataa cattgctagt atcccacttg 2880
aacctggaaa agagcagcaa ctaaaagaaa agcttgagca agtcaagtta ctggtggaag 2940
agttgcccct gcgccaggga attctcaaac aattaaatga aactggagga cccgtgcttg 3000
taagtgctcc cataagccca gaagagcaag ataaacttga aaataagctc aagcagacaa 3060
atctccagtg gataaaggtt tccagagctt tacctgagaa acaaggagaa attgaagctc 3120
aaataaaaga ccttgggcag cttgaaaaaa agcttgaaga ccttgaagag cagttaaatc 3180
atctgctgct gtggttatct cctattagga atcagttgga aatttataac caaccaaacc 3240
aagaaggacc atttgacgtt caggaaactg aaatagcagt tcaagctaaa caaccggatg 3300
tggaagagat tttgtctaaa gggcagcatt tgtacaagga aaaaccagcc actcagccag 3360
tgaagaggaa gttagaagat ctgagctctg agtggaaggc ggtaaaccgt ttacttcaag 3420
agctgagggc aaagcagcct gacctagctc ctggactgac cactattgga gcctctccta 3480
ctcagactgt tactctggtg acacaacctg tggttactaa ggaaactgcc atctccaaac 3540
tagaaatgcc atcttccttg atgttggagg tacctgctct ggcagatttc aaccgggctt 3600
ggacagaact taccgactgg ctttctctgc ttgatcaagt tataaaatca cagagggtga 3660
tggtgggtga ccttgaggat atcaacgaga tgatcatcaa gcagaaggca acaatgcagg 3720
atttggaaca gaggcgtccc cagttggaag aactcattac cgctgcccaa aatttgaaaa 3780
acaagaccag caatcaagag gctagaacaa tcattacgga tcgaattgaa agaattcaga 3840
atcagtggga tgaagtacaa gaacaccttc agaaccggag gcaacagttg aatgaaatgt 3900
taaaggattc aacacaatgg ctggaagcta aggaagaagc tgagcaggtc ttaggacagg 3960
ccagagccaa gcttgagtca tggaaggagg gtccctatac agtagatgca atccaaaaga 4020
aaatcacaga aaccaagcag ttggccaaag acctccgcca gtggcagaca aatgtagatg 4080
tggcaaatga cttggccctg aaacttctcc gggattattc tgcagatgat accagaaaag 4140
tccacatgat aacagagaat atcaatgcct cttggagaag cattcataaa agggtgagtg 4200
agcgagaggc tgctttggaa gaaactcata gattactgca acagttcccc ctggacctgg 4260
aaaagtttct tgcctggctt acagaagctg aaacaactgc caatgtccta caggatgcta 4320
cccgtaagga aaggctccta gaagactcca agggagtaaa agagctgatg aaacaatggc 4380
aagacctcca aggtgaaatt gaagctcaca cagatgttta tcacaacctg gatgaaaaca 4440
gccaaaaaat cctgagatcc ctggaaggtt ccgatgatgc agtcctgtta caaagacgtt 4500
tggataacat gaacttcaag tggagtgaac ttcggaaaaa gtctctcaac attaggtccc 4560
atttggaagc cagttctgac cagtggaagc gtctgcacct ttctctgcag gaacttctgg 4620
tgtggctaca gctgaaagat gatgaattaa gccggcaggc acctattgga ggcgactttc 4680
cagcagttca gaagcagaac gatgtacata gggccttcaa gagggaattg aaaactaaag 4740
aacctgtaat catgagtact cttgagactg tacgaatatt tctgacagag cagcctttgg 4800
aaggactaga gaaactctac caggagccca gagagctgcc tcctgaggag agagcccaga 4860
atgtcactcg gcttctacga aagcaggctg aggaggtcaa tactgagtgg gaaaaattga 4920
acctgcactc cgctgactgg cagagaaaaa tagatgagac ccttgaaaga ctccaggaac 4980
ttcaagaggc cacggatgag ctggacctca agctgcgcca agctgaggtg atcaagggat 5040
cctggcagcc cgtgggcgat ctcctcattg actctctcca agatcacctc gagaaagtca 5100
aggcacttcg aggagaaatt gcgcctctga aagagaacgt gagccacgtc aatgaccttg 5160
ctcgccagct taccactttg ggcattcagc tctcaccgta taacctcagc actctggaag 5220
acctgaacac cagatggaag cttctgcagg tggccgtcga ggaccgagtc aggcagctgc 5280
atgaagccca cagggacttt ggtccagcat ctcagcactt tctttccacg tctgtccagg 5340
gtccctggga gagagccatc tcgccaaaca aagtgcccta ctatatcaac cacgagactc 5400
aaacaacttg ctgggaccat cccaaaatga cagagctcta ccagtcttta gctgacctga 5460
ataatgtcag attctcagct tataggactg ccatgaaact ccgaagactg cagaaggccc 5520
tttgcttgga tctcttgagc ctgtcagctg catgtgatgc cttggaccag cacaacctca 5580
agcaaaatga ccagcccatg gatatcctgc agattattaa ttgtttgacc actatttatg 5640
accgcctgga gcaagagcac aacaatttgg tcaacgtccc tctctgcgtg gatatgtgtc 5700
tgaactggct gctgaatgtt tatgatacgg gacgaacagg gaggatccgt gtcctgtctt 5760
ttaaaactgg catcatttcc ctgtgtaaag cacatttgga agacaagtac agataccttt 5820
tcaagcaagt ggcaagttca acaggatttt gtgaccagcg caggctgggc ctccttctgc 5880
atgattctat ccaaattcca agacagttgg gtgaagttgc atcctttggg ggcagtaaca 5940
ttgagccaag tgtccggagc tgcttccaat ttgctaataa taagccagag atcgaagcgg 6000
ccctcttcct agactggatg agactggaac cccagtccat ggtgtggctg cccgtcctgc 6060
acagagtggc tgctgcagaa actgccaagc atcaggccaa atgtaacatc tgcaaagagt 6120
gtccaatcat tggattcagg tacaggagtc taaagcactt taattatgac atctgccaaa 6180
gctgcttttt ttctggtcga gttgcaaaag gccataaaat gcactatccc atggtggaat 6240
attgcactcc gactacatca ggagaagatg ttcgagactt tgccaaggta ctaaaaaaca 6300
aatttcgaac caaaaggtat tttgcgaagc atccccgaat gggctacctg ccagtgcaga 6360
ctgtcttaga gggggacaac atggaaactc ccgttactct gatcaacttc tggccagtag 6420
attctgcgcc tgcctcgtcc cctcagcttt cacacgatga tactcattca cgcattgaac 6480
attatgctag caggctagca gaaatggaaa acagcaatgg atcttatcta aatgatagca 6540
tctctcctaa tgagagcata gatgatgaac atttgttaat ccagcattac tgccaaagtt 6600
tgaaccagga ctcccccctg agccagcctc gtagtcctgc ccagatcttg atttccttag 6660
agagtgagga aagaggggag ctagagagaa tcctagcaga tcttgaggaa gaaaacagga 6720
atctgcaagc agaatatgac cgtctaaagc agcagcacga acataaaggc ctgtccccac 6780
tgccgtcccc tcctgaaatg atgcccacct ctccccagag tccccgggat gctgagctca 6840
ttgctgaggc caagctactg cgtcaacaca aaggccgcct ggaagccagg atgcaaatcc 6900
tggaagacca caataaacag ctggagtcac agttacacag gctaaggcag ctgctggagc 6960
aaccccaggc agaggccaaa gtgaatggca caacggtgtc ctctccttct acctctctac 7020
agaggtccga cagcagtcag cctatgctgc tccgagtggt tggcagtcaa acttcggact 7080
ccatgggtga ggaagatctt ctcagtcctc cccaggacac aagcacaggg ttagaggagg 7140
tgatggagca actcaacaac tccttcccta gttcaagagg aagaaatacc cctggaaagc 7200
caatgagaga ggacacaatg taggaagtct tttccacatg gcagatgatt tgggcagagc 7260
gatggagtcc ttagtatcag tcatgacaga tgaagaagga gcagaataaa tgttttacaa 7320
ctcctgattc ccgcatggtt tttataatat tcatacaaca aagaggatta gacagtaaga 7380
gtttacaaga aataaatcta tatttttgtg aagggtagtg gtattatact gtagatttca 7440
gtagtttcta agtctgttat tgttttgtta acaatggcag gttttacacg tctatgcaat 7500
tgtacaaaaa agttataaga aaactacatg taaaatcttg atagctaaat aacttgccat 7560
ttctttatat ggaacgcatt ttgggttgtt taaaaattta taacagttat aaagaaagat 7620
tgtaaactaa agtgtgcttt ataaaaaaaa gttgtttata aaaaccccta aaaacaaaac 7680
aaacacacac acacacacat acacacacac acacaaaact ttgaggcagc gcattgtttt 7740
gcatcctttt ggcgtgatat ccatatgaaa ttcatggctt tttctttttt tgcatattaa 7800
agataagact tcctctacca ccacaccaaa tgactactac acactgctca tttgagaact 7860
gtcagctgag tggggcaggc ttgagttttc atttcatata tctatatgtc tataagtata 7920
taaatactat agttatatag ataaagagat acgaatttct atagactgac tttttccatt 7980
ttttaaatgt tcatgtcaca tcctaataga aagaaattac ttctagtcag tcatccaggc 8040
ttacctgctt ggtctagaat ggatttttcc cggagccgga agccaggagg aaactacacc 8100
acactaaaac attgtctaca gctccagatg tttctcattt taaacaactt tccactgaca 8160
acgaaagtaa agtaaagtat tggatttttt taaagggaac atgtgaatga atacacagga 8220
cttattatat cagagtgagt aatcggttgg ttggttgatt gattgattga ttgatacatt 8280
cagcttcctg ctgctagcaa tgccacgatt tagatttaat gatgcttcag tggaaatcaa 8340
tcagaaggta ttctgacctt gtgaacatca gaaggtattt tttaactccc aagcagtagc 8400
aggacgatga tagggctgga gggctatgga ttcccagccc atccctgtga aggagtaggc 8460
cactctttaa gtgaaggatt ggatgattgt tcataataca taaagttctc tgtaattaca 8520
actaaattat tatgccctct tctcacagtc aaaaggaact gggtggtttg gtttttgttg 8580
cttttttaga tttattgtcc catgtgggat gagtttttaa atgccacaag acataattta 8640
aaataaataa actttgggaa aaggtgtaaa acagtagccc catcacattt gtgatactga 8700
caggtatcaa cccagaagcc catgaactgt gtttccatcc tttgcatttc tctgcgagta 8760
gttccacaca ggtttgtaag taagtaagaa agaaggcaaa ttgattcaaa tgttacaaaa 8820
aaacccttct tggtggatta gacaggttaa atatataaac aaacaaacaa aaattgctca 8880
aaaaagagga gaaaagctca agaggaaaag ctaaggactg gtaggaaaaa gctttactct 8940
ttcatgccat tttatttctt tttgattttt aaatcattca ttcaatagat accaccgtgt 9000
gacctataat tttgcaaatc tgttacctct gacatcaagt gtaattagct tttggagagt 9060
gggctgacat caagtgtaat tagcttttgg agagtgggtt ttgtccatta ttaataatta 9120
attaattaac atcaaacacg gcttctcatg ctatttctac ctcactttgg ttttggggtg 9180
ttcctgataa ttgtgcacac ctgagttcac agcttcacca cttgtccatt gcgttatttt 9240
ctttttcctt tataattctt tctttttcct tcataatttt caaaagaaaa cccaaagctc 9300
taaggtaaca aattaccaaa ttacatgaag atttggtttt tgtcttgcat ttttttcctt 9360
tatgtgacgc tggacctttt ctttacccaa ggatttttaa aactcagatt taaaacaagg 9420
ggttacttta catcctacta agaagtttaa gtaagtaagt ttcattctaa aatcagaggt 9480
aaatagagtg cataaataat tttgttttaa tctttttgtt tttcttttag acacattagc 9540
tctggagtga gtctgtcata atatttgaac aaaaattgag agctttattg ctgcatttta 9600
agcataatta atttggacat tatttcgtgt tgtgttcttt ataaccacca agtattaaac 9660
tgtaaatcat aatgtaactg aagcataaac atcacatggc atgttttgtc attgttttca 9720
ggtactgagt tcttacttga gtatcataat atattgtgtt ttaacaccaa cactgtaaca 9780
tttacgaatt atttttttaa acttcagttt tactgcattt tcacaacata tcagacttca 9840
ccaaatatat gccttactat tgtattatag tactgcttta ctgtgtatct caataaagca 9900
cgcagttatg ttac 9914
<210> 15
<211> 2341
<212> PRT
<213> Homo sapiens
<400> 15
Met Ser Ala Arg Lys Leu Arg Asn Leu Ser Tyr Lys Lys Ala Val Arg
1 5 10 15
Arg Gln Lys Leu Leu Glu Gln Ser Ile Gln Ser Ala Gln Glu Thr Glu
20 25 30
Lys Ser Leu His Leu Ile Gln Glu Ser Leu Thr Phe Ile Asp Lys Gln
35 40 45
Leu Ala Ala Tyr Ile Ala Asp Lys Val Asp Ala Ala Gln Met Pro Gln
50 55 60
Glu Ala Gln Lys Ile Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu
65 70 75 80
Glu Glu Met Lys Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val
85 90 95
Leu Ser Gln Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met
100 105 110
Lys Phe Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln
115 120 125
Glu Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
130 135 140
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn His
145 150 155 160
Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu Val Glu
165 170 175
Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys Gln Thr Glu
180 185 190
Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu Lys Leu His Tyr
195 200 205
Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys Gln Gln Leu Glu Lys
210 215 220
Cys Leu Lys Leu Ser Arg Lys Met Arg Lys Glu Met Asn Val Leu Thr
225 230 235 240
Glu Trp Leu Ala Ala Thr Asp Met Glu Leu Thr Lys Arg Ser Ala Val
245 250 255
Glu Gly Met Pro Ser Asn Leu Asp Ser Glu Val Ala Trp Gly Lys Ala
260 265 270
Thr Gln Lys Glu Ile Glu Lys Gln Lys Val His Leu Lys Ser Ile Thr
275 280 285
Glu Val Gly Glu Ala Leu Lys Thr Val Leu Gly Lys Lys Glu Thr Leu
290 295 300
Val Glu Asp Lys Leu Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr
305 310 315 320
Ser Arg Ala Glu Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His
325 330 335
Met Glu Thr Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile
340 345 350
Gln Ala Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln
355 360 365
Lys Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
370 375 380
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala Asn
385 390 395 400
Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser Glu Leu
405 410 415
Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr Gly Lys Ala
420 425 430
Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser Asp Ile Gln Lys
435 440 445
Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln Gly Val Asn Leu Lys
450 455 460
Glu Glu Asp Phe Asn Lys Asp Met Asn Glu Asp Asn Glu Gly Thr Val
465 470 475 480
Lys Glu Leu Leu Gln Arg Gly Asp Asn Leu Gln Gln Arg Ile Thr Asp
485 490 495
Glu Arg Lys Arg Glu Glu Ile Lys Ile Lys Gln Gln Leu Leu Gln Thr
500 505 510
Lys His Asn Ala Leu Lys Asp Leu Arg Ser Gln Arg Arg Lys Lys Ala
515 520 525
Leu Glu Ile Ser His Gln Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp
530 535 540
Leu Leu Lys Cys Leu Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro
545 550 555 560
Glu Pro Arg Asp Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln
565 570 575
Lys Lys Lys Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu
580 585 590
Ser Glu Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu
595 600 605
Ser Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
610 615 620
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val
625 630 635 640
Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr
645 650 655
Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln
660 665 670
Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe
675 680 685
Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser
690 695 700
Ser Gly Arg Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln
705 710 715 720
Ser Ala Thr Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln
725 730 735
Leu Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln
740 745 750
Gly Arg Phe Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp
755 760 765
Ile Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg
770 775 780
Lys Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr
785 790 795 800
Leu Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg
805 810 815
Thr Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr
820 825 830
Asp Ala Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp
835 840 845
Gln Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
850 855 860
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe Val
865 870 875 880
Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu Glu Pro
885 890 895
Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val Lys Leu Leu
900 905 910
Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys Gln Leu Asn Glu
915 920 925
Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile Ser Pro Glu Glu Gln
930 935 940
Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr Asn Leu Gln Trp Ile Lys
945 950 955 960
Val Ser Arg Ala Leu Pro Glu Lys Gln Gly Glu Ile Glu Ala Gln Ile
965 970 975
Lys Asp Leu Gly Gln Leu Glu Lys Lys Leu Glu Asp Leu Glu Glu Gln
980 985 990
Leu Asn His Leu Leu Leu Trp Leu Ser Pro Ile Arg Asn Gln Leu Glu
995 1000 1005
Ile Tyr Asn Gln Pro Asn Gln Glu Gly Pro Phe Asp Val Gln Glu
1010 1015 1020
Thr Glu Ile Ala Val Gln Ala Lys Gln Pro Asp Val Glu Glu Ile
1025 1030 1035
Leu Ser Lys Gly Gln His Leu Tyr Lys Glu Lys Pro Ala Thr Gln
1040 1045 1050
Pro Val Lys Arg Lys Leu Glu Asp Leu Ser Ser Glu Trp Lys Ala
1055 1060 1065
Val Asn Arg Leu Leu Gln Glu Leu Arg Ala Lys Gln Pro Asp Leu
1070 1075 1080
Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val
1085 1090 1095
Thr Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser
1100 1105 1110
Lys Leu Glu Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala Leu
1115 1120 1125
Ala Asp Phe Asn Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu Ser
1130 1135 1140
Leu Leu Asp Gln Val Ile Lys Ser Gln Arg Val Met Val Gly Asp
1145 1150 1155
Leu Glu Asp Ile Asn Glu Met Ile Ile Lys Gln Lys Ala Thr Met
1160 1165 1170
Gln Asp Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu Leu Ile Thr
1175 1180 1185
Ala Ala Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln Glu Ala Arg
1190 1195 1200
Thr Ile Ile Thr Asp Arg Ile Glu Arg Ile Gln Asn Gln Trp Asp
1205 1210 1215
Glu Val Gln Glu His Leu Gln Asn Arg Arg Gln Gln Leu Asn Glu
1220 1225 1230
Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala Lys Glu Glu Ala
1235 1240 1245
Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu Ser Trp Lys
1250 1255 1260
Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile Thr Glu
1265 1270 1275
Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn Val
1280 1285 1290
Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser
1295 1300 1305
Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile Asn
1310 1315 1320
Ala Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu Ala
1325 1330 1335
Ala Leu Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu Asp
1340 1345 1350
Leu Glu Lys Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr Ala
1355 1360 1365
Asn Val Leu Gln Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu Asp
1370 1375 1380
Ser Lys Gly Val Lys Glu Leu Met Lys Gln Trp Gln Asp Leu Gln
1385 1390 1395
Gly Glu Ile Glu Ala His Thr Asp Val Tyr His Asn Leu Asp Glu
1400 1405 1410
Asn Ser Gln Lys Ile Leu Arg Ser Leu Glu Gly Ser Asp Asp Ala
1415 1420 1425
Val Leu Leu Gln Arg Arg Leu Asp Asn Met Asn Phe Lys Trp Ser
1430 1435 1440
Glu Leu Arg Lys Lys Ser Leu Asn Ile Arg Ser His Leu Glu Ala
1445 1450 1455
Ser Ser Asp Gln Trp Lys Arg Leu His Leu Ser Leu Gln Glu Leu
1460 1465 1470
Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser Arg Gln Ala
1475 1480 1485
Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln Asn Asp Val
1490 1495 1500
His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro Val Ile
1505 1510 1515
Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln Pro
1520 1525 1530
Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro
1535 1540 1545
Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln
1550 1555 1560
Ala Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser
1565 1570 1575
Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln
1580 1585 1590
Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln
1595 1600 1605
Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu
1610 1615 1620
Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg
1625 1630 1635
Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp
1640 1645 1650
Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr
1655 1660 1665
Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu
1670 1675 1680
Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His
1685 1690 1695
Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val
1700 1705 1710
Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr
1715 1720 1725
Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys
1730 1735 1740
Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg
1745 1750 1755
Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln Lys
1760 1765 1770
Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
1775 1780 1785
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile
1790 1795 1800
Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu
1805 1810 1815
Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met
1820 1825 1830
Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly
1835 1840 1845
Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys
1850 1855 1860
Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val
1865 1870 1875
Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu
1880 1885 1890
Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala
1895 1900 1905
Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe
1910 1915 1920
Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu
1925 1930 1935
Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro Val
1940 1945 1950
Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala Lys
1955 1960 1965
Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg
1970 1975 1980
Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe
1985 1990 1995
Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met Val
2000 2005 2010
Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
2015 2020 2025
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala
2030 2035 2040
Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu
2045 2050 2055
Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro
2060 2065 2070
Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp
2075 2080 2085
Thr His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met
2090 2095 2100
Glu Asn Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn
2105 2110 2115
Glu Ser Ile Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln
2120 2125 2130
Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala
2135 2140 2145
Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu
2150 2155 2160
Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln Ala
2165 2170 2175
Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys Gly Leu Ser
2180 2185 2190
Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr Ser Pro Gln Ser
2195 2200 2205
Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg Gln
2210 2215 2220
His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu Asp His
2225 2230 2235
Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln Leu Leu
2240 2245 2250
Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser
2255 2260 2265
Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met
2270 2275 2280
Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly Glu
2285 2290 2295
Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu
2300 2305 2310
Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly
2315 2320 2325
Arg Asn Thr Pro Gly Lys Pro Met Arg Glu Asp Thr Met
2330 2335 2340
<210> 16
<211> 7410
<212> DNA
<213> Homo sapiens
<400> 16
acactagcaa tggcaaagct ttgtgcggag gcattgctgg ctgctctgaa ctaaaagcat 60
ccgtggggac cgaaagaggt ttttgcacac cttattaagg aactccagga tggcattggg 120
cagcggcaaa ctgttgtcag aacattgaat gcaactgggg aagaaataat tcagcaatcc 180
tcaaaaacag atgccagtat tctacaggaa aaattgggaa gcctgaatct gcggtggcag 240
gaggtctgca aacagctgtc agacagaaaa aagaggctag aagaacaaaa gaatatcttg 300
tcagaatttc aaagagattt aaatgaattt gttttatggt tggaggaagc agataacatt 360
gctagtatcc cacttgaacc tggaaaagag cagcaactaa aagaaaagct tgagcaagtc 420
aagttactgg tggaagagtt gcccctgcgc cagggaattc tcaaacaatt aaatgaaact 480
ggaggacccg tgcttgtaag tgctcccata agcccagaag agcaagataa acttgaaaat 540
aagctcaagc agacaaatct ccagtggata aaggtttcca gagctttacc tgagaaacaa 600
ggagaaattg aagctcaaat aaaagacctt gggcagcttg aaaaaaagct tgaagacctt 660
gaagagcagt taaatcatct gctgctgtgg ttatctccta ttaggaatca gttggaaatt 720
tataaccaac caaaccaaga aggaccattt gacgttcagg aaactgaaat agcagttcaa 780
gctaaacaac cggatgtgga agagattttg tctaaagggc agcatttgta caaggaaaaa 840
ccagccactc agccagtgaa gaggaagtta gaagatctga gctctgagtg gaaggcggta 900
aaccgtttac ttcaagagct gagggcaaag cagcctgacc tagctcctgg actgaccact 960
attggagcct ctcctactca gactgttact ctggtgacac aacctgtggt tactaaggaa 1020
actgccatct ccaaactaga aatgccatct tccttgatgt tggaggtacc tgctctggca 1080
gatttcaacc gggcttggac agaacttacc gactggcttt ctctgcttga tcaagttata 1140
aaatcacaga gggtgatggt gggtgacctt gaggatatca acgagatgat catcaagcag 1200
aaggcaacaa tgcaggattt ggaacagagg cgtccccagt tggaagaact cattaccgct 1260
gcccaaaatt tgaaaaacaa gaccagcaat caagaggcta gaacaatcat tacggatcga 1320
attgaaagaa ttcagaatca gtgggatgaa gtacaagaac accttcagaa ccggaggcaa 1380
cagttgaatg aaatgttaaa ggattcaaca caatggctgg aagctaagga agaagctgag 1440
caggtcttag gacaggccag agccaagctt gagtcatgga aggagggtcc ctatacagta 1500
gatgcaatcc aaaagaaaat cacagaaacc aagcagttgg ccaaagacct ccgccagtgg 1560
cagacaaatg tagatgtggc aaatgacttg gccctgaaac ttctccggga ttattctgca 1620
gatgatacca gaaaagtcca catgataaca gagaatatca atgcctcttg gagaagcatt 1680
cataaaaggg tgagtgagcg agaggctgct ttggaagaaa ctcatagatt actgcaacag 1740
ttccccctgg acctggaaaa gtttcttgcc tggcttacag aagctgaaac aactgccaat 1800
gtcctacagg atgctacccg taaggaaagg ctcctagaag actccaaggg agtaaaagag 1860
ctgatgaaac aatggcaaga cctccaaggt gaaattgaag ctcacacaga tgtttatcac 1920
aacctggatg aaaacagcca aaaaatcctg agatccctgg aaggttccga tgatgcagtc 1980
ctgttacaaa gacgtttgga taacatgaac ttcaagtgga gtgaacttcg gaaaaagtct 2040
ctcaacatta ggtcccattt ggaagccagt tctgaccagt ggaagcgtct gcacctttct 2100
ctgcaggaac ttctggtgtg gctacagctg aaagatgatg aattaagccg gcaggcacct 2160
attggaggcg actttccagc agttcagaag cagaacgatg tacatagggc cttcaagagg 2220
gaattgaaaa ctaaagaacc tgtaatcatg agtactcttg agactgtacg aatatttctg 2280
acagagcagc ctttggaagg actagagaaa ctctaccagg agcccagaga gctgcctcct 2340
gaggagagag cccagaatgt cactcggctt ctacgaaagc aggctgagga ggtcaatact 2400
gagtgggaaa aattgaacct gcactccgct gactggcaga gaaaaataga tgagaccctt 2460
gaaagactcc aggaacttca agaggccacg gatgagctgg acctcaagct gcgccaagct 2520
gaggtgatca agggatcctg gcagcccgtg ggcgatctcc tcattgactc tctccaagat 2580
cacctcgaga aagtcaaggc acttcgagga gaaattgcgc ctctgaaaga gaacgtgagc 2640
cacgtcaatg accttgctcg ccagcttacc actttgggca ttcagctctc accgtataac 2700
ctcagcactc tggaagacct gaacaccaga tggaagcttc tgcaggtggc cgtcgaggac 2760
cgagtcaggc agctgcatga agcccacagg gactttggtc cagcatctca gcactttctt 2820
tccacgtctg tccagggtcc ctgggagaga gccatctcgc caaacaaagt gccctactat 2880
atcaaccacg agactcaaac aacttgctgg gaccatccca aaatgacaga gctctaccag 2940
tctttagctg acctgaataa tgtcagattc tcagcttata ggactgccat gaaactccga 3000
agactgcaga aggccctttg cttggatctc ttgagcctgt cagctgcatg tgatgccttg 3060
gaccagcaca acctcaagca aaatgaccag cccatggata tcctgcagat tattaattgt 3120
ttgaccacta tttatgaccg cctggagcaa gagcacaaca atttggtcaa cgtccctctc 3180
tgcgtggata tgtgtctgaa ctggctgctg aatgtttatg atacgggacg aacagggagg 3240
atccgtgtcc tgtcttttaa aactggcatc atttccctgt gtaaagcaca tttggaagac 3300
aagtacagat accttttcaa gcaagtggca agttcaacag gattttgtga ccagcgcagg 3360
ctgggcctcc ttctgcatga ttctatccaa attccaagac agttgggtga agttgcatcc 3420
tttgggggca gtaacattga gccaagtgtc cggagctgct tccaatttgc taataataag 3480
ccagagatcg aagcggccct cttcctagac tggatgagac tggaacccca gtccatggtg 3540
tggctgcccg tcctgcacag agtggctgct gcagaaactg ccaagcatca ggccaaatgt 3600
aacatctgca aagagtgtcc aatcattgga ttcaggtaca ggagtctaaa gcactttaat 3660
tatgacatct gccaaagctg ctttttttct ggtcgagttg caaaaggcca taaaatgcac 3720
tatcccatgg tggaatattg cactccgact acatcaggag aagatgttcg agactttgcc 3780
aaggtactaa aaaacaaatt tcgaaccaaa aggtattttg cgaagcatcc ccgaatgggc 3840
tacctgccag tgcagactgt cttagagggg gacaacatgg aaactcccgt tactctgatc 3900
aacttctggc cagtagattc tgcgcctgcc tcgtcccctc agctttcaca cgatgatact 3960
cattcacgca ttgaacatta tgctagcagg ctagcagaaa tggaaaacag caatggatct 4020
tatctaaatg atagcatctc tcctaatgag agcatagatg atgaacattt gttaatccag 4080
cattactgcc aaagtttgaa ccaggactcc cccctgagcc agcctcgtag tcctgcccag 4140
atcttgattt ccttagagag tgaggaaaga ggggagctag agagaatcct agcagatctt 4200
gaggaagaaa acaggaatct gcaagcagaa tatgaccgtc taaagcagca gcacgaacat 4260
aaaggcctgt ccccactgcc gtcccctcct gaaatgatgc ccacctctcc ccagagtccc 4320
cgggatgctg agctcattgc tgaggccaag ctactgcgtc aacacaaagg ccgcctggaa 4380
gccaggatgc aaatcctgga agaccacaat aaacagctgg agtcacagtt acacaggcta 4440
aggcagctgc tggagcaacc ccaggcagag gccaaagtga atggcacaac ggtgtcctct 4500
ccttctacct ctctacagag gtccgacagc agtcagccta tgctgctccg agtggttggc 4560
agtcaaactt cggactccat gggtgaggaa gatcttctca gtcctcccca ggacacaagc 4620
acagggttag aggaggtgat ggagcaactc aacaactcct tccctagttc aagaggaaga 4680
aatacccctg gaaagccaat gagagaggac acaatgtagg aagtcttttc cacatggcag 4740
atgatttggg cagagcgatg gagtccttag tatcagtcat gacagatgaa gaaggagcag 4800
aataaatgtt ttacaactcc tgattcccgc atggttttta taatattcat acaacaaaga 4860
ggattagaca gtaagagttt acaagaaata aatctatatt tttgtgaagg gtagtggtat 4920
tatactgtag atttcagtag tttctaagtc tgttattgtt ttgttaacaa tggcaggttt 4980
tacacgtcta tgcaattgta caaaaaagtt ataagaaaac tacatgtaaa atcttgatag 5040
ctaaataact tgccatttct ttatatggaa cgcattttgg gttgtttaaa aatttataac 5100
agttataaag aaagattgta aactaaagtg tgctttataa aaaaaagttg tttataaaaa 5160
cccctaaaaa caaaacaaac acacacacac acacatacac acacacacac aaaactttga 5220
ggcagcgcat tgttttgcat ccttttggcg tgatatccat atgaaattca tggctttttc 5280
tttttttgca tattaaagat aagacttcct ctaccaccac accaaatgac tactacacac 5340
tgctcatttg agaactgtca gctgagtggg gcaggcttga gttttcattt catatatcta 5400
tatgtctata agtatataaa tactatagtt atatagataa agagatacga atttctatag 5460
actgactttt tccatttttt aaatgttcat gtcacatcct aatagaaaga aattacttct 5520
agtcagtcat ccaggcttac ctgcttggtc tagaatggat ttttcccgga gccggaagcc 5580
aggaggaaac tacaccacac taaaacattg tctacagctc cagatgtttc tcattttaaa 5640
caactttcca ctgacaacga aagtaaagta aagtattgga tttttttaaa gggaacatgt 5700
gaatgaatac acaggactta ttatatcaga gtgagtaatc ggttggttgg ttgattgatt 5760
gattgattga tacattcagc ttcctgctgc tagcaatgcc acgatttaga tttaatgatg 5820
cttcagtgga aatcaatcag aaggtattct gaccttgtga acatcagaag gtatttttta 5880
actcccaagc agtagcagga cgatgatagg gctggagggc tatggattcc cagcccatcc 5940
ctgtgaagga gtaggccact ctttaagtga aggattggat gattgttcat aatacataaa 6000
gttctctgta attacaacta aattattatg ccctcttctc acagtcaaaa ggaactgggt 6060
ggtttggttt ttgttgcttt tttagattta ttgtcccatg tgggatgagt ttttaaatgc 6120
cacaagacat aatttaaaat aaataaactt tgggaaaagg tgtaaaacag tagccccatc 6180
acatttgtga tactgacagg tatcaaccca gaagcccatg aactgtgttt ccatcctttg 6240
catttctctg cgagtagttc cacacaggtt tgtaagtaag taagaaagaa ggcaaattga 6300
ttcaaatgtt acaaaaaaac ccttcttggt ggattagaca ggttaaatat ataaacaaac 6360
aaacaaaaat tgctcaaaaa agaggagaaa agctcaagag gaaaagctaa ggactggtag 6420
gaaaaagctt tactctttca tgccatttta tttctttttg atttttaaat cattcattca 6480
atagatacca ccgtgtgacc tataattttg caaatctgtt acctctgaca tcaagtgtaa 6540
ttagcttttg gagagtgggc tgacatcaag tgtaattagc ttttggagag tgggttttgt 6600
ccattattaa taattaatta attaacatca aacacggctt ctcatgctat ttctacctca 6660
ctttggtttt ggggtgttcc tgataattgt gcacacctga gttcacagct tcaccacttg 6720
tccattgcgt tattttcttt ttcctttata attctttctt tttccttcat aattttcaaa 6780
agaaaaccca aagctctaag gtaacaaatt accaaattac atgaagattt ggtttttgtc 6840
ttgcattttt ttcctttatg tgacgctgga ccttttcttt acccaaggat ttttaaaact 6900
cagatttaaa acaaggggtt actttacatc ctactaagaa gtttaagtaa gtaagtttca 6960
ttctaaaatc agaggtaaat agagtgcata aataattttg ttttaatctt tttgtttttc 7020
ttttagacac attagctctg gagtgagtct gtcataatat ttgaacaaaa attgagagct 7080
ttattgctgc attttaagca taattaattt ggacattatt tcgtgttgtg ttctttataa 7140
ccaccaagta ttaaactgta aatcataatg taactgaagc ataaacatca catggcatgt 7200
tttgtcattg ttttcaggta ctgagttctt acttgagtat cataatatat tgtgttttaa 7260
caccaacact gtaacattta cgaattattt ttttaaactt cagttttact gcattttcac 7320
aacatatcag acttcaccaa atatatgcct tactattgta ttatagtact gctttactgt 7380
gtatctcaat aaagcacgca gttatgttac 7410
<210> 17
<211> 1225
<212> PRT
<213> Homo sapiens
<400> 17
Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn
1 5 10 15
Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val
20 25 30
Ile Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
35 40 45
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg
50 55 60
Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys
65 70 75 80
Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg
85 90 95
Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg
100 105 110
Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala
115 120 125
Lys Glu Glu Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu
130 135 140
Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile
145 150 155 160
Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn
165 170 175
Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser
180 185 190
Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile Asn Ala
195 200 205
Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu
210 215 220
Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys
225 230 235 240
Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln
245 250 255
Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys
260 265 270
Glu Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
275 280 285
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg
290 295 300
Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp
305 310 315 320
Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile
325 330 335
Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu
340 345 350
Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu
355 360 365
Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln
370 375 380
Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro
385 390 395 400
Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
405 410 415
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro
420 425 430
Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala
435 440 445
Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp
450 455 460
Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln
465 470 475 480
Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile
485 490 495
Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln
500 505 510
Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
515 520 525
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
530 535 540
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu
545 550 555 560
Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg
565 570 575
Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe
580 585 590
Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn
595 600 605
Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp
610 615 620
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
625 630 635 640
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
645 650 655
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
660 665 670
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
675 680 685
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
690 695 700
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
705 710 715 720
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
725 730 735
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
740 745 750
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
755 760 765
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
770 775 780
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
785 790 795 800
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
805 810 815
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
820 825 830
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
835 840 845
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
850 855 860
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
865 870 875 880
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
885 890 895
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
900 905 910
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
915 920 925
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
930 935 940
Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser
945 950 955 960
Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg
965 970 975
Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly
980 985 990
Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
995 1000 1005
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser
1010 1015 1020
Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu
1025 1030 1035
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
1040 1045 1050
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys
1055 1060 1065
Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro
1070 1075 1080
Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu
1085 1090 1095
Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu
1100 1105 1110
Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser
1115 1120 1125
Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu
1130 1135 1140
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu
1145 1150 1155
Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly
1160 1165 1170
Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
1175 1180 1185
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu
1190 1195 1200
Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys
1205 1210 1215
Pro Met Arg Glu Asp Thr Met
1220 1225
<210> 18
<211> 5623
<212> DNA
<213> Homo sapiens
<400> 18
gggttttctc aggattgcta tgcaacagga tcagtgctgt agtgcccggt tcaagctgaa 60
aatgttacac aggaagacat accatgtaaa ggacctccaa ggtgaaattg aagctcacac 120
agatgtttat cacaacctgg atgaaaacag ccaaaaaatc ctgagatccc tggaaggttc 180
cgatgatgca gtcctgttac aaagacgttt ggataacatg aacttcaagt ggagtgaact 240
tcggaaaaag tctctcaaca ttaggtccca tttggaagcc agttctgacc agtggaagcg 300
tctgcacctt tctctgcagg aacttctggt gtggctacag ctgaaagatg atgaattaag 360
ccggcaggca cctattggag gcgactttcc agcagttcag aagcagaacg atgtacatag 420
ggccttcaag agggaattga aaactaaaga acctgtaatc atgagtactc ttgagactgt 480
acgaatattt ctgacagagc agcctttgga aggactagag aaactctacc aggagcccag 540
agagctgcct cctgaggaga gagcccagaa tgtcactcgg cttctacgaa agcaggctga 600
ggaggtcaat actgagtggg aaaaattgaa cctgcactcc gctgactggc agagaaaaat 660
agatgagacc cttgaaagac tccaggaact tcaagaggcc acggatgagc tggacctcaa 720
gctgcgccaa gctgaggtga tcaagggatc ctggcagccc gtgggcgatc tcctcattga 780
ctctctccaa gatcacctcg agaaagtcaa ggcacttcga ggagaaattg cgcctctgaa 840
agagaacgtg agccacgtca atgaccttgc tcgccagctt accactttgg gcattcagct 900
ctcaccgtat aacctcagca ctctggaaga cctgaacacc agatggaagc ttctgcaggt 960
ggccgtcgag gaccgagtca ggcagctgca tgaagcccac agggactttg gtccagcatc 1020
tcagcacttt ctttccacgt ctgtccaggg tccctgggag agagccatct cgccaaacaa 1080
agtgccctac tatatcaacc acgagactca aacaacttgc tgggaccatc ccaaaatgac 1140
agagctctac cagtctttag ctgacctgaa taatgtcaga ttctcagctt ataggactgc 1200
catgaaactc cgaagactgc agaaggccct ttgcttggat ctcttgagcc tgtcagctgc 1260
atgtgatgcc ttggaccagc acaacctcaa gcaaaatgac cagcccatgg atatcctgca 1320
gattattaat tgtttgacca ctatttatga ccgcctggag caagagcaca acaatttggt 1380
caacgtccct ctctgcgtgg atatgtgtct gaactggctg ctgaatgttt atgatacggg 1440
acgaacaggg aggatccgtg tcctgtcttt taaaactggc atcatttccc tgtgtaaagc 1500
acatttggaa gacaagtaca gatacctttt caagcaagtg gcaagttcaa caggattttg 1560
tgaccagcgc aggctgggcc tccttctgca tgattctatc caaattccaa gacagttggg 1620
tgaagttgca tcctttgggg gcagtaacat tgagccaagt gtccggagct gcttccaatt 1680
tgctaataat aagccagaga tcgaagcggc cctcttccta gactggatga gactggaacc 1740
ccagtccatg gtgtggctgc ccgtcctgca cagagtggct gctgcagaaa ctgccaagca 1800
tcaggccaaa tgtaacatct gcaaagagtg tccaatcatt ggattcaggt acaggagtct 1860
aaagcacttt aattatgaca tctgccaaag ctgctttttt tctggtcgag ttgcaaaagg 1920
ccataaaatg cactatccca tggtggaata ttgcactccg actacatcag gagaagatgt 1980
tcgagacttt gccaaggtac taaaaaacaa atttcgaacc aaaaggtatt ttgcgaagca 2040
tccccgaatg ggctacctgc cagtgcagac tgtcttagag ggggacaaca tggaaactcc 2100
cgttactctg atcaacttct ggccagtaga ttctgcgcct gcctcgtccc ctcagctttc 2160
acacgatgat actcattcac gcattgaaca ttatgctagc aggctagcag aaatggaaaa 2220
cagcaatgga tcttatctaa atgatagcat ctctcctaat gagagcatag atgatgaaca 2280
tttgttaatc cagcattact gccaaagttt gaaccaggac tcccccctga gccagcctcg 2340
tagtcctgcc cagatcttga tttccttaga gagtgaggaa agaggggagc tagagagaat 2400
cctagcagat cttgaggaag aaaacaggaa tctgcaagca gaatatgacc gtctaaagca 2460
gcagcacgaa cataaaggcc tgtccccact gccgtcccct cctgaaatga tgcccacctc 2520
tccccagagt ccccgggatg ctgagctcat tgctgaggcc aagctactgc gtcaacacaa 2580
aggccgcctg gaagccagga tgcaaatcct ggaagaccac aataaacagc tggagtcaca 2640
gttacacagg ctaaggcagc tgctggagca accccaggca gaggccaaag tgaatggcac 2700
aacggtgtcc tctccttcta cctctctaca gaggtccgac agcagtcagc ctatgctgct 2760
ccgagtggtt ggcagtcaaa cttcggactc catgggtgag gaagatcttc tcagtcctcc 2820
ccaggacaca agcacagggt tagaggaggt gatggagcaa ctcaacaact ccttccctag 2880
ttcaagagga agaaataccc ctggaaagcc aatgagagag gacacaatgt aggaagtctt 2940
ttccacatgg cagatgattt gggcagagcg atggagtcct tagtatcagt catgacagat 3000
gaagaaggag cagaataaat gttttacaac tcctgattcc cgcatggttt ttataatatt 3060
catacaacaa agaggattag acagtaagag tttacaagaa ataaatctat atttttgtga 3120
agggtagtgg tattatactg tagatttcag tagtttctaa gtctgttatt gttttgttaa 3180
caatggcagg ttttacacgt ctatgcaatt gtacaaaaaa gttataagaa aactacatgt 3240
aaaatcttga tagctaaata acttgccatt tctttatatg gaacgcattt tgggttgttt 3300
aaaaatttat aacagttata aagaaagatt gtaaactaaa gtgtgcttta taaaaaaaag 3360
ttgtttataa aaacccctaa aaacaaaaca aacacacaca cacacacata cacacacaca 3420
cacaaaactt tgaggcagcg cattgttttg catccttttg gcgtgatatc catatgaaat 3480
tcatggcttt ttcttttttt gcatattaaa gataagactt cctctaccac cacaccaaat 3540
gactactaca cactgctcat ttgagaactg tcagctgagt ggggcaggct tgagttttca 3600
tttcatatat ctatatgtct ataagtatat aaatactata gttatataga taaagagata 3660
cgaatttcta tagactgact ttttccattt tttaaatgtt catgtcacat cctaatagaa 3720
agaaattact tctagtcagt catccaggct tacctgcttg gtctagaatg gatttttccc 3780
ggagccggaa gccaggagga aactacacca cactaaaaca ttgtctacag ctccagatgt 3840
ttctcatttt aaacaacttt ccactgacaa cgaaagtaaa gtaaagtatt ggattttttt 3900
aaagggaaca tgtgaatgaa tacacaggac ttattatatc agagtgagta atcggttggt 3960
tggttgattg attgattgat tgatacattc agcttcctgc tgctagcaat gccacgattt 4020
agatttaatg atgcttcagt ggaaatcaat cagaaggtat tctgaccttg tgaacatcag 4080
aaggtatttt ttaactccca agcagtagca ggacgatgat agggctggag ggctatggat 4140
tcccagccca tccctgtgaa ggagtaggcc actctttaag tgaaggattg gatgattgtt 4200
cataatacat aaagttctct gtaattacaa ctaaattatt atgccctctt ctcacagtca 4260
aaaggaactg ggtggtttgg tttttgttgc ttttttagat ttattgtccc atgtgggatg 4320
agtttttaaa tgccacaaga cataatttaa aataaataaa ctttgggaaa aggtgtaaaa 4380
cagtagcccc atcacatttg tgatactgac aggtatcaac ccagaagccc atgaactgtg 4440
tttccatcct ttgcatttct ctgcgagtag ttccacacag gtttgtaagt aagtaagaaa 4500
gaaggcaaat tgattcaaat gttacaaaaa aacccttctt ggtggattag acaggttaaa 4560
tatataaaca aacaaacaaa aattgctcaa aaaagaggag aaaagctcaa gaggaaaagc 4620
taaggactgg taggaaaaag ctttactctt tcatgccatt ttatttcttt ttgattttta 4680
aatcattcat tcaatagata ccaccgtgtg acctataatt ttgcaaatct gttacctctg 4740
acatcaagtg taattagctt ttggagagtg ggctgacatc aagtgtaatt agcttttgga 4800
gagtgggttt tgtccattat taataattaa ttaattaaca tcaaacacgg cttctcatgc 4860
tatttctacc tcactttggt tttggggtgt tcctgataat tgtgcacacc tgagttcaca 4920
gcttcaccac ttgtccattg cgttattttc tttttccttt ataattcttt ctttttcctt 4980
cataattttc aaaagaaaac ccaaagctct aaggtaacaa attaccaaat tacatgaaga 5040
tttggttttt gtcttgcatt tttttccttt atgtgacgct ggaccttttc tttacccaag 5100
gatttttaaa actcagattt aaaacaaggg gttactttac atcctactaa gaagtttaag 5160
taagtaagtt tcattctaaa atcagaggta aatagagtgc ataaataatt ttgttttaat 5220
ctttttgttt ttcttttaga cacattagct ctggagtgag tctgtcataa tatttgaaca 5280
aaaattgaga gctttattgc tgcattttaa gcataattaa tttggacatt atttcgtgtt 5340
gtgttcttta taaccaccaa gtattaaact gtaaatcata atgtaactga agcataaaca 5400
tcacatggca tgttttgtca ttgttttcag gtactgagtt cttacttgag tatcataata 5460
tattgtgttt taacaccaac actgtaacat ttacgaatta tttttttaaa cttcagtttt 5520
actgcatttt cacaacatat cagacttcac caaatatatg ccttactatt gtattatagt 5580
actgctttac tgtgtatctc aataaagcac gcagttatgt tac 5623
<210> 19
<211> 956
<212> PRT
<213> Homo sapiens
<400> 19
Met Leu His Arg Lys Thr Tyr His Val Lys Asp Leu Gln Gly Glu Ile
1 5 10 15
Glu Ala His Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys
20 25 30
Ile Leu Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg
35 40 45
Arg Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
50 55 60
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg
65 70 75 80
Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp
85 90 95
Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val
100 105 110
Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr
115 120 125
Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu
130 135 140
Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg
145 150 155 160
Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg
165 170 175
Lys Gln Ala Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His
180 185 190
Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln
195 200 205
Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala
210 215 220
Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp
225 230 235 240
Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile
245 250 255
Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln
260 265 270
Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu
275 280 285
Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
290 295 300
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser
305 310 315 320
Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile
325 330 335
Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr
340 345 350
Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp
355 360 365
Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg
370 375 380
Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala
385 390 395 400
Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met
405 410 415
Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu
420 425 430
Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met
435 440 445
Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg
450 455 460
Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala
465 470 475 480
His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser
485 490 495
Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser
500 505 510
Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser
515 520 525
Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
530 535 540
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro
545 550 555 560
Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu
565 570 575
Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile
580 585 590
Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys
595 600 605
Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His
610 615 620
Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val
625 630 635 640
Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr
645 650 655
Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu
660 665 670
Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro
675 680 685
Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr
690 695 700
His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn
705 710 715 720
Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile
725 730 735
Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln
740 745 750
Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser
755 760 765
Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
770 775 780
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln
785 790 795 800
Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met
805 810 815
Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu
820 825 830
Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln
835 840 845
Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu
850 855 860
Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr
865 870 875 880
Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln
885 890 895
Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly
900 905 910
Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu
915 920 925
Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg
930 935 940
Asn Thr Pro Gly Lys Pro Met Arg Glu Asp Thr Met
945 950 955
<210> 20
<211> 4623
<212> DNA
<213> Homo sapiens
<400> 20
actttcgggg agcccggcgg ctctgggaag ctcactcctc cactcgtacc cacactcgac 60
cgcggagccc ttgcagccat gagggaacag ctcaaaggcc acgagactca aacaacttgc 120
tgggaccatc ccaaaatgac agagctctac cagtctttag ctgacctgaa taatgtcaga 180
ttctcagctt ataggactgc catgaaactc cgaagactgc agaaggccct ttgcttggat 240
ctcttgagcc tgtcagctgc atgtgatgcc ttggaccagc acaacctcaa gcaaaatgac 300
cagcccatgg atatcctgca gattattaat tgtttgacca ctatttatga ccgcctggag 360
caagagcaca acaatttggt caacgtccct ctctgcgtgg atatgtgtct gaactggctg 420
ctgaatgttt atgatacggg acgaacaggg aggatccgtg tcctgtcttt taaaactggc 480
atcatttccc tgtgtaaagc acatttggaa gacaagtaca gatacctttt caagcaagtg 540
gcaagttcaa caggattttg tgaccagcgc aggctgggcc tccttctgca tgattctatc 600
caaattccaa gacagttggg tgaagttgca tcctttgggg gcagtaacat tgagccaagt 660
gtccggagct gcttccaatt tgctaataat aagccagaga tcgaagcggc cctcttccta 720
gactggatga gactggaacc ccagtccatg gtgtggctgc ccgtcctgca cagagtggct 780
gctgcagaaa ctgccaagca tcaggccaaa tgtaacatct gcaaagagtg tccaatcatt 840
ggattcaggt acaggagtct aaagcacttt aattatgaca tctgccaaag ctgctttttt 900
tctggtcgag ttgcaaaagg ccataaaatg cactatccca tggtggaata ttgcactccg 960
actacatcag gagaagatgt tcgagacttt gccaaggtac taaaaaacaa atttcgaacc 1020
aaaaggtatt ttgcgaagca tccccgaatg ggctacctgc cagtgcagac tgtcttagag 1080
ggggacaaca tggaaactcc cgttactctg atcaacttct ggccagtaga ttctgcgcct 1140
gcctcgtccc ctcagctttc acacgatgat actcattcac gcattgaaca ttatgctagc 1200
aggctagcag aaatggaaaa cagcaatgga tcttatctaa atgatagcat ctctcctaat 1260
gagagcatag atgatgaaca tttgttaatc cagcattact gccaaagttt gaaccaggac 1320
tcccccctga gccagcctcg tagtcctgcc cagatcttga tttccttaga gagtgaggaa 1380
agaggggagc tagagagaat cctagcagat cttgaggaag aaaacaggaa tctgcaagca 1440
gaatatgacc gtctaaagca gcagcacgaa cataaaggcc tgtccccact gccgtcccct 1500
cctgaaatga tgcccacctc tccccagagt ccccgggatg ctgagctcat tgctgaggcc 1560
aagctactgc gtcaacacaa aggccgcctg gaagccagga tgcaaatcct ggaagaccac 1620
aataaacagc tggagtcaca gttacacagg ctaaggcagc tgctggagca accccaggca 1680
gaggccaaag tgaatggcac aacggtgtcc tctccttcta cctctctaca gaggtccgac 1740
agcagtcagc ctatgctgct ccgagtggtt ggcagtcaaa cttcggactc catgggtgag 1800
gaagatcttc tcagtcctcc ccaggacaca agcacagggt tagaggaggt gatggagcaa 1860
ctcaacaact ccttccctag ttcaagagga agaaataccc ctggaaagcc aatgagagag 1920
gacacaatgt aggaagtctt ttccacatgg cagatgattt gggcagagcg atggagtcct 1980
tagtatcagt catgacagat gaagaaggag cagaataaat gttttacaac tcctgattcc 2040
cgcatggttt ttataatatt catacaacaa agaggattag acagtaagag tttacaagaa 2100
ataaatctat atttttgtga agggtagtgg tattatactg tagatttcag tagtttctaa 2160
gtctgttatt gttttgttaa caatggcagg ttttacacgt ctatgcaatt gtacaaaaaa 2220
gttataagaa aactacatgt aaaatcttga tagctaaata acttgccatt tctttatatg 2280
gaacgcattt tgggttgttt aaaaatttat aacagttata aagaaagatt gtaaactaaa 2340
gtgtgcttta taaaaaaaag ttgtttataa aaacccctaa aaacaaaaca aacacacaca 2400
cacacacata cacacacaca cacaaaactt tgaggcagcg cattgttttg catccttttg 2460
gcgtgatatc catatgaaat tcatggcttt ttcttttttt gcatattaaa gataagactt 2520
cctctaccac cacaccaaat gactactaca cactgctcat ttgagaactg tcagctgagt 2580
ggggcaggct tgagttttca tttcatatat ctatatgtct ataagtatat aaatactata 2640
gttatataga taaagagata cgaatttcta tagactgact ttttccattt tttaaatgtt 2700
catgtcacat cctaatagaa agaaattact tctagtcagt catccaggct tacctgcttg 2760
gtctagaatg gatttttccc ggagccggaa gccaggagga aactacacca cactaaaaca 2820
ttgtctacag ctccagatgt ttctcatttt aaacaacttt ccactgacaa cgaaagtaaa 2880
gtaaagtatt ggattttttt aaagggaaca tgtgaatgaa tacacaggac ttattatatc 2940
agagtgagta atcggttggt tggttgattg attgattgat tgatacattc agcttcctgc 3000
tgctagcaat gccacgattt agatttaatg atgcttcagt ggaaatcaat cagaaggtat 3060
tctgaccttg tgaacatcag aaggtatttt ttaactccca agcagtagca ggacgatgat 3120
agggctggag ggctatggat tcccagccca tccctgtgaa ggagtaggcc actctttaag 3180
tgaaggattg gatgattgtt cataatacat aaagttctct gtaattacaa ctaaattatt 3240
atgccctctt ctcacagtca aaaggaactg ggtggtttgg tttttgttgc ttttttagat 3300
ttattgtccc atgtgggatg agtttttaaa tgccacaaga cataatttaa aataaataaa 3360
ctttgggaaa aggtgtaaaa cagtagcccc atcacatttg tgatactgac aggtatcaac 3420
ccagaagccc atgaactgtg tttccatcct ttgcatttct ctgcgagtag ttccacacag 3480
gtttgtaagt aagtaagaaa gaaggcaaat tgattcaaat gttacaaaaa aacccttctt 3540
ggtggattag acaggttaaa tatataaaca aacaaacaaa aattgctcaa aaaagaggag 3600
aaaagctcaa gaggaaaagc taaggactgg taggaaaaag ctttactctt tcatgccatt 3660
ttatttcttt ttgattttta aatcattcat tcaatagata ccaccgtgtg acctataatt 3720
ttgcaaatct gttacctctg acatcaagtg taattagctt ttggagagtg ggctgacatc 3780
aagtgtaatt agcttttgga gagtgggttt tgtccattat taataattaa ttaattaaca 3840
tcaaacacgg cttctcatgc tatttctacc tcactttggt tttggggtgt tcctgataat 3900
tgtgcacacc tgagttcaca gcttcaccac ttgtccattg cgttattttc tttttccttt 3960
ataattcttt ctttttcctt cataattttc aaaagaaaac ccaaagctct aaggtaacaa 4020
attaccaaat tacatgaaga tttggttttt gtcttgcatt tttttccttt atgtgacgct 4080
ggaccttttc tttacccaag gatttttaaa actcagattt aaaacaaggg gttactttac 4140
atcctactaa gaagtttaag taagtaagtt tcattctaaa atcagaggta aatagagtgc 4200
ataaataatt ttgttttaat ctttttgttt ttcttttaga cacattagct ctggagtgag 4260
tctgtcataa tatttgaaca aaaattgaga gctttattgc tgcattttaa gcataattaa 4320
tttggacatt atttcgtgtt gtgttcttta taaccaccaa gtattaaact gtaaatcata 4380
atgtaactga agcataaaca tcacatggca tgttttgtca ttgttttcag gtactgagtt 4440
cttacttgag tatcataata tattgtgttt taacaccaac actgtaacat ttacgaatta 4500
tttttttaaa cttcagtttt actgcatttt cacaacatat cagacttcac caaatatatg 4560
ccttactatt gtattatagt actgctttac tgtgtatctc aataaagcac gcagttatgt 4620
tac 4623
<210> 21
<211> 617
<212> PRT
<213> Homo sapiens
<400> 21
Met Arg Glu Gln Leu Lys Gly His Glu Thr Gln Thr Thr Cys Trp Asp
1 5 10 15
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
20 25 30
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
35 40 45
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
50 55 60
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
65 70 75 80
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
85 90 95
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
100 105 110
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
115 120 125
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
130 135 140
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
145 150 155 160
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
165 170 175
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
180 185 190
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
195 200 205
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
210 215 220
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
225 230 235 240
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
245 250 255
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
260 265 270
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
275 280 285
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
290 295 300
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
305 310 315 320
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
325 330 335
Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser
340 345 350
Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg
355 360 365
Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly
370 375 380
Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
385 390 395 400
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro
405 410 415
Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser
420 425 430
Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu
435 440 445
Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu
450 455 460
His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr
465 470 475 480
Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu
485 490 495
Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu
500 505 510
Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln Leu
515 520 525
Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser
530 535 540
Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met Leu
545 550 555 560
Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp
565 570 575
Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met
580 585 590
Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro
595 600 605
Gly Lys Pro Met Arg Glu Asp Thr Met
610 615
<210> 22
<211> 4591
<212> DNA
<213> Homo sapiens
<400> 22
actttcgggg agcccggcgg ctctgggaag ctcactcctc cactcgtacc cacactcgac 60
cgcggagccc ttgcagccat gagggaacag ctcaaaggcc acgagactca aacaacttgc 120
tgggaccatc ccaaaatgac agagctctac cagtctttag ctgacctgaa taatgtcaga 180
ttctcagctt ataggactgc catgaaactc cgaagactgc agaaggccct ttgcttggat 240
ctcttgagcc tgtcagctgc atgtgatgcc ttggaccagc acaacctcaa gcaaaatgac 300
cagcccatgg atatcctgca gattattaat tgtttgacca ctatttatga ccgcctggag 360
caagagcaca acaatttggt caacgtccct ctctgcgtgg atatgtgtct gaactggctg 420
ctgaatgttt atgatacggg acgaacaggg aggatccgtg tcctgtcttt taaaactggc 480
atcatttccc tgtgtaaagc acatttggaa gacaagtaca gatacctttt caagcaagtg 540
gcaagttcaa caggattttg tgaccagcgc aggctgggcc tccttctgca tgattctatc 600
caaattccaa gacagttggg tgaagttgca tcctttgggg gcagtaacat tgagccaagt 660
gtccggagct gcttccaatt tgctaataat aagccagaga tcgaagcggc cctcttccta 720
gactggatga gactggaacc ccagtccatg gtgtggctgc ccgtcctgca cagagtggct 780
gctgcagaaa ctgccaagca tcaggccaaa tgtaacatct gcaaagagtg tccaatcatt 840
ggattcaggt acaggagtct aaagcacttt aattatgaca tctgccaaag ctgctttttt 900
tctggtcgag ttgcaaaagg ccataaaatg cactatccca tggtggaata ttgcactccg 960
actacatcag gagaagatgt tcgagacttt gccaaggtac taaaaaacaa atttcgaacc 1020
aaaaggtatt ttgcgaagca tccccgaatg ggctacctgc cagtgcagac tgtcttagag 1080
ggggacaaca tggaaactcc cgttactctg atcaacttct ggccagtaga ttctgcgcct 1140
gcctcgtccc ctcagctttc acacgatgat actcattcac gcattgaaca ttatgctagc 1200
aggctagcag aaatggaaaa cagcaatgga tcttatctaa atgatagcat ctctcctaat 1260
gagagcatag atgatgaaca tttgttaatc cagcattact gccaaagttt gaaccaggac 1320
tcccccctga gccagcctcg tagtcctgcc cagatcttga tttccttaga gagtgaggaa 1380
agaggggagc tagagagaat cctagcagat cttgaggaag aaaacaggaa tctgcaagca 1440
gaatatgacc gtctaaagca gcagcacgaa cataaaggcc tgtccccact gccgtcccct 1500
cctgaaatga tgcccacctc tccccagagt ccccgggatg ctgagctcat tgctgaggcc 1560
aagctactgc gtcaacacaa aggccgcctg gaagccagga tgcaaatcct ggaagaccac 1620
aataaacagc tggagtcaca gttacacagg ctaaggcagc tgctggagca accccaggca 1680
gaggccaaag tgaatggcac aacggtgtcc tctccttcta cctctctaca gaggtccgac 1740
agcagtcagc ctatgctgct ccgagtggtt ggcagtcaaa cttcggactc catgggtgag 1800
gaagatcttc tcagtcctcc ccaggacaca agcacagggt tagaggaggt gatggagcaa 1860
ctcaacaact ccttccctag ttcaagagga cacaatgtag gaagtctttt ccacatggca 1920
gatgatttgg gcagagcgat ggagtcctta gtatcagtca tgacagatga agaaggagca 1980
gaataaatgt tttacaactc ctgattcccg catggttttt ataatattca tacaacaaag 2040
aggattagac agtaagagtt tacaagaaat aaatctatat ttttgtgaag ggtagtggta 2100
ttatactgta gatttcagta gtttctaagt ctgttattgt tttgttaaca atggcaggtt 2160
ttacacgtct atgcaattgt acaaaaaagt tataagaaaa ctacatgtaa aatcttgata 2220
gctaaataac ttgccatttc tttatatgga acgcattttg ggttgtttaa aaatttataa 2280
cagttataaa gaaagattgt aaactaaagt gtgctttata aaaaaaagtt gtttataaaa 2340
acccctaaaa acaaaacaaa cacacacaca cacacataca cacacacaca caaaactttg 2400
aggcagcgca ttgttttgca tccttttggc gtgatatcca tatgaaattc atggcttttt 2460
ctttttttgc atattaaaga taagacttcc tctaccacca caccaaatga ctactacaca 2520
ctgctcattt gagaactgtc agctgagtgg ggcaggcttg agttttcatt tcatatatct 2580
atatgtctat aagtatataa atactatagt tatatagata aagagatacg aatttctata 2640
gactgacttt ttccattttt taaatgttca tgtcacatcc taatagaaag aaattacttc 2700
tagtcagtca tccaggctta cctgcttggt ctagaatgga tttttcccgg agccggaagc 2760
caggaggaaa ctacaccaca ctaaaacatt gtctacagct ccagatgttt ctcattttaa 2820
acaactttcc actgacaacg aaagtaaagt aaagtattgg atttttttaa agggaacatg 2880
tgaatgaata cacaggactt attatatcag agtgagtaat cggttggttg gttgattgat 2940
tgattgattg atacattcag cttcctgctg ctagcaatgc cacgatttag atttaatgat 3000
gcttcagtgg aaatcaatca gaaggtattc tgaccttgtg aacatcagaa ggtatttttt 3060
aactcccaag cagtagcagg acgatgatag ggctggaggg ctatggattc ccagcccatc 3120
cctgtgaagg agtaggccac tctttaagtg aaggattgga tgattgttca taatacataa 3180
agttctctgt aattacaact aaattattat gccctcttct cacagtcaaa aggaactggg 3240
tggtttggtt tttgttgctt ttttagattt attgtcccat gtgggatgag tttttaaatg 3300
ccacaagaca taatttaaaa taaataaact ttgggaaaag gtgtaaaaca gtagccccat 3360
cacatttgtg atactgacag gtatcaaccc agaagcccat gaactgtgtt tccatccttt 3420
gcatttctct gcgagtagtt ccacacaggt ttgtaagtaa gtaagaaaga aggcaaattg 3480
attcaaatgt tacaaaaaaa cccttcttgg tggattagac aggttaaata tataaacaaa 3540
caaacaaaaa ttgctcaaaa aagaggagaa aagctcaaga ggaaaagcta aggactggta 3600
ggaaaaagct ttactctttc atgccatttt atttcttttt gatttttaaa tcattcattc 3660
aatagatacc accgtgtgac ctataatttt gcaaatctgt tacctctgac atcaagtgta 3720
attagctttt ggagagtggg ctgacatcaa gtgtaattag cttttggaga gtgggttttg 3780
tccattatta ataattaatt aattaacatc aaacacggct tctcatgcta tttctacctc 3840
actttggttt tggggtgttc ctgataattg tgcacacctg agttcacagc ttcaccactt 3900
gtccattgcg ttattttctt tttcctttat aattctttct ttttccttca taattttcaa 3960
aagaaaaccc aaagctctaa ggtaacaaat taccaaatta catgaagatt tggtttttgt 4020
cttgcatttt tttcctttat gtgacgctgg accttttctt tacccaagga tttttaaaac 4080
tcagatttaa aacaaggggt tactttacat cctactaaga agtttaagta agtaagtttc 4140
attctaaaat cagaggtaaa tagagtgcat aaataatttt gttttaatct ttttgttttt 4200
cttttagaca cattagctct ggagtgagtc tgtcataata tttgaacaaa aattgagagc 4260
tttattgctg cattttaagc ataattaatt tggacattat ttcgtgttgt gttctttata 4320
accaccaagt attaaactgt aaatcataat gtaactgaag cataaacatc acatggcatg 4380
ttttgtcatt gttttcaggt actgagttct tacttgagta tcataatata ttgtgtttta 4440
acaccaacac tgtaacattt acgaattatt tttttaaact tcagttttac tgcattttca 4500
caacatatca gacttcacca aatatatgcc ttactattgt attatagtac tgctttactg 4560
tgtatctcaa taaagcacgc agttatgtta c 4591
<210> 23
<211> 635
<212> PRT
<213> Homo sapiens
<400> 23
Met Arg Glu Gln Leu Lys Gly His Glu Thr Gln Thr Thr Cys Trp Asp
1 5 10 15
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
20 25 30
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
35 40 45
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
50 55 60
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
65 70 75 80
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
85 90 95
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
100 105 110
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
115 120 125
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
130 135 140
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
145 150 155 160
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
165 170 175
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
180 185 190
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
195 200 205
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
210 215 220
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
225 230 235 240
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
245 250 255
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
260 265 270
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
275 280 285
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
290 295 300
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
305 310 315 320
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
325 330 335
Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser
340 345 350
Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg
355 360 365
Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly
370 375 380
Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
385 390 395 400
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro
405 410 415
Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser
420 425 430
Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu
435 440 445
Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu
450 455 460
His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr
465 470 475 480
Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu
485 490 495
Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu
500 505 510
Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln Leu
515 520 525
Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser
530 535 540
Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met Leu
545 550 555 560
Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp
565 570 575
Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met
580 585 590
Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly His Asn Val Gly
595 600 605
Ser Leu Phe His Met Ala Asp Asp Leu Gly Arg Ala Met Glu Ser Leu
610 615 620
Val Ser Val Met Thr Asp Glu Glu Gly Ala Glu
625 630 635
<210> 24
<211> 4584
<212> DNA
<213> Homo sapiens
<400> 24
actttcgggg agcccggcgg ctctgggaag ctcactcctc cactcgtacc cacactcgac 60
cgcggagccc ttgcagccat gagggaacag ctcaaaggcc acgagactca aacaacttgc 120
tgggaccatc ccaaaatgac agagctctac cagtctttag ctgacctgaa taatgtcaga 180
ttctcagctt ataggactgc catgaaactc cgaagactgc agaaggccct ttgcttggat 240
ctcttgagcc tgtcagctgc atgtgatgcc ttggaccagc acaacctcaa gcaaaatgac 300
cagcccatgg atatcctgca gattattaat tgtttgacca ctatttatga ccgcctggag 360
caagagcaca acaatttggt caacgtccct ctctgcgtgg atatgtgtct gaactggctg 420
ctgaatgttt atgatacggg acgaacaggg aggatccgtg tcctgtcttt taaaactggc 480
atcatttccc tgtgtaaagc acatttggaa gacaagtaca gatacctttt caagcaagtg 540
gcaagttcaa caggattttg tgaccagcgc aggctgggcc tccttctgca tgattctatc 600
caaattccaa gacagttggg tgaagttgca tcctttgggg gcagtaacat tgagccaagt 660
gtccggagct gcttccaatt tgctaataat aagccagaga tcgaagcggc cctcttccta 720
gactggatga gactggaacc ccagtccatg gtgtggctgc ccgtcctgca cagagtggct 780
gctgcagaaa ctgccaagca tcaggccaaa tgtaacatct gcaaagagtg tccaatcatt 840
ggattcaggt acaggagtct aaagcacttt aattatgaca tctgccaaag ctgctttttt 900
tctggtcgag ttgcaaaagg ccataaaatg cactatccca tggtggaata ttgcactccg 960
actacatcag gagaagatgt tcgagacttt gccaaggtac taaaaaacaa atttcgaacc 1020
aaaaggtatt ttgcgaagca tccccgaatg ggctacctgc cagtgcagac tgtcttagag 1080
ggggacaaca tggaaacgcc tgcctcgtcc cctcagcttt cacacgatga tactcattca 1140
cgcattgaac attatgctag caggctagca gaaatggaaa acagcaatgg atcttatcta 1200
aatgatagca tctctcctaa tgagagcata gatgatgaac atttgttaat ccagcattac 1260
tgccaaagtt tgaaccagga ctcccccctg agccagcctc gtagtcctgc ccagatcttg 1320
atttccttag agagtgagga aagaggggag ctagagagaa tcctagcaga tcttgaggaa 1380
gaaaacagga atctgcaagc agaatatgac cgtctaaagc agcagcacga acataaaggc 1440
ctgtccccac tgccgtcccc tcctgaaatg atgcccacct ctccccagag tccccgggat 1500
gctgagctca ttgctgaggc caagctactg cgtcaacaca aaggccgcct ggaagccagg 1560
atgcaaatcc tggaagacca caataaacag ctggagtcac agttacacag gctaaggcag 1620
ctgctggagc aaccccaggc agaggccaaa gtgaatggca caacggtgtc ctctccttct 1680
acctctctac agaggtccga cagcagtcag cctatgctgc tccgagtggt tggcagtcaa 1740
acttcggact ccatgggtga ggaagatctt ctcagtcctc cccaggacac aagcacaggg 1800
ttagaggagg tgatggagca actcaacaac tccttcccta gttcaagagg aagaaatacc 1860
cctggaaagc caatgagaga ggacacaatg taggaagtct tttccacatg gcagatgatt 1920
tgggcagagc gatggagtcc ttagtatcag tcatgacaga tgaagaagga gcagaataaa 1980
tgttttacaa ctcctgattc ccgcatggtt tttataatat tcatacaaca aagaggatta 2040
gacagtaaga gtttacaaga aataaatcta tatttttgtg aagggtagtg gtattatact 2100
gtagatttca gtagtttcta agtctgttat tgttttgtta acaatggcag gttttacacg 2160
tctatgcaat tgtacaaaaa agttataaga aaactacatg taaaatcttg atagctaaat 2220
aacttgccat ttctttatat ggaacgcatt ttgggttgtt taaaaattta taacagttat 2280
aaagaaagat tgtaaactaa agtgtgcttt ataaaaaaaa gttgtttata aaaaccccta 2340
aaaacaaaac aaacacacac acacacacat acacacacac acacaaaact ttgaggcagc 2400
gcattgtttt gcatcctttt ggcgtgatat ccatatgaaa ttcatggctt tttctttttt 2460
tgcatattaa agataagact tcctctacca ccacaccaaa tgactactac acactgctca 2520
tttgagaact gtcagctgag tggggcaggc ttgagttttc atttcatata tctatatgtc 2580
tataagtata taaatactat agttatatag ataaagagat acgaatttct atagactgac 2640
tttttccatt ttttaaatgt tcatgtcaca tcctaataga aagaaattac ttctagtcag 2700
tcatccaggc ttacctgctt ggtctagaat ggatttttcc cggagccgga agccaggagg 2760
aaactacacc acactaaaac attgtctaca gctccagatg tttctcattt taaacaactt 2820
tccactgaca acgaaagtaa agtaaagtat tggatttttt taaagggaac atgtgaatga 2880
atacacagga cttattatat cagagtgagt aatcggttgg ttggttgatt gattgattga 2940
ttgatacatt cagcttcctg ctgctagcaa tgccacgatt tagatttaat gatgcttcag 3000
tggaaatcaa tcagaaggta ttctgacctt gtgaacatca gaaggtattt tttaactccc 3060
aagcagtagc aggacgatga tagggctgga gggctatgga ttcccagccc atccctgtga 3120
aggagtaggc cactctttaa gtgaaggatt ggatgattgt tcataataca taaagttctc 3180
tgtaattaca actaaattat tatgccctct tctcacagtc aaaaggaact gggtggtttg 3240
gtttttgttg cttttttaga tttattgtcc catgtgggat gagtttttaa atgccacaag 3300
acataattta aaataaataa actttgggaa aaggtgtaaa acagtagccc catcacattt 3360
gtgatactga caggtatcaa cccagaagcc catgaactgt gtttccatcc tttgcatttc 3420
tctgcgagta gttccacaca ggtttgtaag taagtaagaa agaaggcaaa ttgattcaaa 3480
tgttacaaaa aaacccttct tggtggatta gacaggttaa atatataaac aaacaaacaa 3540
aaattgctca aaaaagagga gaaaagctca agaggaaaag ctaaggactg gtaggaaaaa 3600
gctttactct ttcatgccat tttatttctt tttgattttt aaatcattca ttcaatagat 3660
accaccgtgt gacctataat tttgcaaatc tgttacctct gacatcaagt gtaattagct 3720
tttggagagt gggctgacat caagtgtaat tagcttttgg agagtgggtt ttgtccatta 3780
ttaataatta attaattaac atcaaacacg gcttctcatg ctatttctac ctcactttgg 3840
ttttggggtg ttcctgataa ttgtgcacac ctgagttcac agcttcacca cttgtccatt 3900
gcgttatttt ctttttcctt tataattctt tctttttcct tcataatttt caaaagaaaa 3960
cccaaagctc taaggtaaca aattaccaaa ttacatgaag atttggtttt tgtcttgcat 4020
ttttttcctt tatgtgacgc tggacctttt ctttacccaa ggatttttaa aactcagatt 4080
taaaacaagg ggttacttta catcctacta agaagtttaa gtaagtaagt ttcattctaa 4140
aatcagaggt aaatagagtg cataaataat tttgttttaa tctttttgtt tttcttttag 4200
acacattagc tctggagtga gtctgtcata atatttgaac aaaaattgag agctttattg 4260
ctgcatttta agcataatta atttggacat tatttcgtgt tgtgttcttt ataaccacca 4320
agtattaaac tgtaaatcat aatgtaactg aagcataaac atcacatggc atgttttgtc 4380
attgttttca ggtactgagt tcttacttga gtatcataat atattgtgtt ttaacaccaa 4440
cactgtaaca tttacgaatt atttttttaa acttcagttt tactgcattt tcacaacata 4500
tcagacttca ccaaatatat gccttactat tgtattatag tactgcttta ctgtgtatct 4560
caataaagca cgcagttatg ttac 4584
<210> 25
<211> 604
<212> PRT
<213> Homo sapiens
<400> 25
Met Arg Glu Gln Leu Lys Gly His Glu Thr Gln Thr Thr Cys Trp Asp
1 5 10 15
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
20 25 30
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
35 40 45
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
50 55 60
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
65 70 75 80
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
85 90 95
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
100 105 110
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
115 120 125
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
130 135 140
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
145 150 155 160
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
165 170 175
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
180 185 190
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
195 200 205
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
210 215 220
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
225 230 235 240
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
245 250 255
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
260 265 270
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
275 280 285
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
290 295 300
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
305 310 315 320
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
325 330 335
Asn Met Glu Thr Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr
340 345 350
His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn
355 360 365
Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile
370 375 380
Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln
385 390 395 400
Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser
405 410 415
Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
420 425 430
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln
435 440 445
Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met
450 455 460
Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu
465 470 475 480
Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln
485 490 495
Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu
500 505 510
Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr
515 520 525
Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln
530 535 540
Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly
545 550 555 560
Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu
565 570 575
Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg
580 585 590
Asn Thr Pro Gly Lys Pro Met Arg Glu Asp Thr Met
595 600
<210> 26
<211> 4552
<212> DNA
<213> Homo sapiens
<400> 26
actttcgggg agcccggcgg ctctgggaag ctcactcctc cactcgtacc cacactcgac 60
cgcggagccc ttgcagccat gagggaacag ctcaaaggcc acgagactca aacaacttgc 120
tgggaccatc ccaaaatgac agagctctac cagtctttag ctgacctgaa taatgtcaga 180
ttctcagctt ataggactgc catgaaactc cgaagactgc agaaggccct ttgcttggat 240
ctcttgagcc tgtcagctgc atgtgatgcc ttggaccagc acaacctcaa gcaaaatgac 300
cagcccatgg atatcctgca gattattaat tgtttgacca ctatttatga ccgcctggag 360
caagagcaca acaatttggt caacgtccct ctctgcgtgg atatgtgtct gaactggctg 420
ctgaatgttt atgatacggg acgaacaggg aggatccgtg tcctgtcttt taaaactggc 480
atcatttccc tgtgtaaagc acatttggaa gacaagtaca gatacctttt caagcaagtg 540
gcaagttcaa caggattttg tgaccagcgc aggctgggcc tccttctgca tgattctatc 600
caaattccaa gacagttggg tgaagttgca tcctttgggg gcagtaacat tgagccaagt 660
gtccggagct gcttccaatt tgctaataat aagccagaga tcgaagcggc cctcttccta 720
gactggatga gactggaacc ccagtccatg gtgtggctgc ccgtcctgca cagagtggct 780
gctgcagaaa ctgccaagca tcaggccaaa tgtaacatct gcaaagagtg tccaatcatt 840
ggattcaggt acaggagtct aaagcacttt aattatgaca tctgccaaag ctgctttttt 900
tctggtcgag ttgcaaaagg ccataaaatg cactatccca tggtggaata ttgcactccg 960
actacatcag gagaagatgt tcgagacttt gccaaggtac taaaaaacaa atttcgaacc 1020
aaaaggtatt ttgcgaagca tccccgaatg ggctacctgc cagtgcagac tgtcttagag 1080
ggggacaaca tggaaacgcc tgcctcgtcc cctcagcttt cacacgatga tactcattca 1140
cgcattgaac attatgctag caggctagca gaaatggaaa acagcaatgg atcttatcta 1200
aatgatagca tctctcctaa tgagagcata gatgatgaac atttgttaat ccagcattac 1260
tgccaaagtt tgaaccagga ctcccccctg agccagcctc gtagtcctgc ccagatcttg 1320
atttccttag agagtgagga aagaggggag ctagagagaa tcctagcaga tcttgaggaa 1380
gaaaacagga atctgcaagc agaatatgac cgtctaaagc agcagcacga acataaaggc 1440
ctgtccccac tgccgtcccc tcctgaaatg atgcccacct ctccccagag tccccgggat 1500
gctgagctca ttgctgaggc caagctactg cgtcaacaca aaggccgcct ggaagccagg 1560
atgcaaatcc tggaagacca caataaacag ctggagtcac agttacacag gctaaggcag 1620
ctgctggagc aaccccaggc agaggccaaa gtgaatggca caacggtgtc ctctccttct 1680
acctctctac agaggtccga cagcagtcag cctatgctgc tccgagtggt tggcagtcaa 1740
acttcggact ccatgggtga ggaagatctt ctcagtcctc cccaggacac aagcacaggg 1800
ttagaggagg tgatggagca actcaacaac tccttcccta gttcaagagg acacaatgta 1860
ggaagtcttt tccacatggc agatgatttg ggcagagcga tggagtcctt agtatcagtc 1920
atgacagatg aagaaggagc agaataaatg ttttacaact cctgattccc gcatggtttt 1980
tataatattc atacaacaaa gaggattaga cagtaagagt ttacaagaaa taaatctata 2040
tttttgtgaa gggtagtggt attatactgt agatttcagt agtttctaag tctgttattg 2100
ttttgttaac aatggcaggt tttacacgtc tatgcaattg tacaaaaaag ttataagaaa 2160
actacatgta aaatcttgat agctaaataa cttgccattt ctttatatgg aacgcatttt 2220
gggttgttta aaaatttata acagttataa agaaagattg taaactaaag tgtgctttat 2280
aaaaaaaagt tgtttataaa aacccctaaa aacaaaacaa acacacacac acacacatac 2340
acacacacac acaaaacttt gaggcagcgc attgttttgc atccttttgg cgtgatatcc 2400
atatgaaatt catggctttt tctttttttg catattaaag ataagacttc ctctaccacc 2460
acaccaaatg actactacac actgctcatt tgagaactgt cagctgagtg gggcaggctt 2520
gagttttcat ttcatatatc tatatgtcta taagtatata aatactatag ttatatagat 2580
aaagagatac gaatttctat agactgactt tttccatttt ttaaatgttc atgtcacatc 2640
ctaatagaaa gaaattactt ctagtcagtc atccaggctt acctgcttgg tctagaatgg 2700
atttttcccg gagccggaag ccaggaggaa actacaccac actaaaacat tgtctacagc 2760
tccagatgtt tctcatttta aacaactttc cactgacaac gaaagtaaag taaagtattg 2820
gattttttta aagggaacat gtgaatgaat acacaggact tattatatca gagtgagtaa 2880
tcggttggtt ggttgattga ttgattgatt gatacattca gcttcctgct gctagcaatg 2940
ccacgattta gatttaatga tgcttcagtg gaaatcaatc agaaggtatt ctgaccttgt 3000
gaacatcaga aggtattttt taactcccaa gcagtagcag gacgatgata gggctggagg 3060
gctatggatt cccagcccat ccctgtgaag gagtaggcca ctctttaagt gaaggattgg 3120
atgattgttc ataatacata aagttctctg taattacaac taaattatta tgccctcttc 3180
tcacagtcaa aaggaactgg gtggtttggt ttttgttgct tttttagatt tattgtccca 3240
tgtgggatga gtttttaaat gccacaagac ataatttaaa ataaataaac tttgggaaaa 3300
ggtgtaaaac agtagcccca tcacatttgt gatactgaca ggtatcaacc cagaagccca 3360
tgaactgtgt ttccatcctt tgcatttctc tgcgagtagt tccacacagg tttgtaagta 3420
agtaagaaag aaggcaaatt gattcaaatg ttacaaaaaa acccttcttg gtggattaga 3480
caggttaaat atataaacaa acaaacaaaa attgctcaaa aaagaggaga aaagctcaag 3540
aggaaaagct aaggactggt aggaaaaagc tttactcttt catgccattt tatttctttt 3600
tgatttttaa atcattcatt caatagatac caccgtgtga cctataattt tgcaaatctg 3660
ttacctctga catcaagtgt aattagcttt tggagagtgg gctgacatca agtgtaatta 3720
gcttttggag agtgggtttt gtccattatt aataattaat taattaacat caaacacggc 3780
ttctcatgct atttctacct cactttggtt ttggggtgtt cctgataatt gtgcacacct 3840
gagttcacag cttcaccact tgtccattgc gttattttct ttttccttta taattctttc 3900
tttttccttc ataattttca aaagaaaacc caaagctcta aggtaacaaa ttaccaaatt 3960
acatgaagat ttggtttttg tcttgcattt ttttccttta tgtgacgctg gaccttttct 4020
ttacccaagg atttttaaaa ctcagattta aaacaagggg ttactttaca tcctactaag 4080
aagtttaagt aagtaagttt cattctaaaa tcagaggtaa atagagtgca taaataattt 4140
tgttttaatc tttttgtttt tcttttagac acattagctc tggagtgagt ctgtcataat 4200
atttgaacaa aaattgagag ctttattgct gcattttaag cataattaat ttggacatta 4260
tttcgtgttg tgttctttat aaccaccaag tattaaactg taaatcataa tgtaactgaa 4320
gcataaacat cacatggcat gttttgtcat tgttttcagg tactgagttc ttacttgagt 4380
atcataatat attgtgtttt aacaccaaca ctgtaacatt tacgaattat ttttttaaac 4440
ttcagtttta ctgcattttc acaacatatc agacttcacc aaatatatgc cttactattg 4500
tattatagta ctgctttact gtgtatctca ataaagcacg cagttatgtt ac 4552
<210> 27
<211> 622
<212> PRT
<213> Homo sapiens
<400> 27
Met Arg Glu Gln Leu Lys Gly His Glu Thr Gln Thr Thr Cys Trp Asp
1 5 10 15
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
20 25 30
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
35 40 45
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
50 55 60
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
65 70 75 80
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
85 90 95
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
100 105 110
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
115 120 125
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
130 135 140
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
145 150 155 160
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
165 170 175
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
180 185 190
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
195 200 205
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
210 215 220
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
225 230 235 240
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
245 250 255
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
260 265 270
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
275 280 285
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
290 295 300
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
305 310 315 320
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
325 330 335
Asn Met Glu Thr Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr
340 345 350
His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn
355 360 365
Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile
370 375 380
Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln
385 390 395 400
Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser
405 410 415
Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
420 425 430
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln
435 440 445
Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met
450 455 460
Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu
465 470 475 480
Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln
485 490 495
Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu
500 505 510
Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr
515 520 525
Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln
530 535 540
Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly
545 550 555 560
Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu
565 570 575
Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly His
580 585 590
Asn Val Gly Ser Leu Phe His Met Ala Asp Asp Leu Gly Arg Ala Met
595 600 605
Glu Ser Leu Val Ser Val Met Thr Asp Glu Glu Gly Ala Glu
610 615 620
<210> 28
<211> 1571
<212> DNA
<213> Homo sapiens
<400> 28
actttcgggg agcccggcgg ctctgggaag ctcactcctc cactcgtacc cacactcgac 60
cgcggagccc ttgcagccat gagggaacag ctcaaaggcc acgagactca aacaacttgc 120
tgggaccatc ccaaaatgac agagctctac cagtctttag ctgacctgaa taatgtcaga 180
ttctcagctt ataggactgc catgaaactc cgaagactgc agaaggccct ttgcttggat 240
ctcttgagcc tgtcagctgc atgtgatgcc ttggaccagc acaacctcaa gcaaaatgac 300
cagcccatgg atatcctgca gattattaat tgtttgacca ctatttatga ccgcctggag 360
caagagcaca acaatttggt caacgtccct ctctgcgtgg atatgtgtct gaactggctg 420
ctgaatgttt atgatacggg acgaacaggg aggatccgtg tcctgtcttt taaaactggc 480
atcatttccc tgtgtaaagc acatttggaa gacaagtaca gatacctttt caagcaagtg 540
gcaagttcaa caggattttg tgaccagcgc aggctgggcc tccttctgca tgattctatc 600
caaattccaa gacagttggg tgaagttgca tcctttgggg gcagtaacat tgagccaagt 660
gtccggagct gcttccaatt tgctaataat aagccagaga tcgaagcggc cctcttccta 720
gactggatga gactggaacc ccagtccatg gtgtggctgc ccgtcctgca cagagtggct 780
gctgcagaaa ctgccaagca tcaggccaaa tgtaacatct gcaaagagtg tccaatcatt 840
ggattcaggt acaggagtct aaagcacttt aattatgaca tctgccaaag ctgctttttt 900
tctggtcgag ttgcaaaagg ccataaaatg cactatccca tggtggaata ttgcactccg 960
actacatcag gagaagatgt tcgagacttt gccaaggtac taaaaaacaa atttcgaacc 1020
aaaaggtatt ttgcgaagca tccccgaatg ggctacctgc cagtgcagac tgtcttagag 1080
ggggacaaca tggaaacgtg agtagtagca aaagcagaac acactcttgt ttgatgtata 1140
tttgaactcc tctcagctga acaccctcct tcactcccaa atgcaaacag tctcttctat 1200
ttctttcttt ttatttacat tagctgaaaa gagaaaaata agctgatgtc cagttgccac 1260
tttcccacgt cacttgacaa tttctttttc caaaagttaa actttatctc acagggggaa 1320
aaaaaaaaaa aaaccacaac acaatacagc cactaattgc cttacaagcc ttataagaaa 1380
tatgggactg tttacaaatg agtgattcca gtatttcatt ttgattttcc tctctcacaa 1440
atcagtaaat gtgtgtcttt ttgtatctca ttgtgtggtc atatctagtc acttgtttct 1500
actcaaaaga aaatatagtc acaggaaact acttcacagt aagtagtaat gattctcaag 1560
atcaaagggg a 1571
<210> 29
<211> 340
<212> PRT
<213> Homo sapiens
<400> 29
Met Arg Glu Gln Leu Lys Gly His Glu Thr Gln Thr Thr Cys Trp Asp
1 5 10 15
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
20 25 30
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
35 40 45
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
50 55 60
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
65 70 75 80
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
85 90 95
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
100 105 110
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
115 120 125
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
130 135 140
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
145 150 155 160
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
165 170 175
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
180 185 190
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
195 200 205
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
210 215 220
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
225 230 235 240
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
245 250 255
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
260 265 270
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
275 280 285
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
290 295 300
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
305 310 315 320
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
325 330 335
Asn Met Glu Thr
340
<210> 30
<211> 7080
<212> DNA
<213> Homo sapiens
<400> 30
acactagcaa tggcaaagct ttgtgcggag gcattgctgg ctgctctgaa ctaaaagcat 60
ccgtggggac cgaaagaggt ttttgcacac cttattaagg aactccagga tggcattggg 120
cagcggcaaa ctgttgtcag aacattgaat gcaactgggg aagaaataat tcagcaatcc 180
tcaaaaacag atgccagtat tctacaggaa aaattgggaa gcctgaatct gcggtggcag 240
gaggtctgca aacagctgtc agacagaaaa aagaggctag aagaacaaaa gaatatcttg 300
tcagaatttc aaagagattt aaatgaattt gttttatggt tggaggaagc agataacatt 360
gctagtatcc cacttgaacc tggaaaagag cagcaactaa aagaaaagct tgagcaagtc 420
aagttactgg tggaagagtt gcccctgcgc cagggaattc tcaaacaatt aaatgaaact 480
ggaggacccg tgcttgtaag tgctcccata agcccagaag agcaagataa acttgaaaat 540
aagctcaagc agacaaatct ccagtggata aaggtttcca gagctttacc tgagaaacaa 600
ggagaaattg aagctcaaat aaaagacctt gggcagcttg aaaaaaagct tgaagacctt 660
gaagagcagt taaatcatct gctgctgtgg ttatctccta ttaggaatca gttggaaatt 720
tataaccaac caaaccaaga aggaccattt gacgttcagg aaactgaaat agcagttcaa 780
gctaaacaac cggatgtgga agagattttg tctaaagggc agcatttgta caaggaaaaa 840
ccagccactc agccagtgaa gaggaagtta gaagatctga gctctgagtg gaaggcggta 900
aaccgtttac ttcaagagct gagggcaaag cagcctgacc tagctcctgg actgaccact 960
attggagcct ctcctactca gactgttact ctggtgacac aacctgtggt tactaaggaa 1020
actgccatct ccaaactaga aatgccatct tccttgatgt tggaggtacc tgctctggca 1080
gatttcaacc gggcttggac agaacttacc gactggcttt ctctgcttga tcaagttata 1140
aaatcacaga gggtgatggt gggtgacctt gaggatatca acgagatgat catcaagcag 1200
aaggcaacaa tgcaggattt ggaacagagg cgtccccagt tggaagaact cattaccgct 1260
gcccaaaatt tgaaaaacaa gaccagcaat caagaggcta gaacaatcat tacggatcga 1320
attgaaagaa ttcagaatca gtgggatgaa gtacaagaac accttcagaa ccggaggcaa 1380
cagttgaatg aaatgttaaa ggattcaaca caatggctgg aagctaagga agaagctgag 1440
caggtcttag gacaggccag agccaagctt gagtcatgga aggagggtcc ctatacagta 1500
gatgcaatcc aaaagaaaat cacagaaacc aagcagttgg ccaaagacct ccgccagtgg 1560
cagacaaatg tagatgtggc aaatgacttg gccctgaaac ttctccggga ttattctgca 1620
gatgatacca gaaaagtcca catgataaca gagaatatca atgcctcttg gagaagcatt 1680
cataaaaggg tgagtgagcg agaggctgct ttggaagaaa ctcatagatt actgcaacag 1740
ttccccctgg acctggaaaa gtttcttgcc tggcttacag aagctgaaac aactgccaat 1800
gtcctacagg atgctacccg taaggaaagg ctcctagaag actccaaggg agtaaaagag 1860
ctgatgaaac aatggcaaga cctccaaggt gaaattgaag ctcacacaga tgtttatcac 1920
aacctggatg aaaacagcca aaaaatcctg agatccctgg aaggttccga tgatgcagtc 1980
ctgttacaaa gacgtttgga taacatgaac ttcaagtgga gtgaacttcg gaaaaagtct 2040
ctcaacatta ggtcccattt ggaagccagt tctgaccagt ggaagcgtct gcacctttct 2100
ctgcaggaac ttctggtgtg gctacagctg aaagatgatg aattaagccg gcaggcacct 2160
attggaggcg actttccagc agttcagaag cagaacgatg tacatagggc cttcaagagg 2220
gaattgaaaa ctaaagaacc tgtaatcatg agtactcttg agactgtacg aatatttctg 2280
acagagcagc ctttggaagg actagagaaa ctctaccagg agcccagaga gctgcctcct 2340
gaggagagag cccagaatgt cactcggctt ctacgaaagc aggctgagga ggtcaatact 2400
gagtgggaaa aattgaacct gcactccgct gactggcaga gaaaaataga tgagaccctt 2460
gaaagactcc aggaacttca agaggccacg gatgagctgg acctcaagct gcgccaagct 2520
gaggtgatca agggatcctg gcagcccgtg ggcgatctcc tcattgactc tctccaagat 2580
cacctcgaga aagtcaaggc acttcgagga gaaattgcgc ctctgaaaga gaacgtgagc 2640
cacgtcaatg accttgctcg ccagcttacc actttgggca ttcagctctc accgtataac 2700
ctcagcactc tggaagacct gaacaccaga tggaagcttc tgcaggtggc cgtcgaggac 2760
cgagtcaggc agctgcatga agcccacagg gactttggtc cagcatctca gcactttctt 2820
tccacgtctg tccagggtcc ctgggagaga gccatctcgc caaacaaagt gccctactat 2880
atcaaccacg agactcaaac aacttgctgg gaccatccca aaatgacaga gctctaccag 2940
tctttagctg acctgaataa tgtcagattc tcagcttata ggactgccat gaaactccga 3000
agactgcaga aggccctttg cttggatctc ttgagcctgt cagctgcatg tgatgccttg 3060
gaccagcaca acctcaagca aaatgaccag cccatggata tcctgcagat tattaattgt 3120
ttgaccacta tttatgaccg cctggagcaa gagcacaaca atttggtcaa cgtccctctc 3180
tgcgtggata tgtgtctgaa ctggctgctg aatgtttatg atacgggacg aacagggagg 3240
atccgtgtcc tgtcttttaa aactggcatc atttccctgt gtaaagcaca tttggaagac 3300
aagtacagat accttttcaa gcaagtggca agttcaacag gattttgtga ccagcgcagg 3360
ctgggcctcc ttctgcatga ttctatccaa attccaagac agttgggtga agttgcatcc 3420
tttgggggca gtaacattga gccaagtgtc cggagctgct tccaatttgc taataataag 3480
ccagagatcg aagcggccct cttcctagac tggatgagac tggaacccca gtccatggtg 3540
tggctgcccg tcctgcacag agtggctgct gcagaaactg ccaagcatca ggccaaatgt 3600
aacatctgca aagagtgtcc aatcattgga ttcaggtaca ggagtctaaa gcactttaat 3660
tatgacatct gccaaagctg ctttttttct ggtcgagttg caaaaggcca taaaatgcac 3720
tatcccatgg tggaatattg cactccgact acatcaggag aagatgttcg agactttgcc 3780
aaggtactaa aaaacaaatt tcgaaccaaa aggtattttg cgaagcatcc ccgaatgggc 3840
tacctgccag tgcagactgt cttagagggg gacaacatgg aaacgaatct gcaagcagaa 3900
tatgaccgtc taaagcagca gcacgaacat aaaggcctgt ccccactgcc gtcccctcct 3960
gaaatgatgc ccacctctcc ccagagtccc cgggatgctg agctcattgc tgaggccaag 4020
ctactgcgtc aacacaaagg ccgcctggaa gccaggatgc aaatcctgga agaccacaat 4080
aaacagctgg agtcacagtt acacaggcta aggcagctgc tggagcaacc ccaggcagag 4140
gccaaagtga atggcacaac ggtgtcctct ccttctacct ctctacagag gtccgacagc 4200
agtcagccta tgctgctccg agtggttggc agtcaaactt cggactccat gggtgaggaa 4260
gatcttctca gtcctcccca ggacacaagc acagggttag aggaggtgat ggagcaactc 4320
aacaactcct tccctagttc aagaggaaga aatacccctg gaaagccaat gagagaggac 4380
acaatgtagg aagtcttttc cacatggcag atgatttggg cagagcgatg gagtccttag 4440
tatcagtcat gacagatgaa gaaggagcag aataaatgtt ttacaactcc tgattcccgc 4500
atggttttta taatattcat acaacaaaga ggattagaca gtaagagttt acaagaaata 4560
aatctatatt tttgtgaagg gtagtggtat tatactgtag atttcagtag tttctaagtc 4620
tgttattgtt ttgttaacaa tggcaggttt tacacgtcta tgcaattgta caaaaaagtt 4680
ataagaaaac tacatgtaaa atcttgatag ctaaataact tgccatttct ttatatggaa 4740
cgcattttgg gttgtttaaa aatttataac agttataaag aaagattgta aactaaagtg 4800
tgctttataa aaaaaagttg tttataaaaa cccctaaaaa caaaacaaac acacacacac 4860
acacatacac acacacacac aaaactttga ggcagcgcat tgttttgcat ccttttggcg 4920
tgatatccat atgaaattca tggctttttc tttttttgca tattaaagat aagacttcct 4980
ctaccaccac accaaatgac tactacacac tgctcatttg agaactgtca gctgagtggg 5040
gcaggcttga gttttcattt catatatcta tatgtctata agtatataaa tactatagtt 5100
atatagataa agagatacga atttctatag actgactttt tccatttttt aaatgttcat 5160
gtcacatcct aatagaaaga aattacttct agtcagtcat ccaggcttac ctgcttggtc 5220
tagaatggat ttttcccgga gccggaagcc aggaggaaac tacaccacac taaaacattg 5280
tctacagctc cagatgtttc tcattttaaa caactttcca ctgacaacga aagtaaagta 5340
aagtattgga tttttttaaa gggaacatgt gaatgaatac acaggactta ttatatcaga 5400
gtgagtaatc ggttggttgg ttgattgatt gattgattga tacattcagc ttcctgctgc 5460
tagcaatgcc acgatttaga tttaatgatg cttcagtgga aatcaatcag aaggtattct 5520
gaccttgtga acatcagaag gtatttttta actcccaagc agtagcagga cgatgatagg 5580
gctggagggc tatggattcc cagcccatcc ctgtgaagga gtaggccact ctttaagtga 5640
aggattggat gattgttcat aatacataaa gttctctgta attacaacta aattattatg 5700
ccctcttctc acagtcaaaa ggaactgggt ggtttggttt ttgttgcttt tttagattta 5760
ttgtcccatg tgggatgagt ttttaaatgc cacaagacat aatttaaaat aaataaactt 5820
tgggaaaagg tgtaaaacag tagccccatc acatttgtga tactgacagg tatcaaccca 5880
gaagcccatg aactgtgttt ccatcctttg catttctctg cgagtagttc cacacaggtt 5940
tgtaagtaag taagaaagaa ggcaaattga ttcaaatgtt acaaaaaaac ccttcttggt 6000
ggattagaca ggttaaatat ataaacaaac aaacaaaaat tgctcaaaaa agaggagaaa 6060
agctcaagag gaaaagctaa ggactggtag gaaaaagctt tactctttca tgccatttta 6120
tttctttttg atttttaaat cattcattca atagatacca ccgtgtgacc tataattttg 6180
caaatctgtt acctctgaca tcaagtgtaa ttagcttttg gagagtgggc tgacatcaag 6240
tgtaattagc ttttggagag tgggttttgt ccattattaa taattaatta attaacatca 6300
aacacggctt ctcatgctat ttctacctca ctttggtttt ggggtgttcc tgataattgt 6360
gcacacctga gttcacagct tcaccacttg tccattgcgt tattttcttt ttcctttata 6420
attctttctt tttccttcat aattttcaaa agaaaaccca aagctctaag gtaacaaatt 6480
accaaattac atgaagattt ggtttttgtc ttgcattttt ttcctttatg tgacgctgga 6540
ccttttcttt acccaaggat ttttaaaact cagatttaaa acaaggggtt actttacatc 6600
ctactaagaa gtttaagtaa gtaagtttca ttctaaaatc agaggtaaat agagtgcata 6660
aataattttg ttttaatctt tttgtttttc ttttagacac attagctctg gagtgagtct 6720
gtcataatat ttgaacaaaa attgagagct ttattgctgc attttaagca taattaattt 6780
ggacattatt tcgtgttgtg ttctttataa ccaccaagta ttaaactgta aatcataatg 6840
taactgaagc ataaacatca catggcatgt tttgtcattg ttttcaggta ctgagttctt 6900
acttgagtat cataatatat tgtgttttaa caccaacact gtaacattta cgaattattt 6960
ttttaaactt cagttttact gcattttcac aacatatcag acttcaccaa atatatgcct 7020
tactattgta ttatagtact gctttactgt gtatctcaat aaagcacgca gttatgttac 7080
<210> 31
<211> 1115
<212> PRT
<213> Homo sapiens
<400> 31
Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn
1 5 10 15
Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val
20 25 30
Ile Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
35 40 45
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg
50 55 60
Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys
65 70 75 80
Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg
85 90 95
Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg
100 105 110
Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala
115 120 125
Lys Glu Glu Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu
130 135 140
Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile
145 150 155 160
Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn
165 170 175
Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser
180 185 190
Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile Asn Ala
195 200 205
Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu
210 215 220
Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys
225 230 235 240
Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln
245 250 255
Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys
260 265 270
Glu Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
275 280 285
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg
290 295 300
Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp
305 310 315 320
Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile
325 330 335
Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu
340 345 350
Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu
355 360 365
Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln
370 375 380
Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro
385 390 395 400
Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
405 410 415
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro
420 425 430
Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala
435 440 445
Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp
450 455 460
Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln
465 470 475 480
Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile
485 490 495
Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln
500 505 510
Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
515 520 525
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
530 535 540
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu
545 550 555 560
Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg
565 570 575
Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe
580 585 590
Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn
595 600 605
Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp
610 615 620
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
625 630 635 640
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
645 650 655
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
660 665 670
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
675 680 685
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
690 695 700
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
705 710 715 720
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
725 730 735
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
740 745 750
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
755 760 765
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
770 775 780
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
785 790 795 800
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
805 810 815
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
820 825 830
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
835 840 845
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
850 855 860
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
865 870 875 880
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
885 890 895
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
900 905 910
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
915 920 925
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
930 935 940
Asn Met Glu Thr Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln
945 950 955 960
His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met
965 970 975
Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala
980 985 990
Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile
995 1000 1005
Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu
1010 1015 1020
Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly
1025 1030 1035
Thr Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser
1040 1045 1050
Ser Gln Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp
1055 1060 1065
Ser Met Gly Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser
1070 1075 1080
Thr Gly Leu Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro
1085 1090 1095
Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys Pro Met Arg Glu Asp
1100 1105 1110
Thr Met
1115
<210> 32
<211> 7378
<212> DNA
<213> Homo sapiens
<400> 32
acactagcaa tggcaaagct ttgtgcggag gcattgctgg ctgctctgaa ctaaaagcat 60
ccgtggggac cgaaagaggt ttttgcacac cttattaagg aactccagga tggcattggg 120
cagcggcaaa ctgttgtcag aacattgaat gcaactgggg aagaaataat tcagcaatcc 180
tcaaaaacag atgccagtat tctacaggaa aaattgggaa gcctgaatct gcggtggcag 240
gaggtctgca aacagctgtc agacagaaaa aagaggctag aagaacaaaa gaatatcttg 300
tcagaatttc aaagagattt aaatgaattt gttttatggt tggaggaagc agataacatt 360
gctagtatcc cacttgaacc tggaaaagag cagcaactaa aagaaaagct tgagcaagtc 420
aagttactgg tggaagagtt gcccctgcgc cagggaattc tcaaacaatt aaatgaaact 480
ggaggacccg tgcttgtaag tgctcccata agcccagaag agcaagataa acttgaaaat 540
aagctcaagc agacaaatct ccagtggata aaggtttcca gagctttacc tgagaaacaa 600
ggagaaattg aagctcaaat aaaagacctt gggcagcttg aaaaaaagct tgaagacctt 660
gaagagcagt taaatcatct gctgctgtgg ttatctccta ttaggaatca gttggaaatt 720
tataaccaac caaaccaaga aggaccattt gacgttcagg aaactgaaat agcagttcaa 780
gctaaacaac cggatgtgga agagattttg tctaaagggc agcatttgta caaggaaaaa 840
ccagccactc agccagtgaa gaggaagtta gaagatctga gctctgagtg gaaggcggta 900
aaccgtttac ttcaagagct gagggcaaag cagcctgacc tagctcctgg actgaccact 960
attggagcct ctcctactca gactgttact ctggtgacac aacctgtggt tactaaggaa 1020
actgccatct ccaaactaga aatgccatct tccttgatgt tggaggtacc tgctctggca 1080
gatttcaacc gggcttggac agaacttacc gactggcttt ctctgcttga tcaagttata 1140
aaatcacaga gggtgatggt gggtgacctt gaggatatca acgagatgat catcaagcag 1200
aaggcaacaa tgcaggattt ggaacagagg cgtccccagt tggaagaact cattaccgct 1260
gcccaaaatt tgaaaaacaa gaccagcaat caagaggcta gaacaatcat tacggatcga 1320
attgaaagaa ttcagaatca gtgggatgaa gtacaagaac accttcagaa ccggaggcaa 1380
cagttgaatg aaatgttaaa ggattcaaca caatggctgg aagctaagga agaagctgag 1440
caggtcttag gacaggccag agccaagctt gagtcatgga aggagggtcc ctatacagta 1500
gatgcaatcc aaaagaaaat cacagaaacc aagcagttgg ccaaagacct ccgccagtgg 1560
cagacaaatg tagatgtggc aaatgacttg gccctgaaac ttctccggga ttattctgca 1620
gatgatacca gaaaagtcca catgataaca gagaatatca atgcctcttg gagaagcatt 1680
cataaaaggg tgagtgagcg agaggctgct ttggaagaaa ctcatagatt actgcaacag 1740
ttccccctgg acctggaaaa gtttcttgcc tggcttacag aagctgaaac aactgccaat 1800
gtcctacagg atgctacccg taaggaaagg ctcctagaag actccaaggg agtaaaagag 1860
ctgatgaaac aatggcaaga cctccaaggt gaaattgaag ctcacacaga tgtttatcac 1920
aacctggatg aaaacagcca aaaaatcctg agatccctgg aaggttccga tgatgcagtc 1980
ctgttacaaa gacgtttgga taacatgaac ttcaagtgga gtgaacttcg gaaaaagtct 2040
ctcaacatta ggtcccattt ggaagccagt tctgaccagt ggaagcgtct gcacctttct 2100
ctgcaggaac ttctggtgtg gctacagctg aaagatgatg aattaagccg gcaggcacct 2160
attggaggcg actttccagc agttcagaag cagaacgatg tacatagggc cttcaagagg 2220
gaattgaaaa ctaaagaacc tgtaatcatg agtactcttg agactgtacg aatatttctg 2280
acagagcagc ctttggaagg actagagaaa ctctaccagg agcccagaga gctgcctcct 2340
gaggagagag cccagaatgt cactcggctt ctacgaaagc aggctgagga ggtcaatact 2400
gagtgggaaa aattgaacct gcactccgct gactggcaga gaaaaataga tgagaccctt 2460
gaaagactcc aggaacttca agaggccacg gatgagctgg acctcaagct gcgccaagct 2520
gaggtgatca agggatcctg gcagcccgtg ggcgatctcc tcattgactc tctccaagat 2580
cacctcgaga aagtcaaggc acttcgagga gaaattgcgc ctctgaaaga gaacgtgagc 2640
cacgtcaatg accttgctcg ccagcttacc actttgggca ttcagctctc accgtataac 2700
ctcagcactc tggaagacct gaacaccaga tggaagcttc tgcaggtggc cgtcgaggac 2760
cgagtcaggc agctgcatga agcccacagg gactttggtc cagcatctca gcactttctt 2820
tccacgtctg tccagggtcc ctgggagaga gccatctcgc caaacaaagt gccctactat 2880
atcaaccacg agactcaaac aacttgctgg gaccatccca aaatgacaga gctctaccag 2940
tctttagctg acctgaataa tgtcagattc tcagcttata ggactgccat gaaactccga 3000
agactgcaga aggccctttg cttggatctc ttgagcctgt cagctgcatg tgatgccttg 3060
gaccagcaca acctcaagca aaatgaccag cccatggata tcctgcagat tattaattgt 3120
ttgaccacta tttatgaccg cctggagcaa gagcacaaca atttggtcaa cgtccctctc 3180
tgcgtggata tgtgtctgaa ctggctgctg aatgtttatg atacgggacg aacagggagg 3240
atccgtgtcc tgtcttttaa aactggcatc atttccctgt gtaaagcaca tttggaagac 3300
aagtacagat accttttcaa gcaagtggca agttcaacag gattttgtga ccagcgcagg 3360
ctgggcctcc ttctgcatga ttctatccaa attccaagac agttgggtga agttgcatcc 3420
tttgggggca gtaacattga gccaagtgtc cggagctgct tccaatttgc taataataag 3480
ccagagatcg aagcggccct cttcctagac tggatgagac tggaacccca gtccatggtg 3540
tggctgcccg tcctgcacag agtggctgct gcagaaactg ccaagcatca ggccaaatgt 3600
aacatctgca aagagtgtcc aatcattgga ttcaggtaca ggagtctaaa gcactttaat 3660
tatgacatct gccaaagctg ctttttttct ggtcgagttg caaaaggcca taaaatgcac 3720
tatcccatgg tggaatattg cactccgact acatcaggag aagatgttcg agactttgcc 3780
aaggtactaa aaaacaaatt tcgaaccaaa aggtattttg cgaagcatcc ccgaatgggc 3840
tacctgccag tgcagactgt cttagagggg gacaacatgg aaactcccgt tactctgatc 3900
aacttctggc cagtagattc tgcgcctgcc tcgtcccctc agctttcaca cgatgatact 3960
cattcacgca ttgaacatta tgctagcagg ctagcagaaa tggaaaacag caatggatct 4020
tatctaaatg atagcatctc tcctaatgag agcatagatg atgaacattt gttaatccag 4080
cattactgcc aaagtttgaa ccaggactcc cccctgagcc agcctcgtag tcctgcccag 4140
atcttgattt ccttagagag tgaggaaaga ggggagctag agagaatcct agcagatctt 4200
gaggaagaaa acaggaatct gcaagcagaa tatgaccgtc taaagcagca gcacgaacat 4260
aaaggcctgt ccccactgcc gtcccctcct gaaatgatgc ccacctctcc ccagagtccc 4320
cgggatgctg agctcattgc tgaggccaag ctactgcgtc aacacaaagg ccgcctggaa 4380
gccaggatgc aaatcctgga agaccacaat aaacagctgg agtcacagtt acacaggcta 4440
aggcagctgc tggagcaacc ccaggcagag gccaaagtga atggcacaac ggtgtcctct 4500
ccttctacct ctctacagag gtccgacagc agtcagccta tgctgctccg agtggttggc 4560
agtcaaactt cggactccat gggtgaggaa gatcttctca gtcctcccca ggacacaagc 4620
acagggttag aggaggtgat ggagcaactc aacaactcct tccctagttc aagaggacac 4680
aatgtaggaa gtcttttcca catggcagat gatttgggca gagcgatgga gtccttagta 4740
tcagtcatga cagatgaaga aggagcagaa taaatgtttt acaactcctg attcccgcat 4800
ggtttttata atattcatac aacaaagagg attagacagt aagagtttac aagaaataaa 4860
tctatatttt tgtgaagggt agtggtatta tactgtagat ttcagtagtt tctaagtctg 4920
ttattgtttt gttaacaatg gcaggtttta cacgtctatg caattgtaca aaaaagttat 4980
aagaaaacta catgtaaaat cttgatagct aaataacttg ccatttcttt atatggaacg 5040
cattttgggt tgtttaaaaa tttataacag ttataaagaa agattgtaaa ctaaagtgtg 5100
ctttataaaa aaaagttgtt tataaaaacc cctaaaaaca aaacaaacac acacacacac 5160
acatacacac acacacacaa aactttgagg cagcgcattg ttttgcatcc ttttggcgtg 5220
atatccatat gaaattcatg gctttttctt tttttgcata ttaaagataa gacttcctct 5280
accaccacac caaatgacta ctacacactg ctcatttgag aactgtcagc tgagtggggc 5340
aggcttgagt tttcatttca tatatctata tgtctataag tatataaata ctatagttat 5400
atagataaag agatacgaat ttctatagac tgactttttc cattttttaa atgttcatgt 5460
cacatcctaa tagaaagaaa ttacttctag tcagtcatcc aggcttacct gcttggtcta 5520
gaatggattt ttcccggagc cggaagccag gaggaaacta caccacacta aaacattgtc 5580
tacagctcca gatgtttctc attttaaaca actttccact gacaacgaaa gtaaagtaaa 5640
gtattggatt tttttaaagg gaacatgtga atgaatacac aggacttatt atatcagagt 5700
gagtaatcgg ttggttggtt gattgattga ttgattgata cattcagctt cctgctgcta 5760
gcaatgccac gatttagatt taatgatgct tcagtggaaa tcaatcagaa ggtattctga 5820
ccttgtgaac atcagaaggt attttttaac tcccaagcag tagcaggacg atgatagggc 5880
tggagggcta tggattccca gcccatccct gtgaaggagt aggccactct ttaagtgaag 5940
gattggatga ttgttcataa tacataaagt tctctgtaat tacaactaaa ttattatgcc 6000
ctcttctcac agtcaaaagg aactgggtgg tttggttttt gttgcttttt tagatttatt 6060
gtcccatgtg ggatgagttt ttaaatgcca caagacataa tttaaaataa ataaactttg 6120
ggaaaaggtg taaaacagta gccccatcac atttgtgata ctgacaggta tcaacccaga 6180
agcccatgaa ctgtgtttcc atcctttgca tttctctgcg agtagttcca cacaggtttg 6240
taagtaagta agaaagaagg caaattgatt caaatgttac aaaaaaaccc ttcttggtgg 6300
attagacagg ttaaatatat aaacaaacaa acaaaaattg ctcaaaaaag aggagaaaag 6360
ctcaagagga aaagctaagg actggtagga aaaagcttta ctctttcatg ccattttatt 6420
tctttttgat ttttaaatca ttcattcaat agataccacc gtgtgaccta taattttgca 6480
aatctgttac ctctgacatc aagtgtaatt agcttttgga gagtgggctg acatcaagtg 6540
taattagctt ttggagagtg ggttttgtcc attattaata attaattaat taacatcaaa 6600
cacggcttct catgctattt ctacctcact ttggttttgg ggtgttcctg ataattgtgc 6660
acacctgagt tcacagcttc accacttgtc cattgcgtta ttttcttttt cctttataat 6720
tctttctttt tccttcataa ttttcaaaag aaaacccaaa gctctaaggt aacaaattac 6780
caaattacat gaagatttgg tttttgtctt gcattttttt cctttatgtg acgctggacc 6840
ttttctttac ccaaggattt ttaaaactca gatttaaaac aaggggttac tttacatcct 6900
actaagaagt ttaagtaagt aagtttcatt ctaaaatcag aggtaaatag agtgcataaa 6960
taattttgtt ttaatctttt tgtttttctt ttagacacat tagctctgga gtgagtctgt 7020
cataatattt gaacaaaaat tgagagcttt attgctgcat tttaagcata attaatttgg 7080
acattatttc gtgttgtgtt ctttataacc accaagtatt aaactgtaaa tcataatgta 7140
actgaagcat aaacatcaca tggcatgttt tgtcattgtt ttcaggtact gagttcttac 7200
ttgagtatca taatatattg tgttttaaca ccaacactgt aacatttacg aattattttt 7260
ttaaacttca gttttactgc attttcacaa catatcagac ttcaccaaat atatgcctta 7320
ctattgtatt atagtactgc tttactgtgt atctcaataa agcacgcagt tatgttac 7378
<210> 33
<211> 1243
<212> PRT
<213> Homo sapiens
<400> 33
Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn
1 5 10 15
Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val
20 25 30
Ile Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
35 40 45
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg
50 55 60
Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys
65 70 75 80
Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg
85 90 95
Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg
100 105 110
Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala
115 120 125
Lys Glu Glu Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu
130 135 140
Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile
145 150 155 160
Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn
165 170 175
Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser
180 185 190
Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile Asn Ala
195 200 205
Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu
210 215 220
Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys
225 230 235 240
Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln
245 250 255
Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys
260 265 270
Glu Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
275 280 285
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg
290 295 300
Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp
305 310 315 320
Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile
325 330 335
Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu
340 345 350
Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu
355 360 365
Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln
370 375 380
Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro
385 390 395 400
Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
405 410 415
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro
420 425 430
Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala
435 440 445
Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp
450 455 460
Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln
465 470 475 480
Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile
485 490 495
Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln
500 505 510
Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
515 520 525
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
530 535 540
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu
545 550 555 560
Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg
565 570 575
Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe
580 585 590
Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn
595 600 605
Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp
610 615 620
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
625 630 635 640
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
645 650 655
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
660 665 670
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
675 680 685
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
690 695 700
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
705 710 715 720
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
725 730 735
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
740 745 750
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
755 760 765
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
770 775 780
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
785 790 795 800
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
805 810 815
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
820 825 830
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
835 840 845
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
850 855 860
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
865 870 875 880
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
885 890 895
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
900 905 910
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
915 920 925
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
930 935 940
Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser
945 950 955 960
Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg
965 970 975
Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly
980 985 990
Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
995 1000 1005
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser
1010 1015 1020
Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu
1025 1030 1035
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
1040 1045 1050
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys
1055 1060 1065
Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro
1070 1075 1080
Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu
1085 1090 1095
Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu
1100 1105 1110
Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser
1115 1120 1125
Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu
1130 1135 1140
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu
1145 1150 1155
Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly
1160 1165 1170
Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
1175 1180 1185
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu
1190 1195 1200
Asn Asn Ser Phe Pro Ser Ser Arg Gly His Asn Val Gly Ser Leu
1205 1210 1215
Phe His Met Ala Asp Asp Leu Gly Arg Ala Met Glu Ser Leu Val
1220 1225 1230
Ser Val Met Thr Asp Glu Glu Gly Ala Glu
1235 1240
<210> 34
<211> 7339
<212> DNA
<213> Homo sapiens
<400> 34
acactagcaa tggcaaagct ttgtgcggag gcattgctgg ctgctctgaa ctaaaagcat 60
ccgtggggac cgaaagaggt ttttgcacac cttattaagg aactccagga tggcattggg 120
cagcggcaaa ctgttgtcag aacattgaat gcaactgggg aagaaataat tcagcaatcc 180
tcaaaaacag atgccagtat tctacaggaa aaattgggaa gcctgaatct gcggtggcag 240
gaggtctgca aacagctgtc agacagaaaa aagaggctag aagaacaaaa gaatatcttg 300
tcagaatttc aaagagattt aaatgaattt gttttatggt tggaggaagc agataacatt 360
gctagtatcc cacttgaacc tggaaaagag cagcaactaa aagaaaagct tgagcaagtc 420
aagttactgg tggaagagtt gcccctgcgc cagggaattc tcaaacaatt aaatgaaact 480
ggaggacccg tgcttgtaag tgctcccata agcccagaag agcaagataa acttgaaaat 540
aagctcaagc agacaaatct ccagtggata aaggtttcca gagctttacc tgagaaacaa 600
ggagaaattg aagctcaaat aaaagacctt gggcagcttg aaaaaaagct tgaagacctt 660
gaagagcagt taaatcatct gctgctgtgg ttatctccta ttaggaatca gttggaaatt 720
tataaccaac caaaccaaga aggaccattt gacgttcagg aaactgaaat agcagttcaa 780
gctaaacaac cggatgtgga agagattttg tctaaagggc agcatttgta caaggaaaaa 840
ccagccactc agccagtgaa gaggaagtta gaagatctga gctctgagtg gaaggcggta 900
aaccgtttac ttcaagagct gagggcaaag cagcctgacc tagctcctgg actgaccact 960
attggagcct ctcctactca gactgttact ctggtgacac aacctgtggt tactaaggaa 1020
actgccatct ccaaactaga aatgccatct tccttgatgt tggaggtacc tgctctggca 1080
gatttcaacc gggcttggac agaacttacc gactggcttt ctctgcttga tcaagttata 1140
aaatcacaga gggtgatggt gggtgacctt gaggatatca acgagatgat catcaagcag 1200
aaggcaacaa tgcaggattt ggaacagagg cgtccccagt tggaagaact cattaccgct 1260
gcccaaaatt tgaaaaacaa gaccagcaat caagaggcta gaacaatcat tacggatcga 1320
attgaaagaa ttcagaatca gtgggatgaa gtacaagaac accttcagaa ccggaggcaa 1380
cagttgaatg aaatgttaaa ggattcaaca caatggctgg aagctaagga agaagctgag 1440
caggtcttag gacaggccag agccaagctt gagtcatgga aggagggtcc ctatacagta 1500
gatgcaatcc aaaagaaaat cacagaaacc aagcagttgg ccaaagacct ccgccagtgg 1560
cagacaaatg tagatgtggc aaatgacttg gccctgaaac ttctccggga ttattctgca 1620
gatgatacca gaaaagtcca catgataaca gagaatatca atgcctcttg gagaagcatt 1680
cataaaaggg tgagtgagcg agaggctgct ttggaagaaa ctcatagatt actgcaacag 1740
ttccccctgg acctggaaaa gtttcttgcc tggcttacag aagctgaaac aactgccaat 1800
gtcctacagg atgctacccg taaggaaagg ctcctagaag actccaaggg agtaaaagag 1860
ctgatgaaac aatggcaaga cctccaaggt gaaattgaag ctcacacaga tgtttatcac 1920
aacctggatg aaaacagcca aaaaatcctg agatccctgg aaggttccga tgatgcagtc 1980
ctgttacaaa gacgtttgga taacatgaac ttcaagtgga gtgaacttcg gaaaaagtct 2040
ctcaacatta ggtcccattt ggaagccagt tctgaccagt ggaagcgtct gcacctttct 2100
ctgcaggaac ttctggtgtg gctacagctg aaagatgatg aattaagccg gcaggcacct 2160
attggaggcg actttccagc agttcagaag cagaacgatg tacatagggc cttcaagagg 2220
gaattgaaaa ctaaagaacc tgtaatcatg agtactcttg agactgtacg aatatttctg 2280
acagagcagc ctttggaagg actagagaaa ctctaccagg agcccagaga gctgcctcct 2340
gaggagagag cccagaatgt cactcggctt ctacgaaagc aggctgagga ggtcaatact 2400
gagtgggaaa aattgaacct gcactccgct gactggcaga gaaaaataga tgagaccctt 2460
gaaagactcc aggaacttca agaggccacg gatgagctgg acctcaagct gcgccaagct 2520
gaggtgatca agggatcctg gcagcccgtg ggcgatctcc tcattgactc tctccaagat 2580
cacctcgaga aagtcaaggc acttcgagga gaaattgcgc ctctgaaaga gaacgtgagc 2640
cacgtcaatg accttgctcg ccagcttacc actttgggca ttcagctctc accgtataac 2700
ctcagcactc tggaagacct gaacaccaga tggaagcttc tgcaggtggc cgtcgaggac 2760
cgagtcaggc agctgcatga agcccacagg gactttggtc cagcatctca gcactttctt 2820
tccacgtctg tccagggtcc ctgggagaga gccatctcgc caaacaaagt gccctactat 2880
atcaaccacg agactcaaac aacttgctgg gaccatccca aaatgacaga gctctaccag 2940
tctttagctg acctgaataa tgtcagattc tcagcttata ggactgccat gaaactccga 3000
agactgcaga aggccctttg cttggatctc ttgagcctgt cagctgcatg tgatgccttg 3060
gaccagcaca acctcaagca aaatgaccag cccatggata tcctgcagat tattaattgt 3120
ttgaccacta tttatgaccg cctggagcaa gagcacaaca atttggtcaa cgtccctctc 3180
tgcgtggata tgtgtctgaa ctggctgctg aatgtttatg atacgggacg aacagggagg 3240
atccgtgtcc tgtcttttaa aactggcatc atttccctgt gtaaagcaca tttggaagac 3300
aagtacagat accttttcaa gcaagtggca agttcaacag gattttgtga ccagcgcagg 3360
ctgggcctcc ttctgcatga ttctatccaa attccaagac agttgggtga agttgcatcc 3420
tttgggggca gtaacattga gccaagtgtc cggagctgct tccaatttgc taataataag 3480
ccagagatcg aagcggccct cttcctagac tggatgagac tggaacccca gtccatggtg 3540
tggctgcccg tcctgcacag agtggctgct gcagaaactg ccaagcatca ggccaaatgt 3600
aacatctgca aagagtgtcc aatcattgga ttcaggtaca ggagtctaaa gcactttaat 3660
tatgacatct gccaaagctg ctttttttct ggtcgagttg caaaaggcca taaaatgcac 3720
tatcccatgg tggaatattg cactccgact acatcaggag aagatgttcg agactttgcc 3780
aaggtactaa aaaacaaatt tcgaaccaaa aggtattttg cgaagcatcc ccgaatgggc 3840
tacctgccag tgcagactgt cttagagggg gacaacatgg aaacgcctgc ctcgtcccct 3900
cagctttcac acgatgatac tcattcacgc attgaacatt atgctagcag gctagcagaa 3960
atggaaaaca gcaatggatc ttatctaaat gatagcatct ctcctaatga gagcatagat 4020
gatgaacatt tgttaatcca gcattactgc caaagtttga accaggactc ccccctgagc 4080
cagcctcgta gtcctgccca gatcttgatt tccttagaga gtgaggaaag aggggagcta 4140
gagagaatcc tagcagatct tgaggaagaa aacaggaatc tgcaagcaga atatgaccgt 4200
ctaaagcagc agcacgaaca taaaggcctg tccccactgc cgtcccctcc tgaaatgatg 4260
cccacctctc cccagagtcc ccgggatgct gagctcattg ctgaggccaa gctactgcgt 4320
caacacaaag gccgcctgga agccaggatg caaatcctgg aagaccacaa taaacagctg 4380
gagtcacagt tacacaggct aaggcagctg ctggagcaac cccaggcaga ggccaaagtg 4440
aatggcacaa cggtgtcctc tccttctacc tctctacaga ggtccgacag cagtcagcct 4500
atgctgctcc gagtggttgg cagtcaaact tcggactcca tgggtgagga agatcttctc 4560
agtcctcccc aggacacaag cacagggtta gaggaggtga tggagcaact caacaactcc 4620
ttccctagtt caagaggaca caatgtagga agtcttttcc acatggcaga tgatttgggc 4680
agagcgatgg agtccttagt atcagtcatg acagatgaag aaggagcaga ataaatgttt 4740
tacaactcct gattcccgca tggtttttat aatattcata caacaaagag gattagacag 4800
taagagttta caagaaataa atctatattt ttgtgaaggg tagtggtatt atactgtaga 4860
tttcagtagt ttctaagtct gttattgttt tgttaacaat ggcaggtttt acacgtctat 4920
gcaattgtac aaaaaagtta taagaaaact acatgtaaaa tcttgatagc taaataactt 4980
gccatttctt tatatggaac gcattttggg ttgtttaaaa atttataaca gttataaaga 5040
aagattgtaa actaaagtgt gctttataaa aaaaagttgt ttataaaaac ccctaaaaac 5100
aaaacaaaca cacacacaca cacatacaca cacacacaca aaactttgag gcagcgcatt 5160
gttttgcatc cttttggcgt gatatccata tgaaattcat ggctttttct ttttttgcat 5220
attaaagata agacttcctc taccaccaca ccaaatgact actacacact gctcatttga 5280
gaactgtcag ctgagtgggg caggcttgag ttttcatttc atatatctat atgtctataa 5340
gtatataaat actatagtta tatagataaa gagatacgaa tttctataga ctgacttttt 5400
ccatttttta aatgttcatg tcacatccta atagaaagaa attacttcta gtcagtcatc 5460
caggcttacc tgcttggtct agaatggatt tttcccggag ccggaagcca ggaggaaact 5520
acaccacact aaaacattgt ctacagctcc agatgtttct cattttaaac aactttccac 5580
tgacaacgaa agtaaagtaa agtattggat ttttttaaag ggaacatgtg aatgaataca 5640
caggacttat tatatcagag tgagtaatcg gttggttggt tgattgattg attgattgat 5700
acattcagct tcctgctgct agcaatgcca cgatttagat ttaatgatgc ttcagtggaa 5760
atcaatcaga aggtattctg accttgtgaa catcagaagg tattttttaa ctcccaagca 5820
gtagcaggac gatgataggg ctggagggct atggattccc agcccatccc tgtgaaggag 5880
taggccactc tttaagtgaa ggattggatg attgttcata atacataaag ttctctgtaa 5940
ttacaactaa attattatgc cctcttctca cagtcaaaag gaactgggtg gtttggtttt 6000
tgttgctttt ttagatttat tgtcccatgt gggatgagtt tttaaatgcc acaagacata 6060
atttaaaata aataaacttt gggaaaaggt gtaaaacagt agccccatca catttgtgat 6120
actgacaggt atcaacccag aagcccatga actgtgtttc catcctttgc atttctctgc 6180
gagtagttcc acacaggttt gtaagtaagt aagaaagaag gcaaattgat tcaaatgtta 6240
caaaaaaacc cttcttggtg gattagacag gttaaatata taaacaaaca aacaaaaatt 6300
gctcaaaaaa gaggagaaaa gctcaagagg aaaagctaag gactggtagg aaaaagcttt 6360
actctttcat gccattttat ttctttttga tttttaaatc attcattcaa tagataccac 6420
cgtgtgacct ataattttgc aaatctgtta cctctgacat caagtgtaat tagcttttgg 6480
agagtgggct gacatcaagt gtaattagct tttggagagt gggttttgtc cattattaat 6540
aattaattaa ttaacatcaa acacggcttc tcatgctatt tctacctcac tttggttttg 6600
gggtgttcct gataattgtg cacacctgag ttcacagctt caccacttgt ccattgcgtt 6660
attttctttt tcctttataa ttctttcttt ttccttcata attttcaaaa gaaaacccaa 6720
agctctaagg taacaaatta ccaaattaca tgaagatttg gtttttgtct tgcatttttt 6780
tcctttatgt gacgctggac cttttcttta cccaaggatt tttaaaactc agatttaaaa 6840
caaggggtta ctttacatcc tactaagaag tttaagtaag taagtttcat tctaaaatca 6900
gaggtaaata gagtgcataa ataattttgt tttaatcttt ttgtttttct tttagacaca 6960
ttagctctgg agtgagtctg tcataatatt tgaacaaaaa ttgagagctt tattgctgca 7020
ttttaagcat aattaatttg gacattattt cgtgttgtgt tctttataac caccaagtat 7080
taaactgtaa atcataatgt aactgaagca taaacatcac atggcatgtt ttgtcattgt 7140
tttcaggtac tgagttctta cttgagtatc ataatatatt gtgttttaac accaacactg 7200
taacatttac gaattatttt tttaaacttc agttttactg cattttcaca acatatcaga 7260
cttcaccaaa tatatgcctt actattgtat tatagtactg ctttactgtg tatctcaata 7320
aagcacgcag ttatgttac 7339
<210> 35
<211> 1230
<212> PRT
<213> Homo sapiens
<400> 35
Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn
1 5 10 15
Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val
20 25 30
Ile Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
35 40 45
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg
50 55 60
Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys
65 70 75 80
Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg
85 90 95
Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg
100 105 110
Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala
115 120 125
Lys Glu Glu Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu
130 135 140
Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile
145 150 155 160
Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn
165 170 175
Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser
180 185 190
Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile Asn Ala
195 200 205
Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu
210 215 220
Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys
225 230 235 240
Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln
245 250 255
Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys
260 265 270
Glu Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
275 280 285
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg
290 295 300
Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp
305 310 315 320
Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile
325 330 335
Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu
340 345 350
Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu
355 360 365
Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln
370 375 380
Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro
385 390 395 400
Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
405 410 415
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro
420 425 430
Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala
435 440 445
Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp
450 455 460
Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln
465 470 475 480
Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile
485 490 495
Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln
500 505 510
Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
515 520 525
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
530 535 540
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu
545 550 555 560
Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg
565 570 575
Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe
580 585 590
Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn
595 600 605
Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp
610 615 620
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
625 630 635 640
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
645 650 655
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
660 665 670
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
675 680 685
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
690 695 700
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
705 710 715 720
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
725 730 735
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
740 745 750
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
755 760 765
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
770 775 780
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
785 790 795 800
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
805 810 815
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
820 825 830
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
835 840 845
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
850 855 860
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
865 870 875 880
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
885 890 895
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
900 905 910
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
915 920 925
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
930 935 940
Asn Met Glu Thr Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr
945 950 955 960
His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn
965 970 975
Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile
980 985 990
Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln
995 1000 1005
Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile
1010 1015 1020
Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala
1025 1030 1035
Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg
1040 1045 1050
Leu Lys Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser
1055 1060 1065
Pro Pro Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala
1070 1075 1080
Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg
1085 1090 1095
Leu Glu Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu
1100 1105 1110
Glu Ser Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln
1115 1120 1125
Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr
1130 1135 1140
Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val
1145 1150 1155
Val Gly Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu
1160 1165 1170
Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu
1175 1180 1185
Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly His Asn Val Gly
1190 1195 1200
Ser Leu Phe His Met Ala Asp Asp Leu Gly Arg Ala Met Glu Ser
1205 1210 1215
Leu Val Ser Val Met Thr Asp Glu Glu Gly Ala Glu
1220 1225 1230
<210> 36
<211> 7048
<212> DNA
<213> Homo sapiens
<400> 36
acactagcaa tggcaaagct ttgtgcggag gcattgctgg ctgctctgaa ctaaaagcat 60
ccgtggggac cgaaagaggt ttttgcacac cttattaagg aactccagga tggcattggg 120
cagcggcaaa ctgttgtcag aacattgaat gcaactgggg aagaaataat tcagcaatcc 180
tcaaaaacag atgccagtat tctacaggaa aaattgggaa gcctgaatct gcggtggcag 240
gaggtctgca aacagctgtc agacagaaaa aagaggctag aagaacaaaa gaatatcttg 300
tcagaatttc aaagagattt aaatgaattt gttttatggt tggaggaagc agataacatt 360
gctagtatcc cacttgaacc tggaaaagag cagcaactaa aagaaaagct tgagcaagtc 420
aagttactgg tggaagagtt gcccctgcgc cagggaattc tcaaacaatt aaatgaaact 480
ggaggacccg tgcttgtaag tgctcccata agcccagaag agcaagataa acttgaaaat 540
aagctcaagc agacaaatct ccagtggata aaggtttcca gagctttacc tgagaaacaa 600
ggagaaattg aagctcaaat aaaagacctt gggcagcttg aaaaaaagct tgaagacctt 660
gaagagcagt taaatcatct gctgctgtgg ttatctccta ttaggaatca gttggaaatt 720
tataaccaac caaaccaaga aggaccattt gacgttcagg aaactgaaat agcagttcaa 780
gctaaacaac cggatgtgga agagattttg tctaaagggc agcatttgta caaggaaaaa 840
ccagccactc agccagtgaa gaggaagtta gaagatctga gctctgagtg gaaggcggta 900
aaccgtttac ttcaagagct gagggcaaag cagcctgacc tagctcctgg actgaccact 960
attggagcct ctcctactca gactgttact ctggtgacac aacctgtggt tactaaggaa 1020
actgccatct ccaaactaga aatgccatct tccttgatgt tggaggtacc tgctctggca 1080
gatttcaacc gggcttggac agaacttacc gactggcttt ctctgcttga tcaagttata 1140
aaatcacaga gggtgatggt gggtgacctt gaggatatca acgagatgat catcaagcag 1200
aaggcaacaa tgcaggattt ggaacagagg cgtccccagt tggaagaact cattaccgct 1260
gcccaaaatt tgaaaaacaa gaccagcaat caagaggcta gaacaatcat tacggatcga 1320
attgaaagaa ttcagaatca gtgggatgaa gtacaagaac accttcagaa ccggaggcaa 1380
cagttgaatg aaatgttaaa ggattcaaca caatggctgg aagctaagga agaagctgag 1440
caggtcttag gacaggccag agccaagctt gagtcatgga aggagggtcc ctatacagta 1500
gatgcaatcc aaaagaaaat cacagaaacc aagcagttgg ccaaagacct ccgccagtgg 1560
cagacaaatg tagatgtggc aaatgacttg gccctgaaac ttctccggga ttattctgca 1620
gatgatacca gaaaagtcca catgataaca gagaatatca atgcctcttg gagaagcatt 1680
cataaaaggg tgagtgagcg agaggctgct ttggaagaaa ctcatagatt actgcaacag 1740
ttccccctgg acctggaaaa gtttcttgcc tggcttacag aagctgaaac aactgccaat 1800
gtcctacagg atgctacccg taaggaaagg ctcctagaag actccaaggg agtaaaagag 1860
ctgatgaaac aatggcaaga cctccaaggt gaaattgaag ctcacacaga tgtttatcac 1920
aacctggatg aaaacagcca aaaaatcctg agatccctgg aaggttccga tgatgcagtc 1980
ctgttacaaa gacgtttgga taacatgaac ttcaagtgga gtgaacttcg gaaaaagtct 2040
ctcaacatta ggtcccattt ggaagccagt tctgaccagt ggaagcgtct gcacctttct 2100
ctgcaggaac ttctggtgtg gctacagctg aaagatgatg aattaagccg gcaggcacct 2160
attggaggcg actttccagc agttcagaag cagaacgatg tacatagggc cttcaagagg 2220
gaattgaaaa ctaaagaacc tgtaatcatg agtactcttg agactgtacg aatatttctg 2280
acagagcagc ctttggaagg actagagaaa ctctaccagg agcccagaga gctgcctcct 2340
gaggagagag cccagaatgt cactcggctt ctacgaaagc aggctgagga ggtcaatact 2400
gagtgggaaa aattgaacct gcactccgct gactggcaga gaaaaataga tgagaccctt 2460
gaaagactcc aggaacttca agaggccacg gatgagctgg acctcaagct gcgccaagct 2520
gaggtgatca agggatcctg gcagcccgtg ggcgatctcc tcattgactc tctccaagat 2580
cacctcgaga aagtcaaggc acttcgagga gaaattgcgc ctctgaaaga gaacgtgagc 2640
cacgtcaatg accttgctcg ccagcttacc actttgggca ttcagctctc accgtataac 2700
ctcagcactc tggaagacct gaacaccaga tggaagcttc tgcaggtggc cgtcgaggac 2760
cgagtcaggc agctgcatga agcccacagg gactttggtc cagcatctca gcactttctt 2820
tccacgtctg tccagggtcc ctgggagaga gccatctcgc caaacaaagt gccctactat 2880
atcaaccacg agactcaaac aacttgctgg gaccatccca aaatgacaga gctctaccag 2940
tctttagctg acctgaataa tgtcagattc tcagcttata ggactgccat gaaactccga 3000
agactgcaga aggccctttg cttggatctc ttgagcctgt cagctgcatg tgatgccttg 3060
gaccagcaca acctcaagca aaatgaccag cccatggata tcctgcagat tattaattgt 3120
ttgaccacta tttatgaccg cctggagcaa gagcacaaca atttggtcaa cgtccctctc 3180
tgcgtggata tgtgtctgaa ctggctgctg aatgtttatg atacgggacg aacagggagg 3240
atccgtgtcc tgtcttttaa aactggcatc atttccctgt gtaaagcaca tttggaagac 3300
aagtacagat accttttcaa gcaagtggca agttcaacag gattttgtga ccagcgcagg 3360
ctgggcctcc ttctgcatga ttctatccaa attccaagac agttgggtga agttgcatcc 3420
tttgggggca gtaacattga gccaagtgtc cggagctgct tccaatttgc taataataag 3480
ccagagatcg aagcggccct cttcctagac tggatgagac tggaacccca gtccatggtg 3540
tggctgcccg tcctgcacag agtggctgct gcagaaactg ccaagcatca ggccaaatgt 3600
aacatctgca aagagtgtcc aatcattgga ttcaggtaca ggagtctaaa gcactttaat 3660
tatgacatct gccaaagctg ctttttttct ggtcgagttg caaaaggcca taaaatgcac 3720
tatcccatgg tggaatattg cactccgact acatcaggag aagatgttcg agactttgcc 3780
aaggtactaa aaaacaaatt tcgaaccaaa aggtattttg cgaagcatcc ccgaatgggc 3840
tacctgccag tgcagactgt cttagagggg gacaacatgg aaacgaatct gcaagcagaa 3900
tatgaccgtc taaagcagca gcacgaacat aaaggcctgt ccccactgcc gtcccctcct 3960
gaaatgatgc ccacctctcc ccagagtccc cgggatgctg agctcattgc tgaggccaag 4020
ctactgcgtc aacacaaagg ccgcctggaa gccaggatgc aaatcctgga agaccacaat 4080
aaacagctgg agtcacagtt acacaggcta aggcagctgc tggagcaacc ccaggcagag 4140
gccaaagtga atggcacaac ggtgtcctct ccttctacct ctctacagag gtccgacagc 4200
agtcagccta tgctgctccg agtggttggc agtcaaactt cggactccat gggtgaggaa 4260
gatcttctca gtcctcccca ggacacaagc acagggttag aggaggtgat ggagcaactc 4320
aacaactcct tccctagttc aagaggacac aatgtaggaa gtcttttcca catggcagat 4380
gatttgggca gagcgatgga gtccttagta tcagtcatga cagatgaaga aggagcagaa 4440
taaatgtttt acaactcctg attcccgcat ggtttttata atattcatac aacaaagagg 4500
attagacagt aagagtttac aagaaataaa tctatatttt tgtgaagggt agtggtatta 4560
tactgtagat ttcagtagtt tctaagtctg ttattgtttt gttaacaatg gcaggtttta 4620
cacgtctatg caattgtaca aaaaagttat aagaaaacta catgtaaaat cttgatagct 4680
aaataacttg ccatttcttt atatggaacg cattttgggt tgtttaaaaa tttataacag 4740
ttataaagaa agattgtaaa ctaaagtgtg ctttataaaa aaaagttgtt tataaaaacc 4800
cctaaaaaca aaacaaacac acacacacac acatacacac acacacacaa aactttgagg 4860
cagcgcattg ttttgcatcc ttttggcgtg atatccatat gaaattcatg gctttttctt 4920
tttttgcata ttaaagataa gacttcctct accaccacac caaatgacta ctacacactg 4980
ctcatttgag aactgtcagc tgagtggggc aggcttgagt tttcatttca tatatctata 5040
tgtctataag tatataaata ctatagttat atagataaag agatacgaat ttctatagac 5100
tgactttttc cattttttaa atgttcatgt cacatcctaa tagaaagaaa ttacttctag 5160
tcagtcatcc aggcttacct gcttggtcta gaatggattt ttcccggagc cggaagccag 5220
gaggaaacta caccacacta aaacattgtc tacagctcca gatgtttctc attttaaaca 5280
actttccact gacaacgaaa gtaaagtaaa gtattggatt tttttaaagg gaacatgtga 5340
atgaatacac aggacttatt atatcagagt gagtaatcgg ttggttggtt gattgattga 5400
ttgattgata cattcagctt cctgctgcta gcaatgccac gatttagatt taatgatgct 5460
tcagtggaaa tcaatcagaa ggtattctga ccttgtgaac atcagaaggt attttttaac 5520
tcccaagcag tagcaggacg atgatagggc tggagggcta tggattccca gcccatccct 5580
gtgaaggagt aggccactct ttaagtgaag gattggatga ttgttcataa tacataaagt 5640
tctctgtaat tacaactaaa ttattatgcc ctcttctcac agtcaaaagg aactgggtgg 5700
tttggttttt gttgcttttt tagatttatt gtcccatgtg ggatgagttt ttaaatgcca 5760
caagacataa tttaaaataa ataaactttg ggaaaaggtg taaaacagta gccccatcac 5820
atttgtgata ctgacaggta tcaacccaga agcccatgaa ctgtgtttcc atcctttgca 5880
tttctctgcg agtagttcca cacaggtttg taagtaagta agaaagaagg caaattgatt 5940
caaatgttac aaaaaaaccc ttcttggtgg attagacagg ttaaatatat aaacaaacaa 6000
acaaaaattg ctcaaaaaag aggagaaaag ctcaagagga aaagctaagg actggtagga 6060
aaaagcttta ctctttcatg ccattttatt tctttttgat ttttaaatca ttcattcaat 6120
agataccacc gtgtgaccta taattttgca aatctgttac ctctgacatc aagtgtaatt 6180
agcttttgga gagtgggctg acatcaagtg taattagctt ttggagagtg ggttttgtcc 6240
attattaata attaattaat taacatcaaa cacggcttct catgctattt ctacctcact 6300
ttggttttgg ggtgttcctg ataattgtgc acacctgagt tcacagcttc accacttgtc 6360
cattgcgtta ttttcttttt cctttataat tctttctttt tccttcataa ttttcaaaag 6420
aaaacccaaa gctctaaggt aacaaattac caaattacat gaagatttgg tttttgtctt 6480
gcattttttt cctttatgtg acgctggacc ttttctttac ccaaggattt ttaaaactca 6540
gatttaaaac aaggggttac tttacatcct actaagaagt ttaagtaagt aagtttcatt 6600
ctaaaatcag aggtaaatag agtgcataaa taattttgtt ttaatctttt tgtttttctt 6660
ttagacacat tagctctgga gtgagtctgt cataatattt gaacaaaaat tgagagcttt 6720
attgctgcat tttaagcata attaatttgg acattatttc gtgttgtgtt ctttataacc 6780
accaagtatt aaactgtaaa tcataatgta actgaagcat aaacatcaca tggcatgttt 6840
tgtcattgtt ttcaggtact gagttcttac ttgagtatca taatatattg tgttttaaca 6900
ccaacactgt aacatttacg aattattttt ttaaacttca gttttactgc attttcacaa 6960
catatcagac ttcaccaaat atatgcctta ctattgtatt atagtactgc tttactgtgt 7020
atctcaataa agcacgcagt tatgttac 7048
<210> 37
<211> 1133
<212> PRT
<213> Homo sapiens
<400> 37
Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn
1 5 10 15
Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val
20 25 30
Ile Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
35 40 45
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg
50 55 60
Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys
65 70 75 80
Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg
85 90 95
Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg
100 105 110
Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala
115 120 125
Lys Glu Glu Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu
130 135 140
Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile
145 150 155 160
Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn
165 170 175
Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser
180 185 190
Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile Asn Ala
195 200 205
Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu
210 215 220
Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys
225 230 235 240
Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln
245 250 255
Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys
260 265 270
Glu Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
275 280 285
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg
290 295 300
Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp
305 310 315 320
Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile
325 330 335
Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu
340 345 350
Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu
355 360 365
Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln
370 375 380
Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro
385 390 395 400
Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
405 410 415
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro
420 425 430
Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala
435 440 445
Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp
450 455 460
Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln
465 470 475 480
Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile
485 490 495
Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln
500 505 510
Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
515 520 525
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
530 535 540
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu
545 550 555 560
Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg
565 570 575
Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe
580 585 590
Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn
595 600 605
Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp
610 615 620
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
625 630 635 640
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
645 650 655
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
660 665 670
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
675 680 685
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
690 695 700
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn
705 710 715 720
Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
725 730 735
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
740 745 750
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
755 760 765
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
770 775 780
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu
785 790 795 800
Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
805 810 815
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
820 825 830
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
835 840 845
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
850 855 860
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
865 870 875 880
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
885 890 895
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
900 905 910
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
915 920 925
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
930 935 940
Asn Met Glu Thr Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln
945 950 955 960
His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met
965 970 975
Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala
980 985 990
Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile
995 1000 1005
Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu
1010 1015 1020
Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly
1025 1030 1035
Thr Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser
1040 1045 1050
Ser Gln Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp
1055 1060 1065
Ser Met Gly Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser
1070 1075 1080
Thr Gly Leu Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro
1085 1090 1095
Ser Ser Arg Gly His Asn Val Gly Ser Leu Phe His Met Ala Asp
1100 1105 1110
Asp Leu Gly Arg Ala Met Glu Ser Leu Val Ser Val Met Thr Asp
1115 1120 1125
Glu Glu Gly Ala Glu
1130
<210> 38
<211> 13897
<212> DNA
<213> Homo sapiens
<400> 38
acctaaccta acttgaatca tgcgaaaggg gagctgttgg aattcaaata gactttctgg 60
ttcccagcag tcggcagtaa tagaatgctt tcaggaagat gacagaatca ggagaaagat 120
gctgttttgc actatcttga tttgttacag cagccaactt attggcatga tggagtgaca 180
ggaaaaacag ctggcatgga agatgaaaga gaagatgttc aaaagaaaac attcacaaaa 240
tgggtaaatg cacaattttc taagtttggg aagcagcata ttgagaacct cttcagtgac 300
ctacaggatg ggaggcgcct cctagacctc ctcgaaggcc tgacagggca aaaactgcca 360
aaagaaaaag gatccacaag agttcatgcc ctgaacaatg tcaacaaggc actgcgggtt 420
ttgcagaaca ataatgttga tttagtgaat attggaagta ctgacatcgt agatggaaat 480
cataaactga ctcttggttt gatttggaat ataatcctcc actggcaggt caaaaatgta 540
atgaaaaata tcatggctgg attgcaacaa accaacagtg aaaagattct cctgagctgg 600
gtccgacaat caactcgtaa ttatccacag gttaatgtaa tcaacttcac caccagctgg 660
tctgatggcc tggctttgaa tgctctcatc catagtcata ggccagacct atttgactgg 720
aatagtgtgg tttgccagca gtcagccaca caacgactgg aacatgcatt caacatcgcc 780
agatatcaat taggcataga gaaactactc gatcctgaag atgttgatac cacctatcca 840
gataagaagt ccatcttaat gtacatcaca tcactcttcc aagttttgcc tcaacaagtg 900
agcattgaag ccatccagga agtggaaatg ttgccaaggc cacctaaagt gactaaagaa 960
gaacattttc agttacatca tcaaatgcac tattctcaac agatcacggt cagtctagca 1020
cagggatatg agagaacttc ttcccctaag cctcgattca agagctatgc ctacacacag 1080
gctgcttatg tcaccacctc tgaccctaca cggagcccat ttccttcaca gcatttggaa 1140
gctcctgaag acaagtcatt tggcagttca ttgatggaga gtgaagtaaa cctggaccgt 1200
tatcaaacag ctttagaaga agtattatcg tggcttcttt ctgctgagga cacattgcaa 1260
gcacaaggag agatttctaa tgatgtggaa gtggtgaaag accagtttca tactcatgag 1320
gggtacatga tggatttgac agcccatcag ggccgggttg gtaatattct acaattggga 1380
agtaagctga ttggaacagg aaaattatca gaagatgaag aaactgaagt acaagagcag 1440
atgaatctcc taaattcaag atgggaatgc ctcagggtag ctagcatgga aaaacaaagc 1500
aatttacata gagttttaat ggatctccag aatcagaaac tgaaagagtt gaatgactgg 1560
ctaacaaaaa cagaagaaag aacaaggaaa atggaggaag agcctcttgg acctgatctt 1620
gaagacctaa aacgccaagt acaacaacat aaggtgcttc aagaagatct agaacaagaa 1680
caagtcaggg tcaattctct cactcacatg gtggtggtag ttgatgaatc tagtggagat 1740
cacgcaactg ctgctttgga agaacaactt aaggtattgg gagatcgatg ggcaaacatc 1800
tgtagatgga cagaagaccg ctgggttctt ttacaagaca tccttctcaa atggcaacgt 1860
cttactgaag aacagtgcct ttttagtgca tggctttcag aaaaagaaga tgcagtgaac 1920
aagattcaca caactggctt taaagatcaa aatgaaatgt tatcaagtct tcaaaaactg 1980
gccgttttaa aagcggatct agaaaagaaa aagcaatcca tgggcaaact gtattcactc 2040
aaacaagatc ttctttcaac actgaagaat aagtcagtga cccagaagac ggaagcatgg 2100
ctggataact ttgcccggtg ttgggataat ttagtccaaa aacttgaaaa gagtacagca 2160
cagatttcac aggctgtcac caccactcag ccatcactaa cacagacaac tgtaatggaa 2220
acagtaacta cggtgaccac aagggaacag atcctggtaa agcatgctca agaggaactt 2280
ccaccaccac ctccccaaaa gaagaggcag attactgtgg attctgaaat taggaaaagg 2340
ttggatgttg atataactga acttcacagc tggattactc gctcagaagc tgtgttgcag 2400
agtcctgaat ttgcaatctt tcggaaggaa ggcaacttct cagacttaaa agaaaaagtc 2460
aatgccatag agcgagaaaa agctgagaag ttcagaaaac tgcaagatgc cagcagatca 2520
gctcaggccc tggtggaaca gatggtgaat gagggtgtta atgcagatag catcaaacaa 2580
gcctcagaac aactgaacag ccggtggatc gaattctgcc agttgctaag tgagagactt 2640
aactggctgg agtatcagaa caacatcatc gctttctata atcagctaca acaattggag 2700
cagatgacaa ctactgctga aaactggttg aaaatccaac ccaccacccc atcagagcca 2760
acagcaatta aaagtcagtt aaaaatttgt aaggatgaag tcaaccggct atcagatctt 2820
caacctcaaa ttgaacgatt aaaaattcaa agcatagccc tgaaagagaa aggacaagga 2880
cccatgttcc tggatgcaga ctttgtggcc tttacaaatc attttaagca agtcttttct 2940
gatgtgcagg ccagagagaa agagctacag acaatttttg acactttgcc accaatgcgc 3000
tatcaggaga ccatgagtgc catcaggaca tgggtccagc agtcagaaac caaactctcc 3060
atacctcaac ttagtgtcac cgactatgaa atcatggagc agagactcgg ggaattgcag 3120
gctttacaaa gttctctgca agagcaacaa agtggcctat actatctcag caccactgtg 3180
aaagagatgt cgaagaaagc gccctctgaa attagccgga aatatcaatc agaatttgaa 3240
gaaattgagg gacgctggaa gaagctctcc tcccagctgg ttgagcattg tcaaaagcta 3300
gaggagcaaa tgaataaact ccgaaaaatt cagaatcaca tacaaaccct gaagaaatgg 3360
atggctgaag ttgatgtttt tctgaaggag gaatggcctg cccttgggga ttcagaaatt 3420
ctaaaaaagc agctgaaaca gtgcagactt ttagtcagtg atattcagac aattcagccc 3480
agtctaaaca gtgtcaatga aggtgggcag aagataaaga atgaagcaga gccagagttt 3540
gcttcgagac ttgagacaga actcaaagaa cttaacactc agtgggatca catgtgccaa 3600
caggtctatg ccagaaagga ggccttgaag ggaggtttgg agaaaactgt aagcctccag 3660
aaagatctat cagagatgca cgaatggatg acacaagctg aagaagagta tcttgagaga 3720
gattttgaat ataaaactcc agatgaatta cagaaagcag ttgaagagat gaagagagct 3780
aaagaagagg cccaacaaaa agaagcgaaa gtgaaactcc ttactgagtc tgtaaatagt 3840
gtcatagctc aagctccacc tgtagcacaa gaggccttaa aaaaggaact tgaaactcta 3900
accaccaact accagtggct ctgcactagg ctgaatggga aatgcaagac tttggaagaa 3960
gtttgggcat gttggcatga gttattgtca tacttggaga aagcaaacaa gtggctaaat 4020
gaagtagaat ttaaacttaa aaccactgaa aacattcctg gcggagctga ggaaatctct 4080
gaggtgctag attcacttga aaatttgatg cgacattcag aggataaccc aaatcagatt 4140
cgcatattgg cacagaccct aacagatggc ggagtcatgg atgagctaat caatgaggaa 4200
cttgagacat ttaattctcg ttggagggaa ctacatgaag aggctgtaag gaggcaaaag 4260
ttgcttgaac agagcatcca gtctgcccag gagactgaaa aatccttaca cttaatccag 4320
gagtccctca cattcattga caagcagttg gcagcttata ttgcagacaa ggtggacgca 4380
gctcaaatgc ctcaggaagc ccagaaaatc caatctgatt tgacaagtca tgagatcagt 4440
ttagaagaaa tgaagaaaca taatcagggg aaggaggctg cccaaagagt cctgtctcag 4500
attgatgttg cacagaaaaa attacaagat gtctccatga agtttcgatt attccagaaa 4560
ccagccaatt ttgagcagcg tctacaagaa agtaagatga ttttagatga agtgaagatg 4620
cacttgcctg cattggaaac aaagagtgtg gaacaggaag tagtacagtc acagctaaat 4680
cattgtgtga acttgtataa aagtctgagt gaagtgaagt ctgaagtgga aatggtgata 4740
aagactggac gtcagattgt acagaaaaag cagacggaaa atcccaaaga acttgatgaa 4800
agagtaacag ctttgaaatt gcattataat gagctgggag caaaggtaac agaaagaaag 4860
caacagttgg agaaatgctt gaaattgtcc cgtaagatgc gaaaggaaat gaatgtcttg 4920
acagaatggc tggcagctac agatatggaa ttgacaaaga gatcagcagt tgaaggaatg 4980
cctagtaatt tggattctga agttgcctgg ggaaaggcta ctcaaaaaga gattgagaaa 5040
cagaaggtgc acctgaagag tatcacagag gtaggagagg ccttgaaaac agttttgggc 5100
aagaaggaga cgttggtgga agataaactc agtcttctga atagtaactg gatagctgtc 5160
acctcccgag cagaagagtg gttaaatctt ttgttggaat accagaaaca catggaaact 5220
tttgaccaga atgtggacca catcacaaag tggatcattc aggctgacac acttttggat 5280
gaatcagaga aaaagaaacc ccagcaaaaa gaagacgtgc ttaagcgttt aaaggcagaa 5340
ctgaatgaca tacgcccaaa ggtggactct acacgtgacc aagcagcaaa cttgatggca 5400
aaccgcggtg accactgcag gaaattagta gagccccaaa tctcagagct caaccatcga 5460
tttgcagcca tttcacacag aattaagact ggaaaggcct ccattccttt gaaggaattg 5520
gagcagttta actcagatat acaaaaattg cttgaaccac tggaggctga aattcagcag 5580
ggggtgaatc tgaaagagga agacttcaat aaagatatga atgaagacaa tgagggtact 5640
gtaaaagaat tgttgcaaag aggagacaac ttacaacaaa gaatcacaga tgagagaaag 5700
cgagaggaaa taaagataaa acagcagctg ttacagacaa aacataatgc tctcaaggat 5760
ttgaggtctc aaagaagaaa aaaggctcta gaaatttctc atcagtggta tcagtacaag 5820
aggcaggctg atgatctcct gaaatgcttg gatgacattg aaaaaaaatt agccagccta 5880
cctgagccca gagatgaaag gaaaataaag gaaattgatc gggaattgca gaagaagaaa 5940
gaggagctga atgcagtgcg taggcaagct gagggcttgt ctgaggatgg ggccgcaatg 6000
gcagtggagc caactcagat ccagctcagc aagcgctggc gggaaattga gagcaaattt 6060
gctcagtttc gaagactcaa ctttgcacaa attcacactg tccgtgaaga aacgatgatg 6120
gtgatgactg aagacatgcc tttggaaatt tcttatgtgc cttctactta tttgactgaa 6180
atcactcatg tctcacaagc cctattagaa gtggaacaac ttctcaatgc tcctgacctc 6240
tgtgctaagg actttgaaga tctctttaag caagaggagt ctctgaagaa tataaaagat 6300
agtctacaac aaagctcagg tcggattgac attattcata gcaagaagac agcagcattg 6360
caaagtgcaa cgcctgtgga aagggtgaag ctacaggaag ctctctccca gcttgatttc 6420
caatgggaaa aagttaacaa aatgtacaag gaccgacaag ggcgatttga cagatctgtt 6480
gagaaatggc ggcgttttca ttatgatata aagatattta atcagtggct aacagaagct 6540
gaacagtttc tcagaaagac acaaattcct gagaattggg aacatgctaa atacaaatgg 6600
tatcttaagg aactccagga tggcattggg cagcggcaaa ctgttgtcag aacattgaat 6660
gcaactgggg aagaaataat tcagcaatcc tcaaaaacag atgccagtat tctacaggaa 6720
aaattgggaa gcctgaatct gcggtggcag gaggtctgca aacagctgtc agacagaaaa 6780
aagaggctag aagaacaaaa gaatatcttg tcagaatttc aaagagattt aaatgaattt 6840
gttttatggt tggaggaagc agataacatt gctagtatcc cacttgaacc tggaaaagag 6900
cagcaactaa aagaaaagct tgagcaagtc aagttactgg tggaagagtt gcccctgcgc 6960
cagggaattc tcaaacaatt aaatgaaact ggaggacccg tgcttgtaag tgctcccata 7020
agcccagaag agcaagataa acttgaaaat aagctcaagc agacaaatct ccagtggata 7080
aaggtttcca gagctttacc tgagaaacaa ggagaaattg aagctcaaat aaaagacctt 7140
gggcagcttg aaaaaaagct tgaagacctt gaagagcagt taaatcatct gctgctgtgg 7200
ttatctccta ttaggaatca gttggaaatt tataaccaac caaaccaaga aggaccattt 7260
gacgttaagg aaactgaaat agcagttcaa gctaaacaac cggatgtgga agagattttg 7320
tctaaagggc agcatttgta caaggaaaaa ccagccactc agccagtgaa gaggaagtta 7380
gaagatctga gctctgagtg gaaggcggta aaccgtttac ttcaagagct gagggcaaag 7440
cagcctgacc tagctcctgg actgaccact attggagcct ctcctactca gactgttact 7500
ctggtgacac aacctgtggt tactaaggaa actgccatct ccaaactaga aatgccatct 7560
tccttgatgt tggaggtacc tgctctggca gatttcaacc gggcttggac agaacttacc 7620
gactggcttt ctctgcttga tcaagttata aaatcacaga gggtgatggt gggtgacctt 7680
gaggatatca acgagatgat catcaagcag aaggcaacaa tgcaggattt ggaacagagg 7740
cgtccccagt tggaagaact cattaccgct gcccaaaatt tgaaaaacaa gaccagcaat 7800
caagaggcta gaacaatcat tacggatcga attgaaagaa ttcagaatca gtgggatgaa 7860
gtacaagaac accttcagaa ccggaggcaa cagttgaatg aaatgttaaa ggattcaaca 7920
caatggctgg aagctaagga agaagctgag caggtcttag gacaggccag agccaagctt 7980
gagtcatgga aggagggtcc ctatacagta gatgcaatcc aaaagaaaat cacagaaacc 8040
aagcagttgg ccaaagacct ccgccagtgg cagacaaatg tagatgtggc aaatgacttg 8100
gccctgaaac ttctccggga ttattctgca gatgatacca gaaaagtcca catgataaca 8160
gagaatatca atgcctcttg gagaagcatt cataaaaggg tgagtgagcg agaggctgct 8220
ttggaagaaa ctcatagatt actgcaacag ttccccctgg acctggaaaa gtttcttgcc 8280
tggcttacag aagctgaaac aactgccaat gtcctacagg atgctacccg taaggaaagg 8340
ctcctagaag actccaaggg agtaaaagag ctgatgaaac aatggcaaga cctccaaggt 8400
gaaattgaag ctcacacaga tgtttatcac aacctggatg aaaacagcca aaaaatcctg 8460
agatccctgg aaggttccga tgatgcagtc ctgttacaaa gacgtttgga taacatgaac 8520
ttcaagtgga gtgaacttcg gaaaaagtct ctcaacatta ggtcccattt ggaagccagt 8580
tctgaccagt ggaagcgtct gcacctttct ctgcaggaac ttctggtgtg gctacagctg 8640
aaagatgatg aattaagccg gcaggcacct attggaggcg actttccagc agttcagaag 8700
cagaacgatg tacatagggc cttcaagagg gaattgaaaa ctaaagaacc tgtaatcatg 8760
agtactcttg agactgtacg aatatttctg acagagcagc ctttggaagg actagagaaa 8820
ctctaccagg agcccagaga gctgcctcct gaggagagag cccagaatgt cactcggctt 8880
ctacgaaagc aggctgagga ggtcaatact gagtgggaaa aattgaacct gcactccgct 8940
gactggcaga gaaaaataga tgagaccctt gaaagactcc gggaacttca agaggccacg 9000
gatgagctgg acctcaagct gcgccaagct gaggtgatca agggatcctg gcagcccgtg 9060
ggcgatctcc tcattgactc tctccaagat cacctcgaga aagtcaaggc acttcgagga 9120
gaaattgcgc ctctgaaaga gaacgtgagc cacgtcaatg accttgctcg ccagcttacc 9180
actttgggca ttcagctctc accgtataac ctcagcactc tggaagacct gaacaccaga 9240
tggaagcttc tgcaggtggc cgtcgaggac cgagtcaggc agctgcatga agcccacagg 9300
gactttggtc cagcatctca gcactttctt tccacgtctg tccagggtcc ctgggagaga 9360
gccatctcgc caaacaaagt gccctactat atcaaccacg agactcaaac aacttgctgg 9420
gaccatccca aaatgacaga gctctaccag tctttagctg acctgaataa tgtcagattc 9480
tcagcttata ggactgccat gaaactccga agactgcaga aggccctttg cttggatctc 9540
ttgagcctgt cagctgcatg tgatgccttg gaccagcaca acctcaagca aaatgaccag 9600
cccatggata tcctgcagat tattaattgt ttgaccacta tttatgaccg cctggagcaa 9660
gagcacaaca atttggtcaa cgtccctctc tgcgtggata tgtgtctgaa ctggctgctg 9720
aatgtttatg atacgggacg aacagggagg atccgtgtcc tgtcttttaa aactggcatc 9780
atttccctgt gtaaagcaca tttggaagac aagtacagat accttttcaa gcaagtggca 9840
agttcaacag gattttgtga ccagcgcagg ctgggcctcc ttctgcatga ttctatccaa 9900
attccaagac agttgggtga agttgcatcc tttgggggca gtaacattga gccaagtgtc 9960
cggagctgct tccaatttgc taataataag ccagagatcg aagcggccct cttcctagac 10020
tggatgagac tggaacccca gtccatggtg tggctgcccg tcctgcacag agtggctgct 10080
gcagaaactg ccaagcatca ggccaaatgt aacatctgca aagagtgtcc aatcattgga 10140
ttcaggtaca ggagtctaaa gcactttaat tatgacatct gccaaagctg ctttttttct 10200
ggtcgagttg caaaaggcca taaaatgcac tatcccatgg tggaatattg cactccgact 10260
acatcaggag aagatgttcg agactttgcc aaggtactaa aaaacaaatt tcgaaccaaa 10320
aggtattttg cgaagcatcc ccgaatgggc tacctgccag tgcagactgt cttagagggg 10380
gacaacatgg aaactcccgt tactctgatc aacttctggc cagtagattc tgcgcctgcc 10440
tcgtcccctc agctttcaca cgatgatact cattcacgca ttgaacatta tgctagcagg 10500
ctagcagaaa tggaaaacag caatggatct tatctaaatg atagcatctc tcctaatgag 10560
agcatagatg atgaacattt gttaatccag cattactgcc aaagtttgaa ccaggactcc 10620
cccctgagcc agcctcgtag tcctgcccag atcttgattt ccttagagag tgaggaaaga 10680
ggggagctag agagaatcct agcagatctt gaggaagaaa acaggaatct gcaagcagaa 10740
tatgaccgtc taaagcagca gcacgaacat aaaggcctgt ccccactgcc gtcccctcct 10800
gaaatgatgc ccacctctcc ccagagtccc cgggatgctg agctcattgc tgaggccaag 10860
ctactgcgtc aacacaaagg ccgcctggaa gccaggatgc aaatcctgga agaccacaat 10920
aaacagctgg agtcacagtt acacaggcta aggcagctgc tggagcaacc ccaggcagag 10980
gccaaagtga atggcacaac ggtgtcctct ccttctacct ctctacagag gtccgacagc 11040
agtcagccta tgctgctccg agtggttggc agtcaaactt cggactccat gggtgaggaa 11100
gatcttctca gtcctcccca ggacacaagc acagggttag aggaggtgat ggagcaactc 11160
aacaactcct tccctagttc aagaggacac aatgtaggaa gtcttttcca catggcagat 11220
gatttgggca gagcgatgga gtccttagta tcagtcatga cagatgaaga aggagcagaa 11280
taaatgtttt acaactcctg attcccgcat ggtttttata atattcatac aacaaagagg 11340
attagacagt aagagtttac aagaaataaa tctatatttt tgtgaagggt agtggtatta 11400
tactgtagat ttcagtagtt tctaagtctg ttattgtttt gttaacaatg gcaggtttta 11460
cacgtctatg caattgtaca aaaaagttat aagaaaacta catgtaaaat cttgatagct 11520
aaataacttg ccatttcttt atatggaacg cattttgggt tgtttaaaaa tttataacag 11580
ttataaagaa agattgtaaa ctaaagtgtg ctttataaaa aaaagttgtt tataaaaacc 11640
cctaaaaaca aaacaaacac acacacacac acatacacac acacacacaa aactttgagg 11700
cagcgcattg ttttgcatcc ttttggcgtg atatccatat gaaattcatg gctttttctt 11760
tttttgcata ttaaagataa gacttcctct accaccacac caaatgacta ctacacactg 11820
ctcatttgag aactgtcagc tgagtggggc aggcttgagt tttcatttca tatatctata 11880
tgtctataag tatataaata ctatagttat atagataaag agatacgaat ttctatagac 11940
tgactttttc cattttttaa atgttcatgt cacatcctaa tagaaagaaa ttacttctag 12000
tcagtcatcc aggcttacct gcttggtcta gaatggattt ttcccggagc cggaagccag 12060
gaggaaacta caccacacta aaacattgtc tacagctcca gatgtttctc attttaaaca 12120
actttccact gacaacgaaa gtaaagtaaa gtattggatt tttttaaagg gaacatgtga 12180
atgaatacac aggacttatt atatcagagt gagtaatcgg ttggttggtt gattgattga 12240
ttgattgata cattcagctt cctgctgcta gcaatgccac gatttagatt taatgatgct 12300
tcagtggaaa tcaatcagaa ggtattctga ccttgtgaac atcagaaggt attttttaac 12360
tcccaagcag tagcaggacg atgatagggc tggagggcta tggattccca gcccatccct 12420
gtgaaggagt aggccactct ttaagtgaag gattggatga ttgttcataa tacataaagt 12480
tctctgtaat tacaactaaa ttattatgcc ctcttctcac agtcaaaagg aactgggtgg 12540
tttggttttt gttgcttttt tagatttatt gtcccatgtg ggatgagttt ttaaatgcca 12600
caagacataa tttaaaataa ataaactttg ggaaaaggtg taaaacagta gccccatcac 12660
atttgtgata ctgacaggta tcaacccaga agcccatgaa ctgtgtttcc atcctttgca 12720
tttctctgcg agtagttcca cacaggtttg taagtaagta agaaagaagg caaattgatt 12780
caaatgttac aaaaaaaccc ttcttggtgg attagacagg ttaaatatat aaacaaacaa 12840
acaaaaattg ctcaaaaaag aggagaaaag ctcaagagga aaagctaagg actggtagga 12900
aaaagcttta ctctttcatg ccattttatt tctttttgat ttttaaatca ttcattcaat 12960
agataccacc gtgtgaccta taattttgca aatctgttac ctctgacatc aagtgtaatt 13020
agcttttgga gagtgggctg acatcaagtg taattagctt ttggagagtg ggttttgtcc 13080
attattaata attaattaat taacatcaaa cacggcttct catgctattt ctacctcact 13140
ttggttttgg ggtgttcctg ataattgtgc acacctgagt tcacagcttc accacttgtc 13200
cattgcgtta ttttcttttt cctttataat tctttctttt tccttcataa ttttcaaaag 13260
aaaacccaaa gctctaaggt aacaaattac caaattacat gaagatttgg tttttgtctt 13320
gcattttttt cctttatgtg acgctggacc ttttctttac ccaaggattt ttaaaactca 13380
gatttaaaac aaggggttac tttacatcct actaagaagt ttaagtaagt aagtttcatt 13440
ctaaaatcag aggtaaatag agtgcataaa taattttgtt ttaatctttt tgtttttctt 13500
ttagacacat tagctctgga gtgagtctgt cataatattt gaacaaaaat tgagagcttt 13560
attgctgcat tttaagcata attaatttgg acattatttc gtgttgtgtt ctttataacc 13620
accaagtatt aaactgtaaa tcataatgta actgaagcat aaacatcaca tggcatgttt 13680
tgtcattgtt ttcaggtact gagttcttac ttgagtatca taatatattg tgttttaaca 13740
ccaacactgt aacatttacg aattattttt ttaaacttca gttttactgc attttcacaa 13800
catatcagac ttcaccaaat atatgcctta ctattgtatt atagtactgc tttactgtgt 13860
atctcaataa agcacgcagt tatgttacaa aaaagta 13897
<210> 39
<211> 3695
<212> PRT
<213> Homo sapiens
<400> 39
Met Glu Asp Glu Arg Glu Asp Val Gln Lys Lys Thr Phe Thr Lys Trp
1 5 10 15
Val Asn Ala Gln Phe Ser Lys Phe Gly Lys Gln His Ile Glu Asn Leu
20 25 30
Phe Ser Asp Leu Gln Asp Gly Arg Arg Leu Leu Asp Leu Leu Glu Gly
35 40 45
Leu Thr Gly Gln Lys Leu Pro Lys Glu Lys Gly Ser Thr Arg Val His
50 55 60
Ala Leu Asn Asn Val Asn Lys Ala Leu Arg Val Leu Gln Asn Asn Asn
65 70 75 80
Val Asp Leu Val Asn Ile Gly Ser Thr Asp Ile Val Asp Gly Asn His
85 90 95
Lys Leu Thr Leu Gly Leu Ile Trp Asn Ile Ile Leu His Trp Gln Val
100 105 110
Lys Asn Val Met Lys Asn Ile Met Ala Gly Leu Gln Gln Thr Asn Ser
115 120 125
Glu Lys Ile Leu Leu Ser Trp Val Arg Gln Ser Thr Arg Asn Tyr Pro
130 135 140
Gln Val Asn Val Ile Asn Phe Thr Thr Ser Trp Ser Asp Gly Leu Ala
145 150 155 160
Leu Asn Ala Leu Ile His Ser His Arg Pro Asp Leu Phe Asp Trp Asn
165 170 175
Ser Val Val Cys Gln Gln Ser Ala Thr Gln Arg Leu Glu His Ala Phe
180 185 190
Asn Ile Ala Arg Tyr Gln Leu Gly Ile Glu Lys Leu Leu Asp Pro Glu
195 200 205
Asp Val Asp Thr Thr Tyr Pro Asp Lys Lys Ser Ile Leu Met Tyr Ile
210 215 220
Thr Ser Leu Phe Gln Val Leu Pro Gln Gln Val Ser Ile Glu Ala Ile
225 230 235 240
Gln Glu Val Glu Met Leu Pro Arg Pro Pro Lys Val Thr Lys Glu Glu
245 250 255
His Phe Gln Leu His His Gln Met His Tyr Ser Gln Gln Ile Thr Val
260 265 270
Ser Leu Ala Gln Gly Tyr Glu Arg Thr Ser Ser Pro Lys Pro Arg Phe
275 280 285
Lys Ser Tyr Ala Tyr Thr Gln Ala Ala Tyr Val Thr Thr Ser Asp Pro
290 295 300
Thr Arg Ser Pro Phe Pro Ser Gln His Leu Glu Ala Pro Glu Asp Lys
305 310 315 320
Ser Phe Gly Ser Ser Leu Met Glu Ser Glu Val Asn Leu Asp Arg Tyr
325 330 335
Gln Thr Ala Leu Glu Glu Val Leu Ser Trp Leu Leu Ser Ala Glu Asp
340 345 350
Thr Leu Gln Ala Gln Gly Glu Ile Ser Asn Asp Val Glu Val Val Lys
355 360 365
Asp Gln Phe His Thr His Glu Gly Tyr Met Met Asp Leu Thr Ala His
370 375 380
Gln Gly Arg Val Gly Asn Ile Leu Gln Leu Gly Ser Lys Leu Ile Gly
385 390 395 400
Thr Gly Lys Leu Ser Glu Asp Glu Glu Thr Glu Val Gln Glu Gln Met
405 410 415
Asn Leu Leu Asn Ser Arg Trp Glu Cys Leu Arg Val Ala Ser Met Glu
420 425 430
Lys Gln Ser Asn Leu His Arg Val Leu Met Asp Leu Gln Asn Gln Lys
435 440 445
Leu Lys Glu Leu Asn Asp Trp Leu Thr Lys Thr Glu Glu Arg Thr Arg
450 455 460
Lys Met Glu Glu Glu Pro Leu Gly Pro Asp Leu Glu Asp Leu Lys Arg
465 470 475 480
Gln Val Gln Gln His Lys Val Leu Gln Glu Asp Leu Glu Gln Glu Gln
485 490 495
Val Arg Val Asn Ser Leu Thr His Met Val Val Val Val Asp Glu Ser
500 505 510
Ser Gly Asp His Ala Thr Ala Ala Leu Glu Glu Gln Leu Lys Val Leu
515 520 525
Gly Asp Arg Trp Ala Asn Ile Cys Arg Trp Thr Glu Asp Arg Trp Val
530 535 540
Leu Leu Gln Asp Ile Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln
545 550 555 560
Cys Leu Phe Ser Ala Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys
565 570 575
Ile His Thr Thr Gly Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu
580 585 590
Gln Lys Leu Ala Val Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser
595 600 605
Met Gly Lys Leu Tyr Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys
610 615 620
Asn Lys Ser Val Thr Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala
625 630 635 640
Arg Cys Trp Asp Asn Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln
645 650 655
Ile Ser Gln Ala Val Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr
660 665 670
Val Met Glu Thr Val Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val
675 680 685
Lys His Ala Gln Glu Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg
690 695 700
Gln Ile Thr Val Asp Ser Glu Ile Arg Lys Arg Leu Asp Val Asp Ile
705 710 715 720
Thr Glu Leu His Ser Trp Ile Thr Arg Ser Glu Ala Val Leu Gln Ser
725 730 735
Pro Glu Phe Ala Ile Phe Arg Lys Glu Gly Asn Phe Ser Asp Leu Lys
740 745 750
Glu Lys Val Asn Ala Ile Glu Arg Glu Lys Ala Glu Lys Phe Arg Lys
755 760 765
Leu Gln Asp Ala Ser Arg Ser Ala Gln Ala Leu Val Glu Gln Met Val
770 775 780
Asn Glu Gly Val Asn Ala Asp Ser Ile Lys Gln Ala Ser Glu Gln Leu
785 790 795 800
Asn Ser Arg Trp Ile Glu Phe Cys Gln Leu Leu Ser Glu Arg Leu Asn
805 810 815
Trp Leu Glu Tyr Gln Asn Asn Ile Ile Ala Phe Tyr Asn Gln Leu Gln
820 825 830
Gln Leu Glu Gln Met Thr Thr Thr Ala Glu Asn Trp Leu Lys Ile Gln
835 840 845
Pro Thr Thr Pro Ser Glu Pro Thr Ala Ile Lys Ser Gln Leu Lys Ile
850 855 860
Cys Lys Asp Glu Val Asn Arg Leu Ser Asp Leu Gln Pro Gln Ile Glu
865 870 875 880
Arg Leu Lys Ile Gln Ser Ile Ala Leu Lys Glu Lys Gly Gln Gly Pro
885 890 895
Met Phe Leu Asp Ala Asp Phe Val Ala Phe Thr Asn His Phe Lys Gln
900 905 910
Val Phe Ser Asp Val Gln Ala Arg Glu Lys Glu Leu Gln Thr Ile Phe
915 920 925
Asp Thr Leu Pro Pro Met Arg Tyr Gln Glu Thr Met Ser Ala Ile Arg
930 935 940
Thr Trp Val Gln Gln Ser Glu Thr Lys Leu Ser Ile Pro Gln Leu Ser
945 950 955 960
Val Thr Asp Tyr Glu Ile Met Glu Gln Arg Leu Gly Glu Leu Gln Ala
965 970 975
Leu Gln Ser Ser Leu Gln Glu Gln Gln Ser Gly Leu Tyr Tyr Leu Ser
980 985 990
Thr Thr Val Lys Glu Met Ser Lys Lys Ala Pro Ser Glu Ile Ser Arg
995 1000 1005
Lys Tyr Gln Ser Glu Phe Glu Glu Ile Glu Gly Arg Trp Lys Lys
1010 1015 1020
Leu Ser Ser Gln Leu Val Glu His Cys Gln Lys Leu Glu Glu Gln
1025 1030 1035
Met Asn Lys Leu Arg Lys Ile Gln Asn His Ile Gln Thr Leu Lys
1040 1045 1050
Lys Trp Met Ala Glu Val Asp Val Phe Leu Lys Glu Glu Trp Pro
1055 1060 1065
Ala Leu Gly Asp Ser Glu Ile Leu Lys Lys Gln Leu Lys Gln Cys
1070 1075 1080
Arg Leu Leu Val Ser Asp Ile Gln Thr Ile Gln Pro Ser Leu Asn
1085 1090 1095
Ser Val Asn Glu Gly Gly Gln Lys Ile Lys Asn Glu Ala Glu Pro
1100 1105 1110
Glu Phe Ala Ser Arg Leu Glu Thr Glu Leu Lys Glu Leu Asn Thr
1115 1120 1125
Gln Trp Asp His Met Cys Gln Gln Val Tyr Ala Arg Lys Glu Ala
1130 1135 1140
Leu Lys Gly Gly Leu Glu Lys Thr Val Ser Leu Gln Lys Asp Leu
1145 1150 1155
Ser Glu Met His Glu Trp Met Thr Gln Ala Glu Glu Glu Tyr Leu
1160 1165 1170
Glu Arg Asp Phe Glu Tyr Lys Thr Pro Asp Glu Leu Gln Lys Ala
1175 1180 1185
Val Glu Glu Met Lys Arg Ala Lys Glu Glu Ala Gln Gln Lys Glu
1190 1195 1200
Ala Lys Val Lys Leu Leu Thr Glu Ser Val Asn Ser Val Ile Ala
1205 1210 1215
Gln Ala Pro Pro Val Ala Gln Glu Ala Leu Lys Lys Glu Leu Glu
1220 1225 1230
Thr Leu Thr Thr Asn Tyr Gln Trp Leu Cys Thr Arg Leu Asn Gly
1235 1240 1245
Lys Cys Lys Thr Leu Glu Glu Val Trp Ala Cys Trp His Glu Leu
1250 1255 1260
Leu Ser Tyr Leu Glu Lys Ala Asn Lys Trp Leu Asn Glu Val Glu
1265 1270 1275
Phe Lys Leu Lys Thr Thr Glu Asn Ile Pro Gly Gly Ala Glu Glu
1280 1285 1290
Ile Ser Glu Val Leu Asp Ser Leu Glu Asn Leu Met Arg His Ser
1295 1300 1305
Glu Asp Asn Pro Asn Gln Ile Arg Ile Leu Ala Gln Thr Leu Thr
1310 1315 1320
Asp Gly Gly Val Met Asp Glu Leu Ile Asn Glu Glu Leu Glu Thr
1325 1330 1335
Phe Asn Ser Arg Trp Arg Glu Leu His Glu Glu Ala Val Arg Arg
1340 1345 1350
Gln Lys Leu Leu Glu Gln Ser Ile Gln Ser Ala Gln Glu Thr Glu
1355 1360 1365
Lys Ser Leu His Leu Ile Gln Glu Ser Leu Thr Phe Ile Asp Lys
1370 1375 1380
Gln Leu Ala Ala Tyr Ile Ala Asp Lys Val Asp Ala Ala Gln Met
1385 1390 1395
Pro Gln Glu Ala Gln Lys Ile Gln Ser Asp Leu Thr Ser His Glu
1400 1405 1410
Ile Ser Leu Glu Glu Met Lys Lys His Asn Gln Gly Lys Glu Ala
1415 1420 1425
Ala Gln Arg Val Leu Ser Gln Ile Asp Val Ala Gln Lys Lys Leu
1430 1435 1440
Gln Asp Val Ser Met Lys Phe Arg Leu Phe Gln Lys Pro Ala Asn
1445 1450 1455
Phe Glu Gln Arg Leu Gln Glu Ser Lys Met Ile Leu Asp Glu Val
1460 1465 1470
Lys Met His Leu Pro Ala Leu Glu Thr Lys Ser Val Glu Gln Glu
1475 1480 1485
Val Val Gln Ser Gln Leu Asn His Cys Val Asn Leu Tyr Lys Ser
1490 1495 1500
Leu Ser Glu Val Lys Ser Glu Val Glu Met Val Ile Lys Thr Gly
1505 1510 1515
Arg Gln Ile Val Gln Lys Lys Gln Thr Glu Asn Pro Lys Glu Leu
1520 1525 1530
Asp Glu Arg Val Thr Ala Leu Lys Leu His Tyr Asn Glu Leu Gly
1535 1540 1545
Ala Lys Val Thr Glu Arg Lys Gln Gln Leu Glu Lys Cys Leu Lys
1550 1555 1560
Leu Ser Arg Lys Met Arg Lys Glu Met Asn Val Leu Thr Glu Trp
1565 1570 1575
Leu Ala Ala Thr Asp Met Glu Leu Thr Lys Arg Ser Ala Val Glu
1580 1585 1590
Gly Met Pro Ser Asn Leu Asp Ser Glu Val Ala Trp Gly Lys Ala
1595 1600 1605
Thr Gln Lys Glu Ile Glu Lys Gln Lys Val His Leu Lys Ser Ile
1610 1615 1620
Thr Glu Val Gly Glu Ala Leu Lys Thr Val Leu Gly Lys Lys Glu
1625 1630 1635
Thr Leu Val Glu Asp Lys Leu Ser Leu Leu Asn Ser Asn Trp Ile
1640 1645 1650
Ala Val Thr Ser Arg Ala Glu Glu Trp Leu Asn Leu Leu Leu Glu
1655 1660 1665
Tyr Gln Lys His Met Glu Thr Phe Asp Gln Asn Val Asp His Ile
1670 1675 1680
Thr Lys Trp Ile Ile Gln Ala Asp Thr Leu Leu Asp Glu Ser Glu
1685 1690 1695
Lys Lys Lys Pro Gln Gln Lys Glu Asp Val Leu Lys Arg Leu Lys
1700 1705 1710
Ala Glu Leu Asn Asp Ile Arg Pro Lys Val Asp Ser Thr Arg Asp
1715 1720 1725
Gln Ala Ala Asn Leu Met Ala Asn Arg Gly Asp His Cys Arg Lys
1730 1735 1740
Leu Val Glu Pro Gln Ile Ser Glu Leu Asn His Arg Phe Ala Ala
1745 1750 1755
Ile Ser His Arg Ile Lys Thr Gly Lys Ala Ser Ile Pro Leu Lys
1760 1765 1770
Glu Leu Glu Gln Phe Asn Ser Asp Ile Gln Lys Leu Leu Glu Pro
1775 1780 1785
Leu Glu Ala Glu Ile Gln Gln Gly Val Asn Leu Lys Glu Glu Asp
1790 1795 1800
Phe Asn Lys Asp Met Asn Glu Asp Asn Glu Gly Thr Val Lys Glu
1805 1810 1815
Leu Leu Gln Arg Gly Asp Asn Leu Gln Gln Arg Ile Thr Asp Glu
1820 1825 1830
Arg Lys Arg Glu Glu Ile Lys Ile Lys Gln Gln Leu Leu Gln Thr
1835 1840 1845
Lys His Asn Ala Leu Lys Asp Leu Arg Ser Gln Arg Arg Lys Lys
1850 1855 1860
Ala Leu Glu Ile Ser His Gln Trp Tyr Gln Tyr Lys Arg Gln Ala
1865 1870 1875
Asp Asp Leu Leu Lys Cys Leu Asp Asp Ile Glu Lys Lys Leu Ala
1880 1885 1890
Ser Leu Pro Glu Pro Arg Asp Glu Arg Lys Ile Lys Glu Ile Asp
1895 1900 1905
Arg Glu Leu Gln Lys Lys Lys Glu Glu Leu Asn Ala Val Arg Arg
1910 1915 1920
Gln Ala Glu Gly Leu Ser Glu Asp Gly Ala Ala Met Ala Val Glu
1925 1930 1935
Pro Thr Gln Ile Gln Leu Ser Lys Arg Trp Arg Glu Ile Glu Ser
1940 1945 1950
Lys Phe Ala Gln Phe Arg Arg Leu Asn Phe Ala Gln Ile His Thr
1955 1960 1965
Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
1970 1975 1980
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His
1985 1990 1995
Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro
2000 2005 2010
Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu
2015 2020 2025
Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg
2030 2035 2040
Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala
2045 2050 2055
Thr Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu
2060 2065 2070
Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln
2075 2080 2085
Gly Arg Phe Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr
2090 2095 2100
Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe
2105 2110 2115
Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys Tyr
2120 2125 2130
Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln
2135 2140 2145
Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln
2150 2155 2160
Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu Gly
2165 2170 2175
Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp
2180 2185 2190
Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn Ile Leu Ser Glu Phe
2195 2200 2205
Gln Arg Asp Leu Asn Glu Phe Val Leu Trp Leu Glu Glu Ala Asp
2210 2215 2220
Asn Ile Ala Ser Ile Pro Leu Glu Pro Gly Lys Glu Gln Gln Leu
2225 2230 2235
Lys Glu Lys Leu Glu Gln Val Lys Leu Leu Val Glu Glu Leu Pro
2240 2245 2250
Leu Arg Gln Gly Ile Leu Lys Gln Leu Asn Glu Thr Gly Gly Pro
2255 2260 2265
Val Leu Val Ser Ala Pro Ile Ser Pro Glu Glu Gln Asp Lys Leu
2270 2275 2280
Glu Asn Lys Leu Lys Gln Thr Asn Leu Gln Trp Ile Lys Val Ser
2285 2290 2295
Arg Ala Leu Pro Glu Lys Gln Gly Glu Ile Glu Ala Gln Ile Lys
2300 2305 2310
Asp Leu Gly Gln Leu Glu Lys Lys Leu Glu Asp Leu Glu Glu Gln
2315 2320 2325
Leu Asn His Leu Leu Leu Trp Leu Ser Pro Ile Arg Asn Gln Leu
2330 2335 2340
Glu Ile Tyr Asn Gln Pro Asn Gln Glu Gly Pro Phe Asp Val Lys
2345 2350 2355
Glu Thr Glu Ile Ala Val Gln Ala Lys Gln Pro Asp Val Glu Glu
2360 2365 2370
Ile Leu Ser Lys Gly Gln His Leu Tyr Lys Glu Lys Pro Ala Thr
2375 2380 2385
Gln Pro Val Lys Arg Lys Leu Glu Asp Leu Ser Ser Glu Trp Lys
2390 2395 2400
Ala Val Asn Arg Leu Leu Gln Glu Leu Arg Ala Lys Gln Pro Asp
2405 2410 2415
Leu Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr
2420 2425 2430
Val Thr Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile
2435 2440 2445
Ser Lys Leu Glu Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala
2450 2455 2460
Leu Ala Asp Phe Asn Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu
2465 2470 2475
Ser Leu Leu Asp Gln Val Ile Lys Ser Gln Arg Val Met Val Gly
2480 2485 2490
Asp Leu Glu Asp Ile Asn Glu Met Ile Ile Lys Gln Lys Ala Thr
2495 2500 2505
Met Gln Asp Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu Leu Ile
2510 2515 2520
Thr Ala Ala Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln Glu Ala
2525 2530 2535
Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg Ile Gln Asn Gln Trp
2540 2545 2550
Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg Gln Gln Leu Asn
2555 2560 2565
Glu Met Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala Lys Glu Glu
2570 2575 2580
Ala Glu Gln Val Leu Gly Gln Ala Arg Ala Lys Leu Glu Ser Trp
2585 2590 2595
Lys Glu Gly Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile Thr
2600 2605 2610
Glu Thr Lys Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn
2615 2620 2625
Val Asp Val Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr
2630 2635 2640
Ser Ala Asp Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile
2645 2650 2655
Asn Ala Ser Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu
2660 2665 2670
Ala Ala Leu Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu
2675 2680 2685
Asp Leu Glu Lys Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr
2690 2695 2700
Ala Asn Val Leu Gln Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu
2705 2710 2715
Asp Ser Lys Gly Val Lys Glu Leu Met Lys Gln Trp Gln Asp Leu
2720 2725 2730
Gln Gly Glu Ile Glu Ala His Thr Asp Val Tyr His Asn Leu Asp
2735 2740 2745
Glu Asn Ser Gln Lys Ile Leu Arg Ser Leu Glu Gly Ser Asp Asp
2750 2755 2760
Ala Val Leu Leu Gln Arg Arg Leu Asp Asn Met Asn Phe Lys Trp
2765 2770 2775
Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile Arg Ser His Leu Glu
2780 2785 2790
Ala Ser Ser Asp Gln Trp Lys Arg Leu His Leu Ser Leu Gln Glu
2795 2800 2805
Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser Arg Gln
2810 2815 2820
Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln Asn Asp
2825 2830 2835
Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro Val
2840 2845 2850
Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
2855 2860 2865
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu
2870 2875 2880
Pro Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys
2885 2890 2895
Gln Ala Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His
2900 2905 2910
Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu
2915 2920 2925
Arg Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg
2930 2935 2940
Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu
2945 2950 2955
Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu
2960 2965 2970
Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn
2975 2980 2985
Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro
2990 2995 3000
Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu
3005 3010 3015
Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala
3020 3025 3030
His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser
3035 3040 3045
Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro
3050 3055 3060
Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro
3065 3070 3075
Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val
3080 3085 3090
Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln
3095 3100 3105
Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp
3110 3115 3120
Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp
3125 3130 3135
Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu
3140 3145 3150
Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp
3155 3160 3165
Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr
3170 3175 3180
Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu
3185 3190 3195
Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln
3200 3205 3210
Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu
3215 3220 3225
Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val
3230 3235 3240
Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys
3245 3250 3255
Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe
3260 3265 3270
Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro
3275 3280 3285
Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala
3290 3295 3300
Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr
3305 3310 3315
Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe
3320 3325 3330
Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met
3335 3340 3345
Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp
3350 3355 3360
Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe
3365 3370 3375
Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu
3380 3385 3390
Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp
3395 3400 3405
Pro Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp
3410 3415 3420
Asp Thr His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu
3425 3430 3435
Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro
3440 3445 3450
Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys
3455 3460 3465
Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro
3470 3475 3480
Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu
3485 3490 3495
Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln
3500 3505 3510
Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys Gly Leu
3515 3520 3525
Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr Ser Pro Gln
3530 3535 3540
Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg
3545 3550 3555
Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu Asp
3560 3565 3570
His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln Leu
3575 3580 3585
Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr Thr Val
3590 3595 3600
Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro
3605 3610 3615
Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly
3620 3625 3630
Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu
3635 3640 3645
Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg
3650 3655 3660
Gly His Asn Val Gly Ser Leu Phe His Met Ala Asp Asp Leu Gly
3665 3670 3675
Arg Ala Met Glu Ser Leu Val Ser Val Met Thr Asp Glu Glu Gly
3680 3685 3690
Ala Glu
3695
<210> 40
<211> 13800
<212> DNA
<213> Homo sapiens
<400> 40
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
agaatgaaga caatgagggt actgtaaaag aattgttgca aagaggagac aacttacaac 5580
aaagaatcac agatgagaga aagcgagagg aaataaagat aaaacagcag ctgttacaga 5640
caaaacataa tgctctcaag gatttgaggt ctcaaagaag aaaaaaggct ctagaaattt 5700
ctcatcagtg gtatcagtac aagaggcagg ctgatgatct cctgaaatgc ttggatgaca 5760
ttgaaaaaaa attagccagc ctacctgagc ccagagatga aaggaaaata aaggaaattg 5820
atcgggaatt gcagaagaag aaagaggagc tgaatgcagt gcgtaggcaa gctgagggct 5880
tgtctgagga tggggccgca atggcagtgg agccaactca gatccagctc agcaagcgct 5940
ggcgggaaat tgagagcaaa tttgctcagt ttcgaagact caactttgca caaattcaca 6000
ctgtccgtga agaaacgatg atggtgatga ctgaagacat gcctttggaa atttcttatg 6060
tgccttctac ttatttgact gaaatcactc atgtctcaca agccctatta gaagtggaac 6120
aacttctcaa tgctcctgac ctctgtgcta aggactttga agatctcttt aagcaagagg 6180
agtctctgaa gaatataaaa gatagtctac aacaaagctc aggtcggatt gacattattc 6240
atagcaagaa gacagcagca ttgcaaagtg caacgcctgt ggaaagggtg aagctacagg 6300
aagctctctc ccagcttgat ttccaatggg aaaaagttaa caaaatgtac aaggaccgac 6360
aagggcgatt tgacagatct gttgagaaat ggcggcgttt tcattatgat ataaagatat 6420
ttaatcagtg gctaacagaa gctgaacagt ttctcagaaa gacacaaatt cctgagaatt 6480
gggaacatgc taaatacaaa tggtatctta aggaactcca ggatggcatt gggcagcggc 6540
aaactgttgt cagaacattg aatgcaactg gggaagaaat aattcagcaa tcctcaaaaa 6600
cagatgccag tattctacag gaaaaattgg gaagcctgaa tctgcggtgg caggaggtct 6660
gcaaacagct gtcagacaga aaaaagaggc tagaagaaca aaagaatatc ttgtcagaat 6720
ttcaaagaga tttaaatgaa tttgttttat ggttggagga agcagataac attgctagta 6780
tcccacttga acctggaaaa gagcagcaac taaaagaaaa gcttgagcaa gtcaagttac 6840
tggtggaaga gttgcccctg cgccagggaa ttctcaaaca attaaatgaa actggaggac 6900
ccgtgcttgt aagtgctccc ataagcccag aagagcaaga taaacttgaa aataagctca 6960
agcagacaaa tctccagtgg ataaaggttt ccagagcttt acctgagaaa caaggagaaa 7020
ttgaagctca aataaaagac cttgggcagc ttgaaaaaaa gcttgaagac cttgaagagc 7080
agttaaatca tctgctgctg tggttatctc ctattaggaa tcagttggaa atttataacc 7140
aaccaaacca agaaggacca tttgacgtta aggaaactga aatagcagtt caagctaaac 7200
aaccggatgt ggaagagatt ttgtctaaag ggcagcattt gtacaaggaa aaaccagcca 7260
ctcagccagt gaagaggaag ttagaagatc tgagctctga gtggaaggcg gtaaaccgtt 7320
tacttcaaga gctgagggca aagcagcctg acctagctcc tggactgacc actattggag 7380
cctctcctac tcagactgtt actctggtga cacaacctgt ggttactaag gaaactgcca 7440
tctccaaact agaaatgcca tcttccttga tgttggaggt acctgctctg gcagatttca 7500
accgggcttg gacagaactt accgactggc tttctctgct tgatcaagtt ataaaatcac 7560
agagggtgat ggtgggtgac cttgaggata tcaacgagat gatcatcaag cagaaggcaa 7620
caatgcagga tttggaacag aggcgtcccc agttggaaga actcattacc gctgcccaaa 7680
atttgaaaaa caagaccagc aatcaagagg ctagaacaat cattacggat cgaattgaaa 7740
gaattcagaa tcagtgggat gaagtacaag aacaccttca gaaccggagg caacagttga 7800
atgaaatgtt aaaggattca acacaatggc tggaagctaa ggaagaagct gagcaggtct 7860
taggacaggc cagagccaag cttgagtcat ggaaggaggg tccctataca gtagatgcaa 7920
tccaaaagaa aatcacagaa accaagcagt tggccaaaga cctccgccag tggcagacaa 7980
atgtagatgt ggcaaatgac ttggccctga aacttctccg ggattattct gcagatgata 8040
ccagaaaagt ccacatgata acagagaata tcaatgcctc ttggagaagc attcataaaa 8100
gggtgagtga gcgagaggct gctttggaag aaactcatag attactgcaa cagttccccc 8160
tggacctgga aaagtttctt gcctggctta cagaagctga aacaactgcc aatgtcctac 8220
aggatgctac ccgtaaggaa aggctcctag aagactccaa gggagtaaaa gagctgatga 8280
aacaatggca agacctccaa ggtgaaattg aagctcacac agatgtttat cacaacctgg 8340
atgaaaacag ccaaaaaatc ctgagatccc tggaaggttc cgatgatgca gtcctgttac 8400
aaagacgttt ggataacatg aacttcaagt ggagtgaact tcggaaaaag tctctcaaca 8460
ttaggtccca tttggaagcc agttctgacc agtggaagcg tctgcacctt tctctgcagg 8520
aacttctggt gtggctacag ctgaaagatg atgaattaag ccggcaggca cctattggag 8580
gcgactttcc agcagttcag aagcagaacg atgtacatag ggccttcaag agggaattga 8640
aaactaaaga acctgtaatc atgagtactc ttgagactgt acgaatattt ctgacagagc 8700
agcctttgga aggactagag aaactctacc aggagcccag agagctgcct cctgaggaga 8760
gagcccagaa tgtcactcgg cttctacgaa agcaggctga ggaggtcaat actgagtggg 8820
aaaaattgaa cctgcactcc gctgactggc agagaaaaat agatgagacc cttgaaagac 8880
tccgggaact tcaagaggcc acggatgagc tggacctcaa gctgcgccaa gctgaggtga 8940
tcaagggatc ctggcagccc gtgggcgatc tcctcattga ctctctccaa gatcacctcg 9000
agaaagtcaa ggcacttcga ggagaaattg cgcctctgaa agagaacgtg agccacgtca 9060
atgaccttgc tcgccagctt accactttgg gcattcagct ctcaccgtat aacctcagca 9120
ctctggaaga cctgaacacc agatggaagc ttctgcaggt ggccgtcgag gaccgagtca 9180
ggcagctgca tgaagcccac agggactttg gtccagcatc tcagcacttt ctttccacgt 9240
ctgtccaggg tccctgggag agagccatct cgccaaacaa agtgccctac tatatcaacc 9300
acgagactca aacaacttgc tgggaccatc ccaaaatgac agagctctac cagtctttag 9360
ctgacctgaa taatgtcaga ttctcagctt ataggactgc catgaaactc cgaagactgc 9420
agaaggccct ttgcttggat ctcttgagcc tgtcagctgc atgtgatgcc ttggaccagc 9480
acaacctcaa gcaaaatgac cagcccatgg atatcctgca gattattaat tgtttgacca 9540
ctatttatga ccgcctggag caagagcaca acaatttggt caacgtccct ctctgcgtgg 9600
atatgtgtct gaactggctg ctgaatgttt atgatacggg acgaacaggg aggatccgtg 9660
tcctgtcttt taaaactggc atcatttccc tgtgtaaagc acatttggaa gacaagtaca 9720
gatacctttt caagcaagtg gcaagttcaa caggattttg tgaccagcgc aggctgggcc 9780
tccttctgca tgattctatc caaattccaa gacagttggg tgaagttgca tcctttgggg 9840
gcagtaacat tgagccaagt gtccggagct gcttccaatt tgctaataat aagccagaga 9900
tcgaagcggc cctcttccta gactggatga gactggaacc ccagtccatg gtgtggctgc 9960
ccgtcctgca cagagtggct gctgcagaaa ctgccaagca tcaggccaaa tgtaacatct 10020
gcaaagagtg tccaatcatt ggattcaggt acaggagtct aaagcacttt aattatgaca 10080
tctgccaaag ctgctttttt tctggtcgag ttgcaaaagg ccataaaatg cactatccca 10140
tggtggaata ttgcactccg actacatcag gagaagatgt tcgagacttt gccaaggtac 10200
taaaaaacaa atttcgaacc aaaaggtatt ttgcgaagca tccccgaatg ggctacctgc 10260
cagtgcagac tgtcttagag ggggacaaca tggaaactcc cgttactctg atcaacttct 10320
ggccagtaga ttctgcgcct gcctcgtccc ctcagctttc acacgatgat actcattcac 10380
gcattgaaca ttatgctagc aggctagcag aaatggaaaa cagcaatgga tcttatctaa 10440
atgatagcat ctctcctaat gagagcatag atgatgaaca tttgttaatc cagcattact 10500
gccaaagttt gaaccaggac tcccccctga gccagcctcg tagtcctgcc cagatcttga 10560
tttccttaga gagtgaggaa agaggggagc tagagagaat cctagcagat cttgaggaag 10620
aaaacaggaa tctgcaagca gaatatgacc gtctaaagca gcagcacgaa cataaaggcc 10680
tgtccccact gccgtcccct cctgaaatga tgcccacctc tccccagagt ccccgggatg 10740
ctgagctcat tgctgaggcc aagctactgc gtcaacacaa aggccgcctg gaagccagga 10800
tgcaaatcct ggaagaccac aataaacagc tggagtcaca gttacacagg ctaaggcagc 10860
tgctggagca accccaggca gaggccaaag tgaatggcac aacggtgtcc tctccttcta 10920
cctctctaca gaggtccgac agcagtcagc ctatgctgct ccgagtggtt ggcagtcaaa 10980
cttcggactc catgggtgag gaagatcttc tcagtcctcc ccaggacaca agcacagggt 11040
tagaggaggt gatggagcaa ctcaacaact ccttccctag ttcaagagga cacaatgtag 11100
gaagtctttt ccacatggca gatgatttgg gcagagcgat ggagtcctta gtatcagtca 11160
tgacagatga agaaggagca gaataaatgt tttacaactc ctgattcccg catggttttt 11220
ataatattca tacaacaaag aggattagac agtaagagtt tacaagaaat aaatctatat 11280
ttttgtgaag ggtagtggta ttatactgta gatttcagta gtttctaagt ctgttattgt 11340
tttgttaaca atggcaggtt ttacacgtct atgcaattgt acaaaaaagt tataagaaaa 11400
ctacatgtaa aatcttgata gctaaataac ttgccatttc tttatatgga acgcattttg 11460
ggttgtttaa aaatttataa cagttataaa gaaagattgt aaactaaagt gtgctttata 11520
aaaaaaagtt gtttataaaa acccctaaaa acaaaacaaa cacacacaca cacacataca 11580
cacacacaca caaaactttg aggcagcgca ttgttttgca tccttttggc gtgatatcca 11640
tatgaaattc atggcttttt ctttttttgc atattaaaga taagacttcc tctaccacca 11700
caccaaatga ctactacaca ctgctcattt gagaactgtc agctgagtgg ggcaggcttg 11760
agttttcatt tcatatatct atatgtctat aagtatataa atactatagt tatatagata 11820
aagagatacg aatttctata gactgacttt ttccattttt taaatgttca tgtcacatcc 11880
taatagaaag aaattacttc tagtcagtca tccaggctta cctgcttggt ctagaatgga 11940
tttttcccgg agccggaagc caggaggaaa ctacaccaca ctaaaacatt gtctacagct 12000
ccagatgttt ctcattttaa acaactttcc actgacaacg aaagtaaagt aaagtattgg 12060
atttttttaa agggaacatg tgaatgaata cacaggactt attatatcag agtgagtaat 12120
cggttggttg gttgattgat tgattgattg atacattcag cttcctgctg ctagcaatgc 12180
cacgatttag atttaatgat gcttcagtgg aaatcaatca gaaggtattc tgaccttgtg 12240
aacatcagaa ggtatttttt aactcccaag cagtagcagg acgatgatag ggctggaggg 12300
ctatggattc ccagcccatc cctgtgaagg agtaggccac tctttaagtg aaggattgga 12360
tgattgttca taatacataa agttctctgt aattacaact aaattattat gccctcttct 12420
cacagtcaaa aggaactggg tggtttggtt tttgttgctt ttttagattt attgtcccat 12480
gtgggatgag tttttaaatg ccacaagaca taatttaaaa taaataaact ttgggaaaag 12540
gtgtaaaaca gtagccccat cacatttgtg atactgacag gtatcaaccc agaagcccat 12600
gaactgtgtt tccatccttt gcatttctct gcgagtagtt ccacacaggt ttgtaagtaa 12660
gtaagaaaga aggcaaattg attcaaatgt tacaaaaaaa cccttcttgg tggattagac 12720
aggttaaata tataaacaaa caaacaaaaa ttgctcaaaa aagaggagaa aagctcaaga 12780
ggaaaagcta aggactggta ggaaaaagct ttactctttc atgccatttt atttcttttt 12840
gatttttaaa tcattcattc aatagatacc accgtgtgac ctataatttt gcaaatctgt 12900
tacctctgac atcaagtgta attagctttt ggagagtggg ctgacatcaa gtgtaattag 12960
cttttggaga gtgggttttg tccattatta ataattaatt aattaacatc aaacacggct 13020
tctcatgcta tttctacctc actttggttt tggggtgttc ctgataattg tgcacacctg 13080
agttcacagc ttcaccactt gtccattgcg ttattttctt tttcctttat aattctttct 13140
ttttccttca taattttcaa aagaaaaccc aaagctctaa ggtaacaaat taccaaatta 13200
catgaagatt tggtttttgt cttgcatttt tttcctttat gtgacgctgg accttttctt 13260
tacccaagga tttttaaaac tcagatttaa aacaaggggt tactttacat cctactaaga 13320
agtttaagta agtaagtttc attctaaaat cagaggtaaa tagagtgcat aaataatttt 13380
gttttaatct ttttgttttt cttttagaca cattagctct ggagtgagtc tgtcataata 13440
tttgaacaaa aattgagagc tttattgctg cattttaagc ataattaatt tggacattat 13500
ttcgtgttgt gttctttata accaccaagt attaaactgt aaatcataat gtaactgaag 13560
cataaacatc acatggcatg ttttgtcatt gttttcaggt actgagttct tacttgagta 13620
tcataatata ttgtgtttta acaccaacac tgtaacattt acgaattatt tttttaaact 13680
tcagttttac tgcattttca caacatatca gacttcacca aatatatgcc ttactattgt 13740
attatagtac tgctttactg tgtatctcaa taaagcacgc agttatgtta caaaaaagta 13800
<210> 41
<211> 3662
<212> PRT
<213> Homo sapiens
<400> 41
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Asn Glu Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln
1775 1780 1785
Arg Gly Asp Asn Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg
1790 1795 1800
Glu Glu Ile Lys Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn
1805 1810 1815
Ala Leu Lys Asp Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu
1820 1825 1830
Ile Ser His Gln Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu
1835 1840 1845
Leu Lys Cys Leu Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro
1850 1855 1860
Glu Pro Arg Asp Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu
1865 1870 1875
Gln Lys Lys Lys Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu
1880 1885 1890
Gly Leu Ser Glu Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln
1895 1900 1905
Ile Gln Leu Ser Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala
1910 1915 1920
Gln Phe Arg Arg Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu
1925 1930 1935
Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser
1940 1945 1950
Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln
1955 1960 1965
Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys
1970 1975 1980
Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys
1985 1990 1995
Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile
2000 2005 2010
Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val
2015 2020 2025
Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln
2030 2035 2040
Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe
2045 2050 2055
Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys
2060 2065 2070
Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys
2075 2080 2085
Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr
2090 2095 2100
Leu Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val
2105 2110 2115
Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser
2120 2125 2130
Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn
2135 2140 2145
Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys
2150 2155 2160
Arg Leu Glu Glu Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp
2165 2170 2175
Leu Asn Glu Phe Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala
2180 2185 2190
Ser Ile Pro Leu Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys
2195 2200 2205
Leu Glu Gln Val Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln
2210 2215 2220
Gly Ile Leu Lys Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val
2225 2230 2235
Ser Ala Pro Ile Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys
2240 2245 2250
Leu Lys Gln Thr Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu
2255 2260 2265
Pro Glu Lys Gln Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly
2270 2275 2280
Gln Leu Glu Lys Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His
2285 2290 2295
Leu Leu Leu Trp Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr
2300 2305 2310
Asn Gln Pro Asn Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu
2315 2320 2325
Ile Ala Val Gln Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser
2330 2335 2340
Lys Gly Gln His Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val
2345 2350 2355
Lys Arg Lys Leu Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn
2360 2365 2370
Arg Leu Leu Gln Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro
2375 2380 2385
Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu
2390 2395 2400
Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu
2405 2410 2415
Glu Met Pro Ser Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp
2420 2425 2430
Phe Asn Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu
2435 2440 2445
Asp Gln Val Ile Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu
2450 2455 2460
Asp Ile Asn Glu Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp
2465 2470 2475
Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala
2480 2485 2490
Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile
2495 2500 2505
Ile Thr Asp Arg Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val
2510 2515 2520
Gln Glu His Leu Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu
2525 2530 2535
Lys Asp Ser Thr Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln
2540 2545 2550
Val Leu Gly Gln Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly
2555 2560 2565
Pro Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys
2570 2575 2580
Gln Leu Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val
2585 2590 2595
Ala Asn Asp Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp
2600 2605 2610
Asp Thr Arg Lys Val His Met Ile Thr Glu Asn Ile Asn Ala Ser
2615 2620 2625
Trp Arg Ser Ile His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu
2630 2635 2640
Glu Glu Thr His Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu
2645 2650 2655
Lys Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val
2660 2665 2670
Leu Gln Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys
2675 2680 2685
Gly Val Lys Glu Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu
2690 2695 2700
Ile Glu Ala His Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser
2705 2710 2715
Gln Lys Ile Leu Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu
2720 2725 2730
Leu Gln Arg Arg Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu
2735 2740 2745
Arg Lys Lys Ser Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser
2750 2755 2760
Asp Gln Trp Lys Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val
2765 2770 2775
Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile
2780 2785 2790
Gly Gly Asp Phe Pro Ala Val Gln Lys Gln Asn Asp Val His Arg
2795 2800 2805
Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser
2810 2815 2820
Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu
2825 2830 2835
Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu
2840 2845 2850
Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu
2855 2860 2865
Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp
2870 2875 2880
Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu
2885 2890 2895
Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu
2900 2905 2910
Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp
2915 2920 2925
Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu
2930 2935 2940
Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala
2945 2950 2955
Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu
2960 2965 2970
Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val
2975 2980 2985
Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp
2990 2995 3000
Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly
3005 3010 3015
Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile
3020 3025 3030
Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr
3035 3040 3045
Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser
3050 3055 3060
Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu
3065 3070 3075
Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp
3080 3085 3090
Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln
3095 3100 3105
Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu
3110 3115 3120
His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu
3125 3130 3135
Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile
3140 3145 3150
Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala
3155 3160 3165
His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser
3170 3175 3180
Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His
3185 3190 3195
Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe
3200 3205 3210
Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe
3215 3220 3225
Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp
3230 3235 3240
Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu His
3245 3250 3255
Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn
3260 3265 3270
Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu
3275 3280 3285
Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly
3290 3295 3300
Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met Val Glu Tyr
3305 3310 3315
Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys
3320 3325 3330
Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His
3335 3340 3345
Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp
3350 3355 3360
Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp
3365 3370 3375
Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His
3380 3385 3390
Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn
3395 3400 3405
Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser
3410 3415 3420
Ile Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu
3425 3430 3435
Asn Gln Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile
3440 3445 3450
Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile
3455 3460 3465
Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr
3470 3475 3480
Asp Arg Leu Lys Gln Gln His Glu His Lys Gly Leu Ser Pro Leu
3485 3490 3495
Pro Ser Pro Pro Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg
3500 3505 3510
Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys
3515 3520 3525
Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys
3530 3535 3540
Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln
3545 3550 3555
Pro Gln Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro
3560 3565 3570
Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu
3575 3580 3585
Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp
3590 3595 3600
Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val
3605 3610 3615
Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly His Asn
3620 3625 3630
Val Gly Ser Leu Phe His Met Ala Asp Asp Leu Gly Arg Ala Met
3635 3640 3645
Glu Ser Leu Val Ser Val Met Thr Asp Glu Glu Gly Ala Glu
3650 3655 3660
<210> 42
<211> 13785
<212> DNA
<213> Homo sapiens
<400> 42
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatggattt gaggtctcaa agaagaaaaa aggctctaga aatttctcat cagtggtatc 5700
agtacaagag gcaggctgat gatctcctga aatgcttgga tgacattgaa aaaaaattag 5760
ccagcctacc tgagcccaga gatgaaagga aaataaagga aattgatcgg gaattgcaga 5820
agaagaaaga ggagctgaat gcagtgcgta ggcaagctga gggcttgtct gaggatgggg 5880
ccgcaatggc agtggagcca actcagatcc agctcagcaa gcgctggcgg gaaattgaga 5940
gcaaatttgc tcagtttcga agactcaact ttgcacaaat tcacactgtc cgtgaagaaa 6000
cgatgatggt gatgactgaa gacatgcctt tggaaatttc ttatgtgcct tctacttatt 6060
tgactgaaat cactcatgtc tcacaagccc tattagaagt ggaacaactt ctcaatgctc 6120
ctgacctctg tgctaaggac tttgaagatc tctttaagca agaggagtct ctgaagaata 6180
taaaagatag tctacaacaa agctcaggtc ggattgacat tattcatagc aagaagacag 6240
cagcattgca aagtgcaacg cctgtggaaa gggtgaagct acaggaagct ctctcccagc 6300
ttgatttcca atgggaaaaa gttaacaaaa tgtacaagga ccgacaaggg cgatttgaca 6360
gatctgttga gaaatggcgg cgttttcatt atgatataaa gatatttaat cagtggctaa 6420
cagaagctga acagtttctc agaaagacac aaattcctga gaattgggaa catgctaaat 6480
acaaatggta tcttaaggaa ctccaggatg gcattgggca gcggcaaact gttgtcagaa 6540
cattgaatgc aactggggaa gaaataattc agcaatcctc aaaaacagat gccagtattc 6600
tacaggaaaa attgggaagc ctgaatctgc ggtggcagga ggtctgcaaa cagctgtcag 6660
acagaaaaaa gaggctagaa gaacaaaaga atatcttgtc agaatttcaa agagatttaa 6720
atgaatttgt tttatggttg gaggaagcag ataacattgc tagtatccca cttgaacctg 6780
gaaaagagca gcaactaaaa gaaaagcttg agcaagtcaa gttactggtg gaagagttgc 6840
ccctgcgcca gggaattctc aaacaattaa atgaaactgg aggacccgtg cttgtaagtg 6900
ctcccataag cccagaagag caagataaac ttgaaaataa gctcaagcag acaaatctcc 6960
agtggataaa ggtttccaga gctttacctg agaaacaagg agaaattgaa gctcaaataa 7020
aagaccttgg gcagcttgaa aaaaagcttg aagaccttga agagcagtta aatcatctgc 7080
tgctgtggtt atctcctatt aggaatcagt tggaaattta taaccaacca aaccaagaag 7140
gaccatttga cgttaaggaa actgaaatag cagttcaagc taaacaaccg gatgtggaag 7200
agattttgtc taaagggcag catttgtaca aggaaaaacc agccactcag ccagtgaaga 7260
ggaagttaga agatctgagc tctgagtgga aggcggtaaa ccgtttactt caagagctga 7320
gggcaaagca gcctgaccta gctcctggac tgaccactat tggagcctct cctactcaga 7380
ctgttactct ggtgacacaa cctgtggtta ctaaggaaac tgccatctcc aaactagaaa 7440
tgccatcttc cttgatgttg gaggtacctg ctctggcaga tttcaaccgg gcttggacag 7500
aacttaccga ctggctttct ctgcttgatc aagttataaa atcacagagg gtgatggtgg 7560
gtgaccttga ggatatcaac gagatgatca tcaagcagaa ggcaacaatg caggatttgg 7620
aacagaggcg tccccagttg gaagaactca ttaccgctgc ccaaaatttg aaaaacaaga 7680
ccagcaatca agaggctaga acaatcatta cggatcgaat tgaaagaatt cagaatcagt 7740
gggatgaagt acaagaacac cttcagaacc ggaggcaaca gttgaatgaa atgttaaagg 7800
attcaacaca atggctggaa gctaaggaag aagctgagca ggtcttagga caggccagag 7860
ccaagcttga gtcatggaag gagggtccct atacagtaga tgcaatccaa aagaaaatca 7920
cagaaaccaa gcagttggcc aaagacctcc gccagtggca gacaaatgta gatgtggcaa 7980
atgacttggc cctgaaactt ctccgggatt attctgcaga tgataccaga aaagtccaca 8040
tgataacaga gaatatcaat gcctcttgga gaagcattca taaaagggtg agtgagcgag 8100
aggctgcttt ggaagaaact catagattac tgcaacagtt ccccctggac ctggaaaagt 8160
ttcttgcctg gcttacagaa gctgaaacaa ctgccaatgt cctacaggat gctacccgta 8220
aggaaaggct cctagaagac tccaagggag taaaagagct gatgaaacaa tggcaagacc 8280
tccaaggtga aattgaagct cacacagatg tttatcacaa cctggatgaa aacagccaaa 8340
aaatcctgag atccctggaa ggttccgatg atgcagtcct gttacaaaga cgtttggata 8400
acatgaactt caagtggagt gaacttcgga aaaagtctct caacattagg tcccatttgg 8460
aagccagttc tgaccagtgg aagcgtctgc acctttctct gcaggaactt ctggtgtggc 8520
tacagctgaa agatgatgaa ttaagccggc aggcacctat tggaggcgac tttccagcag 8580
ttcagaagca gaacgatgta catagggcct tcaagaggga attgaaaact aaagaacctg 8640
taatcatgag tactcttgag actgtacgaa tatttctgac agagcagcct ttggaaggac 8700
tagagaaact ctaccaggag cccagagagc tgcctcctga ggagagagcc cagaatgtca 8760
ctcggcttct acgaaagcag gctgaggagg tcaatactga gtgggaaaaa ttgaacctgc 8820
actccgctga ctggcagaga aaaatagatg agacccttga aagactccgg gaacttcaag 8880
aggccacgga tgagctggac ctcaagctgc gccaagctga ggtgatcaag ggatcctggc 8940
agcccgtggg cgatctcctc attgactctc tccaagatca cctcgagaaa gtcaaggcac 9000
ttcgaggaga aattgcgcct ctgaaagaga acgtgagcca cgtcaatgac cttgctcgcc 9060
agcttaccac tttgggcatt cagctctcac cgtataacct cagcactctg gaagacctga 9120
acaccagatg gaagcttctg caggtggccg tcgaggaccg agtcaggcag ctgcatgaag 9180
cccacaggga ctttggtcca gcatctcagc actttctttc cacgtctgtc cagggtccct 9240
gggagagagc catctcgcca aacaaagtgc cctactatat caaccacgag actcaaacaa 9300
cttgctggga ccatcccaaa atgacagagc tctaccagtc tttagctgac ctgaataatg 9360
tcagattctc agcttatagg actgccatga aactccgaag actgcagaag gccctttgct 9420
tggatctctt gagcctgtca gctgcatgtg atgccttgga ccagcacaac ctcaagcaaa 9480
atgaccagcc catggatatc ctgcagatta ttaattgttt gaccactatt tatgaccgcc 9540
tggagcaaga gcacaacaat ttggtcaacg tccctctctg cgtggatatg tgtctgaact 9600
ggctgctgaa tgtttatgat acgggacgaa cagggaggat ccgtgtcctg tcttttaaaa 9660
ctggcatcat ttccctgtgt aaagcacatt tggaagacaa gtacagatac cttttcaagc 9720
aagtggcaag ttcaacagga ttttgtgacc agcgcaggct gggcctcctt ctgcatgatt 9780
ctatccaaat tccaagacag ttgggtgaag ttgcatcctt tgggggcagt aacattgagc 9840
caagtgtccg gagctgcttc caatttgcta ataataagcc agagatcgaa gcggccctct 9900
tcctagactg gatgagactg gaaccccagt ccatggtgtg gctgcccgtc ctgcacagag 9960
tggctgctgc agaaactgcc aagcatcagg ccaaatgtaa catctgcaaa gagtgtccaa 10020
tcattggatt caggtacagg agtctaaagc actttaatta tgacatctgc caaagctgct 10080
ttttttctgg tcgagttgca aaaggccata aaatgcacta tcccatggtg gaatattgca 10140
ctccgactac atcaggagaa gatgttcgag actttgccaa ggtactaaaa aacaaatttc 10200
gaaccaaaag gtattttgcg aagcatcccc gaatgggcta cctgccagtg cagactgtct 10260
tagaggggga caacatggaa actcccgtta ctctgatcaa cttctggcca gtagattctg 10320
cgcctgcctc gtcccctcag ctttcacacg atgatactca ttcacgcatt gaacattatg 10380
ctagcaggct agcagaaatg gaaaacagca atggatctta tctaaatgat agcatctctc 10440
ctaatgagag catagatgat gaacatttgt taatccagca ttactgccaa agtttgaacc 10500
aggactcccc cctgagccag cctcgtagtc ctgcccagat cttgatttcc ttagagagtg 10560
aggaaagagg ggagctagag agaatcctag cagatcttga ggaagaaaac aggaatctgc 10620
aagcagaata tgaccgtcta aagcagcagc acgaacataa aggcctgtcc ccactgccgt 10680
cccctcctga aatgatgccc acctctcccc agagtccccg ggatgctgag ctcattgctg 10740
aggccaagct actgcgtcaa cacaaaggcc gcctggaagc caggatgcaa atcctggaag 10800
accacaataa acagctggag tcacagttac acaggctaag gcagctgctg gagcaacccc 10860
aggcagaggc caaagtgaat ggcacaacgg tgtcctctcc ttctacctct ctacagaggt 10920
ccgacagcag tcagcctatg ctgctccgag tggttggcag tcaaacttcg gactccatgg 10980
gtgaggaaga tcttctcagt cctccccagg acacaagcac agggttagag gaggtgatgg 11040
agcaactcaa caactccttc cctagttcaa gaggacacaa tgtaggaagt cttttccaca 11100
tggcagatga tttgggcaga gcgatggagt ccttagtatc agtcatgaca gatgaagaag 11160
gagcagaata aatgttttac aactcctgat tcccgcatgg tttttataat attcatacaa 11220
caaagaggat tagacagtaa gagtttacaa gaaataaatc tatatttttg tgaagggtag 11280
tggtattata ctgtagattt cagtagtttc taagtctgtt attgttttgt taacaatggc 11340
aggttttaca cgtctatgca attgtacaaa aaagttataa gaaaactaca tgtaaaatct 11400
tgatagctaa ataacttgcc atttctttat atggaacgca ttttgggttg tttaaaaatt 11460
tataacagtt ataaagaaag attgtaaact aaagtgtgct ttataaaaaa aagttgttta 11520
taaaaacccc taaaaacaaa acaaacacac acacacacac atacacacac acacacaaaa 11580
ctttgaggca gcgcattgtt ttgcatcctt ttggcgtgat atccatatga aattcatggc 11640
tttttctttt tttgcatatt aaagataaga cttcctctac caccacacca aatgactact 11700
acacactgct catttgagaa ctgtcagctg agtggggcag gcttgagttt tcatttcata 11760
tatctatatg tctataagta tataaatact atagttatat agataaagag atacgaattt 11820
ctatagactg actttttcca ttttttaaat gttcatgtca catcctaata gaaagaaatt 11880
acttctagtc agtcatccag gcttacctgc ttggtctaga atggattttt cccggagccg 11940
gaagccagga ggaaactaca ccacactaaa acattgtcta cagctccaga tgtttctcat 12000
tttaaacaac tttccactga caacgaaagt aaagtaaagt attggatttt tttaaaggga 12060
acatgtgaat gaatacacag gacttattat atcagagtga gtaatcggtt ggttggttga 12120
ttgattgatt gattgataca ttcagcttcc tgctgctagc aatgccacga tttagattta 12180
atgatgcttc agtggaaatc aatcagaagg tattctgacc ttgtgaacat cagaaggtat 12240
tttttaactc ccaagcagta gcaggacgat gatagggctg gagggctatg gattcccagc 12300
ccatccctgt gaaggagtag gccactcttt aagtgaagga ttggatgatt gttcataata 12360
cataaagttc tctgtaatta caactaaatt attatgccct cttctcacag tcaaaaggaa 12420
ctgggtggtt tggtttttgt tgctttttta gatttattgt cccatgtggg atgagttttt 12480
aaatgccaca agacataatt taaaataaat aaactttggg aaaaggtgta aaacagtagc 12540
cccatcacat ttgtgatact gacaggtatc aacccagaag cccatgaact gtgtttccat 12600
cctttgcatt tctctgcgag tagttccaca caggtttgta agtaagtaag aaagaaggca 12660
aattgattca aatgttacaa aaaaaccctt cttggtggat tagacaggtt aaatatataa 12720
acaaacaaac aaaaattgct caaaaaagag gagaaaagct caagaggaaa agctaaggac 12780
tggtaggaaa aagctttact ctttcatgcc attttatttc tttttgattt ttaaatcatt 12840
cattcaatag ataccaccgt gtgacctata attttgcaaa tctgttacct ctgacatcaa 12900
gtgtaattag cttttggaga gtgggctgac atcaagtgta attagctttt ggagagtggg 12960
ttttgtccat tattaataat taattaatta acatcaaaca cggcttctca tgctatttct 13020
acctcacttt ggttttgggg tgttcctgat aattgtgcac acctgagttc acagcttcac 13080
cacttgtcca ttgcgttatt ttctttttcc tttataattc tttctttttc cttcataatt 13140
ttcaaaagaa aacccaaagc tctaaggtaa caaattacca aattacatga agatttggtt 13200
tttgtcttgc atttttttcc tttatgtgac gctggacctt ttctttaccc aaggattttt 13260
aaaactcaga tttaaaacaa ggggttactt tacatcctac taagaagttt aagtaagtaa 13320
gtttcattct aaaatcagag gtaaatagag tgcataaata attttgtttt aatctttttg 13380
tttttctttt agacacatta gctctggagt gagtctgtca taatatttga acaaaaattg 13440
agagctttat tgctgcattt taagcataat taatttggac attatttcgt gttgtgttct 13500
ttataaccac caagtattaa actgtaaatc ataatgtaac tgaagcataa acatcacatg 13560
gcatgttttg tcattgtttt caggtactga gttcttactt gagtatcata atatattgtg 13620
ttttaacacc aacactgtaa catttacgaa ttattttttt aaacttcagt tttactgcat 13680
tttcacaaca tatcagactt caccaaatat atgccttact attgtattat agtactgctt 13740
tactgtgtat ctcaataaag cacgcagtta tgttacaaaa aagta 13785
<210> 43
<211> 3657
<212> PRT
<213> Homo sapiens
<400> 43
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asp Leu
1805 1810 1815
Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln Trp
1820 1825 1830
Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu Asp
1835 1840 1845
Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp Glu
1850 1855 1860
Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys Glu
1865 1870 1875
Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu Asp
1880 1885 1890
Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser Lys
1895 1900 1905
Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg Leu
1910 1915 1920
Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val
1925 1930 1935
Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr
1940 1945 1950
Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu Val
1955 1960 1965
Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu
1970 1975 1980
Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp Ser
1985 1990 1995
Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys Lys
2000 2005 2010
Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys Leu
2015 2020 2025
Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn
2030 2035 2040
Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu
2045 2050 2055
Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp
2060 2065 2070
Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu
2075 2080 2085
Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln
2090 2095 2100
Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala
2105 2110 2115
Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser
2120 2125 2130
Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu
2135 2140 2145
Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln
2150 2155 2160
Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe Val
2165 2170 2175
Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu Glu
2180 2185 2190
Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val Lys
2195 2200 2205
Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys Gln
2210 2215 2220
Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile Ser
2225 2230 2235
Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr Asn
2240 2245 2250
Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln Gly
2255 2260 2265
Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys Lys
2270 2275 2280
Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp Leu
2285 2290 2295
Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn Gln
2300 2305 2310
Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln Ala
2315 2320 2325
Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His Leu
2330 2335 2340
Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu Glu
2345 2350 2355
Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln Glu
2360 2365 2370
Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr Ile
2375 2380 2385
Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro Val
2390 2395 2400
Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser Ser
2405 2410 2415
Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala Trp
2420 2425 2430
Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile Lys
2435 2440 2445
Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu Met
2450 2455 2460
Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg
2465 2470 2475
Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn
2480 2485 2490
Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg Ile
2495 2500 2505
Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu Gln
2510 2515 2520
Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr Gln
2525 2530 2535
Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln Ala
2540 2545 2550
Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp
2555 2560 2565
Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys Asp
2570 2575 2580
Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu Ala
2585 2590 2595
Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys Val
2600 2605 2610
His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile His
2615 2620 2625
Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His Arg
2630 2635 2640
Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala Trp
2645 2650 2655
Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala Thr
2660 2665 2670
Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu Leu
2675 2680 2685
Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His Thr
2690 2695 2700
Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg
2705 2710 2715
Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu
2720 2725 2730
Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu
2735 2740 2745
Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys Arg
2750 2755 2760
Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys
2765 2770 2775
Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro
2780 2785 2790
Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg Glu
2795 2800 2805
Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr Val
2810 2815 2820
Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys Leu
2825 2830 2835
Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn
2840 2845 2850
Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr Glu
2855 2860 2865
Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys Ile
2870 2875 2880
Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu Gln Glu Ala Thr Asp
2885 2890 2895
Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser
2900 2905 2910
Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp His
2915 2920 2925
Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys
2930 2935 2940
Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
2945 2950 2955
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp
2960 2965 2970
Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg
2975 2980 2985
Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser
2990 2995 3000
Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala
3005 3010 3015
Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln
3020 3025 3030
Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser
3035 3040 3045
Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala
3050 3055 3060
Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu
3065 3070 3075
Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys
3080 3085 3090
Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu
3095 3100 3105
Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val
3110 3115 3120
Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn
3125 3130 3135
Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe
3140 3145 3150
Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys
3155 3160 3165
Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys
3170 3175 3180
Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
3185 3190 3195
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile
3200 3205 3210
Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro
3215 3220 3225
Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro
3230 3235 3240
Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala
3245 3250 3255
Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys
3260 3265 3270
Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr
3275 3280 3285
Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly
3290 3295 3300
His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr
3305 3310 3315
Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys
3320 3325 3330
Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr
3335 3340 3345
Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr Pro
3350 3355 3360
Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala Ser
3365 3370 3375
Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu His
3380 3385 3390
Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser Tyr
3395 3400 3405
Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu His
3410 3415 3420
Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro
3425 3430 3435
Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu
3440 3445 3450
Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu
3455 3460 3465
Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln
3470 3475 3480
Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu
3485 3490 3495
Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile
3500 3505 3510
Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala
3515 3520 3525
Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln
3530 3535 3540
Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala
3545 3550 3555
Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu Gln
3560 3565 3570
Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly Ser
3575 3580 3585
Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro Pro
3590 3595 3600
Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu Asn
3605 3610 3615
Asn Ser Phe Pro Ser Ser Arg Gly His Asn Val Gly Ser Leu Phe
3620 3625 3630
His Met Ala Asp Asp Leu Gly Arg Ala Met Glu Ser Leu Val Ser
3635 3640 3645
Val Met Thr Asp Glu Glu Gly Ala Glu
3650 3655
<210> 44
<211> 13625
<212> DNA
<213> Homo sapiens
<400> 44
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaaggaact ccaggatggc attgggcagc 6660
ggcaaactgt tgtcagaaca ttgaatgcaa ctggggaaga aataattcag caatcctcaa 6720
aaacagatgc cagtattcta caggaaaaat tgggaagcct gaatctgcgg tggcaggagg 6780
tctgcaaaca gctgtcagac agaaaaaaga ggctagaaga acaaaagaat atcttgtcag 6840
aatttcaaag agatttaaat gaatttgttt tatggttgga ggaagcagat aacattgcta 6900
gtatcccact tgaacctgga aaagagcagc aactaaaaga aaagcttgag caagtcaagt 6960
tactggtgga agagttgccc ctgcgccagg gaattctcaa acaattaaat gaaactggag 7020
gacccgtgct tgtaagtgct cccataagcc cagaagagca agataaactt gaaaataagc 7080
tcaagcagac aaatctccag tggataaagg tttccagagc tttacctgag aaacaaggag 7140
aaattgaagc tcaaataaaa gaccttgggc agcttgaaaa aaagcttgaa gaccttgaag 7200
agcagttaaa tcatctgctg ctgtggttat ctcctattag gaatcagttg gaaatttata 7260
accaaccaaa ccaagaagga ccatttgacg ttaaggaaac tgaaatagca gttcaagcta 7320
aacaaccgga tgtggaagag attttgtcta aagggcagca tttgtacaag gaaaaaccag 7380
ccactcagcc agtgaagagg aagttagaag atctgagctc tgagtggaag gcggtaaacc 7440
gtttacttca agagctgagg gcaaagcagc ctgacctagc tcctggactg accactattg 7500
gagcctctcc tactcagact gttactctgg tgacacaacc tgtggttact aaggaaactg 7560
ccatctccaa actagaaatg ccatcttcct tgatgttgga ggtacctgct ctggcagatt 7620
tcaaccgggc ttggacagaa cttaccgact ggctttctct gcttgatcaa gttataaaat 7680
cacagagggt gatggtgggt gaccttgagg atatcaacga gatgatcatc aagcagaagg 7740
caacaatgca ggatttggaa cagaggcgtc cccagttgga agaactcatt accgctgccc 7800
aaaatttgaa aaacaagacc agcaatcaag aggctagaac aatcattacg gatcgaattg 7860
aaagaattca gaatcagtgg gatgaagtac aagaacacct tcagaaccgg aggcaacagt 7920
tgaatgaaat gttaaaggat tcaacacaat ggctggaagc taaggaagaa gctgagcagg 7980
tcttaggaca ggccagagcc aagcttgagt catggaagga gggtccctat acagtagatg 8040
caatccaaaa gaaaatcaca gaaaccaagc agttggccaa agacctccgc cagtggcaga 8100
caaatgtaga tgtggcaaat gacttggccc tgaaacttct ccgggattat tctgcagatg 8160
ataccagaaa agtccacatg ataacagaga atatcaatgc ctcttggaga agcattcata 8220
aaagggtgag tgagcgagag gctgctttgg aagaaactca tagattactg caacagttcc 8280
ccctggacct ggaaaagttt cttgcctggc ttacagaagc tgaaacaact gccaatgtcc 8340
tacaggatgc tacccgtaag gaaaggctcc tagaagactc caagggagta aaagagctga 8400
tgaaacaatg gcaagacctc caaggtgaaa ttgaagctca cacagatgtt tatcacaacc 8460
tggatgaaaa cagccaaaaa atcctgagat ccctggaagg ttccgatgat gcagtcctgt 8520
tacaaagacg tttggataac atgaacttca agtggagtga acttcggaaa aagtctctca 8580
acattaggtc ccatttggaa gccagttctg accagtggaa gcgtctgcac ctttctctgc 8640
aggaacttct ggtgtggcta cagctgaaag atgatgaatt aagccggcag gcacctattg 8700
gaggcgactt tccagcagtt cagaagcaga acgatgtaca tagggccttc aagagggaat 8760
tgaaaactaa agaacctgta atcatgagta ctcttgagac tgtacgaata tttctgacag 8820
agcagccttt ggaaggacta gagaaactct accaggagcc cagagagctg cctcctgagg 8880
agagagccca gaatgtcact cggcttctac gaaagcaggc tgaggaggtc aatactgagt 8940
gggaaaaatt gaacctgcac tccgctgact ggcagagaaa aatagatgag acccttgaaa 9000
gactccggga acttcaagag gccacggatg agctggacct caagctgcgc caagctgagg 9060
tgatcaaggg atcctggcag cccgtgggcg atctcctcat tgactctctc caagatcacc 9120
tcgagaaagt caaggcactt cgaggagaaa ttgcgcctct gaaagagaac gtgagccacg 9180
tcaatgacct tgctcgccag cttaccactt tgggcattca gctctcaccg tataacctca 9240
gcactctgga agacctgaac accagatgga agcttctgca ggtggccgtc gaggaccgag 9300
tcaggcagct gcatgaagcc cacagggact ttggtccagc atctcagcac tttctttcca 9360
cgtctgtcca gggtccctgg gagagagcca tctcgccaaa caaagtgccc tactatatca 9420
accacgagac tcaaacaact tgctgggacc atcccaaaat gacagagctc taccagtctt 9480
tagctgacct gaataatgtc agattctcag cttataggac tgccatgaaa ctccgaagac 9540
tgcagaaggc cctttgcttg gatctcttga gcctgtcagc tgcatgtgat gccttggacc 9600
agcacaacct caagcaaaat gaccagccca tggatatcct gcagattatt aattgtttga 9660
ccactattta tgaccgcctg gagcaagagc acaacaattt ggtcaacgtc cctctctgcg 9720
tggatatgtg tctgaactgg ctgctgaatg tttatgatac gggacgaaca gggaggatcc 9780
gtgtcctgtc ttttaaaact ggcatcattt ccctgtgtaa agcacatttg gaagacaagt 9840
acagatacct tttcaagcaa gtggcaagtt caacaggatt ttgtgaccag cgcaggctgg 9900
gcctccttct gcatgattct atccaaattc caagacagtt gggtgaagtt gcatcctttg 9960
ggggcagtaa cattgagcca agtgtccgga gctgcttcca atttgctaat aataagccag 10020
agatcgaagc ggccctcttc ctagactgga tgagactgga accccagtcc atggtgtggc 10080
tgcccgtcct gcacagagtg gctgctgcag aaactgccaa gcatcaggcc aaatgtaaca 10140
tctgcaaaga gtgtccaatc attggattca ggtacaggag tctaaagcac tttaattatg 10200
acatctgcca aagctgcttt ttttctggtc gagttgcaaa aggccataaa atgcactatc 10260
ccatggtgga atattgcact ccgactacat caggagaaga tgttcgagac tttgccaagg 10320
tactaaaaaa caaatttcga accaaaaggt attttgcgaa gcatccccga atgggctacc 10380
tgccagtgca gactgtctta gagggggaca acatggaaac gaatctgcaa gcagaatatg 10440
accgtctaaa gcagcagcac gaacataaag gcctgtcccc actgccgtcc cctcctgaaa 10500
tgatgcccac ctctccccag agtccccggg atgctgagct cattgctgag gccaagctac 10560
tgcgtcaaca caaaggccgc ctggaagcca ggatgcaaat cctggaagac cacaataaac 10620
agctggagtc acagttacac aggctaaggc agctgctgga gcaaccccag gcagaggcca 10680
aagtgaatgg cacaacggtg tcctctcctt ctacctctct acagaggtcc gacagcagtc 10740
agcctatgct gctccgagtg gttggcagtc aaacttcgga ctccatgggt gaggaagatc 10800
ttctcagtcc tccccaggac acaagcacag ggttagagga ggtgatggag caactcaaca 10860
actccttccc tagttcaaga ggaagaaata cccctggaaa gccaatgaga gaggacacaa 10920
tgtaggaagt cttttccaca tggcagatga tttgggcaga gcgatggagt ccttagtatc 10980
agtcatgaca gatgaagaag gagcagaata aatgttttac aactcctgat tcccgcatgg 11040
tttttataat attcatacaa caaagaggat tagacagtaa gagtttacaa gaaataaatc 11100
tatatttttg tgaagggtag tggtattata ctgtagattt cagtagtttc taagtctgtt 11160
attgttttgt taacaatggc aggttttaca cgtctatgca attgtacaaa aaagttataa 11220
gaaaactaca tgtaaaatct tgatagctaa ataacttgcc atttctttat atggaacgca 11280
ttttgggttg tttaaaaatt tataacagtt ataaagaaag attgtaaact aaagtgtgct 11340
ttataaaaaa aagttgttta taaaaacccc taaaaacaaa acaaacacac acacacacac 11400
atacacacac acacacaaaa ctttgaggca gcgcattgtt ttgcatcctt ttggcgtgat 11460
atccatatga aattcatggc tttttctttt tttgcatatt aaagataaga cttcctctac 11520
caccacacca aatgactact acacactgct catttgagaa ctgtcagctg agtggggcag 11580
gcttgagttt tcatttcata tatctatatg tctataagta tataaatact atagttatat 11640
agataaagag atacgaattt ctatagactg actttttcca ttttttaaat gttcatgtca 11700
catcctaata gaaagaaatt acttctagtc agtcatccag gcttacctgc ttggtctaga 11760
atggattttt cccggagccg gaagccagga ggaaactaca ccacactaaa acattgtcta 11820
cagctccaga tgtttctcat tttaaacaac tttccactga caacgaaagt aaagtaaagt 11880
attggatttt tttaaaggga acatgtgaat gaatacacag gacttattat atcagagtga 11940
gtaatcggtt ggttggttga ttgattgatt gattgataca ttcagcttcc tgctgctagc 12000
aatgccacga tttagattta atgatgcttc agtggaaatc aatcagaagg tattctgacc 12060
ttgtgaacat cagaaggtat tttttaactc ccaagcagta gcaggacgat gatagggctg 12120
gagggctatg gattcccagc ccatccctgt gaaggagtag gccactcttt aagtgaagga 12180
ttggatgatt gttcataata cataaagttc tctgtaatta caactaaatt attatgccct 12240
cttctcacag tcaaaaggaa ctgggtggtt tggtttttgt tgctttttta gatttattgt 12300
cccatgtggg atgagttttt aaatgccaca agacataatt taaaataaat aaactttggg 12360
aaaaggtgta aaacagtagc cccatcacat ttgtgatact gacaggtatc aacccagaag 12420
cccatgaact gtgtttccat cctttgcatt tctctgcgag tagttccaca caggtttgta 12480
agtaagtaag aaagaaggca aattgattca aatgttacaa aaaaaccctt cttggtggat 12540
tagacaggtt aaatatataa acaaacaaac aaaaattgct caaaaaagag gagaaaagct 12600
caagaggaaa agctaaggac tggtaggaaa aagctttact ctttcatgcc attttatttc 12660
tttttgattt ttaaatcatt cattcaatag ataccaccgt gtgacctata attttgcaaa 12720
tctgttacct ctgacatcaa gtgtaattag cttttggaga gtgggctgac atcaagtgta 12780
attagctttt ggagagtggg ttttgtccat tattaataat taattaatta acatcaaaca 12840
cggcttctca tgctatttct acctcacttt ggttttgggg tgttcctgat aattgtgcac 12900
acctgagttc acagcttcac cacttgtcca ttgcgttatt ttctttttcc tttataattc 12960
tttctttttc cttcataatt ttcaaaagaa aacccaaagc tctaaggtaa caaattacca 13020
aattacatga agatttggtt tttgtcttgc atttttttcc tttatgtgac gctggacctt 13080
ttctttaccc aaggattttt aaaactcaga tttaaaacaa ggggttactt tacatcctac 13140
taagaagttt aagtaagtaa gtttcattct aaaatcagag gtaaatagag tgcataaata 13200
attttgtttt aatctttttg tttttctttt agacacatta gctctggagt gagtctgtca 13260
taatatttga acaaaaattg agagctttat tgctgcattt taagcataat taatttggac 13320
attatttcgt gttgtgttct ttataaccac caagtattaa actgtaaatc ataatgtaac 13380
tgaagcataa acatcacatg gcatgttttg tcattgtttt caggtactga gttcttactt 13440
gagtatcata atatattgtg ttttaacacc aacactgtaa catttacgaa ttattttttt 13500
aaacttcagt tttactgcat tttcacaaca tatcagactt caccaaatat atgccttact 13560
attgtattat agtactgctt tactgtgtat ctcaataaag cacgcagtta tgttacaaaa 13620
aagta 13625
<210> 45
<211> 3575
<212> PRT
<213> Homo sapiens
<400> 45
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His
3410 3415 3420
Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr
3425 3430 3435
Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys
3440 3445 3450
Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile
3455 3460 3465
Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu
3470 3475 3480
Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly
3485 3490 3495
Thr Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser
3500 3505 3510
Ser Gln Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp
3515 3520 3525
Ser Met Gly Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser
3530 3535 3540
Thr Gly Leu Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro
3545 3550 3555
Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys Pro Met Arg Glu Asp
3560 3565 3570
Thr Met
3575
<210> 46
<211> 13916
<212> DNA
<213> Homo sapiens
<400> 46
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaaggaact ccaggatggc attgggcagc 6660
ggcaaactgt tgtcagaaca ttgaatgcaa ctggggaaga aataattcag caatcctcaa 6720
aaacagatgc cagtattcta caggaaaaat tgggaagcct gaatctgcgg tggcaggagg 6780
tctgcaaaca gctgtcagac agaaaaaaga ggctagaaga acaaaagaat atcttgtcag 6840
aatttcaaag agatttaaat gaatttgttt tatggttgga ggaagcagat aacattgcta 6900
gtatcccact tgaacctgga aaagagcagc aactaaaaga aaagcttgag caagtcaagt 6960
tactggtgga agagttgccc ctgcgccagg gaattctcaa acaattaaat gaaactggag 7020
gacccgtgct tgtaagtgct cccataagcc cagaagagca agataaactt gaaaataagc 7080
tcaagcagac aaatctccag tggataaagg tttccagagc tttacctgag aaacaaggag 7140
aaattgaagc tcaaataaaa gaccttgggc agcttgaaaa aaagcttgaa gaccttgaag 7200
agcagttaaa tcatctgctg ctgtggttat ctcctattag gaatcagttg gaaatttata 7260
accaaccaaa ccaagaagga ccatttgacg ttaaggaaac tgaaatagca gttcaagcta 7320
aacaaccgga tgtggaagag attttgtcta aagggcagca tttgtacaag gaaaaaccag 7380
ccactcagcc agtgaagagg aagttagaag atctgagctc tgagtggaag gcggtaaacc 7440
gtttacttca agagctgagg gcaaagcagc ctgacctagc tcctggactg accactattg 7500
gagcctctcc tactcagact gttactctgg tgacacaacc tgtggttact aaggaaactg 7560
ccatctccaa actagaaatg ccatcttcct tgatgttgga ggtacctgct ctggcagatt 7620
tcaaccgggc ttggacagaa cttaccgact ggctttctct gcttgatcaa gttataaaat 7680
cacagagggt gatggtgggt gaccttgagg atatcaacga gatgatcatc aagcagaagg 7740
caacaatgca ggatttggaa cagaggcgtc cccagttgga agaactcatt accgctgccc 7800
aaaatttgaa aaacaagacc agcaatcaag aggctagaac aatcattacg gatcgaattg 7860
aaagaattca gaatcagtgg gatgaagtac aagaacacct tcagaaccgg aggcaacagt 7920
tgaatgaaat gttaaaggat tcaacacaat ggctggaagc taaggaagaa gctgagcagg 7980
tcttaggaca ggccagagcc aagcttgagt catggaagga gggtccctat acagtagatg 8040
caatccaaaa gaaaatcaca gaaaccaagc agttggccaa agacctccgc cagtggcaga 8100
caaatgtaga tgtggcaaat gacttggccc tgaaacttct ccgggattat tctgcagatg 8160
ataccagaaa agtccacatg ataacagaga atatcaatgc ctcttggaga agcattcata 8220
aaagggtgag tgagcgagag gctgctttgg aagaaactca tagattactg caacagttcc 8280
ccctggacct ggaaaagttt cttgcctggc ttacagaagc tgaaacaact gccaatgtcc 8340
tacaggatgc tacccgtaag gaaaggctcc tagaagactc caagggagta aaagagctga 8400
tgaaacaatg gcaagacctc caaggtgaaa ttgaagctca cacagatgtt tatcacaacc 8460
tggatgaaaa cagccaaaaa atcctgagat ccctggaagg ttccgatgat gcagtcctgt 8520
tacaaagacg tttggataac atgaacttca agtggagtga acttcggaaa aagtctctca 8580
acattaggtc ccatttggaa gccagttctg accagtggaa gcgtctgcac ctttctctgc 8640
aggaacttct ggtgtggcta cagctgaaag atgatgaatt aagccggcag gcacctattg 8700
gaggcgactt tccagcagtt cagaagcaga acgatgtaca tagggccttc aagagggaat 8760
tgaaaactaa agaacctgta atcatgagta ctcttgagac tgtacgaata tttctgacag 8820
agcagccttt ggaaggacta gagaaactct accaggagcc cagagagctg cctcctgagg 8880
agagagccca gaatgtcact cggcttctac gaaagcaggc tgaggaggtc aatactgagt 8940
gggaaaaatt gaacctgcac tccgctgact ggcagagaaa aatagatgag acccttgaaa 9000
gactccggga acttcaagag gccacggatg agctggacct caagctgcgc caagctgagg 9060
tgatcaaggg atcctggcag cccgtgggcg atctcctcat tgactctctc caagatcacc 9120
tcgagaaagt caaggcactt cgaggagaaa ttgcgcctct gaaagagaac gtgagccacg 9180
tcaatgacct tgctcgccag cttaccactt tgggcattca gctctcaccg tataacctca 9240
gcactctgga agacctgaac accagatgga agcttctgca ggtggccgtc gaggaccgag 9300
tcaggcagct gcatgaagcc cacagggact ttggtccagc atctcagcac tttctttcca 9360
cgtctgtcca gggtccctgg gagagagcca tctcgccaaa caaagtgccc tactatatca 9420
accacgagac tcaaacaact tgctgggacc atcccaaaat gacagagctc taccagtctt 9480
tagctgacct gaataatgtc agattctcag cttataggac tgccatgaaa ctccgaagac 9540
tgcagaaggc cctttgcttg gatctcttga gcctgtcagc tgcatgtgat gccttggacc 9600
agcacaacct caagcaaaat gaccagccca tggatatcct gcagattatt aattgtttga 9660
ccactattta tgaccgcctg gagcaagagc acaacaattt ggtcaacgtc cctctctgcg 9720
tggatatgtg tctgaactgg ctgctgaatg tttatgatac gggacgaaca gggaggatcc 9780
gtgtcctgtc ttttaaaact ggcatcattt ccctgtgtaa agcacatttg gaagacaagt 9840
acagatacct tttcaagcaa gtggcaagtt caacaggatt ttgtgaccag cgcaggctgg 9900
gcctccttct gcatgattct atccaaattc caagacagtt gggtgaagtt gcatcctttg 9960
ggggcagtaa cattgagcca agtgtccgga gctgcttcca atttgctaat aataagccag 10020
agatcgaagc ggccctcttc ctagactgga tgagactgga accccagtcc atggtgtggc 10080
tgcccgtcct gcacagagtg gctgctgcag aaactgccaa gcatcaggcc aaatgtaaca 10140
tctgcaaaga gtgtccaatc attggattca ggtacaggag tctaaagcac tttaattatg 10200
acatctgcca aagctgcttt ttttctggtc gagttgcaaa aggccataaa atgcactatc 10260
ccatggtgga atattgcact ccgactacat caggagaaga tgttcgagac tttgccaagg 10320
tactaaaaaa caaatttcga accaaaaggt attttgcgaa gcatccccga atgggctacc 10380
tgccagtgca gactgtctta gagggggaca acatggaaac gcctgcctcg tcccctcagc 10440
tttcacacga tgatactcat tcacgcattg aacattatgc tagcaggcta gcagaaatgg 10500
aaaacagcaa tggatcttat ctaaatgata gcatctctcc taatgagagc atagatgatg 10560
aacatttgtt aatccagcat tactgccaaa gtttgaacca ggactccccc ctgagccagc 10620
ctcgtagtcc tgcccagatc ttgatttcct tagagagtga ggaaagaggg gagctagaga 10680
gaatcctagc agatcttgag gaagaaaaca ggaatctgca agcagaatat gaccgtctaa 10740
agcagcagca cgaacataaa ggcctgtccc cactgccgtc ccctcctgaa atgatgccca 10800
cctctcccca gagtccccgg gatgctgagc tcattgctga ggccaagcta ctgcgtcaac 10860
acaaaggccg cctggaagcc aggatgcaaa tcctggaaga ccacaataaa cagctggagt 10920
cacagttaca caggctaagg cagctgctgg agcaacccca ggcagaggcc aaagtgaatg 10980
gcacaacggt gtcctctcct tctacctctc tacagaggtc cgacagcagt cagcctatgc 11040
tgctccgagt ggttggcagt caaacttcgg actccatggg tgaggaagat cttctcagtc 11100
ctccccagga cacaagcaca gggttagagg aggtgatgga gcaactcaac aactccttcc 11160
ctagttcaag aggaagaaat acccctggaa agccaatgag agaggacaca atgtaggaag 11220
tcttttccac atggcagatg atttgggcag agcgatggag tccttagtat cagtcatgac 11280
agatgaagaa ggagcagaat aaatgtttta caactcctga ttcccgcatg gtttttataa 11340
tattcataca acaaagagga ttagacagta agagtttaca agaaataaat ctatattttt 11400
gtgaagggta gtggtattat actgtagatt tcagtagttt ctaagtctgt tattgttttg 11460
ttaacaatgg caggttttac acgtctatgc aattgtacaa aaaagttata agaaaactac 11520
atgtaaaatc ttgatagcta aataacttgc catttcttta tatggaacgc attttgggtt 11580
gtttaaaaat ttataacagt tataaagaaa gattgtaaac taaagtgtgc tttataaaaa 11640
aaagttgttt ataaaaaccc ctaaaaacaa aacaaacaca cacacacaca catacacaca 11700
cacacacaaa actttgaggc agcgcattgt tttgcatcct tttggcgtga tatccatatg 11760
aaattcatgg ctttttcttt ttttgcatat taaagataag acttcctcta ccaccacacc 11820
aaatgactac tacacactgc tcatttgaga actgtcagct gagtggggca ggcttgagtt 11880
ttcatttcat atatctatat gtctataagt atataaatac tatagttata tagataaaga 11940
gatacgaatt tctatagact gactttttcc attttttaaa tgttcatgtc acatcctaat 12000
agaaagaaat tacttctagt cagtcatcca ggcttacctg cttggtctag aatggatttt 12060
tcccggagcc ggaagccagg aggaaactac accacactaa aacattgtct acagctccag 12120
atgtttctca ttttaaacaa ctttccactg acaacgaaag taaagtaaag tattggattt 12180
ttttaaaggg aacatgtgaa tgaatacaca ggacttatta tatcagagtg agtaatcggt 12240
tggttggttg attgattgat tgattgatac attcagcttc ctgctgctag caatgccacg 12300
atttagattt aatgatgctt cagtggaaat caatcagaag gtattctgac cttgtgaaca 12360
tcagaaggta ttttttaact cccaagcagt agcaggacga tgatagggct ggagggctat 12420
ggattcccag cccatccctg tgaaggagta ggccactctt taagtgaagg attggatgat 12480
tgttcataat acataaagtt ctctgtaatt acaactaaat tattatgccc tcttctcaca 12540
gtcaaaagga actgggtggt ttggtttttg ttgctttttt agatttattg tcccatgtgg 12600
gatgagtttt taaatgccac aagacataat ttaaaataaa taaactttgg gaaaaggtgt 12660
aaaacagtag ccccatcaca tttgtgatac tgacaggtat caacccagaa gcccatgaac 12720
tgtgtttcca tcctttgcat ttctctgcga gtagttccac acaggtttgt aagtaagtaa 12780
gaaagaaggc aaattgattc aaatgttaca aaaaaaccct tcttggtgga ttagacaggt 12840
taaatatata aacaaacaaa caaaaattgc tcaaaaaaga ggagaaaagc tcaagaggaa 12900
aagctaagga ctggtaggaa aaagctttac tctttcatgc cattttattt ctttttgatt 12960
tttaaatcat tcattcaata gataccaccg tgtgacctat aattttgcaa atctgttacc 13020
tctgacatca agtgtaatta gcttttggag agtgggctga catcaagtgt aattagcttt 13080
tggagagtgg gttttgtcca ttattaataa ttaattaatt aacatcaaac acggcttctc 13140
atgctatttc tacctcactt tggttttggg gtgttcctga taattgtgca cacctgagtt 13200
cacagcttca ccacttgtcc attgcgttat tttctttttc ctttataatt ctttcttttt 13260
ccttcataat tttcaaaaga aaacccaaag ctctaaggta acaaattacc aaattacatg 13320
aagatttggt ttttgtcttg catttttttc ctttatgtga cgctggacct tttctttacc 13380
caaggatttt taaaactcag atttaaaaca aggggttact ttacatccta ctaagaagtt 13440
taagtaagta agtttcattc taaaatcaga ggtaaataga gtgcataaat aattttgttt 13500
taatcttttt gtttttcttt tagacacatt agctctggag tgagtctgtc ataatatttg 13560
aacaaaaatt gagagcttta ttgctgcatt ttaagcataa ttaatttgga cattatttcg 13620
tgttgtgttc tttataacca ccaagtatta aactgtaaat cataatgtaa ctgaagcata 13680
aacatcacat ggcatgtttt gtcattgttt tcaggtactg agttcttact tgagtatcat 13740
aatatattgt gttttaacac caacactgta acatttacga attatttttt taaacttcag 13800
ttttactgca ttttcacaac atatcagact tcaccaaata tatgccttac tattgtatta 13860
tagtactgct ttactgtgta tctcaataaa gcacgcagtt atgttacaaa aaagta 13916
<210> 47
<211> 3672
<212> PRT
<213> Homo sapiens
<400> 47
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg
3410 3415 3420
Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn
3425 3430 3435
Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp
3440 3445 3450
Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln
3455 3460 3465
Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile
3470 3475 3480
Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala
3485 3490 3495
Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg
3500 3505 3510
Leu Lys Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser
3515 3520 3525
Pro Pro Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala
3530 3535 3540
Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg
3545 3550 3555
Leu Glu Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu
3560 3565 3570
Glu Ser Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln
3575 3580 3585
Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr
3590 3595 3600
Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val
3605 3610 3615
Val Gly Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu
3620 3625 3630
Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu
3635 3640 3645
Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro
3650 3655 3660
Gly Lys Pro Met Arg Glu Asp Thr Met
3665 3670
<210> 48
<211> 13923
<212> DNA
<213> Homo sapiens
<400> 48
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaaggaact ccaggatggc attgggcagc 6660
ggcaaactgt tgtcagaaca ttgaatgcaa ctggggaaga aataattcag caatcctcaa 6720
aaacagatgc cagtattcta caggaaaaat tgggaagcct gaatctgcgg tggcaggagg 6780
tctgcaaaca gctgtcagac agaaaaaaga ggctagaaga acaaaagaat atcttgtcag 6840
aatttcaaag agatttaaat gaatttgttt tatggttgga ggaagcagat aacattgcta 6900
gtatcccact tgaacctgga aaagagcagc aactaaaaga aaagcttgag caagtcaagt 6960
tactggtgga agagttgccc ctgcgccagg gaattctcaa acaattaaat gaaactggag 7020
gacccgtgct tgtaagtgct cccataagcc cagaagagca agataaactt gaaaataagc 7080
tcaagcagac aaatctccag tggataaagg tttccagagc tttacctgag aaacaaggag 7140
aaattgaagc tcaaataaaa gaccttgggc agcttgaaaa aaagcttgaa gaccttgaag 7200
agcagttaaa tcatctgctg ctgtggttat ctcctattag gaatcagttg gaaatttata 7260
accaaccaaa ccaagaagga ccatttgacg ttaaggaaac tgaaatagca gttcaagcta 7320
aacaaccgga tgtggaagag attttgtcta aagggcagca tttgtacaag gaaaaaccag 7380
ccactcagcc agtgaagagg aagttagaag atctgagctc tgagtggaag gcggtaaacc 7440
gtttacttca agagctgagg gcaaagcagc ctgacctagc tcctggactg accactattg 7500
gagcctctcc tactcagact gttactctgg tgacacaacc tgtggttact aaggaaactg 7560
ccatctccaa actagaaatg ccatcttcct tgatgttgga ggtacctgct ctggcagatt 7620
tcaaccgggc ttggacagaa cttaccgact ggctttctct gcttgatcaa gttataaaat 7680
cacagagggt gatggtgggt gaccttgagg atatcaacga gatgatcatc aagcagaagg 7740
caacaatgca ggatttggaa cagaggcgtc cccagttgga agaactcatt accgctgccc 7800
aaaatttgaa aaacaagacc agcaatcaag aggctagaac aatcattacg gatcgaattg 7860
aaagaattca gaatcagtgg gatgaagtac aagaacacct tcagaaccgg aggcaacagt 7920
tgaatgaaat gttaaaggat tcaacacaat ggctggaagc taaggaagaa gctgagcagg 7980
tcttaggaca ggccagagcc aagcttgagt catggaagga gggtccctat acagtagatg 8040
caatccaaaa gaaaatcaca gaaaccaagc agttggccaa agacctccgc cagtggcaga 8100
caaatgtaga tgtggcaaat gacttggccc tgaaacttct ccgggattat tctgcagatg 8160
ataccagaaa agtccacatg ataacagaga atatcaatgc ctcttggaga agcattcata 8220
aaagggtgag tgagcgagag gctgctttgg aagaaactca tagattactg caacagttcc 8280
ccctggacct ggaaaagttt cttgcctggc ttacagaagc tgaaacaact gccaatgtcc 8340
tacaggatgc tacccgtaag gaaaggctcc tagaagactc caagggagta aaagagctga 8400
tgaaacaatg gcaagacctc caaggtgaaa ttgaagctca cacagatgtt tatcacaacc 8460
tggatgaaaa cagccaaaaa atcctgagat ccctggaagg ttccgatgat gcagtcctgt 8520
tacaaagacg tttggataac atgaacttca agtggagtga acttcggaaa aagtctctca 8580
acattaggtc ccatttggaa gccagttctg accagtggaa gcgtctgcac ctttctctgc 8640
aggaacttct ggtgtggcta cagctgaaag atgatgaatt aagccggcag gcacctattg 8700
gaggcgactt tccagcagtt cagaagcaga acgatgtaca tagggccttc aagagggaat 8760
tgaaaactaa agaacctgta atcatgagta ctcttgagac tgtacgaata tttctgacag 8820
agcagccttt ggaaggacta gagaaactct accaggagcc cagagagctg cctcctgagg 8880
agagagccca gaatgtcact cggcttctac gaaagcaggc tgaggaggtc aatactgagt 8940
gggaaaaatt gaacctgcac tccgctgact ggcagagaaa aatagatgag acccttgaaa 9000
gactccggga acttcaagag gccacggatg agctggacct caagctgcgc caagctgagg 9060
tgatcaaggg atcctggcag cccgtgggcg atctcctcat tgactctctc caagatcacc 9120
tcgagaaagt caaggcactt cgaggagaaa ttgcgcctct gaaagagaac gtgagccacg 9180
tcaatgacct tgctcgccag cttaccactt tgggcattca gctctcaccg tataacctca 9240
gcactctgga agacctgaac accagatgga agcttctgca ggtggccgtc gaggaccgag 9300
tcaggcagct gcatgaagcc cacagggact ttggtccagc atctcagcac tttctttcca 9360
cgtctgtcca gggtccctgg gagagagcca tctcgccaaa caaagtgccc tactatatca 9420
accacgagac tcaaacaact tgctgggacc atcccaaaat gacagagctc taccagtctt 9480
tagctgacct gaataatgtc agattctcag cttataggac tgccatgaaa ctccgaagac 9540
tgcagaaggc cctttgcttg gatctcttga gcctgtcagc tgcatgtgat gccttggacc 9600
agcacaacct caagcaaaat gaccagccca tggatatcct gcagattatt aattgtttga 9660
ccactattta tgaccgcctg gagcaagagc acaacaattt ggtcaacgtc cctctctgcg 9720
tggatatgtg tctgaactgg ctgctgaatg tttatgatac gggacgaaca gggaggatcc 9780
gtgtcctgtc ttttaaaact ggcatcattt ccctgtgtaa agcacatttg gaagacaagt 9840
acagatacct tttcaagcaa gtggcaagtt caacaggatt ttgtgaccag cgcaggctgg 9900
gcctccttct gcatgattct atccaaattc caagacagtt gggtgaagtt gcatcctttg 9960
ggggcagtaa cattgagcca agtgtccgga gctgcttcca atttgctaat aataagccag 10020
agatcgaagc ggccctcttc ctagactgga tgagactgga accccagtcc atggtgtggc 10080
tgcccgtcct gcacagagtg gctgctgcag aaactgccaa gcatcaggcc aaatgtaaca 10140
tctgcaaaga gtgtccaatc attggattca ggtacaggag tctaaagcac tttaattatg 10200
acatctgcca aagctgcttt ttttctggtc gagttgcaaa aggccataaa atgcactatc 10260
ccatggtgga atattgcact ccgactacat caggagaaga tgttcgagac tttgccaagg 10320
tactaaaaaa caaatttcga accaaaaggt attttgcgaa gcatccccga atgggctacc 10380
tgccagtgca gactgtctta gagggggaca acatggaaac tcccgttact ctgatcaact 10440
tctggccagt agattctgcg cctgcctcgt cccctcagct ttcacacgat gatactcatt 10500
cacgcattga acattatgct agcaggctag cagaaatgga aaacagcaat ggatcttatc 10560
taaatgatag catctctcct aatgagagca tagatgatga acatttgtta atccagcatt 10620
actgccaaag tttgaaccag gactcccccc tgagccagcc tcgtagtcct gcccagatct 10680
tgatttcctt agagagtgag gaaagagggg agctagagag aatcctagca gatcttgagg 10740
aagaaaacag gaatctgcaa gcagaatatg accgtctaaa gcagcagcac gaacataaag 10800
gcctgtcccc actgccgtcc cctcctgaaa tgatgcccac ctctccccag agtccccggg 10860
atgctgagct cattgctgag gccaagctac tgcgtcaaca caaaggccgc ctggaagcca 10920
ggatgcaaat cctggaagac cacaataaac agctggagtc acagttacac aggctaaggc 10980
agctgctgga gcaaccccag gcagaggcca aagtgaatgg cacaacggtg tcctctcctt 11040
ctacctctct acagaggtcc gacagcagtc agcctatgct gctccgagtg gttggcagtc 11100
aaacttcgga ctccatgggt gaggaagatc ttctcagtcc tccccaggac acaagcacag 11160
ggttagagga ggtgatggag caactcaaca actccttccc tagttcaaga ggacacaatg 11220
taggaagtct tttccacatg gcagatgatt tgggcagagc gatggagtcc ttagtatcag 11280
tcatgacaga tgaagaagga gcagaataaa tgttttacaa ctcctgattc ccgcatggtt 11340
tttataatat tcatacaaca aagaggatta gacagtaaga gtttacaaga aataaatcta 11400
tatttttgtg aagggtagtg gtattatact gtagatttca gtagtttcta agtctgttat 11460
tgttttgtta acaatggcag gttttacacg tctatgcaat tgtacaaaaa agttataaga 11520
aaactacatg taaaatcttg atagctaaat aacttgccat ttctttatat ggaacgcatt 11580
ttgggttgtt taaaaattta taacagttat aaagaaagat tgtaaactaa agtgtgcttt 11640
ataaaaaaaa gttgtttata aaaaccccta aaaacaaaac aaacacacac acacacacat 11700
acacacacac acacaaaact ttgaggcagc gcattgtttt gcatcctttt ggcgtgatat 11760
ccatatgaaa ttcatggctt tttctttttt tgcatattaa agataagact tcctctacca 11820
ccacaccaaa tgactactac acactgctca tttgagaact gtcagctgag tggggcaggc 11880
ttgagttttc atttcatata tctatatgtc tataagtata taaatactat agttatatag 11940
ataaagagat acgaatttct atagactgac tttttccatt ttttaaatgt tcatgtcaca 12000
tcctaataga aagaaattac ttctagtcag tcatccaggc ttacctgctt ggtctagaat 12060
ggatttttcc cggagccgga agccaggagg aaactacacc acactaaaac attgtctaca 12120
gctccagatg tttctcattt taaacaactt tccactgaca acgaaagtaa agtaaagtat 12180
tggatttttt taaagggaac atgtgaatga atacacagga cttattatat cagagtgagt 12240
aatcggttgg ttggttgatt gattgattga ttgatacatt cagcttcctg ctgctagcaa 12300
tgccacgatt tagatttaat gatgcttcag tggaaatcaa tcagaaggta ttctgacctt 12360
gtgaacatca gaaggtattt tttaactccc aagcagtagc aggacgatga tagggctgga 12420
gggctatgga ttcccagccc atccctgtga aggagtaggc cactctttaa gtgaaggatt 12480
ggatgattgt tcataataca taaagttctc tgtaattaca actaaattat tatgccctct 12540
tctcacagtc aaaaggaact gggtggtttg gtttttgttg cttttttaga tttattgtcc 12600
catgtgggat gagtttttaa atgccacaag acataattta aaataaataa actttgggaa 12660
aaggtgtaaa acagtagccc catcacattt gtgatactga caggtatcaa cccagaagcc 12720
catgaactgt gtttccatcc tttgcatttc tctgcgagta gttccacaca ggtttgtaag 12780
taagtaagaa agaaggcaaa ttgattcaaa tgttacaaaa aaacccttct tggtggatta 12840
gacaggttaa atatataaac aaacaaacaa aaattgctca aaaaagagga gaaaagctca 12900
agaggaaaag ctaaggactg gtaggaaaaa gctttactct ttcatgccat tttatttctt 12960
tttgattttt aaatcattca ttcaatagat accaccgtgt gacctataat tttgcaaatc 13020
tgttacctct gacatcaagt gtaattagct tttggagagt gggctgacat caagtgtaat 13080
tagcttttgg agagtgggtt ttgtccatta ttaataatta attaattaac atcaaacacg 13140
gcttctcatg ctatttctac ctcactttgg ttttggggtg ttcctgataa ttgtgcacac 13200
ctgagttcac agcttcacca cttgtccatt gcgttatttt ctttttcctt tataattctt 13260
tctttttcct tcataatttt caaaagaaaa cccaaagctc taaggtaaca aattaccaaa 13320
ttacatgaag atttggtttt tgtcttgcat ttttttcctt tatgtgacgc tggacctttt 13380
ctttacccaa ggatttttaa aactcagatt taaaacaagg ggttacttta catcctacta 13440
agaagtttaa gtaagtaagt ttcattctaa aatcagaggt aaatagagtg cataaataat 13500
tttgttttaa tctttttgtt tttcttttag acacattagc tctggagtga gtctgtcata 13560
atatttgaac aaaaattgag agctttattg ctgcatttta agcataatta atttggacat 13620
tatttcgtgt tgtgttcttt ataaccacca agtattaaac tgtaaatcat aatgtaactg 13680
aagcataaac atcacatggc atgttttgtc attgttttca ggtactgagt tcttacttga 13740
gtatcataat atattgtgtt ttaacaccaa cactgtaaca tttacgaatt atttttttaa 13800
acttcagttt tactgcattt tcacaacata tcagacttca ccaaatatat gccttactat 13860
tgtattatag tactgcttta ctgtgtatct caataaagca cgcagttatg ttacaaaaaa 13920
gta 13923
<210> 49
<211> 3703
<212> PRT
<213> Homo sapiens
<400> 49
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala
3410 3415 3420
Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu
3425 3430 3435
His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser
3440 3445 3450
Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
3455 3460 3465
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser
3470 3475 3480
Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu
3485 3490 3495
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
3500 3505 3510
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys
3515 3520 3525
Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro
3530 3535 3540
Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu
3545 3550 3555
Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu
3560 3565 3570
Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser
3575 3580 3585
Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu
3590 3595 3600
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu
3605 3610 3615
Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly
3620 3625 3630
Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
3635 3640 3645
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu
3650 3655 3660
Asn Asn Ser Phe Pro Ser Ser Arg Gly His Asn Val Gly Ser Leu
3665 3670 3675
Phe His Met Ala Asp Asp Leu Gly Arg Ala Met Glu Ser Leu Val
3680 3685 3690
Ser Val Met Thr Asp Glu Glu Gly Ala Glu
3695 3700
<210> 50
<211> 8499
<212> DNA
<213> Homo sapiens
<400> 50
tttcatcaga gcatcttcac acatcagtgt tcactctcta tagatttatt tgcatattgt 60
ctaaatatgt ttttttctgt tattatttta cactttttat tttgcttcat tctctgttga 120
gttcctcaaa cctttaaaaa ggaaataaat aacttattca cttaccctct aaattatatt 180
ctatgtggac ggtccctaat aaataatgag ttatcactcc aaattgtttc aaatcccaag 240
acaccagagg aatttagaag aaagaaaatg ttagaccaat ttcaatattt acttaattag 300
aatatctaaa accaagcatt caaaggataa ctgaaataat atttgggtta ttgagcgagg 360
atgacagtca tgcctttcat atttgtaaac ttcaaaggat gacaataaag ggacaacagc 420
ctttgaaatt ttgagagaag tatttgctgc ttgcaagtcg gttgatgtgg ttagctaact 480
gccctgggcc ctgtattggt tttgctcaat aggaaattga tcgggaattg cagaagaaga 540
aagaggagct gaatgcagtg cgtaggcaag ctgagggctt gtctgaggat ggggccgcaa 600
tggcagtgga gccaactcag atccagctca gcaagcgctg gcgggaaatt gagagcaaat 660
ttgctcagtt tcgaagactc aactttgcac aaattcacac tgtccgtgaa gaaacgatga 720
tggtgatgac tgaagacatg cctttggaaa tttcttatgt gccttctact tatttgactg 780
aaatcactca tgtctcacaa gccctattag aagtggaaca acttctcaat gctcctgacc 840
tctgtgctaa ggactttgaa gatctcttta agcaagagga gtctctgaag aatataaaag 900
atagtctaca acaaagctca ggtcggattg acattattca tagcaagaag acagcagcat 960
tgcaaagtgc aacgcctgtg gaaagggtga agctacagga agctctctcc cagcttgatt 1020
tccaatggga aaaagttaac aaaatgtaca aggaccgaca agggcgattt gacagatctg 1080
ttgagaaatg gcggcgtttt cattatgata taaagatatt taatcagtgg ctaacagaag 1140
ctgaacagtt tctcagaaag acacaaattc ctgagaattg ggaacatgct aaatacaaat 1200
ggtatcttaa ggaactccag gatggcattg ggcagcggca aactgttgtc agaacattga 1260
atgcaactgg ggaagaaata attcagcaat cctcaaaaac agatgccagt attctacagg 1320
aaaaattggg aagcctgaat ctgcggtggc aggaggtctg caaacagctg tcagacagaa 1380
aaaagaggct agaagaacaa aagaatatct tgtcagaatt tcaaagagat ttaaatgaat 1440
ttgttttatg gttggaggaa gcagataaca ttgctagtat cccacttgaa cctggaaaag 1500
agcagcaact aaaagaaaag cttgagcaag tcaagttact ggtggaagag ttgcccctgc 1560
gccagggaat tctcaaacaa ttaaatgaaa ctggaggacc cgtgcttgta agtgctccca 1620
taagcccaga agagcaagat aaacttgaaa ataagctcaa gcagacaaat ctccagtgga 1680
taaaggtttc cagagcttta cctgagaaac aaggagaaat tgaagctcaa ataaaagacc 1740
ttgggcagct tgaaaaaaag cttgaagacc ttgaagagca gttaaatcat ctgctgctgt 1800
ggttatctcc tattaggaat cagttggaaa tttataacca accaaaccaa gaaggaccat 1860
ttgacgttaa ggaaactgaa atagcagttc aagctaaaca accggatgtg gaagagattt 1920
tgtctaaagg gcagcatttg tacaaggaaa aaccagccac tcagccagtg aagaggaagt 1980
tagaagatct gagctctgag tggaaggcgg taaaccgttt acttcaagag ctgagggcaa 2040
agcagcctga cctagctcct ggactgacca ctattggagc ctctcctact cagactgtta 2100
ctctggtgac acaacctgtg gttactaagg aaactgccat ctccaaacta gaaatgccat 2160
cttccttgat gttggaggta cctgctctgg cagatttcaa ccgggcttgg acagaactta 2220
ccgactggct ttctctgctt gatcaagtta taaaatcaca gagggtgatg gtgggtgacc 2280
ttgaggatat caacgagatg atcatcaagc agaaggcaac aatgcaggat ttggaacaga 2340
ggcgtcccca gttggaagaa ctcattaccg ctgcccaaaa tttgaaaaac aagaccagca 2400
atcaagaggc tagaacaatc attacggatc gaattgaaag aattcagaat cagtgggatg 2460
aagtacaaga acaccttcag aaccggaggc aacagttgaa tgaaatgtta aaggattcaa 2520
cacaatggct ggaagctaag gaagaagctg agcaggtctt aggacaggcc agagccaagc 2580
ttgagtcatg gaaggagggt ccctatacag tagatgcaat ccaaaagaaa atcacagaaa 2640
ccaagcagtt ggccaaagac ctccgccagt ggcagacaaa tgtagatgtg gcaaatgact 2700
tggccctgaa acttctccgg gattattctg cagatgatac cagaaaagtc cacatgataa 2760
cagagaatat caatgcctct tggagaagca ttcataaaag ggtgagtgag cgagaggctg 2820
ctttggaaga aactcataga ttactgcaac agttccccct ggacctggaa aagtttcttg 2880
cctggcttac agaagctgaa acaactgcca atgtcctaca ggatgctacc cgtaaggaaa 2940
ggctcctaga agactccaag ggagtaaaag agctgatgaa acaatggcaa gacctccaag 3000
gtgaaattga agctcacaca gatgtttatc acaacctgga tgaaaacagc caaaaaatcc 3060
tgagatccct ggaaggttcc gatgatgcag tcctgttaca aagacgtttg gataacatga 3120
acttcaagtg gagtgaactt cggaaaaagt ctctcaacat taggtcccat ttggaagcca 3180
gttctgacca gtggaagcgt ctgcaccttt ctctgcagga acttctggtg tggctacagc 3240
tgaaagatga tgaattaagc cggcaggcac ctattggagg cgactttcca gcagttcaga 3300
agcagaacga tgtacatagg gccttcaaga gggaattgaa aactaaagaa cctgtaatca 3360
tgagtactct tgagactgta cgaatatttc tgacagagca gcctttggaa ggactagaga 3420
aactctacca ggagcccaga gagctgcctc ctgaggagag agcccagaat gtcactcggc 3480
ttctacgaaa gcaggctgag gaggtcaata ctgagtggga aaaattgaac ctgcactccg 3540
ctgactggca gagaaaaata gatgagaccc ttgaaagact ccgggaactt caagaggcca 3600
cggatgagct ggacctcaag ctgcgccaag ctgaggtgat caagggatcc tggcagcccg 3660
tgggcgatct cctcattgac tctctccaag atcacctcga gaaagtcaag gcacttcgag 3720
gagaaattgc gcctctgaaa gagaacgtga gccacgtcaa tgaccttgct cgccagctta 3780
ccactttggg cattcagctc tcaccgtata acctcagcac tctggaagac ctgaacacca 3840
gatggaagct tctgcaggtg gccgtcgagg accgagtcag gcagctgcat gaagcccaca 3900
gggactttgg tccagcatct cagcactttc tttccacgtc tgtccagggt ccctgggaga 3960
gagccatctc gccaaacaaa gtgccctact atatcaacca cgagactcaa acaacttgct 4020
gggaccatcc caaaatgaca gagctctacc agtctttagc tgacctgaat aatgtcagat 4080
tctcagctta taggactgcc atgaaactcc gaagactgca gaaggccctt tgcttggatc 4140
tcttgagcct gtcagctgca tgtgatgcct tggaccagca caacctcaag caaaatgacc 4200
agcccatgga tatcctgcag attattaatt gtttgaccac tatttatgac cgcctggagc 4260
aagagcacaa caatttggtc aacgtccctc tctgcgtgga tatgtgtctg aactggctgc 4320
tgaatgttta tgatacggga cgaacaggga ggatccgtgt cctgtctttt aaaactggca 4380
tcatttccct gtgtaaagca catttggaag acaagtacag ataccttttc aagcaagtgg 4440
caagttcaac aggattttgt gaccagcgca ggctgggcct ccttctgcat gattctatcc 4500
aaattccaag acagttgggt gaagttgcat cctttggggg cagtaacatt gagccaagtg 4560
tccggagctg cttccaattt gctaataata agccagagat cgaagcggcc ctcttcctag 4620
actggatgag actggaaccc cagtccatgg tgtggctgcc cgtcctgcac agagtggctg 4680
ctgcagaaac tgccaagcat caggccaaat gtaacatctg caaagagtgt ccaatcattg 4740
gattcaggta caggagtcta aagcacttta attatgacat ctgccaaagc tgcttttttt 4800
ctggtcgagt tgcaaaaggc cataaaatgc actatcccat ggtggaatat tgcactccga 4860
ctacatcagg agaagatgtt cgagactttg ccaaggtact aaaaaacaaa tttcgaacca 4920
aaaggtattt tgcgaagcat ccccgaatgg gctacctgcc agtgcagact gtcttagagg 4980
gggacaacat ggaaactccc gttactctga tcaacttctg gccagtagat tctgcgcctg 5040
cctcgtcccc tcagctttca cacgatgata ctcattcacg cattgaacat tatgctagca 5100
ggctagcaga aatggaaaac agcaatggat cttatctaaa tgatagcatc tctcctaatg 5160
agagcataga tgatgaacat ttgttaatcc agcattactg ccaaagtttg aaccaggact 5220
cccccctgag ccagcctcgt agtcctgccc agatcttgat ttccttagag agtgaggaaa 5280
gaggggagct agagagaatc ctagcagatc ttgaggaaga aaacaggaat ctgcaagcag 5340
aatatgaccg tctaaagcag cagcacgaac ataaaggcct gtccccactg ccgtcccctc 5400
ctgaaatgat gcccacctct ccccagagtc cccgggatgc tgagctcatt gctgaggcca 5460
agctactgcg tcaacacaaa ggccgcctgg aagccaggat gcaaatcctg gaagaccaca 5520
ataaacagct ggagtcacag ttacacaggc taaggcagct gctggagcaa ccccaggcag 5580
aggccaaagt gaatggcaca acggtgtcct ctccttctac ctctctacag aggtccgaca 5640
gcagtcagcc tatgctgctc cgagtggttg gcagtcaaac ttcggactcc atgggtgagg 5700
aagatcttct cagtcctccc caggacacaa gcacagggtt agaggaggtg atggagcaac 5760
tcaacaactc cttccctagt tcaagaggac acaatgtagg aagtcttttc cacatggcag 5820
atgatttggg cagagcgatg gagtccttag tatcagtcat gacagatgaa gaaggagcag 5880
aataaatgtt ttacaactcc tgattcccgc atggttttta taatattcat acaacaaaga 5940
ggattagaca gtaagagttt acaagaaata aatctatatt tttgtgaagg gtagtggtat 6000
tatactgtag atttcagtag tttctaagtc tgttattgtt ttgttaacaa tggcaggttt 6060
tacacgtcta tgcaattgta caaaaaagtt ataagaaaac tacatgtaaa atcttgatag 6120
ctaaataact tgccatttct ttatatggaa cgcattttgg gttgtttaaa aatttataac 6180
agttataaag aaagattgta aactaaagtg tgctttataa aaaaaagttg tttataaaaa 6240
cccctaaaaa caaaacaaac acacacacac acacatacac acacacacac aaaactttga 6300
ggcagcgcat tgttttgcat ccttttggcg tgatatccat atgaaattca tggctttttc 6360
tttttttgca tattaaagat aagacttcct ctaccaccac accaaatgac tactacacac 6420
tgctcatttg agaactgtca gctgagtggg gcaggcttga gttttcattt catatatcta 6480
tatgtctata agtatataaa tactatagtt atatagataa agagatacga atttctatag 6540
actgactttt tccatttttt aaatgttcat gtcacatcct aatagaaaga aattacttct 6600
agtcagtcat ccaggcttac ctgcttggtc tagaatggat ttttcccgga gccggaagcc 6660
aggaggaaac tacaccacac taaaacattg tctacagctc cagatgtttc tcattttaaa 6720
caactttcca ctgacaacga aagtaaagta aagtattgga tttttttaaa gggaacatgt 6780
gaatgaatac acaggactta ttatatcaga gtgagtaatc ggttggttgg ttgattgatt 6840
gattgattga tacattcagc ttcctgctgc tagcaatgcc acgatttaga tttaatgatg 6900
cttcagtgga aatcaatcag aaggtattct gaccttgtga acatcagaag gtatttttta 6960
actcccaagc agtagcagga cgatgatagg gctggagggc tatggattcc cagcccatcc 7020
ctgtgaagga gtaggccact ctttaagtga aggattggat gattgttcat aatacataaa 7080
gttctctgta attacaacta aattattatg ccctcttctc acagtcaaaa ggaactgggt 7140
ggtttggttt ttgttgcttt tttagattta ttgtcccatg tgggatgagt ttttaaatgc 7200
cacaagacat aatttaaaat aaataaactt tgggaaaagg tgtaaaacag tagccccatc 7260
acatttgtga tactgacagg tatcaaccca gaagcccatg aactgtgttt ccatcctttg 7320
catttctctg cgagtagttc cacacaggtt tgtaagtaag taagaaagaa ggcaaattga 7380
ttcaaatgtt acaaaaaaac ccttcttggt ggattagaca ggttaaatat ataaacaaac 7440
aaacaaaaat tgctcaaaaa agaggagaaa agctcaagag gaaaagctaa ggactggtag 7500
gaaaaagctt tactctttca tgccatttta tttctttttg atttttaaat cattcattca 7560
atagatacca ccgtgtgacc tataattttg caaatctgtt acctctgaca tcaagtgtaa 7620
ttagcttttg gagagtgggc tgacatcaag tgtaattagc ttttggagag tgggttttgt 7680
ccattattaa taattaatta attaacatca aacacggctt ctcatgctat ttctacctca 7740
ctttggtttt ggggtgttcc tgataattgt gcacacctga gttcacagct tcaccacttg 7800
tccattgcgt tattttcttt ttcctttata attctttctt tttccttcat aattttcaaa 7860
agaaaaccca aagctctaag gtaacaaatt accaaattac atgaagattt ggtttttgtc 7920
ttgcattttt ttcctttatg tgacgctgga ccttttcttt acccaaggat ttttaaaact 7980
cagatttaaa acaaggggtt actttacatc ctactaagaa gtttaagtaa gtaagtttca 8040
ttctaaaatc agaggtaaat agagtgcata aataattttg ttttaatctt tttgtttttc 8100
ttttagacac attagctctg gagtgagtct gtcataatat ttgaacaaaa attgagagct 8160
ttattgctgc attttaagca taattaattt ggacattatt tcgtgttgtg ttctttataa 8220
ccaccaagta ttaaactgta aatcataatg taactgaagc ataaacatca catggcatgt 8280
tttgtcattg ttttcaggta ctgagttctt acttgagtat cataatatat tgtgttttaa 8340
caccaacact gtaacattta cgaattattt ttttaaactt cagttttact gcattttcac 8400
aacatatcag acttcaccaa atatatgcct tactattgta ttatagtact gctttactgt 8460
gtatctcaat aaagcacgca gttatgttac aaaaaagta 8499
<210> 51
<211> 1761
<212> PRT
<213> Homo sapiens
<400> 51
Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser Lys Arg Trp Arg Glu
1 5 10 15
Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg Leu Asn Phe Ala Gln Ile
20 25 30
His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro
35 40 45
Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His
50 55 60
Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp
65 70 75 80
Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu
85 90 95
Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile
100 105 110
Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu
115 120 125
Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu
130 135 140
Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser
145 150 155 160
Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
165 170 175
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu
180 185 190
Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp
195 200 205
Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly
210 215 220
Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln
225 230 235 240
Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln
245 250 255
Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn Ile Leu Ser
260 265 270
Glu Phe Gln Arg Asp Leu Asn Glu Phe Val Leu Trp Leu Glu Glu Ala
275 280 285
Asp Asn Ile Ala Ser Ile Pro Leu Glu Pro Gly Lys Glu Gln Gln Leu
290 295 300
Lys Glu Lys Leu Glu Gln Val Lys Leu Leu Val Glu Glu Leu Pro Leu
305 310 315 320
Arg Gln Gly Ile Leu Lys Gln Leu Asn Glu Thr Gly Gly Pro Val Leu
325 330 335
Val Ser Ala Pro Ile Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys
340 345 350
Leu Lys Gln Thr Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro
355 360 365
Glu Lys Gln Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu
370 375 380
Glu Lys Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu
385 390 395 400
Trp Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
405 410 415
Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln Ala
420 425 430
Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His Leu Tyr
435 440 445
Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu Glu Asp Leu
450 455 460
Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln Glu Leu Arg Ala
465 470 475 480
Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro
485 490 495
Thr Gln Thr Val Thr Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr
500 505 510
Ala Ile Ser Lys Leu Glu Met Pro Ser Ser Leu Met Leu Glu Val Pro
515 520 525
Ala Leu Ala Asp Phe Asn Arg Ala Trp Thr Glu Leu Thr Asp Trp Leu
530 535 540
Ser Leu Leu Asp Gln Val Ile Lys Ser Gln Arg Val Met Val Gly Asp
545 550 555 560
Leu Glu Asp Ile Asn Glu Met Ile Ile Lys Gln Lys Ala Thr Met Gln
565 570 575
Asp Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala
580 585 590
Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile
595 600 605
Thr Asp Arg Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu
610 615 620
His Leu Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser
625 630 635 640
Thr Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
645 650 655
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val Asp
660 665 670
Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys Asp Leu
675 680 685
Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu Ala Leu Lys
690 695 700
Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys Val His Met Ile
705 710 715 720
Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile His Lys Arg Val Ser
725 730 735
Glu Arg Glu Ala Ala Leu Glu Glu Thr His Arg Leu Leu Gln Gln Phe
740 745 750
Pro Leu Asp Leu Glu Lys Phe Leu Ala Trp Leu Thr Glu Ala Glu Thr
755 760 765
Thr Ala Asn Val Leu Gln Asp Ala Thr Arg Lys Glu Arg Leu Leu Glu
770 775 780
Asp Ser Lys Gly Val Lys Glu Leu Met Lys Gln Trp Gln Asp Leu Gln
785 790 795 800
Gly Glu Ile Glu Ala His Thr Asp Val Tyr His Asn Leu Asp Glu Asn
805 810 815
Ser Gln Lys Ile Leu Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu
820 825 830
Leu Gln Arg Arg Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg
835 840 845
Lys Lys Ser Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln
850 855 860
Trp Lys Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln
865 870 875 880
Leu Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
885 890 895
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg Glu
900 905 910
Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr Val Arg
915 920 925
Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln
930 935 940
Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn Val Thr Arg
945 950 955 960
Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr Glu Trp Glu Lys Leu
965 970 975
Asn Leu His Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu
980 985 990
Arg Leu Arg Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu
995 1000 1005
Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp
1010 1015 1020
Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala
1025 1030 1035
Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val
1040 1045 1050
Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser
1055 1060 1065
Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys
1070 1075 1080
Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu
1085 1090 1095
Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr
1100 1105 1110
Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val
1115 1120 1125
Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His
1130 1135 1140
Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn
1145 1150 1155
Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu
1160 1165 1170
Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys
1175 1180 1185
Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met
1190 1195 1200
Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg
1205 1210 1215
Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val
1220 1225 1230
Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg
1235 1240 1245
Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser
1250 1255 1260
Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys
1265 1270 1275
Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly
1280 1285 1290
Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu
1295 1300 1305
Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser
1310 1315 1320
Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu
1325 1330 1335
Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu
1340 1345 1350
Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln
1355 1360 1365
Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg
1370 1375 1380
Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys
1385 1390 1395
Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro
1400 1405 1410
Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg
1415 1420 1425
Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr
1430 1435 1440
Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val
1445 1450 1455
Leu Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe
1460 1465 1470
Trp Pro Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His
1475 1480 1485
Asp Asp Thr His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala
1490 1495 1500
Glu Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser
1505 1510 1515
Pro Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile Gln His Tyr
1520 1525 1530
Cys Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro Arg Ser
1535 1540 1545
Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly Glu
1550 1555 1560
Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu
1565 1570 1575
Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys Gly
1580 1585 1590
Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr Ser Pro
1595 1600 1605
Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu Leu
1610 1615 1620
Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu
1625 1630 1635
Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln
1640 1645 1650
Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly Thr Thr
1655 1660 1665
Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser Ser Gln
1670 1675 1680
Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp Ser Met
1685 1690 1695
Gly Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser Thr Gly
1700 1705 1710
Leu Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro Ser Ser
1715 1720 1725
Arg Gly His Asn Val Gly Ser Leu Phe His Met Ala Asp Asp Leu
1730 1735 1740
Gly Arg Ala Met Glu Ser Leu Val Ser Val Met Thr Asp Glu Glu
1745 1750 1755
Gly Ala Glu
1760
<210> 52
<211> 13875
<212> DNA
<213> Homo sapiens
<400> 52
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaaggaact ccaggatggc attgggcagc 6660
ggcaaactgt tgtcagaaca ttgaatgcaa ctggggaaga aataattcag caatcctcaa 6720
aaacagatgc cagtattcta caggaaaaat tgggaagcct gaatctgcgg tggcaggagg 6780
tctgcaaaca gctgtcagac agaaaaaaga ggctagaaga acaaaagaat atcttgtcag 6840
aatttcaaag agatttaaat gaatttgttt tatggttgga ggaagcagat aacattgcta 6900
gtatcccact tgaacctgga aaagagcagc aactaaaaga aaagcttgag caagtcaagt 6960
tactggtgga agagttgccc ctgcgccagg gaattctcaa acaattaaat gaaactggag 7020
gacccgtgct tgtaagtgct cccataagcc cagaagagca agataaactt gaaaataagc 7080
tcaagcagac aaatctccag tggataaagg tttccagagc tttacctgag aaacaaggag 7140
aaattgaagc tcaaataaaa gaccttgggc agcttgaaaa aaagcttgaa gaccttgaag 7200
agcagttaaa tcatctgctg ctgtggttat ctcctattag gaatcagttg gaaatttata 7260
accaaccaaa ccaagaagga ccatttgacg ttaaggaaac tgaaatagca gttcaagcta 7320
aacaaccgga tgtggaagag attttgtcta aagggcagca tttgtacaag gaaaaaccag 7380
ccactcagcc agtgaagagg aagttagaag atctgagctc tgagtggaag gcggtaaacc 7440
gtttacttca agagctgagg gcaaagcagc ctgacctagc tcctggactg accactattg 7500
gagcctctcc tactcagact gttactctgg tgacacaacc tgtggttact aaggaaactg 7560
ccatctccaa actagaaatg ccatcttcct tgatgttgga ggtacctgct ctggcagatt 7620
tcaaccgggc ttggacagaa cttaccgact ggctttctct gcttgatcaa gttataaaat 7680
cacagagggt gatggtgggt gaccttgagg atatcaacga gatgatcatc aagcagaagg 7740
caacaatgca ggatttggaa cagaggcgtc cccagttgga agaactcatt accgctgccc 7800
aaaatttgaa aaacaagacc agcaatcaag aggctagaac aatcattacg gatcgaattg 7860
aaagaattca gaatcagtgg gatgaagtac aagaacacct tcagaaccgg aggcaacagt 7920
tgaatgaaat gttaaaggat tcaacacaat ggctggaagc taaggaagaa gctgagcagg 7980
tcttaggaca ggccagagcc aagcttgagt catggaagga gggtccctat acagtagatg 8040
caatccaaaa gaaaatcaca gaaaccaagc agttggccaa agacctccgc cagtggcaga 8100
caaatgtaga tgtggcaaat gacttggccc tgaaacttct ccgggattat tctgcagatg 8160
ataccagaaa agtccacatg ataacagaga atatcaatgc ctcttggaga agcattcata 8220
aaagggtgag tgagcgagag gctgctttgg aagaaactca tagattactg caacagttcc 8280
ccctggacct ggaaaagttt cttgcctggc ttacagaagc tgaaacaact gccaatgtcc 8340
tacaggatgc tacccgtaag gaaaggctcc tagaagactc caagggagta aaagagctga 8400
tgaaacaatg gcaagacctc caaggtgaaa ttgaagctca cacagatgtt tatcacaacc 8460
tggatgaaaa cagccaaaaa atcctgagat ccctggaagg ttccgatgat gcagtcctgt 8520
tacaaagacg tttggataac atgaacttca agtggagtga acttcggaaa aagtctctca 8580
acattaggtc ccatttggaa gccagttctg accagtggaa gcgtctgcac ctttctctgc 8640
aggaacttct ggtgtggcta cagctgaaag atgatgaatt aagccggcag gcacctattg 8700
gaggcgactt tccagcagtt cagaagcaga acgatgtaca tagggccttc aagagggaat 8760
tgaaaactaa agaacctgta atcatgagta ctcttgagac tgtacgaata tttctgacag 8820
agcagccttt ggaaggacta gagaaactct accaggagcc cagagagctg cctcctgagg 8880
agagagccca gaatgtcact cggcttctac gaaagcaggc tgaggaggtc aatactgagt 8940
gggaaaaatt gaacctgcac tccgctgact ggcagagaaa aatagatgag acccttgaaa 9000
gactccggga acttcaagag gccacggatg agctggacct caagctgcgc caagctgagg 9060
tgatcaaggg atcctggcag cccgtgggcg atctcctcat tgactctctc caagatcacc 9120
tcgagaaagt caaggcactt cgaggagaaa ttgcgcctct gaaagagaac gtgagccacg 9180
tcaatgacct tgctcgccag cttaccactt tgggcattca gctctcaccg tataacctca 9240
gcactctgga agacctgaac accagatgga agcttctgca ggtggccgtc gaggaccgag 9300
tcaggcagct gcatgaagcc cacagggact ttggtccagc atctcagcac tttctttcca 9360
cgtctgtcca gggtccctgg gagagagcca tctcgccaaa caaagtgccc tactatatca 9420
accacgagac tcaaacaact tgctgggacc atcccaaaat gacagagctc taccagtctt 9480
tagctgacct gaataatgtc agattctcag cttataggac tgccatgaaa ctccgaagac 9540
tgcagaaggc cctttgcttg gatctcttga gcctgtcagc tgcatgtgat gccttggacc 9600
agcacaacct caagcaaaat gaccagccca tggatatcct gcagattatt aattgtttga 9660
ccactattta tgaccgcctg gagcaagagc acaacaattt ggtcaacgtc cctctctgcg 9720
tggatatgtg tctgaactgg ctgctgaatg tttatgatac gggacgaaca gggaggatcc 9780
gtgtcctgtc ttttaaaact ggcatcattt ccctgtgtaa agcacatttg gaagacaagt 9840
acagatacct tttcaagcaa gtggcaagtt caacaggatt ttgtgaccag cgcaggctgg 9900
gcctccttct gcatgattct atccaaattc caagacagtt gggtgaagtt gcatcctttg 9960
ggggcagtaa cattgagcca agtgtccgga gctgcttcca atttgctaat aataagccag 10020
agatcgaagc ggccctcttc ctagactgga tgagactgga accccagtcc atggtgtggc 10080
tgcccgtcct gcacagagtg gctgctgcag aaactgccaa gcatcaggcc aaatgtaaca 10140
tctgcaaaga gtgtccaatc attggattca ggtacaggag tctaaagcac tttaattatg 10200
acatctgcca aagctgcttt ttttctggtc gagttgcaaa aggccataaa atgcactatc 10260
ccatggtgga atattgcact ccgactacat caggagaaga tgttcgagac tttgccaagg 10320
tactaaaaaa caaatttcga accaaaaggt attttgcgaa gcatccccga atgggctacc 10380
tgccagtgca gactgtctta gagggggaca acatggaaac gcctgcctcg tcccctcagc 10440
tttcacacga tgatactcat tcacgcattg aacattatgc tagcaggcta gcagaaatgg 10500
aaaacagcaa tggatcttat ctaaatgata gcatctctcc taatgagagc atagatgatg 10560
aacatttgtt aatccagcat tactgccaaa gtttgaacca ggactccccc ctgagccagc 10620
ctcgtagtcc tgcccagatc ttgatttcct tagagagtga ggaaagaggg gagctagaga 10680
gaatcctagc agatcttgag gaagaaaaca ggaatctgca agcagaatat gaccgtctaa 10740
agcagcagca cgaacataaa ggcctgtccc cactgccgtc ccctcctgaa atgatgccca 10800
cctctcccca gagtccccgg gatgctgagc tcattgctga ggccaagcta ctgcgtcaac 10860
acaaaggccg cctggaagcc aggatgcaaa tcctggaaga ccacaataaa cagctggagt 10920
cacagttaca caggctaagg cagctgctgg agcaacccca ggcagaggcc aaagtgaatg 10980
gcacaacggt gtcctctcct tctacctctc tacagaggtc cgacagcagt cagcctatgc 11040
tgctccgagt ggttggcagt caaacttcgg actccatggg tgaggaagat cttctcagtc 11100
ctccccagga cacaagcaca gggttagagg aggtgatgga gcaactcaac aactccttcc 11160
ctagttcaag aggacacaat gtaggaagtc ttttccacat ggcagatgat ttgggcagag 11220
cgatggagtc cttagtatca gtcatgacag atgaagaagg agcagaataa atgttttaca 11280
actcctgatt cccgcatggt ttttataata ttcatacaac aaagaggatt agacagtaag 11340
agtttacaag aaataaatct atatttttgt gaagggtagt ggtattatac tgtagatttc 11400
agtagtttct aagtctgtta ttgttttgtt aacaatggca ggttttacac gtctatgcaa 11460
ttgtacaaaa aagttataag aaaactacat gtaaaatctt gatagctaaa taacttgcca 11520
tttctttata tggaacgcat tttgggttgt ttaaaaattt ataacagtta taaagaaaga 11580
ttgtaaacta aagtgtgctt tataaaaaaa agttgtttat aaaaacccct aaaaacaaaa 11640
caaacacaca cacacacaca tacacacaca cacacaaaac tttgaggcag cgcattgttt 11700
tgcatccttt tggcgtgata tccatatgaa attcatggct ttttcttttt ttgcatatta 11760
aagataagac ttcctctacc accacaccaa atgactacta cacactgctc atttgagaac 11820
tgtcagctga gtggggcagg cttgagtttt catttcatat atctatatgt ctataagtat 11880
ataaatacta tagttatata gataaagaga tacgaatttc tatagactga ctttttccat 11940
tttttaaatg ttcatgtcac atcctaatag aaagaaatta cttctagtca gtcatccagg 12000
cttacctgct tggtctagaa tggatttttc ccggagccgg aagccaggag gaaactacac 12060
cacactaaaa cattgtctac agctccagat gtttctcatt ttaaacaact ttccactgac 12120
aacgaaagta aagtaaagta ttggattttt ttaaagggaa catgtgaatg aatacacagg 12180
acttattata tcagagtgag taatcggttg gttggttgat tgattgattg attgatacat 12240
tcagcttcct gctgctagca atgccacgat ttagatttaa tgatgcttca gtggaaatca 12300
atcagaaggt attctgacct tgtgaacatc agaaggtatt ttttaactcc caagcagtag 12360
caggacgatg atagggctgg agggctatgg attcccagcc catccctgtg aaggagtagg 12420
ccactcttta agtgaaggat tggatgattg ttcataatac ataaagttct ctgtaattac 12480
aactaaatta ttatgccctc ttctcacagt caaaaggaac tgggtggttt ggtttttgtt 12540
gcttttttag atttattgtc ccatgtggga tgagttttta aatgccacaa gacataattt 12600
aaaataaata aactttggga aaaggtgtaa aacagtagcc ccatcacatt tgtgatactg 12660
acaggtatca acccagaagc ccatgaactg tgtttccatc ctttgcattt ctctgcgagt 12720
agttccacac aggtttgtaa gtaagtaaga aagaaggcaa attgattcaa atgttacaaa 12780
aaaacccttc ttggtggatt agacaggtta aatatataaa caaacaaaca aaaattgctc 12840
aaaaaagagg agaaaagctc aagaggaaaa gctaaggact ggtaggaaaa agctttactc 12900
tttcatgcca ttttatttct ttttgatttt taaatcattc attcaataga taccaccgtg 12960
tgacctataa ttttgcaaat ctgttacctc tgacatcaag tgtaattagc ttttggagag 13020
tgggctgaca tcaagtgtaa ttagcttttg gagagtgggt tttgtccatt attaataatt 13080
aattaattaa catcaaacac ggcttctcat gctatttcta cctcactttg gttttggggt 13140
gttcctgata attgtgcaca cctgagttca cagcttcacc acttgtccat tgcgttattt 13200
tctttttcct ttataattct ttctttttcc ttcataattt tcaaaagaaa acccaaagct 13260
ctaaggtaac aaattaccaa attacatgaa gatttggttt ttgtcttgca tttttttcct 13320
ttatgtgacg ctggaccttt tctttaccca aggattttta aaactcagat ttaaaacaag 13380
gggttacttt acatcctact aagaagttta agtaagtaag tttcattcta aaatcagagg 13440
taaatagagt gcataaataa ttttgtttta atctttttgt ttttctttta gacacattag 13500
ctctggagtg agtctgtcat aatatttgaa caaaaattga gagctttatt gctgcatttt 13560
aagcataatt aatttggaca ttatttcgtg ttgtgttctt tataaccacc aagtattaaa 13620
ctgtaaatca taatgtaact gaagcataaa catcacatgg catgttttgt cattgttttc 13680
aggtactgag ttcttacttg agtatcataa tatattgtgt tttaacacca acactgtaac 13740
atttacgaat tattttttta aacttcagtt ttactgcatt ttcacaacat atcagacttc 13800
accaaatata tgccttacta ttgtattata gtactgcttt actgtgtatc tcaataaagc 13860
acgcagttat gttac 13875
<210> 53
<211> 3690
<212> PRT
<213> Homo sapiens
<400> 53
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg
3410 3415 3420
Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn
3425 3430 3435
Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp
3440 3445 3450
Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln
3455 3460 3465
Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile
3470 3475 3480
Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala
3485 3490 3495
Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg
3500 3505 3510
Leu Lys Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser
3515 3520 3525
Pro Pro Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala
3530 3535 3540
Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg
3545 3550 3555
Leu Glu Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu
3560 3565 3570
Glu Ser Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln
3575 3580 3585
Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr
3590 3595 3600
Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val
3605 3610 3615
Val Gly Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu
3620 3625 3630
Ser Pro Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu
3635 3640 3645
Gln Leu Asn Asn Ser Phe Pro Ser Ser Arg Gly His Asn Val Gly
3650 3655 3660
Ser Leu Phe His Met Ala Asp Asp Leu Gly Arg Ala Met Glu Ser
3665 3670 3675
Leu Val Ser Val Met Thr Asp Glu Glu Gly Ala Glu
3680 3685 3690
<210> 54
<211> 13055
<212> DNA
<213> Homo sapiens
<400> 54
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaaggaact ccaggatggc attgggcagc 6660
ggcaaactgt tgtcagaaca ttgaatgcaa ctggggaaga aataattcag caatcctcaa 6720
aaacagatgc cagtattcta caggaaaaat tgggaagcct gaatctgcgg tggcaggagg 6780
tctgcaaaca gctgtcagac agaaaaaaga ggctagaaga acaaaagaat atcttgtcag 6840
aatttcaaag agatttaaat gaatttgttt tatggttgga ggaagcagat aacattgcta 6900
gtatcccact tgaacctgga aaagagcagc aactaaaaga aaagcttgag caagtcaagt 6960
tactggtgga agagttgccc ctgcgccagg gaattctcaa acaattaaat gaaactggag 7020
gacccgtgct tgtaagtgct cccataagcc cagaagagca agataaactt gaaaataagc 7080
tcaagcagac aaatctccag tggataaagg tttccagagc tttacctgag aaacaaggag 7140
aaattgaagc tcaaataaaa gaccttgggc agcttgaaaa aaagcttgaa gaccttgaag 7200
agcagttaaa tcatctgctg ctgtggttat ctcctattag gaatcagttg gaaatttata 7260
accaaccaaa ccaagaagga ccatttgacg ttaaggaaac tgaaatagca gttcaagcta 7320
aacaaccgga tgtggaagag attttgtcta aagggcagca tttgtacaag gaaaaaccag 7380
ccactcagcc agtgaagagg aagttagaag atctgagctc tgagtggaag gcggtaaacc 7440
gtttacttca agagctgagg gcaaagcagc ctgacctagc tcctggactg accactattg 7500
gagcctctcc tactcagact gttactctgg tgacacaacc tgtggttact aaggaaactg 7560
ccatctccaa actagaaatg ccatcttcct tgatgttgga ggtacctgct ctggcagatt 7620
tcaaccgggc ttggacagaa cttaccgact ggctttctct gcttgatcaa gttataaaat 7680
cacagagggt gatggtgggt gaccttgagg atatcaacga gatgatcatc aagcagaagg 7740
caacaatgca ggatttggaa cagaggcgtc cccagttgga agaactcatt accgctgccc 7800
aaaatttgaa aaacaagacc agcaatcaag aggctagaac aatcattacg gatcgaattg 7860
aaagaattca gaatcagtgg gatgaagtac aagaacacct tcagaaccgg aggcaacagt 7920
tgaatgaaat gttaaaggat tcaacacaat ggctggaagc taaggaagaa gctgagcagg 7980
tcttaggaca ggccagagcc aagcttgagt catggaagga gggtccctat acagtagatg 8040
caatccaaaa gaaaatcaca gaaaccaagc agttggccaa agacctccgc cagtggcaga 8100
caaatgtaga tgtggcaaat gacttggccc tgaaacttct ccgggattat tctgcagatg 8160
ataccagaaa agtccacatg ataacagaga atatcaatgc ctcttggaga agcattcata 8220
aaagggtgag tgagcgagag gctgctttgg aagaaactca tagattactg caacagttcc 8280
ccctggacct ggaaaagttt cttgcctggc ttacagaagc tgaaacaact gccaatgtcc 8340
tacaggatgc tacccgtaag gaaaggctcc tagaagactc caagggagta aaagagctga 8400
tgaaacaatg gcaagacctc caaggtgaaa ttgaagctca cacagatgtt tatcacaacc 8460
tggatgaaaa cagccaaaaa atcctgagat ccctggaagg ttccgatgat gcagtcctgt 8520
tacaaagacg tttggataac atgaacttca agtggagtga acttcggaaa aagtctctca 8580
acattaggtc ccatttggaa gccagttctg accagtggaa gcgtctgcac ctttctctgc 8640
aggaacttct ggtgtggcta cagctgaaag atgatgaatt aagccggcag gcacctattg 8700
gaggcgactt tccagcagtt cagaagcaga acgatgtaca tagggccttc aagagggaat 8760
tgaaaactaa agaacctgta atcatgagta ctcttgagac tgtacgaata tttctgacag 8820
agcagccttt ggaaggacta gagaaactct accaggagcc cagagagctg cctcctgagg 8880
agagagccca gaatgtcact cggcttctac gaaagcaggc tgaggaggtc aatactgagt 8940
gggaaaaatt gaacctgcac tccgctgact ggcagagaaa aatagatgag acccttgaaa 9000
gactccggga acttcaagag gccacggatg agctggacct caagctgcgc caagctgagg 9060
tgatcaaggg atcctggcag cccgtgggcg atctcctcat tgactctctc caagatcacc 9120
tcgagaaagt caaggcactt cgaggagaaa ttgcgcctct gaaagagaac gtgagccacg 9180
tcaatgacct tgctcgccag cttaccactt tgggcattca gctctcaccg tataacctca 9240
gcactctgga agacctgaac accagatgga agcttctgca ggtggccgtc gaggaccgag 9300
tcaggcagct gcatgaagcc cacagggact ttggtccagc atctcagcac tttctttcca 9360
cgtctgtcca gggtccctgg gagagagcca tctcgccaaa caaagtgccc tactatatca 9420
accacgagac tcaaacaact tgctgggacc atcccaaaat gacagagctc taccagtctt 9480
tagctgacct gaataatgtc agattctcag cttataggac tgccatgaaa ctccgaagac 9540
tgcagaaggc cctttgcttg gatctcttga gcctgtcagc tgcatgtgat gccttggacc 9600
agcacaacct caagcaaaat gaccagccca tggatatcct gcagattatt aattgtttga 9660
ccactattta tgaccgcctg gagcaagagc acaacaattt ggtcaacgtc cctctctgcg 9720
tggatatgtg tctgaactgg ctgctgaatg tttatgatac gggacgaaca gggaggatcc 9780
gtgtcctgtc ttttaaaact ggcatcattt ccctgtgtaa agcacatttg gaagacaagt 9840
acagatacct tttcaagcaa gtggcaagtt caacaggatt ttgtgaccag cgcaggctgg 9900
gcctccttct gcatgattct atccaaattc caagacagtt gggtgaagtt gcatcctttg 9960
ggggcagtaa cattgagcca agtgtccgga gctgcttcca atttgctaat aataagccag 10020
agatcgaagc ggccctcttc ctagactgga tgagactgga accccagtcc atggtgtggc 10080
tgcccgtcct gcacagagtg gctgctgcag aaactgccaa gcatcaggcc aaatgtaaca 10140
tctgcaaaga gtgtccaatc attggattca ggtacaggag tctaaagcac tttaattatg 10200
acatctgcca aagctgcttt ttttctggtc gagttgcaaa aggccataaa atgcactatc 10260
ccatggtgga atattgcact ccgactacat caggagaaga tgttcgagac tttgccaagg 10320
tactaaaaaa caaatttcga accaaaaggt attttgcgaa gcatccccga atgggctacc 10380
tgccagtgca gactgtctta gagggggaca acatggaaac gaatctgcaa gcagaatatg 10440
accgtctaaa gcagcagcac gaacataaag gcctgtcccc actgccgtcc cctcctgaaa 10500
tgatgcccac ctctccccag agtccccggg atgctgagct cattgctgag gccaagctac 10560
tgcgtcaaca caaaggccgc ctggaagcca ggatgcaaat cctggaagac cacaataaac 10620
agctggagtc acagttacac aggctaaggc agctgctgga gcaaccccag gcagaggcca 10680
aagtgaatgg cacaacggtg tcctctcctt ctacctctct acagaggtcc gacagcagtc 10740
agcctatgct gctccgagtg gttggcagtc aaacttcgga ctccatgggt gaggaagatc 10800
ttctcagtcc tccccaggac acaagcacag ggttagagga ggtgatggag caactcaaca 10860
actccttccc tagttcaaga ggacacaatg taggaagtct tttccacatg gcagatgatt 10920
tgggcagagc gatggagtcc ttagtatcag tcatgacaga tgaagaagga gcagaataaa 10980
tgttttacaa ctcctgattc ccgcatggtt tttataatat tcatacaaca aagaggatta 11040
gacagtaaga gtttacaaga aataaatcta tatttttgtg aagggtagtg gtattatact 11100
gtagatttca gtagtttcta agtctgttat tgttttgtta acaatggcag gttttacacg 11160
tctatgcaat tgtacaaaaa agttataaga aaactacatg taaaatcttg atagctaaat 11220
aacttgccat ttctttatat ggaacgcatt ttgggttgtt taaaaattta taacagttat 11280
aaagaaagat tgtaaactaa agtgtgcttt ataaaaaaaa gttgtttata aaaaccccta 11340
aaaacaaaac aaacacacac acacacacat acacacacac acacaaaact ttgaggcagc 11400
gcattgtttt gcatcctttt ggcgtgatat ccatatgaaa ttcatggctt tttctttttt 11460
tgcatattaa agataagact tcctctacca ccacaccaaa tgactactac acactgctca 11520
tttgagaact gtcagctgag tggggcaggc ttgagttttc atttcatata tctatatgtc 11580
tataagtata taaatactat agttatatag ataaagagat acgaatttct atagactgac 11640
tttttccatt ttttaaatgt tcatgtcaca tcctaataga aagaaattac ttctagtcag 11700
tcatccaggc ttacctgctt ggtctagaat ggatttttcc cggagccgga agccaggagg 11760
aaactacacc acactaaaac attgtctaca gctccagatg tttctcattt taaacaactt 11820
tccactgaca acgaaagtaa agtaaagtat tggatttttt taaagggaac atgtgaatga 11880
atacacagga cttattatat cagagtgagt aatcggttgg ttggttgatt gattgattga 11940
ttgatacatt cagcttcctg ctgctagcaa tgccacgatt tagatttaat gatgcttcag 12000
tggaaatcaa tcagaaggta ttctgacctt gtgaacatca gaaggtattt tttaactccc 12060
aagcagtagc aggacgatga tagggctgga gggctatgga ttcccagccc atccctgtga 12120
aggagtaggc cactctttaa gtgaaggatt ggatgattgt tcataataca taaagttctc 12180
tgtaattaca actaaattat tatgccctct tctcacagtc aaaaggaact gggtggtttg 12240
gtttttgttg cttttttaga tttattgtcc catgtgggat gagtttttaa atgccacaag 12300
acataattta aaataaataa actttgggaa aaggtgtaaa acagtagccc catcacattt 12360
gtgatactga caggtatcaa cccagaagcc catgaactgt gtttccatcc tttgcatttc 12420
tctgcgagta gttccacaca ggtttgtaag taagtaagaa agaaggcaaa ttgattcaaa 12480
tgttacaaaa aaacccttct tggtggatta gacaggttaa atatataaac aaacaaacaa 12540
aaattgctca aaaaagagga gaaaagctca agaggaaaag ctaaggactg gtaggaaaaa 12600
gctttactct ttcatgccat tttatttctt tttgattttt aaatcattca ttcaatagat 12660
accaccgtgt gacctataat tttgcaaatc tgttacctct gacatcaagt gtaattagct 12720
tttggagagt gggctgacat caagtgtaat tagcttttgg agagtgggtt ttgtccatta 12780
ttaataatta attaattaac atcaaacacg gcttctcatg ctatttctac ctcactttgg 12840
ttttggggtg ttcctgataa ttgtgcacac ctgagttcac agcttcacca cttgtccatt 12900
gcgttatttt ctttttcctt tataattctt tctttttcct tcataatttt caaaagaaaa 12960
cccaaagctc taaggtaaca aattaccaaa ttacatgaag atttggtttt tgtcttgcat 13020
ttttttcctt tatgtgacgc tggacctttt cttta 13055
<210> 55
<211> 3593
<212> PRT
<213> Homo sapiens
<400> 55
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His
3410 3415 3420
Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr
3425 3430 3435
Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys
3440 3445 3450
Leu Leu Arg Gln His Lys Gly Arg Leu Glu Ala Arg Met Gln Ile
3455 3460 3465
Leu Glu Asp His Asn Lys Gln Leu Glu Ser Gln Leu His Arg Leu
3470 3475 3480
Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu Ala Lys Val Asn Gly
3485 3490 3495
Thr Thr Val Ser Ser Pro Ser Thr Ser Leu Gln Arg Ser Asp Ser
3500 3505 3510
Ser Gln Pro Met Leu Leu Arg Val Val Gly Ser Gln Thr Ser Asp
3515 3520 3525
Ser Met Gly Glu Glu Asp Leu Leu Ser Pro Pro Gln Asp Thr Ser
3530 3535 3540
Thr Gly Leu Glu Glu Val Met Glu Gln Leu Asn Asn Ser Phe Pro
3545 3550 3555
Ser Ser Arg Gly His Asn Val Gly Ser Leu Phe His Met Ala Asp
3560 3565 3570
Asp Leu Gly Arg Ala Met Glu Ser Leu Val Ser Val Met Thr Asp
3575 3580 3585
Glu Glu Gly Ala Glu
3590
<210> 56
<211> 11474
<212> DNA
<213> Homo sapiens
<400> 56
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaaggaact ccaggatggc attgggcagc 6660
ggcaaactgt tgtcagaaca ttgaatgcaa ctggggaaga aataattcag caatcctcaa 6720
aaacagatgc cagtattcta caggaaaaat tgggaagcct gaatctgcgg tggcaggagg 6780
tctgcaaaca gctgtcagac agaaaaaaga ggctagaaga acaaaagaat atcttgtcag 6840
aatttcaaag agatttaaat gaatttgttt tatggttgga ggaagcagat aacattgcta 6900
gtatcccact tgaacctgga aaagagcagc aactaaaaga aaagcttgag caagtcaagt 6960
tactggtgga agagttgccc ctgcgccagg gaattctcaa acaattaaat gaaactggag 7020
gacccgtgct tgtaagtgct cccataagcc cagaagagca agataaactt gaaaataagc 7080
tcaagcagac aaatctccag tggataaagg tttccagagc tttacctgag aaacaaggag 7140
aaattgaagc tcaaataaaa gaccttgggc agcttgaaaa aaagcttgaa gaccttgaag 7200
agcagttaaa tcatctgctg ctgtggttat ctcctattag gaatcagttg gaaatttata 7260
accaaccaaa ccaagaagga ccatttgacg ttaaggaaac tgaaatagca gttcaagcta 7320
aacaaccgga tgtggaagag attttgtcta aagggcagca tttgtacaag gaaaaaccag 7380
ccactcagcc agtgaagagg aagttagaag atctgagctc tgagtggaag gcggtaaacc 7440
gtttacttca agagctgagg gcaaagcagc ctgacctagc tcctggactg accactattg 7500
gagcctctcc tactcagact gttactctgg tgacacaacc tgtggttact aaggaaactg 7560
ccatctccaa actagaaatg ccatcttcct tgatgttgga ggtacctgct ctggcagatt 7620
tcaaccgggc ttggacagaa cttaccgact ggctttctct gcttgatcaa gttataaaat 7680
cacagagggt gatggtgggt gaccttgagg atatcaacga gatgatcatc aagcagaagg 7740
caacaatgca ggatttggaa cagaggcgtc cccagttgga agaactcatt accgctgccc 7800
aaaatttgaa aaacaagacc agcaatcaag aggctagaac aatcattacg gatcgaattg 7860
aaagaattca gaatcagtgg gatgaagtac aagaacacct tcagaaccgg aggcaacagt 7920
tgaatgaaat gttaaaggat tcaacacaat ggctggaagc taaggaagaa gctgagcagg 7980
tcttaggaca ggccagagcc aagcttgagt catggaagga gggtccctat acagtagatg 8040
caatccaaaa gaaaatcaca gaaaccaagc agttggccaa agacctccgc cagtggcaga 8100
caaatgtaga tgtggcaaat gacttggccc tgaaacttct ccgggattat tctgcagatg 8160
ataccagaaa agtccacatg ataacagaga atatcaatgc ctcttggaga agcattcata 8220
aaagggtgag tgagcgagag gctgctttgg aagaaactca tagattactg caacagttcc 8280
ccctggacct ggaaaagttt cttgcctggc ttacagaagc tgaaacaact gccaatgtcc 8340
tacaggatgc tacccgtaag gaaaggctcc tagaagactc caagggagta aaagagctga 8400
tgaaacaatg gcaagacctc caaggtgaaa ttgaagctca cacagatgtt tatcacaacc 8460
tggatgaaaa cagccaaaaa atcctgagat ccctggaagg ttccgatgat gcagtcctgt 8520
tacaaagacg tttggataac atgaacttca agtggagtga acttcggaaa aagtctctca 8580
acattaggtc ccatttggaa gccagttctg accagtggaa gcgtctgcac ctttctctgc 8640
aggaacttct ggtgtggcta cagctgaaag atgatgaatt aagccggcag gcacctattg 8700
gaggcgactt tccagcagtt cagaagcaga acgatgtaca tagggccttc aagagggaat 8760
tgaaaactaa agaacctgta atcatgagta ctcttgagac tgtacgaata tttctgacag 8820
agcagccttt ggaaggacta gagaaactct accaggagcc cagagagctg cctcctgagg 8880
agagagccca gaatgtcact cggcttctac gaaagcaggc tgaggaggtc aatactgagt 8940
gggaaaaatt gaacctgcac tccgctgact ggcagagaaa aatagatgag acccttgaaa 9000
gactccggga acttcaagag gccacggatg agctggacct caagctgcgc caagctgagg 9060
tgatcaaggg atcctggcag cccgtgggcg atctcctcat tgactctctc caagatcacc 9120
tcgagaaagt caaggcactt cgaggagaaa ttgcgcctct gaaagagaac gtgagccacg 9180
tcaatgacct tgctcgccag cttaccactt tgggcattca gctctcaccg tataacctca 9240
gcactctgga agacctgaac accagatgga agcttctgca ggtggccgtc gaggaccgag 9300
tcaggcagct gcatgaagcc cacagggact ttggtccagc atctcagcac tttctttcca 9360
cgtctgtcca gggtccctgg gagagagcca tctcgccaaa caaagtgccc tactatatca 9420
accacgagac tcaaacaact tgctgggacc atcccaaaat gacagagctc taccagtctt 9480
tagctgacct gaataatgtc agattctcag cttataggac tgccatgaaa ctccgaagac 9540
tgcagaaggc cctttgcttg gatctcttga gcctgtcagc tgcatgtgat gccttggacc 9600
agcacaacct caagcaaaat gaccagccca tggatatcct gcagattatt aattgtttga 9660
ccactattta tgaccgcctg gagcaagagc acaacaattt ggtcaacgtc cctctctgcg 9720
tggatatgtg tctgaactgg ctgctgaatg tttatgatac gggacgaaca gggaggatcc 9780
gtgtcctgtc ttttaaaact ggcatcattt ccctgtgtaa agcacatttg gaagacaagt 9840
acagatacct tttcaagcaa gtggcaagtt caacaggatt ttgtgaccag cgcaggctgg 9900
gcctccttct gcatgattct atccaaattc caagacagtt gggtgaagtt gcatcctttg 9960
ggggcagtaa cattgagcca agtgtccgga gctgcttcca attttcccaa tctctggaaa 10020
ccacagctct gttttctgtt cctgtaattt tgccttttcc tgaactggat tttaaaggat 10080
tgtaggaggc agtagtggaa gagctaactt tatatcttgt tcttttacat aatgcgccct 10140
gatccacact tgggaaagta tattccatgg tacctataga cagatatatg tgctttacca 10200
tgtatatgtg aaacttttct aatttaactt tcctgttaaa ttagaactcg gtagcataaa 10260
ttaatactgt tgagtatact tagggatttg catagattta aaattgtgca tatgttccct 10320
agggccatgg cgttaattgg tttattagtc aggtggagtg cagagcctga ggtcaggaca 10380
gttgtccttg aacatggaaa tgaagagtgg ataatcacca tgtgttattg tttgggctga 10440
ttttatcttt aatgggtgat tcagagtcct gattaatatt tagagcagtg actgctggcc 10500
tcctacctgc tcattatctt cagaacttta aataaaatac ttgatttcta cccaagatgg 10560
tagttatggg aagcctttta cttcttcttg tctcacaaag acaactcttg acctctcaat 10620
ccttaaacaa aaagttctgc ttctgcgcat gtggggactc ttaaactcat tttcatgcct 10680
ggagattcac atttagggat ctaggaaaag cacatctagg cagagtcgat gaggagatgc 10740
tttaagaacc gtgacaagga caggaaggaa atcaattttg cgttaggttt gtatttttag 10800
agaaaacgaa tcctggggaa cttttcacac tcattactat tgacattaat accattgtcc 10860
tgtccctttc acagttacta aaatcactct tgcccaccct cctgccttgc ccacaaccta 10920
ttcccatgaa ggggtgactt gggagaaata acggtttcca accaacgttt tattttggaa 10980
acatttcaag cacaaagagt agttgaaagg atagtctaaa gaacactcat ctgtgtcata 11040
catctgttca atccatggtt gcttttcgct ctacttacct cctccaccct ctcagctctg 11100
tttatgtatg tgtctgtctg tgtacataca cacacaaaca cattttcccc tatgccattt 11160
aaaagtaaag gagcatcaca acataaaccc ctaaacactt caccatacac cattttctta 11220
aaggatgaca ttctctaaca taactgcaat gctatcgtta cacacaaatt taacagcaat 11280
ccagcaatac cctctgatat gcagtccaca ctgaactttc cccagtgccc cagaattgtt 11340
ccttatagcc actgttttct tccagcatct agtcaaggtt tttgtctgtc atgtctctgt 11400
accttcattt agttttgaac agtctcccag cattttgttt tcctttcatg acattgactt 11460
ttttggtagg ggga 11474
<210> 57
<211> 3295
<212> PRT
<213> Homo sapiens
<400> 57
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Lys Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Arg Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ser Gln Ser Leu
3260 3265 3270
Glu Thr Thr Ala Leu Phe Ser Val Pro Val Ile Leu Pro Phe Pro
3275 3280 3285
Glu Leu Asp Phe Lys Gly Leu
3290 3295
<210> 58
<211> 10795
<212> DNA
<213> Homo sapiens
<400> 58
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaagagaac aggagacaga ggacttatcc 6660
ttcttgatga tgtcatttga aaagaatggc tttcaggtcc ttgagtgaga gacacttctg 6720
atttccaaga gctacatgtt cacaattgta agcccttttg agtaaatgtt ctaagaaacg 6780
gaggtaagag tcctatcaac agatgtgtgt tggctagaac aaacattaaa ttttcctggc 6840
agcactgagc tttctcaagc aggcacttaa gggaaggcta gggtcatcct agggacatgg 6900
ccttctgggg ctagaaacca tactagagtt tagtcaagtc ttagtgcaag ggtttggaca 6960
gagttgttaa gtgctgagag ttctgtattt ctcactgtca caaaggaaga tcagaagctc 7020
ctgatacttt tttcatcagt acaattgaat atataaatcc tatacacaaa aataaactaa 7080
gcttatacaa gcatattggt caaggaatgt tgctggcctt attaattaga tagcccagtt 7140
aaaagaagaa ttttttaata taattaatgt taaagtagga tgatagtata taaaacgtgt 7200
ctactgtcct gaatacaaac taaactgttt ggtttagcat ttacctcaag atctcttaat 7260
atcccccaaa gggtccctaa aaccacaact tatctttgtg ctcatgaagt agagaagaga 7320
cagttaatag acatttctag ctgatagact gttgtagagc agagaacgct ctgtgttttt 7380
gaaaattaaa catatgaatt tgcccctctt cccctattaa ggaagaagag tttcttaatt 7440
gtgcgaacac atcaagtgaa ctattcaatt agatttttgt gacccagggt ataaacatct 7500
ggttaaggtt acatatttca aaggaacaaa acactagaaa ctcttggttt taaatctcat 7560
ggctggagga taatttgcag cagagattta tctggcaagc atacagaatt gctgagactg 7620
ttctaaagat gtaagtgtgg gtgtttgtgt cgtgaaaata gctgtttaca tctattaagt 7680
ggataccgat ggttgaaagt gccgtctatg tcaagttttt accaaatcaa cttttgcctc 7740
actgtgtcag accattttac ctaatcaact tggactgcta atgtcctttc ccctggcacc 7800
actatctgtc tcttttgcaa agcacagaaa cggcatgcat gattgtagtt tataaaacac 7860
atgtaccaat gtggtctaca gcttctgttg agttcgagag ggtcagtttc tgtaatctct 7920
tctggcacag agtcaagaac agcttcactt tcctcctgct acctctctac ccgtaagtgt 7980
gaacccatca ctttgctaac actcaggaag gggattacac aaaatagagc aggagccctc 8040
tgacctgaat atgcatctga gccctagcca tagagcttct gattcagtag atctgggatg 8100
gggcctaaat atttgcattt ttaagtgtat aagtgatgct gatgctgctg gttccaggac 8160
cacattttaa gaaatatcga taaaggtgga gaattaaact gcagctcaga agacctgagt 8220
tcttgcccca gcttgacttt tacaatctag caaatggata aaactcgcag gacttcagtt 8280
ctcttcatct acacagtgag tggttagatt ggctttgtaa tttaaaatta aacagggttt 8340
gattctgatt cactacacaa ggttccaaag aaggaatgat atctcctttc atttcttcac 8400
tttgtcttct gtccctaggt aatcttatct atgttcctga tttaacctaa ctaatgtttc 8460
tgcaaagctt ctaatattta catctccagc cctgaaactc tcatttgaat gctagtctta 8520
tatacatacc cccctgccta attgacatct ccacttaaat gtatcagagg caactcagac 8580
tcaacaagga ccaaactgaa tgttcgacct tgtccttcaa acccgataca catccaggtt 8640
cctccatccc agtgaatgac actatccagt taagcaagcc aaaagtctgg attttttttc 8700
ctcactcttc ctcactgtcc gtcaactacc attattaaat ctgtcacctg gtcctactga 8760
tttaaccttc tcaatatctc tacagttttt ctttatgccc attagtatcc tagtgcaagc 8820
taccatcgtc tctcattgga attaacacag taacccccct acccaccaga ctgttctgcc 8880
tacagatagt gtgatattta ataaatataa atctagcctt ggctagattt ctccttcaaa 8940
aggttcacat taattttagc cttaaaatgg tgtgcaaagc tttgcatagt ctgtcctttg 9000
ctatgttggc agtatttttt actatccctc tcatctgctc attctctgta ctccaactac 9060
actaactttg tttttttttt tttttagatt tctctaacta cagtgctgta atctcttttt 9120
cctttgcacg tactattccg tttgtcaggg aatctgctca ctgtctccac ccactccaca 9180
cactcacgtt ttcctgcccg tcttaccggt cttgatcggt tgtcacttgc tcaggaaggt 9240
ttccctggtc accccctcca caaattgaat taagtcctct tgctgcatgc tgtcctagtg 9300
ctctttattt tcctctcctc atccttaatt cagtttgtaa ttacatgtta tttgtgtgag 9360
gatttgatta ttatctgtgt cacccactag atattgggca ttctttactt actcaccact 9420
gaattcatag aaccacagta attgtacaca acaaatattc aagagaaatt tattgaattg 9480
atgaatgaaa agttgtacct taacatgttc ctgacatgta tccaaaaaag agctcccctt 9540
tggggtctat taggactttg gacctaggta aacgtaaccc tagtttcgct caggtttaaa 9600
cagtagaaag taattgggtc tcttttgcat gtggctttcc taagggctaa ccctgtcttc 9660
ggaatgagtc aatacagcag agctgttgaa agcagactct agcttcggac aacgttggtc 9720
cgaatcatgg ttccgtcatt tcttagctgt gtgatttaga ataaattaat gttttaaagc 9780
tttgatttcc tcttccttaa tctggagatg ctaataaagc caacttcgta gaggtattgc 9840
gatgagtaaa taagcataat ttgctgtaaa caccttgcag attgcctgtt gtatgctaac 9900
taatcaataa attgaagctc ttaacatcat tatattagat atttccagca ttgagtatac 9960
tatcaggcat gtggtagaag ctcaatataa agttttgtta aattgaatag attccatata 10020
tggtatttct acagcattat gctccttatt taagtgtctc taagtatttt ttaagtatca 10080
cctcacaaaa gacagatgtt taattcatta cacatgtgaa ttgttttaga tagaaaataa 10140
aataaaaaat tcaaacattg aaatcaatag tgtaccttac cttaggatta caccataaaa 10200
tttctaccaa tcgagaataa agtgtacagt ctatttcctt tctaatactt ttaacgcaac 10260
aaatgtttat tgaacactta ctacttctaa tctatgacag acataaagat gaataaagca 10320
tgccacaatg tttaaaggag ctcactatat cataagaaag cggattcaca cagacaactc 10380
tataagataa agtggtaaat ttaggctggc ctgtgaaaca aaggattata ggtatagtta 10440
agaggtggaa tttattttac ttcgaggatt tcagttacct ttatattctt tgtctaacct 10500
ttcatgtttc tctttcttca gaaacagagc acctttttcc tgacacattc atttccccct 10560
atggagtaga gcagttgttt tcaaagtgtg ggtcccagat cagcatcacg gggatggtta 10620
gaaatgccca ttcttgagcc tcacaacaga cctactgaaa cagaaattct tggagagtgg 10680
agcccgcaga tctgtgatca agccctgtag gcaattctaa cgcacactca agttaaagaa 10740
ccacgggaag aaaggtccat cctgtaacaa gacagatttt tttcattagc atcaa 10795
<210> 59
<211> 2160
<212> PRT
<213> Homo sapiens
<400> 59
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Arg Thr
2135 2140 2145
Gly Asp Arg Gly Leu Ile Leu Leu Asp Asp Val Ile
2150 2155 2160
<210> 60
<211> 24
<212> DNA
<213> Homo sapiens
<400> 60
tctttttctt cttttttcct tttt 24
<210> 61
<211> 24
<212> DNA
<213> Homo sapiens
<400> 61
ctttttcttc ttttttcctt tttg 24
<210> 62
<211> 24
<212> DNA
<213> Homo sapiens
<400> 62
tttttcttct tttttccttt ttgc 24
<210> 63
<211> 24
<212> DNA
<213> Homo sapiens
<400> 63
tcttcttttt tcctttttgc aaaa 24
<210> 64
<211> 24
<212> DNA
<213> Homo sapiens
<400> 64
cttctttttt cctttttgca aaaa 24
<210> 65
<211> 24
<212> DNA
<213> Homo sapiens
<400> 65
ttcttttttc ctttttgcaa aaac 24
<210> 66
<211> 24
<212> DNA
<213> Homo sapiens
<400> 66
ttcctttttg caaaaaccca aaat 24
<210> 67
<211> 24
<212> DNA
<213> Homo sapiens
<400> 67
tcctttttgc aaaaacccaa aata 24
<210> 68
<211> 24
<212> DNA
<213> Homo sapiens
<400> 68
cctttttgca aaaacccaaa atat 24
<210> 69
<211> 24
<212> DNA
<213> Homo sapiens
<400> 69
ctttttgcaa aaacccaaaa tatt 24
<210> 70
<211> 24
<212> DNA
<213> Homo sapiens
<400> 70
tgcaaaaacc caaaatattt tagc 24
<210> 71
<211> 24
<212> DNA
<213> Homo sapiens
<400> 71
gcaaaaaccc aaaatatttt agct 24
<210> 72
<211> 24
<212> DNA
<213> Homo sapiens
<400> 72
caaaaaccca aaatatttta gctc 24
<210> 73
<211> 24
<212> DNA
<213> Homo sapiens
<400> 73
agctcctact cagactgtta ctct 24
<210> 74
<211> 24
<212> DNA
<213> Homo sapiens
<400> 74
gctcctactc agactgttac tctg 24
<210> 75
<211> 24
<212> DNA
<213> Homo sapiens
<400> 75
cttagtaacc acaggttgtg tcac 24
<210> 76
<211> 24
<212> DNA
<213> Homo sapiens
<400> 76
gagatggcag tttccttagt aacc 24
<210> 77
<211> 24
<212> DNA
<213> Homo sapiens
<400> 77
tagtttggag atggcagttt cctt 24
<210> 78
<211> 24
<212> DNA
<213> Homo sapiens
<400> 78
ttctcatacc ttctgcttga tgat 24
<210> 79
<211> 24
<212> DNA
<213> Homo sapiens
<400> 79
tcattttttc tcataccttc tgct 24
<210> 80
<211> 24
<212> DNA
<213> Homo sapiens
<400> 80
atcatttttt ctcatacctt ctgc 24
<210> 81
<211> 24
<212> DNA
<213> Homo sapiens
<400> 81
aagaaaaact tctgccaact ttta 24
<210> 82
<211> 24
<212> DNA
<213> Homo sapiens
<400> 82
aaagaaaaac ttctgccaac tttt 24
<210> 83
<211> 24
<212> DNA
<213> Homo sapiens
<400> 83
tctttaaaat gaagattttc cacc 24
<210> 84
<211> 24
<212> DNA
<213> Homo sapiens
<400> 84
ctttaaaatg aagattttcc acca 24
<210> 85
<211> 24
<212> DNA
<213> Homo sapiens
<400> 85
tttaaaatga agattttcca ccaa 24
<210> 86
<211> 24
<212> DNA
<213> Homo sapiens
<400> 86
aaatgaagat tttccaccaa tcac 24
<210> 87
<211> 24
<212> DNA
<213> Homo sapiens
<400> 87
ccaccaatca ctttactctc ctag 24
<210> 88
<211> 24
<212> DNA
<213> Homo sapiens
<400> 88
caccaatcac tttactctcc taga 24
<210> 89
<211> 24
<212> DNA
<213> Homo sapiens
<400> 89
ctctcctaga ccatttccca ccag 24
<210> 90
<211> 24
<212> DNA
<213> Homo sapiens
<400> 90
agaaaagatt aaacagtgtg ctac 24
<210> 91
<211> 24
<212> DNA
<213> Homo sapiens
<400> 91
tttgagaaaa gattaaacag tgtg 24
<210> 92
<211> 24
<212> DNA
<213> Homo sapiens
<400> 92
atttgagaaa agattaaaca gtgt 24
<210> 93
<211> 24
<212> DNA
<213> Homo sapiens
<400> 93
tatttgagaa aagattaaac agtg 24
<210> 94
<211> 24
<212> DNA
<213> Homo sapiens
<400> 94
atcttttctc aaataaaaag acat 24
<210> 95
<211> 24
<212> DNA
<213> Homo sapiens
<400> 95
ctcaaataaa aagacatggg gctt 24
<210> 96
<211> 24
<212> DNA
<213> Homo sapiens
<400> 96
tcaaataaaa agacatgggg cttc 24
<210> 97
<211> 24
<212> DNA
<213> Homo sapiens
<400> 97
tgttttgcct ttttggtatc ttac 24
<210> 98
<211> 24
<212> DNA
<213> Homo sapiens
<400> 98
gttttgcctt tttggtatct taca 24
<210> 99
<211> 24
<212> DNA
<213> Homo sapiens
<400> 99
ttttgccttt ttggtatctt acag 24
<210> 100
<211> 24
<212> DNA
<213> Homo sapiens
<400> 100
gcctttttgg tatcttacag gaac 24
<210> 101
<211> 24
<212> DNA
<213> Homo sapiens
<400> 101
cctttttggt atcttacagg aact 24
<210> 102
<211> 24
<212> DNA
<213> Homo sapiens
<400> 102
tggtatctta caggaactcc agga 24
<210> 103
<211> 24
<212> DNA
<213> Homo sapiens
<400> 103
ggtatcttac aggaactcca ggat 24
<210> 104
<211> 24
<212> DNA
<213> Homo sapiens
<400> 104
aggattgctg aattatttct tccc 24
<210> 105
<211> 24
<212> DNA
<213> Homo sapiens
<400> 105
gaggattgct gaattatttc ttcc 24
<210> 106
<211> 24
<212> DNA
<213> Homo sapiens
<400> 106
tgaggattgc tgaattattt cttc 24
<210> 107
<211> 24
<212> DNA
<213> Homo sapiens
<400> 107
ctgtagaata ctggcatctg tttt 24
<210> 108
<211> 24
<212> DNA
<213> Homo sapiens
<400> 108
cctgtagaat actggcatct gttt 24
<210> 109
<211> 24
<212> DNA
<213> Homo sapiens
<400> 109
tcctgtagaa tactggcatc tgtt 24
<210> 110
<211> 24
<212> DNA
<213> Homo sapiens
<400> 110
cagacctcct gccaccgcag attc 24
<210> 111
<211> 24
<212> DNA
<213> Homo sapiens
<400> 111
tgtctgacag ctgtttgcag acct 24
<210> 112
<211> 24
<212> DNA
<213> Homo sapiens
<400> 112
ctgtctgaca gctgtttgca gacc 24
<210> 113
<211> 24
<212> DNA
<213> Homo sapiens
<400> 113
tctgtctgac agctgtttgc agac 24
<210> 114
<211> 24
<212> DNA
<213> Homo sapiens
<400> 114
ttctgtctga cagctgtttg caga 24
<210> 115
<211> 24
<212> DNA
<213> Homo sapiens
<400> 115
attcctatta gatctgtcgc ccta 24
<210> 116
<211> 24
<212> DNA
<213> Homo sapiens
<400> 116
cattcctatt agatctgtcg ccct 24
<210> 117
<211> 24
<212> DNA
<213> Homo sapiens
<400> 117
agcagacttt ttaagctttc ttta 24
<210> 118
<211> 24
<212> DNA
<213> Homo sapiens
<400> 118
gcagactttt taagctttct ttag 24
<210> 119
<211> 24
<212> DNA
<213> Homo sapiens
<400> 119
taagctttct ttagaagaat attt 24
<210> 120
<211> 24
<212> DNA
<213> Homo sapiens
<400> 120
aagctttctt tagaagaata tttc 24
<210> 121
<211> 24
<212> DNA
<213> Homo sapiens
<400> 121
agctttcttt agaagaatat ttca 24
<210> 122
<211> 24
<212> DNA
<213> Homo sapiens
<400> 122
tttagaagaa tatttcatga gaga 24
<210> 123
<211> 24
<212> DNA
<213> Homo sapiens
<400> 123
gaagaatatt tcatgagaga ttat 24
<210> 124
<211> 24
<212> DNA
<213> Homo sapiens
<400> 124
tcagtataac caaaaaatat acgc 24
<210> 125
<211> 24
<212> DNA
<213> Homo sapiens
<400> 125
acataatcca tctatttttc ttga 24
<210> 126
<211> 24
<212> DNA
<213> Homo sapiens
<400> 126
cataatccat ctatttttct tgat 24
<210> 127
<211> 24
<212> DNA
<213> Homo sapiens
<400> 127
tcttgatcca tatgctttta cctg 24
<210> 128
<211> 24
<212> DNA
<213> Homo sapiens
<400> 128
cttgatccat atgcttttac ctgc 24
<210> 129
<211> 24
<212> DNA
<213> Homo sapiens
<400> 129
ttgatccata tgcttttacc tgca 24
<210> 130
<211> 24
<212> DNA
<213> Homo sapiens
<400> 130
tcaacagatc tgtcaaatcg cctg 24
<210> 131
<211> 24
<212> DNA
<213> Homo sapiens
<400> 131
acctgcaggc gatttgacag atct 24
<210> 132
<211> 24
<212> DNA
<213> Homo sapiens
<400> 132
cctgcaggcg atttgacaga tctg 24
<210> 133
<211> 24
<212> DNA
<213> Homo sapiens
<400> 133
acagatctgt tgagaaatgg cggc 24
<210> 134
<211> 24
<212> DNA
<213> Homo sapiens
<400> 134
tatcataatg aaaacgccgc catt 24
<210> 135
<211> 24
<212> DNA
<213> Homo sapiens
<400> 135
cattatgata taaagatatt taat 24
<210> 136
<211> 24
<212> DNA
<213> Homo sapiens
<400> 136
tatttagcat gttcccaatt ctca 24
<210> 137
<211> 24
<212> DNA
<213> Homo sapiens
<400> 137
gaaaaaacaa atcaaagact tacc 24
<210> 138
<211> 24
<212> DNA
<213> Homo sapiens
<400> 138
atttgttttt tcgaaattgt attt 24
<210> 139
<211> 24
<212> DNA
<213> Homo sapiens
<400> 139
ttttttcgaa attgtattta tctt 24
<210> 140
<211> 24
<212> DNA
<213> Homo sapiens
<400> 140
ttcgaaattg tatttatctt cagc 24
<210> 141
<211> 24
<212> DNA
<213> Homo sapiens
<400> 141
tcgaaattgt atttatcttc agca 24
<210> 142
<211> 24
<212> DNA
<213> Homo sapiens
<400> 142
cgaaattgta tttatcttca gcac 24
<210> 143
<211> 24
<212> DNA
<213> Homo sapiens
<400> 143
gaaattgtat ttatcttcag caca 24
<210> 144
<211> 24
<212> DNA
<213> Homo sapiens
<400> 144
agaagttaaa gagtccagat gtgc 24
<210> 145
<211> 24
<212> DNA
<213> Homo sapiens
<400> 145
tcttcagcac atctggactc ttta 24
<210> 146
<211> 24
<212> DNA
<213> Homo sapiens
<400> 146
catcaccctt cagaacctga tctt 24
<210> 147
<211> 24
<212> DNA
<213> Homo sapiens
<400> 147
acttcttaaa gatcaggttc tgaa 24
<210> 148
<211> 24
<212> DNA
<213> Homo sapiens
<400> 148
gactgttgtt gtcatcatta tatt 24
<210> 149
<211> 24
<212> DNA
<213> Homo sapiens
<400> 149
actgttgttg tcatcattat atta 24
<210> 150
<211> 24
<212> DNA
<213> Homo sapiens
<400> 150
aactagaata aaaggaaaaa taaa 24
<210> 151
<211> 24
<212> DNA
<213> Homo sapiens
<400> 151
ctactatata tttatttttc cttt 24
<210> 152
<211> 24
<212> DNA
<213> Homo sapiens
<400> 152
tttttccttt tattctagtt gaaa 24
<210> 153
<211> 24
<212> DNA
<213> Homo sapiens
<400> 153
tccttttatt ctagttgaaa gaat 24
<210> 154
<211> 24
<212> DNA
<213> Homo sapiens
<400> 154
ccttttattc tagttgaaag aatt 24
<210> 155
<211> 24
<212> DNA
<213> Homo sapiens
<400> 155
cttttattct agttgaaaga attc 24
<210> 156
<211> 24
<212> DNA
<213> Homo sapiens
<400> 156
attctagttg aaagaattca gaat 24
<210> 157
<211> 24
<212> DNA
<213> Homo sapiens
<400> 157
ttctagttga aagaattcag aatc 24
<210> 158
<211> 24
<212> DNA
<213> Homo sapiens
<400> 158
attcaactgt tgcctccggt tctg 24
<210> 159
<211> 24
<212> DNA
<213> Homo sapiens
<400> 159
acatttcatt caactgttgc ctcc 24
<210> 160
<211> 24
<212> DNA
<213> Homo sapiens
<400> 160
cttttggatt gcatctactg tata 24
<210> 161
<211> 24
<212> DNA
<213> Homo sapiens
<400> 161
tgtgattttc ttttggattg catc 24
<210> 162
<211> 24
<212> DNA
<213> Homo sapiens
<400> 162
atactaacct tggtttctgt gatt 24
<210> 163
<211> 24
<212> DNA
<213> Homo sapiens
<400> 163
aaaaggtatc tttgatacta acct 24
<210> 164
<211> 24
<212> DNA
<213> Homo sapiens
<400> 164
aaaaaggtat ctttgatact aacc 24
<210> 165
<211> 24
<212> DNA
<213> Homo sapiens
<400> 165
ttttaaaaag gtatctttga tact 24
<210> 166
<211> 24
<212> DNA
<213> Homo sapiens
<400> 166
attttaaaaa ggtatctttg atac 24
<210> 167
<211> 24
<212> DNA
<213> Homo sapiens
<400> 167
ttaatgcaaa ctgggacaca aaca 24
<210> 168
<211> 24
<212> DNA
<213> Homo sapiens
<400> 168
taaattgcca tgtttgtgtc ccag 24
<210> 169
<211> 24
<212> DNA
<213> Homo sapiens
<400> 169
aaattgccat gtttgtgtcc cagt 24
<210> 170
<211> 24
<212> DNA
<213> Homo sapiens
<400> 170
aattgccatg tttgtgtccc agtt 24
<210> 171
<211> 24
<212> DNA
<213> Homo sapiens
<400> 171
tgtcccagtt tgcattaaca aata 24
<210> 172
<211> 24
<212> DNA
<213> Homo sapiens
<400> 172
caacatagtt ctcaaactat ttgt 24
<210> 173
<211> 24
<212> DNA
<213> Homo sapiens
<400> 173
ccaacatagt tctcaaacta tttg 24
<210> 174
<211> 24
<212> DNA
<213> Homo sapiens
<400> 174
tccaacatag ttctcaaact attt 24
<210> 175
<211> 24
<212> DNA
<213> Homo sapiens
<400> 175
tttccaacat agttctcaaa ctat 24
<210> 176
<211> 24
<212> DNA
<213> Homo sapiens
<400> 176
ttttccaaca tagttctcaa acta 24
<210> 177
<211> 24
<212> DNA
<213> Homo sapiens
<400> 177
tttttccaac atagttctca aact 24
<210> 178
<211> 24
<212> DNA
<213> Homo sapiens
<400> 178
cattaacaaa tagtttgaga acta 24
<210> 179
<211> 24
<212> DNA
<213> Homo sapiens
<400> 179
agaactatgt tggaaaaaaa aata 24
<210> 180
<211> 24
<212> DNA
<213> Homo sapiens
<400> 180
gttcttctag cctggagaaa gaag 24
<210> 181
<211> 24
<212> DNA
<213> Homo sapiens
<400> 181
attcttcttt ctccaggcta gaag 24
<210> 182
<211> 24
<212> DNA
<213> Homo sapiens
<400> 182
ttcttctttc tccaggctag aaga 24
<210> 183
<211> 24
<212> DNA
<213> Homo sapiens
<400> 183
tccaggctag aagaacaaaa gaat 24
<210> 184
<211> 24
<212> DNA
<213> Homo sapiens
<400> 184
aaattctgac aagatattct tttg 24
<210> 185
<211> 24
<212> DNA
<213> Homo sapiens
<400> 185
cttttagttg ctgctctttt ccag 24
<210> 186
<211> 24
<212> DNA
<213> Homo sapiens
<400> 186
agaaaataaa attaccttga cttg 24
<210> 187
<211> 24
<212> DNA
<213> Homo sapiens
<400> 187
tgcaagcagg ccctggggga tttg 24
<210> 188
<211> 24
<212> DNA
<213> Homo sapiens
<400> 188
attttctcaa atcccccagg gcct 24
<210> 189
<211> 24
<212> DNA
<213> Homo sapiens
<400> 189
ttttctcaaa tcccccaggg cctg 24
<210> 190
<211> 24
<212> DNA
<213> Homo sapiens
<400> 190
ctcaaatccc ccagggcctg cttg 24
<210> 191
<211> 24
<212> DNA
<213> Homo sapiens
<400> 191
tcaaatcccc cagggcctgc ttgc 24
<210> 192
<211> 24
<212> DNA
<213> Homo sapiens
<400> 192
ttaattcaat cattggtttt ctgc 24
<210> 193
<211> 24
<212> DNA
<213> Homo sapiens
<400> 193
taattcaatc attggttttc tgcc 24
<210> 194
<211> 24
<212> DNA
<213> Homo sapiens
<400> 194
aattcaatca ttggttttct gccc 24
<210> 195
<211> 24
<212> DNA
<213> Homo sapiens
<400> 195
attcaatcat tggttttctg ccca 24
<210> 196
<211> 24
<212> DNA
<213> Homo sapiens
<400> 196
gcaaggaact atgaataacc taat 24
<210> 197
<211> 24
<212> DNA
<213> Homo sapiens
<400> 197
ctgcccatta ggttattcat agtt 24
<210> 198
<211> 24
<212> DNA
<213> Homo sapiens
<400> 198
tgcccattag gttattcata gttc 24
<210> 199
<211> 24
<212> DNA
<213> Homo sapiens
<400> 199
tagaaaacaa tttaacagga aata 24
<210> 200
<211> 24
<212> DNA
<213> Homo sapiens
<400> 200
ctgttaaatt gttttctata aacc 24
<210> 201
<211> 24
<212> DNA
<213> Homo sapiens
<400> 201
gaaataaaaa agatgttact gtat 24
<210> 202
<211> 24
<212> DNA
<213> Homo sapiens
<400> 202
agaaataaaa aagatgttac tgta 24
<210> 203
<211> 24
<212> DNA
<213> Homo sapiens
<400> 203
ctataaaccc ttatacagta acat 24
<210> 204
<211> 24
<212> DNA
<213> Homo sapiens
<400> 204
tataaaccct tatacagtaa catc 24
<210> 205
<211> 24
<212> DNA
<213> Homo sapiens
<400> 205
ttatttctaa aagtgttttg gctg 24
<210> 206
<211> 24
<212> DNA
<213> Homo sapiens
<400> 206
tatttctaaa agtgttttgg ctgg 24
<210> 207
<211> 24
<212> DNA
<213> Homo sapiens
<400> 207
atttctaaaa gtgttttggc tggt 24
<210> 208
<211> 24
<212> DNA
<213> Homo sapiens
<400> 208
tttctaaaag tgttttggct ggtc 24
<210> 209
<211> 24
<212> DNA
<213> Homo sapiens
<400> 209
taaaagtgtt ttggctggtc tcac 24
<210> 210
<211> 24
<212> DNA
<213> Homo sapiens
<400> 210
cataatacaa agtaaagtac aatt 24
<210> 211
<211> 24
<212> DNA
<213> Homo sapiens
<400> 211
acataataca aagtaaagta caat 24
<210> 212
<211> 24
<212> DNA
<213> Homo sapiens
<400> 212
ggctggtctc acaattgtac ttta 24
<210> 213
<211> 24
<212> DNA
<213> Homo sapiens
<400> 213
gctggtctca caattgtact ttac 24
<210> 214
<211> 24
<212> DNA
<213> Homo sapiens
<400> 214
ctttgtatta tgtaaaagga atac 24
<210> 215
<211> 24
<212> DNA
<213> Homo sapiens
<400> 215
tattatgtaa aaggaataca caac 24
<210> 216
<211> 24
<212> DNA
<213> Homo sapiens
<400> 216
ttcttacagg caacaatgca ggat 24
<210> 217
<211> 24
<212> DNA
<213> Homo sapiens
<400> 217
gaacagaggc gtccccagtt ggaa 24
<210> 218
<211> 24
<212> DNA
<213> Homo sapiens
<400> 218
ggcagcggta atgagttctt ccaa 24
<210> 219
<211> 24
<212> DNA
<213> Homo sapiens
<400> 219
tcaaattttg ggcagcggta atga 24
<210> 220
<211> 24
<212> DNA
<213> Homo sapiens
<400> 220
aaaaacaaga ccagcaatca agag 24
<210> 221
<211> 24
<212> DNA
<213> Homo sapiens
<400> 221
tgtgtcccat gcttgttaaa aaac 24
<210> 222
<211> 24
<212> DNA
<213> Homo sapiens
<400> 222
ttaacaagca tgggacacac aaag 24
<210> 223
<211> 24
<212> DNA
<213> Homo sapiens
<400> 223
taacaagcat gggacacaca aagc 24
<210> 224
<211> 24
<212> DNA
<213> Homo sapiens
<400> 224
aacaagcatg ggacacacaa agca 24
<210> 225
<211> 24
<212> DNA
<213> Homo sapiens
<400> 225
acaagcatgg gacacacaaa gcaa 24
<210> 226
<211> 24
<212> DNA
<213> Homo sapiens
<400> 226
ttgaaacttg tcatgcatct tgct 24
<210> 227
<211> 24
<212> DNA
<213> Homo sapiens
<400> 227
attgaaactt gtcatgcatc ttgc 24
<210> 228
<211> 24
<212> DNA
<213> Homo sapiens
<400> 228
tattgaaact tgtcatgcat cttg 24
<210> 229
<211> 24
<212> DNA
<213> Homo sapiens
<400> 229
aataaaaact taagttcata tatc 24
<210> 230
<211> 24
<212> DNA
<213> Homo sapiens
<400> 230
gtgaatatat tattggattt ctat 24
<210> 231
<211> 24
<212> DNA
<213> Homo sapiens
<400> 231
aagataattc atgaacatct taat 24
<210> 232
<211> 24
<212> DNA
<213> Homo sapiens
<400> 232
acagaaaagc atacacatta ctta 24
<210> 233
<211> 24
<212> DNA
<213> Homo sapiens
<400> 233
ctgttaaaga ggaagttaga agat 24
<210> 234
<211> 24
<212> DNA
<213> Homo sapiens
<400> 234
tgttaaagag gaagttagaa gatc 24
<210> 235
<211> 24
<212> DNA
<213> Homo sapiens
<400> 235
ccgccttcca ctcagagctc agat 24
<210> 236
<211> 24
<212> DNA
<213> Homo sapiens
<400> 236
ccctcagctc ttgaagtaaa cggt 24
<210> 237
<211> 24
<212> DNA
<213> Homo sapiens
<400> 237
cttcaagagc tgagggcaaa gcag 24
<210> 238
<211> 24
<212> DNA
<213> Homo sapiens
<400> 238
aacaaatagc tagagccaaa gaga 24
<210> 239
<211> 24
<212> DNA
<213> Homo sapiens
<400> 239
gaacaaatag ctagagccaa agag 24
<210> 240
<211> 24
<212> DNA
<213> Homo sapiens
<400> 240
gctctagcta tttgttcaaa agtg 24
<210> 241
<211> 24
<212> DNA
<213> Homo sapiens
<400> 241
ttcaaaagtg caactatgaa gtga 24
<210> 242
<211> 24
<212> DNA
<213> Homo sapiens
<400> 242
tctctcaccc agtcatcact tcat 24
<210> 243
<211> 24
<212> DNA
<213> Homo sapiens
<400> 243
ctctctcacc cagtcatcac ttca 24
<210> 244
<211> 24
<212> DNA
<213> Homo sapiens
<400> 244
tatatatata tatatttttc tctt 24
<210> 245
<211> 24
<212> DNA
<213> Homo sapiens
<400> 245
tctctttcta tagacagcta attc 24
<210> 246
<211> 24
<212> DNA
<213> Homo sapiens
<400> 246
ctctttctat agacagctaa ttca 24
<210> 247
<211> 24
<212> DNA
<213> Homo sapiens
<400> 247
aaacagtaaa aaaatgaatt agct 24
<210> 248
<211> 24
<212> DNA
<213> Homo sapiens
<400> 248
tctttctata gacagctaat tcat 24
<210> 249
<211> 24
<212> DNA
<213> Homo sapiens
<400> 249
aaaacagtaa aaaaatgaat tagc 24
<210> 250
<211> 24
<212> DNA
<213> Homo sapiens
<400> 250
tatagacagc taattcattt tttt 24
<210> 251
<211> 24
<212> DNA
<213> Homo sapiens
<400> 251
tattctgtaa tataaaaatt ttaa 24
<210> 252
<211> 24
<212> DNA
<213> Homo sapiens
<400> 252
atattctgta atataaaaat ttta 24
<210> 253
<211> 24
<212> DNA
<213> Homo sapiens
<400> 253
tttactgttt taaaattttt atat 24
<210> 254
<211> 24
<212> DNA
<213> Homo sapiens
<400> 254
ttactgtttt aaaattttta tatt 24
<210> 255
<211> 24
<212> DNA
<213> Homo sapiens
<400> 255
tactgtttta aaatttttat atta 24
<210> 256
<211> 24
<212> DNA
<213> Homo sapiens
<400> 256
actgttttaa aatttttata ttac 24
<210> 257
<211> 24
<212> DNA
<213> Homo sapiens
<400> 257
ctgttttaaa atttttatat taca 24
<210> 258
<211> 24
<212> DNA
<213> Homo sapiens
<400> 258
aaaattttta tattacagaa tata 24
<210> 259
<211> 24
<212> DNA
<213> Homo sapiens
<400> 259
aaatttttat attacagaat ataa 24
<210> 260
<211> 24
<212> DNA
<213> Homo sapiens
<400> 260
ttgtagacta tcttttatat tctg 24
<210> 261
<211> 24
<212> DNA
<213> Homo sapiens
<400> 261
tatattacag aatataaaag atag 24
<210> 262
<211> 24
<212> DNA
<213> Homo sapiens
<400> 262
atattacaga atataaaaga tagt 24
<210> 263
<211> 24
<212> DNA
<213> Homo sapiens
<400> 263
tattacagaa tataaaagat agtc 24
<210> 264
<211> 24
<212> DNA
<213> Homo sapiens
<400> 264
caatgctgct gtcttcttgc tatg 24
<210> 265
<211> 24
<212> DNA
<213> Homo sapiens
<400> 265
caatgggaaa aagttaacaa aatg 24
<210> 266
<211> 24
<212> DNA
<213> Homo sapiens
<400> 266
tgcaagtatc aagaaaaata tatg 24
<210> 267
<211> 24
<212> DNA
<213> Homo sapiens
<400> 267
tcttgatact tgcagaaatg attt 24
<210> 268
<211> 24
<212> DNA
<213> Homo sapiens
<400> 268
cttgatactt gcagaaatga tttg 24
<210> 269
<211> 24
<212> DNA
<213> Homo sapiens
<400> 269
ttgatacttg cagaaatgat ttgt 24
<210> 270
<211> 24
<212> DNA
<213> Homo sapiens
<400> 270
ttttcaggga actgtagaat ttat 24
<210> 271
<211> 24
<212> DNA
<213> Homo sapiens
<400> 271
catggagggt actgaaataa attc 24
<210> 272
<211> 24
<212> DNA
<213> Homo sapiens
<400> 272
ccatggaggg tactgaaata aatt 24
<210> 273
<211> 24
<212> DNA
<213> Homo sapiens
<400> 273
cagggaactg tagaatttat ttca 24
<210> 274
<211> 24
<212> DNA
<213> Homo sapiens
<400> 274
tccatggagg gtactgaaat aaat 24
<210> 275
<211> 24
<212> DNA
<213> Homo sapiens
<400> 275
agggaactgt agaatttatt tcag 24
<210> 276
<211> 24
<212> DNA
<213> Homo sapiens
<400> 276
ttccatggag ggtactgaaa taaa 24
<210> 277
<211> 24
<212> DNA
<213> Homo sapiens
<400> 277
cctgtctttt ttccatggag ggta 24
<210> 278
<211> 24
<212> DNA
<213> Homo sapiens
<400> 278
ccctgtcttt tttccatgga gggt 24
<210> 279
<211> 24
<212> DNA
<213> Homo sapiens
<400> 279
tccctgtctt ttttccatgg aggg 24
<210> 280
<211> 24
<212> DNA
<213> Homo sapiens
<400> 280
tttcagtacc ctccatggaa aaaa 24
<210> 281
<211> 24
<212> DNA
<213> Homo sapiens
<400> 281
agtaccctcc atggaaaaaa gaca 24
<210> 282
<211> 24
<212> DNA
<213> Homo sapiens
<400> 282
agtttgcatg gttcttgctc aagg 24
<210> 283
<211> 24
<212> DNA
<213> Homo sapiens
<400> 283
ataagaaaat gcattccttg agca 24
<210> 284
<211> 24
<212> DNA
<213> Homo sapiens
<400> 284
cataagaaaa tgcattcctt gagc 24
<210> 285
<211> 24
<212> DNA
<213> Homo sapiens
<400> 285
catggttctt gctcaaggaa tgca 24
<210> 286
<211> 24
<212> DNA
<213> Homo sapiens
<400> 286
acctacatgt ggaaataaat tttc 24
<210> 287
<211> 24
<212> DNA
<213> Homo sapiens
<400> 287
gacctacatg tggaaataaa tttt 24
<210> 288
<211> 24
<212> DNA
<213> Homo sapiens
<400> 288
tgacctacat gtggaaataa attt 24
<210> 289
<211> 24
<212> DNA
<213> Homo sapiens
<400> 289
cttatgaaaa tttatttcca catg 24
<210> 290
<211> 24
<212> DNA
<213> Homo sapiens
<400> 290
ttatgaaaat ttatttccac atgt 24
<210> 291
<211> 24
<212> DNA
<213> Homo sapiens
<400> 291
attacatttt tgacctacat gtgg 24
<210> 292
<211> 24
<212> DNA
<213> Homo sapiens
<400> 292
cattacattt ttgacctaca tgtg 24
<210> 293
<211> 24
<212> DNA
<213> Homo sapiens
<400> 293
tcattacatt tttgacctac atgt 24
<210> 294
<211> 24
<212> DNA
<213> Homo sapiens
<400> 294
tttccacatg taggtcaaaa atgt 24
<210> 295
<211> 24
<212> DNA
<213> Homo sapiens
<400> 295
cacatgtagg tcaaaaatgt aatg 24
<210> 296
<211> 24
<212> DNA
<213> Homo sapiens
<400> 296
ttgcaatcca gccatgatat tttt 24
<210> 297
<211> 24
<212> DNA
<213> Homo sapiens
<400> 297
actgttggtt tgttgcaatc cagc 24
<210> 298
<211> 24
<212> DNA
<213> Homo sapiens
<400> 298
cactgttggt ttgttgcaat ccag 24
<210> 299
<211> 24
<212> DNA
<213> Homo sapiens
<400> 299
aatgctctca tccatagtca tagg 24
<210> 300
<211> 24
<212> DNA
<213> Homo sapiens
<400> 300
atgtctcagt aatcttctta ccta 24
<210> 301
<211> 24
<212> DNA
<213> Homo sapiens
<400> 301
caagttattt aatgtctcag taat 24
<210> 302
<211> 24
<212> DNA
<213> Homo sapiens
<400> 302
acaagttatt taatgtctca gtaa 24
<210> 303
<211> 24
<212> DNA
<213> Homo sapiens
<400> 303
gactctgatg acatattttt cccc 24
<210> 304
<211> 24
<212> DNA
<213> Homo sapiens
<400> 304
tccccagtat ggttccagat catg 24
<210> 305
<211> 24
<212> DNA
<213> Homo sapiens
<400> 305
ccccagtatg gttccagatc atgt 24
<210> 306
<211> 24
<212> DNA
<213> Homo sapiens
<400> 306
cccagtatgg ttccagatca tgtc 24
<210> 307
<211> 24
<212> DNA
<213> Homo sapiens
<400> 307
tatttgtctt tgtgtatgtg tgta 24
<210> 308
<211> 24
<212> DNA
<213> Homo sapiens
<400> 308
tctttgtgta tgtgtgtatg tgta 24
<210> 309
<211> 24
<212> DNA
<213> Homo sapiens
<400> 309
tgtatgtgtg tatgtgtatg tgtt 24
<210> 310
<211> 24
<212> DNA
<213> Homo sapiens
<400> 310
aggccagacc tatttgactg gaat 24
<210> 311
<211> 24
<212> DNA
<213> Homo sapiens
<400> 311
ggccagacct atttgactgg aata 24
<210> 312
<211> 24
<212> DNA
<213> Homo sapiens
<400> 312
actggaatag tgtggtttgc cagc 24
<210> 313
<211> 24
<212> DNA
<213> Homo sapiens
<400> 313
ccagcagtca gccacacaac gact 24
<210> 314
<211> 24
<212> DNA
<213> Homo sapiens
<400> 314
tctatgccta attgatatct ggcg 24
<210> 315
<211> 24
<212> DNA
<213> Homo sapiens
<400> 315
ccaaccttca ggatcgagta gttt 24
<210> 316
<211> 24
<212> DNA
<213> Homo sapiens
<400> 316
tggactacca ctgcttttag tatg 24
<210> 317
<211> 24
<212> DNA
<213> Homo sapiens
<400> 317
agtatggtag agtttaatgt tttc 24
<210> 318
<211> 24
<212> DNA
<213> Homo sapiens
<400> 318
gtatggtaga gtttaatgtt ttca 24
<210> 319
<211> 24
<212> DNA
<213> Homo sapiens
<400> 319
agactctaaa aggataatga acaa 24
<210> 320
<211> 24
<212> DNA
<213> Homo sapiens
<400> 320
actttgattt gttcattatc cttt 24
<210> 321
<211> 24
<212> DNA
<213> Homo sapiens
<400> 321
tatatttgag actctaaaag gata 24
<210> 322
<211> 24
<212> DNA
<213> Homo sapiens
<400> 322
atttgttcat tatcctttta gagt 24
<210> 323
<211> 24
<212> DNA
<213> Homo sapiens
<400> 323
gtttctatat ttgagactct aaaa 24
<210> 324
<211> 24
<212> DNA
<213> Homo sapiens
<400> 324
ggtttctata tttgagactc taaa 24
<210> 325
<211> 24
<212> DNA
<213> Homo sapiens
<400> 325
tggtttctat atttgagact ctaa 24
<210> 326
<211> 24
<212> DNA
<213> Homo sapiens
<400> 326
ttcattatcc ttttagagtc tcaa 24
<210> 327
<211> 24
<212> DNA
<213> Homo sapiens
<400> 327
agagtctcaa atatagaaac caaa 24
<210> 328
<211> 24
<212> DNA
<213> Homo sapiens
<400> 328
gagtctcaaa tatagaaacc aaaa 24
<210> 329
<211> 24
<212> DNA
<213> Homo sapiens
<400> 329
cacttcctgg atggcttcaa tgct 24
<210> 330
<211> 24
<212> DNA
<213> Homo sapiens
<400> 330
gcctcaacaa gtgagcattg aagc 24
<210> 331
<211> 24
<212> DNA
<213> Homo sapiens
<400> 331
cctcaacaag tgagcattga agcc 24
<210> 332
<211> 24
<212> DNA
<213> Homo sapiens
<400> 332
ggtggccttg gcaacatttc cact 24
<210> 333
<211> 24
<212> DNA
<213> Homo sapiens
<400> 333
gtcactttag gtggccttgg caac 24
<210> 334
<211> 24
<212> DNA
<213> Homo sapiens
<400> 334
atgatgtaac tgaaaatgtt cttc 24
<210> 335
<211> 24
<212> DNA
<213> Homo sapiens
<400> 335
cctgttgaga atagtgcatt tgat 24
<210> 336
<211> 24
<212> DNA
<213> Homo sapiens
<400> 336
cagttacatc atcaaatgca ctat 24
<210> 337
<211> 24
<212> DNA
<213> Homo sapiens
<400> 337
agttacatca tcaaatgcac tatt 24
<210> 338
<211> 24
<212> DNA
<213> Homo sapiens
<400> 338
cacactttac ctgttgagaa tagt 24
<210> 339
<211> 24
<212> DNA
<213> Homo sapiens
<400> 339
ctgttttata tgcattttta ggta 24
<210> 340
<211> 24
<212> DNA
<213> Homo sapiens
<400> 340
tgttttatat gcatttttag gtat 24
<210> 341
<211> 24
<212> DNA
<213> Homo sapiens
<400> 341
atatgcattt ttaggtatta cgtg 24
<210> 342
<211> 24
<212> DNA
<213> Homo sapiens
<400> 342
tatgcatttt taggtattac gtgc 24
<210> 343
<211> 24
<212> DNA
<213> Homo sapiens
<400> 343
taggtattac gtgcacatat atat 24
<210> 344
<211> 24
<212> DNA
<213> Homo sapiens
<400> 344
aggtattacg tgcacatata tata 24
<210> 345
<211> 24
<212> DNA
<213> Homo sapiens
<400> 345
ggtattacgt gcacatatat atat 24
<210> 346
<211> 24
<212> DNA
<213> Homo sapiens
<400> 346
agcaacaact ataatattgt gcag 24
<210> 347
<211> 24
<212> DNA
<213> Homo sapiens
<400> 347
gttcctccat ctttctcttt ttat 24
<210> 348
<211> 24
<212> DNA
<213> Homo sapiens
<400> 348
tctttttatg gagttcacta ggtg 24
<210> 349
<211> 24
<212> DNA
<213> Homo sapiens
<400> 349
tatggagttc actaggtgca ccat 24
<210> 350
<211> 24
<212> DNA
<213> Homo sapiens
<400> 350
atggagttca ctaggtgcac catt 24
<210> 351
<211> 24
<212> DNA
<213> Homo sapiens
<400> 351
tggagttcac taggtgcacc attc 24
<210> 352
<211> 24
<212> DNA
<213> Homo sapiens
<400> 352
ataattgcat ctgaacattt ggtc 24
<210> 353
<211> 24
<212> DNA
<213> Homo sapiens
<400> 353
gtcctttgca gggtgagtga gcga 24
<210> 354
<211> 24
<212> DNA
<213> Homo sapiens
<400> 354
ttccaaagca gcctctcgct cact 24
<210> 355
<211> 24
<212> DNA
<213> Homo sapiens
<400> 355
cagggtgagt gagcgagagg ctgc 24
<210> 356
<211> 24
<212> DNA
<213> Homo sapiens
<400> 356
gaagaaactc atagattact gcaa 24
<210> 357
<211> 24
<212> DNA
<213> Homo sapiens
<400> 357
caggtccagg gggaactgtt gcag 24
<210> 358
<211> 24
<212> DNA
<213> Homo sapiens
<400> 358
ccaggtccag ggggaactgt tgca 24
<210> 359
<211> 24
<212> DNA
<213> Homo sapiens
<400> 359
agcttctgta agccaggcaa gaaa 24
<210> 360
<211> 24
<212> DNA
<213> Homo sapiens
<400> 360
ttgcctggct tacagaagct gaaa 24
<210> 361
<211> 24
<212> DNA
<213> Homo sapiens
<400> 361
cttacgggta gcatcctgta ggac 24
<210> 362
<211> 24
<212> DNA
<213> Homo sapiens
<400> 362
ctcccttgga gtcttctagg agcc 24
<210> 363
<211> 24
<212> DNA
<213> Homo sapiens
<400> 363
actcccttgg agtcttctag gagc 24
<210> 364
<211> 24
<212> DNA
<213> Homo sapiens
<400> 364
atcagctctt ttactccctt ggag 24
<210> 365
<211> 24
<212> DNA
<213> Homo sapiens
<400> 365
cgctttagca ctcttgtgga tcca 24
<210> 366
<211> 24
<212> DNA
<213> Homo sapiens
<400> 366
gcactcttgt ggatccaatt gaac 24
<210> 367
<211> 24
<212> DNA
<213> Homo sapiens
<400> 367
tccctggctt gtcagttaca agta 24
<210> 368
<211> 24
<212> DNA
<213> Homo sapiens
<400> 368
gtccctggct tgtcagttac aagt 24
<210> 369
<211> 24
<212> DNA
<213> Homo sapiens
<400> 369
ttttgtccct ggcttgtcag ttac 24
<210> 370
<211> 24
<212> DNA
<213> Homo sapiens
<400> 370
gttttgtccc tggcttgtca gtta 24
<210> 371
<211> 24
<212> DNA
<213> Homo sapiens
<400> 371
tacttgtaac tgacaagcca ggga 24
<210> 372
<211> 24
<212> DNA
<213> Homo sapiens
<400> 372
gctcctactc agactgttac tctg 24
<210> 373
<211> 24
<212> DNA
<213> Homo sapiens
<400> 373
taccatgtat tgctaaacaa agta 24
<210> 374
<211> 24
<212> DNA
<213> Homo sapiens
<400> 374
attgaagagt aacaatttga gcca 24
<210> 375
<211> 24
<212> DNA
<213> Mus musculus
<400> 375
aggctctgca aagttctttg aaag 24
<210> 376
<211> 24
<212> DNA
<213> Mus musculus
<400> 376
aaagagcaac aaaatggctt caac 24
<210> 377
<211> 24
<212> DNA
<213> Mus musculus
<400> 377
aaagagcaat aaaatggctt caac 24
<210> 378
<211> 24
<212> DNA
<213> Mus musculus
<400> 378
aaagaacttt gcagagcctc aaaa 24
<210> 379
<211> 24
<212> DNA
<213> Mus musculus
<400> 379
ctgaatatct atgcattaat aact 24
<210> 380
<211> 24
<212> DNA
<213> Mus musculus
<400> 380
tattatatta cagggcatat tata 24
<210> 381
<211> 24
<212> DNA
<213> Mus musculus
<400> 381
aggtaagccg aggtttggcc ttta 24
<210> 382
<211> 24
<212> DNA
<213> Mus musculus
<400> 382
cccagagtcc ttcaaagata ttga 24
<210> 383
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 383
aaaaaggaaa aaagaagaaa aaga 24
<210> 384
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 384
caaaaaggaa aaaagaagaa aaag 24
<210> 385
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 385
gcaaaaagga aaaaagaaga aaaa 24
<210> 386
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 386
uuuugcaaaa aggaaaaaag aaga 24
<210> 387
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 387
uuuuugcaaa aaggaaaaaa gaag 24
<210> 388
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 388
guuuuugcaa aaaggaaaaa agaa 24
<210> 389
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 389
auuuuggguu uuugcaaaaa ggaa 24
<210> 390
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 390
uauuuugggu uuuugcaaaa agga 24
<210> 391
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 391
auauuuuggg uuuuugcaaa aagg 24
<210> 392
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 392
aauauuuugg guuuuugcaa aaag 24
<210> 393
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 393
gcuaaaauau uuuggguuuu ugca 24
<210> 394
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 394
agcuaaaaua uuuuggguuu uugc 24
<210> 395
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 395
gagcuaaaau auuuuggguu uuug 24
<210> 396
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 396
agaguaacag ucugaguagg agcu 24
<210> 397
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 397
cagaguaaca gucugaguag gagc 24
<210> 398
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 398
gugacacaac cugugguuac uaag 24
<210> 399
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 399
gguuacuaag gaaacugcca ucu 23
<210> 400
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 400
aaggaaacug ccaucuccaa acua 24
<210> 401
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 401
aucaucaagc agaagguaug agaa 24
<210> 402
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 402
agcagaaggu augagaaaaa auga 24
<210> 403
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 403
gcagaaggua ugagaaaaaa ugau 24
<210> 404
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 404
uaaaaguugg cagaaguuuu ucuu 24
<210> 405
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 405
aaaaguuggc agaaguuuuu cuuu 24
<210> 406
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 406
gguggaaaau cuucauuuua aaga 24
<210> 407
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 407
ugguggaaaa ucuucauuuu aaag 24
<210> 408
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 408
uugguggaaa aucuucauuu uaaa 24
<210> 409
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 409
gugauuggug gaaaaucuuc auuu 24
<210> 410
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 410
cuaggagagu aaagugauug gugg 24
<210> 411
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 411
ucuaggagag uaaagugauu ggug 24
<210> 412
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 412
cuggugggaa auggucuagg aga 23
<210> 413
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 413
guagcacacu guuuaaucuu uucu 24
<210> 414
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 414
cacacuguuu aaucuuuucu caaa 24
<210> 415
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 415
acacuguuua aucuuuucuc aaau 24
<210> 416
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 416
cacuguuuaa ucuuuucuca aaua 24
<210> 417
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 417
augucuuuuu auuugagaaa agau 24
<210> 418
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 418
aagccccaug ucuuuuuauu ugag 24
<210> 419
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 419
gaagccccau gucuuuuuau uuga 24
<210> 420
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 420
guaagauacc aaaaaggcaa aaca 24
<210> 421
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 421
uguaagauac caaaaaggca aaac 24
<210> 422
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 422
cuguaagaua ccaaaaaggc aaaa 24
<210> 423
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 423
guuccuguaa gauaccaaaa aggc 24
<210> 424
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 424
aguuccugua agauaccaaa aagg 24
<210> 425
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 425
uccuggaguu ccuguaagau acca 24
<210> 426
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 426
auccuggagu uccuguaaga uacc 24
<210> 427
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 427
gggaagaaau aauucagcaa uccu 24
<210> 428
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 428
ggaagaaaua auucagcaau ccuc 24
<210> 429
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 429
gaagaaauaa uucagcaauc cuca 24
<210> 430
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 430
aaaacagaug ccaguauucu acag 24
<210> 431
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 431
aaacagaugc caguauucua cagg 24
<210> 432
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 432
aacagaugcc aguauucuac agga 24
<210> 433
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 433
gaaucugcgg uggcaggagg ucug 24
<210> 434
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 434
aggucugcaa acagcuguca gaca 24
<210> 435
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 435
ggucugcaaa cagcugucag acag 24
<210> 436
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 436
gucugcaaac agcugucaga caga 24
<210> 437
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 437
ucugcaaaca gcugucagac agaa 24
<210> 438
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 438
uagggcgaca gaucuaauag gaau 24
<210> 439
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 439
agggcgacag aucuaauagg aaug 24
<210> 440
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 440
uaaagaaagc uuaaaaaguc ugcu 24
<210> 441
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 441
cuaaagaaag cuuaaaaagu cugc 24
<210> 442
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 442
aaauauucuu cuaaagaaag cuua 24
<210> 443
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 443
gaaauauucu ucuaaagaaa gcuu 24
<210> 444
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 444
ugaaauauuc uucuaaagaa agcu 24
<210> 445
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 445
ucucucauga aauauucuuc uaaa 24
<210> 446
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 446
auaaucucuc augaaauauu cuuc 24
<210> 447
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 447
gcguauauuu uuugguuaua cuga 24
<210> 448
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 448
ucaagaaaaa uagauggauu augu 24
<210> 449
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 449
aucaagaaaa auagauggau uaug 24
<210> 450
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 450
cagguaaaag cauauggauc aaga 24
<210> 451
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 451
gcagguaaaa gcauauggau caag 24
<210> 452
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 452
ugcagguaaa agcauaugga ucaa 24
<210> 453
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 453
caggcgauuu gacagaucug uuga 24
<210> 454
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 454
agaucuguca aaucgccugc aggu 24
<210> 455
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 455
cagaucuguc aaaucgccug cagg 24
<210> 456
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 456
gccgccauuu cucaacagau cugu 24
<210> 457
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 457
aauggcggcg uuuucauuau gaua 24
<210> 458
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 458
auuaaauauc uuuauaucau aaug 24
<210> 459
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 459
ugagaauugg gaacaugcua aaua 24
<210> 460
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 460
gguaagucuu ugauuuguuu uuuc 24
<210> 461
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 461
aaauacaauu ucgaaaaaac aaau 24
<210> 462
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 462
aagauaaaua caauuucgaa aaaa 24
<210> 463
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 463
gcugaagaua aauacaauuu cgaa 24
<210> 464
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 464
ugcugaagau aaauacaauu ucga 24
<210> 465
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 465
gugcugaaga uaaauacaau uucg 24
<210> 466
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 466
ugugcugaag auaaauacaa uuuc 24
<210> 467
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 467
gcacaucugg acucuuuaac uucu 24
<210> 468
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 468
uaaagagucc agaugugcug aaga 24
<210> 469
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 469
aagaucaggu ucugaagggu gaug 24
<210> 470
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 470
uucagaaccu gaucuuuaag aagu 24
<210> 471
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 471
aauauaauga ugacaacaac aguc 24
<210> 472
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 472
uaauauaaug augacaacaa cagu 24
<210> 473
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 473
uuuauuuuuc cuuuuauucu aguu 24
<210> 474
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 474
aaaggaaaaa uaaauauaua guag 24
<210> 475
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 475
uuucaacuag aauaaaagga aaaa 24
<210> 476
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 476
auucuuucaa cuagaauaaa agga 24
<210> 477
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 477
aauucuuuca acuagaauaa aagg 24
<210> 478
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 478
gaauucuuuc aacuagaaua aaag 24
<210> 479
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 479
auucugaauu cuuucaacua gaau 24
<210> 480
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 480
gauucugaau ucuuucaacu agaa 24
<210> 481
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 481
cagaaccgga ggcaacaguu gaau 24
<210> 482
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 482
ggaggcaaca guugaaugaa augu 24
<210> 483
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 483
uauacaguag augcaaucca aaag 24
<210> 484
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 484
gaugcaaucc aaaagaaaau caca 24
<210> 485
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 485
aaucacagaa accaagguua guau 24
<210> 486
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 486
agguuaguau caaagauacc uuu 23
<210> 487
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 487
gguuaguauc aaagauaccu uuuu 24
<210> 488
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 488
aguaucaaag auaccuuuuu aaaa 24
<210> 489
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 489
guaucaaaga uaccuuuuua aaau 24
<210> 490
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 490
uguuuguguc ccaguuugca uuaa 24
<210> 491
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 491
cugggacaca aacauggcaa uuua 24
<210> 492
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 492
acugggacac aaacauggca auuu 24
<210> 493
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 493
aacugggaca caaacauggc aauu 24
<210> 494
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 494
uauuuguuaa ugcaaacugg gaca 24
<210> 495
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 495
acaaauaguu ugagaacuau guug 24
<210> 496
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 496
caaauaguuu gagaacuaug uugg 24
<210> 497
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 497
aaauaguuug agaacuaugu ugga 24
<210> 498
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 498
auaguuugag aacuauguug gaaa 24
<210> 499
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 499
uaguuugaga acuauguugg aaaa 24
<210> 500
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 500
aguuugagaa cuauguugga aaaa 24
<210> 501
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 501
uaguucucaa acuauuuguu aaug 24
<210> 502
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 502
uauuuuuuuu uccaacauag uucu 24
<210> 503
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 503
cuucuuucuc caggcuagaa gaac 24
<210> 504
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 504
cuucuagccu ggagaaagaa gaau 24
<210> 505
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 505
ucuucuagcc uggagaaaga agaa 24
<210> 506
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 506
auucuuuugu ucuucuagcc ugga 24
<210> 507
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 507
caaaagaaua ucuugucaga auuu 24
<210> 508
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 508
cuggaaaaga gcagcaacua aaag 24
<210> 509
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 509
caagucaagg uaauuuuauu uucu 24
<210> 510
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 510
caaauccccc agggccugcu ugca 24
<210> 511
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 511
aggcccuggg ggauuugaga aaau 24
<210> 512
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 512
caggcccugg gggauuugag aaaa 24
<210> 513
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 513
caagcaggcc cugggggauu ugag 24
<210> 514
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 514
gcaagcaggc ccugggggau uuga 24
<210> 515
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 515
gcagaaaacc aaugauugaa uuaa 24
<210> 516
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 516
ggcagaaaac caaugauuga auua 24
<210> 517
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 517
gggcagaaaa ccaaugauug aauu 24
<210> 518
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 518
ugggcagaaa accaaugauu gaau 24
<210> 519
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 519
auuagguuau ucauaguucc uugc 24
<210> 520
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 520
aacuaugaau aaccuaaugg gcag 24
<210> 521
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 521
gaacuaugaa uaaccuaaug ggca 24
<210> 522
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 522
uauuuccugu uaaauuguuu ucua 24
<210> 523
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 523
gguuuauaga aaacaauuua acag 24
<210> 524
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 524
auacaguaac aucuuuuuua uuuc 24
<210> 525
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 525
uacaguaaca ucuuuuuuau uucu 24
<210> 526
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 526
auguuacugu auaaggguuu auag 24
<210> 527
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 527
gauguuacug uauaaggguu uaua 24
<210> 528
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 528
cagccaaaac acuuuuagaa auaa 24
<210> 529
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 529
ccagccaaaa cacuuuuaga aaua 24
<210> 530
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 530
accagccaaa acacuuuuag aaau 24
<210> 531
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 531
gaccagccaa aacacuuuua gaaa 24
<210> 532
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 532
gugagaccag ccaaaacacu uuua 24
<210> 533
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 533
aauuguacuu uacuuuguau uaug 24
<210> 534
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 534
auuguacuuu acuuuguauu augu 24
<210> 535
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 535
uaaaguacaa uugugagacc agcc 24
<210> 536
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 536
guaaaguaca auugugagac cagc 24
<210> 537
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 537
guauuccuuu uacauaauac aaag 24
<210> 538
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 538
guuguguauu ccuuuuacau aaua 24
<210> 539
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 539
auccugcauu guugccugua agaa 24
<210> 540
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 540
uuccaacugg ggacgccucu guuc 24
<210> 541
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 541
uuggaagaac ucauuaccgc ugcc 24
<210> 542
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 542
ucauuaccgc ugcccaaaau uuga 24
<210> 543
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 543
cucuugauug cuggucuugu uuuu 24
<210> 544
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 544
guuuuuuaac aagcauggga caca 24
<210> 545
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 545
cuuugugugu cccaugcuug uuaa 24
<210> 546
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 546
gcuuugugug ucccaugcuu guua 24
<210> 547
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 547
ugcuuugugu gucccaugcu uguu 24
<210> 548
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 548
uugcuuugug ugucccaugc uugu 24
<210> 549
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 549
agcaagaugc augacaaguu ucaa 24
<210> 550
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 550
gcaagaugca ugacaaguuu caau 24
<210> 551
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 551
caagaugcau gacaaguuuc aaua 24
<210> 552
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 552
gauauaugaa cuuaaguuuu uauu 24
<210> 553
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 553
auagaaaucc aauaauauau ucac 24
<210> 554
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 554
auuaagaugu ucaugaauua ucuu 24
<210> 555
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 555
uaaguaaugu guaugcuuuu cugu 24
<210> 556
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 556
aucuucuaac uuccucuuua acag 24
<210> 557
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 557
gaucuucuaa cuuccucuuu aaca 24
<210> 558
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 558
aucugagcuc ugaguggaag gcgg 24
<210> 559
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 559
accguuuacu ucaagagcug aggg 24
<210> 560
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 560
cugcuuugcc cucagcucuu gaag 24
<210> 561
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 561
ucucuuuggc ucuagcuauu uguu 24
<210> 562
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 562
cucuuuggcu cuagcuauuu guuc 24
<210> 563
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 563
cacuuuugaa caaauagcua gagc 24
<210> 564
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 564
ucacuucaua guugcacuuu ugaa 24
<210> 565
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 565
augaagugau gacuggguga gaga 24
<210> 566
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 566
ugaagugaug acugggugag agag 24
<210> 567
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 567
aagagaaaaa uauauauaua uaua 24
<210> 568
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 568
gaauuagcug ucuauagaaa gaga 24
<210> 569
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 569
ugaauuagcu gucuauagaa agag 24
<210> 570
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 570
agcuaauuca uuuuuuuacu guuu 24
<210> 571
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 571
augaauuagc ugucuauaga aaga 24
<210> 572
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 572
gcuaauucau uuuuuuacug uuuu 24
<210> 573
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 573
aaaaaaauga auuagcuguc uaua 24
<210> 574
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 574
uuaaaauuuu uauauuacag aaua 24
<210> 575
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 575
uaaaauuuuu auauuacaga auau 24
<210> 576
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 576
auauaaaaau uuuaaaacag uaaa 24
<210> 577
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 577
aauauaaaaa uuuuaaaaca guaa 24
<210> 578
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 578
uaauauaaaa auuuuaaaac agua 24
<210> 579
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 579
guaauauaaa aauuuuaaaa cagu 24
<210> 580
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 580
uguaauauaa aaauuuuaaa acag 24
<210> 581
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 581
uauauucugu aauauaaaaa uuuu 24
<210> 582
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 582
uuauauucug uaauauaaaa auuu 24
<210> 583
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 583
cagaauauaa aagauagucu acaa 24
<210> 584
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 584
cuaucuuuua uauucuguaa uaua 24
<210> 585
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 585
acuaucuuuu auauucugua auau 24
<210> 586
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 586
gacuaucuuu uauauucugu aaua 24
<210> 587
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 587
cauagcaaga agacagcagc auug 24
<210> 588
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 588
cauuuuguua acuuuuuccc auug 24
<210> 589
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 589
cauauauuuu ucuugauacu ugca 24
<210> 590
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 590
aaaucauuuc ugcaaguauc aaga 24
<210> 591
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 591
caaaucauuu cugcaaguau caag 24
<210> 592
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 592
acaaaucauu ucugcaagua ucaa 24
<210> 593
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 593
auaaauucua caguucccug aaaa 24
<210> 594
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 594
gaauuuauuu caguacccuc caug 24
<210> 595
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 595
aauuuauuuc aguacccucc augg 24
<210> 596
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 596
ugaaauaaau ucuacaguuc ccug 24
<210> 597
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 597
auuuauuuca guacccucca ugga 24
<210> 598
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 598
cugaaauaaa uucuacaguu cccu 24
<210> 599
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 599
uuuauuucag uacccuccau ggaa 24
<210> 600
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 600
uacccuccau ggaaaaaaga cagg 24
<210> 601
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 601
acccuccaug gaaaaaagac aggg 24
<210> 602
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 602
cccuccaugg aaaaaagaca ggga 24
<210> 603
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 603
uuuuuuccau ggaggguacu gaaa 24
<210> 604
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 604
ugucuuuuuu ccauggaggg uacu 24
<210> 605
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 605
ccuugagcaa gaaccaugca aacu 24
<210> 606
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 606
ugcucaagga augcauuuuc uuau 24
<210> 607
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 607
gcucaaggaa ugcauuuucu uaug 24
<210> 608
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 608
ugcauuccuu gagcaagaac caug 24
<210> 609
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 609
gaaaauuuau uuccacaugu aggu 24
<210> 610
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 610
aaaauuuauu uccacaugua gguc 24
<210> 611
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 611
aaauuuauuu ccacauguag guca 24
<210> 612
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 612
cauguggaaa uaaauuuuca uaag 24
<210> 613
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 613
acauguggaa auaaauuuuc auaa 24
<210> 614
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 614
ccacauguag gucaaaaaug uaau 24
<210> 615
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 615
cacauguagg ucaaaaaugu aaug 24
<210> 616
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 616
acauguaggu caaaaaugua auga 24
<210> 617
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 617
acauuuuuga ccuacaugug gaaa 24
<210> 618
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 618
cauuacauuu uugaccuaca ugug 24
<210> 619
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 619
aaaaauauca uggcuggauu gcaa 24
<210> 620
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 620
gcuggauugc aacaaaccaa cagu 24
<210> 621
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 621
cuggauugca acaaaccaac agug 24
<210> 622
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 622
ccuaugacua uggaugagag cauu 24
<210> 623
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 623
uagguaagaa gauuacugag acau 24
<210> 624
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 624
auuacugaga cauuaaauaa cuug 24
<210> 625
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 625
uuacugagac auuaaauaac uugu 24
<210> 626
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 626
ggggaaaaau augucaucag aguc 24
<210> 627
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 627
caugaucugg aaccauacug ggga 24
<210> 628
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 628
acaugaucug gaaccauacu gggg 24
<210> 629
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 629
gacaugaucu ggaaccauac uggg 24
<210> 630
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 630
uacacacaua cacaaagaca aaua 24
<210> 631
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 631
uacacauaca cacauacaca aaga 24
<210> 632
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 632
aacacauaca cauacacaca uaca 24
<210> 633
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 633
auuccaguca aauaggucug gccu 24
<210> 634
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 634
uauuccaguc aaauaggucu ggcc 24
<210> 635
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 635
gcuggcaaac cacacuauuc cagu 24
<210> 636
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 636
agucguugug uggcugacug cugg 24
<210> 637
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 637
cgccagauau caauuaggca uaga 24
<210> 638
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 638
aaacuacucg auccugaagg uugg 24
<210> 639
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 639
cauacuaaaa gcagugguag ucca 24
<210> 640
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 640
gaaaacauua aacucuacca uacu 24
<210> 641
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 641
ugaaaacauu aaacucuacc auac 24
<210> 642
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 642
uuguucauua uccuuuuaga gucu 24
<210> 643
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 643
aaaggauaau gaacaaauca aagu 24
<210> 644
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 644
uauccuuuua gagucucaaa uaua 24
<210> 645
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 645
acucuaaaag gauaaugaac aaau 24
<210> 646
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 646
uuuuagaguc ucaaauauag aaac 24
<210> 647
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 647
uuuagagucu caaauauaga aacc 24
<210> 648
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 648
uuagagucuc aaauauagaa acca 24
<210> 649
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 649
uugagacucu aaaaggauaa ugaa 24
<210> 650
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 650
uuugguuucu auauuugaga cucu 24
<210> 651
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 651
uuuugguuuc uauauuugag acuc 24
<210> 652
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 652
agcauugaag ccauccagga agug 24
<210> 653
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 653
gcuucaaugc ucacuuguug aggc 24
<210> 654
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 654
ggcuucaaug cucacuuguu gagg 24
<210> 655
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 655
aguggaaaug uugccaaggc cacc 24
<210> 656
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 656
guugccaagg ccaccuaaag ugac 24
<210> 657
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 657
gaagaacauu uucaguuaca ucau 24
<210> 658
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 658
aucaaaugca cuauucucaa cagg 24
<210> 659
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 659
auagugcauu ugaugaugua acug 24
<210> 660
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 660
aauagugcau uugaugaugu aacu 24
<210> 661
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 661
acuauucuca acagguaaag ugug 24
<210> 662
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 662
uaccuaaaaa ugcauauaaa acag 24
<210> 663
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 663
auaccuaaaa augcauauaa aaca 24
<210> 664
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 664
cacguaauac cuaaaaaugc auau 24
<210> 665
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 665
gcacguaaua ccuaaaaaug caua 24
<210> 666
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 666
auauauaugu gcacguaaua ccua 24
<210> 667
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 667
uauauauaug ugcacguaau accu 24
<210> 668
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 668
auauauauau gugcacguaa uacc 24
<210> 669
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 669
cugcacaaua uuauaguugu ugcu 24
<210> 670
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 670
auaaaaagag aaagauggag gaac 24
<210> 671
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 671
caccuaguga acuccauaaa aaga 24
<210> 672
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 672
auggugcacc uagugaacuc caua 24
<210> 673
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 673
aauggugcac cuagugaacu ccau 24
<210> 674
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 674
gaauggugca ccuagugaac ucca 24
<210> 675
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 675
gaccaaaugu ucagaugcaa uuau 24
<210> 676
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 676
ucgcucacuc acccugcaaa ggac 24
<210> 677
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 677
agugagcgag aggcugcuuu ggaa 24
<210> 678
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 678
gcagccucuc gcucacucac ccug 24
<210> 679
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 679
uugcaguaau cuaugaguuu cuuc 24
<210> 680
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 680
cugcaacagu ucccccugga ccug 24
<210> 681
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 681
ugcaacaguu cccccuggac cugg 24
<210> 682
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 682
uuucuugccu ggcuuacaga agcu 24
<210> 683
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 683
uuucagcuuc uguaagccag gcaa 24
<210> 684
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 684
guccuacagg augcuacccg uaag 24
<210> 685
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 685
ggcuccuaga agacuccaag ggag 24
<210> 686
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 686
gcuccuagaa gacuccaagg gagu 24
<210> 687
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 687
cuccaaggga guaaaagagc ugau 24
<210> 688
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 688
uggauccaca agagugcuaa agcg 24
<210> 689
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 689
guucaauugg auccacaaga gugc 24
<210> 690
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 690
uacuuguaac ugacaagcca ggga 24
<210> 691
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 691
acuuguaacu gacaagccag ggac 24
<210> 692
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 692
guaacugaca agccagggac aaaa 24
<210> 693
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 693
uaacugacaa gccagggaca aaac 24
<210> 694
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 694
ucccuggcuu gucaguuaca agua 24
<210> 695
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 695
cagaguaaca gucugaguag gagc 24
<210> 696
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 696
uacuuuguuu agcaauacau ggua 24
<210> 697
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 697
uggcucaaau uguuacucuu caau 24
<210> 698
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 698
cuuucaaaga acuuugcaga gccu 24
<210> 699
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 699
guugaagcca uuuuguugcu cuuu 24
<210> 700
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 700
guugaagcca uuuuauugcu cuuu 24
<210> 701
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 701
uuuugaggcu cugcaaaguu cuuu 24
<210> 702
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 702
aguuauuaau gcauagauau ucag 24
<210> 703
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 703
uauaauaugc ccuguaauau aaua 24
<210> 704
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 704
uaaaggccaa accucggcuu accu 24
<210> 705
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 705
ucaauaucuu ugaaggacuc uggg 24
<210> 706
<211> 19
<212> DNA
<213> Mus musculus
<400> 706
agagtaacag tctgactgg 19
<210> 707
<211> 19
<212> DNA
<213> Mus musculus
<400> 707
gaaatgatca tcaaacaga 19
<210> 708
<211> 20
<212> DNA
<213> Mus musculus
<400> 708
cactagagta acagtctgac 20
<210> 709
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 709
ccagucagac uguuacucu 19
<210> 710
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 710
ucuguuugau gaucauuuc 19
<210> 711
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 711
gucagacugu uacucuagug 20
<210> 712
<211> 19
<212> DNA
<213> Homo sapiens
<400> 712
agagtaacag tctgagtag 19
<210> 713
<211> 19
<212> DNA
<213> Homo sapiens
<400> 713
gagatgatca tcaagcaga 19
<210> 714
<211> 20
<212> DNA
<213> Homo sapiens
<400> 714
caccagagta acagtctgag 20
<210> 715
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 715
cuacucagac uguuacucu 19
<210> 716
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 716
ucugcuugau gaucaucuc 19
<210> 717
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 717
cucagacugu uacucuggug 20
<210> 718
<211> 20
<212> DNA
<213> Homo sapiens
<400> 718
caccagagta acagtctgag 20
<210> 719
<211> 20
<212> DNA
<213> Homo sapiens
<400> 719
tattttgggt ttttgcaaaa 20
<210> 720
<211> 20
<212> DNA
<213> Homo sapiens
<400> 720
agtaggagct aaaatatttt 20
<210> 721
<211> 20
<212> DNA
<213> Homo sapiens
<400> 721
gagtaggagc taaaatattt 20
<210> 722
<211> 20
<212> DNA
<213> Homo sapiens
<400> 722
accagagtaa cagtctgagt 20
<210> 723
<211> 20
<212> DNA
<213> Homo sapiens
<400> 723
tcctactcag actgttactc 20
<210> 724
<211> 20
<212> DNA
<213> Homo sapiens
<400> 724
tactctggtg acacaacctg 20
<210> 725
<211> 20
<212> DNA
<213> Homo sapiens
<400> 725
gcagtttcct tagtaaccac 20
<210> 726
<211> 20
<212> DNA
<213> Homo sapiens
<400> 726
gacacaacct gtggttacta 20
<210> 727
<211> 20
<212> DNA
<213> Homo sapiens
<400> 727
tgtcaccaga gtaacagtct 20
<210> 728
<211> 20
<212> DNA
<213> Homo sapiens
<400> 728
aggttgtgtc accagagtaa 20
<210> 729
<211> 20
<212> DNA
<213> Homo sapiens
<400> 729
aaccacaggt tgtgtcacca 20
<210> 730
<211> 20
<212> DNA
<213> Homo sapiens
<400> 730
gtaaccacag gttgtgtcac 20
<210> 731
<211> 20
<212> DNA
<213> Homo sapiens
<400> 731
atttattttt ccttttattc 20
<210> 732
<211> 20
<212> DNA
<213> Homo sapiens
<400> 732
tttcctttta ttctagttga 20
<210> 733
<211> 20
<212> DNA
<213> Homo sapiens
<400> 733
tgattctgaa ttctttcaac 20
<210> 734
<211> 20
<212> DNA
<213> Homo sapiens
<400> 734
aattctttca actagaataa 20
<210> 735
<211> 20
<212> DNA
<213> Homo sapiens
<400> 735
ttattctagt tgaaagaatt 20
<210> 736
<211> 20
<212> DNA
<213> Homo sapiens
<400> 736
tagttgaaag aattcagaat 20
<210> 737
<211> 20
<212> DNA
<213> Homo sapiens
<400> 737
aattcagaat cagtgggatg 20
<210> 738
<211> 20
<212> DNA
<213> Homo sapiens
<400> 738
attctttcaa ctagaataaa 20
<210> 739
<211> 20
<212> DNA
<213> Homo sapiens
<400> 739
ttgaaagaat tcagaatcag 20
<210> 740
<211> 20
<212> DNA
<213> Homo sapiens
<400> 740
tgaaagaatt cagaatcagt 20
<210> 741
<211> 20
<212> DNA
<213> Homo sapiens
<400> 741
actgttgcct ccggttctga 20
<210> 742
<211> 20
<212> DNA
<213> Homo sapiens
<400> 742
cagatctgtc aaatcgcctg 20
<210> 743
<211> 20
<212> DNA
<213> Homo sapiens
<400> 743
aaaacgccgc catttctcaa 20
<210> 744
<211> 20
<212> DNA
<213> Homo sapiens
<400> 744
agatctgtca aatcgcctgc 20
<210> 745
<211> 20
<212> DNA
<213> Homo sapiens
<400> 745
tatggatcaa gaaaaataga 20
<210> 746
<211> 20
<212> DNA
<213> Homo sapiens
<400> 746
cgcctgcagg taaaagcata 20
<210> 747
<211> 20
<212> DNA
<213> Homo sapiens
<400> 747
atccatatgc ttttacctgc 20
<210> 748
<211> 20
<212> DNA
<213> Homo sapiens
<400> 748
ttgacagatc tgttgagaaa 20
<210> 749
<211> 20
<212> DNA
<213> Homo sapiens
<400> 749
acagatctgt tgagaaatgg 20
<210> 750
<211> 20
<212> DNA
<213> Homo sapiens
<400> 750
ggcgatttga cagatctgtt 20
<210> 751
<211> 20
<212> DNA
<213> Homo sapiens
<400> 751
ggcgttttca ttatgatata 20
<210> 752
<211> 20
<212> DNA
<213> Homo sapiens
<400> 752
atgatataaa gatatttaat 20
<210> 753
<211> 20
<212> DNA
<213> Homo sapiens
<400> 753
gatatttaat cagtggctaa 20
<210> 754
<211> 20
<212> DNA
<213> Homo sapiens
<400> 754
atttaatcag tggctaacag 20
<210> 755
<211> 20
<212> DNA
<213> Homo sapiens
<400> 755
agaaactgtt cagcttctgt 20
<210> 756
<211> 20
<212> DNA
<213> Homo sapiens
<400> 756
gttttaaaat ttttatatta 20
<210> 757
<211> 20
<212> DNA
<213> Homo sapiens
<400> 757
ttttatatta cagaatataa 20
<210> 758
<211> 20
<212> DNA
<213> Homo sapiens
<400> 758
atattacaga atataaaaga 20
<210> 759
<211> 20
<212> DNA
<213> Homo sapiens
<400> 759
gttcctgtaa gataccaaaa 20
<210> 760
<211> 20
<212> DNA
<213> Homo sapiens
<400> 760
ttgccttttt ggtatcttac 20
<210> 761
<211> 20
<212> DNA
<213> Homo sapiens
<400> 761
tggtatctta caggaactcc 20
<210> 762
<211> 20
<212> DNA
<213> Homo sapiens
<400> 762
atcttacagg aactccagga 20
<210> 763
<211> 20
<212> DNA
<213> Homo sapiens
<400> 763
gccgctgccc aatgccatcc 20
<210> 764
<211> 20
<212> DNA
<213> Homo sapiens
<400> 764
caggaactcc aggatggcat 20
<210> 765
<211> 20
<212> DNA
<213> Homo sapiens
<400> 765
aggaactcca ggatggcatt 20
<210> 766
<211> 20
<212> DNA
<213> Homo sapiens
<400> 766
tccaggatgg cattgggcag 20
<210> 767
<211> 20
<212> DNA
<213> Homo sapiens
<400> 767
gtcagaacat tgaatgcaac 20
<210> 768
<211> 20
<212> DNA
<213> Homo sapiens
<400> 768
agttcctgta agataccaaa 20
<210> 769
<211> 20
<212> DNA
<213> Homo sapiens
<400> 769
tgccatcctg gagttcctgt 20
<210> 770
<211> 20
<212> DNA
<213> Homo sapiens
<400> 770
ttggtatctt acaggaactc 20
<210> 771
<211> 20
<212> DNA
<213> Homo sapiens
<400> 771
cgctgcccaa tgccatcctg 20
<210> 772
<211> 20
<212> DNA
<213> Homo sapiens
<400> 772
aactccagga tggcattggg 20
<210> 773
<211> 20
<212> DNA
<213> Homo sapiens
<400> 773
gggcagcggc aaactgttgt 20
<210> 774
<211> 20
<212> DNA
<213> Homo sapiens
<400> 774
agatctgtca aatcgcctgc 20
<210> 775
<211> 20
<212> DNA
<213> Homo sapiens
<400> 775
aatcctgcat tgttgcctgt 20
<210> 776
<211> 20
<212> DNA
<213> Homo sapiens
<400> 776
cgctgaagaa ccctgatact 20
<210> 777
<211> 20
<212> DNA
<213> Homo sapiens
<400> 777
gaacaaatat cccttagtat 20
<210> 778
<211> 20
<212> DNA
<213> Homo sapiens
<400> 778
ctgtaagaac aaatatccct 20
<210> 779
<211> 20
<212> DNA
<213> Homo sapiens
<400> 779
ctaagggata tttgttctta 20
<210> 780
<211> 20
<212> DNA
<213> Homo sapiens
<400> 780
tgttcttaca ggcaacaatg 20
<210> 781
<211> 20
<212> DNA
<213> Homo sapiens
<400> 781
caacaatgca ggatttggaa 20
<210> 782
<211> 20
<212> DNA
<213> Homo sapiens
<400> 782
acaatgcagg atttggaaca 20
<210> 783
<211> 20
<212> DNA
<213> Homo sapiens
<400> 783
atttggaaca gaggcgtccc 20
<210> 784
<211> 20
<212> DNA
<213> Homo sapiens
<400> 784
acagaggcgt ccccagttgg 20
<210> 785
<211> 20
<212> DNA
<213> Homo sapiens
<400> 785
tattttttta ttttgcattt 20
<210> 786
<211> 20
<212> DNA
<213> Homo sapiens
<400> 786
ttattttgca ttttagatga 20
<210> 787
<211> 20
<212> DNA
<213> Homo sapiens
<400> 787
attttgcatt ttagatgaaa 20
<210> 788
<211> 20
<212> DNA
<213> Homo sapiens
<400> 788
ttgcatttta gatgaaagag 20
<210> 789
<211> 20
<212> DNA
<213> Homo sapiens
<400> 789
atgaaagaga agatgttcaa 20
<210> 790
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 790
cuacucagac uguuacucug 20
<210> 791
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 791
cucagacugu uacucuggug 20
<210> 792
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 792
uuuugcaaaa acccaaaaua 20
<210> 793
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 793
aaaauauuuu agcuccuacu 20
<210> 794
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 794
aaauauuuua gcuccuacuc 20
<210> 795
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 795
acucagacug uuacucuggu 20
<210> 796
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 796
gaguaacagu cugaguagga 20
<210> 797
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 797
cagguugugu caccagagua 20
<210> 798
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 798
gugguuacua aggaaacugc 20
<210> 799
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 799
uaguaaccac agguuguguc 20
<210> 800
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 800
agacuguuac ucuggugaca 20
<210> 801
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 801
uuacucuggu gacacaaccu 20
<210> 802
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 802
uggugacaca accugugguu 20
<210> 803
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 803
gugacacaac cugugguuac 20
<210> 804
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 804
gaauaaaagg aaaaauaaau 20
<210> 805
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 805
ucaacuagaa uaaaaggaaa 20
<210> 806
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 806
guugaaagaa uucagaauca 20
<210> 807
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 807
uuauucuagu ugaaagaauu 20
<210> 808
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 808
aauucuuuca acuagaauaa 20
<210> 809
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 809
auucugaauu cuuucaacua 20
<210> 810
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 810
caucccacug auucugaauu 20
<210> 811
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 811
uuuauucuag uugaaagaau 20
<210> 812
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 812
cugauucuga auucuuucaa 20
<210> 813
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 813
acugauucug aauucuuuca 20
<210> 814
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 814
ucagaaccgg aggcaacagu 20
<210> 815
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 815
caggcgauuu gacagaucug 20
<210> 816
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 816
uugagaaaug gcggcguuuu 20
<210> 817
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 817
gcaggcgauu ugacagaucu 20
<210> 818
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 818
ucuauuuuuc uugauccaua 20
<210> 819
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 819
uaugcuuuua ccugcaggcg 20
<210> 820
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 820
gcagguaaaa gcauauggau 20
<210> 821
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 821
uuucucaaca gaucugucaa 20
<210> 822
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 822
ccauuucuca acagaucugu 20
<210> 823
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 823
aacagaucug ucaaaucgcc 20
<210> 824
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 824
uauaucauaa ugaaaacgcc 20
<210> 825
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 825
auuaaauauc uuuauaucau 20
<210> 826
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 826
uuagccacug auuaaauauc 20
<210> 827
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 827
cuguuagcca cugauuaaau 20
<210> 828
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 828
acagaagcug aacaguuucu 20
<210> 829
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 829
uaauauaaaa auuuuaaaac 20
<210> 830
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 830
uuauauucug uaauauaaaa 20
<210> 831
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 831
ucuuuuauau ucuguaauau 20
<210> 832
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 832
uuuugguauc uuacaggaac 20
<210> 833
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 833
guaagauacc aaaaaggcaa 20
<210> 834
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 834
ggaguuccug uaagauacca 20
<210> 835
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 835
uccuggaguu ccuguaagau 20
<210> 836
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 836
ggauggcauu gggcagcggc 20
<210> 837
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 837
augccauccu ggaguuccug 20
<210> 838
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 838
aaugccaucc uggaguuccu 20
<210> 839
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 839
cugcccaaug ccauccugga 20
<210> 840
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 840
guugcauuca auguucugac 20
<210> 841
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 841
uuugguaucu uacaggaacu 20
<210> 842
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 842
acaggaacuc caggauggca 20
<210> 843
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 843
gaguuccugu aagauaccaa 20
<210> 844
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 844
caggauggca uugggcagcg 20
<210> 845
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 845
cccaaugcca uccuggaguu 20
<210> 846
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 846
acaacaguuu gccgcugccc 20
<210> 847
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 847
gcaggcgauu ugacagaucu 20
<210> 848
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 848
acaggcaaca augcaggauu 20
<210> 849
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 849
aguaucaggg uucuucagcg 20
<210> 850
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 850
auacuaaggg auauuuguuc 20
<210> 851
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 851
agggauauuu guucuuacag 20
<210> 852
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 852
uaagaacaaa uaucccuuag 20
<210> 853
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 853
cauuguugcc uguaagaaca 20
<210> 854
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 854
uuccaaaucc ugcauuguug 20
<210> 855
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 855
uguuccaaau ccugcauugu 20
<210> 856
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 856
gggacgccuc uguuccaaau 20
<210> 857
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 857
ccaacugggg acgccucugu 20
<210> 858
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 858
acagaggcgu ccccaguugg 20
<210> 859
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 859
ucaucuaaaa ugcaaaauaa 20
<210> 860
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 860
uuucaucuaa aaugcaaaau 20
<210> 861
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 861
cucuuucauc uaaaaugcaa 20
<210> 862
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 862
uugaacaucu ucucuuucau 20
<210> 863
<211> 20
<212> DNA
<213> Canis lupis
<400> 863
caccagagta acagtctgac 20
<210> 864
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 864
gucagacugu uacucuggug 20
<210> 865
<211> 8969
<212> DNA
<213> Homo sapiens
<400> 865
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaaggaaa 5940
ttgatcggga attgcagaag aagaaagagg agctgaatgc agtgcgtagg caagctgagg 6000
gcttgtctga ggatggggcc gcaatggcag tggagccaac tcagatccag ctcagcaagc 6060
gctggcggga aattgagagc aaatttgctc agtttcgaag actcaacttt gcacaaattc 6120
acactgtccg tgaagaaacg atgatggtga tgactgaaga catgcctttg gaaatttctt 6180
atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta ttagaagtgg 6240
aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc tttaagcaag 6300
aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg attgacatta 6360
ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg gtgaagctac 6420
aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg tacaaggacc 6480
gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat gatataaaga 6540
tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa attcctgaga 6600
attgggaaca tgctaaatac aaatggtatc ttaagatctc cgagaggcag aaaaagggga 6660
actgtgcaac ccttttgtcc ttctggatct caaaatgaag ggatacattc tgctacatga 6720
aatgtggaat taagaccatg atgcaacatg ataaacaaca caaatttggg ggtgtctctg 6780
tgctatacat tattgaattt ttccatgcta tacacttttt ggatgtgtct gtgctattta 6840
ttcagttttt ttaaataaaa gtttttgtag actaaattgc cctctctact ttgcatcgtt 6900
tttgaacaaa ggattttcaa gactgataag ctcaaatgta tcatttattg tattcaagta 6960
gcattcaatt tttctttaga agtataattt gtagatattt taacacagaa aacttgcaac 7020
actgctcatg ataggcactt attatatatt ttttgaaaga ctatatggat aatgattcta 7080
actttgactt ttcctgtttt gccttcactt tagaattaag cagagaatca aatccatatt 7140
cctgggggcg atgcttggac aacagtatct ctttaaagat ctttgtgtga gtcgaaggtg 7200
cagccagact gggagttatt gtgaagaaac agattcagga aggttgagaa acttgcctaa 7260
ggctaatcag atagttactg gcaatgttgt ttctaaatca ctgtttggct ccctcattca 7320
atgaatctac actatgtggg actgcctctt gctcctgaca tcttttgctg ctgaaataaa 7380
tgaactcaaa gcctagaagg tagaaaagag ggagttcaga attatattca ggcacaaata 7440
ccaataaggc tattgccccc agaactgcaa cttctcttgg tttaacagat aactatttag 7500
ctgtgaggta caactgagga agtggacaca caagttatca ggagattctg atgtgccagt 7560
ttatatttct tgtcacaggt aatgattcga aatttcttaa aacagctgtc ctcacagtgg 7620
agtaacctgg gagtacatga aggcattcca aggagtaggc acagatagtt ttaagggaat 7680
ttatttctag atcttctact ttattttgta ctcttcctga aaactgaatt gcctgaaaaa 7740
aaaaaaaaaa aaaaaaagac atctgtagtc aagacctcag gctgtttctc ctttctaacc 7800
acttgccttt tctaaccact tctcccaatt taagaaaaaa agccttatat ttcatccaac 7860
tctgatctta ctaaggcttc aaacaaaaga agcatgaatg actttcatga cagggcaaca 7920
tagctttttg caagaagagt ggttgctaac tctttgcttt caactgaacc cgaagagaag 7980
acctgataag ttgtcagccg atagatcatt aaaaatacgt tttggtaagc aatcatcatg 8040
tacttttagc atatgccata gcaggagcac aaatgattaa gcaatgctac tataatacaa 8100
ttccttccgt ttctttctac tcacctattt gaataagatt tttcatcatt tacatctata 8160
cagacaaaaa ttagggatag aattgatgct gaagcctttc caattgtaga attaatttat 8220
attcttctga aggtgtataa attgttaaat acccatccat cttattaaga gatgtatttt 8280
caataaaatt ttatttttat gtttatcaaa ttttataata tacatatatt gttttggtca 8340
attgcacgtt aataattgta acaatacctc aattgaaaag gtttgttttt tacatttagg 8400
acttacagta acagaaaaaa aacactcatt gtgtatacat actgtttaag aaaagtatac 8460
taggtgatca ataagatttt ttcaggcata aacatatatc ttagttttaa gatatcgata 8520
tttacaatgt ccctcaaatt atattatttt cagtcattta agaatgaaaa gtacatttcg 8580
aatgcggatt ttaaatctgc aagggttgac tcatttttca agagtctttt taggggatac 8640
agaagcaaga atgtttggag ttccctgatc agtatcttta agagaaggta tttgttggta 8700
gttcctagca aattccaaca gcctgatgct acttaaaaga taatagtaat tattttaaat 8760
aatgcttctg ataaaaaaca ttcatgcaca ctcagtttaa aaagatattt aaacatttgt 8820
agttgtagtt tgggaactca tgatacaagt acagtctgta aatgaagctc ttagtttgca 8880
aatatcagag ataagctatt aaaatgcaga aattgaaatt gccctgatat atgcataaat 8940
tagtgtcatc tccatcttgt cagttagag 8969
<210> 866
<211> 2166
<212> PRT
<213> Homo sapiens
<400> 866
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Ile Ser
2135 2140 2145
Glu Arg Gln Lys Lys Gly Asn Cys Ala Thr Leu Leu Ser Phe Trp
2150 2155 2160
Ile Ser Lys
2165
<210> 867
<211> 6156
<212> DNA
<213> Homo sapiens
<400> 867
actttccccc tacaggactc agatctggga ggcaattacc ttcggagaaa aacgaatagg 60
aaaaactgaa gtgttacttt ttttaaagct gctgaagttt gttggtttct cattgttttt 120
aagcctactg gagcaataaa gtttgaagaa cttttaccag gtttttttta tcgctgcctt 180
gatatacact tttcaaaatg ctttggtggg aagaagtaga ggactgttat gaaagagaag 240
atgttcaaaa gaaaacattc acaaaatggg taaatgcaca attttctaag tttgggaagc 300
agcatattga gaacctcttc agtgacctac aggatgggag gcgcctccta gacctcctcg 360
aaggcctgac agggcaaaaa ctgccaaaag aaaaaggatc cacaagagtt catgccctga 420
acaatgtcaa caaggcactg cgggttttgc agaacaataa tgttgattta gtgaatattg 480
gaagtactga catcgtagat ggaaatcata aactgactct tggtttgatt tggaatataa 540
tcctccactg gcaggtcaaa aatgtaatga aaaatatcat ggctggattg caacaaacca 600
acagtgaaaa gattctcctg agctgggtcc gacaatcaac tcgtaattat ccacaggtta 660
atgtaatcaa cttcaccacc agctggtctg atggcctggc tttgaatgct ctcatccata 720
gtcataggcc agacctattt gactggaata gtgtggtttg ccagcagtca gccacacaac 780
gactggaaca tgcattcaac atcgccagat atcaattagg catagagaaa ctactcgatc 840
ctgaagatgt tgataccacc tatccagata agaagtccat cttaatgtac atcacatcac 900
tcttccaagt tttgcctcaa caagtgagca ttgaagccat ccaggaagtg gaaatgttgc 960
caaggccacc taaagtgact aaagaagaac attttcagtt acatcatcaa atgcactatt 1020
ctcaacagat cacggtcagt ctagcacagg gatatgagag aacttcttcc cctaagcctc 1080
gattcaagag ctatgcctac acacaggctg cttatgtcac cacctctgac cctacacgga 1140
gcccatttcc ttcacagcat ttggaagctc ctgaagacaa gtcatttggc agttcattga 1200
tggagagtga agtaaacctg gaccgttatc aaacagcttt agaagaagta ttatcgtggc 1260
ttctttctgc tgaggacaca ttgcaagcac aaggagagat ttctaatgat gtggaagtgg 1320
tgaaagacca gtttcatact catgaggggt acatgatgga tttgacagcc catcagggcc 1380
gggttggtaa tattctacaa ttgggaagta agctgattgg aacaggaaaa ttatcagaag 1440
atgaagaaac tgaagtacaa gagcagatga atctcctaaa ttcaagatgg gaatgcctca 1500
gggtagctag catggaaaaa caaagcaatt tacatagagt tttaatggat ctccagaatc 1560
agaaactgaa agagttgaat gactggctaa caaaaacaga agaaagaaca aggaaaatgg 1620
aggaagagcc tcttggacct gatcttgaag acctaaaacg ccaagtacaa caacataagg 1680
tgcttcaaga agatctagaa caagaacaag tcagggtcaa ttctctcact cacatggtgg 1740
tggtagttga tgaatctagt ggagatcacg caactgctgc tttggaagaa caacttaagg 1800
tattgggaga tcgatgggca aacatctgta gatggacaga agaccgctgg gttcttttac 1860
aagacatcct tctcaaatgg caacgtctta ctgaagaaca gtgccttttt agtgcatggc 1920
tttcagaaaa agaagatgca gtgaacaaga ttcacacaac tggctttaaa gatcaaaatg 1980
aaatgttatc aagtcttcaa aaactggccg ttttaaaagc ggatctagaa aagaaaaagc 2040
aatccatggg caaactgtat tcactcaaac aagatcttct ttcaacactg aagaataagt 2100
cagtgaccca gaagacggaa gcatggctgg ataactttgc ccggtgttgg gataatttag 2160
tccaaaaact tgaaaagagt acagcacaga tttcacaggc tgtcaccacc actcagccat 2220
cactaacaca gacaactgta atggaaacag taactacggt gaccacaagg gaacagatcc 2280
tggtaaagca tgctcaagag gaacttccac caccacctcc ccaaaagaag aggcagatta 2340
ctgtggattc tgaaattagg aaaaggttgg atgttgatat aactgaactt cacagctgga 2400
ttactcgctc agaagctgtg ttgcagagtc ctgaatttgc aatctttcgg aaggaaggca 2460
acttctcaga cttaaaagaa aaagtcaatg ccatagagcg agaaaaagct gagaagttca 2520
gaaaactgca agatgccagc agatcagctc aggccctggt ggaacagatg gtgaatgagg 2580
gtgttaatgc agatagcatc aaacaagcct cagaacaact gaacagccgg tggatcgaat 2640
tctgccagtt gctaagtgag agacttaact ggctggagta tcagaacaac atcatcgctt 2700
tctataatca gctacaacaa ttggagcaga tgacaactac tgctgaaaac tggttgaaaa 2760
tccaacccac caccccatca gagccaacag caattaaaag tcagttaaaa atttgtaagg 2820
atgaagtcaa ccggctatca gatcttcaac ctcaaattga acgattaaaa attcaaagca 2880
tagccctgaa agagaaagga caaggaccca tgttcctgga tgcagacttt gtggccttta 2940
caaatcattt taagcaagtc ttttctgatg tgcaggccag agagaaagag ctacagacaa 3000
tttttgacac tttgccacca atgcgctatc aggagaccat gagtgccatc aggacatggg 3060
tccagcagtc agaaaccaaa ctctccatac ctcaacttag tgtcaccgac tatgaaatca 3120
tggagcagag actcggggaa ttgcaggctt tacaaagttc tctgcaagag caacaaagtg 3180
gcctatacta tctcagcacc actgtgaaag agatgtcgaa gaaagcgccc tctgaaatta 3240
gccggaaata tcaatcagaa tttgaagaaa ttgagggacg ctggaagaag ctctcctccc 3300
agctggttga gcattgtcaa aagctagagg agcaaatgaa taaactccga aaaattcaga 3360
atcacataca aaccctgaag aaatggatgg ctgaagttga tgtttttctg aaggaggaat 3420
ggcctgccct tggggattca gaaattctaa aaaagcagct gaaacagtgc agacttttag 3480
tcagtgatat tcagacaatt cagcccagtc taaacagtgt caatgaaggt gggcagaaga 3540
taaagaatga agcagagcca gagtttgctt cgagacttga gacagaactc aaagaactta 3600
acactcagtg ggatcacatg tgccaacagg tctatgccag aaaggaggcc ttgaagggag 3660
gtttggagaa aactgtaagc ctccagaaag atctatcaga gatgcacgaa tggatgacac 3720
aagctgaaga agagtatctt gagagagatt ttgaatataa aactccagat gaattacaga 3780
aagcagttga agagatgaag agagctaaag aagaggccca acaaaaagaa gcgaaagtga 3840
aactccttac tgagtctgta aatagtgtca tagctcaagc tccacctgta gcacaagagg 3900
ccttaaaaaa ggaacttgaa actctaacca ccaactacca gtggctctgc actaggctga 3960
atgggaaatg caagactttg gaagaagttt gggcatgttg gcatgagtta ttgtcatact 4020
tggagaaagc aaacaagtgg ctaaatgaag tagaatttaa acttaaaacc actgaaaaca 4080
ttcctggcgg agctgaggaa atctctgagg tgctagattc acttgaaaat ttgatgcgac 4140
attcagagga taacccaaat cagattcgca tattggcaca gaccctaaca gatggcggag 4200
tcatggatga gctaatcaat gaggaacttg agacatttaa ttctcgttgg agggaactac 4260
atgaagaggc tgtaaggagg caaaagttgc ttgaacagag catccagtct gcccaggaga 4320
ctgaaaaatc cttacactta atccaggagt ccctcacatt cattgacaag cagttggcag 4380
cttatattgc agacaaggtg gacgcagctc aaatgcctca ggaagcccag aaaatccaat 4440
ctgatttgac aagtcatgag atcagtttag aagaaatgaa gaaacataat caggggaagg 4500
aggctgccca aagagtcctg tctcagattg atgttgcaca gaaaaaatta caagatgtct 4560
ccatgaagtt tcgattattc cagaaaccag ccaattttga gcagcgtcta caagaaagta 4620
agatgatttt agatgaagtg aagatgcact tgcctgcatt ggaaacaaag agtgtggaac 4680
aggaagtagt acagtcacag ctaaatcatt gtgtgaactt gtataaaagt ctgagtgaag 4740
tgaagtctga agtggaaatg gtgataaaga ctggacgtca gattgtacag aaaaagcaga 4800
cggaaaatcc caaagaactt gatgaaagag taacagcttt gaaattgcat tataatgagc 4860
tgggagcaaa ggtaacagaa agaaagcaac agttggagaa atgcttgaaa ttgtcccgta 4920
agatgcgaaa ggaaatgaat gtcttgacag aatggctggc agctacagat atggaattga 4980
caaagagatc agcagttgaa ggaatgccta gtaatttgga ttctgaagtt gcctggggaa 5040
aggctactca aaaagagatt gagaaacaga aggtgcacct gaagagtatc acagaggtag 5100
gagaggcctt gaaaacagtt ttgggcaaga aggagacgtt ggtggaagat aaactcagtc 5160
ttctgaatag taactggata gctgtcacct cccgagcaga agagtggtta aatcttttgt 5220
tggaatacca gaaacacatg gaaacttttg accagaatgt ggaccacatc acaaagtgga 5280
tcattcaggc tgacacactt ttggatgaat cagagaaaaa gaaaccccag caaaaagaag 5340
acgtgcttaa gcgtttaaag gcagaactga atgacatacg cccaaaggtg gactctacac 5400
gtgaccaagc agcaaacttg atggcaaacc gcggtgacca ctgcaggaaa ttagtagagc 5460
cccaaatctc agagctcaac catcgatttg cagccatttc acacagaatt aagactggaa 5520
aggcctccat tcctttgaag gaattggagc agtttaactc agatatacaa aaattgcttg 5580
aaccactgga ggctgaaatt cagcaggggg tgaatctgaa agaggaagac ttcaataaag 5640
atatgaatga agacaatgag ggtactgtaa aagaattgtt gcaaagagga gacaacttac 5700
aacaaagaat cacagatgag agaaagcgag aggaaataaa gataaaacag cagctgttac 5760
agacaaaaca taatgctctc aaggatttga ggtctcaaag aagaaaaaag gctctagaaa 5820
tttctcatca gtggtatcag tacaagaggc aggctgatga tctcctgaaa tgcttggatg 5880
acattgaaaa aaaattagcc agcctacctg agcccagaga tgaaaggaaa ataaagatga 5940
actaatgact tatcggtata tggacgactt cttactcatg ttagcccatt catttcatca 6000
gagcatcttc acacatcagt gttcactctc tatagattta tttgcatatt gtctaaatat 6060
gtttttttct gttattattt tacacttttt attttgcttc attctctgtt gagttcctca 6120
aacctttaaa aaggaaataa ataacttatt cactta 6156
<210> 868
<211> 1915
<212> PRT
<213> Homo sapiens
<400> 868
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Asp Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Met Asn
1910 1915
<210> 869
<211> 2158
<212> PRT
<213> Mus musculus
<400> 869
Met Trp Trp Val Asp Cys Tyr Arg Asp Val Lys Lys Thr Thr Lys Trp
1 5 10 15
Asn Ala Ser Lys Gly Lys His Asp Asn Ser Asp Asp Gly Lys Arg Asp
20 25 30
Gly Thr Gly Lys Lys Lys Gly Ser Thr Arg Val His Ala Asn Asn Val
35 40 45
Asn Lys Ala Arg Val Lys Asn Asn Val Asp Val Asn Gly Ser Thr Asp
50 55 60
Val Asp Gly Asn His Lys Thr Gly Trp Asn His Trp Val Lys Asn Val
65 70 75 80
Met Lys Thr Met Ala Gly Thr Asn Ser Lys Ser Trp Val Arg Ser Thr
85 90 95
Arg Asn Tyr Val Asn Val Asn Thr Ser Ser Trp Ser Asp Gly Ala Asn
100 105 110
Ala His Ser His Arg Asp Asp Trp Asn Ser Val Val Ser His Ser Ala
115 120 125
Thr Arg His Ala Asn Ala Lys Cys Gly Lys Asp Asp Val Ala Thr Thr
130 135 140
Tyr Asp Lys Lys Ser Met Tyr Thr Ser Val Val Ser Ala Val Met Arg
145 150 155 160
Thr Ser Ser Lys Val Thr Arg His His His Met His Tyr Ser Thr Val
165 170 175
Ser Ala Gly Tyr Thr Ser Ser Ser Lys Arg Lys Ser Tyr Ala Thr Ala
180 185 190
Ala Tyr Val Ala Thr Ser Asp Ser Thr Ser Tyr Ser His Ala Arg Asp
195 200 205
Lys Ser Asp Ser Ser Met Thr Val Asn Asp Ser Tyr Thr Ala Val Ser
210 215 220
Trp Ser Ala Asp Thr Arg Ala Gly Ser Asn Asp Val Val Lys His Ala
225 230 235 240
His Gly Met Met Asp Thr Ser His Gly Val Gly Asn Val Gly Ser Val
245 250 255
Gly Lys Gly Lys Ser Asp Ala Val Met Asn Asn Ser Arg Trp Cys Arg
260 265 270
Val Ala Ser Met Lys Ser Lys His Lys Val Met Asp Asn Lys Lys Asp
275 280 285
Asp Trp Thr Lys Thr Arg Thr Lys Lys Met Gly Asp Asp Lys Cys Val
290 295 300
His Lys Val Asp Val Arg Val Asn Ser Thr His Met Val Val Val Val
305 310 315 320
Asp Ser Ser Gly Asp His Ala Thr Ala Ala Lys Val Gly Asp Arg Trp
325 330 335
Ala Asn Cys Arg Trp Thr Asp Arg Trp Val Asp Lys Trp His Thr Cys
340 345 350
Ser Thr Trp Ser Lys Asp Ala Met Lys Asn Thr Ser Gly Lys Asp Asn
355 360 365
Met Met Ser Ser His Lys Ser Thr Lys Asp Lys Lys Lys Thr Met Lys
370 375 380
Ser Ser Asn Asp Ser Ala Lys Asn Lys Ser Val Thr Lys Met Trp Met
385 390 395 400
Asn Ala Arg Trp Asp Asn Thr Lys Lys Ser Ser Ala Ser Ala Val Thr
405 410 415
Thr Thr Ser Thr Thr Thr Val Met Thr Val Thr Met Val Thr Thr Arg
420 425 430
Met Val Lys His Ala Lys Lys Arg Thr Val Asp Ser Arg Lys Arg Asp
435 440 445
Val Asp Thr His Ser Trp Thr Arg Ser Ala Val Ser Ser Ala Val Tyr
450 455 460
Arg Lys Gly Asn Ser Asp Lys Val Asn Ala Ala Arg Lys Ala Lys Arg
465 470 475 480
Lys Asp Ala Ser Arg Ser Ala Ala Val Met Ala Asn Gly Val Asn Ala
485 490 495
Ser Arg Ala Ser Asn Ser Arg Trp Thr Cys Ser Arg Val Asn Trp Tyr
500 505 510
Thr Asn Thr Tyr Asn Met Thr Thr Thr Ala Asn Lys Thr Ser Thr Thr
515 520 525
Ser Thr Ala Lys Ser Lys Cys Lys Asp Val Asn Arg Ser Ala Lys Ser
530 535 540
Lys Lys Gly Gly Met Asp Ala Asp Val Ala Thr Asn His Asn His Asp
545 550 555 560
Gly Val Arg Ala Lys Lys Thr Asp Thr Met Arg Tyr Thr Met Ser Ser
565 570 575
Arg Thr Trp Ser Ser Lys Ser Val Tyr Ser Val Thr Tyr Met Arg Gly
580 585 590
Lys Ala Ser Ser Lys Asn Gly Asn Tyr Ser Asp Thr Val Lys Met Ala
595 600 605
Lys Lys Ala Ser Cys Lys Tyr Ser Gly His Trp Lys Lys Ser Ser Val
610 615 620
Ser Cys Lys His Met Asn Lys Arg Lys Asn His Lys Thr Lys Trp Met
625 630 635 640
Ala Val Asp Val Lys Trp Ala Gly Asp Ala Lys Lys Lys Cys Arg Val
645 650 655
Gly Asp Thr Ser Asn Ser Val Asn Gly Gly Lys Lys Ser Ala Ala Ser
660 665 670
Arg Thr Arg Asn Thr Trp Asp His Cys Arg Val Tyr Thr Arg Lys Ala
675 680 685
Lys Ala Gly Asp Lys Thr Val Ser Lys Asp Ser Met His Trp Met Thr
690 695 700
Ala Tyr Arg Asp Tyr Lys Thr Asp Thr Ala Val Met Lys Arg Ala Lys
705 710 715 720
Ala Lys Thr Lys Val Lys Thr Thr Val Asn Ser Val Ala His Ala Ser
725 730 735
Ala Ala Lys Lys Thr Thr Thr Asn Tyr Trp Cys Thr Arg Asn Gly Lys
740 745 750
Cys Lys Thr Val Trp Ala Cys Trp His Ser Tyr Lys Ala Asn Lys Trp
755 760 765
Asn Val Lys Lys Thr Met Asn Val Ala Gly Thr Val Ser Asn Met His
770 775 780
His Ser Asn Asn Arg Ala Thr Thr Asp Gly Gly Val Met Asp Asn Thr
785 790 795 800
Asn Ser Arg Trp Arg His Ala Val Arg Lys Lys Ser Ser Ala Lys Ser
805 810 815
His Ser Asp Lys Ala Ala Tyr Thr Asp Lys Val Asp Ala Ala Met Ala
820 825 830
Lys Ser Asp Thr Ser His Ser Met Lys Lys His Asn Gly Lys Asp Ala
835 840 845
Asn Arg Val Ser Asp Val Ala Lys Lys Asp Val Ser Met Lys Arg Lys
850 855 860
Ala Asn Arg Ser Lys Met Asp Val Lys Met His Ala Thr Lys Ser Val
865 870 875 880
Val Ser Ser His Cys Val Asn Tyr Lys Ser Ser Val Lys Ser Val Met
885 890 895
Val Lys Thr Gly Arg Val Lys Lys Thr Asn Lys Asp Arg Val Thr Ala
900 905 910
Lys His Tyr Asn Gly Ala Lys Val Thr Arg Lys Lys Cys Lys Ser Arg
915 920 925
Lys Met Arg Lys Met Asn Val Thr Trp Ala Ala Thr Asp Thr Thr Lys
930 935 940
Arg Ser Ala Val Gly Met Ser Asn Asp Ser Val Ala Trp Gly Lys Ala
945 950 955 960
Thr Lys Lys Lys Ala His Lys Ser Val Thr Gly Ser Lys Met Val Gly
965 970 975
Lys Lys Thr Val Asp Lys Ser Asn Ser Asn Trp Ala Val Thr Ser Arg
980 985 990
Val Trp Asn Tyr Lys His Met Thr Asp Asn Thr Lys Trp His Ala Asp
995 1000 1005
Asp Ser Lys Lys Lys Lys Asp Lys Arg Lys Ala Met Asn Asp Met
1010 1015 1020
Arg Lys Val Asp Ser Thr Arg Asp Ala Ala Lys Met Ala Asn Arg
1025 1030 1035
Gly Asp His Cys Arg Lys Val Val Ser Asn Arg Arg Ala Ala Ser
1040 1045 1050
His Arg Lys Thr Gly Lys Ala Ser Lys Asn Ser Asp Lys Ala Gly
1055 1060 1065
Val Asn Lys Asp Asn Lys Asp Met Ser Asp Asn Gly Thr Val Asn
1070 1075 1080
Arg Gly Asp Asn Arg Thr Asp Arg Lys Arg Lys Lys Thr Lys His
1085 1090 1095
Asn Ala Lys Asp Arg Ser Arg Arg Lys Lys Ala Ser His Trp Tyr
1100 1105 1110
Tyr Lys Arg Ala Asp Asp Lys Cys Asp Lys Lys Ala Ser Arg Asp
1115 1120 1125
Arg Lys Lys Asp Arg Lys Lys Lys Asn Ala Val Arg Arg Ala Gly
1130 1135 1140
Ser Asn Gly Ala Ala Met Ala Val Thr Ser Lys Arg Trp Arg Ser
1145 1150 1155
Asn Ala Arg Arg Asn Ala His Thr His Thr Met Val Val Thr Thr
1160 1165 1170
Asp Met Asp Val Ser Tyr Val Ser Thr Tyr Thr Ser His Ala Ser
1175 1180 1185
Val Asp His Asn Thr Cys Ala Lys Asp Asp Lys Ser Lys Asn Lys
1190 1195 1200
Asp Asn Ser Gly Arg Asp His Lys Lys Lys Thr Ala Ala Ser Ala
1205 1210 1215
Thr Ser Met Lys Val Lys Val Ala Val Ala Met Asp Gly Lys His
1220 1225 1230
Arg Met Tyr Lys Arg Gly Arg Asp Arg Ser Val Lys Trp Arg His
1235 1240 1245
His Tyr Asp Met Lys Val Asn Trp Asn Val Lys Lys Thr Asn Asn
1250 1255 1260
Trp His Ala Lys Tyr Lys Trp Tyr Lys Asp Gly Gly Arg Ala Val
1265 1270 1275
Val Arg Thr Asn Ala Thr Gly Ser Ser Lys Thr Asp Val Asn Lys
1280 1285 1290
Gly Ser Ser Arg Trp His Asp Cys Lys Ala Arg Arg Lys Arg Lys
1295 1300 1305
Asn Val Ser Arg Asp Asn Val Trp Ala Asp Asn Ala Thr Gly Asp
1310 1315 1320
Lys Val Lys Ala Arg Gly Lys Asn Thr Gly Gly Ala Val Val Ser
1325 1330 1335
Ala Arg Asp Lys Lys Lys Lys Thr Asn Trp Lys Val Ser Arg Ala
1340 1345 1350
Lys Gly Val His Lys Asp Arg Asp His Trp Ser Arg Asn Tyr Asn
1355 1360 1365
Ser Ala Gly Asp Lys Val Thr Val His Gly Lys Ala Asp Val Arg
1370 1375 1380
Ser Lys Gly His Tyr Lys Lys Ser Thr Val Lys Arg Lys Asp Arg
1385 1390 1395
Ser Trp Ala Val Asn His Arg Arg Thr Lys Asp Arg Ala Gly Ser
1400 1405 1410
Thr Thr Gly Ala Ser Ala Ser Thr Val Thr Val Thr Ser Val Val
1415 1420 1425
Thr Lys Thr Val Ser Lys Met Ser Ser Val Ala Ala Asp Asn Arg
1430 1435 1440
Ala Trp Thr Thr Asp Trp Ser Asp Arg Val Lys Ser Arg Val Met
1445 1450 1455
Val Gly Asp Asp Asn Met Lys Lys Ala Thr Asp Arg Arg Thr Ala
1460 1465 1470
Ala Asn Lys Asn Lys Thr Ser Asn Ala Arg Thr Thr Asp Arg Arg
1475 1480 1485
Trp Asp Val Asn Arg Arg Asn Met Lys Asp Ser Thr Trp Ala Lys
1490 1495 1500
Ala Val Gly Val Arg Gly Lys Asp Ser Trp Lys Gly His Thr Val
1505 1510 1515
Asp Ala Lys Lys Thr Thr Lys Ala Lys Asp Arg Arg Ser Val Asp
1520 1525 1530
Val Ala Asn Asp Ala Lys Arg Asp Tyr Ser Ala Asp Asp Thr Arg
1535 1540 1545
Lys Val His Met Thr Asn Asn Thr Ser Trp Gly Asn His Lys Arg
1550 1555 1560
Val Ser Ala Ala Thr His Arg Asp Lys Ser Trp Thr Ala Thr Thr
1565 1570 1575
Ala Asn Val Asp Ala Ser Arg Lys Lys Asp Ser Arg Gly Val Arg
1580 1585 1590
Met Lys Trp Asp Gly Thr His Thr Asp Tyr His Asn Asp Asn Gly
1595 1600 1605
Lys Arg Ser Gly Ser Asp Ala Arg Arg Asp Asn Met Asn Lys Trp
1610 1615 1620
Ser Lys Lys Ser Asn Arg Ser His Ala Ser Ser Asp Trp Lys Arg
1625 1630 1635
His Ser Val Trp Lys Asp Asp Ser Arg Ala Gly Gly Asp Ala Val
1640 1645 1650
Lys Asn Asp His Arg Ala Lys Arg Lys Thr Lys Val Met Ser Thr
1655 1660 1665
Thr Val Arg Thr Gly Lys Tyr Arg Arg Ala Asn Val Thr Arg Arg
1670 1675 1680
Lys Ala Val Asn Ala Trp Asp Lys Asn Arg Ser Ala Asp Trp Arg
1685 1690 1695
Lys Asp Ala Arg Ala Ala Asp Asp Lys Arg Ala Val Lys Gly Ser
1700 1705 1710
Trp Val Gly Asp Asp Ser Asp His Lys Val Lys Ala Arg Gly Ala
1715 1720 1725
Lys Asn Val Asn Arg Val Asn Asp Ala His Thr Thr Gly Ser Tyr
1730 1735 1740
Asn Ser Thr Asp Asn Thr Arg Trp Arg Val Ala Val Asp Arg Val
1745 1750 1755
Arg His Ala His Arg Asp Gly Ala Ser His Ser Thr Ser Val Gly
1760 1765 1770
Trp Arg Ala Ser Asn Lys Val Tyr Tyr Asn His Thr Thr Thr Cys
1775 1780 1785
Trp Asp His Lys Met Thr Tyr Ser Ala Asp Asn Asn Val Arg Ser
1790 1795 1800
Ala Tyr Arg Thr Ala Met Lys Arg Arg Lys Ala Cys Asp Ser Ser
1805 1810 1815
Ala Ala Cys Asp Ala Asp His Asn Lys Asn Asp Met Asp Asn Cys
1820 1825 1830
Thr Thr Tyr Asp Arg His Asn Asn Val Asn Val Cys Val Asp Met
1835 1840 1845
Cys Asn Trp Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Arg Val
1850 1855 1860
Ser Lys Thr Gly Ser Cys Lys Ala His Asp Lys Tyr Arg Tyr Lys
1865 1870 1875
Val Ala Ser Ser Thr Gly Cys Asp Arg Arg Gly His Asp Ser Arg
1880 1885 1890
Gly Val Ala Ser Gly Gly Ser Asn Ser Val Arg Ser Cys Ala Asn
1895 1900 1905
Asn Lys Ala Ala Asp Trp Met Arg Ser Met Val Trp Val His Arg
1910 1915 1920
Val Ala Ala Ala Thr Ala Lys His Ala Lys Cys Asn Cys Lys Cys
1925 1930 1935
Gly Arg Tyr Arg Ser Lys His Asn Tyr Asp Cys Ser Cys Ser Gly
1940 1945 1950
Arg Val Ala Lys Gly His Lys Met His Tyr Met Val Tyr Cys Thr
1955 1960 1965
Thr Thr Ser Gly Asp Val Arg Asp Ala Lys Val Lys Asn Lys Arg
1970 1975 1980
Thr Lys Arg Tyr Ala Lys His Arg Met Gly Tyr Val Thr Val Gly
1985 1990 1995
Asp Asn Met Thr Val Thr Asn Trp Val Asp Ser Ala Ala Ser Ser
2000 2005 2010
Ser His Asp Asp Thr His Ser Arg His Tyr Ala Ser Arg Ala Met
2015 2020 2025
Asn Ser Asn Gly Ser Tyr Asn Asp Ser Ser Asn Ser Asp Asp His
2030 2035 2040
His Tyr Cys Ser Asn Asp Ser Ser Arg Ser Ala Ser Ser Arg Gly
2045 2050 2055
Arg Ala Asp Asn Arg Asn Ala Tyr Asp Arg Lys His His Lys Gly
2060 2065 2070
Ser Ser Met Met Thr Ser Ser Arg Asp Ala Ala Ala Lys Arg His
2075 2080 2085
Lys Gly Arg Ala Arg Met Asp His Asn Lys Ser His Arg Arg Ala
2090 2095 2100
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Ser Thr Ser Arg Ser
2105 2110 2115
Asp Ser Ser Met Arg Val Val Gly Ser Thr Ser Ser Met Gly Asp
2120 2125 2130
Ser Asp Thr Ser Thr Gly Val Met Asn Asn Ser Ser Ser Arg Gly
2135 2140 2145
Arg Asn Ala Gly Lys Met Arg Asp Thr Met
2150 2155
<210> 870
<211> 1307
<212> PRT
<213> Acidaminococcus sp.
<400> 870
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 871
<211> 1228
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium ND2006"
<400> 871
Ala Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys
1 5 10 15
Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile
20 25 30
Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr
35 40 45
Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn
50 55 60
Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser
65 70 75 80
Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu
85 90 95
Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly
100 105 110
Ala Ala Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile
115 120 125
Leu Pro Glu Ala Ala Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser
130 135 140
Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu
145 150 155 160
Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys
165 170 175
Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu
180 185 190
Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu
195 200 205
Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu
210 215 220
Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala
225 230 235 240
Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu
245 250 255
Asn Glu Tyr Ile Asn Leu Tyr Asn Ala Lys Thr Lys Gln Ala Leu Pro
260 265 270
Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu
275 280 285
Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val
290 295 300
Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys
305 310 315 320
Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly
325 330 335
Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile
340 345 350
Phe Gly Glu Trp Asn Leu Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp
355 360 365
Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp
370 375 380
Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln
385 390 395 400
Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys
405 410 415
Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser
420 425 430
Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys
435 440 445
Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val
450 455 460
Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu
465 470 475 480
Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp
485 490 495
Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val
500 505 510
Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn
515 520 525
Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg
530 535 540
Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp
545 550 555 560
Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn
565 570 575
Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys
580 585 590
Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn
595 600 605
Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys
610 615 620
Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe
625 630 635 640
Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe
645 650 655
Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg
660 665 670
Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys
675 680 685
Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln
690 695 700
Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu
705 710 715 720
His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln
725 730 735
Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu
740 745 750
Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn
755 760 765
Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val
770 775 780
Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro
785 790 795 800
Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu
805 810 815
Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile
820 825 830
Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys
835 840 845
Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe
850 855 860
Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys
865 870 875 880
Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn
885 890 895
Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile
900 905 910
Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu
915 920 925
Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr
930 935 940
Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp
945 950 955 960
Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln
965 970 975
Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly
980 985 990
Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser
995 1000 1005
Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala
1010 1015 1020
Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val
1025 1030 1035
Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe
1040 1045 1050
Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser
1055 1060 1065
Tyr Gly Asn Arg Ile Arg Ile Phe Ala Ala Ala Lys Lys Asn Asn
1070 1075 1080
Val Phe Ala Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu
1085 1090 1095
Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg
1100 1105 1110
Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe
1115 1120 1125
Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr
1130 1135 1140
Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser
1145 1150 1155
Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn
1160 1165 1170
Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile
1175 1180 1185
Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu
1190 1195 1200
Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu
1205 1210 1215
Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys
1220 1225
<210> 872
<211> 4101
<212> DNA
<213> Staphylococcus pyogenes
<400> 872
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggcaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggcga c 4101
<210> 873
<211> 1053
<212> PRT
<213> Staphylococcus aureus
<400> 873
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 874
<211> 450
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown: CK8 promoter
polynucleotide"
<400> 874
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgcat gccatgttcc cggcgaaggg ccagctgtcc cccgccagct agactcagca 180
cttagtttag gaaccagtga gcaagtcagc ccttggggca gcccatacaa ggccatgggg 240
ctgggcaagc tgcacgcctg ggtccggggt gggcacggtg cccgggcaac gagctgaaag 300
ctcatctgct ctcaggggcc cctccctggg gacagcccct cctggctagt cacaccctgt 360
aggctcctct atataaccca ggggcacagg ggctgccctc attctaccac cacctccaca 420
gcacagacag acactcagga gccagccagc 450
<210> 875
<211> 436
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown: CK8e promoter
polynucleotide"
<400> 875
tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata attaacccag 60
acatgtggct gccccccccc ccccaacacc tgctgcctct aaaaataacc ctgcatgcca 120
tgttcccggc gaagggccag ctgtcccccg ccagctagac tcagcactta gtttaggaac 180
cagtgagcaa gtcagccctt ggggcagccc atacaaggcc atggggctgg gcaagctgca 240
cgcctgggtc cggggtgggc acggtgcccg ggcaacgagc tgaaagctca tctgctctca 300
ggggcccctc cctggggaca gcccctcctg gctagtcaca ccctgtaggc tcctctatat 360
aacccagggg cacaggggct gccctcattc taccaccacc tccacagcac agacagacac 420
tcaggagcca gccagc 436
<210> 876
<211> 18
<212> PRT
<213> Thosea asigna
<400> 876
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 877
<211> 20
<212> PRT
<213> Equine rhinitis A virus
<400> 877
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 878
<211> 19
<212> PRT
<213> Porcine teschovirus-1
<400> 878
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 879
<211> 23
<212> PRT
<213> Foot and mouth disease virus
<400> 879
Pro Val Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 880
<211> 115
<212> DNA
<213> Adeno associated virus
<400> 880
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 60
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag aggga 115
<210> 881
<211> 141
<212> DNA
<213> Adeno associated virus
<400> 881
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc t 141
<210> 882
<211> 141
<212> DNA
<213> Adeno associated virus
<400> 882
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag g 141
<210> 883
<211> 141
<212> DNA
<213> Adeno associated virus
<400> 883
ccactccctc tatgcgcgct cgctcactca ctcggccctg gagaccaaag gtctccagac 60
tgccggcctc tggccggcag ggccgagtga gtgagcgagc gcgcatagag ggagtgggta 120
cctccatcat ctaggtttgc c 141
<210> 884
<211> 9
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
C-myc NLS sequence"
<400> 884
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 885
<211> 51
<212> DNA
<213> Simian virus 40
<400> 885
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc c 51
<210> 886
<211> 42
<212> PRT
<213> Homo sapiens
<400> 886
Gly Asn Tyr Asn Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly
1 5 10 15
Asn Phe Gly Gly Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr
20 25 30
Phe Ala Lys Pro Arg Asn Gln Gly Gly Tyr
35 40
<210> 887
<211> 48
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Nucleoplasmin NLS sequence"
<400> 887
aagcgtcctg ctgctactaa gaaagctggt caagctaaga aaaagaaa 48
<210> 888
<211> 41
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
IBB domain from importin alphasequence"
<400> 888
Arg Met Arg Lys Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu Arg
1 5 10 15
Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys Asp
20 25 30
Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 889
<211> 8
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Myoma T protein sequence"
<400> 889
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 890
<211> 8
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Myoma T protein sequence"
<400> 890
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 891
<211> 8
<212> PRT
<213> Homo sapiens
<400> 891
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 892
<211> 12
<212> PRT
<213> Mus musculus
<400> 892
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 893
<211> 5
<212> PRT
<213> Influenza virus
<400> 893
Asp Arg Leu Arg Arg
1 5
<210> 894
<211> 7
<212> PRT
<213> Influenza virus
<400> 894
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 895
<211> 10
<212> PRT
<213> Hepatitis delta virus
<400> 895
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 896
<211> 10
<212> PRT
<213> Mus musculus
<400> 896
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 897
<211> 20
<212> PRT
<213> Homo sapiens
<400> 897
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 898
<211> 17
<212> PRT
<213> Homo sapiens
<400> 898
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 899
<211> 5133
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 899
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 60
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc 120
caactccatc actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac 180
gtagccatgc tctagattaa ttaatgccca tgtaaggagg caaggcctgg ggacacccga 240
gatgcctggt tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc 300
ctctaaaaat aaccctgcat gccatgttcc cggcgaaggg ccagctgtcc cccgccagct 360
agactcagca cttagtttag gaaccagtga gcaagtcagc ccttggggca gcccatacaa 420
ggccatgggg ctgggcaagc tgcacgcctg ggtccggggt gggcacggtg cccgggcaac 480
gagctgaaag ctcatctgct ctcaggggcc cctccctggg gacagcccct cctggctagt 540
cacaccctgt aggctcctct atataaccca ggggcacagg ggctgccctc attctaccac 600
cacctccaca gcacagacag acactcagga gccagccagc gctagcgcca ccatgatggc 660
cccaaagaag aagcggaagg tcggtatcca cggagtccca gcagccgaca agaagtacag 720
catcggcctg gacatcggca ccaactctgt gggctgggcc gtgatcaccg acgagtacaa 780
ggtgcccagc aagaaattca aggtgctggg caacaccgac cggcacagca tcaagaagaa 840
cctgatcgga gccctgctgt tcgacagcgg cgaaacagcc gaggccaccc ggctgaagag 900
aaccgccaga agaagataca ccagacggaa gaaccggatc tgctatctgc aagagatctt 960
cagcaacgag atggccaagg tggacgacag cttcttccac agactggaag agtccttcct 1020
ggtggaagag gataagaagc acgagcggca ccccatcttc ggcaacatcg tggacgaggt 1080
ggcctaccac gagaagtacc ccaccatcta ccacctgaga aagaaactgg tggacagcac 1140
cgacaaggcc gacctgcggc tgatctatct ggccctggcc cacatgatca agttccgggg 1200
ccacttcctg atcgagggcg acctgaaccc cgacaacagc gacgtggaca agctgttcat 1260
ccagctggtg cagacctaca accagctgtt cgaggaaaac cccatcaacg ccagcggcgt 1320
ggacgccaag gccatcctgt ctgccagact gagcaagagc agacggctgg aaaatctgat 1380
cgcccagctg cccggcgaga agaagaatgg cctgttcggc aacctgattg ccctgagcct 1440
gggcctgacc cccaacttca agagcaactt cgacctggcc gaggatgcca aactgcagct 1500
gagcaaggac acctacgacg acgacctgga caacctgctg gcccagatcg gcgaccagta 1560
cgccgacctg tttctggccg ccaagaacct gtccgacgcc atcctgctga gcgacatcct 1620
gagagtgaac accgagatca ccaaggcccc cctgagcgcc tctatgatca agagatacga 1680
cgagcaccac caggacctga ccctgctgaa agctctcgtg cggcagcagc tgcctgagaa 1740
gtacaaagag attttcttcg accagagcaa gaacggctac gccggctaca ttgacggcgg 1800
agccagccag gaagagttct acaagttcat caagcccatc ctggaaaaga tggacggcac 1860
cgaggaactg ctcgtgaagc tgaacagaga ggacctgctg cggaagcagc ggaccttcga 1920
caacggcagc atcccccacc agatccacct gggagagctg cacgccattc tgcggcggca 1980
ggaagatttt tacccattcc tgaaggacaa ccgggaaaag atcgagaaga tcctgacctt 2040
ccgcatcccc tactacgtgg gccctctggc caggggaaac agcagattcg cctggatgac 2100
cagaaagagc gaggaaacca tcaccccctg gaacttcgag gaagtggtgg acaagggcgc 2160
ttccgcccag agcttcatcg agcggatgac caacttcgat aagaacctgc ccaacgagaa 2220
ggtgctgccc aagcacagcc tgctgtacga gtacttcacc gtgtataacg agctgaccaa 2280
agtgaaatac gtgaccgagg gaatgagaaa gcccgccttc ctgagcggcg agcagaaaaa 2340
ggccatcgtg gacctgctgt tcaagaccaa ccggaaagtg accgtgaagc agctgaaaga 2400
ggactacttc aagaaaatcg agtgcttcga ctccgtggaa atctccggcg tggaagatcg 2460
gttcaacgcc tccctgggca cataccacga tctgctgaaa attatcaagg acaaggactt 2520
cctggacaat gaggaaaacg aggacattct ggaagatatc gtgctgaccc tgacactgtt 2580
tgaggacaga gagatgatcg aggaacggct gaaaacctat gcccacctgt tcgacgacaa 2640
agtgatgaag cagctgaagc ggcggagata caccggctgg ggcaggctga gccggaagct 2700
gatcaacggc atccgggaca agcagtccgg caagacaatc ctggatttcc tgaagtccga 2760
cggcttcgcc aacagaaact tcatgcagct gatccacgac gacagcctga cctttaaaga 2820
ggacatccag aaagcccagg tgtccggcca gggcgatagc ctgcacgagc acattgccaa 2880
tctggccggc agccccgcca ttaagaaggg catcctgcag acagtgaagg tggtggacga 2940
gctcgtgaaa gtgatgggcc ggcacaagcc cgagaacatc gtgatcgaaa tggccagaga 3000
gaaccagacc acccagaagg gacagaagaa cagccgcgag agaatgaagc ggatcgaaga 3060
gggcatcaaa gagctgggca gccagatcct gaaagaacac cccgtggaaa acacccagct 3120
gcagaacgag aagctgtacc tgtactacct gcagaatggg cgggatatgt acgtggacca 3180
ggaactggac atcaaccggc tgtccgacta cgatgtggac catatcgtgc ctcagagctt 3240
tctgaaggac gactccatcg acaacaaggt gctgaccaga agcgacaaga accggggcaa 3300
gagcgacaac gtgccctccg aagaggtcgt gaagaagatg aagaactact ggcggcagct 3360
gctgaacgcc aagctgatta cccagagaaa gttcgacaat ctgaccaagg ccgagagagg 3420
cggcctgagc gaactggata aggccggctt catcaagaga cagctggtgg aaacccggca 3480
gatcacaaag cacgtggcac agatcctgga ctcccggatg aacactaagt acgacgagaa 3540
tgacaagctg atccgggaag tgaaagtgat caccctgaag tccaagctgg tgtccgattt 3600
ccggaaggat ttccagtttt acaaagtgcg cgagatcaac aactaccacc acgcccacga 3660
cgcctacctg aacgccgtcg tgggaaccgc cctgatcaaa aagtacccta agctggaaag 3720
cgagttcgtg tacggcgact acaaggtgta cgacgtgcgg aagatgatcg ccaagagcga 3780
gcaggaaatc ggcaaggcta ccgccaagta cttcttctac agcaacatca tgaacttttt 3840
caagaccgag attaccctgg ccaacggcga gatccggaag cggcctctga tcgagacaaa 3900
cggcgaaacc ggggagatcg tgtgggataa gggccgggat tttgccaccg tgcggaaagt 3960
gctgagcatg ccccaagtga atatcgtgaa aaagaccgag gtgcagacag gcggcttcag 4020
caaagagtct atcctgccca agaggaacag cgataagctg atcgccagaa agaaggactg 4080
ggaccctaag aagtacggcg gcttcgacag ccccaccgtg gcctattctg tgctggtggt 4140
ggccaaagtg gaaaagggca agtccaagaa actgaagagt gtgaaagagc tgctggggat 4200
caccatcatg gaaagaagca gcttcgagaa gaatcccatc gactttctgg aagccaaggg 4260
ctacaaagaa gtgaaaaagg acctgatcat caagctgcct aagtactccc tgttcgagct 4320
ggaaaacggc cggaagagaa tgctggcctc tgccggcgaa ctgcagaagg gaaacgaact 4380
ggccctgccc tccaaatatg tgaacttcct gtacctggcc agccactatg agaagctgaa 4440
gggctccccc gaggataatg agcagaaaca gctgtttgtg gaacagcaca agcactacct 4500
ggacgagatc atcgagcaga tcagcgagtt ctccaagaga gtgatcctgg ccgacgctaa 4560
tctggacaaa gtgctgtccg cctacaacaa gcaccgggat aagcccatca gagagcaggc 4620
cgagaatatc atccacctgt ttaccctgac caatctggga gcccctgccg ccttcaagta 4680
ctttgacacc accatcgacc ggaagaggta caccagcacc aaagaggtgc tggacgccac 4740
cctgatccac cagagcatca ccggcctgta cgagacacgg atcgacctgt ctcagctggg 4800
aggcgacaag cgtcctgctg ctactaagaa agctggtcaa gctaagaaaa agaaatgaat 4860
cgattagcaa taaaggatcg tttattttca ttggaagcgt gtgttggttt tttgatcagg 4920
cgcgggtacc aggtcgcggc cgctctagag catggctacg tagataagta gcatggcggg 4980
ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 5040
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 5100
gcctcagtga gcgagcgagc gcgcagagag gga 5133
<210> 900
<211> 5185
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 900
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgtggccaac tccatcacta ggggttcctt gtagttaatg 180
attaacccgc catgctactt atctacgtag ccatgctcta gattaattaa tgcccatgta 240
aggaggcaag gcctggggac acccgagatg cctggttata attaacccag acatgtggct 300
gccccccccc ccccaacacc tgctgcctct aaaaataacc ctgcatgcca tgttcccggc 360
gaagggccag ctgtcccccg ccagctagac tcagcactta gtttaggaac cagtgagcaa 420
gtcagccctt ggggcagccc atacaaggcc atggggctgg gcaagctgca cgcctgggtc 480
cggggtgggc acggtgcccg ggcaacgagc tgaaagctca tctgctctca ggggcccctc 540
cctggggaca gcccctcctg gctagtcaca ccctgtaggc tcctctatat aacccagggg 600
cacaggggct gccctcattc taccaccacc tccacagcac agacagacac tcaggagcca 660
gccagcgcta gcgccaccat gatggcccca aagaagaagc ggaaggtcgg tatccacgga 720
gtcccagcag ccgacaagaa gtacagcatc ggcctggaca tcggcaccaa ctctgtgggc 780
tgggccgtga tcaccgacga gtacaaggtg cccagcaaga aattcaaggt gctgggcaac 840
accgaccggc acagcatcaa gaagaacctg atcggagccc tgctgttcga cagcggcgaa 900
acagccgagg ccacccggct gaagagaacc gccagaagaa gatacaccag acggaagaac 960
cggatctgct atctgcaaga gatcttcagc aacgagatgg ccaaggtgga cgacagcttc 1020
ttccacagac tggaagagtc cttcctggtg gaagaggata agaagcacga gcggcacccc 1080
atcttcggca acatcgtgga cgaggtggcc taccacgaga agtaccccac catctaccac 1140
ctgagaaaga aactggtgga cagcaccgac aaggccgacc tgcggctgat ctatctggcc 1200
ctggcccaca tgatcaagtt ccggggccac ttcctgatcg agggcgacct gaaccccgac 1260
aacagcgacg tggacaagct gttcatccag ctggtgcaga cctacaacca gctgttcgag 1320
gaaaacccca tcaacgccag cggcgtggac gccaaggcca tcctgtctgc cagactgagc 1380
aagagcagac ggctggaaaa tctgatcgcc cagctgcccg gcgagaagaa gaatggcctg 1440
ttcggcaacc tgattgccct gagcctgggc ctgaccccca acttcaagag caacttcgac 1500
ctggccgagg atgccaaact gcagctgagc aaggacacct acgacgacga cctggacaac 1560
ctgctggccc agatcggcga ccagtacgcc gacctgtttc tggccgccaa gaacctgtcc 1620
gacgccatcc tgctgagcga catcctgaga gtgaacaccg agatcaccaa ggcccccctg 1680
agcgcctcta tgatcaagag atacgacgag caccaccagg acctgaccct gctgaaagct 1740
ctcgtgcggc agcagctgcc tgagaagtac aaagagattt tcttcgacca gagcaagaac 1800
ggctacgccg gctacattga cggcggagcc agccaggaag agttctacaa gttcatcaag 1860
cccatcctgg aaaagatgga cggcaccgag gaactgctcg tgaagctgaa cagagaggac 1920
ctgctgcgga agcagcggac cttcgacaac ggcagcatcc cccaccagat ccacctggga 1980
gagctgcacg ccattctgcg gcggcaggaa gatttttacc cattcctgaa ggacaaccgg 2040
gaaaagatcg agaagatcct gaccttccgc atcccctact acgtgggccc tctggccagg 2100
ggaaacagca gattcgcctg gatgaccaga aagagcgagg aaaccatcac cccctggaac 2160
ttcgaggaag tggtggacaa gggcgcttcc gcccagagct tcatcgagcg gatgaccaac 2220
ttcgataaga acctgcccaa cgagaaggtg ctgcccaagc acagcctgct gtacgagtac 2280
ttcaccgtgt ataacgagct gaccaaagtg aaatacgtga ccgagggaat gagaaagccc 2340
gccttcctga gcggcgagca gaaaaaggcc atcgtggacc tgctgttcaa gaccaaccgg 2400
aaagtgaccg tgaagcagct gaaagaggac tacttcaaga aaatcgagtg cttcgactcc 2460
gtggaaatct ccggcgtgga agatcggttc aacgcctccc tgggcacata ccacgatctg 2520
ctgaaaatta tcaaggacaa ggacttcctg gacaatgagg aaaacgagga cattctggaa 2580
gatatcgtgc tgaccctgac actgtttgag gacagagaga tgatcgagga acggctgaaa 2640
acctatgccc acctgttcga cgacaaagtg atgaagcagc tgaagcggcg gagatacacc 2700
ggctggggca ggctgagccg gaagctgatc aacggcatcc gggacaagca gtccggcaag 2760
acaatcctgg atttcctgaa gtccgacggc ttcgccaaca gaaacttcat gcagctgatc 2820
cacgacgaca gcctgacctt taaagaggac atccagaaag cccaggtgtc cggccagggc 2880
gatagcctgc acgagcacat tgccaatctg gccggcagcc ccgccattaa gaagggcatc 2940
ctgcagacag tgaaggtggt ggacgagctc gtgaaagtga tgggccggca caagcccgag 3000
aacatcgtga tcgaaatggc cagagagaac cagaccaccc agaagggaca gaagaacagc 3060
cgcgagagaa tgaagcggat cgaagagggc atcaaagagc tgggcagcca gatcctgaaa 3120
gaacaccccg tggaaaacac ccagctgcag aacgagaagc tgtacctgta ctacctgcag 3180
aatgggcggg atatgtacgt ggaccaggaa ctggacatca accggctgtc cgactacgat 3240
gtggaccata tcgtgcctca gagctttctg aaggacgact ccatcgacaa caaggtgctg 3300
accagaagcg acaagaaccg gggcaagagc gacaacgtgc cctccgaaga ggtcgtgaag 3360
aagatgaaga actactggcg gcagctgctg aacgccaagc tgattaccca gagaaagttc 3420
gacaatctga ccaaggccga gagaggcggc ctgagcgaac tggataaggc cggcttcatc 3480
aagagacagc tggtggaaac ccggcagatc acaaagcacg tggcacagat cctggactcc 3540
cggatgaaca ctaagtacga cgagaatgac aagctgatcc gggaagtgaa agtgatcacc 3600
ctgaagtcca agctggtgtc cgatttccgg aaggatttcc agttttacaa agtgcgcgag 3660
atcaacaact accaccacgc ccacgacgcc tacctgaacg ccgtcgtggg aaccgccctg 3720
atcaaaaagt accctaagct ggaaagcgag ttcgtgtacg gcgactacaa ggtgtacgac 3780
gtgcggaaga tgatcgccaa gagcgagcag gaaatcggca aggctaccgc caagtacttc 3840
ttctacagca acatcatgaa ctttttcaag accgagatta ccctggccaa cggcgagatc 3900
cggaagcggc ctctgatcga gacaaacggc gaaaccgggg agatcgtgtg ggataagggc 3960
cgggattttg ccaccgtgcg gaaagtgctg agcatgcccc aagtgaatat cgtgaaaaag 4020
accgaggtgc agacaggcgg cttcagcaaa gagtctatcc tgcccaagag gaacagcgat 4080
aagctgatcg ccagaaagaa ggactgggac cctaagaagt acggcggctt cgacagcccc 4140
accgtggcct attctgtgct ggtggtggcc aaagtggaaa agggcaagtc caagaaactg 4200
aagagtgtga aagagctgct ggggatcacc atcatggaaa gaagcagctt cgagaagaat 4260
cccatcgact ttctggaagc caagggctac aaagaagtga aaaaggacct gatcatcaag 4320
ctgcctaagt actccctgtt cgagctggaa aacggccgga agagaatgct ggcctctgcc 4380
ggcgaactgc agaagggaaa cgaactggcc ctgccctcca aatatgtgaa cttcctgtac 4440
ctggccagcc actatgagaa gctgaagggc tcccccgagg ataatgagca gaaacagctg 4500
tttgtggaac agcacaagca ctacctggac gagatcatcg agcagatcag cgagttctcc 4560
aagagagtga tcctggccga cgctaatctg gacaaagtgc tgtccgccta caacaagcac 4620
cgggataagc ccatcagaga gcaggccgag aatatcatcc acctgtttac cctgaccaat 4680
ctgggagccc ctgccgcctt caagtacttt gacaccacca tcgaccggaa gaggtacacc 4740
agcaccaaag aggtgctgga cgccaccctg atccaccaga gcatcaccgg cctgtacgag 4800
acacggatcg acctgtctca gctgggaggc gacaagcgtc ctgctgctac taagaaagct 4860
ggtcaagcta agaaaaagaa atgaatcgat tagcaataaa ggatcgttta ttttcattgg 4920
aagcgtgtgt tggttttttg atcaggcgcg ggtaccaggt cgcggccgct ctagagcatg 4980
gctacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 5040
agttaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 5100
gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 5160
gagcgagcgc gcagctgcct gcagg 5185
<210> 901
<211> 6909
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 901
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gacctgcagg cagctgcgcg ctcgctcgct 360
cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt 420
gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cctgtggcca 480
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacgt 540
agccatgctc tagattaatt aatgcccatg taaggaggca aggcctgggg acacccgaga 600
tgcctggtta taattaaccc agacatgtgg ctgccccccc ccccccaaca cctgctgcct 660
ctaaaaataa ccctgcatgc catgttcccg gcgaagggcc agctgtcccc cgccagctag 720
actcagcact tagtttagga accagtgagc aagtcagccc ttggggcagc ccatacaagg 780
ccatggggct gggcaagctg cacgcctggg tccggggtgg gcacggtgcc cgggcaacga 840
gctgaaagct catctgctct caggggcccc tccctgggga cagcccctcc tggctagtca 900
caccctgtag gctcctctat ataacccagg ggcacagggg ctgccctcat tctaccacca 960
cctccacagc acagacagac actcaggagc cagccagcgc tagcgccacc atgatggccc 1020
caaagaagaa gcggaaggtc ggtatccacg gagtcccagc agccgacaag aagtacagca 1080
tcggcctgga catcggcacc aactctgtgg gctgggccgt gatcaccgac gagtacaagg 1140
tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc aagaagaacc 1200
tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg ctgaagagaa 1260
ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa gagatcttca 1320
gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag tccttcctgg 1380
tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg gacgaggtgg 1440
cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg gacagcaccg 1500
acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag ttccggggcc 1560
acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag ctgttcatcc 1620
agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg 1680
acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa aatctgatcg 1740
cccagctgcc cggcgagaag aagaatggcc tgttcggcaa cctgattgcc ctgagcctgg 1800
gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa ctgcagctga 1860
gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc gaccagtacg 1920
ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc gacatcctga 1980
gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag agatacgacg 2040
agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt 2100
acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt gacggcggag 2160
ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg gacggcaccg 2220
aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg accttcgaca 2280
acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg cggcggcagg 2340
aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc ctgaccttcc 2400
gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc tggatgacca 2460
gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac aagggcgctt 2520
ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc aacgagaagg 2580
tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag ctgaccaaag 2640
tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag cagaaaaagg 2700
ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag ctgaaagagg 2760
actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg gaagatcggt 2820
tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac aaggacttcc 2880
tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg acactgtttg 2940
aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc gacgacaaag 3000
tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc cggaagctga 3060
tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg aagtccgacg 3120
gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc tttaaagagg 3180
acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac attgccaatc 3240
tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg gtggacgagc 3300
tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg gccagagaga 3360
accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg atcgaagagg 3420
gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac acccagctgc 3480
agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac gtggaccagg 3540
aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct cagagctttc 3600
tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac cggggcaaga 3660
gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg cggcagctgc 3720
tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc gagagaggcg 3780
gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa acccggcaga 3840
tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac gacgagaatg 3900
acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg tccgatttcc 3960
ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg 4020
cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg 4080
agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc 4140
aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg aactttttca 4200
agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc gagacaaacg 4260
gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg cggaaagtgc 4320
tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca 4380
aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag aaggactggg 4440
accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg ctggtggtgg 4500
ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg ctggggatca 4560
ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa gccaagggct 4620
acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg ttcgagctgg 4680
aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga aacgaactgg 4740
ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag aagctgaagg 4800
gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag cactacctgg 4860
acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc gacgctaatc 4920
tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga gagcaggccg 4980
agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc ttcaagtact 5040
ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg gacgccaccc 5100
tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct cagctgggag 5160
gcgacaagcg tcctgctgct actaagaaag ctggtcaagc taagaaaaag aaatgaatcg 5220
attagcaata aaggatcgtt tattttcatt ggaagcgtgt gttggttttt tgatcaggcg 5280
cgggtaccag gtcgcggccg ctctagagca tggctacgta gataagtagc atggcgggtt 5340
aatcattaac tacaaggaac ccctagtgat ggagttagga acccctagtg atggagttgg 5400
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 5460
gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggcat 5520
gcaagctgta gccaaccact agaactatag ctagagtcct gggcgaacaa acgatgctcg 5580
ccttccagaa aaccgaggat gcgaaccact tcatccgggg tcagcaccac cggcaagcgc 5640
cgcgacggcc gaggtcttcc gatctcctga agccagggca gatccgtgca cagcaccttg 5700
ccgtagaaga acagcaaggc cgccaatgcc tgacgatgcg tggagaccga aaccttgcgc 5760
tcgttcgcca gccaggacag aaatgcctcg acttcgctgc tgcccaaggt tgccgggtga 5820
cgcacaccgt ggaaacggat gaaggcacga acccagttga cataagcctg ttcggttcgt 5880
aaactgtaat gcaagtagcg tatgcgctca cgcaactggt ccagaacctt gaccgaacgc 5940
agcggtggta acggcgcagt ggcggttttc atggcttgtt atgactgttt ttttgtacag 6000
tctatgcctc gggcatccaa gcagcaagcg cgttacgccg tgggtcgatg tttgatgtta 6060
tggagcagca acgatgttac gcagcagcaa cgatgttacg cagcagggca gtcgccctaa 6120
aacaaagtta ggtggctcaa gtatgggcat cattcgcaca tgtaggctcg gccctgacca 6180
agtcaaatcc atgcgggctg ctcttgatct tttcggtcgt gagttcggag acgtagccac 6240
ctactcccaa catcagccgg actccgatta cctcgggaac ttgctccgta gtaagacatt 6300
catcgcgctt gctgccttcg accaagaagc ggttgttggc gctctcgcgg cttacgttct 6360
gcccaagttt gagcagccgc gtagtgagat ctatatctat gatctcgcag tctccggcga 6420
gcaccggagg cagggcattg ccaccgcgct catcaatctc ctcaagcatg aggccaacgc 6480
gcttggtgct tatgtgatct acgtgcaagc agattacggt gacgatcccg cagtggctct 6540
ctatacaaag ttgggcatac gggaagaagt gatgcacttt gatatcgacc caagtaccgc 6600
cacctaacaa ttcgttcaag ccgagatcgg cttcccggcc gcggagttgt tcggtaaatt 6660
gtcacaacgc cgcgaatata gtctttacca tgcccttggc cacgcccctc tttaatacga 6720
cgggcaattt gcacttcaga aaatgaagag tttgctttag ccataacaaa agtccagtat 6780
gctttttcac agcataactg gactgatttc agtttacaac tattctgtct agtttaagac 6840
tttattgtca tagtttagat ctattttgtt cagtttaaga ctttattgtc cgcccacacc 6900
cgcttacgc 6909
<210> 902
<211> 6857
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 902
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gaggccactc cctctctgcg cgctcgctcg 360
ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 420
gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttccttgtag 480
ttaatgatta acccgccatg ctacttatct acgtagccat gctctagatt aattaatgcc 540
catgtaagga ggcaaggcct ggggacaccc gagatgcctg gttataatta acccagacat 600
gtggctgccc cccccccccc aacacctgct gcctctaaaa ataaccctgc atgccatgtt 660
cccggcgaag ggccagctgt cccccgccag ctagactcag cacttagttt aggaaccagt 720
gagcaagtca gcccttgggg cagcccatac aaggccatgg ggctgggcaa gctgcacgcc 780
tgggtccggg gtgggcacgg tgcccgggca acgagctgaa agctcatctg ctctcagggg 840
cccctccctg gggacagccc ctcctggcta gtcacaccct gtaggctcct ctatataacc 900
caggggcaca ggggctgccc tcattctacc accacctcca cagcacagac agacactcag 960
gagccagcca gcgctagcgc caccatgatg gccccaaaga agaagcggaa ggtcggtatc 1020
cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg caccaactct 1080
gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt caaggtgctg 1140
ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct gttcgacagc 1200
ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata caccagacgg 1260
aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa ggtggacgac 1320
agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa gcacgagcgg 1380
caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta ccccaccatc 1440
taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg gctgatctat 1500
ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg cgacctgaac 1560
cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta caaccagctg 1620
ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct gtctgccaga 1680
ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga gaagaagaat 1740
ggcctgttcg gcaacctgat tgccctgagc ctgggcctga cccccaactt caagagcaac 1800
ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga cgacgacctg 1860
gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc cgccaagaac 1920
ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat caccaaggcc 1980
cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct gaccctgctg 2040
aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt cgaccagagc 2100
aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt ctacaagttc 2160
atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa gctgaacaga 2220
gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca ccagatccac 2280
ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt cctgaaggac 2340
aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt gggccctctg 2400
gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac catcaccccc 2460
tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat cgagcggatg 2520
accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag cctgctgtac 2580
gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga gggaatgaga 2640
aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct gttcaagacc 2700
aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat cgagtgcttc 2760
gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg cacataccac 2820
gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa cgaggacatt 2880
ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat cgaggaacgg 2940
ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa gcggcggaga 3000
tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga caagcagtcc 3060
ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa cttcatgcag 3120
ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca ggtgtccggc 3180
cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc cattaagaag 3240
ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg ccggcacaag 3300
cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa gggacagaag 3360
aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg cagccagatc 3420
ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta cctgtactac 3480
ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg gctgtccgac 3540
tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat cgacaacaag 3600
gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc cgaagaggtc 3660
gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat tacccagaga 3720
aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga taaggccggc 3780
ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc acagatcctg 3840
gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga agtgaaagtg 3900
atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt ttacaaagtg 3960
cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt cgtgggaacc 4020
gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga ctacaaggtg 4080
tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc taccgccaag 4140
tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct ggccaacggc 4200
gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat cgtgtgggat 4260
aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt gaatatcgtg 4320
aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc caagaggaac 4380
agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg cggcttcgac 4440
agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg caagtccaag 4500
aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag cagcttcgag 4560
aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa ggacctgatc 4620
atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag aatgctggcc 4680
tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata tgtgaacttc 4740
ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa tgagcagaaa 4800
cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca gatcagcgag 4860
ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc cgcctacaac 4920
aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct gtttaccctg 4980
accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga ccggaagagg 5040
tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat caccggcctg 5100
tacgagacac ggatcgacct gtctcagctg ggaggcgaca agcgtcctgc tgctactaag 5160
aaagctggtc aagctaagaa aaagaaatga atcgattagc aataaaggat cgtttatttt 5220
cattggaagc gtgtgttggt tttttgatca ggcgcgggta ccaggtcgcg gccgctctag 5280
agcatggcta cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 5340
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 5400
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag 5460
agggacatgc aagctgtagc caaccactag aactatagct agagtcctgg gcgaacaaac 5520
gatgctcgcc ttccagaaaa ccgaggatgc gaaccacttc atccggggtc agcaccaccg 5580
gcaagcgccg cgacggccga ggtcttccga tctcctgaag ccagggcaga tccgtgcaca 5640
gcaccttgcc gtagaagaac agcaaggccg ccaatgcctg acgatgcgtg gagaccgaaa 5700
ccttgcgctc gttcgccagc caggacagaa atgcctcgac ttcgctgctg cccaaggttg 5760
ccgggtgacg cacaccgtgg aaacggatga aggcacgaac ccagttgaca taagcctgtt 5820
cggttcgtaa actgtaatgc aagtagcgta tgcgctcacg caactggtcc agaaccttga 5880
ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttgttat gactgttttt 5940
ttgtacagtc tatgcctcgg gcatccaagc agcaagcgcg ttacgccgtg ggtcgatgtt 6000
tgatgttatg gagcagcaac gatgttacgc agcagcaacg atgttacgca gcagggcagt 6060
cgccctaaaa caaagttagg tggctcaagt atgggcatca ttcgcacatg taggctcggc 6120
cctgaccaag tcaaatccat gcgggctgct cttgatcttt tcggtcgtga gttcggagac 6180
gtagccacct actcccaaca tcagccggac tccgattacc tcgggaactt gctccgtagt 6240
aagacattca tcgcgcttgc tgccttcgac caagaagcgg ttgttggcgc tctcgcggct 6300
tacgttctgc ccaagtttga gcagccgcgt agtgagatct atatctatga tctcgcagtc 6360
tccggcgagc accggaggca gggcattgcc accgcgctca tcaatctcct caagcatgag 6420
gccaacgcgc ttggtgctta tgtgatctac gtgcaagcag attacggtga cgatcccgca 6480
gtggctctct atacaaagtt gggcatacgg gaagaagtga tgcactttga tatcgaccca 6540
agtaccgcca cctaacaatt cgttcaagcc gagatcggct tcccggccgc ggagttgttc 6600
ggtaaattgt cacaacgccg cgaatatagt ctttaccatg cccttggcca cgcccctctt 6660
taatacgacg ggcaatttgc acttcagaaa atgaagagtt tgctttagcc ataacaaaag 6720
tccagtatgc tttttcacag cataactgga ctgatttcag tttacaacta ttctgtctag 6780
tttaagactt tattgtcata gtttagatct attttgttca gtttaagact ttattgtccg 6840
cccacacccg cttacgc 6857
<210> 903
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 903
tagcaataaa ggatcgttta ttttcattgg aagcgtgtgt tggttttttg atcaggcgcg 60
<210> 904
<211> 3
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
stop codon oligonucleotide"
<400> 904
tag 3
<210> 905
<211> 3
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
stop codon oligonucleotide"
<400> 905
taa 3
<210> 906
<211> 3
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
stop codon oligonucleotide"
<400> 906
tga 3
<210> 907
<211> 166
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 907
tgtgggcgga caaaatagtt gggaactggg aggggtggaa atggagtttt taaggattat 60
ttagggaaga gtgacaaaat agatgggaac tgggtgtagc gtcgtaagct aatacgaaaa 120
ttaaaaatga caaaatagtt tggaactaga tttcacttat ctggtt 166
<210> 908
<211> 225
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 908
gaatatagtc tttaccatgc ccttggccac gcccctcttt aatacgacgg gcaatttgca 60
cttcagaaaa tgaagagttt gctttagcca taacaaaagt ccagtatgct ttttcacagc 120
ataactggac tgatttcagt ttacaactat tctgtctagt ttaagacttt attgtcatag 180
tttagatcta ttttgttcag tttaagactt tattgtccgc ccaca 225
<210> 909
<211> 1155
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 909
catgcaagct gtagccaacc actagaacta tagctagagt cctgggcgaa caaacgatgc 60
tcgccttcca gaaaaccgag gatgcgaacc acttcatccg gggtcagcac caccggcaag 120
cgccgcgacg gccgaggtct tccgatctcc tgaagccagg gcagatccgt gcacagcacc 180
ttgccgtaga agaacagcaa ggccgccaat gcctgacgat gcgtggagac cgaaaccttg 240
cgctcgttcg ccagccagga cagaaatgcc tcgacttcgc tgctgcccaa ggttgccggg 300
tgacgcacac cgtggaaacg gatgaaggca cgaacccagt tgacataagc ctgttcggtt 360
cgtaaactgt aatgcaagta gcgtatgcgc tcacgcaact ggtccagaac cttgaccgaa 420
cgcagcggtg gtaacggcgc agtggcggtt ttcatggctt gttatgactg tttttttgta 480
cagtctatgc ctcgggcatc caagcagcaa gcgcgttacg ccgtgggtcg atgtttgatg 540
ttatggagca gcaacgatgt tacgcagcag caacgatgtt acgcagcagg gcagtcgccc 600
taaaacaaag ttaggtggct caagtatggg catcattcgc acatgtaggc tcggccctga 660
ccaagtcaaa tccatgcggg ctgctcttga tcttttcggt cgtgagttcg gagacgtagc 720
cacctactcc caacatcagc cggactccga ttacctcggg aacttgctcc gtagtaagac 780
attcatcgcg cttgctgcct tcgaccaaga agcggttgtt ggcgctctcg cggcttacgt 840
tctgcccaag tttgagcagc cgcgtagtga gatctatatc tatgatctcg cagtctccgg 900
cgagcaccgg aggcagggca ttgccaccgc gctcatcaat ctcctcaagc atgaggccaa 960
cgcgcttggt gcttatgtga tctacgtgca agcagattac ggtgacgatc ccgcagtggc 1020
tctctataca aagttgggca tacgggaaga agtgatgcac tttgatatcg acccaagtac 1080
cgccacctaa caattcgttc aagccgagat cggcttcccg gccgcggagt tgttcggtaa 1140
attgtcacaa cgccg 1155
<210> 910
<211> 2861
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 910
ccactccctc tatgcgcgct cgctcactca ctcggccctg gagaccaaag gtctccagac 60
tgccggcctc tggccggcag ggccgagtga gtgagcgagc gcgcatagag ggagtgggta 120
cctccatcat ctaggtttgc cagatctgat atcggcgcgc ccctgggcgc gcccgagtcc 180
aacacccgtg ggaatcccat gggcaccatg gcccctcgct ccaaaaatgc tttcgcgtcg 240
cgcagacact gctcggtagt ttcggggatc agcgtttgag taagagcccg cgtctgaacc 300
ctccgcgccg ccccggcccc agtggaaaga cgcgcaggca aaacgcacca cgtgacggag 360
cgtgaccgcg cgccgagcgc gcgccaaggt cgggcaggaa gagggcctat ttcccatgat 420
tccttcatat ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac 480
tgtaaacaca aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta 540
gtttgcagtt ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa 600
gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg cactagagta 660
acagtctgac gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc 720
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttgcggccg cgctcggcgc 780
gcccatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 840
gatttgggaa tcttataagt tctgtatgag accacggtac accgcactag agtaacagtc 900
tgacgtttaa gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat 960
caacttgaaa aagtggcacc gagtcggtgc tttttttgcg gccgctgacg gcgcgccctg 1020
cagtatttag catgccccac ccatctgcaa ggcattctgg atagtgtcaa aacagccgga 1080
aatcaagtcc gtttatctca aactttagca ttttgggaat aaatgatatt tgctatgctg 1140
gttaaattag attttagtta aatttcctgc tgaagctcta gtacgataag taacttgacc 1200
taagtgtaaa gttgagattt ccttcaggtt tatatagctt gtgcgccgcc tgggtacacc 1260
gcactagagt aacagtctga cgtttaagag ctatgctgga aacagcatag caagtttaaa 1320
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttgcggcc 1380
gcgcttgcgg ccgcctcgag tgatcaaaaa aaccaacaca cgcttccaat gaaaataaac 1440
gatcctttat tgctagcctt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 1500
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcaggg 1560
cggactgggt gctcaggtag tggttgtcgg gcagcaacac ggggccgtcg ccgatggggg 1620
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 1680
tgaagttcac cttgatgccg ttcttctgct tgtcggccat gatatagacg ttgtggctgt 1740
tgtagttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 1800
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 1860
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 1920
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg gctgaagcac tgcacgccgt 1980
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 2040
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 2100
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 2160
cctcgccctt gctcaccatg gtggcgaccg gtggatcccg ggcccgcggg gtggctttac 2220
caacagtacc cggaatgcca agcttactta gatcgcagtc tcgacgctgg ctggctcctg 2280
agtgtctgtc tgtgctgtgg aggtggtggt agaatgaggg cagcccctgt gcccctgggt 2340
tatatagagg agcctacagg gtgtgactag ccaggagggg ctgtccccag ggaggggccc 2400
ctgagagcag atgagctttc agctcgttgc ccgggcaccg tgcccacccc ggacccaggc 2460
gtgcagcttg cccagcccca tggccttgta tgggctgccc caagggctga cttgctcact 2520
ggttcctaaa ctaagtgctg agtctagctg gcgggggaca gctggccctt cgccgggaac 2580
atggcatgca gggttatttt tagaggcagc aggtgttggg gggggggggg cagccacatg 2640
tctgggttaa ttataaccag gcatctcggg tgtccccagg ccttgcctcc ttacatgggc 2700
acgtcgacga tatcagatct aggaacccct agtgatggag ttggccactc cctctctgcg 2760
cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg 2820
cccggcctca gtgagcgagc gagcgcgcag agagggagtg g 2861
<210> 911
<211> 2861
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 911
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tagatctgat atcggcgcgc ccctgggcgc gcccgagtcc 180
aacacccgtg ggaatcccat gggcaccatg gcccctcgct ccaaaaatgc tttcgcgtcg 240
cgcagacact gctcggtagt ttcggggatc agcgtttgag taagagcccg cgtctgaacc 300
ctccgcgccg ccccggcccc agtggaaaga cgcgcaggca aaacgcacca cgtgacggag 360
cgtgaccgcg cgccgagcgc gcgccaaggt cgggcaggaa gagggcctat ttcccatgat 420
tccttcatat ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac 480
tgtaaacaca aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta 540
gtttgcagtt ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa 600
gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg cactagagta 660
acagtctgac gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc 720
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttgcggccg cgctcggcgc 780
gcccatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 840
gatttgggaa tcttataagt tctgtatgag accacggtac accgcactag agtaacagtc 900
tgacgtttaa gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat 960
caacttgaaa aagtggcacc gagtcggtgc tttttttgcg gccgctgacg gcgcgccctg 1020
cagtatttag catgccccac ccatctgcaa ggcattctgg atagtgtcaa aacagccgga 1080
aatcaagtcc gtttatctca aactttagca ttttgggaat aaatgatatt tgctatgctg 1140
gttaaattag attttagtta aatttcctgc tgaagctcta gtacgataag taacttgacc 1200
taagtgtaaa gttgagattt ccttcaggtt tatatagctt gtgcgccgcc tgggtacacc 1260
gcactagagt aacagtctga cgtttaagag ctatgctgga aacagcatag caagtttaaa 1320
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttgcggcc 1380
gcgcttgcgg ccgcctcgag tgatcaaaaa aaccaacaca cgcttccaat gaaaataaac 1440
gatcctttat tgctagcctt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 1500
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcaggg 1560
cggactgggt gctcaggtag tggttgtcgg gcagcaacac ggggccgtcg ccgatggggg 1620
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 1680
tgaagttcac cttgatgccg ttcttctgct tgtcggccat gatatagacg ttgtggctgt 1740
tgtagttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 1800
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 1860
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 1920
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg gctgaagcac tgcacgccgt 1980
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 2040
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 2100
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 2160
cctcgccctt gctcaccatg gtggcgaccg gtggatcccg ggcccgcggg gtggctttac 2220
caacagtacc cggaatgcca agcttactta gatcgcagtc tcgacgctgg ctggctcctg 2280
agtgtctgtc tgtgctgtgg aggtggtggt agaatgaggg cagcccctgt gcccctgggt 2340
tatatagagg agcctacagg gtgtgactag ccaggagggg ctgtccccag ggaggggccc 2400
ctgagagcag atgagctttc agctcgttgc ccgggcaccg tgcccacccc ggacccaggc 2460
gtgcagcttg cccagcccca tggccttgta tgggctgccc caagggctga cttgctcact 2520
ggttcctaaa ctaagtgctg agtctagctg gcgggggaca gctggccctt cgccgggaac 2580
atggcatgca gggttatttt tagaggcagc aggtgttggg gggggggggg cagccacatg 2640
tctgggttaa ttataaccag gcatctcggg tgtccccagg ccttgcctcc ttacatgggc 2700
acgtcgacga tatcagatct aggaacccct agtgatggag ttggccactc cctctctgcg 2760
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 2820
ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag g 2861
<210> 912
<211> 4585
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 912
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gacctgcagg cagctgcgcg ctcgctcgct 360
cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt 420
gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cctagatctg 480
atatcggcgc gcccctgggc gcgcccgagt ccaacacccg tgggaatccc atgggcacca 540
tggcccctcg ctccaaaaat gctttcgcgt cgcgcagaca ctgctcggta gtttcgggga 600
tcagcgtttg agtaagagcc cgcgtctgaa ccctccgcgc cgccccggcc ccagtggaaa 660
gacgcgcagg caaaacgcac cacgtgacgg agcgtgaccg cgcgccgagc gcgcgccaag 720
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 780
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 840
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 900
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 960
ttgtggaaag gacgaaacac cgcactagag taacagtctg acgtttaaga gctatgctgg 1020
aaacagcata gcaagtttaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1080
gtcggtgctt tttttgcggc cgcgcttcgg cgcgcccata tttgcatgtc gctatgtgtt 1140
ctgggaaatc accataaacg tgaaatgtct ttggatttgg gaatcttata agttctgtat 1200
gagaccacgg tacaccgcac tagagtaaca gtctgacgtt taagagctat gctggaaaca 1260
gcatagcaag tttaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 1320
tgcttttttt gcggccgctg acggcgcgcc ctgcagtatt tagcatgccc cacccatctg 1380
caaggcattc tggatagtgt caaaacagcc ggaaatcaag tccgtttatc tcaaacttta 1440
gcattttggg aataaatgat atttgctatg ctggttaaat tagattttag ttaaatttcc 1500
tgctgaagct ctagtacgat aagtaacttg acctaagtgt aaagttgaga tttccttcag 1560
gtttatatag cttgtgcgcc gcctgggtac accgcactag agtaacagtc tgacgtttaa 1620
gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat caacttgaaa 1680
aagtggcacc gagtcggtgc tttttttgcg gccgcgctgc ggccgcctcg agtgatcaaa 1740
aaaaccaaca cacgcttcca atgaaaataa acgatccttt attgctagcc tttacttgta 1800
cagctcgtcc atgccgagag tgatcccggc ggcggtcacg aactccagca ggaccatgtg 1860
atcgcgcttc tcgttggggt ctttgctcag ggcggactgg gtgctcaggt agtggttgtc 1920
gggcagcaac acggggccgt cgccgatggg ggtgttctgc tggtagtggt cggcgagctg 1980
cacgctgccg tcctcgatgt tgtggcggat cttgaagttc accttgatgc cgttcttctg 2040
cttgtcggcc atgatataga cgttgtggct gttgtagttg tactccagct tgtgccccag 2100
gatgttgccg tcctccttga agtcgatgcc cttcagctcg atgcggttca ccagggtgtc 2160
gccctcgaac ttcacctcgg cgcgggtctt gtagttgccg tcgtccttga agaagatggt 2220
gcgctcctgg acgtagcctt cgggcatggc ggacttgaag aagtcgtgct gcttcatgtg 2280
gtcggggtag cggctgaagc actgcacgcc gtaggtcagg gtggtcacga gggtgggcca 2340
gggcacgggc agcttgccgg tggtgcagat gaacttcagg gtcagcttgc cgtaggtggc 2400
atcgccctcg ccctcgccgg acacgctgaa cttgtggccg tttacgtcgc cgtccagctc 2460
gaccaggatg ggcaccaccc cggtgaacag ctcctcgccc ttgctcacca tggtggcgac 2520
cggtggatcc cgggcccgcg gggtggcttt accaacagta cccggaatgc caagcttact 2580
tagatcgcag tctcgacgct ggctggctcc tgagtgtctg tctgtgctgt ggaggtggtg 2640
gtagaatgag ggcagcccct gtgcccctgg gttatataga ggagcctaca gggtgtgact 2700
agccaggagg ggctgtcccc agggaggggc ccctgagagc agatgagctt tcagctcgtt 2760
gcccgggcac cgtgcccacc ccggacccag gcgtgcagct tgcccagccc catggccttg 2820
tatgggctgc cccaagggct gacttgctca ctggttccta aactaagtgc tgagtctagc 2880
tggcggggga cagctggccc ttcgccggga acatggcatg cagggttatt tttagaggca 2940
gcaggtgttg gggggggggg ggcagccaca tgtctgggtt aattataacc aggcatctcg 3000
ggtgtcccca ggccttgcct ccttacatgg gcacgtcgac gatatcagat ctaggaaccc 3060
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3120
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3180
agctgcctgc aggcatgcaa gctgtagcca accactagaa ctatagctag agtcctgggc 3240
gaacaaacga tgctcgcctt ccagaaaacc gaggatgcga accacttcat ccggggtcag 3300
caccaccggc aagcgccgcg acggccgagg tcttccgatc tcctgaagcc agggcagatc 3360
cgtgcacagc accttgccgt agaagaacag caaggccgcc aatgcctgac gatgcgtgga 3420
gaccgaaacc ttgcgctcgt tcgccagcca ggacagaaat gcctcgactt cgctgctgcc 3480
caaggttgcc gggtgacgca caccgtggaa acggatgaag gcacgaaccc agttgacata 3540
agcctgttcg gttcgtaaac tgtaatgcaa gtagcgtatg cgctcacgca actggtccag 3600
aaccttgacc gaacgcagcg gtggtaacgg cgcagtggcg gttttcatgg cttgttatga 3660
ctgttttttt gtacagtcta tgcctcgggc atccaagcag caagcgcgtt acgccgtggg 3720
tcgatgtttg atgttatgga gcagcaacga tgttacgcag cagcaacgat gttacgcagc 3780
agggcagtcg ccctaaaaca aagttaggtg gctcaagtat gggcatcatt cgcacatgta 3840
ggctcggccc tgaccaagtc aaatccatgc gggctgctct tgatcttttc ggtcgtgagt 3900
tcggagacgt agccacctac tcccaacatc agccggactc cgattacctc gggaacttgc 3960
tccgtagtaa gacattcatc gcgcttgctg ccttcgacca agaagcggtt gttggcgctc 4020
tcgcggctta cgttctgccc aagtttgagc agccgcgtag tgagatctat atctatgatc 4080
tcgcagtctc cggcgagcac cggaggcagg gcattgccac cgcgctcatc aatctcctca 4140
agcatgaggc caacgcgctt ggtgcttatg tgatctacgt gcaagcagat tacggtgacg 4200
atcccgcagt ggctctctat acaaagttgg gcatacggga agaagtgatg cactttgata 4260
tcgacccaag taccgccacc taacaattcg ttcaagccga gatcggcttc ccggccgcgg 4320
agttgttcgg taaattgtca caacgccgcg aatatagtct ttaccatgcc cttggccacg 4380
cccctcttta atacgacggg caatttgcac ttcagaaaat gaagagtttg ctttagccat 4440
aacaaaagtc cagtatgctt tttcacagca taactggact gatttcagtt tacaactatt 4500
ctgtctagtt taagacttta ttgtcatagt ttagatctat tttgttcagt ttaagacttt 4560
attgtccgcc cacacccgct tacgc 4585
<210> 913
<211> 4585
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 913
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gaccactccc tctatgcgcg ctcgctcact 360
cactcggccc tggagaccaa aggtctccag actgccggcc tctggccggc agggccgagt 420
gagtgagcga gcgcgcatag agggagtggg tacctccatc atctaggttt gccagatctg 480
atatcggcgc gcccctgggc gcgcccgagt ccaacacccg tgggaatccc atgggcacca 540
tggcccctcg ctccaaaaat gctttcgcgt cgcgcagaca ctgctcggta gtttcgggga 600
tcagcgtttg agtaagagcc cgcgtctgaa ccctccgcgc cgccccggcc ccagtggaaa 660
gacgcgcagg caaaacgcac cacgtgacgg agcgtgaccg cgcgccgagc gcgcgccaag 720
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 780
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 840
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 900
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 960
ttgtggaaag gacgaaacac cgcactagag taacagtctg acgtttaaga gctatgctgg 1020
aaacagcata gcaagtttaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1080
gtcggtgctt tttttgcggc cgcgcttcgg cgcgcccata tttgcatgtc gctatgtgtt 1140
ctgggaaatc accataaacg tgaaatgtct ttggatttgg gaatcttata agttctgtat 1200
gagaccacgg tacaccgcac tagagtaaca gtctgacgtt taagagctat gctggaaaca 1260
gcatagcaag tttaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 1320
tgcttttttt gcggccgctg acggcgcgcc ctgcagtatt tagcatgccc cacccatctg 1380
caaggcattc tggatagtgt caaaacagcc ggaaatcaag tccgtttatc tcaaacttta 1440
gcattttggg aataaatgat atttgctatg ctggttaaat tagattttag ttaaatttcc 1500
tgctgaagct ctagtacgat aagtaacttg acctaagtgt aaagttgaga tttccttcag 1560
gtttatatag cttgtgcgcc gcctgggtac accgcactag agtaacagtc tgacgtttaa 1620
gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat caacttgaaa 1680
aagtggcacc gagtcggtgc tttttttgcg gccgcgctgc ggccgcctcg agtgatcaaa 1740
aaaaccaaca cacgcttcca atgaaaataa acgatccttt attgctagcc tttacttgta 1800
cagctcgtcc atgccgagag tgatcccggc ggcggtcacg aactccagca ggaccatgtg 1860
atcgcgcttc tcgttggggt ctttgctcag ggcggactgg gtgctcaggt agtggttgtc 1920
gggcagcaac acggggccgt cgccgatggg ggtgttctgc tggtagtggt cggcgagctg 1980
cacgctgccg tcctcgatgt tgtggcggat cttgaagttc accttgatgc cgttcttctg 2040
cttgtcggcc atgatataga cgttgtggct gttgtagttg tactccagct tgtgccccag 2100
gatgttgccg tcctccttga agtcgatgcc cttcagctcg atgcggttca ccagggtgtc 2160
gccctcgaac ttcacctcgg cgcgggtctt gtagttgccg tcgtccttga agaagatggt 2220
gcgctcctgg acgtagcctt cgggcatggc ggacttgaag aagtcgtgct gcttcatgtg 2280
gtcggggtag cggctgaagc actgcacgcc gtaggtcagg gtggtcacga gggtgggcca 2340
gggcacgggc agcttgccgg tggtgcagat gaacttcagg gtcagcttgc cgtaggtggc 2400
atcgccctcg ccctcgccgg acacgctgaa cttgtggccg tttacgtcgc cgtccagctc 2460
gaccaggatg ggcaccaccc cggtgaacag ctcctcgccc ttgctcacca tggtggcgac 2520
cggtggatcc cgggcccgcg gggtggcttt accaacagta cccggaatgc caagcttact 2580
tagatcgcag tctcgacgct ggctggctcc tgagtgtctg tctgtgctgt ggaggtggtg 2640
gtagaatgag ggcagcccct gtgcccctgg gttatataga ggagcctaca gggtgtgact 2700
agccaggagg ggctgtcccc agggaggggc ccctgagagc agatgagctt tcagctcgtt 2760
gcccgggcac cgtgcccacc ccggacccag gcgtgcagct tgcccagccc catggccttg 2820
tatgggctgc cccaagggct gacttgctca ctggttccta aactaagtgc tgagtctagc 2880
tggcggggga cagctggccc ttcgccggga acatggcatg cagggttatt tttagaggca 2940
gcaggtgttg gggggggggg ggcagccaca tgtctgggtt aattataacc aggcatctcg 3000
ggtgtcccca ggccttgcct ccttacatgg gcacgtcgac gatatcagat ctaggaaccc 3060
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgcccgg 3120
gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct cagtgagcga gcgagcgcgc 3180
agagagggag tggcatgcaa gctgtagcca accactagaa ctatagctag agtcctgggc 3240
gaacaaacga tgctcgcctt ccagaaaacc gaggatgcga accacttcat ccggggtcag 3300
caccaccggc aagcgccgcg acggccgagg tcttccgatc tcctgaagcc agggcagatc 3360
cgtgcacagc accttgccgt agaagaacag caaggccgcc aatgcctgac gatgcgtgga 3420
gaccgaaacc ttgcgctcgt tcgccagcca ggacagaaat gcctcgactt cgctgctgcc 3480
caaggttgcc gggtgacgca caccgtggaa acggatgaag gcacgaaccc agttgacata 3540
agcctgttcg gttcgtaaac tgtaatgcaa gtagcgtatg cgctcacgca actggtccag 3600
aaccttgacc gaacgcagcg gtggtaacgg cgcagtggcg gttttcatgg cttgttatga 3660
ctgttttttt gtacagtcta tgcctcgggc atccaagcag caagcgcgtt acgccgtggg 3720
tcgatgtttg atgttatgga gcagcaacga tgttacgcag cagcaacgat gttacgcagc 3780
agggcagtcg ccctaaaaca aagttaggtg gctcaagtat gggcatcatt cgcacatgta 3840
ggctcggccc tgaccaagtc aaatccatgc gggctgctct tgatcttttc ggtcgtgagt 3900
tcggagacgt agccacctac tcccaacatc agccggactc cgattacctc gggaacttgc 3960
tccgtagtaa gacattcatc gcgcttgctg ccttcgacca agaagcggtt gttggcgctc 4020
tcgcggctta cgttctgccc aagtttgagc agccgcgtag tgagatctat atctatgatc 4080
tcgcagtctc cggcgagcac cggaggcagg gcattgccac cgcgctcatc aatctcctca 4140
agcatgaggc caacgcgctt ggtgcttatg tgatctacgt gcaagcagat tacggtgacg 4200
atcccgcagt ggctctctat acaaagttgg gcatacggga agaagtgatg cactttgata 4260
tcgacccaag taccgccacc taacaattcg ttcaagccga gatcggcttc ccggccgcgg 4320
agttgttcgg taaattgtca caacgccgcg aatatagtct ttaccatgcc cttggccacg 4380
cccctcttta atacgacggg caatttgcac ttcagaaaat gaagagtttg ctttagccat 4440
aacaaaagtc cagtatgctt tttcacagca taactggact gatttcagtt tacaactatt 4500
ctgtctagtt taagacttta ttgtcatagt ttagatctat tttgttcagt ttaagacttt 4560
attgtccgcc cacacccgct tacgc 4585
<210> 914
<211> 2285
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 914
ccactccctc tatgcgcgct cgctcactca ctcggccctg gagaccaaag gtctccagac 60
tgccggcctc tggccggcag ggccgagtga gtgagcgagc gcgcatagag ggagtgggta 120
cctccatcat ctaggtttgc cagatctgat atcggcgcgc ccctgggcgc gcccgagtcc 180
aacacccgtg ggaatcccat gggcaccatg gcccctcgct ccaaaaatgc tttcgcgtcg 240
cgcagacact gctcggtagt ttcggggatc agcgtttgag taagagcccg cgtctgaacc 300
ctccgcgccg ccccggcccc agtggaaaga cgcgcaggca aaacgcacca cgtgacggag 360
cgtgaccgcg cgccgagcgc gcgccaaggt cgggcaggaa gagggcctat ttcccatgat 420
tccttcatat ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac 480
tgtaaacaca aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta 540
gtttgcagtt ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa 600
gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg caccagagta 660
acagtctgag gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc 720
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttgcggccg cgctcggcgc 780
gcccatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 840
gatttgggaa tcttataagt tctgtatgag accacggtac accgcaccag agtaacagtc 900
tgaggtttaa gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat 960
caacttgaaa aagtggcacc gagtcggtgc tttttttgcg gccgctgacg gcgcgccctg 1020
cagtatttag catgccccac ccatctgcaa ggcattctgg atagtgtcaa aacagccgga 1080
aatcaagtcc gtttatctca aactttagca ttttgggaat aaatgatatt tgctatgctg 1140
gttaaattag attttagtta aatttcctgc tgaagctcta gtacgataag taacttgacc 1200
taagtgtaaa gttgagattt ccttcaggtt tatatagctt gtgcgccgcc tgggtacacc 1260
gcaccagagt aacagtctga ggtttaagag ctatgctgga aacagcatag caagtttaaa 1320
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttgcggcc 1380
gcgctgttta aaccaacaaa atcagcagct aatgaaggca agtcagcagg tcactcatca 1440
ttttccactt cggcaatgca gtgggattat tccaacagag gtttttcaca gcattccttc 1500
agttaactgg agatcgaatc ttgattttca cagatatact tggcaaggtc cgccctgtca 1560
tcagcacatt caagcagatc tccatggcag cattccgtgt ggacttaggt aagatctgtc 1620
actaacttgg aaacttctgc aaactcagct tagggaaatc tctggctcag gcgagctact 1680
gcctcagctt agaaagctct ttctccaaat tattggagac tggcacactt aagtccctgt 1740
taggcagacg aagccttccc ttcatcccga agttcatcga gctttggcaa caggcaggca 1800
gctttatcag cagcttggca acattctgta aaagcagctt tataccttta agcaaagaaa 1860
aggagttccg gggcataaaa gtaaggatgt cttctggcaa tttataataa gtattttttc 1920
aaaaatgtct cttcattgtc atgaaaagca gtgcatcaca catcaacctc tggtctcacc 1980
aatcggggga ggtttgggtt gtttacttag tgttgcaaga attattttat tctctcaggt 2040
tcttgttttg cacagcagtc agctcattca ccataggttt cacgaagagt tgctgcggcc 2100
gcctcgataa tacgactcac tatagggtcg acgatatcag atctaggaac ccctagtgat 2160
ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc 2220
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg 2280
agtgg 2285
<210> 915
<211> 2285
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 915
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tagatctgat atcggcgcgc ccctgggcgc gcccgagtcc 180
aacacccgtg ggaatcccat gggcaccatg gcccctcgct ccaaaaatgc tttcgcgtcg 240
cgcagacact gctcggtagt ttcggggatc agcgtttgag taagagcccg cgtctgaacc 300
ctccgcgccg ccccggcccc agtggaaaga cgcgcaggca aaacgcacca cgtgacggag 360
cgtgaccgcg cgccgagcgc gcgccaaggt cgggcaggaa gagggcctat ttcccatgat 420
tccttcatat ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac 480
tgtaaacaca aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta 540
gtttgcagtt ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa 600
gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg caccagagta 660
acagtctgag gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc 720
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttgcggccg cgctcggcgc 780
gcccatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 840
gatttgggaa tcttataagt tctgtatgag accacggtac accgcaccag agtaacagtc 900
tgaggtttaa gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat 960
caacttgaaa aagtggcacc gagtcggtgc tttttttgcg gccgctgacg gcgcgccctg 1020
cagtatttag catgccccac ccatctgcaa ggcattctgg atagtgtcaa aacagccgga 1080
aatcaagtcc gtttatctca aactttagca ttttgggaat aaatgatatt tgctatgctg 1140
gttaaattag attttagtta aatttcctgc tgaagctcta gtacgataag taacttgacc 1200
taagtgtaaa gttgagattt ccttcaggtt tatatagctt gtgcgccgcc tgggtacacc 1260
gcaccagagt aacagtctga ggtttaagag ctatgctgga aacagcatag caagtttaaa 1320
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttgcggcc 1380
gcgctgttta aaccaacaaa atcagcagct aatgaaggca agtcagcagg tcactcatca 1440
ttttccactt cggcaatgca gtgggattat tccaacagag gtttttcaca gcattccttc 1500
agttaactgg agatcgaatc ttgattttca cagatatact tggcaaggtc cgccctgtca 1560
tcagcacatt caagcagatc tccatggcag cattccgtgt ggacttaggt aagatctgtc 1620
actaacttgg aaacttctgc aaactcagct tagggaaatc tctggctcag gcgagctact 1680
gcctcagctt agaaagctct ttctccaaat tattggagac tggcacactt aagtccctgt 1740
taggcagacg aagccttccc ttcatcccga agttcatcga gctttggcaa caggcaggca 1800
gctttatcag cagcttggca acattctgta aaagcagctt tataccttta agcaaagaaa 1860
aggagttccg gggcataaaa gtaaggatgt cttctggcaa tttataataa gtattttttc 1920
aaaaatgtct cttcattgtc atgaaaagca gtgcatcaca catcaacctc tggtctcacc 1980
aatcggggga ggtttgggtt gtttacttag tgttgcaaga attattttat tctctcaggt 2040
tcttgttttg cacagcagtc agctcattca ccataggttt cacgaagagt tgctgcggcc 2100
gcctcgataa tacgactcac tatagggtcg acgatatcag atctaggaac ccctagtgat 2160
ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt 2220
cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct 2280
gcagg 2285
<210> 916
<211> 4009
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 916
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gacctgcagg cagctgcgcg ctcgctcgct 360
cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt 420
gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cctagatctg 480
atatcggcgc gcccctgggc gcgcccgagt ccaacacccg tgggaatccc atgggcacca 540
tggcccctcg ctccaaaaat gctttcgcgt cgcgcagaca ctgctcggta gtttcgggga 600
tcagcgtttg agtaagagcc cgcgtctgaa ccctccgcgc cgccccggcc ccagtggaaa 660
gacgcgcagg caaaacgcac cacgtgacgg agcgtgaccg cgcgccgagc gcgcgccaag 720
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 780
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 840
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 900
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 960
ttgtggaaag gacgaaacac cgcaccagag taacagtctg aggtttaaga gctatgctgg 1020
aaacagcata gcaagtttaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1080
gtcggtgctt tttttgcggc cgcgctcggc gcgcccatat ttgcatgtcg ctatgtgttc 1140
tgggaaatca ccataaacgt gaaatgtctt tggatttggg aatcttataa gttctgtatg 1200
agaccacggt acaccgcacc agagtaacag tctgaggttt aagagctatg ctggaaacag 1260
catagcaagt ttaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 1320
gctttttttg cggccgctga cggcgcgccc tgcagtattt agcatgcccc acccatctgc 1380
aaggcattct ggatagtgtc aaaacagccg gaaatcaagt ccgtttatct caaactttag 1440
cattttggga ataaatgata tttgctatgc tggttaaatt agattttagt taaatttcct 1500
gctgaagctc tagtacgata agtaacttga cctaagtgta aagttgagat ttccttcagg 1560
tttatatagc ttgtgcgccg cctgggtaca ccgcaccaga gtaacagtct gaggtttaag 1620
agctatgctg gaaacagcat agcaagttta aataaggcta gtccgttatc aacttgaaaa 1680
agtggcaccg agtcggtgct ttttttgcgg ccgcgctgtt taaaccaaca aaatcagcag 1740
ctaatgaagg caagtcagca ggtcactcat cattttccac ttcggcaatg cagtgggatt 1800
attccaacag aggtttttca cagcattcct tcagttaact ggagatcgaa tcttgatttt 1860
cacagatata cttggcaagg tccgccctgt catcagcaca ttcaagcaga tctccatggc 1920
agcattccgt gtggacttag gtaagatctg tcactaactt ggaaacttct gcaaactcag 1980
cttagggaaa tctctggctc aggcgagcta ctgcctcagc ttagaaagct ctttctccaa 2040
attattggag actggcacac ttaagtccct gttaggcaga cgaagccttc ccttcatccc 2100
gaagttcatc gagctttggc aacaggcagg cagctttatc agcagcttgg caacattctg 2160
taaaagcagc tttatacctt taagcaaaga aaaggagttc cggggcataa aagtaaggat 2220
gtcttctggc aatttataat aagtattttt tcaaaaatgt ctcttcattg tcatgaaaag 2280
cagtgcatca cacatcaacc tctggtctca ccaatcgggg gaggtttggg ttgtttactt 2340
agtgttgcaa gaattatttt attctctcag gttcttgttt tgcacagcag tcagctcatt 2400
caccataggt ttcacgaaga gttgctgcgg ccgcctcgat aatacgactc actatagggt 2460
cgacgatatc agatctagga acccctagtg atggagttgg ccactccctc tctgcgcgct 2520
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 2580
gcctcagtga gcgagcgagc gcgcagctgc ctgcaggcat gcaagctgta gccaaccact 2640
agaactatag ctagagtcct gggcgaacaa acgatgctcg ccttccagaa aaccgaggat 2700
gcgaaccact tcatccgggg tcagcaccac cggcaagcgc cgcgacggcc gaggtcttcc 2760
gatctcctga agccagggca gatccgtgca cagcaccttg ccgtagaaga acagcaaggc 2820
cgccaatgcc tgacgatgcg tggagaccga aaccttgcgc tcgttcgcca gccaggacag 2880
aaatgcctcg acttcgctgc tgcccaaggt tgccgggtga cgcacaccgt ggaaacggat 2940
gaaggcacga acccagttga cataagcctg ttcggttcgt aaactgtaat gcaagtagcg 3000
tatgcgctca cgcaactggt ccagaacctt gaccgaacgc agcggtggta acggcgcagt 3060
ggcggttttc atggcttgtt atgactgttt ttttgtacag tctatgcctc gggcatccaa 3120
gcagcaagcg cgttacgccg tgggtcgatg tttgatgtta tggagcagca acgatgttac 3180
gcagcagcaa cgatgttacg cagcagggca gtcgccctaa aacaaagtta ggtggctcaa 3240
gtatgggcat cattcgcaca tgtaggctcg gccctgacca agtcaaatcc atgcgggctg 3300
ctcttgatct tttcggtcgt gagttcggag acgtagccac ctactcccaa catcagccgg 3360
actccgatta cctcgggaac ttgctccgta gtaagacatt catcgcgctt gctgccttcg 3420
accaagaagc ggttgttggc gctctcgcgg cttacgttct gcccaagttt gagcagccgc 3480
gtagtgagat ctatatctat gatctcgcag tctccggcga gcaccggagg cagggcattg 3540
ccaccgcgct catcaatctc ctcaagcatg aggccaacgc gcttggtgct tatgtgatct 3600
acgtgcaagc agattacggt gacgatcccg cagtggctct ctatacaaag ttgggcatac 3660
gggaagaagt gatgcacttt gatatcgacc caagtaccgc cacctaacaa ttcgttcaag 3720
ccgagatcgg cttcccggcc gcggagttgt tcggtaaatt gtcacaacgc cgcgaatata 3780
gtctttacca tgcccttggc cacgcccctc tttaatacga cgggcaattt gcacttcaga 3840
aaatgaagag tttgctttag ccataacaaa agtccagtat gctttttcac agcataactg 3900
gactgatttc agtttacaac tattctgtct agtttaagac tttattgtca tagtttagat 3960
ctattttgtt cagtttaaga ctttattgtc cgcccacacc cgcttacgc 4009
<210> 917
<211> 4009
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 917
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gaccactccc tctatgcgcg ctcgctcact 360
cactcggccc tggagaccaa aggtctccag actgccggcc tctggccggc agggccgagt 420
gagtgagcga gcgcgcatag agggagtggg tacctccatc atctaggttt gccagatctg 480
atatcggcgc gcccctgggc gcgcccgagt ccaacacccg tgggaatccc atgggcacca 540
tggcccctcg ctccaaaaat gctttcgcgt cgcgcagaca ctgctcggta gtttcgggga 600
tcagcgtttg agtaagagcc cgcgtctgaa ccctccgcgc cgccccggcc ccagtggaaa 660
gacgcgcagg caaaacgcac cacgtgacgg agcgtgaccg cgcgccgagc gcgcgccaag 720
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 780
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 840
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 900
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 960
ttgtggaaag gacgaaacac cgcaccagag taacagtctg aggtttaaga gctatgctgg 1020
aaacagcata gcaagtttaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1080
gtcggtgctt tttttgcggc cgcgctcggc gcgcccatat ttgcatgtcg ctatgtgttc 1140
tgggaaatca ccataaacgt gaaatgtctt tggatttggg aatcttataa gttctgtatg 1200
agaccacggt acaccgcacc agagtaacag tctgaggttt aagagctatg ctggaaacag 1260
catagcaagt ttaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 1320
gctttttttg cggccgctga cggcgcgccc tgcagtattt agcatgcccc acccatctgc 1380
aaggcattct ggatagtgtc aaaacagccg gaaatcaagt ccgtttatct caaactttag 1440
cattttggga ataaatgata tttgctatgc tggttaaatt agattttagt taaatttcct 1500
gctgaagctc tagtacgata agtaacttga cctaagtgta aagttgagat ttccttcagg 1560
tttatatagc ttgtgcgccg cctgggtaca ccgcaccaga gtaacagtct gaggtttaag 1620
agctatgctg gaaacagcat agcaagttta aataaggcta gtccgttatc aacttgaaaa 1680
agtggcaccg agtcggtgct ttttttgcgg ccgcgctgtt taaaccaaca aaatcagcag 1740
ctaatgaagg caagtcagca ggtcactcat cattttccac ttcggcaatg cagtgggatt 1800
attccaacag aggtttttca cagcattcct tcagttaact ggagatcgaa tcttgatttt 1860
cacagatata cttggcaagg tccgccctgt catcagcaca ttcaagcaga tctccatggc 1920
agcattccgt gtggacttag gtaagatctg tcactaactt ggaaacttct gcaaactcag 1980
cttagggaaa tctctggctc aggcgagcta ctgcctcagc ttagaaagct ctttctccaa 2040
attattggag actggcacac ttaagtccct gttaggcaga cgaagccttc ccttcatccc 2100
gaagttcatc gagctttggc aacaggcagg cagctttatc agcagcttgg caacattctg 2160
taaaagcagc tttatacctt taagcaaaga aaaggagttc cggggcataa aagtaaggat 2220
gtcttctggc aatttataat aagtattttt tcaaaaatgt ctcttcattg tcatgaaaag 2280
cagtgcatca cacatcaacc tctggtctca ccaatcgggg gaggtttggg ttgtttactt 2340
agtgttgcaa gaattatttt attctctcag gttcttgttt tgcacagcag tcagctcatt 2400
caccataggt ttcacgaaga gttgctgcgg ccgcctcgat aatacgactc actatagggt 2460
cgacgatatc agatctagga acccctagtg atggagttgg ccactccctc tctgcgcgct 2520
cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg 2580
gcctcagtga gcgagcgagc gcgcagagag ggagtggcat gcaagctgta gccaaccact 2640
agaactatag ctagagtcct gggcgaacaa acgatgctcg ccttccagaa aaccgaggat 2700
gcgaaccact tcatccgggg tcagcaccac cggcaagcgc cgcgacggcc gaggtcttcc 2760
gatctcctga agccagggca gatccgtgca cagcaccttg ccgtagaaga acagcaaggc 2820
cgccaatgcc tgacgatgcg tggagaccga aaccttgcgc tcgttcgcca gccaggacag 2880
aaatgcctcg acttcgctgc tgcccaaggt tgccgggtga cgcacaccgt ggaaacggat 2940
gaaggcacga acccagttga cataagcctg ttcggttcgt aaactgtaat gcaagtagcg 3000
tatgcgctca cgcaactggt ccagaacctt gaccgaacgc agcggtggta acggcgcagt 3060
ggcggttttc atggcttgtt atgactgttt ttttgtacag tctatgcctc gggcatccaa 3120
gcagcaagcg cgttacgccg tgggtcgatg tttgatgtta tggagcagca acgatgttac 3180
gcagcagcaa cgatgttacg cagcagggca gtcgccctaa aacaaagtta ggtggctcaa 3240
gtatgggcat cattcgcaca tgtaggctcg gccctgacca agtcaaatcc atgcgggctg 3300
ctcttgatct tttcggtcgt gagttcggag acgtagccac ctactcccaa catcagccgg 3360
actccgatta cctcgggaac ttgctccgta gtaagacatt catcgcgctt gctgccttcg 3420
accaagaagc ggttgttggc gctctcgcgg cttacgttct gcccaagttt gagcagccgc 3480
gtagtgagat ctatatctat gatctcgcag tctccggcga gcaccggagg cagggcattg 3540
ccaccgcgct catcaatctc ctcaagcatg aggccaacgc gcttggtgct tatgtgatct 3600
acgtgcaagc agattacggt gacgatcccg cagtggctct ctatacaaag ttgggcatac 3660
gggaagaagt gatgcacttt gatatcgacc caagtaccgc cacctaacaa ttcgttcaag 3720
ccgagatcgg cttcccggcc gcggagttgt tcggtaaatt gtcacaacgc cgcgaatata 3780
gtctttacca tgcccttggc cacgcccctc tttaatacga cgggcaattt gcacttcaga 3840
aaatgaagag tttgctttag ccataacaaa agtccagtat gctttttcac agcataactg 3900
gactgatttc agtttacaac tattctgtct agtttaagac tttattgtca tagtttagat 3960
ctattttgtt cagtttaaga ctttattgtc cgcccacacc cgcttacgc 4009
<210> 918
<211> 2285
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 918
ccactccctc tatgcgcgct cgctcactca ctcggccctg gagaccaaag gtctccagac 60
tgccggcctc tggccggcag ggccgagtga gtgagcgagc gcgcatagag ggagtgggta 120
cctccatcat ctaggtttgc cagatctgat atcggcgcgc ccctgggcgc gcccgagtcc 180
aacacccgtg ggaatcccat gggcaccatg gcccctcgct ccaaaaatgc tttcgcgtcg 240
cgcagacact gctcggtagt ttcggggatc agcgtttgag taagagcccg cgtctgaacc 300
ctccgcgccg ccccggcccc agtggaaaga cgcgcaggca aaacgcacca cgtgacggag 360
cgtgaccgcg cgccgagcgc gcgccaaggt cgggcaggaa gagggcctat ttcccatgat 420
tccttcatat ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac 480
tgtaaacaca aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta 540
gtttgcagtt ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa 600
gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg caccagagta 660
acagtctgac gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc 720
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttgcggccg cgctcggcgc 780
gcccatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 840
gatttgggaa tcttataagt tctgtatgag accacggtac accgcaccag agtaacagtc 900
tgacgtttaa gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat 960
caacttgaaa aagtggcacc gagtcggtgc tttttttgcg gccgctgacg gcgcgccctg 1020
cagtatttag catgccccac ccatctgcaa ggcattctgg atagtgtcaa aacagccgga 1080
aatcaagtcc gtttatctca aactttagca ttttgggaat aaatgatatt tgctatgctg 1140
gttaaattag attttagtta aatttcctgc tgaagctcta gtacgataag taacttgacc 1200
taagtgtaaa gttgagattt ccttcaggtt tatatagctt gtgcgccgcc tgggtacacc 1260
gcaccagagt aacagtctga cgtttaagag ctatgctgga aacagcatag caagtttaaa 1320
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttgcggcc 1380
gcgctgttta aaccaacaaa atcagcagct aatgaaggca agtcagcagg tcactcatca 1440
ttttccactt cggcaatgca gtgggattat tccaacagag gtttttcaca gcattccttc 1500
agttaactgg agatcgaatc ttgattttca cagatatact tggcaaggtc cgccctgtca 1560
tcagcacatt caagcagatc tccatggcag cattccgtgt ggacttaggt aagatctgtc 1620
actaacttgg aaacttctgc aaactcagct tagggaaatc tctggctcag gcgagctact 1680
gcctcagctt agaaagctct ttctccaaat tattggagac tggcacactt aagtccctgt 1740
taggcagacg aagccttccc ttcatcccga agttcatcga gctttggcaa caggcaggca 1800
gctttatcag cagcttggca acattctgta aaagcagctt tataccttta agcaaagaaa 1860
aggagttccg gggcataaaa gtaaggatgt cttctggcaa tttataataa gtattttttc 1920
aaaaatgtct cttcattgtc atgaaaagca gtgcatcaca catcaacctc tggtctcacc 1980
aatcggggga ggtttgggtt gtttacttag tgttgcaaga attattttat tctctcaggt 2040
tcttgttttg cacagcagtc agctcattca ccataggttt cacgaagagt tgctgcggcc 2100
gcctcgataa tacgactcac tatagggtcg acgatatcag atctaggaac ccctagtgat 2160
ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc 2220
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg 2280
agtgg 2285
<210> 919
<211> 2285
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 919
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tagatctgat atcggcgcgc ccctgggcgc gcccgagtcc 180
aacacccgtg ggaatcccat gggcaccatg gcccctcgct ccaaaaatgc tttcgcgtcg 240
cgcagacact gctcggtagt ttcggggatc agcgtttgag taagagcccg cgtctgaacc 300
ctccgcgccg ccccggcccc agtggaaaga cgcgcaggca aaacgcacca cgtgacggag 360
cgtgaccgcg cgccgagcgc gcgccaaggt cgggcaggaa gagggcctat ttcccatgat 420
tccttcatat ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac 480
tgtaaacaca aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta 540
gtttgcagtt ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa 600
gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg caccagagta 660
acagtctgac gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc 720
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttgcggccg cgctcggcgc 780
gcccatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 840
gatttgggaa tcttataagt tctgtatgag accacggtac accgcaccag agtaacagtc 900
tgacgtttaa gagctatgct ggaaacagca tagcaagttt aaataaggct agtccgttat 960
caacttgaaa aagtggcacc gagtcggtgc tttttttgcg gccgctgacg gcgcgccctg 1020
cagtatttag catgccccac ccatctgcaa ggcattctgg atagtgtcaa aacagccgga 1080
aatcaagtcc gtttatctca aactttagca ttttgggaat aaatgatatt tgctatgctg 1140
gttaaattag attttagtta aatttcctgc tgaagctcta gtacgataag taacttgacc 1200
taagtgtaaa gttgagattt ccttcaggtt tatatagctt gtgcgccgcc tgggtacacc 1260
gcaccagagt aacagtctga cgtttaagag ctatgctgga aacagcatag caagtttaaa 1320
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttgcggcc 1380
gcgctgttta aaccaacaaa atcagcagct aatgaaggca agtcagcagg tcactcatca 1440
ttttccactt cggcaatgca gtgggattat tccaacagag gtttttcaca gcattccttc 1500
agttaactgg agatcgaatc ttgattttca cagatatact tggcaaggtc cgccctgtca 1560
tcagcacatt caagcagatc tccatggcag cattccgtgt ggacttaggt aagatctgtc 1620
actaacttgg aaacttctgc aaactcagct tagggaaatc tctggctcag gcgagctact 1680
gcctcagctt agaaagctct ttctccaaat tattggagac tggcacactt aagtccctgt 1740
taggcagacg aagccttccc ttcatcccga agttcatcga gctttggcaa caggcaggca 1800
gctttatcag cagcttggca acattctgta aaagcagctt tataccttta agcaaagaaa 1860
aggagttccg gggcataaaa gtaaggatgt cttctggcaa tttataataa gtattttttc 1920
aaaaatgtct cttcattgtc atgaaaagca gtgcatcaca catcaacctc tggtctcacc 1980
aatcggggga ggtttgggtt gtttacttag tgttgcaaga attattttat tctctcaggt 2040
tcttgttttg cacagcagtc agctcattca ccataggttt cacgaagagt tgctgcggcc 2100
gcctcgataa tacgactcac tatagggtcg acgatatcag atctaggaac ccctagtgat 2160
ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt 2220
cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct 2280
gcagg 2285
<210> 920
<211> 4009
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 920
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gacctgcagg cagctgcgcg ctcgctcgct 360
cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt 420
gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cctagatctg 480
atatcggcgc gcccctgggc gcgcccgagt ccaacacccg tgggaatccc atgggcacca 540
tggcccctcg ctccaaaaat gctttcgcgt cgcgcagaca ctgctcggta gtttcgggga 600
tcagcgtttg agtaagagcc cgcgtctgaa ccctccgcgc cgccccggcc ccagtggaaa 660
gacgcgcagg caaaacgcac cacgtgacgg agcgtgaccg cgcgccgagc gcgcgccaag 720
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 780
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 840
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 900
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 960
ttgtggaaag gacgaaacac cgcaccagag taacagtctg acgtttaaga gctatgctgg 1020
aaacagcata gcaagtttaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1080
gtcggtgctt tttttgcggc cgcgctcggc gcgcccatat ttgcatgtcg ctatgtgttc 1140
tgggaaatca ccataaacgt gaaatgtctt tggatttggg aatcttataa gttctgtatg 1200
agaccacggt acaccgcacc agagtaacag tctgacgttt aagagctatg ctggaaacag 1260
catagcaagt ttaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 1320
gctttttttg cggccgctga cggcgcgccc tgcagtattt agcatgcccc acccatctgc 1380
aaggcattct ggatagtgtc aaaacagccg gaaatcaagt ccgtttatct caaactttag 1440
cattttggga ataaatgata tttgctatgc tggttaaatt agattttagt taaatttcct 1500
gctgaagctc tagtacgata agtaacttga cctaagtgta aagttgagat ttccttcagg 1560
tttatatagc ttgtgcgccg cctgggtaca ccgcaccaga gtaacagtct gacgtttaag 1620
agctatgctg gaaacagcat agcaagttta aataaggcta gtccgttatc aacttgaaaa 1680
agtggcaccg agtcggtgct ttttttgcgg ccgcgctgtt taaaccaaca aaatcagcag 1740
ctaatgaagg caagtcagca ggtcactcat cattttccac ttcggcaatg cagtgggatt 1800
attccaacag aggtttttca cagcattcct tcagttaact ggagatcgaa tcttgatttt 1860
cacagatata cttggcaagg tccgccctgt catcagcaca ttcaagcaga tctccatggc 1920
agcattccgt gtggacttag gtaagatctg tcactaactt ggaaacttct gcaaactcag 1980
cttagggaaa tctctggctc aggcgagcta ctgcctcagc ttagaaagct ctttctccaa 2040
attattggag actggcacac ttaagtccct gttaggcaga cgaagccttc ccttcatccc 2100
gaagttcatc gagctttggc aacaggcagg cagctttatc agcagcttgg caacattctg 2160
taaaagcagc tttatacctt taagcaaaga aaaggagttc cggggcataa aagtaaggat 2220
gtcttctggc aatttataat aagtattttt tcaaaaatgt ctcttcattg tcatgaaaag 2280
cagtgcatca cacatcaacc tctggtctca ccaatcgggg gaggtttggg ttgtttactt 2340
agtgttgcaa gaattatttt attctctcag gttcttgttt tgcacagcag tcagctcatt 2400
caccataggt ttcacgaaga gttgctgcgg ccgcctcgat aatacgactc actatagggt 2460
cgacgatatc agatctagga acccctagtg atggagttgg ccactccctc tctgcgcgct 2520
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 2580
gcctcagtga gcgagcgagc gcgcagctgc ctgcaggcat gcaagctgta gccaaccact 2640
agaactatag ctagagtcct gggcgaacaa acgatgctcg ccttccagaa aaccgaggat 2700
gcgaaccact tcatccgggg tcagcaccac cggcaagcgc cgcgacggcc gaggtcttcc 2760
gatctcctga agccagggca gatccgtgca cagcaccttg ccgtagaaga acagcaaggc 2820
cgccaatgcc tgacgatgcg tggagaccga aaccttgcgc tcgttcgcca gccaggacag 2880
aaatgcctcg acttcgctgc tgcccaaggt tgccgggtga cgcacaccgt ggaaacggat 2940
gaaggcacga acccagttga cataagcctg ttcggttcgt aaactgtaat gcaagtagcg 3000
tatgcgctca cgcaactggt ccagaacctt gaccgaacgc agcggtggta acggcgcagt 3060
ggcggttttc atggcttgtt atgactgttt ttttgtacag tctatgcctc gggcatccaa 3120
gcagcaagcg cgttacgccg tgggtcgatg tttgatgtta tggagcagca acgatgttac 3180
gcagcagcaa cgatgttacg cagcagggca gtcgccctaa aacaaagtta ggtggctcaa 3240
gtatgggcat cattcgcaca tgtaggctcg gccctgacca agtcaaatcc atgcgggctg 3300
ctcttgatct tttcggtcgt gagttcggag acgtagccac ctactcccaa catcagccgg 3360
actccgatta cctcgggaac ttgctccgta gtaagacatt catcgcgctt gctgccttcg 3420
accaagaagc ggttgttggc gctctcgcgg cttacgttct gcccaagttt gagcagccgc 3480
gtagtgagat ctatatctat gatctcgcag tctccggcga gcaccggagg cagggcattg 3540
ccaccgcgct catcaatctc ctcaagcatg aggccaacgc gcttggtgct tatgtgatct 3600
acgtgcaagc agattacggt gacgatcccg cagtggctct ctatacaaag ttgggcatac 3660
gggaagaagt gatgcacttt gatatcgacc caagtaccgc cacctaacaa ttcgttcaag 3720
ccgagatcgg cttcccggcc gcggagttgt tcggtaaatt gtcacaacgc cgcgaatata 3780
gtctttacca tgcccttggc cacgcccctc tttaatacga cgggcaattt gcacttcaga 3840
aaatgaagag tttgctttag ccataacaaa agtccagtat gctttttcac agcataactg 3900
gactgatttc agtttacaac tattctgtct agtttaagac tttattgtca tagtttagat 3960
ctattttgtt cagtttaaga ctttattgtc cgcccacacc cgcttacgc 4009
<210> 921
<211> 4009
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 921
aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aacaggaaga 60
aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aaatggagtt 120
tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta gcgtcgtaag 180
ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt atctggttcg 240
gatctcctag gcgatatcag tgatcacgga tctcgaccaa ttgacattat tgaagcaact 300
agtatcgatt ttatcagggt tattgtctca gaccactccc tctatgcgcg ctcgctcact 360
cactcggccc tggagaccaa aggtctccag actgccggcc tctggccggc agggccgagt 420
gagtgagcga gcgcgcatag agggagtggg tacctccatc atctaggttt gccagatctg 480
atatcggcgc gcccctgggc gcgcccgagt ccaacacccg tgggaatccc atgggcacca 540
tggcccctcg ctccaaaaat gctttcgcgt cgcgcagaca ctgctcggta gtttcgggga 600
tcagcgtttg agtaagagcc cgcgtctgaa ccctccgcgc cgccccggcc ccagtggaaa 660
gacgcgcagg caaaacgcac cacgtgacgg agcgtgaccg cgcgccgagc gcgcgccaag 720
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 780
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 840
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 900
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 960
ttgtggaaag gacgaaacac cgcaccagag taacagtctg acgtttaaga gctatgctgg 1020
aaacagcata gcaagtttaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1080
gtcggtgctt tttttgcggc cgcgctcggc gcgcccatat ttgcatgtcg ctatgtgttc 1140
tgggaaatca ccataaacgt gaaatgtctt tggatttggg aatcttataa gttctgtatg 1200
agaccacggt acaccgcacc agagtaacag tctgacgttt aagagctatg ctggaaacag 1260
catagcaagt ttaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 1320
gctttttttg cggccgctga cggcgcgccc tgcagtattt agcatgcccc acccatctgc 1380
aaggcattct ggatagtgtc aaaacagccg gaaatcaagt ccgtttatct caaactttag 1440
cattttggga ataaatgata tttgctatgc tggttaaatt agattttagt taaatttcct 1500
gctgaagctc tagtacgata agtaacttga cctaagtgta aagttgagat ttccttcagg 1560
tttatatagc ttgtgcgccg cctgggtaca ccgcaccaga gtaacagtct gacgtttaag 1620
agctatgctg gaaacagcat agcaagttta aataaggcta gtccgttatc aacttgaaaa 1680
agtggcaccg agtcggtgct ttttttgcgg ccgcgctgtt taaaccaaca aaatcagcag 1740
ctaatgaagg caagtcagca ggtcactcat cattttccac ttcggcaatg cagtgggatt 1800
attccaacag aggtttttca cagcattcct tcagttaact ggagatcgaa tcttgatttt 1860
cacagatata cttggcaagg tccgccctgt catcagcaca ttcaagcaga tctccatggc 1920
agcattccgt gtggacttag gtaagatctg tcactaactt ggaaacttct gcaaactcag 1980
cttagggaaa tctctggctc aggcgagcta ctgcctcagc ttagaaagct ctttctccaa 2040
attattggag actggcacac ttaagtccct gttaggcaga cgaagccttc ccttcatccc 2100
gaagttcatc gagctttggc aacaggcagg cagctttatc agcagcttgg caacattctg 2160
taaaagcagc tttatacctt taagcaaaga aaaggagttc cggggcataa aagtaaggat 2220
gtcttctggc aatttataat aagtattttt tcaaaaatgt ctcttcattg tcatgaaaag 2280
cagtgcatca cacatcaacc tctggtctca ccaatcgggg gaggtttggg ttgtttactt 2340
agtgttgcaa gaattatttt attctctcag gttcttgttt tgcacagcag tcagctcatt 2400
caccataggt ttcacgaaga gttgctgcgg ccgcctcgat aatacgactc actatagggt 2460
cgacgatatc agatctagga acccctagtg atggagttgg ccactccctc tctgcgcgct 2520
cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg 2580
gcctcagtga gcgagcgagc gcgcagagag ggagtggcat gcaagctgta gccaaccact 2640
agaactatag ctagagtcct gggcgaacaa acgatgctcg ccttccagaa aaccgaggat 2700
gcgaaccact tcatccgggg tcagcaccac cggcaagcgc cgcgacggcc gaggtcttcc 2760
gatctcctga agccagggca gatccgtgca cagcaccttg ccgtagaaga acagcaaggc 2820
cgccaatgcc tgacgatgcg tggagaccga aaccttgcgc tcgttcgcca gccaggacag 2880
aaatgcctcg acttcgctgc tgcccaaggt tgccgggtga cgcacaccgt ggaaacggat 2940
gaaggcacga acccagttga cataagcctg ttcggttcgt aaactgtaat gcaagtagcg 3000
tatgcgctca cgcaactggt ccagaacctt gaccgaacgc agcggtggta acggcgcagt 3060
ggcggttttc atggcttgtt atgactgttt ttttgtacag tctatgcctc gggcatccaa 3120
gcagcaagcg cgttacgccg tgggtcgatg tttgatgtta tggagcagca acgatgttac 3180
gcagcagcaa cgatgttacg cagcagggca gtcgccctaa aacaaagtta ggtggctcaa 3240
gtatgggcat cattcgcaca tgtaggctcg gccctgacca agtcaaatcc atgcgggctg 3300
ctcttgatct tttcggtcgt gagttcggag acgtagccac ctactcccaa catcagccgg 3360
actccgatta cctcgggaac ttgctccgta gtaagacatt catcgcgctt gctgccttcg 3420
accaagaagc ggttgttggc gctctcgcgg cttacgttct gcccaagttt gagcagccgc 3480
gtagtgagat ctatatctat gatctcgcag tctccggcga gcaccggagg cagggcattg 3540
ccaccgcgct catcaatctc ctcaagcatg aggccaacgc gcttggtgct tatgtgatct 3600
acgtgcaagc agattacggt gacgatcccg cagtggctct ctatacaaag ttgggcatac 3660
gggaagaagt gatgcacttt gatatcgacc caagtaccgc cacctaacaa ttcgttcaag 3720
ccgagatcgg cttcccggcc gcggagttgt tcggtaaatt gtcacaacgc cgcgaatata 3780
gtctttacca tgcccttggc cacgcccctc tttaatacga cgggcaattt gcacttcaga 3840
aaatgaagag tttgctttag ccataacaaa agtccagtat gctttttcac agcataactg 3900
gactgatttc agtttacaac tattctgtct agtttaagac tttattgtca tagtttagat 3960
ctattttgtt cagtttaaga ctttattgtc cgcccacacc cgcttacgc 4009
<210> 922
<211> 472
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 922
cgagtccaac acccgtggga atcccatggg caccatggcc cctcgctcca aaaatgcttt 60
cgcgtcgcgc agacactgct cggtagtttc ggggatcagc gtttgagtaa gagcccgcgt 120
ctgaaccctc cgcgccgccc cggccccagt ggaaagacgc gcaggcaaaa cgcaccacgt 180
gacggagcgt gaccgcgcgc cgagcgcgcg ccaaggtcgg gcaggaagag ggcctatttc 240
ccatgattcc ttcatatttg catatacgat acaaggctgt tagagagata attagaatta 300
atttgactgt aaacacaaag atattagtac aaaatacgtg acgtagaaag taataatttc 360
ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa 420
cttgaaagta tttcgatttc ttggctttat atatcttgtg gaaaggacga aa 472
<210> 923
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 923
gctcggcgcg cccatatttg catgtcgcta tgtgttctgg gaaatcacca taaacgtgaa 60
atgtctttgg atttgggaat cttataagtt ctgtatgaga ccacggta 108
<210> 924
<211> 251
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 924
tgacggcgcg ccctgcagta tttagcatgc cccacccatc tgcaaggcat tctggatagt 60
gtcaaaacag ccggaaatca agtccgttta tctcaaactt tagcattttg ggaataaatg 120
atatttgcta tgctggttaa attagatttt agttaaattt cctgctgaag ctctagtacg 180
ataagtaact tgacctaagt gtaaagttga gatttccttc aggtttatat agcttgtgcg 240
ccgcctgggt a 251
<210> 925
<211> 251
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 925
tgacggcgcg ccctgcagta tttagcatgc cccacccatc tgcaaggcat tctggatagt 60
gtcaaaacag ccggaaatca agtccgttta tctcaaactt tagcattttg ggaataaatg 120
atatttgcta tgctggttaa attagatttt agttaaattt cctgctgaag ctctagtacg 180
ataagtaact tgacctaagt gtaaagttga gatttccttc aggtttatat agcttgtgcg 240
ccgcctgggt a 251
<210> 926
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 926
caccgaaatg atgagtgaag ttatat 26
<210> 927
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 927
aaacatataa cttcactcat catttc 26
<210> 928
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 928
caccggtttg ttcaaaagcg tggct 25
<210> 929
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 929
aaacagccac gcttttgaac aaac 24
<210> 930
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 930
gaattgtaat acgactcact ataggaatga tgagtgaagt tatat 45
<210> 931
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 931
gaattgtaat acgactcact atagggtttg ttcaaaagcg tggct 45
<210> 932
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 932
aaaagcaccg actcggtgcc ac 22
<210> 933
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 933
caccggacac aatgtaggaa gcct 24
<210> 934
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 934
aaacaggctt cctacattgt gtcc 24
<210> 935
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 935
gaattgtaat acgactcact ggacacaatg taggaagcct 40
<210> 936
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 936
aaaagcaccg actcggtgcc ac 22
<210> 937
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 937
ggattgactg aaatgatggc caagg 25
<210> 938
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 938
ctgccacgat tactctgctt ccag 24
<210> 939
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 939
agcaggcaga gaaggtggta 20
<210> 940
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 940
gggcgtatct cttcatagcc tt 22
<210> 941
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 941
gcgtgtgtgt ttgtttaggg 20
<210> 942
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 942
caccgagagt aacagtctga ctgg 24
<210> 943
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 943
aaacgtcaga ctgttactct agtgc 25
<210> 944
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 944
caccgcacta gagtaacagt ctgac 25
<210> 945
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 945
aaacccagtc agactgttac tctc 24
<210> 946
<211> 141
<212> DNA
<213> Adeno associated virus
<400> 946
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120
gagcgcgcag agagggagtg g 141
<210> 947
<211> 20
<212> DNA
<213> Homo sapiens
<400> 947
cagagtaaca gtctgagtag 20
<210> 948
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 948
gtatgttgtg tggaattgtg ag 22
<210> 949
<211> 11
<212> PRT
<213> Homo sapiens
<400> 949
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr
1 5 10
<210> 950
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 950
Met Ser Glu Val Ser Ser Asp
1 5
<210> 951
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 951
Met Thr Glu Ile Ile Leu Leu Ile Phe Phe Pro Ala Tyr Phe Leu Asn
1 5 10 15
<210> 952
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 952
Met Ser Ala Arg Lys Leu Arg Asn Leu Ser Tyr Lys Lys
1 5 10
<210> 953
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 953
Met Leu His Arg Lys Thr Tyr His Val Lys
1 5 10
<210> 954
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 954
ctgccagtca gactgttact ctagtg 26
<210> 955
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 955
ctttactagt agtttgtctt ccatacct 28
<210> 956
<211> 26
<212> DNA
<213> Mus musculus
<400> 956
cactagagta acagtctgac tggcag 26
<210> 957
<211> 28
<212> DNA
<213> Mus musculus
<400> 957
aggtatggaa gacaaactac tagtaaag 28
<210> 958
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 958
aacactagct gccagtcaga ctgttactct agtg 34
<210> 959
<211> 34
<212> DNA
<213> Mus musculus
<400> 959
cactagagta acagtctgac tggcagctag tgtt 34
<210> 960
<211> 50
<212> DNA
<213> Mus musculus
<400> 960
ctttctttca aaaacactag ctgccagtca gactgttact ctagtgacac 50
<210> 961
<211> 51
<212> DNA
<213> Mus musculus
<400> 961
ctttctttca aaaacactag ctgccagtca agactgttac tctagtgaca c 51
<210> 962
<211> 14
<212> DNA
<213> Mus musculus
<400> 962
ctttctagtg acac 14
<210> 963
<211> 11
<212> DNA
<213> Mus musculus
<400> 963
ctttctttca c 11
<210> 964
<211> 18
<212> DNA
<213> Mus musculus
<400> 964
ctttctttct agtgacac 18
<210> 965
<211> 44
<212> DNA
<213> Mus musculus
<400> 965
ctttctttca aaaacactag ctgccactgt tactctagtg acac 44
<210> 966
<211> 46
<212> DNA
<213> Mus musculus
<400> 966
ctttctttca aaaacactag ctgccagact gttactctag tgacac 46
<210> 967
<211> 233
<212> DNA
<213> Mus musculus
<400> 967
ctgccagtca gactgttact ctagtgacac aatctgtggt tactaaggaa actgtcatct 60
ccaaactaga aatgccatct tctttgctgt tggaggtacc tgcactggca gacttcaacc 120
gagcttggac agaacttaca gactggctgt ctctgcttga tcgagttata aaatcacaga 180
gagtgatggt gggtgatctg gaagacatca atgaaatgat catcaaacag aag 233
<210> 968
<211> 233
<212> DNA
<213> Homo sapiens
<400> 968
ctcctactca gactgttact ctggtgacac aacctgtggt tactaaggaa actgccatct 60
ccaaactaga aatgccatct tccttgatgt tggaggtacc tgctctggca gatttcaacc 120
gggcttggac agaacttacc gactggcttt ctctgcttga tcaagttata aaatcacaga 180
gggtgatggt gggtgacctt gaggatatca acgagatgat catcaagcag aag 233
<210> 969
<211> 44
<212> DNA
<213> Homo sapiens
<400> 969
ttttagctcc tactcagact gttactctgg tgacacaacc tgtg 44
<210> 970
<211> 45
<212> DNA
<213> Homo sapiens
<400> 970
ttttagctcc tactcaagac tgttactctg gtgacacaac ctgtg 45
<210> 971
<211> 45
<212> DNA
<213> Homo sapiens
<400> 971
ttttagctcc tactccagac tgttactctg gtgacacaac ctgtg 45
<210> 972
<211> 42
<212> DNA
<213> Homo sapiens
<400> 972
ttttagctcc tacagactgt tactctggtg acacaacctg tg 42
<210> 973
<211> 43
<212> DNA
<213> Homo sapiens
<400> 973
ttttagctcc tactagactg ttactctggt gacacaacct gtg 43
<210> 974
<211> 42
<212> DNA
<213> Homo sapiens
<400> 974
ttttagctcc tactgactgt tactctggtg acacaacctg tg 42
<210> 975
<211> 41
<212> DNA
<213> Homo sapiens
<400> 975
ttttagctcc taagactgtt actctggtga cacaacctgt g 41
<210> 976
<211> 40
<212> DNA
<213> Homo sapiens
<400> 976
ttttagctcc cagactgtta ctctggtgac acaacctgtg 40
<210> 977
<211> 42
<212> DNA
<213> Homo sapiens
<400> 977
ttttagctcc tacagactgt tactctggtg acacaacctg tg 42
<210> 978
<211> 32
<212> DNA
<213> Homo sapiens
<400> 978
ctcagactgt tactctggtg acacaacctg tg 32
<210> 979
<211> 36
<212> DNA
<213> Mus musculus
<400> 979
acactagctg ccagtcagac tgttactcta gtgaca 36
<210> 980
<211> 37
<212> DNA
<213> Mus musculus
<400> 980
acactagctg ccagtcaaga ctgttactct agtgaca 37
<210> 981
<211> 36
<212> DNA
<213> Mus musculus
<400> 981
acactagctg ccagtcatac tgttactcta gtgaca 36
<210> 982
<211> 38
<212> DNA
<213> Mus musculus
<400> 982
acactagctg ccagtcatag actgttactc tagtgaca 38
<210> 983
<211> 36
<212> DNA
<213> Mus musculus
<400> 983
acactagctg ccagtcagac ttttactcta gtgaca 36
<210> 984
<211> 38
<212> DNA
<213> Mus musculus
<400> 984
acactagctg ccagtcaaag actgttactc tagtgaca 38
<210> 985
<211> 34
<212> DNA
<213> Mus musculus
<400> 985
acactagctg ccagtcactg ttactctagt gaca 34
<210> 986
<211> 38
<212> DNA
<213> Mus musculus
<400> 986
acactagctg ccagtcacag actgttactc tagtgaca 38
<210> 987
<211> 35
<212> DNA
<213> Mus musculus
<400> 987
acactagctg ccagtcgact gttactctag tgaca 35
<210> 988
<211> 32
<212> DNA
<213> Mus musculus
<400> 988
acactagctg ccagtctgtt actctagtga ca 32
<210> 989
<211> 30
<212> DNA
<213> Mus musculus
<400> 989
acactagctg agactgttac tctagtgaca 30
<210> 990
<211> 32
<212> DNA
<213> Mus musculus
<400> 990
acactagctg ccagtcagtt actctagtga ca 32
<210> 991
<211> 36
<212> DNA
<213> Mus musculus
<400> 991
acactagctg ccagtcagac tgttactcta gtgaca 36
<210> 992
<211> 37
<212> DNA
<213> Mus musculus
<400> 992
acactagctg ccagtcaaga ctgttactct agtgaca 37
<210> 993
<211> 36
<212> DNA
<213> Mus musculus
<400> 993
acactagctg ccagtcatac tgttactcta gtgaca 36
<210> 994
<211> 34
<212> DNA
<213> Mus musculus
<400> 994
acactagctg ccagtcactg ttactctagt gaca 34
<210> 995
<211> 38
<212> DNA
<213> Mus musculus
<400> 995
acactagctg ccagtcacag actgttactc tagtgaca 38
<210> 996
<211> 38
<212> DNA
<213> Mus musculus
<400> 996
acactagctg ccagtcatag actgttactc tagtgaca 38
<210> 997
<211> 38
<212> DNA
<213> Mus musculus
<400> 997
acactagctg ccagtcaaag actgttactc tagtgaca 38
<210> 998
<211> 37
<212> DNA
<213> Mus musculus
<400> 998
acactagctg ccagtcaaga cttttactct agtgaca 37
<210> 999
<211> 36
<212> DNA
<213> Mus musculus
<400> 999
acactagctg ccagtcagcc tgttactcta gtgaca 36
<210> 1000
<211> 35
<212> DNA
<213> Mus musculus
<400> 1000
acactagctg ccagtcgact gttactctag tgaca 35
<210> 1001
<211> 35
<212> DNA
<213> Mus musculus
<400> 1001
acactagctg ccagtcatgt cactagagta acagt 35
<210> 1002
<211> 33
<212> DNA
<213> Mus musculus
<400> 1002
acactagctg ccagtcatgt tactctagtg aca 33
<210> 1003
<211> 36
<212> DNA
<213> Mus musculus
<400> 1003
acactagctg ccagtcagac tgttactcta gtgaca 36
<210> 1004
<211> 37
<212> DNA
<213> Mus musculus
<400> 1004
acactagctg ccagtcaaga ctgttactct agtgaca 37
<210> 1005
<211> 36
<212> DNA
<213> Mus musculus
<400> 1005
acactagctg ccagtcatac tgttactcta gtgaca 36
<210> 1006
<211> 38
<212> DNA
<213> Mus musculus
<400> 1006
acactagctg ccagtcaaag actgttactc tagtgaca 38
<210> 1007
<211> 37
<212> DNA
<213> Mus musculus
<400> 1007
acactagctg ccagtcaaga cttttactct agtgaca 37
<210> 1008
<211> 35
<212> DNA
<213> Mus musculus
<400> 1008
acactagctg ccagtcatgt cactagagta acagt 35
<210> 1009
<211> 37
<212> DNA
<213> Mus musculus
<400> 1009
acactaggct gccagtcaaa ctgttactct agtgaca 37
<210> 1010
<211> 34
<212> DNA
<213> Mus musculus
<400> 1010
acactagctg ccagtctgtc actagagtaa cagt 34
<210> 1011
<211> 36
<212> DNA
<213> Mus musculus
<400> 1011
acactagctg ccagtccgac tgttactcta gtgaca 36
<210> 1012
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 1012
acactagctg ccagttagac tgttactcta gtgaca 36
<210> 1013
<211> 32
<212> DNA
<213> Mus musculus
<400> 1013
acactagctg ccagttgtca ctagagtaac ag 32
<210> 1014
<211> 30
<212> DNA
<213> Mus musculus
<400> 1014
acactagctg ccagtcatgt cactagagta 30
<210> 1015
<211> 51
<212> DNA
<213> Mus musculus
<400> 1015
ctgagcacta ctggagcctc tgccagtcag actgttactc tagtgacaca a 51
<210> 1016
<211> 17
<212> PRT
<213> Mus musculus
<400> 1016
Leu Ser Thr Thr Gly Ala Ser Ala Ser Gln Thr Val Thr Leu Val Thr
1 5 10 15
Gln
<210> 1017
<211> 50
<212> DNA
<213> Mus musculus
<400> 1017
agcactcagc cagtgaagct gccagtcaga ctgttactct agtgacacaa 50
<210> 1018
<211> 13
<212> PRT
<213> Mus musculus
<400> 1018
Ser Thr Gln Pro Val Lys Leu Pro Val Arg Leu Leu Leu
1 5 10
<210> 1019
<211> 51
<212> DNA
<213> Mus musculus
<400> 1019
agcactcagc cagtgaagct gccagtcaag actgttactc tagtgacaca a 51
<210> 1020
<211> 17
<212> PRT
<213> Mus musculus
<400> 1020
Ser Thr Gln Pro Val Lys Leu Pro Val Lys Thr Val Thr Leu Val Thr
1 5 10 15
Gln
<210> 1021
<211> 51
<212> DNA
<213> Mus musculus
<400> 1021
agcactcagc cagtgaaggc aacactgcaa gatttggaac agagacgccc c 51
<210> 1022
<211> 17
<212> PRT
<213> Mus musculus
<400> 1022
Ser Thr Gln Pro Val Lys Ala Thr Leu Gln Asp Leu Glu Gln Arg Arg
1 5 10 15
Pro
<210> 1023
<211> 46
<212> DNA
<213> Mus musculus
<400> 1023
aagctgccag tcaagactgt tactctagtg acacaatctg tggtta 46
<210> 1024
<211> 45
<212> DNA
<213> Mus musculus
<400> 1024
aagctgccag tcagactgtt actctagtga cacaatctgt ggtta 45
<210> 1025
<211> 46
<212> DNA
<213> Mus musculus
<400> 1025
aagctgccag tcaagactgt tactctagtg acacaatctg tggtta 46
<210> 1026
<211> 45
<212> DNA
<213> Mus musculus
<400> 1026
aagctgccag tcagactgtt actctagtga cacaatctgt ggtta 45
Claims (186)
- 제1 게놈 표적 서열(genomic target sequence)을 표적화하는 제1 DMD(Duchenne muscular dystrophy) 가이드 RNA를 암호화하는 서열,
제2 게놈 표적 서열을 표적화하는 제2 DMD 가이드 RNA를 암호화하는 서열,
제3 게놈 표적 서열을 표적화하는 제3 DMD 가이드 RNA를 암호화하는 서열,
제1 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키는 제1 프로모터,
제2 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동시키는 제2 프로모터, 및
제3 DMD 가이드 RNA를 암호화하는 서열의 발현을 구동하는 제3 프로모터
를 포함하는 핵산으로서,
제1 DMD 가이드 RNA를 암호화하는 서열, 제2 DMD 가이드 RNA를 암호화하는 서열, 및 제3 DMD 가이드 RNA를 암호화하는 서열이 동일하며, 디스트로핀 유전자 내의 서열을 표적화하고,
제1 DMD 가이드 RNA를 암호화하는 서열, 제2 DMD 가이드 RNA를 암호화하는 서열, 및 제3 DMD 가이드 RNA를 암호화하는 서열이 각각 서열번호 714의 서열을 포함하는, 핵산. - 제1항에 있어서, 제1 DMD 가이드 RNA를 암호화하는 서열, 제2 DMD 가이드 RNA를 암호화하는 서열, 및 제3 DMD 가이드 RNA를 암호화하는 서열이 디스트로핀 스플라이스 수용체 부위를 표적화하는, 핵산.
- 제1항 또는 제2항에 있어서, 제1 프로모터, 제2 프로모터, 및 제3 프로모터 중 적어도 2개가 동일한, 핵산.
- 제1항 또는 제2항에 있어서, 제1 프로모터, 제2 프로모터, 및 제3 프로모터 중 적어도 2개가 동일하지 않은, 핵산.
- 제1항 또는 제2항에 있어서, 디스트로핀 내 표적 서열이 스플라이스 수용체 부위를 포함하되, 상기 스플라이스 수용체 부위가 엑손 51의 5' 스플라이스 수용체 부위인, 핵산.
- 제1항 또는 제2항에 있어서, 제1 프로모터, 제2 프로모터, 또는 제3 프로모터 중 적어도 하나가 구성적 프로모터를 포함하는, 핵산.
- 제1항 또는 제2항에 있어서, 제1 프로모터, 제2 프로모터, 또는 제3 프로모터 중 적어도 하나가 유도성 프로모터를 포함하는, 핵산.
- 제1항 또는 제2항에 있어서, 제1 프로모터, 제2 프로모터, 또는 제3 프로모터 중 적어도 하나가 세포형(cell-type) 특이적인 프로모터를 포함하는, 핵산.
- 제8항에 있어서, 세포형 특이적인 프로모터가 근육-특이적인 프로모터인, 핵산.
- 제1항에 있어서, 제1 프로모터, 제2 프로모터, 및 제3 프로모터 중 적어도 하나가 U6 프로모터, H1 프로모터, 또는 7SK 프로모터로부터 선택되는, 핵산.
- 제1항에 있어서, 제1 프로모터가 U6 프로모터이고, 제2 프로모터가 H1 프로모터이며, 제3 프로모터가 7SK 프로모터인, 핵산.
- 제1항 또는 제2항에 있어서,
a) 제1 프로모터가 U6 프로모터이고, 제2 프로모터가 H1 프로모터이고, 제3 프로모터가 7SK 프로모터이거나;
b) 제1 프로모터가 U6 프로모터이고, 제2 프로모터가 7SK 프로모터이고, 제3 프로모터가 H1 프로모터이거나; 또는
c) 제1 프로모터가 H1 프로모터이고, 제2 프로모터가 7SK 프로모터이고, 제3 프로모터가 U6 프로모터인, 핵산. - DMD 가이드 RNA(gRNA)를 암호화하는 서열의 3개 카피를 포함하는 핵산으로서, 상기 gRNA가 DMD 가이드 RNA 및 spCas9 스캐폴드를 포함하고, 상기 DMD 가이드 RNA의 서열이 서열번호 714의 서열을 포함하고, 상기 gRNA의 각 카피가 자신의 프로모터에 의해 발현되는, 핵산.
- 제13항에 있어서, gRNA가 단일-가이드 RNA(sgRNA)인, 핵산.
- 제1항, 제2항, 또는 제14항에 있어서, 핵산이 DNA 서열을 포함하는, 핵산.
- 제1항, 제2항, 또는 제14항에 있어서, 핵산이 RNA 서열을 포함하는, 핵산.
- 제1항 또는 제2항에 있어서, 핵산이 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 및 3' ITR을 암호화하는 서열을 추가로 포함하는, 핵산.
- 제1항 또는 제2항에 있어서, 5' 역위된 말단 반복물(ITR)을 암호화하는 서열 또는 3' ITR을 암호화하는 서열이 아데노-관련 바이러스(AAV)로부터 단리되거나 유래된 서열을 포함하고, 선택적으로 상기 AAV가 AAV2 및 AAV4, 또는 이들의 조합으로부터 선택되는, 핵산.
- 제1항 또는 제2항의 핵산을 포함하는, 근 이영양증(muscular dystrophy)의 치료를 필요로 하는 대상체에서 근 이영양증을 치료하기 위한 약제.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762442606P | 2017-01-05 | 2017-01-05 | |
US62/442,606 | 2017-01-05 | ||
US201762544449P | 2017-08-11 | 2017-08-11 | |
US62/544,449 | 2017-08-11 | ||
US201762596298P | 2017-12-08 | 2017-12-08 | |
US62/596,298 | 2017-12-08 | ||
PCT/US2018/012558 WO2018129296A1 (en) | 2017-01-05 | 2018-01-05 | Optimized strategy for exon skipping modifications using crispr/cas9 with triple guide sequences |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190100967A KR20190100967A (ko) | 2019-08-29 |
KR102606174B1 true KR102606174B1 (ko) | 2023-11-27 |
Family
ID=61193018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197022753A KR102606174B1 (ko) | 2017-01-05 | 2018-01-05 | 트리플 가이드 서열을 지닌 crispr/cas9를 사용한 엑손 스키핑 변형을 위한 최적화된 전략 |
Country Status (21)
Country | Link |
---|---|
US (1) | US20190338311A1 (ko) |
EP (1) | EP3565897A1 (ko) |
JP (1) | JP2020503869A (ko) |
KR (1) | KR102606174B1 (ko) |
CN (1) | CN110506115A (ko) |
AU (1) | AU2018205521A1 (ko) |
BR (1) | BR112019013962A2 (ko) |
CA (1) | CA3048635A1 (ko) |
CL (1) | CL2019001882A1 (ko) |
CO (1) | CO2019008181A2 (ko) |
CR (1) | CR20190326A (ko) |
DO (1) | DOP2019000179A (ko) |
EC (1) | ECSP19056408A (ko) |
IL (1) | IL267786A (ko) |
JO (1) | JOP20190166A1 (ko) |
MA (1) | MA47239A (ko) |
MX (1) | MX2019008064A (ko) |
PE (1) | PE20191357A1 (ko) |
PH (1) | PH12019501561A1 (ko) |
SG (1) | SG11201906147VA (ko) |
WO (1) | WO2018129296A1 (ko) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
JP6929791B2 (ja) | 2015-02-09 | 2021-09-01 | デューク ユニバーシティ | エピゲノム編集のための組成物および方法 |
WO2017066497A2 (en) | 2015-10-13 | 2017-04-20 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
EP3617311A4 (en) * | 2017-03-30 | 2021-04-21 | Kyoto University | METHOD FOR THE INDUCTION OF EXON SKIPPING BY GENOME EDITIING |
WO2019136216A1 (en) * | 2018-01-05 | 2019-07-11 | The Board Of Regents Of The University Of Texas System | Therapeutic crispr/cas9 compositions and methods of use |
US20210261962A1 (en) * | 2018-06-21 | 2021-08-26 | The Board Of Regents Of The University Of Texas System | Correction of dystrophin exon 43, exon 45, or exon 52 deletions in duchenne muscular dystrophy |
US11168141B2 (en) | 2018-08-02 | 2021-11-09 | Dyne Therapeutics, Inc. | Muscle targeting complexes and uses thereof for treating dystrophinopathies |
EP3830259A4 (en) | 2018-08-02 | 2022-05-04 | Dyne Therapeutics, Inc. | MUSCLE TARGETING COMPLEXES AND THEIR USES FOR THE TREATMENT OF FACIOSCAPULOHUMERAL MUSCULAR DYSTROPHY |
EP3829595A4 (en) | 2018-08-02 | 2022-08-24 | Dyne Therapeutics, Inc. | MUSCLE TARGETING COMPLEXES AND THEIR USES FOR THE TREATMENT OF DYSTROPHINOPATHIES |
WO2020122104A1 (ja) * | 2018-12-11 | 2020-06-18 | 国立大学法人京都大学 | ゲノムdnaに欠失を誘導する方法 |
WO2020142714A1 (en) * | 2019-01-04 | 2020-07-09 | Exonics Therapeutics, Inc. | Aav expression cassette and aav vectors comprising the same |
SG11202109550TA (en) | 2019-03-07 | 2021-09-29 | Univ Columbia | Rna-guided dna integration using tn7-like transposons |
US20220177879A1 (en) * | 2019-04-12 | 2022-06-09 | Duke University | Crispr/cas-based base editing composition for restoring dystrophin function |
US20220177876A1 (en) * | 2019-04-12 | 2022-06-09 | The Regents Of The University Of California | Compositions and Methods for Modifying Dystrophin Genes |
US20210047649A1 (en) | 2019-05-08 | 2021-02-18 | Vertex Pharmaceuticals Incorporated | Crispr/cas all-in-two vector systems for treatment of dmd |
KR102264115B1 (ko) * | 2019-05-10 | 2021-06-14 | 한국과학기술연구원 | 무-운반체 다중 CRISPR/Cas 9 유전자 편집 복합체 및 그의 용도 |
CN110499333A (zh) * | 2019-08-01 | 2019-11-26 | 广州德赫生物科技有限公司 | 用于修复dmd基因突变的核酸序列及系统 |
US20240091379A1 (en) * | 2019-10-11 | 2024-03-21 | Yale University | Compositions and methods for upregulating isoforms of dystrophin as therapy for duchenne muscular dystrophy (dmd) |
CN114846146B (zh) * | 2019-10-29 | 2024-04-12 | 基恩科雷有限责任公司 | 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途 |
CN111172191B (zh) * | 2020-02-21 | 2020-12-22 | 浙江大学 | 一种高效基因敲除载体及其应用 |
CN115011598A (zh) * | 2020-09-02 | 2022-09-06 | 西湖大学 | 杜氏肌营养不良症相关的外显子剪接增强子、sgRNA、基因编辑工具及应用 |
US11771776B2 (en) | 2021-07-09 | 2023-10-03 | Dyne Therapeutics, Inc. | Muscle targeting complexes and uses thereof for treating dystrophinopathies |
US11638761B2 (en) | 2021-07-09 | 2023-05-02 | Dyne Therapeutics, Inc. | Muscle targeting complexes and uses thereof for treating Facioscapulohumeral muscular dystrophy |
WO2023159103A1 (en) * | 2022-02-17 | 2023-08-24 | The Board Of Regents Of The University Of Texas System | CRISPR/SpCas9 VARIANT AND METHODS FOR ENHANCED CORRECTON OF DUCHENNE MUSCULAR DYSTROPHY MUTATIONS |
WO2023172116A1 (ko) * | 2022-03-10 | 2023-09-14 | 주식회사 진코어 | 듀센 근이영양증 치료를 위한 유전자 편집 시스템 및 이를 이용한 질병 치료 방법 |
CN115820642B (zh) * | 2022-11-11 | 2023-10-10 | 昆明理工大学 | 一种用于治疗杜氏肌营养不良症的CRISPR-Cas9系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014197748A2 (en) * | 2013-06-05 | 2014-12-11 | Duke University | Rna-guided gene editing and gene regulation |
WO2016025469A1 (en) | 2014-08-11 | 2016-02-18 | The Board Of Regents Of The University Of Texas System | Prevention of muscular dystrophy by crispr/cas9-mediated gene editing |
WO2016164356A1 (en) * | 2015-04-06 | 2016-10-13 | The Board Of Trustees Of The Leland Stanford Junior University | Chemically modified guide rnas for crispr/cas-mediated gene regulation |
US20170362635A1 (en) | 2016-06-20 | 2017-12-21 | University Of Washington | Muscle-specific crispr/cas9 editing of genes |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2385492T3 (es) * | 2004-04-02 | 2012-07-25 | Board Of Regents, The University Of Texas System | Promotores específicos de cáncer |
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
EP3116533B1 (en) * | 2014-03-12 | 2020-08-12 | Precision Biosciences, Inc. | Dystrophin gene exon deletion using engineered nucleases |
US20170266320A1 (en) * | 2014-12-01 | 2017-09-21 | President And Fellows Of Harvard College | RNA-Guided Systems for In Vivo Gene Editing |
KR102684387B1 (ko) * | 2015-01-16 | 2024-07-11 | 유니버시티 오브 워싱톤 | 신규한 마이크로-디스트로핀 및 관련된 사용 방법 |
EP3289081B1 (en) * | 2015-04-27 | 2019-03-27 | Genethon | Compositions and methods for the treatment of nucleotide repeat expansion disorders |
CA3000931A1 (en) * | 2015-10-28 | 2017-05-04 | Crispr Therapeutics Ag | Materials and methods for treatment of duchenne muscular dystrophy |
KR20180081618A (ko) * | 2015-11-30 | 2018-07-16 | 듀크 유니버시티 | 유전자 편집에 의한 인간 디스트로핀 유전자의 교정을 위한 치료용 표적 및 사용 방법 |
-
2017
- 2017-06-16 JO JOP/2019/0166A patent/JOP20190166A1/ar unknown
-
2018
- 2018-01-05 BR BR112019013962-1A patent/BR112019013962A2/pt unknown
- 2018-01-05 JP JP2019536508A patent/JP2020503869A/ja active Pending
- 2018-01-05 CN CN201880010288.7A patent/CN110506115A/zh active Pending
- 2018-01-05 WO PCT/US2018/012558 patent/WO2018129296A1/en active Application Filing
- 2018-01-05 MX MX2019008064A patent/MX2019008064A/es unknown
- 2018-01-05 US US16/476,137 patent/US20190338311A1/en active Pending
- 2018-01-05 CA CA3048635A patent/CA3048635A1/en active Pending
- 2018-01-05 CR CR20190326A patent/CR20190326A/es unknown
- 2018-01-05 PE PE2019001384A patent/PE20191357A1/es unknown
- 2018-01-05 KR KR1020197022753A patent/KR102606174B1/ko active IP Right Grant
- 2018-01-05 EP EP18704637.0A patent/EP3565897A1/en active Pending
- 2018-01-05 SG SG11201906147VA patent/SG11201906147VA/en unknown
- 2018-01-05 MA MA047239A patent/MA47239A/fr unknown
- 2018-01-05 AU AU2018205521A patent/AU2018205521A1/en not_active Abandoned
-
2019
- 2019-07-02 IL IL267786A patent/IL267786A/en unknown
- 2019-07-02 PH PH12019501561A patent/PH12019501561A1/en unknown
- 2019-07-05 CL CL2019001882A patent/CL2019001882A1/es unknown
- 2019-07-05 DO DO2019000179A patent/DOP2019000179A/es unknown
- 2019-07-29 CO CO2019008181A patent/CO2019008181A2/es unknown
- 2019-08-06 EC ECSENADI201956408A patent/ECSP19056408A/es unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014197748A2 (en) * | 2013-06-05 | 2014-12-11 | Duke University | Rna-guided gene editing and gene regulation |
WO2016025469A1 (en) | 2014-08-11 | 2016-02-18 | The Board Of Regents Of The University Of Texas System | Prevention of muscular dystrophy by crispr/cas9-mediated gene editing |
WO2016164356A1 (en) * | 2015-04-06 | 2016-10-13 | The Board Of Trustees Of The Leland Stanford Junior University | Chemically modified guide rnas for crispr/cas-mediated gene regulation |
US20170362635A1 (en) | 2016-06-20 | 2017-12-21 | University Of Washington | Muscle-specific crispr/cas9 editing of genes |
Also Published As
Publication number | Publication date |
---|---|
CR20190326A (es) | 2019-10-02 |
CN110506115A (zh) | 2019-11-26 |
BR112019013962A2 (pt) | 2020-02-11 |
IL267786A (en) | 2019-09-26 |
EP3565897A1 (en) | 2019-11-13 |
WO2018129296A1 (en) | 2018-07-12 |
KR20190100967A (ko) | 2019-08-29 |
MX2019008064A (es) | 2020-07-20 |
PH12019501561A1 (en) | 2019-09-09 |
JOP20190166A1 (ar) | 2019-07-02 |
ECSP19056408A (es) | 2019-09-30 |
US20190338311A1 (en) | 2019-11-07 |
CL2019001882A1 (es) | 2019-10-04 |
JP2020503869A (ja) | 2020-02-06 |
CA3048635A1 (en) | 2018-07-12 |
PE20191357A1 (es) | 2019-10-01 |
AU2018205521A1 (en) | 2019-07-18 |
DOP2019000179A (es) | 2019-11-15 |
MA47239A (fr) | 2019-11-13 |
SG11201906147VA (en) | 2019-08-27 |
CO2019008181A2 (es) | 2019-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102606174B1 (ko) | 트리플 가이드 서열을 지닌 crispr/cas9를 사용한 엑손 스키핑 변형을 위한 최적화된 전략 | |
KR20200116933A (ko) | 인간 심근세포에서 디스트로핀 돌연변이를 교정하기 위한 조성물 및 방법 | |
AU2020270508B2 (en) | C/EBP alpha short activating RNA compositions and methods of use | |
AU2018267625B2 (en) | COMPOSITIONS AND METHODS FOR MODULATING APOLIPOPROTEIN (a) EXPRESSION | |
KR20200044793A (ko) | Aav의 전달을 위한 조성물 및 방법 | |
KR102392236B1 (ko) | 조절성 폴리뉴클레오티드 | |
KR102427379B1 (ko) | 헌팅톤 질환을 치료하기 위한 조성물 및 방법 | |
KR102185465B1 (ko) | 부계 ube3a 발현을 유도하기 위한 올리고뉴클레오티드 | |
KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
KR20210049859A (ko) | 게놈을 조절하는 방법 및 조성물 | |
KR20230053735A (ko) | 게놈의 조정을 위한 개선된 방법 및 조성물 | |
RU2748495C2 (ru) | Способы и композиции для модулирования экспрессии аполипопротеина (а) | |
KR20200018455A (ko) | 파킨슨병의 치료를 위한 aadc 폴리뉴클레오티드 | |
AU2016376191A1 (en) | Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration | |
KR20080043892A (ko) | 단일 카피 게놈 교잡 프로브 및 이의 생성 방법 | |
WO1995014772A1 (fr) | Signature genique | |
KR20210068068A (ko) | 조작된 프로모터를 갖는 프라탁신 발현 구축물 및 그의 사용 방법 | |
KR20200126997A (ko) | 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법 | |
TW202221125A (zh) | 用於治療與葡萄糖神經醯胺酶β缺陷相關之神經病症的組合物及方法 | |
KR20220113743A (ko) | 병태 및 질환의 치료를 위한 안티센스 올리고머 | |
KR20210082193A (ko) | 소형화 디스트로핀 및 그의 용도 | |
KR20230069157A (ko) | GJB2를 코딩하는 재조합 아데노 연관 바이러스 (rAAV) 및 그의 용도 | |
CN113677697B (zh) | 使用重叠的aav载体生产大型拟抗肌萎缩蛋白 | |
TW202426651A (zh) | 具有工程化之啟動子之共濟蛋白(frataxin)表現構築體及其使用方法 | |
KR20230066453A (ko) | 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |