KR20240027595A - 청력 손실 치료를 위한 유전자 치료 구축물 및 방법 - Google Patents
청력 손실 치료를 위한 유전자 치료 구축물 및 방법 Download PDFInfo
- Publication number
- KR20240027595A KR20240027595A KR1020237043139A KR20237043139A KR20240027595A KR 20240027595 A KR20240027595 A KR 20240027595A KR 1020237043139 A KR1020237043139 A KR 1020237043139A KR 20237043139 A KR20237043139 A KR 20237043139A KR 20240027595 A KR20240027595 A KR 20240027595A
- Authority
- KR
- South Korea
- Prior art keywords
- promoter
- leu
- strc
- hearing loss
- seq
- Prior art date
Links
- 208000016354 hearing loss disease Diseases 0.000 title claims abstract description 154
- 206010011878 Deafness Diseases 0.000 title claims abstract description 150
- 230000010370 hearing loss Effects 0.000 title claims abstract description 139
- 231100000888 hearing loss Toxicity 0.000 title claims abstract description 139
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000001415 gene therapy Methods 0.000 title description 24
- 239000013598 vector Substances 0.000 claims abstract description 109
- 230000035772 mutation Effects 0.000 claims abstract description 43
- 101150044746 Strc gene Proteins 0.000 claims abstract description 22
- 101000585180 Homo sapiens Stereocilin Proteins 0.000 claims abstract description 19
- 210000004027 cell Anatomy 0.000 claims description 113
- 150000007523 nucleic acids Chemical group 0.000 claims description 106
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 54
- 102000039446 nucleic acids Human genes 0.000 claims description 53
- 108020004707 nucleic acids Proteins 0.000 claims description 53
- 210000003027 ear inner Anatomy 0.000 claims description 43
- 239000013604 expression vector Substances 0.000 claims description 39
- 230000002068 genetic effect Effects 0.000 claims description 39
- 239000003623 enhancer Substances 0.000 claims description 35
- 241000701024 Human betaherpesvirus 5 Species 0.000 claims description 21
- 210000004263 induced pluripotent stem cell Anatomy 0.000 claims description 21
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 claims description 20
- 210000000130 stem cell Anatomy 0.000 claims description 15
- 238000002347 injection Methods 0.000 claims description 14
- 239000007924 injection Substances 0.000 claims description 14
- 229920001184 polypeptide Polymers 0.000 claims description 14
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 14
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 14
- 241000701022 Cytomegalovirus Species 0.000 claims description 11
- 210000001062 endolymphatic sac Anatomy 0.000 claims description 10
- 101150016977 pou4f3 gene Proteins 0.000 claims description 10
- 239000012528 membrane Substances 0.000 claims description 9
- 210000004379 membrane Anatomy 0.000 claims description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 7
- 210000000262 cochlear duct Anatomy 0.000 claims description 7
- 239000008194 pharmaceutical composition Substances 0.000 claims description 6
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 5
- 238000011830 transgenic mouse model Methods 0.000 claims description 4
- 210000002768 hair cell Anatomy 0.000 abstract description 38
- 238000011282 treatment Methods 0.000 abstract description 17
- 239000000203 mixture Substances 0.000 abstract description 13
- 238000012546 transfer Methods 0.000 abstract description 11
- 102100029924 Stereocilin Human genes 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 10
- 230000004083 survival effect Effects 0.000 abstract description 8
- 230000007423 decrease Effects 0.000 abstract description 5
- 230000002265 prevention Effects 0.000 abstract description 3
- 108090000623 proteins and genes Proteins 0.000 description 93
- 230000014509 gene expression Effects 0.000 description 40
- 102000004169 proteins and genes Human genes 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 23
- 241000699670 Mus sp. Species 0.000 description 22
- 239000013603 viral vector Substances 0.000 description 21
- 238000012360 testing method Methods 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 17
- 108090000288 Glycoproteins Proteins 0.000 description 16
- 102000003886 Glycoproteins Human genes 0.000 description 16
- 238000012217 deletion Methods 0.000 description 16
- 230000037430 deletion Effects 0.000 description 16
- 241000282412 Homo Species 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 108020004999 messenger RNA Proteins 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 241000699666 Mus <mouse, genus> Species 0.000 description 14
- 230000003612 virological effect Effects 0.000 description 13
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 12
- 206010011891 Deafness neurosensory Diseases 0.000 description 12
- 208000009966 Sensorineural Hearing Loss Diseases 0.000 description 12
- 239000013543 active substance Substances 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 12
- 239000002245 particle Substances 0.000 description 12
- 231100000879 sensorineural hearing loss Toxicity 0.000 description 12
- 208000023573 sensorineural hearing loss disease Diseases 0.000 description 12
- 241000700605 Viruses Species 0.000 description 11
- -1 cationic lipid Chemical class 0.000 description 11
- 231100000895 deafness Toxicity 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- 238000010172 mouse model Methods 0.000 description 11
- 238000010361 transduction Methods 0.000 description 11
- 230000026683 transduction Effects 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 10
- 210000000349 chromosome Anatomy 0.000 description 10
- 210000003477 cochlea Anatomy 0.000 description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 10
- 210000000883 ear external Anatomy 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 238000000338 in vitro Methods 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 108091033409 CRISPR Proteins 0.000 description 9
- 206010010356 Congenital anomaly Diseases 0.000 description 9
- 241000702421 Dependoparvovirus Species 0.000 description 9
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 9
- 239000007943 implant Substances 0.000 description 9
- 201000006790 nonsyndromic deafness Diseases 0.000 description 9
- 238000004806 packaging method and process Methods 0.000 description 9
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 8
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 8
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 8
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 8
- 108700019146 Transgenes Proteins 0.000 description 8
- 230000036244 malformation Effects 0.000 description 8
- 210000000056 organ Anatomy 0.000 description 8
- 230000001225 therapeutic effect Effects 0.000 description 8
- 241000713666 Lentivirus Species 0.000 description 7
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 7
- 241000124008 Mammalia Species 0.000 description 7
- 108091008109 Pseudogenes Proteins 0.000 description 7
- 102000057361 Pseudogenes Human genes 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 201000010099 disease Diseases 0.000 description 7
- 238000010212 intracellular staining Methods 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 210000001778 pluripotent stem cell Anatomy 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 241001430294 unidentified retrovirus Species 0.000 description 7
- 101150054854 POU1F1 gene Proteins 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 102000005962 receptors Human genes 0.000 description 6
- 108020003175 receptors Proteins 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 230000001177 retroviral effect Effects 0.000 description 6
- 101150056399 slc20a1 gene Proteins 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 108091092195 Intron Proteins 0.000 description 5
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 5
- 150000001413 amino acids Chemical class 0.000 description 5
- 238000010171 animal model Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 238000000684 flow cytometry Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000010362 genome editing Methods 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 210000000067 inner hair cell Anatomy 0.000 description 5
- 210000004962 mammalian cell Anatomy 0.000 description 5
- 210000004789 organ system Anatomy 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000010374 somatic cell nuclear transfer Methods 0.000 description 5
- 210000001323 spiral ganglion Anatomy 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 239000011534 wash buffer Substances 0.000 description 5
- 239000013607 AAV vector Substances 0.000 description 4
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 4
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 4
- 108090000565 Capsid Proteins Proteins 0.000 description 4
- 102100023321 Ceruloplasmin Human genes 0.000 description 4
- 101150083557 Ear gene Proteins 0.000 description 4
- 102100037156 Gap junction beta-2 protein Human genes 0.000 description 4
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 4
- 101000954092 Homo sapiens Gap junction beta-2 protein Proteins 0.000 description 4
- 102100034349 Integrase Human genes 0.000 description 4
- 108010001831 LDL receptors Proteins 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 4
- 108020005196 Mitochondrial DNA Proteins 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000002513 implantation Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 230000000750 progressive effect Effects 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- 230000001953 sensory effect Effects 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 3
- 241001128034 Amphotropic murine leukemia virus Species 0.000 description 3
- 101150104873 BARHL1 gene Proteins 0.000 description 3
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 3
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 102100028062 Cation channel sperm-associated protein 2 Human genes 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 3
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 3
- 101000666127 Homo sapiens Whirlin Proteins 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- 208000026350 Inborn Genetic disease Diseases 0.000 description 3
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 3
- 208000008719 Mixed Conductive-Sensorineural Hearing Loss Diseases 0.000 description 3
- 241000714177 Murine leukemia virus Species 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 102000004230 Neurotrophin 3 Human genes 0.000 description 3
- 108090000742 Neurotrophin 3 Proteins 0.000 description 3
- 102000011383 Prestin Human genes 0.000 description 3
- 108050001617 Prestin Proteins 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 3
- 241000700584 Simplexvirus Species 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 241000700618 Vaccinia virus Species 0.000 description 3
- 102100038102 Whirlin Human genes 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 210000000133 brain stem Anatomy 0.000 description 3
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000003915 cell function Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000002648 combination therapy Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 210000000959 ear middle Anatomy 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 238000001476 gene delivery Methods 0.000 description 3
- 208000016361 genetic disease Diseases 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 102000054369 human STRC Human genes 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000008140 language development Effects 0.000 description 3
- 230000004777 loss-of-function mutation Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 229940032018 neurotrophin 3 Drugs 0.000 description 3
- 210000002985 organ of corti Anatomy 0.000 description 3
- 230000004853 protein function Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 210000002480 semicircular canal Anatomy 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 210000001082 somatic cell Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- 238000002054 transplantation Methods 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- SCPRYBYMKVYVND-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-4-methylpentanoyl)pyrrolidine-2-carbonyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(O)=O SCPRYBYMKVYVND-UHFFFAOYSA-N 0.000 description 2
- 102100036799 Adhesion G-protein coupled receptor V1 Human genes 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000700198 Cavia Species 0.000 description 2
- 208000000781 Conductive Hearing Loss Diseases 0.000 description 2
- 206010010280 Conductive deafness Diseases 0.000 description 2
- 208000026091 Congenital hearing disease Diseases 0.000 description 2
- 108010069176 Connexin 30 Proteins 0.000 description 2
- 102100033283 Creatine kinase U-type, mitochondrial Human genes 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102100033189 Diablo IAP-binding mitochondrial protein Human genes 0.000 description 2
- 101710121417 Envelope glycoprotein Proteins 0.000 description 2
- 241000713730 Equine infectious anemia virus Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 102100039401 Gap junction beta-6 protein Human genes 0.000 description 2
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 2
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 2
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 2
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101001135413 Homo sapiens Creatine kinase U-type, mitochondrial Proteins 0.000 description 2
- 101001001817 Homo sapiens Pejvakin Proteins 0.000 description 2
- 101000869719 Homo sapiens Sodium-dependent phosphate transporter 2 Proteins 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 206010033109 Ototoxicity Diseases 0.000 description 2
- 102100036328 Pejvakin Human genes 0.000 description 2
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 102000012987 SLC1A5 Human genes 0.000 description 2
- 108060002241 SLC1A5 Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 208000020764 Sensation disease Diseases 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102100032419 Sodium-dependent phosphate transporter 2 Human genes 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 2
- 102100037929 Usher syndrome type-1G protein Human genes 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 2
- 241000711975 Vesicular stomatitis virus Species 0.000 description 2
- 208000019467 X-linked deafness Diseases 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 230000000735 allogeneic effect Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 230000010336 brain pathway Effects 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 210000000860 cochlear nerve Anatomy 0.000 description 2
- 208000023563 conductive hearing loss disease Diseases 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 208000025118 deafness-infertility syndrome Diseases 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000002743 insertional mutagenesis Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000007479 molecular analysis Methods 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 210000000653 nervous system Anatomy 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 231100000262 ototoxicity Toxicity 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 210000004049 perilymph Anatomy 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000008672 reprogramming Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 210000003582 temporal bone Anatomy 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- NBDYVTYCSKWBQI-ATIWLJMLSA-N (2s)-1-[(2s)-1-[(2s)-1-[(2s)-1-[(2s)-2-amino-3-hydroxypropanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(O)=O)CCC1 NBDYVTYCSKWBQI-ATIWLJMLSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- HEZMWWAKWCSUCB-PHDIDXHHSA-N (3R,4R)-3,4-dihydroxycyclohexa-1,5-diene-1-carboxylic acid Chemical compound O[C@@H]1C=CC(C(O)=O)=C[C@H]1O HEZMWWAKWCSUCB-PHDIDXHHSA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 1
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 1
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- 102100021222 ATP-dependent Clp protease proteolytic subunit, mitochondrial Human genes 0.000 description 1
- 102100021176 ATP-sensitive inward rectifier potassium channel 10 Human genes 0.000 description 1
- 102100030374 Actin, cytoplasmic 2 Human genes 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102100039677 Adenylate cyclase type 1 Human genes 0.000 description 1
- 101710096099 Adhesion G-protein coupled receptor V1 Proteins 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- IYCZBJXFSZSHPN-DLOVCJGASA-N Ala-Cys-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IYCZBJXFSZSHPN-DLOVCJGASA-N 0.000 description 1
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 201000004384 Alopecia Diseases 0.000 description 1
- 102100040191 Alpha-tectorin Human genes 0.000 description 1
- 101000798762 Anguilla anguilla Troponin C, skeletal muscle Proteins 0.000 description 1
- 101000686547 Arabidopsis thaliana 30S ribosomal protein S1, chloroplastic Proteins 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- VYSRNGOMGHOJCK-GUBZILKMSA-N Arg-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N VYSRNGOMGHOJCK-GUBZILKMSA-N 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- HJWQFFYRVFEWRM-SRVKXCTJSA-N Arg-Arg-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O HJWQFFYRVFEWRM-SRVKXCTJSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- JYHIVHINLJUIEG-BVSLBCMMSA-N Arg-Tyr-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYHIVHINLJUIEG-BVSLBCMMSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000012639 Balance disease Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 101150115448 CABP2 gene Proteins 0.000 description 1
- 102100022509 Cadherin-23 Human genes 0.000 description 1
- 101100425646 Caenorhabditis elegans tmc-1 gene Proteins 0.000 description 1
- 102100032220 Calcium and integrin-binding family member 2 Human genes 0.000 description 1
- 102100030049 Calcium-binding protein 2 Human genes 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000713756 Caprine arthritis encephalitis virus Species 0.000 description 1
- 102100035445 Carcinoembryonic antigen-related cell adhesion molecule 16 Human genes 0.000 description 1
- 208000023914 Central Auditory disease Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 241000700114 Chinchillidae Species 0.000 description 1
- 102100023503 Chloride intracellular channel protein 5 Human genes 0.000 description 1
- 102100038215 Chromodomain-helicase-DNA-binding protein 7 Human genes 0.000 description 1
- 102100031060 Clarin-1 Human genes 0.000 description 1
- 102100039537 Claudin-14 Human genes 0.000 description 1
- 241000501789 Cocal virus Species 0.000 description 1
- 102100040996 Cochlin Human genes 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102100024133 Coiled-coil domain-containing protein 50 Human genes 0.000 description 1
- 102100029136 Collagen alpha-1(II) chain Human genes 0.000 description 1
- 102100040512 Collagen alpha-1(IX) chain Human genes 0.000 description 1
- 102100033825 Collagen alpha-1(XI) chain Human genes 0.000 description 1
- 102100030976 Collagen alpha-2(IX) chain Human genes 0.000 description 1
- 102100033885 Collagen alpha-2(XI) chain Human genes 0.000 description 1
- 102100033780 Collagen alpha-3(IV) chain Human genes 0.000 description 1
- 102100033779 Collagen alpha-4(IV) chain Human genes 0.000 description 1
- 102100033775 Collagen alpha-5(IV) chain Human genes 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 1
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 1
- UCMIKRLLIOVDRJ-XKBZYTNZSA-N Cys-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)O UCMIKRLLIOVDRJ-XKBZYTNZSA-N 0.000 description 1
- ODDOYXKAHLKKQY-MMWGEVLESA-N Cys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N ODDOYXKAHLKKQY-MMWGEVLESA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 1
- 102100029010 D-aminoacyl-tRNA deacylase 1 Human genes 0.000 description 1
- 101150082208 DIABLO gene Proteins 0.000 description 1
- 230000003682 DNA packaging effect Effects 0.000 description 1
- 102100030960 DNA replication licensing factor MCM2 Human genes 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 102100039851 DNA-directed RNA polymerases I and III subunit RPAC1 Human genes 0.000 description 1
- 102100025734 Dual specificity protein phosphatase CDC14A Human genes 0.000 description 1
- 102100037024 E3 ubiquitin-protein ligase XIAP Human genes 0.000 description 1
- 102000017930 EDNRB Human genes 0.000 description 1
- 102100027108 ELMO domain-containing protein 3 Human genes 0.000 description 1
- 102000020045 EPS8 Human genes 0.000 description 1
- 108091016436 EPS8 Proteins 0.000 description 1
- 102100029109 Endothelin-3 Human genes 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 102100035218 Epidermal growth factor receptor kinase substrate 8-like protein 2 Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 102100031809 Espin Human genes 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102100030863 Eyes absent homolog 1 Human genes 0.000 description 1
- 102100030910 Eyes absent homolog 4 Human genes 0.000 description 1
- 102100041001 Forkhead box protein I1 Human genes 0.000 description 1
- 102100023941 G-protein-signaling modulator 2 Human genes 0.000 description 1
- 229910052688 Gadolinium Inorganic materials 0.000 description 1
- 102100039397 Gap junction beta-3 protein Human genes 0.000 description 1
- 102100037391 Gasdermin-E Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- DTCCMDYODDPHBG-ACZMJKKPSA-N Gln-Ala-Cys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O DTCCMDYODDPHBG-ACZMJKKPSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- PCKOTDPDHIBGRW-CIUDSAMLSA-N Gln-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N PCKOTDPDHIBGRW-CIUDSAMLSA-N 0.000 description 1
- MFLMFRZBAJSGHK-ACZMJKKPSA-N Gln-Cys-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N MFLMFRZBAJSGHK-ACZMJKKPSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- IYAUFWMUCGBFMQ-CIUDSAMLSA-N Glu-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N IYAUFWMUCGBFMQ-CIUDSAMLSA-N 0.000 description 1
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- 102100023697 Glutaredoxin domain-containing cysteine-rich protein 1 Human genes 0.000 description 1
- 102100023695 Glutaredoxin domain-containing cysteine-rich protein 2 Human genes 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- SABZDFAAOJATBR-QWRGUYRKSA-N Gly-Cys-Phe Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SABZDFAAOJATBR-QWRGUYRKSA-N 0.000 description 1
- VUUOMYFPWDYETE-WDSKDSINSA-N Gly-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VUUOMYFPWDYETE-WDSKDSINSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- 102100034227 Grainyhead-like protein 2 homolog Human genes 0.000 description 1
- 102100037931 Harmonin Human genes 0.000 description 1
- 208000016621 Hearing disease Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- AAXMRLWFJFDYQO-GUBZILKMSA-N His-Asp-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O AAXMRLWFJFDYQO-GUBZILKMSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 1
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- JUCZDDVZBMPKRT-IXOXFDKPSA-N His-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O JUCZDDVZBMPKRT-IXOXFDKPSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- WSAILOWUJZEAGC-DCAQKATOSA-N His-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSAILOWUJZEAGC-DCAQKATOSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- 102100029279 Homeobox protein SIX1 Human genes 0.000 description 1
- 102100025449 Homeobox protein SIX5 Human genes 0.000 description 1
- 102100023605 Homer protein homolog 2 Human genes 0.000 description 1
- 101000750222 Homo sapiens ATP-dependent Clp protease proteolytic subunit, mitochondrial Proteins 0.000 description 1
- 101000614696 Homo sapiens ATP-sensitive inward rectifier potassium channel 10 Proteins 0.000 description 1
- 101000773237 Homo sapiens Actin, cytoplasmic 2 Proteins 0.000 description 1
- 101000959343 Homo sapiens Adenylate cyclase type 1 Proteins 0.000 description 1
- 101000928167 Homo sapiens Adhesion G-protein coupled receptor V1 Proteins 0.000 description 1
- 101000889766 Homo sapiens Alpha-tectorin Proteins 0.000 description 1
- 101000899442 Homo sapiens Cadherin-23 Proteins 0.000 description 1
- 101000943456 Homo sapiens Calcium and integrin-binding family member 2 Proteins 0.000 description 1
- 101000737645 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 16 Proteins 0.000 description 1
- 101000906624 Homo sapiens Chloride intracellular channel protein 5 Proteins 0.000 description 1
- 101000906631 Homo sapiens Chloride intracellular channel protein 6 Proteins 0.000 description 1
- 101000883739 Homo sapiens Chromodomain-helicase-DNA-binding protein 7 Proteins 0.000 description 1
- 101000992973 Homo sapiens Clarin-1 Proteins 0.000 description 1
- 101000888570 Homo sapiens Claudin-14 Proteins 0.000 description 1
- 101000748988 Homo sapiens Cochlin Proteins 0.000 description 1
- 101000910772 Homo sapiens Coiled-coil domain-containing protein 50 Proteins 0.000 description 1
- 101000771163 Homo sapiens Collagen alpha-1(II) chain Proteins 0.000 description 1
- 101000749901 Homo sapiens Collagen alpha-1(IX) chain Proteins 0.000 description 1
- 101000710623 Homo sapiens Collagen alpha-1(XI) chain Proteins 0.000 description 1
- 101000919645 Homo sapiens Collagen alpha-2(IX) chain Proteins 0.000 description 1
- 101000710619 Homo sapiens Collagen alpha-2(XI) chain Proteins 0.000 description 1
- 101000710873 Homo sapiens Collagen alpha-3(IV) chain Proteins 0.000 description 1
- 101000710870 Homo sapiens Collagen alpha-4(IV) chain Proteins 0.000 description 1
- 101000710886 Homo sapiens Collagen alpha-5(IV) chain Proteins 0.000 description 1
- 101000838688 Homo sapiens D-aminoacyl-tRNA deacylase 1 Proteins 0.000 description 1
- 101000583807 Homo sapiens DNA replication licensing factor MCM2 Proteins 0.000 description 1
- 101001018431 Homo sapiens DNA replication licensing factor MCM7 Proteins 0.000 description 1
- 101000669166 Homo sapiens DNA-directed RNA polymerases I and III subunit RPAC1 Proteins 0.000 description 1
- 101000669171 Homo sapiens DNA-directed RNA polymerases I and III subunit RPAC2 Proteins 0.000 description 1
- 101000871228 Homo sapiens Diablo IAP-binding mitochondrial protein Proteins 0.000 description 1
- 101000932600 Homo sapiens Dual specificity protein phosphatase CDC14A Proteins 0.000 description 1
- 101001057868 Homo sapiens ELMO domain-containing protein 3 Proteins 0.000 description 1
- 101000967299 Homo sapiens Endothelin receptor type B Proteins 0.000 description 1
- 101000841213 Homo sapiens Endothelin-3 Proteins 0.000 description 1
- 101000876686 Homo sapiens Epidermal growth factor receptor kinase substrate 8-like protein 2 Proteins 0.000 description 1
- 101000920837 Homo sapiens Espin Proteins 0.000 description 1
- 101000938435 Homo sapiens Eyes absent homolog 1 Proteins 0.000 description 1
- 101000938422 Homo sapiens Eyes absent homolog 4 Proteins 0.000 description 1
- 101000892875 Homo sapiens Forkhead box protein I1 Proteins 0.000 description 1
- 101000904754 Homo sapiens G-protein-signaling modulator 2 Proteins 0.000 description 1
- 101000889136 Homo sapiens Gap junction beta-3 protein Proteins 0.000 description 1
- 101001026269 Homo sapiens Gasdermin-E Proteins 0.000 description 1
- 101000829459 Homo sapiens Glutaredoxin domain-containing cysteine-rich protein 1 Proteins 0.000 description 1
- 101000829452 Homo sapiens Glutaredoxin domain-containing cysteine-rich protein 2 Proteins 0.000 description 1
- 101001069929 Homo sapiens Grainyhead-like protein 2 homolog Proteins 0.000 description 1
- 101000805947 Homo sapiens Harmonin Proteins 0.000 description 1
- 101000898034 Homo sapiens Hepatocyte growth factor Proteins 0.000 description 1
- 101000696493 Homo sapiens Histidine-tRNA ligase, mitochondrial Proteins 0.000 description 1
- 101000634171 Homo sapiens Homeobox protein SIX1 Proteins 0.000 description 1
- 101000835959 Homo sapiens Homeobox protein SIX5 Proteins 0.000 description 1
- 101001048464 Homo sapiens Homer protein homolog 2 Proteins 0.000 description 1
- 101000953492 Homo sapiens Inositol hexakisphosphate and diphosphoinositol-pentakisphosphate kinase 1 Proteins 0.000 description 1
- 101001076408 Homo sapiens Interleukin-6 Proteins 0.000 description 1
- 101000745406 Homo sapiens Ketimine reductase mu-crystallin Proteins 0.000 description 1
- 101000716729 Homo sapiens Kit ligand Proteins 0.000 description 1
- 101000981537 Homo sapiens LHFPL tetraspan subfamily member 5 protein Proteins 0.000 description 1
- 101000624540 Homo sapiens Leucine-tRNA ligase, mitochondrial Proteins 0.000 description 1
- 101001043326 Homo sapiens Lipoxygenase homology domain-containing protein 1 Proteins 0.000 description 1
- 101100400377 Homo sapiens MARVELD2 gene Proteins 0.000 description 1
- 101000954986 Homo sapiens Merlin Proteins 0.000 description 1
- 101000763951 Homo sapiens Mitochondrial import inner membrane translocase subunit Tim8 A Proteins 0.000 description 1
- 101001028702 Homo sapiens Mitochondrial-derived peptide MOTS-c Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101000588964 Homo sapiens Myosin-14 Proteins 0.000 description 1
- 101000958744 Homo sapiens Myosin-7B Proteins 0.000 description 1
- 101001030232 Homo sapiens Myosin-9 Proteins 0.000 description 1
- 101000640295 Homo sapiens Nesprin-4 Proteins 0.000 description 1
- 101001134172 Homo sapiens Otoancorin Proteins 0.000 description 1
- 101001134169 Homo sapiens Otoferlin Proteins 0.000 description 1
- 101001134207 Homo sapiens Otogelin Proteins 0.000 description 1
- 101001134210 Homo sapiens Otogelin-like protein Proteins 0.000 description 1
- 101000720696 Homo sapiens Oxysterol-binding protein-related protein 2 Proteins 0.000 description 1
- 101000614335 Homo sapiens P2X purinoceptor 2 Proteins 0.000 description 1
- 101000693236 Homo sapiens PDZ domain-containing protein 7 Proteins 0.000 description 1
- 101000886826 Homo sapiens PDZ domain-containing protein GIPC3 Proteins 0.000 description 1
- 101000572950 Homo sapiens POU domain, class 3, transcription factor 4 Proteins 0.000 description 1
- 101001094737 Homo sapiens POU domain, class 4, transcription factor 3 Proteins 0.000 description 1
- 101000613490 Homo sapiens Paired box protein Pax-3 Proteins 0.000 description 1
- 101001045218 Homo sapiens Peroxisomal multifunctional enzyme type 2 Proteins 0.000 description 1
- 101000591234 Homo sapiens Phosphatidylinositol phosphatase PTPRQ Proteins 0.000 description 1
- 101001066878 Homo sapiens Polyribonucleotide nucleotidyltransferase 1, mitochondrial Proteins 0.000 description 1
- 101000974726 Homo sapiens Potassium voltage-gated channel subfamily E member 1 Proteins 0.000 description 1
- 101000994648 Homo sapiens Potassium voltage-gated channel subfamily KQT member 4 Proteins 0.000 description 1
- 101000640325 Homo sapiens Probable asparagine-tRNA ligase, mitochondrial Proteins 0.000 description 1
- 101000848498 Homo sapiens Protein POLR1D, isoform 2 Proteins 0.000 description 1
- 101001072259 Homo sapiens Protocadherin-15 Proteins 0.000 description 1
- 101001110308 Homo sapiens Radixin Proteins 0.000 description 1
- 101000591236 Homo sapiens Receptor-type tyrosine-protein phosphatase R Proteins 0.000 description 1
- 101000704874 Homo sapiens Rho family-interacting cell polarization regulator 2 Proteins 0.000 description 1
- 101001125551 Homo sapiens Ribose-phosphate pyrophosphokinase 1 Proteins 0.000 description 1
- 101000650804 Homo sapiens Semaphorin-3E Proteins 0.000 description 1
- 101000836066 Homo sapiens Serpin B6 Proteins 0.000 description 1
- 101001133085 Homo sapiens Sialomucin core protein 24 Proteins 0.000 description 1
- 101000868152 Homo sapiens Son of sevenless homolog 1 Proteins 0.000 description 1
- 101000693262 Homo sapiens Sphingosine 1-phosphate receptor 2 Proteins 0.000 description 1
- 101000851696 Homo sapiens Steroid hormone receptor ERR2 Proteins 0.000 description 1
- 101000788505 Homo sapiens TBC1 domain family member 24 Proteins 0.000 description 1
- 101000713234 Homo sapiens TRIO and F-actin-binding protein Proteins 0.000 description 1
- 101000666340 Homo sapiens Tenascin Proteins 0.000 description 1
- 101000612980 Homo sapiens Thrombospondin-type laminin G domain and EAR repeat-containing protein Proteins 0.000 description 1
- 101000785523 Homo sapiens Tight junction protein ZO-2 Proteins 0.000 description 1
- 101000664703 Homo sapiens Transcription factor SOX-10 Proteins 0.000 description 1
- 101000933296 Homo sapiens Transcription factor TFIIIB component B'' homolog Proteins 0.000 description 1
- 101000801040 Homo sapiens Transmembrane channel-like protein 1 Proteins 0.000 description 1
- 101000638069 Homo sapiens Transmembrane channel-like protein 2 Proteins 0.000 description 1
- 101000764625 Homo sapiens Transmembrane inner ear expressed protein Proteins 0.000 description 1
- 101000798700 Homo sapiens Transmembrane protease serine 3 Proteins 0.000 description 1
- 101000798702 Homo sapiens Transmembrane protease serine 4 Proteins 0.000 description 1
- 101000787968 Homo sapiens Transmembrane protein 132E Proteins 0.000 description 1
- 101000891326 Homo sapiens Treacle protein Proteins 0.000 description 1
- 101001087412 Homo sapiens Tyrosine-protein phosphatase non-receptor type 18 Proteins 0.000 description 1
- 101100428000 Homo sapiens USH1G gene Proteins 0.000 description 1
- 101000805943 Homo sapiens Usher syndrome type-1G protein Proteins 0.000 description 1
- 101000805941 Homo sapiens Usherin Proteins 0.000 description 1
- 101000670953 Homo sapiens V-type proton ATPase subunit B, kidney isoform Proteins 0.000 description 1
- 101000803332 Homo sapiens Wolframin Proteins 0.000 description 1
- 101000633054 Homo sapiens Zinc finger protein SNAI2 Proteins 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- KLJKJVXDHVUMMZ-KKPKCPPISA-N Ile-Phe-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N KLJKJVXDHVUMMZ-KKPKCPPISA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 102100037739 Inositol hexakisphosphate and diphosphoinositol-pentakisphosphate kinase 1 Human genes 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 108091007984 KARS Proteins 0.000 description 1
- 108010011185 KCNQ1 Potassium Channel Proteins 0.000 description 1
- YQEZLKZALYSWHR-UHFFFAOYSA-N Ketamine Chemical compound C=1C=CC=C(Cl)C=1C1(NC)CCCCC1=O YQEZLKZALYSWHR-UHFFFAOYSA-N 0.000 description 1
- 102100039386 Ketimine reductase mu-crystallin Human genes 0.000 description 1
- 102100020880 Kit ligand Human genes 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 102100024110 LHFPL tetraspan subfamily member 5 protein Human genes 0.000 description 1
- 101150116611 LRRC51 gene Proteins 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 1
- QKIBIXAQKAFZGL-GUBZILKMSA-N Leu-Cys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QKIBIXAQKAFZGL-GUBZILKMSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 102100022186 Leucine-rich repeat-containing protein 51 Human genes 0.000 description 1
- 102100023342 Leucine-tRNA ligase, mitochondrial Human genes 0.000 description 1
- NNJVILVZKWQKPM-UHFFFAOYSA-N Lidocaine Chemical compound CCN(CC)CC(=O)NC1=C(C)C=CC=C1C NNJVILVZKWQKPM-UHFFFAOYSA-N 0.000 description 1
- 102100021959 Lipoxygenase homology domain-containing protein 1 Human genes 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- 102100035529 Lysine-tRNA ligase Human genes 0.000 description 1
- 102000049280 MARVEL Domain Containing 2 Human genes 0.000 description 1
- 108700008222 MARVEL Domain Containing 2 Proteins 0.000 description 1
- 101150082088 MSRB3 gene Proteins 0.000 description 1
- 208000007466 Male Infertility Diseases 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 208000027530 Meniere disease Diseases 0.000 description 1
- 102100037106 Merlin Human genes 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 1
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- WRXOPYNEKGZWAZ-FXQIFTODSA-N Met-Ser-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O WRXOPYNEKGZWAZ-FXQIFTODSA-N 0.000 description 1
- 102100028720 Methionine-R-sulfoxide reductase B3 Human genes 0.000 description 1
- 108010050345 Microphthalmia-Associated Transcription Factor Proteins 0.000 description 1
- 102100030157 Microphthalmia-associated transcription factor Human genes 0.000 description 1
- 102100026808 Mitochondrial import inner membrane translocase subunit Tim8 A Human genes 0.000 description 1
- 102100037173 Mitochondrial-derived peptide MOTS-c Human genes 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100079084 Mus musculus Myo7a gene Proteins 0.000 description 1
- 102100032972 Myosin-14 Human genes 0.000 description 1
- 102100032973 Myosin-15 Human genes 0.000 description 1
- 101710115138 Myosin-15 Proteins 0.000 description 1
- 102100038319 Myosin-6 Human genes 0.000 description 1
- 101710204027 Myosin-6 Proteins 0.000 description 1
- 102100038934 Myosin-7 Human genes 0.000 description 1
- 101710204029 Myosin-7 Proteins 0.000 description 1
- 102100038938 Myosin-9 Human genes 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 102000007072 Nerve Growth Factors Human genes 0.000 description 1
- 102100033921 Nesprin-4 Human genes 0.000 description 1
- 208000029726 Neurodevelopmental disease Diseases 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 108020003217 Nuclear RNA Proteins 0.000 description 1
- 102000043141 Nuclear RNA Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102100034199 Otoancorin Human genes 0.000 description 1
- 102100034198 Otoferlin Human genes 0.000 description 1
- 102100034205 Otogelin Human genes 0.000 description 1
- 102100034206 Otogelin-like protein Human genes 0.000 description 1
- 102100025925 Oxysterol-binding protein-related protein 2 Human genes 0.000 description 1
- 102100040479 P2X purinoceptor 2 Human genes 0.000 description 1
- 102100025651 PDZ domain-containing protein 7 Human genes 0.000 description 1
- 102100039982 PDZ domain-containing protein GIPC3 Human genes 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102100026450 POU domain, class 3, transcription factor 4 Human genes 0.000 description 1
- 102100035398 POU domain, class 4, transcription factor 3 Human genes 0.000 description 1
- 102100040891 Paired box protein Pax-3 Human genes 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102100035278 Pendrin Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 102100022587 Peroxisomal multifunctional enzyme type 2 Human genes 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 1
- 108010092528 Phosphate Transport Proteins Proteins 0.000 description 1
- 102000016462 Phosphate Transport Proteins Human genes 0.000 description 1
- 102100034410 Polyribonucleotide nucleotidyltransferase 1, mitochondrial Human genes 0.000 description 1
- 102100022755 Potassium voltage-gated channel subfamily E member 1 Human genes 0.000 description 1
- 102100037444 Potassium voltage-gated channel subfamily KQT member 1 Human genes 0.000 description 1
- 102100034363 Potassium voltage-gated channel subfamily KQT member 4 Human genes 0.000 description 1
- 102100035276 Prestin Human genes 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 1
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- WECYCNFPGZLOOU-FXQIFTODSA-N Pro-Asn-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O WECYCNFPGZLOOU-FXQIFTODSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 1
- BWCZJGJKOFUUCN-ZPFDUUQYSA-N Pro-Ile-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O BWCZJGJKOFUUCN-ZPFDUUQYSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- 102100033917 Probable asparagine-tRNA ligase, mitochondrial Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102100034616 Protein POLR1D, isoform 2 Human genes 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 102100036382 Protocadherin-15 Human genes 0.000 description 1
- 238000010240 RT-PCR analysis Methods 0.000 description 1
- 102100022127 Radixin Human genes 0.000 description 1
- 101100135885 Rattus norvegicus Pdia4 gene Proteins 0.000 description 1
- 102100034101 Receptor-type tyrosine-protein phosphatase R Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241001068295 Replication defective viruses Species 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 208000005074 Retroviridae Infections Diseases 0.000 description 1
- 102100032023 Rho family-interacting cell polarization regulator 2 Human genes 0.000 description 1
- 102100029508 Ribose-phosphate pyrophosphokinase 1 Human genes 0.000 description 1
- 108091006282 SLC17A8 Proteins 0.000 description 1
- 108091006737 SLC22A4 Proteins 0.000 description 1
- 108091006507 SLC26A4 Proteins 0.000 description 1
- 108091006506 SLC26A5 Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 102100027752 Semaphorin-3E Human genes 0.000 description 1
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 1
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 102100025512 Serpin B6 Human genes 0.000 description 1
- 102100034258 Sialomucin core protein 24 Human genes 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102100036928 Solute carrier family 22 member 4 Human genes 0.000 description 1
- 102100025749 Sphingosine 1-phosphate receptor 2 Human genes 0.000 description 1
- 241000713880 Spleen focus-forming virus Species 0.000 description 1
- 241000713675 Spumavirus Species 0.000 description 1
- 102100036831 Steroid hormone receptor ERR2 Human genes 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 102100025233 TBC1 domain family member 24 Human genes 0.000 description 1
- 101150088517 TCTA gene Proteins 0.000 description 1
- 102100036855 TRIO and F-actin-binding protein Human genes 0.000 description 1
- 108091008849 TRPN Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 102100038126 Tenascin Human genes 0.000 description 1
- 206010043276 Teratoma Diseases 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- LOHBIDZYHQQTDM-IXOXFDKPSA-N Thr-Cys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LOHBIDZYHQQTDM-IXOXFDKPSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- ODXKUIGEPAGKKV-KATARQTJSA-N Thr-Leu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O ODXKUIGEPAGKKV-KATARQTJSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- VGNKUXWYFFDWDH-BEMMVCDISA-N Thr-Trp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N)O VGNKUXWYFFDWDH-BEMMVCDISA-N 0.000 description 1
- 102100040887 Thrombospondin-type laminin G domain and EAR repeat-containing protein Human genes 0.000 description 1
- 102100026637 Tight junction protein ZO-2 Human genes 0.000 description 1
- 101150065274 Tmc gene Proteins 0.000 description 1
- 101150104365 Tomt gene Proteins 0.000 description 1
- 102100038808 Transcription factor SOX-10 Human genes 0.000 description 1
- 102100031142 Transcriptional repressor protein YY1 Human genes 0.000 description 1
- 102100033690 Transmembrane channel-like protein 1 Human genes 0.000 description 1
- 102100032054 Transmembrane channel-like protein 2 Human genes 0.000 description 1
- 102100026225 Transmembrane inner ear expressed protein Human genes 0.000 description 1
- 102100032454 Transmembrane protease serine 3 Human genes 0.000 description 1
- 102100025899 Transmembrane protein 132E Human genes 0.000 description 1
- 102100040421 Treacle protein Human genes 0.000 description 1
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 1
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 1
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 1
- CZSMNLQMRWPGQF-XEGUGMAKSA-N Trp-Gln-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CZSMNLQMRWPGQF-XEGUGMAKSA-N 0.000 description 1
- OKAMOYTUQMIFJO-JBACZVJFSA-N Trp-Glu-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 OKAMOYTUQMIFJO-JBACZVJFSA-N 0.000 description 1
- KDWZQYUTMJSYRJ-BHYGNILZSA-N Trp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O KDWZQYUTMJSYRJ-BHYGNILZSA-N 0.000 description 1
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 1
- XGFOXYJQBRTJPO-PJODQICGSA-N Trp-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XGFOXYJQBRTJPO-PJODQICGSA-N 0.000 description 1
- JGLXHHQUSIULAK-OYDLWJJNSA-N Trp-Pro-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC=3C4=CC=CC=C4NC=3)N)C(O)=O)=CNC2=C1 JGLXHHQUSIULAK-OYDLWJJNSA-N 0.000 description 1
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 1
- UIRPULWLRODAEQ-QEJZJMRPSA-N Trp-Ser-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 UIRPULWLRODAEQ-QEJZJMRPSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- UPUNWAXSLPBMRK-XTWBLICNSA-N Trp-Thr-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UPUNWAXSLPBMRK-XTWBLICNSA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- 102100033018 Tyrosine-protein phosphatase non-receptor type 18 Human genes 0.000 description 1
- 102100037930 Usherin Human genes 0.000 description 1
- 102100039468 V-type proton ATPase subunit B, kidney isoform Human genes 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- XKVXSCHXGJOQND-ZOBUZTSGSA-N Val-Asp-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XKVXSCHXGJOQND-ZOBUZTSGSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- HLBHFAWNMAQGNO-AVGNSLFASA-N Val-His-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N HLBHFAWNMAQGNO-AVGNSLFASA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- VBTFUDNTMCHPII-UHFFFAOYSA-N Val-Trp-Tyr Natural products C=1NC2=CC=CC=C2C=1CC(NC(=O)C(N)C(C)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 VBTFUDNTMCHPII-UHFFFAOYSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- 102100038033 Vesicular glutamate transporter 3 Human genes 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 102100036022 Wolframin Human genes 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 108700031544 X-Linked Inhibitor of Apoptosis Proteins 0.000 description 1
- 108010042669 YY1 Transcription Factor Proteins 0.000 description 1
- 102100029570 Zinc finger protein SNAI2 Human genes 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- NOSIYYJFMPDDSA-UHFFFAOYSA-N acepromazine Chemical compound C1=C(C(C)=O)C=C2N(CCCN(C)C)C3=CC=CC=C3SC2=C1 NOSIYYJFMPDDSA-UHFFFAOYSA-N 0.000 description 1
- 229960005054 acepromazine Drugs 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 238000011316 allogeneic transplantation Methods 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 208000021018 autosomal dominant inheritance Diseases 0.000 description 1
- 208000036201 autosomal recessive hearing loss Diseases 0.000 description 1
- 201000011340 autosomal recessive nonsyndromic deafness 31 Diseases 0.000 description 1
- 208000031514 autosomal recessive nonsyndromic hearing loss 1A Diseases 0.000 description 1
- 208000035257 autosomal recessive nonsyndromic hearing loss 31 Diseases 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- FFGPTBGBLSHEPO-UHFFFAOYSA-N carbamazepine Chemical compound C1=CC2=CC=CC=C2N(C(=O)N)C2=CC=CC=C21 FFGPTBGBLSHEPO-UHFFFAOYSA-N 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000006721 cell death pathway Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 210000002777 columnar cell Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000004154 complement system Effects 0.000 description 1
- 230000009850 completed effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 210000003792 cranial nerve Anatomy 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000001120 cytoprotective effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 230000036267 drug metabolism Effects 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 210000003060 endolymph Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000026502 entry into host cell Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 210000002304 esc Anatomy 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000009760 functional impairment Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- UIWYJDYFSGRHKR-UHFFFAOYSA-N gadolinium atom Chemical compound [Gd] UIWYJDYFSGRHKR-UHFFFAOYSA-N 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000001654 germ layer Anatomy 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000003676 hair loss Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000008230 hearing development Effects 0.000 description 1
- 238000012071 hearing screening Methods 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 210000004754 hybrid cell Anatomy 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000010820 immunofluorescence microscopy Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 229960003299 ketamine Drugs 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 230000028161 membrane depolarization Effects 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108091029500 miR-183 stem-loop Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 210000000110 microvilli Anatomy 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 230000007383 nerve stimulation Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 239000003900 neurotrophic factor Substances 0.000 description 1
- 238000012072 newborn hearing screening Methods 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 235000013594 poultry meat Nutrition 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000009993 protective function Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 230000010255 response to auditory stimulus Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 210000002356 skeleton Anatomy 0.000 description 1
- 230000007958 sleep Effects 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000019100 sperm motility Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000009168 stem cell therapy Methods 0.000 description 1
- 238000009580 stem-cell therapy Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013520 translational research Methods 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 230000001720 vestibular Effects 0.000 description 1
- 230000008478 viral entry into host cell Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 229940072358 xylocaine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/16—Otologicals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0696—Artificially induced pluripotent stem cells, e.g. iPS
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Plant Pathology (AREA)
- Epidemiology (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Environmental Sciences (AREA)
- Developmental Biology & Embryology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Transplantation (AREA)
- Cell Biology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Animal Husbandry (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
STRC 유전자의 유전적 돌연변이에 의해 유발된 청력 손실의 치료 및/또는 예방에 유용할 수 있는 조성물 및 방법이 개시된다. 본원에 개시된 조성물 및 방법은 렌티바이러스 벡터를 사용하여 STRC 유전자의 활성을 회복하고, 유모세포 생존을 촉진하고, 청력의 더욱 저하를 방지하고 및/또는 청력 손실을 겪는 환자의 청력을 회복시키도록 내이로의 STRC 전달을 용이하게 한다.
Description
(관련 출원에 대한 상호 참조)
본 출원은 2021년 5월 14일에 출원된 미국 가출원번호 63/188,857의 이익과 우선권을 주장하며, 이는 모든 목적을 위해 그 전체 내용이 참조로 포함된다.
본 개시는 청력 손실을 치료 및/또는 예방하는 데 유용한 조성물 및 방법을 제공한다. 보다 구체적으로, 본 개시는 STRC 유전자의 유전적 돌연변이에 의해 유발된 청력 손실을 치료 및/또는 예방하는 데 유용한 조성물 및 방법을 제공한다.
(서열 목록)
본 출원에는 ASCII 형식으로 전자적으로 제출된 서열목록을 포함하고, 전체 내용이 참조로 포함되어 있다. 2022년 5월 14일에 생성된 상기 ASCII 복사본의 명칭은 BN00002_0051_SL_ST25.txt이고, 크기는 56KB이다.
청력 손실은 인간에게 가장 흔한 감각 장애이다. 세계보건기구(WHO)가 발표한 장애성 청력 손실의 규모에 대한 2018년 추정에 따르면, 전 세계적으로 장애성 청력 손실을 갖고 사는 사람은 4억 6,600만 명(성인 4억 3,200만 명, 어린이 3,400만 명)이 있다. 장애성 청력 손실을 가진 사람의 수는 2030년까지 6억 3천만 명, 2050년에는 9억 명 이상으로 증가할 것이다. 장애성 청력 손실을 가진 사람의 90% 이상(4억 2천만 명)이 전세계의 저소득 지역에 거주한다(청력 손실 유병률에 대한 WHO의 전세계 추정치, 난청의 예방 WHO 2018).
연구에 따르면, 언어 습득 전 난청의 50% 이상이 유전적인 것으로 나타났다. 이러한 유전성 청력 손실 및 난청은 전음성, 감음신경성 또는 이 둘의 조합; 증후군(외이 또는 다른 기관의 기형 또는 다른 기관계와 관련된 의학적 문제와 관련됨) 또는 비증후군(외이의 가시적인 기형 또는 관련 의학적 문제와 관련 없음); 언어 습득 전(언어가 발달하기 전) 또는 언어 습득 후(언어가 발달한 후)일 수 있다. 또한, 연구에 따르면 유전성 청력 손실의 70% 이상이 비증후군성인 것으로 나타났다. 비증후군성 난청의 상이한 유전자좌는 DFN(DeaFNess의 경우)으로 지정된다. 유전자좌는 유전 방식에 기반하여 명명된다: DFNA(상염색체 우성), DFNB(상염색체 열성) 및 DFNX(X 염색체 연쇄성). 상기 명칭 뒤에 오는 숫자는 유전자 매핑 및/또는 발견의 순서를 반영한다. 일반 인구에서, 청력 손실의 유병률은 나이가 들수록 증가한다. 이러한 변화는 유전학과 환경의 영향, 및 환경적 요인과 개인의 유전적 소인 사이의 상호작용을 반영한다.
장애성 청력 손실을 가진 사람들을 위한 현재 치료 옵션은 보청기 또는 인공 와우다. 인공 와우는 환자당 평생 비용이 $1,000,000 이상으로 관련 의료비가 많이 드는 일반적인 처치이다. 인공 와우 및 보청기의 평생 비용은 대부분의 사람들에게 엄두도 못 낼 정도로 높으며, 특히 저소득 지역(난청을 가진 사람의 대부분이 거주하는 곳)에 거주하는 사람들에게는 더욱 그렇다. 불행하게도, 현재 청력 손실 또는 난청을 예방하거나 또는 치료하기 위해 승인된 치료제는 없다. 따라서, 청력 손실용 인공 와우 및 보청기에 대한 비용 효율적인 대안을 제공하기 위한 치료 옵션이 시급히 필요하다.
본 개시는 STRC 기능소실 돌연변이와 관련된 표현형을 구제할 수 있는 내이 세포에서의 STRC의 강력한 발현을 생성하기 위해 전체 길이 또는 거의 전체 길이의 스테레오실린(STRC)이 내이 특이적 프로모터(예를 들면, 마우스 또는 인간 Myo7A 프로모터)의 제어 하에 렌티바이러스 벡터에 포함될 수 있다는 발견에 적어도 부분적으로 기반하고 있다. 본원의 기술은 유전자 요법을 통해 포유동물(예를 들면, 인간)에게서 STRC 기능소실 돌연변이를 구제하는 능력을 제공한다. 본 개시는 STRC 돌연변이로 인한 장애를 앓고 있는 환자에게 STRC 기능을 회복하기 위한 조성물 및 방법을 제공한다.
한 양태에 있어서, 본 개시는 스테레오실린(STRC)을 인코딩하는 핵산 서열, 또는 그의 일부; 및 상기 핵산 서열에 작동적으로 연결된 프로모터를 포함하는 렌티바이러스 발현 벡터를 제공한다.
실시형태에 있어서, 렌티바이러스 발현 벡터는 제 3 세대 자가 불활성화(SIN) 렌티바이러스 벡터이다. 실시형태에 있어서, SIN 렌티바이러스 벡터에는 야생형 렌티바이러스 긴 말단 반복(LTR) 인핸서 요소 및 프로모터 요소가 결여되어 있다.
실시형태에 있어서, 프로모터는 STRC 프로모터, Myo7a 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터 및 Pou4f3 프로모터로 이루어진 군에서 선택된다. 실시형태에 있어서, 프로모터는 Myo7a이다. 실시형태에 있어서, 프로모터는 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다. 선택적으로, Myo7a 프로모터는 Myo7a 인핸서를 추가로 포함한다. 선택적으로, Myo7a 프로모터는 Myo7a 인핸서를 추가로 포함한다. 프로모터가 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 실시형태에 있어서, 프로모터는 선택적으로 서열번호 5와 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 Myo7a 인핸서를 추가로 포함할 수 있다.
실시형태에 있어서, 핵산은 서열번호 1과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다. 실시형태에 있어서, 핵산은 서열번호 2와 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 폴리펩티드를 인코딩한다.
한 양태에 있어서, 본 개시는 서열번호 1과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 핵산을 포함하는 렌티바이러스 발현 벡터를 포함하는 청력 손실을 치료 또는 예방하는 방법에 사용되는 의약 조성물을 제공하고, 여기서 핵산 서열은 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 핵산에 작동적으로 연결된다.
한 양태에 있어서, 본 개시는 서열번호 1의 핵산 서열을 포함하는 렌티바이러스 발현 벡터; 및 핵산에 작동적으로 연결된 프로모터를 포함하는 세포를 제공한다.
실시형태에 있어서, 핵산은 서열번호 1과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다.
실시형태에 있어서, 프로모터는 STRC 프로모터, Myo7a 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터 또는 Pou4f3 프로모터로 이루어진 군에서 선택된다.
실시형태에 있어서, 프로모터는 Myo7a이다. 실시형태에 있어서, 프로모터는 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다.
실시형태에 있어서, 세포는 줄기세포이다. 실시형태에 있어서, 줄기세포는 유도만능 줄기세포이다.
한 양태에 있어서, 본 개시는 제 1 항에 기재된 렌티바이러스 벡터의 유효량을 그를 필요로 하는 피험체에게 투여하는 단계를 포함하는 청력 손실을 치료 또는 예방하는 방법을 제공한다.
실시형태에 있어서, 프로모터는 STRC 프로모터, Myo7a 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터, 또는 Pou4f3 프로모터로 이루어진 군에서 선택된다. 실시형태에 있어서, 프로모터는 Myo7a이다. 실시형태에 있어서, 프로모터는 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다.
실시형태에 있어서, 발현 벡터는 피험체의 내이에 주입함으로써 투여된다.
실시형태에 있어서, 주입 방법은 와우 개창술(cochleostomy), 정원창막(round window membrane), 내림프낭, 스칼라 메디아(scala media), 카날로스토미(canalostomy), 내림프낭을 통한 스칼라 메디아, 또는 이들의 임의의 조합으로 이루어진 군에서 선택된다.
실시형태에 있어서, 피험체는 청력 손실과 관련된 하나 이상의 유전적 위험 인자를 갖는다.
실시형태에 있어서, 유전적 위험 인자 중 하나는 STRC 유전자에 있어서의 돌연변이로 이루어진 군에서 선택된다.
실시형태에 있어서, 피험체는 청력 손실의 임상 지표를 전혀 나타내지 않는다.
한 양태에 있어서, 본 개시는 인간 STRC 유전자에 있어서의 돌연변이/변이로 이루어진 군에서 선택된 청력 손실을 유발하는 돌연변이/변이를 포함하는 형질전환 마우스를 제공한다.
본원에서는, 서열번호 1 또는 서열번호 2의 핵산 서열, 또는 서열번호 1 또는 서열번호 2의 핵산 서열과 적어도 90%의 서열 동일성을 갖는 핵산 서열을 포함하는 발현 벡터로서, 여기서 핵산 서열은 프로모터에 작동적으로 연결되는 발현 벡터가 개시된다. 또한, 본원에는, 서열번호 1 또는 서열번호 2의 핵산 서열, 또는 서열번호 1 또는 서열번호 2의 핵산 서열과 적어도 90%의 서열 동일성을 갖는 핵산 서열을 갖는 발현 벡터를 포함하는 청력 소실의 치료 또는 예방하는 방법에 사용되는 의약 조성물로서, 여기서 핵산 서열은 프로모터에 작동적으로 연결되는 의약 조성물이 개시된다. 일부 실시형태에 있어서, 핵산 서열은 서열번호 1 또는 서열번호 2의 핵산 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 일부 실시형태에 있어서, 발현 벡터는 렌티바이러스 벡터, 아데노연관 바이러스 벡터, 아데노바이러스 벡터, 단순 헤르페스 바이러스 벡터, 백시니아 바이러스 벡터, 또는 헬퍼 의존성 아데노바이러스 벡터에서 선택된다. 일부 실시형태에 있어서, 상기 벡터는 AAV2, AAV2/Anc80, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh8, AAVrhlO, AAVrh39, AAVrh43AAVl, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8 또는 Anc80에서 선택되는 렌티바이러스 벡터 또는 아데노연관 바이러스 벡터이다. 일부 실시형태에 있어서, AAV 벡터는 AAV50 혼합 캡시드일 수 있으며, 이는 Anc80과 비교했을 때 성인 동물에서 내부 및 외부 유모세포의 더 우수한 형질주입을 얻는 것으로 나타났다. 일부 실시형태에 있어서, 프로모터는 초기 발달 시 작동적으로 연결된 핵산의 발현을 유도하고 일생 동안 발현을 유지하는 임의의 유모세포 프로모터, 예를 들면 STRC 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터, Myo7a 프로모터 또는 Pou4f3 프로모터에서 선택된다. 일부 실시형태에 있어서, 인핸서는 Barhl1 인핸서일 수 있다(예를 들면, Hou et al., (2019) Cell 8(5):458 참조). 내인성 STRC 프로모터 및 인핸서의 예는 표 1에 나타내어져 있다.
본원에서는, 서열번호 1의 핵산 서열, 또는 서열번호 1의 핵산과 적어도 90%의 서열 동일성을 갖는 핵산 서열을 포함하는 발현 벡터를 갖는 세포로서, 여기서 핵산 서열은 프로모터에 작동적으로 연결되는 세포를 개시한다. 일부 실시형태에 있어서, 핵산 서열은 서열번호 1의 핵산 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 100%의 서열 동일성을 갖는다. 일부 실시형태에 있어서, 세포는 줄기세포이다. 일부 실시형태에 있어서, 줄기세포는 유도만능 줄기세포이다.
본원에서는, 서열번호 1의 핵산 서열, 또는 서열번호 1의 핵산과 적어도 90%의 서열 동일성을 갖는 핵산 서열을 포함하는 발현 벡터의 유효량을 그를 필요로 하는 피험체에게 투여하는 단계를 포함하는 청력 손실을 치료 또는 예방하는 방법으로서, 여기서 핵산 서열은 프로모터에 작동적으로 연결되는 청력 손실을 치료 또는 예방하는 방법을 개시한다. 일부 실시형태에 있어서, 핵산 서열은 서열번호 1의 핵산 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는다. 일부 실시형태에 있어서, 발현 벡터는 렌티바이러스 벡터, 아데노연관 바이러스 벡터, 아데노바이러스 벡터, 단순 헤르페스 바이러스 벡터, 백시니아 바이러스 벡터, 헬퍼 의존성 아데노바이러스 벡터에서 선택된다. 일부 실시형태에 있어서, 상기 벡터는 AAV2, AAV2/Anc80, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh8, AAVrhlO, AAVrh39, AAVrh43, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, Anc80 또는 AAV50에서 선택된 렌티바이러스 벡터 또는 아데노연관 바이러스 벡터이다. 일부 실시형태에 있어서, 프로모터는 초기 발달 시 작동적으로 연결된 핵산 서열의 발현을 유도하고, 평생 동안 발현을 유지하는 임의의 유모세포 프로모터, 예를 들면 STRC 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터, Myo7a 프로모터 또는 Pou4f3 프로모터에서 선택된다. 일부 실시형태에 있어서, 발현 벡터는, 예를 들면 주입에 의해 피험체의 내이에 투여된다. 일부 실시형태에 있어서, 전달 방법은 와우 개창술, 정원창막, 카날로스토미 또는 이들의 임의의 조합에서 선택된다(예를 들면 Erin E. Leary Swan et al., 청각 용도용의 내이 약물 전달; Adv Drug Deliv Rev. 2008 12월 14일; 60(15): 1583-1599 참조). 일부 실시형태에 있어서, 발현 벡터는 내림프낭을 통한 스칼라 메디아로 전달된다(예를 들면 Colletti V, et al., 인간 내이의 내림프낭으로부터 내림프 구획으로의 가돌리늄 분포의 증거, Audiol Neurootol, 2010; 15(6): 353-63; Marco Mandala, MD, et al., 메니에르병에서 내림프낭으로부터 달팽이관으로의 유도된 내림프 흐름, Otolaryngology-Head and Neck Surgery(2010) 143, 673-679; Yamasoba T., et al., 내림프낭에서의 아데노바이러스 벡터 접종 후 내이 이식유전자 발현, Hum Gene Ther. 1999년 3월, 20; 10(5):769-74 참조). 일부 실시형태에 있어서, 피험체는 청력 손실과 관련된 하나 이상의 유전적 위험 인자를 갖는다. 일부 실시형태에 있어서, 유전적 위험 인자 중 하나는 STRC 유전자에 있어서의 돌연변이이다. 일부 실시형태에 있어서, STRC 유전자에 있어서의 돌연변이는 청력 손실을 유발한다고 알려진 임의의 하나 이상의 STRC 돌연변이에서 선택된다(예를 들면, 표 4 참조). 일부 실시형태에 있어서, 피험체는 청력 손실의 임상 지표를 전혀 나타내지 않는다.
일부 실시형태에 있어서, 본원에 기재된 발현 벡터는 다른 핵산 서열을 포함하는 하나 이상의 발현 벡터 및/또는 청력 손실을 치료하기 위한 하나 이상의 다른 활성 약제와의 병용 요법으로서 투여된다. 예를 들면, 병용 요법은 서열번호 1의 핵산 서열을 갖는 제 1 발현 벡터 및 핵산 서열을 갖는 제 2 발현 벡터를 포함할 수 있으며, 여기서 두 발현 벡터는 청력 손실을 치료하기 위한 병용 요법의 일부로서 피험체에게 투여된다.
본원에서는, 청력 손실을 유발한다고 알려진 임의의 하나 이상의 STRC 돌연변이에서 선택된 돌연변이를 가진 인간 STRC 유전자를 갖는 형질전환 마우스를 개시한다(예를 들면, 표 4 참조).
정의
"변경"이란, 증가 또는 감소를 의미한다. 변경은 1%, 2%, 3%, 4%, 5%, 10%, 20%, 30% 만큼 적어질 수 있고, 또는 40%, 50%, 60% 만큼일 수 있고, 또는 심지어 75%, 80%, 90%, 100% 만큼 증가할 수 있다.
"생물학적 샘플"이란, 유기체로부터 유래된 임의의 조직, 세포, 체액 또는 기타 물질을 의미한다.
"실질적으로 동일한"이란, 기준 아미노산 서열(예를 들면, 본원에 기재된 아미노산 서열 중 어느 하나) 또는 핵산 서열(예를 들면, 본원에 기재된 핵산 서열 중 어느 하나)과 적어도 50%의 동일성을 나타내는 폴리펩티드 또는 핵산 분자를 의미한다. 바람직하게는, 이러한 서열은 비교를 위해 사용된 서열과 아미노산 수준 또는 핵산에서 적어도 70%, 더욱 바람직하게는 80% 또는 85%, 더욱 바람직하게는 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 심지어 99% 동일하다.
"융합 단백질"이란, 2개 이상의 다른 단백질에서 발췌한 서열 요소를 결합시킨 조작된 폴리펩티드를 의미한다.
본원에 사용된 바와 같이, "형질주입하다(transfect, transfects)", "형질주입하는" 및 "형질주입"이라는 용어는, 예를 들면 양이온성 지질 비히클(들)의 사용 및/또는 전기천공법 또는 기타 당업자가 인정하는 다른 트랜스펙션 수단에 의해 핵산(보통 DNA 또는 RNA)을 세포질 또는 세포의 핵에 전달하는 것을 지칭한다.
"형질도입(transduction)"이란, 바이러스 전달의 사용을 통해, 예를 들면 렌티바이러스 전달 벡터/플라스미드 또는 그외 분야에서 인정된 트랜스덕션의 수단을 통해 핵산(일반적으로 DNA 또는 RNA)을 세포질 또는 세포의 핵에 전달하는 것을 의미한다.
본원에 사용된 바와 같은 "플라스미드"라는 용어는 표적화 세포의 형질전환을 지시하도록 설계된 유전 물질로 구성된 조작된 구축물을 지칭한다. 플라스미드는 플라스미드 백본으로 이루어진다. 본원에 사용된 바와 같은 "플라스미드 백본"은 핵산 카세트의 핵산이 전사될 수 있고, 필요한 경우 형질주입된 또는 형질도입된 세포에서 번역될 수 있도록, 다른 필요한 유전 요소와 함께 위치적 및 순차적으로 배향된 다수의 유전 요소를 함유한다. 본원에 사용된 바와 같은 플라스미드라는 용어는 특정 유전자를 인코딩하는 하나 이상의 핵산의 단편이 삽입 또는 복제될 수 있는 핵산, 예를 들면 플라스미드 벡터, 코스미드, 파제미드 또는 박테리오파지로부터 유래된 DNA를 지칭할 수 있다.
본원에 사용된 바와 같은 "바이러스 벡터"는 벡터 내에 바이러스 게놈의 일부, 예를 들면 패키징 신호를 포함함으로써 바이러스 입자 내에 물리적으로 포함되는 것이고, 단순히 바이러스 핵산의 일부로부터 취한 DNA 또는 위치한 유전자는 아니다. 따라서, 바이러스 게놈의 일부가 본 개시의 플라스미드에 존재할 수 있지만, 그 일부는 바이러스 입자로의 플라스미드의 포함을 유발하지 않으며, 따라서 감염성 바이러스 입자를 생산할 수 없다.
본원에 사용된 바와 같이, "벡터"라는 용어는 적절한 제어 요소와 관련되었을 때 복제가 가능하고, 또한 세포 사이에서 유전자 서열을 전달할 수 있는, 플라스미드, 파지, 트랜스포손, 코스미드, 염색체, 바이러스, 비리온 등과 같은 임의의 유전 요소를 지칭한다. 따라서, 이 용어는 바이러스 벡터뿐만 아니라 복제 및 발현 비히클을 포함한다.
본원에 사용된 바와 같이, "통합 벡터"라는 용어는 인테그라제를 통해 핵산(예를 들면 염색체)에의 통합 또는 삽입이 달성되는 벡터를 지칭한다. "통합 벡터"의 예로는 레트로바이러스 벡터, 트랜스포존 및 아데노연관 바이러스 벡터를 들 수 있지만, 이에 제한되지 않는다.
본원에 사용된 바와 같이, "통합된"이라는 용어는 숙주 세포의 게놈(즉, 염색체)에 안정적으로 삽입되는 벡터를 지칭한다.
본원에 사용된 바와 같이, "외인성 유전자"라는 용어는 숙주 유기체 또는 세포에 자연적으로 존재하지 않거나, 또는 숙주 유기체 또는 세포에 인위적으로 도입되는 유전자를 지칭한다.
"유전자"라는 용어는 전구체 또는 폴리펩티드(예를 들면 STRC)의 생산에 필요한 코딩 서열을 포함하는 핵산(예를 들면 DNA 또는 RNA) 서열을 지칭한다. 폴리펩티드는 전체 길이 또는 단편의 소망하는 활성 또는 기능적 특성(예를 들면 개선된 유모세포 생존 및 유모세포 기능)이 유지되는 한, 전체 길이 코딩 서열 또는 코딩 서열의 임의의 부분에 의해 인코딩될 수 있다. 또한, 이 용어는 구조 유전자의 코딩 영역을 포함하며, 유전자가 전체 길이 mRNA의 길이와 일치하도록 양 단부에서 약 1kb 이상의 거리에 걸쳐 5' 및 3' 양 말단의 코딩 영역에 인접하여 위치한 서열을 포함한다. 코딩 영역의 5'에 위치하며, mRNA에 존재하는 서열은 5' 미번역 서열이라고 칭해진다. 코딩 영역의 3' 또는 그 하류에 위치하며, mRNA에 존재하는 서열은 3' 미번역 서열이라고 칭해진다. "유전자"라는 용어는 유전자의 cDNA 및 게놈 형태를 모두 포함한다. 유전자의 게놈 형태 또는 클론은 "인트론" 또는 "개재 영역" 또는 "개재 서열"이라고 하는 비코딩 서열로 중단된 코딩 영역을 함유한다. 인트론은 핵 RNA(hnRNA)로 전사되는 유전자의 세그먼트이며; 인트론은 인핸서와 같은 조절 요소를 함유할 수 있다. 인트론은 핵 또는 1차 전사체에서 제거되거나 또는 "스플라이스드 아웃(spliced out)"되므로, 메신저 RNA(mRNA) 전사체에는 존재하지 않는다. mRNA는 번역 중에 초기 폴리펩티드의 아미노산 서열 또는 순서를 지정하는 기능을 한다.
본원에 사용된 바와 같이, "유전자 발현"이라는 용어는 유전자의 "전사"를 통해(즉, RNA 폴리메라아제의 효소 작용을 통해) 유전자에 인코딩된 유전 정보를 RNA(예를 들면 mRNA, rRNA, tRNA 또는 snRNA)로 변환하는 과정, 및 단백질 인코딩 유전자일 경우에는 mRNA의 "번역"을 통해 단백질로 변환하는 과정을 지칭한다. 유전자 발현은 이 과정의 다수의 단계에서 조절될 수 있다. "상향 조절" 또는 "활성화"는 유전자 발현 산물(예를 들면 RNA 또는 단백질)의 생산을 증가시키는 조절을 지칭하는 한편, "하향 조절" 또는 "억제"는 생산을 감소시키는 조절을 지칭한다. 상향 조절 또는 하향 조절에 관여하는 분자(예를 들면 전사 인자)는 각각 '활성화제'와 '억제제'라고 부르는 경우도 있다.
본원에서 "아미노산 서열"이 자연적으로 발생하는 단백질 분자의 아미노산 서열을 지칭하기 위해 인용되는 경우, "아미노산 서열" 및 유사 용어, 예를 들면 "폴리펩티드" 또는 "단백질"은 아미노산 서열을 인용된 단백질 분자와 관련된 완전한 네이티브 아미노산 서열로 제한하고는 것을 의미하는 것은 아니다.
본원에 사용된 바와 같이, "핵산 분자 인코딩", "DNA 서열 인코딩", "DNA 인코딩", "RNA 서열 인코딩" 및 "RNA 인코딩"이라는 용어는 데옥시리보핵산 또는 리보핵산의 가닥을 따라 데옥시리보뉴클레오티드 또는 리보뉴클레오티드의 순서 또는 서열을 지칭한다. 이러한 데옥시리보뉴클레오티드 또는 리보뉴클레오티드의 순서는 폴리펩티드(단백질) 쇄를 따라 아미노산의 순서를 결정한다. 따라서, DNA 또는 RNA 서열은 아미노산 서열을 코딩한다.
본원에 사용된 바와 같이, "변이체"라는 용어는, 단백질과 관련하여 사용될 때, 단백질의 아미노산 서열이 변이하도록 부분적으로 상동하는 핵산에 의해 인코딩된 단백질을 지칭한다. 본원에 사용된 바와 같이, "변이체"라는 용어는 단백질 기능의 변화를 초래하지 않는 보수적 및 비보수적 아미노산 치환 둘 다를 갖는 상동 유전자에 의해 인코딩된 단백질뿐만 아니라, 단백질 기능의 감소(예를 들면 널 돌연변이) 또는 단백질 기능의 증가를 유발하는 아미노산 치환을 갖는 상동 유전자에 의해 인코딩된 단백질을 포함한다.
본원에 사용된 바와 같이, "작동 가능한 조합으로", "작동 가능한 순서로" 및 "작동적으로 연결된"이라는 용어는 주어진 유전자의 전사 및/또는 소망하는 단백질 분자의 합성을 지시할 수 있는 핵산 분자가 생산되는 방식으로의 핵산 서열의 연결을 지칭한다. 또한, 이 용어는 기능성 단백질이 생산되는 방식으로의 아미노산 서열의 연결을 지칭한다.
본원에 사용된 바와 같이, "조절 요소"라는 용어는 핵산 서열의 발현의 일부 양태를 제어하는 유전 요소를 지칭한다. 예를 들면, 프로모터는 작동적으로 연결된 코딩 영역의 전사의 개시를 용이하게 하는 조절 요소이다. 다른 조절 요소는 스플라이싱(splicing) 신호, 폴리아데닐화 신호, 종결 신호, RNA 내보내기(export) 요소, 내부 리보솜 진입 부위 등이다.
진핵 생물의 전사 조절 신호는 "프로모터" 요소 및 "인핸서" 요소를 포함한다. 프로모터 및 인핸서는 전사에 관여하는 세포 단백질과 특이적으로 상호 작용하는 짧은 배열의 DNA 서열로 이루어진다(Maniatis et al., (1987) Science 236:1237). 프로모터 요소 및 인핸서 요소는 효모, 곤충 및 포유류 세포에 있어서의 유전자를 포함한 다양한 진핵 생물, 및 바이러스로부터 분리되어 왔다(유사 제어 요소, 즉 프로모터는 원핵 생물에서도 발견됨). 특정 프로모터 및 인핸서의 선택은 관심 있는 단백질을 발현시키기 위해 사용할 세포 유형에 따라 달라진다. 일부 진핵 생물 프로모터 및 인핸서는 숙주 범위가 넓은 반면, 그외의 것은 세포 유형의 제한된 서브셋에서 기능적이다(검토를 위해서는 Voss et al., (1986) Trends Biochem. 11 : 287; 및 Maniatis et al., 상기 참고, 참조). 예를 들면, SV40 초기 유전자 인핸서는 다수의 포유류 종 유래의 다양한 세포 유형에서 매우 활성이어서, 포유류 세포에서의 단백질 발현에 널리 사용되어 왔다(Dijkema et al., (1985) EMBO J. 4:761). 광범위한 포유류 세포 유형에서 활성인 프로모터/인핸서 요소의 두 가지 다른 예는 인간 신장 인자 1α 유전자(Uetsuki et al., (1989) J. Biol. Chem., 264:5791; Kim et al., (1990) Gene 91:217; 및 Mizushima and Nagata, (1990) Nuc. Acids. Res., 18:5322) 및 루스 육종 바이러스(Gorman et al., (1982) Proc. Natl. Acad. USA 79:6777) 및 인간 거대세포바이러스(Boshart et al., (1985) Cell 41:521)의 긴 말단 반복으로부터의 것들이다.
본원에 사용된 바와 같이, "프로모터/인핸서"라는 용어는 프로모터 기능 및 인핸서 기능(즉, 프로모터 요소 및 인핸서 요소에 의해 제공되는 기능, 이들 기능에 대한 논의는 상기 참조)을 모두 제공할 수 있는 서열을 포함하는 DNA의 세그먼트를 나타낸다. 예를 들면, 레트로바이러스의 긴 말단 반복은 프로모터와 인핸서 기능을 모두 포함한다. 인핸서/프로모터는 "내인성", "외인성" 또는 "이종성"일 수 있다. "내인성" 인핸서/프로모터는 게놈의 주어진 유전자와 자연적으로 연결되어 있는 것이다. "외인성" 또는 "이종성" 인핸서/프로모터는 해당 유전자의 전사가 연결된 인핸서/프로모터에 의해 지시되도록 유전자 조작(즉, 복제 및 재조합과 같은 분자생물학적 기술)을 통해 유전자에 병치되게 배치된 것이다.
본원에 사용된 바와 같은 "프로모터", "프로모터 요소" 또는 "프로모터 서열"이라는 용어는 관심 있는 뉴클레오티드 서열에 결찰되었을 때, 관심 있는 뉴클레오티드 서열의 mRNA로의 전사를 제어할 수 있는 DNA 서열을 지칭한다. 프로모터는 반드시 그런 것은 아니지만 일반적으로 관심 있는 뉴클레오티드 서열의 5'(즉, 상류)에 위치하여 mRNA로의 전사를 제어하며, 전사 개시를 위한 RNA 폴리메라아제 및 다른 전사 인자에 의한 특정 결합을 위한 부위를 제공한다.
프로모터는 구성적이거나 또는 조절 가능할 수 있다. 프로모터와 관련하여 "구성적"이라는 용어는 프로모터가 자극(예를 들면 열 충격, 화학 물질 등)의 부재시 작동적으로 연결된 핵산 서열의 전사를 지시할 수 있다는 것을 의미한다. 이와 대조적으로, "조절 가능한" 프로모터는 자극의 부재시 작동적으로 연결된 핵산 서열의 전사의 수준과는 상이한, 자극(예를 들면 열 충격, 화학 물질 등)의 존재시 작동적으로 연결된 핵산 서열의 전사 수준을 지시할 수 있는 것이다. 또한, 소정의 프로모터는 그러한 프로모터의 제어 하에 핵산 서열의 발현에 조직 특이성 및/또는 시간적/발달적 특이성을 부여하는 것으로 당업자에게 알려져 있다.
본원에 사용된 바와 같이, "레트로바이러스"라는 용어는 세포에 들어갈 수 있고(즉, 입자가 숙주 세포 표면에 결합하여 바이러스 입자가 숙주 세포의 세포질로 들어가는 것을 용이하게 할 수 있는 외피 단백질 또는 바이러스 G 당단백질과 같은 막 관련 단백질을 포함함), 레트로바이러스 게놈(이중가닥 프로바이러스)을 숙주 세포의 게놈에 통합할 수 있는 레트로바이러스 입자를 지칭한다. "레트로바이러스"라는 용어는 종양 바이러스(예를 들면 몰로니 마우스 백혈병 바이러스(MoMLV, 및 본원에서는 단순히 "MLV"라고도 함), 몰로니 마우스 육종 바이러스(MoMSV), 마우스 유방 종양 바이러스(MMTV), 스푸마 바이러스(spumavirinae), 및 렌티 바이러스(예를 들면 인간 면역결핍 바이러스, 시미안 면역결핍 바이러스, 말 감염성 빈혈 바이러스, 및 카프린 관절염-뇌염 바이러스; 예를 들면 미국특허 제5,994,136호 및 제6,013,516호 참조, 모두 본원에 참조로 통합되어 있음)를 포함한다.
본원에 사용된 바와 같이, "레트로바이러스 벡터"라는 용어는 관심 있는 유전자를 발현하도록 변형된 레트로바이러스를 지칭한다. 레트로바이러스 벡터는 바이러스 감염 과정을 이용하여 유전자를 숙주 세포로 효율적으로 전달하는 데 사용될 수 있다. 레트로바이러스 게놈 내로 복제된(즉, 분자생물학적 기술을 사용하여 삽입된) 외래 또는 이종성 유전자는 레트로바이러스에 감염되기 쉬운 숙주 세포에 효율적으로 전달될 수 있다.
본원에 사용된 바와 같이, "렌티바이러스 벡터"라는 용어는 비분열성 세포에 통합될 수 있는 렌티바이러스과(예를 들면 인간 면역결핍 바이러스, 시미안 면역결핍 바이러스, 말 전염성 빈혈 바이러스, 및 카프린 관절염-뇌염 바이러스)로부터 유래된 레트로바이러스 벡터를 지칭한다(예를 들면 미국 특허 제5,994,136호 및 제6,013,516호 참조, 둘 다 본원에 참조로 포함되어 있음).
본원에 사용된 바와 같이, "아데노연관 바이러스(AAV) 벡터"라는 용어는 아데노연관 바이러스 항원형으로부터 유래된 벡터를 지칭하며, 제한되지는 않지만, AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9 등을 포함한다. AAV 벡터는 전체 또는 일부가 삭제된 하나 이상의 AAV 야생형 유전자, 바람직하게는 렙(rep) 유전자 및/또는 캡(cap) 유전자를 가질 수 있지만, 기능성 플랭킹(flanking) ITR 서열을 보유할 수 있다.
본원에 사용된 바와 같이, "시험관 내"라는 용어는 인공 환경 및 인공 환경 내에서 발생하는 과정 또는 반응을 지칭한다. 시험관 내 환경은 시험관 및 세포 배양으로 이루어질 수 있지만, 이에 제한되지 않는다. "생체 내"라는 용어는 자연 환경(예를 들면 동물 또는 세포) 및 자연 환경 내에서 발생하는 과정 또는 반응을 지칭한다.
본원에 사용된 바와 같이, "숙주 세포"라는 용어는 시험관 내 또는 생체 내 위치된 것에 관계없이, 임의의 진핵 세포(예를 들면 포유류 세포, 조류 세포, 양서류 세포, 식물 세포, 어류 세포 및 곤충 세포)를 지칭한다.
"투여"라는 용어는 피험체에게 물질을 도입하는 것을 지칭한다. 일반적으로, 예를 들면 비경구(예를 들면 정맥), 경구, 국소, 피하, 복막, 동맥 내, 흡입, 질, 직장, 비강, 뇌척수액으로의 도입, 또는 체 구획(body compartment)으로의 주입을 포함한 임의의 투여 경로가 이용될 수 있다. 일부 실시형태에 있어서, 투여는 경구 투여이다. 추가적으로 또는 대안적으로, 일부 실시형태에 있어서, 투여는 비경구 투여이다. 일부 실시형태에 있어서, 투여는 정맥 내 투여이다.
"약제"는 임의의 작은 화합물(예를 들면, 저분자), 항체, 핵산 분자, 또는 폴리펩티드, 또는 이들의 단편 또는 동종 이식 및/또는 CART 세포 요법과 같은 세포 치료제를 지칭한다.
"STRC 핵산 분자"는 STRC 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 지칭한다. 예시적인 STRC 핵산 분자는 하기 서열(예를 들면 NM_153700)(서열번호 1)과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다:
"STRC 폴리펩티드"란 하기 서열(예를 들면 NP_714544.1)(서열번호 2)과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 폴리펩티드 또는 그 단편을 의미한다:
"STRC 게놈 서열"이란 STRC 폴리펩티드를 인코딩하는 게놈 폴리뉴클레오티드를 의미한다. 예시적인 STRC 게놈 서열은 하기 서열(예를 들면 NC_000015.10)(서열번호 3)과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다:
"인간 Myo7A 프로모터"란 인간 Myo7A 프로모터 영역을 인코딩하는 폴리뉴클레오티드를 의미한다. 예시적인 Myo7A 프로모터 핵산 분자는 하기 서열(서열번호 4)과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다:
"인간 Myo7A 인핸서"란 Myo7A 인핸서 영역(예를 들면, 인트론 1 인핸서)을 인코딩하는 폴리뉴클레오티드를 의미한다. 예시적인 인간 Myo7A 인핸서 핵산 분자는 하기 서열(서열번호 : 5)과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다:
"마우스 Myo7A 프로모터"란 마우스 Myo7A 프로모터 영역을 인코딩하는 폴리뉴클레오티드를 의미한다. 예시적인 Myo7A 프로모터 핵산 분자는 하기 서열(서열번호 6)과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다:
구체적으로 언급되지 않거나 문맥상 명백하지 않는 한, 본원에 사용되는 용어 "약"은 당업계의 정상적인 허용 범위 내, 예를 들면 평균의 2 표준편차 내인 것으로 이해된다. "약"은 명시된 값의 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.05% 또는 0.01% 이내로 이해될 수 있다.
소정 실시형태에 있어서, 용어 "대략" 또는 "약"은 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 내에 속하는 값의 범위, 또는 달리 명시되지 않거나 문맥상 달리 명백하지 않는 한, 명시된 기준값의 어느 방향(보다 크거나 작음)으로든 그 이하를 말한다(해당 숫자가 가능한 값의 100%를 초과하는 경우는 제외).
문맥상 달리 명백하지 않는 한, 본원에 제공된 모든 수치는 "약"이라는 용어로 수식된다.
"대조군" 또는 "참조"는 비교 표준을 의미한다. 대조군 샘플을 선택하고 테스트하는 방법은 해당 분야의 능력 내에 있다. 통계적 유의성의 결정, 예를 들면 긍정적인 결과를 구성하는 평균으로부터의 표준 차의 수는 당업자의 능력 내에 있다.
본원에 사용되는 바와 같이, 항목의 컬렉션과 관련하여 사용되는 경우에 용어 "각각"은 컬렉션에 있어서의 개별 항목을 식별하도록 의도되었지만 반드시 컬렉션의 모든 항목을 지칭하는 것은 아니다. 명시적인 공개 또는 문맥에 따라 달리 명시되는 경우 예외가 발생할 수 있다.
본원에 사용되는 바와 같이, 용어 "피험체"는 인간 및 포유동물(예를 들면, 마우스, 래트, 돼지, 고양이, 개 및 말)이 포함된다. 다수의 실시형태에 있어서, 피험체는 포유동물, 특히 영장류, 특히 인간이다. 일부 실시형태에 있어서, 피험체는 소, 양, 염소, 암소, 돼지 등과 같은 가축; 닭, 오리, 거위, 칠면조 등과 같은 가금류; 개 및 고양이와 같은 가축, 특히 반려동물이다. 일부 실시형태에 있어서(예를 들면, 특히 연구 문맥에서), 피험체 포유동물은 예를 들면 설치류(예를 들면, 마우스, 래트, 햄스터), 토끼, 영장류, 또는 근친교배된 돼지 등과 같은 돼지일 것이다.
구체적으로 언급되지 않거나 문맥상 명백하지 않는 한, 본원에 사용되는 바와 같이, 용어 "또는"은 포괄적인 것으로 이해된다. 구체적으로 언급되지 않거나 문맥상 명백하지 않는 한, 본원에 사용되는 바와 같이, 용어 "한(a, an)", 및 "그(the)"는 단수 또는 복수인 것으로 이해된다.
범위는 본원에서 하나의 특정값 "약"으로부터, 및/또는 또 다른 특정값 "약"까지 표현될 수 있다. 이러한 범위가 표현되는 경우, 또 다른 양태는 하나의 특정값으로부터 및/또는 다른 특정값으로인 것을 포함한다. 유사하게, 앞의 "약"을 사용하여 값이 근사값으로 표현되는 경우, 특정값이 또 다른 양태를 형성하는 것으로 이해된다. 각각의 범위의 종점은 다른 종점과 관련하여, 그리고 다른 종점과 독립적으로 둘 다 중요하다는 것도 추가로 이해된다. 또한, 본원에 개시된 다수의 값이 있고, 또한 각각의 값은 값 자체에 추가하여 특정값인 "약"으로서 본원에 개시된다는 것도 이해된다. 또한, 용도 전반에 걸쳐서 데이터는 다수의 상이한 형식으로 제공되며, 이 데이터는 데이터 지점의 임의의 조합에 대한 종점, 개시점 및 범위를 나타낸다. 예를 들면, 특정 데이터 지점 "10"과 특정 데이터 지점 "15"가 개시되면, 10과 15 사이뿐만 아니라, 10 및 15에 대해 초과, 이상, 미만, 이하, 및 동등한 것도 간주하여 개시되는 것으로 이해된다. 또한, 2개의 특정 유닛 사이의 각각의 유닛도 개시되는 것으로 이해된다. 예를 들면, 10과 15가 기재되면, 11, 12, 13 및 14도 개시된다.
본원에 제공되는 범위는 해당 범위 내의 모든 값에 대한 약어로 이해된다. 예를 들면, 1 내지 50의 범위는 임의의 숫자, 숫자의 조합, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50뿐만 아니라, 예를 들면 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8 및 1.9와 같은 상술한 정수 사이의 모든 개입 십진수로 이루어지는 군에서 하위 범위를 포함하는 것으로 이해된다. 하위 범위와 관련하여, 범위의 양쪽 종점으로부터 확장되는 "내포된 하위 범위"가 구체적으로 고려된다. 예를 들면, 1 내지 50의 예시적인 범위의 내포된 하위 범위는 한 방향으로 1 내지 10, 1 내지 20, 1 내지 30, 및 1 내지 40, 또는 다른 방향으로는 50 내지 40, 50 내지 30, 50 내지 20, 및 50 내지 10을 포함할 수 있다.
본원에 사용되는 바와 같이, 용어 "치료하다", "치료하는" 및 "치료"는 임상 결과의 바람직한 변화를 목표로 하는 다양한 활동을 포함한다. 예를 들면, 본원에 사용되는 바와 같이, 용어 "치료"는 본원에 기술된 바와 같이 청력 손실의 하나 이상의 임상 지표 또는 증상의 검출가능한 개선을 달성하는 것을 목표로 하거나 달성하는 모든 활동을 포함한다.
"포함하는(including)", "함유하는(containing)" 또는 "을 특징으로 하는(characterized by)"과 동의어인 과도기적 용어 "포함하는(comprising)"은 포괄적이거나 개방적이며, 추가적이고, 인용되지 않은 요소 또는 방법 단계를 배제하지 않는다. 대조적으로, "이루어진"이라는 과도기적 문구는 청구항에 명시되지 않은 모든 요소, 단계 또는 성분을 한정한다. "본질적으로 이루어진"이라는 과도기적 문구는 청구항의 범위를 본 개시에 제시된 청구된 실시형태의 지정된 재료 또는 단계 "및 기본적이고 신규한 특성(들)에 실질적으로 영향을 미치지 않는 것"으로 한정한다.
이하에 설명되고 청구범위에 인용된 실시형태는 상기 정의를 고려하여 이해될 수 있다.
본 개시의 다른 특징 및 이점은 바람직한 실시형태의 이하의 설명, 및 청구범위로부터 명백해질 것이다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 개시에 속하는 기술 분야의 숙련자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기술된 것과 유사하거나 동등한 방법 및 재료가 본 개시의 실시 또는 테스트에 사용될 수 있지만, 적합한 방법 및 재료는 이하에 기술되어 있다. 본원에 인용된 모든 공개된 외국 특허 및 특허 출원은 본원에 참고로 포함된다. 본원에 인용된 다른 공개된 참고문헌, 문서, 원고 및 과학 문헌은 본원에 참고로 포함된다. 상충되는 경우, 정의를 포함하는 본 명세서는 제어될 것이다. 또한, 재료, 방법 및 실시예는 단지 예시적인 것일 뿐이고 한정하려는 의도는 아니다.
한 양태에 있어서, 본 개시는 서열번호 1로 이루어진 군에서 선택된 핵산 서열, 서열번호 1의 핵산과 적어도 90%의 서열 동일성을 갖는 핵산 서열, 및 핵산 서열에 작동적으로 연결된 프로모터를 포함한다.
일부 실시형태에 있어서, 발현 벡터는 렌티바이러스 벡터이다.
일부 실시형태에 있어서, 발현 벡터는 예를 들면 AAV2, AAV2/Anc80, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh8, AAVrh10, AAVrh39, AAVrh43, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, Anc80 또는 AAV50과 같은 아데노연관 바이러스 벡터이다.
일부 실시형태에 있어서, 프로모터는 STRC 프로모터, Myo7a 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터, Barhl1 프로모터/인핸서, 또는 Pou4f3 프로모터일 수 있다.
한 양태에 있어서, 본 개시는 서열번호 1의 핵산 서열 또는 서열번호1의 핵산과 적어도 90%의 서열 동일성을 갖는 핵산 서열을 포함하는, 발현 벡터를 포함하는 청력 손실의 치료 또는 예방 방법에 사용하기 위한 의약 조성물을 제공하며; 상기 핵산 서열은 핵산에 작동적으로 연결되어 있다.
한 양태에 있어서, 본 개시는 서열번호 1의 핵산 서열, 서열번호 1의 핵산과 적어도 90%의 서열 동일성을 갖는 핵산 서열; 및 핵산에 작동적으로 연결된 프로모터를 포함하는 발현 벡터를 포함하는 세포를 제공한다.
한 양태에 있어서, 본 개시는 서열번호 1로 이루어진 군에서 선택된 핵산 서열, 서열번호 1의 핵산과 적어도 90%의 서열 동일성을 갖는 핵산 서열; 및 핵산에 작동적으로 연결된 프로모터를 포함하는 발현 벡터의 유효량을 이를 필요로 하는 피험체에게 투여하는 단계를 포함하는 청력 손실을 치료 또는 예방하는 방법을 제공한다.
일부 실시형태에 있어서, 발현 벡터는 예를 들면 AAV2, AAV2/Anc80, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh8, AAVrh10, AAVrh39, AAVrh43, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, Anc80 또는 AAV50과 같은 렌티바이러스 벡터 또는 아데노연관 바이러스 벡터일 수 있다.
일부 실시형태에 있어서, 프로모터는 STRC 프로모터, Myo 6 프로모터, Myo7a 프로모터, 프레스틴 프로모터/인핸서, Myo15 프로모터/인핸서, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터, Barhl1 프로모터/인핸서, 또는 Pou4f3 프로모터일 수 있다.
일부 실시형태에 있어서, 세포는 줄기세포이다. 일부 실시형태에 있어서, 줄기세포는 유도만능 줄기세포이다.
일부 실시형태에 있어서, 발현 벡터는 피험체의 내이로의 주입에 의해 투여된다. 일부 실시형태에 있어서, 주사 방법은 와우 개창술(cochleostomy), 정원창막(round window membrane), 내림프낭, 스칼라 메디아(scala media), 카날로스토미(canalostomy), 내림프낭을 통한 스칼라 메디아, 또는 이들의 임의의 조합으로 이루어진 군에서 선택된다.
일부 실시형태에 있어서, 피험체는 청력 손실과 관련된 하나 이상의 유전적 위험 인자를 갖는다.
일부 실시형태에 있어서, 유전적 위험 인자는 STRC 유전자에 있어서의 돌연변이일 수 있다.
일부 실시형태에 있어서, 피험체는 청력 손실의 임상 지표를 전혀 나타내지 않는다.
한 양태에 있어서, 본 개시는 인간 STRC 유전자에 있어서의 돌연변이/변이로 이루어진 군에서 선택된 청력 손실을 유발하는 돌연변이/변이를 포함하는 형질전환 마우스를 제공한다.
본 발명으로 간주되는 주제는 명세서 말미의 청구범위에서 특히 지적되고 명백하게 청구된다. 본 발명의 상술한 다른 목적, 특징 및 이점은 수반되는 도면과 함께 취해지는 이하의 상세한 설명으로부터 명백해질 것이다.
도 1은 15q13-q21로부터 염색체 15에 있는 스테레오실린(STRC) 유전자의 위치를 나타낸다.
도 2는 STRC의 mRNA 전사 맵을 나타낸다.
도 3은 STRC 위유전자의 mRNA 전사 맵을 나타낸다.
도 4는 예시적인 LV-SIN 렌티바이러스 벡터의 선형 벡터 맵을 나타내며, GOI는 STRC 유전자를 나타낸다.
도 5는 예시적인 LV-ctrl 렌티바이러스 벡터의 선형 벡터 맵을 나타낸다.
도 6a-6d는 HEI-OC1 세포에 있어서의 dTom 발현을 나타내는 일련의 점도표이다. 특히, 벡터-인코딩된 dTomato 리포터 및 STRC 단백질을 발현하는 HEI-OC1 세포의 백분율이다. 유세포 분석은 MOI2에서 LV-ctrl 또는 LV-SIN으로 형질도입된 세포 및 비형질도입 대조군(NTC)에 있어서의 dTom 발현에 대한 세포내 염색시 수행된다. 나타낸 집단은 SSC-A/FSC-A 특성을 사용하여 살아있는 세포에 대해 사전 게이팅되고, 이어서 FSC-A/FSC-H 특성에 따라 단일 세포에 대해 게이팅된다. 도 6a는 NTC에 대한 데이터를 나타낸다. 도 6b는 MOI 1.277에서의 dTom 발현을 나타낸다. 도 6c는 MOI 3.278에서의 dTom 발현을 나타낸다. 도 6d는 MOI 10.279에서의 dTom 발현을 나타낸다.
도 7은 인간 거대세포바이러스 프로모터(hcmv-p)/STRC/dTom 카세트가 수포성 구내염 바이러스(VSV-g) 단백질로 슈도타입 형성된 제 3 세대 렌티바이러스에 통합된 유전자 치료 구축물의 예시적 실시형태를 통해 마우스의 내이로 예시적인 인간 STRC 유전자를 전달하는 형광 이미지를 나타낸다. 간단히 말하면, STRC 전사는 hcmv-p에 의해 제어되고, dTom 태그는 발현된 STRC 단백질의 검출을 용이하게 한다. 내부 유모세포(화살표) 및 외부 유모세포(별)로의 강력한 전달이 감지된다.
도 8은 성체 마우스 내이에 있어서의 슈도타입 형성된 LV-hcmv-dTom의 분포를 나타낸다. P30 C57Bl/6 마우스의 후방 반고리관에 1×10^6 PU를 전달한다. dtom의 발현은 STRC에 있어서의 돌연변이에 의해 표적화되는 세포를 표적화하는 이 벡터의 능력을 입증하는 나선 신경절뿐만 아니라 모든 유모세포에서 볼 수 있다.
도 2는 STRC의 mRNA 전사 맵을 나타낸다.
도 3은 STRC 위유전자의 mRNA 전사 맵을 나타낸다.
도 4는 예시적인 LV-SIN 렌티바이러스 벡터의 선형 벡터 맵을 나타내며, GOI는 STRC 유전자를 나타낸다.
도 5는 예시적인 LV-ctrl 렌티바이러스 벡터의 선형 벡터 맵을 나타낸다.
도 6a-6d는 HEI-OC1 세포에 있어서의 dTom 발현을 나타내는 일련의 점도표이다. 특히, 벡터-인코딩된 dTomato 리포터 및 STRC 단백질을 발현하는 HEI-OC1 세포의 백분율이다. 유세포 분석은 MOI2에서 LV-ctrl 또는 LV-SIN으로 형질도입된 세포 및 비형질도입 대조군(NTC)에 있어서의 dTom 발현에 대한 세포내 염색시 수행된다. 나타낸 집단은 SSC-A/FSC-A 특성을 사용하여 살아있는 세포에 대해 사전 게이팅되고, 이어서 FSC-A/FSC-H 특성에 따라 단일 세포에 대해 게이팅된다. 도 6a는 NTC에 대한 데이터를 나타낸다. 도 6b는 MOI 1.277에서의 dTom 발현을 나타낸다. 도 6c는 MOI 3.278에서의 dTom 발현을 나타낸다. 도 6d는 MOI 10.279에서의 dTom 발현을 나타낸다.
도 7은 인간 거대세포바이러스 프로모터(hcmv-p)/STRC/dTom 카세트가 수포성 구내염 바이러스(VSV-g) 단백질로 슈도타입 형성된 제 3 세대 렌티바이러스에 통합된 유전자 치료 구축물의 예시적 실시형태를 통해 마우스의 내이로 예시적인 인간 STRC 유전자를 전달하는 형광 이미지를 나타낸다. 간단히 말하면, STRC 전사는 hcmv-p에 의해 제어되고, dTom 태그는 발현된 STRC 단백질의 검출을 용이하게 한다. 내부 유모세포(화살표) 및 외부 유모세포(별)로의 강력한 전달이 감지된다.
도 8은 성체 마우스 내이에 있어서의 슈도타입 형성된 LV-hcmv-dTom의 분포를 나타낸다. P30 C57Bl/6 마우스의 후방 반고리관에 1×10^6 PU를 전달한다. dtom의 발현은 STRC에 있어서의 돌연변이에 의해 표적화되는 세포를 표적화하는 이 벡터의 능력을 입증하는 나선 신경절뿐만 아니라 모든 유모세포에서 볼 수 있다.
본 개시는 전장 또는 거의 전장의 스테레오실린(STRC) 유전자가 내이 세포에 있어서의 STRC의 강력한 발현을 생성하기 위해 내이 특이적 프로모터(예를 들면, 마우스 또는 인간 Myo7A 프로모터)의 제어 하에서 렌티바이러스 벡터에 통합될 수 있다는 발견에 적어도 부분적으로 기초한다. 본원의 기술은 유전자 요법을 통해 포유동물(예를 들면, 인간)에 있어서의 STRC 기능 상실 돌연변이를 구제하는 능력을 제공한다. 본 개시는 STRC 돌연변이로부터 야기된 장애를 겪고 있는 환자에게 STRC 기능을 회복하기 위한 조성물 및 방법을 제공한다.
개요
청력 손실은 인간에게 가장 흔한 감각 장애이다. 세계보건기구(WHO)가 발표한 청력 손실 장애 규모에 대한 2018년 추산에 따르면, 전 세계적으로 청력 손실 장애를 가진 사람은 4억6,600만명(성인 4억3,200만명, 어린이 3,400만 명)에 이른다. 청력 손실 장애를 가진 사람의 수는 2030년까지 6억3천만 명, 2050년에는 9억명 이상으로 증가할 것이다. 청력 손실 장애를 가진 사람의 90% 이상(4억2천만명)이 전 세계의 저소득 지역에 거주하고 있다(청력 손실의 유병률에 관한 WHO 글로번 추산, Prevention of Deafness WHO 2018).
언어 습득 전의 난청의 50% 이상이 유전적이다(Centers for Disease Control and Prevention- Genetics of Hearing Loss). 유전적 청력 손실 및 난청은 전음성, 감음신경성, 또는 이 둘의 조합; 증후군(외이 또는 다른 기관의 기형, 또는 다른 기관계와 관련된 의학적 문제와 관련됨) 또는 비증후군(외이의 가시적인 기형 또는 임의의 관련 의학적 문제와 관련 없음); 및 언어 습득 전(언어가 발달하기 전) 또는 언어 습득 후(언어가 발달한 후)일 수 있다(Deafness and Hereditary Hearing Loss Overview; GeneReviews; Richard JH Smith, MD, A Eliot Shearer, Michael S Hildebrand, PhD, and Guy Van Camp, PhD).
청각 장애는 신생아 1000명 중 약 1명에게 영향을 미치는 이질적인 장애이다. 현재, 42개 유전자와 69개 유전자좌(http://hereditaryhearingloss.org)가 비증후군성 상염색체 열성 난청(유전자좌 표기법 DFNB)과 관련되어 있다. 유럽 인구에서, 비증후군성 청력 손실(NSHL)의 20-40%는 DFNB1 유전자좌를 함께 구성하는 GJB2(MIM: 121011) 및 GJB6(MIM:604418)의 돌연변이로 인해 발생한다. 거의 예외 없이, 상염색체 열성 NSHL은 유사한 증상을 보이며, 청력 손실은 DFNB16 유전자좌를 포함하는 염색체 15q15.3에 STRC(MIM: 606440)가 할당된 언어 습득 전 발병 초기 후보 유전자 접근으로 극심하게 심각하다. 부동섬모는 종방향 강성과 외부 유모세포 구조에 필요한 교차결합을 형성하고, 기계적 편향시에 부동섬모 전달 민감한 채널이 세포 탈분극을 위해 열린다. 수개의 마우스 조직으로부터 역전사 효소 중합효소 연쇄 반응(RT PCR)은 내이에 있어서 강하고 거의 독점적인 발현을 보이고 있으며, 녹아웃시에 이러한 주요 구조는 없었다(Vona, B et al. "DFNB16 is a frequent cause of congenital hearing impairment: implementation of STRC mutation analysis in routine diagnostics." Clinical genetics vol. 87,1 (2015): 49-55. doi:10.1111/cge.12332).
혼합성 난청 인구에 있어서 1% 이상의 STRC 결실 빈도가 계산되었으며, STRC 청력 손실의 발생률은 16,000명 중 1명으로 추정된다. 축적된 증거는 DFNB16이 NSHL을 포함하는 유전적으로 이질적인 병인의 상당 부분을 구성한다는 것을 시사한다. STRC 스크리닝의 진단 실행을 방해하는 한 가지 과제는 4개의 유전자: HISPPD2A(MIM: 610979), CATSPER2(MIM: 607249), STRC 및 CKMT1A(MIM: 613415)를 가진 분절 중복을 포함하는 영역에서 STRC로부터 하류 100kb 미만에 존재하는 98.9% 게놈 및 99.6% 코딩 서열 동일성을 가진 처리되지 않은 위유전자의 존재이다. CKMT1A 이외에도, 이러한 위유전자에는 그들을 비활성화시키는 돌연변이를 가지고 있다. STRC와 CATSPER2의 동형접합 결손은 CATSPER2가 정자 운동성에 필요하기 때문에, 남성과 여성 모두에 있어서의 난청, 및 배타적 남성 불임을 특징으로 하는 난청 불임 증후군(DIS; MIM: 611102)을 야기한다. 위유전자 포함 없이 정확한 서열 분석 데이터를 생성하는 것이 어려울 뿐만 아니라, 이러한 데이터베이스는 위유전자 데이터로 '오염'되어 있기 때문에, 돌연변이 해석을 위한 신뢰할 수 있는 일반적 자원 없이 이러한 데이터를 해석하는 것은 훨씬 더 어렵다(Vona, B et al.(2015)).
유전적 청력 손실의 70% 이상이 비증후군성이다. 비증후군성 난청에 대한 상이한 유전자좌는 DFN(DeaFNess의 경우)으로 지정된다. 유전자좌는 유전 방식에 따라 명명된다: DFNA(상염색체 우성), DFNB(상염색체 열성) 및 DFNX(X-연관). 상기 지정 뒤에 오는 숫자는 유전자 매핑 및/또는 발견의 순서를 반영한다(Deafness and Hereditary Hearing Loss Overview; GeneReviews; Richard JH Smith, MD, A Eliot Shearer, Michael S Hildebrand, PhD, and Guy Van Camp, PhD). 일반적인 인구에서, 청력 손실의 유병률은 나이가 들수록 증가한다. 이러한 변화는 유전학과 환경의 영향, 및 환경적 요인과 개인의 유전적 소질 사이의 상호작용을 반영한다.
감음신경성 청력 손실(SNHL)은 인간에게 가장 흔한 신경퇴행성 질환이며, 현재 승인된 약리학적 개입은 없다. SNHL은 유전적 장애로 인해 발생할 수도 있고, 소리 외상 및 이독성과 같은 부상을 통해 얻을 수도 있다. 유전적 진단은 비증후군성 감음신경성 청력 손실을 일으키는 적어도 100개의 유전자가 있는 것으로 증명되었으며, 유전자에 있어서의 원인이 되는 변화의 대부분은 단일 뉴클레오티드 변이(SNV) 또는 작은 삽입/삭제(인델)인 것으로 나타났다. 최근에는, 복제수 변이(CNV)가 신경 발달 장애를 포함한 다수의 인간 질병에서 중요한 역할을 하는 것으로 밝혀졌다. CNV; 즉, 약 1kb 이상의 유전자의 삭제, 삽입 또는 복제를 통한 변경은 유전자 발현, 표현형의 변이, 및 유전자 파괴를 통한 적응에 영향을 미치는 것으로 생각되며, 이는 질병 특성에 영향을 미칠 수 있다. 보다 최근에는, CNV가 SNHL의 주요 원인으로 인식되고 있다. Sheareret 외에는, 89개의 청력 손실 관련 유전자 중 16개에서 확인되었으며, STRC 유전자는 SNHL4의 가장 흔한 원인이라고 보고되어 있다(Yokota, Yoh et al. "Frequency and clinical features of hearing loss caused by STRC deletions." Scientific reports vol. 9,1 4408. 13 Mar. 2019, doi:10.1038/s41598-019-40586-7).
CNV가 검출된 청력 손실 환자의 임상 특성은 1,025명의 피험체(연령 범위, 0~70세, 평균 연령, 11.8세)를 피험체로 한 연구를 통해 확인되었다. 발병 연령을 기준으로 선천성-6세, 7-18세, 성인기(>18세) 또는 알려지지 않음으로 분류하는 경우, 원인이 되는 STRC 결실이 있는 피험체의 대부분은 청소년기에 SNHL로 진단되었다. 원인이 되는 동형접합성 STRC 결실은 분리된 상염색체 열성 또는 산발성으로 분류된 723 사례 중 14개(1.94%), 상염색체 우성 유전이 있는 264 사례 중 3개(1.14%)에서 발견되었다. STRC의 중복(3개 복제)이 19명(1.85%)에서 확인되었다. 3개의 STRC 복제가 병원성인지 또는 표현형에 영향을 미치는지의 여부는 불분명했다. 추가적으로, 27명의 피험체가 캐리어 결실로 정의된 ST9RC 이형접합 결실로 확인되었다. 캐리어 STRC 결실의 빈도는 청력 손실 코호트에서 2.63%(27/1,025)이었으며, 이는 정상적인 청력 대조군의 빈도와 동일했다(2.63%, 4/152)(Yokota, Yoh et al.(2019)).
유전적 청력 손실로 진단된 연구 피험체 중 STRC의 CNV 유병률은 모든 피험체의 5%(17/395)를 차지했다. 또한, 청력 수준을 기준으로 경도에서 중도 또는 고도에서 심도로 분류하는 경우, 원인이 되는 STRC 결실의 유병률은 경도에서 중도의 SNHL을 가진 피험체에서 12%(17/140)이었다. 결과적으로, STRC 중의 CNV는 GJB2 중의 SNV 후에 경도에서 중도의 SNHL의 두 번째로 흔한 원인이었다. 고도에서 심도 또는 비대칭 SNHL을 가진 피험체 중 누구도 STRC에서 질병을 야기하는 CNV를 가지고 있지 않았다(Yokota, Yoh et al.(2019).
최근 유전적 및 유전자 치료 기술의 발전으로 인해 유전자 치료를 통해 다양한 열성 유형의 청력 손실을 구제할 수 있는 것으로 나타났다(Akil et al., 2012; Askew et al., 2015). 내이로의 장기간 유전자 전달은 아데노연관 바이러스 벡터(AAV)를 사용하여 달성되었다(Shu, Tao, Wang, et al., 2016). 유전자 치료(CGF166)를 사용하여 청력 손실을 역전시키는 최초의 인간 임상 시험은 2014년 6월에 개시되어 2019년 12월에 완료되었다(https://clinicaltrials.gov/ct2/show/NCT02132130). 이 시험에서는 달팽이관 지지 세포에서 atoh1의 과발현이 유모세포의 재생을 유도하는 효과를 평가했다. 이 도메인의 중개 연구를 위한 대체 질병 표적은 내이 내의 규정된 세포 그룹에 영향을 미치는 열성 유전적 청력 손실이다. 일반적인 집단 내의 돌연변이의 유병률 및 정상적인 세포 구조의 유지는 추가적인 고려 사항이다.
현재 청력 손실이나 난청을 예방 또는 치료하기 위해 승인된 치료제는 없다. 청력 손실 장애를 가진 사람들을 위한 현재 치료 옵션은 보청기 또는 인공 와우이다. 인공 와우 이식은 환자당 평생 비용이 $1,000,000가 넘는 관련 의료비용가 많이 드는 흔한 처치이다(Mohr PE, et al.(2000)). 미국에서는 고도에서 심도 청력 손실에 있어서 사회적 비용이 든다(Int J Technol Assess Health Care ;16(4):1120-35). 인공 와우 및 보청기의 평생 비용은 대부분의 사람들에게, 특히 저소득 지역(장애성 청력 손실을 가진 사람들의 대부분이 거주하는 곳)에 거주하는 사람들에게는 감당할 수 없을 만큼 높다. 인공 와우 및 보청기에 대한 비용 효율적인 대안을 제공하려면 치료 옵션이 필요하다.
본원에 기술된 바와 같이, 청력 손실의 흔한 열성 원인의 발생률을 주의 깊게 평가하고, 유전자의 크기와 바이러스 벡터 기술(즉, 운반 능력)의 최근 발전을 고려함으로써, 접근가능하고 상당히 흔한 환자 집단을 갖는 유전자 치료 프로그램을 개발하는 것이 가능할 수 있다. 예를 들면, STRC는 전 세계적으로 선천성 청력 손상의 주요 원인이며, 평생 보청기를 사용해야 하고 심한 경우에 인공 와우 이식이 필요할 정도로 심각하다.
STRC
STRC 유전자는 경도에서 중도 청력 손실을 일으키는 것으로 알려진 난청 관련 유전자로 알려져 있으며, DFNB16 유전자좌의 염색체 15q15.3에서 큰 결실의 일부이다. STRC 유전자는 염색체 15번의 직렬 복제의 일부이고; 제 2 복제는 위유전자이다. 두 복제는 100kb 미만의 간격으로 텔로미어에서 중심체 방향으로 되어 있다. 위유전자는 엑손 20에서의 정지 코돈(예를 들면, n.t.4057C>T, a.a.Gln1353Stop)에 의해 중단된다.
STRC에는 대략 19kb를 포함하는 29개의 엑손이 포함되어 있다. STRC는 1,809개의 아미노산으로 구성되어 있으며, 추정 신호 펩타이드와 여러 소수성 세그먼트를 포함하고 있어 원형질막 국소화를 암시한다. STRC 후 신호 펩타이드 절단의 예상 분자량은 194kD이다.
염색체 15번 염기쌍 위치(음성 가닥)를 포함하는 STRC의 엑손 맵은 표 2에 나타내어져 있다.
STRC 유전자에 일치하는 것으로 밝혀진 mRNA 전사체는 이하의 표 3에 나타내어져 있다. 일부 실시형태에 있어서, STRC 유전자는 Q7RTU9 서열을 포함한다.
스테레오실린은 내이, 신경계, 및 CD14+ 세포에서 발현된다. STRC 결실의 발생률은 농인 인구에서 약 1%에서 약 5% 사이로 추정된다(Yokota 2019). STRC 유전자에서의 돌연변이는 상염색체 열성 비증후군성 난청 유형 DFNB16과 관련되어 있다. DFNB16 청력 손실은 선천성 청력 손상의 주요 원인이다. DFNB16 청력 손실의 임상 특징은 다음과 같다(OMIM 603720):
·상 염색체 열성이다.
·대부분 선천성 발현한다.
·언어 습득 전 발병한다.
·청력 손실은 중도에서 심도이다.
·고주파수(예를 들면, 고주파수 경사)에 영향을 미친다.
·경시에 따라 안정될 가능성이 가장 높다.
STRC 유전자는 내이에서의 외부 유모세포의 부동섬모에서 발견되는 큰 세포외 구조 단백질인 스테레오실린을 인코딩한다. 이는 입체섬모 끝(OMIM 606440)의 적절한 응집 및 위치 지정에 중요한, 수평 상단 커넥터 및 외막 부착 크라운과 관련되어 있다. 외부 유모세포(OHC) 다발은 부동섬모라고 불리는 단단한 미세융모로 구성되어 있으며, 음파의 기계적 수용과 관련되어 있다.
STRC 널 마우스에 있어서, OHC 번들 팁 링크는 점차적으로 악화되고 서로 완전히 분리된다. 또한, 가장 높은 부동섬모의 팁이 지각막에 내포되지 못한다. STRC는 성숙한 OHC 모발 다발의 응집성을 유지하는, 수평 상부 커넥터의 형성에 필수적이다(Veropy 2011).
혼합성 난청 인구에서 >1%의 STRC 결실 빈도가 계산되었으며, STRC 청력 손실의 발생률은 16,000명 중 1명으로 추정된다. 축적된 증거는 DFNB16이 비증후군성 감음신경성 청력 손실(NSHL)을 포함하는 유전적으로 이질적인 병인의 상당 부분을 구성한다는 것을 시사한다(Vona, 2015).
청력 손실을 유발하는 것으로 알려진 15번 염색체 상의 STRC 변이체/돌연변이는 표 4에 설명되어 있다.
표 5에는 변이의 이름, 영향을 받은 유전자, 단백질 변화가 있는 경우, 야기되는 조건과 임상적 중요성을 보여주는 STRC 돌연변이가 있는 환자 31명이 나열되어 있다. 돌연변이의 위치, 등록번호 및 환자의 ID도 제공된다.
그 전체가 본원에 참고로 포함된, 미국 출원 공개 번호 2013/0095071은 내이의 둥근 창막에 아포토시스 단백질(XIAP)의 X-연결된 억제제를 전달하기 위해 돌연변이된 티로신 아데노연관 바이러스 벡터를 사용하여 연령 관련 청력 손실을 회복하기 위한 유전자 치료 방법을 설명한다. 그러나, 상기 간행물은 본원에 개시된 바와 같이, STRC 유전자의 유전적 돌연변이에 의해 야기된 청력 손실의 발병을 예방하거나 지연시키거나 회복시키기 위해, 기능적인 STRC를 인코딩하는 핵산 서열의 전달을 고려하지 않는다.
또한, 청력 장애에 대한 임상 유전자 치료를 개발하기 위한 현재 기술 상태에 있어서의 중요한 함정은 인간의 청력 손실을 반영하는 동물 모델이 부족하다는 것이다. 인간의 성인 발병으로 인한 유전적 청력 손실에 대해 이용가능한 마우스 모델 중 다수는 선천성 청력 손실을 가지고 있어 전달 연구를 복잡하게 만든다. 청력 발달 후에 유전적 청력 손실이 발병한 모델은 거의 없다. 신생아 마우스에서의 벡터 전달은 성체 마우스에서의 전달과 상이한 형질감염 패턴을 야기한다(Shu, Tao, Li, et al., 2016). 상이한 벡터 시스템 및 유전자 표적을 사용하여 청력 구조를 평가하는 데 사용할 수 있는 신규한 동물 모델이 필요하다.
현재 청력 손실 또는 난청을 예방하거나 치료하기 위해 승인된 치료법이 없으며, 그러한 치료법을 테스트하는 데 유용한 전임상 동물 모델이 부족하다. 본 발명은 돌연변이된 STRC 유전자의 활성을 회복하고, 유모세포 생존을 촉진하여 청력 손실 또는 난청으로부터 고통받는 환자의 청력을 회복시키기 위해 내이로 STRC의 바이러스 벡터 유전자 전달을 위한 조성물 및 방법, 및 그러한 조성물 및 방법을 테스트하기 위한 세포 기반 및 동물 기반을 기술하고 있다.
STRC 돌연변이로 인한 청력 손실은 일반적으로 두 집단으로 나타난다: (i) 피험체가 청력 손실을 가지고 태어난 선천적 집단, 및 (ii) 피험체가 출생 시 측정가능한 청력 손실을 가지고 있지는 않지만 일정 기간에 걸쳐서 점진적인 청력 손실을 보이는 진행성 집단. 따라서, 일부 경우에, 피험체가 STRC 유전자에서 돌연변이가 있을 수 있지만(예를 들면, 유전자 진단 테스트에서 검출된 바와 같이), 아직 청력 손실의 임상 지표나 증상이 나타나지 않으므로 치료적 개입을 개시할 수 있는 기회를 제공한다. 따라서, 일부 실시형태에 있어서, 본 발명은 청력의 점진적인 퇴행 기간 동안 치료적 개입을 위한 방법을 제공한다. 본 발명의 방법은 그러한 기간 이전에 착수될 수 있다. 본 발명에 의해 제공되는 청력 손실을 치료하는 방법은 청력 손실의 발병, 또는 청력 손실의 임상 지표 또는 증상의 진행을 예방하거나 지연시키는 방법을 포함하지만 이에 한정되지 않는다.
본원에 사용되는 바와 같이, 용어 "청력 손실"은 소리를 듣는 능력의 감소를 설명하기 위해 사용되며, 난청 및 소리를 전혀 들을 수 없는 상태를 포함한다.
본원에 사용되는 바와 같이, 용어 "유효량" 또는 "치료 유효량"은 위의 "치료" 설명에서 기술된 것과 같은 하나 이상의 바람직한 임상 결과를 달성하거나 달성하는 데 기여하기에 충분한 본원에 기술된 활성제의 양을 의미한다. 임의의 개별적인 사례에서 적절한 "유효량"은 용량 증량 연구와 같은 당업계에 공지된 표준 기술을 사용하여 결정될 수 있다.
본원에 사용되는 바와 같이, 용어 "활성제"는 본원에 기술된 조성물 및 방법에 사용되도록 의도되고, 생물학적으로 활성, 예를 들면 청력 손실 치료 목적이 되도록 의도된 분자(예를 들면, 본원에 기술된 Lenti 또는 AAV 유래 벡터)를 의미한다.
본원에 사용되는 바와 같이, 용어 "의약 조성물"은 본원에 기술된 적어도 하나의 활성제 또는 둘 이상의 활성제의 조합, 및 담체, 안정화제, 희석제, 분산제, 현탁화제, 증점제, 부형제 등과 같은 약학 전달에 사용하기 위해 적합한 하나 이상의 다른 성분을 포함하는 조성물을 말한다.
본원에 상호교환적으로 사용되는 바와 같이, 용어 "피험체" 또는 "환자"는 인간, 비인간 영장류, 설치류(래트, 마우스 및 기니아 피그 등) 등을 포함하지만 이에 한정되지 않는 포유동물을 포함한다. 본 발명의 일부 실시형태에 있어서, 피험체는 인간이다.
본 발명의 활성제의 용량은 활성제의 효능 및/또는 유효량을 결정하기 위해 인간 또는 다른 포유동물에서 수행된 연구를 기초로 계산될 수 있다. 용량 및 투여 빈도 또는 투여 시기는 당업계에 공지된 방법에 의해 결정될 수 있고, 활성제의 약학적 형태, 투여 경로, 하나의 활성제만 또는 다수의 활성제가 사용되는지의 여부(예를 들면, 필요한 제 1 활성제의 투여량은 이러한 제제가 제 2 활성제와 조합하여 사용되는 경우에 더 낮을 수 있음), 및 연령, 체중 또는 약물 대사에 영향을 미치는 임의의 의학적 상태의 존재를 포함한 환자 특성과 같은 요인에 따라 달라질 수 있다.
한 실시형태에 있어서, 단일 용량이 투여될 수 있다. 다른 실시형태에 있어서, 다중 용량은 일정 기간에 걸쳐, 예를 들면 1일 4회, 1일 2회, 1일 1회, 매주, 매달 등과 같은 특정 간격으로 투여될 수 있다.
청력 손실의 임상적 특징
유전적 청력 손실 및 난청은 전음성, 감음신경성 또는 이 둘의 조합일 수 있다: 증후군(외이 또는 다른 기관의 기형 또는 다른 기관계와 관련된 의학적 문제와 관련됨) 또는 비증후군(외이의 가시적인 기형 또는 임의의 관련 의학적 문제와 관련 없음); 및 언어 습득 전(언어 발달 전) 또는 언어 습득 후(언어 발달 후).(Richard JH Smith, MD, et al.; Deafness and Hereditary Hearing Loss Overview; GeneReviews; Initial Posting: February 14, 1999; Last Revision: January 9, 2014)
진단/테스트
청력 손실의 유전적 형태는 청력 손실의 후천적(비유전적) 원인과 구별되어야 한다. 청력 손실의 유전적 형태는 이과학, 청력학, 및 신체 검사, 가족력, 보조 검사(예를 들면, 측두골의 CT 검사) 및 분자 유전적 테스트를 통해 진단된다. 많은 유형의 증후군성 및 비증후군성 난청에 대해 가능한 분자 유전적 테스트는 진단 및 유전적 상담에서 중요한 역할을 한다.
청력 손실을 측정하는 데 사용되는 선택된 테스트:
1. 변조 이음향 방사(Distortion Product Otoacoustic Emissions: DPOAE).
변조 이음향 방사(DPOAE)는 비율이 1.1~1.3 사이인 두 개의 순음 주파수에 의해 달팽이관이 동시에 자극될 때 생성되는 반응이다. DPOAE의 생성 메커니즘에 대한 최근 연구에서는 DPOAE 반응에 두 가지 중요한 구성 요소가 존재한다는 점을 강조하며, 하나는 상호 변조 "왜곡"에 의해 생성되고, 다른 하나는 "반사"에 의해 생성된다.
DPOAE의 유병률은 정상적인 성인 귀에서 100%이다. 왼쪽 귀와 오른쪽 귀의 반응은 종종 상관 관계가 있다(즉, 매우 유사함). 정상 피험체의 경우에, 여성은 진폭 DPOAE가 더 높다. 노화 과정은 DPOAE 진폭을 낮추고 DPOAE 응답 스펙트럼을 좁힘으로써 DPOAE 응답에 영향을 미친다(즉, 더 높은 주파수에서의 응답이 점차적으로 감소함). DPOAE는 도마뱀, 마우스, 래트, 기니피그, 친칠라, 닭, 개, 원숭이와 같은 임상 연구에 사용되는 다른 동물 종에서도 기록될 수 있다(이음향 방사(Otoacoustic Emissions) 웹사이트).
2. 청각 뇌간 반응(ABR)
청각 뇌간 반응(ABR) 테스트는 내이(달팽이관) 및 청력을 위한 뇌 경로에 대한 정보를 제공한다. 이 테스트는 청각 유발 전위(AEP)라고도 한다. 이 테스트는 청력 선별의 종래의 행동 방법으로 어려움을 겪는 어린이나 다른 사람들에게 사용할 수 있다. ABR은 또한 나선형 신경절 세포에서 수많은 청각 신경 섬유의 동시 발생을 포함하는 신경 활동의 척도인 WAVE 1 진폭을 측정할 수 있다(Verhulst, 2016). ABR은 또한 뇌 또는 뇌 경로의 청력 손실 유형을 시사하는 징후, 증상 또는 불만이 있는 사람에게도 적용된다. 이 테스트는 인간과 동물 모두에게 사용된다. ABR은 심전도를 실행할 때 심장 주위에 전극을 배치하는 것과 유사한 전극을 머리에 붙이고 소리에 반응하여 뇌파 활동을 기록하는 방식으로 수행된다. 테스트를 받는 사람은 테스트가 진행되는 동안 조용히 쉬거나 잠을 잔다. 응답이 필요하지 않다. ABR은 또한 신생아 청력 선별 프로그램의 선별 검사로도 사용될 수 있다. 선별 검사로 사용되는 경우에, 강도나 음량 수준 중 하나만 확인하여, 아기는 선별 검사를 통과하거나 실패한다(미국 음성-언어-청각 협회(American Speech-Language-Hearing Association) 웹사이트).
청력 손실의 임상적 징후
청력 손실은 유형과 발병에 따라 설명된다:
유형
·전음성 청력 손실은 외이 및/또는 중이 뼈의 기형으로 인해 발생한다.
·감음신경성 청력 손실은 내이 구조(예를 들면, 달팽이관)의 기능장애로 인해 발생한다.
·혼합성 청력 손실은 전음성 청력 손실과 감음신경성 청력 손실이 결합된 것이다.
·중추 청각 기능장애는 제 8 뇌신경, 청각 뇌간, 또는 대뇌 피질의 수준에서 손상 또는 기능장애로 인해 발생한다.
발병
·언어 습득 전 청력 손실은 언어가 발달하기 전에 나타난다. 모든 선천성(출생시 존재) 청력 손실은 언어 습득 전 청력 손실이지만, 모든 언어 습득 전 청력 손실이 선천적인 것은 아니다.
·언어 습득 후 청력 손실은 정상적인 언어 발달 이후에 발생한다.
(Richard JH Smith, MD, et al.; Deafness and Hereditary Hearing Loss Overview; GeneReviews; Initial Posting: February 14, 1999; Last Revision: January 9, 2014)
청력 손실의 중증도
청력은 데시벨(dB)로 측정된다. 각각의 주파수에 대한 임계값 또는 0dB 표시는 정상적인 젊은 성인이 톤 버스트를 50% 동안 인식하는 수준을 나타낸다. 개인의 임계값이 정상 임계값의 15dB 내에 있으면 청력은 정상으로 간주된다. 청력 손실의 중증도는 표 6과 같이 등급이 매겨진다.
청력 손실 비율
청력 손실 비율을 계산하기 위해 500Hz, 1000Hz, 2000Hz, 3000Hz의 순음 평균에서 25dB를 차감한다. 결과에 1.5를 곱하여 귀-특이적 레벨을 얻는다. 표 7에 나타낸 바와 같이, 손상은 양호한 귀에 열악한 귀의 5배 가중치를 부여함으로써 결정된다. 일상 대화는 약 50-60dB HL(청력 수준)이므로 순음 평균을 기준으로 기능 손상을 계산하는 것은 오해의 소지가 있을 수 있다. 예를 들면, 45dB 청력 상실은 30%가 의미하는 것보다 기능적으로 훨씬 더 유의하다. 제한된 청력 상실이라도 언어 발달에 큰 영향을 미칠 수 있는 어린이에게는 다른 평가 척도가 적합하다[Northern & Downs 2002].
청력 상실의 주파수
청력 상실의 주파수는 이하과 같이 지정된다.
·저 (<500Hz)
·중 (501-2000Hz)
·고 (>2000Hz)
유전자 치료
유전자 치료는 유전 질환을 치료하기 위해 DNA를 환자에게 주입하는 것이다. 일반적으로, 새로운 DNA에는 기존 유전자의 질병 유발 돌연변이의 효과를 교정하는 기능을 하는 유전자가 포함된다. 실험 또는 치료 목적을 위한 유전자 도입은, 벡터 또는 벡터 시스템을 사용하여 유전 정보를 표적 세포로 이동시킨다. 벡터 또는 벡터 시스템은 유전자 도입 반응의 효율성, 특이성, 숙주 반응, 약리학 및 수명의 주요 결정 인자라고 여겨진다. 현재, 유전자 도입을 달성하는 가장 효율적이고 효과적인 방법은, 복제 결함을 만드는 바이러스 기반의 벡터 또는 벡터 시스템을 사용하는 것이다(PCT 공개 No. WO 2015/054653; Methods of Predicting Ancestral Virus Sequences and Uses Thereof).
성체 포유류 달팽이관의 감각 세포는 자가 복구 능력이 부족하고; 결과적으로, 현재의 치료 전략은 일차 감각 유모세포 또는 청각 신경을 형성하고 음향 정보를 뇌에 전달하는 나선형 신경절 뉴런의 영구적인 손상을 보상하기 위해 소리 증폭(예를 들면, 보청기), 더욱 양호한 소리 전달(예를 들면, 중이 보철/능동 임플란트) 또는 직접적인 신경 자극(예를 들면, 달팽이관 임플란트)에 의존한다. 이러한 접근법은 혁신적이었지만, 현대 생활에 있어서 중요한 복합적 인간 청력 기능을 복원하는 데는 최적이 아니다.
달팽이관으로의 치료적 유전자 도입은 연령 관련 및 환경적 유발 청력 손실로부터 STRC 등의 유전적 형태의 난청에 이르기까지 현재의 치료 표준을 더욱 향상시키는 것으로 여겨지고 있다. 300개 이상의 유전자 좌가 유전성 청력 손실과 연관되어 있으며 70개 이상의 원인 유전자가 설명되어 있다(예를 들면, Parker & Bitner-Glindzicz, 2015, Arch. Dis. Childhood, 100:271-8 참조). 이러한 접근법의 치료 성공은 달팽이관의 코르티 기관(OC)의 관련 치료 세포 표적에 대한 외인성 유전자 구조의 안전하고 효율적인 전달과 크게 관련된다.
종래의 바이러스 및 비바이러스계 유전자 도입 방법을 사용하여 달팽이관 등의 표적 조직 또는 포유류 세포에 핵산을 도입할 수 있다. 이러한 방법은 핵산 표적화 시스템의 구성요소를 인코딩하는 핵산을 배양 중의 세포 또는 숙주 유기체의 세포에 투여하는 데 사용될 수 있다. 비바이러스 벡터 전달 시스템에는 DNA 플라스미드, RNA(예를 들면, 벡터의 전사물), 네이키드 핵산, 및 리포솜 등의 전달 비히클과 복합화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 세포로 전달된 후 에피솜 또는 통합된 게놈을 갖는 DNA 및 RNA 바이러스를 포함한다. 핵산의 비바이러스 전달 방법은 리포펙션, 뉴클레오펙션, 미세주입, 바이오리스틱스, 바이로솜, 리포솜, 면역리포솜, 다중 양이온 또는 지질: 핵산 콘쥬게이트, 네이키드 DNA, 인공 비리온 및 DNA의 작용제 강화 흡수를 포함한다(예를 들면, 공개번호 제 JP 2022/000041A; Systems, methods and compositions for targeted nucleic acid editing 참조).
벡터
현재까지 아데노바이러스, 아데노연관 바이러스, 단순 헤르페스 바이러스, 백시니아 바이러스, 레트로바이러스, 헬퍼 의존성 아데노바이러스 및 렌티바이러스는 모두 달팽이관 유전자 전달에 대해 테스트되었다. 이들 중 아데노연관 바이러스(AAV)가 가장 큰 잠재력을 입증했지만, AAV는 길이가 4.7kb 미만인 유전자의 DNA 패키징 용량이 제한되어 있다. STRC 유전자의 길이는 5.5kb이다. 2개의 다른 벡터 시스템이 테스트될 것이고, 하나는 렌티바이러스 벡터 시스템을 기반으로 하고 다른 하나는 이중 AAV 벡터 시스템을 기반으로 한다. 본원에 개시된 렌티바이러스 벡터 시스템은 삽입 돌연변이 유발의 위험이 최소화되고 유모세포를 표적으로 하도록 슈도타입되었다. 본원에 개시된 렌티바이러스 벡터 시스템은 귀에서의 안전성이 테스트되었으며 기저부에서 정점까지 95% 이상의 유모세포에 일관된 전달을 나타내었다.
렌티바이러스 벡터
렌티바이러스는 레트로바이러스과류에 속한다. 이는 유사분열 및 유사분열 후 세포를 감염시킬 수 있기 때문에, 레트로바이러스 중에서 특유하다. 이들은 상당한 양의 유전 정보를 숙주 세포의 DNA에 전달할 수 있으므로 유전자 전달 벡터의 가장 효율적인 방법 중 하나이다. HIV, SIV 및 FIV는 모두 렌티바이러스의 예이다. 렌티바이러스 벡터는, 특히 자가 불활성화 렌티바이러스 벡터를 포함하는 렌티바이러스 게놈의 적어도 일부로부터 유래된 벡터이다.
제 3 세대 렌티바이러스 벡터 시스템은, 소위 자가 불활성화(SIN: self-inactivating) 벡터가 도입되었다. 바람직한 제 3 세대 렌티바이러스 벡터는 당업계에 공지되어 있고 당업자에 의해 제조 및 사용될 수 있으며, 예를 들면 2021년 12월 3일에 출원된 PCT/EP2021/084131에 기재되어 있고, 모든 목적에 대해 그 전체 내용이 참조로 본원에 포함된다.
복제 불능을 달성하는 최적의 방법은, 3' LTR의 U3 영역의 삭제로 인한 분할 패키징 설계 및 자가 불활성화(SIN)를 설정하는 것이다. 유전자 vive vpr, vpu, nef 및 선택적으로 tat는 제거되어야 한다. 구체적으로, 렌티바이러스 시스템의 강화에는 U3 위치에 구성적으로 활성의 이종 프로모터, 반복 영역(R) 및 U5 영역을 포함하는 5' LTR, 프라이머 결합 부위(PBS), 스플라이스 도너 부위(SD), 패키징 신호(y), Rev 반응 요소, 및 선택적으로 스플라이스 수용체(SA) 부위, 카고 서열에 작동 가능하게 연결된 내부 인핸서/프로모터 영역, 선택적으로 우드척 간염 바이러스 전사 후 조절 요소(PRE)를 포함하는 RNA 처리 요소를 포함하는 5' UTR, 및 결실된(SIN) U3 영역, 반복 영역(R) 및 U5 영역이 있는 3' LTR을 포함한다.
이러한 변형은 외부 바이러스 외피 단백질을 표면에 운반하는 능력에 대한 렌티바이러스 벡터의 슈도타입을 형성한다. 이러한 바이러스 표면 당단백질은 특정 세포 수용체와 상호 작용하여 숙주 세포로의 바이러스 진입을 조절하여 막 융합을 유도하고 피험체의 내이로 카고 로드(즉, STRC)를 전달할 수 있게 한다. 특정 강화는, MARAV-G, COCV-G, VSV-G 또는 VSV-G ts 등의 LDL 수용체 또는 LDL-R 계열 구성원, 및 SLC1A5 수용체, Pit1/2 수용체 및 PIRYV-G 수용체에 결합할 수 있는 바이러스 외피 당단백질로 렌티바이러스 벡터의 슈도타입을 형성하는 것을 가능하게 한다.
본원의 기술에 따라 사용될 수 있는 예시적인 렌티바이러스 벡터는 부분적으로 또는 전체적으로 PCT/EP2021/084131에 개시된 제 1 렌티바이러스 서열이다. 또한, 렌티바이러스 벡터는 PCT/EP2021/084131에 개시된 제 1 렌티바이러스 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 동일성을 갖는 핵산 서열을 포함할 수 있다. 또한, 그 전체가 PCT/EP2021/084131에 개시된 제 1 렌티바이러스 서열로 구성될 수 있다. 대안적으로, 렌티바이러스 벡터가 야생형 VSG, VSV-G 또는 LDL 수용체 또는 LDL-R 계열 구성원과 결합할 수 있는 VSG 유도체로 슈도타입을 형성하는 경우, 및 야생형 VSV-G가 인디애나 VSV 혈청형에서 유래된 당단백질인 경우, PCT/EP2021/084131에 개시된 임의의 렌티바이러스 서열과 적어도 80%, 바람직하게는 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 아미노산 서열을 가질 수 있다. 생체내 투여 시, 보다 높은 입자 안정성을 달성하고 숙주의 보체계에 의한 잠재적인 인식을 회피하기 위해, 열에 안정하고 보체 저항성이 있는 VSV-G 당단백질(VSV-G ts)을 대안적으로 사용할 수 있으며 LDL-R 또는 LDL-R 계열 구성원과 결합시킬 수 있다.
렌티바이러스 벡터는 COCV-G 당단백질, 즉 Cocal 바이러스로부터 유래된 당단백질로 슈도타입을 형성할 수 있다. COCV-G는 LDL 수용체와 결합할 수 있다. 대안적으로, LDL-수용체와 결합할 수 있는 본 발명의 렌티바이러스 벡터의 슈도타입을 형성하는데 사용되는 당단백질은 MARAV-G이다. 또한, 렌티바이러스 벡터는 SLC1A5-수용체와 결합할 수 있는 RD114 당단백질(GP)로부터 유래된 바이러스 외피 당단백질로 슈도타입을 형성할 수 있다. 또한, 이는 SLC1A5 수용체와 결합할 수 있는 BaEV GP로부터 유래된 당단백질일 수 있다.
또한, 렌티바이러스 벡터는 Pit1/2-수용체를 결합할 수 있는 바이러스 외피 당단백질로 슈도타입을 형성할 수 있다. Pitl 및 Pit2는 정상적인 세포 기능을 보장하기 위해 인산염 수송에 필수적인 역할을 하는 나트륨 의존성 인산염 수송체이다. 또한, Pitl 및 Pit2는 각각 긴팔 원숭이 백혈병 바이러스(GALV)와 암포트로픽 뮤린 백혈병 바이러스(A-MuLV)에 대한 수용체로서의 역할을 한다. 따라서, 바이러스 외피 당단백질은 GALV로부터 유래될 수 있다. GALV GP는 Pit1/2-수용체를 결합할 수 있다. 대안적으로, 바이러스성 당단백질은 A-MuLV/Ampho로부터 유래될 수 있다. 이러한 Ampho GP는 Pit1/2-수용체를 결합할 수 있다. 또한, 이는 Pit1/2-수용체를 결합할 수 있는 당단백질로 슈도타입을 형성할 수 있고, 10A1 MLV로부터 유래될 수 있다.
또한, 렌티바이러스 벡터는 Pit1/2-수용체를 결합할 수 있는 당단백질로 슈도타입을 형성할 수 있고, 10A1 MLV로부터 유래될 수 있다. 렌티바이러스 벡터는 대안적으로 PIRYV-G로 슈도타입을 형성할 수 있다. 따라서, 당단백질은 PIRYV-G에 의해 들어갈 수 있는 숙주 세포로의 진입을 매개할 수 있다.
렌티바이러스 벡터를 패키징하는 공정에 적어도 4개의 다른 발현 플라스미드가 제공된다. 렌티바이러스 입자는 상술한 바와 같이 렌티바이러스 벡터 게놈 자체를 인코딩하는 벡터 플라스미드, Gag 및 Pol을 코딩하는 패키징 플라스미드, Rev를 인코딩하는 플라스미드 및 본원에 언급된 외피 당단백질 중 적어도 하나를 인코딩하는 플라스미드로부터 제공될 수 있다. 벡터 플라스미드, Rev 인코딩 플라스미드 및/또는 Env 인코딩 플라스미드는 PCT/EP2021/084131에 개시된 핵산 서열일 수 있다.
본원의 기술은 STRC를 발현하는 귀 세포에서 높은 수준의 STRC 발현을 유도할 수 있는 프로모터에 작동적으로 연결된 스테레오실린 유전자(STRC) 유전자를 인코딩하는 뉴클레오티드 서열을 포함하는, PCT/EP2021/084131에 개시된 바와 같은 제 3 세대 렌티바이러스 벡터를 제공한다. 일부 실시형태에서, STRC를 인코딩하는 뉴클레오티드 서열은 서열번호 1과 95%, 96%, 97%, 98%, 99% 또는 100% 동일할 수 있다. 일부 실시형태에서, 프로모터는 인간 Myo7a 프로모터 또는 마우스 Myo7a 프로모터일 수 있다. 일부 실시형태에서, 프로모터는 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일할 수 있다. 일부 실시형태에서, 프로모터는 서열번호 4와 95%, 96%, 97%, 98%, 99% 또는 100% 동일할 수 있다. 당업자는 서열번호 4 또는 서열번호 6으로 나타내어지는 Myo7a 프로모터 서열이 프로모터의 능력을 촉진하기 위해 단축될 필요가 있음을 이해할 것이다: 렌티바이러스 벡터의 패키징 제한에 통합되는 STRC 재조합 핵산이 본원에 개시된다. 특히, 얻어진 LV-SIN 벡터를 바이러스 입자로 충분히 패키징하도록 하는 방식으로 Myo7a:STRC 재조합 뉴클레오티드가 본원에 개시된 렌티바이러스와 통합되는 능력을 촉진하도록 특정 프로모터 서열의 5' 말단의 결실을 포함하는 서열번호 4 또는 서열번호 6의 다양한 유도체가 구성될 수 있음이 본 개시의 범위 내에서 명시적으로 고려된다.
Myo7a 프로모터는 특성화되었으며, 코어 프로모터(예를 들면, 서열번호 4)는 Myo7a 유전자의 제 1 인트론에 위치된 인핸서(예를 들면, Street et al. (2011) A DNA Variant within the MY07A Promoter Regulates YY1 Transcription Factor Binding and Gene Expression Serving as a Potential Dominant DFNA11 Auditory Genetic Modifier, JBC, 286(17): 15278-15286; Boeda et al.(2001) A specific promoter of the sensory cells of the inner ear defined by trans-Genesis, Human Molecular Genetics, 10(15): 1581-1589 참조)와 서열번호 5로 나타내어지는 서열의 인간 버전에 의해 명확하게 조절되는 것으로 알려져 있다. 본 개시의 범위 내에서 서열번호 5로 나타내어지는 핵산 서열의 일부 또는 전부가 STRC의 전사 활성화를 촉진하기 위해 개시된 프로모터 서열과 조합하여 사용될 수 있다는 것이 구체적으로 고려된다. 일부 실시형태에서, 인핸서는 서열번호 5와 95%, 96%, 97%, 98%, 99%, 또는 100% 동일할 수 있다. 일부 실시형태에서, 서열번호 4 또는 서열번호 6은 서열번호 5의 일부 또는 전부와 조합되어 프로모터/인핸서 조합을 생성할 수 있으며, 그런 후 이것은, STRC와 작동적으로 연결되어 본원에 개시된 제 3 세대 렌티바이러스 벡터와 통합될 수 있다. 이론에 구속됨이 없이, 이러한 프로모터/인핸서 조합은 생체내 STRC의 전사 활성을 더욱 증가시켜 STRC 돌연변이와 연관된 장애가 있는 환자에서의 STRC' 표현형을 구제하도록 본원에 개시된 LV-SIN 벡터의 능력을 향상시킬 수 있는 것으로 생각된다.
아데노연관 바이러스 벡터
아데노연관 바이러스(AAA; Adeno associated virus) 벡터는 다양한 인간의 질병 치료를 위한 유전자 전달용의 선도적인 플랫폼이다. 임상적으로 바람직한 AAV 캡시드를 개발하고, 혁신적인 생명공학을 활용한 게놈 설계를 최적화하는 최근 발전은, 유전자 치료 분야의 성장에 실질적으로 기여하고 있다. AAV 매개 유전자 대체, 유전자 편집 및 유전자 침묵에서의 전임상 및 임상적 성공은 AAV가 이상적인 치료 벡터에 대한 주요 선택이 되도록 도왔고, 2개의 AAV 기반 치료법이 유럽 또는 미국에서 규제 승인을 얻고 있다(예를 들면, Wang, D., Tai, P.W.L. & Gao, G. Adeno-associated virus vector as a platform for gene therapy delivery.(2019) Nat Rev Drug Discov 18, 358-378 참조). AAV 생물학에 대한 지속적인 연구와 관련 치료 과제 및 한계에 대한 이해 증가는 향후 임상 성공을 위한 기반을 구축할 것이다.
아데노연관 바이러스 벡터(AAV) 매개의 내이 유전자 치료가 유전성 청력 상실의 동물 모델에 적용되어 청력 기능을 향상시켰지만, 일부 달팽이관 세포 유형에서의 감염률이 낮다. 부분적으로 이것은 AAV의 큰 사이즈 때문이고, 최대 4.6kb의 작은 유전자만 절단된 단백질의 생성 위험없이 벡터에 효과적으로 통합될 수 있기 때문이다. 내이 유전자 치료가 청력 손실을 효과적으로 치료하기 위해서는 보다 높은 효율의 바이러스 벡터가 요구된다.
내이로 전달되는 AAV 매개의 내이 유전자 치료는 정확하고 집중적인 전략을 포함한다. 코르티 기관(OC)은 복잡한 청력 기능에 요구되는 프로세스인, 2종의 감각 유모세포: 소리에 의해 전달된 기계적 정보를 신경 구조로 전달되는 전기 신호로 변환하는 내부 유모세포(IHC) 및 달팽이관 반응을 증폭하고 조정하는 역할을 하는 외부 유모세포(OHC)를 포함한다. 내이의 다른 잠재적 표적은 나선형 신경절 뉴런, 나선연의 원주 세포가 포함되며, 이것은 보호 기능이 있고 초기 신생아 단계까지 유모세포로 직접 교차 분화되도록 촉발될 수 있는 인접한 덮개막 또는 지지세포의 유지에 중요하다.
고칼륨 내림프액으로 채워지는 달팽이관에 대한 주입은, 유모세포로의 직접 접근을 제공할 수 있다. 그러나, 이 섬세한 유체 환경을 변경하면 달팽이관 내 잠재력을 방해하여 주입 관련 독성의 위험을 높일 수 있다. 타원형 또는 원형 창 막(RWM)을 통해 달팽이관, 고실계 및 전정계를 둘러싸고 있는 외림프가 채워진 공간을 중이로부터 접근할 수 있다. 내이로 들어가는 유일한 뼈가 없는 개구부인 RWM은 많은 동물 모델에서 비교적 용이하게 접근할 수 있으며, 이 경로를 사용한 바이러스 벡터의 투여는 잘 허용된다. 인간의 달팽이관 이식은, 일반적으로 RWM을 통한 수술용 전극 삽입에 의존한다.
유전성 난청의 마우스 모델에서 청력의 부분적 구제는 기관형 달팽이관 체외 이식 및 생체내 내이 주입에서의 AAV 혈청형을 평가한 종래 연구의 결과이었다. 이러한 연구에서는 원형의(ancestral) AAV 캡시드 단백질을 함유하는 아데노연관 바이러스(AAV)가 높은 효율로 OHC를 형질 도입하는 것으로 관찰되었다. 이 발견은 종래의 AAV 혈청형을 사용한 달팽이관 유전자 치료법의 성공적인 개발을 제한하는 낮은 형질도입률을 극복한다. 원형의 AAV 캡시드 단백질을 함유하는 AAV는 IHC 및 OHC뿐만 아니라, 유전적 청력 및 균형 장애로 인해 손상되는 다양한 다른 내이 세포 유형으로 내이 유전자 전달을 위한 가치있는 플랫폼을 제공할 수 있다. 높은 형질도입률을 제공하는 것 외에도, 원형의 AAV 캡시드 단백질을 함유하는 AAV는 전신 주입 시 마우스와 비인간 영장류에 있어서 유사한 안전성 프로파일을 갖는 것으로 나타났으며 순환 AAV와 항원적으로 구별되어 종래의 AAV 벡터의 효능을 제한하는 기존 면역성의 면에서 잠재적인 이점을 제공한다.
원형의 AAV 캡시드 단백질을 함유하는 본원에 기재된 바이러스는 다양한 핵산을 내이 세포로 전달하는 데 사용될 수 있다. 내이 세포로 전달되고 발현될 수 있는 대표적인 형질전환 유전자는 신경영양 인자(예를 들면, 신경교 세포주 유래 신경영양 인자(GDNF), 뇌 유래 신경영양 인자(BDNF), 뉴로트로핀-3(NT3) 또는 열충격 단백질(HSP)-70), 면역조절 단백질 또는 항종양성 전사체를 인코딩하는 형질전환 유전자가 포함되지만, 이들에 한정되지 않는다. 또한, 내이 세포로 전달되고 발현될 수 있는 대표적인 형질전환 유전자는 항체 또는 그 단편, 안티센스, 침묵화 또는 긴 비암호화 RNA 종, 또는 게놈 편집 시스템(예를 들면, 유전자 변형 진 핑거 뉴클레아제, 전사 활성제 유사 이펙터 뉴클레아제(TALEN) 또는 규칙적으로 간격을 두고 클러스터링된 짧은 회문식 반복(CRISPR))을 인코딩하는 형질전환 유전자가 포함되지만, 이들에 한정되지 않는다. 또한, 내이 세포로 전달되고 발현될 수 있는 대표적인 형질전환 유전자는 본원에 나타낸 핵산 STRC가 포함되지만, 선택적으로 본원에 개시된 제 3 세대 렌티바이러스 벡터에 포함되는 ACTG1, ADCY1, ATOHI, ATP6V1B1, BDNF, BDP1, BSND, DATSPER2, CABP2, CD164, CDC14A, CDH23, CEACAM16, CHD7, CCDC50, CIB2, CLDN14, CLIC5, CLPP, CLRN1, COCH, COL2A1, COL4A3, COL4A4, COL4A5, COL9A1, COL9A2, COL11A1, COL11A2, CRYM, DCDC2, DFNA5, DFNB31, DFNB59, DIAPHL, EDN3, EDNRB, ELMOD3, EMOD3, EPS8, EPS8L2, ESPN, ESRRB, EYA1, EYA4, FAM65B, FOXI1, GIPC3, GJB2, GJB3, GJB6, GPR98, GRHL2, GPSM2, GRXCR1, GRXCR2, HARS2, HGF, HOMER2, HSD17B4, ILDRl, KARS, KCNE1, KCNJ10, KCNQ1, KCNQ4, KITLG, LARS2, LHFPL5, LOXHD1, LRTOMT, MARVELD2, MCM2, MET, MIR183, MIRN96, MITF, MSRB3, MT-RNR1, MT-TS1, MYH14, MYH9, MY015A, MYOIA, MY03A, MY06, MY07A, NARS2, NDP, NF2, NT3, OSBPL2, OTOA, OTOF, OTOG, OTOGL, P2RX2, PAX3, PCDH15, PDZD7, PJVK, PNPT1, POLR1D, POLR1C, POU3F4, POU4F3, PRPS1, PTPRQ, RDX, S1PR2, SANS, SEMA3E, SERPINB6, SLC17A8, SLC22A4, SLC26A4, SLC26A5, SIX1, SIX5, SMAC/DIABLO, SNAI2, SOX10, SYNE4, TBC1D24, TCOF1, TECTA, TIMM8A, TJP2, TNC, TMC1, TMC2, TMIE, TMEM132E , TMPRSS3, TRPN, TRIOBP, TSPEAR, USH1C, USH1G, USH2A, USH2D, VLGR1, WFS1, WHRN 및 XIAP가 포함될 수도 있다.
유도만능 줄기세포(iPSC)
유도만능 줄기세포(IPS 또는 IPSC)는 세포를 재프로그래밍하고, 이를 배아 줄기세포의 모든 특징을 갖는 세포로 변형시키는 유전자의 도입을 통해 성체 세포, 예를 들면 피부, 간, 위 또는 다른 성숙한 세포로부터 생성된 줄기세포이다. 용어 만능은 신체 기관, 신경계, 피부, 근육 및 골격을 형성하는 3개의 배아 계통을 모두 포함하는 여러 세포 유형을 발생시키는 세포의 능력을 의미한다.
자가의 유도만능 줄기세포(iPSC)는, 이론적으로 환자특이적 세포 기반 장기 복구 전략을 위한 무제한의 세포 공급원을 구성한다. 그러나 이들 세대는 기술 및 제조상의 곤란함을 야기하며 임의의 급성 치료 방식을 개념적으로 방지하는 긴 과정이다. 동종이형 iPSC 기반 치료법 또는 배아 줄기세포 기반 치료법은 제조 관점에서 보다 용이하고, 잘 선별되고 표준화된 고품질 세포 생성물의 생성을 가능하게 한다. 그러나, 그 동종이형 기원으로 인해 이러한 세포 생성물이 거부될 수 있다. 세포의 항원성을 감소 또는 제거함으로써 보편적으로 허용되는 세포 생성물이 생성될 수 있다. 만능 줄기세포는 3배엽의 임의의 세포 유형으로 분화될 수 있기 때문에, 줄기세포 치료법의 적용 가능성은 광범위하다. 분화는 이식 부위의 기관 환경에서 계속해서 분화되고 성숙되는 선조세포를 이식함으로써 생체외 또는 생체내에서 행해질 수 있다. 생체외 분화는 연구자 또는 임상의가 절차를 면밀히 모니터링하고 이식 전에 적절한 세포 집단이 생성되도록 한다.
그러나 대부분의 경우, 미분화된 만능 줄기세포는 기형종을 형성하는 성향이 있기 때문에 임상 이식 치료법에서는 회피된다. 오히려, 이러한 치료법은 분화된 세포(예를 들면, 심부전을 겪고 있는 환자의 심근에 이식된 줄기세포 유래 심근세포)를 사용하는 경향이 있다. 이러한 만능세포 또는 조직의 임상 적용은 이식 후 세포의 성장과 생존을 제어하는 "안전 기능"으로부터 이익을 얻을 수 있다.
만능 줄기세포(PSC)는 빠르게 증식하고 다양한 세포 유형으로 분화되기 때문에 사용될 수 있다. PSC 계열은 다양한 기술을 통해 생성되고 명백한 면역원성 특징을 보유한 여러 구성원을 포함한다. PSC에서 유래된 조작된 세포 또는 조직과의 환자 적합성은 면역 거부의 위험과 면역억제의 필요성을 결정한다.
거부반응 문제를 회피하기 위해, 환자 특이적 만능 줄기세포를 생성하는 다양한 기술이 개발되고 있다. 이들은 체세포 핵을 제핵 난모세포로의 이식(체세포 핵 이식(SCNT) 줄기세포), 체세포와 ESC의 융합(하이브리드 세포), 및 특정 전사 인자를 사용한 체세포의 재프로그래밍(유도된 PSC 또는 iPSC)이 포함된다. 그러나 SCNT 줄기세포와 iPSC는 염색체 동일성에도 불구하고 각각 핵이나 세포 도너와 면역부적합을 가질 수 있다. SCNT 줄기세포는 난모세포에서 전달된 미토콘드리아 DNA(mtDNA)를 운반한다. mtDNA로 코딩된 단백질은 관련 소수 항원으로 작용하여 거부반응을 유발할 수 있다. iPSC의 재프로그래밍 및 배양 확장과 관련된 DNA 및 mtDNA 돌연변이와 유전적 불안정성은 면역 거부와 관련된 소수의 항원을 생성할 수도 있다. 이러한 문제는 SCNT 줄기세포 또는 iPSC를 사용한, 거부반응이 없는 환자 특이적 조직의 성공적인 대규모 조작 가능성을 감소시킨다.
CRISPR/Cas9 유전자 편집
또한, 본원에 기재된 방법은 STRC 유전자 돌연변이를 편집함으로써 청력을 구제하기 위한 CRISPR/Cas9((규칙적으로 간격을 두고 클러스터링된 짧은 회문식 반복 및 CRISPR 관련 단백질) 게놈 편집의 사용을 고려한다.
이 기술은 2개의 유전적 청력 상실 마우스 모델(Tmc1 및 Pmca2)에서 청력을 성공적으로 구제하는 데 사용되어 왔다(Askew, C et al., Tmc gene therapy restores auditory function in deaf mice; Sci Transl Med. 2015 July 8; 7(295):295ra108). 상기 기술은 주로 우성 청력 상실을 표적화하는 데 사용되어 왔지만, 이는 STRC 녹-인 마우스 모델에서, 및 궁극적으로 STRC 유전자에서의 돌연변이에 의해 유발되는 청력 상실을 갖는 인간에서의 열성 청력 상실을 표적화하고, 청력을 복원하기 위해 개발될 수 있다. 결함성 유전자 서열을 복구하기 위한 CRISPR/Cas9 유전자 편집의 사용은, 또한 PCT 공개 No. WO 2016/069910, PCT 공개 No. WO 2015/048577, 및 미국 출원 공개 No. 2015/0291966에 기재되어 있으며, 이들의 각각은 그 전문이 본원에 참조로 포함된다.
본 개시에 따라 당업계 기술 내에 있는 통상적인 분자 생물학, 미생물학, 생화학 및 재조합 DNA 기술을 사용할 수 있다. 이러한 기술은 문헌에 충분히 설명되어 있으며 이하의 실시예에 예시되어 있다. 본 발명은 이하의 실시예에서 더욱 설명되고, 이것은 청구범위에 기재된 방법 및 물질의 조성의 범위를 제한하지 않는다.
실시예
실시예 1: STRC-돌연변이 마우스 모델의 개발
인간의 상태와 최대한 유사한 마우스 모델의 개발은 초기 임상 개발에 중요하다. 녹아웃 STRC 마우스 모델은 시판업체로부터 입수할 수 있으며 본 실시예에서 설명된 실험에 사용될 수 있다. 또한, CRISPR/Cas9 기술을 사용하여 인간에게 청력 상실을 유발하는 것으로 알려진 돌연변이가 있는 마우스 모델도 생성되었다. STRC 마우스 모델은 인간 돌연변이가 마우스에서의 청력 상실을 유발한다는 것을 보여주며, 이는 하기에 기재된 유전자 치료 구성체의 평가에 상기 모델을 가치있게 만든다.
본 개시는 본 연구를 위해 인간 돌연변이를 보유하는 STRC 마우스 모델을 제공한다. 본원에 개시된 STRC 녹인 마우스 모델은 ABR, DPOAE 및 조직학에 의한 유모세포의 생존 및 청력 상실을 연구하는 능력을 제공한다. 마우스의 특성화는 STRC 마우스가 진행성 청력 상실, 부동섬모 팁 링크의 악화, 덮개막에 대한 부동섬모의 분리를 포함하여 인간 STRC 표현형의 전체 스펙트럼을 나타내는지의 여부를 확인하며, 이는 인간 DFNB16에 대한 STRC 마우스 모델의 생성을 입증할 것이다.
실시예 2: 유전자 치료를 위한 렌티바이러스-STRC 구축물의 생성
도 1에 나타낸 바와 같이, 스테레오실린(STRC) 유전자는 염색체 15번의 위치 15ql3-q21에 위치한다. 도 2는 STRC의 mRNA 전사 맵을 나타낸다. 도 3은 STRC 유사 유전자의 mRNA 전사 맵을 나타낸다.
새로운 제 3 세대 고용량 렌티바이러스 벡터 시스템을 사용하여 하나의 벡터에 대형 5,515bp STRC cDNA와 dTomato 리포터 유전자를 전달하였다. 간략하게, NCBI(NM_153700)에 기탁된 인간 STRC cDNA 서열(STRC)은 PCR에 의한 5' Kozak 공통 서열 및 SgrAI/AgeI 제한 부위뿐만 아니라 3' SalI 제한 부위의 측면에 위치하고 있었다. STRC 서열을 Myo7a 프로모터를 보유하는 최첨단 제 3 세대 자가 불활성화(SIN) 렌티바이러스 벡터에 클로닝하여 LV-SIN을 생성하였다(도 4에 나타낸다).
도 4는 목적 유전자(GOI) 및 프로모터(PROM)를 포함하는 일반적인 제 3 세대 렌티바이러스 벡터의 개략도를 나타내고, 여기서 GOI는 STRC이고 프로모터는 Myo7a(예를 들면, 서열번호 4 또는 서열번호 6)이다.
SFFV 프로모터에 의해 구동된 dTomato 리포터만을 발현하는 대조구 벡터는 도 5에 나타내는 바와 같이, pRRL.PPT.SF.dTomato.pre(LV-ctrl)를 생성하는 독특한 Agel 및 Sail 제한 부위를 사용하여 Agel 및 Sail의 측면에 위치하는 dTomato 서열을 벡터 백본에 삽입함으로써 발생되었다.
STRC 돌연변이에 대한 유전자 치료 옵션을 확립하기 위해, 고용량 제 3 세대 렌티바이러스 벡터는 천연 STRC 이소형의 대형 5,515bp cDNA 서열이 구비되었다. 벡터는 긴 말단 반복순서(LTR)로 자연적으로 존재하는 인핸서 및 프로모터 요소가 없는 자가 불활성화(SIN) 아키텍처를 가졌다. 이 설계는 삽입 돌연변이 유발의 위험성을 저감시킴으로써 향상된 안전성 프로파일을 제공하고, 또한 선택한 내부 프로모터(예를 들면, 프레스틴, 미오신 6, 미오신 7, 미오신 15 또는 hcmv 프로모터)를 사용하여 형질변환 유전자 발현을 유도하게 한다. 여기서 myo7a 프로모터는 형질변환 유전자 카세트의 높은 수준 및 지속적인 세포 유형 특이적 발현을 중재하기 위해 선택되었다. 바이러스 벡터 입자 제제의 적정 및 시험관내 및 생체내 적용 시 성공적으로 형질도입된 세포의 식별을 용이하게 하기 위해, 도 4에 나타낸 바와 같이 STRC cDNA를 내부 리보솜 진입 부위(IRES)를 통해 dTomato 리포터 유전자에 연결하여 렌티바이러스 벡터 LV-SIN을 생성하였다. dTomato를 발현하는 대응물은 단지 참조 및 대조(LV-ctrl)로서 제공되고, 도 5에 나타내어진다.
분할 패키징 시스템을 사용한 임시 생성은 STRC cDNA의 어려운 크기에도 불구하고 렌티바이러스 입자를 성공적으로 생성하였다. LV 역가는 시험관내 및 생체내 적용에 충분한 범위에 있었다.
실시예 3: 렌티바이러스 STRC 구축물은 귀 세포주 및 코르티 기관 배양물에서 발현된다.
STRC 발현을 유도하는 LV-SIN의 능력은 HEI-OC1 Otic 세포주에서 초기에 테스트되었다. MY07A와 dTomato는 연구 목적으로 사용할 수 있는 몇 안 되는 마우스 청력 세포주 중 하나인 달팽이관 유래 세포주 HEI-OC1의 시험관내 형질도입 시 성공적으로 발현되었다. HEI-OC 1 세포는 약물 활성화 세포사멸 경로, 자가포식, 노화, 세포 보호 메커니즘, 염증 반응, 세포 분화, 약리학적 약물의 유전적 및 후생적 영향 등을 조사하는 데 유용하다. 본원의 기술에 따르면, HEI-OC 1 세포를 사용하여 청력 세포에서의 유전자 구축물의 발현을 평가할 수 있다. 중요한 것은 HEI-OC 1 세포가 외부 유모세포의 중요한 운동 단백질인 프레스틴을 내생적으로 발현한다는 것이다. 이와 관련하여 HEI-OC 1 세포는 유용한 시험관내 청력 모델로서 제공된다.
벡터 기능과 내이 세포를 형질도입하는 능력을 평가하기 위해, LV-SINLV-SIN은 확립된 유모세포 유사 세포주 HEI-OC1을 사용하여 시험관내 성능에 대해 테스트되었다(Kalinec et al. (2003) A cochlear cell line as an in vitro system for drug ototoxicity screening. Audiol. Neurotol.).
HEI-OC1 세포를 형질도입 전날에 24-웰 플레이트의 웰당 3x104으로 시딩하였다. 형질도입 시점의 세포 수를 결정하기 위한 계수를 위해 3개의 웰을 수확하였고, 벡터의 역가를 기준으로 바이러스 벡터 상층액의 부피를 산출하여 규정된 감염 다중도(MOI), 즉 시딩된 세포당 규정된 입자 수를 적용하였다. 형질도입 절차는 적정 하에 기재된 것과 동일한 프로토콜을 따랐다. 벡터로 인코딩된 dTomato 리포터 단백질을 발현하는 세포의 비율은 적정 하에 기재된 바와 같은 유세포 분석으로 평가되었다.
세포가 트립신 보조 탈착을 사용하여 수확되었고, 400×g에서 5분간 원심분리에 의해 펠릿화되었다. 펠릿을 500 μL 고정 완충액(Cat # 420801, BioLegend, San Diego, CA, USA)에 재현탁시켰고, 세포를 실온에서 20분 동안 배양하였다. 샘플을 다시 펠릿화하였고, 1mL FACS 완충액으로 세척한 후, 1×세포내 염색 펌 세척 완충액(Cat # 421002, BioLegend)에 3회 재현탁하고 400×g에서 5분 동안 원심분리하였다. 1차 항체 폴리클로날 토끼-항-미오신-VIIA(Catalog # 25-6790, Proteus BioSciences Inc., Ramona, CA, USA)를 사용한 배양은 1×세포내 염색 펌 세척 완충액으로 1:300 희석으로 실온에서 20분 동안 행해진 후, 1×세포내 염색 펌 세척 완충액으로 2회 세척하였다. 2차 항체 Alexa Fluor® 488 AffmiPure Donkey Anti-Rabbit IgG(H+L)(Catalog # 711-545-152, Jackson ImmunoResearch Europe Ltd, Ely, UK)를 사용한 배양은 암소에서 실온으로 1×세포내 염색 펌 세척 완충액으로 1:800 희석으로 행해졌다. 1×세포내 염색 펌 세척 완충액으로 2회 세척한 후, 세포 펠릿을 FACS 완충액에 재현탁하였고 CytoFLEX S 유세포 분석기에서 처리하였고 CytExpert 소프트웨어를 사용하여 분석하였다.
다양한 감염 다중도(MOI)로의 형질도입 시, 즉 시딩된 세포당 규정된 바이러스 벡터 입자수를 적용하면, 성공적으로 형질도입된 dTomato 양성 세포의 비율에 유의한 차이가 없는 것으로 테스트된 모든 MOI에 걸쳐 LV-SINLY-SIN과 LV-ctrl 사이의 유세포 분석에 의해 관찰되었다. 도 6a-6d는 HEI-OC1 세포에서의 dTom 발현을 보여주는 일련의 점 도표이다. 특히, 벡터로 인코딩된 dTomato 리포터와 STRC 단백질을 발현하는 HEI-OC1 세포의 비율이다. 일련의 다른 MOI에서 LV-ctrl 또는 LV-SIN으로 형질도입된 세포와 비형질도입 대조구(NTC)에서 dTom 발현에 대한 세포내 염색 시, 유세포 분석을 행하였다. 표시된 집단은 SSC-A/FSC-A 특성을 사용하여 살아있는 세포에 대해 사전 게이팅된 후 FSC-A/FSC-H 특성에 따라 단일 세포에 대해 게이팅되었다. 도 6a는 NTC에 대한 데이터를 나타낸다. 도 6b는 MOI 1.277에서의 dTom 발현을 나타낸다. 도 6c는 MOI 3.278에서의 dTom 발현을 나타낸다. 도 6d는 MOI 10.279에서의 dTom 발현을 나타낸다. 이는 대형 STRC cDNA를 인코딩하는 렌티바이러스 벡터의 형질도입 효율이 보다 작은 벡터와 유사하다는 것을 확인시켰다.
면역형광 현미경 또는 유세포 분석을 통한 시각화는 비형질도입 HEI-OC1 세포에서 낮은 수준의 내인성 STRC 발현을 나타내었고, dTomato에 대한 신호는 없음을 나타내었다(도 6a-6d). 전체적으로, STRC 형질변환 유전자의 대형 크기에도 불구하고, 귀 표적 세포에서 STRC를 성공적으로 도입하고 발현시키는 완전한 기능의 LV 벡터 입자가 생성될 수 있었다.
실시예 4: 렌티바이러스 STRC 구축물이 마우스의 내이에서 발현된다.
STRC가 LV-STRC에 의해 전달되고 발현될 수 있음을 확인한 후, STRC가 생체내에서 적절하게 발현되는 능력을 조사하였다. 16일령 성체 C57BL/6 마우스를 염화나트륨 0.9%에의 케타민(150mg/kg), 자일로카인(6mg/kg) 및 아세프로마진(2mg/kg)의 혼합물을 복강내(IP) 주사하여 마취시켰다. 등쪽 귀후절개를 하여 후반고리관을 노출시켰다. 마이크로드릴을 사용하여 외이도관 성형술을 행하여 외림프 공간을 노출시켰다. 이어서, 0.1μL 눈금의 해밀턴 마이크로시린지와 36게이지 바늘을 사용하여 1μL의 벡터를 주입하였다. 외이도관 성형술을 골납으로 밀봉하였고 동물을 회복시켰다.
LV-SIN이 LV-STRC의 능력을 평가하도록 상술한 바와 같이 야생형 마우스의 내이에 주입되어 인간 STRC의 생체내 발현을 유도하였다. 도 7에 나타낸 바와 같이, STRC(dTom 발현으로 시각화됨)는 마우스의 내이에서 강력하게 발현되었다. 특히, 내부 유모세포(화살표)에서 강력한 발현이 관찰되었고 외부 유모세포(별표)가 검출되었다. 야생형 마우스에 대한 부작용이 없는 상태 하에 STRC의 성공적인 패키징 및 효율적인 생체내 전달의 특징은, LV-SIN이 STRC 관련 유전 질환의 생체내 유전자 치료에 바람직한 후보임을 나타낸다.
도 8은 성체 마우스 내이에서 슈도타입 형성된 LV-hcmv-dTom의 분포를 나타낸다. P30 C57B1/6 마우스의 후방 반고리관에 1×106 PU를 전달한다. dTom의 발현은 이 벡터의 능력을 입증한 나선형 신경절뿐만 아니라 모든 유모세포에서 볼 수 있어 STRC의 돌연변이에 의해 표적화되는 세포를 표적화한다.
실시예 5: 청력 회복에서의 LV-SIN 연구.
LV-SIN은 신생의 STRC 돌연변이 마우스 내이에 주입된다. LV-GFP/dTom을 주사한 마우스와 대조구 마우스에 대해 청력 테스트, 세포 및 분자 연구, 장기간 효과에 대한 분석을 행한다. LV-SIN은 생후 1개월에 유모세포 생존을 촉진하는지의 여부를 측정하기 위해 세포 수준에서 평가될 수 있다. LV-GFP/dTom을 주입한 대조구 돌연변이 귀에 있어서, 이 시점에서 유모세포가 손실될 것으로 예상된다. 한편, LV-SIN을 주입한 유모세포는 생존할 것으로 예상된다. 보다 양호한 청력 회복을 위한 주사 시술(달팽이관 절개술, 원형창막, 외이도관 성형술) 및 복용량. 중요한 것은, 청력 회복 가능성을 평가하기 위해 성체(1-6개월령) 마우스에 대해 주사를 행할 수 있다는 것이다. 중재가 여전히 효과가 있는 기간대에 대한 정보를 제공하는, 성체 주사 결과를 신생 마우스 결과와 비교할 것이다.
실시예 6: 환자 유도만능 줄기세포(iPS) 세포로부터 유래된 유모세포의 연구.
연구의 한 가지 중요한 양상은 본원에 개시된 기술이 인간 유모세포에 효과적일 수 있음을 입증하는 것이다. 연구에 사용할 수 있는 인간 측두골이 없기 때문에 iPS 세포주는 환자 섬유아세포와 대조구 섬유아세포를 사용한 환자 iPS 세포로부터 확립된다. 가장 빈번한 돌연변이를 갖는 환자로부터 섬유아세포를 수확하고 iPS 세포주가 확립된다. iPS 세포주는 유모세포를 포함한 내이 세포로 분화된다. 배양 시스템에 의해 LV-SIN은 iPS 유래 유모세포를 감염시키는 데 사용된다. 감염된 유모세포는 패치 클램핑에 의한 유모세포 형질도입 및 생존에 대해 연구된다. 미감염 및 미처리의 대조구 유모세포에 비하여 유모세포 생존 및 유모세포 기능이 향상될 것으로 예상된다. 이 연구는 인간 유모세포의 LENTI-STRC 감염 및 STRC 유전자 발현의 효과를 평가할 수 있는 기회를 제공한다. 이러한 성과는 결함이 있는 인간 유모세포가 LV-SIN으로 치료될 수 있음을 보여주는 것이며, 이는 향후 임상 연구를 위한 중요한 진전이다.
SEQUENCE LISTING
<110> Rescue Hearing, Inc.
<120> GENE THERAPY CONSTRUCTS AND METHODS FOR TREATMENT OF HEARING LOSS
<130> BN00002.0052
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 5515
<212> DNA
<213> human
<400> 1
gccctgccct cacctggcta tcccacacag gtgagaataa ccagaactca cctccggtac 60
cagtgttcac ttggaaacat ggctctcagc ctctggcccc tgctgctgct gctgctgctg 120
ctgctgctgc tgtcctttgc agtgactctg gcccctactg ggcctcattc cctggaccct 180
ggtctctcct tcctgaagtc attgctctcc actctggacc aggctcccca gggctccctg 240
agccgctcac ggttctttac attcctggcc aacatttctt cttcctttga gcctgggaga 300
atgggggaag gaccagtagg agagccccca cctctccagc cgcctgctct gcggctccat 360
gattttctag tgacactgag aggtagcccc gactgggagc caatgctagg gctgctaggg 420
gatatgctgg cactgctggg acaggagcag actccccgag atttcctggt gcaccaggca 480
ggggtgctgg gtggacttgt ggaggtgctg ctgggagcct tagttcctgg gggcccccct 540
accccaactc ggcccccatg cacccgtgat gggccgtctg actgtgtcct ggctgctgac 600
tggttgcctt ctctgctgct gttgttagag ggcacacgct ggcaagctct ggtgcaggtg 660
cagcccagtg tggaccccac caatgccaca ggcctcgatg ggagggaggc agctcctcac 720
tttttgcagg gtctgttggg tttgcttacc ccaacagggg agctaggctc caaggaggct 780
ctttggggcg gtctgctacg cacagtgggg gcccccctct atgctgcctt tcaggagggg 840
ctgctccgtg tcactcactc cctgcaggat gaggtcttct ccattttggg gcagccagag 900
cctgatacca atgggcagtg ccagggaggt aaccttcaac agctgctctt atggggcgtc 960
cggcacaacc tttcctggga tgtccaggcg ctgggctttc tgtctggatc accaccccca 1020
ccccctgccc tccttcactg cctgagcacg ggcgtgcctc tgcccagagc ttctcagccg 1080
tcagcccaca tcagcccacg ccaacggcga gccatcactg tggaggccct ctgtgagaac 1140
cacttaggcc cagcaccacc ctacagcatt tccaacttct ccatccactt gctctgccag 1200
cacaccaagc ctgccactcc acagccccat cccagcacca ctgccatctg ccagacagct 1260
gtgtggtatg cagtgtcctg ggcaccaggt gcccaaggct ggctacaggc ctgccacgac 1320
cagtttcctg atgagttttt ggatgcgatc tgcagtaacc tctccttttc agccctgtct 1380
ggctccaacc gccgcctggt gaagcggctc tgtgctggcc tgctcccacc ccctaccagc 1440
tgccctgaag gcctgccccc tgttcccctc accccagaca tcttttgggg ctgcttcttg 1500
gagaatgaga ctctgtgggc tgagcgactg tgtggggagg caagtctaca ggctgtgccc 1560
cccagcaacc aggcttgggt ccagcatgtg tgccagggcc ccaccccaga tgtcactgcc 1620
tccccaccat gccacattgg accctgtggg gaacgctgcc cggatggggg cagcttcctg 1680
gtgatggtct gtgccaatga caccatgtat gaggtcctgg tgcccttctg gccttggcta 1740
gcaggccaat gcaggataag tcgtgggggc aatgacactt gcttcctaga agggctgctg 1800
ggcccccttc tgccctctct gccaccactg ggaccatccc cactctgtct gacccctggc 1860
cccttcctcc ttggcatgct atcccagttg ccacgctgtc agtcctctgt cccagctctt 1920
gctcacccca cacgcctaca ctatctcctc cgcctgctga ccttcctctt gggtccaggg 1980
gctgggggcg ctgaggccca ggggatgctg ggtcgggccc tactgctctc cagtctccca 2040
gacaactgct ccttctggga tgcctttcgc ccagagggcc ggcgcagtgt gctacggacg 2100
attggggaat acctggaaca agatgaggag cagccaaccc catcaggctt tgaacccact 2160
gtcaacccca gctctggtat aagcaagatg gagctgctgg cctgctttag tcctgtgctg 2220
tgggatctgc tccagaggga aaagagtgtt tgggccctgc agattctagt gcaggcgtac 2280
ctgcatatgc ccccagaaaa cctccagcag ctggtgcttt cagcagagag ggaggctgca 2340
cagggcttcc tgacactcat gctgcagggg aagctgcagg ggaagctgca ggtaccacca 2400
tccgaggagc aggccctggg tcgcctgaca gccctgctgc tccagcggta cccacgcctc 2460
acctcccagc tcttcattga cctgtcacca ctcatccctt tcttggctgt ctctgacctg 2520
atgcgcttcc caccatccct gttagccaac gacagtgtcc tggctgccat ccgggattac 2580
agcccaggaa tgaggcctga acagaaggag gctctggcaa agcgactgct ggcccctgaa 2640
ctgtttgggg aagtgcctgc ctggccccag gagctgctgt gggcagtgct gcccctgctc 2700
ccccacctcc ctctggagaa ctttttgcag ctcagccctc accagatcca ggccctggag 2760
gatagctggc cagcagcagg tctggggcca gggcatgccc gccatgtgct gcgcagcctg 2820
gtaaaccaga gtgtccagga tggtgaggag caggtacgca ggcttgggcc cctcgcctgt 2880
ttcctgagcc ctgaggagct gcagagccta gtgcccctga gtgatccaac ggggccagta 2940
gaacgggggc tgctggaatg tgcagccaat gggaccctca gcccagaagg acgggtggca 3000
tatgaacttc tgggtgtgtt gcgctcatct ggaggagcgg tgctgagccc ccgggagctg 3060
cgggtctggg cccctctctt ctctcagctg ggcctccgct tccttcagga gctgtcagag 3120
ccccagctta gagccatgct tcctgtcctg cagggaacta gtgttacacc tgctcaggct 3180
gtcctgctgc ttggacggct ccttcctagg cacgatctat ccctggagga actctgctcc 3240
ttgcaccttc tgctaccagg cctcagcccc cagacactcc aggccatccc taggcgagtc 3300
ctggtcgggg cttgttcctg cctggcccct gaactgtcac gcctctcagc ctgccagacc 3360
gcagcactgc tgcagacctt tcgggttaaa gatggtgtta aaaatatggg tacaacaggt 3420
gctggtccag ctgtgtgtat ccctggtcag cctattccca ccacctggcc agactgcctg 3480
cttcccctgc tcccattaaa gctgctacaa ctggattcct tggctcttct ggcaaatcga 3540
agacgctact gggagctgcc ctggtctgag cagcaggcac agtttctctg gaagaagatg 3600
caagtaccca ccaaccttac cctcaggaat ctgcaggctc tgggcaccct ggcaggaggc 3660
atgtcctgtg agtttctgca gcagatcaac tccatggtag acttccttga agtggtgcac 3720
atgatctatc agctgcccac tagagttcga gggagcctga gggcctgtat ctgggcagag 3780
ctacagcgga ggatggcaat gccagaacca gaatggacaa ctgtagggcc agaactgaac 3840
gggctggata gcaagctact cctggactta ccgatccagt tgatggacag actatccaat 3900
gaatccatta tgttggtggt ggagctggtg caaagagctc cagagcagct gctggcactg 3960
acccccctcc accaggcagc cctggcagag agggcactac aaaacctggc tccaaaggag 4020
actccagtct caggggaagt gctggagacc ttaggccctt tggttggatt cctggggaca 4080
gagagcacac gacagatccc cctacagatc ctgctgtccc atctcagtca gctgcaaggc 4140
ttctgcctag gagagacatt tgccacagag ctgggatggc tgctattgca ggagtctgtt 4200
cttgggaaac cagagttgtg gagccaggat gaagtagagc aagctggacg cctagtattc 4260
actctgtcta ctgaggcaat ttccttgatc cccagggagg ccttgggtcc agagaccctg 4320
gagcggcttc tagaaaagca gcagagctgg gagcagagca gagttggaca gctgtgtagg 4380
gagccacagc ttgctgccaa gaaagcagcc ctggtagcag gggtggtgcg accagctgct 4440
gaggatcttc cagaacctgt gccaaattgt gcagatgtac gagggacatt cccagcagcc 4500
tggtctgcaa cccagattgc agagatggag ctctcagact ttgaggactg cctgacatta 4560
tttgcaggag acccaggact tgggcctgag gaactgcggg cagccatggg caaagcaaaa 4620
cagttgtggg gtcccccccg gggatttcgt cctgagcaga tcctgcagct tggtaggctc 4680
ttaataggtc taggagatcg ggaactacag gagctgatcc tagtggactg gggagtgctg 4740
agcaccctgg ggcagataga tggctggagc accactcagc tccgcattgt ggtctccagt 4800
ttcctacggc agagtggtcg gcatgtgagc cacctggact tcgttcatct gacagcgctg 4860
ggttatactc tctgtggact gcggccagag gagctccagc acatcagcag ttgggagttc 4920
agccaagcag ctctcttcct cggcaccctg catctccagt gctctgagga acaactggag 4980
gttctggccc acctacttgt actgcctggt gggtttggcc caatcagtaa ctgggggcct 5040
gagatcttca ctgaaattgg caccatagca gctgggatcc cagacctggc tctttcagca 5100
ctgctgcggg gacagatcca gggcgttact cctcttgcca tttctgtcat ccctcctcct 5160
aaatttgctg tggtgtttag tcccatccaa ctatctagtc tcaccagtgc tcaggctgtg 5220
gctgtcactc ctgagcaaat ggcctttctg agtcctgagc agcgacgagc agttgcatgg 5280
gcccaacatg agggaaagga gagcccagaa cagcaaggtc gaagtacagc ctggggcctc 5340
caggactggt cacgaccttc ctggtccctg gtattgacta tcagcttcct tggccacctg 5400
ctatgagcct gtctctacag tagaaggaga ttgtggggag agaaatctta agtcataatg 5460
aataaagtgc aaacagaagt gcatcctgat tattttcaga agctgatgag gaata 5515
<210> 2
<211> 1775
<212> PRT
<213> human
<400> 2
Met Ala Leu Ser Leu Trp Pro Leu Leu Leu Leu Leu Leu Leu Leu Leu
1 5 10 15
Leu Leu Ser Phe Ala Val Thr Leu Ala Pro Thr Gly Pro His Ser Leu
20 25 30
Asp Pro Gly Leu Ser Phe Leu Lys Ser Leu Leu Ser Thr Leu Asp Gln
35 40 45
Ala Pro Gln Gly Ser Leu Ser Arg Ser Arg Phe Phe Thr Phe Leu Ala
50 55 60
Asn Ile Ser Ser Ser Phe Glu Pro Gly Arg Met Gly Glu Gly Pro Val
65 70 75 80
Gly Glu Pro Pro Pro Leu Gln Pro Pro Ala Leu Arg Leu His Asp Phe
85 90 95
Leu Val Thr Leu Arg Gly Ser Pro Asp Trp Glu Pro Met Leu Gly Leu
100 105 110
Leu Gly Asp Met Leu Ala Leu Leu Gly Gln Glu Gln Thr Pro Arg Asp
115 120 125
Phe Leu Val His Gln Ala Gly Val Leu Gly Gly Leu Val Glu Val Leu
130 135 140
Leu Gly Ala Leu Val Pro Gly Gly Pro Pro Thr Pro Thr Arg Pro Pro
145 150 155 160
Cys Thr Arg Asp Gly Pro Ser Asp Cys Val Leu Ala Ala Asp Trp Leu
165 170 175
Pro Ser Leu Leu Leu Leu Leu Glu Gly Thr Arg Trp Gln Ala Leu Val
180 185 190
Gln Val Gln Pro Ser Val Asp Pro Thr Asn Ala Thr Gly Leu Asp Gly
195 200 205
Arg Glu Ala Ala Pro His Phe Leu Gln Gly Leu Leu Gly Leu Leu Thr
210 215 220
Pro Thr Gly Glu Leu Gly Ser Lys Glu Ala Leu Trp Gly Gly Leu Leu
225 230 235 240
Arg Thr Val Gly Ala Pro Leu Tyr Ala Ala Phe Gln Glu Gly Leu Leu
245 250 255
Arg Val Thr His Ser Leu Gln Asp Glu Val Phe Ser Ile Leu Gly Gln
260 265 270
Pro Glu Pro Asp Thr Asn Gly Gln Cys Gln Gly Gly Asn Leu Gln Gln
275 280 285
Leu Leu Leu Trp Gly Val Arg His Asn Leu Ser Trp Asp Val Gln Ala
290 295 300
Leu Gly Phe Leu Ser Gly Ser Pro Pro Pro Pro Pro Ala Leu Leu His
305 310 315 320
Cys Leu Ser Thr Gly Val Pro Leu Pro Arg Ala Ser Gln Pro Ser Ala
325 330 335
His Ile Ser Pro Arg Gln Arg Arg Ala Ile Thr Val Glu Ala Leu Cys
340 345 350
Glu Asn His Leu Gly Pro Ala Pro Pro Tyr Ser Ile Ser Asn Phe Ser
355 360 365
Ile His Leu Leu Cys Gln His Thr Lys Pro Ala Thr Pro Gln Pro His
370 375 380
Pro Ser Thr Thr Ala Ile Cys Gln Thr Ala Val Trp Tyr Ala Val Ser
385 390 395 400
Trp Ala Pro Gly Ala Gln Gly Trp Leu Gln Ala Cys His Asp Gln Phe
405 410 415
Pro Asp Glu Phe Leu Asp Ala Ile Cys Ser Asn Leu Ser Phe Ser Ala
420 425 430
Leu Ser Gly Ser Asn Arg Arg Leu Val Lys Arg Leu Cys Ala Gly Leu
435 440 445
Leu Pro Pro Pro Thr Ser Cys Pro Glu Gly Leu Pro Pro Val Pro Leu
450 455 460
Thr Pro Asp Ile Phe Trp Gly Cys Phe Leu Glu Asn Glu Thr Leu Trp
465 470 475 480
Ala Glu Arg Leu Cys Gly Glu Ala Ser Leu Gln Ala Val Pro Pro Ser
485 490 495
Asn Gln Ala Trp Val Gln His Val Cys Gln Gly Pro Thr Pro Asp Val
500 505 510
Thr Ala Ser Pro Pro Cys His Ile Gly Pro Cys Gly Glu Arg Cys Pro
515 520 525
Asp Gly Gly Ser Phe Leu Val Met Val Cys Ala Asn Asp Thr Met Tyr
530 535 540
Glu Val Leu Val Pro Phe Trp Pro Trp Leu Ala Gly Gln Cys Arg Ile
545 550 555 560
Ser Arg Gly Gly Asn Asp Thr Cys Phe Leu Glu Gly Leu Leu Gly Pro
565 570 575
Leu Leu Pro Ser Leu Pro Pro Leu Gly Pro Ser Pro Leu Cys Leu Thr
580 585 590
Pro Gly Pro Phe Leu Leu Gly Met Leu Ser Gln Leu Pro Arg Cys Gln
595 600 605
Ser Ser Val Pro Ala Leu Ala His Pro Thr Arg Leu His Tyr Leu Leu
610 615 620
Arg Leu Leu Thr Phe Leu Leu Gly Pro Gly Ala Gly Gly Ala Glu Ala
625 630 635 640
Gln Gly Met Leu Gly Arg Ala Leu Leu Leu Ser Ser Leu Pro Asp Asn
645 650 655
Cys Ser Phe Trp Asp Ala Phe Arg Pro Glu Gly Arg Arg Ser Val Leu
660 665 670
Arg Thr Ile Gly Glu Tyr Leu Glu Gln Asp Glu Glu Gln Pro Thr Pro
675 680 685
Ser Gly Phe Glu Pro Thr Val Asn Pro Ser Ser Gly Ile Ser Lys Met
690 695 700
Glu Leu Leu Ala Cys Phe Ser Pro Val Leu Trp Asp Leu Leu Gln Arg
705 710 715 720
Glu Lys Ser Val Trp Ala Leu Gln Ile Leu Val Gln Ala Tyr Leu His
725 730 735
Met Pro Pro Glu Asn Leu Gln Gln Leu Val Leu Ser Ala Glu Arg Glu
740 745 750
Ala Ala Gln Gly Phe Leu Thr Leu Met Leu Gln Gly Lys Leu Gln Gly
755 760 765
Lys Leu Gln Val Pro Pro Ser Glu Glu Gln Ala Leu Gly Arg Leu Thr
770 775 780
Ala Leu Leu Leu Gln Arg Tyr Pro Arg Leu Thr Ser Gln Leu Phe Ile
785 790 795 800
Asp Leu Ser Pro Leu Ile Pro Phe Leu Ala Val Ser Asp Leu Met Arg
805 810 815
Phe Pro Pro Ser Leu Leu Ala Asn Asp Ser Val Leu Ala Ala Ile Arg
820 825 830
Asp Tyr Ser Pro Gly Met Arg Pro Glu Gln Lys Glu Ala Leu Ala Lys
835 840 845
Arg Leu Leu Ala Pro Glu Leu Phe Gly Glu Val Pro Ala Trp Pro Gln
850 855 860
Glu Leu Leu Trp Ala Val Leu Pro Leu Leu Pro His Leu Pro Leu Glu
865 870 875 880
Asn Phe Leu Gln Leu Ser Pro His Gln Ile Gln Ala Leu Glu Asp Ser
885 890 895
Trp Pro Ala Ala Gly Leu Gly Pro Gly His Ala Arg His Val Leu Arg
900 905 910
Ser Leu Val Asn Gln Ser Val Gln Asp Gly Glu Glu Gln Val Arg Arg
915 920 925
Leu Gly Pro Leu Ala Cys Phe Leu Ser Pro Glu Glu Leu Gln Ser Leu
930 935 940
Val Pro Leu Ser Asp Pro Thr Gly Pro Val Glu Arg Gly Leu Leu Glu
945 950 955 960
Cys Ala Ala Asn Gly Thr Leu Ser Pro Glu Gly Arg Val Ala Tyr Glu
965 970 975
Leu Leu Gly Val Leu Arg Ser Ser Gly Gly Ala Val Leu Ser Pro Arg
980 985 990
Glu Leu Arg Val Trp Ala Pro Leu Phe Ser Gln Leu Gly Leu Arg Phe
995 1000 1005
Leu Gln Glu Leu Ser Glu Pro Gln Leu Arg Ala Met Leu Pro Val
1010 1015 1020
Leu Gln Gly Thr Ser Val Thr Pro Ala Gln Ala Val Leu Leu Leu
1025 1030 1035
Gly Arg Leu Leu Pro Arg His Asp Leu Ser Leu Glu Glu Leu Cys
1040 1045 1050
Ser Leu His Leu Leu Leu Pro Gly Leu Ser Pro Gln Thr Leu Gln
1055 1060 1065
Ala Ile Pro Arg Arg Val Leu Val Gly Ala Cys Ser Cys Leu Ala
1070 1075 1080
Pro Glu Leu Ser Arg Leu Ser Ala Cys Gln Thr Ala Ala Leu Leu
1085 1090 1095
Gln Thr Phe Arg Val Lys Asp Gly Val Lys Asn Met Gly Thr Thr
1100 1105 1110
Gly Ala Gly Pro Ala Val Cys Ile Pro Gly Gln Pro Ile Pro Thr
1115 1120 1125
Thr Trp Pro Asp Cys Leu Leu Pro Leu Leu Pro Leu Lys Leu Leu
1130 1135 1140
Gln Leu Asp Ser Leu Ala Leu Leu Ala Asn Arg Arg Arg Tyr Trp
1145 1150 1155
Glu Leu Pro Trp Ser Glu Gln Gln Ala Gln Phe Leu Trp Lys Lys
1160 1165 1170
Met Gln Val Pro Thr Asn Leu Thr Leu Arg Asn Leu Gln Ala Leu
1175 1180 1185
Gly Thr Leu Ala Gly Gly Met Ser Cys Glu Phe Leu Gln Gln Ile
1190 1195 1200
Asn Ser Met Val Asp Phe Leu Glu Val Val His Met Ile Tyr Gln
1205 1210 1215
Leu Pro Thr Arg Val Arg Gly Ser Leu Arg Ala Cys Ile Trp Ala
1220 1225 1230
Glu Leu Gln Arg Arg Met Ala Met Pro Glu Pro Glu Trp Thr Thr
1235 1240 1245
Val Gly Pro Glu Leu Asn Gly Leu Asp Ser Lys Leu Leu Leu Asp
1250 1255 1260
Leu Pro Ile Gln Leu Met Asp Arg Leu Ser Asn Glu Ser Ile Met
1265 1270 1275
Leu Val Val Glu Leu Val Gln Arg Ala Pro Glu Gln Leu Leu Ala
1280 1285 1290
Leu Thr Pro Leu His Gln Ala Ala Leu Ala Glu Arg Ala Leu Gln
1295 1300 1305
Asn Leu Ala Pro Lys Glu Thr Pro Val Ser Gly Glu Val Leu Glu
1310 1315 1320
Thr Leu Gly Pro Leu Val Gly Phe Leu Gly Thr Glu Ser Thr Arg
1325 1330 1335
Gln Ile Pro Leu Gln Ile Leu Leu Ser His Leu Ser Gln Leu Gln
1340 1345 1350
Gly Phe Cys Leu Gly Glu Thr Phe Ala Thr Glu Leu Gly Trp Leu
1355 1360 1365
Leu Leu Gln Glu Ser Val Leu Gly Lys Pro Glu Leu Trp Ser Gln
1370 1375 1380
Asp Glu Val Glu Gln Ala Gly Arg Leu Val Phe Thr Leu Ser Thr
1385 1390 1395
Glu Ala Ile Ser Leu Ile Pro Arg Glu Ala Leu Gly Pro Glu Thr
1400 1405 1410
Leu Glu Arg Leu Leu Glu Lys Gln Gln Ser Trp Glu Gln Ser Arg
1415 1420 1425
Val Gly Gln Leu Cys Arg Glu Pro Gln Leu Ala Ala Lys Lys Ala
1430 1435 1440
Ala Leu Val Ala Gly Val Val Arg Pro Ala Ala Glu Asp Leu Pro
1445 1450 1455
Glu Pro Val Pro Asn Cys Ala Asp Val Arg Gly Thr Phe Pro Ala
1460 1465 1470
Ala Trp Ser Ala Thr Gln Ile Ala Glu Met Glu Leu Ser Asp Phe
1475 1480 1485
Glu Asp Cys Leu Thr Leu Phe Ala Gly Asp Pro Gly Leu Gly Pro
1490 1495 1500
Glu Glu Leu Arg Ala Ala Met Gly Lys Ala Lys Gln Leu Trp Gly
1505 1510 1515
Pro Pro Arg Gly Phe Arg Pro Glu Gln Ile Leu Gln Leu Gly Arg
1520 1525 1530
Leu Leu Ile Gly Leu Gly Asp Arg Glu Leu Gln Glu Leu Ile Leu
1535 1540 1545
Val Asp Trp Gly Val Leu Ser Thr Leu Gly Gln Ile Asp Gly Trp
1550 1555 1560
Ser Thr Thr Gln Leu Arg Ile Val Val Ser Ser Phe Leu Arg Gln
1565 1570 1575
Ser Gly Arg His Val Ser His Leu Asp Phe Val His Leu Thr Ala
1580 1585 1590
Leu Gly Tyr Thr Leu Cys Gly Leu Arg Pro Glu Glu Leu Gln His
1595 1600 1605
Ile Ser Ser Trp Glu Phe Ser Gln Ala Ala Leu Phe Leu Gly Thr
1610 1615 1620
Leu His Leu Gln Cys Ser Glu Glu Gln Leu Glu Val Leu Ala His
1625 1630 1635
Leu Leu Val Leu Pro Gly Gly Phe Gly Pro Ile Ser Asn Trp Gly
1640 1645 1650
Pro Glu Ile Phe Thr Glu Ile Gly Thr Ile Ala Ala Gly Ile Pro
1655 1660 1665
Asp Leu Ala Leu Ser Ala Leu Leu Arg Gly Gln Ile Gln Gly Val
1670 1675 1680
Thr Pro Leu Ala Ile Ser Val Ile Pro Pro Pro Lys Phe Ala Val
1685 1690 1695
Val Phe Ser Pro Ile Gln Leu Ser Ser Leu Thr Ser Ala Gln Ala
1700 1705 1710
Val Ala Val Thr Pro Glu Gln Met Ala Phe Leu Ser Pro Glu Gln
1715 1720 1725
Arg Arg Ala Val Ala Trp Ala Gln His Glu Gly Lys Glu Ser Pro
1730 1735 1740
Glu Gln Gln Gly Arg Ser Thr Ala Trp Gly Leu Gln Asp Trp Ser
1745 1750 1755
Arg Pro Ser Trp Ser Leu Val Leu Thr Ile Ser Phe Leu Gly His
1760 1765 1770
Leu Leu
1775
<210> 3
<211> 19238
<212> DNA
<213> human
<400> 3
gccctgccct cacctggcta tcccacacag gtgagaataa ccagaactca cctccggtac 60
cagtgttcac ttggaaacat ggctctcagc ctctggcccc tgctgctgct gctgctgctg 120
ctgctgctgc tgtcctttgc aggtaagaag aacagtgagc agaactgggg atgaggagga 180
gggtggctgg aaaaagactt taagaatatg gaggtgaacc tgttagatag aaggacaaag 240
gagagaggca gagacttgtg caaaagggaa aaatgagggt taagaaaagc aggccaagac 300
ttactgtagg ccagtgaaag gggttcagct caccatcccc tcacctcatc tttagatcca 360
ggtagggaac tgtgctcagg ggcagggttg agtttgggct ctgtgttcct ctccttcagt 420
gacctctggt ttctctcctt acagtgactc tggcccctac tgggcctcat tccctggacc 480
ctggtctctc cttcctgaag tcattgctct ccactctgga ccaggctccc cagggctccc 540
tgagccgctc acggttcttt acattcctgg ccaacatttc ttcttccttt gagcctggga 600
gaatggggga aggaccagta ggagagcccc cacctctcca gccgcctgct ctgcggctcc 660
atgattttct agtgacactg agaggtagcc ccgactggga gccaatgcta gggctgctag 720
gggatatgct ggcactgctg ggacaggagc agactccccg agatttcctg gtgcaccagg 780
caggggtgct gggtggactt gtggaggtgc tgctgggagc cttagttcct gggggccccc 840
ctaccccaac tcggccccca tgcacccgtg atgggccgtc tgactgtgtc ctggctgctg 900
actggttgcc ttctctgctg ctgttgttag agggcacacg ctggcaagct ctggtgcagg 960
tgcagcccag tgtggacccc accaatgcca caggcctcga tgggagggag gcagctcctc 1020
actttttgca gggtctgttg ggtttgctta ccccaacagg ggagctaggc tccaaggagg 1080
ctctttgggg cggtctgcta cgcacagtgg gggcccccct ctatgctgcc tttcaggagg 1140
ggctgctccg tgtcactcac tccctgcagg atgaggtctt ctccattttg gggcagccag 1200
agcctgatac caatgggcag tgccagggag gtgagtgtgg ccagggctgg gactgggatg 1260
tggcagggca aggaaagtga aattggggta gttttcttcc ttactctttc cctcctaggt 1320
aaccttcaac agctgctctt atggtaagta acaggagacc agttctgagg gattgggcct 1380
ggaaaatctg gaggtgaaga gctgaagacc tcagcctcta gagaggaaaa ctgatgggag 1440
gagtgtagtt tagtggtttt ggggtgtgac tgtctgggtt ggtgtcccag ctccacctct 1500
tcctagccat atgaccttga gcaggttaca tagtctttct atacctcagt ttccccattt 1560
ataaaatgag aatgataata ttagttacca cagagttgtt gcacccggtt aaatgagttg 1620
atactgtgta tgcaaacgac ttaaaaccgt gctggcacat agcgcttaat aatgttagct 1680
agtaaagatg ggatttggaa aataaggaca cagctggatt cctctacccc cttactactt 1740
cagtacaaca atgccagaca gtagttagac atattgagtt gctgagcaga tttcctaaca 1800
tgaggcccgc tgagggttgt gtttaagcta tctaaaagca tacgaagaaa ggagacagaa 1860
gggggccagg tggacagaaa gaattccaac tggggcttct cctaggtgat tttggacctt 1920
ggcagggcag ctttctcttt tttgccccgt tgcagcattt caaccagtaa cgcctaaact 1980
ctcagggacc tcgcttgtag aaaagcctat gcttgccatg ccccttgagg gctctgagtc 2040
agggtcagaa tcttcagctg gaggaaatgt gaactgacca gatcctgcct gctcctccct 2100
ctgcacccag gggcgtccgg cacaaccttt cctgggatgt ccaggcgctg ggctttctgt 2160
ctggatcacc acccccaccc cctgccctcc ttcactgcct gagcacgggc gtgcctctgc 2220
ccagagcttc tcagccgtca gcccacatca gcccacgcca acggcgagcc atcactgtgg 2280
aggccctctg tgagaaccac ttaggcccag caccacccta cagcatttcc aacttctcca 2340
tccacttgct ctgccagcac accaagcctg ccactccaca gccccatccc agcaccactg 2400
ccatctgcca gacagctgtg tggtatgcag tgtcctgggc accaggtgcc caaggctggc 2460
tacaggcctg ccacgaccag tttcctgatg agtttttgga tgcgatctgc agtaacctct 2520
ccttttcagc cctgtctggc tccaaccgcc gcctggtgaa gcggctctgt gctggcctgc 2580
tcccaccccc taccagctgc cctgaaggcc tgccccctgt tcccctcacc ccagacatct 2640
tttggggctg cttcttggag aatgagactc tgtgggctga gcgactgtgt ggggaggcaa 2700
gtctacaggc tgtgcccccc agcaaccagg cttgggtcca gcatgtgtgc cagggcccca 2760
ccccagatgt cactgcctcc ccaccatgcc acattggacc ctgtggggaa cgctgcccgg 2820
atgggggcag cttcctggtg atggtctgtg ccaatgacac catgtatgag gtcctggtgc 2880
ccttctggcc ttggctagca ggccaatgca ggataagtcg tgggggcaat gacacttgct 2940
tcctagaagg gctgctgggc ccccttctgc cctctctgcc accactggga ccatccccac 3000
tctgtctgac ccctggcccc ttcctccttg gcatgctatc ccagttgcca cgctgtcagt 3060
cctctgtccc agctcttgct caccccacac gcctacacta tctcctccgc ctgctgacct 3120
tcctcttggg tccaggggct gggggcgctg aggcccaggg gatgctgggt cgggccctac 3180
tgctctccag tctcccagac aactgctcct tctgggatgc ctttcgccca gagggccggc 3240
gcagtgtgct acggacgatt ggggaatacc tggaacaaga tgaggagcag ccaaccccat 3300
caggctttga acccactgtc aaccccagct ctggtataag caagatggag ctgctggcct 3360
gctttagtgt gagtgctctg ccagagggaa agctcctaga acagtgagaa ggccctccag 3420
gggaattcct cgaatactca gaggcagtag tgtggggtag tagttgaagc acacagctct 3480
agagtcagac aggcttggat tcatatcttg gttctgtgac cagccttgaa tgagttattt 3540
aacttctctg agcaatattt ttctcgtctc atttataaac tagggatgat aatggtatat 3600
gagataatac atgctgtggg cttagcacag tgcatgatac acaaacatgc aataaatatt 3660
accttgttat tcttttgggc tctttgactc tctcactttc tgcaccagaa agaaaaagga 3720
tcaagttaga ggactctaaa tttttcccct agagagtgag aattggaggc tggcagaata 3780
caggaagata aggtaggaat gagaaagatt cagggacact accaatcaga agactttggt 3840
tctaggttca actgtgccac aaattagtgt gatcttaggc aagcaatttc atttagtttt 3900
tctgggcttc agtttttagt ctgtagaatg gaggggtgag aatatgttaa acaccataat 3960
taattcactg agtgcctatt atatgcaagg cactttgcta ggttctgtag gatatataaa 4020
gatttcttac tccatgttgg ggccaccttt ttcaaaccct gggcccagta aaatggaatt 4080
agatagtctc atagtatttg gttcaggtct acaagtatta attgagccaa ctatggacct 4140
ggcatgggag agggtacaag agaaattaga gatatgatcc cggacctaaa agagcttaat 4200
atctgaagaa tcacacttga gatgatggac aagcatccca gcaagtggag ctggaatgcc 4260
tgggggagct gcaggagaga cagagaagac agctctgttg gcatattgtc tttcttccca 4320
ccagcctgtg ctgtgggatc tgctccagag ggaaaagagt gtttgggccc tgcagattct 4380
agtgcaggta acaggtggag ggcacatggg tgggctgggt gacagccatg gctggaggtc 4440
cctgccccgt gaggtgaggc catacccacc atgacctcct attcgcaggc gtacctgcat 4500
atgcccccag aaaacctcca gcagctggtg ctttcagcag agagggaggc tgcacagggc 4560
ttcctgacac tcatgctgca ggggaagctg caggggaagc tgcaggtgag cactgagaaa 4620
ggggagcaag ggcacctgga gcctagtgtt cagagggctt gctttagtgg gaggaggaac 4680
tccagagagg aaatggcagg gatactgagc atctccagag gcagaatcca ttcctgtgcc 4740
cctacaggta ccaccatccg aggagcaggc cctgggtcgc ctgacagccc tgctgctcca 4800
gcggtaccca cgcctcacct cccagctctt cattgacctg tcaccactca tccctttctt 4860
ggctgtctct gacctgatgc gcttcccacc atccctgtta gccaacgaca gtgtgtaagg 4920
ttcttgcact actcctcctg ctcctgtcac ggtcaggcca accgcatcca cctggagcag 4980
ccccttccgg agctcctctc tgtttttttc tttcatgcca gataggcaat gtgccaacat 5040
cgtagcaagg tttgagagag gcacatctca cgcctgagtg tgaaaaccca atcattatgc 5100
taatgaacta caaaaggatc agagagctcc tctctattaa aaccagggag aggatgggcg 5160
tggtggctca tgcctgtaat cccagcacgt tgggagcccg aggcaggtgg atcactaggt 5220
ccgcctagtg agttcgagac cagcctggcc aatatggtga aaccccgtct ctattaaact 5280
acaaaaatta gccaggcatg gtggtgggcg cttgtagtcc cagttactct ggaggctgag 5340
gcaggaggat agcttgaacc tgggaggcag aggttgcagt gaaccaagat cgtgccactg 5400
cactccagcc tgggtgacag agcgagactc cgtcttaaaa aaaacaaaaa acaaaacaaa 5460
acaaaaaaac agggagagtc tccttcctat ctagacagca gggctacaga gggtcagagg 5520
aaaacagttt ggaggaagac aaagggttaa gacccatgac tcctcgcagc ctggctgcca 5580
tccgggatta cagcccagga atgaggcctg aacagaagga ggctctggca aagcgactgc 5640
tggcccctga actgtttggg gaagtgcctg cctggcccca ggagctgctg tgggcagtgc 5700
tgcccctgct cccccacctc cctctggaga actttttgca gctcagccct caccaggtat 5760
gagaatcatc ttctttactt gactggccca tcttctgcta gtggggacaa agagtcaatg 5820
gcatgtctct cagtggcccc tccctgcaag aaccctatag tgaccccagt gcgagctaac 5880
cttccccatc tcagatccag gccctggagg atagctggcc agcagcaggt ctggggccag 5940
ggcatgcccg ccatgtgctg cgcagcctgg taaaccagag tgtccaggat ggtgaggagc 6000
aggtacgcag gtgagttgtt gtgggatcag taaccaaggc aagagtggaa gaggtagaga 6060
gaggaaggca cagctgtcac gctgggtcgg tgttctagga agaaaggggc aagagagtag 6120
gcagtggcct caggcagcat agagttccag gagagaggtc tatagatggt gcccctgtgt 6180
agtggtgtag tgtcagagtg cccagtgtat gtacccatac catctgctgc caggcctgcc 6240
ttagtgctag tcttggggac cacacaaagg tcagcttcat gccctcctca ggcttgggcc 6300
cctcgcctgt ttcctgagcc ctgaggagct gcagagccta gtgcccctga gtgatccaac 6360
ggggccagta gaacgggggc tgctggaatg tgcagccaat gggaccctca gcccagaagg 6420
acgggtgagc ccctcagcac aagcctacaa gactttaggc ttcccctggg tctgtgtgga 6480
tggctttccc attgtgtcaa cttgagcaca gtggtgccag cccccatccc acttttgcaa 6540
cctccattcc ttactccatg gccattctta cctgttacca cctcttcctg gcccttctct 6600
atctggtctg tagcacccca aacataccct ttgccatttt gaacctaatc tactccagtc 6660
caatccctag ttccaaaccc tagcccaggc cctgggaaat tcagatgtgg gattagagag 6720
gaagttcaag gttcatctgt cttttctctc cagtcctaaa ccttctttgg ttacaggtgg 6780
catatgaact tctgggtgtg ttgcgctcat ctggaggagc ggtgctgagc ccccgggagc 6840
tgcgggtctg ggcccctctc ttctctcagc tgggcctccg cttccttcag gagctgtcag 6900
agccccagct tagagccatg cttcctgtcc tgcagggaac tagtgttaca cctgctcagg 6960
tttgcctgtc tcactccctg gcatgtaccc tccatccccg cttgagcccc agtcaagaga 7020
atcccattca gggataaaag cagcccctcc tttccctggg tgaacagtag aggtaaactc 7080
tgtctgcagg aggacgcctt cattcccttt cctcagatca agaagggacc tgagtcactg 7140
aggatggtta ctagggatgg ttaagaggca gcgggaagtt ttggagggtt tgccttagga 7200
acccacttag gacctggctg ctgggtcctg agagctgttg ttttcggtcc catcccaaca 7260
caggctgtcc tgctgcttgg acggctcctt cctaggcacg atgtgagtag cagcaacttc 7320
tcagcctccc gccagaggtc tctatcctct tttaacctgg ctcctgcatc tgcccctcct 7380
ctctctccgc tcccctcata cttactgcct tgctgcattg tgattgttgt cttccccaac 7440
acccttccct tcttcttcag gcctcttgtc tctcttgctc tttagctatc cctggaggaa 7500
ctctgctcct tgcaccttct gctaccaggc ctcagccccc agacactcca ggccatccct 7560
aggcgagtcc tggtcggggc ttgttcctgc ctggcccctg aactgtcacg cctctcagcc 7620
tgccagaccg cagcactgct gcagaccttt cgggtatgag agtggcaagg aggatgagat 7680
aatcagggat accggctctt tctggttggg aggaaggcat cttccctgag gccagggaag 7740
gcctttcata cctccccact tacacacaca cacacacaca cacacacaca cacacacaca 7800
accaattctc atgcaggtta aagatggtgt taaaaatatg ggtacaacag gtgctggtcc 7860
agctgtgtgt atccctggtc aggtaagtgt gagatctccc aactgagctc ctctccccat 7920
tctggggcag tttcatatgg ctggtgctac ctcccacact accctgcagt ggccctgaga 7980
gttctggtta gctctgtgcc cattagcagc cctccccagt gccagatgca ggacagcatg 8040
atccactcac attgtcctag actaatgtca aagctggaag ggcctgagaa atcttccagg 8100
ccacccaccc tgctttcaga tgaaaagacc aaggctggga gaagctaagg gactttgttt 8160
gcctggtgcc taactagcag caacacttga ccacagcagc ctgcagtgtg aggctcttag 8220
gcgtttattg ctacagtggc aaatgccatt ccacttctgt cctagctttg gtccctttcc 8280
acccccatgg ttccttttct ctgagtgcta agtacagact ctctcaccta tcactacact 8340
gctataccca tcaccgccag cagcctattc ccaccacctg gccagactgc ctgcttcccc 8400
tgctcccatt aaagctgcta caactggatt ccttggctct tctggcaaat cgaagacgct 8460
actgggagct gccctggtct gagcagcagg taattctccc cacttaattt cagaacttcc 8520
tccctcaatg tagtctacct tctttaccta tcccttagcc ctatttggcc agcttatccc 8580
tactatcctt tatttgattg tttgagatac agtctcactc tgttgcccag gctgcagtgc 8640
agtggcatga tcagagttcg ctgtaacctc aaactcctga gctcaggcaa tctttctgcc 8700
tcagcctcct gaatagctag gacgacaggt ggttaccacc atgcctggct aatttttaaa 8760
tttttttttt gttttttgag atgaagtctt gctctgtcac ccaggcttga gtacagtggc 8820
acaagcttgg ctcactgcaa cctctgtctc ccgggttcaa gcgattctcc tgcctcagcc 8880
tcccgagtag ctgggactac aggcactccc cacaatgcct ggctaatttt ttttttgttt 8940
tagtagagac agggtttcac catattggcc aggctggtct cgaactgctg accttgtgat 9000
ctgcctgcct ctgcctctca aagtgctggg attacaggtg tgagccacca tgcccggcca 9060
atttttaaat tttttgtaga gacagacaat acaaaaatgt ggacactatg tggagacact 9120
atgttgaggt actatgctgt ccagattggt cttgaactcc tggcctcaag caatcctcct 9180
gccttggcct cccaaagtgc tgggattaca gacctgagcc actgcaccca gccccctagt 9240
atctcttata atgtgacttg cttttctttt tctttctcct tcccttttct ttcatttctt 9300
tctcactctc gagagaagag tgggcatctg ggagagtggg aggctggtgg gtcccacaga 9360
gtgaggaggc aggactgggt ccaaggcagt cctgcctctc cactctaggg ggtatccttg 9420
gacagtgtct cttctgggaa ggggctcgtc tttctttctc ttgtaggcac agtttctctg 9480
gaagaagatg caagtaccca ccaaccttac cctcaggaat ctgcagtgag taacttgtgt 9540
tgagcagtgc gctgaattcg accaacattt ttttgagtgc ttactatgtg ccaggcacca 9600
tgtgatatgg aatgggggat atagggatga atgatgcata gtccctgcct cgtggacgtt 9660
ctcctagcac ctccctttgc cctcctttcc ttccacagtg ccatgcctat cctgactaga 9720
gccaaaggac tcagaaaacc tggattcagg ttccagtcct gtcacctact tgtcctcttg 9780
ggcaagtcat ttaacgtccc tgtgtcagtt ttcccttctt taaatgagaa ttacaatggc 9840
accagcctca taggtagtta ctgtgaagat taaatgaggt aggtcatgta agatatttaa 9900
cacagtgttt ggtccattgt aaagtcccag tagtcatttg ctactgttag tttacttcag 9960
gatgacttca gaggcactgg ccaagcaaga ataaatagga ataagaaggt atcactttac 10020
ttacacccac attagaagaa caatgggctt cagaatcttt tttttttttt ttttttcgag 10080
acagtcttgc tctgttgccc aggctggagt gcagtggcgc gatttcggct cactgcaacc 10140
tctgcctccc aggttcaagc gattctcctg tctcagcctc tggagtagct gggattacag 10200
gaatgtgcca ccatacccag ctaatttttg tatttttagt agagatgggg tttcaccatt 10260
ttggccaggc tggtctcaaa ctcctgacct caggtgatcc acccgcctca gcctcccaag 10320
ggcttcagaa tctaagacat ggctctagtt tcagtttacc acatttctag cagaatgatg 10380
ttgggaatgt cacctgactt ccataaatcc ttattttctc ctctgataaa cagcagtgat 10440
gttatgggga gctgatgaga tatctatgta aaaacatttc tcaaaccata aattacggtg 10500
gatgaacatc tgtacttgtg ttgagagtac tgatatcaag gagcaaacag gctgttgtat 10560
gtgttgaatg agcctctccc cactcacaca cccacagggc tctgggcacc ctggcaggag 10620
gcatgtcctg tgagtttctg cagcagatca actccatggt agacttcctt gaagtggtgc 10680
acatgatcta tcagctgccc actagagttc gagggagcct ggtgagaggg ggtgcctgga 10740
ctttagtggg agcagggagg ctgggaccct aggtatagaa cccagctcct atgttctgct 10800
ctggcctcac actgcttccc tacagagggc ctgtatctgg gcagagctac agcggaggat 10860
ggcaatgcca gaaccagaat ggacaactgt agggccagaa ctgaacgggc tggatagcaa 10920
gctactcctg gacttaccgt aagtactgca gctagagata ttggcccctc agaaagctca 10980
atctggggtg aagatctgcc cttagggaat gccctggagg aggtagtttt tctgtctggt 11040
agttccctga cataatttat agcccaaagc agaggatttt attcaaagtt gctctatgta 11100
ttgactggtt cccagaatat gctccagcac agggcagctg agggtggcaa cactgtattg 11160
aagcctgcca agtaatctta caataaccta gtccacatta attgagattg agacagagca 11220
tctgaagtga gggaggcaat gctccaaatc tgccccagag gattgtagtt tgctcagggc 11280
actgtgttct tagtgcattc agaggagtag atcgagagaa aaatatatga aaaatgtgat 11340
aaataccttc aaatacctga ggggctatca agtagaaatt agattgtcat atttatgagt 11400
ggccccattg ggcaagacta agagtagtta acggagatca gatttttaca tagtataaga 11460
aaaactaagg tagtgagttc ctggtccttg gagctgttcg agcctaagcc agatggcccc 11520
atggcaggaa tgttgtagag cacgttcata tacaggttgt gggaagaaaa ggctatagga 11580
acccaaggct cctccctacc catggagaaa tttattagta tgttactcat atgctgcttt 11640
tctcatttta cccctaccac caccccgttg ccatccgcac tgtaagtcag gataggaaaa 11700
tgctggtgtt acagtcttcc tggggaatat ggagctgaag tggagtaaaa gcagttgact 11760
tcattcctac ttttttcttt tttttctttt tttttttttt tgagacagag ttttgctgtg 11820
tcaccaaggc tggagtgcag tgacgtgatc tcggctcact gcaacctcca tcttccaggt 11880
tcaagcaatt ctcctgcctc agtctcccga gtagctggga ctgtaggtgt gcaccaccat 11940
gccaggctaa tttttgtatt tgttgtaggg acgagctttc accatgttgg ccaggctggt 12000
cttgaactcc tggcttcaag tgatctgccc acctcggctt cccaacattc ttatattttt 12060
ataggccttt ccacagattt cagctcttgt atgacttagc ccagttccag aactggtaat 12120
cctaggtagg gtacaggtta tcacctctga tttcgggtaa aagggattta tttatttatt 12180
tgtttattta tttatatttt tgagacagag tctcgctctg tcacccaggc tggagtgcaa 12240
tggtgccatc tcggctcact gcaacctctc cctctggggt tcaagcaatt ctcctgcctc 12300
agcctgctga gtagctggga ttacaggcgc gtgccaccac acccggctaa tttttgcatt 12360
tttagtagag acggggtttc accatgttgc tcagggtggt ctcgaatttc tgaccctgtg 12420
atctgcctgc ctcggcctcc caaagtgctg ggattacagg catgagccac tgcgtccggc 12480
ctgtttttac ttttttttaa tgccattcag atctgtttaa atatgtgggt tctgtgagat 12540
aatttagaat cccaaggtta cagatgaggt gaaagatcct agaccatgca tcaaaaaact 12600
tgagtttctc atttgtgaaa gaaggataag agaaacacct attttgtctg ggtgcagtgg 12660
ctcatgccta taatcccagc atttggggag gccaaggtgg gtggatcacg gaggtcaggt 12720
gttcaagacc agactggcca acatggcaaa acaccatctc tactaaaaat acaaaagtta 12780
gctgggcgtg gtggcacgtg cgtgtaattc cagctattcg ggaggctgag gcacgagaat 12840
tgcttgaacc tgggaggtgc gggttgcagt gaactgagat cgcagcacca ctgtgctcca 12900
gcctgagtga tggagtgagg ccaggtcttg ttgtaggatc aaatgagata acacctgaaa 12960
gaactttgta aattgtatag cacgtacaaa caagaaggga cctcttcaca agcagaggaa 13020
gggtggtcct gtggaaaaaa acgggaattg ggagtgagag acctcaacat ttgatctctg 13080
tgaacctcag ttttttaatc tataaaatgg ggaaatgtta atggtactta atatttggag 13140
cttttgagtc cattagatca ggtaggattg ttcgttattt ttttttttta ggaagactag 13200
aaatatgttg ctcccttttt ctcccccact caagcttgat ggtgggaatt ggccctggag 13260
ctgtttacta tcagttcctg tccagcttca ctaaatttgg tctggggtca catcttagct 13320
gcggactgtg gggttttgtg gtcccttctc gacttggccc agctccacct gaatcctgtt 13380
gttgtcaaat tgctgtaata ggatccagtt gatggacaga ctatccaatg aatccattat 13440
gttggtggtg gagctggtgc aaagagctcc agagcagctg ctggcactga cccccctcca 13500
ccaggcagcc ctggcagaga gggcactaca aaacctggta agagtccacc ctaccagact 13560
cagatttgct gccctgggca attcttgctc ctcagacaat gctctctgac tgtcccccaa 13620
ccctctactt cttgctttct tgctgccaaa cagattcctg tctacaaggc ctggcccctg 13680
ttttgcctct gggttctgtt ccttgataat atgcttcacg ttacttgtcc atacctcttg 13740
gagtccgaga aatctcttgg agtccacctc tcagtctttc tgcctgctcc tatctgggct 13800
cattgcttaa ggaagtgaac aaaggtagtg agcatcatag ggtgctgagc tgggagcagg 13860
agggagggaa ggttaggggg cttggtgtct tgatcaaggt gtctggtatt ctgagtcaga 13920
agtgcattgt ccaagttctg atgctcttct ccaggctcca aaggagactc cagtctcagg 13980
ggaagtgctg gagaccttag gccctttggt tggattcctg gggacagaga gcacacgaca 14040
gatcccccta cagatcctgc tgtcccatct cagtcagctg caaggcttct gcctaggaga 14100
gacatttgcc acagagctgg gatggctgct attgcaggag tctgttcttg ggtatggacc 14160
ttcgagaact tcagattcta actcattcta tacccagtcc ctcagccacc atcatcagtg 14220
gcagcctgtt ccatattctt aaggtcccct ggagccctgt gtccgaaatc ctagcatgtc 14280
ctcttttccc cttccttttc ctcacagttc cctcagctcc ccagcccccg attttcttcc 14340
tgtccccagg aaaccagagt tgtggagcca ggatgaagta gagcaagctg gacgcctagt 14400
attcactctg tctactgagg caatttcctt gatccccagg gtgagatgaa ggaagaaggg 14460
aagggagtaa atgcatagag gggactggtg agctggttat ggggacccgt ggccaaagag 14520
ggcaaaggat atgaagccta gatctggggg gagactgcaa aacagagaca ggactttgga 14580
cttagagcta tagcagcagg tcctgatctg tccagatctc cccactctcc ttctaccttc 14640
tcatgcagga ggccttgggt ccagagaccc tggagcggct tctagaaaag cagcagagct 14700
gggagcagag cagagttgga cagctgtgta gggagccaca gcttgctgcc aagaaagcag 14760
ccctggtagc aggggtggtg cgaccagctg ctgaggatct tccaggtgaa actacccaaa 14820
tacttatatg tccagcagga tgtacaggga gtatcaaacg gtctgggttc tacatgtgct 14880
cttccctggg actgggtttt ctaatttata aagcaaagag tttagaggga tgatcttcaa 14940
gcctcttgta gttctagaat tctgtagttc tgggagtttg taaactatta agttttcttt 15000
tagcccagaa cttccatttt cctgctctct cgtgtctgct ctagactcag ctctagctcg 15060
gctaagtgtg gagctctctg ctggggagat ccctagaagc tttgaaggag acattgtgag 15120
gctggagaac tgggttcaaa ttcagtgcta ccattaaatc tctgaataac atcctcagtc 15180
ttccatctat aaaagtcttg gcatctccaa tcacttcttg ttctattatc tcctaagccc 15240
tatacatatt actctgtaat actcctttga tccctatttc tcacagtgct ctatcctcca 15300
aaggttggaa gactcactct atctacagat atctctctgg gcatatttta ttactgcgct 15360
gacctcctgg ccctgccttc ccccttcaga acctgtgcca aattgtgcag atgtacgagg 15420
gacattccca gcagcctggt ctgcaaccca gattgcagag atggagctct cagactttga 15480
ggactgcctg acattatttg caggagaccc aggacttggg cctgaggaac tgcgggcagc 15540
catgggcaaa gcaaaacagg ttagggatgg agagccaact ggggttggcc atgaggaagc 15600
tatttgggtg tgatgtagga cacaaagaga atggagagtt ggatgagagg tgggggaagc 15660
aagagataga agagttagaa gatttgggtc acaagtagga ggtgaaggga gataaatatt 15720
gaggaaagag agctagtata atgaatagag ggacgaaagc agtggttacc aaattttaat 15780
gcatatcacg atcatcaagg gaacagattt ttttctttat ttttttttct ttcttaaaaa 15840
aataatggca tgcttcggct gggtgcagcg gctcacgcct ataatctcag aactttggga 15900
ggccaaggcg ggcagatcac gaggtcagga gatcaagacc atcctgtcta acacggcgaa 15960
acacggtctc tactaaaaat acaaaaaagt tagccgggca tggtggtgca cacttgttgt 16020
cccagctact tgggaggctg aggcaggaga atggcgtgaa cctgggaggg ggagcttgca 16080
gtgagccgaa gtcaagccaa tgcactccat cctgggtgac agagcaagac tccatctcaa 16140
aaaaaaaaaa aaaaaaaaaa ggcatgcttc atgaatttgc gtgttatcct tgcacaggcg 16200
ccatgcaaat ctctgtatca ttccaatttt ttggggtatg tgctgctgaa ctgagcatgg 16260
gaacagtgcc agtgccagat taccatgctt cactgactta ataaaaacct ttggggaggc 16320
tgggcgcagt gactcatgcc tgtaatcaca gcactttggg aggcggaggc aggtggattg 16380
cttgagccca ggagttagag accagactgg gcaacatggt gaaaccctgt ctctactaaa 16440
aatagaaaaa acattagctg ggtgtggcgg cacatgcctg taatcccagc tactcaggag 16500
gctggggtag gagaatccca tgagtgcagg aggtggaggg tgcaatgtgc caagatcgca 16560
ccactgccct ccagcctggg tgtcagagca agaccctgtc tcataaatta aaaaataagc 16620
ctctggggga aagagtctag acatctgcat ctcctttttt tttttttttt tttttttttg 16680
agacagagtc tcactctgtc acccagcatc caggctggag tgcagtggtg tgatcttggc 16740
tcactgtaac ctctacatcc tgggttcaaa cgatcctcct gcctcagcct ctcaagtagc 16800
tgggactaca ggtgcaccac acctggctaa tttttgtatc tttggtagag atggggtttc 16860
actatgttgc ccaggatggt ctcgaacttc tgggctcaag caatcctccc acctcagcct 16920
cccaaagtgc tgggattaca gctgttagcc actgtgctgg gccctaggca tctgttttaa 16980
taagcgtctc tgtgtctgat gcacataaaa gtgtggaact catggactag agttagtttg 17040
ctcttctttt ccactgattg taatgtcttt caaaacacct tagaggaact gtaaggcaac 17100
ggtctcattt tatagtggag gaaactaaag aaaaggcaaa tgatttacct agagttatac 17160
agctaagggc agaggcaaga cttaaaaccc agcagtatga ctcccaatcc actgcttttc 17220
cactcacatt gttcctgtct ttctcctagt tgtggggtcc cccccgggga tttcgtcctg 17280
agcagatcct gcagcttggt aggctcttaa taggtctagg agatcgggaa ctacaggagc 17340
tgatcctagt ggactgggga gtgctgagca ccctggggca gatagatggc tggagcacca 17400
ctcaggtaac acttttcctc ctccctacgg cttcccaaac acccatccca cagacccagc 17460
cctatagatc atctaaagcc caaggaattt ttttcctgtg accctacctg gtccttcttt 17520
ctatcttttg ttgatacccc atactagtga ccttcaggac tctgatttat tcactctgag 17580
gccctggaca cataatactg tctcctacct cttttcctgg aggcttcctc tttttctttc 17640
cttttctttt ctgagtcctc agccttcccc atgactcctt aggtcttaat agtaacagaa 17700
tataacccag taacacctat cacttccctg tccattaatt ctccataact ttcctccttc 17760
ccctcttctc ccacccccca ccccagctcc gcattgtggt ctccagtttc ctacggcaga 17820
gtggtcggca tgtgagccac ctggacttcg ttcatctgac agcgctgggt tatactctct 17880
gtggactgcg gccagaggag ctccagcaca tcagcagttg ggagttcagg tcatttgtga 17940
aggggctgag ggtggtggtg ctgaggtaaa ggtggactta ctggggaaag aaggatcatg 18000
aaggtctggt cccatggagg aagggaactc atttgaagcc atctcttcct ttgtctcatg 18060
accacagccc ctttcactga agccgaattc ttcttccttc cttcctactg ttctacagcc 18120
aagcagctct cttcctcggc accctgcatc tccagtgctc tgaggaacaa ctggaggttc 18180
tggcccacct acttgtactg cctggtgggt ttggcccaat cagtaactgg gggcctgaga 18240
tcttcactga aattggcacc atagcaggtg gggagctggg ccactgctgg tgcaagttgg 18300
tttggtttct ataccatggg tggactggat ggaagactgc cctgcaattc ttaaggtggg 18360
ggcctgaggg tgtttaaata aggggctaga gacatattgg ggaaggtcta tgatagggca 18420
ctttgggagt agttagagaa ggtctatagg tttgaagaga gggaaggtca gtctaagaca 18480
atgtttggat gccacttgct tcaacagctg ggatcccaga cctggctctt tcagcactgc 18540
tgcggggaca gatccagggc gttactcctc ttgccatttc tgtcatccct cctcctaaat 18600
ttgctgtaag tattaatgga ctggggtgac cacaggagag ccagggccca atggggacta 18660
catgcatgca ctgattccta cccctgccct caggtggtgt ttagtcccat ccaactatct 18720
agtctcacca gtgctcaggc tgtggctgtc actcctgagc aaatggcctt tctgagtcct 18780
gagcagcgac gagcagttgc atgggcccaa catgagggaa aggagagccc agaacagcaa 18840
ggtgagttcc cagctgcaca gcttgatcct ccatctcctg acccagaatc aaacccctaa 18900
tttggtgctg tctggctctt agagtgcacc cagggagatc cctggagtga aggagtctac 18960
aggcagagcg ctaatttcca agtatcaatg ctcctggaga gctgagttgt gatattactc 19020
ccattccctg tctattatag gtcgaagtac agcctggggc ctccaggact ggtcacgacc 19080
ttcctggtcc ctggtattga ctatcagctt ccttggccac ctgctatgag cctgtctcta 19140
cagtagaagg agattgtggg gagagaaatc ttaagtcata atgaataaag tgcaaacaga 19200
agtgcatcct gattattttc agaagctgat gaggaata 19238
<210> 4
<211> 2301
<212> DNA
<213> human
<400> 4
ccaggcaggt aaggatcagg ggtgataggg gagagcaatt actttgttca ctgtatgcac 60
ccgcgggggc ctgggagtcc ccatttgcag gtgggtaggg cctccagccc acaccaccca 120
gacctaggct tccctcttct caggatccac cacagggtta ggggacagga agcctgttct 180
attctcaata aatcttacaa aattccaaaa agactttcct gtgtccctct gtccccctgg 240
ggggaaggga caatggagga atattcccca ggcctgggcg actgtccgct ggtcagaggg 300
aaggccccgc tgcctgcccg gtgcacctgt gagctgagat tgtggggatc attcagtcat 360
tcctttattc agtagatctg tacggggctg gctttgtgcc aaggcctgcc ccgggcacct 420
gggatgtggg gaaccaggca tagcaatccc tgctctggga cagtctacaa acgagcagcg 480
agaacaaaga catactctgg tcatgacaga cactaccccg cacattactg atggggcagt 540
gtgggcctgc tgggttagag acggcctact ccctgatctg tgcatgaagg gctgggaaga 600
ggagatgggc cttcggggca caggaaggtg tggggggacc agagcggagg ctgctgaggg 660
cagatgcagg catctagggc caggaagctg gtgtggtggt ggggagaagc agggttggga 720
tgactgaaag cagagtggac gactcaatga aaaacgactt gggagacggg gtgagtgcag 780
tgtgagggca aagtgaaccg agatgcctcg ctttcttcat gggactgaga aatgggtatt 840
gcaaatcgtg tgatctgctt agcatagtgc ctggttcata gcatggctga acacaatgta 900
gctgtcatcc tggtgtttgg aggccgccct gtcccccata acctgcccac ctctctgccc 960
cattcccaca gctcactgca ttttgtccct gctgccagtc gtgtgccatg ggctctcctg 1020
tgctcccccg gggtctcatt tccccatccg tgtagggctg acgccactgg ccccgcccag 1080
cctgggagga tggagagggg ggacttgagg agtggccagt actgggtttc ggcagcaggt 1140
gcaaatccca ggtggggact gtgttccagg gactcctgga ctcctgttag gccagcaggc 1200
taaggggcag acggcatcct ggggtcttcc tgggacaggg tcgtcgggtc tgaggggacc 1260
caggccctag cagaagctga ctcctgtcac ggtcacttcc cagcggtgct cagcccgcct 1320
gacggaagca gctgggcagt ggggcctgtg accagcaggc ggcgctggcg agctatagcg 1380
cccctttggg cccccacccc accttctggg cagcttccct gcagacaccc cagttatggg 1440
ggctagggac ccaaaagaga catccttctg ccacccagag ctgccctggc gaggtgcact 1500
atggggccgc cgacagctgc gtggctgccg agggcggaaa ggagaaactg tcatgtcccg 1560
atagggccgc gcgaggtctc catcctcgac aacgctaata acaaagacgt gtgctcctct 1620
ttgcttggtt ccccccactc ctttaaatca cagatttcac ttcagtttat ctgtgtcgct 1680
gtcacacgtg gggtggctcc cagtcagctg gtttggcaaa gtttctggat gattacggaa 1740
taacatgtgt ccccaacccg cagagcaggt tgtgggggca atgttgcatt gaccagcgtc 1800
agagaacaca catcagaggc aagggtgggt gtgcaggagg gagaaggcgc agaaggcagg 1860
gctttagctc agcactctcc ctcctgccat gctctgcctg accgttccct ctctgagtcc 1920
caaacagcca ggtagaggag gaagaaatgg ggctgagacc ccagcacatc agtgattaag 1980
tcaggatcag gtgcggtttc ctgctcaggt gctgagacag caggcggtgt cctgcaaaca 2040
acaggaggca cctgaagcta gcctgggggg cccacgccca ggtgcggtgc attcagcagc 2100
acagccagag acagacccca atgaccccgc ctccctgtcg gcagccagtg ctctgcacag 2160
agccctgagc agcctctgga cattagtccc agccccagca cggcccgtcc cccacgctga 2220
tgtcaccgca cccagacctt ggaggccccc tccggctccg cctcctggga gaaggctctg 2280
gagtgaggag gggagggcag c 2301
<210> 5
<211> 2343
<212> DNA
<213> human
<400> 5
agtgctggct ggacagctgc tctgggcagg agagagaggg agagacaaga gacacacaca 60
gagagacggc gaggaaggga aagacccaga gggacgccta gaacgagact tggagccaga 120
cagaggaaga ggggacgtgt gtttgcagac tggctgggcc cgtgacccag cttcctgagt 180
cctccgtgca ggtggcagct gtaccaggct ggcaggtcac tgagagtggg cagctgggcc 240
ccaggtaagg atgggctgcc cactgtcctg ggcattggga ggggtttgga tgtggaggag 300
tcatggactt gagctacctc tagagcctct gccccacagc cacttgctcc tgggactggg 360
cttcctgcca cccttgaggg ctcagccacc acagccactg aatgaaactg tcccgagcct 420
gggaagatgg atgtgtgtcc cctggaggag ggaagagcca aggagcatgt tgtccatcga 480
atcttctctg agctggggct ggggttagtg gcatcctggg gccaggggaa tagacatgct 540
gtggtggcag agagaagagt ccgttctctc tgtctccttt gctttctctc tgacactctt 600
tatctccgtt tttggataag tcacttcctt cctctatgcc ccaaatatcc catctgtgaa 660
atgggagtat gaagccccaa cagccagggt tgtagtgggg aagaggtaaa atcaggtata 720
gacatagaaa tacaaataca gtctatgccc cctgttgtca gttggaaaag aaattaactt 780
gaaggtggtc tagttctcat ttttagaaat gaaatgtctg tctggtcatt ttaaaatgtg 840
gcccttaaat ttcacgccct caccactctc ccccatccct tggagcccca tgtctctagt 900
gaaagcactg gctctgcccc cagccctcat ggctcatgct ggcatagggc gcctgctcca 960
cagcctgggc accatcttca gacaagtgcc cggtggcaac tgcctgctgg ccctgttgaa 1020
tccacatctc caccaggcat ccagactagt tcaggtctct ggaaggactg tgggtttgct 1080
gtgtcccaga gctccagggc aggggtcagg gctcggatgt cgggcagtgt catgggcaga 1140
ggatcgaatg ccccggcggc tctgaatggg cccttgtgaa aaattgatgc gcattctagg 1200
agacaggttg ggagccagag gggcctcata ccagggtctg taggctgggg ctgcctttta 1260
agctccttcc tgaggccgtc tctgggtctg gccctgtgct ggacaaggct ggagacaagg 1320
caatgtctca gaccctctcc cattggccac atcctgccct ggatcaactc gccaactttg 1380
ggggcagagg tgggactgac ccttaccctg acaacataat gcatatagtc aaaatgggat 1440
aaaggggaat atagaggctc ttggcagctt gggagtggtc agggaaggct tcctggagga 1500
ggtatcatct gaactgagcc atgaaccata agtggaaatt cactagtcaa aatttcaggt 1560
agaagggcca gtgtgtgaag gccaggagat ggcaagagct ggcgtatttc aggaacagtg 1620
agtcactgag gatgtccaag tataagggta ggaaagggag tgagcagtga gagaaaagac 1680
cgaggcatca gcaggggcca gattgtgctg ggcctagcgg ggcgggcccg ggcccgggcc 1740
caggcccagg tgcggtgcat tcagcagcac agccagagac agaccccaat gaccctgcct 1800
ccccgtcagc agccagtgct ctgcacagag ccatcctgag ggcagtgggt gctcttgaga 1860
ggtttcaggc agggtgtgct gtgagcaggt catgcccagc ccttgacctt ctgctcagtc 1920
aggcttgtcc ttgtcaccca cattcctggg gcagtcccta agctgagtgc cggagattaa 1980
gtcctagtcc taaatttgct ctggctagct gtgtgaccct gggcaagtct tggtccctct 2040
ctgggcccct ttgccgtagg tccctggtgg ggccagactt gctactttct aggagccctt 2100
tgggaatctc tgaatgacag tggctgagag aagaattcag ctgctctggg cagtggtgct 2160
ggtgacagtg gctgaggctc aggtcacaca ggctgggcag tggtcagagg gagagaagcc 2220
aaggagggtt cccttgaggg aggaggagct ggggctttgg gaggagccca ggtgacccca 2280
gccaggctca aggcttccag ggctggcctg cccagaagca tgacatggtc tctctccctg 2340
cag 2343
<210> 6
<211> 2063
<212> DNA
<213> mouse
<400> 6
agagggatct gtctgtttca tttttcccgt accccgcacc cccccccaca cacacacaca 60
caagggtaaa gacagagggc acaatgggta gctgacctct ggtcagaagg atgagcaagg 120
aaggccttgg gaatcacaga taaaagctgg ccttgctggt tacctagtga gtcagagctc 180
agctctgtgg aatccttcag gttccctgtc agtgtggggc tggctttgcc gagctctgcc 240
catctcaggc cctggggaca tgggggcaca cagttcctgc tctgcagcag ccttccagca 300
actgaggaaa atgtacaaat catgtctgat cgaagtactg cagtgtcctt gataggcagt 360
gtccctagga gctgactctc agtctctgag ttcaagatct gtgccctgtt ctagtggaga 420
ggagagactt acatgcaggc cacagacaga ggtggcagag cagagatact gggaaggtgc 480
ggtagctaga gctaggaatt tatggccagg gccacgggca gaagctgggt tgggttgtgg 540
aaaacgaaat gatggaatac gacgatagat tggatttgga ggggcgaggg tggtatgaac 600
ttaagaccag ttctgcagtg gttcagatgt ggtgccctta agaggctcag gtgccagaaa 660
ccagtgcccc ttctggatag ggcagaaaac aggcagaacc tggagaggta cggtggagca 720
tgaggtggta aggacacaca ccatctcagg tggtttgttt tgggggaaac aagcatggat 780
ttctaggttt ctccgatcgg gtgacctgct tagccgagtt tgggtgctga ggaaatgtct 840
ccgttatggt tctgagacca ctttctcacc cacccactgc cttcccagca tgcacctcag 900
ccccaacgaa gcacacctgc cccagttgcc gccttgtcga ttgggctctg gatgctccaa 960
cctgtgtctc tcctactctg tgtaggctca tgctactcac ctgactcata agtatcagtt 1020
tcgtaggtga aggctgcgtt gggtgcaagt caaccttgga ccgtggtctc actgtggcac 1080
cctggtatga ggaagttgac cggcttttcc ttagtcttgt agcagttggc tgtgcccagc 1140
aggtggcacc attgcaccat tgattctccc cactccatac ccactataga ttccacccca 1200
ccctattccc ctccccacct taacccaccc acccccaccg aaaagcagct ttcctgagta 1260
gatgtcccag ctggcaagtg tgggcagaag aaggggccag gtctcaggag gaggaggagg 1320
aggaagagga agaggagtcc tccatcctcc atcctcatct accatgatga gtatttgtgt 1380
cctgttcatt cccacccact ccctttttta aatcacacat ttaaatcaca cacacacaca 1440
cacacacaca cacacacaca cacacacaca cacacacaca cacacacaca caccgggtaa 1500
gtctgtcctg cgtgaggtgg ctcctactca ggtggctttg caaactgtct ggataacagc 1560
acactcaaga ctcctaggac aggctgtggg ggccagttgt agagcttggg ggtggggtgc 1620
atcttgggga gtcctggttt ggatgttgtg tccagccaag gctccaggta ttgcaaagcc 1680
tgctcatcta tgtggtctct agtagtgccc tgacgaggga agctgggtga gcaggggagg 1740
ctactgggaa ctgagaccca gcaaaatcat gaggaagatg ggacgtgatc aggtgtccta 1800
accatgcaga gatggcaggt agtaacacat gtgacaagag accctgaggt cctgatggtt 1860
ggccccaggc ccgaggttcc cactggccag cagtgccccc tggagcttct atgccttgca 1920
tccctgctgg ttagctttac acagcacctt gggcaacctc tagacgttag tcagcagccc 1980
cagcacagcc cgcccctcat gctgatgtca ccacatccag accttcgagg cccccagggc 2040
tccgcctcct gggagaaggc ttt 2063
Claims (26)
- 스테레오실린(STRC)을 인코딩하는 핵산 서열 또는 그 일부; 및
상기 핵산 서열에 작동적으로 연결된 프로모터를 포함하는 렌티바이러스 발현 벡터. - 제 1 항에 있어서,
상기 렌티바이러스 발현 벡터는 제 3 세대 자가 불활성화(SIN) 렌티바이러스 벡터인 렌티바이러스 발현 벡터. - 제 2 항에 있어서,
상기 SIN 렌티바이러스 벡터는 야생형 렌티바이러스 긴 말단 반복(LTR) 인핸서 요소 및 프로모터 요소가 결여되어 있는 렌티바이러스 발현 벡터. - 제 1 항에 있어서,
상기 프로모터는 STRC 프로모터, Myo7a 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터 및 Pou4f3 프로모터로 이루어진 군에서 선택되는 렌티바이러스 발현 벡터. - 제 4 항에 있어서,
상기 프로모터는 Myo7a이며, 선택적으로 Myo7a 인핸서를 더 포함하는 렌티바이러스 발현 벡터. - 제 5 항에 있어서,
상기 프로모터는 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일하며, 선택적으로 서열번호 5와 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 Myo7a 인핸서를 더 포함하는 렌티바이러스 발현 벡터. - 제 1 항에 있어서,
상기 핵산은 서열번호 1과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 렌티바이러스 발현 벡터. - 제 1 항에 있어서,
상기 핵산은 서열번호 2와 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 폴리펩티드를 인코딩하는 렌티바이러스 발현 벡터. - 서열번호 1과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 핵산을 포함하는 렌티바이러스 발현 벡터를 포함하는 청력 손실의 치료 또는 예방 방법에 사용하기 위한 의약 조성물로서,
핵산 서열은 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 핵산에 작동적으로 연결되는 의약 조성물. - 서열번호 1의 핵산 서열을 포함하는 렌티바이러스 발현 벡터; 및 상기 핵산에 작동적으로 연결된 프로모터를 포함하는 세포.
- 제 10 항에 있어서,
상기 핵산은 서열번호 1과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 세포. - 제 10 항에 있어서,
상기 프로모터는 STRC 프로모터, Myo7a 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터 또는 Pou4f3 프로모터로 이루어진 군에서 선택되는 세포. - 제 12 항에 있어서,
상기 프로모터는 Myo7a인 렌티바이러스 발현 벡터. - 제 13 항에 있어서,
상기 프로모터는 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 렌티바이러스 발현 벡터. - 제 10 항에 있어서,
상기 세포는 줄기세포인 세포. - 제 15 항에 있어서,
상기 줄기세포는 유도만능 줄기세포인 세포. - 제 1 항에 기재된 렌티바이러스 벡터의 유효량을 그를 필요로 하는 피험체에 투여하는 단계를 포함하는 청력 손실의 치료 또는 예방 방법.
- 제 17 항에 있어서,
상기 프로모터는 STRC 프로모터, Myo7a 프로모터, 인간 거대세포바이러스(HCMV) 프로모터, 거대세포바이러스/치킨 베타-액틴(CBA) 프로모터 또는 Pou4f3 프로모터로 이루어진 군에서 선택되는 방법. - 제 18 항에 있어서,
상기 프로모터는 Myo7a인 방법. - 제 19 항에 있어서,
상기 프로모터는 서열번호 4 또는 서열번호 6과 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 방법. - 제 17 항에 있어서,
상기 발현 벡터는 피험체의 내이에 주입함으로써 투여되는 방법. - 제 21 항에 있어서,
상기 주입 방법은 와우 개창술, 정원창막, 내림프낭, 스칼라 메디아, 카날로스토미, 내림프낭을 통한 스칼라 메디아, 또는 이들의 임의의 조합으로 이루어진 군에서 선택되는 방법. - 제 17 항에 있어서,
상기 피험체는 청력 손실과 관련된 하나 이상의 유전적 위험 인자를 갖는 방법. - 제 23 항에 있어서,
상기 유전적 위험 인자 중 하나는 STRC 유전자에 있어서의 돌연변이로 이루어진 군에서 선택되는 방법. - 제 23 항에 있어서,
상기 피험체는 청력 손실의 임상 지표를 전혀 나타내지 않는 방법. - 인간 STRC 유전자에 있어서의 돌연변이/변이로 이루어진 군에서 선택되는 청력 손실을 유발하는 돌연변이/변이를 포함하는 형질전환 마우스.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163188857P | 2021-05-14 | 2021-05-14 | |
US63/188,857 | 2021-05-14 | ||
PCT/US2022/029334 WO2022241302A2 (en) | 2021-05-14 | 2022-05-14 | Gene therapy constructs and methods for treatment of hearing loss |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240027595A true KR20240027595A (ko) | 2024-03-04 |
Family
ID=84028567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237043139A KR20240027595A (ko) | 2021-05-14 | 2022-05-14 | 청력 손실 치료를 위한 유전자 치료 구축물 및 방법 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP4337269A2 (ko) |
JP (1) | JP2024518552A (ko) |
KR (1) | KR20240027595A (ko) |
CN (1) | CN117642187A (ko) |
BR (1) | BR112023023838A2 (ko) |
CA (1) | CA3218213A1 (ko) |
IL (1) | IL308328A (ko) |
WO (1) | WO2022241302A2 (ko) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010042490A1 (en) * | 2008-10-06 | 2010-04-15 | Boston Medical Center Corporation | A single lentiviral vector system for induced pluripotent (ips) stem cells derivation |
WO2019173367A1 (en) * | 2018-03-05 | 2019-09-12 | Children's Medical Center Corporation | Compositions and methods for delivering nucleic acids to cochlear and vestibular cells |
EP3821019A4 (en) * | 2018-07-13 | 2022-10-05 | Akouos, Inc. | METHODS OF TREATMENT OF NONSYNDROMIC INNER EAR DEAF |
-
2022
- 2022-05-14 CN CN202280049842.9A patent/CN117642187A/zh active Pending
- 2022-05-14 IL IL308328A patent/IL308328A/en unknown
- 2022-05-14 KR KR1020237043139A patent/KR20240027595A/ko unknown
- 2022-05-14 JP JP2023570158A patent/JP2024518552A/ja active Pending
- 2022-05-14 CA CA3218213A patent/CA3218213A1/en active Pending
- 2022-05-14 BR BR112023023838A patent/BR112023023838A2/pt unknown
- 2022-05-14 WO PCT/US2022/029334 patent/WO2022241302A2/en active Application Filing
- 2022-05-14 EP EP22808469.5A patent/EP4337269A2/en active Pending
Also Published As
Publication number | Publication date |
---|---|
IL308328A (en) | 2024-01-01 |
CN117642187A (zh) | 2024-03-01 |
EP4337269A2 (en) | 2024-03-20 |
WO2022241302A2 (en) | 2022-11-17 |
CA3218213A1 (en) | 2022-11-17 |
JP2024518552A (ja) | 2024-05-01 |
BR112023023838A2 (pt) | 2024-02-20 |
WO2022241302A3 (en) | 2022-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11993777B2 (en) | Compositions and methods for treating non-age-associated hearing impairment in a human subject | |
US9567376B2 (en) | Enhanced AAV-mediated gene transfer for retinal therapies | |
US20220040327A1 (en) | Compositions and methods for treating non-age-associated hearing impairment in a human subject | |
US20170049910A1 (en) | Enhanced aav-mediated gene transfer for retinal therapies | |
KR20200107949A (ko) | 조작된 dna 결합 단백질 | |
EP1471926B1 (en) | Compositions and methods for the therapeutic use of an atonal-associated sequence | |
US20210330814A1 (en) | Methods of treating non-syndromic sensorineural hearing loss | |
CN110461146A (zh) | 视网膜劈裂的非人类动物模型 | |
AU2022201291B2 (en) | Identification of mutations in channelopsin variants having improved light sensitivity and methods of use thereof | |
KR20190131052A (ko) | 청력 상실의 치료를 위한 유전자 요법 구축물 및 방법 | |
JP2020527335A (ja) | 眼疾患のための遺伝子療法 | |
JP2023153320A (ja) | Clrn1に関連する聴力喪失及び/または視力喪失を治療する方法 | |
WO2023116745A1 (zh) | 优化的cyp4v2基因及其用途 | |
KR20240027595A (ko) | 청력 손실 치료를 위한 유전자 치료 구축물 및 방법 | |
KR20230041965A (ko) | Slc26a4-연관 청력손실을 치료하기 위한 조성물 및 방법 | |
KR20230127263A (ko) | Clrn1-연관된 청력손실 및/또는 시력손실을 치료하기위한 조성물 및 방법 | |
LLADO SANTAEULARIA | THERAPEUTIC GENOME EDITING IN RETINA AND LIVER | |
EA045887B1 (ru) | Способы лечения clrn1-ассоциированной потери слуха и/или потери зрения | |
EA046157B1 (ru) | Композиции и способы селективной регуляции экспрессии генов | |
Shortall | Development of gene therapies for retinal degenerations |