KR20200014319A - 글리코겐 축적 질환 유형 iii에 대한 치료제 - Google Patents
글리코겐 축적 질환 유형 iii에 대한 치료제 Download PDFInfo
- Publication number
- KR20200014319A KR20200014319A KR1020197036416A KR20197036416A KR20200014319A KR 20200014319 A KR20200014319 A KR 20200014319A KR 1020197036416 A KR1020197036416 A KR 1020197036416A KR 20197036416 A KR20197036416 A KR 20197036416A KR 20200014319 A KR20200014319 A KR 20200014319A
- Authority
- KR
- South Korea
- Prior art keywords
- agl
- seq
- translatable
- human
- polynucleotide
- Prior art date
Links
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 54
- 201000010099 disease Diseases 0.000 title claims abstract description 42
- 229920002527 Glycogen Polymers 0.000 title claims description 30
- 229940096919 glycogen Drugs 0.000 title claims description 30
- 238000009825 accumulation Methods 0.000 title claims description 24
- 239000003814 drug Substances 0.000 title claims description 11
- 102100040894 Amylo-alpha-1,6-glucosidase Human genes 0.000 claims abstract description 229
- 108010043797 4-alpha-glucanotransferase Proteins 0.000 claims abstract description 200
- 101100392276 Homo sapiens AGL gene Proteins 0.000 claims abstract description 98
- 238000000034 method Methods 0.000 claims abstract description 83
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 71
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 69
- 230000000694 effects Effects 0.000 claims abstract description 55
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 50
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 50
- 239000002157 polynucleotide Substances 0.000 claims abstract description 49
- 239000012634 fragment Substances 0.000 claims abstract description 36
- 101000893559 Homo sapiens Amylo-alpha-1,6-glucosidase Proteins 0.000 claims abstract description 32
- 239000000178 monomer Substances 0.000 claims description 145
- 125000003729 nucleotide group Chemical group 0.000 claims description 120
- 108091026890 Coding region Proteins 0.000 claims description 92
- 239000000203 mixture Substances 0.000 claims description 80
- 108020004999 messenger RNA Proteins 0.000 claims description 75
- 239000002773 nucleotide Substances 0.000 claims description 75
- -1 5-propynuriuridine Chemical compound 0.000 claims description 61
- 150000001875 compounds Chemical class 0.000 claims description 44
- 210000004185 liver Anatomy 0.000 claims description 40
- 230000014509 gene expression Effects 0.000 claims description 35
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 34
- 238000013519 translation Methods 0.000 claims description 34
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 30
- 239000002105 nanoparticle Substances 0.000 claims description 28
- 238000001727 in vivo Methods 0.000 claims description 22
- 108020004705 Codon Proteins 0.000 claims description 20
- 239000002502 liposome Substances 0.000 claims description 17
- 229930185560 Pseudouridine Natural products 0.000 claims description 15
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 claims description 13
- 210000002381 plasma Anatomy 0.000 claims description 12
- 210000002966 serum Anatomy 0.000 claims description 12
- 208000035475 disorder Diseases 0.000 claims description 11
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 claims description 10
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 claims description 10
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 claims description 9
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 claims description 8
- 239000003623 enhancer Substances 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 6
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 claims description 5
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 claims description 5
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 claims description 5
- 229930010555 Inosine Natural products 0.000 claims description 5
- 229960003786 inosine Drugs 0.000 claims description 5
- 210000004962 mammalian cell Anatomy 0.000 claims description 5
- 210000003205 muscle Anatomy 0.000 claims description 5
- AAAANSSZMCYGTA-UAKXSSHOSA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidine-5-carboxylic acid Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(C(O)=O)c(=O)[nH]c1=O AAAANSSZMCYGTA-UAKXSSHOSA-N 0.000 claims description 4
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 claims description 4
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 claims description 4
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 claims description 4
- SVRWPYGLQBPNNJ-UAKXSSHOSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carboxylic acid Chemical compound C1=C(C(O)=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 SVRWPYGLQBPNNJ-UAKXSSHOSA-N 0.000 claims description 4
- MPPUDRFYDKDPBN-UAKXSSHOSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-hydroxypyrimidin-2-one Chemical compound C1=C(O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPPUDRFYDKDPBN-UAKXSSHOSA-N 0.000 claims description 4
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 claims description 4
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 claims description 4
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 claims description 4
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 claims description 4
- 108700026244 Open Reading Frames Proteins 0.000 claims description 4
- 239000003937 drug carrier Substances 0.000 claims description 4
- 210000002216 heart Anatomy 0.000 claims description 4
- 238000002347 injection Methods 0.000 claims description 4
- 239000007924 injection Substances 0.000 claims description 4
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 claims description 4
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 claims description 4
- 239000012096 transfection reagent Substances 0.000 claims description 4
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 claims description 4
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 claims description 3
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 claims description 3
- BTFXIEGOSDSOGN-KWCDMSRLSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-1,3-diazinane-2,4-dione Chemical compound O=C1NC(=O)C(C)CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 BTFXIEGOSDSOGN-KWCDMSRLSA-N 0.000 claims description 3
- WGNUTGFETAXDTJ-OOJXKGFFSA-N 2'-O-methylpseudouridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O WGNUTGFETAXDTJ-OOJXKGFFSA-N 0.000 claims description 3
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 claims description 3
- IZFJAICCKKWWNM-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methoxypyrimidin-2-one Chemical compound O=C1N=C(N)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 IZFJAICCKKWWNM-JXOAFFINSA-N 0.000 claims description 3
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 claims description 3
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 claims description 3
- VQAJJNQKTRZJIQ-JXOAFFINSA-N 5-Hydroxymethyluridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CO)=C1 VQAJJNQKTRZJIQ-JXOAFFINSA-N 0.000 claims description 3
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 claims description 3
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 claims description 3
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 claims description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 3
- 238000001990 intravenous administration Methods 0.000 claims description 3
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 claims description 3
- 210000004556 brain Anatomy 0.000 claims description 2
- 210000004207 dermis Anatomy 0.000 claims description 2
- 238000007918 intramuscular administration Methods 0.000 claims description 2
- 238000007912 intraperitoneal administration Methods 0.000 claims description 2
- 210000003734 kidney Anatomy 0.000 claims description 2
- 210000001165 lymph node Anatomy 0.000 claims description 2
- 238000007920 subcutaneous administration Methods 0.000 claims description 2
- UIYWFOZZIZEEKJ-XVFCMESISA-N 1-[(2r,3r,4r,5r)-3-fluoro-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound F[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 UIYWFOZZIZEEKJ-XVFCMESISA-N 0.000 claims 2
- MZBPLEJIMYNQQI-JXOAFFINSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidine-5-carbaldehyde Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(C=O)=C1 MZBPLEJIMYNQQI-JXOAFFINSA-N 0.000 claims 2
- LLIPTMWIZVIUSX-XVFCMESISA-N 1-[(2r,3r,4s,5r)-3-amino-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound N[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 LLIPTMWIZVIUSX-XVFCMESISA-N 0.000 claims 2
- MRUKYOQQKHNMFI-XVFCMESISA-N 1-[(2r,3r,4s,5r)-3-azido-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound [N-]=[N+]=N[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MRUKYOQQKHNMFI-XVFCMESISA-N 0.000 claims 2
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 claims 2
- DRTQHJPVMGBUCF-CCXZUQQUSA-N arauridine Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-CCXZUQQUSA-N 0.000 claims 2
- 230000005847 immunogenicity Effects 0.000 claims 2
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 claims 1
- YHRRPHCORALGKQ-FDDDBJFASA-N 2'-O-methyl-5-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(C)=C1 YHRRPHCORALGKQ-FDDDBJFASA-N 0.000 claims 1
- ZLOIGESWDJYCTF-UHFFFAOYSA-N 4-Thiouridine Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-UHFFFAOYSA-N 0.000 claims 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 claims 1
- IRROSXSJGHAKHB-LURQLKTLSA-N CO[C@H]1[C@@H](O[C@@H]([C@H]1O)CO)C1=CN(C(=O)NC1=O)C Chemical compound CO[C@H]1[C@@H](O[C@@H]([C@H]1O)CO)C1=CN(C(=O)NC1=O)C IRROSXSJGHAKHB-LURQLKTLSA-N 0.000 claims 1
- 241001465754 Metazoa Species 0.000 claims 1
- 210000004072 lung Anatomy 0.000 claims 1
- 238000013160 medical therapy Methods 0.000 claims 1
- 230000003442 weekly effect Effects 0.000 claims 1
- 108090000765 processed proteins & peptides Proteins 0.000 abstract description 43
- 102000004196 processed proteins & peptides Human genes 0.000 abstract description 37
- 229920001184 polypeptide Polymers 0.000 abstract description 31
- 239000013543 active substance Substances 0.000 abstract description 7
- 239000003795 chemical substances by application Substances 0.000 abstract description 4
- 150000002632 lipids Chemical class 0.000 description 81
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 73
- 235000018102 proteins Nutrition 0.000 description 57
- 210000004027 cell Anatomy 0.000 description 48
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 45
- 208000032008 Glycogen storage disease due to glycogen debranching enzyme deficiency Diseases 0.000 description 28
- 201000004543 glycogen storage disease III Diseases 0.000 description 28
- 125000000217 alkyl group Chemical group 0.000 description 27
- 125000002091 cationic group Chemical group 0.000 description 27
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- 150000007523 nucleic acids Chemical class 0.000 description 24
- 150000003839 salts Chemical class 0.000 description 24
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 22
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 22
- 235000012000 cholesterol Nutrition 0.000 description 22
- 239000008194 pharmaceutical composition Substances 0.000 description 22
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 21
- 239000002585 base Substances 0.000 description 21
- 241000269370 Xenopus <genus> Species 0.000 description 20
- 108020004414 DNA Proteins 0.000 description 19
- 108020005345 3' Untranslated Regions Proteins 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 17
- 125000004432 carbon atom Chemical group C* 0.000 description 16
- 210000003494 hepatocyte Anatomy 0.000 description 16
- 238000000338 in vitro Methods 0.000 description 16
- 229920001223 polyethylene glycol Polymers 0.000 description 16
- 108010082126 Alanine transaminase Proteins 0.000 description 15
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 15
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 15
- 239000012472 biological sample Substances 0.000 description 15
- 238000009472 formulation Methods 0.000 description 15
- 125000005647 linker group Chemical group 0.000 description 15
- 241000723792 Tobacco etch virus Species 0.000 description 14
- 238000001890 transfection Methods 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 12
- 239000002202 Polyethylene glycol Substances 0.000 description 12
- 230000007812 deficiency Effects 0.000 description 12
- 241000699670 Mus sp. Species 0.000 description 11
- 108091034057 RNA (poly(A)) Proteins 0.000 description 11
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 11
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 11
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 11
- 229940045145 uridine Drugs 0.000 description 11
- 230000007935 neutral effect Effects 0.000 description 10
- 108020003589 5' Untranslated Regions Proteins 0.000 description 9
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 9
- 239000005977 Ethylene Substances 0.000 description 9
- 241000699666 Mus <mouse, genus> Species 0.000 description 9
- 125000003342 alkenyl group Chemical group 0.000 description 9
- 230000002440 hepatic effect Effects 0.000 description 9
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 8
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 8
- 102000004420 Creatine Kinase Human genes 0.000 description 8
- 108010042126 Creatine kinase Proteins 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 8
- 229910052757 nitrogen Inorganic materials 0.000 description 8
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 8
- 229920001353 Dextrin Polymers 0.000 description 7
- 239000004375 Dextrin Substances 0.000 description 7
- 125000002947 alkylene group Chemical group 0.000 description 7
- 125000003275 alpha amino acid group Chemical group 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 210000000805 cytoplasm Anatomy 0.000 description 7
- 235000019425 dextrin Nutrition 0.000 description 7
- 208000007345 glycogen storage disease Diseases 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 239000003981 vehicle Substances 0.000 description 7
- 239000002253 acid Substances 0.000 description 6
- 235000001014 amino acid Nutrition 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000011813 knockout mouse model Methods 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000002777 nucleoside Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- 208000021642 Muscular disease Diseases 0.000 description 5
- 201000009623 Myopathy Diseases 0.000 description 5
- 241000208125 Nicotiana Species 0.000 description 5
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 5
- 241000283973 Oryctolagus cuniculus Species 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 150000003838 adenosines Chemical class 0.000 description 5
- 229940024606 amino acid Drugs 0.000 description 5
- 150000001413 amino acids Chemical class 0.000 description 5
- 208000019425 cirrhosis of liver Diseases 0.000 description 5
- 238000005530 etching Methods 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 150000003904 phospholipids Chemical class 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 229940124597 therapeutic agent Drugs 0.000 description 5
- LDGWQMRUWMSZIU-LQDDAWAPSA-M 2,3-bis[(z)-octadec-9-enoxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)C)OCCCCCCCC\C=C/CCCCCCCC LDGWQMRUWMSZIU-LQDDAWAPSA-M 0.000 description 4
- 102100021302 Ataxin-2 Human genes 0.000 description 4
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 4
- 101000895114 Homo sapiens Ataxin-2 Proteins 0.000 description 4
- 229930182558 Sterol Natural products 0.000 description 4
- FHHZHGZBHYYWTG-INFSMZHSSA-N [(2r,3s,4r,5r)-5-(2-amino-7-methyl-6-oxo-3h-purin-9-ium-9-yl)-3,4-dihydroxyoxolan-2-yl]methyl [[[(2r,3s,4r,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl] phosphate Chemical compound N1C(N)=NC(=O)C2=C1[N+]([C@H]1[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=C(C(N=C(N)N4)=O)N=C3)O)O1)O)=CN2C FHHZHGZBHYYWTG-INFSMZHSSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 125000000304 alkynyl group Chemical group 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 230000037396 body weight Effects 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 235000014633 carbohydrates Nutrition 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 125000001570 methylene group Chemical group [H]C([H])([*:1])[*:2] 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 150000003432 sterols Chemical class 0.000 description 4
- 235000003702 sterols Nutrition 0.000 description 4
- 230000014621 translational initiation Effects 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- JZSSTKLEXRQFEA-HEIFUQTGSA-N (2s,3r,4s,5r)-2-(6-aminopurin-9-yl)-3,4-dihydroxy-5-(hydroxymethyl)oxolane-2-carboxamide Chemical compound C1=NC2=C(N)N=CN=C2N1[C@]1(C(=O)N)O[C@H](CO)[C@@H](O)[C@H]1O JZSSTKLEXRQFEA-HEIFUQTGSA-N 0.000 description 3
- ASUCSHXLTWZYBA-UMMCILCDSA-N 8-Bromoguanosine Chemical compound C1=2NC(N)=NC(=O)C=2N=C(Br)N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ASUCSHXLTWZYBA-UMMCILCDSA-N 0.000 description 3
- 206010053250 Glycogen storage disease type III Diseases 0.000 description 3
- 208000013016 Hypoglycemia Diseases 0.000 description 3
- 239000000232 Lipid Bilayer Substances 0.000 description 3
- 108091027974 Mature messenger RNA Proteins 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 108091036407 Polyadenylation Proteins 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- 239000006180 TBST buffer Substances 0.000 description 3
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 3
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 125000000623 heterocyclic group Chemical group 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000012317 liver biopsy Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 238000013268 sustained release Methods 0.000 description 3
- 239000012730 sustained-release form Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- LMBFAGIMSUYTBN-MPZNNTNKSA-N teixobactin Chemical compound C([C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H](CCC(N)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H]1C(N[C@@H](C)C(=O)N[C@@H](C[C@@H]2NC(=N)NC2)C(=O)N[C@H](C(=O)O[C@H]1C)[C@@H](C)CC)=O)NC)C1=CC=CC=C1 LMBFAGIMSUYTBN-MPZNNTNKSA-N 0.000 description 3
- 238000011816 wild-type C57Bl6 mouse Methods 0.000 description 3
- SNKAWJBJQDLSFF-NVKMUCNASA-N 1,2-dioleoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC SNKAWJBJQDLSFF-NVKMUCNASA-N 0.000 description 2
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 2
- RSSRMDMJEZIUJX-XVFCMESISA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-hydrazinylpyrimidin-2-one Chemical compound O=C1N=C(NN)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RSSRMDMJEZIUJX-XVFCMESISA-N 0.000 description 2
- BUOBCSGIAFXNKP-KWXKLSQISA-N 1-[2,2-bis[(9z,12z)-octadeca-9,12-dienyl]-1,3-dioxolan-4-yl]-n,n-dimethylmethanamine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC1(CCCCCCCC\C=C/C\C=C/CCCCC)OCC(CN(C)C)O1 BUOBCSGIAFXNKP-KWXKLSQISA-N 0.000 description 2
- HKJAWHYHRVVDHK-UHFFFAOYSA-N 15,16,17-trihydroxyhentriacontane-14,18-dione Chemical compound CCCCCCCCCCCCCC(=O)C(O)C(O)C(O)C(=O)CCCCCCCCCCCCC HKJAWHYHRVVDHK-UHFFFAOYSA-N 0.000 description 2
- KWVJHCQQUFDPLU-YEUCEMRASA-N 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KWVJHCQQUFDPLU-YEUCEMRASA-N 0.000 description 2
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical class O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 101710096214 Alanine aminotransferase 1 Proteins 0.000 description 2
- 241000180579 Arca Species 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 2
- CPELXLSAUQHCOX-UHFFFAOYSA-M Bromide Chemical compound [Br-] CPELXLSAUQHCOX-UHFFFAOYSA-M 0.000 description 2
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 206010007559 Cardiac failure congestive Diseases 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 2
- XULFJDKZVHTRLG-JDVCJPALSA-N DOSPA trifluoroacetate Chemical compound [O-]C(=O)C(F)(F)F.CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)CCNC(=O)C(CCCNCCCN)NCCCN)OCCCCCCCC\C=C/CCCCCCCC XULFJDKZVHTRLG-JDVCJPALSA-N 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical group OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 2
- 206010019280 Heart failures Diseases 0.000 description 2
- 206010019842 Hepatomegaly Diseases 0.000 description 2
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000771674 Homo sapiens Apolipoprotein E Proteins 0.000 description 2
- 101000901154 Homo sapiens Complement C3 Proteins 0.000 description 2
- 101001078385 Homo sapiens Haptoglobin Proteins 0.000 description 2
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 208000031226 Hyperlipidaemia Diseases 0.000 description 2
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 2
- 101000930477 Mus musculus Albumin Proteins 0.000 description 2
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 2
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 2
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 2
- XSWXHOQMWXTMEH-QOCHGBHMSA-N [(Z)-non-2-enyl] 4-[2-(dimethylamino)ethylsulfanylcarbonyl-(4-oxo-4-pentadecan-8-yloxybutyl)amino]butanoate Chemical compound CCCCCCCC(CCCCCCC)OC(=O)CCCN(CCCC(=O)OC\C=C/CCCCCC)C(=O)SCCN(C)C XSWXHOQMWXTMEH-QOCHGBHMSA-N 0.000 description 2
- RGAIHNZNCGOCLA-ZDSKVHJSSA-N [(Z)-non-2-enyl] 8-[2-(dimethylamino)ethylsulfanylcarbonyl-[8-[(Z)-non-2-enoxy]-8-oxooctyl]amino]octanoate Chemical compound CCCCCC\C=C/COC(=O)CCCCCCCN(CCCCCCCC(=O)OC\C=C/CCCCCC)C(=O)SCCN(C)C RGAIHNZNCGOCLA-ZDSKVHJSSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 150000001447 alkali salts Chemical class 0.000 description 2
- 125000004450 alkenylene group Chemical group 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 239000004019 antithrombin Substances 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 230000000747 cardiac effect Effects 0.000 description 2
- 150000003841 chloride salts Chemical class 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 125000000753 cycloalkyl group Chemical group 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 230000037213 diet Effects 0.000 description 2
- PSLWZOIUBRXAQW-UHFFFAOYSA-M dimethyl(dioctadecyl)azanium;bromide Chemical compound [Br-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC PSLWZOIUBRXAQW-UHFFFAOYSA-M 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 230000009881 electrostatic interaction Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- NLFBCYMMUAKCPC-KQQUZDAGSA-N ethyl (e)-3-[3-amino-2-cyano-1-[(e)-3-ethoxy-3-oxoprop-1-enyl]sulfanyl-3-oxoprop-1-enyl]sulfanylprop-2-enoate Chemical compound CCOC(=O)\C=C\SC(=C(C#N)C(N)=O)S\C=C\C(=O)OCC NLFBCYMMUAKCPC-KQQUZDAGSA-N 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 102000018146 globin Human genes 0.000 description 2
- 108060003196 globin Proteins 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 125000001188 haloalkyl group Chemical group 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 235000008085 high protein diet Nutrition 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 102000053020 human ApoE Human genes 0.000 description 2
- 102000050796 human HP Human genes 0.000 description 2
- 229940106780 human fibrinogen Drugs 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 206010020871 hypertrophic cardiomyopathy Diseases 0.000 description 2
- 230000002218 hypoglycaemic effect Effects 0.000 description 2
- 230000015788 innate immune response Effects 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 208000019423 liver disease Diseases 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 125000005322 morpholin-1-yl group Chemical group 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- XVUQPECVOGMPRU-ZPPAUJSGSA-N n,n-dimethyl-1,2-bis[(9z,12z)-octadeca-9,12-dienoxy]propan-1-amine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCOC(C)C(N(C)C)OCCCCCCCC\C=C/C\C=C/CCCCC XVUQPECVOGMPRU-ZPPAUJSGSA-N 0.000 description 2
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 2
- 238000002515 oligonucleotide synthesis Methods 0.000 description 2
- 150000007530 organic bases Chemical class 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- 208000019899 phobic disease Diseases 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 229920000768 polyamine Polymers 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- WGYKZJWCGVVSQN-UHFFFAOYSA-N propylamine Chemical compound CCCN WGYKZJWCGVVSQN-UHFFFAOYSA-N 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 108010068698 spleen exonuclease Proteins 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 229960003636 vidarabine Drugs 0.000 description 2
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 2
- RVIZTCLKCHZBMR-KWXKLSQISA-N (12z,15z)-1-(dimethylamino)-2-[(9z,12z)-octadeca-9,12-dienoxy]henicosa-12,15-dien-4-one Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCOC(CN(C)C)CC(=O)CCCCCCC\C=C/C\C=C/CCCCC RVIZTCLKCHZBMR-KWXKLSQISA-N 0.000 description 1
- VYSNBSVVTWETJN-OOBLGEDCSA-N (2S,3R)-2-amino-N-[[9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-6-methyl-8H-purin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C1N=C2C(NC(=O)NC(=O)[C@@H](N)[C@H](O)C)(C)N=CN=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VYSNBSVVTWETJN-OOBLGEDCSA-N 0.000 description 1
- GRYSXUXXBDSYRT-WOUKDFQISA-N (2r,3r,4r,5r)-2-(hydroxymethyl)-4-methoxy-5-[6-(methylamino)purin-9-yl]oxolan-3-ol Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1OC GRYSXUXXBDSYRT-WOUKDFQISA-N 0.000 description 1
- DJONVIMMDYQLKR-WOUKDFQISA-N (2r,3r,4r,5r)-2-(hydroxymethyl)-5-(6-imino-1-methylpurin-9-yl)-4-methoxyoxolan-3-ol Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CN(C)C2=N)=C2N=C1 DJONVIMMDYQLKR-WOUKDFQISA-N 0.000 description 1
- IXOXBSCIXZEQEQ-KQYNXXCUSA-N (2r,3r,4s,5r)-2-(2-amino-6-methoxypurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(OC)=NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IXOXBSCIXZEQEQ-KQYNXXCUSA-N 0.000 description 1
- RJIDFZNLNZLQGK-LNMLLNFNSA-N (2r,3r,4s,5r)-2-[6-amino-6-(14-aminotetradecoxyperoxyperoxy)-8h-purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1N=C2C(OOOOOCCCCCCCCCCCCCCN)(N)N=CN=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RJIDFZNLNZLQGK-LNMLLNFNSA-N 0.000 description 1
- UUDVSZSQPFXQQM-GIWSHQQXSA-N (2r,3s,4r,5r)-2-(6-aminopurin-9-yl)-3-fluoro-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@]1(O)F UUDVSZSQPFXQQM-GIWSHQQXSA-N 0.000 description 1
- PHFMCMDFWSZKGD-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-[6-(methylamino)-2-methylsulfanylpurin-9-yl]oxolane-3,4-diol Chemical compound C1=NC=2C(NC)=NC(SC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PHFMCMDFWSZKGD-IOSLPCCCSA-N 0.000 description 1
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- JFBCSFJKETUREV-LJAQVGFWSA-N 1,2-ditetradecanoyl-sn-glycerol Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](CO)OC(=O)CCCCCCCCCCCCC JFBCSFJKETUREV-LJAQVGFWSA-N 0.000 description 1
- WXUMWLPSZFSIJI-XUTVFYLZSA-N 1-(aminomethyl)-5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound NCN1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O WXUMWLPSZFSIJI-XUTVFYLZSA-N 0.000 description 1
- OTFGHFBGGZEXEU-PEBGCTIMSA-N 1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N(C)C(=O)C=C1 OTFGHFBGGZEXEU-PEBGCTIMSA-N 0.000 description 1
- XIJAZGMFHRTBFY-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-$l^{1}-selanyl-5-(methylaminomethyl)pyrimidin-4-one Chemical compound [Se]C1=NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XIJAZGMFHRTBFY-FDDDBJFASA-N 0.000 description 1
- GFCDNWCHLZESES-PEBGCTIMSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(dimethylamino)pyrimidin-2-one Chemical compound O=C1N=C(N(C)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 GFCDNWCHLZESES-PEBGCTIMSA-N 0.000 description 1
- HXVKEKIORVUWDR-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-(methylaminomethyl)-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HXVKEKIORVUWDR-FDDDBJFASA-N 0.000 description 1
- PLKOSISDOAHHCI-QYCRHRGJSA-N 1-[2,3-bis[(9z,12z)-octadeca-9,12-dienoxy]propyl]-4-methylpiperazine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCOCC(OCCCCCCCC\C=C/C\C=C/CCCCC)CN1CCN(C)CC1 PLKOSISDOAHHCI-QYCRHRGJSA-N 0.000 description 1
- VFWCMGCRMGJXDK-UHFFFAOYSA-N 1-chlorobutane Chemical class CCCCCl VFWCMGCRMGJXDK-UHFFFAOYSA-N 0.000 description 1
- VUQPJRPDRDVQMN-UHFFFAOYSA-N 1-chlorooctadecane Chemical compound CCCCCCCCCCCCCCCCCCCl VUQPJRPDRDVQMN-UHFFFAOYSA-N 0.000 description 1
- NVJUHMXYKCUMQA-UHFFFAOYSA-N 1-ethoxypropane Chemical compound CCCOCC NVJUHMXYKCUMQA-UHFFFAOYSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- KSXTUUUQYQYKCR-LQDDAWAPSA-M 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KSXTUUUQYQYKCR-LQDDAWAPSA-M 0.000 description 1
- VHXUHQJRMXUOST-PNHWDRBUSA-N 2-[1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2,4-dioxopyrimidin-5-yl]acetamide Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(N)=O)=C1 VHXUHQJRMXUOST-PNHWDRBUSA-N 0.000 description 1
- LRFJOIPOPUJUMI-KWXKLSQISA-N 2-[2,2-bis[(9z,12z)-octadeca-9,12-dienyl]-1,3-dioxolan-4-yl]-n,n-dimethylethanamine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC1(CCCCCCCC\C=C/C\C=C/CCCCC)OCC(CCN(C)C)O1 LRFJOIPOPUJUMI-KWXKLSQISA-N 0.000 description 1
- VJKJOPUEUOTEBX-TURQNECASA-N 2-[[1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-5-yl]methylamino]ethanesulfonic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCCS(O)(=O)=O)=C1 VJKJOPUEUOTEBX-TURQNECASA-N 0.000 description 1
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7h-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 description 1
- LBLYYCQCTBFVLH-UHFFFAOYSA-M 2-methylbenzenesulfonate Chemical compound CC1=CC=CC=C1S([O-])(=O)=O LBLYYCQCTBFVLH-UHFFFAOYSA-M 0.000 description 1
- VZQXUWKZDSEQRR-SDBHATRESA-N 2-methylthio-N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)C)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VZQXUWKZDSEQRR-SDBHATRESA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- 229940080296 2-naphthalenesulfonate Drugs 0.000 description 1
- WMPPDTMATNBGJN-UHFFFAOYSA-N 2-phenylethylbromide Chemical compound BrCCC1=CC=CC=C1 WMPPDTMATNBGJN-UHFFFAOYSA-N 0.000 description 1
- DIIXYZRGUJMAPE-KWXKLSQISA-N 3-[(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl]oxy-n,n-dimethylpropan-1-amine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OCCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC DIIXYZRGUJMAPE-KWXKLSQISA-N 0.000 description 1
- BVZVICBYYOYVEP-MAZCIEHSSA-N 3-[bis[(9z,12z)-octadeca-9,12-dienyl]amino]propane-1,2-diol Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCN(CC(O)CO)CCCCCCCC\C=C/C\C=C/CCCCC BVZVICBYYOYVEP-MAZCIEHSSA-N 0.000 description 1
- 125000004080 3-carboxypropanoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C(O[H])=O 0.000 description 1
- XMIIGOLPHOKFCH-UHFFFAOYSA-M 3-phenylpropionate Chemical compound [O-]C(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-M 0.000 description 1
- AYWLKTSHGMJOMO-UHFFFAOYSA-N 4,5,6,6a-tetrahydro-3ah-cyclopenta[d][1,3]dioxol-5-amine Chemical compound O1COC2CC(N)CC21 AYWLKTSHGMJOMO-UHFFFAOYSA-N 0.000 description 1
- OXOWTLDONRGYOT-UHFFFAOYSA-M 4-(dimethylamino)butanoate Chemical compound CN(C)CCCC([O-])=O OXOWTLDONRGYOT-UHFFFAOYSA-M 0.000 description 1
- LQQGJDJXUSAEMZ-UAKXSSHOSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidin-2-one Chemical compound C1=C(I)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LQQGJDJXUSAEMZ-UAKXSSHOSA-N 0.000 description 1
- HRDXGYQCVPZEJE-UAKXSSHOSA-N 4-amino-5-bromo-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound C1=C(Br)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HRDXGYQCVPZEJE-UAKXSSHOSA-N 0.000 description 1
- 229960000549 4-dimethylaminophenol Drugs 0.000 description 1
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-dimethylaminopyridine Substances CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- ZYEWPVTXYBLWRT-UHFFFAOYSA-N 5-Uridinacetamid Natural products O=C1NC(=O)C(CC(=O)N)=CN1C1C(O)C(O)C(CO)O1 ZYEWPVTXYBLWRT-UHFFFAOYSA-N 0.000 description 1
- DPUBWAIUESJLKX-STRQVWJDSA-N 5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-6-phenyl-1H-pyrimidine-2,4-dione Chemical compound C1(=CC=CC=C1)C1=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC(N1)=O)=O DPUBWAIUESJLKX-STRQVWJDSA-N 0.000 description 1
- CKXSJHSGYBVUSQ-XUTVFYLZSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-(hydroxymethyl)pyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CN(CO)C(=O)NC1=O CKXSJHSGYBVUSQ-XUTVFYLZSA-N 0.000 description 1
- DXEJZRDJXRVUPN-UHFFFAOYSA-N 5-[3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methyl-1h-pyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)NC=C1C1C(O)C(O)C(CO)O1 DXEJZRDJXRVUPN-UHFFFAOYSA-N 0.000 description 1
- IPRQAJTUSRLECG-UHFFFAOYSA-N 5-[6-(dimethylamino)purin-9-yl]-2-(hydroxymethyl)-4-methoxyoxolan-3-ol Chemical compound COC1C(O)C(CO)OC1N1C2=NC=NC(N(C)C)=C2N=C1 IPRQAJTUSRLECG-UHFFFAOYSA-N 0.000 description 1
- ZYEWPVTXYBLWRT-VPCXQMTMSA-N 5-carbamoylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZYEWPVTXYBLWRT-VPCXQMTMSA-N 0.000 description 1
- KELXHQACBIUYSE-UHFFFAOYSA-N 5-methoxy-1h-pyrimidine-2,4-dione Chemical compound COC1=CNC(=O)NC1=O KELXHQACBIUYSE-UHFFFAOYSA-N 0.000 description 1
- HLZXTFWTDIBXDF-PNHWDRBUSA-N 5-methoxycarbonylmethyl-2-thiouridine Chemical compound S=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HLZXTFWTDIBXDF-PNHWDRBUSA-N 0.000 description 1
- HXVKEKIORVUWDR-UHFFFAOYSA-N 5-methylaminomethyl-2-thiouridine Natural products S=C1NC(=O)C(CNC)=CN1C1C(O)C(O)C(CO)O1 HXVKEKIORVUWDR-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- LQJZZLRZEPKRRQ-UHFFFAOYSA-N 6-amino-1,7-dihydropurine-2-thione Chemical compound N1C(=S)N=C2N=CNC2=C1N LQJZZLRZEPKRRQ-UHFFFAOYSA-N 0.000 description 1
- CQLVSKLZELICMX-QHQIBUKQSA-N 6-amino-N-(2-aminoacetyl)-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-8H-purine-6-carboxamide Chemical compound NCC(=O)NC(=O)C1(C2=NCN([C@H]3[C@H](O)[C@H](O)[C@@H](CO)O3)C2=NC=N1)N CQLVSKLZELICMX-QHQIBUKQSA-N 0.000 description 1
- SYMHUEFSSMBHJA-UHFFFAOYSA-N 6-methylpurine Chemical compound CC1=NC=NC2=C1NC=N2 SYMHUEFSSMBHJA-UHFFFAOYSA-N 0.000 description 1
- FHVDTGUDJYJELY-UHFFFAOYSA-N 6-{[2-carboxy-4,5-dihydroxy-6-(phosphanyloxy)oxan-3-yl]oxy}-4,5-dihydroxy-3-phosphanyloxane-2-carboxylic acid Chemical compound O1C(C(O)=O)C(P)C(O)C(O)C1OC1C(C(O)=O)OC(OP)C(O)C1O FHVDTGUDJYJELY-UHFFFAOYSA-N 0.000 description 1
- FHHZHGZBHYYWTG-INFSMZHSSA-O 7-methyl-guanosine-5'-triphosphate-5'-guanosine Chemical compound N1C(N)=NC(=O)C2=C1[N+]([C@H]1[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=C(C(N=C(N)N4)=O)N=C3)O)O1)O)=CN2C FHHZHGZBHYYWTG-INFSMZHSSA-O 0.000 description 1
- OAUKGFJQZRGECT-UUOKFMHZSA-N 8-Azaadenosine Chemical compound N1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OAUKGFJQZRGECT-UUOKFMHZSA-N 0.000 description 1
- VJUPMOPLUQHMLE-UUOKFMHZSA-N 8-Bromoadenosine Chemical compound BrC1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJUPMOPLUQHMLE-UUOKFMHZSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- RCQRKPUXJAGEEC-ZLUOBGJFSA-N Ala-Cys-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O RCQRKPUXJAGEEC-ZLUOBGJFSA-N 0.000 description 1
- IYCZBJXFSZSHPN-DLOVCJGASA-N Ala-Cys-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IYCZBJXFSZSHPN-DLOVCJGASA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- PHQXWZGXKAFWAZ-ZLIFDBKOSA-N Ala-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 PHQXWZGXKAFWAZ-ZLIFDBKOSA-N 0.000 description 1
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- YLVGUOGAFAJMKP-JYJNAYRXSA-N Arg-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YLVGUOGAFAJMKP-JYJNAYRXSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- AUIJUTGLPVHIRT-FXQIFTODSA-N Arg-Ser-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N AUIJUTGLPVHIRT-FXQIFTODSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- KEZVOBAKAXHMOF-GUBZILKMSA-N Arg-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N KEZVOBAKAXHMOF-GUBZILKMSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- SJPZTWAYTJPPBI-GUBZILKMSA-N Asn-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SJPZTWAYTJPPBI-GUBZILKMSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 1
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- CPYHLXSGDBDULY-IHPCNDPISA-N Asn-Trp-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CPYHLXSGDBDULY-IHPCNDPISA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 1
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- GWOVSEVNXNVMMY-BPUTZDHNSA-N Asp-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N GWOVSEVNXNVMMY-BPUTZDHNSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 1
- HZBYVRUFKGRHBG-MAZCIEHSSA-N C(CCCCCCC\C=C/C\C=C/CCCCC)OOCC(CN1CCOCC1)OOCCCCCCCC\C=C/C\C=C/CCCCC Chemical compound C(CCCCCCC\C=C/C\C=C/CCCCC)OOCC(CN1CCOCC1)OOCCCCCCCC\C=C/C\C=C/CCCCC HZBYVRUFKGRHBG-MAZCIEHSSA-N 0.000 description 1
- YDNKGFDKKRUKPY-JHOUSYSJSA-N C16 ceramide Natural products CCCCCCCCCCCCCCCC(=O)N[C@@H](CO)[C@H](O)C=CCCCCCCCCCCCCC YDNKGFDKKRUKPY-JHOUSYSJSA-N 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000010667 Carcinoma of liver and intrahepatic biliary tract Diseases 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- KKZHXOOZHFABQQ-UWJYBYFXSA-N Cys-Ala-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKZHXOOZHFABQQ-UWJYBYFXSA-N 0.000 description 1
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 1
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 1
- XRTISHJEPHMBJG-SRVKXCTJSA-N Cys-Asp-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XRTISHJEPHMBJG-SRVKXCTJSA-N 0.000 description 1
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 1
- MRVSLWQRNWEROS-SVSWQMSJSA-N Cys-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CS)N MRVSLWQRNWEROS-SVSWQMSJSA-N 0.000 description 1
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 1
- LBSKYJOZIIOZIO-DCAQKATOSA-N Cys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N LBSKYJOZIIOZIO-DCAQKATOSA-N 0.000 description 1
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 1
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 1
- BUAUGQJXGNRTQE-AAEUAGOBSA-N Cys-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N BUAUGQJXGNRTQE-AAEUAGOBSA-N 0.000 description 1
- LHRCZIRWNFRIRG-SRVKXCTJSA-N Cys-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O LHRCZIRWNFRIRG-SRVKXCTJSA-N 0.000 description 1
- HPZAJRPYUIHDIN-BZSNNMDCSA-N Cys-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N HPZAJRPYUIHDIN-BZSNNMDCSA-N 0.000 description 1
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 125000000824 D-ribofuranosyl group Chemical group [H]OC([H])([H])[C@@]1([H])OC([H])(*)[C@]([H])(O[H])[C@]1([H])O[H] 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- XBPCUCUWBYBCDP-UHFFFAOYSA-N Dicyclohexylamine Chemical compound C1CCCCC1NC1CCCCC1 XBPCUCUWBYBCDP-UHFFFAOYSA-N 0.000 description 1
- BXZVVICBKDXVGW-NKWVEPMBSA-N Didanosine Chemical compound O1[C@H](CO)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 BXZVVICBKDXVGW-NKWVEPMBSA-N 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 208000010228 Erectile Dysfunction Diseases 0.000 description 1
- PIICEJLVQHRZGT-UHFFFAOYSA-N Ethylenediamine Chemical compound NCCN PIICEJLVQHRZGT-UHFFFAOYSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 1
- GNDJOCGXGLNCKY-ACZMJKKPSA-N Gln-Cys-Cys Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O GNDJOCGXGLNCKY-ACZMJKKPSA-N 0.000 description 1
- VVWWRZZMPSPVQU-KBIXCLLPSA-N Gln-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N VVWWRZZMPSPVQU-KBIXCLLPSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- XGKNQFOKIBKFTR-CIUDSAMLSA-N Gln-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(N)=O XGKNQFOKIBKFTR-CIUDSAMLSA-N 0.000 description 1
- LHMWTCWZARHLPV-CIUDSAMLSA-N Gln-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LHMWTCWZARHLPV-CIUDSAMLSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- MXPBQDFWIMBACQ-ACZMJKKPSA-N Glu-Cys-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O MXPBQDFWIMBACQ-ACZMJKKPSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108010058102 Glycogen Debranching Enzyme System Proteins 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 206010073069 Hepatic cancer Diseases 0.000 description 1
- 206010019663 Hepatic failure Diseases 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 1
- NNBWMLHQXBTIIT-HVTMNAMFSA-N His-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N NNBWMLHQXBTIIT-HVTMNAMFSA-N 0.000 description 1
- DVHGLDYMGWTYKW-GUBZILKMSA-N His-Gln-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DVHGLDYMGWTYKW-GUBZILKMSA-N 0.000 description 1
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- PBVQWNDMFFCPIZ-ULQDDVLXSA-N His-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 PBVQWNDMFFCPIZ-ULQDDVLXSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000678026 Homo sapiens Alpha-1-antichymotrypsin Proteins 0.000 description 1
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 1
- 101000941598 Homo sapiens Complement C5 Proteins 0.000 description 1
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 1
- 101001021253 Homo sapiens Hepcidin Proteins 0.000 description 1
- 101001076408 Homo sapiens Interleukin-6 Proteins 0.000 description 1
- 101000772194 Homo sapiens Transthyretin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-N Hydrogen bromide Chemical compound Br CPELXLSAUQHCOX-UHFFFAOYSA-N 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- VQTUBCCKSQIDNK-UHFFFAOYSA-N Isobutene Chemical group CC(C)=C VQTUBCCKSQIDNK-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- YRWCPXOFBKTCFY-NUTKFTJISA-N Lys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N YRWCPXOFBKTCFY-NUTKFTJISA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- YXTKSLRSRXKXNV-IHRRRGAJSA-N Lys-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N YXTKSLRSRXKXNV-IHRRRGAJSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 1
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108091007767 MALAT1 Proteins 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 1
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 1
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- UNUYMBPXEFMLNW-DWVDDHQFSA-N N-[(9-beta-D-ribofuranosylpurin-6-yl)carbamoyl]threonine Chemical compound C1=NC=2C(NC(=O)N[C@@H]([C@H](O)C)C(O)=O)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UNUYMBPXEFMLNW-DWVDDHQFSA-N 0.000 description 1
- CRJGESKKUOMBCT-VQTJNVASSA-N N-acetylsphinganine Chemical compound CCCCCCCCCCCCCCC[C@@H](O)[C@H](CO)NC(C)=O CRJGESKKUOMBCT-VQTJNVASSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- MBBZMMPHUWSWHV-BDVNFPICSA-N N-methylglucamine Chemical compound CNC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO MBBZMMPHUWSWHV-BDVNFPICSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- XMIFBEZRFMTGRL-TURQNECASA-N OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S XMIFBEZRFMTGRL-TURQNECASA-N 0.000 description 1
- GCYHIMZPUMPBJJ-GBNDHIKLSA-N ON1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O Chemical compound ON1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O GCYHIMZPUMPBJJ-GBNDHIKLSA-N 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 1
- ROOQMPCUFLDOSB-FHWLQOOXSA-N Phe-Phe-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ROOQMPCUFLDOSB-FHWLQOOXSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- 206010034912 Phobia Diseases 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 102000015623 Polynucleotide Adenylyltransferase Human genes 0.000 description 1
- 108010024055 Polynucleotide adenylyltransferase Proteins 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 1
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical group CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 101710086015 RNA ligase Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- WTPKKLMBNBCCNL-ACZMJKKPSA-N Ser-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N WTPKKLMBNBCCNL-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- LPSKHZWBQONOQJ-XIRDDKMYSA-N Ser-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N LPSKHZWBQONOQJ-XIRDDKMYSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 206010042434 Sudden death Diseases 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- GNVMUORYQLCPJZ-UHFFFAOYSA-M Thiocarbamate Chemical compound NC([S-])=O GNVMUORYQLCPJZ-UHFFFAOYSA-M 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- IGGFFPOIFHZYKC-PBCZWWQYSA-N Thr-His-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O IGGFFPOIFHZYKC-PBCZWWQYSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- BJJRNAVDQGREGC-HOUAVDHOSA-N Thr-Trp-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O BJJRNAVDQGREGC-HOUAVDHOSA-N 0.000 description 1
- FRQRWAMUESPWMT-HSHDSVGOSA-N Thr-Trp-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N)O FRQRWAMUESPWMT-HSHDSVGOSA-N 0.000 description 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- DTQVDTLACAAQTR-UHFFFAOYSA-M Trifluoroacetate Chemical compound [O-]C(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-M 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- OFNPHOGOJLNVLL-KCTSRDHCSA-N Trp-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N OFNPHOGOJLNVLL-KCTSRDHCSA-N 0.000 description 1
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- VCGOTJGGBXEBFO-FDARSICLSA-N Trp-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VCGOTJGGBXEBFO-FDARSICLSA-N 0.000 description 1
- FBHHJGOJWXHGDO-TUSQITKMSA-N Trp-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 FBHHJGOJWXHGDO-TUSQITKMSA-N 0.000 description 1
- KPEVFMGKBCMTJF-SZMVWBNQSA-N Trp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N KPEVFMGKBCMTJF-SZMVWBNQSA-N 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- SEFNTZYRPGBDCY-IHRRRGAJSA-N Tyr-Arg-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O SEFNTZYRPGBDCY-IHRRRGAJSA-N 0.000 description 1
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- YYZPVPJCOGGQPC-JYJNAYRXSA-N Tyr-His-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYZPVPJCOGGQPC-JYJNAYRXSA-N 0.000 description 1
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- OFHKXNKJXURPSY-ULQDDVLXSA-N Tyr-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O OFHKXNKJXURPSY-ULQDDVLXSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- SCZJKZLFSSPJDP-ACRUOGEOSA-N Tyr-Phe-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SCZJKZLFSSPJDP-ACRUOGEOSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 1
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 241000269360 Xenopus sp. Species 0.000 description 1
- HIHOWBSBBDRPDW-PTHRTHQKSA-N [(3s,8s,9s,10r,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-yl] n-[2-(dimethylamino)ethyl]carbamate Chemical compound C1C=C2C[C@@H](OC(=O)NCCN(C)C)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HIHOWBSBBDRPDW-PTHRTHQKSA-N 0.000 description 1
- TTWXVHUYMARJHI-KWXKLSQISA-N [(6Z,9Z,29Z,32Z)-20-[(dimethylamino)methyl]octatriaconta-6,9,29,32-tetraen-19-yl] carbamate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(CN(C)C)C(OC(N)=O)CCCCCCCC\C=C/C\C=C/CCCCC TTWXVHUYMARJHI-KWXKLSQISA-N 0.000 description 1
- HPFVBGJFAYZEBE-XNBTXCQYSA-N [(8r,9s,10r,13s,14s)-10,13-dimethyl-3-oxo-1,2,6,7,8,9,11,12,14,15,16,17-dodecahydrocyclopenta[a]phenanthren-17-yl] 3-cyclopentylpropanoate Chemical compound C([C@H]1[C@H]2[C@@H]([C@]3(CCC(=O)C=C3CC2)C)CC[C@@]11C)CC1OC(=O)CCC1CCCC1 HPFVBGJFAYZEBE-XNBTXCQYSA-N 0.000 description 1
- HCAJCMUKLZSPFT-KWXKLSQISA-N [3-(dimethylamino)-2-[(9z,12z)-octadeca-9,12-dienoyl]oxypropyl] (9z,12z)-octadeca-9,12-dienoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(=O)OCC(CN(C)C)OC(=O)CCCCCCC\C=C/C\C=C/CCCCC HCAJCMUKLZSPFT-KWXKLSQISA-N 0.000 description 1
- NYDLOCKCVISJKK-WRBBJXAJSA-N [3-(dimethylamino)-2-[(z)-octadec-9-enoyl]oxypropyl] (z)-octadec-9-enoate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(CN(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC NYDLOCKCVISJKK-WRBBJXAJSA-N 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- YDHWWBZFRZWVHO-UHFFFAOYSA-H [oxido-[oxido(phosphonatooxy)phosphoryl]oxyphosphoryl] phosphate Chemical class [O-]P([O-])(=O)OP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O YDHWWBZFRZWVHO-UHFFFAOYSA-H 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- WNLRTRBMVRJNCN-UHFFFAOYSA-L adipate(2-) Chemical compound [O-]C(=O)CCCCC([O-])=O WNLRTRBMVRJNCN-UHFFFAOYSA-L 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 101150033605 agl gene Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 229940072056 alginate Drugs 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-DVKNGEFBSA-N alpha-D-glucose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-DVKNGEFBSA-N 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 108010006759 amylo-1,6-glucosidase Proteins 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 229940072107 ascorbate Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- JUHORIMYRDESRB-UHFFFAOYSA-N benzathine Chemical compound C=1C=CC=CC=1CNCCNCC1=CC=CC=C1 JUHORIMYRDESRB-UHFFFAOYSA-N 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-M benzenesulfonate Chemical compound [O-]S(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-M 0.000 description 1
- 229940077388 benzenesulfonate Drugs 0.000 description 1
- 229940050390 benzoate Drugs 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 108010020596 beta-casomorphin 5 Proteins 0.000 description 1
- XMIIGOLPHOKFCH-UHFFFAOYSA-N beta-phenylpropanoic acid Natural products OC(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-N 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000036765 blood level Effects 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- MIOPJNTWMNEORI-UHFFFAOYSA-N camphorsulfonic acid Chemical compound C1CC2(CS(O)(=O)=O)C(=O)CC1C2(C)C MIOPJNTWMNEORI-UHFFFAOYSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 229940106189 ceramide Drugs 0.000 description 1
- ZVEQCJWYRWKARO-UHFFFAOYSA-N ceramide Natural products CCCCCCCCCCCCCCC(O)C(=O)NC(CO)C(O)C=CCCC=C(C)CCCCCCCCC ZVEQCJWYRWKARO-UHFFFAOYSA-N 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 101150047356 dec-1 gene Proteins 0.000 description 1
- 125000002704 decyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 125000004663 dialkyl amino group Chemical group 0.000 description 1
- 150000008050 dialkyl sulfates Chemical class 0.000 description 1
- 229960002656 didanosine Drugs 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 125000004177 diethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 125000000118 dimethyl group Chemical group [H]C([H])([H])* 0.000 description 1
- UAKOZKUVZRMOFN-JDVCJPALSA-M dimethyl-bis[(z)-octadec-9-enyl]azanium;chloride Chemical compound [Cl-].CCCCCCCC\C=C/CCCCCCCC[N+](C)(C)CCCCCCCC\C=C/CCCCCCCC UAKOZKUVZRMOFN-JDVCJPALSA-M 0.000 description 1
- GAFRWLVTHPVQGK-UHFFFAOYSA-N dipentyl sulfate Chemical class CCCCCOS(=O)(=O)OCCCCC GAFRWLVTHPVQGK-UHFFFAOYSA-N 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 125000003438 dodecyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- MOTZDAYCYVMXPC-UHFFFAOYSA-N dodecyl hydrogen sulfate Chemical compound CCCCCCCCCCCCOS(O)(=O)=O MOTZDAYCYVMXPC-UHFFFAOYSA-N 0.000 description 1
- 229940043264 dodecyl sulfate Drugs 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 239000013583 drug formulation Substances 0.000 description 1
- 238000002296 dynamic light scattering Methods 0.000 description 1
- 230000005014 ectopic expression Effects 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000004651 endocytosis pathway Effects 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 125000005313 fatty acid group Chemical group 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- MNWFXJYAOYHMED-UHFFFAOYSA-N heptanoic acid Chemical compound CCCCCCC(O)=O MNWFXJYAOYHMED-UHFFFAOYSA-N 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 102000052611 human IL6 Human genes 0.000 description 1
- 102000051631 human SERPINA1 Human genes 0.000 description 1
- 102000056556 human TTR Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- XGIHQYAWBCFNPY-AZOCGYLKSA-N hydrabamine Chemical compound C([C@@H]12)CC3=CC(C(C)C)=CC=C3[C@@]2(C)CCC[C@@]1(C)CNCCNC[C@@]1(C)[C@@H]2CCC3=CC(C(C)C)=CC=C3[C@@]2(C)CCC1 XGIHQYAWBCFNPY-AZOCGYLKSA-N 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M hydrogensulfate Chemical compound OS([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- 150000002433 hydrophilic molecules Chemical class 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 150000002463 imidates Chemical class 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 150000007529 inorganic bases Chemical class 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000004694 iodide salts Chemical class 0.000 description 1
- SUMDYPCJJOFFON-UHFFFAOYSA-N isethionic acid Chemical compound OCCS(O)(=O)=O SUMDYPCJJOFFON-UHFFFAOYSA-N 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000002479 lipoplex Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 201000002250 liver carcinoma Diseases 0.000 description 1
- 208000007903 liver failure Diseases 0.000 description 1
- 231100000835 liver failure Toxicity 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 159000000003 magnesium salts Chemical class 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- HLZXTFWTDIBXDF-UHFFFAOYSA-N mcm5sU Natural products COC(=O)Cc1cn(C2OC(CO)C(O)C2O)c(=S)[nH]c1=O HLZXTFWTDIBXDF-UHFFFAOYSA-N 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 125000001421 myristyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- VHRYAHCCVUHIBM-NSOMFCEZSA-N n,n-dimethyl-1,2-bis[(6z,9z,12z)-octadeca-6,9,12-trienoxy]propan-1-amine Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCCOC(C)C(N(C)C)OCCCCC\C=C/C\C=C/C\C=C/CCCCC VHRYAHCCVUHIBM-NSOMFCEZSA-N 0.000 description 1
- NFQBIAXADRDUGK-KWXKLSQISA-N n,n-dimethyl-2,3-bis[(9z,12z)-octadeca-9,12-dienoxy]propan-1-amine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCOCC(CN(C)C)OCCCCCCCC\C=C/C\C=C/CCCCC NFQBIAXADRDUGK-KWXKLSQISA-N 0.000 description 1
- GLGLUQVVDHRLQK-WRBBJXAJSA-N n,n-dimethyl-2,3-bis[(z)-octadec-9-enoxy]propan-1-amine Chemical compound CCCCCCCC\C=C/CCCCCCCCOCC(CN(C)C)OCCCCCCCC\C=C/CCCCCCCC GLGLUQVVDHRLQK-WRBBJXAJSA-N 0.000 description 1
- UKXOXMLXFQEEQJ-KWXKLSQISA-N n,n-dimethyl-2,3-bis[[(9z,12z)-octadeca-9,12-dienyl]sulfanyl]propan-1-amine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCSCC(CN(C)C)SCCCCCCCC\C=C/C\C=C/CCCCC UKXOXMLXFQEEQJ-KWXKLSQISA-N 0.000 description 1
- SLLVJTURCPWLTP-WOUKDFQISA-N n-[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]acetamide Chemical compound C1=NC=2C(NC(=O)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLLVJTURCPWLTP-WOUKDFQISA-N 0.000 description 1
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- KVBGVZZKJNLNJU-UHFFFAOYSA-M naphthalene-2-sulfonate Chemical compound C1=CC=CC2=CC(S(=O)(=O)[O-])=CC=C21 KVBGVZZKJNLNJU-UHFFFAOYSA-M 0.000 description 1
- VVGIYYKRAMHVLU-UHFFFAOYSA-N newbouldiamide Natural products CCCCCCCCCCCCCCCCCCCC(O)C(O)C(O)C(CO)NC(=O)CCCCCCCCCCCCCCCCC VVGIYYKRAMHVLU-UHFFFAOYSA-N 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 230000000422 nocturnal effect Effects 0.000 description 1
- 231100000065 noncytotoxic Toxicity 0.000 description 1
- 230000002020 noncytotoxic effect Effects 0.000 description 1
- 230000002352 nonmutagenic effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 229940127073 nucleoside analogue Drugs 0.000 description 1
- 150000003833 nucleoside derivatives Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- JRKICGRDRMAZLK-UHFFFAOYSA-L peroxydisulfate Chemical compound [O-]S(=O)(=O)OOS([O-])(=O)=O JRKICGRDRMAZLK-UHFFFAOYSA-L 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 125000004194 piperazin-1-yl group Chemical group [H]N1C([H])([H])C([H])([H])N(*)C([H])([H])C1([H])[H] 0.000 description 1
- 229950010765 pivalate Drugs 0.000 description 1
- IUGYQRQAERSCNH-UHFFFAOYSA-N pivalic acid Chemical compound CC(C)(C)C(O)=O IUGYQRQAERSCNH-UHFFFAOYSA-N 0.000 description 1
- 230000036470 plasma concentration Effects 0.000 description 1
- 108010083529 poly A specific exoribonuclease Proteins 0.000 description 1
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 159000000001 potassium salts Chemical class 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 239000002213 purine nucleotide Substances 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 125000000548 ribosyl group Chemical class C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- YGSDEFSMJLZEOE-UHFFFAOYSA-M salicylate Chemical compound OC1=CC=CC=C1C([O-])=O YGSDEFSMJLZEOE-UHFFFAOYSA-M 0.000 description 1
- 229960001860 salicylate Drugs 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- YBRBMKDOPFTVDT-UHFFFAOYSA-N tert-butylamine Chemical compound CC(C)(C)N YBRBMKDOPFTVDT-UHFFFAOYSA-N 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- JOXIMZWYDAKGHI-UHFFFAOYSA-N toluene-4-sulfonic acid Chemical compound CC1=CC=C(S(O)(=O)=O)C=C1 JOXIMZWYDAKGHI-UHFFFAOYSA-N 0.000 description 1
- 235000015961 tonic Nutrition 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 229960000716 tonics Drugs 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- ZDPHROOEEOARMN-UHFFFAOYSA-N undecanoic acid Chemical compound CCCCCCCCCCC(O)=O ZDPHROOEEOARMN-UHFFFAOYSA-N 0.000 description 1
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7115—Nucleic acids or oligonucleotides having modified bases, i.e. other than adenine, guanine, cytosine, uracil or thymine
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/45—Transferases (2)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/47—Hydrolases (3) acting on glycosyl compounds (3.2), e.g. cellulases, lactases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2451—Glucanases acting on alpha-1,6-glucosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01025—4-Alpha-glucanotransferase (2.4.1.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01033—Amylo-alpha-1,6-glucosidase (3.2.1.33)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0025—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
- A61K48/0041—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being polymeric
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
- C12N2310/334—Modified C
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
- C12N2310/335—Modified T or U
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Hematology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Diabetes (AREA)
- Obesity (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Saccharide Compounds (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 발명은 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 다양한 번역가능 폴리뉴클레오타이드 및 올리고머 분자를 제공한다. 본 폴리뉴클레오타이드 및 올리고머 분자는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 제공하도록 발현가능하다. 본 분자는 세포 또는 대상체에서 활성 폴리펩타이드 또는 단백질을 발현하는 활성제로서 사용될 수 있다. 본 제제는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성과 연관된 질환 또는 병태를 개선하거나, 예방하거나, 발병을 지연시키거나, 또는 치료하기 위한 방법에 사용될 수 있다.
Description
관련
출원에 대한 교차 참조
본원은 2017년 5월 31일 출원된 미국 가출원 일련 번호 62/513,350에 대한 우선권을 주장하며, 이것은 모든 목적을 위해 본 명세서에 전체적으로 참고로 포함된다.
기술분야
본 발명은 분자 생물학 및 유전학뿐만 아니라 번역가능 분자로부터 생성된 생물약제 및 치료제의 분야에 관한 것이다. 더 상세하게는, 본 발명은 생체내에서 및 치료제로서 사용하기 위해 활성 폴리펩타이드 또는 단백질로 번역되는 능력을 갖는 분자에 대한 방법, 구조 및 조성물에 관한 것이다.
전자적으로 제출된 텍스트 파일의 설명
이와 함께 전자적으로 제출된 텍스트 파일의 내용은 전체적으로 참고로 본 명세서에 포함된다: 서열목록의 컴퓨터 판독가능한 형식 카피 (파일명: ULPI_041_01WO_SeqList_ST25.txt, 기록된 날자: 2018년 5월 30일, 파일 크기: 226 킬로바이트).
글리코겐 축적 질환 유형 III (GSD III 또는 Cori 질환으로도 알려져 있음)은 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)로 알려진 글리코겐 탈분지화 효소의 결핍에 의해 야기된 글리코겐 대사의 드문 (발병률 1:100,000) 선천성 이상이다. 이 상염색체 열성 대사 장애는 가변성 간, 심장 근육, 및 골격 근육 관여를 특징으로 한다.
결핍된 효소, AGL의 조직 발현에서의 차이에 기초하여 4가지 아형 GSD III이 있다. GSD IIIa는 모든 GSD III의 약 85 %를 차지하며 간과 근육 둘 모두에서의 효소 결핍으로 유래되는 간과 근육 관여를 나타낸다. GSDIIIb는 대략 15%를 차지하고 일반적으로 단지 간에서의 효소 결핍으로 유래되는 간 관여만을 나타낸다. 한편, GSDIIIc 및 GSDIIId 둘 모두는 매우 빠르며, GSDIIIc는 글루코시다제 탈분지화 활성의 결핍으로 인한 것으로 여겨지고 GSDIIId는 전달효소 탈분지화 활성의 결핍으로 인한 것으로 여겨진다.
유아기 및 초기 소아기에서, 간 관여는 케토틱 저혈당증, 간비대, 고지혈증, 및 상승된 간 아미노전이효소로 나타난다. 청소년기 및 성인기에서, 간 질환은 덜 두드러진다. 비대성 심근병증은 일반적으로 소아기 동안 GSD IIIa를 갖는 이들의 대다수에서 발생한다. 그것의 임상적 유의성은 대부분에서의 무증상에서부터 중증 심장 기능이상, 울혈성 심장기능상실, 그리고 드물게는, 갑작스러운 사망에 이르기까지 다양하다. 약화로 명확한 골격 근병증은 소아기에는 일반적으로 분명하지 않지만, 느리게 진행되어, 전형적으로 성인에서 두드러진다.
영향받은 기관과 일치하여, 향상된 알라닌 아미노전이효소 (ALT), 아스파르테이트 아미노전이효소 (AST), 알칼리성 포스파타제 (ALP), 및/또는 크레아틴 포스포키나제 (CPK) 활성은 GSD III 환자의 혈청에서 빈번하게 존재한다.
전술한 바와 같이, GSD III은 AGL에서의 결핍에 의해 야기된다. 이 결핍은 일반적으로 GSD III에 시달리는 대상체에서 AGL 효소 활성의 부분적인 또는 전체적인 폐지를 초래하는 AGL 유전자의 선천적 돌연변이(들)에 기인한다. GSD III 환자에서의 AGL 단백질의 분자 분석이 여러 민족 집단에서 수행되었으며, 100가지 이상의 상이한 AGL 돌연변이가 기재되었다. Goldstein et al., 2010, Genet. Med. 12: 424-430 참조. 또한 Sentner et al., 2013, JIMD Rep. 7: 19-26 참조.
GSD III의 효과적인 치료는 현재로는 없다. 종종 야행성 위 점적액 공급 또는 옥수수전분 보충제의 사용을 통한 탄수화물이 높은 식사를 자주하여 저혈당증을 조절하려는 시도가 있었다. 한편, 근병증이 있는 환자는 낮 동안 단백질이 높은 식이에 더하여 밤새 장내 주입하는 것으로 치료받았다. 소수의 환자에서 증상의 일시적인 개선이 문헌에 기록되었지만 고단백 식이가 진행성 근병증을 예방하거나 치료한다는 것을 입증하는 장기적인 자료는 없다. Chen YT, Burchell A, Glycogen storage disease. In: Scriver CR, Beaudet AL, Sly WS, Valle D, The metabolic and molecular basis of inherited disease. New York: McGraw Hill, 1995: 935-65 참조. 진행성 근병증 및/또는 심근병증은 성인에서의 이환율의 주요 원인이며, 진행성 간경변증 및 간암종을 나타내는 환자가 보고되었다. 따라서, 이 질환의 근본 원인, 즉 AGL 효소 활성의 결핍을 해결할 수 있는 치료법에 대한 시급한 필요성이 있다.
현재까지, 효소 대체가 GSD III의 AGL과 같은 세포질에 결함있는 효소가 존재하는 질환에서 연구되지는 않았는데, 이는 아마도 외인성 효소를 세포질 안으로 원형질 막을 가로 질러 전달하는 효율적이고 특이적인 세포의 흡수 메커니즘의 결여때문일 것이다.
본 발명은 GSD III과 같은 AGL 결핍과 관련된 질환 또는 병태를 개선, 예방 또는 치료할 수 있는 활성 AGL을 제공하기 위해 세포질에서 번역되는 능력을 가진 분자, 구조 및 조성물을 제공함에 의해 상기 언급된 요구를 해결한다.
본 발명은 하나 이상의 활성 폴리펩타이드 및 단백질, 또는 이의 단편을 제공하기 위해 사용될 수 있는, 번역되는 능력을 가진 신규한 분자를 포함하는 조성물을 제공한다. 본 발명은 다양한 장애의 예방 또는 치료를 위한 신규한 분자를 포함하는 이들 조성물을 사용하는 방법을 추가로 제공한다. 더 구체적으로, 본 발명의 구현예는 활성 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 제공하는 번역가능 분자를 포함하는 조성물 및 GSD III의 치료를 위해 상기 조성물을 사용하는 방법을 제공한다.
본 발명의 번역가능 분자는 AGL 폴리펩타이드 또는 단백질을 생산하는 기능적 세포질 활성을 가질 수 있다. 펩타이드 및 단백질은 치료적 양식에 대해 활성일 수 있다.
본 발명의 번역가능 분자는, 특히 세포의 세포질에서 긴 반감기를 가질 수 있다. 번역가능 분자는 AGL 결핍과 연관된 질환 또는 병태를 개선, 예방 또는 치료하는 데 활성인 생성물을 제공하도록 발현가능할 수 있다.
본 개시내용은 AGL 폴리펩타이드 또는 단백질을 생산하는 번역가능 분자에 대한 다양한 구조를 제공한다. 일부 구현예에서, 번역가능 분자는 천연 mRNA에 비하여 증가된 번역 능력 및/또는 연장된 반감기를 가질 수 있다.
본 발명의 번역가능 분자는 의약, 및 활성 폴리펩타이드 및 단백질을 생산하고 전달하기 위한 방법 및 조성물에 사용될 수 있다. 본 발명의 번역가능 분자는 시험관내, 생체외, 또는 생체내에서 폴리펩타이드 또는 단백질을 제공하기 위해 사용될 수 있다.
본 개시내용의 구현예는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 다양한 신규한 폴리뉴클레오타이드를 제공한다. 본 폴리뉴클레오타이드는 천연 뉴클레오타이드 및 화학적으로 변형된 뉴클레오타이드를 포함할 수 있다. 본 폴리뉴클레오타이드는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 제공하도록 발현가능할 수 있다.
추가 양태에서, 본 발명은 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 하나 이상의 비잠금 핵산 (UNA) 단량체를 포함하는 다양한 신규한 번역가능한 올리고머를 제공한다. 번역가능한 올리고머는 천연 뉴클레오타이드 및 화학적으로 변형된 뉴클레오타이드와 함께 하나 이상의 UNA 단량체를 함유할 수 있다. 하나 이상의 UNA 단량체를 포함하는 번역가능한 올리고머는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 제공하도록 발현가능할 수 있다.
특정 양태에서, 본 발명의 번역가능 분자는 폴리펩타이드 또는 단백질, 또는 이의 단편의 고-효율 발현을 제공할 수 있다. 발현은 시험관내, 생체외, 또는 생체내에서 될 수 있다.
일부 구현예에서, 본 발명의 분자는 동일한 폴리펩타이드 또는 단백질을 인코딩하는 천연, 성숙한 mRNA에 비하여 증가된 세포질 반감기를 가질 수 있다. 본 발명의 분자 및 조성물은 천연, 성숙한 mRNA에 관하여 증가된 기능 세포 활성을 제공할 수 있다.
추가 양태에서, 본 발명의 번역가능 분자는 천연, 성숙한 mRNA와 비교되는 것과 같은, 펩타이드 또는 단백질 생성물을 제공하는 약물 제제로서 증가된 활성을 제공할 수 있다. 본 발명의 번역가능 분자는 유효한 요법에 필요한 용량 수준을 감소시킬 수 있다.
본 발명의 구현예는 하기를 포함한다.
도 1은 본 발명의 번역가능 분자를 사용하여 시험관내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 1은 참조 분자534에 대해 정규화된 AML12 및 C2C12 세포에서 AGL의 상대적인 발현을 도시한다. 수직축은 참조에 대한 배수-증가를 반영하며, 예를 들어, 10은 참조보다 10-배수 증가이다. 참조 분자를 포함하는 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 Nl-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 Nl-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 2개의 세포주 (AML12, C2C12)로 형질감염되었다. 세포는 용해되고 형질감염 후 6시간에서 수확되었다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 2는 본 발명의 번역가능 분자를 사용하여 시험관내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 2는 참조 분자534에 대해 정규화된 AML12 및 C2C12 세포에서 AGL의 상대적인 발현을 도시한다. 수직축은 참조에 대한 배수-증가를 반영하며, 예를 들어, 10은 참조보다 10-배수 증가이다. 참조 분자를 포함하는 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 Nl-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 Nl-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 2개의 세포주 (AML12, C2C12)로 형질감염되었다. 세포는 용해되고 형질감염 후 24시간에서 수확되었다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 3은 본 발명의 번역가능 분자를 사용하여 생체내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 3은 24시간 및 48시간 시점에서 번역가능 분자528 및 534 (참조)에 대한 WT 마우스에서 AGL의 상대적인 발현을 도시한다. 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 Nl-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 Nl-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 지질 나노입자 형성으로 제조되었고 10 mg/kg으로 WT 마우스 안으로 정맥내로 주입되었다. 마우스 간은 24시간 및 48시간에서 수확되었고, 그리고 AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 4는 본 발명의 번역가능 분자를 사용하여 생체내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 4는 기준선 PBS (100)와 비교하여, 번역가능 분자 525, 527, 528, 529 및 546의 복용 후 WT 마우스에서 AGL의 상대적인 간 발현을 도시한다. AGL을 인코딩하는 합성된 번역가능 분자 525, 527, 528, 529 및 546은 지질 나노입자 형성으로 제조되었고 WT 마우스에 IP를 통해 주입되었다. 주입된 용량은 10 mpk이고, 추가 분석을 위해 6시간에 간을 수집하였다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 5는 3개의 번역가능 분자: 546, 1783 및 1784로부터 인간 AGL을 발현한 결과를 도시한다. 인간 1차 간세포는 코돈-최적화된 mRNA로 형질감염되었고, AGL 단백질 발현은 형질 감염 후 6, 24, 48 및 72시간에서 In-Cell WesternTM에 의해 측정되었다. mRNA 서열의 발현을 미처리된 대조군 ("unt")과 비교되었다.
도 6은 야생형 C57BL/6 마우스에서 지질 나노입자로 제형화된 다양한 mRNA 분자로부터 인간 AGL의 발현을 도시한다. 간 생검 샘플로부터 균질물에서 mRNA 분자로부터 발현된 외인성 인간 AGL의 단백질 농도 (ng/mg)를 다중 반응 모니터링 분석에 의해 결정하였다. 그래프에 546.1, 736.1, 738.1, 737.1, 731.1 및 1783.1로 나타낸 번역가능 분자는 실시예 2에 기재된 바와 같이 각각 546, 736, 738, 737, 731 및 1783과 동일하다. 한편, 번역가능 분자 546.7은 실시예 2에 기술된 546과 동일한 핵염기 서열을 갖지만, 번역가능 분자 546을 합성하는 데 사용된 N1-메틸슈도우리딘 대신 우리딘의 위치에서 5-메톡시우리딘으로 합성되었다.
도 7은 지질 나노입자로 제형화된 다양한 mRNA 분자로 처리된 야생형 C57BL/6 마우스에서 내인성 마우스 AGL의 발현을 도시한다. 간 생검 샘플로부터 균질물에서 발현된 내인성 마우스 AGL의 단백질 농도 (ng / mg)를 다중 반응 모니터링 분석에 의해 결정하였다. 그래프에 546.1, 736.1, 738.1, 737.1, 731.1 및 1783.1로 나타낸 번역가능 분자는 실시예 2에 기재된 바와 같이 각각 546, 736, 738, 737, 731 및 1783과 동일하다. 한편, 번역가능 분자 546.7은 실시예 2에 기술된 546과 동일한 핵염기 서열을 갖지만, 번역가능 분자 546을 합성하는 데 사용된 N1-메틸슈도우리딘 대신 우리딘의 위치에서 5-메톡시우리딘으로 합성되었다.
도 8은 비히클 ("VEH")로 처리된 AGL 녹아웃 마우스로부터 간의 조직병리를 도시한다. 비히클로 처리된 간세포 내에서 간세포의 현저한 내지 심각한 공포형성과 글리코겐 축적에서의 중간 내지 현저한 증가가 관찰되었다.
도 9는 ATX2 지질 나노입자로 제형화된 번역가능 분자 546으로 처리된 AGL 녹아웃 마우스로부터 간의 조직병리를 도시한다. ATX2 지질 나노 입자로 제형화된 번역가능 분자 546으로 처리된 간세포 내에서 단지 간세포의 온화한 내지 중간정도의 공포형성과 간세포 내에서 글리코겐 축적에서의 단지 온화한 내지 중간정도의 증가가 관찰되었다.
도 2는 본 발명의 번역가능 분자를 사용하여 시험관내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 2는 참조 분자534에 대해 정규화된 AML12 및 C2C12 세포에서 AGL의 상대적인 발현을 도시한다. 수직축은 참조에 대한 배수-증가를 반영하며, 예를 들어, 10은 참조보다 10-배수 증가이다. 참조 분자를 포함하는 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 Nl-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 Nl-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 2개의 세포주 (AML12, C2C12)로 형질감염되었다. 세포는 용해되고 형질감염 후 24시간에서 수확되었다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 3은 본 발명의 번역가능 분자를 사용하여 생체내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 3은 24시간 및 48시간 시점에서 번역가능 분자528 및 534 (참조)에 대한 WT 마우스에서 AGL의 상대적인 발현을 도시한다. 분자는 담배 식각 바이러스 (TEV) 5' UTR 및 제노푸스 베타-글로빈 (XBG) 3' UTR을 포함한다. 분자는 전사 동안 캡핑되고 Nl-메틸슈도우리딘으로 합성되어, 100%의 우리딘이 Nl-메틸슈도우리딘으로 대체되었다. AGL을 인코딩하는 번역가능 분자는 지질 나노입자 형성으로 제조되었고 10 mg/kg으로 WT 마우스 안으로 정맥내로 주입되었다. 마우스 간은 24시간 및 48시간에서 수확되었고, 그리고 AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 4는 본 발명의 번역가능 분자를 사용하여 생체내에서 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL, NM_000028)를 발현한 결과를 도시한다. 도 4는 기준선 PBS (100)와 비교하여, 번역가능 분자 525, 527, 528, 529 및 546의 복용 후 WT 마우스에서 AGL의 상대적인 간 발현을 도시한다. AGL을 인코딩하는 합성된 번역가능 분자 525, 527, 528, 529 및 546은 지질 나노입자 형성으로 제조되었고 WT 마우스에 IP를 통해 주입되었다. 주입된 용량은 10 mpk이고, 추가 분석을 위해 6시간에 간을 수집하였다. AGL에 특이적인 항체 (ab133720, 토끼)를 사용하여 AGL을 검출하기 위해 정량적 웨스턴 블랏이 수행되었다.
도 5는 3개의 번역가능 분자: 546, 1783 및 1784로부터 인간 AGL을 발현한 결과를 도시한다. 인간 1차 간세포는 코돈-최적화된 mRNA로 형질감염되었고, AGL 단백질 발현은 형질 감염 후 6, 24, 48 및 72시간에서 In-Cell WesternTM에 의해 측정되었다. mRNA 서열의 발현을 미처리된 대조군 ("unt")과 비교되었다.
도 6은 야생형 C57BL/6 마우스에서 지질 나노입자로 제형화된 다양한 mRNA 분자로부터 인간 AGL의 발현을 도시한다. 간 생검 샘플로부터 균질물에서 mRNA 분자로부터 발현된 외인성 인간 AGL의 단백질 농도 (ng/mg)를 다중 반응 모니터링 분석에 의해 결정하였다. 그래프에 546.1, 736.1, 738.1, 737.1, 731.1 및 1783.1로 나타낸 번역가능 분자는 실시예 2에 기재된 바와 같이 각각 546, 736, 738, 737, 731 및 1783과 동일하다. 한편, 번역가능 분자 546.7은 실시예 2에 기술된 546과 동일한 핵염기 서열을 갖지만, 번역가능 분자 546을 합성하는 데 사용된 N1-메틸슈도우리딘 대신 우리딘의 위치에서 5-메톡시우리딘으로 합성되었다.
도 7은 지질 나노입자로 제형화된 다양한 mRNA 분자로 처리된 야생형 C57BL/6 마우스에서 내인성 마우스 AGL의 발현을 도시한다. 간 생검 샘플로부터 균질물에서 발현된 내인성 마우스 AGL의 단백질 농도 (ng / mg)를 다중 반응 모니터링 분석에 의해 결정하였다. 그래프에 546.1, 736.1, 738.1, 737.1, 731.1 및 1783.1로 나타낸 번역가능 분자는 실시예 2에 기재된 바와 같이 각각 546, 736, 738, 737, 731 및 1783과 동일하다. 한편, 번역가능 분자 546.7은 실시예 2에 기술된 546과 동일한 핵염기 서열을 갖지만, 번역가능 분자 546을 합성하는 데 사용된 N1-메틸슈도우리딘 대신 우리딘의 위치에서 5-메톡시우리딘으로 합성되었다.
도 8은 비히클 ("VEH")로 처리된 AGL 녹아웃 마우스로부터 간의 조직병리를 도시한다. 비히클로 처리된 간세포 내에서 간세포의 현저한 내지 심각한 공포형성과 글리코겐 축적에서의 중간 내지 현저한 증가가 관찰되었다.
도 9는 ATX2 지질 나노입자로 제형화된 번역가능 분자 546으로 처리된 AGL 녹아웃 마우스로부터 간의 조직병리를 도시한다. ATX2 지질 나노 입자로 제형화된 번역가능 분자 546으로 처리된 간세포 내에서 단지 간세포의 온화한 내지 중간정도의 공포형성과 간세포 내에서 글리코겐 축적에서의 단지 온화한 내지 중간정도의 증가가 관찰되었다.
본 발명은 치료적 적용에 사용되는 다양한 신규한 제제 및 조성물을 제공한다. 본 발명의 분자 및 조성물은 대상체에서 GSD III 및/또는 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 존재 또는 기능에 연관된 질환을 개선, 예방 또는 치료하는 데 사용될 수 있다.
일부 구현예에서, 본 발명은 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소를 발현하는 합성, 정제된, 번역가능 폴리뉴클레오타이드 분자를 포괄한다. 본 분자는 천연 및 화학적으로 변형된 뉴클레오타이드를 함유할 수 있고, AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 인코딩한다.
특정 구현예에서, 본 개시내용은 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 하나 이상의 UNA 단량체를 포함하는 합성, 정제된, 번역가능한 올리고머 분자를 포함한다. 번역가능한 올리고머는 하나 이상의 UNA 단량체뿐만 아니라 천연 및 화학적으로-변형된 뉴클레오타이드를 함유할 수 있다. 하나 이상의 UNA 단량체를 포함하는 번역가능한 올리고머는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 제공하도록 발현가능할 수 있다.
본 명세서에서 사용된 바와 같이, 용어 "번역가능한"은 용어 "발현가능한"과 교환가능하게 사용될 수 있고, 숙주세포에 의해 폴리뉴클레오타이드, 또는 이들의 부분이 폴리펩타이드로 전환되도록 하는 능력을 지칭한다. 당업계에서 이해되는 바와 같이, 번역은 세포의 세포질 내 리보솜이 폴리펩타이드를 생성하는 과정이다. 번역에서, 메신저 RNA (mRNA)는 특이적 아미노산 사슬, 또는 폴리펩타이드를 생성하기 위해 리보솜 복합체에서 tRNA에 의해 디코딩된다. 게다가, 올리고머와 관련하여 본 명세서에서 사용될 때 용어 "번역가능"은 올리고머의 적어도 일부분, 예를 들어, 올리고머 서열의 코딩 영역 (코딩 서열 또는 CDS로도 알려져 있음)이 단백질 또는 이의 단편으로 전환될 수 있다는 것을 의미한다.
본 명세서에서 사용된 바와 같이, 용어 "단량체"는 올리고머를 형성하도록 동일 또는 상이한 유형의 또 다른 분자와 연결될 수 있는 단일 단위, 예를 들어, 단일 핵산을 지칭한다. 일부 구현예에서, 단량체는 비잠금 핵산, 즉, UNA 단량체일 수 있다.
한편, 용어 "올리고머"는 "폴리뉴클레오타이드"와 교환가능하게 사용될 수 있고 적어도 2개의 단량체를 포함하는 분자를 지칭하고 올리고뉴클레오타이드 예컨대 DNA 및 RNA를 포함한다. RNA 단량체 및/또는 비잠금 핵산 (UNA) 단량체를 함유하는 올리고머의 경우, 본 발명의 올리고머는 코딩 서열 (CDS)에 부가하여 서열을 함유할 수 있다. 이들 추가의 서열은 미번역된 서열, 즉, 숙주세포에 의해 단백질로 전환되지 않은 서열일 수 있다. 이들 미번역된 서열은 5' cap, 5' 미번역된 영역 (5' UTR), 3' 미번역된 영역 (3' UTR), 및 꼬리 영역, 예를 들어, polyA 꼬리 영역을 포함할 수 있다. 본 명세서에서 더욱 상세하게 기재된 바와 같이, 임의의 이들 미번역된 서열은 하나 이상의 UNA 단량체를 함유할 수 있고 - 이들 UNA 단량체는 숙주세포의 기계장치에 의해 번역될 수 없다. 본 발명의 맥락에서, "번역가능한 올리고머", "번역가능 분자", "번역가능 폴리뉴클레오타이드", 또는 "번역가능 화합물"은 단백질 또는 이의 단편, 예를 들어, 인간 AGL 단백질 또는 이의 단편으로 전환될 수 있는 RNA의 영역, 예를 들어, 코딩 영역을 포함하는 서열 (예를 들어, 인간 AGL의 코딩 서열 또는 이들의 코돈-최적화된 버전)을 지칭한다.
본 명세서에서 사용된 바와 같이, 용어 "코돈-최적화된"은 단백질 발현 수준을 증가시키는 인코딩된 단백질 아미노산 서열을 변형함이 없이 상이한 코돈을 선택함에 의해 재설계된 천연 (또는 목적을 가지고 설계된 천연의 변이체) 코딩 서열을 의미한다 (Gustafsson et al., Codon bias and heterologous protein expression. 2004, Trends Biotechnol 22: 346-53). 변수 예컨대 높은 코돈 적응 지수 (CAI), LowU 방법, mRNA 이차 구조, 시스-조절 서열, GC 함량 및 많은 다른 유사한 변수가 단백질 발현 수준과 어느 정도 상호관련한다는 것이 밝혀졌다 (Villalobos et al., Gene Designer: a synthetic biology tool for constructing artificial DNA segments. 2006, BMC Bioinformatics 7:285). 높은 CAI (코돈 적응 지수) 방법은 전체 단백질 코딩 서열에 대해 가장 빈번하게 사용된 동의어 코돈을 선정한다. 각각의 아미노산에 대해 가장 빈번하게 사용된 코돈은 인간 게놈으로부터 74218 단백질-코딩 유전자로부터 추론된다. LowU 방법은 보다 적은 U 모이어티를 갖는 동의어 코돈으로 대체될 수 있는 U-함유 코돈만을 표적으로 한다. 대체에 대한 선택이 거의 없는 경우, 더 자주 사용된 코돈이 선택될 수 있다. 서열에서 나머지 코돈은 LowU 방법에 의해 변화되지 않는다. 이 방법은 5-메톡시우리딘으로 합성되어지는 코딩 서열을 디자인하기 위해 개시된 mRNA와 공조하여 사용될 수 있다.
본 개시내용으로 숙지된 숙련가에 의해 인정되는 바와 같이, 본 발명의 번역가능 분자는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재, 및/또는 기능으로부터 유래됨)과 연관된 임의의 질환 또는 장애를 개선시키고, 예방하고, 또는 치료하기 위해 사용될 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자는 GSD IIIa, GSD IIIb, GSDIIIc, 및 GSDIIId (집합적으로 또는 개별적으로 본 명세서에서 일명 "GSD III" 또는 "글리코겐 축적 질환 유형 III") 중 하나 이상을 개선시키고, 예방하고, 또는 치료하기 위한 방법에 사용될 수 있다. 본원에서 치료되는 질환 또는 장애 (예를 들어, GSD IIIa, GSD IIIb, GSDIIIc, 또는 GSDIIId)는 낮은 혈당 (저혈당증), 간의 확장 (간비대), 혈액에서 과도한 지방의 양 (고지혈증), 간 효소의 상승된 혈중 농도, 만성 간 질환 (간경변), 간부전, 느린 성장, 단간, 양성 종양 (샘종), 비대성 심근병증, 심장 기능이상, 울혈성 심장기능상실, 골격 근병증, 및/또는 불량한 근육 톤 (긴장저하)과 연관될 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자는 이들 상기 언급된 증상 중 어느 하나 또는 전부를 개선시키고, 예방하고, 또는 치료하기 위해 사용될 수 있다.
숙련가에 의해 이해되는 바와 같이, GSD III은 비제한적으로, AGL 결핍, 코리 질환, 코리병, 탈분포자 결핍, 포브스 질환, 글리코겐 탈분포자 결핍, GSD3, 또는 한계 덱스트린증 (사이토졸에서 한계 덱스트린-유사 구조에 기인함)을 포함하여, 당업계에서 임의의 수의 대체 명칭으로 언급될 수 있다. 따라서, GSD III은 명세서, 실시예, 도면 및 청구범위에서 이들 대체 명칭 중 임의의 것과 상호교환적으로 사용될 수 있다.
기능적 AGL 모이어티를 인코딩하는 본 발명의 번역가능 분자는 이를 필요로 하는 환자 (예를 들어, GSD III 환자)의 간, 특히 간세포로 전달될 수 있고, 환자의 활성 AGL 수준을 상승시킬 수 있다. 번역가능 분자는 환자에서 GSD III의 임의의 증상을 예방, 치료, 개선 또는 역전시키기 위해 사용될 수 있다.
추가 양태에서, 본 발명의 번역가능 분자는 또한 질환을 제어하기 위한 특정 식이에 대한 GSD III 환자의 의존성을 감소시키기 위해 사용될 수 있다. 예를 들어, 본 발명의 번역가능 분자는 단백질이 비정상적으로 높은 빈번한 탄수화물 식사 및/또는 식이에 대한 GSD III 환자의 의존성을 감소시키기 위해 사용될 수 있다.
본 발명의 구현예는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현하는 번역가능 분자를 제조하는 방법을 추가로 포함한다. 상기 방법은 천연 및 화학적으로-변형된 뉴클레오사이드 삼인산의 존재 하에 AGL DNA 주형을 시험관내에서 전사하여 생성물 혼합물을 형성하고, 생성물 혼합물을 정제하여 번역가능 분자를 단리하는 것을 포함한다. 번역가능 분자는 또한 당해 기술에 공지되어 있는 바와 같은 방법에 의해 제조될 수 있다.
본 발명의 분자는 RNA 및/또는 UNA 단량체를 함유하는 번역가능 분자일 수 있다. 이들 번역가능 분자는 특히 세포질에서 긴 반감기를 가질 수 있다. 장기간 번역가능 분자는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)과 관련된 질환 또는 장애를 개선, 예방 또는 치료하는 데 사용될 수 있다.
본 발명의 번역가능 분자의 특성은 그것의 분자 구조에 따라 발생하고, 전체적으로 분자의 구조는, 이들 특성에 기초한 상당한 이점을 전체적으로 제공할 수 있다. 본 발명의 구현예는 유익하게는 향상된 단백질 농도 또는 증가된 단백질 활성을 제공하는 하나 이상의 특성을 갖는 번역가능 분자를 제공할 수 있다. 본 발명의 분자 및 조성물은 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)과 관련된 임의의 질환 또는 장애를 개선, 예방 또는 치료하는 치료제를 포함하는 제형을 제공할 수 있다.
본 발명은 시험관내, 생체외, 및 생체내에서 활성 폴리펩타이드 또는 단백질을 제공하기 위해 놀랍게도 번역가능한 다양한 번역가능 분자를 제공한다.
본 발명의 번역가능 분자는 하나 이상의 활성 폴리펩타이드 또는 단백질, 또는 이의 단편을 제공하도록 발현가능하다.
번역가능 구조 및 조성물은 증가된 번역 활성 또는 세포질 반감기를 가질 수 있다. 이들 구현예에서, 번역가능 구조 및 조성물은 천연 mRNA와 비교할 때 포유동물 세포의 세포질에서 증가된 기능적 반감기를 제공할 수 있다.
본 명세서에서 사용된 바와 같이, 용어 "반감기"는 핵산 또는 단백질 농도 또는 활성과 같은 양이 기간의 시작에서 측정될 때의 그 값의 절반으로 떨어지기 위해 필요한 시간이다.
하나 이상의 UNA 단량체를 함유하는 올리고머를 포함하여, 본 발명의 번역가능 분자에 대한 다양한 구조가 본 명세서에 제공되어 있다. 하나 이상의 UNA 단량체를 함유하는 올리고머는 특화된 링커 그룹을 포함할 수 있다. 링커 그룹은 번역가능 분자에서의 사슬에 부착될 수 있다. 각각의 링커 그룹은 또한 핵염기에 부착될 수 있다.
일부 양태에서, 링커 그룹은 단량체일 수 있다. 단량체는 사슬 분자를 형성하도록 부착될 수 있다. 본 발명의 사슬 분자에서, 링커 그룹 단량체는 사슬 내 임의의 지점에 부착될 수 있다.
특정 양태에서, 링커 그룹 단량체는 링커 그룹 단량체가 사슬의 단부 근처 또는 사슬 내 임의의 위치에 있도록 본 발명의 사슬 분자 내에 부착될 수 있다.
추가 양태에서, 사슬 분자의 링커 그룹 각각은 핵염기에 부착될 수 있다. 사슬 분자 내 핵염기의 존재는 사슬 분자 내 핵염기의 서열을 제공할 수 있다.
특정 구현예에서, 본 발명은 특정 천연 뉴클레오타이드, 또는 비-천연 뉴클레오타이드, 또는 변형된 뉴클레오타이드, 또는 화학적으로 변형된 뉴클레오타이드와 함께, 링커 그룹 단량체의 신규한 조합을 포함하는 사슬 구조를 갖는 번역가능한 올리고머 분자를 제공한다.
본 발명의 올리고머 분자는 핵염기의 서열을 나타낼 수 있고, 시험관내, 생체외, 또는 생체내에서 폴리펩타이드 또는 단백질을 발현하도록 설계될 수 있다. 발현된 폴리펩타이드 또는 단백질은 천연, 천연 또는 야생형 mRNA로부터 발현된 단백질에 상응하는 활성, 또는 음성 또는 우세한 음성 단백질에 상응하는 활성을 포함하여, 다양한 형태의 활성을 가질 수 있다.
일부 양태에서, 본 발명은 적어도 세포의 천연 핵산 분자의 단편과 동일한 염기 서열을 갖는, 활성인 번역가능한 올리고머 분자를 제공할 수 있다.
일부 구현예에서, 세포는 진핵 세포, 포유동물 세포, 또는 인간 세포일 수 있다.
본 발명은 링커 그룹 단량체를 포함하는 번역가능한 올리고머성 제제에 대한 구조, 방법 및 조성물을 제공한다. 본 발명의 올리고머성 분자는 치료제용 제형에서 활성제로서 사용될 수 있다.
본 발명은 대상체 내 세포에서 폴리펩타이드 또는 단백질로 발현되는 그것의 능력때문에 치료적 효과를 제공하는 데 유용한 다양한 번역가능 분자를 제공한다.
특정 구현예에서, 번역가능 분자는 단량체를 포함한 올리고머로 구조화될 수 있다. 본 발명의 올리고머성 구조는 특정 뉴클레오타이드와 함께 하나 이상의 링커 그룹 단량체를 함유할 수 있다.
특정 구현예에서, 번역가능 분자는 핵염기의 서열을 함유할 수 있고, 부분적으로, 천연 폴리뉴클레오타이드 서열과 충분한 상동성을 가짐에 의해, 임의의 동형체의 펩타이드 또는 단백질을 발현하도록 설계될 수 있다.
일부 구현예에서, 번역가능 분자는 길이가 약 200 내지 약 12,000 단량체, 또는 그 초과일 수 있다. 특정 구현예에서, 번역가능 분자는 길이가 1,000 내지 9,000 단량체, 3,000 내지 7,000 단량체, 또는 4,000 내지 6,000 단량체일 수 있다. 예시적인 구현예에서, 번역가능 분자는 길이가 4,500 내지 5,500 단량체이다. 추가 예시적인 구현예에서, 번역가능 분자는 길이가 약 5,000 단량체이다.
일부 구현예에서, 번역가능 분자는 1 내지 약 800 UNA 단량체를 함유할 수 있다. 특정 구현예에서, 번역가능 분자는 1 내지 600 UNA 단량체, 또는 1 내지 100 UNA 단량체, 또는 1 내지 12 UNA 단량체를 함유할 수 있다.
일부 구현예에서, 번역가능 분자는 1 내지 약 800 잠금 핵산 (LNA) 단량체를 함유할 수 있다. 특정 구현예에서, 번역가능 분자는 1 내지 600 LNA 단량체, 또는 1 내지 100 LNA 단량체, 또는 1 내지 12 LNA 단량체를 함유할 수 있다.
본 발명의 번역가능 분자는 5' cap, 단량체의 5' 미번역된 영역, 단량체의 코딩 영역, 단량체의 3' 미번역된 영역, 및 단량체의 꼬리 영역을 포함할 수 있다.
본 발명의 번역가능 분자는 하나 이상의 UNA 단량체를 포함하는 단량체의 3' 미번역된 영역을 포함할 수 있다.
본 발명의 번역가능 분자는 하나 이상의 UNA 단량체를 포함하는 단량체의 꼬리 영역을 포함할 수 있다.
본 발명의 번역가능 분자는 세포에서 번역을 위해 동작가능하거나, 또는, 예를 들어, 5' cap, 5' 미번역된 영역, 코딩 영역, 3' 미번역된 영역, 및 polyA 꼬리를 포함하여 mRNA의 영역의 기능성을 갖는 서열 또는 구조의 영역을 포함할 수 있다.
본 발명은 세포에 하나 이상의 번역가능 분자를 포함하는 하나 이상의 벡터를 전달하는 방법을 추가로 고려한다. 추가 구현예에서, 본 발명은 또한 세포에 전달하거나 또는 하나 이상의 번역가능 분자를 고려한다.
일부 구현예에서, 하나 이상의 번역가능 분자는 시험관내, 생체외, 또는 생체내에서 세포에 전달될 수 있다. 포유동물 세포에 번역가능 분자를 도입하기 위해 당해 기술에 공지되어 있는 바와 같은 바이러스 및 비-바이러스 전달 방법이 사용될 수 있다. 번역가능 분자는 약제학적으로 허용가능한 비히클, 또는 예를 들어, 나노입자 또는 리포좀으로 전달될 수 있다.
일부 구현예에서, 본 발명의 번역가능 구조 및 조성물은 천연 조성물을 이용하는 것에 비교할 때 배양에서 세포-운명 조작에 필요한 형질감염의 횟수 및 빈도를 감소시킬 수 있다.
추가 양태에서, 본 발명은 천연 mRNA를 이용하는 것과 비교할 때 활성제로서 번역가능 분자에 대한 증가된 활성을 제공한다.
일부 양태에서, 본 발명은 천연 핵산, 폴리펩타이드 또는 단백질에 의해 유도된 것과 비교하여 세포의 선천성 면역 반응을 감소시킬 수 있는 번역가능 분자를 제공할 수 있다.
본 발명은 천연 분자에 비교하여 탈아데닐화에 대해 불응성인 합성 번역가능 분자를 제공할 수 있다.
특정 구현예에서, 본 발명은 천연 분자에 비교하여 증가된 특이 활성 및 더 긴 기능적 반감기를 갖는 합성 번역가능 분자를 제공할 수 있다. 본 발명의 합성 번역가능 분자는 이소성 단백질 발현의 증가된 수준을 제공할 수 있다. 벡터를 사용하여 번역가능 분자를 발현할 때, 세포-전달은 증가된 수준일 수 있고, 세포 독성 선천성 면역 반응이 억제되어 더 높은 수준의 이소성 단백질 발현이 달성될 수 있도록 변형될 수 있다. 본 발명의 번역가능 분자는 천연 mRNA보다 증가된 특이적 활성 및 더 긴 기능적 반감기를 가질 수 있다.
특정 양태에서, 번역가능 분자는 천연 mRNA에 비하여 수많은 돌연변이를 가질 수 있다.
추가 구현예에서, 본 발명은 절단가능 전달 및 3' 말단 및/또는 5' 말단에 부착된 표적화 모이어티를 갖는 번역가능 분자를 제공할 수 있다.
일반적으로, 형질감염에 의해 전달된 합성 번역가능 분자에 대한 특이 활성은 단위 시간당 전달된 전사체당 발현된 단백질 분자의 수로 관찰될 수 있다.
본 명세서에서 사용된 바와 같이, 번역 효율은 시험관내 또는 생체내에서 번역가능 분자의 번역에 의한 단백질 또는 폴리펩타이드의 생산의 척도를 지칭한다.
본 발명은 하나 이상의 UNA 단량체, 및 수많은 핵산 단량체를 함유할 수 있는 다양한 번역가능한 올리고머 분자를 제공하고, 여기서 상기 번역가능 분자는 폴리펩타이드 또는 단백질을 제공하도록 발현가능할 수 있다.
일부 구현예에서, 본 발명은 하나 이상의 미번역된 영역에 하나 이상의 UNA 단량체, 및 수많은 핵산 단량체를 함유할 수 있는 다양한 번역가능한 올리고머 분자를 포함하고, 여기서 상기 번역가능 분자는 폴리펩타이드 또는 단백질을 제공하도록 발현가능할 수 있다.
일부 구현예에서, 본 발명은 꼬리 영역에 하나 이상의 UNA 단량체, 및 수많은 핵산 단량체를 함유하는 다양한 번역가능한 올리고머 분자를 포함하고, 여기서 상기 번역가능 분자는 폴리펩타이드 또는 단백질을 제공하도록 발현가능할 수 있다.
일부 구현예에서, 번역가능 분자는 변형된 5' cap을 함유할 수 있다.
추가 구현예에서, 번역가능 분자는 단량체의 번역 향상시키는 5' 미번역된 영역을 함유할 수 있다.
추가 구현예에서, 번역가능 분자는 단량체의 번역 향상시키는 3' 미번역된 영역을 함유할 수 있다.
추가 구현예에서, 번역가능 분자는 단량체의3' 미번역된 영역에 하나 이상의 UNA 단량체를 함유할 수 있다.
추가 구현예에서, 번역가능 분자는 단량체의 꼬리 영역에 하나 이상의 UNA 단량체를 함유할 수 있다.
추가 구현예에서, 번역가능 분자는 polyA 꼬리에 하나 이상의 UNA 단량체를 함유할 수 있다.
일부 구현예에서, 번역가능 분자는 단량체의 3' 미번역된 영역에 또는 단량체의 꼬리 영역, 예를 들어, polyA 꼬리에 하나 이상의 LNA 단량체를 함유할 수 있다.
또 다른 양태에서, 본 발명의 번역가능 분자는 동일한 번역 생성물을 인코딩하는 천연 mRNA와 비교하여 생체내에서 적어도 2-배, 3-배, 5-배, 또는 10-배수 증가된 번역 효율을 나타낼 수 있다.
추가 양태에서, 번역가능 분자는 동일한 폴리펩타이드 또는 단백질을 인코딩하는 천연 mRNA와 비교하여 생체내에서 적어도 2-배, 3-배, 5-배, 또는 10-배수 증가된 폴리펩타이드 또는 단백질 수준을 생산할 수 있다.
특정 구현예에서, 번역가능 분자는 동일한 폴리펩타이드 또는 단백질을 인코딩하는 천연 mRNA와 비교하여 생체내에서 증가된 수준의 폴리펩타이드 또는 단백질을 제공할 수 있다. 예를 들어, 폴리펩타이드 또는 단백질의 수준은 10%, 또는 20%, 또는 30%, 또는 40%, 또는 50%, 또는 그 초과로 증가될 수 있다.
추가 구현예에서, 본 발명은 본 발명의 번역가능 분자를 함유하는 조성물을 대상체에게 투여함에 의해 대상체에서 질환 또는 병태를 치료하는 방법을 제공한다.
본 발명의 번역가능 분자는 질환 또는 장애, 예를 들어, 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)과 관련된 질환 또는 장애를 개선, 예방 또는 치료하는 데 사용될 수 있다. 이들 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물은 대상체에서 AGL 효소의 농도 또는 유효성을 제어, 조절 또는 증가시키기 위해 투여될 수 있다. 일부 양태에서, 효소는 환자가 비정상 양을 갖는 (예를 들어, AGL 활성을 부분적으로 또는 전적으로 폐기하는 AGL의 돌연변이된 버전을 갖는 환자) 비변형된, 천연 효소일 수 있다. 일부 양태에서, 효소는 AGL의 돌연변이된 버전을 갖는 환자를 치료하기 위해 사용될 수 있는 비변형된, 천연 AGL 효소일 수 있다. 예시적인 구현예에서, 본 발명의 번역가능 분자는 GSD III을 개선, 예방 또는 치료하는 데 사용될 수 있다.
일부 구현예에서, 번역가능 분자는 세포 또는 대상체에서 AGL 수준을 증가시키기 위해 세포 또는 대상체에 전달될 수 있고, 번역될 수 있다.
본 명세서에서 사용된 바와 같이, 용어 "대상체"는 인간 또는 임의의 비-인간 동물 (예를 들어, 마우스, 랫트, 토끼, 개, 고양이, 소, 돼지, 양, 말 또는 영장류)을 지칭한다. 인간은 전- 및 후-태생의 형태를 포함한다. 많은 구현예에서, 대상체는 인간이다. 대상체는 환자일 수 있으며, 이는 질환의 진단 또는 치료를 위해 의료 제공자에게 제시하는 인간을 지칭한다. 용어 "대상체"는 본 명세서에 "개체" 또는 "환자"와 상호 교환가능하게 사용된다. 대상체는 질환 또는 장애에 걸리거나 그에 걸리기 쉽지만 질환 또는 장애의 증상을 나타내거나 나타내지 않을 수 있다.
예시적인 구현예에서, 본 발명의 대상체는 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성 (예를 들어, 감소된 농도, 존재 및/또는 기능으로부터 유래됨)을 갖는 대상체이다. 추가 예시적인 구현예에서, 상기 대상체는 인간이다.
일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료된 대상체에서 증가된 간 AGL 단백질 수준을 초래할 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료 이전의 대상체에서의 기준선 AGL 단백질 수준에 비하여 간 AGL 단백질 수준에서 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95% 증가율을 초래한다. 예시적인 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료 이전의 대상체에서의 기준선 간 AGL 수준에 비하여 간 AGL 수준에서 증가를 초래한다. 일부 구현예에서, 간 AGL 수준에서의 증가는 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 100%, 200%, 또는 그 초과일 수 있다.
일부 구현예에서, 본 발명의 번역가능 분자로부터 발현되는 AGL 단백질은 간, 혈청, 혈장, 신장, 심장, 근육, 뇌, 뇌척수액, 또는 림프절에서 검출가능하다. 예시적인 구현예에서, AGL 단백질은 간 세포, 예를 들어, 치료된 대상체의 간세포에서 발현된다.
일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료된 대상체의 간에서 약 10 ng/mg, 약 20 ng/mg, 약 50 ng/mg, 약 100 ng/mg, 약 150 ng/mg, 약 200 ng/mg, 약 250 ng/mg, 약 300 ng/mg, 약 350 ng/mg, 약 400 ng/mg, 약 450 ng/mg, 약 500 ng/mg, 약 600 ng/mg, 약 700 ng/mg, 약 800 ng/mg, 약 900 ng/mg, 약 1000 ng/mg, 약 1200 ng/mg 또는 약 1500 ng/mg의 총 단백질 또는 그 이상으로 천연, 비-돌연변이된 인간 AGL (즉, 비정상 또는 돌연변이된 AGL과 대조적으로 정상 또는 야생형 AGL) 단백질 수준의 발현을 초래한다.
본 명세서에서 사용된 바와 같이, 하나 이상의 관심 있는 값에 적용될 때 용어 "약" 또는 "대략"은 언급된 기준값에 유사한 값을 지칭한다. 특정 구현예에서, 용어 "대략" 또는 "약"은 달리 언급되지 않는 한 또는 달리 문맥으로부터 분명하지 않는 한 언급된 기준값의 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 그 미만 내로 어느 하나의 방향 (초과 또는 미만)으로 되는 다양한 값을 지칭한다(그러한 수가 가능한 값의 100%를 초과하는 경우 제외).
일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 6, 12, 18, 24, 30, 36, 48, 60, 및/또는 72 시간에서 검출가능하다. 일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 1 일, 2 일, 3 일, 4 일, 5 일, 6 일, 및/또는 7 일에서 검출가능하다. 일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 투여 후 1 주, 2 주, 3 주, 및/또는 4 주에서 검출가능하다. 일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 검출가능하다.일부 구현예에서, 천연, 비-돌연변이된 인간 AGL 단백질의 발현은 본 발명의 번역가능 분자를 포함하는 조성물의 투여 후 간, 예를 들어, 간세포에서 검출가능하다.
번역가능 분자를 제조하기 위한 변이체 템플레이트
본 명세서에 기재된 다양한 구현예에서, 번역가능한 올리고머는 AGL을 인코딩하는 mRNA를 포함할 수 있고, 여기서 상기 AGL을 인코딩하는 mRNA는 코돈-최적화된다. 일부 구현예에서, AGL은 인간 AGL (즉, hAGL)이다. 일부 구현예에서, 인간 AGL은 서열번호 2의 아미노산 서열을 포함한다. 일부 구현예에서, 인간 AGL은 서열번호 2의 아미노산 서열로 구성된다.
일부 구현예에서, 변이체 DNA 템플레이트는 AGL을 인코딩할 수 있는 번역가능 분자를 제작하기 위해 이용될 수 있다. 본 개시내용의 변이체 DNA 템플레이트는 번역가능 분자를 제작하는 과정과 번역가능 분자의 효율에서 이점을 나타낼 수 있다. 본 발명의 번역가능 분자에 변형된 뉴클레오타이드 또는 단량체의 편입을 증진시키기 위해 템플레이트의 변동이 이용될 수 있다. 특정 양태에서, 번역가능 분자의 구조 특징을 증진시키기 위해 템플레이트의 변동이 이용될 수 있다. 번역가능 분자의 향상된 구조 특징은 폴리펩타이드 또는 단백질 생성물을 제공하기 위한 번역 효율을 포함하여, 예상외로 유리한 특성을 제공할 수 있다.
본 발명의 일부 양태에서, 템플레이트의 변동은 템플레이트 가닥에서 특정 뉴클레오타이드의 발생 또는 발현의 빈도를 감소시키는 것을 포함할 수 있다. 특정 뉴클레오타이드의 발생을 감소시키는 것은 AGL을 인코딩하는 번역가능 RNA 생성물의 놀랍게도 개선된 특성을 달성하는, 비-자연 형태를 제공하기 위해 본 개시내용의 구조 및 방법을 변경할 수 있다.
본 발명의 양태는 번역가능 분자를 제작하는 방법에서 변이체 DNA 템플레이트를 요할 수 있다. DNA 분자는 AGL을 인코딩하는 표적 번역가능 분자를 제공하기 위해 전사될 수 있는 뉴클레오타이드의 비-코딩 템플레이트 가닥을 가질 수 있다.
표적 번역가능 분자는 천연 또는 변형된, 합성이거나 또는 천연 공급원으로부터 유래되든 간에 임의의 RNA일 수 있다.
일부 구현예에서, 코돈 배정을 보전하면서 템플레이트 가닥의 열린 해독틀이 대안적인 형태로 전환된 변이체 DNA 템플레이트가 사용될 수 있다.
특정 구현예에서, 대안적인 뉴클레오타이드가 대안적인 코돈 최적화 및/또는 서열 축퇴에 기반하여 사용된 DNA 템플레이트가 사용될 수 있다.
추가 구현예에서, DNA 템플레이트는 코돈 배정을 보전하면서 대안적인 뉴클레오타이드로 대체된 특정 뉴클레오타이드를 가질 수 있다.
본 발명의 구현예는 유익하게는 AGL을 인코딩하는 번역가능 분자를 제작하는 방법에서 사용된 본 발명의 DNA 템플레이트에 대안적인 코돈을 이용한다. 본 발명의 DNA 템플레이트에서 달성될 수 있는 변동은 많은 과정에서 바람직한 코돈을 요할 수 있는, 세포 및 유기체에 대한 것보다 범위가 휠씬 더 클 수 있다. 본 발명에서, 광범위한 대안적인 코돈 및 위치가 번역가능 분자를 전사하기 위해 DNA 템플레이트에서 사용될 수 있다.
본 발명의 추가 양태에서, 템플레이트의 변동은 템플레이트 가닥에서 특정 뉴클레오타이드의 발생 또는 발현의 빈도를 감소시키는 것을 포함할 수 있다. 예를 들어, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 25% 아래의 수준으로 감소될 수 있다. 추가 예에서, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 20% 아래의 수준으로 감소될 수 있다. 일부 예에서, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 16% 아래의 수준으로 감소될 수 있다. 특정 예에서, 템플레이트에서 뉴클레오타이드의 발생은 템플레이트에서 뉴클레오타이드의 12% 아래의 수준으로 감소될 수 있다.
인간 AGL
인간 AGL 유전자는 대략 174.8 kDa의 분자량을 갖는 1532 아미노산 단백질을 인코딩한다. AGL은 글리코겐 열화에서 1,4-알파-D-글루칸:1,4-알파-D-글루칸-4-알파-D-글리코실전달효소 및 아밀로-1,6-글루코시다제로 작용하는 다작용성 효소이다. 전술한 바와 같이, 정상 AGL 활성의 유전적 결핍은 글리코겐 축적 질환 III을 야기한다.
공통 인간 AGL 코딩 서열은 서열번호 1에 도시된 4,599 핵염기의 RNA 서열을 갖는다.
공통 인간 AGL 코딩 서열 ?? NCBI 수탁 번호 NP_000019.2에서 발견됨 ?? 은 서열번호 2로 번역된다.
일부 구현예에서, hAGL의 천연 mRNA와 비교하여 유익하게 상승된 번역의 효능을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (hAGL)를 발현하기 위해 번역가능 분자가 제작되고 사용될 수 있다. hAGL을 발현하는 번역가능 분자는 질환을 개선, 예방 또는 치료하는 방법에 사용하기에 적합한 활성을 나타낼 수 있다. 일부 구현예에서, 번역가능 분자는 하나 이상의 UNA 단량체를 포함할 수 있다.
일부 구현예에서, 번역가능 분자는 5' cap, 5' UTR, 번역 개시 서열, 예를 들어, 코작 서열, 인간 AGL CDS, 3'UTR, 및/또는 꼬리 영역을 포함할 수 있다. 예시적인 구현예에서, 번역가능 분자는 5' cap (m7GpppGm), 담배 식각 바이러스 (TEV)의 5' UTR, 코작 서열, 인간 AGL CDS, 제노푸스 베타-글로빈의 3' UTR, 및 꼬리 영역을 포함할 수 있다. 추가의 예시적인 구현예에서, 인간 AGL CDS는 아래에 더욱 상세하게 기재된 서열번호 7-32 또는 서열번호 41-45의 코돈-최적화된 서열을 포함할 수 있다. 본 명세서에 기재된 이들 및 다른 구현예 중 어느 하나에서, 번역가능 분자는 하나 이상의 UNA 단량체를 포함할 수 있다. 본 명세서에 기재된 이들 및 다른 구현예 중 어느 하나에서, 번역가능 분자는 하나 이상의 LNA 단량체를 포함할 수 있다.
분자의 번역 효율은 AGL의 천연 mRNA와 비교하여 증가될 수 있다. 특히, 48 시간 후, 분자의 번역 효율은 AGL의 천연 mRNA와 비교하여 2배 이상으로 될 수 있다.
일부 구현예에서, 본 발명에 대해 적합한 mRNA 서열은 인간 AGL 단백질을 인코딩하는 mRNA 서열을 포함한다. 자연 발생 인간 AGL 단백질의 서열은 서열번호 2에 도시되어 있다.
일부 구현예에서, 적합한 mRNA 서열은 인간 AGL의 동족체 또는 변이체를 인코딩하는 mRNA 서열일 수 있다. 본 명세서에서 사용된 바와 같이, 인간 AGL 단백질의 동족체 또는 변이체는 실질적인 AGL 단백질 활성을 보유하면서 야생형 또는 자연 발생 인간 AGL 단백질에 비교하여 하나 이상의 아미노산 치환, 결실, 및/또는 삽입을 함유하는 변형된 인간 AGL 단백질일 수 있다. 일부 구현예에서, 본 발명에 적합한 mRNA는 인간 AGL 단백질에 실질적으로 동일한 단백질을 인코딩한다. 일부 구현예에서, 본 발명에 적합한 mRNA는 서열번호 2에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 아미노산 서열을 인코딩한다. 일부 구현예에서, 본 발명에 적합한 mRNA는 인간 AGL 단백질의 단편 또는 부분을 인코딩한다.
일부 구현예에서, 본 발명에 적합한 mRNA는 인간 AGL 단백질의 단편 또는 부분을 인코딩하고, 여기서 상기 단백질의 단편 또는 부분은 야생형 단백질의 것에 유사한 AGL 활성을 여전히 유지한다.
일부 구현예에서, 본 발명에 적합한 mRNA는 서열번호 7-32 또는 서열번호 41-45에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 서열을 포함한다.
일부 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 7-32 또는 서열번호 41-45에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 코딩 서열을 포함한다. 일부 구현예에서, 서열번호 7-32 또는 서열번호 41-45에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 코딩 서열을 포함하는 번역가능한 올리고머성 분자는 5' cap, 5' UTR, 번역 개시 서열, 3' UTR, 및 꼬리 영역으로부터 선택된 하나 이상의 서열을 더 포함한다.
일부 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현한다. 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현한다. 또 다른 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현하고, 여기서 상기 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일하다. 또 다른 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현하고, 여기서 상기 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열에 적어도 95% 동일하다. 또 다른 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 코딩 서열을 포함하고 기능적 인간 AGL 단백질을 발현하고, 여기서 상기 코딩 서열은 서열번호 19, 서열번호 31, 또는 서열번호 45로부터 선택된 서열에 적어도 95% 동일하다. 따라서, 일부 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하거나 이로 구성된 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열에 적어도80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일하다. 예시적인 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하거나 이로 구성된 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 19, 서열번호 31, 또는 서열번호 45로부터 선택된 서열에 적어도 95% 동일하다. 특정 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 19에 적어도 95% 동일하다. 또 다른 특정 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 31에 적어도 95% 동일하다. 또 다른 특정 구현예에서, 본원은 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열에 80% 미만으로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드를 제공하고, 그리고 여기서 상기 인간 AGL 코딩 서열은 서열번호 45에 적어도 95% 동일하다.
일부 구현예에서, 본 발명의 번역가능한 올리고머성 분자는 또 다른 서열에 융합된(예를 들어, N 또는 C 말단 융합) AGL 단백질의 전장, 단편 또는 일부분을 포함하는 융합 단백질을 인코딩한다. 일부 구현예에서, N 또는 C 말단 서열은 신호 서열 또는 세포 표적화 서열이다.
UNA 단량체 및 올리고머
일부 구현예에서, 링커 그룹 단량체는 아래에서 나타낸 바와 같이 프로판-1,2,3-tri-일-트리스옥시 구조에 기초한 작은 유기 분자인 잠기지 않은 핵단량체 (UNA 단량체)일 수 있다:
여기서 R1 및 R2는 H이고, 그리고 R1 및 R2는 포스포디에스테르 결합일 수 있고, 염기는 핵염기일 수 있고, 그리고 R3은 아래에 기재된 작용기이다.
또 다른 관점에서, UNA 단량체 주요 원자는 아래와 같이 IUPAC 표기법으로 도시될 수 있다:
여기서 올리고머 사슬의 진행 방향은 프로판 잔기의 1-말단으로부터 3-말단으로 된다.
핵염기의 예는 우라실, 티민, 시토신, 5-메틸시토신, 아데닌, 구아닌, 이노신, 및 천연 및 비-천연 핵염기 유사체를 포함한다.
핵염기의 예는 슈도우라실, 1-메틸슈도우라실 (m1Ψ), 즉, N1-메틸슈도우라실, 및 5-메톡시우라실을 포함한다.
일반적으로, 뉴클레오타이드가 아닌 UNA 단량체는 올리고머에서 내부 링커 단량체일 수 있다. 올리고머에서 내부 UNA 단량체는 양면 상에서 다른 단량체에 의해 측접된다.
UNA 단량체는 올리고머가 예를 들어 복합체 또는 듀플렉스를 형성하고, 복합체 또는 듀플렉스에 핵염기를 갖는 다른 단량체가 있는 경우 염기 짝짓기에 참여할 수 있다.
R3이 -OH인, 프로판-1-일 위치 및 프로판-3-일 위치 둘 모두에서 측접된 내부 단량체와 같은 UNA 단량체의 예는 아래에 도시되어 있다.
UNA 단량체는 올리고머의 말단 단량체일 수 있고, 여기서 UNA 단량체는 프로판-1-일 위치 또는 프로판-3-일 위치 중 어느 하나에서 단 하나의 단량체에 부착된다. 뉴클레오타이드와 달리, UNA 단량체는 가요성 유기 구조이기 때문에, 말단 UNA 단량체는 올리고머에 대해 가요성 종결자일 수 있다.
프로판-3-일 위치에서 부착된 말단 단량체와 같은 UNA 단량체의 예는 아래에 도시되어 있다.
UNA 단량체는 가요성 분자일 수 있기 때문에, 말단 단량체와 같은 UNA 단량체는 매우 상이한 형태를 취할 수 있다. 프로판-3-일 위치에 부착된 말단 단량체와 같은 에너지 최소화된 UNA 단량체 형태의 예는 아래에 도시되어 있다.
다른 것들 중에서, UNA 단량체의 구조는 자연 발생 뉴클레오타이드에 부착되도록 한다.
UNA 올리고머는 UNA 단량체뿐만 아니라 자연 발생 뉴클레오사이드에 기초할 수 있는 다양한 뉴클레오타이드를 포함한 사슬일 수 있다.
일부 구현예에서, UNA 단량체의 작용기 R3은 -OR4, -SR4, -NR4 2, -NH(C=O)R4, 모폴리노, 모폴린-1-일, 피페라진-1-일, 또는 4-알카노일-피페라진-1-일일 수 있고, 여기서 R4는 각 경우에 대해 동일 또는 상이할 수 있고, 그리고 H, 알킬, 콜레스테롤, 지질 분자, 폴리아민, 아미노산, 또는 폴리펩타이드일 수 있다.
UNA 단량체는 유기 분자이다. UNA 단량체는 핵산 단량체 또는 뉴클레오타이드가 아니거나, 또는 이들은 자연 발생 뉴클레오사이드 또는 변형된 자연 발생 뉴클레오사이드가 아니다.
본 발명의 UNA 올리고머는 합성 사슬 분자이다.
본 명세서에 사용될 수 있는 지정은 mA, mG, mC, 및 mU를 포함하고, 이것은 2'-O-메틸 변형된 리보뉴클레오타이드를 지칭한다.
본 명세서에 사용될 수 있는 지정은 dT를 포함하고, 이것은 2'-데옥시 T 뉴클레오타이드를 지칭한다.
본 명세서에서 사용된 바와 같이, 올리고머 서열의 맥락에서, 기호 N은 임의의 천연 뉴클레오타이드 단량체, 또는 임의의 변형된 뉴클레오타이드 단량체를 나타낼 수 있다.
본 명세서에서 사용된 바와 같이, 올리고머 서열의 맥락에서, 기호 Q는 비-천연, 변형된, 또는 화학적으로-변형된 뉴클레오타이드 단량체를 나타낸다.
본 명세서에서 사용된 바와 같이, 올리고머 서열의 맥락에서, 기호 X는 UNA 단량체를 나타내기 위해 사용될 수 있다.
변형된 및 화학적으로-변형된 뉴클레오타이드
본 명세서에서 변형된 또는 화학적으로-변형된 뉴클레오타이드의 예에 있어서, 알킬, 사이클로알킬, 또는 페닐 치환체는 비치환될 수 있거나, 또는 하나 이상의 알킬, 할로, 할로알킬, 아미노, 또는 니트로 치환체로 추가로 치환될 수 있다.
핵산 단량체의 예는 당업계에서 알려진 임의의 이러한 뉴클레오타이드를 포함하여, 비-천연, 변형된, 및 화학적으로-변형된 뉴클레오타이드를 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시시티딘, 5-알킬시티딘, 5-하이드록시알킬시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-알콕시시티딘, 5-알키닐시티딘, 5-할로시티딘, 2-티오시티딘, N4-알킬시티딘, N4-아미노시티딘, N4-아세틸시티딘, 및 N4,N4-디알킬시티딘을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시시티딘, 5-메틸시티딘, 5-하이드록시메틸시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-메톡시시티딘, 5-프로피닐시티딘, 5-브로모시티딘, 5-아이오도시티딘, 2-티오시티딘; N4-메틸시티딘, N4-아미노시티딘, N4-아세틸시티딘, 및 N4,N4-디메틸시티딘을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시우리딘, 5-알킬우리딘, 5-하이드록시알킬우리딘, 5-카복시우리딘, 5-카복시알킬에스테르우리딘, 5-포르밀우리딘, 5-알콕시우리딘, 5-알키닐우리딘, 5-할로우리딘, 2-티오우리딘, 및 6-알킬우리딘을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-하이드록시우리딘, 5-메틸우리딘, 5-하이드록시메틸우리딘, 5-카복시우리딘, 5-카복시메틸에스테르우리딘, 5-포르밀우리딘, 5-메톡시우리딘, 5-프로피닐우리딘, 5-브로모우리딘, 5-플루오로우리딘, 5-아이오도우리딘, 2-티오우리딘, 및 6-메틸우리딘을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 5-메톡시카보닐메틸-2-티오우리딘, 5-메틸아미노메틸-2-티오우리딘, 5-카바모일메틸우리딘, 5-카바모일메틸-2'-O-메틸우리딘, 1-메틸-3-(3-아미노-3-카복시프로피)슈도우리딘, 5-메틸아미노메틸-2-셀레노우리딘, 5-카복시메틸우리딘, 5-메틸디하이드로우리딘, 5-타우리노메틸우리딘, 5-타우리노메틸-2-티오우리딘, 5-(이소펜테닐아미노메틸)우리딘, 2'-O-메틸슈도우리딘, 2-티오-2'O-메틸우리딘, 및 3,2'-O-디메틸우리딘을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 N6-메틸아데노신, 2-아미노아데노신, 3-메틸아데노신, 8-아자아데노신, 7-데아자아데노신, 8-옥소아데노신, 8-브로모아데노신, 2-메틸티오-N6-메틸아데노신, N6-이소펜테닐아데노신, 2-메틸티오-N6-이소펜테닐아데노신, N6-(시스-하이드록시이소펜테닐)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜테닐)아데노신, N6-글라이시닐카바모일아데노신, N6-트레오닐카바모일-아데노신, N6-메틸-N6-트레오닐카바모일-아데노신, 2-메틸티오-N6-트레오닐카바모일-아데노신, N6,N6-디메틸아데노신, N6-하이드록시노르발릴카바모일아데노신, 2-메틸티오-N6-하이드록시노르발릴카바모일-아데노신, N6-아세틸-아데노신, 7-메틸-아데닌, 2-메틸티오-아데닌, 2-메톡시-아데닌, 알파-티오-아데노신, 2'-O-메틸-아데노신, N6,2'-O-디메틸-아데노신, N6,N6,2'-O-트리메틸-아데노신, 1,2'-O-디메틸-아데노신, 2'-O-리보실아데노신, 2-아미노-N6-메틸-퓨린, 1-티오-아데노신, 2'-F-ara-아데노신, 2'-F-아데노신, 2'-OH-ara-아데노신, 및 N6-(19-아미노-펜타옥사노나데실)-아데노신을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 N1-알킬구아노신, N2-알킬구아노신, 티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 8-브로모구아노신, O6-알킬구아노신, 크산토신, 이노신, 및 N1-알킬이노신을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 N1-메틸구아노신, N2-메틸구아노신, 티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 8-브로모구아노신, O6-메틸구아노신, 크산토신, 이노신, 및 Nl-메틸이노신을 포함한다.
변형된 또는 화학적으로-변형된 뉴클레오타이드의 예는 슈도우리딘을 포함한다. 슈도우리딘의 예는 Nl-알킬슈도우리딘, Nl-사이클로알킬슈도우리딘, N1-하이드록시슈도우리딘, N1-하이드록시알킬슈도우리딘, N1-페닐슈도우리딘, N1-페닐알킬슈도우리딘, N1-아미노알킬슈도우리딘, N3-알킬슈도우리딘, N6-알킬슈도우리딘, N6-알콕시슈도우리딘, N6-하이드록시슈도우리딘, N6-하이드록시알킬슈도우리딘, N6-모폴리노슈도우리딘, N6-페닐슈도우리딘, 및 N6-할로슈도우리딘을 포함한다. 슈도우리딘의 예는 N1-알킬-N6-알킬슈도우리딘, N1-알킬-N6-알콕시슈도우리딘, N1-알킬-N6-하이드록시슈도우리딘, N1-알킬-N6-하이드록시알킬슈도우리딘, N1-알킬-N6-모폴리노슈도우리딘, N1-알킬-N6-페닐슈도우리딘, 및 N1-알킬-N6-halo슈도우리딘을 포함한다. 이들 예에서, 알킬, 사이클로알킬, 및 페닐 치환체는 비치환될 수 있거나, 또는 알킬, 할로, 할로알킬, 아미노, 또는 니트로 치환체로 추가로 치환될 수 있다.
슈도우리딘의 예는 N1-메틸슈도우리딘, N1-에틸슈도우리딘, N1-프로필슈도우리딘, N1-사이클로프로필슈도우리딘, N1-페닐슈도우리딘, N1-아미노메틸슈도우리딘, N3-메틸슈도우리딘, N1-하이드록시슈도우리딘, 및 N1-하이드록시메틸슈도우리딘을 포함한다.
핵산 단량체의 예는 당업계에서 알려진 임의의 그와 같은 뉴클레오타이드를 포함한, 변형된 및 화학적으로-변형된 뉴클레오타이드를 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 당업계에서 알려진 임의의 그와 같은 뉴클레오타이드, 예를 들어, 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸 퓨린 뉴클레오타이드, 2'-데옥시-2'-플루오로 리보뉴클레오타이드, 2'-데옥시-2'-플루오로 피리미딘 뉴클레오타이드, 2'-데옥시 리보뉴클레오타이드, 2'-데옥시 퓨린 뉴클레오타이드, 보편적인 염기 뉴클레오타이드, 5-C-메틸-뉴클레오타이드, 및 역전된 데옥시어베이직 단량체 잔기를 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 3'-말단 안정화된 뉴클레오타이드, 3'-글리세릴 뉴클레오타이드, 3'-역전된 무염기성 뉴클레오타이드, 및 3'-역전된 티미딘을 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 잠금 핵산 뉴클레오타이드 (LNA), 2'-O,4'-C-메틸렌-(D-리보푸라노실) 뉴클레오타이드, 2'-메톡시에톡시 (MOE) 뉴클레오타이드, 2'-메틸-티오-에틸, 2'-데옥시-2'-플루오로 뉴클레오타이드, 및 2'-O-메틸 뉴클레오타이드를 포함한다. 예시적인 구현예에서, 변형된 단량체는 잠금 핵산 뉴클레오타이드 (LNA)이다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2′,4′-구속된 2′-O-메톡시에틸 (cMOE) 및 2′-O-에틸 (cEt) 변형된 DNA를 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2'-아미노 뉴클레오타이드, 2'-O-아미노 뉴클레오타이드, 2'-C-알릴 뉴클레오타이드, 및 2'-O-알릴 뉴클레오타이드를 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 N6-메틸아데노신 뉴클레오타이드를 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 변형된 염기 5-(3-아미노)프로필우리딘, 5-(2-머캅토)에틸우리딘, 5-브로모우리딘; 8-브로모구아노신, 또는 7-데아자아데노신을 갖는 뉴클레오타이드 단량체를 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2'-O-아미노프로필 치환된 뉴클레오타이드를 포함한다.
변형된 및 화학적으로-변형된 뉴클레오타이드 단량체의 예는 2'-R, 2'-OR, 2'-할로겐, 2'-SR, 또는 2'-아미노로 뉴클레오타이드의 2'-OH 그룹을 대체하는 것을 포함하고, 여기서 R은 H, 알킬, 알케닐, 또는 알키닐일 수 있다.
변형된 뉴클레오타이드의 일부 예는 Saenger, Principles of Nucleic Acid Structure, Springer-Verlag, 1984에서 주어진다.
상기에 기재된 염기 변형의 예는 당 변형 및 연결 변형을 포함한, 뉴클레오사이드 또는 뉴클레오타이드 구조의 추가의 변형과 조합될 수 있다.
특정 변형된 또는 화학적으로-변형된 뉴클레오타이드 단량체는 자연에서 발견될 수 있다.
하나 이상의 UNA 단량체를 함유하는 번역가능 분자
본 발명의 양태는 하나 이상의 UNA 단량체를 함유하는 올리고머성 화합물인 번역가능 분자에 대한 구조 및 조성물을 제공한다. 번역가능한 올리고머는 약제학적 조성물에 대한 활성제일 수 있다. 일부 구현예에서, 번역가능한 올리고머는 인간 AGL 또는 그의 변이체를 인코딩한다.
올리고머성인 본 발명의 번역가능 분자는 하나 이상의 UNA 단량체를 함유할 수 있다. 분자 본 발명의 올리고머성은 펩타이드 및 단백질 치료제를 공급하기 위해 제형에서 활성제로서 사용될 수 있다. 일부 구현예에서, 번역가능한 올리고머는 인간 AGL 또는 그것의 변이체를 인코딩한다.
일부 구현예에서, 본 발명은 특정 천연 뉴클레오타이드, 비-천연 뉴클레오타이드, 변형된 뉴클레오타이드, 또는 화학적으로-변형된 뉴클레오타이드와 UNA 단량체의 신규한 조합을 포함하는 구조를 갖는 올리고머성, 번역가능 화합물을 제공한다.
본 발명의 번역가능한 올리고머성 화합물은 길이가 약 200 내지 약 12,000 염기인 길이를 가질 수 있다. 본 발명의 번역가능한 올리고머성 화합물은 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 또는 약 9000 염기의 길이를 가질 수 있다. 일부 구현예에서, 본 발명의 번역가능한 올리고머성 화합물은 약 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900, 5000, 5100, 5200, 5300, 5400, 또는 약 5500 염기의 길이를 가질 수 있다. 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 화합물은 약 5000 염기의 길이를 가진다.
추가 양태에서, 하나 이상의 UNA 단량체를 포함하는 본 발명의 올리고머성, 번역가능 화합물은 약리적으로 활성 분자일 수 있다. 번역가능한 올리고머성 분자는 시험관내, 생체내, 또는 생체외에서 펩타이드 또는 단백질 활성제를 발생하기 위한 활성 약제학적 성분으로서 사용될 수 있다. 예시적인 구현예에서, 본 발명의 번역가능한 올리고머성 화합물은 인간 AGL 또는 그것의 변이체를 인코딩한다.
본 발명의 번역가능한 올리고머성 분자는 식 I의 구조를 가질 수 있다:
여기서 L1은 연결기이고, n은 200 내지 12,000이고, 그리고 각 경우에 대해 L2는 식 -C1-C2-C3-를 갖는 UNA 링커 그룹이고, 여기서 R은 C2에 부착되고 식 -OCH(CH2R3)R5를 가지고, 여기서 R3은 -OR4, -SR4, -NR4 2, -NH(C=O)R4, 모폴리노, 모폴린-1-일, 피페라진-1-일, 또는 4-알카노일-피페라진-1-일이고, 여기서 R4는 각 경우에 대해 동일 또는 상이하고 H, 알킬, 콜레스테롤, 지질 분자, 폴리아민, 아미노산, 또는 폴리펩타이드이고, 여기서 R5는 핵염기이거나, 또는 L2(R)은 당 예컨대 리보오스이고 R은 핵염기이거나, 또는 L2는 변형된 당 예컨대 변형된 리보오스이고 R은 핵염기이다. 특정 구현예에서, 핵염기는 변형된 핵염기일 수 있다. L1은 포스포디에스테르 결합일 수 있다.
번역가능한 올리고머성 분자의 염기 서열은 임의의 핵염기의 서열일 수 있다.
일부 양태에서, 본 발명의 번역가능한 올리고머성 분자는 임의의 단량체간 위치에 임의의 수의 포스포로티오에이트 단량체간 연결기를 가질 수 있다.
일부 구현예에서, 번역가능한 올리고머성 분자의 단량체간 연결기 중 임의의 하나 이상은 디티오에이트, 키랄 포스포로티오에이트, 및 다른 화학적으로 변형된 형태를 포함한 포스포디에스테르, 포스포로티오에이트일 수 있다.
번역가능한 올리고머성 분자가 UNA 단량체에서 종결할 때, 말단 위치는 상기에서 나타낸 위치상 넘버링에 따라 1-말단을 가지거나, 또는 말단 위치는 3-말단을 가진다.
향상된 번역
본 발명의 번역가능 분자는 분자의 번역 효율을 향상시키는 영역을 포함할 수 있다.
일반적으로, 당해 분야에서 알려진 바와 같이 번역 향상제 영역은 펩타이드 또는 단백질 수율을 증가시키기 위해 번역가능 분자의 구조 안으로 편입될 수 있다.
번역 향상제 영역을 함유하는 번역가능 분자는 펩타이드 또는 단백질의 증가된 생산을 제공할 수 있다.
일부 구현예에서, 번역 향상제 영역은 번역가능 분자의 5′ 또는 3′ 미번역된 영역을 포함할 수 있거나, 또는 그 안에 위치할 수 있다.
번역 향상제 영역의 예는 TEV 5'UTR 및 제노푸스 베타-글로빈 3'UTR로부터 자연 발생 향상제 영역을 포함한다.
분자 구조 및 서열
번역가능 분자는 표적 펩타이드 또는 단백질을 발현하도록 설계될 수 있다. 일부 구현예에서, 상기 표적 펩타이드 또는 단백질은 대상체에서 병태 또는 질환과 연관될 수 있다.
일부 양태에서, 번역가능 분자의 염기 서열은 mRNA의 염기 서열의 적어도 효과적인 부분 또는 도메인과 동일한 부분을 포함할 수 있고, 여기서 효과적인 부분은 번역가능 분자의 번역 생성물에 치료적 활성을 부여하기에 충분하다.
일부 양태에서, 본 발명은 적어도 세포의 천연 핵산 분자의 단편에 동일한 염기 서열을 갖는 활성인 번역가능 분자를 제공한다.
특정 구현예에서, 번역가능 분자의 염기 서열은 하나 이상의 염기 돌연변이를 제외하고 mRNA의 염기 서열과 동일한 부분을 포함할 수 있다. 번역가능 분자에 대한 돌연변이의 수는 mRNA보다 실질적으로 낮은 활성을 갖는 번역가능 분자의 번역 생성물을 생성하는 양을 초과하지 않아야 한다.
본 발명의 올리고머성, 번역가능 UNA 분자는 핵염기의 서열을 나타낼 수 있고, 시험관내, 생체외, 또는 생체내에서 펩타이드 또는 단백질을 발현하도록 설계될 수 있다. 발현된 펩타이드 또는 단백질은 천연 또는 자연 mRNA로부터 발현된 단백질에 상응하는 활성을 포함하여 다양한 형태의 활성을 가질 수 있다.
일부 구현예에서, 본 발명의 번역가능 분자는 약 400 내지 15,000 단량체의 사슬 길이를 가질 수 있고, 여기서 UNA 단량체가 아닌 임의의 단량체는 N 또는 Q 단량체일 수 있다.
분자 캡 구조
본 발명의 번역가능 분자는 당해 기술에 공지되어 있는 바와 같은 다양한 기 및 그것의 유사체로 캡핑된 5'-말단을 가질 수 있다. 예시적인 구현예에서, 5' cap은 m7GpppGm cap일 수 있다. 추가 구현예에서, 5' cap은 m7GpppA, m7GpppC; 비메틸화된 cap 유사체 (예를 들어, GpppG); 디메틸화된 cap 유사체 (예를 들어, m2,7GpppG), 트리메틸화된 cap 유사체 (예를 들어, m2,2,7GpppG), 디메틸화된 대칭 cap 유사체 (예를 들어, m7Gpppm7G), 또는 항 가역적 cap 유사체 (예를 들어, ARCA; m7, 2'OmeGpppG, m72'dGpppG, m7,3'OmeGpppG, m7,3'dGpppG 및 그것의 테트라포스페이트 유도체) (예를 들어, Jemielity, J. et al., RNA 9: 1108-1122 (2003) 참고)로부터 선택될 수 있다. 다른 구현예에서, 5' cap은 ARCA cap (3'-OMe-m7G(5')pppG)일 수 있다. 5' cap은 mCAP (m7G(5')ppp(5')G, N7-메틸-구아노신-5'-삼인산-5'-구아노신)일 수 있다. 5' cap은 가수분해에 대해 내성일 수 있다.
5' cap 구조의 일부 예는 WO2015/051169A2, WO/2015/061491, 및 미국 특허 번호 8,093,367 및 8,304,529에 주어져 있다.
꼬리 영역
일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 엑소뉴클레아제 열화로부터 mRNA를 보호하는 역할을 할 수 있는 꼬리 영역을 포함한다. 일부 구현예에서, 꼬리 영역은 polyA 꼬리일 수 있다.
PolyA 꼬리는 당해 분야에서 알려진 다양한 방법을 사용하여, 예를 들어, 합성 또는 시험관내 전사된 RNA에 꼬리를 부가하는 poly A 중합효소를 사용하여 첨가될 수 있다. 다른 방법은 poly A 꼬리를 인코딩하는 전사 벡터의 사용 또는 리가제 (예를 들어, T4 RNA 리가제 및/또는 T4 DNA 리가제를 사용한 스프린트 결찰을 통함)의 사용을 포함하고, 여기서 polyA는 센스 RNA의 3' 말단에 결찰될 수 있다. 일부 구현예에서, 임의의 상기 방법의 조합이 이용된다.
일부 구현예에서, 번역가능한 올리고머는 3' polyA 꼬리 구조를 포함한다. 일부 구현예에서, polyA 꼬리의 길이는 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 또는 300 뉴클레오타이드일 수 있다. 일부 구현예에서, 3' polyA 꼬리는 약 5 내지 300 아데노신 뉴클레오타이드 (예를 들어, 약 30 내지 250 아데노신 뉴클레오타이드, 약 60 내지 220 아데노신 뉴클레오타이드, 약 80 내지 200 아데노신 뉴클레오타이드, 약 90 내지 약 150 아데노신 뉴클레오타이드, 또는 약 100 내지 약 120 아데노신 뉴클레오타이드)을 함유한다. 예시적인 구현예에서, 3' polyA 꼬리는 길이가 약 100 개의 뉴클레오타이드이다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 길이가 약 115 개의 뉴클레오타이드이다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 길이가 약 250 개의 뉴클레오타이드이다.
일부 구현예에서, 3' polyA 꼬리는 하나 이상의 UNA 단량체를 포함한다. 일부 구현예에서, 3' polyA 꼬리는 2, 3, 4, 5, 10, 15, 20, 또는 그 초과 UNA 단량체를 함유한다. 예시적인 구현예에서, 3' polyA 꼬리는 2 UNA 단량체를 함유한다. 추가 예시적인 구현예에서, 3' polyA 꼬리는 3' polyA 꼬리에서 서로에 대해서 연속적으로 즉, 인접하여 발견된 2 UNA 단량체를 함유한다.
예시적인 구현예에서, 3' polyA 꼬리는 서열번호 6에서 도시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 서열번호 38에서 도시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 3' polyA 꼬리는 서열번호 39에서 도시된 서열을 포함하거나 이들로 구성된다.
일부 구현예에서, 번역가능한 올리고머는 3' polyC 꼬리 구조를 포함한다. 일부 구현예에서, polyC 꼬리의 길이는 적어도 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 또는 300 뉴클레오타이드일 수 있다. 일부 구현예에서, 3' polyC 꼬리는 약 5 내지 300 시토신 뉴클레오타이드 (예를 들어, 약 30 내지 250 시토신 뉴클레오타이드, 약 60 내지 220 시토신 뉴클레오타이드, 약 80 내지 약 200 시토신 뉴클레오타이드, 약 90 내지 150 시토신 뉴클레오타이드, 또는 약 100 내지 약 120 시토신 뉴클레오타이드)를 함유한다. 예시적인 구현예에서, 3' polyC 꼬리는 길이가 약 100 개의 뉴클레오타이드이다. 또 다른 예시적인 구현예에서, 3' polyC 꼬리는 길이가 약 115 개의 뉴클레오타이드이다. polyC 꼬리는 polyA 꼬리에 첨가될 수 있거나 또는 polyA 꼬리로 치환될 수 있다. polyC 꼬리는 polyA 꼬리의 5' 말단 또는 polyA 꼬리의3' 말단에 첨가될 수 있다.
일부 구현예에서, poly A 및/또는 poly C 꼬리의 길이는 본 발명의 변형된 번역가능한 올리고머성 분자의 안정성 및, 따라서, 단백질의 전사를 조절하도록 조정된다. 예를 들어, polyA 꼬리의 길이는 번역가능 분자의 반감기에 영향을 줄 수 있기 때문에, polyA 꼬리의 길이는 뉴클레아제에 대한 mRNA의 저항 수준을 변경하여 그에 의해 표적 세포에서 폴리뉴클레오타이드 발현 및/또는 폴리펩타이드 생산의 시간 경과를 제어하도록 조정될 수 있다.
5' 및 3' 미번역된 영역 (UTRs)
일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 5' 미번역된 영역 및/또는 3' 미번역된 영역을 포함할 수 있다. 당업계에서 이해되는 바와 같이, 5' 및/또는 3' UTR은 mRNA의 번역의 안정성 또는 번역 효율에 영향을 미칠 수 있다. 예시적인 구현예에서, 번역가능한 올리고머는 5' UTR 및 3' UTR을 포함한다.
일부 구현예에서, 번역가능한 올리고머는 적어도 약 25, 50, 75, 100, 125, 150, 175, 200, 300, 400, 또는 500 뉴클레오타이드인 5' UTR을 포함할 수 있다. 일부 구현예에서, 5' UTR은 약 50 내지 300 뉴클레오타이드 (예를 들어, 약 75 내지 250 뉴클레오타이드, 약 100 내지 200 뉴클레오타이드, 약 120 내지 150 뉴클레오타이드, 또는 약 135 뉴클레오타이드)를 함유한다. 예시적인 구현예에서, 5' UTR은 길이가 약 135 개의 뉴클레오타이드이다.
일부 구현예에서, 5' UTR은 번역가능한 올리고머의 안정성을 증가시키는 데 상대적으로 안정한 것으로 당업계에서 알려진 mRNA 분자(예를 들어, 히스톤, 튜불린, 글로빈, GAPDH, 액틴, 또는 시트르산 사이클 효소)로부터 유래된다. 다른 구현예에서, 5' UTR 서열은 CMV 급초기 1 (IE1) 유전자의 부분 서열을 포함할 수 있다. 5' UTR 서열의 예는 미국 특허 번호 9,149,506에서 발견될 수 있다. 일부 구현예에서, 5' UTR은 인간 IL-6, 알라닌 아미노기전달효소 1, 인간 아포지질단백질 E, 인간 피브리노겐 알파 사슬, 인간 트랜스티레틴, 인간 합토글로빈, 인간 알파-1-항키모트립신, 인간 항트롬빈, 인간 알파-1-항트립신, 인간 알부민, 인간 베타 글로빈, 인간 보체 C3, 인간 보체 C5, SynK, AT1G58420, 마우스 베타 글로빈, 마우스 알부민, 및 담배 식각 바이러스, 또는 전술한 것 중 임의의 것의 단편의 5' UTR으로부터 선택된 서열을 포함한다. 예시적인 구현예에서, 5' UTR은 담배 식각 바이러스 (TEV)로부터 유래된다. 추가 예시적인 구현예에서, 5' UTR은 서열번호 3에 제시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 5' UTR은 서열번호 3에 제시된 서열의 단편, 예컨대 서열번호 3의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 또는 125 인접 뉴클레오타이드의 단편이다.
일부 구현예에서, 번역가능한 올리고머성 분자는 내부 리보솜 유입 부위 (IRES)를 포함한다. 당업계에서 이해되는 바와 같이, IRES는 말단-독립 방식으로 번역 개시를 허용하는 RNA 요소이다. 예시적인 구현예에서, IRES는 5' UTR 내에 있다. 다른 구현예에서, IRES는 5' UTR 외측에 있을 수 있다.
일부 구현예에서, 번역가능한 올리고머는 적어도 약 25, 50, 75, 100, 125, 150, 175, 200, 300, 400, 또는 500 뉴클레오타이드인 3' UTR을 포함할 수 있다. 일부 구현예에서, 3' UTR은 약 50 내지 300 뉴클레오타이드 (예를 들어, 약 75 내지 250 뉴클레오타이드, 약 100 내지 200 뉴클레오타이드, 약 140 내지 175 뉴클레오타이드, 또는 약 160 뉴클레오타이드)를 함유한다. 예시적인 구현예에서, 3' UTR은 길이가 약 160 개의 뉴클레오타이드이다.
일부 구현예에서, 3' UTR은 하나 이상의 UNA 단량체를 포함한다. 일부 구현예에서, 3' UTR은 2, 3, 4, 5, 10, 15, 20, 또는 그 초과 UNA 단량체를 함유한다.
3' UTR 서열의 예는 미국 특허 번호 9,149,506에서 발견될 수 있다. 일부 구현예에서, 3' UTR은 알라닌 아미노기전달효소 1, 인간 아포지질단백질 E, 인간 피브리노겐 알파 사슬, 인간 합토글로빈, 인간 항트롬빈, 인간 알파 글로빈, 인간 베타 글로빈, 인간 보체 C3, 인간 성장 인자, 인간 헵시딘, MALAT-1, 마우스 베타 글로빈, 마우스 알부민, 및 제노푸스 베타 글로빈, 또는 전술한 것 중 임의의 것의 단편의 3' UTR으로부터 선택된 서열을 포함한다. 예시적인 구현예에서, 3' UTR은 제노푸스 베타 글로빈으로부터 유래된다. 예시적인 구현예에서, 3' UTR은 제노푸스 베타 글로빈으로부터 유래되고 하나 이상의 UNA 단량체를 함유한다. 추가 예시적인 구현예에서, 3' UTR은 서열번호 5 및 33-37에 제시된 서열을 포함하거나 이들로 구성된다. 또 다른 예시적인 구현예에서, 3' UTR은 서열번호 5 및 33-37에 제시된 서열의 단편, 예컨대 서열번호 5 및 33-37의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 또는 150 인접 뉴클레오타이드의 단편이다.
특정 예시적인 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 3의 5' UTR 서열 및 서열번호 5 및 33-37로부터 선택된 3' UTR 서열을 포함한다. 일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 6, 서열번호 38, 또는 서열번호 39에 도시된 polyA 꼬리를 추가로 포함한다. 일부 구현예에서, AGL의 mRNA 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택된 서열을 포함한다.
삼중 정지 코돈
일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 삼중 정지 코돈을 창출하는 CDS의 즉시 다운스트림 서열을 포함할 수 있다. 삼중 정지 코돈은 번역의 효율성을 향상시키기 위해 편입될 수 있다. 일부 구현예에서, 번역가능한 올리고머는 서열번호 7-32 또는 서열번호 41-45에서 예시된 바와 같이 본 명세서에 기재된 PAH CDS의 즉시 다운스트림 서열 AUAAGUGAA (서열번호 40)를 포함할 수 있다.
번역 시작 부위
일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 번역 시작 부위를 포함할 수 있다. 그와 같은 서열은 당해 기술에 공지되어 있고 코작 서열을 포함한다. 예를 들어, Kozak, Marilyn (1988) Mol. and Cell Biol., 8:2737-2744; Kozak, Marilyn (1991) J. Biol. Chem., 266:19867-19870; Kozak, Marilyn (1990) Proc Natl. Acad. Sci. USA, 87:8301-8305; 및 Kozak, Marilyn (1989) J. Cell Biol., 108:229-241; 및 본 명세서에서 인용된 참조문헌을 참고한다. 당업계에서 이해되는 바와 같이, 코작 서열은 mRNA의 번역의 효율적인 개시를 허용하는 진핵 mRNA의 번역 시작 부위 주위에 중심이 있는 짧은 공통 서열이다. 리보솜 번역 기계장치는 코작 서열의 맥락에서 AUG 개시 코돈을 인식한다.
일부 구현예에서, 번역 시작 부위, 예를 들어, 코작 서열은 AGL에 대한 코딩 서열의 업스트림으로 삽입된다. 일부 구현예에서, 번역 시작 부위는 5' UTR의 다운스트림으로 삽입된다. 특정 예시적인 구현예에서, 번역 시작 부위는 AGL에 대한 코딩 서열의 업스트림 및 5' UTR의 다운스트림으로 삽입된다.
당업계에서 이해되는 바와 같이, 코작 서열의 길이는 변할 수 있다. 일반적으로, 선도 서열의 길이가 증가하면 번역이 향상된다.
일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 4의 서열을 갖는 코작 서열을 포함한다. 특정 예시적인 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 서열번호 4의 서열을 갖는 코작 서열을 포함하고, 여기서 상기 코작 서열은 5' UTR의 즉시 다운스트림 및 AGL에 대한 코딩 서열의 즉시 업스트림이다.
합성 방법
다양한 양태에서, 본 발명은 번역가능 메신저 분자의 합성 방법을 제공한다.
본 발명의 번역가능 분자는 본 명세서에 개시된 방법뿐만 아니라 당업계에서 알려진 임의의 적절한 기술을 사용하여 합성되고 단리될 수 있다.
핵산을 제조하는 일부 방법은, 예를 들어, Merino, Chemical Synthesis of Nucleoside Analogues, (2013); Gait, Oligonucleotide synthesis: a practical approach (1984); Herdewijn, Oligonucleotide Synthesis, Methods in Molecular Biology, Vol. 288 (2005)에서 주어진다.
일부 구현예에서, 번역가능 분자는 시험관내 전사 (IVT) 반응에 의해 제작될 수 있다. 뉴클레오사이드 삼인산 (NTP)의 혼합은 T7 시약을 사용하여, 예를 들어, DNA 템플레이트로부터 RNA를 생성하기 위해 중합될 수 있다. DNA 템플레이트는 RNase-유리 DNase로 분해될 수 있고, RNA 칼럼-분리될 수 있다.
일부 구현예에서, 리가제가 사용되어 RNA 분자의 3' 말단 또는 RNA 전사체에 합성 올리고머를 연결하여 번역가능 분자를 형성할 수 있다. 3' 말단에 결찰되는 합성 올리고머는 polyA 꼬리의 기능성을 제공할 수 있고 유익하게는 3'-엑소리보뉴클레아제에 의한 그것의 제거에 대해 저항을 제공한다. 결찰된 생성물 번역가능 분자는 증가된 특이 활성을 가질 수 있고 증가된 수준의 이소성 단백질 발현을 제공한다.
특정 구현예에서, 본 발명의 번역가능 분자의 결찰된 생성물은 천연 특이성을 갖는 RNA 전사체로 제작될 수 있다. 결찰된 생성물은 천연 특이성과의 혼용성을 보장하도록 5' 말단에 RNA 전사체의 구조를 보유하는 합성 분자일 수 있다.
추가 구현예에서, 본 발명의 번역가능 분자의 결찰된 생성물은 외인성 RNA 전사체 또는 비-천연 RNA로 제작될 수 있다. 결찰된 생성물은 RNA의 구조를 보유하는 합성 분자일 수 있다.
이론에 의해 구속되기를 바라지 않으면서, 세포에서 정식 mRNA 열화 경로는 하기 단계를 포함한다: (i) polyA 꼬리가 3' 엑소뉴클레아제에 의해 스터브로 다시 서서히 절단되어, 효율적인 번역에 필요한 고리화 상호작용을 중단시키고 cap을 공격에 대해 공개하는 단계; (ii) 탈캡핑 복합체가 5' cap을 이탈하는 단계; (iii) 전사체의 비보호되고 번역적으로 무력한 잔류물이 5' 및 3' 엑소뉴클레아제 활성에 의해 분해되는 단계.
본 발명의 구현예는 천연 전사체에 비하여 증가된 번역 활성을 가질 수 있는 신규한 번역가능 구조를 포함한다. 다른 것들 중에서, 본 명세서에 번역가능 분자는 엑소뉴클레아제가 탈-아데닐화의 과정에서 polyA 꼬리를 다시 트리밍하는 것을 방지한다.
본 발명의 구현예는 번역가능 분자에 대한 구조, 조성물 및 방법을 제공한다. 본 발명의 구현예는 하나 이상의 UNA 단량체를 함유하고 증가된 기능적 반감기를 갖는 번역가능 분자를 제공할 수 있다.
mRNA 전사체의 3' 말단에 합성 올리고머의 결찰은 mRNA 전사체의 결찰 생성물로의 높은 전환이 놀랍게도 달성될 수 있음이 밝혀졌다.
본 명세서에서 사용된 바와 같이, 용어들 polyA 꼬리 및 polyA 올리고머는 단량체의 올리고머를 지칭하고, 여기서 상기 단량체는 아데닌, UNA 단량체, 자연 발생 뉴클레오타이드, 변형된 뉴클레오타이드, 또는 뉴클레오타이드 유사체에 기초한 뉴클레오타이드를 포함할 수 있다.
RNA의 3' 말단에 결찰하기 위한 올리고머는 2 내지 120 단량체 길이, 또는 3 내지 120 단량체 길이, 또는 4 내지 120 단량체 길이, 또는 5 내지 120 단량체 길이, 또는 더 길 수 있다. 예시적인 구현예에서, 결찰을 위한 올리고머는 길이가 약 30 단량체이다.
지질-계 제형
지질-계 제형은 그것의 생체적합성 및 대규모 생산의 용이성으로 인해 RNA에 대한 가장 유망한 전달 시스템 중 하나로 점점 더 인식되고 있다. 양이온성 지질은 RNA의 전달을 위한 합성 물질로서 널리 연구되어 왔다. 함께 혼합한 후, 핵산은 양이온성 지질에 의해 응축되어 리포플렉스로 알려진 지질/핵산 복합체를 형성한다. 이들 지질 복합체는 뉴클레아제의 작용으로부터 유전 물질을 보호하고 음으로 하전된 세포막과 상호작용함으로써 이를 세포 내로 전달할 수 있다. 리포플렉스는 생리적으로 pH에서 양으로 하전된 지질을 음으로 하전된 핵산과 직접적으로 혼합함에 의해 제조될 수 있다.
통상적인 리포좀은 수성 코어를 둘러싸는, 양이온성, 음이온성 또는 중성 (포스포) 지질 및 콜레스테롤로 구성될 수 있는 지질 이중층으로 구성된다. 지질 이중층 및 수성 공간 둘 모두는 각각 소수성 또는 친수성 화합물을 포함할 수 있다. 생체내 리포좀 특성 및 거동은 친수성 중합체 코팅물, 예를 들어 리포좀 표면에 폴리에틸렌 글리콜 (PEG)의 첨가에 의해 입체 안정화를 부여하도록 변형될 수 있다. 또한, 리포좀은 리간드 (예를 들어, 항체, 펩타이드 및 탄수화물)를 부착된 PEG 사슬의 표면 또는 말단에 부착함에 의해 특정 표적화에 사용될 수 있다 (Front Pharmacol. 2015 Dec 1;6:286).
리포좀은 수성 구획을 둘러싸는 인지질 이중층으로 구성된 콜로이드성 지질-계 및 계면활성제-계 전달 시스템이다. 그것들은 구형 소포로 존재할 수 있으며, 크기는 20 nm 내지 수 미크론의 범위일 수 있다. 양이온성 지질-계 리포좀은 정전기적 상호작용을 통해 음으로 하전된 핵산과 복합체를 형성할 수 있어 생체적합성, 낮은 독성 및 생체내 임상 적용에 필요한 대규모 생산의 가능성을 부여하는 복합체를 생성한다. 리포좀은 흡수를 위해 원형질막과 융합될 수 있다; 세포 내부로 들어가면, 리포좀은 세포내이입 경로를 통해 처리되고 유전 물질은 엔도좀/담체에서 세포질로 방출된다. 리포좀은 기본적으로 생물학적 막의 유사체이고 천연 및 합성 인지질 둘 모두로부터 제조될 수 있다는 점에서 리포좀은 그것의 우수한 생체적합성으로 인해 약물 전달 비히클로 오랫동안 인식되어 왔다 (Int J Nanomedicine. 2014; 9: 1833-1843).
양이온성 리포좀은 플라스미드 DNA, 안티센스 올리고 및 siRNA/소형 헤어핀 RA-shRNA를 포함하는 올리고뉴클레오타이드에 가장 일반적으로 사용되는 비-바이러스 전달 시스템이었다. 양이온성 지질, 예컨대 DOTAP, (1,2-디올레오일-3-트리메틸암모늄-프로판) 및 DOTMA (N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄 메틸 설페이트)는 음의 하전된 핵산으로 복합체 또는 리포플렉스를 형성하여 정전기적 상호작용에 의해 나노입자를 형성하여, 높은 시험관내 형질감염 효율을 제공한다. 또한, 예를 들어 중성 1,2-디올레오일-sn-글리세로-3-포스파티딜콜린 (DOPC)-계 나노리포좀과 같이 RNA 전달을 위한 중성 지질-계 나노 리포좀이 개발되었다. (Adv Drug Deliv Rev. 2014 Feb; 66: 110-116.)
일부 구현예에 따르면, 본 명세서에 기재된 발현가능한 폴리뉴클레오타이드 및 이종성 mRNA 작제물은 지질 제형화된다. 지질 제형은 바람직하게는, 비제한적으로, 리포좀, 리포플렉스, 공중합체, 예컨대 PLGA, 및 지질 나노입자로부터 선택된다. 하나의 바람직한 구현예에서, 지질 나노입자 (LNP)는 하기를 포함한다:
(a) 핵산,
(b) 양이온성 지질,
(c) 응집 환원제 (예컨대 폴리에틸렌 글리콜 (PEG) 지질 또는 PEG-변형된 지질),
(d) 선택적으로 비-양이온성 지질 (예컨대 중성 지질), 및
(e) 선택적으로, 스테롤.
일 구현예에서, 지질 나노입자 제형은 (i) 적어도 하나의 양이온성 지질; (ii) 중성 지질; (iii) 스테롤, 예를 들어, 콜레스테롤; 및 (iv) PEG-지질이 약 20-60% 양이온성 지질: 5-25% 중성 지질: 25-55% 스테롤; 0.5-15% PEG-지질의 몰비로 구성된다.
티오카바메이트 및 카바메이트-함유 지질 제형
본 발명의 활성 분자의 전달을 위한 지질 및 지질 조성물의 일부 예는 WO/2015/074085 및 USSN 15/387,067에 주어져 있고, 이들 각각은 전체적으로 본 명세서에 참고로 통합된다. 특정 구현예에서, 지질은 하기 식의 화합물이다:
여기서
R1 및 R2 둘 모두는 1 내지 14개의 탄소로 구성된 선형 알킬, 또는 2 내지 14개의 탄소로 구성된 알케닐 또는 알키닐로 구성되고;
L1 및 L2 둘 모두는 5 내지 18개의 탄소로 구성되거나, 또는 N와 복소환을 형성하는, 선형 알킬렌 또는 알케닐렌으로 구성되고;
X는 S이고;
L3은 1 내지 6개의 탄소로 구성되거나, 또는 N와 복소환을 형성하는, 결합 또는 선형 알킬렌으로 구성되고;
R3은 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬렌으로 구성되고; 그리고
R4 및 R5는 동일 또는 상이하고, 각각은 수소 또는 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬로 구성됨;
또는 이의 약제학적으로 허용가능한 염.
지질 제형은 하기 중에서 선택된 하나 이상의 이온화가능한 양이온성 지질을 함유할 수 있다:
양이온성 지질
지질 나노입자는 바람직하게는 지질 나노입자를 형성하기에 적합한 양이온성 지질을 포함한다. 바람직하게는, 양이온성 지질은 약 생리적 pH에서 순 양전하를 수반한다.
양이온성 지질은, 예를 들어, N,N-디올레일-N,N-디메틸염화암모늄 (DODAC), N,N-디스테아릴-N,N-디메틸암모늄 브로마이드 (DDAB), 1,2-디올레오일트리메틸암모늄프로판 염화물 (DOTAP) (N-(2,3-디올레오일옥시)프로필)-N,N,N-트리메틸염화암모늄 및 1,2-디올레일옥시-3-트리메틸아미노프로판 염화물 염으로도 알려져 있음), N-(1-(2,3-디올레일옥시)프로필)-N,N,N-트리메틸염화암모늄 (DOTMA), N,N-디메틸-2,3-디올레일옥시)프로필아민 (DODMA), 1,2-디리놀레일옥시-N,N-디메틸아미노프로판 (DLinDMA), 1,2-디리놀레닐옥시-N,N-디메틸아미노프로판 (DLenDMA), 1,2-디-y-리놀레닐옥시-N,N-디메틸아미노프로판 (γ-DLenDMA), 1,2-디리놀레일카바모일옥시-3-디메틸아미노프로판 (DLin-C-DAP), 1,2-딜리놀레이옥시-3-(디메틸아미노)아세톡시프로판 (DLin-DAC), 1,2-디리놀레이옥시-3-모폴리노프로판 (DLin-MA), 1,2-디리놀레오일-3-디메틸아미노프로판 (DLinDAP), 1,2-디리놀레일티오-3-디메틸아미노프로판 (DLin-S- DMA), 1-리놀레오일-2-리놀레일옥시-3-디메틸아미노프로판 (DLin-2-DMAP), 1,2-디리놀레일옥시-3-트리메틸아미노프로판 염화물 염 (DLin-TMA.CI), 1,2-디리놀레오일-3-트리메틸아미노프로판 염화물 염 (DLin-TAP.CI), 1,2-디리놀레일옥시-3-(N-메틸피페라지노)프로판 (DLin-MPZ), 또는 3-(N,N-디리놀레일아미노)-1,2-프로판디올 (DLinAP), 3-(N,N-디올레일아미노)-1,2-프로판디오 (DOAP), 1,2-디리놀레일옥소-3-(2-N,N- 디메틸아미노)에톡시프로판 (DLin-EG-DM A), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란 (DLin-K-DMA) 또는 그의 유사체, (3aR,5s,6aS)-N,N-디메틸-2,2-디((9Z,12Z)-옥타데카-9,12-디에닐)테트라하이드로-3aH-사이클로펜타[d][1,3]디옥솔-5-아민, (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일4-(디메틸아미노)부타노에이트 (MC3), 1,1'-(2-(4-(2-((2-(비스(2-하이드록시도데실)아미노)에틸)(2-하이드록시도데실)아미노)에틸)피페라진-1-일)에틸아잔디일)디도데칸-2-올 (C12-200), 2,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란 (DLin-K-C2-DMA), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란 (DLin-K-DMA), (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28 31-테트라엔-19-일 4-(디메틸아미노) 부타노에이트 (DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,3 1-테트라엔-19-일옥시)-N,N-디메틸프로판-1-아민 (MC3 에테르), 4-((6Z,9Z,28Z,31 Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일옥시)-N,N-디메틸부탄-1-아민 (MC4 에테르), 또는 전술한 것 중 임의의 것의 임의의 조합일 수 있다. 다른 양이온성 지질은, 비제한적으로, N,N-디스테아릴-N,N-디메틸암모늄 브로마이드 (DDAB), 3P-(N-(N',N'-디메틸아미노에탄)- 카바모일)콜레스테롤 (DC-Choi), N-(1-(2,3-디올레일옥시)프로필)-N-2-(스페르민카복사미도)에틸)-N,N-디메틸암모늄 트리플루오르아세테이트 (DOSPA), 디옥타데실아미도글라이실 카복시스페르민 (DOGS), 1,2-디레오일-sn-3-포스포에탄올아민 (DOPE), 1,2-디올레오일-3-디메틸암모늄 프로판 (DODAP), N-(1,2-디미리스틸록시프로프-3-일)-N,N-디메틸-N-하이드록시에틸 암모늄 브로마이드 (DMRIE), 및 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란 (XTC)을 포함한다. 추가로, 양이온성 지질의 상업적 제제, 예컨대, 예를 들어, 리포펙틴 (GIBCO/BRL로부터 이용가능한 DOTMA 및 DOPE를 포함함), 및 리포펙타민 (GIBCO/BRL로부터 이용가능한 DOSPA 및 DOPE를 포함함)이 사용될 수 있다.
다른 적합한 양이온성 지질은 아래에서 개시되어 있다: 국제공개 번호 WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709, 및 WO 2011/153493; 미국 특허 공보 번호 2011/0256175, 2012/0128760, 및 2012/0027803; 미국 특허 번호 8,158,601; 및 Love et al, PNAS, 107(5), 1864-69, 2010. 다른 적합한 아미노 지질은 알킬 치환체가 상이한 (예를 들어, N-에틸- N-메틸아미노-, 및 N-프로필-N-에틸아미노-) 것들을 포함하여, 대안적인 지방산 기 및 다른 디알킬아미노 기를 갖는 것들을 포함한다. 일반적으로, 덜 포화된 아실 사슬을 갖는 아미노 지질은 특히 필터 멸균을 위해 복합체가 약 0.3 미크론 미만으로 크기로 되어야 할 때 더 쉽게 크기가 결정된다. C14 내지 C22 범위의 탄소 사슬 길이를 갖는 불포화된 지방산을 함유하는 아미노 지질이 사용될 수 있다. 다른 스캐폴드는 또한 아미노 기 및 아미노 지질의 지방산 또는 지방 알킬 부분을 분리하기 위해 사용될 수 있다.
추가의 바람직한 구현예에서, LNP는 특허 출원 PCT/EP2017/064066에 따른 식 (III)을 갖는 양이온성 지질을 포함한다. 이와 관련하여, PCT/EP2017/064066의 개시내용은 또한 본 명세서에 참고로 포함된다.
특정 구현예에서, 본 발명의 아미노 또는 양이온성 지질은 적어도 하나의 양성자화성 또는 탈양성자화성 그룹을 가지므로, 지질은 생리적 pH 이하의 pH (예를 들어, pH 7.4)에서 양으로 하전되고, 제2 pH에서, 바람직하게는 생리적 pH 이상에서 중성이다. 물론, pH의 기능으로서 양성자의 첨가 또는 제거는 평형 과정이며, 하전 또는 중성 지질에 대한 언급은 우세한 종의 성질을 나타내며 모든 지질이 하전 또는 중성 형태에서 존재할 것을 요구하지는 않는다는 것이 이해될 것이다. 하나 초과의 양성자화성 또는 탈양성자화성 그룹을 갖거나, 또는 쯔비터이온성인 지질은 본 발명에서의 사용에서 배제되지 않는다. 특정 구현예에서, 양성자화성 지질은 약 4 내지 약 11의 범위인 양성자화성 그룹의 pKa, 예를 들어, 약 5 내지 약 7의 pKa를 갖는다.
양이온성 지질은 입자에 존재하는 총 지질의 약 20 mol % 내지 약 70 또는 75 mol % 또는 약 45 내지 약 65 mol % 또는 약 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 또는 약 70 mol %를 포함할 수 있다. 또 다른 구현예에서, 지질 나노입자는 양이온성 지질의 몰 기준으로 약 25% 내지 약 75%, 예를 들어, (지질 나노입자에서의 지질의 100% 총 몰에 기초하여) 몰 기준으로 약 20 내지 약 70%, 약 35 내지 약 65%, 약 45 내지 약 65%, 약 60%, 약 57.5%, 약 57.1%, 약 50% 또는 약 40%를 포함한다. 일 구현예에서, 양이온성 지질 대 핵산의 비는 약 3 대 약 15, 예컨대 약 5 대 약 13 또는 약 7 대 약 11이다.
약제학적 조성물
일부 양태에서, 본 발명은 번역가능 화합물 및 약제학적으로 허용가능한 담체를 함유하는 약제학적 조성물을 제공한다.
약제학적 조성물은 국소 또는 전신 투여가 가능할 수 있다. 일부 양태에서, 약제학적 조성물은 임의의 양식의 투여가 가능할 수 있다. 특정 양태에서, 투여는 정맥내, 피하, 폐, 근육내, 복강내, 진피, 경구, 흡입 또는 비강 투여를 포함한, 임의의 경로일 수 있다.
본 발명의 구현예는 지질 제형 내에 번역가능 화합물을 함유하는 약제학적 조성물을 포함한다.
일부 구현예에서, 약제학적 조성물은 양이온성 지질, 음이온성 지질, 스테롤, 페길화된 지질, 및 전술한 것의 임의의 조합으로부터 선택된 하나 이상의 지질을 포함할 수 있다. 일부 구현예에서, 번역가능 화합물을 함유하는 약제학적 조성물은 양이온성 지질, 인지질, 콜레스테롤, 및 페길화된 지질을 포함한다.
특정 구현예에서, 약제학적 조성물은 리포좀이 실질적으로 없을 수 있다.
추가 구현예에서, 약제학적 조성물은 나노입자를 포함할 수 있다.
본 발명의 활성 분자의 전달을 위한 지질 및 지질 조성물의 일부 예는, 전체적으로 본 명세서에 참고로 통합되는, WO/2015/074085에 주어져 있다. 특정 구현예에서, 지질은 양이온성 지질이다. 일부 구현예에서, 양이온성 지질은 식 II의 화합물을 포함한다:
여기서 R1 및 R2는 동일 또는 상이한, 각각 선형 또는 분지형 알킬, 알케닐, 또는 알키닐이고, L1 및 L2는 동일 또는 상이한, 각각 적어도 5개의 탄소 원자를 갖는 선형 알킬이거나, 또는 N과 복소환을 형성하고, X1은 결합이거나, 또는 --CO--O--로 그것에 의하여 L2-CO--O--R2가 형성되고 X2는 S 또는 O이고, L3은 결합 또는 저급 알킬이고, R3은 저급 알킬이고, R4 및 R5는 동일 또는 상이한, 각각 저급 알킬이다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L3은 부재이고, R1 및 R2 각각은 적어도 7개의 탄소 원자로 구성되고, R3은 에틸렌 또는 n-프로필렌이고, R4 및 R5는 메틸 또는 에틸이고, 그리고 L1 및 L2 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L3은 부재이고, R1 및 R2 각각은 적어도 7개의 탄소 원자로 구성되고, R3은 에틸렌 또는 n-프로필렌이고, R4 및 R5는 메틸 또는 에틸이고, 그리고 L1 및 L2 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L3은 부재이고, R1 및 R2 각각은 적어도 9개의 탄소 원자의 알케닐로 구성되고, R3은 에틸렌 또는 n-프로필렌이고, R4 및 R5는 메틸 또는 에틸이고, 그리고 L1 및 L2 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L3은 메틸렌이고, R1 및 R2 각각은 적어도 7개의 탄소 원자로 구성되고, R3은 에틸렌 또는 n-프로필렌이고, R4 및 R5는 메틸 또는 에틸이고, 그리고 L1 및 L2 각각은 적어도 5개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L3은 메틸렌이고, R1 및 R2 각각은 적어도 9개의 탄소 원자로 구성되고, R3은 에틸렌 또는 n-프로필렌이고, R4 및 R5 각각은 메틸이고, L1 및 L2 각각은 적어도 7개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L3은 메틸렌이고, R1은 적어도 9개의 탄소 원자를 갖는 알케닐로 구성되고 그리고 R2는 적어도 7개의 탄소 원자를 갖는 알케닐로 구성되고, R3은 n-프로필렌이고, R4 및 R5 각각은 메틸이고, L1 및 L2 각각은 적어도 7개의 탄소 원자를 갖는 선형 알킬로 구성된다.또한 본 명세서에 기재된 것은 식 II의 화합물로, 여기서 L3은 메틸렌이고, R1 및 R2 각각은 적어도 9개의 탄소 원자를 갖는 알케닐로 구성되고, R3은 에틸렌이고, R4 및 R5 각각은 메틸이고, L1 및 L2 각각은 적어도 7개의 탄소 원자를 갖는 선형 알킬로 구성된다.
예시적인 구현예에서, 양이온성 지질은 ATX-001, ATX-002, ATX-003, ATX-004, ATX-005, ATX-006, ATX-007, ATX-008, ATX-009, ATX-010, ATX-011, ATX-012, ATX-013, ATX-014, ATX-015, ATX-016, ATX-017, ATX-018, ATX-019, ATX-020, ATX-021, ATX-022, ATX-023, ATX-024, ATX-025, ATX-026, ATX-027, ATX-028, ATX-029, ATX-030, ATX-031, ATX-032, ATX-081, ATX-095, 및 ATX-126, 또는 이의 약제학적으로 허용가능한 염으로 구성된 군으로부터 선택된 화합물을 포함한다.
특정 예시적인 구현예에서, 양이온성 지질은 ATX-002, ATX-081, ATX-095, 또는 ATX-126을 포함한다.
일부 구현예에서, 양이온성 지질 또는 이의 약제학적으로 허용가능한 염은 지질 분자의 나노입자 또는 이중층을 포함하는 지질 조성물에 제시될 수 있다. 지질 이중층은 바람직하게는 중성 지질 또는 폴리머를 더 포함한다. 지질 조성물은 바람직하게는 액체 배지를 포함한다. 조성물은 바람직하게는 본 발명의 번역가능 화합물을 추가로 캡슐화한다. 지질 조성물은 바람직하게는 본 발명의 번역가능 화합물 및 중성 지질 또는 폴리머를 추가로 포함한다. 지질 조성물은 바람직하게는 번역가능 화합물을 캡슐화한다.
추가 구현예에서, 양이온성 지질은 식 III의 화합물을 포함한다:
여기서 R1 및 R2는 동일 또는 상이한, 각각 1 내지 9개의 탄소로 구성된 선형 또는 분지형 알킬, 2 내지 11개의 탄소로 구성된 알케닐 또는 알키닐, 또는 콜레스테릴이고, L1 및 L2는 동일 또는 상이한, 각각 5 내지 18개의 탄소로 구성된 선형 알킬렌 또는 알케닐렌이고, X1은 --CO--O--로 그것에 의하여 -L2-CO--O--R2가 형성되고, X2는 S 또는 O이고, X3은 --CO--O-- 로 그것에 의하여 -L1-CO--O--R1이 형성되고, L3은 결합이고, R3은 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬렌이고, 그리고 R4 및 R5는 동일 또는 상이한, 각각 수소 또는 1 내지 6개의 탄소로 구성된 선형 또는 분지형 알킬임; 또는 이의 약제학적으로 허용가능한 염이다. 일 구현예에서, X2는 S이다. 또 다른 구현예에서, R3은 에틸렌, n-프로필렌, 또는 이소부틸렌으로부터 선택된다. 또 다른 구현예에서, R4 및 R5는 별도로 메틸, 에틸, 또는 이소프로필이다. 또 다른 구현예에서, L1 및 L2는 동일하다. 또 다른 구현예에서, L1 및 L2는 상이하다. 또 다른 구현예에서, L1 또는 L2는 7개의 탄소를 갖는 선형 알킬렌으로 구성된다.또 다른 구현예에서, L1 또는 L2는 9개의 탄소를 갖는 선형 알킬렌으로 구성된다.또 다른 구현예에서, R1 및 R2는 동일하다.또 다른 구현예에서, R1 및 R2는 상이하다.또 다른 구현예에서, R1 및 R2 각각은 알케닐로 구성된다.또 다른 구현예에서, R1 및 R2 각각은 알킬로 구성된다.또 다른 구현예에서, 알케닐은 단일 이중 결합으로 구성된다.또 다른 구현예에서, R1 또는 R2는 9개의 탄소로 구성된다.또 다른 구현예에서, R1 또는 R2는 11개의 탄소로 구성된다.또 다른 구현예에서, R1 또는 R2는 7개의 탄소로 구성된다.또 다른 구현예에서, L3은 결합이고, R3은 에틸렌이고, X2는 S이고, 그리고 R4 및 R5 각각은 메틸이다.또 다른 구현예에서, L3은 결합이고, R3은 n-프로필렌이고, X2는 S이고, R4 및 R5 각각은 메틸이다.또 다른 구현예에서, L3은 결합이고, R3은 에틸렌이고, X2는 S이고, 그리고 R4 및 R5 각각은 에틸이다.
숙련가에 의해 인정된 바와 같이, 식 II 및 III의 화합물은 또한 본 개시내용의 범주 내에 있는 염을 형성한다. 본 명세서에서의 식 II 및 III의 화합물에 대한 언급은 달리 나타내지 않는 한 그의 염에 대한 언급을 포함하는 것으로 이해된다. 본 명세서에서 이용된 바와 같은 용어 "염(들)"은 무기 및/또는 유기 산으로 형성된 산성 염뿐만 아니라 무기 및/또는 유기 염기로 형성된 염기성 염을 의미한다. 또한, 식 II 또는 III의 화합물이 염기성 모이어티, 예컨대, 비제한적으로, 피리딘 또는 이미다졸, 및 산성 모이어티, 예컨대, 비제한적으로, 카복실산을 함유하는 경우, 쯔비터이온 ("분자내 염")이 형성될 수 있고 본 명세서에서 사용된 바와 같은 용어 "염(들)"에 포함된다. 다른 염이 또한 유용하지만, 염은 약제학적으로 허용되는 (즉, 무독성, 생리적으로 허용되는) 염일 수 있다. 식 II 또는 III의 화합물의 염은 예를 들어 식 II 또는 III의 화합물을 염이 침전하는 것과 같은 매질에서 또는 수성 매질에서 산 또는 염기의 양, 예컨대 동등량과 반응시키고 이어 동결 건조시킴에 의해 형성될 수 있다.
예시적인 산 부가 염은 아세테이트, 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤조에이트, 벤젠설포네이트, 바이설페이트, 보레이트, 부티레이트, 시트레이트, 캄포레이트, 캄포르설포네이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 푸마레이트, 글루코헵타노에이트, 글리세로포스페이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로클로라이드, 하이드로브로마이드, 하이드로아이오다이드, 2-하이드록시에탄설포네이트, 락테이트, 말레에이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 옥살레이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 살리실레이트, 석시네이트, 설페이트, 설포네이트 (예컨대 본 명세서에서 언급된 것들), 타르타레이트, 티오시아네이트, 톨루엔설포네이트 (토실레이트로도 알려져 있음) 운데카노에이트, 및 기타 동종의 것을 포함한다. 추가로, 염기성 약제학적 화합물로부터 약제학적으로 유용한 염의 형성에 적합한 것으로 일반적으로 간주되는 산은, 예를 들어, S. Berge et al, J. Pharmaceutical Sciences (1977) 66(1)1-19; P. Gould, International J. Pharmaceutics (1986) 33 201-217; Anderson et al, The Practice of Medicinal Chemistry (1996), Academic Press, New York; 및 The Orange Book (그것의 웹사이트 상의 Food & Drug Administration, Washington, D.C.)에 논의되어 있다. 이들 개시내용은 본 명세서에 참고로 편입된다.
예시적인 염기성 염은 암모늄 염, 알칼리 금속 염 예컨대 나트륨, 리튬, 및 칼륨 염, 알칼리 토금속 염 예컨대 칼슘 및 마그네슘 염, 유기 염기를 갖는 염 (예를 들어, 유기 아민) 예컨대 벤자틴, 디사이클로헥실아민, 하이드라바민 (N,N-비스(데하이드로아비에틸)에틸렌디아민으로 형성됨), N-메틸-D-글루카민, N-메틸-D-글루카미드, t-부틸 아민, 및 아미노산 예컨대 아르기닌, 라이신을 갖는 염, 및 기타 동종의 것을 포함한다. 염기성 질소-함유 기는 저급 알킬 할라이드 (예를 들어, 메틸, 에틸, 프로필, 및 부틸 염화물, 브로마이드, 및 아이오다이드), 디알킬 설페이트 (예들 들어, 디메틸, 디에틸, 디부틸, 및 디아밀 설페이트), 장쇄 할라이드 (예를 들어, 데실, 라우릴, 미리스틸, 및 스테아릴 염화물, 브로마이드, 및 아이오다이드), 아릴알킬 할라이드 (예를 들어, 벤질 및 펜에틸 브로마이드), 및 기타와 같은 제제로 사차화될 수 있다.
모든 그와 같은 산 및 염기 염은 본 개시내용의 범위 내의 약제학적으로 허용가능한 염인 것으로 의도되고 모든 산 및 염기 염은 본 개시내용의 목적에 상응하는 화합물의 유리 형태에 동등한 것으로 간주된다. 식 II 또는 III의 화합물은 수화된 형태를 포함하여 불용매화된 및 용매화된 형태로 존재할 수 있다. 일반적으로, 약제학적으로 허용가능한 용매 예컨대 물, 에탄올, 및 동종의 것으로 용매화된 형태는 본 개시내용의 목적에 대해 불용매화된 형태에 동등하다. 식 II 또는 III의 화합물 및 이들의 염, 용매화물은 그것의 호변이성질체 형태로 (예를 들어, 아미드 또는 이미노 에테르로) 존재할 수 있다. 모든 그와 같은 호변이성질체 형태는 본 개시내용의 일부로 본 명세서에서 고려된다.
본 명세서에 기재된 양이온성 지질 화합물은 본 발명의 번역가능 화합물과 조합되어 극미립자, 나노입자, 리포좀, 또는 교질입자를 형성할 수 있다. 입자, 리포좀, 또는 교질입자에 의해 전달되는 본 발명의 번역가능 화합물은 가스, 액체, 또는 고체의 형태로 될 수 있다. 양이온성 지질 화합물 및 번역가능 화합물은 다른 양이온성 지질 화합물, 폴리머 (합성 또는 천연), 계면활성제, 콜레스테롤, 탄수화물, 단백질, 지질, 등과 조합되어 입자를 형성할 수 있다. 이들 입자는 그런 다음 선택적으로 약제학적 부형제와 조합되어 약제학적 조성물을 형성할 수 있다.
특정 구현예에서, 양이온성 지질 화합물은 상대적으로 비-세포독성이다. 양이온성 지질 화합물은 생체적합성 및 생분해성일 수 있다. 양이온성 지질은 대략 5.5 내지 대략 7.5, 더 바람직하게는 대략 6.0과 대략 7.0 사이의 범위인 pKa를 가질 수 있다. 대략 3.0 내지 대략 9.0 사이, 또는 대략 5.0 내지 대략 8.0 사이의 원하는 pKa를 가지도록 설계될 수 있다.
양이온성 지질 화합물을 함유하는 조성물은 30-70% 양이온성 지질 화합물, 0-60% 콜레스테롤, 0-30% 인지질 및 1-10% 폴리에틸렌 글리콜 (PEG)일 수 있다. 바람직하게는, 본 조성물은 30-40% 양이온성 지질 화합물, 40-50% 콜레스테롤, 및 10-20% PEG이다. 다른 바람직한 구현예에서, 본 조성물은 50-75% 양이온성 지질 화합물, 20-40% 콜레스테롤, 및 5 내지 10% 인지질, 및 1-10% PEG이다. 본 조성물은 60-70% 양이온성 지질 화합물, 25-35% 콜레스테롤, 및 5-10% PEG를 함유할 수 있다. 본 조성물은 최대 90% 양이온성 지질 화합물 및 2 내지 15% 헬퍼 지질을 함유할 수 있다. 본 제형은, 예를 들어 8-30% 화합물, 5-30% 헬퍼 지질, 및 0-20% 콜레스테롤; 4-25% 양이온성 지질, 4-25% 헬퍼 지질, 2 내지 25% 콜레스테롤, 10 내지 35% 콜레스테롤-PEG, 및 5% 콜레스테롤-아민; 또는 2-30% 양이온성 지질, 2-30% 헬퍼 지질, 1 내지 15% 콜레스테롤, 2 내지 35% 콜레스테롤-PEG, 및 1-20% 콜레스테롤-아민; 또는 최대 90% 양이온성 지질 및 2-10% 헬퍼 지질, 또는 더욱이는 100% 양이온성 지질을 함유하는 지질 입자 제형일 수 있다.
일부 구현예에서, 하나 이상의 콜레스테롤-계 지질은 콜레스테롤, 페길화된 콜레스테롤 및 DC-Chol (N,N-디메틸-N-에틸카복사미도콜레스테롤), 및 1,4-비스(3-N-올레일아미노-프로필)피페라진으로부터 선택된다. 예시적인 구현예에서, 콜레스테롤-계 지질은 콜레스테롤이다.
일부 구현예에서, 하나 이상의 페길화된 지질, 즉, PEG-변형된 지질. 일부 구현예에서, 하나 이상의 PEG-변형된 지질은 C6-C20 길이의 알킬 사슬(들)을 갖는 지질에 공유결합된 최대 5 kDa 길이의 폴리(에틸렌) 글리콜 사슬을 포함한다. 일부 구현예에서, PEG-변형된 지질은 유도된 세라미드 예컨대 N-옥타노일-스핑고신-1-[석시닐(메톡시 폴리에틸렌 글리콜)-2000]이다. 일부 구현예에서, PEG-변형된 또는 페길화된 지질은 페길화된 콜레스테롤 또는 디미리스토일글리세롤 (DMG)-PEG-2K이다. 예시적인 구현예에서, PEG-변형된 지질은 페길화된 콜레스테롤이다.
추가 구현예에서, 약제학적 조성물은 바이러스 또는 박테리아 벡터 내에 올리고머성 화합물을 함유할 수 있다.
본 개시내용의 약제학적 조성물은 당해 기술에 공지되어 있는 바와 같은 캐리어, 희석제 또는 부형제를 포함할 수 있다. 약제학적 조성물 및 방법의 예는, 예를 들어, Remington's Pharmaceutical Sciences, Mack Publishing Co. (A.R. Gennaro ed. 1985), 및 Remington, The Science and Practice of Pharmacy, 21st Edition (2005)에 기재되어 있다.
약제학적 조성물에 대한 부형제의 예는 산화방지제, 현탁화제, 분산제, 보존제, 완충제, 긴장제, 및 계면활성제를 포함한다.
본 발명의 제제 또는 약제학적 제형의 효과적인 용량은 세포에서 번역가능 분자의 번역을 야기하기에 충분한 양일 수 있다.
치료적으로 효과적인 용량은 치료적 효과를 야기하기에 충분한 제제 또는 제형의 양일 수 있다. 치료적으로 효과적인 용량은 하나 이상의 개별 투여 및 상이한 경로로 투여될 수 있다. 당업계에서 이해되는 바와 같이, 치료적으로 효과적인 용량 또는 치료 유효량은 본 발명의 약제학적 조성물에 함유된 치료제의 총량을 기준으로 대부분 결정된다. 일반적으로, 치료 유효량은 대상체에게 의미있는 이익 (예를 들어, GSD III를 치료, 조절, 치유, 예방 및/또는 개선하는 것)을 달성하기에 충분하다. 예를 들어, 치료 유효량은 원하는 치료적 및/또는 예방적 효과를 달성하기에 충분한 양일 수 있다. 일반적으로, 그것을 필요로 하는 대상체에게 투여되는 치료제 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 양은 대상체의 특성에 따라 달라질 것이다. 그와 같은 특성은 대상체의 상태, 질환 중증도, 일반적인 건강상태, 연령, 성별 및 체중을 포함한다. 당해 분야의 숙련가는 이들 및 다른 관련 인자에 따라 적절한 투약량을 쉽게 결정할 수 있을 것이다. 또한, 최적의 투약 범위를 확인하기 위해 객관적 및 주관적 분석 둘 모두가 사용될 수 있다.
본 명세서에 제공된 방법은 본 명세서에 기재된 치료 유효량의 번역가능 화합물 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 단일뿐만 아니라 다중 투여를 고려한다. AGL을 인코딩하는 번역가능 화합물을 포함하는 약제학적 조성물은 대상체 상태의 본질, 심각성 및 정도 (예를 들어, 대상체의 GSD III 질환 상태의 심각성 및 GSD III의 관련 증상, 및/또는 대상체의 AGL 활성 수준)에 따라 규칙적인 간격으로 투여될 수 있다. 일부 구현예에서, 본 발명의 번역가능 화합물 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 치료 유효량은 규칙적 간격으로 주기적으로 (예를 들어, 매년 1회, 6 개월마다 1회, 4개월마다 1회, 3개월마다 1회, 2 개월마다 1회, 월 1회), 격주로, 매주, 매일, 1일 2회, 1일 3회, 1일 4회, 1일 5회, 1일 6회, 또는 계속해서 투여될 수 있다.
일부 구현예에서, 본 발명의 약제학적 조성물은 이들이 함유된 AGL을 인코딩하는 번역가능 화합물의 서방형 방출에 적합하도록 제형화된다. 이러한 서방형 방출 조성물은 연장된 투약 간격으로 대상체에게 편리하게 투여될 수 있다. 예를 들어, 일 구현예에서, 본 발명의 약제학적 조성물은 1일 2회, 매일 또는 격일로 대상체에게 투여된다. 일부 구현예에서, 본 발명의 약제학적 조성물은 일주일에 2회, 일주일에 1회, 10일마다, 2주마다, 28일마다, 매달, 6주마다, 8주마다, 격월마다, 3개월마다, 4개월마다, 6개월마다, 9개월마다 또는 1년에 1회 대상에게 투여된다. 또한, 장기간에 걸쳐 AGL을 인코딩하는 번역가능 화합물을 전달 또는 방출하기 위해 데포 투여 (예를 들어, 피하로, 근육내로)로 제형화된 약제학적 조성물이 본 명세서에서 고려된다. 바람직하게는, 이용된 서방형 방출 수단은 안정성을 향상시키기 위해 AGL을 인코딩하는 번역가능 화합물에 대해 이루어진 변형과 조합된다.
일부 구현예에서, 치료적으로 효과적인 용량은 투여 시 1-1000 pg/ml, 또는 1-1000 ng/ml, 또는 1-1000 ㎍/ml, 또는 그 초과의 AGL의 혈청 또는 혈장 수준을 초래할 수 있다.
일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료된 대상체에서 증가된 간 AGL 단백질 수준을 초래할 수 있다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물을 투여하는 것은 치료 이전의 대상체에서 기준선 AGL 단백질 수준에 비하여 간 AGL 단백질 수준에서 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95% 증가율을 초래한다. 특정 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 이전의 대상체에서 기준선 간 AGL 수준에 비하여 간 AGL 수준에서 증가를 초래할 것이다. 일부 구현예에서, 기준선 간 AGL 수준에 비한 간 AGL 수준에서의 증가는 적어도 5%, 10%, 20%, 30%, 40%, 50%, 100%, 200%, 또는 그 초과일 것이다.
일부 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 치료 이전 기준선 수준에 비교할 때 간에서 AGL의 증가된 발현을 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료된 대상체의 간에서 총 단백질의 약 10 ng/mg, 약 20 ng/mg, 약 50 ng/mg, 약 100 ng/mg, 약 150 ng/mg, 약 200 ng/mg, 약 250 ng/mg, 약 300 ng/mg, 약 350 ng/mg, 약 400 ng/mg, 약 450 ng/mg, 약 500 ng/mg, 약 600 ng/mg, 약 700 ng/mg, 약 800 ng/mg, 약 900 ng/mg, 약 1000 ng/mg, 약 1200 ng/mg 또는 약 1500 ng/mg 또는 그 이상의 AGL 단백질 수준의 발현을 초래한다.
일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 알라닌 아미노전이효소 (ALT), 아스파르테이트 아미노전이효소 (AST), 알칼리성 포스파타제 (ALP), 크레아틴 포스포키나제 (CPK), 글리코겐, 및 제한 덱스트린 (즉, 글리코겐의 가수분해에 의해 생산된 저-분자 탄수화물)으로부터 선택된 마커 중 하나 이상의 감소된 수준을 초래할 것이다.
일부 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 생물학적 샘플에서 ALT, AST, ALP, 및/또는 CPK 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 ALT, AST, ALP, 및/또는 CPK 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 ALT, AST, ALP, 및/또는 CPK 수준의 감소를 초래한다. 일부 구현예에서, 생물학적 샘플은 혈장, 혈청, 전혈, 소변, 또는 뇌척수액으로부터 선택된다.
특정 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 혈청 또는 혈장 샘플에서, 예를 들어, ALT 활성/리터 (U/l)의 단위로 측정될 때, ALT 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 ALT 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 ALT 수준의 감소를 초래한다. 예시적인 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 ALT 수준에 비교할 때 적어도 약 50%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 ALT 수준의 감소를 초래한다. 추가 예시적인 구현예에서, ALT 수준은 공복 후, 예를 들어, 6, 8, 10, 12, 18, 또는 24 시간 공복 후에 측정된다.
다른 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 혈청 또는 혈장 샘플에서, 예를 들어, AST 활성/리터 (U/l)의 단위로 측정될 때, AST 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 AST 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 AST 수준의 감소를 초래한다. 예시적인 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 AST 수준에 비교할 때 적어도 약 50%까지 생물학적 샘플 (예를 들어, 혈장 또는 혈청 샘플)에서 AST 수준의 감소를 초래한다. 추가 예시적인 구현예에서, AST 수준은 공복 후, 예를 들어, 6, 8, 10, 12, 18, 또는 24 시간 공복 후에 측정된다.
ALT, AST, ALP, 및/또는 CPK 수준의 측정은 당해 분야에 알려진 임의의 방법을 사용하여, 예를 들어, Liu et al., 2014, Mol Genet and Metabolism 111: 467-76에 설명된 Fuji Dri-Chem Clinical Chemistry Analyzer FDC 3500을 사용하여 이루어질 수 있다.
다른 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 생물학적 샘플에서 글리코겐 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 글리코겐 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 간 샘플)에서 글리코겐 축적의 감소를 초래한다. 일부 구현예에서, 생물학적 샘플은 간, 심장, 횡격막, 사두근, 및 비복근으로부터 선택된 장기의 부분이다. 예시적인 구현예에서, 생물학적 샘플은 간 분절, 예를 들어, 간세포의 영역이다.
다른 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 생물학적 샘플에서 한계 덱스트린 수준의 감소를 초래한다. 일부 구현예에서, 본 발명의 번역가능 분자를 포함하는 조성물의 치료적으로 효과적인 용량을 투여하는 것은 치료 전 기준선 한계 덱스트린 수준에 비교할 때 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%까지 생물학적 샘플 (예를 들어, 간 샘플)에서 한계 덱스트린 축적의 감소를 초래한다. 일부 구현예에서, 생물학적 샘플은 간, 심장, 횡격막, 사두근, 및 비복근으로부터 선택된 장기의 부분이다. 예시적인 구현예에서, 생물학적 샘플은 간 분절, 예를 들어, 간세포의 영역이다. 추가 예시적인 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 치료 전 기준선 한계 덱스트린 수준에 비교할 때 간 샘플에서 한계 덱스트린 수준의 적어도 50%, 60%, 70%, 또는 80% 감소를 초래한다.
추가 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 치료된 대상체에서 간 섬유증의 발병을 지연시킨다. 일부 구현예에서, 규칙적으로 투여된 경우 치료적으로 효과적인 용량은 간 섬유증의 전개를 늦추거나 또는 GSD III에 시달리는 대상체에서 간 섬유증의 양을 감소시킨다.
활성제 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 생체내 치료적으로 효과적인 용량은 약 0.001 내지 약 500 mg/kg 체중의 용량일 수 있다. 예를 들어, 치료적으로 효과적인 용량은 약 0.001-0.01 mg/kg 체중, 또는 0.01-0.1 mg/kg, 또는 0.1-1 mg/kg, 또는 1-10 mg/kg, 또는 10-100 mg/kg일 수 있다. 일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 약 0.1 내지 약 10 mg/kg 체중, 예를 들어, 약 0.5 내지 약 5 mg/kg, 약 1 내지 약 4.5 mg/kg, 또는 약 2 내지 약 4 mg/kg의 범위인 용량 제공된다
활성제 (예를 들어, AGL을 인코딩하는 번역가능한 올리고머)의 생체내 치료적으로 효과적인 용량은 적어도 약 0.001 mg/kg 체중, 또는 적어도 약 0.01 mg/kg, 또는 적어도 약 0.1 mg/kg, 또는 적어도 약 1 mg/kg, 또는 적어도 약 2 mg/kg, 또는 적어도 약 3 mg/kg, 또는 적어도 약 4 mg/kg, 또는 적어도 약 5 mg/kg, 적어도 약 10 mg/kg, 적어도 약 20 mg/kg, 적어도 약 50 mg/kg, 또는 그 초과의 용량일 수 있다. 일부 구현예에서, AGL을 인코딩하는 번역가능한 올리고머는 약 0.1 mg/kg, 약 0.5 mg/kg, 약 1 mg/kg, 약 1.5 mg/kg, 약 2 mg/kg, 약 2.5 mg/kg, 약 3 mg/kg, 약 3.5 mg/kg, 약 4 mg/kg, 약 5 mg/kg, 또는 약 6, 7, 8, 9, 10, 15, 20, 25, 50, 75, 또는 100 mg/kg의 용량으로 제공된다.
본 명세서에서 도시된 핵염기 서열은 달리 언급되지 않는 한 좌측에서 우측으로 5'에서 3'이다.
형질감염
일부 실험에서, 번역가능 메신저 분자는 96웰 플레이트에서 Hepa1-6 또는 AML12 세포 안으로 형질감염된다. MessengerMAX 형질감염 시약 (Thermo Fisher Scientific)이 모든 형질감염에 대해 제조자의 지침에 의해 사용되었다. 다른 적합한 세포주는 HEK293 및 Hep3B 세포를 포함한다.
시험관내 형질감염 프로토콜의 예는 아래와 같다:
형질감염 적어도 8 시간 전에 96웰 플레이트에 웰당 간세포 Hepa1-6 세포 5000 세포를 도말한다.
형질감염 실험을 개시하기 직전 96웰 플레이트의 각 웰에 90 μL를 부가하여 10% FBS 및 비-필수 아미노산)을 함유하는 90 μL DMEM 배지를 교체한다.
제조자의 지침에 따라 MessengerMAX 형질감염 시약 (Thermo Fisher Scientific) 번역가능 분자 복합체를 제조한다.
10 μL의 복합체를 96-웰 플레이트에 세포를 함유하는 웰 안으로 옮긴다.
원하는 시점 후 배지를 수집하고 각 웰에 100 μL 신선한 배지를 부가한다. 배지는 표준 제조자 프로토콜을 사용하여 AGL에 대한 ELISA 검정을 수행할 때까지 -80℃로 유지될 것이다.
생체내 형질감염 프로토콜의 예는 아래와 같다:
번역가능 분자는 나노입자로 제형화된다.
측면 꼬리 정맥에 표준 i.v. 주사를 통해 나노입자-제형화된 번역가능 분자 (1 mg/kg)를 BL57BL/c 마우스 (4-6 주령)에 주입한다.
주사 후 적합한 시간에 헤파린-코팅된 마이크로원심관에 대략 50 ㅅL의 혈액을 수집한다.
3,000 X g에서 10 분 동안 4℃에서 원심분리한다.
상청액 (혈장)은 신선한 마이크로원심관 안으로 옮긴다. 혈장은 표준 제조자 프로토콜을 사용하여 AGL에 대한 ELISA 검정을 수행할 때까지 -80℃로 유지될 것이다.
나노입자 제형
지질 나노입자는 mRNA를 함유하는 에탄올/수성 완충액에서 적절한 용적의 지질을 사용하여 mRNA를 함유하여 제조될 수 있다. Nanossemblr 미세유체 디바이스는 이러한 목적을 위해 사용될 수 있고, 이어서 다운스트림 처리가 이어진다. 예를 들어, 나노입자를 제조하기 위해, 원하는 양의 표적화된 mRNA를 5mM 시트르산 완충액 (pH 3.5)에 용해시킬 수 있다. 지질은 에탄올에 적절한 몰비로 용해될 수 있다. 구성성분 지질에 대한 몰 백분율 비는, 예를 들어, 50% 이온화가능 지질, 7% DSPC (1,2-디스테아로일-sn-글리세로-3-포스포콜린; 아반티 극성 지질), 40% 콜레스테롤 (아반티 극성 지질), 및 3% DMG-PEG (1,2-디미리스토일-sn-글리세롤, 메톡시폴리에틸렌 글리콜, PEG 사슬 분자량: 2000; NOF America Corporation)일 수 있다. 다음으로, 지질 및 mRNA 용액은 1:3 (에탄올:수성상)의 유량비로 미세유체 장치 (Precision NanoSystems)에 조합될 수 있다. 총 조합된 유량은 12 mL/분일 수 있다. 지질 나노입자가 형성되고 투석 장치 (Float-a-lyzer, Spectrum Labs)에서 인산염 완충액을 사용하여 밤새 투석하고, 이어서 Amicon Ultra-15 원심 필터 (Merck Millipore)를 사용하여 농축함에 의해 후속적으로 정제될 수 있다. 입자 크기는 동적 광 산란 (ZEN3600, Malvern Instruments)에 의해 결정될 수 있다. "캡슐화" 효율은 RiboGreen (Molecular Probes)을 LNP 슬러리 (Fi)에 첨가할 때 형광에 의해 측정된 캡슐화되지 않은 mRNA 함량을 결정함에 의해 계산될 수 있고; 이어서, 값을 1% Triton X-100 (Ft)에 의해 LNP의 용해시 수득된 총 mRNA 함량과 비교하였으며, 여기서 "캡슐화"의 백분율 = (Ft-Fi)/Ft x 100이다. 캡슐화는 형태에 무관하게 나노 입자에 mRNA의 봉입을 지칭할 수 있다.
세포내 웨스턴
96-웰 콜라겐 플레이트를 사용하여 DMEM/FBS 배양 배지에서 세포를 적절한 밀도로 시딩하였다. 최적의 합류점에서, 세포를 형질감염 시약 혼합물 (MessengerMax 및 Opti-MEM)에 희석된 표적화된 mRNA로 형질감염시켰다. 세포를 CO2 인큐베이터에 배치하고 성장시켰다. 원하는 시점에, 배지를 제거하고 세포를 20분 동안 4% 신선한 PFA에 고정시켰다. 그 후, 고정제를 제거하고 세포를 TBST에서 5분 동안 여러 번 투과시켰다. 투과화 세정이 완료되면, 세포를 차단 완충액과 함께 45분 동안 인큐베이션하였다. 이어서 일차 항체를 첨가하고 실온에서 1시간 동안 인큐베이션하였다. 그 후, 세포를 TBST로 수회 세정하고, 그 다음 차단 완충액에 희석되고 CellTag 700 염색을 함유하는 이차 항체와 함께 1시간 동안 인큐베이션하였다. 최종적으로 하기 위해, 세포를 TBST에서 수회 세정하고 그 다음 TBS에서 마지막 세정하였다. 그런 다음, Licor 검출 시스템을 사용하여 플레이트를 이미지화하고, CellTag 700으로 라벨링된 총 세포의 수로 데이터를 표준화하였다.
꼬리 PCR 생성물 생성
각각의 mRNA 발현 작제물을 함유하는 플라스미드 DNA (10 ng)가 제조자의 지침에 따라 2X KAPA HiFi PCR 믹스 (KR0370)와의 50 μl PCR 반응에서 polyA 꼬리 120 PCR 생성물을 생성하는 데 사용될 수 있다. 그런 다음 Thermo Fisher Scientific으로부터의 2% 겔 상에서 생성물이 검사될 수 있고 저분자량 사다리 (Thermo Fisher Scientific, 10068-013)의 강도를 기준으로 대략 정량화되고 Qiagen PCR 정제 키트로 세정되고 50ul 물에서 재현탁될 수 있다.
합성을 위한 시험관내 전사 (IVT)
하기 프로토콜은 약 1 mg의 RNA를 생성해야 하는 NEB HiScribe T7 RNA 중합효소 시약을 사용한 200 μl IVT 반응에 대한 것이다. 2.5X NTP 믹스는 필요에 따라 개별 100mM NTP 스톡 (ATP, GTP, CTP 및 UTP 뉴클레오타이드 또는 화학적으로 변형된 대응물)을 해동하고 함께 모아서 제조되었다. IVT 반응의 경우, 약 2-4 μg의 템플레이트가 200 μl 반응에 사용되었다. 10X IVT 반응 완충제, 2.5X dNTP 믹스, 템플레이트 DNA 및 T7 RNA 중합효소는 피펫팅에 의해 잘 혼합되고 37℃에서 4시간 동안 인큐베이션된다. DNA 템플레이트를 분해하기 위해, IVT 반응을 700ul의 뉴클레아제가 없는 물에 희석하고 그 다음 10X DNase I 완충액 및 20ul의 RNase가 없는 DNase I을 IVT 믹스에 첨가하고 15분 동안 37℃에서 인큐베이션한다. 그런 다음 희석된 (1ml까지) DNase 처리된 반응은 제조자의 지침에 따라 RNase가 없는 물에서 최종 용출로 Qiagen RNeasy Maxi 컬럼으로 정제된다. 정제된 RNA는 그 다음 사용된 재현탁 완충액에 따라, A260/A280이 약 1.8-2.2이어야 하는 UV 흡광도에 의해 정량화된다.
IVT RNA의 효소적 캡핑
효소적 캡핑을 위해, 50X 확장된 버전의 NEB의 1-단계 캡핑 및 2'O-메틸화 반응이 사용될 수 있으며, 이는 최대 1mg의 IVT 전사체를 처리하는 데 적합하다. 전사체 길이가 100 nt 정도로 짧다는 가정하에 20 μl 반응에서 10 μg RNA가 권장된다. 그러나, 전사체에 대해 더 높은 기질-대-반응 용적이 허용가능하며, 이는 일반적으로 길이가 더 길다 (약 300-600nt). 캡핑 반응을 개시하기 전에, RNA는 65℃에서 5분 동안 변성되고, 그 다음 스냅 냉각되어 임의의 이차 형태를 완화시킨다. 총 1 ml 캡핑 반응을 위해, 700 μl의 뉴클레아제가 없는 물에 변성된 RNA 1 mg가 100 μl (10X) 캡핑 완충액, 50 μl (10 mM) GTP, 50 μl (4 mM) SAM, 50 μl의 (10 U/μl) 백시니아 캡핑 효소 및 50 μl의 mRNA cap 2'-O-메틸전달효소와 함께 (50 U/μl)에서 사용되고 조합되고 37℃에서 1시간 동안 인큐베이션되었다. 수득한 캡핑된 mRNA를 RNase 유리수를 사용하여 용리시키고, RNeasy 컬럼에서 재정제하고, 나노드롭으로 정량화하였다. mRNA는 또한 변성 및 스냅-냉각 후 변성 겔에서 레인 당 500 ng의 정제된 생성물을 실행시킴에 의해 겔 상에서 시각화하여 이차 구조를 제거한다.
실시예
실시예 1: 참조 번역가능 분자 534.
이 실시예에서, 참조 번역가능 분자 534를 제작하여 인간 WT 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현시키기 위해 사용하였다. 번역가능 분자는 5' cap (7mGpppG), TEV의 5' UTR, 코작 서열, WT AGL CDS (서열번호 1), 제노푸스 베타-글로빈의 3'UTR, 및 114 As로 구성된 폴리(A) 꼬리 영역 (즉, "폴리(A) 114 꼬리 영역")을 포함했다. 참조 번역가능 분자는 AGL CDS의 즉시 다운스트림인 서열번호 40의 서열을 더 포함했다. 이 참조 번역가능 분자는 우리딘 대신에 N1-메틸슈도우리딘으로 합성되었다.
이 참조 번역가능 분자의 구조의 세부사항은 아래와 같다: 서열번호 3의 담배 식각 바이러스 (TEV) 5' UTR, 서열번호 4의 코작 서열, 서열번호 5의 제노푸스 베타-글로빈 (XBG) 3' UTR, 및 서열번호 6의 폴리(A) 114 꼬리.
하기 실시예에서 번역가능 분자는 m7GpppGm cap인 5' cap으로 합성될 수 있다. 하기 실시예에서 번역가능 분자는 5'-UTR (예를 들어, TEV (서열번호 3)의 5' UTR), 번역 개시 서열 (예를 들어, 서열번호 4의 코작 서열), 서열번호 40의 서열, 3' UTR (예를 들어, 제노푸스 베타-글로빈 (서열번호 5)의 3' UTR), 및 폴리(A) 꼬리 (예를 들어, 서열번호 6, 서열번호 38, 또는 서열번호 39의 polyA 꼬리)를 함유할 수 있다.
실시예 2: AGL을 인코딩하는 번역가능 분자.
이 실시예에서, 번역가능 분자 522-533, 546, 730-740, 및 1783-1784를 제작하여 유익하게 상승된 번역의 효능으로 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현시키기 위해 사용하였다. 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)를 발현하는 이들 번역가능 분자는 GSD III을 개선하거나 또는 치료하는 방법에 사용하기에 적합한 활성을 나타냈다. 이들 번역가능 분자는 5' cap (7mGpppG), TEV의 5' UTR, 코작 서열, AGL CDS, 및 제노푸스 베타-글로빈의 3'UTR을 포함했다. 번역가능 분자 522-533, 546, 및 1783-1784는 폴리(A) 114 꼬리 영역을 더 포함한다. 번역가능 분자 730은 폴리(A) 100 꼬리 영역을 더 포함하고, 반면에 번역가능 분자 731-740은 폴리(A) 110 꼬리 영역을 더 포함한다. 번역가능 분자 522-533, 546, 730-740, 및 1783-1784는 AGL CDS의 즉시 다운스트림인 서열번호 40의 서열을 더 포함한다. 폴리(A) 114 꼬리 영역과는 대조적으로 폴리(A) 100 꼬리 영역을 함유하는 것을 제외하고, 각각 546 및 1783과 동일한 2개의 추가의 번역가능 분자 - 2258 및 2259 -가 전개되었다. 1783 및 2259의 코딩 서열은 서열번호 45에서 반영된 바와 같이 12개 뉴클레오타이드 차이를 함유하도록 선택적으로 변형될 수 있다. 이 실시예에서 기재된 번역가능 분자는 우리딘 대신에 N1-메틸슈도우리딘으로 합성되었다.
각각의 번역가능 분자에서 AGL CDS는 하기 서열로 구성된다:
본 실시예의 번역가능 분자는 AML12 및 C2C12 세포에서 번역되어 인간 AGL을 생산했다.
실시예 3: 제노푸스 베타-글로빈 3'UTR에 기초한 번역 향상제.
이 실시예에서, 번역가능 분자의 번역 효율을 향상시키는 데 사용하기 위한 3' UTR 서열의 구조가 도시되어 있다.
서열번호 33-37에 도시된 염기 서열은 기능성에서 제노푸스 베타-글로빈의 3'-UTR에 상응할 수 있는 번역가능 분자의 부분이다. 완전한 번역가능 분자는 5' cap (m7GpppGm), 5'-UTR, 및 하기 서열의 코딩 영역 (CDS) 업스트림, 및 하기 서열의 polyA 꼬리 다운스트림을 포함하고, 그 각각은 천연 인간 mRNA의 구조에 상응한다. 상기에서 나타낸 바와 같이, 코작 서열이 선택적으로 사용될 수 있다. 따라서, 하기 단편을 편입한 번역가능 분자는 향상된 번역 효율을 가질 수 있다. 제노푸스 베타-글로빈 유전자 서열은 수탁 번호 NM_001096347.1에 도시되어 있다.
실시예 4: 인간 일차 간세포에서 AGL 발현
이 실시예에서, 인간 일차 간세포는 코돈-최적화된 mRNA 분자 546, 1783, 및 1784로 형질감염되었다. AGL 단백질 발현은 형질감염 6, 24, 48, 및 72 시간 후에서 In-Cell WesternTM에 의해 측정되었다. 미처리된 대조군 ("unt")과 비교될 때 mRNA 서열의 발현은 도 5에 도시되어 있다.
실시예 5: 야생형 마우스에서 AGL 단백질 발현의 생체내 분석
이 실시예에서, 야생형 C57BL/6 마우스에 지질 나노입자로 제형화된 인간 AGL mRNA를 주입했다. 마우스를 주사 6 시간 후 희생시켰다. 간 생검 샘플을 마우스로부터 취하고, 간 균질물에서 인간 및 마우스 AGL 단백질 발현을 분석하였다. 도 6은 다양한 mRNA 분자로부터 인간 AGL 단백질의 이소성 발현을 도시한다. 도 7은 처리된 마우스에 걸쳐 마우스 AGL 단백질의 내인성 발현의 유사한 수준을 나타내는, 마우스 AGL 단백질 수준을 도시한다. 번역가능 분자 546.7 -도 6 및 7에서 나타낸 바와 같음-은 번역가능 분자 546에 동일한 핵염기 서열을 가지지만, N1-메틸슈도우리딘 대신에 우리딘의 위치에 5-메톡시우리딘으로 합성되었다.
실시예 6: mRNA 처리는 GSD3 마우스에서 글리코겐 축적을 감소시킨다
이 실시예에서, AGL 넉아웃 마우스를 비히클 또는 ATX2 지질 나노입자로 제형화된 번역가능 분자 546으로 처리하였다. 비히클로 처리된 넉아웃 마우스 ("VEH")로부터의 간은 간세포의 현저한 내지 중증 공포화 및 간세포 내의 글리코겐 축적에서 중간 내지 현저한 증가를 나타냈다 (도 8). 그에 반해서, ATX2 지질 나노입자로 제형화된 번역가능 분자 546으로 처리된 넉아웃 마우스로부터의 간은 단지 간세포의 경도 내지 중간 정도 공포화 및 간세포 내의 글리코겐 축적에서 단지 경도 내지 중간 정도 증가를 가졌다 (도 9). 이 실시예에서 나타난 조직병리 결과에 기초하여, 비히클로 처리된 KO 마우스와 비교하여 mRNA로 처리된 넉아웃 마우스로부터의 간에서의 간세포 공포화 및 글리코겐 축적의 중증도에서의 감소가 있는 것으로 보인다.
실시예 7: AGL을 발현하는 추가의 번역가능 분자
4개의 추가의 번역가능 분자 - 1970, 1987, SD1, 및 SD2 - 가 각각 서열번호 41, 42, 43, 및 44에 도시된 추가로 변형된 코돈-최적화된 인간 AGL 코딩 서열로 설계되었다. 번역가능 분자 1970, 1987, SD1, 및 SD2는 5' cap (7mGpppG), TEV의 5' UTR, 코작 서열, 코딩 서열의 즉시 다운스트림 서열번호 40의 서열, 제노푸스 베타-글로빈의 3' UTR, 및 폴리(A) 꼬리 영역 (예를 들어, 폴리(A) 100, 110, 또는 114 꼬리 영역)을 더 포함한다. 이들 번역가능 분자는 우리딘의 위치에 N1-메틸슈도우리딘 또는 5-메톡시우리딘 중 어느 하나로 선택적으로 합성될 수 있다.
본 명세서에 구체적으로 언급된 모든 공보, 특허 및 문헌은 모든 목적을 위해 참고로 포함된다.
본 발명은 다양할 수 있기 때문에 기재된 특정 방법론, 프로토콜, 물질 및 시약에 제한되지 않는 것으로 이해된다. 또한, 본 명세서에서 사용된 용어는 단지 특정 구현예들을 설명하기 위한 것이고, 첨부된 청구범위에 의해 포함될 본 발명의 범위를 제한하는 것으로 의도되지 않는다는 것을 이해해야 한다.
본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태는 문맥상 명백하게 다르게 지시되지 않는 한 복수의 참조를 포함한다는 것에 유의해야 한다. 또한, 용어 "a" (또는 "an"), "하나 이상" 및 "적어도 하나"는 본 명세서에서 상호교환적으로 사용될 수 있다. 용어 "포함하다", "포함하는", "함유하는", "포괄하는" 및 "갖는"은 상호교환적으로 사용될 수 있음을 또한 유의해야 한다.
추가의 부연 없이, 당 업계의 통상인은 상기 상세한 설명에 기초하여 본 발명을 최대한 정도로 활용할 수 있는 것으로 여겨진다. 이하 특정 구현예는 따라서 단지 예시적인 것으로 해석되어야 하며, 어떠한 방식으로 든 본 개시내용의 나머지를 제한하지 않는다.
본 명세서에 개시된 모든 특징들은 임의의 조합으로 결합될 수 있다. 본 명세서에 개시된 각각의 특징은 동일하거나, 동등하거나 또는 유사한 목적을 제공하는 대안적인 특징에 의해 대체될 수 있다.
<110> Ultragenyx Pharmaceutical Inc.
<120> THERAPEUTICS FOR GLYCOGEN STORAGE DISEASE TYPE III
<130> 2019-FPA-9715
<150> US 62/513,350
<151> 2017-05-31
<160> 45
<170> PatentIn version 3.5
<210> 1
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Consensus Human AGL Coding Sequence
<400> 1
augggacaca guaaacagau ucgaauuuua cuucugaacg aaauggagaa acuggaaaag 60
acccucuuca gacuugaaca aggguaugag cuacaguucc gauuaggccc aacuuuacag 120
ggaaaagcag uuaccgugua uacaaauuac ccauuuccug gagaaacauu uaauagagaa 180
aaauuccguu cucuggauug ggaaaaucca acagaaagag aagaugauuc ugauaaauac 240
uguaaacuua aucugcaaca aucugguuca uuucaguauu auuuccuuca aggaaaugag 300
aaaaguggug gagguuacau aguuguggac cccauuuuac guguuggugc ugauaaucau 360
gugcuacccu uggacugugu uacucuucag acauuuuuag cuaaguguuu gggaccuuuu 420
gaugaauggg aaagcagacu uaggguugca aaagaaucag gcuacaacau gauucauuuu 480
accccauugc agacucuugg acuaucuagg ucaugcuacu cccuugccaa ucaguuagaa 540
uuaaauccug acuuuucaag accuaauaga aaguauaccu ggaaugaugu uggacagcua 600
guggaaaaau uaaaaaagga auggaauguu auuuguauua cugauguugu cuacaaucau 660
acugcugcua auaguaaaug gauccaggaa cauccagaau gugccuauaa ucuugugaau 720
ucuccacacu uaaaaccugc cugggucuua gacagagcac uuuggcguuu cuccugugau 780
guugcagaag ggaaauacaa agaaaaggga auaccugcuu ugauugaaaa ugaucaccau 840
augaauucca uccgaaaaau aauuugggag gauauuuuuc caaagcuuaa acucugggaa 900
uuuuuccaag uagaugucaa caaagcgguu gagcaauuua gaagacuucu uacacaagaa 960
aauaggcgag uaaccaaguc ugauccaaac caacaccuua cgauuauuca agauccugaa 1020
uacagacggu uuggcuguac uguagauaug aacauugcac uaacgacuuu cauaccacau 1080
gacaaggggc cagcagcaau ugaagaaugc uguaauuggu uucauaaaag aauggaggaa 1140
uuaaauucag agaagcaucg acucauuaac uaucaucagg aacaggcagu uaauugccuu 1200
uugggaaaug uguuuuauga acgacuggcu ggccaugguc caaaacuagg accugucacu 1260
agaaagcauc cuuuaguuac cagguauuuu acuuucccau uugaagagau agacuucucc 1320
auggaagaau cuaugauuca ucugccaaau aaagcuuguu uucugauggc acacaaugga 1380
uggguaaugg gagaugaucc ucuucgaaac uuugcugaac cggguucaga aguuuaccua 1440
aggagagaac uuauuugcug gggagacagu guuaaauuac gcuaugggaa uaaaccagag 1500
gacuguccuu aucucugggc acacaugaaa aaauacacug aaauaacugc aacuuauuuc 1560
cagggaguac gucuugauaa cugccacuca acaccucuuc acguagcuga guacauguug 1620
gaugcugcua ggaauuugca acccaauuua uauguaguag cugaacuguu cacaggaagu 1680
gaagaucugg acaaugucuu uguuacuaga cugggcauua guuccuuaau aagagaggca 1740
augagugcau auaauaguca ugaagagggc agauuaguuu accgauaugg aggagaaccu 1800
guuggauccu uuguucagcc cuguuugagg ccuuuaaugc cagcuauugc acaugcccug 1860
uuuauggaua uuacgcauga uaaugagugu ccuauugugc auagaucagc guaugaugcu 1920
cuaccaagua cuacaauugu uucuauggca uguugugcua guggaaguac aagaggcuau 1980
gaugaauuag ugccucauca gauuucagug guuucugaag aacgguuuua cacuaagugg 2040
aauccugaag cauugccuuc aaacacaggu gaaguuaauu uccaaagcgg cauuauugca 2100
gccaggugug cuaucaguaa acuucaucag gagcuuggag ccaaggguuu uauucaggug 2160
uauguggauc aaguugauga agacauagug gcaguaacaa gacacucacc uagcauccau 2220
cagucuguug uggcuguauc uagaacugcu uucaggaauc ccaagacuuc auuuuacagc 2280
aaggaagugc cucaaaugug caucccuggc aaaauugaag aaguaguucu ugaagcuaga 2340
acuauugaga gaaacacgaa accuuauagg aaggaugaga auucaaucaa uggaacacca 2400
gauaucacag uagaaauuag agaacauauu cagcuuaaug aaaguaaaau uguuaaacaa 2460
gcuggaguug ccacaaaagg gcccaaugaa uauauucaag aaauagaauu ugaaaacuug 2520
ucuccaggaa guguuauuau auucagaguu agucuugauc cacaugcaca agucgcuguu 2580
ggaauucuuc gaaaucaucu gacacaauuc aguccucacu uuaaaucugg cagccuagcu 2640
guugacaaug cagauccuau auuaaaaauu ccuuuugcuu cucuugccuc cagauuaacu 2700
uuggcugagc uaaaucagau ccuuuaccga ugugaaucag aagaaaagga agauggugga 2760
gggugcuaug acauaccaaa cuggucagcc cuuaaauaug caggucuuca agguuuaaug 2820
ucuguauugg cagaaauaag accaaagaau gacuuggggc auccuuuuug uaauaauuug 2880
agaucuggag auuggaugau ugacuauguc aguaaccggc uuauuucacg aucaggaacu 2940
auugcugaag uugguaaaug guugcaggcu auguucuucu accugaagca gaucccacgu 3000
uaccuuaucc cauguuacuu ugaugcuaua uuaauuggug cauauaccac ucuucuggau 3060
acagcaugga agcagauguc aagcuuuguu cagaaugguu caaccuuugu gaaacaccuu 3120
ucauuggguu caguucaacu guguggagua ggaaaauucc cuucccugcc aauucuuuca 3180
ccugcccuaa uggauguacc uuauagguua aaugagauca caaaagaaaa ggagcaaugu 3240
uguguuucuc uagcugcagg cuuaccucau uuuucuucug guauuuuccg cugcugggga 3300
agggauacuu uuauugcacu uagagguaua cugcugauua cuggacgcua uguagaagcc 3360
aggaauauua uuuuagcauu ugcggguacc cugaggcaug gacucauucc uaaucuacug 3420
ggugaaggaa uuuaugccag auacaauugu cgggaugcug ugugguggug gcugcagugu 3480
auccaggauu acuguaaaau gguuccaaau ggucuagaca uucucaagug cccaguuucc 3540
agaauguauc cuacagauga uucugcuccu uugccugcug gcacacugga ucagccauug 3600
uuugaaguca uacaggaagc aaugcaaaaa cacaugcagg gcauacaguu ccgagaaagg 3660
aaugcugguc cccagauaga ucgaaacaug aaggacgaag guuuuaauau aacugcagga 3720
guugaugaag aaacaggauu uguuuaugga ggaaaucguu ucaauugugg cacauggaug 3780
gauaaaaugg gagaaaguga cagagcuaga aacagaggaa ucccagccac accaagagau 3840
gggucugcug uggaaauugu gggccugagu aaaucugcug uucgcugguu gcuggaauua 3900
uccaaaaaaa auauuuuccc uuaucaugaa gucacaguaa aaagacaugg aaaggcuaua 3960
aagguaucau augaugagug gaacagaaaa auacaagaca acuuugaaaa gcuauuucau 4020
guuuccgaag acccuucaga uuuaaaugaa aagcauccaa aucugguuca caaacguggc 4080
auauacaaag auaguuaugg agcuucaagu ccuuggugug acuaucagcu caggccuaau 4140
uuuaccauag caaugguugu ggccccugag cucuuuacua cagaaaaagc auggaaagcu 4200
uuggagauug cagaaaaaaa auugcuuggu ccccuuggca ugaaaacuuu agauccagau 4260
gauaugguuu acuguggaau uuaugacaau gcauuagaca augacaacua caaucuugcu 4320
aaagguuuca auuaucacca aggaccugag uggcuguggc cuauugggua uuuucuucgu 4380
gcaaaauuau auuuuuccag auugaugggc ccggagacua cugcaaagac uauaguuuug 4440
guuaaaaaug uucuuucccg acauuauguu caucuugaga gauccccuug gaaaggacuu 4500
ccagaacuga ccaaugagaa ugcccaguac uguccuuuca gcugugaaac acaagccugg 4560
ucaauugcua cuauucuuga gacacuuuau gauuuauag 4599
<210> 2
<211> 1532
<212> PRT
<213> Artificial Sequence
<220>
<223> Consensus Human AGL Amino Acid Sequence
<400> 2
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
151015 151019 151024 151029
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
151034 151039 151044
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
151049 151054 151059
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
151064 151069 151074
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
151079 151084 151089 151094
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
151099 151104 151109
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
151114 151119 151124
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
151129 151134 151139
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
151144 151149 151154
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
151159 151164 151169 151174
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
151179 151184 151189
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
151194 151199 151204
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
151209 151214 151219
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
151224 151229 151234
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
151239 151244 151249 151254
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
151259 151264 151269
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
151274 151279 151284
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
151289 151294 151299
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
151304 151309 151314
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
151319 151324 151329 151334
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
151339 151344 151349
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
151354 151359 151364
Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu
151369 151374 151379
Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu
151384 151389 151394
Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
151399 151404 151409 151414
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
151419 151424 151429
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
151434 151439 151444
Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
151449 151454 151459
Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly
151464 151469 151474
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
151479 151484 151489 151494
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
151499 151504 151509
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
151514 151519 151524
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
151529 151534 151539
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
151544 151549 151554
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
151559 151564 151569 151574
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
151579 151584 151589
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
151594 151599 151604
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
151609 151614 151619
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
151624 151629 151634
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
151639 151644 151649 151654
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
151659 151664 151669
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
151674 151679 151684
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn
151689 151694 151699
Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala
151704 151709 151714
Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
151719 151724 151729 151734
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser
151739 151744 151749
Pro Ser Ile His Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg
151754 151759 151764
Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
151769 151774 151779
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg
151784 151789 151794
Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro
151799 151804 151809 151814
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
151819 151824 151829
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile
151834 151839 151844
Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe
151849 151854 151859
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
151864 151869 151874
Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala
151879 151884 151889 151894
Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala
151899 151904 151909
Ser Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu
151914 151919 151924
Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp
151929 151934 151939
Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala
151944 151949 151954
Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu
151959 151964 151969 151974
Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser
151979 151984 151989
Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe
151994 151999 152004
Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp
152009 152014 152019
Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys
152024 152029 152034
Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu
152039 152044 152049 152054
Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu
152059 152064 152069
Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu
152074 152079 152084
Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu
152089 152094 152099
Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe
152104 152109 152114
Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala
152119 152124 152129 152134
Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile
152139 152144 152149
Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp
152154 152159 152164
Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val
152169 152174 152179
Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro
152184 152189 152194
Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu
152199 152204 152209 152214
Phe Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln
152219 152224 152229
Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp
152234 152239 152244
Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val
152249 152254 152259
Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly
152264 152269 152274
Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp
152279 152284 152289 152294
Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp
152299 152304 152309
Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr
152314 152319 152324
Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn
152329 152334 152339
Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp
152344 152349 152354
Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly
152359 152364 152369 152374
Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln
152379 152384 152389
Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe
152394 152399 152404
Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu
152409 152414 152419
Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr
152424 152429 152434
Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala
152439 152444 152449 152454
Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly
152459 152464 152469
Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu
152474 152479 152484
Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His
152489 152494 152499
Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr
152504 152509 152514
Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp
152519 152524 152529 152534
Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
152539 152544
<210> 3
<211> 129
<212> RNA
<213> Tobacco Etch Virus
<400> 3
ucaacacaac auauacaaaa caaacgaauc ucaagcaauc aagcauucua cuucuauugc 60
agcaauuuaa aucauuucuu uuaaagcaaa agcaauuuuc ugaaaauuuu caccauuuac 120
gaacgauag 129
<210> 4
<211> 6
<212> RNA
<213> Unknown
<220>
<223> Kozak Sequence
<400> 4
gccacc 6
<210> 5
<211> 158
<212> RNA
<213> Xenopus sp.
<400> 5
cuagugacug acuaggaucu gguuaccacu aaaccagccu caagaacacc cgaauggagu 60
cucuaagcua cauaauacca acuuacacuu acaaaauguu gucccccaaa auguagccau 120
ucguaucugc uccuaauaaa aagaaaguuu cuucacau 158
<210> 6
<211> 114
<212> RNA
<213> Unknown
<220>
<223> Poly(A) 114 Tail
<400> 6
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 114
<210> 7
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 7
augggacacu ccaaacagau ccggauacug cugcugaacg agauggaaaa gcuggaaaag 60
acucuauucc ggcucgagca gggauacgag cugcaguucc gccugggccc cacccuacaa 120
gggaaggccg ugaccgucua caccaacuac ccuuucccgg gcgaaacuuu caaccgggag 180
aaguuccggu cccuugacug ggaaaacccg acugagcgcg aggacgacuc ggacaaauac 240
ugcaagcuga accuccagca gucgggcucu uuccaauauu acuucuugca agggaacgag 300
aaguccggug gcggcuacau cgugguggac ccaauuuugc gcgugggggc ugacaaccac 360
gugcugccac uggauugugu gacccugcaa accuuccugg ccaagugccu cggccccuuc 420
gacgaauggg agucgcgccu gagaguggcg aaagagagcg gauacaacau gauucacuuc 480
acgccgcucc aaacgcuggg ucugagccgg ucaugcuacu cacuggcgaa ccagcucgaa 540
cugaaccccg auuucucccg gccaaacagg aaguacaccu ggaacgacgu gggacagcug 600
gucgagaagu ugaagaagga guggaacgug aucuguauca ccgacgucgu guacaaccac 660
accgcugcaa acucgaagug gauccaggaa cauccggaau gugccuacaa ccucgugaac 720
agcccgcacc ugaagccugc cuggguguug gauagggcac uguggagguu cuccugugac 780
guggcagagg gaaaguacaa ggagaagggu auucccgcac ucaucgaaaa cgaucaccac 840
augaauucga ucagaaagau uaucugggag gauaucuucc cuaagcugaa gcugugggag 900
uucuuucaag uugaugugaa caaggcaguc gaacaguuuc ggcggcuguu aacccaagaa 960
aaccgccgcg ugaccaaguc cgauccgaau cagcaucuga ccauaaucca ggacccggaa 1020
uaccgccggu uuggcugcac cguggacaug aacauugccc ugacuaccuu uaucccgcau 1080
gauaagggcc ccgccgcuau cgaagaaugc ugcaacuggu uccacaagag gauggaggaa 1140
cugaacuccg aaaagcauag gcucauuaac uaccaccagg aacaggcagu gaacugccug 1200
cuggggaacg uguucuacga gcgacuggcu ggacacggac cgaaguuagg acccgugaca 1260
aggaagcacc cacuggucac uagauacuuc accuucccau uugaggaaau cgacuucuca 1320
auggaggagu cgaugaucca cuugccuaac aaggccugcu uucucauggc acauaacgga 1380
ugggucaugg gcgacgaucc ccuacggaau uuugcagaac caggcagcga ggucuaccuu 1440
cggcgggaac ugauuugcug gggcgacucc gucaagcugc gcuacggcaa caagccugag 1500
gacugucccu accuuugggc acacaugaag aaguacacug aaauuacugc gacauacuuc 1560
caaggagucc gcuuagauaa uugucacucc accccgcugc auguggcgga guacaugcug 1620
gaugccgcaa gaaaccucca gccgaaucuc uacgugguag cagagcuguu caccgggagc 1680
gaggaccugg acaauguguu ugucacccgg cuggggaucu ccucccugau ccgggaggcc 1740
auguccgccu acaacucaca cgaggagggg agacuggugu accgcuacgg aggagaaccc 1800
gugggcagcu uugugcagcc uugccuccgg ccgcugaugc ccgcgauugc gcaugcucug 1860
uucauggaua ucacucacga uaacgagugc cccauugugc acagauccgc cuacgacgcc 1920
cuuccuucca caaccaucgu guccauggca ugcugcgccu ccggcuccac ucgggguuac 1980
gaugagcugg ugccacacca gauuuccgug guguccgaag aacgcuucua caccaagugg 2040
aacccggaag cucugccguc aaacaccgga gaagugaacu uccaguccgg gaucaucgca 2100
gcgcgcugug cuauuagcaa gcugcaccag gagcugggag ccaagggguu cauccagguc 2160
uauguggacc aggucgauga ggauaucguc gcugucacga gacacagccc gucuauccau 2220
caaagcgucg uggccguguc ccggacugcg uuccggaacc cuaaaaccuc auucuauucc 2280
aaagaggugc cccagaugug caucccugga aagaucgaag aagucgugcu ggaagcccgg 2340
accaucgagc ggaacaccaa gccguacagg aaggacgaaa acuccaucaa ugguaccccu 2400
gacauuaccg uggaaaucag agaacauauc cagcugaacg aguccaagau cgugaagcag 2460
gccggcgugg cgaccaaggg ucccaacgag uacauucagg aaaucgaguu ugaaaaccug 2520
ucccccggaa gcgugaucau uuuccgggug ucccuggacc cgcaugcgca agucgcuguc 2580
ggaauucugc ggaaucaccu cacccaauuc ucgccgcauu ucaagagugg uucccuggcg 2640
guggauaaug ccgauccgau ccugaagauu cccuucgcgu cccuggcauc gagacucacc 2700
cuggcggagu ugaaccagau ucuguaccgc ugcgaauccg aggaaaagga ggacggaggc 2760
gguugcuacg acauccccaa cugguccgca cuuaaguacg cagggcugca gggucuuaug 2820
agcgugcugg cagaaauucg cccuaagaac gauuugggac accccuucug caacaaccuc 2880
cgguccggag acuggaugau cgauuacgug ucgaacagac ugauuucgag auccggcacc 2940
auugccgagg ucggaaagug gcuucaggcc auguucuucu accugaagca gaucccgaga 3000
uaccugauuc ccugcuacuu cgacgcaauc cugaucgggg cguauaccac ucuucuggac 3060
acugccugga agcagauguc cagcuucgug caaaacggau ccaccuucgu caagcaucuu 3120
agccugggcu cagugcaguu gugcggagug ggaaaauucc cuagccuccc uauucuuuca 3180
ccggcgcuga uggacgugcc uuaccgccug aacgaaauca ccaaagagaa ggagcagugu 3240
ugcgugucgc uggccgcggg ucugccgcau uucuccuccg gcaucuuccg gugcugggga 3300
agggacaccu ucaucgcucu gaggggaauc cugcugauua ccgggcgcua cguggaagcu 3360
cggaacauca uccuggccuu cgcgggaacu cugcgccacg gccugauucc aaacuugcuu 3420
ggcgaaggca ucuacgcgcg cuacaacugc cgcgacgcgg ucugguggug gcuccagugc 3480
auucaagacu acugcaagau ggugccaaac ggccuggaca uccugaagug cccggugucg 3540
agaauguacc ccaccgacga uucugcgccc cugccggccg guacucuuga ccaaccucug 3600
uucgaaguga uccaggaagc aaugcagaag cacaugcagg gcauucaguu ccgggagcgc 3660
aacgcagggc cgcaaaucga caggaacaug aaggacgaag gauucaacau caccgcggga 3720
guggacgaag agacuggcuu cgucuacggu ggaaaucggu ucaacugcgg gaccuggaug 3780
gacaagaugg gcgaaucaga ccgagcccgc aaccgcggaa ucccugccac cccccgggau 3840
gggagcgccg uggagauugu gggacugagc aagagcgcug ugcgcuggcu gcuggaguug 3900
agcaagaaga acauuuuccc cuaucacgaa gugaccguga agcggcacgg aaaagcuauc 3960
aaaguguccu acgacgagug gaacagaaag auccaggaca acuucgagaa gcuguuccac 4020
guguccgagg acccgucgga cuugaaugag aagcacccua accucgugca caagcgggga 4080
aucuacaagg acagcuacgg agcauccucg ccuuggugcg acuaucagcu gaggcccaac 4140
uucacuaucg caaugguggu ggccccagaa cuguucacua ccgaaaaggc cuggaaggca 4200
cuggagaucg cagagaaaaa gcugcugggc ccucugggca ugaaaacccu ggaccccgac 4260
gacauggugu acugcgggau cuacgauaac gcucuugaca augacaacua caaccuggcu 4320
aagggauuca acuaucacca gggccccgag uggcuguggc cgaucgguua cuuccugcgc 4380
gccaagcugu acuuuucccg gcugaugggc ccugagacua ccgcaaagac gaucgugcug 4440
gucaagaacg ugcugucacg gcacuacgug caucuggaac ggagcccgug gaagggguug 4500
cccgaacuga ccaacgaaaa cgcgcaguac uguccguucu cgugcgaaac ucaggccugg 4560
uccaucgcca cuauccucga aacucucuac gaccuguag 4599
<210> 8
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 8
augggacaua gcaaacaaau uaggauccuc cugcugaacg aaauggaaaa acuggaaaag 60
acgcuguuuc ggcuggaaca gggcuacgaa cuccaguuuc gccucgggcc aacgcugcaa 120
gggaaagcag ugaccgugua uacaaacuac ccauucccug gagagacauu caauagggag 180
aaguuuagaa gcuuagacug ggaaaaucca accgaacgag aagaugacag cgauaaguau 240
ugcaagcuga aucugcaaca guccggaagu uuucaguacu acuuuuugca agggaacgaa 300
aagagcggcg gagguuauau ugugguggau ccaauuuuga gaguuggggc cgacaaccau 360
guacugccuc uugacugugu gacacugcaa acguuccugg ccaagugccu gggcccguuu 420
gaugaguggg aaagccguuu gcgcguggcc aaggaauccg gguacaacau gauccauuuu 480
accccacugc aaaccuuagg ccugucaagg agcuguuaca gucuggccaa ccagcuggaa 540
cugaaucccg acuucucccg gccaaauagg aaguacacgu ggaacgacgu uggccagcua 600
guggagaagu ugaagaagga guggaacguu auuugcauca cugacgucgu guauaaucac 660
acugccgcua auagcaaaug gauccaggaa cauccagagu gugccuauaa ccuggucaac 720
agcccgcauc ugaagccagc augggugcug gaccgggcgu uguggcgguu cucgugugac 780
guggccgaag gaaaguauaa ggagaagggu auuccggcuc ugauagagaa cgaccaucau 840
augaauucca ucaggaagau cauuugggag gacaucuuuc caaaguugaa gcugugggag 900
uucuuucaag uggaugugaa caaggccgua gaacaguuuc gccgccuacu aacccaggaa 960
aauaggagag ucacaaaguc cgaucccaac caacaucuga ccauaauuca ggaccccgaa 1020
uaucgucgau uuggcugcac cguggauaug aacaucgcuu ugacaacuuu cauaccacac 1080
gacaaggguc cagccgccau ugaagagugu uguaacuggu uucacaaacg aauggaggag 1140
uugaacagug aaaagcaccg ccugaucaau uaucaucagg agcaggccgu gaacuguuug 1200
cuggggaaug uguucuauga gaggcucgcu ggucauggcc cuaagcuggg uccuguaaca 1260
agaaagcauc cauuagugac gcgcuacuuu acauucccau uugaggagau cgacuuuucg 1320
auggaagagu ccaugauuca ucuccccaac aaggccuguu uucugauggc ccacaacggc 1380
uggguuaugg gggaugaucc guugagaaau uuugcggaac cagguucaga aguguaucug 1440
cgucgggagc ugauuuguug gggcgacucc gugaagcucc gcuaugggaa caagccugag 1500
gauuguccuu aucugugggc gcauaugaag aaguauacag agaucacugc cacauauuuu 1560
cagggcguca ggcuggacaa uugucauagc accccgcuuc auguggcuga guauaugcug 1620
gacgcagcaa ggaaucugca gcccaaucug uauguggugg cggaacuguu uaccgggucc 1680
gaggaccugg acaauguauu uguaacccga uugggcaucu ccagccugau uagggaagca 1740
augagugcau acaacucaca cgaggagggg cggcugguuu aucgauaugg gggggaaccu 1800
gugggcagcu uuguacagcc augucuccgg ccguugaugc cugccauugc ucaugcgcuc 1860
uuuauggaua uaacacauga caacgaaugu ccaaucguuc auaggagugc uuacgacgcc 1920
cugccgagca caacgaucgu guccauggcc uguugugcaa guggcagcac acguggcuau 1980
gacgaauugg uaccccacca aauuagcgug guuuccgagg agagguucua uacaaagugg 2040
aauccagagg cuuugcccuc gaacaccgga gaggucaacu uucaaucugg cauaauugcc 2100
gcucgcugcg ccauaucuaa guugcaucag gaacugggcg cgaagggguu uauacaaguc 2160
uacguugacc aaguggauga ggacaucguu gcugucacgc ggcacucacc uaguauucau 2220
caauccgugg uagcaguguc ucggacggcc uuuagaaacc caaagacauc auuuuacucg 2280
aaagaagugc cucaaaugug uauaccuggc aaaauugaag aggugguccu ggaagcccgc 2340
acgauagaga ggaauacuaa gccguauaga aaggaugaaa auucuaucaa cggcacuccg 2400
gauauuacag uagaaaucag agagcacauu caacuuaaug agucuaagau uguuaagcag 2460
gcugguguug caaccaaagg gccaaacgag uacauccagg agauugaauu ugaaaaucug 2520
ucaccgggcu ccgugaucau cuuuagagua ucuuuggauc cacaugcuca agucgcuguu 2580
ggaauccuga gaaaccaucu gacacaauuu uccccacauu uuaagagcgg cagccuggcc 2640
guggacaacg cagacccaau ccugaagauc ccauuugcau cccuggcuuc ccgccugacu 2700
cuggcugagc ugaaccagau cuuguaucgc ugugaaucug aagaaaaaga ggauggcgga 2760
ggcuguuaug acaucccaaa uuggagcgcc cugaaauaug ccggacucca aggccugaug 2820
uccguucugg ccgagauuag gccaaagaau gaucugggac acccauuuug uaacaacuug 2880
cggucuggag acuggaugau cgacuauguc agcaaccgcc ugauaagcag auccgguacu 2940
aucgcugaag ucggaaaaug gcugcaggcu auguuuuucu auuugaagca gauuccgaga 3000
uauuugaucc ccuguuauuu ugaugccauu cugauuggug cuuauacuac ccugcuggau 3060
accgcuugga aacagaugag uagcuuuguc caaaauggcu ccaccuucgu aaagcaucug 3120
ucgcugggcu ccgugcaauu guguggcguc gggaaguucc cuagccugcc aauccugucc 3180
ccugcucuga uggacgugcc uuaucgccug aacgagauua cgaaggaaaa ggaacagugu 3240
ugcgugucac ucgcugcugg gcugccacac uuuucuucug gaauuuuucg guguuggggg 3300
cgggacaccu uuauugcccu gaggggcauu cugcugauua ccggccgcua ugucgaggcu 3360
aggaacauua uccuggcuuu cgcggguacc cuucggcacg gacucauacc caaccuccug 3420
ggagaaggaa ucuaugcacg guauaacugu cgggacgcag uuugguggug guugcagugu 3480
auucaagauu auugcaagau ggucccgaac ggacuggaca uacugaagug cccagugucc 3540
cggauguauc caacugacga cuccgcacca cugcccgcug ggacacuuga ccagccauug 3600
uuugaaguua uucaggaagc uaugcagaag cauaugcagg gaauucaguu uagggagaga 3660
aacgcuggac cccagauuga ccguaacaug aaggaugagg gguuuaacau uaccgcggga 3720
guggacgaag agacuggcuu cgucuauggu ggcaaucggu ucaacugcgg caccuggaug 3780
gacaaaaugg gcgaaagcga uagagcucga aauaggggca ucccagcaac accacgggau 3840
ggcucugccg uggagauugu gggccugucu aagagcgcag uucggugguu guuggaacuc 3900
agcaagaaga acauuuuucc auaccaugaa guuacaguga agcggcaugg gaaggccauc 3960
aagguuucuu acgacgaaug gaaucggaag auccaggaua acuucgagaa acuguuucau 4020
guauccgagg acccuucuga ccugaacgaa aagcauccaa auuugguaca caaaagggga 4080
aucuauaagg auaguuaugg agccagcagc ccuuggugcg acuaucagcu acgaccaaac 4140
uucacuauug ccaugguagu agcaccagaa cucuuuacua ccgaaaaggc uuggaaggca 4200
cuggagaucg ccgagaagaa gcuguuaggu ccacugggca ugaaaacccu ggaccccgac 4260
gacaugguuu acuguggcau cuaugacaac gcucuggaca augacaacua uaaucuggcc 4320
aagggcuuca acuaccacca gggcccagag uggcuauggc caauuggcua uuuucugcgg 4380
gcgaagcugu acuuuucacg auugaugggc ccagagacaa ccgcuaagac cauaguauug 4440
gucaagaacg ugcugagucg gcacuauguc caccuggaaa ggagccccug gaaggggcug 4500
cccgagcuga ccaacgaaaa ugcacaguau uguccguuuu caugcgaaac ccaggcuugg 4560
uccaucgcga cgauccugga aacccucuau gaucuguag 4599
<210> 9
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 9
augggacacu caaaacagau aaggauccug cugcugaacg aaauggagaa acuggaaaag 60
acccuguucc ggcucgaaca gggauaugaa cuccaguuua ggcugggccc aacucugcaa 120
ggaaaagcug ugaccgucua uacuaacuau ccauuucccg gggaaacguu uaaccgagag 180
aaguuccgau ccuuggacug ggaaaauccc acagagcggg aggaugauuc ggacaaguau 240
ugcaagcuga aucugcaaca aucgggcagc uuucaguacu auuuucuaca aggaaacgaa 300
aagagcggcg ggggauacau ugugguggac ccaauccuga ggguuggggc agacaaucac 360
guacugccuu uggacugugu gacauugcaa acauuccugg caaagugccu gggccccuuc 420
gaugaauggg agucacggcu gcgaguggcu aaggaaucug gcuauaauau gauucacuuu 480
acaccauuac aaacgcuggg ccugagcaga aguugcuacu cgcuggcuaa ucaguuggag 540
uugaacccgg acuuuagccg ucccaaccgg aaguauacau ggaaugaugu uggccaacuc 600
guggagaagc ugaagaagga guggaacgug aucuguauua ccgaugucgu guauaaucau 660
acagccgcga acuccaagug gauucaggag cacccagaau gugcauauaa cuuggucaau 720
agcccccacc ugaagccggc cuggguacug gaucgggccc uguggcgguu uucuugugac 780
guggcagaag gaaaguauaa ggaaaagggg aucccagcac ugauagagaa cgaccaucau 840
augaacagca uuaggaagau cauuugggag gacauuuucc caaaguugaa gcucugggag 900
uuuuuccaag uugacgucaa caaggccgug gaacaauuuc gaaggcugcu gacacaggaa 960
aacagacgug uaacgaaguc cgaccccaau cagcauuuga cgaucauaca ggauccugag 1020
uauaggcgcu uuggcuguac ggucgacaug aauauugcuc ugaccaccuu uaucccucau 1080
gacaaggggc cagccgccau cgaagagugu uguaauuggu uccacaagcg cauggaagag 1140
uugaauuccg aaaagcauag guugaucaac uaccaccagg aacaggcagu gaacugucug 1200
cugggcaacg uguuuuauga gcggcuggcc ggucauggcc cuaagcuggg accagugacc 1260
aggaagcauc cacucguaac cagauauuuu accuucccgu uugaggagau agauuuuagc 1320
auggaagaau ccaugauuca ccuaccgaac aaggcuuguu uucugauggc ucacaacggu 1380
uggguuaugg gcgaugaucc ccugcgcaac uuugcggaac cgggcucuga gguguacuug 1440
agaagggagc ugauauguug gggggacucc gucaaacugc gcuaugggaa uaagccugaa 1500
gauugcccuu aucugugggc ccauaugaag aaguauaccg agauuaccgc gacauauuuu 1560
caaggagugc ggcuggacaa cugccacagc acgccgcugc auguggcaga guauaugcug 1620
gacgcagccc gcaaucugca gccaaaucug uauguugugg cugagcuguu uacgggcucc 1680
gaggaccucg acaacguuuu cguaacccgg cugggcauca gcagccugau ccgggaagcu 1740
augucagcgu auaauagcca ugaggagggc agacuggugu acagauaugg uggcgaacca 1800
guuggcagcu uugugcagcc cuguuugcgc ccucugaugc ccgccaucgc acaugcuuug 1860
uucauggaca ucacgcauga uaacgaaugu cccauuguac aucgcuccgc cuaugacgcu 1920
uugccaucca caacaaucgu guccauggcu uguugugcaa gcggcagcac caggggauau 1980
gacgaauugg uuccgcauca aaucagcgug guaucagagg aaagguuuua uacaaagugg 2040
aauccugaag cccugccauc caacaccggc gaagugaacu uucagucggg uaucauugcc 2100
gcgcguugcg cuauuagcaa acugcaucag gagcugggug cuaaaggcuu uauccaaguu 2160
uauguggauc aaguagacga agauauuguu gccguaacca gacauagccc cagcauucau 2220
caauccgugg uugcuguguc ccggacggcc uucaggaacc cuaaaacauc cuuuuauucc 2280
aaggaagucc cacagaugug uauuccggga aagauagagg aagugguuuu ggaggcucgc 2340
acgauugagc ggaacaccaa gccauauagg aaggacgaga acucgaucaa cggcacgccc 2400
gacauuaccg uugaaauucg cgagcacauu cagcugaacg aaucgaaaau ugucaagcag 2460
gccggcguag cgaccaaggg uccaaacgag uauauccagg aaaucgaguu ugagaaucug 2520
ucgccugggu ccguaaucau uuuuagaguc agccuagacc cucacgcuca aguggccgua 2580
gggauccuga ggaaucaucu gacgcaguuu ucaccccauu uuaaguccgg cagccuggca 2640
guggauaacg ccgaccccau ccugaaaauu cccuuugcuu cccuggccuc gcgccugaca 2700
cuggcagaau ugaaucagau acuguaucgu ugcgagagcg aggagaagga ggacggaggg 2760
ggguguuaug auaucccgaa cugguccgcu cugaaauaug cgggauugca gggcuugaug 2820
aguguacugg ccgaaauuag acccaagaac gaucugggcc auccguucug uaacaaucug 2880
cgauccggcg auuggaugau ugauuauguc agcaaccggu ugauaagccg gagugggaca 2940
auugcagaag ucggaaagug guugcaagcc auguucuuuu accugaagca gaucccucga 3000
uaucugauac cauguuauuu cgaugccauu cugaucgggg ccuauacaac ucuguuagac 3060
acugcuugga aacagauguc uagcuucgug caaaacggcu caacauuugu uaagcacuug 3120
agccuggggu cugugcaguu guguggcgua ggaaaguuuc ccucacugcc cauccugucg 3180
cccgcccuga uggacgugcc cuaccgccuc aacgaaauua ccaaggagaa agagcagugu 3240
uguguuagcu uggcugccgg uuugccgcau uuuucaagcg gaaucuuccg augcugggga 3300
cgcgauacgu ucauagcccu gagggguauu cugcugauua cgggcagaua cguagaggcu 3360
cggaauauua uccuggccuu cgccggcacg cugcggcaug ggcugauucc gaacuugcug 3420
ggagagggca ucuacgcccg guacaacugc agggacgcug ugugguggug gcugcagugc 3480
auccaggacu auugcaaaau ggugccaaac ggccuugaca uacugaagug uccugucucu 3540
cggauguauc caacggauga cuccgcaccc cugcccgcug gaacccugga ucaaccccug 3600
uuugaaguga uacaggaagc aaugcagaag cacaugcagg gaauucaguu uagagagaga 3660
aaugcaggcc cccaaaucga cagaaacaug aaagaugaag gcuuuaacau cacggcugga 3720
guggacgaag aaacuggguu uguguauggc gggaauaggu uuaacugugg gacguggaug 3780
gacaagaugg gcgaauccga uagagcgcgg aacaggggaa ucccggcuac accccgggac 3840
gguagugcug uggagauugu cggcuuaucc aaauccgccg ugcgcuggcu gcuggagcug 3900
uccaagaaga acaucuuucc uuaccaugaa gugaccguga agcggcaugg aaaggccauc 3960
aaagucuccu acgacgaaug gaauaggaag auucaggaca auuuugagaa gcuguuucau 4020
guguccgagg aucccagcga ccugaacgag aagcacccua auuuggugca uaagcggggc 4080
aucuauaagg acuccuacgg cgcuaguucg ccuuggugcg acuaucagcu gcggccaaac 4140
uuuacgauug cgaugguggu agcccccgaa uuguuuacga cggaaaaggc uuggaaggcc 4200
cuggagaucg cagaaaagaa gcugcugggg cccuugggca ugaaaacgcu ggaccccgac 4260
gauaugguuu auuguggcau cuacgacaac gcccucgaca augacaauua caaccuggca 4320
aaggguuuua acuaucauca ggguccugaa uggcuguggc caauuggcua cuuuuugcgg 4380
gccaagcugu acuuuucacg gcugauggga ccugaaacca ccgcuaagac cauuguacug 4440
gucaagaacg ugcugagcag gcauuacgug caucuggaaa gaagcccgug gaagggucug 4500
ccagaguuga cgaacgagaa cgcgcaguau uguccuuucu cuugugaaac gcaggcuugg 4560
aguauugcaa ccauucugga aacucuuuau gaccuguag 4599
<210> 10
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 10
augggccacu caaagcagau uagaaucuua cuccugaacg agauggaaaa gcuggaaaag 60
acccuguucc gccuggaaca gggauaugag cugcaguucc ggcuuggacc aacccuccaa 120
ggaaaggccg ugaccgugua cacgaacuac ccauucccgg gcgaaaccuu caacagagag 180
aaguuccgga gccuggacug ggaaaacccg accgaaaggg aagaugauag cgacaaguac 240
ugcaagcuga acuugcaaca guccggauca uuccaguacu acuuucugca agggaacgag 300
aagucgggcg gcgguuacau cgugguggac ccuauucugc gcgugggagc cgacaaccac 360
guguugccuc uggacugugu cacccugcaa acuuuccugg ccaagugccu ggggccauuc 420
gaugaguggg aaucgcggcu gcggguggca aaagaguccg guuacaacau gauccacuuc 480
accccacucc aaacccuggg ccuguccagg ucgugcuacu cgcuggccaa ccagcuggaa 540
cugaacccgg auuucucgcg gccuaacaga aaguauaccu ggaaugacgu cggacagcuc 600
gucgaaaagc ugaagaagga auggaacgua aucuguauca ccgaugucgu guauaaccac 660
accgcugcca acuccaagug gauccaggaa caccccgagu gcgcuuacaa cuuggugaac 720
ucgccccacc ugaaaccggc uugggugcug gaccgggccc uguggcgguu cagcugcgau 780
guggcugagg gaaaguauaa ggagaagggu aucccagcgc ucauugaaaa cgaccaccau 840
augaacucga uccgcaagau cauuugggag gauauuuucc caaaguugaa acugugggag 900
uuuuuccaag uggacgugaa caaggcgguc gaacaguuca gacggcuguu gacucaggaa 960
aaucggaggg ucaccaaguc ggaucccaac cagcaccuga ccauaaucca ggauccagaa 1020
uaccggcggu ucggcugcac uguggacaug aacauugccc ugaccacuuu uaucccacac 1080
gacaagggcc cggccgccau cgaagagugc ugcaacuggu uccacaagcg gauggaggaa 1140
cugaacucgg agaagcaccg ccugaucaac uaccaccagg agcaggcggu uaacugucug 1200
uugggaaacg uguucuacga gcgguuggcc ggccacggcc cuaagcuggg cccggucacc 1260
cggaagcacc cccuggucac ccgcuacuuc accuuuccau ucgaggagau cgacuucagc 1320
auggaagaau cgaugaucca ucugccgaac aaggccugcu uccugauggc ucacaacgga 1380
ugggugaugg gcgacgaucc ucugagaaac uuugccgagc cgggcucgga gguguaccug 1440
aggagggagc ugaucuguug gggggacagc gugaagcuga gauacggaaa caagccagag 1500
gacugcccgu accugugggc ccauaugaag aaguacaccg agauuaccgc aacauacuuc 1560
caaggggucc ggcuggacaa uugccacucg acuccccugc acguggcgga guacaugcug 1620
gacgcggcca ggaaccucca gcccaaccuc uacgucgugg ccgagcuguu cacugguucc 1680
gaggaccugg auaacguguu cgugaccaga cuggggaucu ccucacugau ucgcgaagcc 1740
auguccgcgu auaacucgca ugaagagggc cgccuggugu accgcuacgg aggcgaaccu 1800
gugggcagcu ucgugcaacc gugucugcgg ccucugaugc cugccauugc gcacgcccug 1860
uucauggaca ucacccacga caacgaaugc cccaucgugc accgguccgc cuacgaugcc 1920
cucccuucga cuacuaucgu guccauggcu ugcugcgcgu ccggcucgac ccgcggcuac 1980
gaugagcucg ugccgcauca gauuagcgug guguccgagg aaagguucua caccaagugg 2040
aauccagaag cgcugccgag caacaccggg gaggucaacu uccagucggg aaucaucgcc 2100
gcccgcugug ccaucuccaa gcugcaccag gaacugggcg cgaaggguuu cauccaaguc 2160
uacgucgauc aggucgacga ggacaucgug gccgugacuc ggcauucccc gagcauucac 2220
caguccgugg uggccguguc gcgcaccgcc uuccgcaacc cuaagaccag cuucuauuca 2280
aaagaagugc cgcagaugug caucccugga aagaucgagg aggugguccu ggaagcgcgg 2340
acuaucgaaa ggaacaccaa gccauaccgc aaggacgaga acuccaucaa cgguaccccg 2400
gacaucacug uggagauccg cgagcauauu caacugaacg aguccaagau cgugaaacag 2460
gccggagugg caaccaaggg accgaacgag uauauccagg aaauugaguu cgagaaccuc 2520
uccccgggaa gcgugauuau cuuccgcgug ucccuggacc cacacgccca aguggccguc 2580
ggcaucuugc ggaaccaccu gacucaguuc uccccgcauu ucaaguccgg aagccuggcg 2640
guggacaacg cggacccaau ccugaagaua cccuucgccu cacuggccuc gcgccugacu 2700
uuggccgagu ugaaucagau ccuguaccgc ugcgaauccg aagaaaagga ggacggugga 2760
ggcuguuacg acaucccuaa cugguccgca cugaaauacg caggacugca gggacugaug 2820
uccguccucg cugaaaucag accgaagaac gaucucggcc acccauucug caacaaccug 2880
agauccggcg auuggaugau ugauuacgug ucgaaccgac ugaucucccg cucggguacu 2940
auugcggaag ucggaaaaug gcugcaggcc auguucuucu accugaagca gaucccacga 3000
uaccuuaucc cuugcuacuu ugacgcgauu cugauuggug ccuacacgac ccugcuggac 3060
acggccugga agcaaauguc cagcuuugug cagaacggca gcaccuucgu gaaacaccug 3120
ucgcugggau cggugcagcu cugcggcgug gggaaguuuc cgucacugcc gauccugucc 3180
ccggccuuga uggaugugcc cuaccggcug aacgaaauca ccaaggagaa ggagcagugc 3240
ugcgugucgc uggccgccgg gcugccucac uucuccuccg gaauuuuucg augcuggggu 3300
agagacacuu ucauugcgcu gagggggauu cugcuuauua ccggccgcua cguggaagcc 3360
aggaacauca uccuggcauu cgccggaacc cugcggcacg ggcugauucc caaccuccuc 3420
ggagaaggaa ucuacgcucg guacaauugc cgggacgcag ugugguggug gcuccagugc 3480
auccaggacu acugcaagau ggucccuaac ggacuggaca uucugaagug cccagugucc 3540
cggauguacc ccacugacga uucggcaccg cugccggcug guacccugga ccagccgcug 3600
uucgaaguga uccaggaagc caugcaaaag cauaugcagg ggauucaguu ccgcgaaaga 3660
aaugccggac cucagaucga ccgcaacaug aaggaugaag gcuuuaacau cacugccgga 3720
guggacgaag agacuggauu cgucuacggg ggaaacagau ucaauugcgg uacauggaug 3780
gauaagaugg gagaaagcga cagagcucgg aauagaggaa uuccggccac accucgggac 3840
ggcucagccg uggagaucgu ggggcuaucc aagucugccg ugcgcuggcu guuggaacug 3900
ucgaagaaga acauuuuccc auaccacgag gucaccguga agcgccacgg aaaggccauc 3960
aaagugucau acgaugaaug gaaccgcaag auucaggaca acuucgagaa gcuguuccau 4020
gugucggagg acccuuccga ccugaacgaa aagcauccaa accuggugca caagcggggg 4080
aucuacaagg acuccuacgg agcguccucc ccuuggugcg acuaccaacu ccggccaaau 4140
uucacgaucg cgaugguggu ggccccugaa uuguuuacca ccgaaaaggc cuggaaggcc 4200
cucgagaucg cagagaagaa acugcuggga ccccugggca ugaaaacccu ggacccggac 4260
gauauggugu acugcggaau cuacgacaac gcccucgaua augacaacua uaacuuggcc 4320
aaggguuuca auuaccacca ggggccagag uggcuguggc caaucgguua cuuucugcgg 4380
gccaagcugu acuucucgag auugaugggg cccgaaacca ccgcuaagac uaucgugcuc 4440
gucaagaacg ugcugucacg gcauuacgug caccuggaac gcagcccaug gaagggccug 4500
ccggaacuga ccaacgagaa cgcacaguac uguccguucu cgugugaaac ucaggccugg 4560
agcauugcga ccauccugga aacucucuau gaucuguag 4599
<210> 11
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 11
augggccauu cuaagcaaau ucggauacug cugcugaacg aaauggagaa acuugaaaag 60
acccuguucc ggcuggagca gggcuaugag cugcaguuua gauugggccc gacacugcag 120
gggaaggcag ucaccguuua uaccaauuau ccuuuuccug gggaaacguu caaucgugaa 180
aaguuucgga gccucgacug ggaaaacccu accgagcgag aggaugauag cgacaaguau 240
uguaaacuca aucugcagca gucaggcuca uuccaauauu auuuucugca agggaacgag 300
aagucuggcg gaggcuacau ugucguugau ccgauacugc ggguuggcgc cgacaaccac 360
guguugccuc uggacugcgu gacacugcaa acauuucucg cgaaaugcuu aggccccuuu 420
gaugaguggg aaagccgccu gagagucgcc aaggagagcg gcuauaauau gauccauuuu 480
acgccgcugc aaacacuggg ucugucuagg ucauguuacu cauuggcuaa ccagcuggag 540
cugaacccgg acuuuaguag gccuaacagg aaguauacau ggaaugaugu ugggcaacug 600
guggagaagc ugaagaagga auggaauguc auuuguauua ccgaugucgu guacaaccac 660
acggcagcaa auucaaagug gauucaggaa cauccggaau gcgcuuauaa ccucguaaac 720
ucaccgcacc ugaagccggc cuggguacug gacagggcac uguggagauu cucuugugau 780
guagccgagg ggaaguacaa ggagaaaggc auucccgcuc uuauugaaaa ugaccaccau 840
augaauagca uuaggaagau caucugggaa gauauuuuuc caaaacugaa gcugugggaa 900
uucuuucaag uugacgugaa caaggcuguc gagcaguuca ggcggcuguu gacccaggag 960
aacagacggg uuacuaagag ugaccccaac caacaucuga cgaucaucca ggacccagag 1020
uaucggcgcu uuggcugcac aguggacaug aacaucgccc ugaccacguu uaucccccau 1080
gauaagggcc cggccgcuau ugaagagugu uguaacuggu uucauaagcg cauggaagaa 1140
cucaacagcg aaaagcauag acugaucaac uaucaucaag aacaggcugu gaauugucug 1200
cugggcaacg uguuuuauga gcgguuggcu ggccauggcc ccaaguuggg ccccgugacg 1260
cgaaaacauc cccucgugac aagauauuuc accuuuccau uugaagagau cgacuucuca 1320
auggaggaaa gcaugauuca ucugccaaac aaggcuuguu uucugauggc ucauaauggc 1380
uggguuaugg gcgacgaccc ccugagaaac uuugcggaac cagggucuga aguguaucug 1440
cggagggaau ugauuugcug gggagacucu guaaagcugc gauaugggaa caagccggag 1500
gauuguccgu aucugugggc ccauaugaag aaguauacag aaauuaccgc aacguauuuu 1560
cagggcguac gccuggauaa uugucauuca acgccacugc auguggcaga guacaugcua 1620
gacgcggcua ggaaucugca gccgaaucug uaugucgugg ccgagcuguu caccggcucc 1680
gaagauuugg acaauguguu ugugacccgc cucgguauua gcucacugau uagagaagca 1740
augucggcuu acaauucgca ugaggaaggu cgccuggugu accguuacgg cggcgaaccc 1800
gugggcaguu uugugcaacc cugucugagg ccacuaaugc ccgcuauugc acaugcccug 1860
uuuauggaua uaacacauga uaacgaaugu ccaaucguac accggagugc uuaugaugcu 1920
cugcccucaa cgaccaucgu aucaauggca ugcugugccu ccggcucaac acggggcuau 1980
gaugaacugg uaccacacca gaucagcgug guuucugagg aacgguuuua cacaaagugg 2040
aauccugagg cguugccauc caacacuggc gaagugaacu uucagagcgg cauuauugcu 2100
gcccgaugug cuauuucaaa gcuacaccag gaguugggcg caaagggguu uauccagguu 2160
uauguggacc agguugacga agauaucgua gcugugacgc ggcacucucc gucuauccau 2220
caauccgugg uagccguguc uaggacggcu uuucgcaacc ccaagacaag uuucuauucc 2280
aaagaaguac cccagaugug uaucccgggg aagauugagg aagugguccu ggaggccagg 2340
acgauagaac ggaacacgaa gccguaucgc aaggacgaaa acagcauaaa cgggacgccu 2400
gacaucacgg uggagauucg cgagcacauc caguugaacg aaucaaagau agugaaacag 2460
gcuggggugg cuaccaaggg cccaaaugag uacauucagg agaucgaguu cgaaaaccug 2520
uccccgggca gugugaucau cuuuagaguc ucuuuggauc cgcaugccca ggucgcugug 2580
ggcaucuugc gaaaucaccu gacgcaguuu ucuccacauu uuaagagugg cucccuggcu 2640
guggacaacg ccgacccaau cuugaagauu ccguucgcuu cccuggcuuc acgucugacu 2700
cucgcugaau ugaaucaaau ucuguauaga ugcgaaucag aggagaagga agauggaggc 2760
gguuguuacg acaucccgaa uuggucggca cugaaauacg ccggucugca aggcuugaug 2820
agcguacugg ccgagauaag accaaagaac gaucugggcc acccauuuug caacaacuug 2880
cgguccggcg auuggaugau ugacuauguc ucuaaccgac ucaucaguag aagcggaacc 2940
auagcugagg ucggcaaaug gcugcaagcc auguucuucu auuugaagca gaucccccga 3000
uaucugaucc ccuguuauuu ugacgcaauc cucauuggcg ccuauaccac acuccucgac 3060
accgcuugga agcagauguc cucauuugug caaaacggua gcaccuuugu gaagcaucug 3120
ucgcugggua gugugcagcu cugcggcgua gggaaguucc ccaguuugcc gauccugagu 3180
ccagcucuaa uggacgugcc auauaggcug aacgagauua ccaaggaaaa ggagcagugu 3240
ugugucuccc uugcugccgg ucugccccau uuuuccucgg gcauuuuuag auguuggggg 3300
cgggacaccu ucaucgcucu gcggggcauc cugcugauca ccggcagaua uguggaggcu 3360
cggaauauua uucuggcuuu ugcugggacg cugcgccaug gacugauucc caaucuauug 3420
ggcgaaggca uauacgcuag guauaacugu cgggacgcug uuugguggug gcugcagugu 3480
auccaagauu auugcaagau gguccccaac ggccuggaca uacugaaaug uccaguaucu 3540
aggauguacc cgacugacga cagugcuccc cugcccgcug gaacuuugga ucaaccccug 3600
uuugagguua uucaagaggc uaugcagaag cacaugcagg gcauucaguu ucgcgaaagg 3660
aacgccggcc cccaaauuga ccguaacaug aaggacgaag gcuucaauau uacggcuggc 3720
guagaugaag aaacaggcuu uguguacggc ggcaaccgcu ucaacugugg gacauggaug 3780
gacaagaugg gcgaaagcga cagggcucgg aacaggggaa uuccagccac gccccgcgau 3840
ggcagugcug uugaaauugu cggcuuguca aaaucagccg uacgcugguu auuagagcuc 3900
uccaagaaga acaucuuucc guaucaugaa gucacgguua agcggcaugg aaaagcaauc 3960
aaagugucuu acgacgaaug gaauaggaaa auucaggaca acuuugagaa gcuguuccau 4020
gugucugagg acccguccga ucuuaacgag aagcauccca auuuggugca caagaggggc 4080
aucuauaagg acucauacgg ggcuagcuca ccuuggugug acuaucagcu gcgaccgaau 4140
uucacaauag cuauggucgu ggcuccggag cuuuuuacca ccgagaaggc uuggaaggcc 4200
cuggagauug ccgagaagaa gcuguuaggc ccguugggca ugaaaacguu ggauccagac 4260
gacauggucu auuguggcau cuaugacaac gcucucgaca augacaacua uaaccuagcu 4320
aagggcuuca auuaccauca gggcccggag uggcuguggc caauuggaua uuuccugagg 4380
gcaaagcugu auuucucccg gcugaugggc cccgagacaa cggcaaaaac cauagucuug 4440
guuaagaacg ugcugucccg ccacuaugug caccuugaaa ggaguccgug gaagggccug 4500
ccggagcuga caaacgaaaa ugcccaguac ugcccauuuu cuugcgaaac ucaggcuugg 4560
agcaucgcca caaucuugga aacccuguau gacuuguag 4599
<210> 12
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 12
augggacacu cgaagcagau ccgcauccuc cugcugaacg aaauggaaaa acuggaaaag 60
acacucuucc ggcuggaaca gggauaugag cugcaguuua gacuggggcc caccuuacaa 120
ggaaaggccg ugacugucua uaccaacuac ccguuccccg gagaaacuuu caaccgggaa 180
aaguuccggu cacuggacug ggaaaacccg accgagcggg aggacgauag cgacaaguac 240
ugcaagcuga accuucagca guccggaucg uuccaguacu acuuccugca agggaacgag 300
aagucgggcg gaggauacau uguggucgau ccuauccugc gcgugggagc ugacaaucac 360
gugcucccuc uggacugcgu gacgcugcaa accuuccucg caaagugccu cggaccuuuc 420
gacgaauggg aauccagacu ccgcguggcc aaggagucag gauacaacau gauccacuuc 480
acgccgcugc agaccuuggg acucucucgg agcuguuacu cccuggccaa ccagcuggaa 540
cugaacccag acuucucacg cccgaauaga aaguacaccu ggaacgacgu gggacagcuu 600
guggagaagc ucaagaagga auggaacguc aucugcauaa ccgacgucgu guacaaccac 660
accgcagcca auucuaagug gauucaggaa caccccgaau gcgccuacaa ucugguuaac 720
ucaccccacc uuaagcccgc cuggguccua gacagagccc ucuggcgguu cucgugugac 780
guggccgagg gaaaguacaa ggagaaggga auccccgcuc ugauugaaaa cgaccaccac 840
augaacucca uccgcaagau uaucugggag gacaucuucc cgaagcucaa gcugugggaa 900
uucuuccaag uggacgugaa caaggcgguc gagcaguuca gacgccugcu gacccaggaa 960
aaucggagag ugaccaagag cgauccuaac cagcaccuga ccaucaucca agacccagag 1020
uaccggcggu ucggaugcac uguggauaug aacaucgccc ugaccacuuu caucccucac 1080
gacaagggac cggccgcaau ugaggaaugc ugcaacuggu uccauaagcg gauggaggaa 1140
cugaacagcg agaagcaucg acugaucaau uaucaucaag agcaggcugu gaauugccug 1200
cugggaaacg uguucuacga acggcuggcc ggacauggcc cuaagcuggg gccugugacc 1260
cggaagcacc cucuugugac ccgauacuuc accuucccgu uugaagaaau ugauuucucc 1320
auggaagaau ccaugaucca ucugccaaac aaggccugcu uccuuauggc ccacaauggc 1380
ugggucaugg gggacgaccc ucuucggaac uucgccgaac cagggagcga gguguaccuc 1440
agaagggagc ucaucuguug gggggauucc gugaagcuca gauacggaaa caagccagaa 1500
gauugccccu accuuugggc ccacaugaag aaguacaccg aaaucaccgc cacauacuuc 1560
caaggagugc ggcuggacaa cugccauuca acuccccugc acgucgccga guacaugcug 1620
gacgcugcga gaaacuugca gcccaaccuu uacguggugg ccgagcuguu caccgggagc 1680
gaggaccugg acaacguguu ugugaccagg cucggaaucu cgucgcugau ucgcgaagcc 1740
augagcgccu acaacuccca cgaagagggu agacuggugu acagauacgg aggagagcca 1800
gugggauccu ucguccaacc gugccugcgg ccgcucaugc cugcgaucgc acacgcgcug 1860
uucauggaca ucacccacga uaacgaaugu ccuaucgugc auaggagcgc cuaugaugcc 1920
cuucccucca ccaccaucgu guccauggcg ugcugugccu cggguagcac caggggauac 1980
gacgagcugg ugccgcacca gaucucggug guguccgaag aacgguuuua cacuaagugg 2040
aacccugagg cgcugccuuc caacaccgga gaagugaacu uccaguccgg uaucauugcc 2100
gcucgcugcg caaucagcaa acugcaccag gagcuuggug ccaaaggauu cauccaaguu 2160
uacgucgauc aaguggacga ggauauugug gccgucacua ggcacucucc aagcauucac 2220
caguccguag uggcaguguc gaggaccgcc uuccggaacc ccaagacuuc auuuuacucg 2280
aaagaggucc cacagaugug caucccugga aagaucgaag aaguggugcu ggaagcccgg 2340
accaucgaga ggaacacaaa gcccuaccgg aaggacgaga acuccaucaa cggaaccccc 2400
gacauuaccg uggaaauuag agagcacauc caguugaacg agucgaagau cgugaagcag 2460
gccggagugg ccacuaaggg accaaacgag uacauccagg agaucgaguu ugaaaaccug 2520
uccccgggcu ccgugaucau cuuccgggug ucccuugacc cccaugccca aguggccguc 2580
ggaauccuua ggaaccaccu gacccaguuu ucgccccauu ucaaguccgg auccuuggcu 2640
gucgacaaug ccgaucccau ccugaaaauu ccguucgccu cccucgcuuc ccggcucacc 2700
cuugccgaac ucaaccagau ucuguaccgc ugcgagucag aagaaaagga agauggaggg 2760
ggaugcuacg acaucccgaa cugguccgcc cuuaaauacg ccgggcugca aggccugaug 2820
uccgugcugg cggagauuag accgaagaac gacuuggguc acccuuuuug caacaacuug 2880
cggagcggag acuggaugau cgacuacgug ucgaaccggc ugauuagucg guccggaacc 2940
aucgccgaag ucggaaagug gcuccaagcc auguucuucu accugaagca aauuccccgc 3000
uaccugauac cgugcuacuu cgacgccauc cucauuggag ccuacaccac gcugcuggac 3060
accgccugga agcaaaugag cuccuucgug caaaacggau caaccuucgu gaagcaccug 3120
ucccugggua gcguccagcu cuguggcgug ggaaaguuuc cgucccugcc aauucugagc 3180
ccggcucuga uggaugugcc guaucgccug aacgagauca cgaaggagaa ggagcagugu 3240
ugcgugucgc uggcugcggg acugccucac uucucguccg gaaucuuccg cuguugggga 3300
cgcgacacgu uuaucgcguu gagggguauu cuccucauua ccggacgcua cguggaagcg 3360
cggaacauua uccuggcguu cgccggaacc cugcgccacg gucugauucc uaaucugcug 3420
ggagagggaa ucuacgcgcg guacaacugc cgggaugcug ugugguggug guugcagugc 3480
auccaggacu auuguaaaau ggugccgaac ggccuggaca uccugaagug cccggugucc 3540
cggauguacc cgaccgauga uucagcacca cugcccgccg ggacccugga ccagccccug 3600
uucgaaguca uucaggaagc gaugcagaag cauaugcagg gaauccaguu ccgcgaaaga 3660
aacgccggac cucagaucga ccgcaacaug aaggaugagg gcuucaacau caccgcggga 3720
guggaugagg aaaccggcuu cgucuacgga gggaaccggu ucaacugcgg aaccuggaug 3780
gacaagaugg gagaguccga ccgcgcaaga aaccgcggua uuccugccac cccgcgggac 3840
ggaagcgcgg uggagaucgu cggacugagc aagagcgcag ugcgcuggcu gcuggaguug 3900
uccaagaaga auaucuuccc cuaucacgag gucaccguga aacgccacgg gaaggccauc 3960
aaaguguccu acgaugagug gaaccgcaag auucaggaua acuucgaaaa gcuguuucau 4020
guguccgagg aucccuccga ccucaacgaa aagcacccga accucgugca uaagaggggg 4080
aucuacaagg acagcuacgg ugccuccuca ccuuggugcg auuaucagcu ccgcccgaac 4140
uucaccauug ccaugguggu cgccccugaa cuguuuacua ccgagaaggc cuggaaggcg 4200
cuggagauug ccgaaaagaa gcuguuggga ccccugggca ugaaaacccu cgaccccgac 4260
gacauggugu acugcggaau cuacgacaac gcccucgaca acgacaacua caaccucgcg 4320
aagggguuca acuaccacca gggccccgaa uggcuguggc ccaucggaua cuuccuccgg 4380
gcgaaguugu acuucucccg ccugaugggc ccugaaacca cggccaaaac gaucgugcuc 4440
gugaagaacg ugcugucgag gcauuacgug caccucgagc ggagcccgug gaaggggcug 4500
ccggaacuga ccaacgagaa ugcacaguac ugccccuucu ccugcgaaac gcaggcuugg 4560
uccauugcca cuauuuugga aacgcuguac gaccuguag 4599
<210> 13
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 13
augggacacu cgaaacagau cagaauccug uugcucaacg aaauggagaa gcuggaaaag 60
acccucuuuc ggcucgagca gggcuacgag cugcaguucc gccugggucc gacacuacaa 120
ggaaaggcag ugacugugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180
aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugacuc cgacaaguac 240
ugcaagcuga accuccaaca guccgguuca uuccaguacu acuuucugca agggaacgag 300
aaguccggag gcggcuacau cguggucgac ccgauacuua gagugggagc cgacaaucau 360
guccugccuc uggacugcgu gacccugcaa accuucuugg ccaaaugucu gggcccguuc 420
gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucacuuc 480
acuccgcugc aaacccucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540
cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600
guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccau 660
acggccgcca acucgaagug gauccaagag caucccgagu gcgcguacaa ccucgugaac 720
agcccgcauc ugaagccugc uugggugcug gauagagccc ucuggagauu cagcugcgac 780
guggccgagg ggaaguacaa agaaaaggga auuccggccu ugauugagaa cgaccaucac 840
augaacucaa uccgcaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900
uucuuccaag uggacguaaa caaggcagug gagcaguuca gaagguugcu gacucaagaa 960
aacagacgcg ucacuaaguc cgauccuaac cagcaccuua ccaucauuca agacccugag 1020
uaccgccggu uuggcugcac cgucgacaug aacaucgccc ugaccacuuu caucccgcau 1080
gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140
cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaauugccuc 1200
cugggcaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260
cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucucc 1320
auggaagaau ccaugaucca ccucccgaac aaggcuugcu uccugauggc gcacaacgga 1380
ugggucaugg gcgacgaccc acugcgcaac uucgcugagc cuggcucgga ggucuaccug 1440
agaagggaau ugauuugcug gggagacucc gucaagcugc gcuauggaaa caagcccgaa 1500
gauugccccu accugugggc ucacaugaag aaguacacgg aaaucacugc cacguacuuc 1560
cagggagucc ggcuggacaa uugccacucc accccccucc auguggccga guacaugcuc 1620
gaugcagcga ggaaucugca gcccaaucug uacgugguug cagaacuguu cacuggcucc 1680
gaggaccucg acaacguguu cgugaccaga cuggggaucu ccucccugau ccgggaagcc 1740
augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg cggagaaccc 1800
gugggaagcu ucgugcagcc uugccuccgg ccgcugaugc cugcgaucgc ccacgcccug 1860
uucauggaua ucacucacga caacgaaugc cccauugugc aucgcucggc cuacgacgca 1920
cugccuucga ccacuaucgu guccauggcc ugcugcgccu ccgggagcac ccgcggauac 1980
gaugaacucg ugccgcacca gaucagcgug guguccgaag aaagauucua uaccaagugg 2040
aaccccgaag cccugccgag caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100
gcucgcugug ccaucagcaa acuccaccaa gagcucggug ccaagggauu cauucaaguc 2160
uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220
caauccgucg ucgccguguc ccggacugcg uuucggaacc ccaagacuuc guucuacucg 2280
aaagaagugc cacagaugug uaucccggga aaaaucgaag aggucgugcu cgaagcccgg 2340
accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgguaccccu 2400
gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460
gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520
uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccgug 2580
ggaauucuca gaaaccaccu gacccaguuc ucaccccacu uuaaguccgg uucccuggcg 2640
guggacaacg ccgauccgau cuugaagauc cccuucgcau cgcuggccuc ccgccugacu 2700
cucgcggaac ugaaccagau ccuguaccgc ugugaaucag aggaaaagga ggacggcggc 2760
ggcuguuacg auauccccaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820
ucugugcugg cggaaauccg gccgaagaac gaccugggac acccauucug caacaacuug 2880
cggagcggag acuggaugau cgauuacguc agcaacagau ugaucagccg gagcggcacu 2940
aucgccgagg ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccga 3000
uaccucaucc ccuguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060
accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120
ucacugggcu cagugcagcu cugcggcgug ggaaaguucc ccucgcugcc cauucugagc 3180
ccggcccuga uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240
uguguuuccc uggcugccgg gcugccacac uucucguccg gcaucuuccg gugcuggggc 3300
cgggauaccu ucauugcccu gcggggaauc cugcuuauca ccggucgcua cguggaggcu 3360
cggaacauua uucuggcguu cgccggcacc cuuagacacg gucugauucc gaaucuuuug 3420
ggcgaaggaa ucuacgccag auacaacugu cgggacgccg ugugguggug gcuccagugc 3480
auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540
aggauguauc caaccgacga cagcgcaccu cugccggccg ggacccucga ccaaccccug 3600
uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggagcgg 3660
aacgcggggc cccagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720
guggacgaag aaaccgguuu uguguacgga ggaaacagau ucaacugcgg uaccuggaug 3780
gacaagaugg gagaguccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840
ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu ccuggaacug 3900
agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960
aaagucucau acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuguuucac 4020
guguccgagg aucccuccga ucugaacgaa aagcauccga aucucgugca caagcgcggg 4080
aucuacaagg acucguacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140
uucaccauug ccauggucgu ggccccggag cuguucacaa cugagaaggc cuggaaggcc 4200
cuugaaauug ccgagaagaa gcugcugggg ccuuugggga ugaaaacccu ggauccggac 4260
gacauggugu acugcggaau cuacgacaac gcccuggaca acgauaacua caaucuggcg 4320
aagggcuuca auuaccacca gggcccggaa uggcucuggc cuauugggua cuuccugcgc 4380
gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440
gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacuu 4500
ccugagcuga cgaacgaaaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560
uccauugcca cuauacugga aaccuuauau gaccuguag 4599
<210> 14
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 14
augggucacu ccaagcaaau cagaaucuua cuccuuaacg aaauggaaaa gcuugaaaag 60
acacucuucc gcuuggagca gggcuacgag cugcaguucc ggcugggucc gacacuucag 120
gggaaagccg ugaccgugua uaccaacuac cccuuuccgg gagaaacauu caaucgcgag 180
aaguuccggu cgcuggacug ggagaacccu accgagaggg aggacgacuc ugauaaguac 240
ugcaagcuga aucuccagca aucagguucu uuccaauauu acuuccuuca aggaaacgaa 300
aaguccgggg gcggcuacau uguaguggac cccauccuuc gggucggcgc ggauaaccau 360
gugcuucccc ucgacugcgu gacucuccaa acuuuccucg ccaagugccu gggaccauuc 420
gaugaauggg aaucccgccu gcgcguggcc aaggagagcg gcuacaacau gauucacuuc 480
acuccgcuuc aaacccuugg gcugucccgc uccugcuauu cccuugcgaa ccagcuggaa 540
cuuaacccgg acuucucucg gccgaacaga aaguacacuu ggaacgacgu gggccagcuu 600
gucgagaagc ugaagaagga auggaacgug aucugcauca ccgacguggu guacaaccac 660
accgcggcaa acuccaagug gauccaggaa cauccugagu gcgcauacaa ccucgugaac 720
aguccgcauc ugaagccugc cugggugcug gauagagccc uguggcgcuu cuccugcgac 780
guggcugagg gaaaguacaa ggaaaagggc aucccugcgc ucauugaaaa cgaucaccac 840
augaacagca uccgcaagau uauuugggag gacaucuucc cuaagcucaa gcucugggag 900
uuuuuccaag uugacgugaa caaggccgug gagcaguuca gacggcuccu gacucaagaa 960
aacagacgcg ucaccaaguc cgacccuaac caacaccuca ccaucaucca ggaucccgaa 1020
uaccgccggu uuggcugcac uguggacaug aacauugccc ugaccaccuu cauuccgcac 1080
gacaaaggcc cggccgcgau ugaagagugc uguaacuggu uccacaagag aauggaggag 1140
cugaacuccg aaaagcauag acuuaucaac uaccaccagg aacaggccgu gaacugccug 1200
cugggaaacg uguuuuacga gagacucgcc ggacacgguc caaaguuggg uccugugacc 1260
cgcaaacacc cgcucgucac ccgcuacuuu accuucccgu ucgaggagau cgacuucagu 1320
auggaggaga gcaugaucca ucuccccaac aaggccuguu uccucauggc ccacaacggc 1380
ugggucaugg gcgacgaccc ccugcgcaac uucgcugaac ccggcucgga aguguaccuu 1440
cggagggagc uuaucuguug gggcgacagc gugaagcuua gauacggcaa caagccagaa 1500
gauuguccgu accugugggc gcacaugaag aaguacaccg agaucaccgc gacguacuuu 1560
caaggagugc ggcucgauaa cugccacucc accccucugc acguggcaga guacaugcua 1620
gacgcggccc ggaaccucca gcccaaccuu uacguggugg ccgaacucuu cacugguucu 1680
gaggaucuug auaacguguu cgugacuagg cucggcauuu ccucccucau ccgggaagcc 1740
augucggccu auaacuccca cgaggagggg cggcuggugu accgcuacgg aggcgaaccg 1800
gucggcagcu ucgugcagcc gugccuccgc ccucugaugc ccgcuauugc ucacgcccuu 1860
uucauggaua ucacucacga uaaugagugc ccuaucgugc aucggagcgc cuacgacgcu 1920
cucccuucca ccaccaucgu guccauggcg ugcugcgccu ccgguucaac caggggcuac 1980
gaugaacuug ugccgcacca gaucucaguc gucagcgagg aaagguucua cacuaagugg 2040
aacccugaag cccugcccuc uaacacgggc gaagugaacu uucagagcgg uaucauugcc 2100
gcuagaugcg caaucuccaa guugcaccag gaacugggag ccaagggguu cauccagguc 2160
uacguggacc aggucgacga ggacaucguc gccgugaccc ggcauucccc gagcauccau 2220
caguccgugg ucgccguguc acggaccgcc uuccgcaacc ccaagaccuc cuucuacucc 2280
aaggaagugc cgcaaaugug uaucccuggc aaaaucgagg aaguggugcu cgaagcgcgg 2340
acgauugaga ggaauacuaa gccguacaga aaggacgaaa acuccaucaa cggcaccccg 2400
gacaucacug uggagauccg ggagcacauc cagcucaacg agagcaaaau ugugaagcag 2460
gccggcgucg cuacuaaggg cccaaacgag uacauccagg agauugaguu cgaaaaccuu 2520
agcccugggu cugugaucau cuuucgcgug ucccucgacc cgcacgcaca ggucgcaguc 2580
gggauucucc ggaaccaucu gacucaguuc agcccccacu ucaagagcgg cagccuugcc 2640
gucgacaacg ccgaucccau ccucaaaauc ccuuucgcau cccuugcguc gaggcuuacc 2700
cuggcggaau ugaaccagau ucuguaccgc ugcgagucgg aagaaaaaga ggauggcggc 2760
ggcugcuacg acauuccgaa cugguccgcc cugaaauacg cgggccuuca gggccuuaug 2820
agcgucuugg ccgagauccg ccccaagaac gaccuggggc accccuuuug caacaaccuc 2880
agaagcggcg auuggaugau cgacuacgug ucgaacaggc ucaucagccg auccggcacu 2940
auagccgagg ucggaaagug gcugcaggcc auguucuuuu accucaaaca gaucccgcgg 3000
uaccugaucc cgugcuacuu cgacgcuauu cucauuggcg ccuacacuac ccugcucgau 3060
accgcuugga agcagaugag cucauucgug caaaacggaa gcaccuucgu gaagcaccuc 3120
ucccugggau cagugcagcu gugcggcgug ggaaaguucc cauccuuacc aauucucucg 3180
ccugcccuga uggacguccc uuaucgccug aacgaaauca cgaaggagaa ggaacagugu 3240
ugugucucac uggcugccgg ccucccgcac uucucauccg gcaucuuccg gugcuggggu 3300
agagacacuu ucauugcgcu ccggggaauu cugcuuauca cuggccgcua cguggaagcc 3360
cgcaacauca uccuugccuu ugccgggacc cugcggcacg gccugauccc uaaccuucuc 3420
ggggagggca ucuaugcgcg auacaauugc cgggacgccg ucugguggug gcugcagugc 3480
auucaggacu auugcaagau ggugccaaau ggucuggaca uucugaagug uccagugucc 3540
cggauguacc cuaccgacga uagcgcccca cugcccgccg gaacccucga ucagccccug 3600
uucgaaguca uucaggaagc gaugcagaag cauaugcagg guauccaauu ccgcgaaagg 3660
aaugccggcc cacaaaucga cagaaauaug aaggaugagg gcuuuaacau caccgccggc 3720
guggacgagg agacugguuu cgucuacggc ggcaaucggu ucaauugcgg gaccuggaug 3780
gacaagaugg gcgaaagcga ccgggccaga aaccggggca uuccggcuac cccccgcgau 3840
ggcucggccg uggaaaucgu gggccucucc aagucugccg ugcgguggcu uuuggagcuc 3900
uccaagaaaa acaucuuccc guaccacgaa gugaccguga agagacacgg gaaggccauc 3960
aaaguguccu acgacgaaug gaaccggaag auccaggaca acuucgaaaa gcuguuccac 4020
guguccgagg aucccuccga cuugaacgaa aagcacccca accucgugca caagcgcggc 4080
aucuacaagg auuccuacgg agcguccuca ccuuggugcg acuaucagcu gaggcccaac 4140
uucaccaucg caaugguggu ggccccugag uuguucacca cugagaaggc uuggaaggcc 4200
cuugagaucg ccgaaaagaa gcugcucggc ccgcugggga ugaaaacccu cgaccccgau 4260
gacauggugu acugcgggau auacgacaau gcacuagaca acgacaacua caaccuggcc 4320
aagggcuuca auuaccauca gggcccggag uggcuuuggc cuaucggcua cuuccugcgg 4380
gccaagcugu acuucucacg gcuuauggga ccggagacua cugcaaagac cauugugcuu 4440
gugaagaacg ugcuuucgcg ccacuacgug caucuggaac ggagccccug gaaggggcuc 4500
cccgagcuga ccaacgagaa cgcccaguac ugucccuucu ccugugaaac ccaggcuugg 4560
uccauugcca ccauucugga aacccuguac gaccucuag 4599
<210> 15
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 15
augggacacu caaagcaaau ucggauccuc cugcucaacg agauggaaaa gcucgagaaa 60
acccucuuuc gccuggagca ggguuaugag cuccaguucc gccugggucc gacccuccaa 120
gggaaggccg ucacugugua cacuaacuau ccauuccccg gagagacuuu caaccgggaa 180
aaguuccgca gccucgauug ggagaacccu acugaacggg aggacgauuc ggacaaguac 240
uguaaacuga accuccagca gagcggcuca uuucaauacu acuuucugca agggaacgag 300
aaguccggag ggggguacau cgucguggau ccuauccuuc gcgugggcgc cgacaaccau 360
gugcugccgu uggacugcgu gacccugcaa accuuccucg ccaaaugccu cggaccuuuc 420
gaugaguggg aauccaggcu gagaguggcc aaggaaucgg gguacaacau gauucacuuc 480
accccucucc aaacccuggg ccugucucgg agcugcuacu cccuggccaa ccagcuggag 540
cugaaucccg acuucucccg gcccaaccgg aaguacacuu ggaaugacgu gggccaacug 600
guggagaagc ucaagaagga guggaacgug aucugcauua ccgacguggu guacaaccau 660
accgccgcca acuccaagug gauccaggaa cacccagaau gugccuacaa ccucgucaac 720
ucaccccacc ugaaaccagc augggugcug gaucgcgccc ucuggcgguu cucgugugac 780
guggccgaag gaaaguacaa agagaagggc aucccugccc ugaucgaaaa ugaccaccac 840
augaauucca uuagaaagau cauuugggag gacauuuucc cuaaguugaa gcucugggag 900
uucuuccaag uggacgucaa caaggccgug gaacaguuuc gccggcuccu gacccaagaa 960
aaccgccgcg ugaccaaguc cgacccuaac cagcaccuga ccauaaucca ggacccugag 1020
uacagacggu ucgguugcac ugucgacaug aacaucgccu ugacuacuuu caucccgcac 1080
gacaaggguc cugccgccau ugaggagugc ugcaacuggu uccacaagcg gauggaagaa 1140
cugaacuccg aaaagcaccg ccucaucaac uaccaccagg agcaggccgu gaacugccug 1200
cuggggaacg uauucuacga gaggcuggcc ggacacggac ccaagcuggg acccgugacc 1260
agaaagcauc cucucgucac ccgcuacuuu acuuucccgu uugaagagau cgacuucuca 1320
auggaagagu cgaugaucca ucucccuaac aaggccugcu uccugauggc ccacaacggc 1380
ugggugaugg gcgacgaucc ucugagaaac uucgcugagc ccgguucgga aguguaccuu 1440
agacgggaac uuauuugcug gggcgauucc gugaaguuac gcuacggaaa caagccugag 1500
gacugcccuu accugugggc ccauaugaag aaguacaccg agauuaccgc caccuacuuc 1560
caaggggucc ggcuggacaa cugccacuca acuccucugc acguggcuga guacaugcug 1620
gaugcggccc ggaauuugca gccuaaccuu uacguggucg ccgaacucuu uaccgggucc 1680
gaggaccugg acaacguguu cgugacucgg cucggaaucu ccucacugau uagagaggcc 1740
auguccgcau acaacucgca cgaagaaggc cggcuggucu aucgauacgg cggcgaaccu 1800
gucggaagcu ucguccagcc cugccugcgg ccgcugaugc cagcgaucgc ccacgcccuc 1860
uucauggaca ucacccauga caacgaaugu cccaucgugc accgcuccgc cuacgaugcc 1920
uugccaagca ccaccaucgu guccauggcg ugcugcgcca gcgguagcac uaggggcuac 1980
gaugaacuug ugccgcacca gaucagcgug guguccgagg aaagguuuua cacgaagugg 2040
aaccccgaag cccugcccuc caacacuggg gaagugaacu uccaguccgg gaucauugcg 2100
gcccgcugcg cgaucucgaa gcuccaccag gaacucggcg cgaaaggauu cauucaaguu 2160
uacguggacc aggucgacga ggacaucguc gccgugacuc gccacucccc uucaauccau 2220
caauccgugg uggcgguguc gcggaccgcu uuccggaacc cuaagacuuc guucuacucg 2280
aaagaagugc cucagaugug uauccccgga aagaucgagg aaguggugcu cgaggccagg 2340
acuauugaga ggaauaccaa gccuuaccgg aaggaugaga acuccauuaa cgguacuccu 2400
gacaucaccg ucgagauccg ggaacacauc cagcucaacg aaagcaaaau cgugaagcag 2460
gccggcgugg ccacuaaggg uccgaacgag uacauccagg aaaucgaauu ugagaaccug 2520
ucgcccggaa gcgugauuau uuuucgggug ucccuggacc cgcacgccca agucgccgug 2580
gguauccugc gcaaucaucu gacucaguuc agcccucacu ucaaguccgg cagccuugcc 2640
guggacaacg ccgauccgau ccugaagauc ccauucgccu cacucgccuc acggcucaca 2700
cuggccgaac ucaaucagau ccucuaucgc ugugaauccg aagagaagga ggacggcgga 2760
gguugcuacg auauuccgaa uugguccgca cugaaauacg ccggacugca gggccucaug 2820
uccguguugg ccgaaauccg cccuaagaac gaccucggcc acccguucug caacaaccuc 2880
agaucuggag acuggaugau cgauuacgug ucaaaccgcc ugaucucgag guccggcacu 2940
aucgccgaag ucggaaagug gcuccaagca auguucuucu accugaagca gaucccucgc 3000
uaccugauac cuuguuacuu cgacgccauc cucauuggcg ccuacacuac ucugcuggau 3060
acugccugga agcaaaugag cagcuucgug cagaacggaa gcacuuucgu caagcaucug 3120
ucgcucggga gcgugcagcu gugcggcguc ggaaaguuuc cuucccugcc cauucugucc 3180
ccugcccuca uggaugugcc guaccgccuu aacgagauca cuaaggagaa ggagcagugu 3240
ugcgugagcc uggcugccgg gcucccucac uucucguccg gaaucuucag augcuggggc 3300
cgcgacaccu ucauugcccu gcgagggauc cuguugauua cuggccgcua cguggaggcc 3360
aggaauauca uucucgccuu cgcgggaacc cugcggcacg gccugauccc uaaccuccug 3420
ggagaaggaa ucuaugcgag auauaacugc agggacgccg ugugguggug gcuccagugc 3480
auccaggacu acugcaagau ggugcccaac gggcuggaca uccucaagug ccccguguca 3540
cggauguacc caacugauga cagugcuccu cugccggccg guacucucga ccagccacuc 3600
uuugaaguca uccaggaggc caugcagaag cacaugcagg gcauucaauu ccgggagagg 3660
aacgccggac cucagauuga ccggaacaug aaggacgagg guuucaauau cacugccggc 3720
guggacgaag aaaccggcuu cgucuacgga ggaaacagau ucaacugcgg aaccuggaug 3780
gauaagaugg gagaaagcga cagagcgcgg aacaggggua ucccugccac uccccgggac 3840
ggaucggccg uggaaauugu gggacuuucc aaguccgccg ugcgguggcu ccuggagcuu 3900
uccaagaaga acaucuuccc uuaccaugaa gugaccguga agcggcacgg gaaggccauc 3960
aaagucuccu acgaugaaug gaaccgcaag auucaggaca auuucgagaa gcuguuccau 4020
gucuccgagg acccuucuga ccugaaugag aagcauccca accuggugca caagagaggc 4080
aucuacaagg acagcuacgg agcuuccucc ccuuggugcg auuaccagcu ccggccaaac 4140
uucacuaucg ccaugguggu ggcgccugaa cuguucacca cugaaaaggc cuggaaggcg 4200
cucgaaaucg cggagaagaa gcugcucggg ccucucggga ugaaaacccu cgacccugau 4260
gauauggugu acugcggaau cuacgauaac gcccuagaca acgacaacua caaccuggcc 4320
aagggauuca acuaccauca ggggcccgag ugguuguggc cuauuggcua cuuccugaga 4380
gccaagcucu acuucucccg ccucaugggc cccgaaacca cugccaagac caucgugcuc 4440
gugaagaacg ugcucucccg gcacuaugug caccuugagc gcucgccaug gaagggacug 4500
cccgaacuga cuaacgagaa cgcccaguac ugccccuucu ccugugaaac ucaggccugg 4560
uccaucgcca caauuuugga aacccucuac gaucuguag 4599
<210> 16
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 16
augggacauu caaagcaaau ccggauucug uuacuuaaug agauggagaa guuggagaaa 60
acauuguuua gacucgagca gggcuacgaa cugcaguuuc gccugggccc uacacuacaa 120
gggaaagccg ucaccgucua uacaaacuau cccuuccccg gcgaaacguu uaaucgggag 180
aaguucagau cucuggauug ggagaacccc accgaacggg aggaugauag cgacaaguau 240
ugcaaacuga acuugcagca gucuggcagu uuucaguauu auuuucugca agggaacgag 300
aaguccggcg gcggcuauau aguggucgac cccauccuuc gugugggagc ugacaaccau 360
guguugcccc uggacugugu uacacugcaa accuuucugg cuaagugucu cgguccuuuu 420
gaugaauggg aaucgcggcu caggguggca aaagaauccg gcuauaacau gauucauuuu 480
acaccccugc aaacccuggg ccucucaagg aguuguuaca gccuugccaa ucagcuggag 540
cugaaccccg acuuuucccg ucccaaccgg aaguauacuu ggaacgacgu gggccagcuc 600
guagaaaagc ugaaaaagga guggaacgug aucuguauaa ccgauguggu cuauaaccac 660
accgccgcca auucgaagug gauccaggag caucccgagu gugcuuacaa ccucgugaac 720
agcccccauc uuaagcccgc uuggguacuu gaccgcgcac uuuggagguu uuccugugac 780
guggcugagg ggaaguauaa ggaaaagggc auccccgccc ugaucgaaaa cgaccaucac 840
augaacagua uacggaagau cauuugggag gauauuuuuc ccaaacugaa gcugugggag 900
uuuuuucaag uggaugugaa caaggcuguc gaacaguuua ggaggcugcu gacccaagaa 960
aauagacgcg ugacuaagag cgacccaaau cagcauuuga caauuauaca ggaccccgaa 1020
uaucgccgau ucggcuguac cguggauaug aauaucgcau ugacuacuuu caucccccac 1080
gacaagggcc ccgccgcuau ugaggaaugc uguaauuggu uucauaagcg aauggaggag 1140
cugaacucug agaagcacag gcugauuaac uaucaucagg aacaggccgu uaacuguuug 1200
cugggcaacg uguuuuauga acggcuugcc ggccauggcc cgaaguuggg cccgguuaca 1260
agaaagcauc cacuugugac ccgcuacuuc accuuuccgu ucgaagaaau ugacuuuagc 1320
auggaggagu caaugaucca ccuccccaac aaggcuugcu uucuuauggc ucacaacggc 1380
ugggugaugg gcgacgaccc ccugcggaac uuugcggaac cgggcucaga ggucuaucua 1440
agaagggaac ugauuugcug gggcgacucc gugaagcuga gauacgggaa caagccugag 1500
gauugccccu accucugggc ucacaugaaa aaguauacag aaauuacugc uacguauuuc 1560
caaggcguac ggcuugacaa cugucacucc accccacugc augucgccga guauauguua 1620
gaugcugcuc gaaacuugca gcccaauuug uauguggucg cugaacuguu uacggggagu 1680
gaagaucucg acaacgucuu uguaacccga cugggcauca gcucgcuaau ucgggaggcc 1740
auguccgcuu acaacuccca ugaggaaggc cgccuuguau aucguuaugg cggcgaaccc 1800
guggggagcu uuguucaacc gugucuacgc ccccugaugc ccgccaucgc ucaugcccua 1860
uucauggaua ucacucauga caaugagugu ccuauugugc auaggagugc uuaugacgcc 1920
cucccaagca caacgaucgu guccauggcu uguugugcua guggcuccac aagaggcuau 1980
gacgaacugg ugccccauca aaucuccgua gugucugaag agagauuuua caccaagugg 2040
aaccccgagg cucucccuuc aaacacugga gagguuaacu uucaauccgg gauuauugcu 2100
gcuagaugug cuaucagcaa gcuccaucag gaacugggcg caaagggcuu cauucaaguu 2160
uauguagacc agguugacga ggacauaguu gcaguaacuc ggcauucccc uucgauacau 2220
cagucugucg uggccguguc caggacagca uuucgcaauc ccaagacuag cuuuuacucc 2280
aaagaaguac cacaaaugug uauccccggg aagaucgagg aagugguacu ggaagcccgg 2340
acuauugaga gaaacaccaa gccguaucgg aaggacgaga auucuaucaa cggcacaccu 2400
gauauaacag uggaaauacg cgaacacauu caguugaaug aguccaagau cgugaagcag 2460
gccggcgucg ccaccaaggg ccccaacgag uauauccagg agaucgaauu ugaaaaccug 2520
agccccggcu cuguuauuau auuucggguu ucauuagauc cucaugcuca aguggcugua 2580
ggcauccucc ggaaucaucu gacucaguuc ucuccccacu ucaagagcgg cagccuggcu 2640
gucgauaaug ccgaccccau acuuaagauu cccuuugcuu cccuggcuuc aaggcugacc 2700
cuggcugaac uuaaucaaau ccuauaccga ugcgaaagcg aagagaagga agauggcggc 2760
ggcuguuacg auaucccgaa cuggagcgca cugaaauaug cuggcuuaca aggccucaug 2820
aguguguugg cugagauuag acccaagaau gacuugggcc auccauuuug uaacaaccug 2880
agaagcggcg acuggaugau cgauuacgug ucuaaccgac ucaucucccg aagcggcacc 2940
auugcugagg uuggcaaaug gcugcaggcu auguucuuuu aucugaaaca gauuccucgg 3000
uaccugauuc ccuguuauuu cgacgcuauu cugauuggcg cauauaccac gcucuuggac 3060
acugcaugga agcaaaugag cucuuuuguc caaaauggcu ccacuuuugu uaaacaucug 3120
aguuugggca gcgugcaguu auguggcguu ggcaaauuuc caagccugcc cauacugucc 3180
cccgcucuga uggacguccc cuaccgacug aacgagauca ccaaggaaaa ggaacagugc 3240
ugugugucuu uagcugccgg cuugccgcau uuuucaagcg gcauuuuccg guguuggggu 3300
cgggacaccu ucaucgcacu gagaggcauu cugcugauca cuggccgcua uguggaagcu 3360
aggaauauca uuuuagccuu ugcggguacc cuucggcacg ggcugauccc caaucuuuug 3420
ggcgaaggca ucuacgcacg uuacaauugc cgggaugccg uaugguggug gcuccaaugu 3480
auccaggacu auugcaagau gguucccaac ggccucgaua uccugaagug ccccguguca 3540
aggauguauc cuaccgauga cagugcuccc cuuccugcug gcacccugga ucagccgcuc 3600
uuugaaguua uucaggaagc aaugcaaaag cauaugcagg gcauccaguu ucgggaaaga 3660
aacgcuggcc cgcaaauaga caggaacaug aaggaugaag gcuucaauau uacugcuggc 3720
guagacgaag agacaggguu cgucuacggc ggcaauaggu uuaacugugg cacuuggaug 3780
gacaagaugg gcgaaucuga ccgcgcgagg aacagaggca ucccagcaac accgagggac 3840
ggcagcgcug uggagauugu gggccugucu aagucugccg ugcgcuggcu acucgaacug 3900
uccaagaaga auaucuuucc cuaucaugaa gucaccguaa agcggcaugg caaagcuauu 3960
aagguuuccu augacgagug gaacaggaag auucaggaca auuuugagaa gcuguuccau 4020
gugucggagg acccuagcga ucucaacgag aagcacccca acuuaguaca uaagaggggc 4080
aucuauaagg auagcuaugg cgcuagcagc ccuuggugug acuaucagcu ccgucccaac 4140
uuuaccauug cuaugguagu ggcgcccgag uuguuuacca cugagaaggc uuggaaggcu 4200
cuugaaauag ccgagaagaa auugcugggc ccccugggca ugaaaacucu ggaucccgau 4260
gacaugguau acuguggcau cuaugacaau gcccuggaca augacaauua caaucuggcc 4320
aaggguuuua acuaucacca gggcccugaa uggcuguggc cuauuggcua uuuucuucgc 4380
gccaagcuau auuuuaguag gcugaugggu ccagaaacaa cugcaaagac aauugugcuc 4440
gugaagaacg ugcuuucccg gcacuaugug caucuggaaa ggaguccaug gaagggcuug 4500
ccggaauuga cuaacgagaa cgcccaguau ugucccuuuu cuugugaaac ucaggccugg 4560
uccauugcua cuauucugga gacucuauau gacuuguag 4599
<210> 17
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 17
augggccauu ccaagcaaau ucgaauucug cugcugaacg aaauggaaaa guuggaaaag 60
acauuguucc gucuggagca gggcuaugag cugcaguuua ggcuuggccc gacguugcag 120
ggcaaagccg ugaccguaua uacuaacuau cccuucccug gcgaaacguu uaaccgggag 180
aaguuucgcu cacuggacug ggagaauccc acggaaaggg aggacgauag cgauaaguac 240
uguaaacuga aucugcaaca gucuggcucu uuccaauauu auuuucugca agggaacgag 300
aaguccgggg gcggcuauau uguaguggac cccaucuuga gagugggcgc ugacaaccau 360
guauuacccc uugauugcgu gacgcugcag accuuucugg cuaaguguuu gggcccuuuc 420
gaugaguggg aaagccggcu gaggguggcc aaggagagcg gcuauaauau gauucauuuu 480
accccuuugc aaacucuggg gcucucuagg agcuguuauu ccuuggcuaa ucagcuggaa 540
cugaaccccg auuuuagccg gcccaaccga aaguauacau ggaaugacgu ugggcaauug 600
guugagaagc ugaagaagga auggaauguu auauguauaa cagacguggu guauaaccau 660
accgcugcua auucgaaaug gauucaggaa cauccugagu gcgccuacaa ccucguaaau 720
aguccucauc ugaagccggc uugggugcug gacagggcuc ucuggagguu uagcugugau 780
guggccgaag ggaaguauaa ggagaagggu aucccggcuc ugauugagaa cgaccaccau 840
augaacagua uaaggaagau aaucugggag gacauuuuuc ccaaacugaa gcugugggaa 900
uucuuucaag uggacgugaa caaggccguu gagcaguuua gacgcuugcu gacacaagag 960
aaccgaaggg ucaccaagag ugacccuaac cagcaucuua caauuaucca agaccccgag 1020
uaucgucggu uuggcuguac uguggacaug aacauugcuc ugaccaccuu uauaccccac 1080
gauaagggcc ccgcugcuau cgaagagugu uguaacuggu uccacaagag gauggaagag 1140
uugaacucug aaaagcaucg gcugauuaac uaucaucagg aacaggcugu gaacugccug 1200
cucggcaacg uauucuacga gagauuggcu ggccauggac cuaagcuggg cccgguuacg 1260
agaaagcauc cccugguuac gcgguauuuc accuucccgu uugaggagau ugauuuuagc 1320
auggaagaau ccaugaucca ccuccccaac aaggcuugcu uccugauggc acauaacgga 1380
uggguuaugg gcgacgaccc ccugaggaau uuugcugaac ccggcuccga agucuaucug 1440
agaagggaac ugaucuguug gggcgacucc gucaaguugc gcuauggcaa uaagccugag 1500
gacuguccau aucugugggc ucacaugaag aaguacacag agaucaccgc uacauacuuu 1560
cagggcguca ggcucgacaa uugucacucc acaccccugc acguggcuga guauaugcug 1620
gaugccgcua ggaaucucca gccuaaccua uauguggucg cugaacuguu caccggcucu 1680
gaggaucugg auaauguguu ugugacacgc cugggcauca gcucccugau ccgcgaggcu 1740
augagugccu acaauaguca cgaggaaggc cggcuugugu accgcuaugg cggcgaaccc 1800
gugggcagcu uuguacaacc uugucugcgg ccucugaugc ccgcuauugc ucacgcuuug 1860
uuuauggaca ucacccauga caacgaaugu cccauuguac accggucugc uuacgacgcu 1920
cugcccucca caacuauugu caguauggcu uguugugcau cuggcucaac ucggggcuac 1980
gacgaauuag uuccgcauca aaucucugua guguccgaag aacgguuuua uacaaaaugg 2040
aaccccgaag cgcugcccuc caauaccggc gaagugaacu uucagucugg gaucaucgcc 2100
gcuagaugug cuauuucuaa acugcaucag gaacugggcg cuaagggcuu uauucaagua 2160
uauguggacc aggucgacga ggacaucgua gcuguaaccc ggcacagccc cagcauacau 2220
cagagugucg uggcuguguc uagaacagcu uuuaggaacc caaagaccuc uuuuuacucc 2280
aaagagguuc cacagaugug uaucccgggc aaaauugagg aaguggucuu ggaggccagg 2340
acaauugagc guaauacgaa gcccuauaga aaggaugaga auagcaucaa cggcacuccu 2400
gauaucacug uggaaauccg ggagcauaua caguugaacg agucuaagau cguuaagcag 2460
gcugguguag cuaccaaggg ucccaaugag uauauucagg aaauugaguu ugaaaaccug 2520
uccccgggca gcguaauuau cuuuagaguc agucucgacc cccaugcuca aguggcagug 2580
gggauccugc ggaaccauuu gacucaguuc uccccccauu uuaagucugg cagucuggcc 2640
guugacaacg cugaccccau auugaagauu cccuuugcuu cccuggcuuc acgguugacc 2700
cuggccgaac ugaaccagau uuuauaucgc ugcgaguccg aggaaaagga ggauggcggc 2760
ggcuguuaug acauucccaa cuggucugcu cuaaaauacg cugggcugca gggucugaug 2820
agugugcugg cugaaauucg ccccaagaac gaccugggcc auccauuuug caacaaucug 2880
cgcaguggcg acuggaugau ugauuaugug uccaaccggc ugauuagucg gagcggcacg 2940
aucgcagaag ucggcaaaug gcuccaggcu auguuuuuuu accuaaagca gauacccaga 3000
uaccugaucc cuuguuauuu ugacgcuaua cugauuggcg cuuacacaac cuugcuggac 3060
accgccugga agcagaugag cagcuuuguc caaaauggca gcacauucgu gaagcauuug 3120
ucucugggca gugugcagcu guguggcgug ggcaaauuuc caaguuugcc gauccugucu 3180
cccgcuuuga uggaugugcc auaucgacug aacgagauaa ccaaggaaaa ggaacagugu 3240
uguguuucac ucgcugcugg cuugccccau uuuuccucug gcauuuuccg auguuggggg 3300
agggacacau ucauugcccu gcgugggauc cugcugauua ccggccgcua cguugaggcu 3360
agaaacauua uuuuggcuuu cgccggcaca uugagacaug gucugauacc caaucugcug 3420
ggcgaaggca uauaugcuag guauaacugu cgcgacgcag ugugguggug gcugcaaugc 3480
auccaggauu auugcaagau gguuccuaac ggccuagaca uccugaagug cccagugucc 3540
cggauguauc caaccgauga uucagcuccc cugcccgccg guacacugga ccaaccccug 3600
uucgaaguua uucaagaagc caugcagaag cacaugcagg guauccaguu ucgagagagg 3660
aaugcaggcc cccaaauuga ccggaacaug aaggaugaag gcuucaacau uacugcuggc 3720
gucgacgaag aaacaggguu uguguacggc ggcaaccggu uuaacugcgg cacauggaug 3780
gacaagaugg gcgaaagcga ucgcgcacgg aaccggggca uccccgccac gccgcgugau 3840
ggcucugcug uggagaucgu cggccucagc aaauccgcug uccgauggcu guuagagcug 3900
ucgaagaaga acaucuuucc cuaccaugag guuaccguua agagacacgg caaagcuauc 3960
aaagugucuu augacgaaug gaauagaaag auucaagaca acuucgagaa acuguuucau 4020
guguccgagg aucccagcga ccucaacgaa aagcauccca aucucguaca uaagaggggc 4080
aucuauaagg acucauaugg cgcaucaagu ccuuggugcg acuaucagcu ucggcccaau 4140
uucacgaucg caauggucgu ggcacccgag cuguuuacua cggagaaggc uuggaaggcu 4200
cuggaaaucg cugagaagaa gcugcugggc cccuugggca ugaaaacccu ggaucccgac 4260
gacaugguau acuguggcau auaugacaac gcucuggaua acgauaacua uaauuuggcu 4320
aaaggcuuua auuaucacca gggcccagaa uggcuauggc ccauuggcua cuuucugcga 4380
gcuaagcuau auuuuucucg ccugaugggc ccugaaacca ccgcuaagac uaucgugcuc 4440
gucaagaacg uacugaguag gcauuacgug cacuuggagc gcagcccaug gaagggcuug 4500
ccggaacuga cgaacgaaaa cgcucaguau uguccguuuu cuugugaaac acaggcuugg 4560
aguauugcua cuauccugga aacucuguac gaucuguag 4599
<210> 18
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 18
augggucauu ccaaacaaau uaggauccug cuguugaacg aaauggaaaa gcucgaaaag 60
accuuauuuc gccuggagca gggcuaugag uugcaguuuc ggcugggacc aacucugcaa 120
ggaaaggcug uaaccgugua cacaaauuau ccuuuucccg gcgaaacguu uaacagggag 180
aaguuucgau cucuggauug ggagaacccc acugaaaggg aggacgauag cgacaaguau 240
ugcaaacuga aucugcaaca guccggcagc uuucaauauu auuuucugca agggaacgaa 300
aagagcggcg ggggcuauau uguaguagac ccuauacuga gagucggagc ugacaaccau 360
guucugcccu uggacugcgu gacacugcag accuuuuugg cuaagugucu gggccccuuu 420
gaugaauggg agagucggcu ccguguggcu aaggagagcg gguacaauau gauucacuuu 480
accccccugc aaacuuuggg acuuucccgg agcuguuaua gccuggcaaa ccagcuggag 540
uugaauccug acuuuucccg cccaaauagg aaguauaccu ggaacgacgu gggccaacug 600
guggagaagc ugaagaagga guggaacgug aucugcauua ccgacgucgu guauaaucau 660
accgccgcca acuccaagug gauacaggaa cauccugagu gugcuuacaa ccucguaaac 720
uccccgcauc ugaagccagc uuggguucug gauagagcuu uguggcgguu cagcugugac 780
gucgcugagg gaaaguacaa ggaaaaaggg auuccugcuc ucaucgagaa ugaccaccac 840
augaacagua uuaggaagau uaucugggag gacaucuucc cgaagcuaaa gcugugggaa 900
uucuuccaag uggacgugaa caaggccgug gagcaguucc gacggcuguu aacucaagag 960
aaccguaggg ucacaaaauc ggauccuaac cagcaccuga ccauuaucca agacccggaa 1020
uaucggcggu ucggcuguac uguggacaug aacauugcuu ugacaacuuu cauuccccac 1080
gacaaggguc cagcagcuau cgaggaaugu uguaauuggu uucauaagcg gauggaggaa 1140
cucaacuccg agaagcauag gcugauuaau uaucaucagg aacaggcugu gaauugucug 1200
uugggcaaug uuuucuacga acggcuggcu ggccauggcc ccaaacucgg accuguuaca 1260
aggaagcauc cacugguuac ccgauacuuu accuuuccau uugaagaaau ugauuuuagc 1320
auggaagaau ccaugaucca ucuaccuaac aaggccuguu uucugauggc ccauaacggc 1380
uggguuaugg gagaugaucc cuugcggaac uuugcugaac ccggaucuga aguauaucug 1440
cggagagagu ugauuuguug gggcgacucc guaaagcugc gcuauggcaa caagccagag 1500
gacugucccu auuugugggc ucauaugaag aaguauaccg agaucaccgc uacguauuuu 1560
caaggcguca ggcucgauaa uugucauucc acuccgcugc auguugcuga guauauguug 1620
gacgcugcuc gaaaucugca gcccaauuug uauguugugg ccgagcuguu uaccggcucc 1680
gaggaccucg auaacguguu cgucacgcga cuaggcauca gcagcuugau ccgggaagcc 1740
auguccgcuu auaacuccca cgaggagggc cgacuggucu accgcuaugg cggcgaacca 1800
gugggcaguu uuguacagcc uugucugagg ccccucaugc ccgcuauugc ucaugcucug 1860
uucauggaca uuacucauga uaacgagugc ccuauagugc aucgguccgc cuacgacgcc 1920
cugccgagca cuacaauagu guccauggcu uguugugcaa gcgggagcac ccgcggcuau 1980
gacgagcugg ugccgcauca aauaucugua gucagcgaag aaagguuuua uaccaagugg 2040
aacccggaag cuuuaccuuc caauacuggg gaagugaacu uucagagcgg cauuaucgcu 2100
gcgagaugug cuauauccaa guugcaucag gaacuggggg caaagggguu uauucaagua 2160
uauguagacc agguugacga agauauagug gcugugacac gccacagccc aagcauccac 2220
caguccgugg uggcugucag ccggacugcu uuucgcaacc caaagacaag cuuuuauagc 2280
aaagaagugc cgcagaugug cauucccggc aaaauugagg aggucgugcu ggaggcuagg 2340
acuaucgaaa ggaacaccaa gccguacagg aaggacgaga auuccaucaa cgggacucca 2400
gauauuacag uugagauccg ggaacauauu caguugaaug agucgaagau uguuaagcag 2460
gcuggcguag cuacaaaggg gccaaacgag uauauucaag agauagaauu cgaaaaccug 2520
agccccgguu ccgugaucau uuuucgagug ucccuggauc cucaugcuca aguggccguu 2580
ggcauucuga gaaaccaucu cacacaauuu uccccucacu uuaaaagugg cagccuggcu 2640
guggacaacg ccgauccgau ccugaagauu ccauucgcuu cccuggcuag ucgccugaca 2700
cuggcugaac uaaaccagau ucuuuaccgc ugugaaucug aagagaagga ggacggcggc 2760
gguugcuaug acaucccaaa uuggagcgcu cugaaauacg cugggcugca gggccucaug 2820
agcguacugg cagaaaucag acccaagaac gaccugggcc accccuucug uaacaaccug 2880
agguccggcg auuggaugau cgacuaugug ucgaacagac ucaucucaag aagcggcacu 2940
auagcugagg ucggcaaaug guugcaggcu auguucuuuu aucugaagca aauuccgcgg 3000
uaucugaucc cgugcuauuu ugacgcuaua uugaucggcg cuuauacgac uuugcuggac 3060
acagccugga agcagauguc cagcuucgug cagaacggca gcacuuuugu gaagcaccug 3120
agucugggcu caguacagcu guguggcgug ggcaaauucc ccagccuacc aauucugucc 3180
cccgcucuga uggauguucc cuaucggcug aacgagauua ccaaggaaaa ggagcaaugu 3240
ugcgugagcc uggcagccgg ccugccccac uuuucuuccg gcauuuuucg cuguuggggu 3300
cgggacaccu ucauugcacu gcggggcauc cuguuaauca ccggccgcua uguggaagcu 3360
agaaauauua ucuuggcuuu ugcuggcacu cugcgacacg gccugauccc caaccuucug 3420
ggcgaaggca ucuaugcucg cuacaauugu cgcgacgccg ucugguggug gcugcagugu 3480
auacaggacu auugcaagau ggugccaaau ggccuggaca uccuuaaaug uccaguuucc 3540
cggauguacc caacugacga cagcgcuccu uugccugccg gcacacugga ucagccgcug 3600
uuugaaguga uccaggaagc uaugcagaag cauaugcagg gcauucaguu ucgggaacga 3660
aaugcuggcc cacaaauuga cagaaacaug aaggaugagg guuuuaacau uacugcuggc 3720
gucgaugaag agacaggguu uguguacggc ggcaacaggu ucaacugcgg cacauggaug 3780
gacaagaugg gcgaaucuga ccgugcuagg aacaggggaa uccccgcuac cccccgggac 3840
ggcagcgcug uggaaaucgu aggccugucc aaguccgccg uucgcuggcu ucuggagcug 3900
agcaagaaaa acaucuuucc cuaucacgag gucacaguga agagacaugg caaagcuauc 3960
aaagucucuu acgaugagug gaauagaaag auucaagaua acuuugaaaa guuguuccac 4020
guuucggagg accccagcga ucugaaugag aagcauccca acuuggugca caagaggggc 4080
auauacaagg acucuuaugg ugcuagcagc ccuuggugcg acuaucagcu gaggcccaac 4140
uuuacuaucg ccaugguggu ggcaccggaa cuguuuacaa cggagaaggc uuggaaggcu 4200
cuggaaauug cugagaagaa guugcugggg ccccugggga ugaaaacgcu ggauccagac 4260
gacauggucu acuguggcau auaugauaau gcucuggaua acgauaauua caaucuggcu 4320
aaggguuuca acuaucauca ggggccagag uggcucuggc cuauuggcua uuuccuccgu 4380
gcuaagcugu acuuuucucg ccugaugggg ccagaaacua ccgcaaagac cauuguauug 4440
gucaagaacg ugcugagccg gcauuaugua cauuuggaac gguccccuug gaaaggccug 4500
cccgaacuca cuaacgagaa cgcucaguau uguccguuuu ccugcgaaac ccaggcuugg 4560
uccaucgcaa cuauuuugga aacccuguac gaccuguag 4599
<210> 19
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 19
augggccaca gcaagcaaau cagaauccuc cugcucaacg agauggaaaa gcucgaaaag 60
acccuguuca gacuggagca gggauacgag cugcaguucc gccucggacc aacccuccaa 120
gggaaggccg ugaccgugua caccaacuac ccauucccgg gagaaaccuu caaccgggaa 180
aaguucagga gccuggacug ggaaaacccc accgagagag aggacgacag cgacaaauac 240
ugcaagcuga accuccaaca gagcggcagc uuccaguacu acuuccucca aggaaacgaa 300
aagagcgggg gcggcuacau cgugguggac ccaauccugc gggucggggc agacaaccac 360
gugcugccac uggacugcgu gacacugcag accuuccugg ccaagugccu gggaccguuc 420
gacgaauggg agagccggcu gcggguggcc aaggagagcg gcuacaacau gauccacuuc 480
acaccgcucc aaacccucgg ccugagcaga agcugcuaca gccuagccaa ccagcuggag 540
cucaacccgg acuucagcag gcccaacaga aaguacaccu ggaacgacgu gggacagcuc 600
guggaaaagc ugaaaaagga auggaacgug aucugcauca ccgacguggu guacaaccac 660
accgccgcca acagcaaaug gauccaggaa cacccggaau gcgcguacaa ccucgugaac 720
agcccccacc ugaagccggc cuggguacug gacagggcac uguggcgcuu cagcugcgac 780
guggccgaag gaaaguacaa ggagaagggc auccccgccc ugaucgagaa cgaccaccac 840
augaacagca uccggaagau caucugggag gacaucuucc caaagcugaa gcugugggag 900
uucuuccaag ucgacgugaa caaggccgug gaacaguuca gacgccugcu gacgcaggag 960
aaccggaggg ucaccaagag cgaccccaac cagcaccuga ccaucaucca agacccggaa 1020
uaccggagau ucggaugcac cguggacaug aacaucgccc ugaccaccuu caucccacac 1080
gacaaggggc ccgcagccau cgaggagugc ugcaacuggu uccacaagag aauggaggaa 1140
cugaacagcg aaaagcaccg ccucaucaac uaccaccagg aacaggccgu gaacugccuc 1200
cucggaaacg uguucuacga gcggcuggcc ggccacgggc ccaagcuggg ccccgugacc 1260
cgcaagcacc cgcucgugac gcgguacuuc accuucccgu ucgaagaaau cgacuucagc 1320
auggaggaga gcaugaucca ccucccgaac aaggccugcu uccucauggc ccacaacggc 1380
ugggucaugg gcgacgaccc gcugcggaac uucgcagagc ccggaagcga aguguaccuc 1440
agaagggagc ugaucugcug gggagacagc gugaagcugc gcuacggaaa caagcccgag 1500
gacugcccgu accugugggc gcacaugaag aaguacaccg agaucaccgc caccuacuuc 1560
caaggagugc ggcuggacaa cugccacagc accccgcugc acguggccga guacaugcug 1620
gacgccgcca gaaaccucca gcccaaccuc uacguggugg cagagcuguu caccgggagc 1680
gaggaccucg acaacguguu cgugacccga cucggcauca gcagccugau ccgggaagca 1740
augagcgccu acaacagcca cgaggaaggg aggcuggugu acagauacgg aggagaaccc 1800
gugggcagcu ucgugcagcc gugccugagg ccccugaugc cagccaucgc gcacgcgcug 1860
uucauggaca ucacccacga caacgaaugc ccgaucgugc accggagcgc auacgacgcc 1920
cugccgagca ccacgaucgu cagcauggcc ugcugcgcca gcggcagcac ccgaggauac 1980
gacgagcugg ugccccacca aaucagcguc gucagcgaag aacgcuucua caccaagugg 2040
aacccggaag cacugccgag caacaccgga gaagugaacu uccagagcgg aaucaucgcc 2100
gcgcgcugcg cgaucagcaa acugcaccag gaacugggag ccaagggguu cauccagguc 2160
uacgucgacc aaguggacga ggacaucgug gcagugaccc gccacagccc cagcauccac 2220
caaagcgugg uggccgugag ccggacagcg uuccggaacc ccaagacgag cuucuacagc 2280
aaagaggugc cccagaugug caucccggga aagaucgagg aaguggugcu cgaagcgcgc 2340
accaucgaac gcaacaccaa accguaccgc aaggacgaaa acagcauaaa cgggaccccc 2400
gacaucaccg uggagaucag ggaacacauc cagcugaacg agagcaagau cgugaagcag 2460
gccggggucg ccaccaaggg cccgaacgag uacauccagg agaucgaguu cgagaaccuc 2520
agccccggga gcgugaucau cuucagaguc agccuggacc cacacgccca aguggccgug 2580
ggcauccucc ggaaccaccu gacccaguuc agcccgcacu ucaagagcgg gagccucgcc 2640
guggacaacg ccgacccgau ccugaagauc ccguucgcga gccuggccag ccggcucacc 2700
cuggccgaac ugaaccagau ccuguaccgc ugcgagagcg aagaaaagga ggacggagga 2760
gggugcuacg acaucccaaa cuggagcgcg cugaaauacg cgggccugca gggccugaug 2820
agcgugcugg ccgaaauccg ccccaagaac gaccugggac acccauucug caacaaccug 2880
aggagcggag acuggaugau cgacuacguc agcaacagac ugaucagccg cagcggcacc 2940
aucgccgaag ucggaaaaug gcuccaggcc auguucuucu accugaagca gaucccgcgg 3000
uaccugaucc cgugcuacuu cgacgccauc cugaucggcg ccuacaccac ccugcucgac 3060
accgccugga agcagaugag cagcuucguc caaaacggga gcaccuucgu gaagcaccuc 3120
agccugggca gcgugcagcu gugcgggguc ggaaaauucc cgagccugcc cauccugagc 3180
ccggcgcuga uggacgugcc guacagacug aacgagauca ccaaggaaaa ggaacagugc 3240
ugcgugagcc uggccgccgg acugccgcac uucagcagcg gcaucuuccg gugcuggggg 3300
cgcgacaccu ucaucgcccu gcggggaauc cugcugauca cgggccgcua cguggaggcc 3360
cggaacauca uccuggccuu cgccggcacc cugcggcacg gacugauccc gaaccuccug 3420
ggagagggga ucuacgcccg guacaacugc cgggacgccg ugugguggug gcugcagugc 3480
auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgucagc 3540
cggauguacc cgaccgacga cagcgccccg cuccccgccg gaacccucga ccagccacug 3600
uucgaaguga uccaggaggc caugcaaaag cacaugcagg gaauccaguu cagagaacgg 3660
aacgccggac cccagaucga ccggaacaug aaggacgagg gauucaacau caccgccgga 3720
gucgacgagg aaaccggcuu cgucuacgga gggaaccggu ucaacugcgg aacauggaug 3780
gacaagaugg gagagagcga ccgcgccagg aaccgcggaa ucccagcaac cccgcgggac 3840
gggagcgcag uggaaaucgu ggggcugagc aaaagcgccg ugcgguggcu gcucgaacuc 3900
agcaagaaga acaucuuccc cuaccacgaa gucaccguga agagacacgg aaaggccauc 3960
aaagucagcu acgacgaaug gaacaggaag auacaggaca acuucgagaa gcuguuccac 4020
gucagcgagg acccgagcga ccugaacgag aagcacccca accuggugca caagcgcggg 4080
aucuacaagg acagcuacgg cgcgagcagc ccguggugcg acuaccaacu gcgccccaac 4140
uucaccaucg ccauggucgu ggcccccgaa cucuucacga ccgagaaagc guggaaggcg 4200
cuggagaucg cggaaaagaa gcuccucgga ccccugggga ugaaaacccu ggaccccgac 4260
gacauggugu acugcggcau cuacgacaac gcgcuggaca acgacaacua caaccuggcc 4320
aagggcuuca acuaccacca gggccccgaa uggcuauggc cgaucggcua cuuccugcgg 4380
gccaagcugu acuucagccg ccucaugggc ccagaaacca ccgcaaagac caucgugcug 4440
gucaagaacg uccugagccg ccacuacgug caccucgaga gaagcccaug gaagggacug 4500
cccgagcuga ccaacgaaaa cgcgcaguac ugcccguuca gcugcgaaac ccaggccugg 4560
agcaucgcca ccauccugga aacacuguac gaccucuag 4599
<210> 20
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 20
augggccaca gcaaacagau ccggauccuc cuacucaacg aaauggaaaa gcucgaaaag 60
acucuguucc ggcuggagca aggauacgag cuucaguucc gguugggccc gacgcugcag 120
gggaaggccg ugacagucua cacuaacuac ccauuccccg gcgaaaccuu caacagagag 180
aaguucaggu cccuggacug ggagaacccc acugaacggg aagaugauuc cgacaaguac 240
ugcaagcuga accuccagca auccgguuca uuccaguacu auuuccugca aggaaacgaa 300
aagagcggag gaggcuacau ugugguugau ccaauccuuc gcgugggagc cgauaaucau 360
gugcugccgc uggauugcgu cacccugcaa accuuccugg cgaagugccu gggcccguuc 420
gacgaauggg aaucccgccu gcgggucgcc aaagaguccg gguauaacau gauccacuuc 480
accccacucc aaacucuugg ccuguccaga uccugcuacu cguuggccaa ccaguuggag 540
cugaacccgg acuucucacg gccuaaccgg aaguacacuu ggaacgacgu cggacaacuc 600
guggagaagc ugaagaagga auggaauguc aucugcauua cugaugucgu guacaaccac 660
acggcggcga auucaaagug gauccaggag cacccagaau gcgccuacaa ccuggucaau 720
uccccucacc ugaagccggc cugggugcuc gaccgggccc uguggcgguu uucgugcgau 780
guggcggagg gaaaguacaa ggagaagggg auuccggcuc ucaucgaaaa cgaccaccac 840
augaacucca uccggaaaau uaucugggag gacaucuucc cgaaacuuaa gcugugggaa 900
uucuuccaag uggacgucaa caaggcugug gagcaguucc ggagauugcu gacacaagaa 960
aaccgccgcg ugaccaaauc cgauccgaac cagcaccuga cuaucauuca agacccggaa 1020
uaccggaggu uuggcugcac uguggacaug aauaucgcgc ugaccaccuu caucccgcac 1080
gacaagggac cggcagccau cgaagagugc uguaacuggu uccauaagag gauggaagaa 1140
uugaacucug aaaagcaccg gcugauuaac uaccaucagg aacaggccgu gaacugucuc 1200
cugggaaacg uguucuacga gcggcuggcg ggacacggac ccaagcucgg ccccgugacc 1260
cgcaagcauc cucucgugac uagauacuuu acuuucccau ucgaggagau cgacuucucc 1320
auggaagaau caaugaucca ccucccuaac aaggcuugcu uucugauggc acacaacggc 1380
ugggugaugg gcgaugaccc ccugaggaac uuugccgagc ccggcuccga aguguaccug 1440
aggagagagc ugauuugcug gggggacagc gucaagcugc gcuauggaaa caagccggaa 1500
gauugcccuu accucugggc ccacaugaag aaguacacug agauuacugc caccuacuuu 1560
caaggagugc gccuggauaa cugccacuca accccgcugc augucgcuga guacauguug 1620
gacgcagccc ggaaucugca accgaaccuc uacguggugg cggagcuguu caccggcucg 1680
gaggaucucg acaacguguu cgugacucgc cugggcaucu caucgcugau ccgggaagca 1740
auguccgccu acaacuccca ugaggagggu cggcuggugu accgcuacgg cggagaaccc 1800
gugggguccu ucgugcaacc gugccugcga ccccugaugc ccgccaucgc ccaugcccuc 1860
uuuauggaua uuacccacga uaacgaaugc ccuaucgugc accgcucagc cuaugaugcc 1920
cuccccucca ccaccaucgu guccauggcc ugcugcgccu cggggagcac ccgggguuau 1980
gacgagcugg ugccgcacca gauuucggug guguccgagg agagauucua caccaagugg 2040
aacccagaag cucugccguc aaacacugga gagguuaacu uucaguccgg uauuaucgcc 2100
gcuagaugug cuauuagcaa acugcaccaa gagcugggcg ccaaggguuu cauccaaguc 2160
uacgucgauc aggucgacga ggacaucgug gcugucacua ggcacucacc uagcauccac 2220
cagagcgugg uggccgugag ccgcacugcc uuccgcaacc caaagaccag cuuuuacucc 2280
aaggaggucc cucagaugug cauuccugga aagaucgaag aagugguccu ggaagcccgg 2340
accaucgaac gcaacaccaa gccuuaccgg aaggacgaaa acucgaucaa cgguaccccg 2400
gauauuacug uggagauucg cgaacacauc cagcucaaug aguccaagau cgugaagcag 2460
gccggagugg caaccaaggg gccgaacgag uacauccagg agaucgaauu cgagaaucuc 2520
agcccuggca gcgugaucau cuuccgagug ucguuggacc cacaugcuca ggucgccgug 2580
ggcauccuga ggaaccaccu gacccaguuu uccccgcauu ucaaguccgg uucgcuggcc 2640
guggacaacg cagauccgau ccugaagauc cccuucgccu ccuuggcuuc gcgccucacg 2700
cuggccgagc ugaaccagau ccuguauaga ugcgaauccg aagaaaagga agauggaggc 2760
gguuguuacg acaucccgaa cugguccgcc uugaaauacg ccggacugca gggauugaug 2820
uccgugcugg ccgaaauuag accgaagaac gaccuggggc acccguucug caacaaccuc 2880
cggucggggg acuggaugau ugauuacgug ucgaaccgcc ucaucucccg guccgguacu 2940
auugcggagg ucggcaaaug gcuccaggcc auguucuucu acuugaagca aaucccccgc 3000
uaccugaucc ccugcuacuu cgacgccauc cugaucggag ccuacaccac ccugcuggac 3060
accgcgugga agcagauguc uagcuucguc cagaacggcu ccaccuucgu gaagcaccug 3120
ucacugggcu cagugcagcu gugcggaguu ggaaaguucc ccagccugcc uauccugucc 3180
ccggccuuga uggacgugcc guacagacug aacgaaauca cuaaggagaa ggagcagugu 3240
ugcgugucgu uggcggccgg gcugccccac uuuucaagcg ggauuuuccg gugcugggga 3300
agggacaccu ucaucgcgcu gcggggaauc cugcugauua ccggacgcua cguggaggcu 3360
cggaacauca uucucgcguu cgccggcacc cugcgccaug gacugauccc uaaucugcuu 3420
ggagagggca ucuacgcucg guacaacugc agagaugccg ugugguggug gcuccaaugc 3480
auccaggauu acugcaagau ggugccuaac ggucuggaca uucugaagug cccugugucc 3540
cgcauguacc ccaccgacga cuccgccccc cugccugccg gaacccucga ccagccucug 3600
uucgaaguca uccaagaggc caugcagaag cauaugcagg gcauucaguu ccgcgaacgg 3660
aacgcagggc cccagaucga ccggaacaug aaggaugaag gguucaacau caccgccgga 3720
guggaugaag agacuggauu ugucuacgga ggaaaccgcu uuaacugcgg gaccuggaug 3780
gacaagaugg gagagucaga cagggccaga aauagaggaa uccccgcgac cccgcgcgac 3840
ggauccgccg uggagauugu gggccuguca aagagcgccg uccgcuggcu gcuggaacuu 3900
agcaagaaga acaucuuccc uuaccacgaa gugaccguga aaagacaugg caaagccauc 3960
aaagucuccu acgacgagug gaaccgcaag auucaggaca acuucgaaaa gcuguuccac 4020
guguccgaag aucccuccga ucugaacgag aagcauccga accuggucca uaagcgggga 4080
aucuacaagg auagcuacgg ugccagcucg ccguggugug acuaccagcu gcggccaaau 4140
uucacgauug cgauggucgu cgccccugag uuguucacca cugagaaggc cuggaaagcc 4200
cuggaaauag ccgagaagaa auuacugggg ccacugggca ugaaaacucu cgacccugac 4260
gacauggugu acuguggaau cuacgacaac gcacuggaca acgauaacua caauuuggcc 4320
aagggauuca acuaccacca ggggcccgaa uggcuguggc cuaucggaua cuuccuucgg 4380
gcaaagcuuu acuucucccg ccugauggga ccugaaacua cugccaagac cauugugcuu 4440
gugaagaacg ugcucucacg gcacuacgug caccuggaga gauccccgug gaaggggcuc 4500
ccggagcuga ccaacgagaa cgcccaguac ugcccuuucu ccugcgaaac ccaagccugg 4560
uccaucgcca ccauacuuga aacucuguac gaccuguag 4599
<210> 21
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 21
augggacacu ccaagcagau ccgcauucuc cuccugaacg aaauggaaaa gcuggaaaag 60
accuuauuuc gccuugaaca aggauacgag cugcaguucc ggcuuggacc gacccuccaa 120
gggaaagcug ucaccgucua caccaacuac cccuucccgg gggagacuuu caacagagag 180
aaguucagau ccuuggacug ggaaaauccc acggaacggg aggacgacuc cgauaaguac 240
uguaaacuga accuccagca gucgggaucg uuccaguacu acuuccuaca agggaacgaa 300
aaguccggug gugguuacau cgugguggac ccgauccugc gcgugggggc cgacaaccac 360
gugcugccgc uggacugcgu gacucugcaa accuuccugg ccaagugccu cggcccguuc 420
gaugaauggg agucgagacu gcggguggcc aaggaaagcg gauacaauau gauucacuuu 480
acuccgcugc aaacccuggg gcugucgcgc uccugcuacu cgcucgcuaa ccagcuggaa 540
cugaauccgg auuuuagccg gccgaaccgg aaguauacgu ggaacgacgu cggucagcug 600
gucgagaagc ucaagaagga guggaacguc auuugcauca ccgacguggu cuacaaccac 660
accgcggcca auuccaagug gauccaggaa cacccggagu gcgccuauaa cuuggugaac 720
uccccucauu ugaaacccgc augggugcuc gaccgggccc uguggcgcuu uucaugcgac 780
guggcggaag ggaaguacaa ggaaaagggg auucccgccc ugaucgagaa cgaucaccac 840
augaacucaa uucgcaaaau caucugggag gauaucuucc cuaagcucaa gcugugggaa 900
uucuuccaag ucgacgucaa caaggccgug gaacaauuca gaaggcugcu gacccaagag 960
aaccgcagag ugaccaaguc ggacccgaac cagcaccuga cuauaaucca ggacccggaa 1020
uaccggaggu ucgguugcac cguggacaug aacauugcac ucaccaccuu caucccgcac 1080
gauaaggguc cggcggcgau ugaggagugc ugcaacuggu uccacaagcg gauggaggaa 1140
cugaacuccg agaagcaccg gcugauuaac uaccaccagg aacaggcugu gaauugccug 1200
cuggggaacg uguucuacga acggcucgcc ggccacggcc ccaagcuggg gcccgucacc 1260
cgcaagcacc cgcucgugac ucgauauuuc accuucccgu ucgaggaaau ugauuucucc 1320
auggaggaau caaugaucca ucugccgaac aaggccuguu ucuugauggc ccacaacggc 1380
ugggugaugg gagaugaccc gcugagaaau uucgccgagc cgggguccga gguguaccug 1440
aggagagaac ucaucugcug gggggauucc gugaaacugc gcuacgggaa caagcccgag 1500
gacugccccu accugugggc acauaugaag aaguacaccg aaaucaccgc caccuacuuc 1560
caaggggucc ggcuggauaa cugccauuca acuccgcucc auguggccga auacaugcug 1620
gacgccgcac ggaacuugca gcccaaccuc uacguggugg ccgaacucuu cacugggagc 1680
gaagaucucg auaacguguu cgugacccgg cucggaauuu cgagccugau ccgggaagcg 1740
augucugcuu acaacucgca cgaagaggga aggcuggugu acagauacgg gggggagccc 1800
gugggauccu ucgugcaacc gugccugagg ccgcuuaugc ccgcgaucgc ccacgcucug 1860
uucauggaca ucacccacga caacgaaugu ccgauugucc accggagugc cuacgaugcc 1920
cuuccgagca cuaccaucgu gucgauggcg ugcugugcgu ccgggucuac ccgcggcuac 1980
gacgaacucg ucccgcacca aaucagcgug guguccgaag aacgguuuua cacuaagugg 2040
aacccggagg ccuugcccuc gaacaccggg gaggucaacu uccagucggg aaucauugcc 2100
gcccgaugug ccaucucaaa guugcaccaa gaacucgggg caaagggguu cauccaagug 2160
uacguggacc aaguggacga ggauauugug gccgugacca ggcacucccc gucgauccac 2220
caguccgugg uggcagucuc aagaacugcc uuccggaacc ccaagaccuc cuuuuacucg 2280
aaggaagugc cccagaugug caucccgggc aaaaucgaag aagucgugcu ggaagccaga 2340
acuaucgagc ggaacaccaa gcccuaccgg aaggaugaga acagcaucaa cggcacgccc 2400
gacaucaccg ucgagaucag agagcacauc cagcugaacg aauccaagau ugucaagcag 2460
gccggcguag cgacuaaggg acccaacgaa uacauccagg agaucgaauu cgaaaaccug 2520
ucgccgggau ccgugauuau cuuccgggug ucccuggacc cgcacgccca aguggccgug 2580
ggaauccugc ggaaccaccu gacccaguuc uccccgcauu ucaaguccgg cucccuggcg 2640
guggacaaug cagacccgau ucucaagauc ccguucgccu ccuuggccuc ccgccugacc 2700
cucgccgaac ucaaccagau ccuguaccgc ugcgagucug aggaaaagga ggacggggga 2760
ggaugcuacg auauuccgaa cuggucugcc cuuaaauacg cgggacugca gggucugaug 2820
ucggugcucg ccgagaucag accgaagaac gaccuggggc acccguuuug caacaaccug 2880
agaucggggg auuggaugau cgacuacgug ucgaaccggc uuaucucucg cuccggcacc 2940
aucgccgagg ucgggaagug gcugcaggcc auguucuucu accugaagca aauuccgcgc 3000
uaccugaucc cgugcuacuu ugaugccauc cugaucggcg ccuacacgac cuugcuggac 3060
accgccugga agcagaugag cagcuucgug cagaacggcu ccacguucgu gaagcaucug 3120
ucccugggau ccgugcagcu uugcgguguc ggaaaguucc cuucgcugcc uauucugucc 3180
ccggcgcuga uggacgugcc guaccggcug aacgagauca cuaaggagaa ggaacaaugc 3240
ugcgugucac uggcggcggg acucccccac uucuccuccg ggauuuuccg guguugggga 3300
agagauaccu ucauugcccu gagggggaua cugcugauca ccggaagaua cguggaggcu 3360
agaaacauca uccucgccuu cgccggcacu cuccgccacg ggcugauccc caaccucuug 3420
ggcgaaggaa ucuacgcccg guauaacugc cgcgacgcgg ucugguggug gcuucagugc 3480
auccaggauu acugcaaaau ggugccgaau ggacuggaua uucugaagug ccccguuagc 3540
cgcauguacc ccaccgauga cuccgcaccc uugccggcgg gcaccuugga ccagccgcuc 3600
uuugaaguga uccaggaggc caugcagaag cacaugcagg guauccaguu cagagagcgg 3660
aacgcugggc cgcagauuga ccggaacaug aaggacgaag guuucaacau uacugccggg 3720
guggacgaag agacuggguu uguguacggg gggaaccgcu ucaacugugg gaccuggaug 3780
gauaagaugg gggagucgga ucgggcucgg aacaggggga uccccgcuac cccccgggac 3840
gggucggcug uggagauugu cgggcugagc aagagcgcag ugcgcuggcu gcuggagcuc 3900
agcaaaaaga acaucuuccc cuaccacgaa gucacuguga agagacacgg aaaggccauc 3960
aagguguccu acgaugagug gaacagaaag auccaagaca acuucgagaa gcuguuccau 4020
guguccgagg auccgagcga ucugaacgaa aagcauccga accucgugca caagcgcggg 4080
aucuacaagg acucguacgg cgcauccucg ccguggugcg acuaccagcu gcgccccaau 4140
uucaccauug ccaugguggu ggcgcccgag cuguucacua ccgagaaggc cuggaaggcc 4200
cuggagauug cugagaagaa gcugcuggga ccgcucggga ugaaaacuuu ggacccugac 4260
gacauggugu acuguggaau cuacgacaau gcgcucgaca acgacaacua caaucuugcg 4320
aagggauuca acuaccauca ggggcccgaa uggcuguggc cgaucgggua cuuccugcgc 4380
gccaagcugu acuucucccg gcugaugggg cccgagacaa ccgccaagac cauugugcuc 4440
gucaagaacg uucucucccg gcacuacgug caccucgaaa gauccccgug gaaggggcug 4500
cccgagcuca ccaacgagaa cgcacaguac ugcccguucu ccugugaaac ccaggccugg 4560
agcaucgcca ccauauugga aacucuguau gaccucuag 4599
<210> 22
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 22
augggacacu cgaaacagau cagaauccug uugcugaacg aaauggagaa gcuggaaaag 60
acccucuuuc ggcucgaaca gggcuacgag cugcaguucc gccugggucc gacucuacaa 120
ggaaaggcag ugacugugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180
aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugauuc cgacaaguac 240
ugcaagcuga accuccaaca guccggauca uuccaguacu acuuuuugca aggaaacgag 300
aaguccggag gaggcuacau cguggucgac ccgauucuga gagugggagc ugacaaucau 360
guccugccuc uggacugcgu aacccugcaa accuucuugg ccaaaugccu gggcccguuc 420
gaugaguggg aaagccgccu ccgggucgca aaggaaagcg gcuacaauau gauucacuuc 480
acuccucugc aaacccucgg ucugucccgg uccuguuauu cccuggcgaa ccagcuggag 540
cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600
guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccac 660
accgcggcca acuccaagug gauccaagaa caucccgaau gcgcguacaa ccucgugaac 720
agcccgcauc ugaagccugc cugggugcug gauagggccc ucuggagauu cagcugcgac 780
guggccgagg ggaaguacaa agaaaaggga auucccgccc ugauugagaa cgaccaucac 840
augaacucaa uccgcaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900
uucuuccaag uggacgugaa caaggcagug gagcaguuca gaaggcugcu gacucaagaa 960
aacagacggg ucacuaaguc cgacccuaac cagcaccuua ccaucauuca agacccggag 1020
uaccgccggu uuggcugcac ugucgacaug aacaucgccc ugaccacuuu caucccgcau 1080
gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140
cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaauugccuc 1200
cugggaaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260
cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuuuucc 1320
auggaagaau ccaugaucca ccucccgaac aaggcuugcu uccugauggc gcacaacgga 1380
ugggucaugg gcgacgaccc acugcgcaac uucgcugagc cuggcagcga ggucuaccug 1440
agaagggaac ugauuugcug gggagacucc gucaagcugc gcuauggaaa caagcccgaa 1500
gauugccccu accugugggc ucacaugaag aaguacacug aaaucacugc cacguacuuc 1560
cagggagucc ggcuggacaa uugccacucc accccccucc auguggccga guacaugcuc 1620
gaugcagcga ggaaucugca gcccaaucug uacgugguug ccgaacuguu caccggcucc 1680
gaggaccucg acaacguguu cgugaccaga cuugggauuu ccagccugau ccgggaagcc 1740
augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg cggagaaccc 1800
gugggaagcu ucgugcagcc uugccuccgg ccgcugaugc cugcgaucgc ccacgcccug 1860
uucauggaua uuacccacga caacgaaugc cccaucgugc aucgcucggc cuacgacgca 1920
cugccuucga ccaccaucgu guccauggcc ugcugcgccu ccgguagcac ccgcggauac 1980
gaugaacucg ugccgcacca gaucagcgug guguccgaag aaagauucua caccaagugg 2040
aacccugagg cacugccgag caacaccgga gaagugaacu uccagucggg uauuaucgcc 2100
gcucgcugug ccaucuccaa acuccaccaa gagcucggug ccaagggauu cauucaaguc 2160
uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220
caauccgucg ucgccguguc acggacugcc uuccggaacc ccaagacuuc guucuacucg 2280
aaagaggugc cacagaugug uauccccgga aagaucgaag aggucguccu ggaagcccgg 2340
accauugaga ggaacaccaa gccuuaccgg aaggacgaga acagcaucaa cgguaccccu 2400
gauauuacug uggagauccg cgaacacauc cagcucaacg aaucaaagau ugucaagcag 2460
gccggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520
uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccguc 2580
ggcauccuca gaaaccaccu gacccaguuc ucaccccauu ucaaguccgg uucccuggcg 2640
guggacaacg ccgauccgau cuugaagauc cccuuugcau cccuggccuc ccgccugacu 2700
cucgcggaac ugaaccagau ccuguaccgc ugcgaaucag aggaaaagga ggacggcggc 2760
ggcuguuacg auaucccgaa uugguccgcu cugaaauaug cgggacuuca ggggcugaug 2820
agcgugcugg cggagauccg gccgaagaau gaccugggac acccauucug caacaacuug 2880
cggagcggag acuggaugau cgauuacguc agcaacagau ugaucucccg gagcggcacu 2940
aucgcggagg ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccga 3000
uaccucaucc cguguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060
accgccugga agcagaugag cuccuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120
ucacugggau cagugcagcu cugcggcgug ggaaaauucc ccucgcugcc cauucugagc 3180
ccggcccuca uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240
uguguuuccc uggcugccgg acuuccacac uucucguccg gcaucuuccg gugcuggggc 3300
cgggauaccu ucauugcccu gcggggcauc uuguugauca ccggucgcua cguggaggcu 3360
cggaacauua uucuggcauu cgccggcacu cugagacacg gucugauucc gaaucuuuug 3420
ggcgaaggaa ucuacgcccg cuacaacugu cgggacgccg ugugguggug gcuccagugc 3480
auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540
aggauguauc caaccgacga cagcgcgccu cugccggccg ggacccucga ccaaccccug 3600
uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggagaga 3660
aacgcggggc cccagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720
guggacgaag aaaccgguuu uguguacgga ggaaaccggu ucaacugcgg uaccuggaug 3780
gacaagaugg gagaguccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840
ggaucagcgg uggaaauugu gggacugagc aagagcgccg ugcgcuggcu ccuggaacug 3900
agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960
aaagucucau acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuguuucac 4020
guguccgagg aucccuccga ucugaacgaa aagcauccga aucucgugca caagcgcggc 4080
aucuacaagg acucguacgg agccuccucc ccuuggugcg auuaucagcu gcggccuaac 4140
uucaccauug ccauggucgu ggcuccggag cuguucacua cugagaaggc cuggaaggca 4200
cuugaaauug ccgagaagaa gcugcuuggg ccuuugggga ugaaaacccu ggauccggac 4260
gacauggugu acugcggaau cuacgacaac gcccuggaca acgacaacua caaucuggcg 4320
aagggcuuca auuaccacca gggcccggaa uggcuguggc cuauugggua cuuccugcgc 4380
gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440
gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggccuu 4500
ccugagcuga ccaacgaaaa cgcccaguac ugccccuucu ccugcgaaac ccaggcuugg 4560
uccauugcca cuauacugga aaccuuauau gaccuguag 4599
<210> 23
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 23
augggacacu caaagcagau ccggauccuc cugcugaacg aaauggaaaa gcucgaaaag 60
acucuguucc ggcuggaaca gggcuaugag cugcaguucc ggcucggacc gacgcugcaa 120
ggaaaggccg ugacugugua caccaacuac cccuucccgg gagaaacuuu uaacagagaa 180
aaguuuaggu cccuggacug ggagaacccg accgagcggg aagaugacuc cgauaaguac 240
ugcaagcuga accuccagca gucgggaucg uuccaguacu acuuccuuca aggaaaugag 300
aagucuggug gaggauacau cgugguggac cccauccuga gagugggagc cgacaaucac 360
guccugccgc uugacugcgu gacucugcaa accuuccugg cuaagugucu cgggccguuc 420
gacgaauggg aguccaggcu gcgcguggcu aaggagagcg gcuacaauau gauccacuuc 480
accccgcucc aaacucucgg acucucgcgc uccuguuacu cccucgccaa ccaacuggag 540
cugaacccgg acuucucccg cccgaaccgg aaguacaccu ggaacgacgu cggucagcuc 600
guggagaaau ugaagaagga guggaacgug aucugcauua cggacgucgu guacaaccau 660
acugcggcca acuccaagug gauucaagag cacccggaau gcgcuuacaa ccuugucaac 720
uccccgcacc ugaagccggc cugggugcug gacagagccc uguggcgguu cucgugcgac 780
guggcagagg gaaaguacaa ggagaagggc auccccgccc uuauugagaa ugaccaucac 840
augaacucca uccggaagau caucugggag gauaucuucc cgaagcucaa gcugugggaa 900
uucuuccaag uggacgugaa caaggccgug gaacaguucc ggagacuccu gacccaagaa 960
aaccggagag ugaccaagag cgacccgaac cagcaucuga cuaucauuca ggauccggag 1020
uaucggcggu uuggcugcac uguggacaug aacaucgccc ucaccaccuu caucccgcac 1080
gacaagggcc ccgccgcgau cgaggaaugc ugcaacuggu uccacaagcg cauggaggag 1140
cugaauuccg aaaagcaccg ccugaucaac uaccaucagg agcaggcagu gaacugucuc 1200
cugggaaacg uguuuuacga acggcuggcc ggacacggcc cgaagcuggg ucccgugacc 1260
cgcaagcauc cccucgugac gcgguacuuc accuucccgu ucgaggagau cgacuucagc 1320
auggaagagu ccaugaucca ucugccgaac aaggccugcu uccucauggc gcauaauggu 1380
ugggucaugg gagaugaucc ccuccgaaac uuugcggagc cggguucgga aguguaucug 1440
aggagggagc ucaucugcug gggagauagc gugaaacuga gauacgggaa caagccggaa 1500
gauuguccgu accugugggc acacaugaag aaguacaccg aaaucacugc cacuuacuuc 1560
caaggaguuc gccuggauaa cugccauuca accccucugc augucgccga guacaugcug 1620
gacgccgcuc gcaaccuuca gccgaaucuc uacguggucg ccgagcuguu caccgguucc 1680
gaagaucugg acaacguguu cgugacuaga cugggaauca gcagccugau ccgggaagcg 1740
augagcgccu acaacuccca cgaagagggc cggcucgugu auagauacgg cggagagccg 1800
gucgggagcu ucgugcaacc cugccugcgg ccgcugaugc ccgccauugc ccacgccuug 1860
uucauggaua ucacccacga caacgagugu ccgaucgugc accggagcgc guacgacgcg 1920
uuaccgucca ccacgauugu gucgauggcc ugcugcgccu ccggaucgac ccgcggcuac 1980
gaugagcugg ucccgcauca aaucagcguc gucagcgaag aacgguucua cacuaagugg 2040
aaccccgagg cgcuccccuc caacaccgga gaagugaacu uccaauccgg cauuaucgcu 2100
gcacgcugcg cgauuagcaa gcugcaucag gagcuuggcg cuaagggguu cauacagguc 2160
uacguggauc aggucgacga ggacauugug gccgugacuc gccacucacc guccauucac 2220
caaagcgugg uggcuguguc ccggaccgcu uuccggaauc ccaagaccuc auucuacucc 2280
aaggagguuc cgcagaugug uaucccggga aagauugagg aagugguccu agaggcucgc 2340
acuauugaac gcaacaccaa gccguacaga aaggacgaga auuccauuaa cgggaccccg 2400
gauauuaccg uagaaauuag agaacauauu cagcugaacg agucgaagau cgugaagcag 2460
gccggggugg cuaccaaggg cccgaacgaa uacauccagg agauugaguu cgaaaaccuc 2520
ucccccggcu cggugaucau cuuccgggug ucccucgauc cccacgccca aguggccgug 2580
ggaaucuuga gaaaccaccu gacucaguuc agcccgcauu ucaaguccgg aucacucgcc 2640
guggacaacg ccgacccgau ccuuaagauc cccuucgcau cacuggccag ccgccugacc 2700
cuugccgaac ugaaccaaau ccucuaucgg ugcgaauccg aggagaagga agaugggggu 2760
ggaugcuaug acauuccuaa cuggucugcc cugaaauacg caggccugca gggacugaug 2820
uccguccugg ccgaaauccg cccgaagaau gaccuggggc accccuuuug caacaaucug 2880
agguccggag auuggaugau ugauuacgug uccaaccgcc ugauuucgcg gagcggcacc 2940
aucgcggaag ugggaaagug gcugcaagcc auguuuuucu accugaaaca gaucccccgg 3000
uaccucaucc cgugcuauuu cgaugcgauu uugauuggcg cguacaccac ccuccucgac 3060
acugccugga agcaaaugag cuccuucgug caaaacgguu caaccuucgu caagcacuug 3120
ucgcuggggu cgguccaacu guguggaguc ggaaaguucc cgagccugcc cauccugucg 3180
ccugcccuga uggacgugcc cuaccggcug aacgagauca ccaaagaaaa ggagcagugc 3240
ugcguguccc uggcggccgg acucccccau uucucguccg ggaucuuuag auguugggga 3300
cgggauacuu ucauugcgcu gcgcggcauc uuguugauua ccggacgcua cguggaagcg 3360
cggaacauca uacucgccuu cgccggcacc cucagacacg gccugauccc gaaccuccug 3420
ggagaaggca ucuacgcacg auacaacugu cgggacgccg ucugguggug gcugcagugc 3480
auucaggacu acugcaagau ggugccgaac ggucuggaca uccugaagug ccccguguca 3540
aggauguacc cgaccgacga uagcgcaccg cugcccgcgg ggacccugga ucagccgcug 3600
uucgaaguga uccaagaagc caugcaaaag cacaugcagg gaauucaguu cagagaaagg 3660
aacgcaggcc cccagauuga ccggaacaug aaggacgagg guuucaacau caccgccggc 3720
gucgacgaag aaacgggguu uguguacggg ggcaaccgcu ucaacugcgg uacuuggaug 3780
gacaagaugg gggaaucaga ccgcgcccgc aaccgcggaa uuccggcgac cccgcgcgau 3840
ggauccgcag uggaaaucgu gggacugucc aagucggcug ugcgguggcu gcuggagcug 3900
uccaagaaga acaucuuccc guaccacgag gucaccguga agagacacgg gaaggccauc 3960
aagguguccu acgacgaaug gaaccggaaa auccaggaua acuucgaaaa acuguuucac 4020
guguccgagg acccgucuga ccugaacgaa aaacacccga acuuggugca uaagcgggga 4080
aucuacaagg acaguuacgg agccucaagc ccguggugcg acuaccagcu gcggcccaac 4140
uucacaaucg cgaugguggu ggcgcccgag cuuuucacca cggagaaagc cuggaaggca 4200
cuggagaucg cugaaaagaa gcugcucggu ccccucggca ugaaaacccu ggacccggac 4260
gauauggugu acugcggaau cuacgacaac gcccuggaca augauaacua caaccuggcc 4320
aagggauuca auuaccacca ggggccggaa uggcuguggc cgaucggcua cuuucugcgg 4380
gcuaagcucu acuucucgcg gcugauggga ccggaaacca cagccaagac cauuguccuc 4440
gucaagaacg ugcugucccg ccacuacgug caucuggagc ggucaccuug gaagggccug 4500
cccgagcuga ccaacgaaaa cgcccaguac ugccccuucu ccugugaaac ucaagccugg 4560
ucaaucgcca cuauucucga aacucuguac gaucuguag 4599
<210> 24
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 24
augggucaca gcaaacaaau ccggauccug cugcucaacg aaauggaaaa gcuggaaaag 60
acucuguuuc gccuggagca gggcuacgaa cuccaauucc ggcugggacc aacgcugcaa 120
gggaaggccg ucaccgugua caccaacuac cccuuucccg gagagacuuu uaaccgcgaa 180
aaguucagaa gccuggacug ggaaaacccc accgaacggg aagaugauuc ggacaaguac 240
ugcaagcuga accuccagca guccggcagc uuccaguacu acuuccucca agggaacgaa 300
aagagcggag gaggcuacau cgugguggau ccgauccuuc ggguuggagc ggacaaccau 360
gugcugccuc uggacugcgu gacucugcaa accuuccuag ccaagugccu cggcccguuc 420
gaugaguggg aaucccggcu gcgaguggcg aaggagucag guuacaacau gauccacuuc 480
acaccgcugc agacccuggg acucucccgg uccugcuacu cauuggccaa ccagcucgaa 540
cugaacccgg acuucucaag gccgaaccgc aaguacacuu ggaaugacgu gggacaguug 600
guggagaagc ugaagaaaga guggaacgug aucugcauua ccgacguggu guacaaccac 660
acugcggcga auucgaagug gauucaggaa cauccggaau gcgccuacaa cuuggugaac 720
ucaccucacc ugaagccugc cugggugcug gacagagccc uguggcgcuu uagcugugac 780
gucgcggagg ggaaguacaa ggaaaaggga auccccgccc ugaucgagaa cgaccaccau 840
augaauagca uucgcaagau caucugggag gacauuuucc cgaagcugaa gcugugggag 900
uucuuccaag ucgacgucaa caaggccguc gaacaguucc ggcgguugcu gacccaagaa 960
aaccggagag ugacgaaaag cgacccuaac cagcaccuga caaucauuca ggacccugaa 1020
uaccggagau ucggcuguac cgucgauaug aacaucgccc ugaccaccuu uauuccccac 1080
gauaagggcc cggcggccau cgaggagugu ugcaacuggu uccacaagag aauggaggaa 1140
cucaacuccg aaaaacaccg guugauuaau uaccaccagg agcaggcggu caacugccug 1200
cugggcaacg uguucuacga aaggcucgcu gggcacggcc cuaagcuggg accugucacu 1260
cggaaacacc cccuggugac ccgguacuuu acuuucccgu ucgaagagau cgacuucucc 1320
auggaggaaa gcaugaucca ccucccuaac aaggccugcu uccugauggc ccacaacgga 1380
ugggucaugg gcgacgaccc uuugcggaac uuugccgagc cgggcucaga gguguaccuu 1440
agacgcgaac ugaucugcug gggagacucc gugaagcugc gcuacgggaa caagcccgaa 1500
gauuguccuu accugugggc acacaugaag aaguacaccg aaaucacugc caccuacuuc 1560
caaggagugc gcuuggauaa cugucauagc acuccucugc acgucgccga guacaugcug 1620
gacgcagcca ggaaucucca gccuaaucug uacguggugg ccgaacuguu caccgggagc 1680
gaggaccugg acaacguguu cgugacccgg cugggcauca gcucccuuau ccgggaggcc 1740
auguccgcau acaacucgca cgaggagggu cgccuggugu accgcuacgg aggagagccg 1800
gucggaucau uuguccaacc augccuccgg ccccugaugc cagcgaucgc gcacgcucuc 1860
uucauggaca ucacccacga uaacgaaugc ccuaucgugc accggagcgc uuacgacgcc 1920
cucccuucga ccaccauugu guccauggcc ugcugcgccu ccgguuccac ucggggcuac 1980
gaugaacugg ugccacacca gauuuccgug gugucagagg agcgguucua caccaagugg 2040
aacccagagg cgcugccgag caacacuggg gaagugaacu uccaguccgg aaucauagcg 2100
gcuagaugug caauuuccaa gcuucaucag gagcugggcg ccaaaggauu cauccagguc 2160
uacguggacc aaguggauga ggacauugug gccgugacua gacauucacc gucaauccac 2220
caaucggucg uggcuguguc cagaaccgca uuccgcaacc ccaagacuuc cuucuacucc 2280
aaggaggucc cucagaugug caucccggga aagaucgagg agguggugcu ggaggccagg 2340
accaucgaaa gaaacacuaa gccuuaccgg aaagacgaaa acuccaucaa ugggacuccc 2400
gauauuaccg uggagauuag ggagcacauu cagcugaacg aaucaaagau ugugaaacag 2460
gccggggucg caacuaaagg gccuaaugag uacauccaag agaucgaguu cgaaaaccug 2520
ucgccggguu ccgugaucau uuuccgcgug uccuuggacc cucacgccca aguggccgug 2580
ggcauccuga ggaaccaccu gacccaguuc agcccacacu ucaaguccgg auccuuggcu 2640
guggacaacg ccgauccaau ccucaagauc ccuuuugcgu cgcuggccuc acggcuuacc 2700
cuggccgagc ugaaccagau ccuguaccgc ugcgagagcg aagaaaagga ggacggugga 2760
gguugcuacg acauuccaaa cugguccgcg cuuaaguacg ccggacucca gggucugaug 2820
uccgugcuug ccgagaucag accgaaaaac gaccuggggc accccuuuug caacaaccug 2880
agaagcggag acuggaugau cgacuaugug uccaaccggc ugauuucgag aagcgguacu 2940
auugccgagg ucggaaagug gcuccaagca auguuuuucu accugaagca aauuccccgc 3000
uaccugaucc cgugcuacuu ugacgccauu cugaucggug cauacacuac ccugcuggac 3060
accgcgugga agcagauguc cagcuucgug cagaauggcu ccaccuucgu caagcaucug 3120
ucccucggaa gcgugcagcu gugcggagug ggaaaguuuc cgucgcugcc aauccugucc 3180
cccgcgcuga uggauguccc guaccggcug aacgaaauca cgaaggaaaa agaacagugc 3240
ugcguguccc uugccgccgg acugccgcac uucuccuccg gcauuuuccg gugcugggga 3300
cgggauaccu ucaucgcgcu gagagguauu cugcugauua ccggcagaua uguggaagcc 3360
cgcaacauca uccuggccuu ugccggcacu cugcggcacg ggcucauccc uaaccucuug 3420
ggagaaggca ucuacgcgcg cuacaacugc cgggaugcug ugugguggug gcugcagugc 3480
auccaggacu acuguaaaau ggugcccaau ggccuugaca uccucaagug cccagugucc 3540
cggauguacc cgaccgauga cuccgcgccc cugcccgccg gcacccuuga ucaaccucug 3600
uucgaaguca uccaagaggc caugcagaag cacaugcagg gaauccaguu cagggaaaga 3660
aacgccgggc cucagaucga ccggaacaug aaggacgagg gauucaacau uaccgccgga 3720
guggacgagg aaacuggcuu cguguacggu ggaaaccgcu ucaacugcgg caccuggaug 3780
gauaagaugg gcgaauccga ucgcgcccgc aaccggggaa ucccagcaac uccuagggac 3840
ggaagcgcag ucgagaucgu ggggcugucc aaguccgccg ugcgguggcu cuuagaacug 3900
uccaagaaga auauuuuccc cuaccacgag gucaccguga agcgccaugg aaaggccauc 3960
aaaguguccu augacgaaug gaaccgcaag auccaggaca acuucgaaaa guuguuccac 4020
guguccgagg accccagcga ucugaacgaa aagcacccca accucgugca caagaggggc 4080
aucuacaagg acuccuacgg agcuagcucc ccuuggugcg auuaccaacu gcggccuaau 4140
uucaccaucg ccauggucgu cgcacccgaa cucuucacca ccgagaaggc cuggaaggcu 4200
cuggaaaucg ccgaaaagaa gcuucugggc ccgcugggca ugaaaacucu cgauccugac 4260
gauauggucu acuguggcau cuacgacaac gcccuugaca acgacaacua caaccuggcc 4320
aagggcuuua acuaccacca gggcccagag uggcucuggc ccaucggaua uuuccugcgg 4380
gccaaacugu acuucucgcg guugaugggu ccggaaacca cagcuaagac caucgugcuc 4440
gugaagaaug ugcugucgcg gcacuauguc caucuggagc gcucccccug gaagggacuc 4500
ccugagcuga cuaaugagaa cgcccaguac ugcccuuucu ccugcgaaac ccaggccugg 4560
agcaucgcua ccauucucga aacgcucuac gaucuguag 4599
<210> 25
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 25
augggacauu cuaaacagau ucggauccuc cugcucaacg aaauggagaa gcucgaaaag 60
acccuguucc ggcucgaaca gggauacgaa cugcaauucc ggcugggucc caccuuacaa 120
ggaaaggccg ugacugucua caccaacuac ccguuccccg gcgaaaccuu caauagggag 180
aaguuccggu cccucgauug ggagaacccu acagagcgcg aagaugauuc agacaaguau 240
ugcaagcuga auuugcagca gagcggcuca uuccaauacu acuuccugca aggaaacgaa 300
aagucgggcg gcggcuacau cgugguggac ccuauucuga gagugggcgc cgacaaccau 360
guccugccgc uggacugcgu cacccugcaa acuuuccugg ccaagugccu ggguccuuuc 420
gaugaguggg aaucgagacu ucgcguggca aaggaaucgg guuauaauau gauucacuuc 480
accccgcugc aaacccuggg ccugucgcgg ucuugcuacu cacuggccaa ccagcuggaa 540
cugaacccag auuucucacg ccccaaccgg aaguacaccu ggaacgaugu gggccagcuu 600
guggaaaagc ucaaaaagga guggaacgug aucugcauua cugacguggu guacaaccau 660
acugcugcua auuccaagug gauccaggaa cauccugagu gugcuuacaa ccuggucaac 720
uccccacacc ugaagcccgc cugggugcug gaucgggcuc ucuggcgguu cuccugcgau 780
gucgccgaag gaaaguacaa ggagaagggg aucccugcgc ugaucgaaaa cgaccaucac 840
augaauucca ucaggaaaau caucugggag gacaucuucc cuaagcucaa gcugugggag 900
uucuuucaag ucgacgugaa caaggccgug gagcaguuca gacggcugcu gacacaagag 960
aaccgccgcg ucaccaagag cgacccgaau cagcaccuga cgauuaucca ggacccugag 1020
uacagaagau ucggcugcac cguggauaug aacauugcuc ugaccaccuu caucccccac 1080
gauaaggguc ccgcagccau ugaggagugc ugcaacuggu uccacaagag gauggaagaa 1140
cugaauuccg agaagcaccg gcugaucaau uaucaccaag aacaagccgu gaacugccuu 1200
cugggaaacg ucuuuuacga gcgccuggcg ggacaugggc caaagcucgg gcccgugacc 1260
agaaagcacc cacuggucac ccgcuacuuc accuucccgu ucgaggaaau cgacuucagc 1320
auggaagagu cgaugaucca cuugccgaac aaggccugcu uccucauggc ccauaacggu 1380
ugggucaugg gcgaugaccc ucuucgcaac uucgcggagc ccgguucuga agucuaucuu 1440
cggcgggaac ugauuugcug gggagacucc gucaagcugc gcuacggaaa caagcccgag 1500
gauugcccgu acuugugggc ccauaugaag aaguacacug agaucacugc cacuuacuuc 1560
caaggagugc gccucgacaa uugucacagc acuccgcugc acguggcgga guacaugcug 1620
gacgccgcuc gcaacuugca gccuaaucug uaugucgugg ccgaguuguu caccggcucg 1680
gaagaucugg acaacguguu cgucacucgc cugggaaucu ccucccugau ccgggaagcg 1740
augagcgccu acaacuccca cgaagagggg cgguuggugu accgcuacgg cggagagccu 1800
gucggaaguu ucgugcagcc cugucugagg ccccugaugc ccgcuaucgc ccaugcgcug 1860
uuuauggaca ucacccacga caacgaaugc ccuauugugc accgcuccgc cuaugaugcc 1920
cugcccucca ccacuauugu cagcauggcc ugcugcgccu cgggguccac ccggggauac 1980
gacgaacugg ugccccacca aauuuccgug guguccgagg aacgguucua caccaagugg 2040
aacccugaag cgcugccauc gaacacugga gaagugaacu uucagucggg aauuaucgca 2100
gcccgaugcg ccaucagcaa gcugcaccag gaacucggcg caaaggguuu uauccaaguc 2160
uacguggacc aggucgacga ggacauuguc gccgugaccc ggcacucccc auccauccac 2220
cagucugugg uggcuguguc aaggacggcu uuccggaacc caaagaccag cuucuacagc 2280
aaggaagugc cucagaugug caucccgggg aagaucgaag aaguggugcu ggaggccaga 2340
accaucgaaa gaaacaccaa gcccuaucgg aaggacgaga acucgaucaa cgguacuccg 2400
gacauuaccg ucgagauacg cgagcacauu cagcugaacg aguccaaaau cgugaagcag 2460
gccggggugg ccacgaaggg ucccaacgag uacauucagg agaucgaguu cgagaaccug 2520
agccccgggu ccgugaucau cuuccgcgug ucccuggacc cccacgccca aguggccgug 2580
ggcauccugc ggaaccaucu gacccaguuc uccccgcacu ucaagagcgg cucgcucgcc 2640
guggacaacg cggacccgau ccucaagauc ccuuucgcau cgcuggccuc ccgccugacc 2700
cuggccgaac ugaaucagau cuuguaccga ugcgaaucag aagagaagga ggacgggggg 2760
ggcugcuacg auauccccaa cuggagcgcg uugaaguacg caggauugca gggauugaug 2820
uccguccucg cugaaauccg cccgaagaac gaccugggac acccguuuug caacaaccug 2880
agaucagggg auuggaugau cgauuacgug ucgaacagac ugaucucgcg cagcggcacu 2940
auugccgaag uggggaagug gcuccaggcc auguucuucu accugaagca gaucccucgg 3000
uacuugaucc cuuguuacuu cgacgccauc cugaucggag ccuacaccac ccugcuugac 3060
acugcaugga agcagauguc cagcuucgug caaaacggaa gcaccuucgu gaagcaccug 3120
ucccugggau ccgugcagcu cugcggcgug ggaaaguuuc cgucccuccc cauccugagc 3180
ccugcccuua uggacgugcc guacaggcug aacgaaauua ccaaagagaa ggagcaaugc 3240
uguguguccu uggcggccgg auugccgcau uucuccuccg ggauuuuccg gugcugggga 3300
cgggacaccu uuaucgcacu gagggguauu cuccugauca ccggucgcua cguggaggcu 3360
cgcaacauua uucuggccuu cgcgggcacg cuuagacaug gauugauccc uaaccuucug 3420
ggagaaggga ucuacgcgcg guacaacugc cgcgaugccg ugugguggug gcugcagugc 3480
auccaggacu acugcaaaau ggugccgaau ggucuggaua uccugaagug uccgguuucg 3540
cggauguacc cuaccgacga cagcgccccu cucccggccg gcacucucga ccagccccua 3600
uuugaaguaa uccaggaggc caugcaaaag cacaugcagg gcauacaguu cagagagagg 3660
aacgccggac cgcagauuga ccggaacaug aaggacgagg gauucaacau uaccgcggga 3720
guggaugagg aaacugguuu cguguacggc ggaaaccggu uuaacugcgg cacuuggaug 3780
gacaagaugg gagaauccga ccgcgcccga aaccgcggaa uucccgccac uccccgcgac 3840
ggcuccgccg uggaaauugu gggacuguca aaguccgcag uccgcuggcu gcuggaacuc 3900
ucaaagaaga acaucuuccc guaccacgag gucaccguga agcggcacgg caaagcgauc 3960
aaagugucgu acgacgagug gaaccggaag auucaggaua acuucgagaa gcuguuucac 4020
guguccgaag auccaagcga ccugaacgag aagcauccca acuuggugca caagcgcggc 4080
aucuacaagg auuccuacgg agccagcagc ccguggugcg acuaccaacu ccgccccaac 4140
uucaccaucg ccaugguggu ggcgccggag cuguucacga cggagaaagc uuggaaggcu 4200
cucgaaaucg cggagaagaa gcugcugggu ccucugggga ugaaaacccu ggacccggac 4260
gauauggugu acugugggau cuacgacaac gcccuggaca acgacaacua caaccucgcc 4320
aagggguuca acuaccacca gggacccgaa uggcucuggc caaucggaua cuuccugaga 4380
gcgaagcuuu acuucucgcg gcugaugggu ccugaaacca cggccaagac caucgugcuc 4440
gugaaaaaug ugcugucaag gcacuacgug caucuggaga ggucgccaug gaagggucug 4500
ccggaacuga ccaacgaaaa cgcacaguac ugccccuuuu cgugcgagac ucaggccugg 4560
uccaucgcca ccauucucga aacucucuac gaccuguag 4599
<210> 26
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 26
augggacacu cgaaacagau cagaauccug uugcucaacg aaauggagaa gcuggaaaag 60
acccucuuuc ggcucgaaca gggcuacgag cugcaguucc gccugggucc gacacuacaa 120
ggaaaggcag ucacugugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180
aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugacuc cgacaaguac 240
ugcaagcuga accuccaaca guccggauca uuccaguacu acuuucugca agggaacgag 300
aaguccggag gcggcuacau cguggucgac ccaauacuua gagugggagc cgacaaucau 360
guccugccuc uggacugcgu gacccugcaa accuucuugg cgaaaugucu gggcccguuc 420
gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucacuuc 480
acuccgcugc aaacccucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540
cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600
guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccau 660
acggccgcca acucgaagug gauccaagag caucccgagu gcgcguacaa ccucgugaau 720
agcccgcauc ugaagccugc uugggugcug gauagagccc ucuggagauu cagcugcgac 780
guggccgagg ggaaguacaa agaaaaggga auuccggccu ugauugagaa cgaccaucac 840
augaacucaa uccgcaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900
uucuuccaag uggacguaaa caaggcagug gagcaguuca gaagguugcu gacucaagaa 960
aacagacggg ucacuaaguc cgauccuaac cagcaccuua ccaucauuca agacccugag 1020
uaccgccggu uuggcugcac cgucgacaug aacaucgccc ugaccacuuu caucccgcau 1080
gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140
cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu caacugccuc 1200
cugggcaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260
cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucucc 1320
auggaagaau ccaugaucca ccucccgaac aaggcuugcu uccugauggc gcacaacgga 1380
ugggucaugg gcgacgaccc acugcgcaau uucgcugagc cuggcucgga ggucuaccug 1440
agaagggaau ugauuugcug gggagacucc gugaagcugc gcuauggcaa caagccugaa 1500
gauugccccu accugugggc ucacaugaag aaguacacgg aaaucacugc cacguacuuc 1560
cagggagucc ggcuggacaa uugccacucg accccgcucc auguggccga guacaugcug 1620
gaugcagcga ggaaucugca gcccaaucug uacgugguug cagaacuguu cacuggcucc 1680
gaggaccucg acaacguguu cgugaccaga cuggggauuu ccucacugau ccgggaagcc 1740
augucggccu acaacuccca ugaagagggc cgccuggugu accgcuaugg gggagaaccc 1800
gugggaagcu ucgugcagcc uugccuccgg ccgcugaugc cugcgaucgc ccacgcccug 1860
uucauggaua ucacucacga caacgaaugc cccauugugc aucgcucggc cuacgacgca 1920
cugccuucga ccacuaucgu guccauggcc ugcugcgccu ccgggagcac ccgcggauac 1980
gaugaacucg ugccgcacca gaucagcgug guguccgaag aacgguucua caccaagugg 2040
aaccccgaag cccugccuag caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100
gcucgcugcg ccaucuccaa acuccaccaa gagcucggug ccaagggauu cauucaaguc 2160
uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220
caauccgucg ucgccguguc ccggacugcg uuucggaacc ccaagacuuc guucuacucg 2280
aaagaagugc cacagaugug uaucccggga aaaaucgagg aggucgugcu cgaagcccgg 2340
accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgguaccccu 2400
gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460
gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520
uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccgug 2580
ggaauucuca gaaaccaccu gacccaguuc ucaccacacu uuaaguccgg uucccuggcg 2640
guggacaacg ccgauccgau cuugaagauc cccuucgcau cgcucgccuc ccgccugacu 2700
cucgcggaac ugaaccagau ccuguaccgc ugugaauccg aggaaaagga ggacggcggc 2760
ggcuguuacg auauccccaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820
ucugugcugg cggaaauccg gccgaagaac gaccugggac acccauucug caacaacuug 2880
cggagcggag acuggaugau cgauuacguc agcaacagau ugaucagccg gagcggcacu 2940
aucgccgagg ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccga 3000
uaccucaucc ccuguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060
accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120
ucacugggcu cagugcagcu cugcggcgug ggaaaguucc ccucgcugcc cauucugagc 3180
cccgcccuga uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240
uguguuuccc uggcugccgg gcugccacac uucucguccg gcaucuuccg guguuggggc 3300
cgggauaccu ucauugcccu gcggggaauc cugcuuauca ccggucgcua cguggaggcu 3360
cggaacauua uucucgcguu cgccggcacc cugagacacg gucugauucc gaaucuguug 3420
ggcgaaggaa ucuacgccag auacaacugu cgggacgccg ugugguggug gcuccagugc 3480
auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540
aggauguauc caacugacga cagcgcaccu cugccggccg ggacccucga ccaaccccug 3600
uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggagcgg 3660
aacgcggggc cccagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720
guggacgaag aaaccgguuu uguguacgga ggaaaccgcu ucaacugcgg uaccuggaug 3780
gacaagaugg gagaauccga ucgcgcgcgc aacagaggga ucccggcaac cccucgggac 3840
ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu ccuggaacug 3900
uccaaaaaga acaucuuccc cuaccacgaa gugaccguga agagacacgg aaaggccauc 3960
aaagucucau acgaugaaug gaacaggaag auccaggaua acuucgagaa gcuguuucac 4020
guguccgagg aucccuccga ucugaacgag aagcauccga aucuggugca caagcgcggg 4080
aucuacaagg acucguacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140
uucaccauug ccauggucgu ggccccggag cuguucacaa cugagaaggc cuggaaggcc 4200
cuugaaauug ccgagaagaa gcugcugggg ccuuugggga ugaaaacccu ggauccggac 4260
gacauggugu acugcggaau cuacgacaac gcccuggaca acgauaacua caaucucgcg 4320
aagggcuuca auuaccacca aggccccgaa uggcucuggc cuauugggua cuuccugcgc 4380
gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440
gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacuu 4500
ccugagcuga cgaacgaaaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560
uccauugcca cuauacugga aaccuuauau gaccuguag 4599
<210> 27
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 27
augggacacu cgaaacagau ccggauccug uugcugaacg aaauggagaa gcuugaaaag 60
acccuguuuc ggcuggagca gggcuacgag cugcaguucc gccugggucc gacacuacaa 120
ggaaaggccg ugacugugua caccaacuac ccauuucccg gagaaacuuu caaccgggag 180
aaguuccggu cccuggacug ggaaaaccca accgaacgag aggacgacuc ggacaaguac 240
ugcaagcuga accuccaaca guccggauca uuccaguacu acuuucugca agggaacgag 300
aaguccggag gcggcuacau cguggucgac ccgauacuua gagugggcgc cgacaaucau 360
guccugccuc uggauugcgu gacccugcaa accuucuugg ccaaaugucu gggcccguuc 420
gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucauuuc 480
accccgcugc aaacccuggg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540
cuuaaccccg acuucucgcg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600
guggaaaagc ugaagaagga guggaacgug aucugcauca cugacguggu guacaaccau 660
acggccgcca acucgaagug gauccaggag caucccgagu gcgcauacaa ccucgugaac 720
agcccgcacc uuaagccugc uugggugcug gacagagccc ucuggagauu caguugcgac 780
guggccgagg ggaaguacaa ggaaaaggga auuccggccu ugaucgagaa cgaccaucac 840
augaacucaa ucaggaagau caucugggag gacaucuucc cuaagcuuaa guugugggag 900
uucuuccaag uggacguaaa caaggcagug gagcaguuca gaagguugcu gacccaagaa 960
aacagacgcg ucacuaaguc cgauccuaac caacaccuua ccaucauuca agacccugaa 1020
uaccgccggu uuggcugcac cgucgauaug aacaucgccc ugaccacuuu caucccgcau 1080
gacaagggcc cggcggcaau cgaggaaugc uguaacuggu uucauaagag aauggaagaa 1140
cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaacugccug 1200
cugggcaaug uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260
aggaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucucg 1320
auggaagaau ccaugaucca ucugccuaac aaggcuugcu uccugauggc gcacaacgga 1380
ugggucaugg gcgacgaccc ccugcgcaac uucgccgagc cuggcucgga ggucuaccug 1440
agaagggaac uuaucuguug gggagacucc gucaagcugc gcuacggaaa caagcccgaa 1500
gauugccccu accugugggc ucacaugaag aaguacacgg aaaucacugc aacguacuuc 1560
cagggagucc ggcuggacaa uugccacucc accccccuuc auguggccga guacaugcuc 1620
gaugcagcga ggaaucugca gccgaaucug uacgugguug ccgaacuguu cacuggcucc 1680
gaggacuugg acaacguguu cgugaccaga cuggggaucu ccucccugau ccgggaagcc 1740
augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg gggagaaccc 1800
gugggaagcu ucgugcaacc uugccugcgg ccgcugaugc cugcgaucgc ccacgcccug 1860
uucauggaca ucacucacga uaacgaaugc ccgauugugc aucgcucggc cuacgacgca 1920
cugccgagca ccacuaucgu guccauggcc ugcugcgccu ccgggagcac ucgcggauac 1980
gaugaacucg ugccgcacca gaucagcgug guguccgaag aacgcuucua uaccaagugg 2040
aaccccgaag cgcugccauc gaauacuggc gaagugaacu uccaguccgg uauuaucgcc 2100
gcucgcugug ccaucagcaa acugcaccaa gagcuuggug ccaagggauu cauucaaguc 2160
uacguggauc aggucgacga agauauugug gccgugacca ggcacucacc uuccauccac 2220
caaucagucg uggccguguc ccggaccgcg uuccggaacc ccaagaccag cuucuacucg 2280
aaagaagugc cucagaugug uaucccggga aaaaucgaag aggucgugcu ggaagcccgg 2340
accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgguaccccu 2400
gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460
gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520
uccccuggcu ccgugauuau cuuucgggug ucccuggacc cucacgccca aguggccgug 2580
ggaauucuca gaaaccaccu gacccaguuc ucaccccacu ucaaguccgg uucccuggcg 2640
guggauaacg ccgacccgau uuugaagauc cccuucgccu cgcuggccuc ccgccugacu 2700
cucgcggaac ugaaccagau ccuguaccgc ugugaaucag aggaaaaaga ggacggcggc 2760
ggcuguuacg auauucccaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820
ucugugcugg cggaaauccg gccgaagaac gaccugggac acccauucug caacaacuug 2880
cgguccggag acuggaugau cgauuacguc agcaacagau ugaucagccg gagcggcacu 2940
aucgcugagg ucggaaagug gcugcaggcc auguucuucu aucugaagca gaucccccga 3000
uaccucaucc ccuguuacuu cgacgccauu cugaucgggg ccuacaccac ccugcuggac 3060
accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120
ucacugggcu cagugcagcu cugcggcgug ggaaaguucc ccucucugcc cauucugagc 3180
ccggcccuga uggacguccc uuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240
ugcguuuccc uggcugccgg gcugccacac uucucguccg gcaucuuccg gugcuggggc 3300
cgggauaccu ucaucgcccu gcgggguauc cugcuuauca ccggucgcua cguggaggcu 3360
cggaacauua uucuggcguu cgccggcacc cuuagacacg gacugauucc gaaccuuuug 3420
ggcgaaggaa ucuacgccag auacaacugu cgggacgccg ugugguggug gcuucagugc 3480
auucaggacu auugcaagau ggugccgaac ggccuggaca uccugaagug cccagugucg 3540
aggauguauc caaccgacga cagcgcaccu cugccggccg ggacccucga ccaaccccug 3600
uucgaaguca uucaggaggc uaugcagaag cacaugcagg guauucaguu ccgggagcgg 3660
aacgcggggc cgcagauuga uaggaacaug aaagacgagg gcuucaacau cacugccggc 3720
guggacgaag aaaccgguuu uguguacgga ggaaacagau ucaacugcgg uaccuggaug 3780
gacaagaugg gagaguccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840
ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu gcuggaacug 3900
agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960
aaagucucau acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuguuucac 4020
guguccgagg aucccuccga ucugaacgaa aagcacccga aucucgugca caagcgcggg 4080
aucuauaagg acucguacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140
uucaccauug ccauggucgu ggccccggag cuguucacaa cugagaaggc cuggaaggcc 4200
cuugaaauug ccgagaagaa gcugcugggg ccuuugggga ugaaaacccu ggauccggac 4260
gacauggugu acugcggaau cuacgacaac gcccuggaca acgauaacua caaucuggcc 4320
aagggcuuca auuaccacca gggcccggaa uggcuguggc ccauugggua cuuccugcgc 4380
gccaagcugu acuucucacg gcugauggga ccagagacua ccgccaagac uaucguccuc 4440
gugaagaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacuu 4500
ccugaacuga cuaacgagaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560
uccauugcca ccauacugga aacccuuuau gaccuguag 4599
<210> 28
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 28
augggacacu cgaaacagau uagaauccug uugcucaacg aaauggagaa gcuggaaaag 60
acccucuuuc ggcuggagca gggcuacgag cuccaguucc gccugggucc gacacuacaa 120
gggaaggcag ugaccgugua caccaacuac ccauuucccg gagaaaccuu caaccgggag 180
aaguuccggu cccuggacug ggaaaaccca accgaacgag aggaugacag cgacaaguac 240
ugcaagcuga accuccaaca gucgggaucg uuccaguacu acuuucugca agggaacgag 300
aaguccggag gaggcuacau cguggucgac ccgauacuua gagugggagc cgacaaccau 360
guccugccuc uggacugcgu gacccugcaa accuucuugg ccaaaugucu gggcccguuc 420
gaugaguggg aaagccgccu cagaguggcc aaggaguccg gguacaacau gauucacuuc 480
acuccgcugc aaacccucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540
cugaaccccg acuucucccg cccaaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600
guggaaaagc ugaagaagga guggaacgug aucugcauua cugacguggu guacaaccac 660
accgccgcca acucgaagug gauccaagaa caucccgagu gcgcguacaa ccucgugaac 720
agcccgcauc ugaagccggc uugggugcuc gauagagccc ucuggagauu cuccugugac 780
gucgccgagg ggaaguacaa agagaagggu auuccggccc ucauugagaa cgaccaucac 840
augaacucaa uccggaagau caucugggag gauaucuucc cuaagcuuaa guugugggag 900
uucuuccaag uggacguaaa caaggccgug gaacaguuca gaaggcugcu gacucaagaa 960
aaccgccgcg ucacuaaguc cgauccuaac cagcaucuua ccaucaucca agacccugag 1020
uaucgccggu uugggugcac cgucgacaug aacaucgcac ugaccacuuu caucccgcau 1080
gacaaggggc cggcggccau cgaggaaugc uguaacuggu uucauaagag gauggaggaa 1140
cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaauugccuc 1200
cuggggaacg uguucuacga aaggcuggcu ggacacggac cgaagcuggg gcccgugacu 1260
cgcaagcauc cgcucgugac ucgcuacuuc accuucccgu uugaggagau ugacuucuca 1320
auggaagaau ccaugaucca ccucccgaac aaggcuugcu ucuugauggc gcacaaugga 1380
ugggucaugg gcgacgaccc acugcgcaac uucgcugagc cuggcucgga ggucuaccug 1440
agaagggaau ugauuugcug gggggacucc gucaagcugc gcuauggaaa caagccggaa 1500
gauugccccu accugugggc ucacaugaag aaguacacgg aaauuacugc cacguacuuc 1560
cagggcgucc ggcuggacaa cugccacucc acuccccucc auguggccga guacaugcuc 1620
gacgcagcga ggaaucugca gcccaaucug uacgugguug cagaacuguu cacugggucc 1680
gaggaccucg acaauguguu cgugaccaga cuggggaucu ccucccugau ccgggaagcc 1740
augucggccu acaacuccca ugaagagggc cgccuggugu accgcuacgg gggagaaccc 1800
guggggagcu ucgugcagcc uugccuccgc ccgcugaugc cugccaucgc ccacgcccug 1860
uucauggaua ucacucauga caacgaaugu cccauugugc aucgcucggc cuacgacgca 1920
cugccuucga ccacuaucgu guccauggcc ugcugcgccu ccgggagcac caggggauac 1980
gacgaacucg ugccgcacca gaucagcgug guguccgaag agagauucua uaccaagugg 2040
aaccccgaag cgcugcccag caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100
gcucgcugug cgaucagcaa gcuccaccag gagcucggug ccaagggauu cauucaaguc 2160
uacguggacc aggucgacga agauaucgug gccgugacca ggcacucacc uuccauucac 2220
caauccgugg ucgccguguc ccggacugcu uuucggaacc ccaagacuuc guucuacucg 2280
aaagaagugc cacagaugug uaucccgggg aaaaucgaag aggucguccu cgaagcccgg 2340
accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgggaccccu 2400
gauauuacug uggagauccg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460
gcuggagugg cgaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520
uccccuggcu ccgugauuau cuuccgggug ucccuggacc cucacgccca aguggccgug 2580
ggaauucuca gaaaccaccu gacucaguuc ucaccccacu uuaagucugg gucccuggcg 2640
guggacaacg ccgauccgau cuugaaaauc ccuuucgcaa gccuggccuc ccgccugacu 2700
uuggccgagc ugaaccagau ccuguaccgc ugugaaucag aggaaaagga ggacgggggu 2760
ggcuguuacg auauccccaa cugguccgcu uugaaauacg cgggacugca ggggcugaug 2820
uccgugcugg cggaaaucag accgaagaac gaucuggggc accccuucug caacaacuug 2880
cgguccggag acuggaugau cgauuacguc agcaaccggu ugaucagcag aagcgguacu 2940
aucgccgagg ucggaaagug gcugcaggcc auguucuucu accugaagca gaucccucga 3000
uaccucaucc ccuguuacuu cgacgccauu uugaucgggg ccuacaccac ccugcuggac 3060
acugccugga agcagaugag caguuuugug caaaaugggu cgaccuucgu gaagcaccuu 3120
uccuugggcu cagugcagcu cugcggcgug gggaaguucc ccucgcugcc cauucugucc 3180
ccggcccuga uggacguccc uuaccggcug aacgagauua ccaaggagaa ggagcagugc 3240
uguguuuccc uggcugccgg gcugccacac uucucguccg ggaucuuccg gugcuggggc 3300
cgcgauaccu ucauugcgcu gcgggguauc cugcuuauca ccggucgcua cguggaggcu 3360
cggaacauua uccuugcauu cgccgguacc cugagacacg gucugauccc gaaucuucuc 3420
ggggaaggaa ucuacgcaag auacaacugc cgggacgccg ugugguggug gcuccagugc 3480
auucaggacu auugcaagau ggugccgaac ggacuugaca uccugaagug cccagugucg 3540
aggauguacc cuaccgacga cagcgcuccu cugccggccg ggacccugga ccaaccccug 3600
uucgaaguca uccaagaggc uaugcagaag cacaugcagg guauucaguu ccgggaacgg 3660
aacgcggggc cccagauuga uaggaacaug aaggacgagg guuucaacau cacugccggc 3720
guggacgaag aaacuggguu uguguacgga ggaaacagau ucaacugcgg uaccuggaug 3780
gacaagaugg gagaauccga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840
ggauccgcgg uggaaauugu gggacugagc aagagcgccg ugcgguggcu ccuggaacug 3900
uccaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960
aaagucucau acgaugaaug gaaucggaag auccaggaua acuucgagaa gcuguuucac 4020
guguccgagg aucccuccga ucucaacgaa aagcauccga aucucgugca caagcgcggg 4080
aucuacaagg acucguacgg ggcguccuca ccuuggugcg acuaucagcu gcggccuaac 4140
uucacuauug cgauggucgu ggccccggag uuauucacaa cggagaaggc cuggaaggcc 4200
cuugaaauug cggagaagaa gcugcugggg ccucucggga ugaaaacccu ggauccggac 4260
gacauggugu acugcggaau cuacgacaac gcccuugaca acgauaacua caaucuggcc 4320
aagggguuca auuaccacca ggggccggaa uggcucuggc ccauugggua cuuccugcgc 4380
gccaagcugu acuucucacg gcugaugggg ccagagacua ccgccaagac uaucguccuc 4440
gugaaaaacg ugcugucccg gcacuacgug caucuggaga ggagcccuug gaagggacug 4500
ccagagcuga cgaacgagaa cgcgcaguac ugccccuucu ccugcgaaac ccaggcuugg 4560
ucgauugcca cuauacugga aaccuuauau gaccuguag 4599
<210> 29
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 29
augggacacu caaagcaaau ccgcauucug cugcugaacg agauggaaaa gcuggaaaag 60
acucuguucc ggcuggaaca ggguuacgag cugcaguuuc ggcucggccc aaccuugcaa 120
gggaaggccg ucacugucua caccaacuac ccuuuuccgg gggagacuuu caaccgcgaa 180
aaguuccgcu cccuggauug ggaaaacccc acugaacggg aggaugacag cgacaaguac 240
ugcaaacuga accuucagca guccggcagc uuccaauacu acuuccugca aggaaacgaa 300
aaguccggcg gcgguuacau cguggucgac cccauucuga gagugggagc cgauaaucau 360
gugcugcccc uggacugcgu cacccugcaa acuuuccugg cuaagugccu gggaccguuc 420
gaugaguggg aauccaggcu ccgcguggcg aaggagucgg gcuacaacau gauucauuuc 480
acuccccuuc aaacucuggg gcugagucgc agcuguuacu cccuggccaa ccagcuugaa 540
cugaacccag acuuuucccg gccaaacaga aaguacaccu ggaacgacgu gggacaauug 600
guggagaagc uuaagaagga auggaacgug aucugcauca ccgauguggu guauaaccac 660
acugccgcga auuccaagug gauccaggaa caccccgagu gugcuuacaa ccuugugaac 720
agcccucacc uuaagccggc cugggugcug gaucgggcgc uguggagauu cuccugcgac 780
guggccgaag ggaaguacaa agaaaaggga auccccgccc ugauugaaaa ugaccaccau 840
augaacucca uucggaaaau cauuugggaa gauaucuuuc ccaagcugaa gcucugggag 900
uucuuucaag uggaugugaa caaggcugug gagcaguucc ggcggcugcu gacccaggag 960
aaccgccgcg ugaccaaguc cgacccuaac cagcacuuga ccaucauaca ggacccggaa 1020
uaccggagau ucggcugcac ugucgacaug aacauugccc ucacuaccuu caucccgcau 1080
gacaagggac ccgcugccau cgaagagugc ugcaacuggu uccacaagcg gauggaagaa 1140
cugaacucug aaaagcacag gcugaucaac uaccaccagg aacaggcugu gaacugccug 1200
cugggcaacg uguucuacga gagacucgca ggacacggac cgaagcuggg cccugugacc 1260
cggaagcauc cucuggucac ccgcuacuuc accuucccgu ucgaagagau cgacuuuucg 1320
auggaagaau cgaugaucca ccucccuaac aaggccugcu uccucauggc gcacaacggc 1380
ugggucaugg gcgacgaccc gcugagaaac uucgccgagc ccgggagcga aguguaccuc 1440
cggcgggaac uuauuugcug gggagauagc gugaagcuua gauauggcaa caagccugag 1500
gacugcccau accugugggc gcacaugaag aaguacacug aaauuaccgc gaccuacuuc 1560
caaggagucc gacucgacaa cugccacagc accccacuuc acgucgcgga guacauguug 1620
gaugccgcac ggaaucucca gcccaaucug uaugucgugg cugaacuguu cacuggaucc 1680
gaggaccuug acaauguguu cgugacuaga cuggggaucu ccagccugau ccgggaagcu 1740
auguccgcgu acaacuccca cgaagaggga cggcuggugu accgcuacgg cggagagccc 1800
gugggaagcu ucgugcagcc cugccugcgg ccucugaugc cggccaucgc ucacgcccug 1860
uucauggaua ucacucacga caaugagugu ccuaucgugc acaggagcgc guacgacgcc 1920
cugcccucca cuacuaucgu gucgauggcc ugcugcgcaa gcgguucuac ccgcgguuac 1980
gacgagcuug ucccgcacca aauauccgug gugucagagg aacgguucua caccaagugg 2040
aacccggagg cccugccuuc aaacaccggc gaagugaacu uccaguccgg aaucauugcc 2100
gcccgcugug ccauuucaaa guugcaccag gagcugggcg ccaagggauu cauucagguc 2160
uacguugacc aggucgacga agauaucgug gccguuacua gacauucacc gagcauccau 2220
cagagcgugg ucgcagucag caggacugcc uuccgcaacc cgaaaaccuc guucuacucc 2280
aaggaagugc cccagaugug uaucccggga aaaauugagg aaguggugcu ggaggcccgg 2340
accaucgagc ggaacacuaa gcccuaccgg aaggacgaga auucaaucaa cggaaccccu 2400
gacaucaccg uggagauccg cgagcauauc caacugaacg agucgaagau cgucaagcag 2460
gcuggggugg caacuaaggg cccuaacgag uacauucagg agauugaauu cgagaaccug 2520
ucccccgggu ccgugaucau uuuccgcgug ucccuggacc cacaugcuca aguagcagug 2580
gggauccuga gaaaccaccu gacccaguuu agcccgcacu ucaaguccgg aucccuggcc 2640
guggauaacg ccgacccgau ccugaagauc cccuuugcau cccuggcuuc ccggcugacc 2700
uuggccgaac ugaaccagau ucuguaccgc ugcgaaucag aggaaaagga ggacggaggc 2760
ggaugcuacg auauccccaa uuggucggcg cugaaguacg ccggccuuca aggacugaug 2820
uccgugcugg ccgagaucag gccgaagaau gaccugggac acccguucug caacaacuug 2880
agaagcgggg acuggaugau ugauuacgug ucgaaccggc ugaucucccg gagcggcacc 2940
aucgcggaag ucggaaagug gcuccaggcc auguucuucu accugaagca gaucccccgc 3000
uaccugaucc ccugcuacuu cgacgcgauc uugauugggg cauacaccac ucugcuugac 3060
accgcuugga agcagauguc cuccuucgug caaaacggau ccaccuucgu gaagcaccug 3120
ucccuuggau cagugcagcu gugcggcgug ggaaaguucc cuucccuucc cauccugucc 3180
ccugcgcuga uggacgugcc guaccggcuc aacgagauca ccaaggaaaa ggaacagugc 3240
ugcgugucac uggcagccgg ccuuccgcau uuuucgagcg gaauuuucag auguuggggc 3300
agagacaccu ucauugcgcu gcgcgguauc cugcugauua ccggcagaua cguggaagcc 3360
agaaacauua uccuggcguu ugcugguacu cugcggcacg gacugauucc uaaccuguug 3420
ggagagggga ucuacgcccg guacaauugc agagaugccg ugugguggug gcugcagugc 3480
auccaggacu acugcaagau ggugcccaac ggacuugaca uucugaagug cccggugucg 3540
cgcauguacc ccaccgacga cucugcgccc cugccggccg guacccugga ucagccgcug 3600
uucgaaguga uccaggaagc caugcaaaag cacaugcagg gaauucaguu cagggaacgg 3660
aacgcaggcc cgcaaaucga ccggaacaug aaggacgaag gcuucaacau uaccgccggc 3720
guggacgagg aaaccggcuu cguguacggc ggcaaccggu ucaauugcgg uacuuggaug 3780
gacaagaugg gagaaagcga ccgcgccagg aaucggggca uuccugccac cccgcgggac 3840
gguagcgcgg uggagaucgu gggccuuucg aaguccgcgg uccgcuggcu ucuggagcug 3900
ucuaagaaaa acaucuuccc uuaccacgag gucaccguga aacgccacgg aaaggccauc 3960
aagguguccu acgacgaaug gaacaggaag auccaggaca acuuugagaa gcuguuucac 4020
gugucggaag auccguccga ccugaacgaa aagcacccca accuugucca uaagcgcggu 4080
aucuacaaag auucguaugg ugcauccucc ccuuggugcg acuaccaacu ccggccgaac 4140
uucaccaucg caaugguggu ggccccggag cuguucacca cugaaaaggc cuggaaggcc 4200
cuggaaaucg ccgaaaagaa gcugcuggga ccgcugggga ugaaaacccu ggaccccgau 4260
gauauggugu acugcgggau cuacgacaac gcccuggaua acgacaacua caaccuggcc 4320
aagggcuuca acuaccauca ggguccggag uggcuguggc caaucggaua cuuccugagg 4380
gccaagcugu acuucucccg cuugaugggc cccgaaacua ccgcaaagac uaucgugcuc 4440
gugaagaacg uccugucccg gcacuacgug caucuggaac ggucgccgug gaaaggccug 4500
ccagaguuga ccaacgagaa ugcccaguau ugcccguucu caugcgaaac ccaagccugg 4560
agcauugcca cuauucugga aacccucuac gaccuguag 4599
<210> 30
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 30
augggacacu cgaaacagau cagaauccug uugcucaacg aaauggagaa gcucgaaaag 60
acccuguucc ggcuggagca ggguuacgag cugcaguucc gccugggucc gacucuacaa 120
gggaaagcag ugacggucua caccaacuac ccguuucccg gagaaaccuu caaccgggag 180
aaguuccggu cccuggacug ggagaacccg accgaacgag aggaugacuc agauaaguac 240
ugcaagcuga acuugcaaca guccggguca uuccaguacu acuuucugca agggaacgag 300
aagucaggag ggggcuacau cguggucgac ccgauacugc gcgugggagc cgacaaucac 360
guccugccgc uggacugcgu gacccugcaa accuuccucg ccaaaugucu ggggccguuc 420
gaugaguggg aaagccgccu cagagucgca aaggaguccg gauacaacau gauucacuuc 480
acuccgcugc aaacacucgg ucugucccgg ucgugcuauu cucuggcgaa ccagcuggag 540
cuuaaucccg acuuuucccg cccgaaccgg aaguacaccu ggaacgacgu cgggcagcuu 600
guggaaaagc ugaagaagga guggaacgug aucugcauca cugauguggu guacaaccac 660
acggcugcca acucgaagug gauccaagag caucccgagu gcgcguacaa cuuggugaac 720
agcccgcauc ugaagccugc uugggugcug gacagagccc ucuggagauu cagcugcgac 780
guggccgagg ggaaguacaa agaaaagggg auuccggccu ugauugagaa cgaccaucac 840
augaacucaa uccgcaagau cauuugggag gauaucuucc cuaagcuuaa guugugggag 900
uucuuccaag uggacguaaa caaggcagug gagcaguuca gaaggcugcu gacucaagaa 960
aacagacgcg ucacuaaguc cgacccgaac cagcaccuua ccaucaucca agacccggag 1020
uaccgccggu ucggcugcac cgucgauaug aacauagccc ugaccacuuu caucccccau 1080
gacaaggggc cggcggcaau cgaggaaugc uguaacuggu uucauaagcg gauggaggaa 1140
cugaauuccg agaagcaccg gcugauuaac uaccaccagg aacaggcagu gaacugccug 1200
cugggcaacg uguucuacga acggcuggcu ggacacggac cgaagcuggg ucccgugacu 1260
agaaagcauc cgcucgucac ucgcuacuuc accuucccgu uugaggagau ugacuucucc 1320
auggaagaau ccaugaucca cuugccgaac aaggcuugcu uccugauggc gcacaacgga 1380
ugggucaugg gcgacgaccc gcugaggaau uucgcggagc cggguucgga aguguaccug 1440
agaagggaac ucauuugcug gggagacucc gucaagcugc gcuaugggaa caagcccgag 1500
gauugccccu accugugggc ucacaugaag aaguacacgg aaaucaccgc cacguacuuc 1560
cagggagucc ggcuggacaa uugccacucc accccccucc auguggccga guacaugcug 1620
gaugcagcgc gcaaucugca gccgaaucug uacgugguug cagagcuguu cacugggucc 1680
gaggaccucg acaacguguu cgugacuaga uuggggaucu ccucccucau ccgggaagcc 1740
augucggccu acaacuccca ugaggagggg aggcuggugu acagauacgg cggcgaaccc 1800
gugggaagcu ucgugcagcc gugccuccgg ccgcugaugc cggccaucgc ccacgcccug 1860
uucauggaua ucacucacga caacgaaugc ccgaucgugc aucgcucggc cuacgacgca 1920
cugccgucca ccacuaucgu guccauggca ugcugcgccu ccgggagcac ccgcggauac 1980
gaugagcucg ugccgcacca gauuagcgug guguccgaag aacgcuucua uaccaagugg 2040
aaccccgaag cccugccguc caauaccggg gaagugaacu uccaguccgg uauuaucgcc 2100
gcucgcugug cgaucucgaa acuccaccaa gagcucggug ccaagggguu cauucagguc 2160
uacguggauc aggucgacga ggauauugug gcagugacca ggcacucacc uagcauccac 2220
caauccgugg ucgccguguc acgcacugcg uuucggaacc ccaagaccuc guucuacucg 2280
aaagaagugc cgcagaugug uaucccggga aagaucgaag aggucgugcu ggaagcacgg 2340
accauugaga ggaacaccaa gccuuaccgg aaagacgaga acucuaucaa cgggaccccg 2400
gauaucacug uggagauucg cgaacacauc cagcugaacg aaucaaagau cgucaagcag 2460
gcuggagugg ccaccaaggg acccaacgag uacauccagg agaucgaauu ugaaaaccuc 2520
uccccggggu ccgugaucau cuuccgggug ucccuggacc cccacgccca aguggccgug 2580
ggaauucuca gaaaccaccu gacccaguuc ucaccccacu uuaagucggg uucccuggcc 2640
guggacaacg ccgauccgau ccucaagauc ccguucgcgu cgcuggccuc ccgccucacu 2700
cucgcggaac ugaaccagau ccuguaccgc ugugaaucag aggaaaagga ggacggcggc 2760
ggcuguuacg auauuccgaa uuggucggcu uugaaauacg cgggacuuca ggggcugaug 2820
ucuguccugg cggaaauccg gccgaagaac gaccuggggc acccguucug caacaacuug 2880
cggagcggag auuggaugau cgacuacguc agcaacagac ugaucagccg gagcggcacu 2940
aucgccgagg ucggaaagug guugcaggcc auguucuucu accugaagca gaucccccga 3000
uaccucaucc cguguuacuu cgacgccauc cugaucgggg ccuacaccac ccuccuggac 3060
accgccugga agcagaugag caguuuugug caaaacgggu ccaccuucgu gaagcaccuu 3120
ucccugggcu cagugcagcu gugcggcgug ggaaaguucc ccucgcugcc cauucugagc 3180
ccggcccuga uggacguccc cuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240
uguguguccc uggcugccgg gcugccgcac uuuucguccg gcaucuuccg gugcuggggg 3300
cgggauaccu ucauugcccu gcggggaauc cuucuuauca ccggucgcua uguggaggcu 3360
cggaacauua uucuggcguu cgccggaacc cugagacacg ggcugauucc gaaccucuug 3420
ggggaaggga ucuacgcccg cuacaacugu cgggacgccg ugugguggug gcuccagugc 3480
auucaggacu auugcaagau ggugcccaac gggcuggaca uccugaagug cccggugucg 3540
aggauguauc cgaccgacga cagcgcaccc cugccggccg ggacccucga ccaaccccug 3600
uucgaaguca uucaagaggc uaugcagaag cacaugcagg guauucaguu ccgggaacgg 3660
aacgcggggc cccagauuga uaggaacaug aaagacgagg guuucaacau cacugccggc 3720
guggacgaag aaaccgguuu uguguacgga ggaaaccggu ucaacugcgg uaccuggaug 3780
gauaagaugg gagaaucaga ucgcgcgcgc aacagaggga ucccggcaac cccgcgggac 3840
ggaucggcug uggaaauugu gggacugagc aagagcgccg ugcgguggcu gcuggaacug 3900
agcaaaaaga acaucuuccc cuaccacgaa gugaccguga agcggcacgg aaaggccauc 3960
aaagucuccu acgaugaaug gaauaggaag auccaggaua acuucgagaa gcuuuuucac 4020
guguccgagg aucccuccga ucugaacgag aagcauccga aucucgugca uaagaggggg 4080
aucuacaagg acuccuacgg agcguccucc ccuuggugcg acuaucagcu gcggccuaac 4140
uucaccauug ccauggucgu ggccccggag cucuuuacaa ccgagaaggc cuggaaggcc 4200
cucgaaauug ccgaaaagaa gcugcugggg cccuugggga ugaaaacccu ggauccggac 4260
gacauggugu acugcggaau cuacgacaac gcccuggaca acgacaacua caaucuggcg 4320
aagggcuuca auuaccacca ggggccggaa uggcucuggc cgauugggua cuuccugcgc 4380
gccaagcugu acuucucacg gcugauggga ccggagacua ccgccaagac caucguccuc 4440
gugaagaacg ugcugucgcg gcacuacgug caccuggaga ggagccccug gaaggggcuu 4500
cccgagcuga cgaacgagaa cgcgcaguac ugucccuucu ccugcgaaac ccaagccugg 4560
uccauugcca cuauacugga aaccuuauau gaccuguag 4599
<210> 31
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 31
augggccaca gcaagcagau ccggaucuug cugcugaacg agauggagaa gcuggagaag 60
acccuguuca ggcuggagca gggcuacgag cugcaguucc gguugggccc caccuugcag 120
ggcaaggccg ugaccgugua caccaacuac cccuuccccg gcgaaaccuu caacagggag 180
aaguuccggu cccuggacug ggagaacccc accgagaggg aggacgacuc cgacaaguac 240
ugcaagcuga accugcagca guccggcucc uuccaguacu acuuccugca gggcaacgag 300
aaaagcggcg gcggcuacau cgugguggac cccaucuugc gggugggcgc cgacaaccac 360
gugcugcccu uggacugcgu gacccugcag accuucuugg ccaagugcuu gggccccuuc 420
gacgaguggg agagcaggcu gaggguggcc aaggaguccg gcuacaacau gauccacuuc 480
acccccuugc agacccuggg ccuguccagg uccugcuacu cccuggccaa ccaguuggag 540
uugaaccccg acuucuccag gcccaacagg aaguacaccu ggaacgacgu gggccagcug 600
guggagaagu ugaagaagga guggaacgug aucugcauca ccgacguggu guacaaccac 660
accgccgcca acagcaagug gauccaggag caccccgagu gcgccuacaa ccuggugaac 720
uccccccacu ugaagcccgc cuggguguug gacagggccc uguggcgguu cuccugcgac 780
guggccgagg gcaaguacaa ggagaagggc auccccgccu ugaucgagaa cgaccaccac 840
augaacucca uccggaagau caucugggag gacaucuucc ccaagcugaa gcugugggag 900
uucuuccagg uggacgugaa caaggccgug gagcaguuca ggaggcugcu gacccaggag 960
aacaggcggg ugaccaaguc cgaccccaac cagcaccuga ccaucaucca ggaccccgag 1020
uacaggcggu ucggcugcac cguggacaug aacaucgccc ugaccaccuu caucccccac 1080
gacaagggcc ccgccgccau cgaggagugc ugcaacuggu uccacaagag gauggaggag 1140
uugaacuccg agaagcaccg gcugaucaac uaccaccagg agcaggccgu gaacugccug 1200
uugggcaacg uguucuacga gcggcuggcc ggccacggcc ccaagcuggg ccccgugacc 1260
aggaagcacc ccuuggugac cagguacuuc accuuccccu ucgaggagau cgacuucucc 1320
auggaggagu ccaugaucca ccugcccaac aaggccugcu uccugauggc ccacaacggc 1380
ugggugaugg gcgacgaccc ccugcggaac uucgccgagc ccggcuccga gguguaccug 1440
aggagggagc ugaucugcug gggcgacagc gugaaguugc gguacggcaa caagcccgag 1500
gacugccccu accugugggc ccacaugaag aaguacaccg agaucaccgc caccuacuuc 1560
cagggcgugc ggcuggacaa cugccacucc accccccugc acguggccga guacauguug 1620
gacgccgcca ggaacuugca gcccaacuug uacguggugg ccgagcuguu caccggcagc 1680
gaggaccugg acaacguguu cgugaccagg cugggcauca gcuccuugau cagggaggcc 1740
augagcgccu acaacagcca cgaggagggc agguuggugu accgguacgg cggcgagccc 1800
gugggcuccu ucgugcagcc cugcuugagg cccuugaugc ccgccaucgc ccacgcccug 1860
uucauggaca ucacccacga caacgagugc cccaucgugc acagguccgc cuacgacgcc 1920
cugcccagca ccaccaucgu guccauggcc ugcugcgcca gcggcagcac caggggcuac 1980
gacgaguugg ugccccacca gaucuccgug guguccgagg agcgguucua caccaagugg 2040
aaccccgagg ccuugcccuc caacaccggc gaggugaacu uccagagcgg caucaucgcc 2100
gccaggugcg ccaucagcaa gcugcaccag gagcugggcg ccaagggcuu cauccaggug 2160
uacguggacc agguggacga ggacaucgug gccgugacca ggcacucccc cagcauccac 2220
caguccgugg uggccguguc caggaccgcc uucaggaacc ccaagaccuc cuucuacagc 2280
aaggaggugc cccagaugug cauccccggc aagaucgagg agguggugcu ggaggccagg 2340
accaucgaga ggaacaccaa gcccuacagg aaggacgaga acuccaucaa cggcaccccc 2400
gacaucaccg uggagaucag ggagcacauc cagcugaacg agagcaagau cgugaagcag 2460
gccggcgugg ccaccaaggg ccccaacgag uacauccagg agaucgaguu cgagaacuug 2520
ucccccggca gcgugaucau cuucagggug agccuggacc cccacgccca gguggccgug 2580
ggcauccugc ggaaccaccu gacccaguuc agcccccacu ucaaguccgg cagccuggcc 2640
guggacaacg ccgaccccau cuugaagauc cccuucgccu cccuggccuc cagguugacc 2700
uuggccgagc ugaaccagau ccuguaccgg ugcgaguccg aggagaagga ggacggcggc 2760
ggcugcuacg acauccccaa cugguccgcc cugaaguacg ccggccugca gggcuugaug 2820
uccguguugg ccgagaucag gcccaagaac gacuugggcc accccuucug caacaacuug 2880
agguccggcg acuggaugau cgacuacgug agcaaccggc ugaucucccg guccggcacc 2940
aucgccgagg ugggcaagug guugcaggcc auguucuucu accugaagca gaucccccgg 3000
uaccugaucc ccugcuacuu cgacgccauc uugaucggcg ccuacaccac ccugcuggac 3060
accgccugga agcagauguc cagcuucgug cagaacggcu ccaccuucgu gaagcaccug 3120
uccuugggcu ccgugcagcu gugcggcgug ggcaaguucc ccucccugcc cauccugucc 3180
cccgcccuga uggacgugcc cuacagguug aacgagauca ccaaggagaa ggagcagugc 3240
ugcguguccc uggccgccgg cuugccccac uucuccuccg gcaucuuccg gugcuggggc 3300
agggacaccu ucaucgcccu gaggggcauc cugcugauca ccggccggua cguggaggcc 3360
aggaacauca ucuuggccuu cgccggcacc cugaggcacg gccugauccc caaccugcug 3420
ggcgagggca ucuacgccag guacaacugc cgggacgccg ugugguggug gcugcagugc 3480
auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgugucc 3540
aggauguacc ccaccgacga cuccgccccc uugcccgccg gcacccugga ccagcccuug 3600
uucgagguga uccaggaggc caugcagaag cacaugcagg gcauccaguu ccgggagagg 3660
aacgccggcc cccagaucga ccggaacaug aaggacgagg gcuucaacau caccgccggc 3720
guggacgagg aaaccggcuu cguguacggc ggcaaccggu ucaacugcgg caccuggaug 3780
gacaagaugg gcgagagcga cagggccagg aacaggggca uccccgccac ccccagggac 3840
ggcuccgccg uggagaucgu gggccugagc aaguccgccg ugcggugguu gcuggaguug 3900
uccaagaaga acaucuuccc cuaccacgag gugaccguga agaggcacgg caaggccauc 3960
aagguguccu acgacgagug gaacaggaag auccaggaca acuucgagaa gcuguuccac 4020
guguccgagg accccuccga cuugaacgag aagcacccca accuggugca caagcggggc 4080
aucuacaagg acagcuacgg cgccuccagc cccuggugcg acuaccagcu gaggcccaac 4140
uucaccaucg ccaugguggu ggcccccgag cuguucacca ccgagaaggc cuggaaggcc 4200
uuggagaucg ccgagaagaa guugcugggc ccccugggca ugaagaccuu ggaccccgac 4260
gacauggugu acugcggcau cuacgacaac gccuuggaca acgacaacua caaccuggcc 4320
aagggcuuca acuaccacca gggccccgag uggcuguggc ccaucggcua cuuccugcgg 4380
gccaaguugu acuucuccag guugaugggc cccgaaacca ccgccaagac caucguguug 4440
gugaagaacg ugcugucccg gcacuacgug caccuggaga ggucccccug gaagggccug 4500
cccgagcuga ccaacgagaa cgcccaguac ugccccuuca gcugcgaaac ccaggccugg 4560
uccaucgcca ccauccugga aacccuguac gacuuguag 4599
<210> 32
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 32
augggacaua gcaagcagau ccggaucuug cugcugaaug aaauggaaaa gcuggaaaag 60
acccuguuca gacuggaaca gggauacgaa cugcaguucc gguugggacc uaccuugcag 120
ggaaaggcug ugaccgugua caccaauuac ccuuucccug gagaaaccuu caauagagaa 180
aaguucagau cucuagauug ggaaaauccu accgaaagag aagaugauuc ugauaaguac 240
ugcaagcuga aucugcagca gucuggaucu uuccaguacu acuuccugca gggaaaugaa 300
aagagcggag gaggauacau cgugguggau ccuaucuugc gggugggagc ugauaaucau 360
gugcugccuu uggauugcgu gacccugcag accuucuugg cuaagugcuu gggaccuuuc 420
gaugaauggg aaagcagacu gagaguggcu aaggaaucug gauacaauau gauccauuuc 480
accccuuugc agacccuggg acugucuaga ucuugcuacu cucuggcuaa ucaguuggaa 540
uugaauccug auuucucuag accuaauaga aaguacaccu ggaaugaugu gggacagcug 600
guggaaaagu ugaagaagga auggaaugug aucugcauca ccgauguggu guacaaucau 660
accgcugcua auagcaagug gauccaggaa cauccugaau gcgcuuacaa ucuggugaau 720
ucuccucauu ugaagccugc uuggguguug gauagagcuc uguggcgguu cucuugcgau 780
guggcugaag gaaaguacaa ggaaaaggga aucccugcuu ugaucgaaaa ugaucaucau 840
augaauucua uccggaagau caucugggaa gauaucuucc cuaagcugaa gcugugggaa 900
uucuuccagg uggaugugaa uaaggcugug gaacaguuca gaagacugcu gacccaggaa 960
aauagacggg ugaccaaguc ugauccuaau cagcaucuga ccaucaucca ggauccugaa 1020
uacagacggu ucggaugcac cguggauaug aauaucgcuc ugaccaccuu caucccucau 1080
gauaagggac cugcugcuau cgaagaaugc ugcaauuggu uccauaagag aauggaagaa 1140
uugaauucug aaaagcaucg gcugaucaau uaccaucagg aacaggcugu gaauugccug 1200
uugggaaaug uguucuacga acggcuggcu ggacauggac cuaagcuggg accugugacc 1260
agaaagcauc cuuuggugac cagauacuuc accuucccuu ucgaagaaau cgauuucucu 1320
auggaagaau cuaugaucca ucugccuaau aaggcuugcu uccugauggc ucauaaugga 1380
ugggugaugg gagaugaucc ucugcggaau uucgcugaac cuggaucuga aguguaccug 1440
agaagagaac ugaucugcug gggagauagc gugaaguugc gguacggaaa uaagccugaa 1500
gauugcccuu accugugggc ucauaugaag aaguacaccg aaaucaccgc uaccuacuuc 1560
cagggagugc ggcuggauaa uugccauucu accccucugc auguggcuga auacauguug 1620
gaugcugcua gaaauuugca gccuaauuug uacguggugg cugaacuguu caccggaagc 1680
gaagaucugg auaauguguu cgugaccaga cugggaauca gcucuuugau cagagaagcu 1740
augagcgcuu acaauagcca ugaagaagga agauuggugu accgguacgg aggagaaccu 1800
gugggaucuu ucgugcagcc uugcuugagg ccuuugaugc cugcuaucgc ucaugcucug 1860
uucauggaua ucacccauga uaaugaaugc ccuaucgugc auagaucugc uuacgaugcu 1920
cugccuagca ccaccaucgu gucuauggcu ugcugcgcua gcggaagcac cagaggauac 1980
gaugaauugg ugccucauca gaucucugug gugucugaag aacgguucua caccaagugg 2040
aauccugaag cuuugccuuc uaauaccgga gaagugaauu uccagagcgg aaucaucgcu 2100
gcuagaugcg cuaucagcaa gcugcaucag gaacugggag cuaagggauu cauccaggug 2160
uacguggauc agguggauga agauaucgug gcugugacca gacauucucc uagcauccau 2220
cagucugugg uggcuguguc uagaaccgcu uucagaaauc cuaagaccuc uuucuacagc 2280
aaggaagugc cucagaugug caucccugga aagaucgaag aaguggugcu ggaagcuaga 2340
accaucgaaa gaaauaccaa gccuuacaga aaggaugaaa auucuaucaa uggaaccccu 2400
gauaucaccg uggaaaucag agaacauauc cagcugaaug aaagcaagau cgugaagcag 2460
gcuggagugg cuaccaaggg accuaaugaa uacauccagg aaaucgaauu cgaaaauuug 2520
ucuccuggaa gcgugaucau cuucagagug agccuggauc cucaugcuca gguggcugug 2580
ggaauccugc ggaaucaucu gacccaguuc agcccucauu ucaagucugg aagccuggcu 2640
guggauaaug cugauccuau cuugaagauc ccuuucgcuu cucuggcuuc uagauugacc 2700
uuggcugaac ugaaucagau ccuguaccgg ugcgaaucug aagaaaagga agauggagga 2760
ggaugcuacg auaucccuaa uuggucugcu cugaaguacg cuggacugca gggauugaug 2820
ucuguguugg cugaaaucag accuaagaau gauuugggac auccuuucug caauaauuug 2880
agaucuggag auuggaugau cgauuacgug agcaaucggc ugaucucucg gucuggaacc 2940
aucgcugaag ugggaaagug guugcaggcu auguucuucu accugaagca gaucccucgg 3000
uaccugaucc cuugcuacuu cgaugcuauc uugaucggag cuuacaccac ccugcuggau 3060
accgcuugga agcagauguc uagcuucgug cagaauggau cuaccuucgu gaagcaucug 3120
ucuuugggau cugugcagcu gugcggagug ggaaaguucc cuucucugcc uauccugucu 3180
ccugcucuga uggaugugcc uuacagauug aaugaaauca ccaaggaaaa ggaacagugc 3240
ugcgugucuc uggcugcugg auugccucau uucucuucug gaaucuuccg gugcugggga 3300
agagauaccu ucaucgcucu gagaggaauc cugcugauca ccggacggua cguggaagcu 3360
agaaauauca ucuuggcuuu cgcuggaacc cugagacaug gacugauccc uaaucugcug 3420
ggagaaggaa ucuacgcuag auacaauugc cgggaugcug ugugguggug gcugcagugc 3480
auccaggauu acugcaagau ggugccuaau ggacuggaua uccugaagug cccugugucu 3540
agaauguacc cuaccgauga uucugcuccu uugccugcug gaacccugga ucagccuuug 3600
uucgaaguga uccaggaagc uaugcagaag cauaugcagg gaauccaguu ccgggaaaga 3660
aaugcuggac cucagaucga ucggaauaug aaggaugaag gauucaauau caccgcugga 3720
guggaugaag aaaccggauu cguguacgga ggaaaucggu ucaauugcgg aaccuggaug 3780
gauaagaugg gagaaagcga uagagcuaga aauagaggaa ucccugcuac cccuagagau 3840
ggaucugcug uggaaaucgu gggacugagc aagucugcug ugcggugguu gcuggaauug 3900
ucuaagaaga auaucuuccc uuaccaugaa gugaccguga agagacaugg aaaggcuauc 3960
aaggugucuu acgaugaaug gaauagaaag auccaggaua auuucgaaaa gcuguuccau 4020
gugucugaag auccuucuga uuugaaugaa aagcauccua aucuggugca uaagcgggga 4080
aucuacaagg auagcuacgg agcuucuagc ccuuggugcg auuaccagcu gaggccuaau 4140
uucaccaucg cuaugguggu ggcuccugaa cuguucacca ccgaaaaggc uuggaaggcu 4200
uuggaaaucg cugaaaagaa guugcuggga ccucugggaa ugaagaccuu ggauccugau 4260
gauauggugu acugcggaau cuacgauaau gcuuuggaua augauaauua caaucuggcu 4320
aagggauuca auuaccauca gggaccugaa uggcuguggc cuaucggaua cuuccugcgg 4380
gcuaaguugu acuucucuag auugauggga ccugaaacca ccgcuaagac caucguguug 4440
gugaagaaug ugcugucucg gcauuacgug caucuggaaa gaucuccuug gaagggacug 4500
ccugaacuga ccaaugaaaa ugcucaguac ugcccuuuca gcugcgaaac ccaggcuugg 4560
ucuaucgcua ccauccugga aacccuguac gauuuguag 4599
<210> 33
<211> 158
<212> RNA
<213> Artificial Sequence
<220>
<223> Modified Xenopus beta-globin 3'UTR
<220>
<221> misc_feature
<222> (2)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (157)
<223> n is unlocked nucleomonomer UNA-A
<400> 33
cnagugacug acuaggaucu gguuaccacu aaaccagccu caagaacacc cgaauggagu 60
cucuaagcua cauaauacca acuuacacuu acaaaauguu gucccccaaa auguagccau 120
ucguaucugc uccuaauaaa aagaaaguuu cuucacnu 158
<210> 34
<211> 158
<212> RNA
<213> Artificial Sequence
<220>
<223> Modified Xenopus beta-globin 3'UTR
<220>
<221> misc_feature
<222> (2)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (3)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (4)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (155)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (156)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (157)
<223> n is unlocked nucleomonomer UNA-A
<400> 34
cnnnugacug acuaggaucu gguuaccacu aaaccagccu caagaacacc cgaauggagu 60
cucuaagcua cauaauacca acuuacacuu acaaaauguu gucccccaaa auguagccau 120
ucguaucugc uccuaauaaa aagaaaguuu cuucnnnu 158
<210> 35
<211> 158
<212> RNA
<213> Artificial Sequence
<220>
<223> Modified Xenopus beta-globin 3'UTR
<220>
<221> misc_feature
<222> (2)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (8)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (14)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (20)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (26)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (32)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (38)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (44)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (50)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (56)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (62)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (68)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (74)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (80)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (86)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (92)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (98)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (104)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (110)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (116)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (122)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (128)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (134)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (140)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (146)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (152)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (157)
<223> n is unlocked nucleomonomer UNA-A
<400> 35
cnaguganug acunggaucn gguuancacu anaccagncu caanaacacn cgaaungagu 60
cncuaagnua caunauaccn acuuanacuu anaaaaunuu gucncccaan auguanccau 120
unguaucngc uccnaauaan aagaanguuu cnucacnu 158
<210> 36
<211> 158
<212> RNA
<213> Artificial Sequence
<220>
<223> Modified Xenopus beta-globin 3'UTR
<220>
<221> misc_feature
<222> (2)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (3)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (8)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (9)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (14)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (15)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (20)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (21)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (26)..(27)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (32)..(33)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (38)..(39)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (44)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (45)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (50)..(51)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (56)..(57)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (62)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (63)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (68)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (69)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (74)..(75)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (80)..(81)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (86)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (87)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (92)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (93)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (98)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (99)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (104)..(105)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (110)..(111)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (116)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (117)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (122)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (123)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (128)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (129)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (134)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (135)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (140)..(141)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (146)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (147)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (152)..(153)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (157)
<223> n is unlocked nucleomonomer UNA-A
<400> 36
cnnguganng acunngaucn nguuannacu annccagnnu caannacacn ngaaunnagu 60
cnnuaagnna caunnuaccn ncuuanncuu annaaaunnu gucnnccaan nuguanncau 120
unnuaucnnc uccnnauaan nagaannuuu cnncacnu 158
<210> 37
<211> 158
<212> RNA
<213> Artificial Sequence
<220>
<223> Modified Xenopus beta-globin 3'UTR
<220>
<221> misc_feature
<222> (1)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (2)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (3)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (4)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (5)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (6)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (7)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (8)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (9)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (10)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (11)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (12)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (13)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (14)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (15)..(16)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (17)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (18)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (19)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (20)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (21)..(22)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (23)..(24)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (25)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (26)..(27)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (28)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (29)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (30)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (31)..(33)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (34)..(35)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (36)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (37)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (38)..(39)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (40)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (41)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (42)..(43)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (44)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (45)..(46)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (47)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (48)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (49)..(51)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (52)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (53)..(54)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (55)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (56)..(57)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (58)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (59)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (60)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (61)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (62)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (63)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (64)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (65)..(66)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (67)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (68)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (69)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (70)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (71)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (72)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (73)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (74)..(75)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (76)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (77)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (78)..(79)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (80)..(81)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (82)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (83)..(84)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (85)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (86)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (87)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (88)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (89)..(90)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (91)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (92)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (93)..(96)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (97)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (98)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (99)..(100)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (101)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (102)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (103)..(107)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (108)..(111)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (112)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (113)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (114)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (115)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (116)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (117)..(118)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (119)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (120)..(121)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (122)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (123)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (124)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (125)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (126)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (127)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (128)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (129)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (130)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (131)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (132)..(133)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (134)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (135)..(136)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (137)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (138)..(142)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (143)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (144)..(146)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (147)
<223> n is unlocked nucleomonomer UNA-G
<220>
<221> misc_feature
<222> (148)..(149)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (150)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (151)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (152)..(153)
<223> n is unlocked nucleomonomer UNA-U
<220>
<221> misc_feature
<222> (154)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (155)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (156)
<223> n is unlocked nucleomonomer UNA-C
<220>
<221> misc_feature
<222> (157)
<223> n is unlocked nucleomonomer UNA-A
<220>
<221> misc_feature
<222> (158)
<223> n is unlocked nucleomonomer UNA-U
<400> 37
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnn 158
<210> 38
<211> 100
<212> RNA
<213> Unknown
<220>
<223> Poly(A) 100 Tail
<400> 38
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 100
<210> 39
<211> 110
<212> RNA
<213> Unknown
<220>
<223> Poly(A) 110 Tail
<400> 39
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 110
<210> 40
<211> 9
<212> RNA
<213> Unknown
<220>
<223> Triple Stop Codon
<400> 40
auaagugaa 9
<210> 41
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 41
augggccaca gcaagcagau ccggauccug cugcugaacg agauggagaa gcuggagaag 60
acccuguucc ggcuggagca gggcuacgag cugcaguucc ggcugggccc cacccugcag 120
ggcaaggccg ugaccgugua caccaacuac cccuuccccg gcgagaccuu caaccgggag 180
aaguuccgga gccuggacug ggagaacccc accgagcggg aggacgacag cgacaaguac 240
ugcaagcuga accugcagca gagcggcagc uuccaguacu acuuccugca gggcaacgag 300
aagagcggcg gcggcuacau cgugguggac cccauccugc gggugggcgc cgacaaccac 360
gugcugcccc uggacugcgu gacccugcag accuuccugg ccaagugccu gggccccuuc 420
gacgaguggg agagccggcu gcggguggcc aaggagagcg gcuacaacau gauccacuuc 480
accccccugc agacccuggg ccugagccgg agcugcuaca gccuggccaa ccagcuggag 540
cugaaccccg acuucagccg gcccaaccgg aaguacaccu ggaacgacgu gggccagcug 600
guggagaagc ugaagaagga guggaacgug aucugcauca ccgacguggu guacaaccac 660
accgccgcca acagcaagug gauccaggag caccccgagu gcgccuacaa ccuggugaac 720
agcccccacc ugaagcccgc cugggugcug gaccgggccc uguggcgguu cagcugcgac 780
guggccgagg gcaaguacaa ggagaagggc auccccgccc ugaucgagaa cgaccaccac 840
augaacagca uccggaagau caucugggag gacaucuucc ccaagcugaa gcugugggag 900
uucuuccagg uggacgugaa caaggccgug gagcaguucc ggcggcugcu gacccaggag 960
aaccggcggg ugaccaagag cgaccccaac cagcaccuga ccaucaucca ggaccccgag 1020
uaccggcggu ucggcugcac cguggacaug aacaucgccc ugaccaccuu caucccccac 1080
gacaagggcc ccgccgccau cgaggagugc ugcaacuggu uccacaagcg gauggaggag 1140
cugaacagcg agaagcaccg gcugaucaac uaccaccagg agcaggccgu gaacugccug 1200
cugggcaacg uguucuacga gcggcuggcc ggccacggcc ccaagcuggg ccccgugacc 1260
cggaagcacc cccuggugac ccgguacuuc accuuccccu ucgaggagau cgacuucagc 1320
auggaggaga gcaugaucca ccugcccaac aaggccugcu uccugauggc ccacaacggc 1380
ugggugaugg gcgacgaccc ccugcggaac uucgccgagc ccggcagcga gguguaccug 1440
cggcgggagc ugaucugcug gggcgacagc gugaagcugc gguacggcaa caagcccgag 1500
gacugccccu accugugggc ccacaugaag aaguacaccg agaucaccgc caccuacuuc 1560
cagggcgugc ggcuggacaa cugccacagc accccccugc acguggccga guacaugcug 1620
gacgccgccc ggaaccugca gcccaaccug uacguggugg ccgagcuguu caccggcagc 1680
gaggaccugg acaacguguu cgugacccgg cugggcauca gcagccugau ccgggaggcc 1740
augagcgccu acaacagcca cgaggagggc cggcuggugu accgguacgg cggcgagccc 1800
gugggcagcu ucgugcagcc cugccugcgg ccccugaugc ccgccaucgc ccacgcccug 1860
uucauggaca ucacccacga caacgagugc cccaucgugc accggagcgc cuacgacgcc 1920
cugcccagca ccaccaucgu gagcauggcc ugcugcgcca gcggcagcac ccggggcuac 1980
gacgagcugg ugccccacca gaucagcgug gugagcgagg agcgguucua caccaagugg 2040
aaccccgagg cccugcccag caacaccggc gaggugaacu uccagagcgg caucaucgcc 2100
gcccggugcg ccaucagcaa gcugcaccag gagcugggcg ccaagggcuu cauccaggug 2160
uacguggacc agguggacga ggacaucgug gccgugaccc ggcacagccc cagcauccac 2220
cagagcgugg uggccgugag ccggaccgcc uuccggaacc ccaagaccag cuucuacagc 2280
aaggaggugc cccagaugug cauccccggc aagaucgagg agguggugcu ggaggcccgg 2340
accaucgagc ggaacaccaa gcccuaccgg aaggacgaga acagcaucaa cggcaccccc 2400
gacaucaccg uggagauccg ggagcacauc cagcugaacg agagcaagau cgugaagcag 2460
gccggcgugg ccaccaaggg ccccaacgag uacauccagg agaucgaguu cgagaaccug 2520
agccccggca gcgugaucau cuuccgggug agccuggacc cccacgccca gguggccgug 2580
ggcauccugc ggaaccaccu gacccaguuc agcccccacu ucaagagcgg cagccuggcc 2640
guggacaacg ccgaccccau ccugaagauc cccuucgcca gccuggccag ccggcugacc 2700
cuggccgagc ugaaccagau ccuguaccgg ugcgagagcg aggagaagga ggacggcggc 2760
ggcugcuacg acauccccaa cuggagcgcc cugaaguacg ccggccugca gggccugaug 2820
agcgugcugg ccgagauccg gcccaagaac gaccugggcc accccuucug caacaaccug 2880
cggagcggcg acuggaugau cgacuacgug agcaaccggc ugaucagccg gagcggcacc 2940
aucgccgagg ugggcaagug gcugcaggcc auguucuucu accugaagca gaucccccgg 3000
uaccugaucc ccugcuacuu cgacgccauc cugaucggcg ccuacaccac ccugcuggac 3060
accgccugga agcagaugag cagcuucgug cagaacggca gcaccuucgu gaagcaccug 3120
agccugggca gcgugcagcu gugcggcgug ggcaaguucc ccagccugcc cauccugagc 3180
cccgcccuga uggacgugcc cuaccggcug aacgagauca ccaaggagaa ggagcagugc 3240
ugcgugagcc uggccgccgg ccugccccac uucagcagcg gcaucuuccg gugcuggggc 3300
cgggacaccu ucaucgcccu gcggggcauc cugcugauca ccggccggua cguggaggcc 3360
cggaacauca uccuggccuu cgccggcacc cugcggcacg gccugauccc caaccugcug 3420
ggcgagggca ucuacgcccg guacaacugc cgggacgccg ugugguggug gcugcagugc 3480
auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgugagc 3540
cggauguacc ccaccgacga cagcgccccc cugcccgccg gcacccugga ccagccccug 3600
uucgagguga uccaggaggc caugcagaag cacaugcagg gcauccaguu ccgggagcgg 3660
aacgccggcc cccagaucga ccggaacaug aaggacgagg gcuucaacau caccgccggc 3720
guggacgagg agaccggcuu cguguacggc ggcaaccggu ucaacugcgg caccuggaug 3780
gacaagaugg gcgagagcga ccgggcccgg aaccggggca uccccgccac cccccgggac 3840
ggcagcgccg uggagaucgu gggccugagc aagagcgccg ugcgguggcu gcuggagcug 3900
agcaagaaga acaucuuccc cuaccacgag gugaccguga agcggcacgg caaggccauc 3960
aaggugagcu acgacgagug gaaccggaag auccaggaca acuucgagaa gcuguuccac 4020
gugagcgagg accccagcga ccugaacgag aagcacccca accuggugca caagcggggc 4080
aucuacaagg acagcuacgg cgccagcagc cccuggugcg acuaccagcu gcggcccaac 4140
uucaccaucg ccaugguggu ggcccccgag cuguucacca ccgagaaggc cuggaaggcc 4200
cuggagaucg ccgagaagaa gcugcugggc ccccugggca ugaagacccu ggaccccgac 4260
gacauggugu acugcggcau cuacgacaac gcccuggaca acgacaacua caaccuggcc 4320
aagggcuuca acuaccacca gggccccgag uggcuguggc ccaucggcua cuuccugcgg 4380
gccaagcugu acuucagccg gcugaugggc cccgagacca ccgccaagac caucgugcug 4440
gugaagaacg ugcugagccg gcacuacgug caccuggagc ggagccccug gaagggccug 4500
cccgagcuga ccaacgagaa cgcccaguac ugccccuuca gcugcgagac ccaggccugg 4560
agcaucgcca ccauccugga gacccuguac gaccuguag 4599
<210> 42
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 42
augggccaua gcaagcagau ccggauccuc cugcucaaug agauggaaaa gcucgagaaa 60
acccucuuua ggcuggagca aggcuacgaa cuccaguuuc ggcucgggcc cacucuccag 120
ggcaaggccg ugaccgucua caccaacuau cccuucccug gcgagaccuu caacagggag 180
aaguuucggu cccucgacug ggagaacccc accgagaggg aggacgacuc cgacaaguau 240
ugcaagcuga accuccaaca auccgggucc uuccaguacu acuuucugca aggcaacgaa 300
aagagcgggg gcggguauau uguggucgau cccauccucc gggugggggc ugacaaccac 360
guccuccccc uggauugcgu gacucugcag accuuccucg cuaaaugccu gggcccuuuc 420
gacgaguggg agagcaggcu gcggguggcc aaggaguccg gguauaauau gauccacuuc 480
accccccugc agacucuggg ccucucccgg uccuguuaua gccuggccaa ccagcucgag 540
cucaacccug auuucuccag gccuaacagg aaauacaccu ggaacgacgu gggccagcuc 600
gucgagaagc ucaagaaaga guggaacgug aucugcauca cugacguggu cuauaaccac 660
acugcugcua acagcaagug gauucaggag caccccgagu gcgccuacaa ccuggucaac 720
uccccccauc ucaagccugc cuggguccuc gauagggccc uguggcgguu uagcugcgac 780
guggccgagg gcaaguauaa ggagaaaggc auuccugcuc ugaucgagaa cgaccaucac 840
augaacagca uucggaagau uaucugggaa gacaucuucc ccaaacugaa gcucugggag 900
uucuuucaag ucgacgucaa uaaggcugug gaacaauuca ggaggcugcu gacccaagag 960
aaccggcggg ucaccaaauc cgaccccaau caacaucuga cuaucaucca agacccugag 1020
uauaggcggu ucgggugcac ugucgacaug aauaucgccc ucacuacuuu uauuccccac 1080
gauaaaggcc ccgccgccau cgaggagugu ugcaacuggu uccacaagag gauggaagag 1140
cucaacuccg aaaaacaccg gcucaucaau uaccaccagg agcaggccgu gaacugucug 1200
cugggcaacg ucuucuacga gcggcucgcu gggcacgggc ccaagcucgg cccugucacu 1260
aggaaacacc cucucgugac ccgguacuuc acuuuucccu ucgaggaaau ugauuuuagc 1320
auggaggagu ccaugaucca ccuccccaac aaggcuugcu uccucauggc ccauaacggc 1380
ugggucaugg gcgacgaccc ucugcggaau uucgcugagc ccggguccga gguguaucuc 1440
cggagggagc ugaucuguug gggcgauagc gugaagcucc gguacggcaa caagcccgaa 1500
gauugcccuu accucugggc ccauaugaag aaguauacug agauuacugc cacuuacuuu 1560
cagggcgucc ggcuggacaa uugucauucc accccucugc augucgcuga auauaugcug 1620
gacgcugcuc ggaaccugca acccaaccuc uacgucgucg cugagcucuu uaccggcagc 1680
gaggaccucg auaacgucuu cgugacuagg cucgggauca gcagccucau uagggaagcc 1740
augagcgccu acaacagcca cgaggaaggg aggcucgugu aucgguacgg cggcgagccu 1800
gugggcagcu ucgugcagcc cugccugcgg ccucucaugc ccgcuaucgc ccacgcccuc 1860
uucauggaca ucacucacga caacgaaugc ccuaucgucc acagguccgc uuacgacgcu 1920
cugcccagca cuaccaucgu guccauggcc ugcugcgcua gcggcagcac caggggguac 1980
gacgagcucg ucccucacca gaucuccguc guguccgagg agcgguucua uacuaaaugg 2040
aacccugagg cccugccuuc caauaccggg gaggugaacu uucaaagcgg gaucaucgcc 2100
gcccggugcg cuauuagcaa gcugcaccag gaacugggcg ccaaaggguu cauccagguc 2160
uacgucgacc aaguggacga ggauauuguc gccgucacca ggcauucccc uagcauucac 2220
caguccgugg ucgcugucuc caggacugcu uuucggaacc ccaaaacuuc cuucuauagc 2280
aaagaggucc cucaaaugug uauuccuggg aagaucgagg aggucgugcu ggaggcuagg 2340
acuaucgaaa ggaauacuaa gccuuaccgg aaagacgaaa acuccauuaa cggcaccccc 2400
gacauuaccg ucgagaucag ggagcacauc cagcugaacg agagcaagau cgugaagcaa 2460
gcuggcgugg ccaccaaggg ccccaacgag uacauccaag agauugaguu cgagaaucug 2520
ucccccggca gcgugaucau uuuuagggug agccuggacc cccacgccca agucgcugug 2580
ggcauccugc ggaaccaccu cacccaauuu agcccucauu ucaaguccgg gagccucgcu 2640
guggauaacg ccgacccuau ucucaagauc ccuuucgcuu cccuggccag caggcucacu 2700
cuggcugaac ucaaccagau ucuguaucgg ugcgaguccg aggagaaaga ggacgggggc 2760
ggcuguuacg auauucccaa uugguccgcc cugaaguacg ccgggcugca agggcucaug 2820
uccguccugg ccgagauuag gcccaaaaac gaucugggcc acccuuucug caacaaccug 2880
agguccggcg acuggaugau cgauuacguc agcaaucggc ugaucucccg guccggcacu 2940
aucgcugagg uggggaagug gcugcaggcu auguuuuuuu aucucaaaca gauuccccgg 3000
uaucugauuc ccugcuauuu cgacgcuauu cucaucgggg ccuacaccac ucugcucgac 3060
accgccugga aacagauguc cagcuucgug cagaacgggu ccaccuucgu caagcaucug 3120
ucccuggggu ccgugcaacu cugcggcguc ggcaaguuuc cuagccuccc cauccugucc 3180
ccugcccuca uggacguccc uuaccggcuc aacgaaauua ccaaggagaa agaacaaugc 3240
ugcguguccc ucgcugccgg gcucccucac uucuccuccg ggaucuuucg guguuggggc 3300
cgggacacuu ucaucgcccu gagggggauu cuccucauca cuggccggua cgucgaggcc 3360
cggaacauca uccucgccuu cgcugggacc cuccggcacg ggcucauccc uaaccuccuc 3420
ggggagggca ucuacgccag guauaacugc cgggacgcug ucugguggug gcuccagugc 3480
auucaggacu auugcaagau ggugcccaac gggcucgaua uccucaaaug ucccgugagc 3540
aggauguacc cuaccgacga cuccgcuccu cugccugcug ggacccucga ccagccccug 3600
uucgagguca uucaggaggc caugcaaaag cauaugcagg ggauucaguu ucgggagcgg 3660
aacgcugggc cccagauuga ccggaauaug aaagaugagg gguucaacau uacugccggc 3720
guggacgagg agaccggcuu cguguacggc ggcaaccggu uuaacugcgg gaccuggaug 3780
gacaagaugg gcgagagcga uagggcuagg aauaggggca uucccgccac ccccagggac 3840
ggcuccgcug ucgagaucgu cgggcucagc aaguccgcug ugcgguggcu gcucgagcuc 3900
agcaagaaga acaucuuucc uuaccacgag gucaccguca agaggcacgg caaagcuauu 3960
aaagucuccu acgacgaaug gaauaggaag auucaagaua auuucgagaa acucuuccac 4020
gugagcgagg auccuuccga ccucaacgag aaacacccca accucgugca uaagcggggg 4080
auuuauaagg acagcuacgg cgcuuccagc ccuuggugcg auuaccagcu ccggccuaac 4140
uucaccauug ccaugguggu cgccccugaa cucuucacua ccgagaaggc cuggaaggcu 4200
cuggaaaucg ccgagaagaa gcugcugggg ccccugggga ugaagacucu cgaccccgac 4260
gacauggugu auugcggcau cuacgauaac gcccucgaua acgauaauua uaaccuggcu 4320
aagggguuua acuaccauca aggcccugaa uggcucuggc cuaucggcua cuuccugcgg 4380
gccaagcucu acuucagcag gcugaugggg cccgaaacua cugccaaaac uauugugcug 4440
gugaagaacg ugcugagccg gcacuacgug caccuggaaa ggagcccuug gaagggccug 4500
cccgagcuca ccaacgaaaa cgcccaguau ugcccuuuua gcugcgagac ccaagccugg 4560
uccaucgcua cuauccugga aacccuguac gaccucuag 4599
<210> 43
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 43
auggggcaca gcaaacaaau caggauccuc cuccucaacg aaauggaaaa acucgaaaaa 60
acccucuuca ggcucgaaca aggguacgaa cuccaauuca ggcucgggcc gacgcuccaa 120
gggaaagcgg ugacggugua cacgaacuac ccguucccgg gggaaacguu caacagggaa 180
aaauucagga gccucgacug ggaaaacccg acggaaaggg aagacgacag cgacaaauac 240
ugcaaacuca accuccaaca aagcgggagc uuccaauacu acuuccucca agggaacgaa 300
aaaagcgggg ggggguacau cgugguggac ccgauccuca gggugggggc ggacaaccac 360
gugcucccgc ucgacugcgu gacgcuccaa acguuccucg cgaaaugccu cgggccguuc 420
gacgaauggg aaagcaggcu caggguggcg aaagaaagcg gguacaacau gauccacuuc 480
acgccgcucc aaacgcucgg gcucagcagg agcugcuaca gccucgcgaa ccaacucgaa 540
cucaacccgg acuucagcag gccgaacagg aaauacacgu ggaacgacgu ggggcaacuc 600
guggaaaaac ucaaaaaaga auggaacgug aucugcauca cggacguggu guacaaccac 660
acggcggcga acagcaaaug gauccaagaa cacccggaau gcgcguacaa ccucgugaac 720
agcccgcacc ucaaaccggc gugggugcuc gacagggcgc ucuggagguu cagcugcgac 780
guggcggaag ggaaauacaa agaaaaaggg aucccggcgc ucaucgaaaa cgaccaccac 840
augaacagca ucaggaaaau caucugggaa gacaucuucc cgaaacucaa acucugggaa 900
uucuuccaag uggacgugaa caaagcggug gaacaauuca ggaggcuccu cacgcaagaa 960
aacaggaggg ugacgaaaag cgacccgaac caacaccuca cgaucaucca agacccggaa 1020
uacaggaggu ucgggugcac gguggacaug aacaucgcgc ucacgacguu caucccgcac 1080
gacaaagggc cggcggcgau cgaagaaugc ugcaacuggu uccacaaaag gauggaagaa 1140
cucaacagcg aaaaacacag gcucaucaac uaccaccaag aacaagcggu gaacugccuc 1200
cucgggaacg uguucuacga aaggcucgcg gggcacgggc cgaaacucgg gccggugacg 1260
aggaaacacc cgcucgugac gagguacuuc acguucccgu ucgaagaaau cgacuucagc 1320
auggaagaaa gcaugaucca ccucccgaac aaagcgugcu uccucauggc gcacaacggg 1380
ugggugaugg gggacgaccc gcucaggaac uucgcggaac cggggagcga aguguaccuc 1440
aggagggaac ucaucugcug gggggacagc gugaaacuca gguacgggaa caaaccggaa 1500
gacugcccgu accucugggc gcacaugaaa aaauacacgg aaaucacggc gacguacuuc 1560
caagggguga ggcucgacaa cugccacagc acgccgcucc acguggcgga auacaugcuc 1620
gacgcggcga ggaaccucca accgaaccuc uacguggugg cggaacucuu cacggggagc 1680
gaagaccucg acaacguguu cgugacgagg cucgggauca gcagccucau cagggaagcg 1740
augagcgcgu acaacagcca cgaagaaggg aggcucgugu acagguacgg gggggaaccg 1800
guggggagcu ucgugcaacc gugccucagg ccgcucaugc cggcgaucgc gcacgcgcug 1860
uucauggaca ucacgcacga caacgaaugc ccgaucgugc acaggagcgc guacgacgcg 1920
cucccgagca cgacgaucgu gagcauggcg ugcugcgcga gcgggagcac gaggggguac 1980
gacgaacucg ugccgcacca aaucagcgug gugagcgaag aaagguucua cacgaaaugg 2040
aacccggaag cgcucccgag caacacgggg gaagugaacu uccaaagcgg gaucaucgcg 2100
gcgaggugcg cgaucagcaa acuccaccaa gaacucgggg cgaaaggguu cauccaagug 2160
uacguggacc aaguggacga agacaucgug gcggugacga ggcacagccc gagcauccac 2220
caaagcgugg uggcggugag caggacggcg uucaggaacc cgaaaacgag cuucuacagc 2280
aaagaagugc cgcaaaugug caucccgggg aaaaucgaag aaguggugcu cgaagcgagg 2340
acgaucgaaa ggaacacgaa accguacagg aaagacgaaa acagcaucaa cgggacgccg 2400
gacaucacgg uggaaaucag ggaacacauc caacucaacg aaagcaaaau cgugaaacaa 2460
gcgggggugg cgacgaaagg gccgaacgaa uacauccaag aaaucgaauu cgaaaaccuc 2520
agcccgggga gcgugaucau cuucagggug agccucgacc cgcacgcgca aguggcggug 2580
gggauccuca ggaaccaccu cacgcaauuc agcccgcacu ucaaaagcgg gagccucgcg 2640
guggacaacg cggacccgau ccucaaaauc ccguucgcga gccucgcgag caggcucacg 2700
cucgcggaac ucaaccaaau ccucuacagg ugcgaaagcg aagaaaaaga agacgggggg 2760
gggugcuacg acaucccgaa cuggagcgcg cucaaauacg cggggcucca agggcucaug 2820
agcgugcucg cggaaaucag gccgaaaaac gaccucgggc acccguucug caacaaccuc 2880
aggagcgggg acuggaugau cgacuacgug agcaacaggc ucaucagcag gagcgggacg 2940
aucgcggaag uggggaaaug gcuccaagcg auguucuucu accucaaaca aaucccgagg 3000
uaccucaucc cgugcuacuu cgacgcgauc cucaucgggg cguacacgac gcuccucgac 3060
acggcgugga aacaaaugag cagcuucgug caaaacggga gcacguucgu gaaacaccuc 3120
agccucggga gcgugcaacu cugcggggug gggaaauucc cgagccuccc gauccucagc 3180
ccggcgcuca uggacgugcc guacaggcuc aacgaaauca cgaaagaaaa agaacaaugc 3240
ugcgugagcc ucgcggcggg gcucccgcac uucagcagcg ggaucuucag gugcuggggg 3300
agggacacgu ucaucgcgcu cagggggauc cuccucauca cggggaggua cguggaagcg 3360
aggaacauca uccucgcguu cgcggggacg cucaggcacg ggcucauccc gaaccuccuc 3420
ggggaaggga ucuacgcgag guacaacugc agggacgcgg ugugguggug gcuccaaugc 3480
auccaagacu acugcaaaau ggugccgaac gggcucgaca uccucaaaug cccggugagc 3540
aggauguacc cgacggacga cagcgcgccg cucccggcgg ggacgcucga ccaaccgcug 3600
uucgaaguga uccaagaagc gaugcaaaaa cacaugcaag ggauccaauu cagggaaagg 3660
aacgcggggc cgcaaaucga caggaacaug aaagacgaag gguucaacau cacggcgggg 3720
guggacgaag aaacgggguu cguguacggg gggaacaggu ucaacugcgg gacguggaug 3780
gacaaaaugg gggaaagcga cagggcgagg aacaggggga ucccggcgac gccgagggac 3840
gggagcgcgg uggaaaucgu ggggcucagc aaaagcgcgg ugagguggcu ccucgaacuc 3900
agcaaaaaaa acaucuuccc guaccacgaa gugacgguga aaaggcacgg gaaagcgauc 3960
aaagugagcu acgacgaaug gaacaggaaa auccaagaca acuucgaaaa acucuuccac 4020
gugagcgaag acccgagcga ccucaacgaa aaacacccga accucgugca caaaaggggg 4080
aucuacaaag acagcuacgg ggcgagcagc ccguggugcg acuaccaacu caggccgaac 4140
uucacgaucg cgaugguggu ggcgccggaa cucuucacga cggaaaaagc guggaaagcg 4200
cucgaaaucg cggaaaaaaa acuccucggg ccgcucggga ugaaaacgcu cgacccggac 4260
gacauggugu acugcgggau cuacgacaac gcgcucgaca acgacaacua caaccucgcg 4320
aaaggguuca acuaccacca agggccggaa uggcucuggc cgaucgggua cuuccucagg 4380
gcgaaacucu acuucagcag gcucaugggg ccggaaacga cggcgaaaac gaucgugcuc 4440
gugaaaaacg ugcucagcag gcacuacgug caccucgaaa ggagcccgug gaaagggcuc 4500
ccggaacuca cgaacgaaaa cgcgcaauac ugcccguuca gcugcgaaac gcaagcgugg 4560
agcaucgcga cgauccucga aacgcucuac gaccucuga 4599
<210> 44
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 44
augggccaca gcaagcagau caggauccuc cuccucaacg aaauggaaaa gcucgaaaag 60
acacucuuca ggcucgaaca gggcuacgaa cuccaguuca ggcucggccc aacacuccag 120
ggcaaggccg ugacagugua cacaaacuac ccauucccag gcgaaacauu caacagggaa 180
aaguucagga gccucgacug ggaaaaccca acagaaaggg aagacgacag cgacaaguac 240
ugcaagcuca accuccagca gagcggcagc uuccaguacu acuuccucca gggcaacgaa 300
aagagcggcg gcggcuacau cgugguggac ccaauccuca gggugggcgc cgacaaccac 360
gugcucccac ucgacugcgu gacacuccag acauuccucg ccaagugccu cggcccauuc 420
gacgaauggg aaagcaggcu caggguggcc aaggaaagcg gcuacaacau gauccacuuc 480
acaccacucc agacacucgg ccucagcagg agcugcuaca gccucgccaa ccagcucgaa 540
cucaacccag acuucagcag gccaaacagg aaguacacau ggaacgacgu gggccagcuc 600
guggaaaagc ucaagaagga auggaacgug aucugcauca cagacguggu guacaaccac 660
acagccgcca acagcaagug gauccaggaa cacccagaau gcgccuacaa ccucgugaac 720
agcccacacc ucaagccagc cugggugcuc gacagggccc ucuggagguu cagcugcgac 780
guggccgaag gcaaguacaa ggaaaagggc aucccagccc ucaucgaaaa cgaccaccac 840
augaacagca ucaggaagau caucugggaa gacaucuucc caaagcucaa gcucugggaa 900
uucuuccagg uggacgugaa caaggccgug gaacaguuca ggaggcuccu cacacaggaa 960
aacaggaggg ugacaaagag cgacccaaac cagcaccuca caaucaucca ggacccagaa 1020
uacaggaggu ucggcugcac aguggacaug aacaucgccc ucacaacauu caucccacac 1080
gacaagggcc cagccgccau cgaagaaugc ugcaacuggu uccacaagag gauggaagaa 1140
cucaacagcg aaaagcacag gcucaucaac uaccaccagg aacaggccgu gaacugccuc 1200
cucggcaacg uguucuacga aaggcucgcc ggccacggcc caaagcucgg cccagugaca 1260
aggaagcacc cacucgugac aagguacuuc acauucccau ucgaagaaau cgacuucagc 1320
auggaagaaa gcaugaucca ccucccaaac aaggccugcu uccucauggc ccacaacggc 1380
ugggugaugg gcgacgaccc acucaggaac uucgccgaac caggcagcga aguguaccuc 1440
aggagggaac ucaucugcug gggcgacagc gugaagcuca gguacggcaa caagccagaa 1500
gacugcccau accucugggc ccacaugaag aaguacacag aaaucacagc cacauacuuc 1560
cagggcguga ggcucgacaa cugccacagc acaccacucc acguggccga auacaugcuc 1620
gacgccgcca ggaaccucca gccaaaccuc uacguggugg ccgaacucuu cacaggcagc 1680
gaagaccucg acaacguguu cgugacaagg cucggcauca gcagccucau cagggaagcc 1740
augagcgccu acaacagcca cgaagaaggc aggcucgugu acagguacgg cggcgaacca 1800
gugggcagcu ucgugcagcc augccucagg ccacucaugc cagccaucgc ccacgcccuc 1860
uucauggaca ucacacacga caacgaaugc ccaaucgugc acaggagcgc cuacgacgcc 1920
cucccaagca caacaaucgu gagcauggcc ugcugcgcca gcggcagcac aaggggcuac 1980
gacgaacucg ugccacacca gaucagcgug gugagcgaag aaagguucua cacaaagugg 2040
aacccagaag cccucccaag caacacaggc gaagugaacu uccagagcgg caucaucgcc 2100
gccaggugcg ccaucagcaa gcuccaccag gaacucggcg ccaagggcuu cauccaggug 2160
uacguggacc agguggacga agacaucgug gccgugacaa ggcacagccc aagcauccac 2220
cagagcgugg uggccgugag caggacagcc uucaggaacc caaagacaag cuucuacagc 2280
aaggaagugc cacagaugug caucccaggc aagaucgaag aaguggugcu cgaagccagg 2340
acaaucgaaa ggaacacaaa gccauacagg aaggacgaaa acagcaucaa cggcacacca 2400
gacaucacag uggaaaucag ggaacacauc cagcucaacg aaagcaagau cgugaagcag 2460
gccggcgugg ccacaaaggg cccaaacgaa uacauccagg aaaucgaauu cgaaaaccuc 2520
agcccaggca gcgugaucau cuucagggug agccucgacc cacacgccca gguggccgug 2580
ggcauccuca ggaaccaccu cacacaguuc agcccacacu ucaagagcgg cagccucgcc 2640
guggacaacg ccgacccaau ccucaagauc ccauucgcca gccucgccag caggcucaca 2700
cucgccgaac ucaaccagau ccucuacagg ugcgaaagcg aagaaaagga agacggcggc 2760
ggcugcuacg acaucccaaa cuggagcgcc cucaaguacg ccggccucca gggccucaug 2820
agcgugcucg ccgaaaucag gccaaagaac gaccucggcc acccauucug caacaaccuc 2880
aggagcggcg acuggaugau cgacuacgug agcaacaggc ucaucagcag gagcggcaca 2940
aucgccgaag ugggcaagug gcuccaggcc auguucuucu accucaagca gaucccaagg 3000
uaccucaucc caugcuacuu cgacgccauc cucaucggcg ccuacacaac acuccucgac 3060
acagccugga agcagaugag cagcuucgug cagaacggca gcacauucgu gaagcaccuc 3120
agccucggca gcgugcagcu cugcggcgug ggcaaguucc caagccuccc aauccucagc 3180
ccagcccuca uggacgugcc auacaggcuc aacgaaauca caaaggaaaa ggaacagugc 3240
ugcgugagcc ucgccgccgg ccucccacac uucagcagcg gcaucuucag gugcuggggc 3300
agggacacau ucaucgcccu caggggcauc cuccucauca caggcaggua cguggaagcc 3360
aggaacauca uccucgccuu cgccggcaca cucaggcacg gccucauccc aaaccuccuc 3420
ggcgaaggca ucuacgccag guacaacugc agggacgccg ugugguggug gcuccagugc 3480
auccaggacu acugcaagau ggugccaaac ggccucgaca uccucaagug cccagugagc 3540
aggauguacc caacagacga cagcgcccca cucccagccg gcacacucga ccagccacuc 3600
uucgaaguga uccaggaagc caugcagaag cacaugcagg gcauccaguu cagggaaagg 3660
aacgccggcc cacagaucga caggaacaug aaggacgaag gcuucaacau cacagccggc 3720
guggacgaag aaacaggcuu cguguacggc ggcaacaggu ucaacugcgg cacauggaug 3780
gacaagaugg gcgaaagcga cagggccagg aacaggggca ucccagccac accaagggac 3840
ggcagcgccg uggaaaucgu gggccucagc aagagcgccg ugagguggcu ccucgaacuc 3900
agcaagaaga acaucuuccc auaccacgaa gugacaguga agaggcacgg caaggccauc 3960
aaggugagcu acgacgaaug gaacaggaag auccaggaca acuucgaaaa gcuguuccac 4020
gugagcgaag acccaagcga ccucaacgaa aagcacccaa accucgugca caagaggggc 4080
aucuacaagg acagcuacgg cgccagcagc ccauggugcg acuaccagcu caggccaaac 4140
uucacaaucg ccaugguggu ggccccagaa cucuucacaa cagaaaaggc cuggaaggcc 4200
cucgaaaucg ccgaaaagaa gcuccucggc ccacucggca ugaagacacu cgacccagac 4260
gacauggugu acugcggcau cuacgacaac gcccucgaca acgacaacua caaccucgcc 4320
aagggcuuca acuaccacca gggcccagaa uggcucuggc caaucggcua cuuccucagg 4380
gccaagcucu acuucagcag gcucaugggc ccagaaacaa cagccaagac aaucgugcuc 4440
gugaagaacg ugcucagcag gcacuacgug caccucgaaa ggagcccaug gaagggccuc 4500
ccagaacuca caaacgaaaa cgcccaguac ugcccauuca gcugcgaaac acaggccugg 4560
agcaucgcca caauccucga aacacucuac gaccucuga 4599
<210> 45
<211> 4599
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon-Optimized AGL Coding Sequence
<400> 45
augggccaca gcaagcagau ccggaucuug cugcugaacg agauggagaa gcuggagaag 60
acccuguuca ggcuggagca gggcuacgag cugcaguucc gguugggccc caccuugcag 120
ggcaaggccg ugaccgugua caccaacuac cccuuccccg gcgagacguu caacagggag 180
aaguuccggu cccuggacug ggagaacccc accgagaggg aggacgacuc cgacaaguac 240
ugcaagcuga accugcagca guccggcucc uuccaguacu acuuccugca gggcaacgag 300
aagaguggcg gcggcuacau cgugguggac cccaucuugc gggugggcgc cgacaaccac 360
gugcugcccu uggacugcgu gacccugcag accuucuugg ccaagugcuu gggccccuuc 420
gacgaguggg agagcaggcu gaggguggcc aaggaguccg gcuacaacau gauccacuuc 480
acccccuugc agacccuggg ccuguccagg uccugcuacu cccuggccaa ccaguuggag 540
uugaaccccg acuucuccag gcccaacagg aaguacaccu ggaacgacgu gggccagcug 600
guggagaagu ugaagaagga guggaacgug aucugcauca ccgacguggu guacaaccac 660
accgccgcca acagcaagug gauccaggag caccccgagu gcgccuacaa ccuggugaac 720
uccccccacu ugaagcccgc cuggguguug gacagggccc uguggcgguu cuccugcgac 780
guggccgagg gcaaguacaa ggagaagggc auccccgccu ugaucgagaa cgaccaccac 840
augaacucca uccggaagau caucugggag gacaucuucc ccaagcugaa gcugugggag 900
uucuuccagg uggacgugaa caaggccgug gagcaguuca ggaggcugcu gacccaggag 960
aacaggcggg ugaccaaguc cgaccccaac cagcaccuga ccaucaucca ggaccccgag 1020
uacaggcggu ucggcugcac cguggacaug aacaucgccc ugaccaccuu caucccccac 1080
gacaagggcc ccgccgccau cgaggagugc ugcaacuggu uccacaagag gauggaggag 1140
uugaacuccg agaagcaccg gcugaucaac uaccaccagg agcaggccgu gaacugccug 1200
uugggcaacg uguucuacga gcggcuggcc ggccacggcc ccaagcuggg ccccgugacc 1260
aggaagcacc ccuuggugac cagguacuuc accuuccccu ucgaggagau cgacuucucc 1320
auggaggagu ccaugaucca ccugcccaac aaggccugcu uccugauggc ccacaacggc 1380
ugggugaugg gcgacgaccc ccugcggaac uucgccgagc ccggcuccga gguguaccug 1440
aggagggagc ugaucugcug gggcgacagc gugaaguugc gguacggcaa caagcccgag 1500
gacugccccu accugugggc ccacaugaag aaguacaccg agaucaccgc caccuacuuc 1560
cagggcgugc ggcuggacaa cugccacucc accccccugc acguggccga guacauguug 1620
gacgccgcca ggaacuugca gcccaacuug uacguggugg ccgagcuguu caccggcagc 1680
gaggaccugg acaacguguu cgugaccagg cugggcauca gcuccuugau cagggaggcc 1740
augagcgccu acaacagcca cgaggagggc agguuggugu accgguacgg cggcgagccc 1800
gugggcuccu ucgugcagcc cugcuugagg cccuugaugc ccgccaucgc ccacgcccug 1860
uucauggaca ucacccacga caacgagugc cccaucgugc acagguccgc cuacgacgcc 1920
cugcccagca ccaccaucgu guccauggcc ugcugcgcca gcggcagcac caggggcuac 1980
gacgaguugg ugccccacca gaucuccgug guguccgagg agcgguucua caccaagugg 2040
aaccccgagg ccuugcccuc caacaccggc gaggugaacu uccagagcgg caucaucgcc 2100
gccaggugcg ccaucagcaa gcugcaccag gagcugggcg ccaagggcuu cauccaggug 2160
uacguggacc agguggacga ggacaucgug gccgugacca ggcacucccc cagcauccac 2220
caguccgugg uggccguguc caggaccgcc uucaggaacc ccaagaccuc cuucuacagc 2280
aaggaggugc cccagaugug cauccccggc aagaucgagg agguggugcu ggaggccagg 2340
accaucgaga ggaacaccaa gcccuacagg aaggacgaga acuccaucaa cggcaccccc 2400
gacaucaccg uggagaucag ggagcacauc cagcugaacg agagcaagau cgugaagcag 2460
gccggcgugg ccaccaaggg ccccaacgag uacauccagg agaucgaguu cgagaacuug 2520
ucccccggca gcgugaucau cuucagggug agccuggacc cccacgccca gguggccgug 2580
ggcauccugc ggaaccaccu gacccaguuc agcccccacu ucaaguccgg cagccuggcc 2640
guggacaacg ccgaccccau cuugaagauc cccuucgccu cccuggccuc cagguugacc 2700
uuggccgagc ugaaccagau ccuguaccgg ugcgaguccg aggagaagga ggacggcggc 2760
ggcugcuacg acauccccaa cugguccgcc cugaaguacg ccggccugca gggcuugaug 2820
uccguguugg ccgagaucag gcccaagaac gacuugggcc accccuucug caacaacuug 2880
agguccggcg acuggaugau cgacuacgug agcaaccggc ugaucucccg guccggcacc 2940
aucgccgagg ugggcaagug guugcaggcc auguucuucu accugaagca gaucccccgg 3000
uaccugaucc ccugcuacuu cgacgccauc uugaucggcg ccuacaccac ccugcuggac 3060
accgccugga agcagauguc cagcuucgug cagaacggcu ccaccuucgu gaagcaccug 3120
uccuugggcu ccgugcagcu gugcggcgug ggcaaguucc ccucccugcc cauccugucc 3180
cccgcccuga uggacgugcc cuacagguug aacgagauca ccaaggagaa ggagcagugc 3240
ugcguguccc uggccgccgg cuugccccac uucuccuccg gcaucuuccg gugcuggggc 3300
agggacaccu ucaucgcccu gaggggcauc cugcugauca ccggccggua cguggaggcc 3360
aggaacauca ucuuggccuu cgccggcacc cugaggcacg gccugauccc caaccugcug 3420
ggcgagggca ucuacgccag guacaacugc cgggacgccg ugugguggug gcugcagugc 3480
auccaggacu acugcaagau ggugcccaac ggccuggaca uccugaagug ccccgugucc 3540
aggauguacc ccaccgacga cuccgccccc uugcccgccg gcacccugga ccagcccuug 3600
uucgagguga uccaggaggc caugcagaag cacaugcagg gcauccaguu ccgggagagg 3660
aacgccggcc cccagaucga ccggaacaug aaggacgagg gcuucaacau caccgccggc 3720
guggacgagg agacuggcuu cguguacggc ggcaaccggu ucaacugcgg caccuggaug 3780
gacaagaugg gcgagagcga cagggccagg aacaggggca uccccgccac ccccagggac 3840
ggcuccgccg uggagaucgu gggccugagc aaguccgccg ugcggugguu gcuggaguug 3900
uccaagaaga acaucuuccc cuaccacgag gugaccguga agaggcacgg caaggccauc 3960
aagguguccu acgacgagug gaacaggaag auccaggaca acuucgagaa gcuguuccac 4020
guguccgagg accccuccga cuugaacgag aagcacccca accuggugca caagcggggc 4080
aucuacaagg acagcuacgg cgccuccagc cccuggugcg acuaccagcu gaggcccaac 4140
uucaccaucg ccaugguggu ggcccccgag cuguucacca ccgagaaggc cuggaaggcc 4200
uuggagaucg ccgagaagaa guugcugggc ccccugggca ugaagaccuu ggaccccgac 4260
gacauggugu acugcggcau cuacgacaac gccuuggaca acgacaacua caaccuggcc 4320
aagggcuuca acuaccacca gggccccgag uggcuguggc ccaucggcua cuuccugcgg 4380
gccaaguugu acuucuccag guugaugggc cccgagacga ccgccaagac caucguguug 4440
gugaagaacg ugcugucccg gcacuacgug caccuggaga ggucccccug gaagggccug 4500
cccgagcuga ccaacgagaa cgcccaguac ugccccuuca gcugcgagac gcaggccugg 4560
uccaucgcca ccauccugga gacgcuguac gacuuguag 4599
Claims (65)
- 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 폴리뉴클레오타이드로서,
상기 폴리뉴클레오타이드는 천연 및 화학적으로-변형된 뉴클레오타이드를 포함하고, AGL 활성을 갖는 인간 AGL 또는 이의 단편을 제공하도록 발현가능한 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드는 인간 AGL 야생형 mRNA와 비교하여 코돈-최적화된 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는
5-하이드록시시티딘, 5-메틸시티딘, 5-하이드록시메틸시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-메톡시시티딘, 5-프로피닐시티딘, 2-티오시티딘;
5-하이드록시우리딘, 5-메틸우리딘, 5,6-디하이드로-5-메틸우리딘, 2'-O-메틸우리딘, 2'-O-메틸-5-메틸우리딘, 2'-플루오로-2'-데옥시우리딘, 2'-아미노-2'-데옥시우리딘, 2'-아지도-2'-데옥시우리딘, 4-티오우리딘, 5-하이드록시메틸우리딘, 5-카복시우리딘, 5-카복시메틸에스테르우리딘, 5-포르밀우리딘, 5-메톡시우리딘, 5-프로피닐우리딘, 5-브로모우리딘, 5-아이오도우리딘, 5-플루오로우리딘;
슈도우리딘, 2'-O-메틸-슈도우리딘, N1-하이드록시슈도우리딘, N1-메틸슈도우리딘, 2'-O-메틸-N1-메틸슈도우리딘, N1-에틸슈도우리딘, N1-하이드록시메틸슈도우리딘, 및 아라우리딘;
N6-메틸아데노신, 2-아미노아데노신, 3-메틸아데노신, 7-데아자아데노신, 8-옥소아데노신, 이노신;
티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 및 6-O-메틸구아닌;으로부터 선택되는 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 N1-메틸슈도우리딘인 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메톡시우리딘인 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 슈도우리딘 및 N1-메틸슈도우리딘의 조합인 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메틸시티딘 및 N1-메틸슈도우리딘의 조합인 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메톡시우리딘 및 N1-메틸슈도우리딘의 조합인 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 5-메톡시우리딘, 5-메틸시티딘 및 N1-메틸슈도우리딘의 조합인 폴리뉴클레오타이드. - 청구항 1 내지 청구항 9 중 어느 한 항에 있어서,
상기 폴리뉴클레오타이드의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 50% 증가된 것인 폴리뉴클레오타이드. - 청구항 1 내지 청구항 10 중 어느 한 항에 있어서,
상기 폴리뉴클레오타이드의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 3-배 증가된 것인 폴리뉴클레오타이드. - 청구항 1 내지 청구항 11 중 어느 한 항에 있어서,
상기 폴리뉴클레오타이드는 200 내지 12,000 뉴클레오타이드를 포함하는 폴리뉴클레오타이드. - 청구항 1 내지 청구항 12 중 어느 한 항에 있어서,
화학적으로-변형된 뉴클레오타이드는 1-99%의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드. - 청구항 1 내지 청구항 13 중 어느 한 항에 있어서,
화학적으로-변형된 뉴클레오타이드는 50-99%의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드는 5' cap, 5' 미번역된 영역, 코딩 영역, 3' 미번역된 영역, 및 꼬리 영역을 포함하는 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드는 번역 향상제를 포함하는 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 발현하도록 포유동물 세포에서 번역가능한 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드는 AGL 활성을 갖는 인간 AGL 또는 이의 단편을 발현하도록 대상체의 생체내에서 번역가능한 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드의 번역 생성물은 AGL 활성을 갖는 활성 인간 AGL 또는 이의 단편인 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드는 인간 AGL 야생형 mRNA와 비교하여 감소된 면역원성을 갖는 폴리뉴클레오타이드. - 청구항 1에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열을 포함하는 폴리뉴클레오타이드. - 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL), 또는 이의 단편을 발현하는 번역가능한 올리고머로서,
상기 올리고머는 천연 및 화학적으로-변형된 뉴클레오타이드, 하나 이상의 UNA 단량체를 포함하고, AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL) 또는 이의 단편을 제공하도록 발현가능한 올리고머. - 청구항 22에 있어서,
상기 올리고머는 인간 AGL 야생형 mRNA와 비교하여 코돈 최적화된 올리고머. - 청구항 22에 있어서,
상기 올리고머의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 50% 증가된 올리고머. - 청구항 22에 있어서,
상기 올리고머의 번역 효율은 인간 AGL 야생형 mRNA와 비교하여 적어도 3-배 증가된 올리고머. - 청구항 22에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는
5-하이드록시시티딘, 5-메틸시티딘, 5-하이드록시메틸시티딘, 5-카복시시티딘, 5-포르밀시티딘, 5-메톡시시티딘, 5-프로피닐시티딘, 2-티오시티딘;
5-하이드록시우리딘, 5-메틸우리딘, 5-하이드록시메틸우리딘, 5-카복시우리딘, 5-카복시메틸에스테르우리딘, 5-포르밀우리딘, 5-메톡시우리딘, 5-프로피닐우리딘, 5-브로모우리딘, 5-플루오로우리딘, 5-아이오도우리딘, 5,6-디하이드로-5-메틸우리딘, 2'-O-메틸우리딘, 2'-O-메틸-5-메틸우리딘, 2'-플루오로-2'-데옥시우리딘, 2'-아미노-2'-데옥시우리딘, 2'-아지도-2'-데옥시우리딘;
슈도우리딘, 2'-O-메틸-슈도우리딘, N1-하이드록시슈도우리딘, N1-메틸슈도우리딘, N1-하이드록시메틸슈도우리딘, 2'-O-메틸-N1-메틸슈도우리딘, N1-에틸슈도우리딘, 아라우리딘;
N6-메틸아데노신, 2-아미노아데노신, 3-메틸아데노신, 7-데아자아데노신, 8-옥소아데노신, 이노신;
티에노구아노신, 7-데아자구아노신, 8-옥소구아노신, 및 6-O-메틸구아닌;으로부터 선택되는 올리고머. - 청구항 22 내지 청구항 26 중 어느 한 항에 있어서,
상기 화학적으로-변형된 뉴클레오타이드는 1-99%의 뉴클레오타이드를 포함하는 올리고머. - 청구항 22 내지 청구항 27 중 어느 한 항에 있어서,
상기 올리고머는 5' cap, 5' 미번역된 영역, 코딩 영역, 3' 미번역된 영역, 및 꼬리 영역을 포함하는 올리고머. - 청구항 22에 있어서,
상기 올리고머는 번역 향상제를 포함하는 올리고머. - 청구항 22에 있어서,
상기 올리고머는 AGL 활성을 갖는 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL) 또는 이의 단편을 발현하도록 포유동물 세포에서 번역가능한 올리고머. - 청구항 22에 있어서,
상기 올리고머의 번역 생성물은 AGL 활성을 갖는 활성 인간 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 또는 이의 단편인 올리고머. - 청구항 22에 있어서,
상기 올리고머는 인간 AGL 야생형 mRNA와 비교하여 감소된 면역원성을 갖는 올리고머. - 청구항 22 내지 청구항 32 중 어느 한 항에 있어서,
상기 올리고머는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열을 포함하는 올리고머. - 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열과 적어도 90% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 청구항 34에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열과 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드. - 청구항 34에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기 서열과 적어도 99% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드. - 청구항 34에 있어서,
상기 폴리뉴클레오타이드는 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 핵염기를 포함하는 폴리뉴클레오타이드. - 청구항 1 내지 청구항 21 또는 청구항 34 내지 청구항 37 중 어느 한 항의 하나 이상의 폴리뉴클레오타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
- 청구항 22 내지 청구항 33 중 어느 한 항의 하나 이상의 올리고머 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
- 청구항 1 내지 청구항 21 또는 청구항 34 내지 청구항 37 중 어느 한 항의 하나 이상의 폴리뉴클레오타이드, 청구항 22 내지 청구항 33 중 어느 한 항의 하나 이상의 올리고머 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
- 청구항 38 내지 청구항 40 중 어느 한 항에 있어서,
상기 담체는 형질감염 시약, 나노입자, 또는 리포좀을 포함하는 조성물. - 의료 요법에 사용하기 위한 청구항 38 내지 청구항 40 중 어느 한 항의 조성물.
- 인간 또는 동물 신체의 치료에 사용하기 위한 청구항 38 내지 청구항 40 중 어느 한 항의 조성물.
- 이를 필요로 하는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성과 연관된 질환 또는 장애를 개선하거나, 예방하거나, 발병을 지연시키거나, 또는 치료하기 위한 약제를 제조 또는 생산하기 위한 청구항 38 내지 청구항 40 중 어느 한 항의 조성물의 용도.
- 청구항 44에 있어서,
상기 질환은 글리코겐 축적 질환 유형 III인 용도. - 청구항 45에 있어서,
상기 글리코겐 축적 질환 유형 III은 글리코겐 축적 질환 유형 IIIa, 글리코겐 축적 질환 유형 IIIb, 글리코겐 축적 질환 유형 IIIc, 및 글리코겐 축적 질환 유형 IIId로부터 선택되는 용도. - 대상체에게 청구항 38 내지 청구항 40 중 어느 한 항의 조성물을 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노전달효소 (AGL)의 감소된 활성과 연관된 질환 또는 장애를 개선하거나, 예방하거나, 발병을 지연시키거나, 또는 치료하기 위한 방법.
- 청구항 47에 있어서,
상기 질환은 글리코겐 축적 질환 유형 III인 방법. - 청구항 48에 있어서,
상기 글리코겐 축적 질환 유형 III은 글리코겐 축적 질환 유형 IIIa, 글리코겐 축적 질환 유형 IIIb, 글리코겐 축적 질환 유형 IIIc, 및 글리코겐 축적 질환 유형 IIId로부터 선택되는 방법. - 청구항 47 내지 청구항 49 중 어느 한 항에 있어서,
상기 투여는 정맥내, 피하, 폐, 근육내, 복강내, 진피, 경구, 비강, 또는 흡입인 방법. - 청구항 47 내지 청구항 50 중 어느 한 항에 있어서,
상기 투여는 매일 1회, 매주, 격주로, 또는 매월인 방법. - 청구항 47 내지 청구항 51 중 어느 한 항에 있어서,
상기 투여는 0.01 내지 10 mg/kg의 유효 용량을 포함하는 방법. - 청구항 47 내지 청구항 52 중 어느 한 항에 있어서,
상기 투여는 상기 대상체의 간, 혈청, 혈장, 신장, 심장, 근육, 뇌, 뇌척수액, 또는 림프절에서 AGL의 발현을 증가시키는 방법. - 청구항 47에 있어서,
투여 후 상기 대상체의 간에서 AGL의 수준은 10 내지 1500 ng/mg의 총 간 단백질인 방법. - 청구항 47에 있어서,
투여 후 상기 대상체의 간에서 AGL의 수준은 20 내지 150 ng/mg의 총 간 단백질인 방법. - 0.1 내지 500 mg 용량의 청구항 1 내지 청구항 21 또는 청구항 34 내지 청구항 37 중 어느 한 항의 하나 이상의 폴리뉴클레오타이드, 또는 청구항 22 내지 청구항 33 중 어느 한 항의 하나 이상의 올리고머와, 상기 용량을 투여하기 위한 장치를 포함하는, 생체내에서 인간 AGL을 발현하기 위한 키트.
- 청구항 56에 있어서,
상기 장치는 주사 바늘, 정맥내 바늘, 또는 흡입기인 키트. - 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 서열에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 7-32 또는 서열번호 41-45로부터 선택되는 서열에 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과로 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 19에 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 31에 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 서열번호 1의 전장 인간 AGL 코딩 서열에 걸쳐서 야생형 인간 AGL 코딩 서열과 80% 미만이 동일하고, 상기 인간 AGL 코딩 서열은 서열번호 45에 적어도 95% 동일한 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 서열번호 19의 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 서열번호 31의 핵염기 서열을 포함하는 폴리뉴클레오타이드.
- 서열번호 45의 핵염기 서열을 포함하는 폴리뉴클레오타이드.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762513350P | 2017-05-31 | 2017-05-31 | |
US62/513,350 | 2017-05-31 | ||
PCT/US2018/035477 WO2018222926A1 (en) | 2017-05-31 | 2018-05-31 | Therapeutics for glycogen storage disease type iii |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200014319A true KR20200014319A (ko) | 2020-02-10 |
KR102636537B1 KR102636537B1 (ko) | 2024-02-15 |
Family
ID=64456114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197036416A KR102636537B1 (ko) | 2017-05-31 | 2018-05-31 | 글리코겐 축적 질환 유형 iii에 대한 치료제 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11377643B2 (ko) |
EP (1) | EP3630964A4 (ko) |
JP (2) | JP7284101B2 (ko) |
KR (1) | KR102636537B1 (ko) |
CN (1) | CN110719954B (ko) |
AR (1) | AR112706A1 (ko) |
AU (1) | AU2018278315B2 (ko) |
BR (1) | BR112019025224A2 (ko) |
CA (1) | CA3063907A1 (ko) |
CO (1) | CO2019013332A2 (ko) |
MX (1) | MX2019014412A (ko) |
TW (1) | TWI794237B (ko) |
WO (1) | WO2018222926A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104114572A (zh) | 2011-12-16 | 2014-10-22 | 现代治疗公司 | 经修饰的核苷、核苷酸和核酸组合物 |
ES2960692T3 (es) | 2018-12-06 | 2024-03-06 | Arcturus Therapeutics Inc | Composiciones y métodos para el tratamiento de la deficiencia de ornitina transcarbamilasa |
CN110314407A (zh) * | 2019-08-01 | 2019-10-11 | 山东新希望六和集团有限公司 | 一种脂肪快速提取装置 |
US20220347298A1 (en) | 2019-10-04 | 2022-11-03 | Ultragenyx Pharmaceutical Inc. | Methods for improved therapeutic use of recombinant aav |
IT202000003371A1 (it) * | 2020-02-19 | 2021-08-19 | Enea Agenzia Naz Per Le Nuove Tecnologie Lenergia E Lo Sviluppo Economico Sostenibile | Composto per il trattamento di una glicogenosi |
JP2023517644A (ja) * | 2020-03-09 | 2023-04-26 | アークトゥラス・セラピューティクス・インコーポレイテッド | コロナウイルスワクチン組成物及び方法 |
EP4189098A1 (en) | 2020-07-27 | 2023-06-07 | Anjarium Biosciences AG | Compositions of dna molecules, methods of making therefor, and methods of use thereof |
KR20240012370A (ko) * | 2021-04-20 | 2024-01-29 | 안자리움 바이오사이언시스 아게 | 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노트랜스퍼라제를 인코딩하는 dna 분자의 조성물, 이를 제조하는 방법 및 이를 사용하는 방법 |
WO2023131254A1 (zh) * | 2022-01-06 | 2023-07-13 | 上海吉量医药工程有限公司 | N1位修饰假尿嘧啶核苷及其在mRNA合成中的应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140044356A (ko) * | 2011-06-08 | 2014-04-14 | 샤이어 휴먼 지네틱 테라피즈 인크. | Mrna 전달을 위한 지질 나노입자 조성물 및 방법 |
US20160130567A1 (en) * | 2014-11-02 | 2016-05-12 | Arcturus Therapeutics, Inc. | Messenger una molecules and uses thereof |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE50214200D1 (de) | 2001-06-05 | 2010-03-25 | Curevac Gmbh | Stabilisierte Tumorantigen-mRNA mit erhöhtem G/C-Gehalt |
US20050202559A1 (en) | 2002-10-29 | 2005-09-15 | Scott Pownall | Cancer treatment by metabolic modulations |
ES2735531T3 (es) | 2005-08-23 | 2019-12-19 | Univ Pennsylvania | ARN que contiene nucleósidos modificados y métodos de uso del mismo |
CA2659301A1 (en) | 2006-07-28 | 2008-02-07 | Applera Corporation | Dinucleotide mrna cap analogs |
WO2009058911A2 (en) | 2007-10-31 | 2009-05-07 | Applied Biosystems Inc. | Preparation and isolation of 5' capped mrna |
AU2008342535B2 (en) | 2007-12-27 | 2015-02-05 | Arbutus Biopharma Corporation | Silencing of polo-like kinase expression using interfering RNA |
CA3044134A1 (en) | 2008-01-02 | 2009-07-09 | Arbutus Biopharma Corporation | Improved compositions and methods for the delivery of nucleic acids |
CN102119217B (zh) | 2008-04-15 | 2015-06-03 | 普洛体维生物治疗公司 | 用于核酸递送的新型制剂 |
WO2010005565A2 (en) | 2008-07-08 | 2010-01-14 | Duke University | Method of treating glycogen storage disease |
WO2010037408A1 (en) | 2008-09-30 | 2010-04-08 | Curevac Gmbh | Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof |
CA2740000C (en) | 2008-10-09 | 2017-12-12 | Tekmira Pharmaceuticals Corporation | Improved amino lipids and methods for the delivery of nucleic acids |
WO2010048536A2 (en) | 2008-10-23 | 2010-04-29 | Alnylam Pharmaceuticals, Inc. | Processes for preparing lipids |
KR102344392B1 (ko) | 2008-11-10 | 2021-12-28 | 알닐람 파마슈티칼스 인코포레이티드 | 치료제 운반용 신규 지질 및 조성물 |
AU2010208035B2 (en) | 2009-01-29 | 2016-06-23 | Arbutus Biopharma Corporation | Improved lipid formulation for the delivery of nucleic acids |
NZ621981A (en) | 2009-05-05 | 2015-09-25 | Tekmira Pharmaceuticals Corp | Lipid compositions |
EA201791744A3 (ru) | 2009-06-10 | 2018-07-31 | Арбутус Биофарма Корпорэйшн | Улучшенная липидная композиция |
NZ700688A (en) | 2009-12-01 | 2016-02-26 | Shire Human Genetic Therapies | Delivery of mrna for the augmentation of proteins and enzymes in human genetic diseases |
DK2575764T3 (en) | 2010-06-03 | 2017-08-07 | Alnylam Pharmaceuticals Inc | BIODEGRADABLE LIPIDS FOR THE ACTIVATION OF ACTIVE AGENTS |
US9006417B2 (en) | 2010-06-30 | 2015-04-14 | Protiva Biotherapeutics, Inc. | Non-liposomal systems for nucleic acid delivery |
RS62993B1 (sr) | 2011-10-03 | 2022-03-31 | Modernatx Inc | Modifikovani nukleozidi, nukleotidi, i nukleinske kiseline, i njihove upotrebe |
EP4372081A2 (en) | 2011-12-30 | 2024-05-22 | Cellscript, Llc | Making and using in vitro-synthesized ssrna for introducing into mammalian cells to induce a biological or biochemical effect |
DE18200782T1 (de) | 2012-04-02 | 2021-10-21 | Modernatx, Inc. | Modifizierte polynukleotide zur herstellung von proteinen im zusammenhang mit erkrankungen beim menschen |
US9303079B2 (en) | 2012-04-02 | 2016-04-05 | Moderna Therapeutics, Inc. | Modified polynucleotides for the production of cytoplasmic and cytoskeletal proteins |
EP2931319B1 (en) | 2012-12-13 | 2019-08-21 | ModernaTX, Inc. | Modified nucleic acid molecules and uses thereof |
US20160089451A1 (en) * | 2013-02-20 | 2016-03-31 | Dustin D. Armstrong | Methods and compositions for treatment of forbes-cori disease |
WO2014164253A1 (en) | 2013-03-09 | 2014-10-09 | Moderna Therapeutics, Inc. | Heterologous untranslated regions for mrna |
ES2647832T3 (es) | 2013-03-14 | 2017-12-26 | Translate Bio, Inc. | Ácidos ribonucleicos con nucleótidos modificados con 4-tio y procedimientos relacionados |
US10385088B2 (en) | 2013-10-02 | 2019-08-20 | Modernatx, Inc. | Polynucleotide molecules and uses thereof |
CA2928186A1 (en) | 2013-10-22 | 2015-04-30 | Shire Human Genetic Therapies, Inc. | Mrna therapy for phenylketonuria |
WO2015074085A1 (en) | 2013-11-18 | 2015-05-21 | Arcturus Therapeutics, Inc. | Ionizable cationic lipid for rna delivery |
CA2989294A1 (en) | 2014-06-13 | 2015-12-17 | Valerion Therapeutics, Llc | Methods and compositions for treatment of glycogen storage diseases and glycogen metabolism disorders |
WO2016077125A1 (en) | 2014-11-10 | 2016-05-19 | Moderna Therapeutics, Inc. | Alternative nucleic acid molecules containing reduced uracil content and uses thereof |
EP3218508A4 (en) | 2014-11-10 | 2018-04-18 | Modernatx, Inc. | Multiparametric nucleic acid optimization |
US9709490B2 (en) | 2014-12-08 | 2017-07-18 | Canon Kabushiki Kaisha | Refractive index distribution measuring method, refractive index distribution measuring apparatus, and optical element manufacturing method |
WO2017054086A1 (en) | 2015-10-01 | 2017-04-06 | Exerkine Corporation | Treatment of genetic myopathies using bioengineered exosomes |
WO2017100551A1 (en) | 2015-12-09 | 2017-06-15 | Alexion Pharmaceuticals, Inc. | HETEROLOGOUS UTR SEQUENCES FOR ENHANCED mRNA EXPRESSION |
US10576167B2 (en) | 2016-08-17 | 2020-03-03 | Factor Bioscience Inc. | Nucleic acid products and methods of administration thereof |
KR20190093816A (ko) | 2016-10-26 | 2019-08-26 | 큐어백 아게 | 지질 나노입자 mRNA 백신 |
US10526284B2 (en) | 2016-12-21 | 2020-01-07 | Arcturus Therapeutics, Inc. | Ionizable cationic lipid for RNA delivery |
US10383952B2 (en) | 2016-12-21 | 2019-08-20 | Arcturus Therapeutics, Inc. | Ionizable cationic lipid for RNA delivery |
US10227302B2 (en) | 2017-02-09 | 2019-03-12 | Arcturus Therapeutics, Inc. | Ionizable cationic lipid for RNA delivery |
-
2018
- 2018-05-31 EP EP18810235.4A patent/EP3630964A4/en active Pending
- 2018-05-31 JP JP2019565348A patent/JP7284101B2/ja active Active
- 2018-05-31 TW TW107118693A patent/TWI794237B/zh active
- 2018-05-31 AR ARP180101448A patent/AR112706A1/es unknown
- 2018-05-31 MX MX2019014412A patent/MX2019014412A/es unknown
- 2018-05-31 WO PCT/US2018/035477 patent/WO2018222926A1/en unknown
- 2018-05-31 KR KR1020197036416A patent/KR102636537B1/ko active IP Right Grant
- 2018-05-31 US US16/617,431 patent/US11377643B2/en active Active
- 2018-05-31 BR BR112019025224-0A patent/BR112019025224A2/pt unknown
- 2018-05-31 CA CA3063907A patent/CA3063907A1/en active Pending
- 2018-05-31 CN CN201880036551.XA patent/CN110719954B/zh active Active
- 2018-05-31 AU AU2018278315A patent/AU2018278315B2/en active Active
-
2019
- 2019-11-27 CO CONC2019/0013332A patent/CO2019013332A2/es unknown
-
2022
- 2022-05-04 US US17/736,798 patent/US20220340886A1/en active Pending
-
2023
- 2023-03-13 JP JP2023038257A patent/JP2023075248A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140044356A (ko) * | 2011-06-08 | 2014-04-14 | 샤이어 휴먼 지네틱 테라피즈 인크. | Mrna 전달을 위한 지질 나노입자 조성물 및 방법 |
US20160130567A1 (en) * | 2014-11-02 | 2016-05-12 | Arcturus Therapeutics, Inc. | Messenger una molecules and uses thereof |
Non-Patent Citations (1)
Title |
---|
NCBI Reference Sequence: NP_000019.2(2015.11.29.)* * |
Also Published As
Publication number | Publication date |
---|---|
TWI794237B (zh) | 2023-03-01 |
AU2018278315A1 (en) | 2019-12-12 |
JP7284101B2 (ja) | 2023-05-30 |
WO2018222926A1 (en) | 2018-12-06 |
EP3630964A1 (en) | 2020-04-08 |
AU2018278315B2 (en) | 2024-01-18 |
US20220340886A1 (en) | 2022-10-27 |
CN110719954B (zh) | 2023-12-26 |
JP2020522244A (ja) | 2020-07-30 |
BR112019025224A2 (pt) | 2020-12-08 |
AR112706A1 (es) | 2019-12-04 |
EP3630964A4 (en) | 2021-03-03 |
CO2019013332A2 (es) | 2020-02-18 |
CN110719954A (zh) | 2020-01-21 |
CA3063907A1 (en) | 2018-12-06 |
KR102636537B1 (ko) | 2024-02-15 |
US20200149017A1 (en) | 2020-05-14 |
US11377643B2 (en) | 2022-07-05 |
JP2023075248A (ja) | 2023-05-30 |
MX2019014412A (es) | 2020-02-10 |
TW201903151A (zh) | 2019-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102636537B1 (ko) | 글리코겐 축적 질환 유형 iii에 대한 치료제 | |
AU2018270111B2 (en) | Polynucleotides encoding tethered interleukin-12 (IL12) polypeptides and uses thereof | |
AU2017268397B2 (en) | Polynucleotides encoding interleukin-12 (IL12) and uses thereof | |
JP2024038121A (ja) | Crispr関連タンパク質をコードする核酸、及びその使用 | |
EP3891274B1 (en) | Compositions and methods for treating ornithine transcarbamylase deficiency | |
US11939600B2 (en) | Compositions and methods for treating phenylketonuria | |
US20220220189A1 (en) | Compositions and methods for treatment of hemochromatosis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |