TW202417629A - 用於改良之多核苷酸轉譯之內部核糖體進入位點 - Google Patents
用於改良之多核苷酸轉譯之內部核糖體進入位點 Download PDFInfo
- Publication number
- TW202417629A TW202417629A TW112129616A TW112129616A TW202417629A TW 202417629 A TW202417629 A TW 202417629A TW 112129616 A TW112129616 A TW 112129616A TW 112129616 A TW112129616 A TW 112129616A TW 202417629 A TW202417629 A TW 202417629A
- Authority
- TW
- Taiwan
- Prior art keywords
- uridine
- methyl
- nucleic acid
- thio
- adenosine
- Prior art date
Links
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 199
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 199
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 199
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 title claims abstract description 164
- 238000013519 translation Methods 0.000 title description 5
- 230000001976 improved effect Effects 0.000 title description 2
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 806
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 788
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 788
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims abstract description 406
- 229940045145 uridine Drugs 0.000 claims abstract description 205
- 239000002777 nucleoside Substances 0.000 claims abstract description 153
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims abstract description 137
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims abstract description 137
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 claims abstract description 45
- 108020004418 ribosomal RNA Proteins 0.000 claims abstract description 41
- 229920001184 polypeptide Polymers 0.000 claims abstract description 31
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 31
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 31
- 102000005877 Peptide Initiation Factors Human genes 0.000 claims abstract description 25
- 108010044843 Peptide Initiation Factors Proteins 0.000 claims abstract description 25
- 230000014621 translational initiation Effects 0.000 claims abstract description 25
- 230000014509 gene expression Effects 0.000 claims abstract description 15
- 230000027455 binding Effects 0.000 claims abstract description 9
- 238000009739 binding Methods 0.000 claims abstract description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract 5
- 230000007812 deficiency Effects 0.000 claims abstract 3
- 201000010099 disease Diseases 0.000 claims abstract 3
- 239000002773 nucleotide Substances 0.000 claims description 609
- 125000003729 nucleotide group Chemical group 0.000 claims description 609
- -1 5-carboxyhydroxymethyl-uridine methyl ester Chemical class 0.000 claims description 138
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 claims description 106
- 125000003835 nucleoside group Chemical group 0.000 claims description 100
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 73
- 102000012858 Eukaryotic Initiation Factor-4G Human genes 0.000 claims description 63
- 108010057192 Eukaryotic Initiation Factor-4G Proteins 0.000 claims description 63
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical group O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 claims description 61
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 59
- 229960005305 adenosine Drugs 0.000 claims description 59
- 108090000623 proteins and genes Proteins 0.000 claims description 59
- 102000004169 proteins and genes Human genes 0.000 claims description 59
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 50
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 50
- 229940029575 guanosine Drugs 0.000 claims description 46
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 claims description 44
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 44
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 claims description 40
- 108700026244 Open Reading Frames Proteins 0.000 claims description 38
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 claims description 37
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 claims description 36
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 claims description 36
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 32
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 32
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 32
- 101710105008 RNA-binding protein Proteins 0.000 claims description 32
- MXYRZDAGKTVQIL-IOSLPCCCSA-N (2r,3r,4s,5r)-2-(6-aminopurin-9-yl)-5-(hydroxymethyl)-2-methyloxolane-3,4-diol Chemical compound C1=NC2=C(N)N=CN=C2N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MXYRZDAGKTVQIL-IOSLPCCCSA-N 0.000 claims description 30
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 claims description 30
- 108020001507 fusion proteins Proteins 0.000 claims description 30
- 102000037865 fusion proteins Human genes 0.000 claims description 30
- SXUXMRMBWZCMEN-UHFFFAOYSA-N 2'-O-methyl uridine Natural products COC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-UHFFFAOYSA-N 0.000 claims description 24
- YHPKGSLWSUCJQK-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[[2-[[5-amino-2-[[2-[(2,4-diamino-4-oxobutanoyl)amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-4-methylsulfanylbutanoyl]amino]-3-carboxypropanoyl]amino]-5-(diaminomethylideneamino) Chemical compound NC(N)=NCCCC(C(=O)NC(C(C)C)C(O)=O)NC(=O)C(CC(O)=O)NC(=O)C(CCSC)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(N)CC(N)=O YHPKGSLWSUCJQK-UHFFFAOYSA-N 0.000 claims description 23
- SNNBPMAXGYBMHM-JXOAFFINSA-N 5-methyl-2-thiouridine Chemical compound S=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 SNNBPMAXGYBMHM-JXOAFFINSA-N 0.000 claims description 22
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 claims description 22
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 claims description 22
- 230000000295 complement effect Effects 0.000 claims description 20
- KYJLJOJCMUFWDY-UUOKFMHZSA-N (2r,3r,4s,5r)-2-(6-amino-8-azidopurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound [N-]=[N+]=NC1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O KYJLJOJCMUFWDY-UUOKFMHZSA-N 0.000 claims description 18
- OYTVCAGSWWRUII-DWJKKKFUSA-N 1-Methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=O)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O OYTVCAGSWWRUII-DWJKKKFUSA-N 0.000 claims description 18
- VGHXKGWSRNEDEP-OJKLQORTSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-2,5-bis(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidine-5-carboxylic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)N1C(=O)NC(=O)C(C(O)=O)=C1 VGHXKGWSRNEDEP-OJKLQORTSA-N 0.000 claims description 18
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 claims description 18
- XIJAZGMFHRTBFY-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-$l^{1}-selanyl-5-(methylaminomethyl)pyrimidin-4-one Chemical compound [Se]C1=NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XIJAZGMFHRTBFY-FDDDBJFASA-N 0.000 claims description 18
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 claims description 18
- HXVKEKIORVUWDR-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-(methylaminomethyl)-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HXVKEKIORVUWDR-FDDDBJFASA-N 0.000 claims description 18
- KJLRIEFCMSGNSI-HKUMRIAESA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-[(3-methylbut-3-enylamino)methyl]-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(CNCCC(=C)C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 KJLRIEFCMSGNSI-HKUMRIAESA-N 0.000 claims description 18
- HLBIEOQUEHEDCR-HKUMRIAESA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-[(3-methylbut-3-enylamino)methyl]pyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(CNCCC(=C)C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HLBIEOQUEHEDCR-HKUMRIAESA-N 0.000 claims description 18
- BTFXIEGOSDSOGN-KWCDMSRLSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-1,3-diazinane-2,4-dione Chemical compound O=C1NC(=O)C(C)CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 BTFXIEGOSDSOGN-KWCDMSRLSA-N 0.000 claims description 18
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 claims description 18
- JCNGYIGHEUKAHK-DWJKKKFUSA-N 2-Thio-1-methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O JCNGYIGHEUKAHK-DWJKKKFUSA-N 0.000 claims description 18
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 claims description 18
- CWXIOHYALLRNSZ-JWMKEVCDSA-N 2-Thiodihydropseudouridine Chemical compound C1C(C(=O)NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O CWXIOHYALLRNSZ-JWMKEVCDSA-N 0.000 claims description 18
- NUBJGTNGKODGGX-YYNOVJQHSA-N 2-[5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]acetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CN(CC(O)=O)C(=O)NC1=O NUBJGTNGKODGGX-YYNOVJQHSA-N 0.000 claims description 18
- CTPQMQZKRWLMRA-LYTXVXJPSA-N 2-amino-4-[5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methyl-2,6-dioxopyrimidin-1-yl]butanoic acid Chemical compound O=C1N(CCC(N)C(O)=O)C(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 CTPQMQZKRWLMRA-LYTXVXJPSA-N 0.000 claims description 18
- RLZMYTZDQAVNIN-ZOQUXTDFSA-N 2-methoxy-4-thio-uridine Chemical compound COC1=NC(=S)C=CN1[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O RLZMYTZDQAVNIN-ZOQUXTDFSA-N 0.000 claims description 18
- WBVPJIKOWUQTSD-ZOQUXTDFSA-N 2-methoxyuridine Chemical compound COC1=NC(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WBVPJIKOWUQTSD-ZOQUXTDFSA-N 0.000 claims description 18
- JUMHLCXWYQVTLL-KVTDHHQDSA-N 2-thio-5-aza-uridine Chemical compound [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=S)NC(=O)N=C1 JUMHLCXWYQVTLL-KVTDHHQDSA-N 0.000 claims description 18
- VRVXMIJPUBNPGH-XVFCMESISA-N 2-thio-dihydrouridine Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)N1CCC(=O)NC1=S VRVXMIJPUBNPGH-XVFCMESISA-N 0.000 claims description 18
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 claims description 18
- YXNIEZJFCGTDKV-JANFQQFMSA-N 3-(3-amino-3-carboxypropyl)uridine Chemical compound O=C1N(CCC(N)C(O)=O)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YXNIEZJFCGTDKV-JANFQQFMSA-N 0.000 claims description 18
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 claims description 18
- FGFVODMBKZRMMW-XUTVFYLZSA-N 4-Methoxy-2-thiopseudouridine Chemical compound COC1=C(C=NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O FGFVODMBKZRMMW-XUTVFYLZSA-N 0.000 claims description 18
- HOCJTJWYMOSXMU-XUTVFYLZSA-N 4-Methoxypseudouridine Chemical compound COC1=C(C=NC(=O)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O HOCJTJWYMOSXMU-XUTVFYLZSA-N 0.000 claims description 18
- ZLOIGESWDJYCTF-UHFFFAOYSA-N 4-Thiouridine Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-UHFFFAOYSA-N 0.000 claims description 18
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 claims description 18
- CNVRVGAACYEOQI-FDDDBJFASA-N 5,2'-O-dimethylcytidine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C(C)=C1 CNVRVGAACYEOQI-FDDDBJFASA-N 0.000 claims description 18
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 claims description 18
- VSCNRXVDHRNJOA-PNHWDRBUSA-N 5-(carboxymethylaminomethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCC(O)=O)=C1 VSCNRXVDHRNJOA-PNHWDRBUSA-N 0.000 claims description 18
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 claims description 18
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 claims description 18
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 claims description 18
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 claims description 18
- VKLFQTYNHLDMDP-PNHWDRBUSA-N 5-carboxymethylaminomethyl-2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C(CNCC(O)=O)=C1 VKLFQTYNHLDMDP-PNHWDRBUSA-N 0.000 claims description 18
- YIZYCHKPHCPKHZ-PNHWDRBUSA-N 5-methoxycarbonylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YIZYCHKPHCPKHZ-PNHWDRBUSA-N 0.000 claims description 18
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 claims description 18
- HXVKEKIORVUWDR-UHFFFAOYSA-N 5-methylaminomethyl-2-thiouridine Natural products S=C1NC(=O)C(CNC)=CN1C1C(O)C(O)C(CO)O1 HXVKEKIORVUWDR-UHFFFAOYSA-N 0.000 claims description 18
- ZXQHKBUIXRFZBV-FDDDBJFASA-N 5-methylaminomethyluridine Chemical compound O=C1NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXQHKBUIXRFZBV-FDDDBJFASA-N 0.000 claims description 18
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 claims description 18
- WYXSYVWAUAUWLD-SHUUEZRQSA-N 6-azauridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=N1 WYXSYVWAUAUWLD-SHUUEZRQSA-N 0.000 claims description 18
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 claims description 18
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 claims description 18
- YKWUPFSEFXSGRT-JWMKEVCDSA-N Dihydropseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1C(=O)NC(=O)NC1 YKWUPFSEFXSGRT-JWMKEVCDSA-N 0.000 claims description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 229930185560 Pseudouridine Natural products 0.000 claims description 18
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 claims description 18
- YXNIEZJFCGTDKV-UHFFFAOYSA-N X-Nucleosid Natural products O=C1N(CCC(N)C(O)=O)C(=O)C=CN1C1C(O)C(O)C(CO)O1 YXNIEZJFCGTDKV-UHFFFAOYSA-N 0.000 claims description 18
- 150000003838 adenosines Chemical class 0.000 claims description 18
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 claims description 18
- FPUGCISOLXNPPC-IOSLPCCCSA-N cordysinin B Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(N)=C2N=C1 FPUGCISOLXNPPC-IOSLPCCCSA-N 0.000 claims description 18
- 229960000684 cytarabine Drugs 0.000 claims description 18
- WZRYXYRWFAPPBJ-PNHWDRBUSA-N methyl uridin-5-yloxyacetate Chemical compound O=C1NC(=O)C(OCC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WZRYXYRWFAPPBJ-PNHWDRBUSA-N 0.000 claims description 18
- 229940096913 pseudoisocytidine Drugs 0.000 claims description 18
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 claims description 18
- RVCNQQGZJWVLIP-VPCXQMTMSA-N uridin-5-yloxyacetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(OCC(O)=O)=C1 RVCNQQGZJWVLIP-VPCXQMTMSA-N 0.000 claims description 18
- YIZYCHKPHCPKHZ-UHFFFAOYSA-N uridine-5-acetic acid methyl ester Natural products COC(=O)Cc1cn(C2OC(CO)C(O)C2O)c(=O)[nH]c1=O YIZYCHKPHCPKHZ-UHFFFAOYSA-N 0.000 claims description 18
- GCNTZFIIOFTKIY-UHFFFAOYSA-N 4-hydroxypyridine Chemical compound OC1=CC=NC=C1 GCNTZFIIOFTKIY-UHFFFAOYSA-N 0.000 claims description 17
- 239000002342 ribonucleoside Substances 0.000 claims description 17
- DXEJZRDJXRVUPN-XUTVFYLZSA-N 3-Methylpseudouridine Chemical compound O=C1N(C)C(=O)NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DXEJZRDJXRVUPN-XUTVFYLZSA-N 0.000 claims description 16
- OTFGHFBGGZEXEU-PEBGCTIMSA-N 1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N(C)C(=O)C=C1 OTFGHFBGGZEXEU-PEBGCTIMSA-N 0.000 claims description 15
- BGOKOAWPGAZSES-RGCMKSIDSA-N 1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-5-[(3-methylbut-3-enylamino)methyl]pyrimidine-2,4-dione Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCCC(C)=C)=C1 BGOKOAWPGAZSES-RGCMKSIDSA-N 0.000 claims description 15
- QPHRQMAYYMYWFW-FJGDRVTGSA-N 1-[(2r,3s,4r,5r)-3-fluoro-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound O[C@]1(F)[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 QPHRQMAYYMYWFW-FJGDRVTGSA-N 0.000 claims description 15
- SFFCQAIBJUCFJK-UGKPPGOTSA-N 2-[[1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2,4-dioxopyrimidin-5-yl]methylamino]acetic acid Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCC(O)=O)=C1 SFFCQAIBJUCFJK-UGKPPGOTSA-N 0.000 claims description 15
- XOTXNXXJZCFUOA-UGKPPGOTSA-N methyl 2-[1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2,4-dioxopyrimidin-5-yl]acetate Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(=O)OC)=C1 XOTXNXXJZCFUOA-UGKPPGOTSA-N 0.000 claims description 15
- AHIQDGXXLZVOGZ-UGKPPGOTSA-N methyl 3-[1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-5-yl]prop-2-enoate Chemical compound O=C1NC(=O)C(C=CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 AHIQDGXXLZVOGZ-UGKPPGOTSA-N 0.000 claims description 15
- WGNUTGFETAXDTJ-OOJXKGFFSA-N 2'-O-methylpseudouridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O WGNUTGFETAXDTJ-OOJXKGFFSA-N 0.000 claims description 14
- SXUXMRMBWZCMEN-ZOQUXTDFSA-N 2'-O-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-ZOQUXTDFSA-N 0.000 claims description 14
- VHXUHQJRMXUOST-PNHWDRBUSA-N 2-[1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2,4-dioxopyrimidin-5-yl]acetamide Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(N)=O)=C1 VHXUHQJRMXUOST-PNHWDRBUSA-N 0.000 claims description 14
- YHRRPHCORALGKQ-UHFFFAOYSA-N 5,2'-O-dimethyluridine Chemical compound COC1C(O)C(CO)OC1N1C(=O)NC(=O)C(C)=C1 YHRRPHCORALGKQ-UHFFFAOYSA-N 0.000 claims description 14
- LOEDKMLIGFMQKR-JXOAFFINSA-N 5-aminomethyl-2-thiouridine Chemical compound S=C1NC(=O)C(CN)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LOEDKMLIGFMQKR-JXOAFFINSA-N 0.000 claims description 14
- HLZXTFWTDIBXDF-PNHWDRBUSA-N 5-methoxycarbonylmethyl-2-thiouridine Chemical compound S=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HLZXTFWTDIBXDF-PNHWDRBUSA-N 0.000 claims description 14
- 125000006850 spacer group Chemical group 0.000 claims description 14
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 claims description 13
- 210000004027 cell Anatomy 0.000 claims description 13
- HLZXTFWTDIBXDF-UHFFFAOYSA-N mcm5sU Natural products COC(=O)Cc1cn(C2OC(CO)C(O)C2O)c(=S)[nH]c1=O HLZXTFWTDIBXDF-UHFFFAOYSA-N 0.000 claims description 13
- FSNWBYQDBMGPPO-KCGFPETGSA-N NCC=1C(NC(N([C@]2([C@H](O)[C@H](O)[C@@H](CO)O2)C)C1)=O)=O Chemical compound NCC=1C(NC(N([C@]2([C@H](O)[C@H](O)[C@@H](CO)O2)C)C1)=O)=O FSNWBYQDBMGPPO-KCGFPETGSA-N 0.000 claims description 11
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 claims description 10
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 claims description 9
- GRYSXUXXBDSYRT-WOUKDFQISA-N (2r,3r,4r,5r)-2-(hydroxymethyl)-4-methoxy-5-[6-(methylamino)purin-9-yl]oxolan-3-ol Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1OC GRYSXUXXBDSYRT-WOUKDFQISA-N 0.000 claims description 9
- DJONVIMMDYQLKR-WOUKDFQISA-N (2r,3r,4r,5r)-2-(hydroxymethyl)-5-(6-imino-1-methylpurin-9-yl)-4-methoxyoxolan-3-ol Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CN(C)C2=N)=C2N=C1 DJONVIMMDYQLKR-WOUKDFQISA-N 0.000 claims description 9
- IXOXBSCIXZEQEQ-KQYNXXCUSA-N (2r,3r,4s,5r)-2-(2-amino-6-methoxypurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(OC)=NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IXOXBSCIXZEQEQ-KQYNXXCUSA-N 0.000 claims description 9
- UUDVSZSQPFXQQM-GIWSHQQXSA-N (2r,3s,4r,5r)-2-(6-aminopurin-9-yl)-3-fluoro-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@]1(O)F UUDVSZSQPFXQQM-GIWSHQQXSA-N 0.000 claims description 9
- PHFMCMDFWSZKGD-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-[6-(methylamino)-2-methylsulfanylpurin-9-yl]oxolane-3,4-diol Chemical compound C1=NC=2C(NC)=NC(SC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PHFMCMDFWSZKGD-IOSLPCCCSA-N 0.000 claims description 9
- XBBQCOKPWNZHFX-TYASJMOZSA-N (3r,4s,5r)-2-[(2r,3r,4r,5r)-2-(6-aminopurin-9-yl)-4-hydroxy-5-(hydroxymethyl)oxolan-3-yl]oxy-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound O([C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C=2N=CN=C(C=2N=C1)N)C1O[C@H](CO)[C@@H](O)[C@H]1O XBBQCOKPWNZHFX-TYASJMOZSA-N 0.000 claims description 9
- MIXBUOXRHTZHKR-XUTVFYLZSA-N 1-Methylpseudoisocytidine Chemical compound CN1C=C(C(=O)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O MIXBUOXRHTZHKR-XUTVFYLZSA-N 0.000 claims description 9
- BNXGRQLXOMSOMV-UHFFFAOYSA-N 1-[4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-4-(methylamino)pyrimidin-2-one Chemical compound O=C1N=C(NC)C=CN1C1C(OC)C(O)C(CO)O1 BNXGRQLXOMSOMV-UHFFFAOYSA-N 0.000 claims description 9
- GUNOEKASBVILNS-UHFFFAOYSA-N 1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=O GUNOEKASBVILNS-UHFFFAOYSA-N 0.000 claims description 9
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 claims description 9
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 claims description 9
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 claims description 9
- FPUGCISOLXNPPC-UHFFFAOYSA-N 2'-O-Methyladenosine Natural products COC1C(O)C(CO)OC1N1C2=NC=NC(N)=C2N=C1 FPUGCISOLXNPPC-UHFFFAOYSA-N 0.000 claims description 9
- RFCQJGFZUQFYRF-UHFFFAOYSA-N 2'-O-Methylcytidine Natural products COC1C(O)C(CO)OC1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-UHFFFAOYSA-N 0.000 claims description 9
- OVYNGSFVYRPRCG-UHFFFAOYSA-N 2'-O-Methylguanosine Natural products COC1C(O)C(CO)OC1N1C(NC(N)=NC2=O)=C2N=C1 OVYNGSFVYRPRCG-UHFFFAOYSA-N 0.000 claims description 9
- RFCQJGFZUQFYRF-ZOQUXTDFSA-N 2'-O-methylcytidine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C=C1 RFCQJGFZUQFYRF-ZOQUXTDFSA-N 0.000 claims description 9
- OVYNGSFVYRPRCG-KQYNXXCUSA-N 2'-O-methylguanosine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=C(N)NC2=O)=C2N=C1 OVYNGSFVYRPRCG-KQYNXXCUSA-N 0.000 claims description 9
- HPHXOIULGYVAKW-IOSLPCCCSA-N 2'-O-methylinosine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 HPHXOIULGYVAKW-IOSLPCCCSA-N 0.000 claims description 9
- HPHXOIULGYVAKW-UHFFFAOYSA-N 2'-O-methylinosine Natural products COC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 HPHXOIULGYVAKW-UHFFFAOYSA-N 0.000 claims description 9
- YUCFXTKBZFABID-WOUKDFQISA-N 2-(dimethylamino)-9-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-3h-purin-6-one Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=NC2=O)N(C)C)=C2N=C1 YUCFXTKBZFABID-WOUKDFQISA-N 0.000 claims description 9
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 claims description 9
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 claims description 9
- BIRQNXWAXWLATA-IOSLPCCCSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-oxo-1h-pyrrolo[2,3-d]pyrimidine-5-carbonitrile Chemical compound C1=C(C#N)C=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O BIRQNXWAXWLATA-IOSLPCCCSA-N 0.000 claims description 9
- NTYZLKZZBRSAPT-DBINCYRJSA-N 2-amino-9-[(2r,3r,4r,5r)-3-[(3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]oxy-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound O([C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C=NC=2C(=O)N=C(NC=21)N)C1O[C@H](CO)[C@@H](O)[C@H]1O NTYZLKZZBRSAPT-DBINCYRJSA-N 0.000 claims description 9
- JLYURAYAEKVGQJ-IOSLPCCCSA-N 2-amino-9-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-1-methylpurin-6-one Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=C(N)N(C)C2=O)=C2N=C1 JLYURAYAEKVGQJ-IOSLPCCCSA-N 0.000 claims description 9
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 claims description 9
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3h-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 claims description 9
- BGTXMQUSDNMLDW-AEHJODJJSA-N 2-amino-9-[(2r,3s,4r,5r)-3-fluoro-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@]1(O)F BGTXMQUSDNMLDW-AEHJODJJSA-N 0.000 claims description 9
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 claims description 9
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7h-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 claims description 9
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical compound CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 claims description 9
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 claims description 9
- VZQXUWKZDSEQRR-SDBHATRESA-N 2-methylthio-N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)C)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VZQXUWKZDSEQRR-SDBHATRESA-N 0.000 claims description 9
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 claims description 9
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 claims description 9
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 claims description 9
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 claims description 9
- WFCJCYSSTXNUED-UHFFFAOYSA-N 4-(dimethylamino)-1-[4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]pyrimidin-2-one Chemical compound COC1C(O)C(CO)OC1N1C(=O)N=C(N(C)C)C=C1 WFCJCYSSTXNUED-UHFFFAOYSA-N 0.000 claims description 9
- DMUQOPXCCOBPID-XUTVFYLZSA-N 4-Thio-1-methylpseudoisocytidine Chemical compound CN1C=C(C(=S)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O DMUQOPXCCOBPID-XUTVFYLZSA-N 0.000 claims description 9
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 claims description 9
- PJWBTAIPBFWVHX-FJGDRVTGSA-N 4-amino-1-[(2r,3s,4r,5r)-3-fluoro-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@](F)(O)[C@H](O)[C@@H](CO)O1 PJWBTAIPBFWVHX-FJGDRVTGSA-N 0.000 claims description 9
- FIWQPTRUVGSKOD-UHFFFAOYSA-N 4-thio-1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=S FIWQPTRUVGSKOD-UHFFFAOYSA-N 0.000 claims description 9
- SJVVKUMXGIKAAI-UHFFFAOYSA-N 4-thio-pseudoisocytidine Chemical compound NC(N1)=NC=C(C(C2O)OC(CO)C2O)C1=S SJVVKUMXGIKAAI-UHFFFAOYSA-N 0.000 claims description 9
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 claims description 9
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 claims description 9
- IPRQAJTUSRLECG-UHFFFAOYSA-N 5-[6-(dimethylamino)purin-9-yl]-2-(hydroxymethyl)-4-methoxyoxolan-3-ol Chemical compound COC1C(O)C(CO)OC1N1C2=NC=NC(N(C)C)=C2N=C1 IPRQAJTUSRLECG-UHFFFAOYSA-N 0.000 claims description 9
- OZQDLJNDRVBCST-SHUUEZRQSA-N 5-amino-2-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,2,4-triazin-3-one Chemical compound O=C1N=C(N)C=NN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZQDLJNDRVBCST-SHUUEZRQSA-N 0.000 claims description 9
- OSLBPVOJTCDNEF-DBRKOABJSA-N 5-aza-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CN=C1 OSLBPVOJTCDNEF-DBRKOABJSA-N 0.000 claims description 9
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 claims description 9
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 claims description 9
- AFWWNHLDHNSVSD-UHFFFAOYSA-N 6-methyl-7h-purin-2-amine Chemical compound CC1=NC(N)=NC2=C1NC=N2 AFWWNHLDHNSVSD-UHFFFAOYSA-N 0.000 claims description 9
- ISSMDAFGDCTNDV-UHFFFAOYSA-N 7-deaza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NC=CC2=N1 ISSMDAFGDCTNDV-UHFFFAOYSA-N 0.000 claims description 9
- YVVMIGRXQRPSIY-UHFFFAOYSA-N 7-deaza-2-aminopurine Chemical compound N1C(N)=NC=C2C=CN=C21 YVVMIGRXQRPSIY-UHFFFAOYSA-N 0.000 claims description 9
- ZTAWTRPFJHKMRU-UHFFFAOYSA-N 7-deaza-8-aza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NN=CC2=N1 ZTAWTRPFJHKMRU-UHFFFAOYSA-N 0.000 claims description 9
- SMXRCJBCWRHDJE-UHFFFAOYSA-N 7-deaza-8-aza-2-aminopurine Chemical compound NC1=NC=C2C=NNC2=N1 SMXRCJBCWRHDJE-UHFFFAOYSA-N 0.000 claims description 9
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 claims description 9
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 claims description 9
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 claims description 9
- JSRIPIORIMCGTG-WOUKDFQISA-N 9-[(2R,3R,4R,5R)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-1-methylpurin-6-one Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CN(C)C2=O)=C2N=C1 JSRIPIORIMCGTG-WOUKDFQISA-N 0.000 claims description 9
- IGUVTVZUVROGNX-WOUKDFQISA-O 9-[(2R,3R,4R,5R)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-7-methyl-2-(methylamino)-1H-purin-9-ium-6-one Chemical compound CNC=1NC(C=2[N+](=CN([C@H]3[C@H](OC)[C@H](O)[C@@H](CO)O3)C=2N=1)C)=O IGUVTVZUVROGNX-WOUKDFQISA-O 0.000 claims description 9
- OJTAZBNWKTYVFJ-IOSLPCCCSA-N 9-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2-(methylamino)-3h-purin-6-one Chemical compound C1=2NC(NC)=NC(=O)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1OC OJTAZBNWKTYVFJ-IOSLPCCCSA-N 0.000 claims description 9
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 claims description 9
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 claims description 9
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 claims description 9
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 claims description 9
- 229930010555 Inosine Natural products 0.000 claims description 9
- ZBYRSRLCXTUFLJ-IOSLPCCCSA-O N(2),N(7)-dimethylguanosine Chemical compound CNC=1NC(C=2[N+](=CN([C@H]3[C@H](O)[C@H](O)[C@@H](CO)O3)C=2N=1)C)=O ZBYRSRLCXTUFLJ-IOSLPCCCSA-O 0.000 claims description 9
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 claims description 9
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 claims description 9
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 claims description 9
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 claims description 9
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 claims description 9
- SLLVJTURCPWLTP-UHFFFAOYSA-N N-[9-[3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]acetamide Chemical compound C1=NC=2C(NC(=O)C)=NC=NC=2N1C1OC(CO)C(O)C1O SLLVJTURCPWLTP-UHFFFAOYSA-N 0.000 claims description 9
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 claims description 9
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 claims description 9
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 claims description 9
- VZQXUWKZDSEQRR-UHFFFAOYSA-N Nucleosid Natural products C12=NC(SC)=NC(NCC=C(C)C)=C2N=CN1C1OC(CO)C(O)C1O VZQXUWKZDSEQRR-UHFFFAOYSA-N 0.000 claims description 9
- 229960002756 azacitidine Drugs 0.000 claims description 9
- 229960003786 inosine Drugs 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 9
- CYDFBLGNJUNSCC-QCNRFFRDSA-N n-[1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2-oxopyrimidin-4-yl]acetamide Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(NC(C)=O)C=C1 CYDFBLGNJUNSCC-QCNRFFRDSA-N 0.000 claims description 9
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 claims description 9
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 claims description 9
- SOEYIPCQNRSIAV-IOSLPCCCSA-N 2-amino-5-(aminomethyl)-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=2NC(N)=NC(=O)C=2C(CN)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SOEYIPCQNRSIAV-IOSLPCCCSA-N 0.000 claims description 8
- RPQQZHJQUBDHHG-FNCVBFRFSA-N 5-methyl-zebularine Chemical compound C1=C(C)C=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RPQQZHJQUBDHHG-FNCVBFRFSA-N 0.000 claims description 8
- OZTOEARQSSIFOG-MWKIOEHESA-N 6-Thio-7-deaza-8-azaguanosine Chemical compound Nc1nc(=S)c2cnn([C@@H]3O[C@H](CO)[C@@H](O)[C@H]3O)c2[nH]1 OZTOEARQSSIFOG-MWKIOEHESA-N 0.000 claims description 8
- CBNRZZNSRJQZNT-IOSLPCCCSA-O 6-thio-7-deaza-guanosine Chemical compound CC1=C[NH+]([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C(NC(N)=N2)=C1C2=S CBNRZZNSRJQZNT-IOSLPCCCSA-O 0.000 claims description 8
- RFHIWBUKNJIBSE-KQYNXXCUSA-O 6-thio-7-methyl-guanosine Chemical compound C1=2NC(N)=NC(=S)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RFHIWBUKNJIBSE-KQYNXXCUSA-O 0.000 claims description 8
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 claims description 8
- 102100024364 Disintegrin and metalloproteinase domain-containing protein 8 Human genes 0.000 claims description 8
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 claims description 8
- 210000000170 cell membrane Anatomy 0.000 claims description 8
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 6
- 108091092724 Noncoding DNA Proteins 0.000 claims description 6
- QCPQCJVQJKOKMS-VLSMUFELSA-N 2-methoxy-5-methyl-cytidine Chemical compound CC(C(N)=N1)=CN([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C1OC QCPQCJVQJKOKMS-VLSMUFELSA-N 0.000 claims description 5
- STISOQJGVFEOFJ-MEVVYUPBSA-N 2-methoxy-cytidine Chemical compound COC(N([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)C=C1)N=C1N STISOQJGVFEOFJ-MEVVYUPBSA-N 0.000 claims description 5
- ZSIINYPBPQCZKU-BQNZPOLKSA-O 4-Methoxy-1-methylpseudoisocytidine Chemical compound C[N+](CC1[C@H]([C@H]2O)O[C@@H](CO)[C@@H]2O)=C(N)N=C1OC ZSIINYPBPQCZKU-BQNZPOLKSA-O 0.000 claims description 5
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 claims description 5
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 5
- ZVGONGHIVBJXFC-WCTZXXKLSA-N 2-thio-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)N=CC=C1 ZVGONGHIVBJXFC-WCTZXXKLSA-N 0.000 claims description 4
- XUNBIDXYAUXNKD-DBRKOABJSA-N 5-aza-2-thio-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)N=CN=C1 XUNBIDXYAUXNKD-DBRKOABJSA-N 0.000 claims description 4
- 102000014914 Carrier Proteins Human genes 0.000 claims description 4
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 claims description 4
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 claims description 4
- 102100021238 Dynamin-2 Human genes 0.000 claims description 4
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 101000817607 Homo sapiens Dynamin-2 Proteins 0.000 claims description 4
- 102000007999 Nuclear Proteins Human genes 0.000 claims description 4
- 108010089610 Nuclear Proteins Proteins 0.000 claims description 4
- 239000000427 antigen Substances 0.000 claims description 4
- 108091007433 antigens Proteins 0.000 claims description 4
- 102000036639 antigens Human genes 0.000 claims description 4
- 108091008324 binding proteins Proteins 0.000 claims description 4
- 125000001369 canonical nucleoside group Chemical group 0.000 claims description 4
- 230000001086 cytosolic effect Effects 0.000 claims description 4
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 4
- 239000012634 fragment Substances 0.000 claims description 4
- 239000003102 growth factor Substances 0.000 claims description 4
- 239000002955 immunomodulating agent Substances 0.000 claims description 4
- 229940121354 immunomodulator Drugs 0.000 claims description 4
- 230000002584 immunomodulator Effects 0.000 claims description 4
- 210000004962 mammalian cell Anatomy 0.000 claims description 4
- 108020005075 5S Ribosomal RNA Proteins 0.000 claims description 3
- 102000015696 Interleukins Human genes 0.000 claims description 3
- 108010063738 Interleukins Proteins 0.000 claims description 3
- 108091023040 Transcription factor Proteins 0.000 claims description 3
- 108091023045 Untranslated Region Proteins 0.000 claims description 3
- 108020004463 18S ribosomal RNA Proteins 0.000 claims description 2
- VWSLLSXLURJCDF-UHFFFAOYSA-N 2-methyl-4,5-dihydro-1h-imidazole Chemical compound CC1=NCCN1 VWSLLSXLURJCDF-UHFFFAOYSA-N 0.000 claims description 2
- HOEIPINIBKBXTJ-IDTAVKCVSA-N 3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4,6,7-trimethylimidazo[1,2-a]purin-9-one Chemical compound C1=NC=2C(=O)N3C(C)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HOEIPINIBKBXTJ-IDTAVKCVSA-N 0.000 claims description 2
- QUZQVVNSDQCAOL-WOUKDFQISA-N 4-demethylwyosine Chemical compound N1C(C)=CN(C(C=2N=C3)=O)C1=NC=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O QUZQVVNSDQCAOL-WOUKDFQISA-N 0.000 claims description 2
- 108020004565 5.8S Ribosomal RNA Proteins 0.000 claims description 2
- PEMQXWCOMFJRLS-UHFFFAOYSA-N Archaeosine Natural products C1=2NC(N)=NC(=O)C=2C(C(=N)N)=CN1C1OC(CO)C(O)C1O PEMQXWCOMFJRLS-UHFFFAOYSA-N 0.000 claims description 2
- 102000002278 Ribosomal Proteins Human genes 0.000 claims description 2
- 108010000605 Ribosomal Proteins Proteins 0.000 claims description 2
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 claims description 2
- 230000000692 anti-sense effect Effects 0.000 claims description 2
- PEMQXWCOMFJRLS-RPKMEZRRSA-N archaeosine Chemical compound C1=2NC(N)=NC(=O)C=2C(C(=N)N)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PEMQXWCOMFJRLS-RPKMEZRRSA-N 0.000 claims description 2
- MVCRZALXJBDOKF-JPZHCBQBSA-N beta-hydroxywybutosine 5'-monophosphate Chemical compound C1=NC=2C(=O)N3C(CC(O)[C@H](NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O MVCRZALXJBDOKF-JPZHCBQBSA-N 0.000 claims description 2
- RRCFLRBBBFZLSB-XIFYLAFSSA-N epoxyqueuosine Chemical compound C1=C(CN[C@@H]2[C@H]([C@@H](O)[C@@H]3O[C@@H]32)O)C=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RRCFLRBBBFZLSB-XIFYLAFSSA-N 0.000 claims description 2
- 210000003002 eukaryotic large ribosome subunit Anatomy 0.000 claims description 2
- 210000004265 eukaryotic small ribosome subunit Anatomy 0.000 claims description 2
- 210000005260 human cell Anatomy 0.000 claims description 2
- WCNMEQDMUYVWMJ-UHFFFAOYSA-N methyl 4-[3-[3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4,6-dimethyl-9-oxoimidazo[1,2-a]purin-7-yl]-3-hydroperoxy-2-(methoxycarbonylamino)butanoate Chemical compound C1=NC=2C(=O)N3C(CC(C(NC(=O)OC)C(=O)OC)OO)=C(C)N=C3N(C)C=2N1C1OC(CO)C(O)C1O WCNMEQDMUYVWMJ-UHFFFAOYSA-N 0.000 claims description 2
- QQXQGKSPIMGUIZ-AEZJAUAXSA-N queuosine Chemical compound C1=2C(=O)NC(N)=NC=2N([C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=C1CN[C@H]1C=C[C@H](O)[C@@H]1O QQXQGKSPIMGUIZ-AEZJAUAXSA-N 0.000 claims description 2
- QAOHCFGKCWTBGC-QHOAOGIMSA-N wybutosine Chemical compound C1=NC=2C(=O)N3C(CC[C@H](NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O QAOHCFGKCWTBGC-QHOAOGIMSA-N 0.000 claims description 2
- QAOHCFGKCWTBGC-UHFFFAOYSA-N wybutosine Natural products C1=NC=2C(=O)N3C(CCC(NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1C1OC(CO)C(O)C1O QAOHCFGKCWTBGC-UHFFFAOYSA-N 0.000 claims description 2
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 claims description 2
- 229910052707 ruthenium Inorganic materials 0.000 claims 15
- ZYEWPVTXYBLWRT-VPCXQMTMSA-N 5-carbamoylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZYEWPVTXYBLWRT-VPCXQMTMSA-N 0.000 claims 7
- KJTLSVCANCCWHF-UHFFFAOYSA-N Ruthenium Chemical compound [Ru] KJTLSVCANCCWHF-UHFFFAOYSA-N 0.000 claims 6
- DHOKPTWOSCFEQZ-UHFFFAOYSA-N C[Ru] Chemical compound C[Ru] DHOKPTWOSCFEQZ-UHFFFAOYSA-N 0.000 claims 3
- PWRYKCFNWWHKLP-UHFFFAOYSA-N ruthenium;hydrate Chemical compound O.[Ru] PWRYKCFNWWHKLP-UHFFFAOYSA-N 0.000 claims 3
- NHJGXBBPHNAQNZ-LMDZVNGHSA-N C[C@H]([C@@H](C(NCN(C)C1=NC=NC2=C1N=CN2[C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)=O)N)O Chemical compound C[C@H]([C@@H](C(NCN(C)C1=NC=NC2=C1N=CN2[C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)=O)N)O NHJGXBBPHNAQNZ-LMDZVNGHSA-N 0.000 claims 2
- SYPYSQORICZYSF-IBZYUGMLSA-N C[C@H]([C@@H](C(NCNC1=NC(SC)=NC2=C1N=CN2[C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)=O)N)O Chemical compound C[C@H]([C@@H](C(NCNC1=NC(SC)=NC2=C1N=CN2[C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)=O)N)O SYPYSQORICZYSF-IBZYUGMLSA-N 0.000 claims 2
- 102000040739 Secretory proteins Human genes 0.000 claims 2
- 108091058545 Secretory proteins Proteins 0.000 claims 2
- 208000035475 disorder Diseases 0.000 claims 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims 1
- 210000003705 ribosome Anatomy 0.000 abstract description 6
- 235000018102 proteins Nutrition 0.000 description 42
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 19
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 102000015585 poly-pyrimidine tract binding protein Human genes 0.000 description 10
- 108010063723 poly-pyrimidine tract binding protein Proteins 0.000 description 10
- 229920002477 rna polymer Polymers 0.000 description 10
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- 230000014616 translation Effects 0.000 description 8
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 5
- KQVWFVPAXVFJCI-IBZYUGMLSA-N C[C@H]([C@@H](C(NCNC1=NC=NC2=C1N=CN2[C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)=O)N)O Chemical compound C[C@H]([C@@H](C(NCNC1=NC=NC2=C1N=CN2[C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)=O)N)O KQVWFVPAXVFJCI-IBZYUGMLSA-N 0.000 description 5
- 108060002716 Exonuclease Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 102000013165 exonuclease Human genes 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 150000003833 nucleoside derivatives Chemical class 0.000 description 4
- 125000000714 pyrimidinyl group Chemical group 0.000 description 4
- JICJEKNRBIQESC-BHBWVORQSA-N 2-amino-9-[(2r,3r,4s,5r)-2,3,4-trihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@]1(O)O[C@H](CO)[C@@H](O)[C@H]1O JICJEKNRBIQESC-BHBWVORQSA-N 0.000 description 3
- QNIZHKITBISILC-RPKMEZRRSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-3h-purin-6-one Chemical compound C1=NC(C(NC(N)=N2)=O)=C2N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O QNIZHKITBISILC-RPKMEZRRSA-N 0.000 description 3
- MIKUYHXYGGJMLM-UUOKFMHZSA-N Crotonoside Chemical compound C1=NC2=C(N)NC(=O)N=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MIKUYHXYGGJMLM-UUOKFMHZSA-N 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 150000002924 oxiranes Chemical class 0.000 description 3
- 108091028075 Circular RNA Proteins 0.000 description 2
- 239000002585 base Substances 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000001293 nucleolytic effect Effects 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- HFPSLERXODRBFZ-MFYTUXHUSA-N C[C@@]1([C@@H]([C@@H]([C@H](O1)CO)O)OC)N2C=C(C(=O)NC2=O)CN Chemical compound C[C@@]1([C@@H]([C@@H]([C@H](O1)CO)O)OC)N2C=C(C(=O)NC2=O)CN HFPSLERXODRBFZ-MFYTUXHUSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000001036 exonucleolytic effect Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 210000004708 ribosome subunit Anatomy 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/60—Vectors comprising a special translation-regulating system from viruses
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Saccharide Compounds (AREA)
Abstract
本揭示案係關於內部核糖體進入位點(IRES)元件,該等元件即使在不存在5’帽結構之情形下仍能夠實現期望多核苷酸之表現。本揭示案亦提供含有此等IRES元件之多核苷酸(例如RNA分子,諸如環狀或線性RNA分子)。在本揭示案之一些實施例中,該IRES元件含有一或多個核酸區段,該一或多個核酸區段富含尿苷核苷或經修飾尿苷核苷,諸如1-甲基假尿苷核苷。在一些實施例中,該IRES元件含有一或多個核酸區段,該一或多個核酸區段之特徵在於複數個鄰接尿苷核苷或經修飾尿苷核苷(例如1-甲基假尿苷核苷)。在一些實施例中,本文所闡述之IRES元件可藉由例如結合至核糖體、與核糖體之核糖體RNA雜交或結合至轉譯起始因子來募集核糖體及/或轉譯起始因子。本揭示案之多核苷酸(例如環狀或線性RNA分子)可用於在個體體內表現期望多肽,該個體諸如為患有與相應內源性多肽缺乏相關之疾病或疾患之個體。
Description
使用外源性核酸已成為用於將所關注多肽遞送至靶細胞、組織或生物體之特別有效策略,此乃因單一編碼蛋白質之核酸可經轉譯以產生多個拷貝之期望多肽,此容許投與少量核酸以達成高水準之蛋白質表現。隨著核酸治療領域之發展,已採取步驟以改良核酸分子之藥物動力學性質。舉例而言,為進一步延長核酸分子(諸如編碼蛋白質之RNA分子)之半衰期所作出之努力得出使核酸不易受核溶解降解影響之修飾。該等修飾之實例係納入5’及/或3’化學基團,該等基團在空間上限制核酸外切酶接近核酸之5’端及/或3’端;以及核酸環化,其將原本可由核酸外切酶接合並裂解之5’端及3’端一起去除。
儘管前述修飾藉由減輕核溶解降解而有助於核酸穩定性,但該等修飾通常排除納入5’帽結構。5’帽結構通常包括在編碼蛋白質之核酸(例如RNA)分子中,此乃因5’帽促進核糖體結合,且由此促進蛋白質轉譯。因此,儘管諸如5’/3’封阻及環化等修飾可賦予減少的核酸外切酶介導之降解之益處,但該等修飾可因不存在5’帽而阻礙核糖體募集。業內需要實現核糖體進入及蛋白質轉譯起始之改良策略,尤其是在缺少5’帽之核酸分子中。
本揭示案係關於核酸分子,諸如線性及環狀RNA分子,其能夠以不依賴於5’帽結構之方式募集且結合至核糖體。不受機制限制,核酸分子通常採用5’帽結構以促進核糖體結合,且由此促進所編碼蛋白質之轉譯。存在易於脫帽之5’帽進而觸發RNA之隨後降解,此排除添加某些延長分子半衰期之化學修飾之可能性。該等類型之修飾之實例包括(i)存在限制核酸外切酶接近核酸分子之5’化學部分,以及(ii)核酸分子之環化,其將5’端及3’端一起去除。該兩種類型之修飾藉助化學保護或去除核酸外切酶將結合之5’端及3’端而提供減少或消除核酸外切裂解之益處。然而,由於該等類型之修飾改變或消除5’端,故其排除納入5’帽。
本揭示案係關於內部核糖體進入位點(IRES),其可併入至核酸中且以不依賴於5’帽之存在之方式促進核糖體募集及蛋白質轉譯。值得注意的是,本揭示案之IRES元件可用於缺少或含有5’帽之核酸(例如RNA分子)中,此乃因本發明之IRES元件為該兩種類型之分子提供優勢。舉例而言,本揭示案之IRES元件可併入至缺少5’帽之核酸(例如線性或環狀RNA分子)中,藉此提供一種方式,藉由該方式核酸分子可由核糖體結合並轉譯,儘管不存在通常視為對蛋白質生物合成之起始重要之5’帽結構。在另一實例中,本揭示案之IRES元件可併入至含有5’帽之核酸(例如線性RNA)中。在此背景下,IRES元件可提供如下益處:即使在藉助內源性脫帽過程去除5’帽後,核酸亦可藉由該方式進行轉譯。以此方式,納入本揭示案之IRES元件可有效地擴展脫帽核酸(例如脫帽線性RNA)實現蛋白質表現之能力。
本揭示案之IRES可將轉譯牽引子及/或核糖體募集至本文所闡述之核酸,以促進轉譯。舉例而言,本揭示案之IRES (例如SEQ ID NO: 173-205)可結合至轉譯起始因子,藉此募集起始核酸轉譯所需之分子機構。在另一實例中,本揭示案之IRES (例如SEQ ID NO: 185、190及199-201)可藉由例如直接與核糖體RNA (rRNA,諸如25S、28S、18S、5.8S及/或5S rRNA)雜交而直接結合至核糖體亞單元(例如真核60S或40S亞單元)。藉由直接與核糖體雜交,本揭示案之IRES進一步提供快速且高效之蛋白質表現之優點,同時降低細胞之能量消耗。
在一個態樣中,本揭示案提供核酸,該核酸包含:
(i) 內部核糖體進入位點(IRES),其包含一或多個富含尿苷或經修飾尿苷之多核苷酸束;該IRES可操作地連接至
(ii) 編碼多肽之開放閱讀框。
在一些實施例中,IRES包含1至20個富含尿苷或經修飾尿苷之多核苷酸束(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個富含尿苷或經修飾尿苷之多核苷酸束)。在一些實施例中,IRES包含2至10個富含尿苷或經修飾尿苷之多核苷酸束。在一些實施例中,IRES包含3至6個富含尿苷或經修飾尿苷之多核苷酸束。
在一些實施例中,每一多核苷酸束中至少70%之核苷為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷(例如每一多核苷酸束中70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%之核苷可為尿苷、經修飾尿苷、胞苷或經修飾胞苷)。在一些實施例中,每一多核苷酸束中至少75%之核苷為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷。在一些實施例中,每一多核苷酸束中至少80%之核苷為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷。在一些實施例中,每一多核苷酸束中至少85%之核苷為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷。在一些實施例中,每一多核苷酸束中至少90%之核苷為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷。在一些實施例中,每一多核苷酸束中至少95%之核苷為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷。在一些實施例中,每一多核苷酸束中之所有核苷均為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷。
在一些實施例中,每一多核苷酸束之長度獨立地為5至20個核苷(例如長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷)。在一些實施例中,每一多核苷酸束之長度獨立地為5至19個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至18個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至17個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至16個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至15個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至14個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至13個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至12個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至11個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至10個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至15個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至14個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至13個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至12個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至11個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至10個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至15個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至14個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至13個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至12個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至11個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至10個核苷。在一些實施例中,每一多核苷酸束之長度為9個核苷。
在一些實施例中,每一多核苷酸束獨立地包含5至20個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷,諸如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含6至15個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含6至14個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含6至13個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含6至12個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含6至11個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含6至10個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含7至15個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含7至14個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含7至13個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含7至12個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含7至11個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含7至10個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。
在一些實施例中,每一多核苷酸束包含至少9個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。在一些實施例中,每一多核苷酸束包含9個鄰接含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷)。
在一些實施例中,一或多個(或全部)多核苷酸束富含經修飾尿苷。在一些實施例中,經修飾尿苷為1-甲基假尿苷。在其他實施例中,經修飾尿苷為假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在較佳實施例中,經修飾尿苷為1-甲基假尿苷。
在一些實施例中,IRES在尿苷處經100%修飾,且修飾係由1-甲基假尿苷組成。在一些實施例中,整個mRNA (包括IRES)在尿苷處經100%修飾,且修飾係由1-甲基假尿苷組成。
在一些實施例中,IRES不含尿苷之化學修飾。在一些實施例中,IRES不含其中任何核苷之化學修飾。
在一些實施例中,IRES位於核酸之非編碼區內。舉例而言,IRES可位於可操作地連接至開放閱讀框之5’非轉譯區(UTR)內。在一些實施例中,開放閱讀框進一步可操作地連接至3’ UTR。
在一些實施例中,多核苷酸束藉助一或多個間隔區彼此隔開,該一或多個間隔區各自獨立地包含5至100個核苷(例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷)。在一些實施例中,每一間隔區獨立地包含10至40個核苷(例如10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個核苷)。在一些實施例中,每一間隔區獨立地包含11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38個核苷。
在一些實施例中,IRES由下式表示:
[(
N)
n- (
U’)
m]
p其中:
每一
N獨立地為任何核苷殘基;
每一
U’獨立地為含嘧啶核苷(例如尿苷、經修飾尿苷、胞苷或經修飾胞苷核苷),較佳地其中每一
U’獨立地為尿苷或經修飾尿苷,甚至更佳地其中每一
U’獨立地為經修飾尿苷(例如1-甲基假尿苷);
每一n獨立地為1至100之整數(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100);
每一m獨立地為2至15之整數(例如2、3、4、5、6、7、8、9、10、11、12、13、14或15);且
p為2至20之整數(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)。
在一些實施例中,
N獨立地選自腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。在一些實施例中,每一
N獨立地選自腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
在一些實施例中,
N之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
在一些實施例中,
N之經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林(zebularine)、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶(lysidine)、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
在一些實施例中,
N之經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在一些實施例中,
N之經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷(wyosine)、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷(wybutosine)、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷(queuosine)、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷(archaeosine)、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
在一些實施例中,
U’之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
在一些實施例中,每一n獨立地為10至40之整數。在一些實施例中,每一n獨立地為11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38。在一些實施例中,每一m獨立地為2至15之整數。在一些實施例中,每一m獨立地為7至11之整數。在一些實施例中,每一m為9。在一些實施例中,p為2至10之整數。在一些實施例中,p為3至6之整數,視情況其中p為3或6。
在一些實施例中,核酸為RNA。在一些實施例中,核酸為線性的。在一些實施例中,核酸為環狀的。在一些實施例中,開放閱讀框係由選自以下之核苷組成:腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。在一些實施例中,開放閱讀框係由選自以下之核苷組成:腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
在一些實施例中,開放閱讀框之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,開放閱讀框之經修飾尿苷為1-甲基假尿苷。
在一些實施例中,
N之經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
在一些實施例中,
N之經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在一些實施例中,
N之經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
在一些實施例中,由開放閱讀框編碼之多肽為分泌蛋白(例如細胞介素、生長因子、酶、免疫調節劑、抗體或其抗原結合片段或細胞穿透肽)、細胞外膜結合蛋白、細胞內膜結合蛋白、細胞質蛋白、細胞骨架蛋白或核蛋白。
在一些實施例中,核酸不包含5’帽。
在一些實施例中,核酸包括與SEQ ID NO: 173-190及202-205中之任一者具有至少75%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173-190及202-205中之任一者具有至少80%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173-190及202-205中之任一者具有至少85%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173-190及202-205中之任一者具有至少90%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173-190及202-205中之任一者具有至少95%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括SEQ ID NO: 173-190及202-205中之任一者之核苷酸序列。
在一些實施例中,核酸包括與表2中所呈現之IRES序列(例如IRES 1至IRES 22中之任一者)具有約70%至約100% (例如約70%至約100%、約75%至約100%、約80%至約100%、約85%至約100%、約90%至約100%、約91%至約100%、約92%至約100%、約93%至約100%、約94%至約100%、約95%至約100%、約96%至約100%、約97%至約100%、約98%至約100%或約99%至100%)序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 173具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 173具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 174具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 174具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 175具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 175具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 176具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 176具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 177具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 177具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 178具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 178具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 179具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 179具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 180具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 180具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 181具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 181具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 182具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 182具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 183具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 183具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 184具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 184具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 185具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 185具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 186具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 186具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 187具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 187具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 188具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 188具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 189具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 189具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 190具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 190具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 202具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 202具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 203具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 203具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 204具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 204具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 205具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 205具有100%序列一致性之核苷酸序列。
在另一態樣中,本揭示案提供核酸,該核酸包含:
(i) IRES,其包含一或多個特異性結合轉譯起始因子(例如真核轉譯起始因子4 G (eIF4G)、真核轉譯起始因子4G2 (eIF4G2,亦稱為Dap5)、真核轉譯起始因子3 (eIF3))或IRES反式作用因子(ITAf) (諸如聚嘧啶束結合蛋白(PTBP))或融合蛋白(包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如La))之多核苷酸;該IRES可操作地連接至
(ii) 編碼多肽之開放閱讀框。
在一些實施例中,該一或多個多核苷酸特異性結合eIF4G、eIF4G2、eIF3、La蛋白或ITAF,諸如PTBP。在一些實施例中,該一或多個多核苷酸中之每一者獨立地具有與ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAA (SEQ ID NO: 1)至少75%一致之核酸序列。在一些實施例中,該一或多個多核苷酸中之每一者獨立地具有與SEQ ID NO: 1之核酸序列至少85%一致之核酸序列(例如與SEQ ID NO: 1之核酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致)。在一些實施例中,該一或多個多核苷酸中之每一者具有SEQ ID NO: 1之核酸序列。
在一些實施例中,SEQ ID NO: 1中之每一U殘基由經修飾尿苷置換,諸如1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,SEQ ID NO: 1中之每一U殘基經1-甲基假尿苷置換。
在一些實施例中,IRES包含一或多個特異性結合至融合蛋白之多核苷酸,該融合蛋白包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如PTBP)。作為非限制性實例,RNA結合蛋白可為MS2結合蛋白,且一或多個多核苷酸可包含一或多個MS2 RNA髮夾。
在一些實施例中,IRES包含複數個特異性結合轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如PTBP)或融合蛋白(包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如PTBP))之多核苷酸。在一些實施例中,IRES包含2至20個特異性結合轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如PTBP)或融合蛋白(包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如PTBP))之多核苷酸(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個特異性結合轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如PTBP)或融合蛋白(包含與RNA結合蛋白融合之轉譯起始因子(例如、eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如PTBP))之多核苷酸)。
在一些實施例中,IRES包含2至10個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白(例如2、3、4、5、6、7、8、9或10個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白)。
在一些實施例中,IRES包含3至9個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白(例如3、4、5、6、7、8或9個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白)。
在一些實施例中,IRES包含4至8個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白(例如4、5、6、7或8個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白)。
在一些實施例中,IRES包含5至7個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白(例如5、6或7個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白)。
在一些實施例中,IRES包含2個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含3個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含4個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含5個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含6個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含7個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含8個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含9個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。在一些實施例中,IRES包含10個特異性結合以下之多核苷酸:(a) eIF4G,(b) La蛋白,或(c)包含與RNA結合蛋白融合之eIF4G或La之融合蛋白。
在一些實施例中,核酸不包含5’帽。
在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少75%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少80%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少85%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少90%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少95%序列一致性百分比之核苷酸序列。在一些實施例中,核酸包括SEQ ID NO: 191-201中之任一者之核苷酸序列。
在一些實施例中,核酸包括與表3中所呈現之IRES序列(例如IRES 19至IRES 29中之任一者)具有約70%至約100% (例如約70%至約100%、約75%至約100%、約80%至約100%、約85%至約100%、約90%至約100%、約91%至約100%、約92%至約100%、約93%至約100%、約94%至約100%、約95%至約100%、約96%至約100%、約97%至約100%、約98%至約100%或約99%至100%)序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 191具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 192具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 192具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 193具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 193具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 194具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 194具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 195具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 195具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 196具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 196具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 197具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 197具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 198具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 198具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 199具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 199具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 200具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 200具有100%序列一致性之核苷酸序列。
在一些實施例中,核酸包括與SEQ ID NO: 201具有至少70%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少91%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少92%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少93%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少94%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少96%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少97%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少98%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有至少99%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 201具有100%序列一致性之核苷酸序列。
在另一態樣中,本揭示案提供核酸,該核酸包括:
(i) 內部核糖體進入位點(IRES),其包括具有足以與核糖體RNA (rRNA)內之區域雜交之互補性的核苷酸序列,該IRES可操作地連接至
(ii) 編碼多肽之開放閱讀框。
在一些實施例中,IRES不特異性結合至核糖體蛋白。
在一些實施例中,IRES之核苷酸序列與rRNA內之區域具有至少70%互補性,視情況其中IRES與rRNA內之區域具有至少71%、72%、73%、74%、85%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互補性。
在一些實施例中,IRES之核苷酸序列與rRNA區域內之至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或30或更多個鄰接核鹼基具有至少70%互補性。
在一些實施例中,IRES之核苷酸序列與rRNA區域內之至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或30或更多個鄰接核鹼基具有至少75%互補性,視情況其中該等核酸序列與rRNA區域內之該至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或30或更多個鄰接核鹼基具有至少76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互補性。
在一些實施例中,IRES之核苷酸序列包括至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或30個與rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
在一些實施例中,IRES之核苷酸序列包括10至30個與rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。在一些實施例中,IRES之核苷酸序列包括12至30個與rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。在一些實施例中,IRES之核苷酸序列包括15至30個與rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。在一些實施例中,IRES之核苷酸序列包括18至30個與rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。在一些實施例中,IRES之核苷酸序列包括20至30個與rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。在一些實施例中,IRES之核苷酸序列包括25至30個與rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
在一些實施例中,IRES之核苷酸序列相對於rRNA區域包括9個或更少之核苷酸錯配,視情況其中反義股相對於rRNA區域包括8個或更少、7個或更少、6個或更少、5個或更少、4個或更少、3個或更少、2個或更少或僅1個錯配。
在一些實施例中,IRES不包括經化學修飾之核苷。舉例而言,在一些實施例中,IRES包括僅選自腺苷、鳥苷、胞苷及尿苷之核苷。
在一些實施例中,IRES包括一或多個經化學修飾之核苷。在一些實施例中,IRES包括一或多個經化學修飾之腺苷、鳥苷、胞苷及/或尿苷核苷。
在一些實施例中,IRES中至少70%之核苷經化學修飾(例如,IRES中至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%之核苷經化學修飾)。
在一些實施例中,IRES中至少70%之腺苷核苷經化學修飾(例如,IRES中至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%之腺苷核苷經化學修飾)。
在一些實施例中,IRES包括一或多個經化學修飾之腺苷核苷。在一些實施例中,
N之經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在一些實施例中,IRES中至少70%之鳥苷核苷經化學修飾(例如,IRES中至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%之鳥苷核苷經化學修飾)。
在一些實施例中,IRES包括一或多個經化學修飾之鳥苷核苷。在一些實施例中,
N之經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
在一些實施例中,IRES中至少70%之胞苷核苷經化學修飾(例如,IRES中至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%之胞苷核苷經化學修飾)。
在一些實施例中,IRES包括一或多個經化學修飾之胞苷核苷。在一些實施例中,
N之經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
在一些實施例中,IRES中至少70%之尿苷核苷經化學修飾(例如,IRES中至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%之尿苷核苷經化學修飾)。
在一些實施例中,IRES包括一或多個經化學修飾之尿苷核苷。在一些實施例中,
N之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
在一些實施例中,IRES包括一或多個富含尿苷或經修飾尿苷之多核苷酸束。
在一些實施例中,IRES包括1至20個富含尿苷或經修飾尿苷之多核苷酸束。在一些實施例中,IRES包括2至10個富含尿苷或經修飾尿苷之多核苷酸束。在一些實施例中,IRES包括3至6個富含尿苷或經修飾尿苷之多核苷酸束。在一些實施例中,IRES包括3個富含尿苷或經修飾尿苷之多核苷酸束。在一些實施例中,IRES包括4個富含尿苷或經修飾尿苷之多核苷酸束。在一些實施例中,IRES包括5個富含尿苷或經修飾尿苷之多核苷酸束。在一些實施例中,IRES包括6個富含尿苷或經修飾尿苷之多核苷酸束。
在一些實施例中,每一多核苷酸束中至少70%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少75%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少80%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少85%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少90%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少95%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中之所有核苷均為尿苷或經修飾尿苷,較佳地其中每一多核苷酸束中之所有核苷均為經修飾尿苷。
在一些實施例中,每一多核苷酸束之長度獨立地為5至20個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至15個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至11個核苷。在一些實施例中,每一多核苷酸束之長度為9個核苷。
在一些實施例中,每一多核苷酸束獨立地包括5至20個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包括6至15個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包括7至11個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束包括至少9個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束包括9個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束富含經修飾尿苷。
在一些實施例中,經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,經修飾尿苷為1-甲基假尿苷。
在一些實施例中,IRES位於可操作地連接至開放閱讀框之核酸非編碼區(例如5’非轉譯區(UTR))內。在一些實施例中,開放閱讀框進一步可操作地連接至3’ UTR。
在一些實施例中,多核苷酸束藉助一或多個間隔區彼此隔開,該一或多個間隔區各自獨立地包括5至100個核苷。在一些實施例中,每一間隔區獨立地包括10至40個核苷。在一些實施例中,每一間隔區獨立地包括11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38個核苷。
在一些實施例中,IRES由下式表示:
[(
N)
n- (
U’)
m]
p其中:
每一
N獨立地為任何核苷殘基;
每一
U’獨立地為尿苷或經修飾尿苷;
每一n獨立地為1至100之整數;
每一m獨立地為2至15之整數;且
p為2至20之整數。
在一些實施例中,每一
N獨立地選自腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。在一些實施例中,每一
N獨立地選自腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
在一些實施例中,
N之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,
N之經修飾尿苷為1-甲基假尿苷。
在一些實施例中,
N之經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
在一些實施例中,
N之經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在一些實施例中,
N之經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
在一些實施例中,
U’之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,
U’之經修飾尿苷為1-甲基假尿苷。
在一些實施例中,每一n獨立地為10至40之整數。在一些實施例中,每一n獨立地為11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38。在一些實施例中,每一m獨立地為2至15之整數。在一些實施例中,每一m獨立地為7至11之整數。在一些實施例中,每一m為9。
在一些實施例中,p為2至10之整數。在一些實施例中,p為3至6之整數,視情況其中p為3或6。
在一些實施例中,核酸為RNA。在一些實施例中,核酸為線性的。在一些實施例中,核酸為環狀的。
在一些實施例中,開放閱讀框係由選自以下之核苷組成:腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。在一些實施例中,開放閱讀框係由選自以下之核苷組成:腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
在一些實施例中,開放閱讀框之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,開放閱讀框之經修飾尿苷為1-甲基假尿苷。
在一些實施例中,
N之經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
在一些實施例中,
N之經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在一些實施例中,
N之經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
在一些實施例中,由開放閱讀框編碼之多肽為分泌蛋白、細胞介素、生長因子、酶、免疫調節劑、抗體或其抗原結合片段、細胞穿透肽、細胞外膜結合蛋白、細胞內膜結合蛋白、細胞質蛋白、細胞骨架蛋白或核蛋白。
在一些實施例中,核酸不包括5’帽。在一些實施例中,核酸包括5’帽。
在一些實施例中,IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190包括至少75%之序列一致性。在一些實施例中,IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190包括至少80%之序列一致性。在一些實施例中,IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190包括至少85%之序列一致性。在一些實施例中,IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190具有至少90%之序列一致性。在一些實施例中,IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190具有至少95%之序列一致性,視情況其中IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190具有至少96%、97%、98%或99%之序列一致性。在一些實施例中,IRES之核苷酸序列為SEQ ID NO: 185或SEQ ID NO: 190。
在一些實施例中,IRES包括一或多個特異性結合轉譯起始因子(例如真核轉譯起始因子4 G (eIF4G)、真核轉譯起始因子4G2 (eIF4G2)、真核轉譯起始因子3 (eIF3)、La蛋白或IRES反式作用因子(ITAf))或融合蛋白(包括與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白或ITAf))之多核苷酸。在一些實施例中,該一或多個多核苷酸特異性結合eIF4G。
在一些實施例中,該一或多個多核苷酸中之每一者獨立地具有與ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAA (SEQ ID NO: 1)至少75%一致之核酸序列,視情況其中SEQ ID NO: 1中之每一U殘基經1-甲基假尿苷置換。
在一些實施例中,該一或多個多核苷酸中之每一者獨立地具有與SEQ ID NO: 1之核酸序列至少85%一致之核酸序列(例如與SEQ ID NO: 1之核酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致),視情況其中SEQ ID NO: 1中之每一U殘基經1-甲基假尿苷置換。
在一些實施例中,IRES包括一或多個特異性結合至融合蛋白(包括與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf))之多核苷酸,視情況其中該RNA結合蛋白為MS2結合蛋白且該一或多個多核苷酸包括一或多個MS2 RNA髮夾。
在一些實施例中,核酸不包括5’帽。在一些實施例中,核酸包括5’帽。
在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少75%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少80%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少85%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少90%序列一致性之核苷酸序列。在一些實施例中,核酸包括與SEQ ID NO: 191-201中之任一者具有至少95%序列一致性之核苷酸序列。在一些實施例中,核酸包括SEQ ID NO: 191-201中之任一者之核苷酸序列。
在一些實施例中,rRNA為真核rRNA。在一些實施例中,rRNA來自60S或40S核糖體亞單元,視情況其中rRNA選自由以下組成之群:25S、28S、18S、5.8S及5S rRNA。
在一些實施例中,在本揭示案之任一前述態樣或實施例中,圍繞IRES (例如相對於IRES之5’及/或3’)之核酸序列具有單股RNA結構。
在另一態樣中,本揭示案提供多肽表現系統,該系統包含:
(i) 前述態樣(或其任一上述實施例)之核酸;及
(ii) 包含編碼eIF4G、La蛋白或其功能變異體之開放閱讀框之核酸。
在一些實施例中,(i)之核酸與(ii)之核酸係單獨的分子。在一些實施例中,(ii)之核酸自5’至3’包含:
(i) 5’ UTR;
(ii) 編碼eIF4G、La蛋白或其功能變異體之開放閱讀框;及
(iii) 3’ UTR。
在一些實施例中,(ii)之核酸進一步包含可操作地連接至5’ UTR之5’帽。
在另一態樣中,本揭示案提供宿主細胞,其包含本揭示案之任一上述態樣或實施例之核酸或多肽表現系統。在一些實施例中,宿主細胞為真核細胞。在一些實施例中,真核細胞為哺乳動物細胞。在一些實施例中,哺乳動物細胞為人類細胞。
在另一態樣中,本揭示案提供在個體體內表現多肽之方法,該方法包括向該個體投與本揭示案之任一上述態樣或實施例之核酸或多肽表現系統。
在另一態樣中,本揭示案提供在細胞或細胞群體中表現多肽之方法,該方法包括向個體投與本揭示案之任一上述態樣或實施例之核酸或多肽表現系統。
在另一態樣中,本揭示案提供治療與內源性多肽缺乏相關之疾病或疾患之方法,該方法包括向個體投與本揭示案之任一上述態樣或實施例之核酸或多肽表現系統,前提條件為由該核酸或多肽表現系統編碼之多肽對應於其缺乏與該疾病或疾患相關之多肽。
序列表
本申請案含有序列表,其已以XML格式電子提交且以全文引用的方式併入本文中。該XML拷貝創建於2023年8月4日,命名為「50858-124TW2_Sequence_Listing_8_4_23」,且大小為313,370個位元組。
定義
為使本揭示案可更容易地理解,首先定義某些術語。如本申請案中所用,除非本文中另外明確提供,否則以下術語中之每一者應具有下文所陳述之含義。其他定義在本申請案中通篇予以陳述。
本揭示案包括其中恰好一個群組成員存在於、用於給定產物或製程或以其他方式與給定產物或製程相關之實施例。本發明包括其中一個以上或所有群組成員存在於、用於給定產物或製程或以其他方式與給定產物或製程相關之實施例。
在本說明書及隨附申請專利範圍中,除非上下文另外明確指示,否則單數形式「一個/種(a、an)」及「該(the)」包括複數個/種指示物。術語「一個/種(a)」(或「一個/種(an)」)以及術語「一或多個/種」及「至少一個/種」在本文中可互換使用。在某些態樣中,術語「一個/種(a或an)」意指「單一的」。在其他態樣中,術語「一個/種(a或an)」包括「兩個/種或更多個/種」或「多個/種」。
此外,「及/或」當在本文中使用時,應視為特定揭示兩種指定特徵或組分中之每一者與另一者一起或不與另一者一起之情況。因此,在本文中諸如「A及/或B」之片語中所用之術語「及/或」意欲包括「A及B」、「A或B」、「A」(單獨)及「B」(單獨)。同樣,在諸如「A、B及/或C」之片語中所用之術語「及/或」意欲涵蓋以下態樣中之每一者:A、B及C;A、B或C;A或C;A或B;B或C;A及C;A及B;B及C;A (單獨);B (單獨);及C (單獨)。
除非另有定義,否則本文中所用之所有技術及科學術語均具有與熟習本揭示案相關領域技術者所通常理解相同之含義。舉例而言,Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show,第2版,2002, CRC Press;The Dictionary of Cell and Molecular Biology,第3版,1999, Academic Press;及Oxford Dictionary of Biochemistry and Molecular Biology,修訂版,2000, Oxford University Press向熟習此項技術者提供本揭示案中所使用許多術語之一般性字典。
凡是本文用言語「包含」來闡述態樣之處,均亦提供以「由......組成」及/或「基本上由......組成」闡述之其他類似態樣。
倘若給出範圍,則端點包括在內。此外,除非另外指示或自上下文及熟習此項技術者之理解另外明顯可見,否則表述為範圍之值可在本揭示案之不同實施例中假設所陳述範圍內之任一具體值或子範圍,直至該範圍之下限單位之十分之一,除非上下文另外明確指示。
單位、前綴及符號係以其國際單位制(Système International de Unites,SI)接受之形式來表示。數值範圍包括界定該範圍之數值。倘若列舉值範圍,則應理解,亦具體地揭示在該範圍之所列舉上限與下限之間的每一居間整數值及其每一分率,以及此等值之間的每一子範圍。任何範圍之上限及下限可獨立地包括在該範圍中或自該範圍中排除,且本發明內亦涵蓋包括任一限值、兩個限值均不包括或兩個限值均包括在內之每一範圍。倘若明確列舉一值,則應理解,與所列舉值之數量或量大約相同之值亦在本揭示案之範圍內。倘若揭示一組合,則亦具體地揭示該組合之要素之每一子組合,且其在本揭示案之範圍內。相反,倘若個別地揭示不同要素或要素群,則亦揭示其組合。倘若發明之任何要素被揭示為具有複數個替代形式,則在此亦揭示該發明中每一替代形式被單獨地或以與其他替代形式之任何組合排除之實例;發明之一個以上要素可具有此等排除,且在此揭示具有此等排除之要素之所有組合。
如本文所用,術語「約」係指在所述值上下不超過10%之值。舉例而言,術語「約5 nM」指示4.5 nM至5.5 nM之範圍。
如本文所用,術語「生物相容」意指與活細胞、組織、器官或系統相容,造成損傷、毒性或免疫系統排斥之風險極小或沒有。
如本文所用,術語「生物可降解」意指能夠由生物作用分解成無害產物。
如本文所用,片語「具有生物活性」係指在生物系統及/或生物體中具有活性之任何物質之特性。舉例而言,在投與給生物體時,對該生物體具有生物效應之物質視為具有生物活性。在特定實施例中,即使本揭示案之多核苷酸之一部分具有生物活性或模擬視為生物相關之活性,亦可認為該多核苷酸具有生物活性。
如本文所用,術語「胺基酸取代」係指親代或參考多肽(例如本文所闡述之目標多肽)中所存在之胺基酸殘基經另一胺基酸殘基置換。例如,經由化學肽合成或經由此項技術中已知之重組方法,親代或參考序列中之胺基酸可被取代。因此,對「在位置X處取代」之提及係指位置X處存在之胺基酸經替代性胺基酸殘基取代。在一些態樣中,取代模式可根據圖式(scheme) AnY予以描述,其中A為對應於天然或最初存在於位置n處之胺基酸之單字母代碼,且Y為取代性胺基酸殘基。在一些態樣中,取代模式可根據圖式An(YZ)予以描述,其中A為對應於取代天然或最初存在於位置n處之胺基酸之胺基酸殘基之單字母代碼,且Y及Z為替代性取代胺基酸殘基。
在本揭示案之背景下,取代(即使當其稱為胺基酸取代時)可在核酸層面上進行,亦即,用替代性胺基酸殘基取代胺基酸殘基可藉由用編碼第二胺基酸之密碼子取代編碼第一胺基酸之密碼子來進行。
如本文所用,術語「保守性突變」、「保守性取代」、「保守性胺基酸取代」及諸如此類係指用一或多個胺基酸取代一或多個展現類似物理化學性質(諸如極性、靜電荷及/或空間體積)之不同胺基酸。二十種天然胺基酸各自之該等性質彙總於下
表 1中。
表 1. 天然胺基酸之代表性物理化學性質
胺基酸 | 3 字母代碼 | 1 字母代碼 | 側鏈極性 | 生理 pH (7.4) 下之靜電特性 | 空間體積 † |
丙胺酸 | Ala | A | 非極性 | 中性 | 小 |
精胺酸 | Arg | R | 極性 | 陽離子 | 大 |
天冬醯胺 | Asn | N | 極性 | 中性 | 中等 |
天冬胺酸 | Asp | D | 極性 | 陰離子 | 中等 |
半胱胺酸 | Cys | C | 非極性 | 中性 | 中等 |
麩胺酸 | Glu | E | 極性 | 陰離子 | 中等 |
麩醯胺酸 | Gln | Q | 極性 | 中性 | 中等 |
甘胺酸 | Gly | G | 非極性 | 中性 | 小 |
組胺酸 | His | H | 極性 | 中性及陽離子形式二者在pH 7.4下處於平衡狀態 | 大 |
異白胺酸 | Ile | I | 非極性 | 中性 | 大 |
白胺酸 | Leu | L | 非極性 | 中性 | 大 |
離胺酸 | Lys | K | 極性 | 陽離子 | 大 |
甲硫胺酸 | Met | M | 非極性 | 中性 | 大 |
苯丙胺酸 | Phe | F | 非極性 | 中性 | 大 |
脯胺酸 | Pro | P | 非極性 | 中性 | 中等 |
絲胺酸 | Ser | S | 極性 | 中性 | 小 |
蘇胺酸 | Thr | T | 極性 | 中性 | 中等 |
色胺酸 | Trp | W | 非極性 | 中性 | 龐大 |
酪胺酸 | Tyr | Y | 極性 | 中性 | 大 |
纈胺酸 | Val | V | 非極性 | 中性 | 中等 |
†基於A 3之體積:50-100為小,100-150為中等, | |||||
150-200為大,且>200為龐大 |
根據該表,應瞭解,保守性胺基酸家族包括(例如) (i) G、A、V、L、I、P及M;(ii) D及E;(iii) C、S及T;(iv) H、K及R;(v) N及Q;及(vi) F、Y及W。因此,保守性突變或取代係用一個胺基酸取代同一胺基酸家族之成員之突變或取代(例如用Ser取代Thr或用Lys取代Arg)。
如本文所用,術語「結合物」係指藉由一個分子之反應性官能基與另一分子之適當反應性官能基之化學鍵結所形成的化合物。結合物可另外產生,例如作為單一多肽鏈之一部分的彼此共價結合之兩個多肽結構域,該單一多肽鏈係藉由轉譯編碼彼此符合讀框之兩個多肽之單一RNA轉錄本來合成。
如本文所用,術語「序列最佳化」係指一個過程或一系列過程,藉由該(等)過程,參考核酸序列中之核鹼基經替代性核鹼基置換,產生具有改良性質(例如改良之蛋白質表現或降低之免疫原性)之核酸序列。
一般而言,序列最佳化之目標係產生編碼由參考核苷酸序列編碼之相同多肽序列之同義核苷酸序列。因此,相對於參考核苷酸序列編碼之多肽,密碼子最佳化核苷酸序列編碼之多肽中無胺基酸取代(密碼子最佳化之結果)。
如本文所用,在序列最佳化之背景中,術語「密碼子取代」或「密碼子置換」係指用另一密碼子置換參考核酸序列中所存在之密碼子。例如,經由化學肽合成或經由此項技術中已知之重組方法,參考核酸序列中之密碼子可被取代。因此,對核酸序列(例如mRNA)中某一位置處或核酸序列(例如mRNA)之某一區域或子序列內之「取代」或「置換」之提及係指在此位置或區域用替代性密碼子取代密碼子。
如本文所用,術語「編碼區」及「編碼......之區」及其文法變化形式係指多核苷酸中之開放閱讀框(ORF),其在表現時產生多肽或蛋白質。
如本文所用,術語「足以雜交之互補性」係指不需要與靶區完全互補(例如100%互補)之核酸序列或其一部分,或相對於靶區具有一或多個核苷酸錯配,但在指定條件下仍能夠與靶區雜交之核酸序列或其一部分。舉例而言,核酸可例如與靶標95%互補、90%互補、85%互補、80%互補、75%互補、70%互補、65%互補、60%互補、55%互補、50%互補或互補性更少,但仍與靶標形成足夠的鹼基對,以便跨其長度雜交。
如本文所用,術語「接觸」意指在兩個或更多個實體之間建立物理連結。舉例而言,使哺乳動物細胞與奈米顆粒組合物接觸意味著使哺乳動物細胞與奈米顆粒共享物理連結。在活體內及離體使細胞與外部實體接觸之方法為生物技術中所熟知。舉例而言,使奈米顆粒組合物與分佈在哺乳動物體內之哺乳動物細胞接觸可藉由不同的投與途徑(例如靜脈內、肌內、真皮內及皮下)來實施,且可涉及不同量之奈米顆粒組合物。此外,奈米顆粒組合物可接觸一種以上哺乳動物細胞。
如本文所用,術語「遞送」意指將實體提供至目的地。舉例而言,將多核苷酸遞送至個體可涉及向該個體投與包括該多核苷酸之奈米顆粒組合物(例如藉由靜脈內、肌內、真皮內或皮下途徑)。將奈米顆粒組合物投與給哺乳動物或哺乳動物細胞可涉及使一或多種細胞與奈米顆粒組合物接觸。
如本文所用,「遞送劑」係指至少部分地有助於多核苷酸在活體內、活體外或離體遞送至靶細胞之任何物質。
如本文所用,核酸序列之「表現」係指以下事件中之一或多者:(1)自DNA序列產生mRNA模板(例如藉由轉錄);(2) mRNA轉錄本之加工(例如藉由剪接、編輯、5'帽形成及/或3'端加工);(3) mRNA轉譯成多肽或蛋白質;及(4)多肽或蛋白質之轉譯後修飾。
如本文所用,術語「脂質奈米顆粒」係指包括一或多種脂質(例如陽離子脂質、非陽離子脂質及PEG修飾脂質)之轉移媒介。例示性脂質奈米顆粒經調配以將一或多種mRNA遞送至一或多種靶細胞。適宜脂質之實例包括例如磷脂醯化合物(例如磷脂醯甘油、磷脂醯膽鹼、磷脂醯絲胺酸、磷脂醯乙醇胺、神經鞘脂、腦苷脂及神經節苷脂)。脂質奈米顆粒可含有陽離子脂質或在選定pH (例如生理pH)下具有淨正電荷之脂質種類,以囊封及/或增強mRNA向靶細胞中之遞送。
如本文所用,術語「輔助脂質」係指包括脂質部分(用於插入至脂質層(例如脂質雙層)中)及極性部分(用於與脂質層表面之生理溶液相互作用)之化合物或分子。通常,輔助脂質為磷脂。輔助脂質之功能為「補充」胺基脂質且增加雙層之融合性及/或幫助促進例如遞送至細胞之核酸之胞內體逃逸。據信,輔助脂質亦為LNP表面之關鍵結構組分。
如本文所用,術語「可電離胺基脂質」包括具有一個、兩個、三個或更多個脂肪酸或脂肪烷基鏈及pH可滴定胺基頭基(例如烷基胺基或二烷基胺基頭基)之彼等脂質。可電離胺基脂質在低於胺基頭基之pKa之pH下通常經質子化(亦即帶正電荷),且在高於該pKa之pH下實質上不帶電荷。此等可電離胺基脂質包括(但不限於) DLin-MC3-DMA (MC3)、(13Z,165Z)-N,N-二甲基-3-九-二十二-13-16-二烯-1-胺(L608)及本文所闡述之式I、式II及式II中之任一者之化合物(例如化合物I-1、化合物I-2、化合物I-3或化合物I-VI中之任一者)。
如本文所用,「連接體」係指一組原子,例如10-1,000個原子,且可包含原子或基團,諸如(但不限於)碳、胺基、烷基胺基、氧、硫、亞碸、磺醯基、羰基及亞胺。連接體可在第一端連接至核鹼基或糖部分上之經修飾核苷或核苷酸,且在第二端連接至有效載荷,例如可偵測劑或治療劑。連接體可具有足夠長度以不干擾在核酸序列中之併入。如本文所闡述,連接體可用於任何有用目的,諸如形成多核苷酸多聚體(例如,經由兩個或更多個嵌合多核苷酸分子或IVT多核苷酸之鍵聯)或多核苷酸結合物,以及投與有效載荷。如本文所闡述,可併入至連接體中之化學基團之實例包括(但不限於)烷基、烯基、炔基、醯胺基、胺基、醚、硫醚、酯、伸烷基、伸雜烷基、芳基或雜環基,其各自可視情況經取代。連接體之實例包括(但不限於)不飽和烷烴、聚乙二醇(例如乙二醇或丙二醇單體單元,例如二乙二醇、二丙二醇、三乙二醇、三丙二醇、四乙二醇或四乙二醇),以及聚葡萄糖聚合物及其衍生物。其他實例包括(但不限於)連接體內之可裂解部分,諸如二硫鍵(-S-S-)或偶氮鍵(-N=N-),其可使用還原劑或光解來裂解。可選擇性地裂解之鍵的非限制性實例包括醯胺鍵,其可例如藉由使用參(2-羧基乙基)膦(TCEP)或其他還原劑及/或光解來裂解,以及酯鍵,其可例如藉由酸性或鹼性水解來裂解。
如本文所用,術語「信使RNA」或「mRNA」係指編碼所關注多肽且能夠經轉譯以在活體外、活體內、原位或離體產生所編碼之關注多肽之任何多核苷酸。傳統上,mRNA分子之基本組件包括編碼區、5’UTR、3’UTR、5’帽及聚A尾。
如本文所用,術語「經修飾」係指本揭示案分子之經改變狀態或結構。分子可以許多方式經修飾,包括以化學方式、以結構方式及以功能方式。在一些實施例中,藉由引入非天然核苷及/或核苷酸使本揭示案之mRNA分子經修飾,例如當其涉及天然核糖核苷酸A、U、G及/或C時。本文提供「經修飾」核苷之實例。
如本文所用,術語「經修飾之信使RNA」或「經修飾之mRNA」係指包括例如糖、核鹼基或核苷間鍵聯(例如與連接性磷酸酯、磷酸二酯鍵聯或磷酸二酯主鏈之核苷間鍵聯)之天然及/或非天然修飾之mRNA多核苷酸。非天然修飾之核苷酸可在多核苷酸之合成期間或合成後引入,以達成期望功能或性質。修飾可存在於核苷間鍵聯、嘌呤或嘧啶鹼基或糖上。修飾可利用化學合成或利用聚合酶在鏈末端或鏈中之任何其他位置處引入。多核苷酸之任一區域均可經化學修飾。
如本文所用,「未經修飾」係指在以某種方式改變之前的任何物質、化合物或分子。未經修飾可(但不總是)指生物分子之野生型或天然形式。分子可經歷一系列修飾,藉此每一經修飾之分子可用作後續修飾之「未經修飾」之起始分子。
尿嘧啶係RNA核酸中之四種核鹼基之一,且其由字母U表示。尿嘧啶可連接至核糖環,或更具體而言,經由N
1-糖苷鍵連接至呋喃核糖,以產生核苷尿苷。核苷尿苷通常亦根據其核鹼基之單字母代碼予以縮寫,亦即U。因此,在本揭示案之背景下,當多核苷酸序列中之單體為U時,此U可互換地稱為「尿嘧啶」或「尿苷」。
術語「尿苷含量」或「尿嘧啶含量」可互換且係指某一核酸序列中所存在之尿嘧啶或尿苷量。尿苷含量或尿嘧啶含量可表示為絕對值(序列中尿苷或尿嘧啶之總數)或相對值(尿苷或尿嘧啶相對於核酸序列中核鹼基總數之百分比)。
術語「尿苷修飾之序列」係指相對於候選核酸序列之尿苷含量及/或尿苷模式,具有不同的總體或局部尿苷含量(更高或更低之尿苷含量)或具有不同的尿苷模式(例如梯度分佈或群集)之序列最佳化核酸(例如合成mRNA序列)。在本揭示案之內容中,術語「尿苷修飾之序列」及「尿嘧啶修飾之序列」視為等同的且可互換。
「高尿苷密碼子」定義為包含兩個或三個尿苷之密碼子,「低尿苷密碼子」定義為包含一個尿苷之密碼子,且「無尿苷密碼子」係不含任何尿苷之密碼子。在一些實施例中,尿苷修飾之序列包含用低尿苷密碼子取代高尿苷密碼子、用無尿苷密碼子取代高尿苷密碼子、用高尿苷密碼子取代低尿苷密碼子、用無尿苷密碼子取代低尿苷密碼子、用低尿苷密碼子取代無尿苷密碼子、用高尿苷密碼子取代無尿苷密碼子及其組合。在一些實施例中,高尿苷密碼子可經另一高尿苷密碼子置換。在一些實施例中,低尿苷密碼子可經另一低尿苷密碼子置換。在一些實施例中,無尿苷密碼子可經另一無尿苷密碼子置換。尿苷修飾之序列可富含尿苷或尿苷稀少。
如本文所用,術語「富含尿苷」及文法變化形式係指相對於相應候選核酸序列之尿苷含量,序列最佳化核酸(例如合成mRNA序列)中之尿苷含量增加(以絕對值或以百分比值表示)。尿苷富集可藉由用含有較少尿苷核鹼基之同義密碼子取代候選核酸序列中之密碼子來實施。尿苷富集可為全域的(亦即相對於候選核酸序列之整個長度)或局部的(亦即相對於候選核酸序列之子序列或區域)。
如本文所用,術語「尿苷稀少」及文法變化形式係指相對於相應候選核酸序列之尿苷含量,序列最佳化核酸(例如合成mRNA序列)中之尿苷含量減少(以絕對值或以百分比值表示)。尿苷變稀少可藉由用含有較少尿苷核鹼基之同義密碼子取代候選核酸序列中之密碼子來實施。尿苷變稀少可為全域的(亦即相對於候選核酸序列之整個長度)或局部的(亦即相對於候選核酸序列之子序列或區域)。
如本文所用,術語「起始密碼子(initiation codon)」可與術語「起始密碼子(start codon)」互換使用,係指開放閱讀框之第一密碼子,其由核糖體轉譯且包含連接之腺嘌呤-尿嘧啶-鳥嘌呤核鹼基之三聯體。起始密碼子由腺嘌呤(A)、尿嘧啶(U)及鳥嘌呤(G)之首字母代碼繪示,且通常簡寫為「AUG」。儘管天然mRNA可使用除AUG以外之密碼子作為起始密碼子,其在本文中稱為「替代性起始密碼子」,但本文所闡述之多核苷酸之起始密碼子使用AUG密碼子。在轉譯起始過程期間,包含起始密碼子之序列經由與由核糖體結合之起始tRNA (Met-tRNA
i Met)之反密碼子的互補鹼基配對來識別。開放閱讀框可含有一個以上AUG起始密碼子,其在本文中稱為「替代性起始密碼子」。
起始密碼子在轉譯起始中起重要作用。起始密碼子係開放閱讀框之第一密碼子,其由核糖體轉譯。通常,起始密碼子包含核苷酸三聯體AUG,然而,在一些情況下,轉譯起始可在包含不同核苷酸之其他密碼子處發生。真核生物中之轉譯起始係一種多步生物化學過程,其涉及信使RNA分子(mRNA)、40S核糖體亞單元、轉譯機構之其他組件(例如真核生物起始因子;eIF)之間的眾多蛋白質-蛋白質、蛋白質-RNA及RNA-RNA相互作用。目前的mRNA轉譯起始模型假定,藉由以5'至3'方向掃描核苷酸,直至遇到位於特定轉譯促進性核苷酸背景(Kozak序列)內之第一AUG密碼子為止,起始前複合物(或者「43S起始前複合物」;縮寫為「PIC」)自mRNA上之募集位點(通常5'帽)易位至起始密碼子(Kozak (1989) J Cell Biol 108:229-241)。PIC掃描在包含起始Met-tRNA
i Met轉移RNA之反密碼子之核苷酸與包含mRNA之起始密碼子之核苷酸之間的互補鹼基配對後結束。AUG密碼子與Met-tRNA
i Met反密碼子之間的富有成效的鹼基配對引發一系列結構及生物化學事件,最終導致大60S核糖體亞單元與PIC接合,形成具有轉譯延伸能力之活性核糖體。
術語「Kozak序列」(亦稱為「Kozak一致序列」)係指增強基因或開放閱讀框之表現之轉譯起始增強子元件,且在真核生物中,其位於5' UTR中。在對起始密碼子(AUG)周圍之單一突變對前胰島素原基因轉譯之效應進行分析後,Kozak一致序列最初定義為序列GCCRCC (SEQ ID NO: 2),其中R =嘌呤(Kozak (1986) Cell 44:283-292)。本文所揭示之多核苷酸包含Kozak一致序列或其衍生物或修飾形式。(轉譯增強子組合物之實例及其使用方法參見Andrews等人之美國專利第5,807,707號,其係以全文引用的方式併入本文中;Chernajovsky之美國專利第5,723,332號,其係以全文引用的方式併入本文中;Wilson之美國專利第5,891,665號,其係以全文引用的方式併入本文中。)
如本文所用,術語「核鹼基」(或者「核苷酸鹼基」或「含氮鹼基」)係指在核酸中發現的嘌呤或嘧啶雜環化合物,包括賦予核酸或其一部分或區段改良之性質(例如結合親和力、核酸酶抗性、化學穩定性)之天然嘌呤及嘧啶之任何衍生物或類似物。腺嘌呤、胞嘧啶、鳥嘌呤、胸腺嘧啶及尿嘧啶係主要在天然核酸中發現之核鹼基。可將如此項技術中所已知及/或本文所闡述之其他天然、非天然及/或合成核鹼基併入至核酸中。除非另外指定,否則本文所闡述之SEQ ID NO之核鹼基序列涵蓋天然核鹼基及經化學修飾之核鹼基二者(例如,SEQ ID NO中之「U」名稱涵蓋尿嘧啶及經化學修飾之尿嘧啶二者)。
如本文所用,術語「核苷」係指含有共價連接至核鹼基(例如嘌呤或嘧啶)或其衍生物或類似物(本文中亦稱為「核鹼基」)之糖分子(例如RNA中之核糖或DNA中之去氧核糖)或其衍生物或類似物、但缺少核苷間連接基團(例如磷酸酯基)之化合物。如本文所用,術語「核苷酸」係指共價鍵結至核苷間連接基團(例如磷酸酯基)或其任何衍生物、類似物或修飾之核苷,該核苷間連接基團(例如磷酸酯基)或其任何衍生物、類似物或修飾賦予核酸或其一部分或區段改良的化學及/或功能性質(例如結合親和力、核酸酶抗性、化學穩定性)。
如本文所用,術語「開放閱讀框」縮寫為「ORF」,係指mRNA分子中編碼多肽之區段或區域。ORF包含一段連續的非重疊符合讀框密碼子,以起始密碼子開始且以終止密碼子結束,且其由核糖體轉譯。
如本文所用,術語「轉譯調控活性」(可與「轉譯調控功能」互換使用)係指調節(例如調控、影響、控制、改變)轉譯器之活性(包括PIC及/或核糖體之活性)之生物功能、機制或過程。在一些態樣中,期望之轉譯調控活性促進及/或增強mRNA轉譯之轉譯保真度。在一些態樣中,期望之轉譯調控活性減少/或抑制漏掃描。
如本文所用,術語「核酸」及「多核苷酸」可互換使用。在其最廣泛意義上,該等術語包括包含核苷酸聚合物之任何化合物及/或物質。本揭示案之例示性核酸或多核苷酸包括(但不限於)核糖核酸(RNA)、去氧核糖核酸(DNA)、蘇糖核酸(TNA)、二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA,包括具有β-D-核糖構形之LNA、具有α-L-核糖構形之α-LNA (LNA之非鏡像異構物)、具有2'-胺基官能化之2'-胺基-LNA及具有2'-胺基官能化之2'-胺基-α-LNA)、乙烯核酸(ENA)、環己烯基核酸(CeNA)或其雜合體或組合。
本揭示案之核酸分子可為例如三股、雙股及單股去氧核糖核酸(「DNA」),以及三股、雙股及單股核糖核酸(「RNA」)。此術語亦包括相應未經修飾核酸之經修飾(例如藉由烷基化及/或藉由加帽)及未經修飾之形式。在特定態樣中,核酸包含mRNA。在其他態樣中,mRNA為合成mRNA。在一些態樣中,合成mRNA包含至少一個非天然核鹼基。在一些態樣中,某一類別之所有核鹼基均已經非天然核鹼基置換(例如本文所揭示之多核苷酸中之所有尿苷均可經非天然核鹼基(例如1-甲基假尿苷)置換)。在一些態樣中,多核苷酸(例如合成RNA或合成DNA)僅包含天然核鹼基,亦即在合成DNA之情形下為A (腺苷)、G (鳥苷)、C (胞苷)及T (胸苷),或在合成RNA之情形下為A、C、G及U (尿苷)。
熟習此項技術者應瞭解,本文所揭示之密碼子圖中的T鹼基存在於DNA中,而該等T鹼基將經相應RNA中之U鹼基置換。舉例而言,本文所揭示之呈DNA形式之密碼子-核苷酸序列(例如載體或活體外轉譯(IVT)模板)將在其相應轉錄mRNA中使其T鹼基轉錄為U鹼基。就此而言,經密碼子最佳化之DNA序列(包含T)及其相應mRNA序列(包含U)二者均視為本揭示案之經密碼子最佳化之核苷酸序列。熟習此項技術者亦應理解,等效密碼子圖可藉由用非天然鹼基置換一或多個鹼基來產生。因此,例如TTC密碼子(DNA圖)將對應於UUC密碼子(RNA圖),該UUC密碼子繼而將對應於ΨΨC密碼子(U經假尿苷置換之RNA圖)。
標準A-T及G-C鹼基對在容許分別在胸苷之N3-H及C4-氧基與腺苷之N1及C6-NH2之間以及分別在胞苷之C2-氧基、N3及C4-NH2與鳥苷之C2-NH2、N'-H及C6-氧基之間形成氫鍵的條件下形成。因此,舉例而言,鳥苷(2-胺基-6-氧基-9-β-D-呋喃核糖基-嘌呤)可經修飾以形成異鳥苷(2-氧基-6-胺基-9-β-D-呋喃核糖基-嘌呤)。此修飾產生不再有效地與胞嘧啶形成標準鹼基對之核苷鹼基。然而,對胞嘧啶(1-β-D-呋喃核糖基-2-氧基-4-胺基-嘧啶)進行修飾以形成異胞嘧啶(1-β-D-呋喃核糖基-2-胺基-4-氧基-嘧啶-)產生不會與鳥苷有效地鹼基配對,而會與異鳥苷形成鹼基對的經修飾核苷酸(Collins等人之美國專利第5,681,702號)。異胞嘧啶可自Sigma Chemical Co. (St. Louis, Mo.)獲得;異胞苷可藉由Switzer等人(1993) Biochemistry 32:10489-10496及其中引用之參考文獻所闡述之方法製備;2'-去氧-5-甲基-異胞苷可藉由Tor等人,1993, J. Am. Chem. Soc. 115:4461-4467及其中引用之參考文獻之方法製備;且異鳥嘌呤核苷酸可使用Switzer等人,1993,上文文獻,及Mantsch等人,1993, Biochem. 14:5593-5601所闡述之方法或藉由Collins等人之美國專利第5,780,610號中所闡述之方法製備。其他非天然鹼基對可藉由Piccirilli等人,1990, Nature 343:33-37中所闡述之用於合成2,6-二胺基嘧啶及其互補物(1-甲基吡唑并-[4,3]嘧啶-5,7-(4H,6H)-二酮)之方法合成。形成獨特鹼基對之其他此等經修飾之核苷酸單元係已知的,諸如Leach等人(1992) J. Am. Chem. Soc. 114:3675-3683及Switzer等人,上文文獻中所闡述者。
核苷酸係由其公認之單字母代碼來提及。除非另有指示,否則核酸係以5'至3'定向自左向右書寫。核鹼基在本文中係由其普遍已知之由IUPAC-IUB生化命名委員會(Biochemical Nomenclature Commission)推薦之單字母符號來提及。因此,A表示腺嘌呤,C表示胞嘧啶,G表示鳥嘌呤,T表示胸腺嘧啶,U表示尿嘧啶。
根據本文所揭示之組合物及方法,核酸或多核苷酸可「富含」某些核苷。如在此背景中所用,術語「富集」係指多核苷酸內至少50%之核苷相同之多核苷酸。舉例而言,若多核苷酸中至少50% (例如51%、52%、53%、54%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)之核苷為尿苷核苷,則稱該多核苷酸「富含」尿苷。在另一實例中,若多核苷酸中至少50% (例如51%、52%、53%、54%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)之核苷為經修飾之尿苷核苷(例如1-甲基假尿苷),則稱該多核苷酸「富含」經修飾之尿苷核苷(例如1-甲基假尿苷)。
如本文所用,某些核苷殘基「富集」之多核苷酸可藉助間隔區彼此隔開。在此背景下,「間隔區」係指不編碼多肽(亦即不含可操作地連接至胺基酸編碼密碼子之連續區段之起始密碼子),且不富含與毗鄰該間隔區之富集多核苷酸相同的核苷之多核苷酸。在一些實施例中,間隔區可富含與毗鄰該間隔區之富集多核苷酸不同的核苷。間隔區之長度可為例如5至100個核苷,諸如長度為10至40個核苷(例如,長度為10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個核苷)。
術語「多肽」、「肽」及「蛋白質」在本文中可互換使用,以指任何長度之胺基酸聚合物。聚合物可包含經修飾之胺基酸。該等術語亦涵蓋經天然或間插修飾之胺基酸聚合物;例如,二硫鍵形成、糖基化、脂化、乙醯化、磷酸化或任何其他操縱或修飾(諸如與標記組分結合)。該定義內亦包括例如含有胺基酸(包括例如非天然胺基酸,諸如高半胱胺酸、鳥胺酸、對乙醯基苯丙胺酸、D-胺基酸及肌酸)之一或多種類似物之多肽,以及此項技術中已知之其他修飾。
如本文所用,該術語係指任何大小、結構或功能之蛋白質、多肽及肽。多肽包括所編碼之多核苷酸產物、天然多肽、合成多肽、同系物、異種同源物、同種同源物、片段及前述物質之其他等效物、變異體及類似物。多肽可為單體或可為多分子複合物,諸如二聚體、三聚體或四聚體。其亦可包含單鏈或多鏈多肽。最常見地,在多鏈多肽中發現二硫鍵聯。術語多肽亦可應用於胺基酸聚合物,其中一或多個胺基酸殘基為相應天然胺基酸之人工化學類似物。在一些實施例中,「肽」之長度可小於或等於50個胺基酸,例如長度為約5、10、15、20、25、30、35、40、45或50個胺基酸。
胺基酸在本文中係由其普遍已知之三字母符號或由IUPAC-IUB生化命名委員會推薦之單字母符號來提及。除非另外指示,否則胺基酸序列係以胺基至羧基定向自左向右書寫。
相對於參考多核苷酸序列之「序列互補性百分比(%)」係定義為在將序列對齊且引入空位(若需要)以達成最大序列互補性百分比之後,候選序列中與參考多核苷酸序列中之核酸互補的核酸之百分比。若給定核苷酸與如本文所闡述之參考核苷酸形成典型之沃森-克里克(Watson-Crick)鹼基對,則認為該兩個核苷酸「互補」。為避免產生疑問,在本揭示案之背景中,沃森-克里克鹼基對包括腺嘌呤-胸腺嘧啶、腺嘌呤-尿嘧啶及胞嘧啶-鳥嘌呤鹼基對。在此背景下,正確的沃森-克里克鹼基對稱為「匹配」,而每一未配對之核苷酸及每一不正確配對之核苷酸稱為「錯配」。出於確定核酸序列互補性百分比之目的,對齊可以熟習此項技術者能力範圍內之各種方式來達成,例如使用可公開獲得之電腦軟體,諸如BLAST、BLAST-2或Megalign軟體。熟習此項技術者可確定用於對齊序列之適當參數,包括在所比較序列之全長範圍內達成最大互補性所需要之任何演算法。作為闡釋,如下計算給定核酸序列A與給定核酸序列B之序列互補性百分比(或者其可表述為與給定核酸序列B具有一定互補性百分比之給定核酸序列A):
100 × (分率X/Y)
其中X為在A與B之程式對齊中,對齊(例如,如由電腦軟體諸如BLAST執行)中互補鹼基對之數量,且其中Y為B中之核酸總數。將瞭解,倘若核酸序列A之長度不等於核酸序列B之長度,則A與B之序列互補性百分比將不等於B與A之序列互補性百分比。如本文所用,若查詢核酸序列與參考核酸序列具有100%序列互補性,則認為該查詢核酸序列與該參考核酸序列「完全互補」。
如本文所用,術語相對於參考多核苷酸或多肽序列之「序列一致性百分比(%)」、「一致性百分比(%)」及諸如此類係定義為在將序列對齊且引入空位(若需要)以達成最大序列一致性百分比之後,候選序列中與參考多核苷酸或多肽序列中之核酸或胺基酸一致之核酸或胺基酸之百分比。出於確定核酸或胺基酸序列一致性百分比之目的,對齊可以熟習此項技術者能力範圍內之各種方式來達成,例如使用可公開獲得之電腦軟體,諸如BLAST、BLAST-2或Megalign軟體。熟習此項技術者可確定用於對齊序列之適當參數,包括在所比較序列之全長範圍內達成最大對齊所需要之任何演算法。舉例而言,序列一致性百分比值可使用序列比較電腦程式BLAST來生成。作為闡釋,如下計算給定核酸或胺基酸序列A相對於(to)、與(with)或針對(against)給定核酸或胺基酸序列B之序列一致性百分比(或者其可表述為相對於(to)、與(with)或針對(against)給定核酸或胺基酸序列B具有一定序列一致性百分比之給定核酸或胺基酸序列A):
100 × (分率X/Y)
其中X為在A與B之程式對齊中,由序列對齊程式(例如BLAST)評分為一致匹配之核苷酸或胺基酸之數量,且其中Y為B中核酸之總數。將瞭解,倘若核酸或胺基酸序列A之長度不等於核酸或胺基酸序列B之長度,則A與B之序列一致性百分比將不等於B與A之序列一致性百分比。
如本文所用,在多核苷酸片段之背景中,術語「可操作地連接」意欲意指兩個多核苷酸片段經接合使得由該兩個多核苷酸片段編碼之胺基酸序列保持符合讀框。
如本文所用,術語「藥物動力學」係指分子或化合物之任一或多種性質,此乃因其涉及確定投與給活生物體之物質之命運。藥物動力學分為若干個領域,包括吸收、分佈、代謝及排泄之程度及速率。此通常稱為ADME,其中:(A)吸收係物質進入血液循環之過程;(D)分佈係物質在整個身體之體液及組織中之分散或散佈;(M)代謝(或生物轉變)係母體化合物不可逆地轉變成子體代謝物;及(E)排泄(或消除)係指物質自體內消除。在極少數情形下,一些藥物不可逆地在身體組織中累積。
如本文所用,術語「調控序列」包括控制例如本文所闡述之開放閱讀框之轉錄或轉譯之啟動子、增強子及其他表現控制元件(例如多聚腺苷酸化信號)。此等調控序列闡述於(例如) Goeddel, Gene Expression Technology: Methods in Enzymology 185 (Academic Press, San Diego, CA, 1990)中;其係以引用的方式併入本文中。
如本文所用,片語「信號序列」、「信號肽」及「轉運肽」可互換使用,且係指可引導蛋白質轉運或定位至某一細胞器、細胞區室或細胞外出口之序列。該術語涵蓋信號序列多肽及編碼信號序列之核酸序列二者。因此,在核酸之背景中,對信號序列之提及實際上係指編碼信號序列多肽之核酸序列。
如本文所用,術語「相似性」係指聚合分子之間的總體相關性,例如多核苷酸分子(例如DNA分子及/或RNA分子)之間及/或多肽分子之間。可以與計算一致性百分比相同之方式來計算聚合分子彼此之相似性百分比,只是相似性百分比之計算考慮如此項技術中所理解之保守性取代。
如本文所用,片語「特異性結合」係指決定蛋白質及其他生物分子之異源群體中存在抗原之結合反應,該抗原例如由具有特異性之蛋白質或核酸識別。特異性結合至抗原之蛋白質或核酸將以小於100 nM之K
D結合至抗原。舉例而言,特異性結合至抗原之蛋白質或核酸將以至多100 nM (例如介於1 pM與100 nM之間)的K
D結合至抗原。不展現出與特定抗原或其抗原決定基特異性結合之蛋白質或核酸將展現出大於100 nM (例如大於500 nm、1 μM、100 μM、500 μM或1 mM)之對該特定抗原或其抗原決定基之K
D。可使用多種免疫分析格式來選擇與特定蛋白質或碳水化合物特異性免疫反應之抗體。舉例而言,常規使用固相ELISA免疫分析來選擇與蛋白質或碳水化合物特異性免疫反應之抗體。關於可用於測定特異性免疫反應性之免疫分析格式及條件之描述,參見Harlow及Lane,Antibodies, A Laboratory Manual, Cold Spring Harbor Press, New York (1988)以及Harlow及Lane,Using Antibodies, A Laboratory Manual, Cold Spring Harbor Press, New York (1999)。
如本文所用,術語「個體」及「患者」係指接受針對特定疾病或疾患之治療之生物體。個體及患者之實例包括哺乳動物,諸如人類、靈長類動物、豬、山羊、兔、倉鼠、貓、狗、天竺鼠、牛科成員(諸如牛、野牛、水牛及犛牛等)、綿羊及馬等。可使用本文所闡述之組合物及方法治療之患者可能患有確定疾病,在該情形下,患者已被診斷為患有該疾病且已長時間顯示出該疾病之症狀(例如經數天、數週、數月或數年之時程)。或者,患者可能有特定疾病之症狀,但尚未被醫師診斷為患有該疾病。可使用本文所闡述之組合物及方法治療之其他患者包括已診斷為患有特定疾病,且至目前為止可能或可能不顯示該疾病症狀之彼等患者。舉例而言,若適合於用本文所闡述之組合物及方法治療之患者已接受疾病之診斷,即使該患者可能尚未顯示出疾病症狀,則亦可將該患者描述為經診斷但無症狀。
如本文所用,「轉染」係指將多核苷酸(例如外源性核酸)引入至細胞中,其中由該多核苷酸(例如mRNA)編碼之多肽得以表現或該多肽調節細胞功能(例如siRNA、miRNA)。如本文所用,核酸序列之「表現」係指多核苷酸(例如mRNA)轉譯成多肽或蛋白質及/或多肽或蛋白質之轉譯後修飾。轉染方法包括(但不限於)化學方法、物理處理及陽離子脂質或混合物。
如本文所用,術語「治療(treat或treatment)」係指治療性治療,其中目的為抑制或減緩(減輕)不期望之生理變化或病症。不管可偵測還是偵測不到,治療之有益或期望臨床結果包括(但不限於)症狀之緩和、疾病程度之減弱、疾病狀態之穩定(亦即不惡化)、疾病進展之延遲或減緩、疾病狀態之改善或減輕以及緩解(無論是部分還是全部的)。需要治療者包括已患有疾患或病症者,以及易患疾患或病症者或欲抑制疾患或病症者。
如本文所用,術語劑之「有效量」係足以實現有益或期望結果(例如臨床結果)之量,且因此,「有效量」取決於其應用之背景。舉例而言,在投與治療蛋白質缺乏之劑的背景下,劑之有效量為例如與在不投與該劑之情形下所觀察到的症狀之嚴重程度相比,表現足夠的期望蛋白質以改善、減少、消除或預防與相應蛋白質缺乏相關之症狀的mRNA之量。術語「有效量」可與「有效劑量」、「治療有效量」或「治療有效劑量」互換使用。
如本文所用,「投與方法」可包括靜脈內、肌內、真皮內、皮下或將組合物遞送至個體之其他方法。可選擇投與方法以靶向遞送(例如特異性遞送)至身體之特定區域或系統。
如本文所用,術語「內部核糖體進入位點」或「IRES」係指能夠募集轉譯機構之一或多個組件(例如核糖體(例如25S、28S、18S、5.8S或5S rRNA)之組件、eIF4G或eIF3),藉此促進與其可操作地連接之開放閱讀框之轉譯的核酸元件。本揭示案之IRES元件可與含有5’帽之核酸(例如含有5’-帽之mRNA分子)或缺少5’帽之核酸(例如環狀RNA分子)聯合使用。本揭示案之例示性IRES元件包括聚嘧啶束,諸如一個或複數個多核苷酸束,其中至少70%之核苷為含嘧啶核苷,諸如尿苷、經修飾尿苷、胞苷或經修飾胞苷(例如每一多核苷酸束中70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%之核苷可為尿苷、經修飾尿苷、胞苷或經修飾胞苷)。
片語「醫藥學上可接受」在本文中用以指在合理醫學判斷範圍內適用於與人類及動物之組織接觸而無過度毒性、刺激、過敏反應或其他問題或併發症且與合理益處/風險比相稱之彼等化合物、材料、組合物及/或劑型。
如本文所用,片語「醫藥學上可接受之賦形劑」係指除本文所闡述之化合物以外之任何成分(例如能夠懸浮或溶解活性化合物之媒劑),且其具有對患者實質上無毒且非發炎性之性質。賦形劑可包括例如:抗黏附劑、抗氧化劑、黏合劑、包衣、壓縮助劑、崩解劑、染料(色彩)、軟化劑、乳化劑、填充劑(稀釋劑)、成膜劑或包衣、調味劑、芳香劑、助流劑(流動增強劑)、潤滑劑、防腐劑、印刷墨水、吸附劑、懸浮劑或分散劑、甜味劑及水合水。例示性賦形劑包括(但不限於):二丁基羥基甲苯(BHT)、碳酸鈣、磷酸氫鈣、硬脂酸鈣、交聯羧甲基纖維素、交聯聚乙烯吡咯啶酮、檸檬酸、交聚維酮(crospovidone)、半胱胺酸、乙基纖維素、明膠、羥丙基纖維素、羥丙基甲基纖維素、乳糖、硬脂酸鎂、麥芽糖醇、甘露醇、甲硫胺酸、甲基纖維素、對羥基苯甲酸甲酯、微晶纖維素、聚乙二醇、聚乙烯吡咯啶酮、聚維酮(povidone)、預膠凝澱粉、對羥基苯甲酸丙酯、棕櫚酸視黃酯、蟲膠、二氧化矽、羧甲基纖維素鈉、檸檬酸鈉、甘醇酸澱粉鈉、山梨醇、澱粉(玉米)、硬脂酸、蔗糖、滑石、二氧化鈦、維生素A、維生素E、維生素C及木糖醇。
本揭示案亦包括本文所闡述化合物之醫藥學上可接受之鹽。如本文所用,「醫藥學上可接受之鹽」係指所揭示化合物之衍生物,其中母體化合物藉由將現有酸或鹼部分轉化成其鹽形式而經修飾(例如藉由使游離鹼基團與適宜有機酸反應)。醫藥學上可接受之鹽之實例包括(但不限於)鹼性殘基(諸如胺)之礦物酸鹽或有機酸鹽;酸性殘基(諸如羧酸)之鹼性鹽或有機鹽;及諸如此類。代表性酸加成鹽包括乙酸鹽、乙酸、己二酸鹽、海藻酸鹽、抗壞血酸鹽、天冬胺酸鹽、苯磺酸鹽、苯磺酸、苯甲酸鹽、硫酸氫鹽、硼酸鹽、丁酸鹽、樟腦酸鹽、樟腦磺酸鹽、檸檬酸鹽、環戊烷丙酸鹽、二葡糖酸鹽、十二烷基硫酸鹽、乙磺酸鹽、富馬酸鹽、葡庚糖酸鹽、甘油磷酸鹽、半硫酸鹽、庚酸鹽、己酸鹽、氫溴酸鹽、鹽酸鹽、氫碘酸鹽、2-羥基-乙磺酸鹽、乳糖酸鹽、乳酸鹽、月桂酸鹽、月桂基硫酸鹽、蘋果酸鹽、馬來酸鹽、丙二酸鹽、甲磺酸鹽、2-萘磺酸鹽、菸鹼酸鹽、硝酸鹽、油酸鹽、草酸鹽、棕櫚酸鹽、雙羥萘酸鹽、果膠酸鹽、過硫酸鹽、3-苯基丙酸鹽、磷酸鹽、苦味酸鹽、特戊酸鹽、丙酸鹽、硬脂酸鹽、琥珀酸鹽、硫酸鹽、酒石酸鹽、硫氰酸鹽、甲苯磺酸鹽、十一烷酸鹽、戊酸鹽及諸如此類。代表性鹼金屬或鹼土金屬鹽包括鈉鹽、鋰鹽、鉀鹽、鈣鹽、鎂鹽及諸如此類,以及無毒銨、四級銨及胺陽離子,包括(但不限於)銨、四甲基銨、四乙基銨、甲胺、二甲胺、三甲胺、三乙胺、乙胺及諸如此類。本揭示案之醫藥學上可接受之鹽包括由例如無毒無機酸或有機酸形成的母體化合物之習用無毒鹽。本揭示案之醫藥學上可接受之鹽可藉由習用化學方法由含有鹼性或酸性部分之母體化合物來合成。通常,此等鹽可藉由使該等化合物之游離酸或鹼形式與化學計算量之適當鹼或酸在水中或在有機溶劑中或在該兩者之混合物中反應來製備;通常,使用非水性介質如乙醚、乙酸乙酯、乙醇、異丙醇或乙腈。適宜鹽之列表參見
Remington's Pharmaceutical Sciences,第17版,Mack Publishing Company, Easton, Pa., 1985,第1418頁,
Pharmaceutical Salts: Properties, Selection, and Use, P.H. Stahl及C.G. Wermuth (編輯),Wiley-VCH, 2008,及Berge等人,
Journal of Pharmaceutical Science, 66, 1-19 (1977),其各自係以全文引用的方式併入本文中。
如本文所用,術語「醫藥學上可接受之溶劑合物」意指本揭示案之化合物,其中適宜溶劑之分子併入在晶格中。適宜溶劑在所投與之劑量下係生理學上可耐受的。舉例而言,溶劑合物可藉由自包括有機溶劑、水或其混合物之溶液結晶、再結晶或沈澱來製備。適宜溶劑之實例為乙醇、水(例如單水合物、二水合物及三水合物)、
N-甲基吡咯啶酮(NMP)、二甲亞碸(DMSO)、
N,
N'二甲基甲醯胺(DMF)、
N,
N'-二甲基乙醯胺(DMAC)、1,3-二甲基-2-咪唑啶酮(DMEU)、1,3-二甲基-3,4,5,6-四氫-2-(1H)-嘧啶酮(DMPU)、乙腈(ACN)、丙二醇、乙酸乙酯、苄醇、2-吡咯啶酮、苯甲酸苄酯及諸如此類。當水為溶劑時,溶劑合物稱為「水合物」。
如本文所用,術語「烷基(alkyl、alkyl group)」或「伸烷基」意指包括一或多個碳原子(例如一個、兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個、十二個、十三個、十四個、十五個、十六個、十七個、十八個、十九個、二十個或更多個碳原子)之直鏈或具支鏈飽和烴,其視情況經取代。記法「C
1-
14烷基」意指包括1-14個碳原子之視情況經取代之直鏈或具支鏈飽和烴。除非另有指定,否則本文所闡述之烷基係指未經取代及經取代之烷基二者。
如本文所用,術語「烯基(alkenyl、alkenyl group)」或「伸烯基」意指包括兩個或更多個碳原子(例如兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個、十二個、十三個、十四個、十五個、十六個、十七個、十八個、十九個、二十個或更多個碳原子)及至少一個雙鍵之直鏈或具支鏈烴,其視情況經取代。記法「C
2-
14烯基」意指包括2-14個碳原子及至少一個碳-碳雙鍵之視情況經取代之直鏈或具支鏈烴。烯基可包括一個、兩個、三個、四個或更多個碳-碳雙鍵。舉例而言,C
18烯基可包括一或多個雙鍵。包括兩個雙鍵之C
18烯基可為亞油基。除非另有指定,否則本文所闡述之烯基係指未經取代及經取代之烯基二者。
如本文所用,術語「炔基(alkynyl、alkynyl group)」或「伸炔基」意指包括兩個或更多個碳原子(例如兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個、十二個、十三個、十四個、十五個、十六個、十七個、十八個、十九個、二十個或更多個碳原子)及至少一個碳-碳三鍵之直鏈或具支鏈烴,其視情況經取代。記法「C
2-14炔基」意指包括2-14個碳原子及至少一個碳-碳三鍵之視情況經取代之直鏈或具支鏈烴。炔基可包括一個、兩個、三個、四個或更多個碳-碳三鍵。舉例而言,C
18炔基可包括一或多個碳-碳三鍵。除非另有指定,否則本文所闡述之炔基係指未經取代及經取代之炔基二者。
如本文所用,術語「碳環」或「碳環基」意指包括一或多個碳原子環之視情況經取代之單環或多環系統。環可為三員、四員、五員、六員、七員、八員、九員、十員、十一員、十二員、十三員、十四員、十五員、十六員、十七員、十八員、十九員或二十員環。記法「C
3-6碳環」意指包括具有3-6個碳原子之單環之碳環。碳環可包括一或多個碳-碳雙鍵或三鍵,且可為非芳香族或芳香族(例如環烷基或芳基)。碳環之實例包括環丙基、環戊基、環己基、苯基、萘基及1,2二氫萘基。如本文所用,術語「環烷基」意指非芳香族碳環,且可包括或可不包括任何雙鍵或三鍵。除非另有指定,否則本文所闡述之碳環係指未經取代及經取代之碳環基二者,亦即視情況經取代之碳環。
如本文所用,術語「雜環」或「雜環基」意指包括一或多個環之視情況經取代之單環或多環系統,其中至少一個環包括至少一個雜原子。雜原子可為例如氮、氧或硫原子。環可為三員、四員、五員、六員、七員、八員、九員、十員、十一員、十二員、十三員或十四員環。雜環可包括一或多個雙鍵或三鍵,且可為非芳香族或芳香族(例如雜環烷基或雜芳基)。雜環之實例包括咪唑基、咪唑啶基、噁唑基、噁唑啶基、噻唑基、噻唑啶基、吡唑啶基、吡唑基、異噁唑啶基、異噁唑基、異噻唑啶基、異噻唑基、嗎啉基、吡咯基、吡咯啶基、呋喃基、四氫呋喃基、噻吩基、吡啶基、六氫吡啶基、喹啉基及異喹啉基。如本文所用,術語「雜環烷基」意指非芳香族雜環,且可包括或可不包括任何雙鍵或三鍵。除非另有指定,否則本文所闡述之雜環係指未經取代及經取代之雜環基二者,亦即視情況經取代之雜環。
如本文所用,術語「雜烷基」、「雜烯基」或「雜炔基」分別係指如本文所定義之烷基、烯基、炔基,其進一步包含一或多個(例如1、2、3或4個)雜原子(例如氧、硫、氮、硼、矽、磷),其中該一或多個雜原子插入在母體碳鏈內之毗鄰碳原子之間及/或一或多個雜原子插入在碳原子與母體分子之間,亦即在連接點之間。除非另有指定,否則本文所闡述之雜烷基、雜烯基或雜炔基係指未經取代及經取代之雜烷基、雜烯基或雜炔基,亦即視情況經取代之雜烷基、雜烯基或雜炔基。
如本文所用,「生物可降解基團」係可有助於哺乳動物實體中脂質更快速代謝之基團。生物可降解基團可選自由以下組成之群,但不限於以下:-C(O)O-、-OC(O)-、-C(O)N(R')-、-N(R')C(O)-、-C(O)-、-C(S)-、-C(S)S-、-SC(S)-、-CH(OH)-、-P(O)(OR')O-、-S(O)2-、芳基及雜芳基。如本文所用,「芳基」係包括一或多個芳香族環之視情況經取代之碳環基。芳基之實例包括苯基及萘基。如本文所用,「雜芳基」係包括一或多個芳香族環之視情況經取代之雜環基。雜芳基之實例包括吡咯基、呋喃基、噻吩基、咪唑基、噁唑基及噻唑基。芳基及雜芳基二者均可視情況經取代。舉例而言,M及M'可選自由以下組成之非限制性群:視情況經取代之苯基、噁唑及噻唑。在本文各式中,M及M'可獨立地選自上文生物可降解基團之列表。除非另有指定,否則本文所闡述之芳基或雜芳基係指未經取代及經取代之基團二者,亦即視情況經取代之芳基或雜芳基。
除非另有指定,否則烷基、烯基及環基(例如碳環基及雜環基)可視情況經取代。視情況選用之取代基可選自由以下組成之群,但不限於以下:鹵素原子(例如氯化物、溴化物、氟化物或碘化物基團)、羧酸(例如C(O)OH)、醇(例如羥基、OH)、酯(例如C(O)OR OC(O)R)、醛(例如C(O)H)、羰基(例如C(O)R,或者由C=O表示)、醯鹵(例如C(O)X,其中X為選自溴化物、氟化物、氯化物及碘化物之鹵化物)、碳酸酯(例如OC(O)OR)、烷氧基(例如OR)、縮醛(例如C(OR)2R"",其中每一OR為可相同或不同之烷氧基,且R""為烷基或烯基)、磷酸根(例如P(O)
4 3-)、硫醇(例如SH)、亞碸(例如S(O)R)、亞磺酸(例如S(O)OH)、磺酸(例如S(O)
2OH)、硫醛(例如C(S)H)、硫酸根(例如S(O)
4 2-)、磺醯基(例如S(O)
2)、醯胺(例如C(O)NR
2或N(R)C(O)R)、疊氮基(例如N
3)、硝基(例如NO
2)、氰基(例如CN)、異氰基(例如NC)、醯氧基(例如OC(O)R)、胺基(例如NR
2、NRH或NH
2)、胺甲醯基(例如OC(O)NR
2、OC(O)NRH或OC(O)NH
2)、磺醯胺(例如S(O)
2NR
2、S(O)
2NRH、S(O)
2NH
2、N(R)S(O)
2R、N(H)S(O)
2R、N(R)S(O)
2H或N(H)S(O)
2H)、烷基、烯基及環基(例如碳環基或雜環基)。在前述任一者中,R為如本文所定義之烷基或烯基。在一些實施例中,取代基本身可進一步經例如一個、兩個、三個、四個、五個或六個如本文所定義之取代基取代。舉例而言,C
1-6烷基可進一步經一個、兩個、三個、四個、五個或六個如本文所闡述之取代基取代。
本揭示案之含氮化合物可藉由用氧化劑(例如3-氯過氧苯甲酸(mCPBA)及/或過氧化氫)處理而轉化成N-氧化物,從而得到本揭示案之其他化合物。因此,當化合價及結構容許時,考慮所有示出及主張之含氮化合物,以包括如所示出之化合物及其N-氧化物衍生物(其可命名為N→O或N+-O-)二者。此外,在其他情況中,本揭示案化合物中之氮可轉化成N-羥基或N-烷氧基化合物。舉例而言,N-羥基化合物可藉由用氧化劑(諸如mCPBA)氧化母體胺來製備。當化合價及結構容許時,亦考慮所有示出及主張之含氮化合物,以覆蓋如所示出之化合物及其N-羥基(亦即N-OH)及N-烷氧基(亦即N-OR,其中R為經取代或未經取代之C
1-C
6烷基、C
1-C
6烯基、C
1-C
6炔基、3員至14員碳環或3員至14員雜環)衍生物二者。
本揭示案提供能夠募集且結合至核糖體而不需要5’帽結構之核酸分子(例如RNA分子,諸如線性或環狀RNA分子)。核酸分子常使用5’帽結構作為用於促進核糖體結合且最終促進開放閱讀框轉譯之手段。易於脫帽之5’帽之存在及RNA之隨後降解可排除改為進行化學修飾以延長分子半衰期之可能性。本揭示案藉由提供用於核酸分子募集且結合核糖體而不需要5’帽結構之手段而解決此問題,從而提供同時容許核酸分子可轉譯且以減輕核溶解降解之方式而經修飾之優點。
減少或避免核溶解降解但亦排除納入5’帽之核酸修飾之實例包括(i)存在限制核酸外切酶接近核酸分子之5’化學部分,以及(ii)核酸分子之環化,其將5’端及3’端一起去除。該兩種類型之修飾藉助化學保護或去除核酸外切酶將結合之5’端及3’端而提供減少或消除核酸外切裂解之益處。然而,由於該等類型之修飾改變或消除5’端,故其排除納入5’帽。本揭示案係關於內部核糖體進入位點(IRES),其可併入至核酸中且在不存在5’帽之情形下促進核糖體募集及蛋白質轉譯。
重要的是,本發明所闡述之IRES元件不僅促進不依賴於帽之轉譯,藉此允許延長半衰期之修飾(諸如5’/3’封阻及環化),且本發明之IRES元件亦與經化學修飾之尿苷核苷、特定而言1-甲基假尿苷核苷相容。此與已知之IRES元件顯著不同,後者通常係基於結構的且預期與經化學修飾之核苷不相容。使用經修飾之尿苷殘基、特定而言1-甲基假尿苷提供使核酸分子之免疫原性較缺少此修飾之相應核酸分子大幅降低之益處。因此,與1-甲基假尿苷相容之IRES元件尤其有利。
本揭示案之IRES可將轉譯牽引子及/或核糖體募集至本文所闡述之核酸,以促進轉譯。舉例而言,本揭示案之IRES (例如SEQ ID NO: 173-205)可結合至轉譯起始因子,藉此募集起始核酸轉譯所需之分子機構。在另一實例中,本揭示案之IRES (例如SEQ ID NO: 185、190及199-201)可藉由例如直接與核糖體RNA (rRNA,諸如25S、28S、18S、5.8S及/或5S rRNA)雜交而直接結合至核糖體亞單元(例如真核60S或40S亞單元)。
因此,本文所闡述之IRES元件由此提供多種益處:本發明之IRES元件不僅容許排除5’帽基團之延長半衰期之核酸修飾類型,且亦與顯著抑制核酸分子免疫原性之尿苷修飾一起起作用。此外,藉由與核糖體結合或直接與核糖體RNA雜交,本揭示案之IRES提供快速且高效之蛋白質表現之優點,同時降低細胞之能量消耗。
以下部分更詳細地闡述例示性IRES元件,以及可與本揭示案之IRES元件聯合使用之各種類型之核酸修飾。
1. 內部核糖體進入位點
本揭示案之例示性核酸為含有以下之彼等核酸:
(i) 內部核糖體進入位點(IRES),其包含一或多個富含尿苷或經修飾尿苷之多核苷酸束;該IRES可操作地連接至
(ii) 編碼多肽之開放閱讀框。
在一些實施例中,IRES包含1至20個富含尿苷或經修飾尿苷之多核苷酸束(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個富含尿苷或經修飾尿苷之多核苷酸束)。IRES可例如包含2至10個富含尿苷或經修飾尿苷之多核苷酸束。在某些實施例中,IRES包含3至6個富含尿苷或經修飾尿苷之多核苷酸束。
在一些實施例中,每一多核苷酸束中至少70%之核苷為尿苷或經修飾尿苷(例如每一多核苷酸束中70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%之核苷可為尿苷或經修飾尿苷)。在一些實施例中,每一多核苷酸束中至少75%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少80%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少85%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少90%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中至少95%之核苷為尿苷或經修飾尿苷。在一些實施例中,每一多核苷酸束中之所有核苷均為尿苷或經修飾尿苷。
在本揭示案之例示性核酸中,每一多核苷酸束之長度獨立地為5至20個核苷(例如長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷)。在一些實施例中,每一多核苷酸束之長度獨立地為5至19個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至18個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至17個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至16個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至15個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至14個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至13個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至12個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至11個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為5至10個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至15個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至14個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至13個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至12個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至11個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為6至10個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至15個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至14個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至13個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至12個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至11個核苷。在一些實施例中,每一多核苷酸束之長度獨立地為7至10個核苷。在一些實施例中,每一多核苷酸束之長度為9個核苷。
在本揭示案之例示性核酸中,每一多核苷酸束獨立地包含5至20個鄰接尿苷或經修飾尿苷核苷(例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個尿苷或經修飾尿苷核苷)。在一些實施例中,每一多核苷酸束獨立地包含6至15個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含6至14個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含6至13個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含6至12個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含6至11個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含6至10個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含7至15個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含7至14個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含7至13個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含7至12個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含7至11個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束獨立地包含7至10個鄰接尿苷或經修飾尿苷核苷。
在本揭示案之例示性核酸中,每一多核苷酸束包含至少9個鄰接尿苷或經修飾尿苷核苷。在一些實施例中,每一多核苷酸束包含9個鄰接尿苷或經修飾尿苷核苷。
在本揭示案之例示性核酸中,一或多個(或全部)多核苷酸束富含經修飾尿苷。在一些實施例中,經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,經修飾尿苷為1-甲基假尿苷。
在本揭示案之例示性核酸中,IRES位於可操作地連接至開放閱讀框之核酸非編碼區(諸如5’非轉譯區(UTR))內。在一些實施例中,開放閱讀框進一步可操作地連接至3’ UTR。
在本揭示案之例示性核酸中,多核苷酸束藉助一或多個間隔區彼此隔開,該一或多個間隔區各自獨立地包含5至100個核苷(例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷)。在一些實施例中,每一間隔區獨立地包含10至40個核苷(例如10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個核苷)。在一些實施例中,每一間隔區獨立地包含11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38個核苷。
在本揭示案之例示性核酸中,IRES由下式表示:
[(
N)
n- (
U’)
m]
p其中:
每一
N獨立地為任何核苷殘基;
每一
U’獨立地為尿苷或經修飾尿苷;
每一n獨立地為1至100之整數(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100);
每一m獨立地為2至15之整數(例如2、3、4、5、6、7、8、9、10、11、12、13、14或15);且
p為2至20之整數(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)。
在本揭示案之例示性核酸中,
N獨立地選自腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。在一些實施例中,每一
N獨立地選自腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
在本揭示案之例示性核酸中,
N之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
在本揭示案之例示性核酸中,
N之經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
在本揭示案之例示性核酸中,
N之經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在本揭示案之例示性核酸中,
N之經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
在本揭示案之例示性核酸中,
U’之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
在本揭示案之例示性核酸中,每一n獨立地為10至40之整數。在一些實施例中,每一n獨立地為11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38。在一些實施例中,每一m獨立地為2至15之整數。在一些實施例中,每一m獨立地為7至11之整數。在一些實施例中,每一m為9。在一些實施例中,p為2至10之整數。在一些實施例中,p為3至6之整數,視情況其中p為3或6。
在本揭示案之例示性核酸中,核酸為RNA。在一些實施例中,核酸為線性的。在一些實施例中,核酸為環狀的。在一些實施例中,開放閱讀框係由選自以下之核苷組成:腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。在一些實施例中,開放閱讀框係由選自以下之核苷組成:腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
在本揭示案之例示性核酸中,開放閱讀框之經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2’-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。在一些實施例中,開放閱讀框之經修飾尿苷為1-甲基假尿苷。
在本揭示案之例示性核酸中,
N之經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
在本揭示案之例示性核酸中,
N之經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在本揭示案之例示性核酸中,
N之經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
在本揭示案之例示性核酸中,由開放閱讀框編碼之多肽為分泌蛋白、細胞介素、生長因子、酶、免疫調節劑、抗體或其抗原結合片段、細胞穿透肽、細胞外膜結合蛋白、細胞內膜結合蛋白、細胞質蛋白、細胞骨架蛋白或核蛋白。
在本揭示案之例示性核酸中,IRES含有與表2中所呈現之IRES (例如IRES 1至IRES 22中之任一者)具有約70%至約100% (例如約70%至約100%、約75%至約100%、約80%至約100%、約85%至約100%、約90%至約100%、約91%至約100%、約92%至約100%、約93%至約100%、約94%至約100%、約95%至約100%、約96%至約100%、約97%至約100%、約98%至約100%或約99%至100%)序列一致性之核苷酸序列。
在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少70%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少75%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少80%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少85%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少90%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少91%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少92%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少93%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少94%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少95%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少96%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少97%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少98%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有至少99%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 173-190及202-205中之任一者具有100%序列一致性之核苷酸序列。
表 2. 例示性 IRES 序列
SEQ ID NO: | 名稱 | 序列 |
173 | IRES 1 | AGGUAUAAUUCUCAUUUCCACCUCUUUUCAUCACCGGUCAGCGGACUCACCGGCCAGGGCGCUCGGUGCUGGAAUUUGAUAUUCAUUGAUCCGGGUUUUAUCCCUCUUCUUUUUUCUUAAACAUUUUUUUUUAAAACUGUAUUGUUUCUCGUUUUAAUUUAUUUUUGCUUGCCAUUCCCCACUUGAAUCGGGCCGACGGCUUGGGGAGAUUGCUCUACUUCCCCAAAUCACUGUGGAUUUUGGAAACCAGCAGAAAGAGGAAAGAGGUAGCAAGAGCUCCAGAGAGAAGUCGAGGAAGAGAGAGACGGGGUCAGAGAGAGCGCGCGGGCGUGCGAGCAGCGAAAGCGACAGGGGCAAAGUGAGUGACCUGCUUUUGGGGGUGACCGCCGGAGCGCGGCGUGAGCCCUCCCCCUUGGGAUCCCGCUGGUAUUUUGUUGUUCUUGGACACUUCCGAAACCAAAAUCUCGCC |
174 | IRES 2 | AGGAACCCAUAAUCAUUUUCUUUUCCUUUGAUAUUAUUUCAAUUAUAUUUUCCUUUGAUAUUAUAAAAAUUAUUUUCCUUUUUGAUAUUAUUUACUAAUCUUUUCCUUUUGAUAUUAUUUUUAUACAAUUUUCCUUUCUCGACAUUAAAUUUUUAUUUUCCUUUGAUAUUAUUGGCUCACCCUAUCCUCGCC |
175 | IRES 3 | AGGAACCCAUAAUCAUUUUCUUUUCCUUUGAUAUUAUUUCAAUUAUAUUUUCCUUUGAUAUUAUAAAAAUUAUUUUCCUUUUUGAUAUUAUUUACUAAUCUUUUCCUUUUGAUAUUAUUUUUAUACAAUUUUCCUUUGAUAUUAUUAAAUUUUUAUUUUCCUUUGAUAUUAUUAUAUCACCCUAUCCUCGCC |
176 | IRES 4 | AGGAACCCAUAAUCAUUUUCUUUUUUUUUGAUAUUAUUUCAAUUAUAUUUUUUUUUGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUGAUAUUAUUAAAUUUUUAUUUUUUUUUGAUAUUAUUGGCUCACCCUAUCCUCGCC |
177 | IRES 5 | AGGAACCCAUAAUCAUUUUCUUUUUUUUUGAUAUUAUUUCAAUUAUAUUUUUUUUUGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUCUCGACAUUAAAUUUUUAUUUUUUUUUGAUAUUAUUGGCUCACCCUAUCCUCGCC |
178 | IRES 6 | AGGAACCCAUAAUCAUUUUCUUUUUUUUUGAUAUUAUUUCAAGAUAAAUUUUUUUUUGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUGAUAUUAUUAAAUUUUUAUUUUUUUUUGAUAUUAUUAUAUCACAAGAACCCUAUCCUCGCC |
179 | IRES 7 | AGGAACCCAGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUCCUAUCCUCGCC |
180 | IRES 8 | AGGAAAUAAGAAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAGAGCCAUCAAGAGUAAGACGCAUUAUAAGACCCCGGCGCCGCCACC |
181 | IRES 9 | AGGAAAUAAGGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUGAUAUUAAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGACCCCGGCGCCGCCACC |
182 | IRES 10 | AGGAACCCAUAAUCAUUUUCUUUUUUUUUGAUAUUAUUUCAAUUAUAUUUUUUUUUGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUGAUAUUAUUAAAUUUUUAACAGCCCUCCCCAGCUGCCCAGGAAGAGCCCCAGCCGAUAUUAUUAUAUCACCCUAUCCUCGCC |
183 | IRES 11 | AGGAACCCAUAAUCAUUUUCACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGAUAUUAUUUCAAUUAUAUUUUUUUUUGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUGAUAUUAUUAAAUUUUUAUUUUUUUUUGAUAUUAUUAUAUCACCCUAUCCUCGCC |
184 | IRES 12 | AGGAACCCAUAAUCAUUUUCACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGAUAUUAUUUCAAUUAUAUUUUUUUUUGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUGAUAUUAUUAAAUUUUUAUUUUUUUUUGAUAUUAUUAUAUCACCCUAUCCUCGCC |
185 | IRES 13 | GGGAAAUCGCAAAAUUUGCUCCGGCGGGUCAUGGGAAUAACGCCGCCGAUAAUUUUUUUUUUCUUACUCGGAACUACGACGGUAUCUGAUCGUCUUCGAACCUCCGAACGUUUUUUUUUUUAAUAACGCCGACCGCUCGGGGGUCGCAAAUCUUUUUUUUUAACCUUUCCGCAGGUUCACCUACGGAAUAUCCUCGCC |
186 | IRES 14 | AGGAAAUUUUUUUUUGAUAUUAUAAGACUUUUUUUUUGAUAUUACCCGGCUUUUUUUUUGAUAUUAGCCGCCACC |
187 | IRES 15 | GGGAAAUCGCAAAAUUUGCUCUUUUUUUUUAUAUACAUCGUUUUUUUUUAUACUUUGGCUUUUUUUUUCAGUUGAUUAUUUUUUUUUGAUAACAGUCUUUUUUUUUAGUAUCACUAUUUUUUUUUCAUAUCACCCUAUCCUCGCC |
188 | IRES 16 | GGGAAAUCGCAAAAUUUGCUCUUUUCUUUUUAUAUACAUCGUUUUUCUUUUAUACUUUGGCUUUUCUUUUUCAGUUGAUUAUUUUUCUUUUGAUAACAGUCUUUUCUUUUUAGUAUCACUAUUUUUCUUUUCAUAUCACCCUAUCCUCGCC |
189 | IRES 17 | AGGAAAUCGCAAAAUUUGCUCUUUUCUUUUUUACAUUUUUUCUUUUACUGCUUUUCUUUUUGUGAUUUUUUCUUUUGUAGUUUUUCUUUUUAGACUUUUUUCUUUUCAUAUCACCCUAUCCUCGCC |
190 | IRES 18 | GGGAAAUCGCAAAAUUUGCUCGCGGCUGCUGGCACCAGACUUUUUUUUUUGGUCCGUCUUGCGCCGGUCCUUUUUUUUUCCGACCGCUCGGGGGUCGCGUUUUUUUUUAUCCUUCCGCAGGUUCACCUUAUCCUCGCC |
202 | IRES 19 | AGGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUUUUUUUUUGAUAUUAUAAGACUUUUUUUUUGAUAUUACCCGGCUUUUUUUUUGAUAUUAGCCGCCACC |
203 | IRES 20 | AGGAACCCAUAAUCAUUUUCUUUUUUUUUGAUAUUAUUUCAAUUAUAUUUUUUUUUGAUAUUAUAAAAAUUAUUUUUUUUUUUGAUAUUAUUUACUAAUCUUUUUUUUUUGAUAUUAUUUUUAUACAAUUUUUUUUUGAUAUUAUUAAAUUUUUAUUUUUUUUUGAUAUUAUUAUAUCACCCUAUCCUCGCC |
204 | IRES 21 | AGGAAAUCGCAAAAUUUGCUCUUUUCUUUUUACAUUUUUUCUUUUACUGCUUUUUCCUUUUGUGAUUUUUCCUUUUUGUAGUUUUUCUUUUAGACUUUUUUCCUUUUCAUAUCACCCUAUCCUCGCC |
205 | IRES 22 | AGGAAAUCGCAAAAUUUGCUCUUUCCUUUUUACAUUUUCCUUUUACUGCUUUCCUUUUGUGAUUUUCCUUUUGUAGUUUUCCUUUUAGACUUUUCCUUUUCAUAUCACCCUAUCCUCGCC |
在本揭示案之例示性核酸中,核酸不包含5’帽。
在另一態樣中,本揭示案提供核酸,該核酸包含:
(i) (a) IRES,其包含一或多個特異性結合以下之多核苷酸:RNA結合蛋白、轉譯起始因子(例如真核轉譯起始因子4 G (eIF4G)、真核轉譯起始因子4G2 (eIF4G2,亦稱為Dap5)、真核轉譯起始因子3 (eIF3))或IRES反式作用因子(ITAf),諸如聚嘧啶束結合蛋白(PTBP);或(b)融合蛋白,其包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白,或ITAf,諸如La);其可操作地連接至
(ii) 編碼多肽之開放閱讀框。
在本揭示案之例示性核酸中,該一或多個多核苷酸特異性結合eIF4G。在一些實施例中,該一或多個多核苷酸中之每一者獨立地具有與ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAA (SEQ ID NO: 1)至少75%一致之核酸序列。在一些實施例中,該一或多個多核苷酸中之每一者獨立地具有與SEQ ID NO: 1之核酸序列至少85%一致之核酸序列(例如與SEQ ID NO: 1之核酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致)。在一些實施例中,該一或多個多核苷酸中之每一者具有SEQ ID NO: 1之核酸序列。在一些實施例中,核酸不包含5’帽。
在另一態樣中,本揭示案提供多肽表現系統,該系統包含:
(i) 前述態樣(或其任一上述實施例)之核酸;及
(ii) 包含編碼eIF4G、La蛋白或其功能變異體之開放閱讀框之核酸。
在一些實施例中,(i)之核酸與(ii)之核酸係單獨的分子。在一些實施例中,(ii)之核酸自5’至3’包含:
(i) 5’ UTR;
(ii) 編碼eIF4G、La蛋白或其功能變異體之開放閱讀框;及
(iii) 3’ UTR。
在一些實施例中,(ii)之核酸進一步包含可操作地連接至5’ UTR之5’帽。
在本揭示案之例示性核酸中,IRES含有與表3中所呈現之IRES (例如IRES 23至IRES 33中之任一者)具有約70%至約100% (例如約70%至約100%、約75%至約100%、約80%至約100%、約85%至約100%、約90%至約100%、約91%至約100%、約92%至約100%、約93%至約100%、約94%至約100%、約95%至約100%、約96%至約100%、約97%至約100%、約98%至約100%或約99%至100%)序列一致性之核苷酸序列。
在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少70%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少75%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少80%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少85%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少90%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少91%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少92%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少93%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少94%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少95%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少96%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少97%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少98%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有至少99%序列一致性之核苷酸序列。在本揭示案之例示性核酸中,IRES含有與SEQ ID NO: 191-201中之任一者具有100%序列一致性之核苷酸序列。
表 3. 例示性轉譯起始元件
2. 經化學修飾之核酸
SEQ ID NO: | 名稱 | 序列 |
191 | IRES 23 | AGGUAUAAUUCUCAUUUCCACCUCUUUUCAUCAUCUACCAUACCCAUUGACUAACUUGGUAUUUUGUUGUUCUUGGACACUUCCGAAACCAAAAUCUCGCC |
192 | IRES 24 | AGGUAUAAUUCUCAUUUCCACCUCUUUUCAUCUGAACUUUGAACCAGGUGGUAUUUUGUUGUUCUUGGACACUUCCGAAACCAAAAUCUCGCC |
193 | IRES 25 | AGGUAUAAUUCUCAUUUCCACCUCUUUUCAUCUACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAAGUUGUUCUAGGACACUUCCGAAACCAAAAUCUCGCC |
194 | IRES 26 | AGGUAUAAUUCUCAUUUCCACCUCUUUUCAUCUAUAUUUUGGUAUUUUGUUGUUCUUGGACACUUCCGAAACCAAAAUCUCGCC |
195 | IRES 27 | AGGUAUAAUUCUCAUUUCCACCUCUUUUCAUCUGAGGGACAGAAAAGUAACCUCUUCUUAGGUAUUUUGUUGUUCUUGGACACUUCCGAAACCAAAAUCUCGCC |
196 | IRES 28 | AGGUAUAAUUCUCAUUUCCACCUCUUUUCAUCUACAGCCCUCCCCAGCUGCCCAGGAAGAGCCCCAGCCGGUAUUUUGUUGUUCUUGGACACUUCCGAAACCAAAAUCUCGCC |
197 | IRES 29 | AGGAGGGCUGUCGGCGCAGUAGCAGCGAGCAGCAGAGUCCGCACGCUCCGGCGAGGGGCAGAAGAGCGCGAGGGAGCGCGGGGCAGCAGAAGCGAGAGCCGAGCGCGGACCCAGCCAGGACCCACAGCCCUCCCCAGCUGCCCAGGAAGAGCCCCAGCC |
198 | IRES 30 | AGGAACCCAUAAUCAUUUUCGAGGGACAGAAAAGUAACCUCUUCUUAGAUAUUAUUUCAAUUAUAGAGGGACAGAAAAGUAACCUCUUCUUAGAUAUUAUAAAAAUUAUUGAGGGACAGAAAAGUAACCUCUUCUUAGAUAUUAUUUACUAAUCUGAGGGACAGAAAAGUAACCUCUUCUUAGAUAUUAUUUUUAUACAAGAGGGACAGAAAAGUAACCUCUUCUUAGAUAUUAUUAAAUUUUUAGAGGGACAGAAAAGUAACCUCUUCUUAGAUAUUAUUAUAUCACCCUAUCCUCGCC |
199 | IRES 31 | GGGAAAUCGCAAAAUUUGCUCGCCGAGUAGUGUUGGGUCGCGAAAGGCACUACAUCGAGGUCCGUCUUGCGCCGGUCCACGUUAAUAACCGACCGCUCGGGGGUCGCGUCUGAUCAUUAUCCUUCCGCAGGUUCACCUUAUCCUCGCC |
200 | IRES 32 | GGGAAAUCGCAAAAUUUGCUCGCGGCUGCUGGCACCAGACUACUACAUCGAGGUCCGUCUUGCGCCGGUCCACGUUAAUAACCGACCGCUCGGGGGUCGCGUCUGAUCAUUAUCCUUCCGCAGGUUCACCUUAUCCUCGCC |
201 | IRES 33 | GGGAAAUCGCAAAAUUUGCUCCGGCGGGUCAUGGGAAUAACGCCGCCGAUAAUCUUACUCGGAACUACGACGGUAUCUGAUCGUCUUCGAACCUCCGAACGUUAAUAACGCCGACCGCUCGGGGGUCGCAAAUCAACCUUUCCGCAGGUUCACCUACGGAAUAUCCUCGCC |
本揭示案之IRES元件以及本文所闡述之核酸構築體之開放閱讀框、UTR及其他元件可具有一或多個化學修飾。根據Aduri等人(Aduri, R.等人,AMBER force field parameters for the naturally occurring modified nucleosides in RNA. Journal of Chemical Theory and Computation. 2006. 3(4):1464-75),存在107種天然核苷,包括1-甲基腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基腺苷、2-甲基腺苷、2-O-核糖基磷酸腺苷、N6-甲基-N6-蘇胺醯胺甲醯基腺苷、N6-乙醯基腺苷、N6-甘胺醯胺甲醯基腺苷、N6-異戊烯基腺苷、N6-甲基腺苷、N6-蘇胺醯胺甲醯基腺苷、N6,N6-二甲基腺苷、N6-(順式-羥基異戊烯基)腺苷、N6-羥基正纈胺醯胺甲醯基腺苷、1,2-O-二甲基腺苷、N6,2-O-二甲基腺苷、2-O-甲基腺苷、N6,N6,O-2-三甲基腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-甲基腺苷、2-甲基硫基-N6-異戊烯基腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基腺苷、2-硫胞苷、3-甲基胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞苷、5-甲基胞苷、5-羥基甲基胞苷、立西啶、N4-乙醯基-2-O-甲基胞苷、5-甲醯基-2-O-甲基胞苷、5,2-O-二甲基胞苷、2-O-甲基胞苷、N4,2-O-二甲基胞苷、N4,N4,2-O-三甲基胞苷、1-甲基鳥苷、N2,7-二甲基鳥苷、N2-甲基鳥苷、2-O-核糖基磷酸鳥苷、7-甲基鳥苷、修飾不足之羥基懷丁苷、7-胺基甲基-7-去氮鳥苷、7-氰基-7-去氮鳥苷、N2,N2-二甲基鳥苷、4-去甲基懷俄苷、環氧辮苷、羥基懷丁苷、異懷俄苷、N2,7,2-O-三甲基鳥苷、N2,2-O-二甲基鳥苷、1,2-O-二甲基鳥苷、2-O-甲基鳥苷、N2,N2,2-O-三甲基鳥苷、N2,N2,7-三甲基鳥苷、過氧懷丁苷、半乳糖基-辮苷、甘露糖基-辮苷、辮苷、古嘌苷、懷丁苷、甲基懷俄苷、懷俄苷、2-硫尿苷、3-(3-胺基-3-羧基丙基)尿苷、3-甲基尿苷、4-硫尿苷、5-甲基-2-硫尿苷、5-甲基胺基甲基尿苷、5-羧基甲基尿苷、5-羧基甲基胺基甲基尿苷、5-羥基尿苷、5-甲基尿苷、5-牛磺酸甲基尿苷、5-胺甲醯基甲基尿苷、5-(羧基羥基甲基)尿苷甲基酯、二氫尿苷、5-甲基二氫尿苷、5-甲基胺基甲基-2-硫尿苷、5-(羧基羥基甲基)尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫尿苷、3,2-O-二甲基尿苷、5-羧基甲基胺基甲基-2-O-甲基尿苷、5-胺甲醯基甲基-2-O-甲基尿苷、5-甲氧基羰基甲基-2-O-甲基尿苷、5-(異戊烯基胺基甲基)-2-O-甲基尿苷、5,2-O-二甲基尿苷、2-O-甲基尿苷、2-硫基-2-O-甲基尿苷、尿苷5-氧基乙酸、5-甲氧基羰基甲基尿苷、尿苷5-氧基乙酸甲基酯、5-甲氧基尿苷、5-胺基甲基-2-硫尿苷、5-羧基甲基胺基甲基-2-硫尿苷、5-甲基胺基甲基-2-硒基尿苷、5-甲氧基羰基甲基-2-硫尿苷、5-牛磺酸甲基-2-硫尿苷、假尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、1-甲基假尿苷、3-甲基假尿苷、2-O-甲基假尿苷、肌苷、1-甲基肌苷、1,2-O-二甲基肌苷及2-O-甲基肌苷。該等核苷中之每一者可為本發明核酸之組件。
a. 含有經修飾糖之核苷
可併入至多核苷酸(例如,如本文所闡述之RNA或mRNA)中之替代性核苷及核苷酸(例如構建組元分子)可在核糖核酸之糖上經改變。舉例而言,2’羥基(OH)可經多種不同的取代基修飾或置換。在2'-位置處之例示性取代包括(但不限於) H、鹵基、視情況經取代之C
1-6烷基;視情況經取代之C
1-6烷氧基;視情況經取代之C
6-10芳基氧基;視情況經取代之C
3-8環烷基;視情況經取代之C
3-8環烷氧基;視情況經取代之C
6-10芳基氧基;視情況經取代之C
6-10芳基-C
1-6烷氧基、視情況經取代之C
1-12(雜環基)氧基;糖(例如核糖、戊糖或本文所闡述之任何糖);聚乙二醇(PEG)、-O(CH
2CH
2O)
nCH
2CH
2OR,其中R為H或視情況經取代之烷基,且n為0至20之整數(例如0至4、0至8、0至10、0至16、1至4、1至8、1至10、1至16、1至20、2至4、2至8、2至10、2至16、2至20、4至8、4至10、4至16及4至20);「鎖」核酸(LNA),其中2'-羥基由C
1-6伸烷基或C
1-6伸雜烷基橋連結至同一核糖之4’-碳,其中例示性橋包括亞甲基、伸丙基、醚或胺基橋;如本文所定義之胺基烷基;如本文所定義之胺基烷氧基;如本文所定義之胺基;及如本文所定義之胺基酸。
通常,RNA包括糖基核糖,其為具有氧之5員環。例示性非限制性替代性核苷酸包括核糖中氧之置換(例如用S、Se或伸烷基諸如亞甲基或伸乙基置換);雙鍵之加成(例如用環戊烯基或環己烯基置換核糖);核糖之環縮(例如形成環丁烷或氧雜環丁烷之4員環);核糖之擴環(例如形成具有額外碳或雜原子之6員或7員環,諸如亦具有胺基磷酸酯主鏈之去水己糖醇、阿卓糖醇(altritol)、甘露醇、環己烷基、環己烯基及嗎啉基);多環形式(例如三環;及「非鎖定」形式,諸如二醇核酸(GNA) (例如R-GNA或S-GNA,其中核糖經與磷酸二酯鍵連接之二醇單元置換)、蘇糖核酸(TNA,其中核糖經α-L-蘇呋喃糖基-(3'→2')置換)及肽核酸(PNA,其中2-胺基-乙基-甘胺酸鍵聯置換核糖及磷酸二酯主鏈)。糖基亦可含有一或多個碳,該一或多個碳之立體化學構形與核糖中相應碳之立體化學構形相反。因此,多核苷酸分子可包括含有(例如)阿拉伯糖作為糖之核苷酸。
b. 核鹼基上之改變
本揭示案提供替代性核苷及核苷酸。如本文所闡述,「核苷」定義為含有糖分子(例如戊糖或核糖)或其衍生物與有機鹼基(例如嘌呤或嘧啶)或其衍生物(在本文中亦稱為「核鹼基」)之組合之化合物。如本文所闡述,「核苷酸」定義為包括磷酸酯基之核苷。
例示性非限制性改變包括胺基、硫醇基、烷基、鹵基或本文所闡述之任何基團。替代性核苷酸可藉由如本文所闡述之任何可用方法來合成(例如化學、酶促或重組,以包括一或多個替代性或替代性核苷)。
在一些實施例中,本發明之核酸(例如mRNA或寡核苷酸)包括一或多個2’-OMe核苷酸、2’-甲氧基乙基核苷酸(2’-MOE核苷酸)、2’-F核苷酸、2’-NH2核苷酸、2’氟阿拉伯糖核苷酸(FANA核苷酸)、鎖核酸核苷酸(LNA核苷酸)或4’-S核苷酸。
替代性核苷酸鹼基配對不僅涵蓋標準腺苷-胸腺嘧啶、腺苷-尿嘧啶及鳥苷-胞嘧啶鹼基對,且亦涵蓋在核苷酸及/或包括非標準或替代性鹼基之替代性核苷酸之間形成的鹼基對,其中氫鍵供體與氫鍵受體之排列允許在非標準鹼基與標準鹼基之間或在兩個互補非標準鹼基結構之間形成氫鍵。此非標準鹼基配對之一個實例係在替代性核苷酸肌苷與腺嘌呤、胞嘧啶或尿嘧啶之間的鹼基配對。
替代性核苷及核苷酸可包括替代性核鹼基。RNA中所發現之核鹼基之實例包括(但不限於)腺嘌呤、鳥嘌呤、胞嘧啶及尿嘧啶。DNA中所發現之核鹼基之實例包括(但不限於)腺嘌呤、鳥嘌呤、胞嘧啶及胸腺嘧啶。該等核鹼基可經改變或完全置換,以提供具有增強性質(例如對核酸酶之抗性以及穩定性)之多核苷酸分子,且該等性質可經由破壞主溝槽結合搭配物之結合而顯現。
在一些實施例中,替代性核鹼基為替代性尿嘧啶。具有替代性尿嘧啶之例示性核鹼基及核苷包括假尿苷(ψ)、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷(s
2U)、4-硫基-尿苷(s
4U)、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷(ho
5U)、5-胺基烯丙基-尿苷、5-鹵基-尿苷(例如5-碘-尿苷或5-溴-尿苷)、3-甲基-尿苷(m
3U)、5-甲氧基-尿苷(mo
5U)、尿苷5-氧基乙酸(cmo
5U)、尿苷5-氧基乙酸甲基酯(mcmo
5U)、5-羧基甲基-尿苷(cm
5U)、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷(chm
5U)、5-羧基羥基甲基-尿苷甲基酯(mchm
5U)、5-甲氧基羰基甲基-尿苷(mcm
5U)、5-甲氧基羰基甲基-2-硫基-尿苷(mcm
5s
2U)、5-胺基甲基-2-硫基-尿苷(nm
5s
2U)、5-甲基胺基甲基-尿苷(mnm
5U)、5-甲基胺基甲基-2-硫基-尿苷(mnm
5s
2U)、5-甲基胺基甲基-2-硒基-尿苷(mnm
5se
2U)、5-胺甲醯基甲基-尿苷(ncm
5U)、5-羧基甲基胺基甲基-尿苷(cmnm
5U)、5-羧基甲基胺基甲基-2-硫基-尿苷(cmnm
5s
2U)、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷(τm
5U)、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷(τm
5s
2U)、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷(m
5U,亦即具有核鹼基去氧胸腺嘧啶)、1-甲基-假尿苷(m
1ψ)、5-甲基-2-硫基-尿苷(m
5s
2U)、1-甲基-4-硫基-假尿苷(m
1s
4ψ)、4-硫基-1-甲基-假尿苷、3-甲基-假尿苷(m
3ψ)、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷(D)、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷(m
5D)、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷(acp
3U)、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷(acp
3ψ)、5-(異戊烯基胺基甲基)尿苷(inm
5U)、5-(異戊烯基胺基甲基)-2-硫基-尿苷(inm
5s
2U)、α-硫基-尿苷、2'-O-甲基-尿苷(Um)、5,2'-O-二甲基-尿苷(m
5Um)、2'-O-甲基-假尿苷(ψm)、2-硫基-2'-O-甲基-尿苷(s
2Um)、5-甲氧基羰基甲基-2'-O-甲基-尿苷(mcm
5Um)、5-胺甲醯基甲基-2'-O-甲基-尿苷(ncm
5Um)、5-羧基甲基胺基甲基-2'-O-甲基-尿苷(cmnm
5Um)、3,2'-O-二甲基-尿苷(m
3Um)及5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷(inm
5Um)、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷及5‐[3‐(1‐E‐丙烯基胺基)尿苷。
在較佳實施例中,在每一情況下,核酸經修飾以含有1-甲基假尿苷(m
1ψ)代替尿苷。
在一些實施例中,替代性核鹼基為替代性胞嘧啶。具有替代性胞嘧啶之例示性核鹼基及核苷包括5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷(m
3C)、N4-乙醯基-胞苷(ac
4C)、5-甲醯基-胞苷(f
5C)、N4-甲基-胞苷(m
4C)、5-甲基-胞苷(m
5C)、5-鹵基-胞苷(例如5-碘-胞苷)、5-羥基甲基-胞苷(hm
5C)、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷(s
2C)、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶(k
2C)、α-硫基-胞苷、2'-O-甲基-胞苷(Cm)、5,2'-O-二甲基-胞苷(m
5Cm)、N4-乙醯基-2'-O-甲基-胞苷(ac
4Cm)、N4,2'-O-二甲基-胞苷(m
4Cm)、5-甲醯基-2'-O-甲基-胞苷(f
5Cm)、N4,N4,2'-O-三甲基-胞苷(m
4 2Cm)、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷及2’‐OH‐阿糖‐胞苷。
在一些實施例中,替代性核鹼基為替代性腺嘌呤。具有替代性腺嘌呤之例示性核鹼基及核苷包括2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤(例如2-胺基-6-氯-嘌呤)、6-鹵基-嘌呤(例如6-氯-嘌呤)、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷(m
1A)、2-甲基-腺嘌呤(m
2A)、N6-甲基-腺苷(m
6A)、2-甲基硫基-N6-甲基-腺苷(ms
2m
6A)、N6-異戊烯基-腺苷(i
6A)、2-甲基硫基-N6-異戊烯基-腺苷(ms
2i
6A)、N6-(順式-羥基異戊烯基)腺苷(io
6A)、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷(ms
2io
6A)、N6-甘胺醯胺甲醯基-腺苷(g
6A)、N6-蘇胺醯胺甲醯基-腺苷(t
6A)、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷(m
6t
6A)、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷(ms
2g
6A)、N6,N6-二甲基-腺苷(m
6 2A)、N6-羥基正纈胺醯胺甲醯基-腺苷(hn
6A)、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷(ms
2hn
6A)、N6-乙醯基-腺苷(ac
6A)、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷(Am)、N6,2'-O-二甲基-腺苷(m
6Am)、N6,N6,2'-O-三甲基-腺苷(m
6 2Am)、1,2'-O-二甲基-腺苷(m
1Am)、2'-O-核糖基腺苷(磷酸酯) (Ar(p))、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷及N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
在一些實施例中,替代性核鹼基為替代性鳥嘌呤。具有替代性鳥嘌呤之例示性核鹼基及核苷包括肌苷(I)、1-甲基-肌苷(m
1I)、懷俄苷(imG)、甲基懷俄苷(mimG)、4-去甲基-懷俄苷(imG-14)、異懷俄苷(imG2)、懷丁苷(yW)、過氧懷丁苷(o
2yW)、羥基懷丁苷(OhyW)、修飾不足之羥基懷丁苷(OhyW*)、7-去氮-鳥苷、辮苷(Q)、環氧辮苷(oQ)、半乳糖基-辮苷(galQ)、甘露糖基-辮苷(manQ)、7-氰基-7-去氮-鳥苷(preQ
0)、7-胺基甲基-7-去氮-鳥苷(preQ
1)、古嘌苷(G
+)、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷(m
7G)、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷(m
1G)、N2-甲基-鳥苷(m
2G)、N2,N2-二甲基-鳥苷(m
2 2G)、N2,7-二甲基-鳥苷(m
2,7G)、N2,N2,7-二甲基-鳥苷(m
2,2,7G)、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷(Gm)、N2-甲基-2'-O-甲基-鳥苷(m
2Gm)、N2,N2-二甲基-2'-O-甲基-鳥苷(m
2 2Gm)、1-甲基-2'-O-甲基-鳥苷(m
1Gm)、N2,7-二甲基-2'-O-甲基-鳥苷(m
2,7Gm)、2'-O-甲基-肌苷(Im)、1,2'-O-二甲基-肌苷(m
1Im)、2'-O-核糖基鳥苷(磷酸酯) (Gr(p))、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷及2’‐F‐鳥苷。
核苷酸之核鹼基可獨立地選自嘌呤、嘧啶、嘌呤或嘧啶類似物。舉例而言,核鹼基可各自獨立地選自腺嘌呤、胞嘧啶、鳥嘌呤、尿嘧啶或次黃嘌呤。在一些實施例中,核鹼基亦可包括(例如)鹼基之天然及合成衍生物,包括吡唑并[3,4-d]嘧啶、5-甲基胞嘧啶(5-me-C)、5-羥基甲基胞嘧啶、黃嘌呤、次黃嘌呤、2-胺基腺嘌呤、腺嘌呤及鳥嘌呤之6-甲基及其他烷基衍生物、腺嘌呤及鳥嘌呤之2-丙基及其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶及2-硫胞嘧啶、5-丙炔基尿嘧啶及胞嘧啶、6-偶氮尿嘧啶、胞嘧啶及胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-鹵基(例如8-溴)、8-胺基、8-硫醇、8-硫烷基、8-羥基及其他8-取代之腺嘌呤及鳥嘌呤、5-鹵基特定而言5-溴、5-三氟甲基及其他5-取代之尿嘧啶及胞嘧啶、7-甲基鳥嘌呤及7-甲基腺嘌呤、8-氮雜鳥嘌呤及8-氮雜腺嘌呤、去氮鳥嘌呤、7-去氮鳥嘌呤、3-去氮鳥嘌呤、去氮腺嘌呤、7-去氮腺嘌呤、3-去氮腺嘌呤、吡唑并[3,4-d]嘧啶、咪唑并[1,5-a]1,3,5三嗪酮、9-去氮嘌呤、咪唑并[4,5-d]吡嗪、噻唑并[4,5-d]嘧啶、吡嗪-2-酮、1,2,4-三嗪、嗒嗪;及1,3,5三嗪。當使用簡寫A、G、C、T或U來繪示核苷酸時,每一字母係指代表性鹼基及/或其衍生物(例如A包括腺嘌呤或腺嘌呤類似物(例如7-去氮腺嘌呤))。
在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-三氟甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-羥基甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-溴-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-碘-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-甲氧基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-乙基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-苯基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-乙炔基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、N4-甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-氟-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、N4-乙醯基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、假異胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-甲醯基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-胺基烯丙基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿嘧啶、尿嘧啶、5-羧基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。
在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-三氟甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-羥基甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-溴-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-碘-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-甲氧基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-乙基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-苯基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-乙炔基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、N4-甲基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-氟-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、N4-乙醯基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、假異胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-甲醯基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-胺基烯丙基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿嘧啶、尿嘧啶、5-羧基-胞嘧啶及胞嘧啶作為僅有之尿嘧啶及胞嘧啶。
在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-三氟甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-羥基甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-溴-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-碘-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-甲氧基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-乙基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-苯基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-乙炔基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、N4-甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-氟-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、N4-乙醯基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、假異胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-甲醯基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-胺基烯丙基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有5-甲氧基-尿苷、尿苷、5-羧基-胞苷及胞苷作為僅有之尿苷及胞苷。
在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-三氟甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-羥基甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-溴-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-碘-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-甲氧基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-乙基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-苯基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-乙炔基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、N4-甲基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-氟-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、N4-乙醯基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、假異胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-甲醯基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-胺基烯丙基-胞苷及胞苷作為僅有之尿苷及胞苷。在一些實施例中,本發明之多核苷酸含有1-甲基-假尿苷、尿苷、5-羧基-胞苷及胞苷作為僅有之尿苷及胞苷。
在一些實施例中,本發明之多核苷酸含有
表 4之核苷中之一者之尿嘧啶及尿嘧啶作為僅有之尿嘧啶。在其他實施例中,本發明之多核苷酸含有
表 4之尿苷及尿苷作為僅有之尿苷。
表 4. 例示性經修飾之尿苷核苷
核苷 |
5-甲氧基-尿苷 |
1-甲基-假尿苷 |
假尿苷 |
5-甲基-尿苷 |
5-溴-尿苷 |
2-硫基-尿苷 |
4-硫尿苷 |
2'-O-甲基尿苷 |
5-甲基-2-硫尿苷 |
5,2'-O-二甲基尿苷 |
5-胺基甲基-2-硫尿苷 |
5-(1-丙炔基)阿糖-尿苷 |
2'-O-甲基-5-(1-丙炔基)尿苷 |
5-乙烯基阿糖尿苷 |
(Z)-5-(2-溴-乙烯基)阿糖-尿苷 |
(E)-5-(2-溴-乙烯基)阿糖-尿苷 |
(Z)-5-(2-溴-乙烯基)尿苷 |
(E)-5-(2-溴-乙烯基)尿苷 |
5-氰基尿苷 |
5-甲醯基尿苷 |
5-二甲基胺基尿苷 |
5-三氘代甲基-6-氘代尿苷 |
5-(2-呋喃基)尿苷 |
5-苯基乙炔基尿苷 |
4'-碳環尿苷 |
4'-乙炔基尿苷 |
4'-疊氮基尿苷 |
2'-去氧-2',2'-二氟尿苷 |
2'-去氧-2'-b-氟尿苷 |
2'-去氧-2'-b-氯尿苷 |
2'-去氧-2'-b-溴尿苷 |
2'-去氧-2'-b-碘尿苷 |
5'-高尿苷 |
2'-去氧-2'-a-巰基尿苷 |
2'-去氧-2'-a-硫甲氧基尿苷 |
2'-去氧-2'-a-疊氮基尿苷 |
2'-去氧-2'-a-胺基尿苷 |
2'-去氧-2'-b-巰基尿苷 |
2'-去氧-2'-b-硫甲氧基尿苷 |
2'-去氧-2'-b-疊氮基尿苷 |
2'-去氧-2'-b-胺基尿苷 |
2'-b-三氟甲基尿苷 |
2'-a-三氟甲基尿苷 |
2'-b-乙炔基尿苷 |
2'-a-乙炔基尿苷 |
1-乙基-假尿苷 |
1-丙基-假尿苷 |
1-異丙基-假尿苷 |
1-(2,2,2-三氟乙基)-假尿苷 |
1-環丙基-假尿苷 |
1-環丙基甲基-假尿苷 |
1-苯基-假尿苷 |
1-苄基-假尿苷 |
1-胺基甲基-假尿苷 |
假尿苷-1-2-乙酸 |
1-(3-胺基-3-羧基丙基)假尿苷 |
1-甲基-3-(3-胺基-3-羧基丙基)假尿苷 |
6-甲基-假尿苷 |
6-三氟甲基-假尿苷 |
6-甲氧基-假尿苷 |
6-苯基-假尿苷 |
6-碘-假尿苷 |
6-溴-假尿苷 |
6-氯-假尿苷 |
6-氟-假尿苷 |
4-硫基-假尿苷 |
2-硫基-假尿苷 |
α-硫基-假尿苷 |
1-Me-α-硫基-假尿苷 |
1-丁基-假尿苷 |
1-第三丁基-假尿苷 |
1-戊基-假尿苷 |
1-己基-假尿苷 |
1-三氟甲基-假尿苷 |
1-環丁基-假尿苷 |
1-環戊基-假尿苷 |
1-環己基-假尿苷 |
1-環庚基-假尿苷 |
1-環辛基-假尿苷 |
1-環丁基甲基-假尿苷 |
1-環戊基甲基-假尿苷 |
1-環己基甲基-假尿苷 |
1-環庚基甲基-假尿苷 |
1-環辛基甲基-假尿苷 |
1-對甲苯基-假尿苷 |
1-(2,4,6-三甲基-苯基)假尿苷 |
1-(4-甲氧基-苯基)假尿苷 |
1-(4-胺基-苯基)假尿苷 |
1(4-硝基-苯基)假尿苷 |
假尿苷-N1-對苯甲酸 |
1-(4-甲基-苄基)假尿苷 |
1-(2,4,6-三甲基-苄基)假尿苷 |
1-(4-甲氧基-苄基)假尿苷 |
1-(4-胺基-苄基)假尿苷 |
1-(4-硝基-苄基)假尿苷 |
假尿苷-N1-甲基-對苯甲酸 |
1-(2-胺基-乙基)假尿苷 |
1-(3-胺基-丙基)假尿苷 |
1-(4-胺基-丁基)假尿苷 |
1-(5-胺基-戊基)假尿苷 |
1-(6-胺基-己基)假尿苷 |
假尿苷-N1-3-丙酸 |
假尿苷-N1-4-丁酸 |
假尿苷-N1-5-戊酸 |
假尿苷-N1-6-己酸 |
假尿苷-N1-7-庚酸 |
1-(2-胺基-2-羧基乙基)假尿苷 |
1-(4-胺基-4-羧基丁基)假尿苷 |
3-烷基-假尿苷 |
6-乙基-假尿苷 |
6-丙基-假尿苷 |
6-異丙基-假尿苷 |
6-丁基-假尿苷 |
6-第三丁基-假尿苷 |
6-(2,2,2-三氟乙基)-假尿苷 |
6-乙氧基-假尿苷 |
6-三氟甲氧基-假尿苷 |
6-苯基-假尿苷 |
6-(經取代苯基)-假尿苷 |
6-氰基-假尿苷 |
6-疊氮基-假尿苷 |
6-胺基-假尿苷 |
6-乙基羧酸酯-假尿苷 |
6-羥基-假尿苷 |
6-甲基胺基-假尿苷 |
6-二甲基胺基-假尿苷 |
6-羥基胺基-假尿苷 |
6-甲醯基-假尿苷 |
6-(4-嗎啉基)-假尿苷 |
6-(4-硫嗎啉基)-假尿苷 |
1-me-4-硫基-假尿苷 |
1-me-2-硫基-假尿苷 |
1,6-二甲基-假尿苷 |
1-甲基-6-三氟甲基-假尿苷 |
1-甲基-6-乙基-假尿苷 |
1-甲基-6-丙基-假尿苷 |
1-甲基-6-異丙基-假尿苷 |
1-甲基-6-丁基-假尿苷 |
1-甲基-6-第三丁基-假尿苷 |
1-甲基-6-(2,2,2-三氟乙基)假尿苷 |
1-甲基-6-碘-假尿苷 |
1-甲基-6-溴-假尿苷 |
1-甲基-6-氯-假尿苷 |
1-甲基-6-氟-假尿苷 |
1-甲基-6-甲氧基-假尿苷 |
1-甲基-6-乙氧基-假尿苷 |
1-甲基-6-三氟甲氧基-假尿苷 |
1-甲基-6-苯基-假尿苷 |
1-甲基-6-(經取代苯基)假尿苷 |
1-甲基-6-氰基-假尿苷 |
1-甲基-6-疊氮基-假尿苷 |
1-甲基-6-胺基-假尿苷 |
1-甲基-6-乙基羧酸酯-假尿苷 |
1-甲基-6-羥基-假尿苷 |
1-甲基-6-甲基胺基-假尿苷 |
1-甲基-6-二甲基胺基-假尿苷 |
1-甲基-6-羥基胺基-假尿苷 |
1-甲基-6-甲醯基-假尿苷 |
1-甲基-6-(4-嗎啉基)-假尿苷 |
1-甲基-6-(4-硫嗎啉基)-假尿苷 |
1-烷基-6-乙烯基-假尿苷 |
1-烷基-6-烯丙基-假尿苷 |
1-烷基-6-高烯丙基-假尿苷 |
1-烷基-6-乙炔基-假尿苷 |
1-烷基-6-(2-丙炔基)-假尿苷 |
1-烷基-6-(1-丙炔基)-假尿苷 |
1-羥基甲基假尿苷 |
1-(2-羥基乙基)假尿苷 |
1-甲氧基甲基假尿苷 |
1-(2-甲氧基乙基)假尿苷 |
1-(2,2-二乙氧基乙基)假尿苷 |
(±)1-(2-羥基丙基)假尿苷 |
(2R)-1-(2-羥基丙基)假尿苷 |
(2S)-1-(2-羥基丙基)假尿苷 |
1-氰基甲基假尿苷 |
1-嗎啉基甲基假尿苷 |
1-硫嗎啉基甲基假尿苷 |
1-苄基氧基甲基假尿苷 |
1-(2,2,3,3,3-五氟丙基)假尿苷 |
1-硫甲氧基甲基假尿苷 |
1-甲磺醯基甲基假尿苷 |
1-乙烯基假尿苷 |
1-烯丙基假尿苷 |
1-高烯丙基假尿苷 |
1-炔丙基假尿苷 |
1-(4-氟苄基)假尿苷 |
1-(4-氯苄基)假尿苷 |
1-(4-溴苄基)假尿苷 |
1-(4-碘苄基)假尿苷 |
1-(4-甲基苄基)假尿苷 |
1-(4-三氟甲基苄基)假尿苷 |
1-(4-甲氧基苄基)假尿苷 |
1-(4-三氟甲氧基苄基)假尿苷 |
1-(4-硫甲氧基苄基)假尿苷 |
1-(4-甲磺醯基苄基)假尿苷 |
假尿苷1-(4-甲基苯甲酸) |
假尿苷1-(4-甲基苯磺酸) |
1-(2,4,6-三甲基苄基)假尿苷 |
1-(4-硝基苄基)假尿苷 |
1-(4-疊氮基苄基)假尿苷 |
1-(3,4-二甲氧基苄基)假尿苷 |
1-(3,4-雙-三氟甲氧基苄基)假尿苷 |
1-乙醯基假尿苷 |
1-三氟乙醯基假尿苷 |
1-苯甲醯基假尿苷 |
1-新戊醯基假尿苷 |
1-(3-環丙基-丙-2-炔基)假尿苷 |
假尿苷1-甲基膦酸二乙基酯 |
假尿苷1-甲基膦酸 |
假尿苷1-[3-(2-乙氧基)]丙酸 |
假尿苷1-[3-{2-(2-乙氧基)-乙氧基}]丙酸 |
假尿苷TP 1-[3-{2-(2-[2-乙氧基]-乙氧基)-乙氧基}]丙酸 |
假尿苷1-[3-{2-(2-[2-(2-乙氧基)-乙氧基]-乙氧基)-乙氧基}]丙酸 |
假尿苷1-[3-{2-(2-[2-{2(2-乙氧基)-乙氧基}-乙氧基]-乙氧基)-乙氧基}]丙酸 |
1-{3-[2-(2-胺基乙氧基)-乙氧基]-丙醯基}假尿苷 |
1-[3-(2-{2-[2-(2-胺基乙氧基)-乙氧基]-乙氧基}-乙氧基)-丙醯基]假尿苷 |
1-生物素基假尿苷 |
1-生物素基-PEG2-假尿苷 |
5-氧基乙酸-甲基酯-尿苷 |
3-甲基-假尿苷 |
5-三氟甲基-尿苷 |
5-甲基-胺基-甲基-尿苷 |
5-羧基-甲基-胺基-甲基-尿苷 |
5-羧基甲基胺基甲基-2’-OMe-尿苷 |
5-羧基甲基胺基甲基-2-硫基-尿苷 |
5-甲基胺基甲基-2-硫基-尿苷 |
5-甲氧基-羰基-甲基-尿苷 |
5-甲氧基-羰基-甲基-2’-OMe-尿苷 |
5-氧基乙酸-尿苷 |
3-(3-胺基-3-羧基丙基)-尿苷 |
5-(羧基羥基甲基)尿苷甲基酯 |
5-(羧基羥基甲基)尿苷 |
2’-OMe-假尿苷 |
2’-疊氮基-2’-去氧-尿苷 |
2’-胺基-2’-去氧-尿苷 |
2’-F-5-甲基-2’-去氧-尿苷 |
5-碘-2’-氟-去氧尿苷 |
2’-溴-去氧尿苷 |
2,2’-去水-尿苷 |
2’-疊氮基-去氧尿苷 |
5-甲氧基羰基甲基-2-硫尿苷 |
5-甲基胺基甲基-2-硫尿苷 |
5-胺甲醯基甲基尿苷 |
5-胺甲醯基甲基-2'-O-甲基尿苷 |
1-甲基-3-(3-胺基-3-羧基丙基)假尿苷 |
5-甲基胺基甲基-2-硒基尿苷 |
5-羧基甲基尿苷 |
5-甲基二氫尿苷 |
5-牛磺酸甲基尿苷 |
5-牛磺酸甲基-2-硫尿苷 |
5-(異戊烯基胺基甲基)尿苷 |
5-(異戊烯基胺基甲基)-2-硫尿苷 |
5-(異戊烯基胺基甲基)-2'-O-甲基尿苷 |
2'-O-甲基假尿苷 |
2-硫基-2'-O-甲基尿苷 |
3,2'-O-二甲基尿苷 |
5-甲氧基-羰基甲基-尿苷 |
5-羥基-尿苷 |
5-異戊烯基-胺基甲基-尿苷 |
在一些實施例中,本發明之多核苷酸含有
表 5之核苷中之一者之胞嘧啶及胞嘧啶作為僅有之胞嘧啶。在其他實施例中,本發明之多核苷酸含有
表 5之胞苷及胞苷作為僅有之胞苷。
表 5. 例示性經修飾之胞苷核苷
c. 核苷間鍵聯上之改變
核苷 |
α-硫基-胞苷 |
假異胞苷 |
吡咯并-胞苷 |
5-甲基-胞苷 |
N4-乙醯基-胞苷 |
5-溴-胞苷 |
5-三氟甲基-胞苷 |
5-羥基甲基-胞苷 |
5-碘-胞苷 |
5-乙基-胞苷 |
5-甲氧基-胞苷 |
5-乙炔基-胞苷 |
5-氟-胞苷 |
5-苯基-胞苷 |
N4-Bz-胞苷 |
N4-甲基-胞苷 |
5-假異胞苷 |
5-甲醯基-胞苷 |
5-胺基烯丙基-胞苷 |
2'-O-甲基胞苷 |
2'-O-甲基-5-(1-丙炔基)胞苷 |
5-(1-丙炔基)阿糖-胞苷 |
5-乙炔基阿糖-胞苷 |
5-乙炔基胞苷 |
5-氰基胞苷 |
5-(2-氯-苯基)-2-硫胞苷 |
5-(4-胺基-苯基)-2-硫胞苷 |
N4,2'-O-二甲基胞苷 |
3'-乙炔基胞苷 |
4'-碳環胞苷 |
4'-乙炔基胞苷 |
4'-疊氮基胞苷 |
2'-去氧-2',2'-二氟胞苷 |
2'-去氧-2'-b-氟胞苷 |
2'-去氧-2'-b-氯胞苷 |
2'-去氧-2'-b-溴胞苷 |
2'-去氧-2'-b-碘胞苷 |
5'-高胞苷 |
2'-去氧-2'-a-巰基胞苷 |
2'-去氧-2'-a-硫甲氧基胞苷 |
2'-去氧-2'-a-疊氮基胞苷 |
2'-去氧-2'-a-胺基胞苷 |
2'-去氧-2'-b-巰基胞苷 |
2'-去氧-2'-b-硫甲氧基胞苷 |
2'-去氧-2'-b-疊氮基胞苷 |
2'-去氧-2'-b-胺基胞苷 |
2'-b-三氟甲基胞苷 |
2'-a-三氟甲基胞苷 |
2'-b-乙炔基胞苷 |
2'-a-乙炔基胞苷 |
(E)-5-(2-溴-乙烯基)胞苷 |
2’-疊氮基-2’-去氧-胞苷 |
2’-胺基-2’-去氧-胞苷 |
5-胺基烯丙基-胞苷 |
2,2’-去水-胞苷 |
N4-胺基-胞苷 |
2’-O-甲基-N4-乙醯基-胞苷 |
2’-氟-N4-乙醯基-胞苷 |
2’-氟-N4-Bz-胞苷 |
2’-O-甲基-N4-Bz-胞苷 |
N4,2'-O-二甲基胞苷 |
5-甲醯基-2'-O-甲基胞苷 |
可併入至多核苷酸分子中之替代性核苷酸可在核苷間鍵聯(例如磷酸酯主鏈)上經改變。本文中,在多核苷酸主鏈之背景中,片語「磷酸酯」與「磷酸二酯」可互換使用。主鏈磷酸酯基可藉由用不同的取代基置換一或多個氧原子而經改變。
替代性核苷及核苷酸可包括用如本文所闡述之另一核苷間鍵聯大規模置換未改變之磷酸酯部分。替代性磷酸酯基之實例包括(但不限於)硫代磷酸酯、硒代磷酸酯、硼烷磷酸酯(boranophosphate、boranophosphate ester)、膦酸氫酯、胺基磷酸酯、磷醯二胺、膦酸烷基酯或膦酸芳基酯以及磷酸三酯。二硫代磷酸酯之兩個非連接氧均由硫置換。磷酸酯連接體亦可藉由用氮(橋接胺基磷酸酯)、硫(橋接硫代磷酸酯)及碳(橋接亞甲基-膦酸酯)置換連接氧來改變。
替代性核苷及核苷酸可包括用硼烷部分(BH
3)、硫(硫基)、甲基、乙基及/或甲氧基置換一或多個非橋接氧。作為非限制性實例,在相同位置(例如阿爾法(α)、貝塔(β)或伽馬(γ)位置)處之兩個非橋接氧可經硫(硫基)及甲氧基置換。
提供磷酸酯部分(例如α-硫代磷酸酯)之α位上之一或多個氧原子之置換,以經由非天然硫代磷酸酯主鏈鍵聯賦予RNA及DNA穩定性(諸如針對核酸外切酶及核酸內切酶)。硫代磷酸酯DNA及RNA具有增加之核酸酶抗性,且因此在細胞環境中之半衰期更長。儘管不希望受理論束縛,但硫代磷酸酯連接之多核苷酸分子亦有望經由細胞先天免疫分子之較弱結合/活化來降低先天免疫反應。
在具體實施例中,替代性核苷包括α-硫基-核苷(例如5'-O-(1-硫代磷酸酯)-腺苷、5'-O-(1-硫代磷酸酯)-胞苷(α-硫基-胞苷)、5'-O-(1-硫代磷酸酯)-鳥苷、5'-O-(1-硫代磷酸酯)-尿苷或5'-O-(1-硫代磷酸酯)-假尿苷)。
根據本發明可採用之其他核苷間鍵聯(包括不含磷原子之核苷間鍵聯)闡述於下文中。
d. 替代性糖、核鹼基與核苷間鍵聯之組合
本發明之多核苷酸可包括針對糖、核鹼基及/或核苷間鍵聯之改變之組合。該等組合可包括本文所闡述之任一或多種改變。
3. 脂質奈米顆粒 (LNP) 組合物
本揭示案提供囊封本文所闡述之核酸分子(例如線性或環狀RNA分子)之LNP組合物。本揭示案之LNP可賦予一或多種有利性質。本文所闡述之脂質奈米顆粒組合物可用於遞送治療劑及/或預防劑,例如將mRNA遞送至哺乳動物細胞或器官。舉例而言,本文所闡述之脂質奈米顆粒具有極少或不具有免疫原性。舉例而言,與參考脂質(例如MC3、KC2或DLinDMA)相比,本文所揭示之脂質化合物具有較低之免疫原性。舉例而言,與包含參考脂質(例如MC3、KC2或DLinDMA)以及治療劑或預防劑(例如mRNA)之相應調配物相比,包含本文所揭示脂質以及相同治療劑或預防劑之調配物之治療指數增加。
在一些實施例中,本申請案提供醫藥組合物,其包含:
(a) 包含脂質奈米顆粒之遞送劑;及
(b) 包含本揭示案之IRES之多核苷酸。
a. 脂質奈米顆粒
在一些實施例中,本揭示案之多核苷酸包括在脂質奈米顆粒(LNP)中。根據本揭示案之脂質奈米顆粒可包含:(i)可電離脂質(例如可電離胺基脂質);(ii)固醇或其他結構脂質;(iii)非陽離子輔助脂質或磷脂;及(iv) PEG修飾之脂質。在一些實施例中,根據本揭示案之脂質奈米顆粒進一步包含一或多種本揭示案之多核苷酸(例如編碼治療性多肽(諸如本文所揭示之治療性多肽)之線性或環狀RNA)。
本揭示案之脂質奈米顆粒可使用此項技術中眾所周知之組分、組合物及方法來生成,例如參見PCT/US2016/052352;PCT/US2016/068300;PCT/US2017/037551;PCT/US2015/027400;PCT/US2016/047406;PCT/US2016000129;PCT/US2016/014280;PCT/US2016/014280;PCT/US2017/038426;PCT/US2014/027077;PCT/US2014/055394;PCT/US2016/52117;PCT/US2012/069610;PCT/US2017/027492;PCT/US2016/059575及PCT/US2016/069491,所有該等專利均係以全文引用的方式併入本文中。
在一些實施例中,脂質奈米顆粒包含以下含量之可電離陽離子脂質(例如可電離胺基脂質):20-60 mol.%、25-60 mol.%、30-60 mol.%、35-60 mol.%、40-60 mol.%、45-60 mol.%、20-55 mol.%、25-55 mol.%、30-55 mol.%、35-55 mol.%、40-55 mol.%、45-55 mol.%、20-50 mol.%、25-50 mol.%、30-50 mol.%、35-50 mol.%或40-50 mol.%。舉例而言,脂質奈米顆粒可包含以下含量之可電離陽離子脂質(例如可電離胺基脂質):40-50 mol.%、45-50 mol.%、45-46 mol.%、46-47 mol.%、47-48 mol.%、48-49 mol.%或49-50 mol.%,例如約45 mol.%、約45.5 mol.%、約46 mol.%、約46.5 mol.%、約47 mol.%、約47.5 mol.%、約48 mol.%、約48.5 mol.%、約49 mol.%或約49.5 mol.%之可電離陽離子脂質(例如可電離胺基脂質)。
在一些實施例中,脂質奈米顆粒包含含量為5-25 mol.%之非陽離子輔助脂質或磷脂。舉例而言,脂質奈米顆粒可包含以下莫耳比含量之非陽離子輔助脂質或磷脂:5-25 mol.%、5-20 mol.%、5-15 mol.%、10-25 mol.%、10-20 mol.%、10-15 mol.%、5-6 mol.%、6-7 mol.%、7-8 mol.%、8-9 mol.%、9-10 mol.%、10-11 mol.%、11-12 mol.%、12-13 mol.%、13-14 mol.%、14-15 mol.%、10-14 mol.%、10-13 mol.%、10-12 mol.%、10-11 mol.%、9-15 mol.%、9-14 mol.%、9-13 mol.%、9-12 mol.%或9-11 mol.%之非陽離子脂質。
在一些實施例中,脂質奈米顆粒包含以下莫耳比含量之固醇或其他結構脂質:25-55 mol.%、25-50 mol.%、25-45 mol.%、25-40 mol.%、25-35 mol.%、30-55 mol.%、30-50 mol.%、30-45 mol.%、30-40 mol.%、30-35 mol.%、35-55 mol.%、35-50 mol.%、35-45 mol.%、35-40 mol.%、25-30 mol.%、30-35 mol.%、25-28 mol.%、28-30 mol.%、30-33 mol.%、35-38 mol.%、38-40 mol.%、36-40 mol.%、37-40 mol.%、38-40 mol.%、38-39 mol.%、36-40 mol.%、37-40 mol.%、36-39 mol.%或37-39 mol.%。舉例而言,脂質奈米顆粒可包含以下含量之固醇或其他結構脂質:約30 mol.%、約30.5 mol.%、約31.0 mol.%、約31.5 mol.%、約32.0 mol.%、約32.5 mol.%、約33.0 mol.%、約33.5 mol.%、約34.0 mol.%、約34.5 mol.%、約35.0 mol.%、約35.5 mol.%、約36.0 mol.%、約36.5 mol.%、約37.0 mol.%、約37.5 mol.%、約38.0 mol.%、約38.5 mol.%、約39.0 mol.%、約39.5 mol.%、約40.0 mol.%、約40.5 mol.%、約41.0 mol.%、約41.5 mol.%、約42.0 mol.%、約42.5 mol.%、約43.0 mol.%、約43.5 mol.%、約44.0 mol.%、約44.5 mol.%或約45.0 mol.%。
在一些實施例中,脂質奈米顆粒包含以下含量之PEG修飾之脂質:0.5-15 mol.%、1.0-15 mol.%、1.5-15 mol.%、2.0-15 mol.%、2.5-15 mol.%、3.0-15 mol.%、3.5-15 mol.%、4.0-15 mol.%、4.5-15 mol.%、5.0-15 mol.%、10-15 mol.%、0.5-10 mol.%、0.5-5 mol.%、0.5-4.5 mol.%、0.5-4.0 mol.%、0.5-3.5 mol.%、0.5-3.0 mol.%、0.5-2.5 mol.%、0.5-2.0 mol.%、0.5-1.5 mol.%、0.5-1.0 mol.%、1.0-10 mol.%、1.0-5 mol.%、1.0-4.5 mol.%、1.0-4.0 mol.%、1.0-3.5 mol.%、1.0-3.0 mol.%、1.0-2.5 mol.%、1.0-2.0 mol.%、1.0-1.5 mol.%、1.5-5.0 mol.%、1.5-4.5 mol.%、1.5-4.0 mol.%、1.5-3.5 mol.%、1.5-3.0 mol.%、1.5-2.5 mol.%、1.5-2.0 mol.%、2.0-5.0 mol.%、2.0-4.5 mol.%、2.0-4.0 mol.%、2.0-3.5 mol.%、2.0-3.0 mol.%或2.0-2.5 mol.%。舉例而言,脂質奈米顆粒可包含以下含量之PEG修飾之脂質:約0.5 mol.%、約1.0 mol.%、約1.5 mol.%、約2.0 mol.%、約2.5 mol.%、約3.0 mol.%、約3.5 mol.%、約4.0 mol.%、約4.5 mol.%、約5.0 mol.%、約6.0 mol.%、約7.0 mol.%、約8.0 mol.%、約9.0 mol.%、約10.0 mol.%或約15.0 mol.%。
在一些實施例中,脂質奈米顆粒包含:(i) 20 mol.%至60 mol.%之可電離陽離子脂質(例如可電離胺基脂質),(ii) 25 mol.%至55 mol.%之固醇或其他結構脂質,(iii) 5 mol.%至25 mol.%之非陽離子脂質(例如磷脂),及(iv) 0.5 mol.%至15 mol.%之PEG修飾之脂質。
在一些實施例中,脂質奈米顆粒包含:(i) 40 mol.%至50 mol.%之可電離陽離子脂質(例如可電離胺基脂質),(ii) 30 mol.%至45 mol.%之固醇或其他結構脂質,(iii) 5 mol.%至15 mol.%之非陽離子脂質(例如磷脂),及(iv) 1 mol.%至5 mol.%之PEG修飾之脂質。
在一些實施例中,脂質奈米顆粒包含:(i) 45 mol.%至50 mol.%之可電離陽離子脂質(例如可電離胺基脂質),(ii) 35 mol.%至45 mol.%之固醇或其他結構脂質,(iii) 8 mol.%至12 mol.%之非陽離子脂質(例如磷脂),及(iv) 1.5 mol.%至3.5 mol.%之PEG修飾之脂質。
在以下部分中,以「I-」前綴編號之「化合物」(例如「化合物I-1」、「化合物I-2」、「化合物I-3」、「化合物I-VI」等)指示具體的可電離脂質化合物。同樣,以「P-」前綴編號之化合物(例如「化合物P-I」等)指示具體的PEG修飾之脂質化合物。
b. 可電離胺基脂質
在一些實施例中,本揭示案之脂質奈米顆粒包含可電離陽離子脂質(例如可電離胺基脂質),其為式(I)化合物:
(I)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈;其中
R’
支鏈為:
;其中
表示連接點;
其中R
aα、R
aβ、R
aγ及R
aδ各自獨立地選自由H、C
2-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;及
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;且n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
每一R
5獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
每一R
6獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
M及M’各自獨立地選自由-C(O)O-及-OC(O)-組成之群;
R’為C
1-12烷基或C
2-12烯基;
l選自由1、2、3、4及5組成之群;且
m選自由5、6、7、8、9、10、11、12及13組成之群。
在一些實施例中,在式(I)中,R’
a為R’
支鏈;R’
支鏈為
;
表示連接點;R
aα、R
aβ、R
aγ及R
aδ各自為H;R
2及R
3各自為C
1-14烷基;R
4為-(CH
2)
nOH;n為2;每一R
5為H;每一R
6為H;M及M’各自為-C(O)O-;R’為C
1-12烷基;l為5;且m為7。
在一些實施例中,在式(I)中,R’
a為R’
支鏈;R’
支鏈為
;
表示連接點;R
aα、R
aβ、R
aγ及R
aδ各自為H;R
2及R
3各自為C
1-14烷基;R
4為-(CH
2)
nOH;n為2;每一R
5為H;每一R
6為H;M及M’各自為-C(O)O-;R’為C
1-12烷基;l為3;且m為7。
在式(I)化合物之一些實施例中,R’
a為R’
支鏈;R’
支鏈為
;
表示連接點;R
aα為C
2-12烷基;R
aβ、R
aγ及R
aδ各自為H;R
2及R
3各自為C
1-14烷基;R
4為
;R
10為NH(C
1-6烷基);n2為2;R
5為H;每一R
6為H;M及M’各自為-C(O)O-;R’為C
1-12烷基;l為5;且m為7。
在式(I)化合物之一些實施例中,R’
a為R’
支鏈;
R’
支鏈為
;
表示連接點;R
aα、R
aβ及R
aδ各自為H;R
aγ為C
2-12烷基;R
2及R
3各自為C
1-14烷基;R
4為-(CH
2)
nOH;n為2;每一R
5為H;每一R
6為H;M及M’各自為-C(O)O-;R’為C
1-12烷基;l為5;且m為7。
在一些實施例中,式(I)化合物選自:
(化合物I-1)、
(化合物I-2)及
(化合物I-3)。
在一些實施例中,式(I)化合物為:
(化合物I-1)。
在一些實施例中,式(I)化合物為:
(化合物I-2)。
在一些實施例中,式(I)化合物為:
(化合物I-3)。
在一些態樣中,本揭示案係關於式(Ia)化合物:
(Ia)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈;其中
R’
支鏈為:
;其中
表示連接點;
其中R
aβ、R
aγ及R
aδ各自獨立地選自由H、C
2-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;及
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;且n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
每一R
5獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
每一R
6獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
M及M’各自獨立地選自由-C(O)O-及-OC(O)-組成之群;
R’為C
1-12烷基或C
2-12烯基;
l選自由1、2、3、4及5組成之群;且
m選自由5、6、7、8、9、10、11、12及13組成之群。
在一些態樣中,本揭示係關於式(Ib)化合物:
(Ib)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈;其中
R’
支鏈為:
;其中
表示連接點;
其中R
aα、R
aβ、R
aγ及R
aδ各自獨立地選自由H、C
2-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4為-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;
每一R
5獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
每一R
6獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
M及M’各自獨立地選自由-C(O)O-及-OC(O)-組成之群;
R’為C
1-12烷基或C
2-12烯基;
l選自由1、2、3、4及5組成之群;且
m選自由5、6、7、8、9、10、11、12及13組成之群。
在式(I)或式(Ib)之一些實施例中,R’
a為R’
支鏈;R’
支鏈為
;
表示連接點;R
aβ、R
aγ及R
aδ各自為H;R
2及R
3各自為C
1-14烷基;R
4為-(CH
2)
nOH;n為2;每一R
5為H;每一R
6為H;M及M’各自為-C(O)O-;R’為C
1-12烷基;l為5;且m為7。
在式(I)或式(Ib)之一些實施例中,R’
a為R’
支鏈;R’
支鏈為
;
表示連接點;R
aβ及R
aδ各自為H;R
aγ為C
2-12烷基;R
2及R
3各自為C
1-14烷基;R
4為-(CH
2)
nOH;n為2;每一R
5為H;每一R
6為H;M及M’各自為-C(O)O-;R’為C
1-12烷基;l為5;且m為7。
在一些實施例中,本揭示案係關於式(Ic)化合物:
(Ic)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈;其中
R’
支鏈為:
;其中
表示連接點;
其中R
aα、R
aβ、R
aγ及R
aδ各自獨立地選自由H、C
2-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4為
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
每一R
5獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
每一R
6獨立地選自由C
1-3烷基、C
2-3烯基及H組成之群;
M及M’各自獨立地選自由-C(O)O-及-OC(O)-組成之群;
R’為C
1-12烷基或C
2-12烯基;
l選自由1、2、3、4及5組成之群;且
m選自由5、6、7、8、9、10、11、12及13組成之群。
在一些實施例中,R’
a為R’
支鏈;R’
支鏈為
;
表示連接點;R
aβ、R
aγ及R
aδ各自為H;R
aα為C
2-12烷基;R
2及R
3各自為C
1-14烷基;R
4為
;
表示連接點;R
10為NH(C
1-6烷基);n2為2;每一R
5為H;每一R
6為H;M及M’各自為-C(O)O-;R’為C
1-12烷基;l為5;且m為7。
在一些實施例中,式(Ic)化合物為:
(化合物I-2)。
在一些態樣中,本揭示案係關於式(II)化合物:
(II)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈或R’
環狀;其中
R’
支鏈為:
且R’
環狀為:
;且
R’
b為:
或
;
其中
表示連接點;
R
aγ及R
aδ各自獨立地選自由H、C
1-12烷基及C
2-12烯基組成之群,其中R
aγ及R
aδ中之至少一者選自由C
1-12烷基及C
2-12烯基組成之群;
R
bγ及R
bδ各自獨立地選自由H、C
1-12烷基及C
2-12烯基組成之群,其中R
bγ及R
bδ中之至少一者選自由C
1-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;及
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;且n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
每一R’獨立地為C
1-12烷基或C
2-12烯基;
Y
a為C
3-6碳環;
R*”
a選自由C
1-15烷基及C
2-15烯基組成之群;且
s為2或3;
m選自1、2、3、4、5、6、7、8及9;
l選自1、2、3、4、5、6、7、8及9。
在一些態樣中,本揭示案係關於式(II-a)化合物:
(II-a)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈或R’
環狀;其中
R’
支鏈為:
且R’
b為:
或
;
其中
表示連接點;
R
aγ及R
aδ各自獨立地選自由H、C
1-12烷基及C
2-12烯基組成之群,其中R
aγ及R
aδ中之至少一者選自由C
1-12烷基及C
2-12烯基組成之群;
R
bγ及R
bδ各自獨立地選自由H、C
1-12烷基及C
2-12烯基組成之群,其中R
bγ及R
bδ中之至少一者選自由C
1-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;及
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;且n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
每一R’獨立地為C
1-12烷基或C
2-12烯基;
m選自1、2、3、4、5、6、7、8及9;
l選自1、2、3、4、5、6、7、8及9。
在一些態樣中,本揭示案係關於式(II-b)化合物:
(II-b)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈或R’
環狀;其中
R’
支鏈為:
且R’
b為:
或
;
其中
表示連接點;
R
aγ及R
bγ各自獨立地選自由C
1-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;及
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;且n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
每一R’獨立地為C
1-12烷基或C
2-12烯基;
m選自1、2、3、4、5、6、7、8及9;
l選自1、2、3、4、5、6、7、8及9。
在一些態樣中,本揭示案係關於式(II-c)化合物:
(II-c)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈或R’
環狀;其中
R’
支鏈為:
且R’
b為:
;
其中
表示連接點;
其中R
aγ選自由C
1-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;及
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;且n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
R’為C
1-12烷基或C
2-12烯基;
m選自1、2、3、4、5、6、7、8及9;
l選自1、2、3、4、5、6、7、8及9。
在一些態樣中,本揭示案係關於式(II-d)化合物:
(II-d)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈或R’
環狀;其中
R’
支鏈為:
且R’
b為:
;
其中
表示連接點;
其中R
aγ及R
bγ各自獨立地選自由C
1-12烷基及C
2-12烯基組成之群;
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;及
,
其中
表示連接點;其中
R
10為N(R)
2;每一R獨立地選自由C
1-6烷基、C
2-3烯基及H組成之群;且n2選自由1、2、3、4、5、6、7、8、9及10組成之群;
每一R’獨立地為C
1-12烷基或C
2-12烯基;
m選自1、2、3、4、5、6、7、8及9;
l選自1、2、3、4、5、6、7、8及9。
在一些態樣中,本揭示案係關於式(II-e)化合物:
(II-e)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈或R’
環狀;其中
R’
支鏈為:
且R’
b為:
;
其中
表示連接點;
其中R
aγ選自由C
1-12烷基及C
2-12烯基組成之群;
R
2及R
3各自獨立地選自由C
1-14烷基及C
2-14烯基組成之群;
R
4為-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;
R’為C
1-12烷基或C
2-12烯基;
m選自1、2、3、4、5、6、7、8及9;
l選自1、2、3、4、5、6、7、8及9。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,m及l各自獨立地選自4、5及6。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,m及l各自為5。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,每一R’獨立地為C
1-12烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,每一R’獨立地為C
2-5烷基。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
b為:
,且R
2及R
3各自獨立地為C
1-14烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
b為:
,且R
2及R
3各自獨立地為C
6-10烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
b為:
,且R
2及R
3各自為C
8烷基。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
且R’
b為:
,R
aγ為C
1-12烷基,且R
2及R
3各自獨立地為C
6-10烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
且R’
b為:
,R
aγ為C
2-6烷基,且R
2及R
3各自獨立地為C
6-10烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
且R’
b為:
,R
aγ為C
2-6烷基,且R
2及R
3各自為C
8烷基。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,且R
aγ及R
bγ各自為C
1-12烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,且R
aγ及R
bγ各自為C
2-6烷基。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,m及l各自獨立地選自4、5及6,且每一R’獨立地為C
1-12烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,m及l各自為5,且每一R’獨立地為C
2-5烷基。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,m及l各自獨立地選自4、5及6,每一R’獨立地為C
1-12烷基,且R
aγ及R
bγ各自為C
1-12烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,m及l各自為5,每一R’獨立地為C
2-5烷基,且R
aγ及R
bγ各自為C
2-6烷基。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
且R’
b為:
,m及l各自獨立地選自4、5及6,R’為C
1-12烷基,R
aγ為C
1-12烷基,且R
2及R
3各自獨立地為C
6-10烷基。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
且R’
b為:
,m及l各自為5,R’為C
2-5烷基,R
aγ為C
2-6烷基,且R
2及R
3各自為C
8烷基。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R
4為
,其中R
10為NH(C
1-6烷基)且n2為2。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R
4為
,其中R
10為NH(CH
3)且n2為2。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,m及l各自獨立地選自4、5及6,每一R’獨立地為C
1-12烷基,R
aγ及R
bγ各自為C
1-12烷基,且R
4為
,其中R
10為NH(C
1-6烷基),且n2為2。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,m及l各自為5,每一R’獨立地為C
2-5烷基,R
aγ及R
bγ各自為C
2-6烷基,且R
4為
,其中R
10為NH(CH
3)且n2為2。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
且R’
b為:
,m及l各自獨立地選自4、5及6,R’為C
1-12烷基,R
2及R
3各自獨立地為C
6-10烷基,R
aγ為C
1-12烷基,且R
4為
,其中R
10為NH(C
1-6烷基)且n2為2。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
且R’
b為:
,m及l各自為5,R’為C
2-5烷基,R
aγ為C
2-6烷基,R
2及R
3各自為C
8烷基,且R
4為
,其中R
10為NH(CH
3)且n2為2。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R
4為-(CH
2)
nOH且n為2、3或4。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R
4為-(CH
2)
nOH且n為2。
在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,m及l各自獨立地選自4、5及6,每一R’獨立地為C
1-12烷基,R
aγ及R
bγ各自為C
1-12烷基,R
4為-(CH
2)
nOH,且n為2、3或4。在式(II)、式(II-a)、式(II-b)、式(II-c)、式(II-d)或式(II-e)化合物之一些實施例中,R’
支鏈為:
,R’
b為:
,m及l各自為5,每一R’獨立地為C
2-5烷基,R
aγ及R
bγ各自為C
2-6烷基,R
4為-(CH
2)
nOH,且n為2。
在一些態樣中,本揭示案係關於式(II-f)化合物:
(II-f)或其N-氧化物,或其鹽或異構物,
其中R’
a為R’
支鏈或R’
環狀;其中
R’
支鏈為:
且R’
b為:
;
其中
表示連接點;
R
aγ為C
1-12烷基;
R
2及R
3各自獨立地為C
1-14烷基;
R
4為-(CH
2)
nOH,其中n選自由1、2、3、4及5組成之群;
R’為C
1-12烷基;
m選自4、5及6;且
l選自4、5及6。
在式(II-f)化合物之一些實施例中,m及l各自為5,且n為2、3或4。
在式(II-f)化合物之一些實施例中,R’為C
2-5烷基,R
aγ為C
2-6烷基,且R
2及R
3各自為C
6-10烷基。
在式(II-f)化合物之一些實施例中,m及l各自為5,n為2、3或4,R’為C
2-5烷基,R
aγ為C
2-6烷基,且R
2及R
3各自為C
6-10烷基。
在一些態樣中,本揭示案係關於式(II-g)化合物:
(II-g),其中
R
aγ為C
2-6烷基;
R’為C
2-5烷基;且
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由3、4及5組成之群;及
,
其中
表示連接點,R
10為NH(C
1-6烷基),且n2選自由1、2及3組成之群。
在一些態樣中,本揭示案係關於式(II-h)化合物:
(II-h),其中
R
aγ及R
bγ各自獨立地為C
2-6烷基;
每一R’獨立地為C
2-5烷基;且
R
4選自由以下組成之群:-(CH
2)
nOH,其中n選自由3、4及5組成之群;及
,
其中
表示連接點,R
10為NH(C
1-6烷基),且n2選自由1、2及3組成之群。
在式(II-g)或式(II-h)化合物之一些實施例中,R
4為
,其中
R
10為NH(CH
3)且n2為2。
在式(II-g)或式(II-h)化合物之一些實施例中,R
4為-(CH
2)
2OH。
在一些態樣中,本揭示案係關於具有式(III)之化合物:
(III),
或其鹽或異構物,其中
R
1、R
2、R
3、R
4及R
5獨立地選自由C
5-20烷基、C
5-20烯基、-R”MR’、-R*YR”、-YR”及-R*OR”組成之群;
每一M獨立地選自由以下組成之群:-C(O)O-、-OC(O)-、-OC(O)O-、-C(O)N(R’)-、-N(R’)C(O)-、-C(O)-、-C(S)-、-C(S)S-、-SC(S)-、-CH(OH)-、-P(O)(OR’)O-、-S(O)
2-、芳基及雜芳基;
X
1、X
2及X
3獨立地選自由以下組成之群:鍵、-CH
2-、-(CH
2)
2-、-CHR-、-CHY-、-C(O)-、-C(O)O-、-OC(O)-、-C(O)-CH
2-、-CH
2-C(O)-、-C(O)O-CH
2-、-OC(O)-CH
2-、-CH
2-C(O)O-、-CH
2-OC(O)-、-CH(OH)-、-C(S)-及-CH(SH)-;
每一Y獨立地為C
3-6碳環;
每一R*獨立地選自由C
1-12烷基及C
2-12烯基組成之群;
每一R獨立地選自由C
1-3烷基及C
3-6碳環組成之群;
每一R’獨立地選自由C
1-12烷基、C
2-12烯基及H組成之群;且
每一R”獨立地選自由C
3-12烷基及C
3-12烯基組成之群,且其中:
i) X
1、X
2及X
3中之至少一者不為-CH
2-;及/或
ii) R
1、R
2、R
3、R
4及R
5中之至少一者為-R”MR’。
在一些實施例中,R
1、R
2、R
3、R
4及R
5各自為C
5-20烷基;X
1為-CH
2-;且X
2及X
3各自為-C(O)-。
在一些實施例中,式(III)化合物為:
(化合物I-VI),或其鹽或異構物。
c. 磷脂
本文所揭示之脂質奈米顆粒組合物之脂質組合物可包含一或多種磷脂,例如一或多種飽和或(聚)不飽和磷脂或其組合。一般而言,磷脂包含磷脂部分及一或多個脂肪酸部分。
磷脂部分可選自(例如)由以下組成之非限制性群:磷脂醯膽鹼、磷脂醯乙醇胺、磷脂醯甘油、磷脂醯絲胺酸、磷脂酸、2-溶血磷脂醯膽鹼及鞘磷脂。
脂肪酸部分可選自(例如)由以下組成之非限制性群:月桂酸、肉豆蔻酸、肉豆蔻油酸、棕櫚酸、棕櫚油酸、硬脂酸、油酸、亞油酸、α-亞麻酸、芥子酸、植烷酸、花生酸、花生四烯酸、二十碳五烯酸、山崳酸、二十二碳五烯酸及二十二碳六烯酸。
特定磷脂可促進與膜之融合。舉例而言,陽離子磷脂可與膜(例如細胞膜或細胞內膜)之一或多種帶負電荷之磷脂相互作用。磷脂與膜之融合可容許含脂質組合物(例如LNP)之一或多種元件(例如治療劑)穿過膜,從而允許例如將一或多種元件遞送至靶組織。
亦考慮非天然磷脂種類,包括具有包括分支、氧化、環化及炔烴在內的修飾及取代之天然種類。舉例而言,磷脂可經一或多種炔烴(例如一或多個雙鍵經三鍵置換之烯基)官能化或與其交聯。在適當反應條件下,炔基可在暴露於疊氮化物時經歷銅催化之環加成。此等反應可用於官能化奈米粒子組合物之脂質雙層以有助於膜滲透或細胞識別,或可用於使奈米粒子組合物與諸如靶向或成像部分(例如染料)等可用組分結合。
磷脂包括(但不限於)甘油磷脂,諸如磷脂醯膽鹼、磷脂醯乙醇胺、磷脂醯絲胺酸、磷脂醯肌醇、磷脂醯甘油及磷脂酸。磷脂亦包括磷酸鞘脂,諸如鞘磷脂。
在一些實施例中,本揭示案之磷脂包含1,2-二硬脂醯基-sn-甘油-3-磷酸膽鹼(DSPC)、1,2-二油醯基-sn-甘油-3-磷酸乙醇胺(DOPE)、1,2-二亞油醯基-sn-甘油-3-磷酸膽鹼(DLPC)、1,2-二肉豆蔻醯基-sn-甘油-磷酸膽鹼(DMPC)、1,2-二油醯基-sn-甘油-3-磷酸膽鹼(DOPC)、l,2-二棕櫚醯基-sn-甘油-3-磷酸膽鹼(DPPC)、1,2-雙十一醯基-sn-甘油-磷酸膽鹼(DUPC)、1-棕櫚醯基-2-油醯基-sn-甘油-3-磷酸膽鹼(POPC)、1,2-二-O-十八烯基-sn-甘油-3-磷酸膽鹼(18:0二醚PC)、1-油醯基-2-膽固醇基半琥珀醯基-sn-甘油-3-磷酸膽鹼(OChemsPC)、1-十六烷基-sn-甘油-3-磷酸膽鹼(C16 Lyso PC)、1,2-二亞麻醯基-sn-甘油-3-磷酸膽鹼、1,2-二花生四烯醯基-sn-甘油-3-磷酸膽鹼、1,2-雙二十二碳六烯醯基-sn-甘油-3-磷酸膽鹼、1,2-二植烷醯基-sn-甘油-3-磷酸乙醇胺(ME 16.0 PE)、1,2-二硬脂醯基-sn-甘油-3-磷酸乙醇胺、1,2-二亞油醯基-sn-甘油-3-磷酸乙醇胺、1,2-二亞麻醯基-sn-甘油-3-磷酸乙醇胺、1,2-二花生四烯醯基-sn-甘油-3-磷酸乙醇胺、1,2-雙二十二碳六烯醯基-sn-甘油-3-磷酸乙醇胺、1,2-二油醯基-sn-甘油-3-磷酸-外消旋-(1-甘油)鈉鹽(DOPG)、鞘磷脂及其混合物。
在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂為DSPC之類似物或變異體。在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂為式(
IV)化合物:
(
IV),
或其鹽,其中:
每一R
1獨立地為視情況經取代之烷基;或視情況兩個R
1與插入原子一起接合形成視情況經取代之單環碳環基或視情況經取代之單環雜環基;或視情況三個R
1與插入原子一起接合形成視情況經取代之二環碳環基或視情況經取代之二環雜環基;
n為1、2、3、4、5、6、7、8、9或10;
m為0、1、2、3、4、5、6、7、8、9或10;
A具有式:
或
;
L
2之每一情況獨立地為鍵或視情況經取代之C
1-6伸烷基,其中視情況經取代之C
1-6伸烷基之一個亞甲基單元視情況經以下置換:O、N(R
N)、S、C(O)、-C(O)N(R
N)、NR
NC(O)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O或NR
NC(O)N(R
N);
R
2之每一情況獨立地為視情況經取代之C
1-30烷基、視情況經取代之C
1-30烯基或視情況經取代之C
1-30炔基;視情況其中R
2之一或多個亞甲基單元獨立地經以下置換:視情況經取代之伸碳環基、視情況經取代之伸雜環基、視情況經取代之伸芳基、視情況經取代之伸雜芳基、N(R
N)、O、S、C(O)、C(O)N(R
N)、-NR
NC(O)、NR
NC(O)N(R
N)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O、C(O)S、SC(O)、C(=NR
N)、C(=NR
N)N(R
N)、NR
NC(=NR
N)、NR
NC(=NR
N)N(R
N)、C(S)、C(S)N(R
N)、NR
NC(S)、NR
NC(S)N(R
N)、S(O)、-OS(O)、S(O)O、OS(O)O、OS(O)
2、S(O)
2O、OS(O)
2O、N(R
N)S(O)、S(O)N(R
N)、N(R
N)S(O)N(R
N)、-OS(O)N(R
N)、N(R
N)S(O)O、S(O)
2、N(R
N)S(O)
2、S(O)
2N(R
N)、N(R
N)S(O)
2N(R
N)、OS(O)
2N(R
N)或-N(R
N)S(O)
2O;
R
N之每一情況獨立地為氫、視情況經取代之烷基或氮保護基團;
環B為視情況經取代之碳環基、視情況經取代之雜環基、視情況經取代之芳基或視情況經取代之雜芳基;且
p為1或2;
前提條件係該化合物不具有下式:
,
其中R
2之每一情況獨立地為未經取代之烷基、未經取代之烯基或未經取代之炔基。
在一些實施例中,磷脂可為美國申請案第62/520,530號中所闡述之磷脂中之一或多者。
i. 磷脂頭修飾
在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂包含經修飾之磷脂頭(例如經修飾之膽鹼基團)。在某些實施例中,具有經修飾之頭之磷脂為DSPC或其具有經修飾之四級胺之類似物。舉例而言,在式(
IV)之實施例中,至少一個R
1不為甲基。在某些實施例中,至少一個R
1不為氫或甲基。在某些實施例中,式(
IV)化合物為以下各式中之一者:
、
、
、
、
或其鹽,其中:
每一t獨立地為1、2、3、4、5、6、7、8、9或10;
每一u獨立地為0、1、2、3、4、5、6、7、8、9或10;且
每一v獨立地為1、2或3。
在某些實施例中,式(
IV)化合物為式(
IV-a)化合物:
(
IV-a),
或其鹽。
在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂包含環狀部分代替甘油酯部分。在某些實施例中,可用於本揭示案中之磷脂為具有環狀部分代替甘油酯部分之DSPC或其類似物。在某些實施例中,式(
IV)化合物為式(
IV-b)化合物:
(
IV-b),
或其鹽。
ii. 磷脂尾修飾
在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂包含經修飾尾。在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂為DSPC或其具有經修飾尾之類似物。如本文所闡述,「經修飾尾」可為具有較短或較長脂肪族鏈、引入分支之脂肪族鏈、引入取代基之脂肪族鏈、一或多個亞甲基經環狀或雜原子基團置換之脂肪族鏈或其任何組合之尾。舉例而言,在某些實施例中,(
IV)化合物為式(
IV-a)化合物或其鹽,其中R
2之至少一種情況為R
2之每一情況為視情況經取代之C
1-30烷基,其中R
2之一或多個亞甲基單元獨立地經以下置換:視情況經取代之伸碳環基、視情況經取代之伸雜環基、視情況經取代之伸芳基、視情況經取代之伸雜芳基、N(R
N)、O、S、C(O)、C(O)N(R
N)、NR
NC(O)、NR
NC(O)N(R
N)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O、C(O)S、SC(O)、C(=NR
N)、C(=NR
N)N(R
N)、NR
NC(=NR
N)、NR
NC(=NR
N)N(R
N)、C(S)、C(S)N(R
N)、NR
NC(S)、NR
NC(S)N(R
N)、S(O)、OS(O)、S(O)O、OS(O)O、OS(O)
2、S(O)
2O、OS(O)
2O、N(R
N)S(O)、S(O)N(R
N)、N(R
N)S(O)N(R
N)、OS(O)N(R
N)、N(R
N)S(O)O、S(O)
2、N(R
N)S(O)
2、S(O)
2N(R
N)、N(R
N)S(O)
2N(R
N)、OS(O)
2N(R
N)或N(R
N)S(O)
2O。
在某些實施例中,式(
IV)化合物為式(
IV-c)化合物:
(
IV-c),
或其鹽,其中:
每一x獨立地為介於0-30之間的整數,包括端值;且
G之每一情況獨立地選自由以下組成之群:視情況經取代之伸碳環基、視情況經取代之伸雜環基、視情況經取代之伸芳基、視情況經取代之伸雜芳基、N(R
N)、O、S、C(O)、C(O)N(R
N)、NR
NC(O)、NR
NC(O)N(R
N)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O、C(O)S、SC(O)、C(=NR
N)、C(=NR
N)N(R
N)、NR
NC(=NR
N)、NR
NC(=NR
N)N(R
N)、C(S)、C(S)N(R
N)、NR
NC(S)、NR
NC(S)N(R
N)、S(O)、OS(O)、S(O)O、OS(O)O、OS(O)
2、S(O)
2O、OS(O)
2O、N(R
N)S(O)、S(O)N(R
N)、N(R
N)S(O)N(R
N)、OS(O)N(R
N)、N(R
N)S(O)O、S(O)
2、N(R
N)S(O)
2、S(O)
2N(R
N)、N(R
N)S(O)
2N(R
N)、OS(O)
2N(R
N)或N(R
N)S(O)
2O。每一可能性代表本揭示案之單獨實施例。
在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂包含經修飾之磷酸膽鹼部分,其中連接四級胺與磷醯基之烷基鏈不為伸乙基(例如n不為2)。因此,在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂為式(
IV)化合物,其中n為1、3、4、5、6、7、8、9或10。舉例而言,在某些實施例中,式(
IV)化合物為以下各式化合物中之一者:
、
,
或其鹽。
iii. 替代性脂質
在某些實施例中,可用於或潛在地可用於本揭示案中之磷脂包含經修飾之磷酸膽鹼部分,其中連接四級胺與磷醯基之烷基鏈不為伸乙基(例如n不為2)。因此,在某些實施例中,可用磷脂。
在某些實施例中,使用替代性脂質代替本揭示案之磷脂。
在某些實施例中,本揭示案之替代性脂質為油酸。
在某些實施例中,替代性脂質為以下中之一者:
、
、
、
、
、
及
。
d. 結構脂質
本文所揭示之醫藥組合物之脂質組合物可包含一或多種結構脂質。如本文所用,術語「結構脂質」係指固醇且亦指含有固醇部分之脂質。
將結構脂質併入脂質奈米顆粒中可有助於減輕顆粒中其他脂質之聚集。結構脂質可選自包括(但不限於)以下之群:膽固醇、糞固醇、麥固醇、麥角固醇、菜油固醇、豆固醇、蕓苔固醇、番茄鹼、番茄苷、熊果酸、α-生育酚、類藿烷、植固醇、類固醇及其混合物。在一些實施例中,結構脂質為固醇。如本文所定義,「固醇」係由類固醇組成之類固醇子群。在某些實施例中,結構脂質為類固醇。在某些實施例中,結構脂質為膽固醇。在某些實施例中,結構脂質為膽固醇之類似物。在某些實施例中,結構脂質為α-生育酚。
在一些實施例中,結構脂質可為美國申請案第62/520,530號中所闡述之結構脂質中之一或多者。
e. 聚乙二醇 - 脂質
本文所揭示之醫藥組合物之脂質組合物可包含一或多種聚乙二醇(PEG)脂質。
如本文所用,術語「PEG-脂質」係指聚乙二醇(PEG)修飾之脂質。PEG-脂質之非限制性實例包括PEG修飾之磷脂醯乙醇胺及磷脂酸、PEG-神經醯胺結合物(例如PEG-CerC14或PEG-CerC20)、PEG修飾之二烷基胺及PEG修飾之1,2-二醯氧基丙-3-胺。此等脂質亦稱為聚乙二醇化脂質。舉例而言,PEG脂質可為PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC或PEG-DSPE脂質。
在一些實施例中,PEG-脂質包括(但不限於) 1,2-二肉豆蔻醯基-sn-甘油甲氧基聚乙二醇(PEG-DMG)、1,2-二硬脂醯基-sn-甘油基-3-磷酸乙醇胺-N-[胺基(聚乙二醇)] (PEG-DSPE)、PEG-二固醇基甘油(PEG-DSG)、PEG-二棕櫚油基、PEG-二油基、PEG-二硬脂基、PEG-二醯基甘油醯胺(PEG-DAG)、PEG-二棕櫚醯基磷脂醯乙醇胺(PEG-DPPE)或PEG-l,2-二肉豆蔻基氧基丙基-3-胺(PEG-c-DMA)。
在一些實施例中,PEG-脂質選自由以下組成之群:PEG修飾之磷脂醯乙醇胺、PEG修飾之磷脂酸、PEG修飾之神經醯胺、PEG修飾之二烷基胺、PEG修飾之二醯基甘油、PEG修飾之二烷基甘油及其混合物。
在一些實施例中,PEG-脂質之脂質部分包括長度為約C
14至約C
22、較佳約C
14至約C
16之彼等脂質部分。在一些實施例中,PEG部分(例如mPEG-NH
2)之大小為約1000、2000、5000、10,000、15,000或20,000道耳頓。在一些實施例中,PEG-脂質為PEG
2k-DMG。
在一些實施例中,本文所闡述之脂質奈米粒子可包含PEG脂質,其為不可擴散PEG。不可擴散PEG之非限制性實例包括PEG-DSG及PEG-DSPE。
PEG-脂質為此項技術中所已知,諸如美國專利第8,158,601號及國際公開案第WO 2015/130584 A2中所闡述之彼等PEG-脂質,該等案件係以全文引用的方式併入本文中。
一般而言,本文所闡述之各式之一些其他脂質組分(例如PEG脂質)可如國際專利申請案第PCT/US2016/000129號中所闡述來合成,該國際專利申請案於2016年12月10日提出申請,標題為「用於遞送治療劑之組合物及方法(Compositions and Methods for Delivery of Therapeutic Agents)」,其係以全文引用的方式併入。
脂質奈米顆粒組合物之脂質組分可包括一或多種包含聚乙二醇之分子,諸如PEG或PEG修飾之脂質。此等物質可替代地稱為聚乙二醇化脂質。PEG脂質為經聚乙二醇修飾之脂質。PEG脂質可選自包括以下之非限制性群:PEG修飾之磷脂醯乙醇胺、PEG修飾之磷脂酸、PEG修飾之神經醯胺、PEG修飾之二烷基胺、PEG修飾之二醯基甘油、PEG修飾之二烷基甘油及其混合物。舉例而言,PEG脂質可為PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC或PEG-DSPE脂質。
在一些實施例中,PEG修飾之脂質為PEG DMG之經修飾形式。PEG-DMG具有以下結構:
在一些實施例中,可用於本揭示案中之PEG脂質可為國際公開案第WO2012099755號中所闡述之聚乙二醇化脂質,該國際公開案之內容係以全文引用的方式併入本文中。本文所闡述之該等例示性PEG脂質中之任一者均可經修飾以在PEG鏈上包含羥基。在某些實施例中,PEG脂質為PEG-OH脂質。如本文所一般定義,「PEG-OH脂質」(在本文中亦稱為「羥基-聚乙二醇化脂質」)係在脂質上具有一或多個羥基(-OH)之聚乙二醇化脂質。在某些實施例中,PEG-OH脂質在PEG鏈上包括一或多個羥基。在某些實施例中,PEG-OH或羥基-聚乙二醇化脂質在PEG鏈之末端包含-OH基團。每一可能性代表本揭示案之單獨實施例。
在某些實施例中,可用於本揭示案中之PEG脂質為式(
V)化合物。本文提供式(
V)化合物:
(
V),
或其鹽,其中:
R
3為-OR
O;
R
O為氫、視情況經取代之烷基或氧保護基團;
r為介於1與100之間的整數,包括端值;
L
1為視情況經取代之C
1-10伸烷基,其中該視情況經取代之C
1-10伸烷基之至少一個亞甲基獨立地經以下置換:視情況經取代之伸碳環基、視情況經取代之伸雜環基、視情況經取代之伸芳基、視情況經取代之伸雜芳基、O、N(R
N)、S、C(O)、C(O)N(R
N)、NR
NC(O)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O或NR
NC(O)N(R
N);
D為藉由點擊化學獲得之部分或在生理條件下可裂解之部分;
m為0、1、2、3、4、5、6、7、8、9或10;
A具有式:
或
;
L
2之每一情況獨立地為鍵或視情況經取代之C
1-6伸烷基,其中視情況經取代之C
1-6伸烷基之一個亞甲基單元視情況經以下置換:O、N(R
N)、S、C(O)、C(O)N(R
N)、NR
NC(O)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O或NR
NC(O)N(R
N);
R
2之每一情況獨立地為視情況經取代之C
1-30烷基、視情況經取代之C
1-30烯基或視情況經取代之C
1-30炔基;視情況其中R
2之一或多個亞甲基單元獨立地經以下置換:視情況經取代之伸碳環基、視情況經取代之伸雜環基、視情況經取代之伸芳基、視情況經取代之伸雜芳基、N(R
N)、O、S、C(O)、C(O)N(R
N)、NR
NC(O)、NR
NC(O)N(R
N)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O、C(O)S、SC(O)、C(=NR
N)、C(=NR
N)N(R
N)、NR
NC(=NR
N)、NR
NC(=NR
N)N(R
N)、C(S)、C(S)N(R
N)、NR
NC(S)、NR
NC(S)N(R
N)、S(O)、OS(O)、S(O)O、OS(O)O、OS(O)
2、S(O)
2O、OS(O)
2O、N(R
N)S(O)、S(O)N(R
N)、N(R
N)S(O)N(R
N)、OS(O)N(R
N)、N(R
N)S(O)O、S(O)
2、N(R
N)S(O)
2、S(O)
2N(R
N)、N(R
N)S(O)
2N(R
N)、OS(O)
2N(R
N)或N(R
N)S(O)
2O;
R
N之每一情況獨立地為氫、視情況經取代之烷基或氮保護基團;
環B為視情況經取代之碳環基、視情況經取代之雜環基、視情況經取代之芳基或視情況經取代之雜芳基;且
p為1或2。
在某些實施例中,式(
V)化合物為PEG-OH脂質(亦即,R
3為-OR
O,且R
O為氫)。在某些實施例中,式(
V)化合物為式(
V-OH)化合物:
(V-OH),
或其鹽。
在某些實施例中,可用於本揭示案中之PEG脂質為聚乙二醇化脂肪酸。在某些實施例中,可用於本揭示案中之PEG脂質為式(
VI)化合物。本文提供式(
VI)化合物:
(
VI),
或其鹽,其中:
R
3為-OR
O;
R
O為氫、視情況經取代之烷基或氧保護基團;
r為介於1與100之間的整數,包括端值;
R
5為視情況經取代之C
10-40烷基、視情況經取代之C
10-40烯基或視情況經取代之C
10-40炔基;且視情況R
5之一或多個亞甲基經以下置換:視情況經取代之伸碳環基、視情況經取代之伸雜環基、視情況經取代之伸芳基、視情況經取代之伸雜芳基、N(R
N)、O、S、C(O)、C(O)N(R
N)、NR
NC(O)、NR
NC(O)N(R
N)、C(O)O、OC(O)、OC(O)O、OC(O)N(R
N)、NR
NC(O)O、C(O)S、SC(O)、C(=NR
N)、C(=NR
N)N(R
N)、NR
NC(=NR
N)、NR
NC(=NR
N)N(R
N)、C(S)、C(S)N(R
N)、NR
NC(S)、NR
NC(S)N(R
N)、S(O)、OS(O)、S(O)O、OS(O)O、OS(O)
2、S(O)
2O、OS(O)
2O、N(R
N)S(O)、S(O)N(R
N)、N(R
N)S(O)N(R
N)、OS(O)N(R
N)、N(R
N)S(O)O、S(O)
2、N(R
N)S(O)
2、S(O)
2N(R
N)、N(R
N)S(O)
2N(R
N)、OS(O)
2N(R
N)或N(R
N)S(O)
2O;且
R
N之每一情況獨立地為氫、視情況經取代之烷基或氮保護基團。
在某些實施例中,式(
VI)化合物為式(
VI-OH)化合物:
(VI-OH),
或其鹽。在一些實施例中,r為45。
在其他實施例中,式(VI)化合物為:
或其鹽。在一個實施例中,r為40至50。
在一些實施例中,式(VI)化合物為
(化合物P-I)。
在一些態樣中,本文所揭示之醫藥組合物之脂質組合物不包含PEG-脂質。
在一些實施例中,PEG-脂質可為美國申請案第62/520,530號中所闡述之PEG脂質中之一或多者。
在一些實施例中,本揭示案之PEG脂質包含PEG修飾之磷脂醯乙醇胺、PEG修飾之磷脂酸、PEG修飾之神經醯胺、PEG修飾之二烷基胺、PEG修飾之二醯基甘油、PEG修飾之二烷基甘油及其混合物。在一些實施例中,PEG修飾之脂質為PEG-DMG、PEG-c-DOMG (亦稱為PEG-DOMG)、PEG-DSG及/或PEG-DPG。
在一些實施例中,本揭示案之LNP包含式I、式II或式III中之任一者之可電離陽離子脂質、包含DSPC之磷脂、結構脂質及包含PEG-DMG之PEG脂質。
在一些實施例中,本揭示案之LNP包含式I、式II或式III中之任一者之可電離陽離子脂質、包含DSPC之磷脂、結構脂質及包含具有式VI之化合物之PEG脂質。
在一些實施例中,本揭示案之LNP包含式I、式II或式III之可電離陽離子脂質、包含具有式IV之化合物之磷脂、結構脂質及包含具有式V或式VI之化合物之PEG脂質。
在一些實施例中,本揭示案之LNP包含式I、式II或式III之可電離陽離子脂質、包含具有式IV之化合物之磷脂、結構脂質及包含具有式V或式VI之化合物之PEG脂質。
在一些實施例中,本揭示案之LNP包含式I、式II或式III之可電離陽離子脂質、具有式IV之磷脂、結構脂質及包含具有式VI之化合物之PEG脂質。
在一些實施例中,本揭示案之LNP包含下式之可電離陽離子脂質:
,
及包含式VI之PEG脂質。
在一些實施例中,本揭示案之LNP包含下式之可電離陽離子脂質:
,
及包含油酸之替代性脂質。
在一些實施例中,本揭示案之LNP包含下式之可電離陽離子脂質:
,
包含油酸之替代性脂質,包含膽固醇之結構脂質及包含具有式VI之化合物之PEG脂質。
在一些實施例中,本揭示案之LNP包含下式之可電離陽離子脂質:
,
包含DOPE之磷脂,包含膽固醇之結構脂質及包含具有式VI之化合物之PEG脂質。
在一些實施例中,本揭示案之LNP包含下式之可電離陽離子脂質:
,
包含DOPE之磷脂,包含膽固醇之結構脂質及包含具有式VI之化合物之PEG脂質。
在一些實施例中,本揭示案之LNP包含約2:1至約30:1之N:P比。
在一些實施例中,本揭示案之LNP包含約6:1之N:P比。
在一些實施例中,本揭示案之LNP包含約3:1之N:P比。
在一些實施例中,本揭示案之LNP包含約10:1至約100:1之可電離陽離子脂質組分對RNA之wt/wt比。
在一些實施例中,本揭示案之LNP包含約20:1之可電離陽離子脂質組分對RNA之wt/wt比。
在一些實施例中,本揭示案之LNP包含約10:1之可電離陽離子脂質組分對RNA之wt/wt比。
在一些實施例中,本揭示案之LNP之平均直徑為約50 nm至約150 nm。
在一些實施例中,本揭示案之LNP之平均直徑為約70 nm至約120 nm。
如本文所用,術語「烷基(alkyl、alkyl group)」或「伸烷基」意指包括一或多個碳原子(例如一個、兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個、十二個、十三個、十四個、十五個、十六個、十七個、十八個、十九個、二十個或更多個碳原子)之直鏈或具支鏈飽和烴,其視情況經取代。記法「C
1-
14烷基」意指包括1-14個碳原子之視情況經取代之直鏈或具支鏈飽和烴。除非另有指定,否則本文所闡述之烷基係指未經取代及經取代之烷基二者。
如本文所用,術語「烯基(alkenyl、alkenyl group)」或「伸烯基」意指包括兩個或更多個碳原子(例如兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個、十二個、十三個、十四個、十五個、十六個、十七個、十八個、十九個、二十個或更多個碳原子)及至少一個雙鍵之直鏈或具支鏈烴,其視情況經取代。記法「C
2-
14烯基」意指包括2-14個碳原子及至少一個碳-碳雙鍵之視情況經取代之直鏈或具支鏈烴。烯基可包括一個、兩個、三個、四個或更多個碳-碳雙鍵。舉例而言,C
18烯基可包括一或多個雙鍵。包括兩個雙鍵之C
18烯基可為亞油基。除非另有指定,否則本文所闡述之烯基係指未經取代及經取代之烯基二者。
如本文所用,術語「炔基(alkynyl、alkynyl group)」或「伸炔基」意指包括兩個或更多個碳原子(例如兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個、十二個、十三個、十四個、十五個、十六個、十七個、十八個、十九個、二十個或更多個碳原子)及至少一個碳-碳三鍵之直鏈或具支鏈烴,其視情況經取代。記法「C
2-14炔基」意指包括2-14個碳原子及至少一個碳-碳三鍵之視情況經取代之直鏈或具支鏈烴。炔基可包括一個、兩個、三個、四個或更多個碳-碳三鍵。舉例而言,C
18炔基可包括一或多個碳-碳三鍵。除非另有指定,否則本文所闡述之炔基係指未經取代及經取代之炔基二者。
如本文所用,術語「碳環」或「碳環基」意指包括一或多個碳原子環之視情況經取代之單環或多環系統。環可為三員、四員、五員、六員、七員、八員、九員、十員、十一員、十二員、十三員、十四員、十五員、十六員、十七員、十八員、十九員或二十員環。記法「C
3-6碳環」意指包括具有3-6個碳原子之單環之碳環。碳環可包括一或多個碳-碳雙鍵或三鍵,且可為非芳香族或芳香族(例如環烷基或芳基)。碳環之實例包括環丙基、環戊基、環己基、苯基、萘基及1,2二氫萘基。如本文所用,術語「環烷基」意指非芳香族碳環,且可包括或可不包括任何雙鍵或三鍵。除非另有指定,否則本文所闡述之碳環係指未經取代及經取代之碳環基二者,亦即視情況經取代之碳環。
如本文所用,術語「雜環」或「雜環基」意指包括一或多個環之視情況經取代之單環或多環系統,其中至少一個環包括至少一個雜原子。雜原子可為例如氮、氧或硫原子。環可為三員、四員、五員、六員、七員、八員、九員、十員、十一員、十二員、十三員或十四員環。雜環可包括一或多個雙鍵或三鍵,且可為非芳香族或芳香族(例如雜環烷基或雜芳基)。雜環之實例包括咪唑基、咪唑啶基、噁唑基、噁唑啶基、噻唑基、噻唑啶基、吡唑啶基、吡唑基、異噁唑啶基、異噁唑基、異噻唑啶基、異噻唑基、嗎啉基、吡咯基、吡咯啶基、呋喃基、四氫呋喃基、噻吩基、吡啶基、六氫吡啶基、喹啉基及異喹啉基。如本文所用,術語「雜環烷基」意指非芳香族雜環,且可包括或可不包括任何雙鍵或三鍵。除非另有指定,否則本文所闡述之雜環係指未經取代及經取代之雜環基二者,亦即視情況經取代之雜環。
如本文所用,術語「雜烷基」、「雜烯基」或「雜炔基」分別係指如本文所定義之烷基、烯基、炔基,其進一步包含一或多個(例如1、2、3或4個)雜原子(例如氧、硫、氮、硼、矽、磷),其中該一或多個雜原子插入在母體碳鏈內之毗鄰碳原子之間及/或一或多個雜原子插入在碳原子與母體分子之間,亦即在連接點之間。除非另有指定,否則本文所闡述之雜烷基、雜烯基或雜炔基係指未經取代及經取代之雜烷基、雜烯基或雜炔基,亦即視情況經取代之雜烷基、雜烯基或雜炔基。
如本文所用,「生物可降解基團」係可有助於哺乳動物實體中脂質更快速代謝之基團。生物可降解基團可選自由以下組成之群,但不限於以下:-C(O)O-、-OC(O)-、-C(O)N(R')-、-N(R')C(O)-、-C(O)-、-C(S)-、-C(S)S-、-SC(S)-、-CH(OH)-、-P(O)(OR')O-、-S(O)2-、芳基及雜芳基。如本文所用,「芳基」係包括一或多個芳香族環之視情況經取代之碳環基。芳基之實例包括苯基及萘基。如本文所用,「雜芳基」係包括一或多個芳香族環之視情況經取代之雜環基。雜芳基之實例包括吡咯基、呋喃基、噻吩基、咪唑基、噁唑基及噻唑基。芳基及雜芳基二者均可視情況經取代。舉例而言,M及M'可選自由以下組成之非限制性群:視情況經取代之苯基、噁唑及噻唑。在本文各式中,M及M'可獨立地選自上文生物可降解基團之列表。除非另有指定,否則本文所闡述之芳基或雜芳基係指未經取代及經取代之基團二者,亦即視情況經取代之芳基或雜芳基。
除非另有指定,否則烷基、烯基及環基(例如碳環基及雜環基)可視情況經取代。視情況選用之取代基可選自由以下組成之群,但不限於以下:鹵素原子(例如氯化物、溴化物、氟化物或碘化物基團)、羧酸(例如C(O)OH)、醇(例如羥基、OH)、酯(例如C(O)OR OC(O)R)、醛(例如C(O)H)、羰基(例如C(O)R,或者由C=O表示)、醯鹵(例如C(O)X,其中X為選自溴化物、氟化物、氯化物及碘化物之鹵化物)、碳酸酯(例如OC(O)OR)、烷氧基(例如OR)、縮醛(例如C(OR)2R"",其中每一OR為可相同或不同之烷氧基,且R""為烷基或烯基)、磷酸根(例如P(O)
4 3-)、硫醇(例如SH)、亞碸(例如S(O)R)、亞磺酸(例如S(O)OH)、磺酸(例如S(O)
2OH)、硫醛(例如C(S)H)、硫酸根(例如S(O)
4 2-)、磺醯基(例如S(O)
2)、醯胺(例如C(O)NR
2或N(R)C(O)R)、疊氮基(例如N
3)、硝基(例如NO
2)、氰基(例如CN)、異氰基(例如NC)、醯氧基(例如OC(O)R)、胺基(例如NR
2、NRH或NH
2)、胺甲醯基(例如OC(O)NR
2、OC(O)NRH或OC(O)NH
2)、磺醯胺(例如S(O)
2NR
2、S(O)
2NRH、S(O)
2NH
2、N(R)S(O)
2R、N(H)S(O)
2R、N(R)S(O)
2H或N(H)S(O)
2H)、烷基、烯基及環基(例如碳環基或雜環基)。在前述任一者中,R為如本文所定義之烷基或烯基。在一些實施例中,取代基本身可進一步經例如一個、兩個、三個、四個、五個或六個如本文所定義之取代基取代。舉例而言,C
1-6烷基可進一步經一個、兩個、三個、四個、五個或六個如本文所闡述之取代基取代。
本揭示案之含氮化合物可藉由用氧化劑(例如3-氯過氧苯甲酸(mCPBA)及/或過氧化氫)處理而轉化成N-氧化物,從而得到本揭示案之其他化合物。因此,當化合價及結構容許時,考慮所有示出及主張之含氮化合物,以包括如所示出之化合物及其N-氧化物衍生物(其可命名為N→O或N+-O-)二者。此外,在其他情況中,本揭示案化合物中之氮可轉化成N-羥基或N-烷氧基化合物。舉例而言,N-羥基化合物可藉由用氧化劑(諸如mCPBA)氧化母體胺來製備。當化合價及結構容許時,亦考慮所有示出及主張之含氮化合物,以覆蓋如所示出之化合物及其N-羥基(亦即N-OH)及N-烷氧基(亦即N-OR,其中R為經取代或未經取代之C
1-C
6烷基、C
1-C
6烯基、C
1-C
6炔基、3員至14員碳環或3員至14員雜環)衍生物二者。
f. 其他脂質組合物組分
本文所揭示之醫藥組合物之脂質組合物可包括除上述彼等組分以外之一或多種組分。舉例而言,脂質組合物可包括一或多種滲透性增強劑分子、碳水化合物、聚合物、表面改變劑(例如表面活性劑)或其他組分。舉例而言,滲透性增強劑分子可為美國專利申請公開案第2005/0222064號中所闡述之分子。碳水化合物可包括單糖(例如葡萄糖)及多糖(例如肝糖及其衍生物及類似物)。
聚合物可包括在本文所揭示之醫藥組合物中及/或用於囊封或部分囊封本文所揭示之醫藥組合物(例如呈脂質奈米顆粒形式之醫藥組合物)。聚合物可為生物可降解的及/或生物相容的。聚合物可選自(但不限於)聚胺、聚醚、聚醯胺、聚酯、聚胺基甲酸酯、聚脲、聚碳酸酯、聚苯乙烯、聚醯亞胺、聚碸、聚胺甲酸乙酯、聚乙炔、聚乙烯、聚乙烯亞胺、聚異氰酸酯、聚丙烯酸酯、聚甲基丙烯酸酯、聚丙烯腈及聚芳酯。
脂質組合物與多核苷酸之間的比率範圍可為約10:1至約60:1 (wt/wt)。
在一些實施例中,脂質組合物與多核苷酸之間的比率可為約10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1或60:1 (wt/wt)。在一些實施例中,脂質組合物與編碼治療劑之多核苷酸之wt/wt比率為約20:1或約15:1。
在一些實施例中,本文所揭示之醫藥組合物可含有一種以上多肽。舉例而言,本文所揭示之醫藥組合物可含有兩種或更多種多核苷酸(例如RNA,例如mRNA)。
在一些實施例中,本文所闡述之脂質奈米顆粒可以如下脂質:多核苷酸重量比包含多核苷酸(例如mRNA):5:1、10:1、15:1、20:1、25:1、30:1、35:1、40:1、45:1、50:1、55:1、60:1或70:1,或該等比率中之範圍或任一者,諸如(但不限於) 5:1至約10:1、約5:1至約15:1、約5:1至約20:1、約5:1至約25:1、約5:1至約30:1、約5:1至約35:1、約5:1至約40:1、約5:1至約45:1、約5:1至約50:1、約5:1至約55:1、約5:1至約60:1、約5:1至約70:1、約10:1至約15:1、約10:1至約20:1、約10:1至約25:1、約10:1至約30:1、約10:1至約35:1、約10:1至約40:1、約10:1至約45:1、約10:1至約50:1、約10:1至約55:1、約10:1至約60:1、約10:1至約70:1、約15:1至約20:1、約15:1至約25:1、約15:1至約30:1、約15:1至約35:1、約15:1至約40:1、約15:1至約45:1、約15:1至約50:1、約15:1至約55:1、約15:1至約60:1或約15:1至約70:1。
在一些實施例中,本文所闡述之脂質奈米顆粒可以大約0.1 mg/ml至2 mg/ml之濃度包含多核苷酸,諸如(但不限於) 0.1 mg/ml、0.2 mg/ml、0.3 mg/ml、0.4 mg/ml、0.5 mg/ml、0.6 mg/ml、0.7 mg/ml、0.8 mg/ml、0.9 mg/ml、1.0 mg/ml、1.1 mg/ml、1.2 mg/ml、1.3 mg/ml、1.4 mg/ml、1.5 mg/ml、1.6 mg/ml、1.7 mg/ml、1.8 mg/ml、1.9 mg/ml、2.0 mg/ml或大於2.0 mg/ml。
g. 奈米顆粒組合物
在一些實施例中,本文所揭示之醫藥組合物調配為脂質奈米顆粒(LNP)。因此,本揭示案亦提供奈米顆粒組合物,該等奈米顆粒組合物包含(i)包含遞送劑(諸如如本文所闡述之化合物)之脂質組合物,及(ii)含有本文所闡述之IRES且編碼所關注多肽之多核苷酸。在此種奈米顆粒組合物中,本文所揭示之脂質組合物可囊封含有IRES且編碼多肽之多核苷酸。
奈米顆粒組合物之大小通常為大約微米或更小,且可包括脂質雙層。奈米顆粒組合物涵蓋脂質奈米顆粒(LNP)、脂質體(例如脂質囊泡)及脂質複合物(lipoplex)。舉例而言,奈米顆粒組合物可為直徑為500 nm或更小的具有脂質雙層之脂質體。
奈米顆粒組合物包括(例如)脂質奈米顆粒(LNP)、脂質體及脂質複合物。在一些實施例中,奈米顆粒組合物為包括一或多個脂質雙層之囊泡。在某些實施例中,奈米顆粒組合物包括兩個或更多個由水性區室隔開之同心雙層。脂質雙層可經官能化及/或彼此交聯。脂質雙層可包括一或多種配位體、蛋白質或通道。
在一些實施例中,脂質奈米顆粒包含可電離胺基脂質、結構脂質、磷脂及mRNA。在一些實施例中,LNP包含可電離胺基脂質、PEG修飾之脂質、固醇及結構脂質。在一些實施例中,LNP具有莫耳比為約40%-50%之可電離胺基脂質;約5%-15%之結構脂質;約30%-45%之固醇;及約1%-5%之PEG修飾之脂質。
在一些實施例中,脂質奈米顆粒包含47-49 mol.%之可電離陽離子脂質(例如可電離胺基脂質,例如化合物I-1、化合物I-2或化合物I-3)、10-12 mol.%之非陽離子脂質(例如磷脂,例如DSPC)、38-40 mol.%之固醇(例如膽固醇)或其他結構脂質及1-3 mol.%之PEG修飾之脂質(例如PEG-DMG或化合物P-I)。
舉例而言,在一些實施例中,脂質奈米顆粒(「LNP-1」)可包含以下莫耳比之以下組分:
(i) 45-50 mol.%之化合物I-1;
(ii) 35-45 mol.%之固醇(例如膽固醇);
(iii) 8-12 mol.%之磷脂(例如DSPC或DOPE);及
(iv) 1.5-3.5 mol.%之PEG-脂質(例如化合物P-I或PEG-DMG)。
舉例而言,在一些實施例中,脂質奈米顆粒(「LNP-1A」)可包含以下莫耳比之以下組分:
(i) 45-50 mol.%之化合物I-1;
(ii) 35-45 mol.%之膽固醇;
(iii) 8-12 mol.%之DSPC;及
(iv) 1.5-3.5 mol.%之PEG-DMG。
舉例而言,在一些實施例中,脂質奈米顆粒(「LNP-1B」)可包含以下莫耳比之以下組分:
(i) 45-50 mol.%之化合物I-1;
(ii) 35-45 mol.%之膽固醇;
(iii) 8-12 mol.%之DSPC;及
(iv) 1.5-3.5 mol.%之化合物P-I。
在一些實施例中,脂質奈米顆粒(「LNP-2」)可包含以下:
(i) 45-50 mol.%之化合物I-2;
(ii) 35-45 mol.%之固醇(例如膽固醇);
(iii) 8-12 mol.%之磷脂(例如DSPC或DOPE);及
(iv) 1.5-3.5 mol.%之PEG-脂質(例如化合物P-I或PEG-DMG)。
在一些實施例中,脂質奈米顆粒(「LNP-2A」)可包含以下:
(i) 45-50 mol.%之化合物I-2;
(ii) 35-45 mol.%之膽固醇;
(iii) 8-12 mol.%之DSPC;及
(iv) 1.5-3.5 mol.%之PEG-DMG。
舉例而言,在一些實施例中,脂質奈米顆粒(「LNP-2B」)可包含以下莫耳比之以下組分:
(i) 45-50 mol.%之化合物I-2;
(ii) 35-45 mol.%之膽固醇;
(iii) 8-12 mol.%之DSPC;及
(iv) 1.5-3.5 mol.%之化合物P-I。
在一些實施例中,脂質奈米顆粒(「LNP-3」)可包含以下:
(i) 45-50 mol.%之化合物I-3;
(ii) 35-45 mol.%之固醇(例如膽固醇);
(iii) 8-12 mol.%之磷脂(例如DSPC或DOPE);及
(iv) 1.5-3.5 mol.%之PEG-脂質(例如化合物P-I或PEG-DMG)。
在一些實施例中,脂質奈米顆粒(「LNP-3A」)可包含以下:
(i) 45-50 mol.%之化合物I-3;
(ii) 35-45 mol.%之膽固醇;
(iii) 8-12 mol.%之DSPC;及
(iv) 1.5-3.5 mol.%之PEG-DMG。
在一些實施例中,脂質奈米顆粒(「LNP-3B」)可包含以下:
(i) 45-50 mol.%之化合物I-3;
(ii) 35-45 mol.%之膽固醇;
(iii) 8-12 mol.%之DSPC;及
(iv) 1.5-3.5 mol.%之化合物P-I。
在一些實施例中,LNP之多分散性值小於0.4。在一些實施例中,LNP在中性pH下具有淨中性電荷。在一些實施例中,LNP之平均直徑為50-150 nm。在一些實施例中,LNP之平均直徑為80-100 nm。
如本文所一般定義,術語「脂質」係指具有疏水性或兩親性性質之小分子。脂質可為天然的或合成的。脂質類別之實例包括(但不限於)脂肪、蠟、含固醇之代謝物、維生素、脂肪酸、甘油脂質、甘油磷脂、神經鞘脂、糖脂及聚酮類以及異戊烯醇脂質。在一些情況下,一些脂質之兩親性性質導致其在水性介質中形成脂質體、囊泡或膜。
在一些實施例中,脂質奈米顆粒(LNP)可包含可電離胺基脂質。如本文所用,術語「可電離胺基脂質」具有其在此項技術中之通常含義,且可指包含一或多個帶電部分之脂質。在一些實施例中,可電離胺基脂質可帶正電或帶負電。可電離胺基脂質可帶正電,在該情形中其可稱為「陽離子脂質」。在某些實施例中,可電離胺基脂質分子可包含胺基,且可稱為可電離胺基脂質。如本文所用,「帶電部分」係攜載形式電子電荷之化學部分,例如單價(+1或-1)、二價(+2或-2)、三價(+3或-3)等。帶電部分可為陰離子(亦即帶負電荷)或陽離子(亦即帶正電荷)。帶正電部分之實例包括胺基(例如一級胺、二級胺及/或三級胺)、銨基、吡啶鎓基、胍基及咪唑鎓基。在特定實施例中,帶電部分包含胺基。帶負電基團或其前體之實例包括羧酸酯基、磺酸酯基、硫酸酯基、膦酸酯基、磷酸酯基、羥基及諸如此類。在一些情形下,帶電部分之電荷可隨環境條件而變化,例如,pH變化可改變部分之電荷,及/或使部分帶電或不帶電。一般而言,可視期望選擇分子之電荷密度。
應理解,術語「帶電」或「帶電部分」不指分子上之「部分負電荷」或「部分正電荷」。術語「部分負電荷」及「部分正電荷」具有其在此項技術中之通常含義。當官能基包含極化鍵,使得電子密度被拉向該鍵之一個原子,從而在該原子上產生部分負電荷時,可產生「部分負電荷」。一般而言,熟習此項技術者應識別可以此方式極化之鍵。
可電離胺基脂質在此項技術中有時稱為「可電離陽離子脂質」。在一些實施例中,可電離胺基脂質可具有帶正電之親水性頭及疏水性尾,該親水性頭與該疏水性尾經由連接體結構連結。
除該等可電離胺基脂質以外,可電離胺基脂質亦可為包括環胺基之脂質。
在一些實施例中,可電離胺基脂質可選自(但不限於)國際公開案第WO2013086354號及第WO2013116126號中所闡述之可電離胺基脂質;該等國際公開案各自之內容係以全文引用的方式併入本文中。
在另一實施例中,可電離胺基脂質可選自(但不限於)美國專利第7,404,969號之式CLI-CLXXXXII;該專利各自係以全文引用的方式併入本文中。
在一些實施例中,脂質可為可裂解脂質,諸如國際公開案第WO2012170889號中所闡述之彼等可裂解脂質,該國際公開案係以全文引用的方式併入本文中。在一些實施例中,脂質可藉由此項技術中已知及/或如國際公開案第WO2013086354號中所闡述之方法來合成;該等國際公開案各自之內容係以全文引用的方式併入本文中。
奈米顆粒組合物可藉由多種方法來表徵。舉例而言,可使用顯微鏡術(例如透射電子顯微鏡術或掃描電子顯微鏡術)來檢查奈米顆粒組合物之形態學及大小分佈。可使用動態光散射或電位滴定法(例如電位滴定)來量測ζ電位。亦可利用動態光散射來測定粒徑。亦可使用諸如Zetasizer Nano ZS (Malvern Instruments Ltd, Malvern, Worcestershire, UK)等儀器來量測奈米顆粒組合物之多重特性,諸如粒徑、多分散性指數及ζ電位。
奈米顆粒之大小可幫助對抗生物反應,諸如(但不限於)發炎,或可增加多核苷酸之生物效應。
如本文所用,在奈米顆粒組合物之背景中,「大小」或「平均大小」係指奈米顆粒組合物之平均直徑。
在一些實施例中,將本揭示案之多核苷酸調配在直徑為約10至約100 nm之脂質奈米顆粒中,諸如(但不限於)約10至約20 nm、約10至約30 nm、約10至約40 nm、約10至約50 nm、約10至約60 nm、約10至約70 nm、約10至約80 nm、約10至約90 nm、約20至約30 nm、約20至約40 nm、約20至約50 nm、約20至約60 nm、約20至約70 nm、約20至約80 nm、約20至約90 nm、約20至約100 nm、約30至約40 nm、約30至約50 nm、約30至約60 nm、約30至約70 nm、約30至約80 nm、約30至約90 nm、約30至約100 nm、約40至約50 nm、約40至約60 nm、約40至約70 nm、約40至約80 nm、約40至約90 nm、約40至約100 nm、約50至約60 nm、約50至約70 nm、約50至約80 nm、約50至約90 nm、約50至約100 nm、約60至約70 nm、約60至約80 nm、約60至約90 nm、約60至約100 nm、約70至約80 nm、約70至約90 nm、約70至約100 nm、約80至約90 nm、約80至約100 nm及/或約90至約100 nm。
在一些實施例中,奈米顆粒之直徑為約10至500 nm。在一些實施例中,奈米顆粒之直徑大於100 nm、大於150 nm、大於200 nm、大於250 nm、大於300 nm、大於350 nm、大於400 nm、大於450 nm、大於500 nm、大於550 nm、大於600 nm、大於650 nm、大於700 nm、大於750 nm、大於800 nm、大於850 nm、大於900 nm、大於950 nm或大於1000 nm。
在一些實施例中,奈米顆粒組合物之最大尺寸為1 μm或更短(例如1 μm、900 nm、800 nm、700 nm、600 nm、500 nm、400 nm、300 nm、200 nm、175 nm、150 nm、125 nm、100 nm、75 nm、50 nm或更短)。
奈米顆粒組合物可相對均質。多分散性指數可用於指示奈米顆粒組合物之均質性,例如奈米顆粒組合物之粒徑分佈。小的(例如小於0.3)多分散性指數通常指示窄的粒徑分佈。奈米顆粒組合物之多分散性指數可為約0至約0.25,諸如0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.10、0.11、0.12、0.13、0.14、0.15、0.16、0.17、0.18、0.19、0.20、0.21、0.22、0.23、0.24或0.25。在一些實施例中,本文所揭示之奈米顆粒組合物之多分散性指數可為約0.10至約0.20。
奈米顆粒組合物之ζ電位可用於指示組合物之電動電位。舉例而言,ζ電位可描述奈米顆粒組合物之表面電荷。具有相對低電荷(正電荷或負電荷)之奈米顆粒組合物通常合意,此乃因帶有更高電荷之物質可與體內之細胞、組織及其他元件發生不期望之相互作用。在一些實施例中,本文所揭示之奈米顆粒組合物之ζ電位可為約-10 mV至約+20 mV、約-10 mV至約+15 mV、約10 mV至約+10 mV、約-10 mV至約+5 mV、約-10 mV至約0 mV、約-10 mV至約-5 mV、約-5 mV至約+20 mV、約-5 mV至約+15 mV、約-5 mV至約+10 mV、約-5 mV至約+5 mV、約-5 mV至約0 mV、約0 mV至約+20 mV、約0 mV至約+15 mV、約0 mV至約+10 mV、約0 mV至約+5 mV、約+5 mV至約+20 mV、約+5 mV至約+15 mV或約+5 mV至約+10 mV。
在一些實施例中,脂質奈米顆粒之ζ電位可為約0 mV至約100 mV、約0 mV至約90 mV、約0 mV至約80 mV、約0 mV至約70 mV、約0 mV至約60 mV、約0 mV至約50 mV、約0 mV至約40 mV、約0 mV至約30 mV、約0 mV至約20 mV、約0 mV至約10 mV、約10 mV至約100 mV、約10 mV至約90 mV、約10 mV至約80 mV、約10 mV至約70 mV、約10 mV至約60 mV、約10 mV至約50 mV、約10 mV至約40 mV、約10 mV至約30 mV、約10 mV至約20 mV、約20 mV至約100 mV、約20 mV至約90 mV、約20 mV至約80 mV、約20 mV至約70 mV、約20 mV至約60 mV、約20 mV至約50 mV、約20 mV至約40 mV、約20 mV至約30 mV、約30 mV至約100 mV、約30 mV至約90 mV、約30 mV至約80 mV、約30 mV至約70 mV、約30 mV至約60 mV、約30 mV至約50 mV、約30 mV至約40 mV、約40 mV至約100 mV、約40 mV至約90 mV、約40 mV至約80 mV、約40 mV至約70 mV、約40 mV至約60 mV及約40 mV至約50 mV。在一些實施例中,脂質奈米顆粒之ζ電位可為約10 mV至約50 mV、約15 mV至約45 mV、約20 mV至約40 mV及約25 mV至約35 mV。在一些實施例中,脂質奈米顆粒之ζ電位可為約10 mV、約20 mV、約30 mV、約40 mV、約50 mV、約60 mV、約70 mV、約80 mV、約90 mV及約100 mV。
術語多核苷酸之「囊封效率」描述相對於所提供之初始量,在製備後由奈米顆粒組合物囊封或以其他方式與之締合的多核苷酸之量。如本文所用,「囊封」可指完全、實質上或部分包封、封閉、包圍或包裝。
期望囊封效率係高的(例如接近100%)。例如,可藉由比較在用一或多種有機溶劑或清潔劑分解奈米顆粒組合物之前及之後,含有奈米顆粒組合物之溶液中多核苷酸之量來量測囊封效率。
可使用螢光來量測溶液中游離多核苷酸之量。對於本文所闡述之奈米顆粒組合物,多核苷酸之囊封效率可為至少50%,例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些實施例中,囊封效率可為至少80%。在某些實施例中,囊封效率可為至少90%。
本文所揭示之醫藥組合物中所存在的多核苷酸之量可取決於多種因素,諸如多核苷酸之大小、期望靶標及/或應用或奈米顆粒組合物之其他性質以及多核苷酸之性質。
舉例而言,可用於奈米顆粒組合物中之mRNA之量可取決於mRNA之大小(表示為長度或分子質量)、序列及其他特性。奈米顆粒組合物中多核苷酸之相對量亦可變化。
本揭示案之脂質奈米顆粒組合物中所存在的脂質組合物及多核苷酸之相對量可根據對功效及耐受性之考慮進行最佳化。對於包括mRNA作為多核苷酸之組合物,N:P比可用作有用之度量。
由於奈米顆粒組合物之N:P比控制表現及耐受性二者,故具有低N:P比及強表現之奈米顆粒組合物係合意的。N:P比根據奈米顆粒組合物中脂質與RNA之比率而變化。
一般而言,較低之N:P比較佳。該一或多種RNA、脂質及其量可經選擇以提供約2:1至約30:1之N:P比,諸如2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、12:1、14:1、16:1、18:1、20:1、22:1、24:1、26:1、28:1或30:1。在某些實施例中,N:P比可為約2:1至約8:1。在其他實施例中,N:P比為約5:1至約8:1。在某些實施例中,N:P比介於5:1與6:1之間。在一個具體態樣中,N:P比為約5.67:1。
除提供奈米顆粒組合物以外,本揭示案亦提供產生包含囊封有多核苷酸之脂質奈米顆粒之方法。此方法包括使用本文所揭示之任一醫藥組合物且根據此項技術中已知之產生脂質奈米顆粒之方法產生脂質奈米顆粒。例如,參見Wang等人(2015) 「Delivery of oligonucleotides with lipid nanoparticles」 Adv. Drug Deliv. Rev. 87:68-80;Silva等人(2015) 「Delivery Systems for Biopharmaceuticals. Part I: Nanoparticles and Microparticles」 Curr. Pharm. Technol. 16: 940-954;Naseri等人(2015) 「Solid Lipid Nanoparticles and Nanostructured Lipid Carriers: Structure, Preparation and Application」 Adv. Pharm. Bull. 5:305-13;Silva等人(2015) 「Lipid nanoparticles for the delivery of biopharmaceuticals」 Curr. Pharm. Biotechnol. 16:291-302,及其中所引用之參考文獻。
在一些實施例中,本文所闡述之LNP調配物可另外包含滲透性增強劑分子。非限制性滲透性增強劑分子闡述於美國公開案第US20050222064號中,該公開案係以全文引用的方式併入本文中。
LNP調配物可進一步含有磷酸酯結合物。磷酸酯結合物可延長活體內循環時間及/或增加奈米顆粒之靶向遞送。磷酸酯結合物可藉由(例如)國際公開案第WO2013033438號或美國公開案第US20130196948號中所闡述之方法來製得。如例如美國公開案第US20130059360號、第US20130196948號及第US20130072709號中所闡述,LNP調配物亦可含有聚合物結合物(例如水溶性結合物)。每一參考文獻均係以全文引用的方式併入本文中。
LNP調配物可包含結合物以增強本揭示案之奈米顆粒在個體中之遞送。此外,該結合物可抑制個體中奈米顆粒之吞噬清除。在一些實施例中,結合物可為自人類膜蛋白CD47設計之「自身」肽(例如Rodriguez等人,
Science2013 339, 971-975闡述之「自身」顆粒,該文獻係以全文引用的方式併入本文中)。如Rodriguez等人所示,自身肽延遲巨噬細胞介導之奈米顆粒清除,此增強奈米顆粒之遞送。
LNP調配物可包含碳水化合物載劑。作為非限制性實例,碳水化合物載劑可包括(但不限於)酸酐修飾之植物肝糖或肝糖型材料、植物肝糖辛烯基琥珀酸酯、植物肝糖β-糊精、酸酐修飾之植物肝糖β-糊精(例如,國際公開案第WO2012109121號,該國際公開案係以全文引用的方式併入本文中)。
LNP調配物可經表面活性劑或聚合物包覆,以改良顆粒之遞送。在一些實施例中,LNP可經親水性塗層諸如(但不限於)如美國公開案第US20130183244號中所闡述之PEG塗層及/或具有中性表面電荷之塗層包覆,該美國公開案係以全文引用的方式併入本文中。
如美國專利第8,241,670號或國際公開案第WO2013110028號中所闡述,LNP調配物可經工程化以改變顆粒之表面性質,使得脂質奈米顆粒可穿透黏膜障壁,該專利及該公開案各自係以全文引用的方式併入本文中。
經工程化以穿透黏液之LNP可包含聚合材料(亦即聚合核心)及/或聚合物-維生素結合物及/或三嵌段共聚物。聚合材料可包括(但不限於)聚胺、聚醚、聚醯胺、聚酯、聚胺基甲酸酯、聚脲、聚碳酸酯、聚(苯乙烯)、聚醯亞胺、聚碸、聚胺基甲酸酯、聚乙炔、聚乙烯、聚乙烯亞胺、聚異氰酸酯、聚丙烯酸酯、聚甲基丙烯酸酯、聚丙烯腈及聚芳酯。
經工程化以穿透黏液之LNP亦可包括表面改變劑,諸如(但不限於)多核苷酸、陰離子蛋白質(例如牛血清白蛋白)、表面活性劑(例如陽離子表面活性劑,諸如二甲基雙十八烷基-溴化銨)、糖或糖衍生物(例如環糊精)、核酸、聚合物(例如肝素、聚乙二醇及泊洛沙姆(poloxamer))、黏液溶解劑(例如N-乙醯基半胱胺酸、艾科植物(mugwort)、鳳梨酶、木瓜酶、大青屬(clerodendrum)、乙醯基半胱胺酸、溴己新(bromhexine)、羧甲司坦(carbocisteine)、依普拉酮(eprazinone)、美司鈉(mesna)、安布索(ambroxol)、索布瑞醇(sobrerol)、多米奧醇(domiodol)、來托司坦(letosteine)、司替羅寧(stepronin)、硫普羅寧(tiopronin)、凝溶膠蛋白、胸腺素β4阿法鏈道酶(thymosin β4 dornase alfa)、奈替克新(neltenexine)、厄多司坦(erdosteine))及各種DNA酶,包括rhDNA酶。
在一些實施例中,黏液穿透性LNP可為包含黏膜穿透增強塗層之低滲調配物。調配物對於其所遞送至之上皮而言可為低滲的。低滲調配物之非限制性實例可參見(例如)國際公開案第WO2013110028號,該國際公開案係以全文引用的方式併入本文中。
在一些實施例中,將本文所闡述之多核苷酸調配為脂質複合物,諸如(但不限於)來自Silence Therapeutics (London, United Kingdom)之ATUPLEXTM系統、DACC系統、DBTC系統及其他siRNA-脂質複合物技術、來自STEMGENT® (Cambridge, MA)之STEMFECTTM以及基於聚乙烯亞胺(PEI)或魚精蛋白之核酸靶向及非靶向遞送(Aleku等人,Cancer Res. 2008 68:9788-9798;Strumberg等人,Int J Clin Pharmacol Ther 2012 50:76-78;Santel等人,Gene Ther 2006 13:1222-1234;Santel等人,Gene Ther 2006 13:1360-1370;Gutbier等人,Pulm Pharmacol. Ther. 2010 23:334-344;Kaufmann等人,Microvasc Res 2010 80:286-293;Weide等人,J Immunother. 2009 32:498-507;Weide等人,J Immunother. 2008 31:180-188;Pascolo Expert Opin. Biol. Ther. 4:1285-1294;Fotin-Mleczek等人,2011 J. Immunother. 34:1-15;Song等人,Nature Biotechnol. 2005, 23:709-717;Peer等人,Proc Natl Acad Sci U S A. 2007 6;104:4095-4100;deFougerolles Hum Gene Ther. 2008 19:125-132;所有該等文獻均係以全文引用的方式併入本文中)。
在一些實施例中,將本文所闡述之多核苷酸調配為固體脂質奈米顆粒(SLN),其可為平均直徑介於10 nm至1000 nm之間的球形。SLN具有可使親脂性分子溶解且可用表面活性劑及/或乳化劑穩定之固體脂質核心基質。例示性SLN可為如國際公開案第WO2013105101號中所闡述之彼等SLN,該國際公開案係以全文引用的方式併入本文中。
在一些實施例中,本文所闡述之多核苷酸可經調配以用於受控釋放及/或靶向遞送。如本文所用,「受控釋放」係指符合特定釋放模式以實現治療效果之醫藥組合物或化合物釋放型態。在一些實施例中,可將多核苷酸囊封至本文所闡述及/或此項技術中已知之遞送劑中,以用於受控釋放及/或靶向遞送。如本文所用,術語「囊封」意指包封、包圍或包裝。由於該術語與本揭示案之化合物之調配有關,故囊封可為實質性的、完全的或部分的。術語「實質上囊封」意指至少大於50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或大於99%之本揭示案之醫藥組合物或化合物可包封、包圍或包裝在遞送劑內。「部分囊封」或「部分地囊封」意指少於10%、10%、20%、30%、40%、50%或更少之本揭示案之醫藥組合物或化合物可包封、包圍或包裝在遞送劑內。
有利地,可藉由使用螢光及/或電子顯微照片量測本揭示案之醫藥組合物或化合物之逃逸或活性來測定囊封。舉例而言,至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或大於99%之本揭示案之醫藥組合物或化合物囊封在遞送劑內。
在一些實施例中,可將本文所闡述之多核苷酸囊封在治療性奈米顆粒中,在本文中稱為「治療性奈米顆粒多核苷酸」。治療性奈米顆粒可藉由(例如)國際公開案第WO2010005740、第WO2010030763號、第WO2010005721號、第WO2010005723號及第WO2012054923號;及美國公開案第US20110262491號、第US20100104645號、第US20100087337號、第US20100068285號、第US20110274759號、第US20100068286號、第US20120288541號、第US20120140790號、第US20130123351號及第US20130230567號;及美國專利第8,206,747號、第8,293,276號、第8,318,208號及第8,318,211號中所闡述之方法來調配,該等公開案及專利各自係以全文引用的方式併入本文中。
在一些實施例中,治療性奈米顆粒多核苷酸可經調配以供持續釋放。如本文所用,「持續釋放」係指醫藥組合物或化合物在特定時間段內符合某一釋放速率。該時間段可包括(但不限於)數小時、數天、數週、數月及數年。作為非限制性實例,本文所闡述多核苷酸之持續釋放奈米顆粒可如國際公開案第WO2010075072號及美國公開案第US20100216804號、第US20110217377號、第US20120201859號及第US20130150295號中所揭示進行調配,該等公開案各自係以全文引用的方式併入本文中。
在一些實施例中,治療性奈米顆粒多核苷酸可調配成靶標特異性的,諸如國際公開案第WO2008121949號、第WO2010005726號、第WO2010005725號、第WO2011084521號及第WO2011084518號;及美國公開案第US20100069426號、第US20120004293號及第US20100104655號中所闡述之彼等治療性奈米顆粒多核苷酸,該等公開案各自係以全文引用的方式併入本文中。
LNP可使用微流體混合器或微混合器來製備。例示性微流體混合器可包括(但不限於)切口叉指式微混合器,包括(但不限於)由Microinnova (Allerheiligen bei Wildon, Austria)製造之彼等微混合器及/或交錯人字形微混合器(SHM) (參見Zhigaltsev等人,「Bottom-up design and synthesis of limit size lipid nanoparticle systems with aqueous and triglyceride cores using millisecond microfluidic mixing」,
Langmuir28:3633-40 (2012);Belliveau等人,「Microfluidic synthesis of highly potent limit-size lipid nanoparticles for
in vivodelivery of siRNA」, Molecular Therapy-Nucleic Acids. 1:e37 (2012);Chen等人,「Rapid discovery of potent siRNA-containing lipid nanoparticles enabled by controlled microfluidic formulation」,
J. Am. Chem. Soc.134(16):6948-51 (2012);該等文獻各自係以全文引用的方式併入本文中)。例示性微混合器包括切口叉指式微結構化混合器(SIMM-V2)或標準切口叉指式微混合器(SSIMM)或Caterpillar微混合器(CPMM)或碰撞射流微混合器(IJMM),其來自Institut für Mikrotechnik Mainz GmbH, Mainz Germany。在一些實施例中,使用SHM製備LNP之方法進一步包括混合至少兩個輸入流,其中混合藉由微結構誘導之混沌對流(MICA)發生。根據此方法,液流流經以人字形圖案呈現之通道,引起旋流且使流體圍繞彼此摺疊。此方法亦可包括用於流體混合之表面,其中該表面在流體循環期間改變定向。使用SHM生成LNP之方法包括美國公開案第US20040262223號及第US20120276209號中所揭示之彼等方法,該等公開案各自係以全文引用的方式併入本文中。
在一些實施例中,本文所闡述之多核苷酸可使用微流體技術調配於脂質奈米顆粒中(參見Whitesides, George M., 「The Origins and the Future of Microfluidics」,
Nature442: 368-373 (2006);及Abraham等人,「Chaotic Mixer for Microchannels」,
Science295: 647-651 (2002);該等文獻各自係以全文引用的方式併入本文中)。在一些實施例中,可使用微混合器晶片將多核苷酸調配於脂質奈米顆粒中,該晶片諸如(但不限於)來自Harvard Apparatus (Holliston, MA)或Dolomite Microfluidics (Royston, UK)之彼等晶片。微混合器晶片可用於利用分流及重組機制使兩個或更多個液流快速混合。
在一些實施例中,可將本文所闡述之多核苷酸調配於直徑為約1 nm至約100 nm之脂質奈米顆粒中,諸如(但不限於)約1 nm至約20 nm、約1 nm至約30 nm、約1 nm至約40 nm、約1 nm至約50 nm、約1 nm至約60 nm、約1 nm至約70 nm、約1 nm至約80 nm、約1 nm至約90 nm、約5 nm至約100 nm、約5 nm至約10 nm、約5 nm至約20 nm、約5 nm至約30 nm、約5 nm至約40 nm、約5 nm至約50 nm、約5 nm至約60 nm、約5 nm至約70 nm、約5 nm至約80 nm、約5 nm至約90 nm、約10至約20 nm、約10至約30 nm、約10至約40 nm、約10至約50 nm、約10至約60 nm、約10至約70 nm、約10至約80 nm、約10至約90 nm、約20至約30 nm、約20至約40 nm、約20至約50 nm、約20至約60 nm、約20至約70 nm、約20至約80 nm、約20至約90 nm、約20至約100 nm、約30至約40 nm、約30至約50 nm、約30至約60 nm、約30至約70 nm、約30至約80 nm、約30至約90 nm、約30至約100 nm、約40至約50 nm、約40至約60 nm、約40至約70 nm、約40至約80 nm、約40至約90 nm、約40至約100 nm、約50至約60 nm、約50至約70 nm、約50至約80 nm、約50至約90 nm、約50至約100 nm、約60至約70 nm、約60至約80 nm、約60至約90 nm、約60至約100 nm、約70至約80 nm、約70至約90 nm、約70至約100 nm、約80至約90 nm、約80至約100 nm及/或約90至約100 nm。
在一些實施例中,脂質奈米顆粒之直徑可為約10至500 nm。在一些實施例中,脂質奈米顆粒之直徑可大於100 nm、大於150 nm、大於200 nm、大於250 nm、大於300 nm、大於350 nm、大於400 nm、大於450 nm、大於500 nm、大於550 nm、大於600 nm、大於650 nm、大於700 nm、大於750 nm、大於800 nm、大於850 nm、大於900 nm、大於950 nm或大於1000 nm。
在一些實施例中,可使用較小之LNP來遞送多核苷酸。此等顆粒可包含低於0.1 μm至100 nm之直徑,諸如(但不限於)小於0.1 μm、小於1.0 μm、小於5 μm、小於10 μm、小於15 um、小於20 um、小於25 um、小於30 um、小於35 um、小於40 um、小於50 um、小於55 um、小於60 um、小於65 um、小於70 um、小於75 um、小於80 um、小於85 um、小於90 um、小於95 um、小於100 um、小於125 um、小於150 um、小於175 um、小於200 um、小於225 um、小於250 um、小於275 um、小於300 um、小於325 um、小於350 um、小於375 um、小於400 um、小於425 um、小於450 um、小於475 um、小於500 um、小於525 um、小於550 um、小於575 um、小於600 um、小於625 um、小於650 um、小於675 um、小於700 um、小於725 um、小於750 um、小於775 um、小於800 um、小於825 um、小於850 um、小於875 um、小於900 um、小於925 um、小於950 um或小於975 um。
可對本文所闡述之奈米顆粒及微顆粒進行幾何工程化,以調節巨噬細胞及/或免疫反應。幾何工程化顆粒可具有不同形狀、大小及/或表面電荷,以併入本文所闡述之多核苷酸用於靶向遞送,諸如(但不限於)經肺遞送(例如,參見國際公開案第WO2013082111號,該國際公開案係以全文引用的方式併入本文中)。幾何工程化顆粒之其他物理特徵可包括(但不限於)窗孔、成角臂、不對稱性及表面粗糙度、可改變與細胞及組織之相互作用之電荷。
在一些實施例中,本文所闡述之奈米顆粒為隱密奈米顆粒或靶標特異性隱密奈米顆粒,諸如(但不限於)美國公開案第US20130172406號中所闡述之彼等奈米顆粒,該公開案係以全文引用的方式併入本文中。隱密或靶標特異性隱密奈米顆粒可包含聚合基質,其可包含兩種或更多種聚合物,諸如(但不限於)聚乙烯、聚碳酸酯、聚酸酐、聚羥基酸、聚富馬酸丙酯、聚己內酯、聚醯胺、聚縮醛、聚醚、聚酯、聚(原酸酯)、聚氰基丙烯酸酯、聚乙烯醇、聚胺基甲酸酯、聚磷腈、聚丙烯酸酯、聚甲基丙烯酸酯、聚氰基丙烯酸酯、聚脲、聚苯乙烯、聚胺、聚酯、聚酸酐、聚醚、聚胺基甲酸酯、聚甲基丙烯酸酯、聚丙烯酸酯、聚氰基丙烯酸酯或其組合。
4. 治療性多肽
本文所闡述之多核苷酸可編碼治療性多肽,諸如當提供給個體(例如哺乳動物個體,諸如人類)時發揮有益效應之多肽,該有益效應諸如為緩和疾病之一或多種症狀、減弱疾病之程度、疾病狀態穩定(亦即不惡化)、延遲或減緩疾病之進展或改善或減輕疾病狀態。該疾病可為與內源性多肽形式缺乏相關之疾病。
在一些實施例中,由開放閱讀框編碼之多肽為分泌蛋白(例如細胞介素、生長因子、酶、免疫調節劑、抗體或其抗原結合片段或細胞穿透肽)、細胞外膜結合蛋白、細胞內膜結合蛋白、細胞質蛋白、細胞骨架蛋白或核蛋白。
在一些實施例中,多肽為人類蛋白質體之蛋白質。舉例而言,多肽可具有以下中之任一者之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601,此等申請案中之每一者之揭示內容均係以全文引用的方式併入本文中。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少70%一致之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少75%一致之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少80%一致之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少85%一致之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少90%一致之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少95%一致(例如95%、96%、97%、98%、99%或100%一致)之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少96%一致(例如96%、97%、98%、99%或100%一致)之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少97%一致(例如97%、98%、99%或100%一致)之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少98%一致(例如98%、99%或100%一致)之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
在一些實施例中,多肽具有與以下中之任一者之胺基酸序列至少99%一致(例如99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%一致)之胺基酸序列:PCT/US2013/030062之SEQ ID NO: 769至1392;PCT/US2013/030068之SEQ ID NO: 884至1611;PCT/US2013/030064之SEQ ID NO: 1827至3497;PCT/US2013/030067之SEQ ID NO: 3858至7559;PCT/US2013/030066之SEQ ID NO: 4672至9187;PCT/US2013/030070之SEQ ID NO: 4704至9203;PCT/US2013/030059之SEQ ID NO: 8144至16131;PCT/US2013/030060之SEQ ID NO: 8922至17687;及PCT/US2013/030061之SEQ ID NO: 35608至45601。
5. 信號序列
本揭示案之多核苷酸(例如RNA,例如mRNA)亦可包含編碼額外特徵之核苷酸序列,該等額外特徵有助於將所編碼多肽輸送至治療相關部位。有助於蛋白質輸送之一個此類特徵為信號序列或靶向序列。由該等信號序列編碼之肽有多種名稱,包括靶向肽、轉運肽及信號肽。在一些實施例中,多核苷酸(例如RNA,例如mRNA)包含編碼信號肽之核苷酸序列(例如ORF),該編碼信號肽之核苷酸序列可操作地連接至編碼所關注多肽之核苷酸序列。
在一些實施例中,「信號序列」或「信號肽」分別為多核苷酸或多肽,其長度為約30-210個、例如約45-80或15-60個核苷酸(例如約20、30、40、50、60或70個胺基酸),其視情況分別在編碼區或多肽之5' (或N末端)處併入。添加該等序列使得所編碼多肽經由一或多種靶向路徑輸送至期望部位,諸如內質網或粒線體。一些信號肽自蛋白質裂解,例如在蛋白質轉運至期望部位後由信號肽酶裂解。
6. 編碼目標多肽之核苷酸序列之序列最佳化
在一些實施例中,本揭示案之多核苷酸(例如RNA,例如mRNA)經序列最佳化。在一些實施例中,本揭示案之多核苷酸(例如RNA,例如mRNA)包含編碼治療性多肽(例如上文所闡述之治療性多肽)之核苷酸序列(例如ORF)、視情況存在之編碼另一所關注多肽之核苷酸序列(例如ORF)、5'-UTR、3'-UTR (該5' UTR或該3' UTR視情況包含至少一個微小RNA結合位點)、視情況存在之編碼連接體之核苷酸序列、聚A尾或其任何組合,其中ORF經序列最佳化。
序列最佳化之核苷酸序列(例如編碼治療性多肽之密碼子最佳化之RNA序列)係相對於參考序列(例如編碼所關注之治療性多肽之野生型核苷酸序列)包含至少一個同義核鹼基取代之序列。
序列最佳化之核苷酸序列之序列可部分或完全不同於參考序列。舉例而言,編碼由UCU密碼子統一編碼之聚絲胺酸之參考序列可藉由使其100%之核鹼基經取代(對於每一密碼子,1位之U由A置換,2位之C由G置換,且3位之U由C置換)而經序列最佳化,以產生編碼將由AGC密碼子統一編碼之聚絲胺酸之序列。自參考聚絲胺酸核酸序列與序列最佳化之聚絲胺酸核酸序列之間的全域成對對齊獲得之序列一致性百分比將為0%。然而,來自該兩種序列之蛋白質產物將為100%一致的。
一些序列最佳化(有時亦稱為密碼子最佳化)方法為此項技術中所已知(且在下文中更詳細地論述),且可用於達成一或多種期望結果。該等結果可包括(例如)在某些組織靶標及/或宿主生物體中匹配密碼子頻率以確保正確摺疊;偏置G/C含量以增加mRNA穩定性或減少二級結構;使可損害基因構築或表現之串聯重複密碼子或鹼基連串降至最低;定製轉錄及轉譯控制區;插入或去除蛋白質輸送序列;在所編碼蛋白質中去除/添加轉譯後修飾位點(例如糖基化位點);添加、去除或改組蛋白質結構域;插入或缺失限制位點;修飾核糖體結合位點及mRNA降解位點;調整轉譯速率以容許蛋白質之各個結構域正確摺疊;及/或減少或消除多核苷酸內之問題二級結構。序列最佳化工具、演算法及服務為此項技術中所已知,非限制性實例包括來自GeneArt (Life Technologies)、DNA2.0 (Menlo Park CA)及/或專有方法之服務。
每一胺基酸之密碼子選擇在
表 6中給出。
表 6. 密碼子選擇
胺基酸 | 單字母代碼 | 密碼子選擇 |
異白胺酸 | I | AUU、AUC、AUA |
白胺酸 | L | CUU、CUC、CUA、CUG、UUA、UUG |
纈胺酸 | V | GUU、GUC、GUA、GUG |
苯丙胺酸 | F | UUU、UUC |
甲硫胺酸 | M | AUG |
半胱胺酸 | C | UGU、UGC |
丙胺酸 | A | GCU、GCC、GCA、GCG |
甘胺酸 | G | GGU、GGC、GGA、GGG |
脯胺酸 | P | CCU、CCC、CCA、CCG |
蘇胺酸 | T | ACU、ACC、ACA、ACG |
絲胺酸 | S | UCU、UCC、UCA、UCG、AGU、AGC |
酪胺酸 | Y | UAU、UAC |
色胺酸 | W | UGG |
麩醯胺酸 | Q | CAA、CAG |
天冬醯胺 | N | AAU、AAC |
組胺酸 | H | CAU、CAC |
麩胺酸 | E | GAA、GAG |
天冬胺酸 | D | GAU、GAC |
離胺酸 | K | AAA、AAG |
精胺酸 | R | CGU、CGC、CGA、CGG、AGA、AGG |
硒基半胱胺酸 | Sec | 在存在硒基半胱胺酸插入元件(SECIS)之情形下mRNA中之UGA |
終止密碼子 | 終止 | UAA、UAG、UGA |
在一些實施例中,本揭示案之多核苷酸(例如RNA,例如mRNA)包含編碼治療性多肽、其功能片段或變異體之序列最佳化之核苷酸序列(例如ORF),其中由序列最佳化之核苷酸序列編碼之該治療性多肽、其功能片段或變異體具有改良性質(例如,與由未經序列最佳化之參考核苷酸序列編碼之治療性多肽、其功能片段或變異體相比),例如在活體內投與後與表現功效有關的改良之性質。此等性質包括(但不限於)改良核酸穩定性(例如mRNA穩定性)、增加靶組織中之轉譯功效、減少所表現之截短蛋白質之數量、改良所表現蛋白質之摺疊或防止錯摺疊、降低表現產物之毒性、減少由表現產物引起之細胞死亡、增加及/或減少蛋白質聚集。
在一些實施例中,序列最佳化之核苷酸序列(例如ORF)經密碼子最佳化以在人類個體中表現,具有避免此項技術中之一或多個問題之結構及/或化學特徵,例如可用於以下之特徵:最佳化基於核酸之治療劑之調配及遞送,同時保持結構及功能完整性;克服表現臨限值;改良表現速率;半衰期及/或蛋白質濃度;最佳化蛋白質定位;及避免有害生物反應,諸如免疫反應及/或降解路徑。
在一些實施例中,本揭示案之多核苷酸包含核苷酸序列(例如編碼治療性多肽之核苷酸序列(例如ORF)、編碼另一所關注多肽之核苷酸序列(例如ORF)、5'-UTR、3'-UTR、微小RNA結合位點、編碼連接體之核酸序列或其任何組合),其根據包括以下之方法經序列最佳化:
(i) 用替代性密碼子取代參考核苷酸序列(例如編碼治療性多肽之ORF)中之至少一個密碼子,以增加或減少尿苷含量,從而生成尿苷修飾之序列;
(ii) 用在同義密碼子集中具有更高密碼子頻率之替代性密碼子取代參考核苷酸序列(例如編碼治療性多肽之ORF)中之至少一個密碼子;
(iii) 用替代性密碼子取代參考核苷酸序列(例如編碼治療性多肽之ORF)中之至少一個密碼子,以增加G/C含量;或
(iv) 其組合。
在一些實施例中,相對於參考核苷酸序列,序列最佳化之核苷酸序列(例如編碼治療性多肽之ORF)具有至少一種改良之性質。
在一些實施例中,序列最佳化方法係多參數的,且包含本文所揭示之一種、兩種、三種、四種或更多種方法及/或此項技術中已知之其他最佳化方法。
在本揭示案之一些實施例中可視為有益之特徵可由多核苷酸之區域編碼或在該等區域內編碼,且此等區域可位於編碼治療性多肽之區域之上游(5')、下游(3')或在該區域內。該等區域可在蛋白質編碼區或開放閱讀框(ORF)之序列最佳化之前及/或之後併入至多核苷酸中。此等特徵之實例包括(但不限於)非轉譯區(UTR)、微小RNA序列、Kozak序列、寡(dT)序列、聚A尾及可偵測標籤,且可包括可具有XbaI識別之多選殖位點。
在一些實施例中,本揭示案之多核苷酸包含5' UTR、3' UTR及/或微小RNA結合位點。在一些實施例中,多核苷酸包含兩個或更多個5' UTR及/或3' UTR,其可為相同或不同序列。在一些實施例中,多核苷酸包含兩個或更多個微小RNA結合位點,其可為相同或不同序列。5' UTR、3' UTR及/或微小RNA結合位點中之任何部分(包括無)均可經序列最佳化,且在序列最佳化之前及/或之後可獨立地含有一或多個不同的結構或化學修飾。
在一些實施例中,在最佳化後,使多核苷酸重構且轉型至載體中,諸如(但不限於)質體、病毒、黏粒及人工染色體。舉例而言,可使最佳化之多核苷酸重構且轉型至化學感受態大腸桿菌(
E. coli)、酵母、紅黴菌(neurospora)、玉蜀黍、果蠅等中,在該等物種中藉由本文所闡述之方法產生高拷貝之質體樣或染色體結構。
7. 編碼目標多肽之序列最佳化核苷酸序列
在一些實施例中,本揭示案之多核苷酸包含編碼本文所揭示之治療性多肽之序列最佳化核苷酸序列。在一些實施例中,本揭示案之多核苷酸包含編碼治療性多肽之開放閱讀框(ORF),其中該ORF已經序列最佳化。
本文所揭示之序列最佳化核苷酸序列可不同於相應野生型核苷酸序列及其他已知之序列最佳化核苷酸序列,例如該等序列最佳化核酸具有獨特之組合性特性。
在一些實施例中,相對於參考野生型核苷酸序列中尿嘧啶或胸腺嘧啶核鹼基之百分比,序列最佳化核苷酸序列(例如編碼治療性多肽、其功能片段或變異體)中尿嘧啶或胸腺嘧啶核鹼基之百分比改變(例如減少)。此一序列稱為尿嘧啶修飾或胸腺嘧啶修飾之序列。核苷酸序列中之尿嘧啶或胸腺嘧啶含量之百分比可藉由將序列中之尿嘧啶或胸腺嘧啶之數量除以核苷酸之總數且乘以100來確定。在一些實施例中,序列最佳化核苷酸序列所具有之尿嘧啶或胸腺嘧啶含量低於參考野生型序列中之尿嘧啶或胸腺嘧啶含量。在一些實施例中,本揭示案之序列最佳化核苷酸序列中之尿嘧啶或胸腺嘧啶含量大於參考野生型序列中之尿嘧啶或胸腺嘧啶含量且仍維持有益效應,例如與參考野生型序列相比,表現增加及/或類鐸受體(TLR)反應減少。
最佳化密碼子使用之方法為此項技術中所已知。舉例而言,本文所提供序列中之任一或多者之ORF可經密碼子最佳化。在一些實施例中,密碼子最佳化可用於匹配目標及宿主生物體中之密碼子頻率以確保正確摺疊;偏置GC含量以增加mRNA穩定性或減少二級結構;使可能損害基因構築或表現之串聯重複密碼子或鹼基連串降至最低;定製轉錄及轉譯控制區;插入或去除蛋白質輸送序列;在編碼蛋白質中去除/添加轉譯後修飾位點(例如糖基化位點);添加、去除或改組蛋白質結構域;插入或缺失限制位點;修飾核糖體結合位點及mRNA降解位點;調整轉譯速率以容許蛋白質之各個結構域正確摺疊;或減少或消除多核苷酸內之問題二級結構。密碼子最佳化工具、演算法及服務為此項技術中所已知,非限制性實例包括來自GeneArt (Life Technologies)、DNA2.0 (Menlo Park CA)及/或專有方法之服務。在一些實施例中,使用最佳化演算法使開放閱讀框(ORF)序列最佳化。
8. 序列最佳化核酸之表徵
在本揭示案之一些實施例中,可對包含本文所揭示之編碼治療性多肽之序列最佳化核酸之多核苷酸(例如RNA,例如mRNA)進行測試,以確定至少一種核酸序列性質(例如當暴露於核酸酶時之穩定性)或表現性質相對於非序列最佳化核酸是否已得到改良。
如本文所用,「表現性質」係指核酸序列在活體內之性質(例如在投與給有需要之個體後,合成mRNA之轉譯功效)或在活體外之性質(例如在活體外模型系統中測試之合成mRNA之轉譯功效)。表現性質包括(但不限於)在投與後由編碼治療性多肽之mRNA產生的蛋白質之量,以及所產生之可溶性蛋白質或其他功能蛋白質之量。在一些實施例中,本文所揭示之序列最佳化核酸可根據細胞存活率來評估,該等細胞表現由編碼本文所揭示之治療性多肽之序列最佳化核酸序列(例如RNA,例如mRNA)編碼之蛋白質。
在給定實施例中,相對於未最佳化之參考核酸序列含有密碼子取代之本文所揭示之複數個序列最佳化核酸(例如RNA,例如mRNA)可進行功能表徵以量測所關注之性質,例如在活體外模型系統中或在活體內靶組織或細胞中之表現性質。
a. 核酸序列固有性質之最佳化
在本揭示案之一些實施例中,多核苷酸之期望性質係核酸序列之固有性質。舉例而言,核苷酸序列(例如RNA,例如mRNA)可經序列最佳化以獲得活體內或活體外穩定性。在一些實施例中,核苷酸序列可經序列最佳化以在給定靶組織或細胞中表現。在一些實施例中,核酸序列經序列最佳化以藉由防止由核酸內切酶及核酸外切酶降解而延長其血漿半衰期。
在其他實施例中,核酸序列經序列最佳化以增加其在溶液中之水解抗性,例如延長序列最佳化核酸或包含序列最佳化核酸之醫藥組合物可在水性條件下儲存之時間,同時降解極少。
在其他實施例中,序列最佳化核酸可經最佳化以增加其在乾燥儲存條件下之水解抗性,例如延長序列最佳化核酸在凍乾後可儲存之時間,同時降解極少。
b. 針對蛋白質表現而最佳化之核酸序列
在本揭示案之一些實施例中,多核苷酸之期望性質係由本文所揭示之序列最佳化序列編碼之治療性多肽之表現水準。可使用一或多種表現系統來量測蛋白質表現水準。在一些實施例中,可在細胞培養系統中量測表現,例如CHO細胞或HEK293細胞。在一些實施例中,可使用自活細胞提取物(例如兔網狀紅血球溶解物)製備之活體外表現系統或藉由組裝經純化之個別組分而製備之活體外表現系統來量測表現。在其他實施例中,在活體內系統(例如小鼠、兔、猴等)中量測蛋白質表現。
在一些實施例中,呈溶液形式之蛋白質表現可為合意的。因此,在一些實施例中,參考序列可經序列最佳化,以產生具有最佳化水準之呈溶液形式之表現蛋白質之序列最佳化核酸序列。可根據此項技術中已知之方法,例如使用電泳(例如天然或SDS-PAGE)或層析方法(例如HPLC、粒徑篩析層析等)來量測蛋白質表現水準及其他性質,諸如溶解度、聚集水準及截短產物之存在(亦即由於蛋白質水解、水解或缺陷性轉譯產生之片段)。
c. 靶組織或靶細胞存活率之最佳化
在一些實施例中,由核酸序列編碼之異源治療性蛋白質之表現可在靶組織或細胞中具有有害效應,降低蛋白質產率,或降低表現產物之品質(例如由於存在蛋白質片段或所表現之蛋白質在包涵體中沈澱),或引起毒性。
因此,在本揭示案之一些實施例中,本文所揭示之核酸序列(例如編碼治療性多肽之核酸序列)之序列最佳化可用於增加表現由序列最佳化核酸編碼之蛋白質之靶細胞的存活率。
對於自體或異源移植而言,異源蛋白質表現亦可對經核酸序列轉染之細胞有害。因此,在本揭示案之一些實施例中,本文所揭示之核酸序列之序列最佳化可用於增加表現由序列最佳化核酸序列編碼之蛋白質之靶細胞的存活率。細胞或組織存活率、毒性及其他生理反應之變化可根據此項技術中已知之方法來量測。
d. 免疫及 / 或發炎性反應之減少
在一些情形中,投與編碼治療性多肽或其功能片段之序列最佳化核酸可觸發免疫反應,該免疫反應可由以下引起:(i)治療劑(例如編碼治療性多肽之mRNA),或(ii)此治療劑之表現產物(例如由該mRNA編碼之治療性多肽),或(iv)其組合。因此,在本揭示案之一些實施例中,本文所揭示之核酸序列(例如mRNA)之序列最佳化可用於降低由投與編碼治療性多肽之核酸或由此核酸編碼之治療性多肽之表現產物觸發的免疫或發炎性反應。
在一些情形中,可使用此項技術中已知之方法(例如ELISA),藉由偵測一或多種發炎性細胞介素之水準增加來量測發炎性反應。術語「發炎性細胞介素」係指在發炎性反應中升高之細胞介素。發炎性細胞介素之實例包括介白素-6 (IL-6)、CXCL1 (趨化介素(C-X-C模體)配位體1;干擾素-γ (IFNγ)、腫瘤壞死因子α (TNFα)、干擾素γ誘導蛋白10 (IP-10)或顆粒球群落刺激因子(G-CSF)。術語發炎性細胞介素亦包括此項技術中已知之與發炎性反應相關之其他細胞介素,例如介白素-1 (IL-1)、介白素-8 (IL-8)、介白素-12 (IL-12)、介白素-13 (Il-13)、干擾素α (IFN-α)等。
9. 編碼目標多肽之經修飾之核苷酸序列
在一些實施例中,本揭示案之多核苷酸(例如RNA,例如mRNA)包含經化學修飾之核鹼基,例如經化學修飾之尿嘧啶,例如假尿嘧啶、N1-甲基假尿嘧啶、5-甲氧基尿嘧啶或諸如此類。在一些實施例中,mRNA為包含編碼治療性多肽之ORF的尿嘧啶修飾之序列,其中該mRNA包含經化學修飾之核鹼基,例如經化學修飾之尿嘧啶,例如假尿嘧啶、N1-甲基假尿嘧啶或5-甲氧基尿嘧啶。
在本揭示案之某些態樣中,當經修飾之尿嘧啶鹼基連結至核糖時,如在多核苷酸中,所得經修飾之核苷或核苷酸稱為經修飾尿苷。在一些實施例中,多核苷酸中之尿嘧啶為至少約25%、至少約30%、至少約40%、至少約50%、至少約60%、至少約70%、至少約80%、至少90%、至少95%、至少99%或約100%經修飾之尿嘧啶。在一些實施例中,多核苷酸中之尿嘧啶為至少95%經修飾之尿嘧啶。在一些實施例中,多核苷酸中之尿嘧啶為100%經修飾之尿嘧啶。
在多核苷酸中之尿嘧啶為至少95%經修飾之尿嘧啶之實施例中,可調整總尿嘧啶含量,使得mRNA提供適宜蛋白質表現水準,同時誘導極少至不誘導免疫反應。在一些實施例中,ORF之尿嘧啶含量為相應野生型ORF中理論最小尿嘧啶含量(U
TM%)之約100%至約150%、約100%至約110%、約105%至約115%、約110%至約120%、約115%至約125%、約120%至約130%、約125%至約135%、約130%至約140%、約135%至約145%、約140%至約150%。在其他實施例中,ORF之尿嘧啶含量為U
TM%之約121%至約136%或123%至134%。在一些實施例中,編碼治療性多肽之ORF之尿嘧啶含量為U
TM%之約115%、約120%、約125%、約130%、約135%、約140%、約145%或約150%。在此背景中,術語「尿嘧啶」可指經修飾之尿嘧啶及/或天然尿嘧啶。
在一些實施例中,編碼本揭示案之治療性多肽之mRNA ORF中之尿嘧啶含量小於ORF中總核鹼基含量之約30%、約25%、約20%、約15%或約10%。在一些實施例中,ORF中之尿嘧啶含量介於ORF中總核鹼基含量之約10%與約20%之間。在其他實施例中,ORF中之尿嘧啶含量介於ORF中總核鹼基含量之約10%與約25%之間。在一些實施例中,編碼治療性多肽之mRNA ORF中之尿嘧啶含量小於開放閱讀框中總核鹼基含量之約20%。在此背景中,術語「尿嘧啶」可指經修飾之尿嘧啶及/或天然尿嘧啶。
在其他實施例中,編碼治療性多肽且具有經修飾之尿嘧啶及經調整之尿嘧啶含量之mRNA ORF具有增加之胞嘧啶(C)、鳥嘌呤(G)或鳥嘌呤/胞嘧啶(G/C)含量(絕對或相對)。在一些實施例中,相對於野生型ORF之G/C含量(絕對或相對),ORF之C、G或G/C含量(絕對或相對)之總體增加為至少約2%、至少約3%、至少約4%、至少約5%、至少約6%、至少約7%、至少約10%、至少約15%、至少約20%、至少約40%、至少約50%、至少約60%、至少約70%、至少約80%、至少約90%、至少約95%或至少約100%。在一些實施例中,ORF中之G、C或G/C含量為編碼治療性多肽之相應野生型核苷酸序列之理論最大G、C或G/C含量(G
TMX%;C
TMX%或G/C
TMX%)之小於約100%、小於約90%、小於約85%或小於約80%。在一些實施例中,本文所闡述之G及/或C含量(絕對或相對)之增加可藉由用具有更高G、C或G/C含量之同義密碼子置換具有低G、C或G/C含量之同義密碼子來進行。在其他實施例中,G及/或C含量(絕對或相對)之增加係藉由用以G或C結束之同義密碼子置換以U結束之密碼子來進行。
在其他實施例中,編碼本揭示案之治療性多肽之mRNA ORF包含經修飾之尿嘧啶且具有經調整之尿嘧啶含量,相較於編碼該治療性多肽之相應野生型核苷酸序列,其含有較少之尿嘧啶對(UU)及/或尿嘧啶三聯體(UUU)及/或尿嘧啶四聯體(UUUU)。在一些實施例中,編碼本揭示案之治療性多肽之mRNA ORF不含尿嘧啶對及/或尿嘧啶三聯體及/或尿嘧啶四聯體。在一些實施例中,尿嘧啶對及/或尿嘧啶三聯體及/或尿嘧啶四聯體減少至低於某一臨限值,例如在編碼治療性多肽之mRNA ORF中出現不超過1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次。在特定實施例中,編碼本揭示案之治療性多肽之mRNA ORF含有少於20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個非苯丙胺酸尿嘧啶對及/或三聯體。在一些實施例中,編碼治療性多肽之mRNA ORF不含非苯丙胺酸尿嘧啶對及/或三聯體。
在其他實施例中,編碼本揭示案之治療性多肽之mRNA ORF包含經修飾之尿嘧啶且具有經調整之尿嘧啶含量,相較於編碼治療性多肽之相應野生型核苷酸序列,其含有較少之富含尿嘧啶之簇。在一些實施例中,編碼本揭示案之治療性多肽之mRNA ORF含有富含尿嘧啶之簇,其長度短於編碼治療性多肽之相應野生型核苷酸序列中之相應富含尿嘧啶之簇。
在其他實施例中,採用替代性較低頻率密碼子。包含經修飾尿嘧啶之mRNA的編碼治療性多肽之ORF中至少約5%、至少約10%、至少約15%、至少約20%、至少約25%、至少約30%、至少約35%、至少約40%、至少約45%、至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約99%或100%之密碼子經替代性密碼子取代,每一替代性密碼子之密碼子頻率低於同義密碼子集中經取代密碼子之密碼子頻率。如上文所闡述,ORF亦具有經調整之尿嘧啶含量。在一些實施例中,編碼治療性多肽之mRNA ORF中之至少一個密碼子經替代性密碼子取代,該替代性密碼子之密碼子頻率低於同義密碼子集中經取代密碼子之密碼子頻率。
在一些實施例中,當投與給哺乳動物細胞時,包含經修飾尿嘧啶之mRNA的尿嘧啶含量經調整之編碼治療性多肽之ORF所展現出的治療性多肽之表現水準高於來自相應野生型mRNA之治療性多肽之表現水準。在一些實施例中,哺乳動物細胞為小鼠細胞、大鼠細胞或兔細胞。在其他實施例中,哺乳動物細胞為猴細胞或人類細胞。在一些實施例中,人類細胞為HeLa細胞、BJ纖維母細胞或外周血單核細胞(PBMC)。在一些實施例中,當將mRNA活體內投與給哺乳動物細胞時,本揭示案之治療性多肽之表現水準高於來自相應野生型mRNA之相同多肽之表現水準。在一些實施例中,將mRNA投與給小鼠、兔、大鼠、猴或人類。在一些實施例中,小鼠為缺陷型(null)小鼠。在一些實施例中,將mRNA以約0.01 mg/kg、約0.05 mg/kg、約0.1 mg/kg或0.2 mg/kg或約0.5 mg/kg之量投與給小鼠。在一些實施例中,靜脈內或肌內投與mRNA。在其他實施例中,當將mRNA活體外投與至哺乳動物細胞時,治療性多肽得以表現。在一些實施例中,表現增加至至少約2倍、至少約5倍、至少約10倍、至少約50倍、至少約500倍、至少約1500倍或至少約3000倍。在其他實施例中,表現增加至少約10%、約20%、約30%、約40%、約50%、60%、約70%、約80%、約90%或約100%。
在一些實施例中,包含經修飾尿嘧啶之mRNA的尿嘧啶含量經調整之編碼治療性多肽之ORF展現增加之穩定性。在一些實施例中,相對於相同條件下相應野生型mRNA之穩定性,mRNA在細胞中展現出增加之穩定性。在一些實施例中,mRNA展現出增加之穩定性,包括對核酸酶之抗性、熱穩定性及/或二級結構之穩定增加。在一些實施例中,藉由測定mRNA之半衰期(例如在血漿、血清、細胞或組織樣品中)及/或測定mRNA之蛋白質表現隨時間推移之曲線下面積(AUC)(例如活體外或活體內)來量測mRNA所展現出之穩定性增加。若半衰期及/或AUC大於相同條件下相應野生型mRNA之半衰期及/或AUC,則將mRNA鑑別為具有增加之穩定性。
在一些實施例中,相對於相同條件下由相應野生型mRNA誘導之免疫反應,本揭示案之mRNA誘導可偵測地更低之免疫反應(例如先天性或獲得性)。在其他實施例中,相對於在相同條件下由編碼治療性多肽但不包含經修飾尿嘧啶之mRNA誘導之免疫反應,或相對於在相同條件下由編碼治療性多肽且包含經修飾尿嘧啶但不具有經調整之尿嘧啶含量之mRNA誘導之免疫反應,本揭示案之mRNA誘導可偵測地更低之免疫反應(例如先天性或獲得性)。先天免疫反應可表現為促發炎性細胞介素之表現增加、細胞內PRR (RIG-I、MDA5等)活化、細胞死亡及/或蛋白質轉譯終止或減少。在一些實施例中,先天免疫反應之減少可藉由1型干擾素(例如IFN-α、IFN-β、IFN-κ、IFN-δ、IFN-ε、IFN-τ、IFN-ω及IFN-ζ)之表現或活性水準或干擾素調控基因(諸如類鐸受體(例如TLR7及TLR8))之表現及/或藉由將本揭示案之mRNA一或多次投與至細胞中後細胞死亡之減少來量測。
在一些實施例中,相對於相應野生型mRNA、編碼治療性多肽但不包含經修飾尿嘧啶之mRNA或編碼治療性多肽且包含經修飾尿嘧啶但不具有經調整之尿嘧啶含量之mRNA,哺乳動物細胞因應於本揭示案之mRNA之1型干擾素表現減少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%或大於99.9%。在一些實施例中,干擾素為IFN-β。在一些實施例中,相較於相應野生型mRNA、編碼治療性多肽但不包含經修飾尿嘧啶之mRNA或編碼治療性多肽且包含經修飾尿嘧啶但不具有經調整之尿嘧啶含量之mRNA所觀察到的細胞死亡頻率,由向哺乳動物細胞投與本揭示案之mRNA所引起的細胞死亡頻率低10%、25%、50%、75%、85%、90%、95%或超過95%。在一些實施例中,哺乳動物細胞為BJ纖維母細胞。在其他實施例中,哺乳動物細胞為脾細胞。在一些實施例中,哺乳動物細胞為小鼠或大鼠之細胞。在其他實施例中,哺乳動物細胞為人類之細胞。在一些實施例中,本揭示案之mRNA實質上不誘導引入該mRNA之哺乳動物細胞之先天免疫反應。
10. 修飾多核苷酸之方法
本揭示案包括經修飾之多核苷酸,其包含本文所闡述之多核苷酸(例如多核苷酸,例如mRNA,其包含編碼治療性多肽之核苷酸序列)。經修飾之多核苷酸可經化學修飾及/或經結構修飾。當本揭示案之多核苷酸經化學及/或結構修飾時,該等多核苷酸可稱為「經修飾之多核苷酸」。
本揭示案提供編碼治療性多肽之多核苷酸(例如RNA多核苷酸,諸如mRNA多核苷酸)之經修飾核苷及核苷酸。「核苷」係指含有糖分子(例如戊糖或核糖)或其衍生物與有機鹼基(例如嘌呤或嘧啶)或其衍生物(在本文中亦稱為「核鹼基」)之組合之化合物。「核苷酸」係指包括磷酸酯基之核苷。經修飾之核苷酸可藉由任何可用方法(諸如化學、酶促或重組)合成,以包括一或多個經修飾或非天然之核苷。多核苷酸可包含一或多個連接核苷區。此等區可具有可變主鏈鍵聯。該等鍵聯可為標準磷酸二酯鍵聯,在該情形下,多核苷酸將包含核苷酸區。
本文所揭示之經修飾之多核苷酸可包含各種不同的修飾。在一些實施例中,經修飾之多核苷酸含有一個、兩個或更多個(視情況不同的)核苷或核苷酸修飾。在一些實施例中,與未經修飾之多核苷酸相比,引入至細胞中之經修飾之多核苷酸可展現出一或多種合意性質,例如改良之蛋白質表現、降低之免疫原性或降低之細胞中之降解。
在一些實施例中,本揭示案之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)經結構修飾。如本文所用,「結構」修飾係兩個或更多個連接之核苷在多核苷酸中插入、缺失、重複、倒置或隨機化而不對核苷酸本身進行顯著化學修飾之修飾。由於化學鍵必然會斷裂並重新形成以實現結構修飾,故結構修飾具有化學性質,且因此為化學修飾。然而,結構修飾將產生不同的核苷酸序列。舉例而言,多核苷酸「ATCG」可化學修飾成「AT-5meC-G」。該相同多核苷酸可自「ATCG」結構修飾成「ATCCCG」。在此,已插入二核苷酸「CC」,從而導致對多核苷酸之結構修飾。
在一些實施例中,本揭示案之治療性組合物包含至少一種核酸(例如RNA),其具有編碼治療性多肽、其片段或變異體之開放閱讀框,其中該核酸包含可為標準(未經修飾)或如此項技術中所已知經修飾之核苷酸及/或核苷。在一些實施例中,本揭示案之核苷酸及核苷包含經修飾之核苷酸或核苷。此等經修飾之核苷酸及核苷可為天然修飾之核苷酸及核苷或非天然修飾之核苷酸及核苷。此等修飾可包括如此項技術中所公認的在核苷酸及/或核苷之糖、主鏈或核鹼基部分中之彼等修飾。
在一些實施例中,本揭示案之天然修飾之核苷酸或核苷酸係如此項技術中所眾所周知或公認之核苷酸或核苷。此等天然修飾之核苷酸及核苷酸之非限制性實例可尤其在廣泛認可之MODOMICS資料庫中找到。
在一些實施例中,本揭示案之非天然修飾之核苷酸或核苷係如此項技術中所眾所周知或公認之核苷酸或核苷。此等非天然修飾之核苷酸及核苷之非限制性實例可尤其在已公開之美國申請案第PCT/US2012/058519號;第PCT/US2013/075177號;第PCT/US2014/058897號;第PCT/US2014/058891號;第PCT/US2014/070413號;第PCT/US2015/36773號;第PCT/US2015/36759號;第PCT/US2015/36771號;或第PCT/IB2017/051367號中找到,所有該等申請案均係以引用的方式併入本文中。
在一些實施例中,本揭示案之至少一種RNA (例如mRNA)未經化學修飾,且包含由腺苷、鳥苷、胞嘧啶及尿苷組成之標準核糖核苷酸。在一些實施例中,本揭示案之核苷酸及核苷包含標準核苷殘基,諸如存在於所轉錄RNA中之彼等核苷殘基(例如A、G、C或U)。在一些實施例中,本揭示案之核苷酸及核苷包含標準去氧核糖核苷,諸如存在於DNA中之彼等去氧核糖核苷(例如dA、dG、dC或dT)。
因此,本揭示案之核酸(例如DNA核酸及RNA核酸,諸如mRNA核酸)可包含標準核苷酸及核苷、天然核苷酸及核苷、非天然核苷酸及核苷或其任何組合。
在一些實施例中,本揭示案之核酸(例如DNA核酸及RNA核酸,諸如mRNA核酸)包含各種(一種以上)不同類型之標準及/或經修飾之核苷酸及核苷。在一些實施例中,核酸之特定區域含有一種、兩種或更多種(視情況不同)類型之標準及/或經修飾之核苷酸及核苷。
在一些實施例中,相對於包含標準核苷酸及核苷之未經修飾之核酸,引入至細胞或生物體中的經修飾之RNA核酸(例如經修飾之mRNA核酸)分別在細胞或生物體中展現出降低之降解。
在一些實施例中,相對於包含標準核苷酸及核苷之未經修飾之核酸,引入至細胞或生物體中的經修飾之RNA核酸(例如經修飾之mRNA核酸)可分別在細胞或生物體中展現出降低之免疫原性(例如降低之先天反應)。
在一些實施例中,核酸(例如RNA核酸,諸如mRNA核酸)包含非天然修飾之核苷酸,該等核苷酸係在核酸之合成期間或合成後引入,以達成期望功能或性質。修飾可存在於核苷間鍵聯、嘌呤或嘧啶鹼基或糖上。修飾可利用化學合成或利用聚合酶在鏈末端或鏈中之任何其他位置處引入。核酸之任一區域均可經化學修飾。
本揭示案提供核酸(例如RNA核酸,諸如mRNA核酸)之經修飾核苷及核苷酸。「核苷」係指含有糖分子(例如戊糖或核糖)或其衍生物與有機鹼基(例如嘌呤或嘧啶)或其衍生物(在本文中亦稱為「核鹼基」)之組合之化合物。「核苷酸」係指包括磷酸酯基之核苷。經修飾之核苷酸可藉由任何可用方法(諸如化學、酶促或重組)合成,以包括一或多個經修飾或非天然之核苷。核酸可包含一或多個連接核苷區。此等區可具有可變主鏈鍵聯。該等鍵聯可為標準磷酸二酯鍵聯,在該情形下,核酸將包含核苷酸區。
經修飾之核苷酸鹼基配對不僅涵蓋標準腺苷-胸腺嘧啶、腺苷-尿嘧啶或鳥苷-胞嘧啶鹼基對,且亦涵蓋在核苷酸及/或包含非標準或經修飾鹼基之經修飾核苷酸之間形成的鹼基對,其中氫鍵供體與氫鍵受體之排列允許在非標準鹼基與標準鹼基之間或在兩個互補非標準鹼基結構之間形成氫鍵,諸如在彼等具有至少一種化學修飾之核酸中。此非標準鹼基配對之一個實例係在經修飾之核苷酸肌苷與腺嘌呤、胞嘧啶或尿嘧啶之間的鹼基配對。鹼基/糖或連接體之任何組合均可併入至本揭示案之核酸中。
在一些實施例中,核酸(例如RNA核酸,諸如mRNA核酸)中之經修飾之核鹼基包含N1-甲基-假尿苷(m1ψ)、1-乙基-假尿苷(e1ψ)、5-甲氧基-尿苷(mo5U)、5-甲基-胞苷(m5C)及/或假尿苷(ψ)。在一些實施例中,核酸(例如RNA核酸,諸如mRNA核酸)中之經修飾之核鹼基包含5-甲氧基甲基尿苷、5-甲硫基尿苷、1-甲氧基甲基假尿苷、5-甲基胞苷及/或5-甲氧基胞苷。在一些實施例中,多核糖核苷酸包括上文所提及之任何經修飾核鹼基中之至少兩者(例如2者、3者、4者或更多者)之組合,包括(但不限於)化學修飾。
在一些實施例中,本揭示案之RNA核酸在核酸之一或多個或所有尿苷位置處包含N1-甲基-假尿苷(m1ψ)取代。
在一些實施例中,本揭示案之RNA核酸在核酸之一或多個或所有尿苷位置處包含N1-甲基-假尿苷(m1ψ)取代且在核酸之一或多個或所有胞苷位置處包含5-甲基胞苷取代。
在一些實施例中,本揭示案之RNA核酸在核酸之一或多個或所有尿苷位置處包含假尿苷(ψ)取代。
在一些實施例中,本揭示案之RNA核酸在核酸之一或多個或所有尿苷位置處包含假尿苷(ψ)取代且在核酸之一或多個或所有胞苷位置處包含5-甲基胞苷取代。
在一些實施例中,本揭示案之RNA核酸在核酸之一或多個或所有尿苷位置處包含尿苷。
在一些實施例中,核酸(例如RNA核酸,諸如mRNA核酸)對於特定修飾而言係均一修飾的(例如完全修飾、遍及整個序列經修飾)。舉例而言,核酸可經N1-甲基-假尿苷均一修飾,此意味著mRNA序列中之所有尿苷殘基均經N1-甲基-假尿苷置換。類似地,可藉由用經修飾之殘基(諸如上文所陳述之彼等殘基)進行置換對序列中所存在的任一類型之核苷殘基進行均一修飾。
本揭示案之核酸可沿著整個分子長度部分或完全地經修飾。舉例而言,本揭示案之核酸中或其預定序列區域中(例如包括或不包括聚A尾之mRNA中)之一或多個或全部或給定類型之核苷酸(例如嘌呤或嘧啶,或A、G、U、C中之任一或多者或全部)可經均一修飾。在一些實施例中,本揭示案之核酸(或其序列區域)中之所有核苷酸X均為經修飾之核苷酸,其中X可為核苷酸A、G、U、C中之任一者,或組合A+G、A+U、A+C、G+U、G+C、U+C、A+G+U、A+G+C、G+U+C或A+G+C中之任一者。
核酸可含有約1%至約100%的經修飾之核苷酸(相對於總核苷酸含量,或相對於一或多種類型之核苷酸,亦即A、G、U或C中之任一或多者)或任何介於中間之百分比(例如1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%及95%至100%)。應理解,任何剩餘百分比係歸因於存在未經修飾之A、G、U或C。
核酸可含有最低1%且最高100%的經修飾之核苷酸,或任何介於中間之百分比,諸如至少5%的經修飾之核苷酸、至少10%的經修飾之核苷酸、至少25%的經修飾之核苷酸、至少50%的經修飾之核苷酸、至少80%的經修飾之核苷酸或至少90%的經修飾之核苷酸。舉例而言,核酸可含有經修飾之嘧啶,諸如經修飾之尿嘧啶或胞嘧啶。在一些實施例中,核酸中至少5%、至少10%、至少25%、至少50%、至少80%、至少90%或100%之尿嘧啶由經修飾之尿嘧啶(例如5-經取代之尿嘧啶)置換。經修飾之尿嘧啶可由具有單一獨特結構之化合物置換,或可由具有不同結構(例如2、3、4或更多種獨特結構)之複數種化合物置換。在一些實施例中,核酸中至少5%、至少10%、至少25%、至少50%、至少80%、至少90%或100%之胞嘧啶由經修飾之胞嘧啶(例如5-取代之胞嘧啶)置換。經修飾之胞嘧啶可由具有單一獨特結構之化合物置換,或可由具有不同結構(例如2、3、4或更多種獨特結構)之複數種化合物置換。
11. 非轉譯區
非轉譯區(UTR)係多核苷酸中起始密碼子之前(5' UTR)及終止密碼子之後(3' UTR)不轉譯之核酸部分。在一些實施例中,包含編碼治療性多肽之開放閱讀框(ORF)的本揭示案之多核苷酸(例如核糖核酸(RNA),例如信使RNA (mRNA))進一步包含UTR (例如5' UTR或其功能片段、3' UTR或其功能片段或其組合)。
UTR (例如5' UTR或3' UTR)可與多核苷酸中之編碼區同源或異源。在一些實施例中,UTR與編碼治療性多肽之ORF同源。在一些實施例中,UTR與編碼治療性多肽之ORF異源。
在一些實施例中,多核苷酸包含兩個或更多個5' UTR或其功能片段,其各自具有相同或不同的核苷酸序列。在一些實施例中,多核苷酸包含兩個或更多個3' UTR或其功能片段,其各自具有相同或不同的核苷酸序列。
在一些實施例中,5' UTR或其功能片段、3' UTR或其功能片段或其任何組合經序列最佳化。
在一些實施例中,5'UTR或其功能片段、3' UTR或其功能片段或其任何組合包含至少一個化學修飾之核鹼基,例如N1-甲基假尿嘧啶或5-甲氧基尿嘧啶。
UTR可具有提供調控作用之特徵,例如增加或降低穩定性、定位及/或轉譯效率。可向細胞、組織或生物體投與包含UTR之多核苷酸,且可使用常規方法量測一或多種調控特徵。在一些實施例中,5' UTR或3' UTR之功能片段分別包含全長5'或3' UTR之一或多種調控特徵。
天然5' UTR攜帶有在轉譯起始中起作用之特徵。該等5'UTR含有如同Kozak序列之印記,眾所周知,該等序列參與核糖體起始許多基因轉譯之過程。Kozak序列具有共同的CCR(A/G)CCAUGG (SEQ ID NO: 5),其中R為起始密碼子(AUG)上游三個鹼基之嘌呤(腺嘌呤或鳥嘌呤),其後為另一『G』。亦已知5' UTR形成參與延伸因子結合之二級結構。
藉由對通常在特定靶器官之大量表現基因中發現之特徵進行工程化,可增強多核苷酸之穩定性及蛋白質產生。舉例而言,引入肝臟表現之mRNA之5' UTR (諸如白蛋白、血清澱粉樣蛋白A、脂蛋白元A/B/E、運鐵蛋白、α胎兒蛋白、促紅血球生成素或因子VIII)可增強肝細胞株或肝臟中多核苷酸之表現。同樣,可使用來自其他組織特異性mRNA之5'UTR來改良該組織中之表現:肌肉(例如MyoD、肌凝蛋白、肌紅蛋白、肌細胞生成素、力蛋白(Herculin))、內皮細胞(例如Tie-1、CD36)、骨髓樣細胞(例如C/EBP、AML1、G-CSF、GM-CSF、CD11b、MSR、Fr-1、i-NOS)、白血球(例如CD45、CD18)、脂肪組織(例如CD36、GLUT4、ACRP30、脂聯素)及肺上皮細胞(例如SP-A/B/C/D)。
在一些實施例中,UTR選自蛋白質共有共同功能、結構、特徵或性質之轉錄本家族。舉例而言,所編碼之多肽可屬於在特定細胞、組織或在發育期間之某一時間表現之蛋白質家族(亦即,共有至少一種功能、結構、特徵、定位、起源或表現模式)。可將來自任何基因或mRNA之UTR換成相同或不同蛋白質家族之任何其他UTR,以產生新的多核苷酸。
在一些實施例中,5' UTR及3' UTR可為異源的。在一些實施例中,5' UTR可源自與3' UTR不同之物種。在一些實施例中,3' UTR可源自與5' UTR不同之物種。
共同擁有之國際專利申請案第PCT/US2014/021522號(公開案第WO/2014/164253號,以全文引用的方式併入本文中)提供可在本揭示案之多核苷酸中用作ORF之側翼區之例示性UTR列表。
本申請案之其他例示性UTR包括(但不限於)一或多個源自以下之核酸序列之5'UTR及/或3'UTR:球蛋白,諸如α-球蛋白或β-球蛋白(例如爪蟾(
Xenopus)、小鼠、兔或人類球蛋白);強Kozak轉譯起始信號;CYBA (例如人類細胞色素b-245 α多肽);白蛋白(例如人類白蛋白7);HSD17B4 (羥基類固醇(17-β)去氫酶);病毒(例如煙草蝕紋病毒(TEV)、委內瑞拉馬腦炎病毒(Venezuelan equine encephalitis virus, VEEV)、登革病毒(Dengue virus)、巨細胞病毒(CMV) (例如CMV立即早期1 (IE1))、肝炎病毒(例如B型肝炎病毒)、辛得比斯病毒(sindbis virus)或PAV大麥黃矮病毒);熱休克蛋白(例如hsp70);轉譯起始因子(例如elF4G);葡萄糖轉運蛋白(例如hGLUT1 (人類葡萄糖轉運蛋白1));肌動蛋白(例如人類α或β肌動蛋白);GAPDH;微管蛋白;組織蛋白;檸檬酸循環酶;拓撲異構酶(例如缺少5' TOP模體之TOP基因之5'UTR (寡嘧啶束));核糖體蛋白大32 (L32);核糖體蛋白(例如人類或小鼠核糖體蛋白,諸如rps9);ATP合酶(例如ATP5A1或粒線體H
+-ATP合酶之β亞單元);生長激素(例如牛(bGH)或人類(hGH));延伸因子(例如延伸因子1 α1 (EEF1A1));錳超氧化物歧化酶(MnSOD);肌細胞增強因子2A (MEF2A);β-F1-ATP酶、肌酸激酶、肌紅蛋白、顆粒球群落刺激因子(G-CSF);膠原蛋白(例如膠原蛋白I型α2 (Col1A2)、膠原蛋白I型α1 (Col1A1)、膠原蛋白VI型α2 (Col6A2)、膠原蛋白VI型α1 (Col6A1));核糖體結合蛋白(例如核糖體結合蛋白I (RPNI));低密度脂蛋白受體相關蛋白(例如LRP1);心肌營養蛋白樣細胞介素因子(例如Nnt1);鈣網蛋白(Calr);原膠原-離胺酸、2-側氧基戊二酸5-雙加氧酶1 (Plod1);及核連蛋白(例如Nucb1)。
在一些實施例中,5' UTR選自由以下組成之群:β球蛋白5' UTR;含有強Kozak轉譯起始信號之5'UTR;細胞色素b-245 α多肽(CYBA) 5' UTR;羥基類固醇(17-β)去氫酶(HSD17B4) 5' UTR;煙草蝕紋病毒(TEV) 5' UTR;委內瑞拉馬腦炎病毒(TEEV) 5' UTR;編碼非結構蛋白質之德國麻疹病毒(RV) RNA之5'近端開放閱讀框;登革病毒(DEN) 5' UTR;熱休克蛋白70 (Hsp70) 5' UTR;eIF4G 5' UTR;GLUT1 5' UTR;其功能片段及其任何組合。
在一些實施例中,3' UTR選自由以下組成之群:β球蛋白3' UTR;CYBA 3' UTR;白蛋白3' UTR;生長激素(GH) 3' UTR;VEEV 3' UTR;B型肝炎病毒(HBV) 3' UTR;α-球蛋白3'UTR;DEN 3' UTR;PAV大麥黃矮病毒(BYDV-PAV) 3' UTR;延伸因子1 α1 (EEF1A1) 3' UTR;錳超氧化物歧化酶(MnSOD) 3' UTR;粒線體H(+)-ATP合酶之β亞單元(β-mRNA) 3' UTR;GLUT1 3' UTR;MEF2A 3' UTR;β-F1-ATP酶3' UTR;其功能片段及其組合。
可將源自任何基因或mRNA之野生型UTR併入至本揭示案之多核苷酸中。在一些實施例中,UTR相對於野生型或天然UTR可發生改變以產生變異體UTR,例如藉由改變UTR相對於ORF之定向或位置;或藉由納入額外核苷酸、使核苷酸缺失、使核苷酸交換或轉座。在一些實施例中,可使用5'或3' UTR之變異體,例如野生型UTR之突變體,或其中一或多個核苷酸添加至UTR之末端或自UTR之末端去除的變異體。
另外,一或多個合成UTR可與一或多個非合成UTR組合使用。例如,參見Mandal及Rossi,
Nat. Protoc.2013 8(3):568-82,其內容係以全文引用的方式併入本文中。
UTR或其部分可置於與其所選自之轉錄本相同之定向上,或可改變其定向或位置。因此,5'及/或3' UTR可倒置、縮短、延長或與一或多個其他5' UTR或3' UTR組合。
在一些實施例中,多核苷酸包含多個UTR,例如雙聯、三聯或四聯5' UTR或3' UTR。舉例而言,雙聯UTR包含相同UTR之串聯或實質上串聯之兩個拷貝。舉例而言,可使用雙聯β-球蛋白3'UTR (參見US2010/0129877,其內容係以全文引用的方式併入本文中)。
本揭示案之多核苷酸可包含特徵之組合。舉例而言,ORF之側翼可為包含強Kozak轉譯起始信號之5'UTR及/或包含用於模板化添加聚A尾之寡(dT)序列之3'UTR。5'UTR可包含來自相同及/或不同UTR之第一多核苷酸片段及第二多核苷酸片段(例如,參見US2010/0293625,其係以全文引用的方式併入本文中)。
其他非UTR序列可用作本揭示案之多核苷酸內的區域或亞區域。舉例而言,可將內含子或內含子序列之部分併入至本揭示案之多核苷酸中。併入內含子序列可增加蛋白質產生以及多核苷酸表現水準。在一些實施例中,本揭示案之多核苷酸包含內部核糖體進入位點(IRES)而非UTR,或除UTR以外亦包含IRES (例如,參見Yakubov等人,
Biochem. Biophys. Res. Commun.2010 394(1):189-193,其內容係以全文引用的方式併入本文中)。在一些實施例中,多核苷酸包含IRES而非5' UTR序列。在一些實施例中,多核苷酸包含ORF及病毒衣殼序列。在一些實施例中,多核苷酸包含合成5' UTR與非合成3' UTR之組合。
在一些實施例中,UTR亦可包括至少一個轉譯增強子多核苷酸、一或多個轉譯增強子元件(統稱為「TEE」,其係指增加自多核苷酸產生之多肽或蛋白質之量的核酸序列)。作為非限制性實例,TEE可位於轉錄啟動子與起始密碼子之間。在一些實施例中,5' UTR包含TEE。
在一個態樣中,TEE為UTR中之保守元件,其可促進核酸之轉譯活性,諸如(但不限於)帽依賴性或帽非依賴性轉譯。
a. 5' UTR 序列
5' UTR序列對於核糖體募集至mRNA係重要的,且已報導其在轉譯中起作用(Hinnebusch A等人,(2016)
Science, 352:6292: 1413-6)。
本文尤其揭示多核苷酸,例如mRNA,其包含編碼治療性多肽之開放閱讀框,該多核苷酸具有5' UTR,該5' UTR賦予由該多核苷酸編碼之多肽或該多核苷酸自身延長之半衰期、增加之表現及/或增加之活性。在一些實施例中,本文所揭示之多核苷酸包含:(a) 5'-UTR (例如如
表 7中所提供或其變異體或片段);(b)包含終止元件之編碼區(例如如本文所闡述);及(c) 3'-UTR (例如如本文所闡述),以及包含該多核苷酸之LNP組合物。在一些實施例中,多核苷酸包含5'-UTR,該5'-UTR包含
表 7中所提供之序列或其變異體或片段(例如其功能變異體或片段)。
在一些實施例中,具有
表 7中所提供之5' UTR序列或其變異體或片段之多核苷酸具有延長之多核苷酸半衰期,例如多核苷酸之半衰期延長至約1.5-20倍。在一些實施例中,半衰期延長至約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍或20倍或更多倍。在一些實施例中,半衰期延長至約1.5倍或更多倍。在一些實施例中,半衰期延長至約2倍或更多倍。在一些實施例中,半衰期延長至約3倍或更多倍。在一些實施例中,半衰期延長至約4倍或更多倍。在一些實施例中,半衰期延長至約5倍或更多倍。
在一些實施例中,具有
表 7中所提供之5' UTR序列或其變異體或片段之多核苷酸使得由該多核苷酸編碼之多肽之水準及/或活性(例如產量)增加。在一些實施例中,5'UTR使得由多核苷酸編碼之多肽之水準及/或活性(例如產量)增加至約1.5-20倍。在一些實施例中,水準及/或活性增加至約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍或20倍或更多倍。在一些實施例中,水準及/或活性增加至約1.5倍或更多倍。在一些實施例中,水準及/或活性增加至約2倍或更多倍。在一些實施例中,水準及/或活性增加至約3倍或更多倍。在一些實施例中,水準及/或活性增加至約4倍或更多倍。在一些實施例中,水準及/或活性增加至約5倍或更多倍。
在一些實施例中,將增加與不具有5' UTR、具有不同5' UTR或不具有
表 7中所闡述之5' UTR或其變異體或片段的在其他方面類似之多核苷酸進行比較。
在一些實施例中,根據量測多核苷酸之半衰期之分析來量測多核苷酸半衰期之延長。
在一些實施例中,根據量測多肽水準及/或活性之分析來量測由多核苷酸編碼之多肽的水準及/或活性(例如產量)之增加。
在一些實施例中,5' UTR包含
表 7中所提供之序列或與
表 7中所提供之5' UTR序列或其變異體或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 6、SEQ ID NO: 7、SEQ ID NO: 8、SEQ ID NO: 9、SEQ ID NO: 10、SEQ ID NO: 11、SEQ ID NO: 12、SEQ ID NO: 13、SEQ ID NO: 14或SEQ ID NO: 34具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。
在一些實施例中,5' UTR包含與SEQ ID NO: 6具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 7具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 8具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 9具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 10具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 11具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 12具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 13具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 14具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,5' UTR包含與SEQ ID NO: 34具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。
在一些實施例中,5' UTR包含SEQ ID NO: 6之序列。在一些實施例中,5' UTR係由SEQ ID NO: 6之序列組成。在一些實施例中,5' UTR包含SEQ ID NO: 11之序列。在一些實施例中,5' UTR係由SEQ ID NO: 11之序列組成。在一些實施例中,5' UTR包含SEQ ID NO: 12之序列。在一些實施例中,5' UTR係由SEQ ID NO: 12之序列組成。在一些實施例中,5' UTR包含SEQ ID NO: 34之序列。在一些實施例中,5' UTR係由SEQ ID NO: 34之序列組成。
在一些實施例中,
表 7中所提供之5' UTR序列具有為A之第一核苷酸(未顯示)。在一些實施例中,
表 7中所提供之5' UTR序列具有為G之第一核苷酸(未顯示)。
表 7. 例示性 5' UTR 序列
SEQ ID NO: | 序列名稱 | 序列 |
6 | A1 | GGAAAUCGCAAAAUUUGCUCUUCGCGUUAGAUUUCUUUUAGUUUUCUCGCAACUAGCAAGCUUUUUGUUCUCGCC |
7 | A5 | GGAAAUCCCCACAACCGCCUCAUAUCCAGGCUCAAGAAUAGAGCUCAGUGUUUUGUUGUUUAAUCAUUCCGACGUGUUUUGCGAUAUUCGCGCAAAGCAGCCAGUCGCGCGCUUGCUUUUAAGUAGAGUUGUUUUUCCACCCGUUUGCCAGGCAUCUUUAAUUUAACAUAUUUUUAUUUUUCAGGCUAACCUACGCCGCCACC |
8 | A6 | GGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAUCUCCCUGAGCUUCAGGGAGCCCCGGCGCCGCCACC |
9 | A7 | GGAAACCCCCCACCCCCGUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAUCUCCCUGAGCUUCAGGGAGCCCCGGCGCCGCCACC |
10 | A8 | GGAGAACUUCCGCUUCCGUUGGCGCAAGCGCUUUCAUUUUUUCUGCUACCGUGACUAAG |
11 | A9 | GGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAGCCACC |
12 | A11 (參考) | GGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGA CCCCGGCGCCGCCACC |
13 | A2 | GGAAAUCGCAAAAUUUGCUCUUCGCGUUAGAUUUCUUUUAGUUUUCUCGCAACUAGCAAGCUUUUUGUUCUCGCCGCCGCC |
14 | A3 | GGAAAUCGCAAAAUUUUCUUUUCGCGUUAGAUUUCUUUUAGUUUUCUUUCAACUAGCAAGCUUUUUGUUCUCGCCGCCGCC |
15 | A4 | G G A A A U C G C A A A A (N 2) X(N 3) XC U (N 4) X(N 5) XC G C G U U A G A U U U C U U U U A G U U U U C U N 6N 7C A A C U A G C A A G C U U U U U G U U C U C G C C (N 8C C)x (N 2) x為尿嘧啶且x為0至5之整數,例如,其中x=3或4; (N 3) x為鳥嘌呤且x為0至1之整數; (N 4) x為胞嘧啶且x為0至1之整數; (N 5) x為尿嘧啶且x為0至5之整數,例如,其中x=2或3; N 6為尿嘧啶或胞嘧啶; N 7為尿嘧啶或鳥嘌呤; N 8為腺嘌呤或鳥嘌呤且x為0至1之整數。 |
16 | A27 | GGAAAAUUUUAGCCUGGAACGUUAGAUAACUGUCCUGUUGUCUUUAUAUACUUGGUCCCCAAGUAGUUUGUCUUCCAAA |
17 | A12 | GGAAACUUUAUUUAGUGUUACUUUAUUUUCUGUUUAUUUGUGUUUCUUCAGUGGGUUUGUUCUAAUUUCCUUGGCCGCC |
18 | A13 | GGAAAAUCUGUAUUAGGUUGGCGUGUUCUUUGGUCGGUUGUUAGUAUUGUUGUUGAUUCGUUUGUGGUCGGUUGCCGCC |
19 | A14 | GGAAAAUUAUUAACAUCUUGGUAUUCUCGAUAACCAUUCGUUGGAUUUUAUUGUAUUCGUAGUUUGGGUUCCUGCCGCC |
20 | A15 | GGAAAUUAUUAUUAUUUCUAGCUACAAUUUAUCAUUGUAUUAUUUUAGCUAUUCAUCAUUAUUUACUUGGUGAUCAACA |
21 | A16 | GGAAAUAGGUUGUUAACCAAGUUCAAGCCUAAUAAGCUUGGAUUCUGGUGACUUGCUUCACCGUUGGCGGGCACCGAUC |
22 | A17 | GGAAAUCGUAGAGAGUCGUACUUAGUACAUAUCGACUAUCGGUGGACACCAUCAAGAUUAUAAACCAGGCCAGA |
23 | A18 | GGAAACCCGCCCAAGCGACCCCAACAUAUCAGCAGUUGCCCAAUCCCAACUCCCAACACAAUCCCCAAGCAACGCCGCC |
24 | A19 | GGAAAGCGAUUGAAGGCGUCUUUUCAACUACUCGAUUAAGGUUGGGUAUCGUCGUGGGACUUGGAAAUUUGUUGUUUCC |
25 | A20 | GGAAACUAAUCGAAAUAAAAGAGCCCCGUACUCUUUUAUUUCUAUUAGGUUAGGAGCCUUAGCAUUUGUAUCUUAGGUA |
26 | A21 | GGAAAUGUGAUUUCCAGCAACUUCUUUUGAAUAUAUUGAAUUCCUAAUUCAAAGCGAACAAAUCUACAAGCCAUAUACC |
27 | A22 | GGAAAUCGUAGAGAGUCGUACUUACGUGGUCGCCAUUGCAUAGCGCGCGAAAGCAACAGGAACAAGAACGCGCC |
28 | A23 | GGAAAUCGUAGAGAGUCGUACUUAGAAUAAACAGAGUCGGGUCGACUUGUCUCUGAUACUACGACGUCACAAUC |
29 | A24 | GGAAAAUUUGCCUUCGGAGUUGCGUAUCCUGAACUGCCCAGCCUCCUGAUAUACAACUGUUCCGCUUAUUCGGGCCGCC |
30 | A25 | GGAAAUCUGAGCAGGAAUCCUUUGUGCAUUGAAGACUUUAGAUUCCUCUCUGCGGUAGACGUGCACUUAUAAGUAUUUG |
31 | A26 | GGAAAGCGAUUGAAGGCGUCUUUUCAACUACUCGAUUAAGGUUGGGUAUCGUCGUGGGACUUGGAAAUUUGUUGCCACC |
32 | A28 | GGAAAUUUUUUUUUGAUAUUAUAAGAGUUUUUUUUUGAUAUUAAGAAAAUUUUUUUUUGAUAUUAGAAGAGUAAGAAGAAAUAUAAGACCCCGGCGCCGCCACC |
33 | A29 | GGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAGCCAAAAAAAAAAAACC |
34 | A30 | GGAAAUCUCCCUGAGCUUCAGGGAGUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGACCCCGGCGCCGCCACC |
35 | A31 | GCCRCC,其中R= A或G |
在一些實施例中,5' UTR包含SEQ ID NO: 6之變異體。在一些實施例中,SEQ ID NO: 6之變異體包含式A之核酸序列:
G G A A A U C G C A A A A (N
2)
X(N
3)
XC U (N
4)
X(N
5)
XC G C G U U A G A U U U C U U U U A G U U U U C U N
6N
7C A A C U A G C A A G C U U U U U G U U C U C G C C (N
8C C)x (SEQ ID NO: 15),
其中:
(N
2)
x為尿嘧啶且x為0至5之整數,例如,其中x=3或4;
(N
3)
x為鳥嘌呤且x為0至1之整數;
(N
4)
x為胞嘧啶且x為0至1之整數;
(N
5)
x為尿嘧啶且x為0至5之整數,例如,其中x=2或3;
N
6為尿嘧啶或胞嘧啶;
N
7為尿嘧啶或鳥嘌呤;
N
8為腺嘌呤或鳥嘌呤且x為0至1之整數。
在一些實施例中,(N
2)
x為尿嘧啶且x為0。在一些實施例中,(N
2)
x為尿嘧啶且x為1。在一些實施例中,(N
2)
x為尿嘧啶且x為2。在一些實施例中,(N
2)
x為尿嘧啶且x為3。在一些實施例中,(N
2)
x為尿嘧啶且x為4。在一些實施例中,(N
2)
x為尿嘧啶且x為5。
在一些實施例中,(N
3)
x為鳥嘌呤且x為0。在一些實施例中,(N
3)
x為鳥嘌呤且x為1。
在一些實施例中,(N
4)
x為胞嘧啶且x為0。在一些實施例中,(N
4)
x為胞嘧啶且x為1。
在一些實施例中,(N
5)
x為尿嘧啶且x為0。在一些實施例中,(N
5)
x為尿嘧啶且x為1。在一些實施例中,(N
5)
x為尿嘧啶且x為2。在一些實施例中,(N
5)
x為尿嘧啶且x為3。在一些實施例中,(N
5)
x為尿嘧啶且x為4。在一些實施例中(N
5)
x為尿嘧啶且x為5。
在一些實施例中,N6為尿嘧啶。在一些實施例中,N6為胞嘧啶。
在一些實施例中,N7為尿嘧啶。在一些實施例中,N7為鳥嘌呤。
在一些實施例中,N8為腺嘌呤且x為0。在一些實施例中,N8為腺嘌呤且x為1。
在一些實施例中,N8為鳥嘌呤且x為0。在一些實施例中,N8為鳥嘌呤且x為1。
在一些實施例中,5' UTR包含SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少50%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少60%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少70%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少80%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少90%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少95%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少96%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少97%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少98%一致性之序列。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含與SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34具有至少99%一致性之序列。
在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少5%、10%、20%、30%、40%、50%、60%、70%或80%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少5%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少10%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少20%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少30%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少40%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少50%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少60%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少70%之尿苷含量。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少80%之尿苷含量。
在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含至少2、3、4、5、6或7個連續尿苷(例如聚尿苷束)。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體中之聚尿苷束包含至少1-7、2-7、3-7、4-7、5-7、6-7、1-6、1-5、1-4、1-3、1-2、2-6或3-5個連續尿苷。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體中之聚尿苷束包含4個連續尿苷。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體中之聚尿苷束包含5個連續尿苷。
在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含1、2、3、4、5、6、7、8、9、10、11、12、13、14或15個聚尿苷束。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含3個聚尿苷束。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含4個聚尿苷束。在一些實施例中,SEQ ID NO: 6、SEQ ID NO: 11、SEQ ID NO: 12或SEQ ID NO: 34之變異體包含5個聚尿苷束。
在一些實施例中,一或多個聚尿苷束與不同的聚尿苷束毗鄰。在一些實施例中,每一(例如所有)聚尿苷束彼此毗鄰,例如所有聚尿苷束均係鄰接的。
在一些實施例中,一或多個聚尿苷束由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60個核苷酸隔開。在一些實施例中,每一(例如全部)聚尿苷束由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60個核苷酸隔開。
在一些實施例中,第一聚尿苷束與第二聚尿苷束彼此毗鄰。
在一些實施例中,隨後的(例如第三、第四、第五、第六或第七、第八、第九或第十個)聚尿苷束與第一聚尿苷束、第二聚尿苷束或隨後聚尿苷束中之任一者相隔1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60個核苷酸。
在一些實施例中,第一聚尿苷束與隨後之聚尿苷束(例如第二、第三、第四、第五、第六或第七、第八、第九或第十個聚尿苷束)相隔1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60個核苷酸。在一些實施例中,隨後之聚尿苷束中之一或多者與不同的聚尿苷束毗鄰。
在一些實施例中,5' UTR包含Kozak序列,例如GCCRCC核苷酸序列(SEQ ID NO: 35),其中R為腺嘌呤或鳥嘌呤。在一些實施例中,Kozak序列佈置在5'UTR序列之3'端。
在一態樣中,將包含編碼治療性多肽之開放閱讀框且包含本文所揭示之5' UTR序列之多核苷酸(例如mRNA)調配為LNP。在一些實施例中,LNP組合物包含:(i)可電離脂質,例如胺基脂質;(ii)固醇或其他結構脂質;(iii)非陽離子輔助脂質或磷脂;及(iv) PEG-脂質。
在另一態樣中,包含本文所揭示之編碼治療性多肽(例如如本文所闡述)之多核苷酸的LNP組合物可與額外劑(例如如本文所闡述)一起投與。
b. 3' UTR 序列
已顯示3'UTR序列影響mRNA之轉譯、半衰期及亞細胞定位(Mayr C.,
Cold Spring Harb. Persp. Biol.2019年10月1日;11(10):a034728)。
本文尤其揭示多核苷酸,例如mRNA,其包含編碼治療性多肽之開放閱讀框,該多核苷酸具有3' UTR,該3' UTR賦予由該多核苷酸編碼之多肽或該多核苷酸自身延長之半衰期、增加之表現及/或增加之活性。本文所揭示之多核苷酸可包含:(a) 5'-UTR (例如如本文所闡述);(b)包含終止元件之編碼區(例如如本文所闡述);及(c) 3'-UTR (例如如
表 8中所提供或其變異體或片段),及包含該多核苷酸之LNP組合物。在一些實施例中,多核苷酸包含3'-UTR,其包含
表 8中所提供之序列或其變異體或片段。
在一些實施例中,具有
表 8中所提供之3' UTR序列或其變異體或片段之多核苷酸使得多核苷酸之半衰期延長,例如多核苷酸之半衰期延長至約1.5-10倍。在一些實施例中,半衰期延長至約1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍或更多倍。在一些實施例中,半衰期延長至約1.5倍或更多倍。在一些實施例中,半衰期延長至約2倍或更多倍。在一些實施例中,半衰期延長至約3倍或更多倍。在一些實施例中,半衰期延長至約4倍或更多倍。在一些實施例中,半衰期延長至約5倍或更多倍。在一些實施例中,半衰期延長至約6倍或更多倍。在一些實施例中,半衰期延長至約7倍或更多倍。在一些實施例中,半衰期延長至約8倍。在一些實施例中,半衰期延長至約9倍或更多倍。在一些實施例中,半衰期延長至約10倍或更多倍。
在一些實施例中,具有
表 8中所提供之3' UTR序列或其變異體或片段之多核苷酸產生平均半衰期評分大於10之多核苷酸。
在一些實施例中,具有
表 8中所提供之3' UTR序列或其變異體或片段之多核苷酸使得由該多核苷酸編碼之多肽之水準及/或活性(例如產量)增加。
在一些實施例中,將增加與不具有3' UTR、具有不同3' UTR或不具有
表 8之3' UTR或其變異體或片段的在其他方面類似之多核苷酸進行比較。
在一些實施例中,多核苷酸包含
表 8中所提供之3' UTR序列或與
表 8中所提供之3' UTR序列或其片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含與SEQ ID NO: 36、SEQ ID NO: 37、SEQ ID NO: 38、SEQ ID NO: 39、SEQ ID NO: 40、SEQ ID NO: 41、SEQ ID NO: 42、SEQ ID NO: 43、SEQ ID NO: 44、SEQ ID NO: 45、SEQ ID NO: 46、SEQ ID NO: 47、SEQ ID NO: 48、SEQ ID NO: 49、SEQ ID NO: 50、SEQ ID NO: 51、SEQ ID NO: 61、SEQ ID NO: 62及SEQ ID NO: 63具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。
在一些實施例中,3' UTR包含SEQ ID NO: 36之序列,或與SEQ ID NO: 36具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 37之序列,或與SEQ ID NO: 37具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 38之序列,或與SEQ ID NO: 38具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 39之序列,或與SEQ ID NO: 39具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 40之序列,或與SEQ ID NO: 40具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 41之序列,或與SEQ ID NO: 41具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 42之序列,或與SEQ ID NO: 42具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 43之序列,或與SEQ ID NO: 43具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 44之序列,或與SEQ ID NO: 44具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 45之序列,或與SEQ ID NO: 45具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 46之序列,或與SEQ ID NO: 46具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 47之序列,或與SEQ ID NO: 47具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 48之序列,或與SEQ ID NO: 48具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 49之序列,或與SEQ ID NO: 49具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 50之序列,或與SEQ ID NO: 50具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 51之序列,或與SEQ ID NO: 51具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 61之序列,或與SEQ ID NO: 61具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 62之序列,或與SEQ ID NO: 62具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,3' UTR包含SEQ ID NO: 63之序列,或與SEQ ID NO: 63具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。
表 8. 例示性 3' UTR 序列
SEQ ID NO | 序列資訊 | 序列 |
36 | B1 | UAAUAGUAAGCUGGAGCCUCCUGAGAGACCUGUGUGAACUAUUGAGAAGAUCGGAACAGCUCCUUACUCUGAGGAAGUUGGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
37 | B3 | UAAUAGUAAGCUGGAGCCUCACUCUCCUCUCCAUCCCGUAUCCAGGCUGUGAAUUUUUCAAGGAAUAUAAAGAUCGGGAUGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
38 | B4 | UGAUAGUAAGCUGGAGCCUCUAGUGACGGCAACAGGGCUUGGUUUUUCCUUGUUGUGAAAUCGACAUCUCUGAAGACAGGGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
39 | B5 | UGAUAGUAAGCUGGAGCCUCCUUCCAUCUAGUCACAAAGACUCCUUCGUCCCCAGUUGCCGUCUAGGAUUGGGCCUCCCAGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
40 | B6 | UGAUAGUAAGCUGGAGCCUCCCAUAACAUGACAUAUCUGGAUUUUGUGCUUAGAACCUUAAAUUGGAAGCAUUCUUAAUUGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
41 | B7 | UAAUAGUAAGCUGGAGCCUCCGGAAAACUAAAAUAGAGAUAUUUCAAGAUUUUAUAAUUUUCAAAGACCUUUGAAAUAUUGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
42 | B8 | UAAUAGUAAGCUGGAGCCUCUACACAUUGCUUCUAGUUGGCAGAAAUAAUUGAUUAAAAGACCAGAAACUGUGAUAACUGGUACCCCCGUGGUCUUUAAAUAAAGUCUAAGUGGGCGGC |
43 | B9 | UGAUAAUAGGCUGGAGCCUCGGUGGCCAUGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
44 | B10 | UGAUAAUAGGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
45 | B11 | UGAUAAUAGGCUGGAGCCUCGGUGGCCAUGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCCAAACACCAUUGUCACACUCCAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
46 | B12 | UGAUAAUAGGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCCAAACACCAUUGUCACACUCCAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
47 | B13 | UGAUAAUAGGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCC UCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
48 | B14 | UGAUAAUAGGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCCGCAUUAUUACUCACGGUACGAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
49 | B15 | UGAUAAUAG UCCAUAAAGUAGGAAACACUACAGCUGGAGCCUCGGUGGCCAUGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCC CGCAUUAUUACUCACGGUACGAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
50 | B16 | UGAUAAUAG UCCAUAAAGUAGGAAACACUACAGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCC UCCAUAAAGUAGGAAACACUACAUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCC UCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
51 | B2 | CUGAGAGACCUGUGUGAACUAUUGAGAAGAUCGGAACAGCUCCUUACUCUGAGGAAGUUG |
52 | B17 | UGAUAAUAGGCUGGAGCCUCUCACACACCUCUGCCCCUUGGGCCUCCCACUCCCAUGGCUCUGGGCGGUCCAGAAGGAGCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
53 | B18 | UGAUAAUAGGCUGGAGCCUCCACCGCGUUAUCCGUUCCUCGUAGGCUGGUCCUGGGGAACGGGUCGGCGGGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
54 | B19 | UGAUAAUAGGCUGGAGCCUCUGCCCGGCAACGGCCAGGUCUGUGCCAAGUGUUUGCUGACGCAACCCCCACUGGCUGGGGCUUGGUCAUGGGCCAUCAGCGCGUGCGUGGAACCUUUUCGGCUCCUCUGCCGAUCCAUACUGCGGAACUCCUAGCCGCUUGUUUUGCUCGCAGCAGGUCUGGAGCAAACAUUAUCGGGACUGAUAACUCUGUUGUCCUGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
55 | B20 | UGAUAAUAGGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCUUUUUUUUUUUUUUUUUUUCUUCUUUUCUUUUUUUUCUUUUUUUUUUUUCUUUCUUUUUUUCUUUUUUUUUCUUUUCUUUUUUCUUUUUUUUUUUUUUUUCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
56 | B21 | UGAUAAUAGGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
57 | B22 | UAAGUCUCCAUAAAGUAGGAAACACUACAGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCAUAAAGUAGGAAACACUACAUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCUCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
58 | B23 | UAAAGCGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCUCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
59 | B24 | UAAAGCUCCCCGGGGUCCAUAAAGUAGGAAACACUACAGCUGGAGCCUCCUGAGAGACCUGUGUGAACUAUUGAGAAGAUCGGAACAGCUCCUUACUCUGAGGAAGUUGUCCAUAAAGUAGGAAACACUACAGUACCCCCUCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
60 | B25 | UAAUAGUAAACCUCACUCACGGCCACAUUGAGUGCCAGGCUCCGGGCUGGUUUAUAGUAGUGUAGAGCAUUGCAGCACUUAGACUGGGGUGCUGUAGUCUUUAUUGUAGUCUUUCCACAUACCUGAUAAUUCUUAGAUAAUUUCUUAUUUUAAUUCCAUAAAGUAGGAAACACUACAUAAAUCUCCAUAAAGUAGGAAACACUACAUAUUCUUCCAUAAAGUAGGAAACACUACAUAGGCU |
61 | B26 | UAAUAGUAAACCUCACUCACGGCCACAUUGAGUGCCAGGCUCCGGGCUGGUUUAUAGUAGUGUAGAGCAUUGCAGCACUUAGACUGGGGUGCUGUAGUCUUUAUUGUAGUCUUUCCACAUACCUGAUAAUUCUUAGAUAAUUUCUUAUUUUAAUUAAAUCUAUUCUUAGGCU |
62 | B27 | UAAAGCUAAGCUGGAGCCUCCUGAGAGACCUGUGUGAACUAUUGAGAAGAUCGGAACAGCUCCUUACUCUGAGGAAGUUGGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
63 | B28 | UAAAGCUAAACCUCACUCACGGCCACAUUGAGUGCCAGGCUCCGGGCUGGUUUAUAGUAGUGUAGAGCAUUGCAGCACUUAGACUGGGGUGCUGUAGUCUUUAUUGUAGUCUUUCCACAUACCUGAUAAUUCUUAGAUAAUUUCUUAUUUUAAUUAAAUCUAUUCUUAGGCU |
在一些實施例中,3' UTR包含例如如本文所闡述之微小RNA (miRNA)結合位點,其結合至人類細胞中所存在之miR。在一些實施例中,3' UTR包含SEQ ID NO: 64、SEQ ID NO: 65、SEQ ID NO: 66或其組合之miRNA結合位點。在一些實施例中,3' UTR包含複數個miRNA結合位點(例如2、3、4、5、6、7或8個miRNA結合位點)。在一些實施例中,該複數個miRNA結合位點包含相同或不同的miRNA結合位點。
miR122 bs = CAAACACCAUUGUCACACUCCA (SEQ ID NO: 64)
miR-142-3p bs = UCCAUAAAGUAGGAAACACUACA (SEQ ID NO: 65)
miR-126 bs = CGCAUUAUUACUCACGGUACGA (SEQ ID NO: 66)
在一態樣中,本文揭示編碼多肽之多核苷酸,其中該多核苷酸包含:(a) 5'-UTR,例如如本文所闡述;(b)包含終止元件之編碼區(例如如本文所闡述);及(c) 3'-UTR (例如如本文所闡述)。
在一態樣中,包含含有編碼治療性多肽之開放閱讀框且含有本文所揭示之3' UTR之多核苷酸的LNP組合物包含:(i)可電離脂質,例如胺基脂質;(ii)固醇或其他結構脂質;(iii)非陽離子輔助脂質或磷脂;及(iv) PEG-脂質。
12. 微小 RNA 結合位點
本揭示案之多核苷酸可包括調控元件,例如微小RNA (miRNA)結合位點、轉錄因子結合位點、結構化mRNA序列及/或模體、經工程化以用作內源性核酸結合分子之假受體之人工結合位點及其組合。在一些實施例中,包括此等調控元件之多核苷酸稱為包括「感測序列」。
在一些實施例中,本揭示案之多核苷酸(例如核糖核酸(RNA),例如信使RNA (mRNA))包含編碼所關注多肽之開放閱讀框(ORF),且進一步包含一或多個miRNA結合位點。基於天然miRNA之組織特異性及/或細胞類型特異性表現,納入或併入miRNA結合位點提供對本揭示案之多核苷酸、且進而對其所編碼多肽之調控。
本揭示案亦提供醫藥組合物及調配物,其包含上文所闡述之任一多核苷酸。在一些實施例中,組合物或調配物進一步包含遞送劑。
在一些實施例中,組合物或調配物可含有多核苷酸,該多核苷酸包含本文所揭示之編碼多肽之序列最佳化核酸序列。在一些實施例中,組合物或調配物可含有多核苷酸(例如RNA,例如mRNA),該多核苷酸包含與本文所揭示之編碼多肽之序列最佳化核酸序列具有顯著序列一致性之多核苷酸(例如ORF)。在一些實施例中,多核苷酸進一步包含miRNA結合位點,例如結合至以下之miRNA結合位點:miR-126、miR-142、miR-144、miR-146、miR-150、miR-155、miR-16、miR-21、miR-223、miR-24、miR-27及miR-26a。
miRNA (例如天然miRNA)係一種19-25個核苷酸長之非編碼RNA,其結合至多核苷酸且藉由降低多核苷酸之穩定性或藉由抑制其轉譯而下調基因表現。miRNA序列包含「種子」區域,亦即成熟miRNA之2-8位區域中之序列。miRNA種子可包含成熟miRNA之2-8位或2-7位。
微小RNA酶促衍生自RNA轉錄本之區域,該等RNA轉錄本之區域自身摺疊形成通常稱為前miRNA (前體miRNA)之短髮夾結構。前miRNA在其3'端通常具有雙核苷酸懸突,且具有3'羥基及5'磷酸酯基。此前體mRNA在細胞核中加工且隨後轉運至細胞質,在細胞質中其由DICER (RNA酶III)進一步加工,以形成大約22個核苷酸之成熟微小RNA。接著成熟微小RNA併入至核糖核酸顆粒中,以形成RNA誘導之沈默複合體RISC,其介導基因沈默。此項技術所公認之對成熟miRNA之命名通常指定成熟miRNA所源自的前miRNA之臂;「5p」意指微小RNA來自前miRNA髮夾之5’臂,且「3p」意指微小RNA來自前miRNA髮夾之3’端。本文中以數字提及之miR可指來源於相同前miRNA之相對臂之兩種成熟微小RNA中之任一者(例如3p或5p微小RNA)。除非3p或5p命名特別指定,否則本文所提及之所有miR均意欲包括3p及5p臂/序列二者。
如本文所用,術語「微小RNA (miRNA或miR)結合位點」係指多核苷酸內之序列,例如DNA內或RNA轉錄本內之序列,包括5'UTR及/或3'UTR中之序列,其與miRNA之全部或miRNA之一個區域具有足夠互補性,以與該miRNA相互作用、締合或結合。在一些實施例中,本揭示案之多核苷酸包含編碼所關注多肽之ORF,且進一步包含一或多個miRNA結合位點。在例示性實施例中,多核苷酸(例如核糖核酸(RNA),例如信使RNA (mRNA))之5' UTR及/或3' UTR包含一或多個miRNA結合位點。
miRNA結合位點與miRNA具有足夠互補性係指足以促進miRNA介導之多核苷酸調控之互補程度,例如miRNA介導之多核苷酸之轉譯抑制或降解。在本揭示案之例示性態樣中,與miRNA具有足夠互補性之miRNA結合位點係指足以促進miRNA介導之多核苷酸降解之互補性程度,例如miRNA引導之RNA誘導沈默複合體(RISC)介導之mRNA裂解。miRNA結合位點可與例如19-25個核苷酸長之miRNA序列、與19-23個核苷酸長之miRNA序列或與22個核苷酸長之miRNA序列具有互補性。miRNA結合位點可僅與miRNA之一部分互補,例如與全長天然miRNA序列之小於1、2、3或4個核苷酸之部分互補,或與短於天然miRNA序列之小於1、2、3或4個核苷酸之部分互補。當所期望之調控為mRNA降解時,全互補性或完全互補性(例如在全部天然miRNA長度或其重要部分上之全互補性或完全互補性)較佳。
在一些實施例中,miRNA結合位點包括與miRNA種子序列具有互補性(例如部分或完全互補性)之序列。在一些實施例中,miRNA結合位點包括與miRNA種子序列具有完全互補性之序列。在一些實施例中,miRNA結合位點包括與miRNA序列具有互補性(例如部分或完全互補性)之序列。在一些實施例中,miRNA結合位點包括與miRNA序列具有完全互補性之序列。在其他實施例中,序列不完全互補。在一些實施例中,miRNA結合位點與miRNA序列具有完全互補性,但具有1、2或3個核苷酸取代、末端添加及/或截短。
在一些實施例中,miRNA結合位點與相應miRNA之長度相同。在其他實施例中,miRNA結合位點較5'末端、3'末端或兩者處之相應miRNA短一個、兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個或十二個核苷酸。在其他實施例中,微小RNA結合位點較5'末端、3'末端或兩者處之相應微小RNA短兩個核苷酸。較相應miRNA短之miRNA結合位點仍能降解併入一或多個miRNA結合位點之mRNA或防止該mRNA轉譯。
在一些實施例中,miRNA結合位點結合作為含有Dicer之活性RISC之一部分的相應成熟miRNA。在一些實施例中,miRNA結合位點與RISC中相應miRNA之結合降解含有miRNA結合位點之mRNA或防止該mRNA轉譯。在一些實施例中,miRNA結合位點與miRNA具有足夠的互補性,使得包含miRNA之RISC複合物裂解包含miRNA結合位點之多核苷酸。在其他實施例中,miRNA結合位點具有不完全互補性,使得包含miRNA之RISC複合物誘導包含miRNA結合位點之多核苷酸之不穩定性。在一些實施例中,miRNA結合位點具有不完全互補性,使得包含miRNA之RISC複合物抑制包含miRNA結合位點之多核苷酸之轉錄。
在一些實施例中,miRNA結合位點與相應miRNA具有一個、兩個、三個、四個、五個、六個、七個、八個、九個、十個、十一個或十二個錯配。
在一些實施例中,miRNA結合位點與相應miRNA之至少約十個、至少約十一個、至少約十二個、至少約十三個、至少約十四個、至少約十五個、至少約十六個、至少約十七個、至少約十八個、至少約十九個、至少約二十個或至少約二十一個鄰接核苷酸分別具有至少約十個、至少約十一個、至少約十二個、至少約十三個、至少約十四個、至少約十五個、至少約十六個、至少約十七個、至少約十八個、至少約十九個、至少約二十個或至少約二十一個互補之鄰接核苷酸。
藉由將一或多個miRNA結合位點工程化至本揭示案之多核苷酸中,可靶向該多核苷酸以進行降解或降低轉譯,前提條件為可獲得所討論之miRNA。此可減少多核苷酸遞送時之脫靶效應。舉例而言,若本揭示案之多核苷酸不意欲遞送至組織或細胞,但最終到達該組織或細胞,則若將miRNA之一或多個結合位點工程化至多核苷酸之5' UTR及/或3' UTR中,則該組織或細胞中所富含之miRNA可抑制所關注基因之表現。因此,在一些實施例中,將一或多個miRNA結合位點併入至本揭示案之mRNA中可降低核酸分子遞送時之脫靶效應危害及/或使得能夠組織特異性調控由該mRNA編碼之多肽之表現。在其他實施例中,將一或多個miRNA結合位點併入至本揭示案之mRNA中可調節活體內核酸遞送時之免疫反應。在其他實施例中,將一或多個miRNA結合位點併入至本揭示案之mRNA中可調節本文所闡述之包含脂質之化合物及組合物之加速血液清除(ABC)。
相反,miRNA結合位點可自其天然存在於其中之多核苷酸序列中去除,以增加特定組織中之蛋白質表現。舉例而言,可自多核苷酸中去除特定miRNA之結合位點,以改良含有該miRNA之組織或細胞中之蛋白質表現。
經由引入或去除一或多個miRNA結合位點(例如一或多個不同的miRNA結合位點)可實現對多個組織中表現之調控。可基於miRNA表現模式及/或該等表現模式在處於發育及/或疾病中之組織及/或細胞中之剖析決定是否去除或插入miRNA結合位點。已對miRNA、miRNA結合位點及其表現模式之鑑別以及生物學作用進行報導(例如Bonauer等人,Curr. Drug Targets 2010 11:943-949;Anand及Cheresh,Curr. Op. Hematol. 2011 18:171-176;Contreras及Rao,Leukemia 2012 26:404-413 (2011年12月20日. doi: 10.1038/leu.2011.356);Bartel, Cell, 2009 136:215-233;Landgraf等人,Cell, 2007 129:1401-1414;Gentner及Naldini,Tissue Antigens, 2012 80:393-403及其中之所有參考文獻;該等參考文獻各自係以全文引用的方式併入本文中)。
已知miRNA調控mRNA且藉此調控蛋白質表現之組織之實例包括(但不限於)肝臟(miR-122)、肌肉(miR-133、miR-206、miR-208)、內皮細胞(miR-17-92、miR-126)、骨髓樣細胞(miR-142-3p、miR-142-5p、miR-16、miR-21、miR-223、miR-24、miR-27)、脂肪組織(let-7、miR-30c)、心臟(miR-1d、miR-149)、腎臟(miR-192、miR-194、miR-204)及肺上皮細胞(let-7、miR-133、miR-126)。
具體而言,已知miRNA在免疫細胞(亦稱為造血細胞)中差異表現,諸如抗原呈遞細胞(APC) (例如樹突細胞及巨噬細胞)、巨噬細胞、單核球、B淋巴球、T淋巴球、顆粒球、天然殺手細胞等。免疫細胞特異性miRNA參與免疫原性、自體免疫性、對感染之免疫反應、發炎以及基因療法及組織/器官移植後之不期望免疫反應。免疫細胞特異性miRNA亦調控造血細胞(免疫細胞)之發育、增殖、分化及凋亡之許多態樣。舉例而言,miR-142及miR-146僅在免疫細胞中表現,在骨髓樣樹突細胞中尤其豐富。已證明,藉由將miR-142結合位點添加至多核苷酸之3'-UTR可關閉對多核苷酸之免疫反應,從而使組織及細胞中之基因轉移更穩定。miR-142有效降解抗原呈遞細胞中之外源性多核苷酸,且阻抑轉導細胞之細胞毒性消除(例如Annoni A等人,Blood, 2009, 114, 5152-5161;Brown BD等人,Nat. Med. 2006, 12(5), 585-591;Brown BD等人,Blood, 2007, 110(13): 4144-4152,該等參考文獻各自係以全文引用的方式併入本文中)。
抗原介導之免疫反應可指由外源性抗原觸發之免疫反應,當該等外源性抗原進入生物體時,由抗原呈遞細胞加工且展示在抗原呈遞細胞之表面上。T細胞可識別所呈遞之抗原,且誘導表現該抗原之細胞之細胞毒性消除。
將一或多個(例如一個、兩個或三個) miR-142結合位點引入至本揭示案之多核苷酸之5' UTR及/或3'UTR中可經由miR-142介導之降解選擇性地抑制抗原呈遞細胞中之基因表現,從而限制抗原呈遞細胞(例如樹突細胞)中之抗原呈遞,且藉此防止多核苷酸遞送後之抗原介導之免疫反應。接著,多核苷酸在靶組織或細胞中穩定表現,而不觸發細胞毒性消除。
在一些實施例中,若3p及5p臂二者均為豐富的(例如miR-142-3p及miR142-5p二者在造血幹細胞中均為豐富的),則用多個miR靶向相同的細胞類型且向3p及5p臂中之每一者中併入結合位點可為有益的。因此,在某些實施例中,本揭示案之多核苷酸含有兩個或更多個(例如兩個、三個、四個或更多個) miR結合位點,其來自:(i)由miR-142、miR-144、miR-150、miR-155及miR-223 (在許多造血細胞中表現)組成之群;或(ii)由miR-142、miR150、miR-16及miR-223 (在B細胞中表現)組成之群;或由miR-223、miR-451、miR-26a、miR-16 (在祖造血細胞中表現)組成之群。
在一些實施例中,將各種miR組合使得同時靶向多種所關注之細胞類型亦可為有益的(例如,miR-142及miR-126靶向造血譜系之許多細胞及內皮細胞)。因此,舉例而言,在某些實施例中,本揭示案之多核苷酸包含兩個或更多個(例如兩個、三個、四個或更多個) miRNA結合位點,其中:(i)至少一種miR靶向造血譜系細胞(例如miR-142、miR-144、miR-150、miR-155或miR-223)且至少一種miR靶向漿細胞樣樹突細胞、血小板或內皮細胞(例如miR-126);或(ii)至少一種miR靶向B細胞(例如miR-142、miR150、miR-16或miR-223)且至少一種miR靶向漿細胞樣樹突細胞、血小板或內皮細胞(例如miR-126);或(iii)至少一種miR靶向祖造血細胞(例如miR-223、miR-451、miR-26a或miR-16)且至少一種miR靶向漿細胞樣樹突細胞、血小板或內皮細胞(例如miR-126);或(iv)至少一種miR靶向造血譜系細胞(例如miR-142、miR-144、miR-150、miR-155或miR-223),至少一種miR靶向B細胞(例如miR-142、miR150、miR-16或miR-223)且至少一種miR靶向漿細胞樣樹突細胞、血小板或內皮細胞(例如miR-126);或前述四類miR結合位點之任何其他可能組合(亦即靶向造血譜系者、靶向B細胞者、靶向祖造血細胞者及/或靶向漿細胞樣樹突細胞/血小板/內皮細胞者)。
在一些實施例中,為調節免疫反應,本揭示案之多核苷酸可包含一或多個miRNA結合序列,該一或多個miRNA結合序列結合至一或多種在習知免疫細胞或表現TLR7及/或TLR8且分泌促發炎性細胞介素及/或趨化介素之任何細胞(例如外周淋巴樣器官之免疫細胞及/或脾細胞及/或內皮細胞)中表現之miR。現已發現,向mRNA中併入一或多種在習知免疫細胞或表現TLR7及/或TLR8且分泌促發炎性細胞介素及/或趨化介素之任何細胞(例如外周淋巴樣器官之免疫細胞及/或脾細胞及/或內皮細胞)中表現之miR降低或抑制免疫細胞活化(例如B細胞活化,如藉由活化B細胞之頻率所量測)及/或細胞介素產生(例如IL-6、IFN-γ及/或TNFα之產生)。此外,現已發現,向mRNA中併入一或多種在習知免疫細胞或表現TLR7及/或TLR8且分泌促發炎性細胞介素及/或趨化介素之任何細胞(例如外周淋巴樣器官之免疫細胞及/或脾細胞及/或內皮細胞)中表現之miR可降低或抑制針對由該mRNA編碼之所關注蛋白質之抗藥物抗體(ADA)反應。
在一些實施例中,為調節在包含脂質之化合物或組合物中遞送的多核苷酸之加速血液清除,本揭示案之多核苷酸可包含一或多個miR結合序列,該一或多個miR結合序列結合至一或多種在習知免疫細胞或表現TLR7及/或TLR8且分泌促發炎性細胞介素及/或趨化介素之任何細胞(例如外周淋巴樣器官之免疫細胞及/或脾細胞及/或內皮細胞)中表現之miRNA。現已發現,向mRNA中併入一或多個miR結合位點降低或抑制用於遞送該mRNA之包含脂質之化合物或組合物之加速血液清除(ABC)。此外,現已發現,向mRNA中併入一或多個miR結合位點在投與包含該mRNA之包含脂質之化合物或組合物後,降低抗PEG抗IgM之血清水準(例如降低或抑制B細胞急性產生識別聚乙二醇(PEG)之IgM)及/或降低或抑制漿細胞樣樹突細胞之增殖及/或活化。
在一些實施例中,miR序列可對應於在免疫細胞中表現之任何已知微小RNA,包括(但不限於)美國公開案US2005/0261218及美國公開案US2005/0059005中所教示之彼等微小RNA,該等公開案之內容係以全文引用的方式併入本文中。在免疫細胞中表現之miR之非限制性實例包括在脾細胞、骨髓樣細胞、樹突細胞、漿細胞樣樹突細胞、B細胞、T細胞及/或巨噬細胞中表現之彼等miR。舉例而言,miR-142-3p、miR-142-5p、miR-16、miR-21、miR-223、miR-24及miR-27在骨髓樣細胞中表現,miR-155在樹突細胞、B細胞及T細胞中表現,miR-146在TLR刺激下在巨噬細胞中上調,且miR-126在漿細胞樣樹突細胞中表現。在某些實施例中,miR在免疫細胞中大量或優先表現。舉例而言,miR-142 (miR-142-3p及/或miR-142-5p)、miR-126 (miR-126-3p及/或miR-126-5p)、miR-146 (miR-146-3p及/或miR-146-5p)及miR-155 (miR-155-3p及/或miR155-5p)在免疫細胞中大量表現。該等微小RNA序列為此項技術中所已知,且因此熟習此項技術者可基於沃森-克里克互補性容易地設計該等微小RNA將結合之結合序列或靶序列。
在一些實施例中,本揭示案之多核苷酸包含三個拷貝之相同miRNA結合位點。在某些實施例中,與使用單一miRNA結合位點相比,使用三個拷貝之相同miR結合位點可展現出有益性質。
在一些實施例中,本揭示案之多核苷酸包含在免疫細胞中表現的兩個或更多個(例如兩個、三個、四個)拷貝之至少兩個不同的miR結合位點。
在一些實施例中,本揭示案之多核苷酸包含至少兩個針對在免疫細胞中表現的微小RNA之miR結合位點,其中一個miR結合位點係針對miR-142-3p。在各個實施例中,本揭示案之多核苷酸包含針對miR-142-3p及miR-155 (miR-155-3p或miR-155-5p)、miR-142-3p及miR-146 (miR-146-3或miR-146-5p)或miR-142-3p及miR-126 (miR-126-3p或miR-126-5p)之結合位點。
在一些實施例中,本揭示案之多核苷酸包含至少兩個針對在免疫細胞中表現的微小RNA之miR結合位點,其中一個miR結合位點係針對miR-126-3p。在各個實施例中,本揭示案之多核苷酸包含針對miR-126-3p及miR-155 (miR-155-3p或miR-155-5p)、miR-126-3p及miR-146 (miR-146-3p或miR-146-5p)或miR-126-3p及miR-142 (miR-142-3p或miR-142-5p)之結合位點。
在一些實施例中,本揭示案之多核苷酸包含至少兩個針對在免疫細胞中表現的微小RNA之miR結合位點,其中一個miR結合位點係針對miR-142-5p。在各個實施例中,本揭示案之多核苷酸包含針對miR-142-5p及miR-155 (miR-155-3p或miR-155-5p)、miR-142-5p及miR-146 (miR-146-3或miR-146-5p)或miR-142-5p及miR-126 (miR-126-3p或miR-126-5p)之結合位點。
在一些實施例中,本揭示案之多核苷酸包含至少兩個針對在免疫細胞中表現的微小RNA之miR結合位點,其中一個miR結合位點係針對miR-155-5p。在各個實施例中,本揭示案之多核苷酸包含針對miR-155-5p及miR-142 (miR-142-3p或miR-142-5p)、miR-155-5p及miR-146 (miR-146-3或miR-146-5p)或miR-155-5p及miR-126 (miR-126-3p或miR-126-5p)之結合位點。
在一些實施例中,本揭示案之多核苷酸包含miRNA結合位點,其中該miRNA結合位點包含一或多個選自
表 9之核苷酸序列,包括一或多個拷貝之任一或多個miRNA結合位點序列。在一些實施例中,本揭示案之多核苷酸進一步包含至少一個、兩個、三個、四個、五個、六個、七個、八個、九個、十個或更多個選自
表 9之相同或不同的miRNA結合位點,包括其任何組合。
在一些實施例中,miRNA結合位點結合至miR-142或與miR-142互補。在一些實施例中,miR-142包含SEQ ID NO: 67。在一些實施例中,miRNA結合位點結合至miR-142-3p或miR-142-5p。在一些實施例中,miR-142-3p結合位點包含SEQ ID NO: 69。在一些實施例中,miR-142-5p結合位點包含SEQ ID NO: 71。在一些實施例中,miRNA結合位點包含與SEQ ID NO: 69或SEQ ID NO: 71至少80%、至少85%、至少90%、至少95%或100%一致之核苷酸序列。
在一些實施例中,miRNA結合位點結合至miR-126或與miR-126互補。在一些實施例中,miR-126包含SEQ ID NO: 72。在一些實施例中,miRNA結合位點結合至miR-126-3p或miR-126-5p。在一些實施例中,miR-126-3p結合位點包含SEQ ID NO: 74。在一些實施例中,miR-126-5p結合位點包含SEQ ID NO: 76。在一些實施例中,miRNA結合位點包含與SEQ ID NO: 74或SEQ ID NO: 76至少80%、至少85%、至少90%、至少95%或100%一致之核苷酸序列。
在一些實施例中,3' UTR包含兩個miRNA結合位點,其中第一miRNA結合位點結合至miR-142且第二miRNA結合位點結合至miR-126。
表 9. 例示性 miR-142 、 miR-126 、及 miR-142 及 miR-126 結合位點
SEQ ID NO. | 說明 | 序列 |
67 | miR-142 | GACAGUGCAGUCACCCAUAAAGUAGAAAGCACUACUAACAGCACUGGAGGGUGUAGUGUUUCCUACUUUAUGGAUGAGUGUACUGUG |
68 | miR-142-3p | uguaguguuuccuacuuuaugga |
69 | miR-142-3p結合位點 | uccauaaaguaggaaacacuaca |
70 | miR-142-5p | cauaaaguagaaagcacuacu |
71 | miR-142-5p結合位點 | aguagugcuuucuacuuuaug |
72 | miR-126 | CGCUGGCGACGGGACAUUAUUACUUUUGGUACGCGCUGUGACACUUCAAACUCGUACCGUGAGUAAUAAUGCGCCGUCCACGGCA |
73 | miR-126-3p | UCGUACCGUGAGUAAUAAUGCG |
74 | miR-126-3p結合位點 | CGCAUUAUUACUCACGGUACGA |
75 | miR-126-5p | CAUUAUUACUUUUGGUACGCG |
76 | miR-126-5p結合位點 | CGCGUACCAAAAGUAAUAAUG |
在一些實施例中,miRNA結合位點插入在本揭示案之多核苷酸中多核苷酸之任何位置(例如5' UTR及/或3' UTR)。在一些實施例中,5' UTR包含miRNA結合位點。在一些實施例中,3' UTR包含miRNA結合位點。在一些實施例中,5' UTR及3' UTR包含miRNA結合位點。多核苷酸中之插入位點可位於多核苷酸中之任何地方,只要miRNA結合位點在多核苷酸中之插入不干擾相應miRNA不存在之情形下功能多肽之轉譯即可;且在miRNA存在之情形下,miRNA結合位點在多核苷酸中之插入及miRNA結合位點與相應miRNA之結合能夠降解多核苷酸或防止多核苷酸轉譯。
在一些實施例中,miRNA結合位點插入在包含ORF之本揭示案多核苷酸中該ORF之終止密碼子下游至少約30個核苷酸處。在一些實施例中,miRNA結合位點插入在本揭示案之多核苷酸中ORF之終止密碼子下游至少約10個核苷酸、至少約15個核苷酸、至少約20個核苷酸、至少約25個核苷酸、至少約30個核苷酸、至少約35個核苷酸、至少約40個核苷酸、至少約45個核苷酸、至少約50個核苷酸、至少約55個核苷酸、至少約60個核苷酸、至少約65個核苷酸、至少約70個核苷酸、至少約75個核苷酸、至少約80個核苷酸、至少約85個核苷酸、至少約90個核苷酸、至少約95個核苷酸或至少約100個核苷酸處。在一些實施例中,miRNA結合位點插入在本揭示案之多核苷酸中ORF之終止密碼子下游約10個核苷酸至約100個核苷酸、約20個核苷酸至約90個核苷酸、約30個核苷酸至約80個核苷酸、約40個核苷酸至約70個核苷酸、約50個核苷酸至約60個核苷酸、約45個核苷酸至約65個核苷酸處。
在一些實施例中,miRNA結合位點插入在緊接本揭示案之多核苷酸(例如mRNA)內編碼區之終止密碼子後之3' UTR內。在一些實施例中,若構築體中存在多個終止密碼子拷貝,則miRNA結合位點緊接最後一個終止密碼子後插入。在一些實施例中,miRNA結合位點插入在終止密碼子之更下游,在該情形下,終止密碼子與miR結合位點之間存在3' UTR鹼基。
在一些實施例中,一或多個miRNA結合位點可定位在5' UTR內之一或多個可能插入位點處。
在一些實施例中,編碼所關注多肽之密碼子最佳化之開放閱讀框包含終止密碼子,且至少一個微小RNA結合位點位於終止密碼子後1-100個核苷酸之3' UTR內。在一些實施例中,編碼所關注多肽之密碼子最佳化開放閱讀框包含終止密碼子,且在免疫細胞中表現之miR之至少一個微小RNA結合位點位於終止密碼子後30-50個核苷酸之3' UTR內。在一些實施例中,編碼所關注多肽之密碼子最佳化開放閱讀框包含終止密碼子,且在免疫細胞中表現之miR之至少一個微小RNA結合位點位於終止密碼子後至少50個核苷酸之3' UTR內。在其他實施例中,編碼所關注多肽之密碼子最佳化開放閱讀框包含終止密碼子,且在免疫細胞中表現之miR之至少一個微小RNA結合位點位於終止密碼子後緊接之3' UTR內,或終止密碼子後15-20個核苷酸之3' UTR內或終止密碼子後70-80個核苷酸之3' UTR內。在其他實施例中,3' UTR包含一個以上miRNA結合位點(例如2-4個miRNA結合位點),其中每一miRNA結合位點之間可存在間隔區(例如長度為10-100個、20-70個或30-50個核苷酸)。在一些實施例中,3' UTR包含miRNA結合位點末端與聚A尾核苷酸之間的間隔區。舉例而言,長度為10-100個、20-70個或30-50個核苷酸之間隔區可位於miRNA結合位點末端與聚A尾之起始端之間。
在一些實施例中,編碼所關注多肽之密碼子最佳化開放閱讀框包含起始密碼子,且至少一個微小RNA結合位點位於起始密碼子之前(上游) 1-100個核苷酸之5' UTR內。在一些實施例中,編碼所關注多肽之密碼子最佳化開放閱讀框包含起始密碼子,且在免疫細胞中表現之miR之至少一個微小RNA結合位點位於起始密碼子之前(上游) 10-50個核苷酸之5' UTR內。在一些實施例中,編碼所關注多肽之密碼子最佳化開放閱讀框包含起始密碼子,且在免疫細胞中表現之miR之至少一個微小RNA結合位點位於起始密碼子之前(上游)至少25個核苷酸之5' UTR內。在其他實施例中,編碼所關注多肽之密碼子最佳化開放閱讀框包含起始密碼子,且在免疫細胞中表現之miR之至少一個微小RNA結合位點位於起始密碼子之前緊接之5' UTR內,或起始密碼子之前15-20個核苷酸之5' UTR內或起始密碼子之前70-80個核苷酸之5' UTR內。在其他實施例中,5' UTR包含一個以上miRNA結合位點(例如2-4個miRNA結合位點),其中每一miRNA結合位點之間可存在間隔區(例如長度為10-100個、20-70個或30-50個核苷酸)。
在一些實施例中,3' UTR包含一個以上終止密碼子,其中至少一個miRNA結合位點定位在終止密碼子下游。舉例而言,3' UTR可包含1、2或3個終止密碼子。可使用之三重終止密碼子之非限制性實例包括:UGAUAAUAG、UGAUAGUAA、UAAUGAUAG、UGAUAAUAA、UGAUAGUAG、UAAUGAUGA、UAAUAGUAG、UGAUGAUGA、UAAUAAUAA及UAGUAGUAG。舉例而言,在3' UTR內,1、2、3或4個miRNA結合位點(例如miR-142-3p結合位點)可緊鄰終止密碼子或在最後一個終止密碼子下游之任何數目的核苷酸處定位。當3' UTR包含多個miRNA結合位點時,該等結合位點可在構築體中彼此直接相鄰定位(亦即一個接一個),或替代地,間隔核苷酸可定位在每一結合位點之間。
在一些實施例中,3' UTR包含三個終止密碼子及位於第3個終止密碼子下游之單一miR-142-3p結合位點。
在一些實施例中,本揭示案之多核苷酸包含5' UTR、編碼所關注多肽之密碼子最佳化開放閱讀框、包含免疫細胞中表現之miR之至少一個miRNA結合位點之3' UTR及連接核苷之3'曳尾區。在各個實施例中,3' UTR包含在免疫細胞中表現(較佳在免疫細胞中大量或優先表現)之miR之1-4個、至少兩個、一個、兩個、三個或四個miRNA結合位點。
在一些實施例中,在免疫細胞中表現之該至少一種miRNA為miR-142-3p微小RNA結合位點。在一些實施例中,miR-142-3p微小RNA結合位點包含SEQ ID NO: 69中所示之序列。
在一些實施例中,在免疫細胞中表現之該至少一種miRNA為miR-126微小RNA結合位點。在一些實施例中,miR-126結合位點為miR-126-3p結合位點。在一些實施例中,miR-126-3p微小RNA結合位點包含SEQ ID NO: 74中所示之序列。
本揭示案之微小RNA結合位點可結合之miR之非限制性例示性序列包括以下:miR-142-3p、miR-142-5p、miR-146-3p、miR-146-5p、miR-155-3p、miR-155-5p、miR-126-3p、miR-126-5p、miR-16-3p、miR-16-5p、miR-21-3p、miR-21-5p、miR-223-3p、miR-223-5p、miR-24-3p、miR-24-5p、miR-27-3p及miR-27-5p。在免疫細胞中表現(例如在免疫細胞中大量或優先表現)之其他適宜miR序列為此項技術中所已知且可獲得,例如在曼徹斯特大學(University of Manchester)之微小RNA資料庫miRBase中獲得。可基於與miR之沃森-克里克互補性(通常與miR之100%互補性)來設計結合任一上文所提及之miR之位點,且如本文所闡述插入至本揭示案之mRNA構築體中。
在一些實施例中,本揭示案之多核苷酸(例如mRNA,例如其3' UTR)可包含至少一個miRNA結合位點,以例如藉由減少或抑制B細胞產生IgM (例如針對PEG)及/或減少或抑制pDC之增殖及/或活化來藉此降低或抑制加速血液清除,且可包含至少一個miRNA結合位點以供調節所編碼之關注蛋白質之組織表現。
miRNA基因調控可受miRNA周圍序列之影響,諸如(但不限於)周圍序列之種類、序列類型(例如異源、同源、外源、內源或人工)、周圍序列中之調控元件及/或周圍序列中之結構元件。miRNA可受5'UTR及/或3'UTR影響。作為非限制性實例,與相同序列類型之人類3' UTR相比,非人類3'UTR可增加miRNA序列對所關注多肽之表現之調控效應。
在一些實施例中,5' UTR之其他調控元件及/或結構元件可影響miRNA介導之基因調控。調控元件及/或結構元件之一個實例為5' UTR中之結構化IRES (內部核糖體進入位點),其對於結合轉譯延伸因子以起始蛋白質轉譯係必需的。EIF4A2與5'-UTR中之此二級結構化元件之結合對於miRNA介導之基因表現係必需的(Meijer HA等人,
Science, 2013, 340, 82-85,其係以全文引用的方式併入本文中)。本揭示案之多核苷酸可進一步包括此結構化5' UTR,以增強微小RNA介導之基因調控。
可將至少一個miRNA結合位點工程化至本揭示案之多核苷酸之3' UTR中。在此背景中,可將至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個、至少十個或更多個miRNA結合位點工程化至本揭示案之多核苷酸之3' UTR中。舉例而言,可將1至10個、1至9個、1至8個、1至7個、1至6個、1至5個、1至4個、1至3個、2個或1個miRNA結合位點工程化至本揭示案之多核苷酸之3' UTR中。在一些實施例中,併入至本揭示案之多核苷酸中之miRNA結合位點可相同或可為不同的miRNA位點。併入至本揭示案之多核苷酸中的不同miRNA結合位點之組合可包括併入有任何不同miRNA位點之一個以上拷貝之組合。在一些實施例中,併入至本揭示案之多核苷酸中之miRNA結合位點可靶向體內之相同或不同組織。作為非限制性實例,經由在本揭示案之多核苷酸之3'-UTR中引入組織特異性、細胞類型特異性或疾病特異性miRNA結合位點,可降低特定細胞類型(例如骨髓樣細胞、內皮細胞等)中之表現程度。
在一些實施例中,在本揭示案之多核苷酸中,可將miRNA結合位點工程化在3'UTR之5'末端附近、3'UTR之5'末端與3'末端之間的大約中途及/或在3' UTR之3'末端附近。作為非限制性實例,可將miRNA結合位點工程化在3'UTR之5'末端附近及3'UTR之5'末端與3'末端之間的大約中途。作為另一非限制性實例,可將miRNA結合位點工程化在3'UTR之3'末端附近及3' UTR之5'末端與3'末端之間的大約中途。作為另一非限制性實例,可將miRNA結合位點工程化在3' UTR之5'末端附近及3' UTR之3'末端附近。
在一些實施例中,3'UTR可包含1、2、3、4、5、6、7、8、9或10個miRNA結合位點。miRNA結合位點可與miRNA、miRNA種子序列及/或種子序列側翼之miRNA序列互補。
在一些實施例中,本揭示案多核苷酸之表現可藉由在多核苷酸中併入至少一個感測序列且調配供投與之多核苷酸來控制。作為非限制性實例,可藉由併入miRNA結合位點且將本揭示案之多核苷酸調配在包含可電離胺基脂質(包括本文所闡述之任一脂質)之脂質奈米顆粒中使該多核苷酸靶向組織或細胞。
基於miRNA在不同組織、細胞類型或生物條件中之表現模式,可對本揭示案之多核苷酸進行工程化,以在特定組織、細胞類型或生物條件中進行更具靶向性之表現。經由引入組織特異性miRNA結合位點,本揭示案之多核苷酸可經設計用於在組織或細胞中或在生物條件背景下進行最佳蛋白質表現。
在一些實施例中,本揭示案之多核苷酸可經設計以併入與已知miRNA種子序列具有100%一致性或與miRNA種子序列具有小於100%一致性之miRNA結合位點。在一些實施例中,本揭示案之多核苷酸可經設計以併入與已知miRNA種子序列具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%一致性之miRNA結合位點。miRNA種子序列可部分突變以降低miRNA結合親和力,且因此導致多核苷酸之下調減少。本質上,miRNA結合位點與miRNA種子之間的匹配或錯配程度可作為調變器(rheostat),以更精細地調節miRNA調節蛋白質表現之能力。另外,miRNA結合位點之非種子區中之突變亦可影響miRNA調節蛋白質表現之能力。
在一些實施例中,可將miRNA序列併入至莖環之環中。
在一些實施例中,可將miRNA種子序列併入至莖環之環中,且可將miRNA結合位點併入至莖環之5'或3'莖中。
在一些實施例中,5' UTR中之miRNA序列可用於穩定本文所闡述之本揭示案之多核苷酸。
在一些實施例中,本揭示案之多核苷酸之5' UTR中之miRNA序列可用於降低轉譯起始位點(諸如但不限於起始密碼子)之可及性。例如,參見Matsuda等人,PLoS One. 2010 11(5):e15057;以全文引用的方式併入本文中,其使用起始密碼子(-4至+37,其中AUG密碼子之A為+1)周圍之反義鎖核酸(LNA)寡核苷酸及外顯子連接複合物(EJC)來降低對第一起始密碼子(AUG)之可及性。Matsuda顯示,利用LNA或EJC改變起始密碼子周圍之序列影響多核苷酸之效率、長度及結構穩定性。本揭示案之多核苷酸可在轉譯起始位點附近包含miRNA序列而非Matsuda等人所闡述之LNA或EJC序列,以降低轉譯起始位點之可及性。轉譯起始位點可在miRNA序列之前、之後或之內。作為非限制性實例,轉譯起始位點可位於miRNA序列內,諸如種子序列或結合位點。
在一些實施例中,本揭示案之多核苷酸可包括至少一種miRNA,以抑制抗原呈遞細胞之抗原呈遞。該miRNA可為完整miRNA序列、miRNA種子序列、不含種子之miRNA序列或其組合。作為非限制性實例,併入至本揭示案之多核苷酸中之miRNA可對造血系統具有特異性。作為另一非限制性實例,併入至本揭示案之多核苷酸中以抑制抗原呈遞之miRNA為miR-142-3p。
在一些實施例中,本揭示案之多核苷酸可包括至少一種miRNA,以抑制編碼多肽在所關注組織或細胞中之表現。作為非限制性實例,本揭示案之多核苷酸可包括至少一個miR-142-3p結合位點、miR-142-3p種子序列、不含種子之miR-142-3p結合位點、miR-142-5p結合位點、miR-142-5p種子序列、不含種子之miR-142-5p結合位點、miR-146結合位點、miR-146種子序列及/或不含種子序列之miR-146結合位點。
在一些實施例中,本揭示案之多核苷酸在3'UTR中可包含至少一個miRNA結合位點,以選擇性地降解免疫細胞中之mRNA治療劑,從而抑制由治療性遞送所引起之不期望免疫原性反應。作為非限制性實例,miRNA結合位點可使本揭示案之多核苷酸在抗原呈遞細胞中更不穩定。該等miRNA之非限制性實例包括miR-142-5p、miR-142-3p、miR-146a-5p及miR-146-3p。
在一些實施例中,本揭示案之多核苷酸在該多核苷酸中的可與RNA結合蛋白相互作用之區域中包含至少一個miRNA序列。
在一些實施例中,本揭示案之多核苷酸(例如RNA,例如mRNA)包含(i)編碼治療性多肽(例如野生型序列、其功能片段或變異體)之序列最佳化核苷酸序列(例如ORF),及(ii) miRNA結合位點(例如結合至miR-142之miRNA結合位點)及/或結合至miR-126之miRNA結合位點。
13. 5' 帽
儘管不為必需的,但若期望,本揭示案之多核苷酸亦可含有5’帽結構。應理解,在一個實施例中,本發明之核酸分子缺少5’帽。
天然mRNA之5'帽結構參與核輸出、增加mRNA穩定性且結合mRNA帽結合蛋白(CBP),其經由CBP與聚(A)結合蛋白之締合形成成熟環狀mRNA物質而負責細胞中之mRNA穩定性及轉譯能力。在mRNA剪接期間,該帽進一步幫助去除5'近端內含子。
內源性mRNA分子可為5'端加帽的,在末端鳥苷帽殘基與mRNA分子之5'末端轉錄之有義核苷酸之間產生5'-ppp-5'-三磷酸酯鍵聯。此5'-鳥苷酸帽可接著經甲基化,以產生N7-甲基-鳥苷酸殘基。mRNA 5'端之末端及/或末端前(anteterminal)轉錄核苷酸之核糖可視情況亦經2'-O-甲基化。經由水解及裂解鳥苷酸帽結構之5'脫帽可靶向核酸分子(諸如mRNA分子)以進行降解。
在一些實施例中,本揭示案之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)併有帽部分。在本文所揭示之任一實施例中,5’末端帽可在3’端以A或G終止,即使下文揭示內容中未示出。
在一些實施例中,本揭示案之多核苷酸包含防止脫帽且由此延長mRNA半衰期之不可水解帽結構。由於帽結構水解需要裂解5'-ppp-5'磷酸二酯鍵聯,故可在加帽反應期間使用經修飾之核苷酸。舉例而言,來自New England Biolabs (Ipswich, MA)之牛痘加帽酶可根據製造商說明書與α-硫基-鳥苷核苷酸一起使用,以在5'-ppp-5'帽中產生硫代磷酸酯鍵聯。可使用其他經修飾之鳥苷核苷酸,諸如α-甲基-膦酸酯及硒基-磷酸酯核苷酸。
其他修飾包括(但不限於)在糖環之2'-羥基上多核苷酸(如上文所提及)之5'末端及/或5'末端前核苷酸之核糖之2'-O-甲基化。多個不同的5'-帽結構可用於產生核酸分子之5'-帽,諸如起mRNA分子作用之多核苷酸。帽類似物在本文中亦稱為合成帽類似物、化學帽、化學帽類似物或結構或功能帽類似物,其在化學結構上不同於天然(亦即內源性、野生型或生理性) 5'帽,同時保留帽功能。帽類似物可化學(亦即非酶促)或酶促合成及/或連接至本揭示案之多核苷酸。
舉例而言,抗反向帽類似物(ARCA)帽含有兩個由5'-5'-三磷酸酯基連接之鳥嘌呤,其中一個鳥嘌呤含有N7甲基以及3'-O-甲基(亦即,N7,3'-O-二甲基-鳥苷-5'-三磷酸-5'-鳥苷(m
7G-3'mppp-G;其可等同地命名為3' O-Me-m
7G(5')ppp(5')G)。另一未經修飾之鳥嘌呤之3'-O原子與加帽多核苷酸之5'末端核苷酸連接。N7-及3'-O-甲基化之鳥嘌呤提供加帽多核苷酸之末端部分。
另一例示性帽為mCAP,其與ARCA類似,但在鳥苷上具有2'-O-甲基(亦即,N7,2'-O-二甲基-鳥苷-5'-三磷酸-5'-鳥苷,m
7Gm-ppp-G)。
另一例示性帽為m
7G-ppp-Gm-A (亦即,N7,鳥苷-5'-三磷酸-2'-O-二甲基-鳥苷-腺苷)。
在一些實施例中,帽為二核苷酸帽類似物。作為非限制性實例,二核苷酸帽類似物可在不同的磷酸酯位置處經硼烷磷酸酯基或硒代磷酸酯基修飾,諸如美國專利第US 8,519,110號中所闡述之二核苷酸帽類似物,該美國專利之內容係以全文引用的方式併入本文中。
在一些實施例中,帽為帽類似物,其為此項技術中所已知及/或本文所闡述之帽類似物之N7-(4-氯苯氧基乙基)取代之二核苷酸形式。帽類似物之N7-(4-氯苯氧基乙基)取代之二核苷酸形式之非限制性實例包括N7-(4-氯苯氧基乙基)-G(5')ppp(5')G及N7-(4-氯苯氧基乙基)-m
3'-OG(5')ppp(5')G帽類似物(例如,參見Kore等人,
Bioorganic & Medicinal Chemistry2013 21:4570-4574中所闡述之各種帽類似物及合成帽類似物之方法;該文獻之內容係以全文引用的方式併入本文中)。在一些實施例中,本揭示案之帽類似物為4-氯/溴苯氧基乙基類似物。
本揭示案之多核苷酸亦可在製造後使用酶進行加帽(無論為IVT還是化學合成),以生成更真實之5'-帽結構。如本文所用,片語「更真實」係指在結構上或在功能上密切反映或模擬內源性或野生型特徵之特徵。亦即,「更真實」之特徵與先前技術之合成特徵或類似物等相比更佳地代表內源性、野生型、天然或生理細胞功能及/或結構,或在一或多個方面優於相應內源性、野生型、天然或生理特徵。本揭示案之更真實5'帽結構之非限制性實例尤其為與此項技術中已知之合成5'帽結構(或野生型、天然或生理5'帽結構)相比,帽結合蛋白之結合增強、半衰期延長、對5'核酸內切酶之敏感性降低及/或5'脫帽減少之彼等帽結構。舉例而言,重組牛痘病毒加帽酶及重組2'-O-甲基轉移酶可在多核苷酸之5'末端核苷酸與鳥嘌呤帽核苷酸之間產生規範的5'-5'-三磷酸鍵聯,其中帽鳥嘌呤含有N7甲基化且mRNA之5'末端核苷酸含有2'-O-甲基。此一結構稱為帽1結構。例如,與此項技術中已知之其他5'帽類似物結構相比,此帽使得轉譯能力及細胞穩定性更高且細胞促發炎性細胞介素之活化降低。帽結構包括(但不限於) 7mG(5')ppp(5')N1pN2p (帽0)、7mG(5')ppp(5')N1mpNp (帽1)及7mG(5')-ppp(5')N1mpN2mp (帽2)。
作為非限制性實例,由於幾乎100%之嵌合多核苷酸可加帽,因此在製造後對嵌合多核苷酸加帽可更有效。與之相比,在活體外轉錄反應過程中,帽類似物與嵌合多核苷酸連接時為約80%。
根據本揭示案,5'末端帽可包括內源性帽或帽類似物。根據本揭示案,5'末端帽可包含鳥嘌呤類似物。可用之鳥嘌呤類似物包括(但不限於)肌苷、N1-甲基-鳥苷、2'氟-鳥苷、7-去氮-鳥苷、8-側氧基-鳥苷、2-胺基-鳥苷、LNA-鳥苷及2-疊氮基-鳥苷。
本文亦提供例示性帽,包括可用於使用RNA聚合酶(例如野生型RNA聚合酶或其變異體,例如本文所闡述之彼等變異體)之核糖核酸(RNA)合成之共轉錄加帽方法中之彼等帽。在一些實施例中,可在「一鍋式」反應中產生RNA時添加帽,而不需要單獨之加帽反應。因此,在一些實施例中,該等方法包括使多核苷酸模板與RNA聚合酶變異體、核苷三磷酸及帽類似物在活體外轉錄反應條件下反應,以產生RNA轉錄本。
如本文所用,術語「帽」包括反向G核苷酸且可包含位於反向G核苷酸3’之一或多個其他核苷酸,例如位於反向G核苷酸3’及5’ UTR (例如本文所闡述之5’ UTR) 5’之1個、2個、3個或更多個核苷酸。
例示性帽包含
G G、
G A或
G GA之序列,其中加下劃線之斜體G為反向G核苷酸,之後為5’-5’-三磷酸酯基。
在一些實施例中,帽包含式(C-I)化合物
(C-I),或其立體異構物、互變異構物或鹽,其中
;
環B
1為經修飾或未經修飾之鳥嘌呤;
環B
2及環B
3各自獨立地為核鹼基或經修飾之核鹼基;
X
2為O、S(O)
p、NR
24或CR
25R
26,其中p為0、1或2;
Y
0為O或CR
6R
7;
Y1為O、S(O)
n、CR
6R
7或NR
8,其中n為0、1或2;
每一---為單鍵或不存在,其中當每一---為單鍵時,Yi為O、S(O)
n、CR
6R
7或NR
8;且當每一---不存在時,Y
1為空的;
Y
2為(OP(O)R
4)
m,其中m為0、1或2,或-O-(CR
40R
41)u-Q
0-(CR
42R
43)v-,其中Q
0為鍵、O、S(O)
r、NR
44或CR
45R
46,r為0、1或2,且u及v各自獨立地為1、2、3或4;
每一R
2及R
2'獨立地為鹵基、LNA或OR
3;
每一R
3獨立地為H、C
1-C
6烷基、C
2-C
6烯基或C
2-C
6炔基,且當R
3為C
1-C
6烷基、C
2-C
6烯基或C
2-C
6炔基時,其視情況經鹵基、OH及視情況經一或多個OH或OC(O)-C
1-C
6烷基取代之C
1-C
6烷氧基中之一或多者取代;
每一R
4及R
4'獨立地為H、鹵基、C
1-C
6烷基、OH、SH、SeH或BH
3 -;
R
6、R
7及R
8各自獨立地為-Q
1-T
1,其中Q
1為鍵或視情況經鹵基、氰基、OH及C
1-C
6烷氧基中之一或多者取代之C
1-C
3烷基連接體,且T
1為H、鹵基、OH、COOH、氰基或R
s1,其中R
s1為C
1-C
3烷基、C
2-C
6烯基、C
2-C
6炔基、C
1-C
6烷氧基、C(O)O-C
1-C
6烷基、C
3-C
8環烷基、C
6-C
10芳基、NR
31R
32、(NR
31R
32R
33)
+、4員至12員雜環烷基或5員或6員雜芳基,且R
s1視情況經一或多個選自由以下組成之群的取代基取代:鹵基、OH、側氧基、C
1-C
6烷基、COOH、C(O)O-C
1-C
6烷基、氰基、C
1-C
6烷氧基、NR
31R
32、(NR
31R
32R
33)
+、C
3-C
8環烷基、C
6-C
10芳基、4員至12員雜環烷基及5員或6員雜芳基;
R
10、R
11、R
12、R
13、R
14及R
15各自獨立地為-Q
2-T
2,其中Q
2為鍵或視情況經鹵基、氰基、OH及C
1-C
6烷氧基中之一或多者取代之C
1-C
3烷基連接體,且T
2為H、鹵基、OH、NH
2、氰基、NO
2、N
3、R
s2或OR
s2,其中R
s2為C
1-C
6烷基、C
2-C
6烯基、C
2-C
6炔基、C
3-C
8環烷基、C
6-C
10芳基、NHC(O)-C
1-C
6烷基、NR
31R
32、(NR
31R
32R
33)
+、4員至12員雜環烷基或5員或6員雜芳基,且R
s2視情況經一或多個選自由以下組成之群的取代基取代:鹵基、OH、側氧基、C
1-C
6烷基、COOH、C(O)O-C
1-C
6烷基、氰基、C
1-C
6烷氧基、NR
31R
32、(NR
31R
32R
33)
+、C
3-C
8環烷基、C
6-C
10芳基、4員至12員雜環烷基及5員或6員雜芳基;或替代地R
12與R
14一起為側氧基,或R
13與R
15一起為側氧基,
R
20、R
21、R
22及R
23各自獨立地為-Q
3-T
3,其中Q
3為鍵或視情況經鹵基、氰基、OH及C
1-C
6烷氧基中之一或多者取代之C
1-C
3烷基連接體,且T
3為H、鹵基、OH、NH
2、氰基、NO
2、N
3、R
S3或OR
S3,其中R
S3為C
1-C
6烷基、C
2-C
6烯基、C
2-C
6炔基、C
3-C
8環烷基、C
6-C
10芳基、NHC(O)-C
1-C
6烷基、單-C
1-C
6烷基胺基、二-C
1-C
6烷基胺基、4員至12員雜環烷基或5員或6員雜芳基,且Rs
3視情況經一或多個選自由以下組成之群的取代基取代:鹵基、OH、側氧基、C
1-C
6烷基、COOH、C(O)O-C
1-C
6烷基、氰基、C
1-C
6烷氧基、胺基、單-C
1-C
6烷基胺基、二-C
1-C
6烷基胺基、C
3-C
8環烷基、C
6-C
10芳基、4員至12員雜環烷基及5員或6員雜芳基;
R
24、R
25及R
26各自獨立地為H或C
1-C
6烷基;
R
27及R
28各自獨立地為H或OR
29;或R
27及R
28一起形成O-R
30-O;每一R
29獨立地為H、C
1-C
6烷基、C
2-C
6烯基或C
2-C
6炔基,且當R
29為C
1-C
6烷基、C
2-C
6烯基或C
2-C
6炔基時,其視情況經鹵基、OH及視情況經一或多個OH或OC(O)-C
1-C
6烷基取代之C
1-C
6烷氧基中之一或多者取代;
R
30為C
1-C
6伸烷基,其視情況經鹵基、OH及C
1-C
6烷氧基中之一或多者取代;
R
31、R
32及R
33各自獨立地為H、C
1-C
6烷基、C
3-C
8環烷基、C
6-C
10芳基、4員至12員雜環烷基或5員或6員雜芳基;
R
40、R
41、R
42及R
43各自獨立地為H、鹵基、OH、氰基、N
3、OP(O)R
47R
48或視情況經一或多個OP(O)R
47R
48取代之C
1-C
6烷基,或一個R
41及一個R
43與其所連接之碳原子、及Q
0一起形成C
4-C
10環烷基、4員至14員雜環烷基、C
6-C
10芳基或5員至14員雜芳基,且環烷基、雜環烷基、苯基或5員至6員雜芳基各自視情況經以下中之一或多者取代:OH、鹵基、氰基、N
3、側氧基、OP(O)R
47R
48、C
1-C
6烷基、C
1-C
6鹵烷基、COOH、C(O)O-C
1-C
6烷基、C
1-C
6烷氧基、C
1-C
6鹵烷氧基、胺基、單-C
1-C
6烷基胺基及二-C
1-C
6烷基胺基;
R
44為H、C
1-C
6烷基或胺保護基團;
R
45及R
46各自獨立地為H、OP(O)R
47R
48或視情況經一或多個OP(O)R
47R
48取代之C
1-C
6烷基,且
R
47及R
48各自獨立地為H、鹵基、C
1-C
6烷基、OH、SH、SeH或BH
3 -。
應理解,如本文所提供之帽類似物可包括2017年4月20日公開之國際公開案WO 2017/066797中所闡述之帽類似物中之任一者,該國際公開案係以全文引用的方式併入本文中。
在一些實施例中,B
2中間位置可為非核糖分子,諸如阿拉伯糖。
在一些實施例中,R
2基於乙基。
因此,在一些實施例中,帽包含以下結構:
(C-II)
在其他實施例中,帽包含以下結構:
(C-III)
在其他實施例中,帽包含以下結構:
(C-IV)
在其他實施例中,帽包含以下結構:
(C-V)
在一些實施例中,R為烷基(例如C
1-C
6烷基)。在一些實施例中,R為甲基(例如C
1烷基)。在一些實施例中,R為乙基(例如C
2烷基)。
在一些實施例中,帽包含選自以下序列之序列:GAA、GAC、GAG、GAU、GCA、GCC、GCG、GCU、GGA、GGC、GGG、GGU、GUA、GUC、GUG及GUU。在一些實施例中,帽包含GAA。在一些實施例中,帽包含GAC。在一些實施例中,帽包含GAG。在一些實施例中,帽包含GAU。在一些實施例中,帽包含GCA。在一些實施例中,帽包含GCC。在一些實施例中,帽包含GCG。在一些實施例中,帽包含GCU。在一些實施例中,帽包含GGA。在一些實施例中,帽包含GGC。在一些實施例中,帽包含GGG。在一些實施例中,帽包含GGU。在一些實施例中,帽包含GUA。在一些實施例中,帽包含GUC。在一些實施例中,帽包含GUG。在一些實施例中,帽包含GUU。
在一些實施例中,帽包含選自以下序列之序列:m
7GpppApA、m
7GpppApC、m
7GpppApG、m
7GpppApU、m
7GpppCpA、m
7GpppCpC、m
7GpppCpG、m
7GpppCpU、m
7GpppGpA、m
7GpppGpC、m
7GpppGpG、m
7GpppGpU、m
7GpppUpA、m
7GpppUpC、m
7GpppUpG及m
7GpppUpU。
在一些實施例中,帽包含m
7GpppApA。在一些實施例中,帽包含m
7GpppApC。在一些實施例中,帽包含m
7GpppApG。在一些實施例中,帽包含m
7GpppApU。在一些實施例中,帽包含m
7GpppCpA。在一些實施例中,帽包含m
7GpppCpC。在一些實施例中,帽包含m
7GpppCpG。在一些實施例中,帽包含m
7GpppCpU。在一些實施例中,帽包含m
7GpppGpA。在一些實施例中,帽包含m
7GpppGpC。在一些實施例中,帽包含m
7GpppGpG。在一些實施例中,帽包含m
7GpppGpU。在一些實施例中,帽包含m
7GpppUpA。在一些實施例中,帽包含m
7GpppUpC。在一些實施例中,帽包含m
7GpppUpG。在一些實施例中,帽包含m
7GpppUpU。
在一些實施例中,帽包含選自以下序列之序列:m
7G
3′OMepppApA、m
7G
3′OMepppApC、m
7G
3′OMepppApG、m
7G
3′OMepppApU、m
7G
3′OMepppCpA、m
7G
3′OMepppCpC、m
7G
3′OMepppCpG、m
7G
3′OMepppCpU、m
7G
3′OMepppGpA、m
7G
3′OMepppGpC、m
7G
3′OMepppGpG、m
7G
3′OMepppGpU、m
7G
3′OMepppUpA、m
7G
3′OMepppUpC、m
7G
3′OMepppUpG及m
7G
3′OMepppUpU。
在一些實施例中,帽包含m
7G
3′OMepppApA。在一些實施例中,帽包含m
7G
3′OMepppApC。在一些實施例中,帽包含m
7G
3′OMepppApG。在一些實施例中,帽包含m
7G
3′OMepppApU。在一些實施例中,帽包含m
7G
3′OMepppCpA。在一些實施例中,帽包含m
7G
3′OMepppCpC。在一些實施例中,帽包含m
7G
3′OMepppCpG。在一些實施例中,帽包含m
7G
3′OMepppCpU。在一些實施例中,帽包含m
7G
3′OMepppGpA。在一些實施例中,帽包含m
7G
3′OMepppGpC。在一些實施例中,帽包含m
7G
3′OMepppGpG。在一些實施例中,帽包含m
7G
3′OMepppGpU。在一些實施例中,帽包含m
7G
3′OMepppUpA。在一些實施例中,帽包含m
7G
3′OMepppUpC。在一些實施例中,帽包含m
7G
3′OMepppUpG。在一些實施例中,帽包含m
7G
3′OMepppUpU。
在一些實施例中,帽包含選自以下序列之序列:m
7G
3′OMepppA
2′OMepA、m
7G
3′OMepppA
2′OMepC、m
7G
3′OMepppA
2′OMepG、m
7G
3′OMepppA
2′OMepU、m
7G
3′OMepppC
2′OMepA、m
7G
3′OMepppC
2′OMepC、m
7G
3′OMepppC
2′OMepG、m
7G
3′OMepppC
2′OMepU、m
7G
3′OMepppG
2′OMepA、m
7G
3′OMepppG
2′OMepC、m
7G
3′OMepppG
2′OMepG、m
7G
3′OMepppG
2′OMepU、m
7G
3′OMepppU
2′OMepA、m
7G
3′OMepppU
2′OMepC、m
7G
3′OMepppU
2′OMepG及m
7G
3′OMepppU
2′OMepU。
在一些實施例中,帽包含m
7G
3′OMepppA
2′OMepA。在一些實施例中,帽包含m
7G
3′OMepppA
2′OMepC。在一些實施例中,帽包含m
7G
3′OMepppA
2′OMepG。在一些實施例中,帽包含m
7G
3′OMepppA
2′OMepU。在一些實施例中,帽包含m
7G
3′OMepppC
2′OMepA。在一些實施例中,帽包含m
7G
3′OMepppC
2′OMepC。在一些實施例中,帽包含m
7G
3′OMepppC
2′OMepG。在一些實施例中,帽包含m
7G
3′OMepppC
2′OMepU。在一些實施例中,帽包含m
7G
3′OMepppG
2′OMepA。在一些實施例中,帽包含m
7G
3′OMepppG
2′OMepC。在一些實施例中,帽包含m
7G
3′OMepppG
2′OMepG。在一些實施例中,帽包含m
7G
3′OMepppG
2′OMepU。在一些實施例中,帽包含m
7G
3′OMepppU
2′OMepA。在一些實施例中,帽包含m
7G
3′OMepppU
2′OMepC。在一些實施例中,帽包含m
7G
3′OMepppU
2′OMepG。在一些實施例中,帽包含m
7G
3′OMepppU
2′OMepU。
在其他實施例中,帽包含選自以下序列之序列:m
7GpppA
2′OMepA、m
7GpppA
2′OMepC、m
7GpppA
2′OMepG、m
7GpppA
2′OMepU、m
7GpppC
2′OMepA、m
7GpppC
2′OMepC、m
7GpppC
2′OMepG、m
7GpppC
2′OMepU、m
7GpppG
2′OMepA、m
7GpppG
2′OMepC、m
7GpppG
2′OMepG、m
7GpppG
2′OMepU、m
7GpppU
2′OMepA、m
7GpppU
2′OMepC、m
7GpppU
2′OMepG及m
7GpppU
2′OMepU。
在一些實施例中,帽包含m
7GpppA
2′OMepA。在一些實施例中,帽包含m
7GpppA
2′OMepC。在一些實施例中,帽包含m
7GpppA
2′OMepG。在一些實施例中,帽包含m
7GpppA
2′OMepU。在一些實施例中,帽包含m
7GpppC
2′OMepA。在一些實施例中,帽包含m
7GpppC
2′OMepC。在一些實施例中,帽包含m
7GpppC
2′OMepG。在一些實施例中,三核苷酸帽包含m
7GpppC
2′OMepU。在一些實施例中,帽包含m
7GpppG
2′OMepA。在一些實施例中,帽包含m
7GpppG
2′OMepC。在一些實施例中,帽包含m
7GpppG
2′OMepG。在一些實施例中,帽包含m
7GpppG
2′OMepU。在一些實施例中,帽包含m
7GpppU
2′OMepA。在一些實施例中,帽包含m
7GpppU
2′OMepC。在一些實施例中,帽包含m
7GpppU
2′OMepG。在一些實施例中,帽包含m
7GpppU
2′OMepU。
在一些實施例中,帽包含m
7Gpppm
6A
2’OmepG。在一些實施例中,帽包含m
7Gpppe
6A
2’OmepG。
在一些實施例中,帽包含GAG。在一些實施例中,帽包含GCG。在一些實施例中,帽包含GUG。在一些實施例中,帽包含GGG。
在一些實施例中,帽包含以下結構中之任一者:
(C-VI) | |
(C-VII);或 | |
(C-VIII)。 |
在一些實施例中,帽包含
m7GpppN
1N
2N
3,其中N
1、N
2及N
3係視情況選用的(亦即可不存在或可存在一或多個),且獨立地為天然、經修飾或非天然之核苷鹼基。在一些實施例中,
m7G經進一步甲基化,例如在3’位置。在一些實施例中,
m7G在3’位置包含O-甲基。在一些實施例中,N
1、N
2及N
3若存在,則視情況獨立地為腺嘌呤、尿嘧啶、鳥嘌呤、胸腺嘧啶或胞嘧啶。在一些實施例中,N
1、N
2及N
3中之一或多者(或全部)若存在,則經甲基化,例如在2’位置。在一些實施例中,N
1、N
2及N
3中之一或多者(或全部)若存在,則在2’位置具有O-甲基。
在一些實施例中,帽包含以下結構:
(C-IX)
其中B
1、B
2及B
3獨立地為天然、經修飾或非天然之核苷鹼基;且R
1、R
2、R
3及R
4獨立地為OH或O-甲基。在一些實施例中,R
3為O-甲基且R
4為OH。在一些實施例中,R
3及R
4為O-甲基。在一些實施例中,R
4為O-甲基。在一些實施例中,R
1為OH,R
2為OH,R
3為O-甲基,且R
4為OH。在一些實施例中,R
1為OH,R
2為OH,R
3為O-甲基,且R
4為O-甲基。在一些實施例中,R
1及R
2中之至少一者為O-甲基,R
3為O-甲基,且R
4為OH。在一些實施例中,R
1及R
2中之至少一者為O-甲基,R
3為O-甲基,且R
4為O-甲基。
在一些實施例中,B
1、B
2及B
3為天然核苷鹼基。在一些實施例中,B
1、B
2及B
3中之至少一者為經修飾或非天然鹼基。在一些實施例中,B
1、B
2及B
3中之至少一者為N6-甲基腺嘌呤。在一些實施例中,B
1為腺嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。在一些實施例中,B
1為腺嘌呤,B
2為尿嘧啶,且B
3為腺嘌呤。在一些實施例中,R
1及R
2為OH,R
3及R
4為O-甲基,B
1為腺嘌呤,B
2為尿嘧啶,且B
3為腺嘌呤。
在一些實施例中,帽包含選自以下序列之序列:GAAA、GACA、GAGA、GAUA、GCAA、GCCA、GCGA、GCUA、GGAA、GGCA、GGGA、GGUA、GUCA及GUUA。在一些實施例中,帽包含選自以下序列之序列:GAAG、GACG、GAGG、GAUG、GCAG、GCCG、GCGG、GCUG、GGAG、GGCG、GGGG、GGUG、GUCG、GUGG及GUUG。在一些實施例中,帽包含選自以下序列之序列:GAAU、GACU、GAGU、GAUU、GCAU、GCCU、GCGU、GCUU、GGAU、GGCU、GGGU、GGUU、GUAU、GUCU、GUGU及GUUU。在一些實施例中,帽包含選自以下序列之序列:GAAC、GACC、GAGC、GAUC、GCAC、GCCC、GCGC、GCUC、GGAC、GGCC、GGGC、GGUC、GUAC、GUCC、GUGC及GUUC。
在一些實施例中,帽包含選自以下序列之序列:m
7G
3′OMepppApApN、m
7G
3′OMepppApCpN、m
7G
3′OMepppApGpN、m
7G
3′OMepppApUpN、m
7G
3′OMepppCpApN、m
7G
3′OMepppCpCpN、m
7G
3′OMepppCpGpN、m
7G
3′OMepppCpUpN、m
7G
3′OMepppGpApN、m
7G
3′OMepppGpCpN、m
7G
3′OMepppGpGpN、m
7G
3′OMepppGpUpN、m
7G
3′OMepppUpApN、m
7G
3′OMepppUpCpN、m
7G
3′OMepppUpGpN及m
7G
3′OMepppUpUpN,其中N為天然、經修飾或非天然之核苷鹼基。
在一些實施例中,帽包含選自以下序列之序列:m
7G
3′OMepppA
2′OMepApN、m
7G
3′OMepppA
2′OMepCpN、m
7G
3′OMepppA
2′OMepGpN、m
7G
3′OMepppA
2′OMepUpN、m
7G
3′OMepppC
2′OMepApN、m
7G
3′OMepppC
2′OMepCpN、m
7G
3′OMepppC
2′OMepGpN、m
7G
3′OMepppC
2′OMepUpN、m
7G
3′OMepppG
2′OMepApN、m
7G
3′OMepppG
2′OMepCpN、m
7G
3′OMepppG
2′OMepGpN、m
7G
3′OMepppG
2′OMepUpN、m
7G
3′OMepppU
2′OMepApN、m
7G
3′OMepppU
2′OMepCpN、m
7G
3′OMepppU
2′OMepGpN及m
7G
3′OMepppU
2′OMepUpN,其中N為天然、經修飾或非天然之核苷鹼基。
在一些實施例中,帽包含選自以下序列之序列:m
7GpppA
2′OMepApN、m
7GpppA
2′OMepCpN、m
7GpppA
2′OMepGpN、m
7GpppA
2′OMepUpN、m
7GpppC
2′OMepApN、m
7GpppC
2′OMepCpN、m
7GpppC
2′OMepGpN、m
7GpppC
2′OMepUpN、m
7GpppG
2′OMepApN、m
7GpppG
2′OMepCpN、m
7GpppG
2′OMepGpN、m
7GpppG
2′OMepUpN、m
7GpppU
2′OMepApN、m
7GpppU
2′OMepCpN、m
7GpppU
2′OMepGpN及m
7GpppU
2′OMepUpN,其中N為天然、經修飾或非天然之核苷鹼基。
在一些實施例中,帽包含選自以下序列之序列:m
7G
3′OMepppA
2′OMepA
2′OMepN、m
7G
3′OMepppA
2′OMepC
2′OMepN、m
7G
3′OMepppA
2′OMepG
2′OMepN、m
7G
3′OMepppA
2′OMepU
2′OMepN、m
7G
3′OMepppC
2′OMepA
2′OMepN、m
7G
3′OMepppC
2′OMepC
2′OMepN、m
7G
3′OMepppC
2′OMepG
2′OMepN、m
7G
3′OMepppC
2′OMepU
2′OMepN、m
7G
3′OMepppG
2′OMepA
2′OMepN、m
7G
3′OMepppG
2′OMepC
2′OMepN、m
7G
3′OMepppG
2′OMepG
2′OMepN、m
7G
3′OMepppG
2′OMepU
2′OMepN、m
7G
3′OMepppU
2′OMepA
2′OMepN、m
7G
3′OMepppU
2′OMepC
2′OMepN、m
7G
3′OMepppU
2′OMepG
2′OMepN及m
7G
3′OMepppU
2′OMepU
2′OMepN,其中N為天然、經修飾或非天然之核苷鹼基。
在一些實施例中,帽包含選自以下序列之序列:m
7GpppA
2′OMepA
2′OMepN、m
7GpppA
2′OMepC
2′OMepN、m
7GpppA
2′OMepG
2′OMepN、m
7GpppA
2′OMepU
2′OMepN、m
7GpppC
2′OMepA
2′OMepN、m
7GpppC
2′OMepC
2′OMepN、m
7GpppC
2′OMepG
2′OMepN、m
7GpppC
2′OMepU
2′OMepN、m
7GpppG
2′OMepA
2′OMepN、m
7GpppG
2′OMepC
2′OMepN、m
7GpppG
2′OMepG
2′OMepN、m
7GpppG
2′OMepU
2′OMepN、m
7GpppU
2′OMepA
2′OMepN、m
7GpppU
2′OMepC
2′OMepN、m
7GpppU
2′OMepG
2′OMepN及m
7GpppU
2′OMepU
2′OMepN,其中N為天然、經修飾或非天然之核苷鹼基。
在一些實施例中,帽包含GGAG。在一些實施例中,帽包含以下結構:
(C-X)。
14. 經修飾之 5’ 及 3’ 穩定區
本揭示案之IRES元件可(例如)併入至含有5’穩定區及/或3’穩定區之核酸中。在一些實施例中,本發明之核酸包括包含一或多個核苷(例如1至500個核苷,諸如1至200、1至400、1至10、5至15、10至20、15至25、20至30、25至35、30至40、35至45、40至50、45至65、50至70、65至85、70至90、85至105、90至110、105至135、120至150、130至170、150至200或1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200個核苷)之5’及/或3'穩定區。在一些實施例中,5’及/或3'穩定區含有一或多個經化學修飾之核苷,諸如具有替代性核鹼基、糖或主鏈之核苷(例如2'-去氧核苷、3'-去氧核苷、2',3'-二去氧核苷、2'-O-甲基核苷、3'-O-甲基核苷、3'-O-乙基-核苷、3'-阿拉伯糖苷、L-核苷、α-硫基-2'-O-甲基-腺苷、2'-氟-腺苷、阿拉伯糖-腺苷、己糖醇-腺苷、LNA-腺苷、PNA-腺苷、反向胸苷或3'-疊氮基-2',3'-二去氧腺苷)。在一些實施例中,5’及/或3'穩定區包括複數個替代性核苷。在一些實施例中,5’及/或3’穩定區在5’末端、3’末端或5’及/或3’穩定區之內部位置包括至少一個非核苷(例如無鹼基核糖)。
在一些實施例中,5’及/或3'穩定區係由一個核苷組成(例如2'-去氧核苷、3'-去氧核苷、2',3'-二去氧核苷、2'-O-甲基核苷、3'-O-甲基核苷、3'-O-乙基-核苷、3'-阿拉伯糖苷、L-核苷、α-硫基-2'-O-甲基-腺苷、2'-氟-腺苷、阿拉伯糖-腺苷、己糖醇-腺苷、LNA-腺苷、PNA-腺苷、反向胸苷或3'-疊氮基-2’,3'-二去氧腺苷)。
在一些實施例中,5’及/或3'穩定區中之一或多個核苷包括以下結構:
、
、
或
,
式 VII 式 VIII 式 IX 式 X其中B
1為核鹼基;
每一U及U’獨立地為O、S、N(R
U)
nu或C(R
U)
nu,其中nu為1或2 (例如N(R
U)
nu之nu為1且C(R
U)
nu之nu為2)且每一R
U獨立地為H、鹵基或視情況經取代之C
1-C
6烷基;
R
1、R
1’、R
1”、R
2、R
2’、R
2”、R
3、R
4及R
5各自獨立地為H、鹵基、羥基、硫醇、視情況經取代之C
1-C
6烷基、視情況經取代之C
2-C
6炔基、視情況經取代之C
1-C
6雜烷基、視情況經取代之C
2-C
6雜烯基、視情況經取代之C
2-C
6雜炔基、視情況經取代之胺基、疊氮基、視情況經取代之C
6-C
10芳基;或R
3及/或R
5可與R
1、R
1’、R
1”、R
2、R
2’或R
2”中之一者接合在一起以與其所連接之碳一起形成視情況經取代之C
3-C
10碳環或視情況經取代之C
3-C
9雜環基;
m及n各自獨立地為0、1、2、3、4或5;
Y
1、Y
2及Y
3各自獨立地為O、S、Se、-NR
N1-、視情況經取代之C
1-C
6伸烷基或視情況經取代之C
1-C
6伸雜烷基,其中R
N1為H、視情況經取代之C
1-C
6烷基、視情況經取代之C
2-C
6烯基、視情況經取代之C
2-C
6炔基或視情況經取代之C
6-C
10芳基;且
每一Y
4獨立地為H、羥基、受保護羥基、鹵基、硫醇、硼烷基、視情況經取代之C
1-C
6烷基、視情況經取代之C
2-C
6烯基、視情況經取代之C
2-C
6炔基、視情況經取代之C
1-C
6雜烷基、視情況經取代之C
2-C
6雜烯基、視情況經取代之C
2-C
6雜炔基或視情況經取代之胺基;且
Y
5為O、S、Se、視情況經取代之C
1-C
6伸烷基或視情況經取代之C
1-C
6伸雜烷基;
或為其鹽。
在一些實施例中,5’及/或3'穩定區包括複數個腺苷。在一些實施例中,5’及/或3'穩定區之所有核苷均為腺苷。在一些實施例中,5’及/或3'穩定區包括至少一個(例如至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或至少十個)替代性核苷(例如L-核苷,諸如L-腺苷、2'-O-甲基-腺苷、α-硫基-2'-O-甲基-腺苷、2'-氟-腺苷、阿拉伯糖-腺苷、己糖醇-腺苷、LNA-腺苷、PNA-腺苷或反向胸苷)。在一些實施例中,替代性核苷為L-腺苷、2'-O-甲基-腺苷或反向胸苷。在一些實施例中,5’及/或3'穩定區包括複數個替代性核苷。在一些實施例中,3'穩定區中之所有核苷酸均為替代性核苷。在一些實施例中,5’及/或3'穩定區包括至少兩個不同的替代性核苷。在一些實施例中,至少一個替代性核苷為2'-O-甲基-腺苷。在一些實施例中,至少一個替代性核苷為反向胸苷。在一些實施例中,至少一個替代性核苷為2'-O-甲基-腺苷,且至少一個替代性核苷為反向胸苷。
在一些實施例中,穩定區包括以下結構:
式 XI或其鹽;
其中每一X獨立地為O或S;且
A表示腺嘌呤且T表示胸腺嘧啶。
在一些實施例中,每一X為O。在一些實施例中,每一X為S。
在一些實施例中,該複數個替代性核苷全部均為相同的(例如所有替代性核苷均為L-腺苷)。在一些實施例中,5’及/或3’穩定區包括十個核苷。在一些實施例中,5’及/或3’穩定區包括十一個核苷。在一些實施例中,5’及/或3’穩定區包含至少五個L-腺苷(例如至少十個L-腺苷或至少二十個L-腺苷)。在一些實施例中,5’及/或3’穩定區係由五個L-腺苷組成。在一些實施例中,5’及/或3’穩定區係由十個L-腺苷組成。在一些實施例中,5’及/或3’穩定區係由二十個L-腺苷組成。
5’及/或3’穩定區之其他實例為此項技術中所已知,例如如國際專利公開案第WO2013/103659號、第WO2017/049275號及第WO2017/049286號中所闡述,該等專利公開案之5’及/或3’穩定區係以引用的方式併入本文中。
在一些實施例中,3'穩定區之5'末端與3'-UTR之3'末端結合。在一些實施例中,3’穩定區之5'末端與聚A區之3'末端結合。在一些實施例中,3'穩定區之5'末端與聚C區之3'末端結合。在任一前述多核苷酸之一些實施例中,3'穩定區包括多核苷酸之3'末端。
在一些實施例中,5'穩定區之3'末端與5'-UTR之5'末端結合。在一些實施例中,5'穩定區包括多核苷酸之5'末端。
在一些實施例中,5’及/或3’穩定尾例如經由磷酸酯鍵聯與多核苷酸之其餘部分結合。在一些實施例中,磷酸酯鍵聯為天然磷酸酯鍵聯。在一些實施例中,5’及/或3’穩定區與多核苷酸之其餘部分之結合係經由酶促或夾板連接(splint ligation)產生。
在一些實施例中,5’及/或3’穩定尾例如經由化學鍵聯與多核苷酸之其餘部分結合。在一些實施例中,化學鍵聯包括式XII之結構:
式 XII其中a、b、c、e、f及g各自獨立地為0或1;
d為0、1、2或3;
R
6、R
8、R
10及R
12各自獨立地為視情況經取代之C
1-C
6伸烷基、視情況經取代之C
1-C
6伸雜烷基、視情況經取代之C
2-C
6伸烯基、視情況經取代之C
2-C
6伸炔基或視情況經取代之C
6-C
10伸芳基、O、S、Se及NR
13;
R
7及R
11各自獨立地為羰基、硫羰基、磺醯基或磷醯基,其中若R
7為磷醯基,-(R
9)
d-為鍵,且e、f及g為0,則R
6或R
8中之至少一者不為O;且若R
11為磷醯基,-(R
9)
d-為鍵,且a、b及c為0,則R
10或R
12中之至少一者不為O;
每一R
9為視情況經取代之C
1-C
10伸烷基、視情況經取代之C
2-C
10伸烯基、視情況經取代之C
2-C
10伸炔基、視情況經取代之C
2-C
10伸雜環基、視情況經取代之C
6-C
12伸芳基、視情況經取代之C
2-C
100聚乙二醇烯或視情況經取代之C
1-C
10伸雜烷基或將(R
6)
a-(R
7)
b-(R
8)
c與(R
10)
e-(R
11)
f-(R
12)
g連接之鍵,其中若-(R
9)
d-為鍵,則a、b、c、e、f或g中之至少一者為1;且
R
13為氫、視情況經取代之C
1-C
4烷基、視情況經取代之C
2-C
4烯基、視情況經取代之C
2-C
4炔基、視情況經取代之C
2-C
6雜環基、視情況經取代之C
6-C
12芳基或視情況經取代之C
1-C
7雜烷基。
在一些實施例中,化學鍵聯包含式XIII之結構:
式 XIII其中B
1為核鹼基、氫、鹵基、羥基、硫醇、視情況經取代之C
1-C
6烷基、視情況經取代之C
2-C
6烯基、視情況經取代之C
2-C
6炔基、視情況經取代之C
1-C
6雜烷基、視情況經取代之C
2-C
6雜烯基、視情況經取代之C
2-C
6雜炔基、視情況經取代之胺基、疊氮基、視情況經取代之C
3-C
10環烷基、視情況經取代之C
6-C
10芳基、視情況經取代之C
2-C
9雜環;且
R
14及R
15各自獨立地為氫或羥基。
在一些實施例中,化學鍵聯包括以下結構:
、
、
、
、
、
、
、
、
、
、
、
、
、
或醯胺鍵。
將5’及/或3’穩定區與多核苷酸之其餘部分結合之化學鍵聯之其他實例為此項技術中所已知,例如如國際專利公開案第WO2017/049275號及第WO2017/049286號中所闡述,該等專利公開案之化學連接體係以引用的方式併入本文中。
15. 聚 A 尾
在一些實施例中,本揭示案之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)進一步包含聚A尾。在一些實施例中,可出於穩定化併入聚A尾上之末端基團。在一些實施例中,聚A尾包含去3'羥基尾。
在RNA加工期間,可將腺嘌呤核苷酸之長鏈(聚A尾)添加至多核苷酸(例如mRNA分子),以增加穩定性。轉錄後,轉錄本之3'端可立即裂解以釋放3'羥基。接著聚A聚合酶將腺嘌呤核苷酸鏈添加至RNA。該過程稱為多聚腺苷酸化,其添加長度可介於例如大約80至大約250個殘基之間的聚A尾,包括長度為大約80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250個殘基。在一些實施例中,聚A尾之長度為100個核苷酸。
聚A尾亦可在構築體自細胞核中輸出後添加。
根據本揭示案,可出於穩定化併入聚A尾上之末端基團。本揭示案之多核苷酸可包括去3'羥基尾。如Junjie Li等人(Current Biology,第15卷,1501-1507,2005年8月23日,其內容係以全文引用的方式併入本文中)所教示,該等多核苷酸亦可包括結構部分或2'-O-甲基修飾。
本揭示案之多核苷酸可經設計以編碼具有替代性聚A尾結構之轉錄本,包括組織蛋白mRNA。根據Norbury,「在人類複製依賴性組織蛋白mRNA上亦已偵測到末端尿苷化。據認為,該等mRNA之周轉對於防止染色體DNA複製完成或抑制後潛在毒性組織蛋白累積係重要的。該等mRNA之區別在於其缺少3'聚(A)尾,該3'聚(A)尾之功能替代地由穩定莖-環結構及其同源莖-環結合蛋白(SLBP)承擔;後者在多聚腺苷酸化mRNA上執行與PABP相同之功能」(Norbury,「Cytoplasmic RNA: a case of the tail wagging the dog」, Nature Reviews Molecular Cell Biology; AOP,2013年8月29日線上發表;doi:10.1038/nrm3645),該參考文獻之內容係以全文引用的方式併入本文中。
獨特的聚A尾長度為本揭示案之多核苷酸提供某些優勢。通常,當存在聚A尾時,其長度大於30個核苷酸。在一些實施例中,聚A尾之長度大於35個核苷酸(例如至少或大於約35、40、45、50、55、60、70、80、90、100、120、140、160、180、200、250、300、350、400、450、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、1,900、2,000、2,500及3,000個核苷酸)。
在一些實施例中,多核苷酸或其區域包括約30至約3,000個核苷酸(例如30至50個、30至100個、30至250個、30至500個、30至750個、30至1,000個、30至1,500個、30至2,000個、30至2,500個、50至100個、50至250個、50至500個、50至750個、50至1,000個、50至1,500個、50至2,000個、50至2,500個、50至3,000個、100至500個、100至750個、100至1,000個、100至1,500個、100至2,000個、100至2,500個、100至3,000個、500至750個、500至1,000個、500至1,500個、500至2,000個、500至2,500個、500至3,000個、1,000至1,500個、1,000至2,000個、1,000至2,500個、1,000至3,000個、1,500至2,000個、1,500至2,500個、1,500至3,000個、2,000至3,000個、2,000至2,500個及2,500至3,000個)。
在一些實施例中,聚A尾係相對於整個多核苷酸之長度或多核苷酸之特定區域之長度來設計。此設計可基於編碼區之長度、特定特徵或區域之長度或基於自多核苷酸表現之最終產物之長度。
在此背景中,聚A尾可較多核苷酸或其特徵長10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。亦可將聚A尾設計為其所屬多核苷酸之一部分。在此背景中,聚A尾可為構築體總長度、構築體區域或構築體總長度減去聚A尾之10%、20%、30%、40%、50%、60%、70%、80%或90%或更多。此外,聚A結合蛋白之工程化結合位點及多核苷酸之結合可增強表現。
另外,可使用經修飾之核苷酸在聚A尾之3'末端經由PABP (聚A結合蛋白)經3'端將多個不同的多核苷酸連接在一起。可在相關細胞株中進行轉染實驗,且可在轉染後12小時、24小時、48小時、72小時及7天藉由ELISA分析蛋白質產生。
在一些實施例中,本揭示案之多核苷酸經設計以包括聚A-G四聯體區域。G-四聯體係四個鳥嘌呤核苷酸之環狀氫鍵結陣列,其可由DNA及RNA中富含G之序列形成。在一些實施例中,G-四聯體在聚A尾之末端併入。分析所得多核苷酸之穩定性、蛋白質產生及其他參數,包括在各個時間點之半衰期。已發現,聚A-G四聯體導致mRNA產生之蛋白質相當於僅使用120個核苷酸之聚A尾所觀察到之蛋白質的至少75%。
在一些實施例中,聚A尾包含替代性核苷,例如反向胸苷。可如本文所闡述生成包含替代性核苷(例如反向胸苷)之聚A尾。舉例而言,可藉由連接修飾mRNA構築體,以穩定聚(A)尾。可使用以下來實施連接:0.5-1.5 mg/mL mRNA (5'帽1,3' A100)、50 mM Tris-HCl pH 7.5、10 mM MgCl
2、1 mM TCEP、1000個單位/mL T4 RNA連接酶1、1 mM ATP、20% w/v聚乙二醇8000及5:1莫耳比之修飾性寡核苷酸對mRNA。修飾性寡核苷酸具有5’-磷酸-AAAAAAAAAAAAAAAAAAAA-(反向去氧胸苷(idT) (SEQ ID NO: 77))之序列(參見下文)。將連接反應物混合且在室溫下(約22℃)培育例如4小時。藉由例如dT純化、反相純化、羥磷灰石純化、超濾至水中及無菌過濾來純化穩定尾mRNA。所得含有穩定尾之mRNA在3’端含有以下結構,以聚A區域開始:A
100-UCUAGAAAAAAAAAAAAAAAAAAAA-反向去氧胸苷(SEQ ID NO: 78)。
用以穩定尾之修飾性寡核苷酸(5’-磷酸-AAAAAAAAAAAAAAAAAAAA-(反向去氧胸苷) (SEQ ID NO: 77)):
在一些情況下,聚A尾包含A100-UCUAG-A20-反向去氧-胸苷(SEQ ID NO: 78)。在一些情況下,聚A尾係由A100-UCUAG-A20-反向去氧-胸苷(SEQ ID NO: 78)組成。
16. 分子系鏈
本揭示案係關於含有藉助分子間系鏈結合第二多核苷酸之第一多核苷酸的系統。舉例而言,第一多核苷酸可含有結合元件,該結合元件包括由RNA結合蛋白或其片段(例如系鏈分子,例如如本文所揭示)結合(例如由其識別)之序列(例如DNA或RNA序列)。在一些實施例中,系鏈分子結合至包含結合元件之序列或其片段。在一些實施例中,系鏈分子結合至包含結合元件之結構或其片段。
在一些實施例中,第一多核苷酸之結合元件由第二多核苷酸之系鏈分子結合,例如進一步包含系鏈分子之效應分子。
在一些實施例中,系鏈分子選自
表 10中所提供之系鏈分子,例如MBP、PCP、Lambda N、U1A或PUF、15.5kd或LARP7或其變異體或片段。在一些實施例中,結合元件包含由系鏈分子結合(例如識別)之序列。在一些實施例中,結合元件包含含有由系鏈分子結合(例如識別)之結構之序列。
在一些實施例中,結合元件選自
表 10中所提供之結合元件,例如MS2、PP7、BoxB、U1A髮夾、PRE、扭結轉角形成序列、7sk或其變異體或片段。在一些實施例中,結合元件為MS2。在一些實施例中,結合元件為PP7。在一些實施例中,結合元件為BoxB。在一些實施例中,結合元件為U1A髮夾。在一些實施例中,結合元件為PRE。在一些實施例中,結合元件為扭結轉角形成序列。在一些實施例中,結合元件為7SK。
在一些實施例中,當結合元件為MS2 (例如野生型MS2或其變異體或片段)時,系鏈分子為MBP (例如野生型MBP、其變異體或片段)。
在一些實施例中,當結合元件為PP7 (例如野生型PP7或其變異體或片段)時,系鏈分子為PCP (例如野生型PCP或其變異體或片段)。
在一些實施例中,當結合元件為BoxB (例如野生型BoxB或其變異體或片段)時,系鏈分子為Lambda N (例如野生型Lambda N或其變異體或片段)。
在一些實施例中,當結合元件為U1A髮夾(例如野生型U1A髮夾或其變異體或片段)時,系鏈分子為U1A (例如野生型U1A或其變異體或片段)。
在一些實施例中,當結合元件為PRE (例如野生型PRE或其變異體或片段)時,系鏈分子為PUF (例如野生型PUF或其變異體或片段)。
在一些實施例中,當結合元件為扭結轉角形成序列時,系鏈分子為15.5kd (例如野生型15.5kd或其變異體或片段)。
在一些實施例中,當結合元件為7sk序列時,系鏈分子為LARP7 (例如野生型LARP7或其變異體或片段)。
表 10. 例示性結合元件及系鏈分子
RNA 結合蛋白 (RBP) | RNA 元件 | 確認依據 |
PUF | PRE | 序列 |
MBP | MS2 | 結構 |
PCP | PP7 | 結構 |
lambda N | boxB | 結構 |
U1A | U1A髮夾 | 結構 |
15.5kd | 扭結轉角形成序列 | 結構 |
LARP7 | 7sk | 結構 |
在一些實施例中,結合元件包含含有5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90或100個核苷酸之序列。在一些實施例中,結合元件包含含有約5-100、約5-90、約5-80、約5-70、約5-60、約5-50、約5-40、約5-30、約5-25、約5-20、約5-19、約5-18、約5-17、約5-16、約5-15、約5-14、約5-13、約5-12、約5-11、約5-10、約5-9、約5-8、約5-7或約5-6個核苷酸之序列。在一些實施例中,結合元件包含含有約5-100、約6-100、約7-100、約8-100、約9-100、約10-100、約11-100、約12-100、約13-100、約14-100、約15-100、約16-100、約17-100、約18-100、約19-100、約20-100、約21-100、約22-100、約23-100、約24-100、約25-100、約30-100、約40-100、約50-100、約60-100、約70-100、約80-100或約90-100個核苷酸之序列。在一些實施例中,結合元件包含含有約5-100、約6-90、約7-80、約8-70、約9-60、約10-50、約11-40、約12-30、約13-25、約14-24、約15-23、約16-22、約17-21或約18-20個核苷酸之序列。在一些實施例中,結合元件包含含有19個核苷酸之序列。
在一些實施例中,結合元件包含
表 11中所提供之結合元件核苷酸序列或與其具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,結合元件包含SEQ ID NO: 79、SEQ ID NO: 80、SEQ ID NO: 81、SEQ ID NO: 82中所提供之結合元件序列或與其具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。
在本文所揭示之系統、LNP組合物、方法或用途中之任一者之一些實施例中,結合元件包含由第二多核苷酸之系鏈分子結合之序列的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20或30個重複序列。在一些實施例中,結合元件包含由第二多核苷酸之系鏈分子結合之序列的不超過80、70、60、50、40或30個重複序列。在一些實施例中,結合元件包含由第二多核苷酸之系鏈分子結合之序列的約1-30、約1-20、約1-10、約1-9、約1-8、約1-7、約1-6、約1-5、約1-4、約1-3或約1-2個重複序列。在一些實施例中,結合元件包含由第二多核苷酸之系鏈分子結合之序列的約1-30、約2-30、約3-30、約4-30、約5-30、約6-30、約7-30、約8-30、約9-30、約10-30、約11-30、約12-30、約13-30、約14-30、約15-30或約20-30個重複序列。在一些實施例中,結合元件包含由第二多核苷酸之系鏈分子結合之序列的約1-30、約2-20、約3-15、約4-14、約5-13、約6-12、約7-11或約8-10個重複序列。在一些實施例中,結合元件包含由第二多核苷酸之系鏈分子結合之序列的6個重複序列。
在本文所揭示之系統、LNP組合物、方法或用途中之任一者之一些實施例中,每一重複序列由包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90或100個核苷酸之間隔區序列隔開。在一些實施例中,間隔區序列包含約1-100、約1-90、約1-80、約1-70、約1-60、約1-50、約1-40、約1-30、約1-25、約1-20、約1-19、約1-18、約1-17、約1-16、約1-15、約1-14、約1-13、約1-12、約1-11、約1-10、約1-9、約1-8、約1-7、約1-6、約1-5、約1-4、約1-3或約1-2個核苷酸。在一些實施例中,間隔區序列包含約1-100、約2-100、約3-100、約4-100、約5-100、約6-100、約7-100、約8-100、約9-100、約10-100、約11-100、約12-100、約13-100、約14-100、約15-100、約16-100、約17-100、約18-100、約19-100、約20-100、約21-100、約22-100、約23-100、約24-100、約25-100、約30-100、約40-100、約50-100、約60-100、約70-100、約80-100或約90-100個核苷酸。在一些實施例中,間隔區序列包含約1-100、約2-90、約3-80、約4-70、約5-60、約6-50、約7-40、約8-40、約9-30、約10-25、約11-24、約12-23、約13-22、約14-21、約15-20、約16-19、約17-18個核苷酸。在一些實施例中,間隔區序列包含20個核苷酸。
在一些實施例中,間隔區序列包含
表 11中所提供之間隔區序列或與其具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。
表 11. 結合元件、系鏈分子及 / 或效應分子之例示性序列
SEQ ID NO | 序列資訊 | 序列 |
79 | 3’v1.1_6xMS2 (MS2序列為粗體且加下劃線) | TGATAATAGGCTGGAGCCTCGGTGGCCTAGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGAGTGGGCGGC CAGGTATGATTACAACCTG TGCTACTTTAGATGACTATT GAAAGACCATTAGGCTTT CTAACGGACGCTCACGAGAGA GGGGCACCAATAGGGCCCC ACGGCACTTCAAAGGTTTGG CTTGGAGTAGTAACCCAAG CAGCAACAGTTTTGACTTTCGGACCACCATCAGGGGTCCCACGTTGGGAACACGTAACT CTCCTACTAACAAGAGGAG |
80 | 3’6xMS2_3’v1.1 (MS2序列為粗體且加下劃線) | TGATAATAG CAGGTATGATTACAACCTG TGCTACTTTAGATGACTATT GAAAGACCATTAGGCTTTC TAACGGACGCTCACGAGAGA GGGGCACCAATAGGGCCCC ACGGCACTTCAAAGGTTTGG CTTGGAGTAGTAACCCAAG CAGCAACAGTTTTGACTTTC GGACCACCATCAGGGGTCC CACGTTGGGAACACGTAACT CTCCTACTAACAAGAGGAG GCTGGAGCCTCGGTGGCCTAGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGAGTGGGCGGC |
81 | 3’_6xMS2 (MS2序列為粗體且加下劃線) | TGATAATAG CAGGTATGATTACAACCTG TGCTACTTTAGATGACTATT GAAAGACCATTAGGCTTTC TAACGGACGCTCACGAGAGA GGGGCACCAATAGGGCCCC ACGGCACTTCAAAGGTTTGG CTTGGAGTAGTAACCCAAG CAGCAACAGTTTTGACTTTC GGACCACCATCAGGGGTCC CACGTTGGGAACACGTAACT CTCCTACTAACAAGAGGAG |
82 | 3’v1.1 | TGATAATAGGCTGGAGCCTCGGTGGCCTAGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGAGTGGGCGGC |
83 | 3'UTR_24MS2 | TGATAATAGGCGCGATGATCACACGCGCACGCGAAGCTTGTGTTCGCACGGCAAGCAGCAGCTGCCGTGGAGGCTTCCACGGCGAAATGTCCACGAATACGGGACAAATAATTGATATAGGGCCGGCCCGTAAGAGTACTACGGGATGATTCTCTTGACTTAAGTGCCGGACCACTAGGCCGGCAACGGACAGACAAAGAGGCTCTGGGACTACCAAGCCCAGTCACACGGTACTTCAAGGCACCGGGAACAGTAGTCCCGGAGTGTTGACTTATAGAAGTAGTCCCATTATTAAAGGGACTTCGGGACTTCCCTTCTCGCTCCCGACCAGTAGGCGGGAAATGCGCCCTCCCGTACTGTCCTGCACCATTAGGGCAGGTTCTTTGAGGCTCTCTCGCTCGTGTATGAATACAACACGTGTGCGTCCTGTCCCCTCGTGACTCAGGACTACCGAGTCACAGCAAACTTAAAGGATCGCACGGACGAACACGCCGTGACATAGCTAATCAGACAATGGCACCAGTACCAACGGTGCACGTTGACACTCGAACGTGATTGACAGGATTACCGTCAACTCTTCCACTAGCCCGTTACTGGCAAGGATTACCTGCCACTGTTTTGTCTTAACCGGTTGACGTATCAACAGAACGTCTGGTAGCAGCCACGCTTACTGGGCCATTAATAAAGGCCCAAGGAACTTAAAGCCAGTGCCCGGCACTATCAAGGCCGGGCATCATTGATTCGACGCCGGACGGAGGAGCACCCCGTCGGGCATCGCGGCCCTGCGGGTGCTAAACAGTAGTTAGCAGACATTTAGCGCCGGTTTGAAGCCCACGAGTACGGGGCTTAGCAGCTCCAGATACACGGCGGGAACTACTAAGTCCCGTAAACTCTCCACTATCGCCGGGCCAATCAATAGATGGCC |
84 | 5’ v1.1 | GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGACCCCGGCGCCGCCACC |
效應分子或系鏈分子序列 | ||
85 | MBP (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY |
86 | MBP (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTAC |
87 | eIF4GdN (aa) | IFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN |
88 | eIF4GdN (nt) | ATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
89 | MBP-eIF4GdN (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN |
90 | MBP-eIF4GdN (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
91 | MBP_eIF4G(fl) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSNKAPQSTGPPPAPSPGLPQPAFPPGQTAPVVFSTPQATQMNTPSQPRQHFYPSRAQPPSSAASRVQSAAPARPGPAAHVYPAGSQVMMIPSQISYPASQGAYYIPGQGRSTYVVPTQQYPVQPGAPGFYPGASPTEFGTYAGAYYPAQGVQQFPTGVAPTPVLMNQPPQIAPKRERKTIRIRDPNQGGKDITEEIMSGARTASTPTPPQTGGGLEPQANGETPQVAVIVRPDDRSQGAIIADRPGLPGPEHSPSESQPSSPSPTPSPSPVLEPGSEPNLAVLSIPGDTMTTIQMSVEESTPISRETGEPYRLSPEPTPLAEPILEVEVTLSKPVPESEFSSSPLQAPTPLASHTVEIHEPNGMVPSEDLEPEVESSPELAPPPACPSESPVPIAPTAQPEELLNGAPSPPAVDLSPVSEPEEQAKEVTASMAPPTIPSATPATAPSATSPAQEEEMEEEEEEEEGEAGEAGEAESEKGGEELLPPESTPIPANLSQNLEAAAATQVAVSVPKRRRKIKELNKKEAVGDLLDAFKEANPAVPEVENQPPAGSNPGPESEGSGVPPRPEEADETWDSKEDKIHNAENIQPGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN |
92 | MBP_eIF4G(fl) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCAACAAGGCCCCTCAGAGCACCGGCCCTCCTCCTGCCCCTAGCCCTGGCCTGCCTCAGCCTGCCTTCCCTCCTGGCCAGACCGCCCCTGTGGTGTTCAGCACCCCTCAGGCCACCCAGATGAACACACCTAGCCAGCCTAGACAGCACTTCTACCCTAGCAGAGCCCAGCCTCCTAGCAGCGCCGCCAGCAGAGTGCAGTCCGCTGCACCTGCCAGACCTGGCCCTGCCGCCCACGTGTACCCTGCCGGCAGCCAGGTGATGATGATCCCGAGTCAAATCAGCTACCCTGCAAGCCAGGGCGCCTACTACATCCCGGGCCAGGGCAGAAGCACCTACGTGGTGCCTACCCAGCAGTACCCTGTGCAGCCTGGCGCCCCTGGTTTCTATCCTGGCGCAAGCCCTACCGAGTTCGGAACTTACGCCGGCGCTTACTATCCAGCTCAGGGCGTGCAGCAGTTCCCTACCGGCGTGGCCCCTACCCCTGTGCTGATGAATCAGCCACCTCAGATCGCCCCTAAGCGCGAGCGCAAGACCATCAGAATCCGCGATCCTAACCAGGGCGGCAAGGACATCACCGAGGAGATCATGAGCGGCGCCAGAACAGCAAGTACTCCAACCCCGCCACAAACCGGCGGCGGCCTGGAGCCTCAAGCCAACGGCGAGACGCCACAAGTGGCCGTGATCGTACGCCCTGACGACCGGAGCCAAGGTGCAATCATCGCCGATAGGCCTGGCCTCCCAGGTCCGGAGCACAGCCCTAGCGAGTCCCAGCCGTCTTCACCATCACCAACCCCTAGTCCATCCCCTGTTCTCGAACCAGGCAGCGAGCCTAACCTGGCCGTGCTGAGCATACCAGGTGACACCATGACCACCATCCAGATGAGCGTGGAGGAGAGCACCCCAATCAGCAGAGAAACTGGAGAGCCTTACAGACTGTCCCCAGAGCCGACCCCACTGGCCGAGCCAATACTGGAGGTGGAGGTGACCCTGAGCAAGCCTGTGCCTGAGAGCGAGTTCAGCTCCTCTCCACTGCAGGCCCCAACTCCTCTCGCAAGCCACACCGTGGAGATCCACGAACCTAACGGCATGGTACCAAGCGAAGATCTTGAGCCAGAGGTCGAATCAAGCCCAGAACTGGCCCCTCCACCTGCCTGCCCGTCTGAATCTCCGGTCCCTATCGCTCCTACGGCACAGCCTGAGGAGCTGCTGAACGGTGCCCCGAGCCCTCCAGCAGTGGACTTATCCCCAGTATCAGAGCCTGAAGAACAGGCCAAGGAGGTAACTGCCTCTATGGCGCCACCTACCATACCTTCGGCAACACCGGCTACAGCACCATCTGCGACTAGTCCGGCTCAGGAGGAGGAGATGGAGGAAGAAGAAGAGGAAGAGGAGGGCGAGGCCGGAGAGGCCGGTGAAGCCGAGTCCGAGAAGGGCGGCGAAGAACTTCTCCCTCCAGAGTCAACTCCTATCCCTGCCAACCTTAGTCAGAATCTGGAGGCCGCCGCCGCTACTCAGGTTGCAGTGAGCGTGCCAAAGAGACGTCGCAAGATCAAGGAGCTGAACAAGAAGGAGGCCGTGGGCGACCTGCTGGACGCCTTCAAGGAGGCAAACCCGGCGGTGCCTGAAGTGGAGAATCAGCCTCCGGCCGGATCAAACCCTGGTCCTGAGAGTGAAGGCAGCGGCGTCCCACCAAGACCTGAAGAGGCTGACGAAACTTGGGACAGCAAGGAGGACAAGATCCACAACGCCGAGAACATCCAGCCAGGCGAGCAGAAGTACGAGTACAAGAGCGACCAGTGGAAGCCTCTTAACCTTGAAGAGAAGAAGAGATACGACAGAGAGTTCCTGCTGGGCTTCCAGTTCATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
93 | MBP_eIF4G-dN (623-1599, 3A) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSIANKATPQMAQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDR LERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALK SVTAFFKWLREAEEESDHN |
94 | MBP_eIF4G-dN (623-1599, 3A) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCGCGAACAAGGCGACCCCTCAGATGGCGCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
95 | MBP_eIF4G-dN2 (653-1599) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLG KAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN |
96 | MBP_eIF4G-dN2 (653-1599) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
97 | MBP_eIF4G-dN3 (653-1451) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLG KAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEES EAPGQRALPSEELNRQLEKLL |
98 | MBP_eIF4G-dN3 (653-1451) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTC |
99 | MBP_eIF4G-mid1 (674-1079) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKR RGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSID |
100 | MBP_eIF4G-mid1 (674-1079) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGAC |
101 | MBP_eIF4G-mid2 (653-1130) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAV |
102 | MBP_eIF4G-mid2 (653-1130) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTG |
103 | MBP_eIF4G-mid3 (712-1130) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAV |
104 | MBP_eIF4G-mid3 (712-1130) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTG |
105 | MBP_eIF4G-C1 (1080-1599) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN |
106 | MBP_eIF4G-C1 (1080-1599) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
107 | MBP_eIF4G-C2 (1080-1451) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLL |
108 | MBP_eIF4G-C2 (1080-1451) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTC |
109 | MBP-CTIF (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSENSSAASASSEAGSSRSQEIEELERFIDSYVLEYQVQGLLADKTEGDGESERTQSHISQWTADCSEPLDSSCSFSRGRAPPQQNGSKDNSLDMLGTDIWAANTFDSFSGATWDLQPEKLDFTQFHRKVRHTPKQPLPHIDREGCGKGKLEDGDGINLNDIEKVLPAWQGYHPMPHEVEIAHTKKLFRRRRNDRRRQQRPPGGNKPQQHGDHQPGSAKHNRDHQKSYQGGSAPHPSGRPTHHGYSQNRRWHHGNMKHPPGDKGEAGAHRNAKETMTIENPKLEDTAGDTGHSSLEAPRSPDTLAPVASERLPPQQSGGPEVETKRKDSILPERIGERPKITLLQSSKDRLRRRLKEKDEVAVETTTPQQNKMDKLIEILNSMRNNSSDVDTKLTTFMEEAQNSTNSEEMLGEIVRTIYQKAVSDRSFAFTAAKLCDKMALFMVEGTKFRSLLLNMLQKDFTVREELQQQDVERWLGFITFLCEVFGTMRSSTGEPFRVLVCPIYTCLRELLQSQDVKEDAVLCCSMELQSTGRLLEEQLPEMMTELLASARDKMLCPSESMLTRSLLLEVIELHANSWNPLTPPITQYYNRTIQKLTA |
110 | MBP-CTIF (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGAGAACAGTAGCGCCGCTAGCGCGAGCAGCGAAGCCGGGAGCAGCCGGTCTCAGGAGATCGAGGAGCTGGAGCGGTTCATCGACAGCTACGTGCTGGAGTACCAGGTGCAGGGCCTGCTGGCCGACAAGACCGAGGGCGACGGCGAGAGCGAGCGGACCCAGAGCCACATCAGCCAGTGGACCGCCGACTGCAGCGAGCCCCTGGACTCTAGCTGCTCATTCAGTCGTGGACGGGCCCCTCCACAGCAGAACGGCAGCAAGGACAACAGCCTGGACATGCTGGGCACCGACATCTGGGCCGCCAACACCTTCGACAGCTTCAGCGGCGCCACCTGGGATCTGCAGCCCGAGAAGCTGGACTTTACCCAGTTCCACCGGAAGGTGCGGCACACTCCCAAGCAGCCCCTGCCCCACATCGATCGGGAGGGCTGCGGCAAGGGCAAGCTGGAAGACGGCGACGGCATCAACCTGAACGACATCGAGAAGGTGCTGCCTGCCTGGCAGGGCTACCACCCCATGCCCCACGAGGTGGAGATCGCCCACACCAAGAAGCTGTTCCGGCGACGACGCAACGACCGGCGTAGGCAGCAACGGCCGCCTGGAGGGAACAAGCCCCAGCAGCACGGAGACCACCAGCCCGGTAGCGCCAAGCACAACCGGGACCACCAGAAGAGCTACCAGGGCGGAAGCGCACCACACCCCTCGGGCAGACCCACCCACCACGGCTACAGCCAGAACCGGCGGTGGCATCACGGTAACATGAAGCACCCACCCGGCGACAAAGGAGAGGCCGGCGCTCACCGTAACGCCAAGGAGACCATGACCATCGAGAACCCCAAGCTGGAGGATACCGCCGGCGATACGGGTCACAGCAGCCTGGAGGCACCGCGGTCTCCCGACACCCTGGCACCCGTGGCCAGCGAACGGCTGCCACCCCAACAGAGCGGCGGCCCTGAGGTTGAGACCAAGCGGAAGGACAGCATCCTGCCCGAACGGATCGGTGAGCGGCCCAAGATCACCTTACTGCAGAGTAGCAAGGACCGGCTGAGACGGCGGCTGAAGGAGAAGGACGAGGTGGCCGTGGAGACAACCACTCCCCAGCAGAACAAGATGGACAAGCTGATCGAGATCCTGAACAGCATGCGGAACAACAGCAGCGACGTGGACACCAAGCTGACCACCTTCATGGAGGAGGCCCAGAACAGCACCAACAGCGAGGAGATGCTGGGCGAGATCGTGCGGACCATCTACCAGAAGGCCGTGAGCGACCGGAGCTTCGCCTTCACCGCCGCCAAGCTGTGCGACAAGATGGCCCTGTTCATGGTGGAGGGCACCAAGTTCCGGAGCTTACTGCTGAATATGCTGCAGAAGGACTTCACCGTGCGGGAGGAGCTGCAGCAGCAGGACGTGGAGCGGTGGCTGGGCTTCATCACCTTCCTGTGCGAGGTGTTCGGCACCATGCGGAGCAGCACCGGCGAACCCTTCCGGGTGCTGGTGTGCCCCATCTACACCTGCCTGCGGGAGTTGCTGCAGAGCCAGGACGTGAAGGAGGACGCCGTGCTGTGCTGCAGCATGGAACTGCAGAGCACTGGCCGGCTGCTGGAGGAGCAGCTGCCCGAGATGATGACCGAGCTGCTCGCTAGCGCCCGGGACAAGATGCTGTGCCCCAGCGAGAGCATGCTGACCCGGAGCCTGCTTCTGGAGGTGATCGAGCTGCACGCCAACAGCTGGAATCCCCTGACCCCTCCCATCACCCAGTACTACAACCGGACCATCCAGAAGCTGACCGCC |
111 | MBP--CTIF(379-579) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSLNSMRNNSSDVDTKLTTFMEEAQNSTNSEEMLGEIVRTIYQKAVSDRSFAFTAAKLCDKMALFMVEGTKFRSLLLNMLQKDFTVREELQQQDVERWLGFITFLCEVFGTMRSSTGEPFRVLVCPIYTCLRELLQSQDVKEDAVLCCSMELQSTGRLLEEQLPEMMTELLASARDKMLCPSESMLTRSLLLEVIELHANSWN |
112 | MBP--CTIF(379-579) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCCTGAACAGCATGAGAAACAACAGCAGCGACGTGGACACCAAGCTGACCACCTTCATGGAGGAGGCCCAGAACAGCACCAACAGCGAGGAGATGCTGGGCGAGATCGTGAGAACCATCTACCAGAAGGCCGTGAGCGACAGAAGCTTCGCCTTCACCGCCGCCAAGCTGTGCGACAAGATGGCCCTGTTCATGGTGGAGGGCACCAAGTTCAGAAGCCTGCTGCTGAACATGCTGCAGAAGGACTTCACCGTGAGAGAGGAGCTGCAGCAGCAGGACGTGGAGCGATGGCTGGGCTTCATCACCTTCCTGTGCGAGGTGTTCGGCACCATGAGAAGCAGCACCGGCGAGCCTTTCAGAGTGCTGGTGTGCCCTATCTACACCTGCCTGAGAGAGCTGCTGCAGAGCCAGGACGTGAAGGAGGACGCCGTGCTGTGCTGCAGCATGGAGCTGCAGAGCACCGGCAGACTGCTGGAGGAGCAGCTGCCTGAGATGATGACCGAGCTGCTGGCCAGCGCCAGAGACAAGATGCTGTGCCCTAGCGAGAGCATGCTGACTAGATCCCTACTGTTGGAGGTGATCGAGCTGCACGCCAACAGCTGGAAC |
113 | MBP-_CTIF(365-598) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSTTPQQNKMDKLIEILNSMRNNSSDVDTKLTTFMEEAQNSTNSEEMLGEIVRTIYQKAVSDRSFAFTAAKLCDKMALFMVEGTKFRSLLLNMLQKDFTVREELQQQDVERWLGFITFLCEVFGTMRSSTGEPFRVLVCPIYTCLRELLQSQDVKEDAVLCCSMELQSTGRLLEEQLPEMMTELLASARDKMLCPSESMLTRSLLLEVIELHANSWNPLTPPITQYYNRTIQKLTA |
114 | MBP-_CTIF(365-598) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCACCACCCCTCAGCAGAACAAGATGGACAAGCTGATCGAGATCCTGAACAGCATGAGAAACAACAGCAGCGACGTGGACACCAAGCTGACCACCTTCATGGAGGAGGCCCAGAACAGCACCAACAGCGAGGAGATGCTGGGCGAGATCGTGAGAACCATCTACCAGAAGGCCGTGAGCGACAGAAGCTTCGCCTTCACCGCCGCCAAGCTGTGCGACAAGATGGCCCTGTTCATGGTGGAGGGCACCAAGTTCAGAAGCCTGCTGCTGAACATGCTGCAGAAGGACTTCACCGTGAGAGAGGAGCTGCAGCAGCAGGACGTGGAGAGGTGGCTGGGCTTCATCACCTTCCTGTGCGAGGTGTTCGGCACCATGAGAAGCAGCACCGGCGAGCCTTTCAGAGTGCTGGTGTGCCCTATCTACACCTGCCTGAGAGAGCTGCTGCAGAGCCAGGACGTGAAGGAGGACGCCGTGCTGTGCTGCAGCATGGAGCTGCAGAGCACCGGCAGACTGCTGGAGGAGCAGCTGCCTGAGATGATGACCGAGCTGCTGGCCAGCGCCAGAGACAAGATGCTGTGCCCTAGCGAGAGCATGCTGACGCGCAGCCTCCTGCTGGAGGTGATCGAGCTGCACGCCAACAGCTGGAACCCTCTGACCCCTCCTATCACCCAGTACTACAACAGAACCATCCAGAAGCTGACCGCC |
115 | MBP-eIF4G-mid4(752-993) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPR |
116 | MBP-eIF4G-mid4(752-993) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGCCGACGGCAGCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTGAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACCCAGCTGGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTCGAGAAGGCCATCAGCGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGGTGCCTGATGGCCCTGAAGGTGCCTACCACCGAGAAGCCTACCGTGACCGTGAACTTCAGAAAGCTGCTGCTGAACCGGTGCCAGAAGGAGTTCGAGAAGGACAAGGACGACGACGAGGTGTTCGAGAAGAAGCAGAAGGAGATGGACGAGGCCGCCACCGCCGAGGAGAGAGGCAGACTGAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGAAGAAGAAGCCTGGGCAACATCAAGTTCATCGGCGAGCTGTTCAAGCTGAAGATGCTGACCGAGGCCATCATGCACGACTGCGTGGTGAAGCTGCTGAAGAACCACGACGAGGAGAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGATTTCGAGAAGGCGAAGCCTAGAATGGACCAGTACTTCAACCAGATGGAGAAGATCATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTGCTGGACCTGAGAGGCAGCAACTGGGTGCCTAGA |
117 | MBP-LacZ (對照) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSSFTLTNKNVIFVAGLGGIGLDTSKELLKRDPVVLQRRDWENPGVTQLNRLAAHPPFASWRNSEEARTDRPSQQLRSLNGEWRFAWFPAPEAVPESWLECDLPEADTVVVPSNWQMHGYDAPIYTNVTYPITVNPPFVPTENPTGCYSLTFNVDESWLQEGQTRIIFDGVNSAFHLWCNGRWVGYGQDSRLPSEFDLSAFLRAGENRLAVMVLRWSDGSYLEDQDMWRMSGIFRDVSLLHKPTTQISDFHVATRFNDDFSRAVLEAEVQMCGELRDYLRVTVSLWQGETQVASGTAPFGGEIIDERGGYADRVTLRLNVENPKLWSAEIPNLYRAVVELHTADGTLIEAEACDVGFREVRIENGLLLLNGKPLLIRGVNRHEHHPLHGQVMDEQTMVQDILLMKQNNFNAVRCSHYPNHPLWYTLCDRYGLYVVDEANIETHGMVPMNRLTDDPRWLPAMSERVTRMVQRDRNHPSVIIWSLGNESGHGANHDALYRWIKSVDPSRPVQYEGGGADTTATDIICPMYARVDEDQPFPAVPKWSIKKWLSLPGETRPLILCEYAHAMGNSLGGFAKYWQAFRQYPRLQGGFVWDWVDQSLIKYDENGNPWSAYGGDFGDTPNDRQFCMNGLVFADRTPHPALTEAKHQQQFFQFRLSGQTIEVTSEYLFRHSDNELLHWMVALDGKPLASGEVPLDVAPQGKQLIELPELPQPESAGQLWLTVRVVQPNATAWSEAGHISAWQQWRLAENLSVTLPAASHAIPHLTTSEMDFCIELGNKRWQFNRQSGFLSQMWIGDKKQLLTPLRDQFTRAPLDNDIGVSEATRIDPNAWVERWKAAGHYQAEAALLQCTADTLADAVLITTAHAWQHQGKTLFISRKTYRIDGSGQMAITVDVEVASDTPHPARIGLNCQLAQVAERVNWLGLGPQENYPDRLTAACFDRWDLPLSDMYTPYVFPSENGLRCGTRELNYGPHQWRGDFQFNISRYSQQQLMETSHRHLLHAEEGTWLNIDGFHMGIGGDDSWSPSVSAELQLSAGRYHYQLVWCQK |
118 | MBP-LacZ (對照) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCTCGTTCACGCTAACGAACAAGAACGTCATCTTCGTAGCGGGACTTGGCGGTATCGGCCTAGACACGTCGAAGGAACTACTAAAGCGTGACCCGGTAGTCCTCCAACGTCGCGATTGGGAGAACCCGGGCGTAACGCAACTAAACCGTCTTGCGGCGCACCCGCCGTTTGCGTCGTGGCGTAACTCGGAGGAGGCGCGAACGGATCGTCCGTCGCAACAACTACGTTCGCTCAACGGGGAGTGGCGCTTCGCGTGGTTCCCGGCGCCGGAGGCGGTACCGGAGTCGTGGCTCGAGTGCGATCTACCGGAGGCGGACACGGTCGTCGTACCGTCGAACTGGCAAATGCACGGTTACGACGCGCCGATATACACGAACGTCACGTACCCGATAACGGTAAACCCGCCGTTCGTCCCGACGGAGAACCCGACGGGGTGCTACTCGCTAACGTTCAACGTTGACGAGTCGTGGTTGCAAGAGGGTCAAACGCGTATCATATTCGACGGTGTAAACTCGGCGTTCCACCTGTGGTGCAACGGGCGCTGGGTAGGGTACGGCCAAGACTCGCGTCTACCGTCGGAGTTCGACCTATCGGCGTTCCTACGAGCGGGTGAGAACCGGCTAGCGGTCATGGTCCTACGTTGGTCGGACGGTTCGTACCTCGAGGACCAAGACATGTGGCGAATGTCGGGTATCTTCCGCGACGTATCGCTCCTACACAAGCCGACGACGCAAATCTCGGACTTCCACGTCGCGACGCGTTTCAACGACGATTTCTCGCGGGCAGTCCTAGAGGCGGAGGTCCAAATGTGCGGGGAGCTACGTGACTACCTCCGTGTCACGGTATCGCTCTGGCAAGGTGAGACGCAAGTAGCGTCGGGTACGGCGCCGTTCGGCGGTGAGATCATCGACGAGCGTGGTGGGTACGCGGACCGTGTAACGCTACGTCTAAACGTCGAGAACCCGAAGCTCTGGTCGGCGGAGATCCCGAACCTATACCGTGCGGTCGTCGAGCTACATACGGCGGACGGGACGCTAATAGAGGCGGAAGCGTGCGACGTCGGGTTTCGAGAGGTTCGTATAGAGAACGGGCTGCTACTTCTAAACGGGAAGCCGTTGCTCATACGTGGTGTCAACCGTCACGAGCACCACCCGCTACACGGTCAAGTAATGGACGAGCAAACGATGGTACAAGACATCCTACTAATGAAGCAGAACAACTTCAACGCGGTACGCTGTTCGCATTACCCGAACCATCCGTTGTGGTACACGCTTTGCGACCGATACGGTCTATACGTCGTAGACGAGGCGAACATAGAGACGCACGGGATGGTACCGATGAATCGCCTAACGGACGACCCGCGTTGGCTACCGGCGATGTCGGAGCGAGTCACGCGTATGGTCCAACGGGACCGTAACCACCCGTCGGTAATAATCTGGTCGCTAGGCAACGAATCGGGGCACGGGGCGAACCACGACGCGCTATACCGTTGGATCAAGTCGGTAGACCCGTCGCGTCCGGTACAATACGAAGGTGGCGGTGCGGACACGACGGCGACGGACATCATCTGCCCGATGTACGCGCGCGTCGACGAAGACCAACCGTTCCCGGCGGTACCGAAGTGGTCGATCAAGAAGTGGCTCTCGTTGCCGGGTGAAACGCGTCCGTTGATACTTTGCGAGTACGCGCACGCGATGGGCAACTCGTTGGGTGGGTTCGCGAAGTACTGGCAGGCGTTCCGTCAATACCCGCGTCTACAGGGTGGGTTCGTCTGGGACTGGGTAGACCAATCGCTAATCAAGTACGACGAGAACGGCAACCCGTGGTCGGCGTACGGTGGGGACTTCGGGGACACGCCGAACGACCGCCAATTCTGTATGAACGGCCTAGTCTTCGCGGACCGAACGCCGCACCCGGCGTTGACGGAGGCGAAGCATCAACAACAATTCTTCCAATTCCGTCTATCGGGGCAAACGATCGAGGTAACGTCGGAGTACTTGTTCCGGCACTCGGACAACGAGCTACTACACTGGATGGTAGCACTAGACGGCAAGCCGCTAGCGTCGGGAGAAGTCCCTTTGGACGTCGCGCCGCAAGGTAAGCAACTAATCGAGCTACCGGAGCTACCGCAACCGGAGTCGGCGGGTCAACTGTGGTTGACGGTCCGTGTCGTTCAACCGAACGCGACGGCGTGGTCGGAGGCGGGTCACATCTCGGCGTGGCAGCAGTGGCGTCTAGCGGAGAACCTCTCGGTCACGCTACCGGCGGCGTCGCACGCGATACCGCATCTAACGACGTCGGAGATGGACTTCTGCATCGAGTTGGGGAACAAGAGGTGGCAGTTCAACCGTCAATCGGGATTCCTATCGCAAATGTGGATAGGTGACAAGAAGCAACTACTAACGCCGCTACGTGATCAGTTCACGCGTGCTCCGCTAGACAACGACATAGGTGTTTCGGAGGCGACGCGTATAGACCCGAACGCGTGGGTGGAGCGGTGGAAGGCGGCGGGGCACTACCAAGCGGAGGCGGCGCTACTACAGTGCACGGCGGACACGCTAGCGGACGCGGTATTGATCACGACGGCGCACGCGTGGCAACACCAGGGGAAGACGCTATTCATCTCGCGTAAGACGTACCGTATCGACGGTTCGGGCCAAATGGCGATCACGGTCGACGTAGAGGTAGCGTCGGACACGCCGCATCCGGCGCGCATCGGTCTAAACTGCCAACTAGCGCAAGTAGCGGAGCGTGTAAACTGGCTAGGGCTAGGGCCGCAAGAGAACTATCCGGACCGCCTAACGGCGGCGTGCTTCGACCGTTGGGACCTACCGCTTTCGGACATGTATACCCCGTACGTCTTCCCGTCGGAGAACGGGTTGAGGTGCGGGACGCGCGAGCTAAACTACGGGCCGCACCAGTGGCGAGGGGACTTCCAATTCAACATATCGCGTTACTCGCAACAACAACTAATGGAGACGTCGCACCGTCACCTACTACACGCGGAGGAGGGGACGTGGCTAAACATCGACGGGTTCCACATGGGCATAGGTGGGGACGACTCGTGGTCGCCGTCGGTCTCGGCGGAGCTCCAACTCTCGGCGGGTCGTTACCATTACCAACTAGTTTGGTGCCAGAAG |
119 | eIF4G-mid2 (aa) | DPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAV |
120 | eIF4G-mid2 (nt) | GACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTG |
121 | eIF4G(dN) 623-1599 (aa) | IFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN |
122 | eIF4G(dN) 623-1599 (nt) | ATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
123 | eIF4G(dN)-mid_突變體(aa)_3A | IFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSIANKATPQMAQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAVPTESTDNRRVVQRSSLSRERGEKAGDRGDRLERSERGGDRGDRLDRARTPATKRSFSKEVEERSRERPSQPEGLRKAASLTEDRDRGRDAVKREAALPPVSPLKAALSEEELEKKSKAIIEEYLHLNDMKEAVQCVQELASPSLLFIFVRHGVESTLERSAIAREHMGQLLHQLLCAGHLSTAQYYQGLYEILELAEDMEIDIPHVWLYLAELVTPILQEGGVPMGELFREITKPLRPLGKAASLLLEILGLLCKSMGPKKVGTLWREAGLSWKEFLPEGQDIGAFVAEQKVEYTLGEESEAPGQRALPSEELNRQLEKLLKEGSSNQRVFDWIEANLSEQQIVSNTLVRALMTAVCYSAIIFETPLRVDVAVLKARAKLLQKYLCDEQKELQALYALQALVVTLEQPPNLLRMFFDALYDEDVVKEDAFYSWESSKDPAEQQGKGVALKSVTAFFKWLREAEEESDHN |
124 | eIF4G(dN)-mid_突變體(nt)_3A | ATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCGCGAACAAGGCGACCCCTCAGATGGCGCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTGCCGACCGAGAGCACCGACAACCGGCGAGTTGTGCAGAGAAGCAGCCTGAGCAGAGAGAGGGGCGAGAAAGCCGGCGATAGAGGTGACCGACTGGAGAGAAGCGAGAGAGGAGGTGATAGAGGCGACCGGCTTGACAGAGCCAGAACCCCTGCCACAAAGCGATCGTTCAGCAAGGAGGTCGAAGAGAGGTCCAGGGAGCGCCCTAGCCAGCCGGAAGGACTCAGAAAGGCAGCCAGTCTAACAGAGGACCGCGACAGGGGAAGAGACGCCGTGAAGAGGGAGGCCGCACTGCCTCCTGTGAGCCCTCTGAAGGCGGCACTGAGCGAAGAAGAACTTGAGAAGAAGAGTAAGGCGATCATCGAGGAGTACCTGCACCTGAACGACATGAAGGAGGCCGTGCAGTGCGTGCAAGAGCTCGCGAGCCCATCACTGCTGTTCATCTTCGTCCGGCACGGCGTGGAGTCCACACTGGAAAGATCTGCCATTGCTAGGGAGCATATGGGCCAGTTGTTGCACCAATTGCTTTGCGCCGGCCACCTAAGTACTGCCCAGTACTATCAGGGTTTATACGAGATCCTCGAACTGGCCGAAGACATGGAGATCGACATCCCTCACGTGTGGCTGTACCTCGCAGAACTGGTGACCCCTATCCTGCAGGAGGGCGGCGTTCCAATGGGTGAGTTGTTCAGAGAAATCACAAAGCCACTGCGCCCACTGGGCAAGGCGGCTAGTCTCCTTCTGGAGATTCTCGGCCTGCTCTGTAAGAGCATGGGTCCAAAGAAGGTGGGCACCCTGTGGAGGGAAGCTGGACTCTCCTGGAAGGAATTCCTCCCTGAGGGTCAGGACATCGGCGCCTTCGTGGCCGAACAGAAGGTTGAGTACACCCTGGGAGAGGAATCGGAAGCGCCGGGTCAGCGGGCTCTGCCGAGTGAGGAGCTCAACAGACAACTCGAGAAGCTCCTCAAGGAGGGATCCTCAAATCAGAGAGTGTTCGACTGGATCGAGGCCAATCTCAGCGAGCAGCAAATCGTGAGCAACACGTTGGTTCGCGCTCTCATGACAGCCGTGTGCTACTCAGCCATTATCTTCGAGACGCCTCTCCGCGTGGACGTGGCAGTGCTCAAGGCCCGCGCTAAGCTGTTACAGAAGTACCTGTGCGACGAGCAGAAGGAACTGCAGGCCCTGTACGCCCTGCAAGCTCTGGTCGTCACACTCGAGCAGCCTCCTAACCTGCTGAGAATGTTCTTCGACGCATTGTACGACGAGGACGTTGTGAAGGAAGACGCTTTCTACAGCTGGGAGTCTAGTAAGGATCCTGCGGAACAACAAGGCAAGGGCGTTGCTCTAAAGAGCGTGACCGCCTTCTTCAAGTGGCTGCGAGAGGCTGAGGAAGAGTCGGACCACAAC |
125 | eIF4GminMut (aa) | DPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSIANKATPQMAQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAV |
126 | eIF4GminMut (nt) | GACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCGCCAACAAGGCGACCCCTCAGATGGCGCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTG |
127 | PABP (aa) | NPSAPSYPMASLYVGDLHPDVTEAMLYEKFSPAGPILSIRVCRDMITRRSLGYAYVNFQQPADAERALDTMNFDVIKGKPVRIMWSQRDPSLRKSGVGNIFIKNLDKSIDNKALYDTFSAFGNILSCKVVCDENGSKGYGFVHFETQEAAERAIEKMNGMLLNDRKVFVGRFKSRKEREAELGARAKEFTNVYIKNFGEDMDDERLKDLFGKFGPALSVKVMTDESGKSKGFGFVSFERHEDAQKAVDEMNGKELNGKQIYVGRAQKKVERQTELKRKFEQMKQDRITRYQGVNLYVKNLDDGIDDERLRKEFSPFGTITSAKVMMEGGRSKGFGFVCFSSPEEATKAVTEMNGRIVATKPLYVALAQRKEERQAHLTNQYMQRMASVRAVPNPVINPYQPAPPSGYFMAAIPQTQNRAAYYPPSQIAQLRPSPRWTAQGARPHPFQNMPGAIRPAAPRPPFSTMRPASSQVPRVMSTQRVANTSTQTMGPRPAAAAAAATPAVRTVPQYKYAAGVRNPQQHLNAQPQVTMQQPAVHVQGQEPLTASMLASAPPQEQKQMLGERLFPLIQAMHPTLAGKITGMLLEIDNSELLHMLESPESLRSKVDEAVAVLQAHQAKEAAQKAVNSATGVPTV |
128 | PABP (nt) | AACCCCAGCGCCCCAAGCTACCCCATGGCCAGCCTGTACGTGGGCGACCTGCACCCCGACGTTACCGAGGCCATGCTGTACGAGAAATTTTCTCCCGCTGGCCCCATCCTGAGCATCCGGGTGTGCCGGGACATGATTACCCGGCGCTCTCTGGGGTACGCCTACGTGAACTTCCAGCAGCCCGCAGACGCCGAACGGGCCCTGGACACCATGAACTTCGACGTGATCAAGGGCAAGCCCGTGCGGATCATGTGGAGCCAGCGGGACCCAAGCCTGAGAAAGAGCGGCGTGGGCAACATCTTCATCAAGAATCTGGACAAGAGCATCGACAACAAGGCCCTGTACGACACCTTCAGCGCCTTCGGCAATATCTTAAGCTGCAAGGTGGTGTGCGACGAGAACGGCAGCAAGGGCTACGGCTTCGTGCACTTCGAAACACAAGAAGCCGCAGAGCGGGCCATCGAGAAGATGAACGGCATGCTGCTGAACGACCGGAAGGTGTTCGTGGGCCGGTTCAAGAGCCGGAAGGAGCGGGAGGCTGAACTCGGTGCCCGGGCCAAGGAGTTCACCAACGTGTACATCAAGAACTTCGGCGAGGACATGGACGACGAGCGGTTGAAGGACCTGTTCGGCAAGTTCGGCCCCGCCCTGTCTGTGAAGGTGATGACCGACGAGAGCGGCAAGTCGAAGGGTTTCGGCTTTGTGAGCTTCGAGCGGCACGAGGACGCACAGAAGGCCGTGGACGAAATGAACGGTAAGGAGCTTAACGGTAAGCAGATCTACGTTGGCCGGGCCCAGAAGAAGGTGGAGCGGCAGACCGAGCTGAAGCGGAAGTTCGAGCAGATGAAGCAGGACCGGATCACCCGGTACCAGGGCGTGAACCTATACGTGAAGAACCTGGACGACGGCATCGACGACGAACGGCTGCGGAAGGAATTCAGCCCCTTCGGCACCATCACCAGCGCCAAGGTAATGATGGAGGGTGGCCGGTCGAAGGGATTCGGTTTCGTGTGCTTCAGCAGCCCCGAGGAGGCCACCAAGGCCGTTACTGAGATGAACGGCCGGATCGTAGCCACAAAGCCACTTTACGTCGCCCTGGCCCAACGCAAGGAGGAACGGCAGGCCCACCTGACCAACCAGTACATGCAGCGGATGGCCAGCGTGCGGGCAGTGCCCAACCCCGTGATCAACCCCTACCAACCCGCACCACCAAGCGGCTACTTCATGGCCGCCATCCCTCAGACCCAGAACCGGGCCGCCTACTACCCACCCAGCCAGATCGCCCAGTTGCGGCCTAGTCCCCGCTGGACGGCTCAAGGAGCACGACCCCACCCCTTCCAGAACATGCCCGGAGCCATCAGACCAGCTGCCCCTAGGCCACCCTTCAGCACCATGCGGCCCGCCTCAAGCCAGGTGCCCCGGGTGATGAGCACCCAGCGGGTGGCCAACACCAGCACCCAGACCATGGGCCCTAGACCAGCAGCTGCTGCGGCTGCTGCCACTCCTGCCGTCCGGACCGTGCCACAGTACAAGTACGCCGCCGGCGTTCGGAACCCACAGCAGCACCTGAACGCCCAGCCCCAGGTGACCATGCAGCAGCCTGCCGTGCACGTGCAGGGCCAGGAGCCCCTGACCGCCAGCATGTTAGCAAGCGCCCCTCCACAGGAGCAGAAGCAGATGCTGGGCGAAAGGCTGTTTCCCCTGATCCAAGCGATGCATCCCACCCTGGCCGGCAAGATCACCGGTATGCTGCTGGAGATCGATAATAGCGAGCTGCTGCACATGCTGGAGAGCCCCGAGAGTCTTAGATCTAAGGTGGACGAGGCCGTGGCCGTGCTCCAGGCTCACCAGGCAAAGGAGGCCGCCCAGAAAGCCGTGAACTCCGCCACAGGCGTGCCCACCGTG |
129 | MBP-PABP (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSNPSAPSYPMASLYVGDLHPDVTEAMLYEKFSPAGPILSIRVCRDMITRRSLGYAYVNFQQPADAERALDTMNFDVIKGKPVRIMWSQRDPSLRKSGVGNIFIKNLDKSIDNKALYDTFSAFGNILSCKVVCDENGSKGYGFVHFETQEAAERAIEKMNGMLLNDRKVFVGRFKSRKEREAELGARAKEFTNVYIKNFGEDMDDERLKDLFGKFGPALSVKVMTDESGKSKGFGFVSFERHEDAQKAVDEMNGKELNGKQIYVGRAQKKVERQTELKRKFEQMKQDRITRYQGVNLYVKNLDDGIDDERLRKEFSPFGTITSAKVMMEGGRSKGFGFVCFSSPEEATKAVTEMNGRIVATKPLYVALAQRKEERQAHLTNQYMQRMASVRAVPNPVINPYQPAPPSGYFMAAIPQTQNRAAYYPPSQIAQLRPSPRWTAQGARPHPFQNMPGAIRPAAPRPPFSTMRPASSQVPRVMSTQRVANTSTQTMGPRPAAAAAAATPAVRTVPQYKYAAGVRNPQQHLNAQPQVTMQQPAVHVQGQEPLTASMLASAPPQEQKQMLGERLFPLIQAMHPTLAGKITGMLLEIDNSELLHMLESPESLRSKVDEAVAVLQAHQAKEAAQKAVNSATGVPTV |
130 | MBP-PABP (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCAACCCCAGCGCCCCAAGCTACCCCATGGCCAGCCTGTACGTGGGCGACCTGCACCCCGACGTTACCGAGGCCATGCTGTACGAGAAATTTTCTCCCGCTGGCCCCATCCTGAGCATCCGGGTGTGCCGGGACATGATTACCCGGCGCTCTCTGGGGTACGCCTACGTGAACTTCCAGCAGCCCGCAGACGCCGAACGGGCCCTGGACACCATGAACTTCGACGTGATCAAGGGCAAGCCCGTGCGGATCATGTGGAGCCAGCGGGACCCAAGCCTGAGAAAGAGCGGCGTGGGCAACATCTTCATCAAGAATCTGGACAAGAGCATCGACAACAAGGCCCTGTACGACACCTTCAGCGCCTTCGGCAATATCTTAAGCTGCAAGGTGGTGTGCGACGAGAACGGCAGCAAGGGCTACGGCTTCGTGCACTTCGAAACACAAGAAGCCGCAGAGCGGGCCATCGAGAAGATGAACGGCATGCTGCTGAACGACCGGAAGGTGTTCGTGGGCCGGTTCAAGAGCCGGAAGGAGCGGGAGGCTGAACTCGGTGCCCGGGCCAAGGAGTTCACCAACGTGTACATCAAGAACTTCGGCGAGGACATGGACGACGAGCGGTTGAAGGACCTGTTCGGCAAGTTCGGCCCCGCCCTGTCTGTGAAGGTGATGACCGACGAGAGCGGCAAGTCGAAGGGTTTCGGCTTTGTGAGCTTCGAGCGGCACGAGGACGCACAGAAGGCCGTGGACGAAATGAACGGTAAGGAGCTTAACGGTAAGCAGATCTACGTTGGCCGGGCCCAGAAGAAGGTGGAGCGGCAGACCGAGCTGAAGCGGAAGTTCGAGCAGATGAAGCAGGACCGGATCACCCGGTACCAGGGCGTGAACCTATACGTGAAGAACCTGGACGACGGCATCGACGACGAACGGCTGCGGAAGGAATTCAGCCCCTTCGGCACCATCACCAGCGCCAAGGTAATGATGGAGGGTGGCCGGTCGAAGGGATTCGGTTTCGTGTGCTTCAGCAGCCCCGAGGAGGCCACCAAGGCCGTTACTGAGATGAACGGCCGGATCGTAGCCACAAAGCCACTTTACGTCGCCCTGGCCCAACGCAAGGAGGAACGGCAGGCCCACCTGACCAACCAGTACATGCAGCGGATGGCCAGCGTGCGGGCAGTGCCCAACCCCGTGATCAACCCCTACCAACCCGCACCACCAAGCGGCTACTTCATGGCCGCCATCCCTCAGACCCAGAACCGGGCCGCCTACTACCCACCCAGCCAGATCGCCCAGTTGCGGCCTAGTCCCCGCTGGACGGCTCAAGGAGCACGACCCCACCCCTTCCAGAACATGCCCGGAGCCATCAGACCAGCTGCCCCTAGGCCACCCTTCAGCACCATGCGGCCCGCCTCAAGCCAGGTGCCCCGGGTGATGAGCACCCAGCGGGTGGCCAACACCAGCACCCAGACCATGGGCCCTAGACCAGCAGCTGCTGCGGCTGCTGCCACTCCTGCCGTCCGGACCGTGCCACAGTACAAGTACGCCGCCGGCGTTCGGAACCCACAGCAGCACCTGAACGCCCAGCCCCAGGTGACCATGCAGCAGCCTGCCGTGCACGTGCAGGGCCAGGAGCCCCTGACCGCCAGCATGTTAGCAAGCGCCCCTCCACAGGAGCAGAAGCAGATGCTGGGCGAAAGGCTGTTTCCCCTGATCCAAGCGATGCATCCCACCCTGGCCGGCAAGATCACCGGTATGCTGCTGGAGATCGATAATAGCGAGCTGCTGCACATGCTGGAGAGCCCCGAGAGTCTTAGATCTAAGGTGGACGAGGCCGTGGCCGTGCTCCAGGCTCACCAGGCAAAGGAGGCCGCCCAGAAAGCCGTGAACTCCGCCACAGGCGTGCCCACCGTG |
131 | TENT4A (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSDPRVAWIQPEQKGPANALWMQIWETSQGVGRGGSGFASYFCLNSPALDTAAAAGAAGRGSGGLGPALPAASPPPPGPTAPAALPPALLTALGPAAEGARRLHKSPSLSSSSSSSSSNAESGTESPGCSSSSSSSASLGRPGGGRGGAFFNFADGAPSAPGTANGHPGPRGPAPAGSPSQHQFHPGRRKRENKASTYGLNYLLSGSRAAALSGGGGPGAQAPRPGTPWKSRAYSPGIQGLHEEIIDFYNFMSPCPEEAAMRREVVKRIETVVKDLWPTADVQIFGSFSTGLYLPTSDIDLVVFGKWERPPLQLLEQALRKHNVAEPCSIKVLDKATVPIIKLTDQETEVKVDISFNMETGVRAAEFIKNYMKKYSLLPYLILVLKQFLLQRDLNEVFTGGISSYSLILMAISFLQLHPRIDARRADENLGMLLVEFFELYGRNFNYLKTGIRIKEGGAYIAKEEIMKAMTSGYRPSMLCIEDPLLPGNDVGRSSYGAMQVKQVFDYAYIVLSHAVSPLARSYPNRDAESTLGRIIKVTQEVIDYRRWIKEKWGSKAHPSPGMDSRIKIKERIATCNGEQTQNREPESPYGQRLTLSLSSPQLLSSGSSASSVSSLSGSDVDSDTPPCTTPSVYQFSLQAPAPLMAGLPTALPMPSGKPQPTTSRTLIMTTNNQTRFTIPPPTLGVAPVPCRQAGVEGTASLKAVHHMSSPAIPSASPNPLSSPHLYHKQHNGMKLSMKGSHGHTQGGGYSSVGSGGVRPPVGNRGHHQYNRTGWRRKKHTHTRDSLPVSLSR |
132 | TENT4A (nt) | GATCCCCGGGTGGCCTGGATCCAGCCCGAGCAGAAGGGCCCCGCCAACGCACTGTGGATGCAGATCTGGGAGACCTCTCAGGGCGTAGGGAGGGGAGGAAGCGGCTTCGCCAGCTACTTCTGCCTGAACAGCCCCGCTCTGGATACGGCAGCCGCAGCAGGAGCCGCTGGGAGAGGCTCTGGAGGCCTGGGACCAGCACTGCCCGCTGCTTCACCACCACCTCCAGGCCCTACCGCACCCGCAGCCCTTCCACCCGCCCTGCTGACCGCTCTGGGCCCAGCTGCAGAGGGTGCTCGGCGGCTGCACAAGAGCCCCAGCCTGAGCAGCAGCAGTAGCAGCTCCAGCAGCAACGCCGAGAGCGGCACAGAGAGCCCCGGCTGCAGCAGCAGCAGCTCCAGTTCCGCAAGCCTCGGCAGACCAGGCGGTGGCAGAGGCGGTGCATTCTTCAACTTCGCTGACGGAGCGCCAAGCGCTCCAGGGACAGCCAACGGACACCCAGGCCCAAGAGGTCCGGCACCCGCTGGAAGCCCCAGCCAGCACCAGTTCCACCCCGGCAGACGGAAGCGGGAGAACAAGGCCAGCACCTACGGCCTGAACTACCTGCTGAGCGGCTCTCGAGCCGCTGCCCTCTCTGGTGGCGGTGGCCCTGGTGCTCAGGCCCCAAGACCTGGCACCCCGTGGAAGTCACGGGCCTACAGCCCCGGTATCCAGGGCCTGCACGAGGAGATCATCGACTTCTACAACTTCATGAGCCCCTGTCCCGAGGAAGCCGCCATGCGGAGGGAGGTGGTGAAGCGGATCGAGACCGTGGTGAAGGACCTGTGGCCCACCGCAGACGTGCAGATCTTCGGCAGCTTCAGCACCGGCCTGTACCTGCCCACCAGCGACATCGACCTGGTGGTGTTCGGCAAGTGGGAACGCCCTCCCCTGCAGCTGCTGGAGCAGGCCCTGCGGAAGCACAACGTGGCCGAGCCCTGCAGCATCAAGGTGCTGGACAAGGCCACCGTGCCCATCATCAAGCTGACCGACCAGGAGACCGAGGTGAAGGTGGACATCAGCTTCAACATGGAGACCGGCGTGCGTGCAGCAGAGTTCATCAAGAACTACATGAAGAAGTACAGCCTGCTGCCCTACCTGATCCTGGTGCTGAAGCAGTTCCTGCTGCAGCGGGACCTGAACGAGGTGTTCACCGGCGGCATCAGCAGCTACAGCCTGATCCTCATGGCCATCAGCTTCCTGCAGCTGCACCCGCGGATCGACGCAAGGCGGGCCGACGAGAACCTGGGCATGCTGCTGGTGGAGTTCTTCGAGCTGTACGGCCGGAACTTCAACTACCTGAAGACCGGCATCCGGATCAAGGAGGGCGGCGCCTACATCGCCAAGGAGGAGATCATGAAGGCCATGACCAGCGGCTACCGGCCCAGCATGCTGTGCATCGAGGACCCTCTGCTGCCCGGCAACGACGTGGGCCGGAGCAGCTACGGCGCCATGCAGGTGAAGCAGGTGTTCGACTACGCCTACATCGTGCTGAGCCACGCCGTGAGCCCACTGGCCCGGAGCTACCCCAACCGGGACGCCGAGAGCACCCTGGGCCGGATCATCAAGGTGACCCAGGAGGTGATCGACTACCGGCGGTGGATCAAGGAGAAGTGGGGCAGCAAGGCCCACCCATCTCCCGGCATGGACAGCCGGATCAAGATCAAGGAGCGGATCGCCACCTGCAACGGCGAGCAGACCCAGAACCGGGAGCCCGAAAGCCCCTACGGCCAGCGTCTGACCCTGAGCCTGAGCTCTCCCCAGCTGCTGAGCAGCGGCAGCAGCGCCAGCAGCGTGAGCAGCCTGAGCGGCAGCGACGTGGACAGCGACACCCCACCCTGCACCACCCCAAGCGTGTACCAGTTCTCACTGCAGGCCCCTGCTCCGCTGATGGCTGGCCTGCCTACCGCCCTGCCCATGCCCAGCGGCAAGCCCCAGCCCACCACCAGCCGGACCCTGATCATGACCACCAACAACCAGACCCGGTTCACCATCCCACCACCAACCCTGGGCGTGGCTCCTGTGCCTTGTCGGCAGGCCGGAGTGGAGGGCACCGCCAGCCTGAAGGCCGTGCACCACATGAGCAGCCCAGCCATCCCCAGCGCCAGCCCCAACCCTCTGAGCAGCCCACACCTGTACCACAAGCAGCACAACGGCATGAAGCTGAGCATGAAGGGCAGCCACGGACACACCCAGGGCGGAGGGTACTCAAGCGTTGGGAGCGGAGGGGTACGGCCTCCAGTGGGCAACCGGGGCCACCACCAGTACAACAGGACCGGCTGGAGACGGAAGAAGCACACCCACACCCGGGACTCTCTGCCCGTGAGCCTGAGCCGG |
133 | MBP-TENT4A (aa) | DPRVAWIQPEQKGPANALWMQIWETSQGVGRGGSGFASYFCLNSPALDTAAAAGAAGRGSGGLGPALPAASPPPPGPTAPAALPPALLTALGPAAEGARRLHKSPSLSSSSSSSSSNAESGTESPGCSSSSSSSASLGRPGGGRGGAFFNFADGAPSAPGTANGHPGPRGPAPAGSPSQHQFHPGRRKRENKASTYGLNYLLSGSRAAALSGGGGPGAQAPRPGTPWKSRAYSPGIQGLHEEIIDFYNFMSPCPEEAAMRREVVKRIETVVKDLWPTADVQIFGSFSTGLYLPTSDIDLVVFGKWERPPLQLLEQALRKHNVAEPCSIKVLDKATVPIIKLTDQETEVKVDISFNMETGVRAAEFIKNYMKKYSLLPYLILVLKQFLLQRDLNEVFTGGISSYSLILMAISFLQLHPRIDARRADENLGMLLVEFFELYGRNFNYLKTGIRIKEGGAYIAKEEIMKAMTSGYRPSMLCIEDPLLPGNDVGRSSYGAMQVKQVFDYAYIVLSHAVSPLARSYPNRDAESTLGRIIKVTQEVIDYRRWIKEKWGSKAHPSPGMDSRIKIKERIATCNGEQTQNREPESPYGQRLTLSLSSPQLLSSGSSASSVSSLSGSDVDSDTPPCTTPSVYQFSLQAPAPLMAGLPTALPMPSGKPQPTTSRTLIMTTNNQTRFTIPPPTLGVAPVPCRQAGVEGTASLKAVHHMSSPAIPSASPNPLSSPHLYHKQHNGMKLSMKGSHGHTQGGGYSSVGSGGVRPPVGNRGHHQYNRTGWRRKKHTHTRDSLPVSLSR |
134 | MBP-TENT4A (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGATCCCCGGGTGGCCTGGATCCAGCCCGAGCAGAAGGGCCCCGCCAACGCACTGTGGATGCAGATCTGGGAGACCTCTCAGGGCGTAGGGAGGGGAGGAAGCGGCTTCGCCAGCTACTTCTGCCTGAACAGCCCCGCTCTGGATACGGCAGCCGCAGCAGGAGCCGCTGGGAGAGGCTCTGGAGGCCTGGGACCAGCACTGCCCGCTGCTTCACCACCACCTCCAGGCCCTACCGCACCCGCAGCCCTTCCACCCGCCCTGCTGACCGCTCTGGGCCCAGCTGCAGAGGGTGCTCGGCGGCTGCACAAGAGCCCCAGCCTGAGCAGCAGCAGTAGCAGCTCCAGCAGCAACGCCGAGAGCGGCACAGAGAGCCCCGGCTGCAGCAGCAGCAGCTCCAGTTCCGCAAGCCTCGGCAGACCAGGCGGTGGCAGAGGCGGTGCATTCTTCAACTTCGCTGACGGAGCGCCAAGCGCTCCAGGGACAGCCAACGGACACCCAGGCCCAAGAGGTCCGGCACCCGCTGGAAGCCCCAGCCAGCACCAGTTCCACCCCGGCAGACGGAAGCGGGAGAACAAGGCCAGCACCTACGGCCTGAACTACCTGCTGAGCGGCTCTCGAGCCGCTGCCCTCTCTGGTGGCGGTGGCCCTGGTGCTCAGGCCCCAAGACCTGGCACCCCGTGGAAGTCACGGGCCTACAGCCCCGGTATCCAGGGCCTGCACGAGGAGATCATCGACTTCTACAACTTCATGAGCCCCTGTCCCGAGGAAGCCGCCATGCGGAGGGAGGTGGTGAAGCGGATCGAGACCGTGGTGAAGGACCTGTGGCCCACCGCAGACGTGCAGATCTTCGGCAGCTTCAGCACCGGCCTGTACCTGCCCACCAGCGACATCGACCTGGTGGTGTTCGGCAAGTGGGAACGCCCTCCCCTGCAGCTGCTGGAGCAGGCCCTGCGGAAGCACAACGTGGCCGAGCCCTGCAGCATCAAGGTGCTGGACAAGGCCACCGTGCCCATCATCAAGCTGACCGACCAGGAGACCGAGGTGAAGGTGGACATCAGCTTCAACATGGAGACCGGCGTGCGTGCAGCAGAGTTCATCAAGAACTACATGAAGAAGTACAGCCTGCTGCCCTACCTGATCCTGGTGCTGAAGCAGTTCCTGCTGCAGCGGGACCTGAACGAGGTGTTCACCGGCGGCATCAGCAGCTACAGCCTGATCCTCATGGCCATCAGCTTCCTGCAGCTGCACCCGCGGATCGACGCAAGGCGGGCCGACGAGAACCTGGGCATGCTGCTGGTGGAGTTCTTCGAGCTGTACGGCCGGAACTTCAACTACCTGAAGACCGGCATCCGGATCAAGGAGGGCGGCGCCTACATCGCCAAGGAGGAGATCATGAAGGCCATGACCAGCGGCTACCGGCCCAGCATGCTGTGCATCGAGGACCCTCTGCTGCCCGGCAACGACGTGGGCCGGAGCAGCTACGGCGCCATGCAGGTGAAGCAGGTGTTCGACTACGCCTACATCGTGCTGAGCCACGCCGTGAGCCCACTGGCCCGGAGCTACCCCAACCGGGACGCCGAGAGCACCCTGGGCCGGATCATCAAGGTGACCCAGGAGGTGATCGACTACCGGCGGTGGATCAAGGAGAAGTGGGGCAGCAAGGCCCACCCATCTCCCGGCATGGACAGCCGGATCAAGATCAAGGAGCGGATCGCCACCTGCAACGGCGAGCAGACCCAGAACCGGGAGCCCGAAAGCCCCTACGGCCAGCGTCTGACCCTGAGCCTGAGCTCTCCCCAGCTGCTGAGCAGCGGCAGCAGCGCCAGCAGCGTGAGCAGCCTGAGCGGCAGCGACGTGGACAGCGACACCCCACCCTGCACCACCCCAAGCGTGTACCAGTTCTCACTGCAGGCCCCTGCTCCGCTGATGGCTGGCCTGCCTACCGCCCTGCCCATGCCCAGCGGCAAGCCCCAGCCCACCACCAGCCGGACCCTGATCATGACCACCAACAACCAGACCCGGTTCACCATCCCACCACCAACCCTGGGCGTGGCTCCTGTGCCTTGTCGGCAGGCCGGAGTGGAGGGCACCGCCAGCCTGAAGGCCGTGCACCACATGAGCAGCCCAGCCATCCCCAGCGCCAGCCCCAACCCTCTGAGCAGCCCACACCTGTACCACAAGCAGCACAACGGCATGAAGCTGAGCATGAAGGGCAGCCACGGACACACCCAGGGCGGAGGGTACTCAAGCGTTGGGAGCGGAGGGGTACGGCCTCCAGTGGGCAACCGGGGCCACCACCAGTACAACAGGACCGGCTGGAGACGGAAGAAGCACACCCACACCCGGGACTCTCTGCCCGTGAGCCTGAGCCGG |
135 | TENT4B (aa) | DPRIAWFQPEQLGPSNSLWMQIWETTQGLRNLYFNHHCHSSGGASGGGGSSSSSSTATGGSGSSTGSPGGAASAPAPAPAGMYRSGERLLGSHALPAEQRDFLPLETTNNNNNHHQPGAWARRAGSSASSPPSASSSPHPSAAVPAADPADSASGSSNKRKRDNKASTYGLNYSLLQPSGGRAAGGGRADGGGVVYSGTPWKRRNYNQGVVGLHEEISDFYEYMSPRPEEEKMRMEVVNRIESVIKELWPSADVQIFGSFKTGLYLPTSDIDLVVFGKWENLPLWTLEEALRKHKVADEDSVKVLDKATVPIIKLTDSFTEVKVDISFNVQNGVRAADLIKDFTKKYPVLPYLVLVLKQFLLQRDLNEVFTGGIGSYSLFLMAVSFLQLHPREDACIPNTNYGVLLIEFFELYGRHFNYLKTGIRIKDGGSYVAKDEVQKNMLDGYRPSMLYIEDPLQPGNDVGRSSYGAMQVKQAFDYAYVVLSHAVSPIAKYYPNNETESILGRIIRVTDEVATYRDWISKQWGLKNRPEPSCNGPVSSSSATQSSSSDVDSDATPCKTPKQLLCRPSTGNRVGSQDVSLESSQAVGKMQSTQTTNTSNSTNKSQHGSARLFRSSSKGFQGTTQTSHGSLMTNKQHQGKSNNQYYHGKKRKHKRDAPLSDLCR |
136 | TENT4B (nt) | GATCCCCGGATCGCCTGGTTCCAGCCCGAGCAGCTAGGCCCAAGCAACAGCCTGTGGATGCAGATCTGGGAGACCACCCAGGGCCTGCGGAACCTGTACTTCAACCACCACTGTCACAGCTCTGGCGGCGCAAGTGGCGGAGGCGGCAGTAGCAGCAGCTCTTCAACAGCAACCGGAGGCAGCGGCTCGTCCACCGGCAGTCCGGGTGGAGCCGCCAGTGCCCCAGCTCCTGCCCCAGCAGGCATGTACCGGAGCGGCGAACGGCTGCTGGGCAGCCACGCTCTGCCTGCCGAGCAGCGGGACTTCCTGCCCCTGGAGACCACCAATAACAACAACAATCACCACCAACCCGGGGCTTGGGCTCGACGAGCCGGCTCCAGTGCAAGCAGTCCACCTAGCGCCAGCAGCTCTCCACACCCCAGCGCCGCTGTTCCAGCAGCCGATCCCGCCGACAGTGCCAGCGGCAGCAGCAACAAGCGGAAGCGGGACAACAAGGCCAGCACCTACGGCCTGAACTACAGCCTGCTGCAACCTTCTGGAGGCCGTGCAGCTGGCGGAGGTAGAGCCGACGGTGGCGGTGTGGTGTACAGCGGCACGCCCTGGAAGCGGCGGAACTACAACCAGGGCGTGGTGGGCCTGCACGAGGAGATCAGCGACTTCTACGAGTACATGAGCCCACGGCCCGAAGAGGAGAAGATGCGGATGGAGGTGGTGAACCGGATCGAGAGCGTGATCAAGGAGCTGTGGCCTAGCGCCGACGTGCAGATCTTCGGCAGCTTCAAGACCGGCCTGTACCTGCCCACCAGCGACATCGACCTGGTGGTGTTCGGCAAGTGGGAGAACCTGCCCCTGTGGACCCTGGAGGAGGCCCTGCGGAAACACAAGGTGGCCGACGAGGACAGCGTGAAGGTGCTGGACAAGGCCACCGTGCCCATCATCAAGCTGACCGACAGCTTCACCGAGGTGAAGGTGGACATCAGCTTCAACGTGCAGAACGGCGTGAGGGCAGCCGACCTGATCAAGGACTTCACCAAGAAGTACCCCGTGCTGCCCTACCTGGTGCTGGTGCTGAAGCAGTTCCTGCTGCAGCGGGACCTGAACGAGGTGTTCACCGGCGGCATCGGCAGCTACAGCCTGTTCCTGATGGCCGTGAGCTTCCTGCAGCTGCATCCCCGTGAGGACGCCTGCATCCCCAACACCAACTACGGCGTGCTGCTGATCGAGTTCTTCGAGCTGTACGGCCGGCACTTCAACTACCTGAAGACCGGCATCCGGATCAAGGACGGCGGCAGCTACGTGGCCAAGGACGAGGTGCAGAAGAACATGCTGGACGGCTACCGGCCCAGCATGCTGTACATCGAGGACCCACTGCAGCCCGGCAACGACGTGGGCCGGAGCAGCTACGGCGCCATGCAGGTGAAGCAGGCCTTCGACTACGCCTACGTGGTGCTGAGCCACGCCGTGAGCCCCATCGCCAAGTACTACCCCAACAACGAGACCGAGAGCATCCTGGGCCGGATCATCCGGGTGACCGACGAGGTGGCCACCTACCGGGACTGGATCAGCAAGCAGTGGGGCCTGAAGAACCGGCCCGAGCCTAGCTGCAACGGCCCCGTGAGCTCAAGCAGCGCCACCCAGAGCAGCAGCAGCGACGTGGACAGCGACGCCACTCCCTGCAAGACCCCTAAGCAGCTGCTGTGCCGTCCCAGCACCGGCAACCGGGTGGGCAGCCAGGACGTGAGCCTGGAGAGCAGCCAGGCCGTGGGCAAGATGCAGAGCACCCAGACCACCAACACCAGCAACAGCACCAACAAGAGCCAACACGGCAGCGCACGGCTGTTCCGGAGCAGCAGCAAGGGCTTCCAGGGCACCACCCAGACCAGCCACGGCAGCCTGATGACCAACAAGCAGCACCAGGGCAAGAGCAACAACCAGTACTACCACGGCAAGAAGCGGAAGCACAAGCGGGACGCTCCCCTGAGCGACCTGTGCCGG |
137 | MBP-TENT4B (aaa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSDPRIAWFQPEQLGPSNSLWMQIWETTQGLRNLYFNHHCHSSGGASGGGGSSSSSSTATGGSGSSTGSPGGAASAPAPAPAGMYRSGERLLGSHALPAEQRDFLPLETTNNNNNHHQPGAWARRAGSSASSPPSASSSPHPSAAVPAADPADSASGSSNKRKRDNKASTYGLNYSLLQPSGGRAAGGGRADGGGVVYSGTPWKRRNYNQGVVGLHEEISDFYEYMSPRPEEEKMRMEVVNRIESVIKELWPSADVQIFGSFKTGLYLPTSDIDLVVFGKWENLPLWTLEEALRKHKVADEDSVKVLDKATVPIIKLTDSFTEVKVDISFNVQNGVRAADLIKDFTKKYPVLPYLVLVLKQFLLQRDLNEVFTGGIGSYSLFLMAVSFLQLHPREDACIPNTNYGVLLIEFFELYGRHFNYLKTGIRIKDGGSYVAKDEVQKNMLDGYRPSMLYIEDPLQPGNDVGRSSYGAMQVKQAFDYAYVVLSHAVSPIAKYYPNNETESILGRIIRVTDEVATYRDWISKQWGLKNRPEPSCNGPVSSSSATQSSSSDVDSDATPCKTPKQLLCRPSTGNRVGSQDVSLESSQAVGKMQSTQTTNTSNSTNKSQHGSARLFRSSSKGFQGTTQTSHGSLMTNKQHQGKSNNQYYHGKKRKHKRDAPLSDLCR |
138 | MBP-TENT4B (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGATCCCCGGATCGCCTGGTTCCAGCCCGAGCAGCTAGGCCCAAGCAACAGCCTGTGGATGCAGATCTGGGAGACCACCCAGGGCCTGCGGAACCTGTACTTCAACCACCACTGTCACAGCTCTGGCGGCGCAAGTGGCGGAGGCGGCAGTAGCAGCAGCTCTTCAACAGCAACCGGAGGCAGCGGCTCGTCCACCGGCAGTCCGGGTGGAGCCGCCAGTGCCCCAGCTCCTGCCCCAGCAGGCATGTACCGGAGCGGCGAACGGCTGCTGGGCAGCCACGCTCTGCCTGCCGAGCAGCGGGACTTCCTGCCCCTGGAGACCACCAATAACAACAACAATCACCACCAACCCGGGGCTTGGGCTCGACGAGCCGGCTCCAGTGCAAGCAGTCCACCTAGCGCCAGCAGCTCTCCACACCCCAGCGCCGCTGTTCCAGCAGCCGATCCCGCCGACAGTGCCAGCGGCAGCAGCAACAAGCGGAAGCGGGACAACAAGGCCAGCACCTACGGCCTGAACTACAGCCTGCTGCAACCTTCTGGAGGCCGTGCAGCTGGCGGAGGTAGAGCCGACGGTGGCGGTGTGGTGTACAGCGGCACGCCCTGGAAGCGGCGGAACTACAACCAGGGCGTGGTGGGCCTGCACGAGGAGATCAGCGACTTCTACGAGTACATGAGCCCACGGCCCGAAGAGGAGAAGATGCGGATGGAGGTGGTGAACCGGATCGAGAGCGTGATCAAGGAGCTGTGGCCTAGCGCCGACGTGCAGATCTTCGGCAGCTTCAAGACCGGCCTGTACCTGCCCACCAGCGACATCGACCTGGTGGTGTTCGGCAAGTGGGAGAACCTGCCCCTGTGGACCCTGGAGGAGGCCCTGCGGAAACACAAGGTGGCCGACGAGGACAGCGTGAAGGTGCTGGACAAGGCCACCGTGCCCATCATCAAGCTGACCGACAGCTTCACCGAGGTGAAGGTGGACATCAGCTTCAACGTGCAGAACGGCGTGAGGGCAGCCGACCTGATCAAGGACTTCACCAAGAAGTACCCCGTGCTGCCCTACCTGGTGCTGGTGCTGAAGCAGTTCCTGCTGCAGCGGGACCTGAACGAGGTGTTCACCGGCGGCATCGGCAGCTACAGCCTGTTCCTGATGGCCGTGAGCTTCCTGCAGCTGCATCCCCGTGAGGACGCCTGCATCCCCAACACCAACTACGGCGTGCTGCTGATCGAGTTCTTCGAGCTGTACGGCCGGCACTTCAACTACCTGAAGACCGGCATCCGGATCAAGGACGGCGGCAGCTACGTGGCCAAGGACGAGGTGCAGAAGAACATGCTGGACGGCTACCGGCCCAGCATGCTGTACATCGAGGACCCACTGCAGCCCGGCAACGACGTGGGCCGGAGCAGCTACGGCGCCATGCAGGTGAAGCAGGCCTTCGACTACGCCTACGTGGTGCTGAGCCACGCCGTGAGCCCCATCGCCAAGTACTACCCCAACAACGAGACCGAGAGCATCCTGGGCCGGATCATCCGGGTGACCGACGAGGTGGCCACCTACCGGGACTGGATCAGCAAGCAGTGGGGCCTGAAGAACCGGCCCGAGCCTAGCTGCAACGGCCCCGTGAGCTCAAGCAGCGCCACCCAGAGCAGCAGCAGCGACGTGGACAGCGACGCCACTCCCTGCAAGACCCCTAAGCAGCTGCTGTGCCGTCCCAGCACCGGCAACCGGGTGGGCAGCCAGGACGTGAGCCTGGAGAGCAGCCAGGCCGTGGGCAAGATGCAGAGCACCCAGACCACCAACACCAGCAACAGCACCAACAAGAGCCAACACGGCAGCGCACGGCTGTTCCGGAGCAGCAGCAAGGGCTTCCAGGGCACCACCCAGACCAGCCACGGCAGCCTGATGACCAACAAGCAGCACCAGGGCAAGAGCAACAACCAGTACTACCACGGCAAGAAGCGGAAGCACAAGCGGGACGCTCCCCTGAGCGACCTGTGCCGG |
139 | eIF4G-fl (aa) | NSQPQTRSPFFQRPQIQPPRATIPNSSPSIRPGAQTPTAVYQANQHIMMVNHLPMPYPVPQGPQYCIPQYRHSGPPYVGPPQQYPVQPPGPGPFYPGPGPGDFPNAYGTPFYPSQPVYQSAPIIVPTQQQPPPAKREKKTIRIRDPNQGGKDITEEIMSGGGSRNPTPPIGRPTSTPTPPQQLPSQVPEHSPVVYGTVESAHLAASTPVTAASDQKQEEKPKPDPVLKSPSPVLRLVLSGEKKEQEGQTSETTAIVSIAELPLPPSPTTVSSVARSTIAAPTSSALSSQPIFTTAIDDRCELSSPREDTIPIPSLTSCTETSDPLPTNENDDDICKKPCSVAPNDIPLVSSTNLINEINGVSEKLSATESIVEIVKQEVLPLTLELEILENPPEEMKLECIPAPITPSTVPSFPPTPPTPPASPPHTPVIVPAAATTVSSPSAAITVQRVLEEDESIRTCLSEDAKEIQNKIEVEADGQTEEILDSQNLNSRRSPVPAQIAITVPKTWKKPKDRTRTTEEMLEAELELKAEEELSIDKVLESEQDKMSQGFHPERDPSDLKKVKAVEENGEEAEPVRNGAESVSEGEGIDANSGSTDSSGDGVTFPFKPESWKPTDTEGKKQYDREFLLDFQFMPACIQKPEGLPPISDVVLDKINQPKLPMRTLDPRILPRGPDFTPAFADFGRQTPGGRGVPLLNVGSRRSQPGQRREPRKIITVSVKEDVHLKKAENAWKPSQKRDSQADDPENIKTQELFRKVRSILNKLTPQMFNQLMKQVSGLTVDTEERLKGVIDLVFEKAIDEPSFSVAYANMCRCLVTLKVPMADKPGNTVNFRKLLLNRCQKEFEKDKADDDVFEKKQKELEAASAPEERTRLHDELEEAKDKARRRSIGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIVKERKTSSRIRFMLQDVIDLRLCNWVSRRADQGPKTIEQIHKEAKIEEQEEQRKVQQLMTKEKRRPGVQRVDEGGWNTVQGAKNSRVLDPSKFLKITKPTIDEKIQLVPKAQLGSWGKGSSGGAKASETDALRSSASSLNRFSALQPPAPSGSTPSTPVEFDSRRTLTSRGSMGREKNDKPLPSATARPNTFMRGGSSKDLLDNQSQEEQRREMLETVKQLTGGVDVERNSTEAERNKTRESAKPEISAMSAHDKAALSEEELERKSKSIIDEFLHINDFKEAMQCVEELNAQGLLHVFVRVGVESTLERSQITRDHMGQLLYQLVQSEKLSKQDFFKGFSETLELADDMAIDIPHIWLYLAELVTPMLKEGGISMRELTIEFSKPLLPVGRAGVLLSEILHLLCKQMSHKKVGALWREADLSWKDFLPEGEDVHNFLLEQKLDFIESDSPCSSEALSKKELSAEELYKRLEKLIIEDKANDEQIFDWVEANLDEIQMSSPTFLRALMTAVCKAAIIADSSTFRVDTAVIKQRVPILLKYLDSDTEKELQALYALQASIVKLDQPANLLRMFFDCLYDEEVISEDAFYKWESSKDPAEQNGKGVALKSVTAFFTWLREAEEESEDN |
140 | eIF4G-fl (nt) | AACAGCCAACCCCAGACACGGAGCCCCTTCTTCCAGCGGCCCCAGATCCAGCCACCACGGGCAACCATCCCCAACAGCAGCCCCAGCATCCGACCCGGCGCACAGACACCCACCGCCGTGTACCAGGCCAACCAGCACATCATGATGGTGAACCACCTGCCCATGCCCTACCCCGTGCCACAAGGCCCTCAGTACTGCATCCCACAGTACCGGCACAGCGGTCCTCCCTACGTGGGGCCGCCACAGCAGTACCCCGTTCAGCCTCCTGGACCGGGACCCTTTTATCCGGGACCTGGACCCGGAGACTTCCCCAACGCCTACGGCACACCCTTCTACCCCAGCCAGCCAGTGTACCAGAGCGCGCCCATCATCGTGCCCACCCAGCAGCAGCCTCCACCCGCCAAGCGGGAGAAGAAGACCATCCGGATCCGGGACCCCAACCAGGGCGGCAAGGACATCACCGAGGAGATCATGAGCGGAGGCGGCAGTCGGAACCCCACACCGCCCATCGGCAGACCCACCAGCACCCCAACTCCACCACAGCAGCTGCCCAGCCAGGTGCCCGAGCACAGCCCCGTGGTGTACGGCACCGTGGAAAGCGCCCACCTGGCCGCTAGCACCCCTGTGACCGCCGCCAGCGACCAGAAGCAGGAGGAGAAGCCCAAACCCGACCCCGTGCTGAAGTCTCCCAGCCCCGTGCTGCGTCTGGTGCTGAGCGGCGAGAAGAAGGAGCAGGAGGGCCAGACCAGCGAGACAACCGCCATCGTGAGCATCGCCGAGCTGCCACTGCCTCCCAGTCCCACCACCGTGAGCAGCGTGGCCCGGAGCACCATCGCAGCGCCCACAAGCAGCGCCCTGAGCAGCCAGCCCATCTTCACCACCGCCATCGACGACCGGTGCGAGCTGAGCAGTCCCCGGGAGGACACCATCCCCATCCCCAGCCTGACCAGCTGCACCGAGACCAGCGACCCACTGCCCACCAACGAGAACGACGACGACATCTGCAAGAAGCCCTGCAGCGTGGCACCCAACGACATCCCGCTGGTGAGCAGCACCAACCTGATCAACGAGATCAACGGCGTTAGCGAGAAACTGTCTGCCACCGAGAGCATCGTGGAGATCGTCAAGCAGGAGGTGCTGCCCCTGACCCTGGAGCTAGAGATCCTGGAGAACCCTCCAGAGGAGATGAAGCTGGAGTGCATCCCCGCCCCAATCACCCCGAGCACCGTGCCCAGCTTTCCTCCAACCCCACCCACCCCACCAGCCAGTCCACCTCACACTCCCGTGATCGTGCCTGCCGCCGCTACCACCGTGTCTAGCCCCAGCGCCGCCATCACCGTCCAGCGGGTACTGGAGGAGGACGAGAGCATCCGGACCTGCCTGAGCGAAGACGCCAAGGAGATCCAGAACAAGATCGAGGTGGAGGCCGACGGCCAGACCGAGGAAATCCTGGACAGCCAGAACCTGAATTCCCGGCGAAGCCCTGTGCCCGCACAGATCGCCATCACAGTGCCCAAGACCTGGAAGAAGCCCAAGGACCGGACCCGGACCACAGAGGAAATGCTGGAGGCCGAGCTGGAGCTGAAGGCCGAGGAAGAGCTGAGCATCGACAAGGTGCTGGAGAGCGAGCAGGACAAGATGAGCCAGGGCTTCCACCCTGAGCGGGACCCCAGCGACCTGAAGAAGGTGAAGGCCGTGGAGGAGAACGGCGAGGAGGCAGAGCCTGTGCGGAACGGGGCCGAGAGCGTGAGCGAGGGCGAGGGCATCGACGCCAACAGCGGCAGCACTGACAGCAGCGGCGACGGCGTGACCTTCCCCTTCAAGCCCGAAAGCTGGAAGCCCACCGACACCGAAGGAAAGAAGCAGTACGACCGGGAGTTCCTGCTGGACTTCCAGTTCATGCCCGCCTGCATCCAGAAACCCGAGGGGCTGCCACCAATCAGCGACGTGGTGCTGGACAAGATCAACCAGCCCAAGCTGCCCATGCGGACCCTGGATCCTCGGATCCTTCCCAGAGGCCCCGACTTCACTCCCGCCTTCGCCGACTTCGGCAGGCAGACCCCAGGTGGTCGGGGTGTGCCCCTGCTGAACGTGGGCAGCCGTCGGAGCCAGCCTGGCCAACGGCGGGAACCCCGGAAGATCATCACCGTGAGCGTGAAGGAGGACGTGCATCTGAAGAAGGCCGAGAACGCCTGGAAACCCAGCCAGAAGCGGGACAGCCAAGCCGACGACCCCGAGAACATCAAGACCCAGGAGCTGTTCCGGAAGGTTCGGAGCATCCTGAACAAGCTGACACCCCAGATGTTCAACCAGCTGATGAAGCAGGTGAGCGGCCTGACCGTGGACACCGAGGAGCGGCTGAAGGGCGTGATCGACCTGGTGTTTGAGAAAGCCATTGACGAGCCCAGCTTCAGCGTGGCCTACGCCAACATGTGCCGGTGCCTGGTGACCCTGAAGGTGCCCATGGCCGACAAGCCCGGCAACACCGTGAACTTCCGGAAGCTGCTGCTGAACCGGTGCCAGAAGGAGTTCGAGAAGGACAAGGCAGACGACGACGTGTTCGAGAAGAAGCAGAAAGAGTTAGAGGCCGCAAGCGCCCCTGAGGAGCGGACCCGGCTGCACGACGAGCTGGAGGAGGCCAAAGACAAGGCCCGGCGGAGGAGCATCGGCAACATCAAGTTCATCGGCGAGCTGTTCAAGCTGAAGATGCTGACCGAGGCCATCATGCACGACTGCGTGGTGAAGCTGCTGAAGAACCACGACGAGGAGAGCCTGGAGTGCCTGTGCCGGCTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCCAAGCCCCGGATGGACCAGTACTTCAACCAGATGGAGAAGATCGTGAAGGAGCGGAAGACCAGCAGCCGGATCCGGTTCATGCTGCAGGACGTTATCGACCTGCGGCTGTGCAACTGGGTGAGCCGGAGGGCTGACCAGGGCCCCAAGACCATCGAGCAGATCCACAAGGAGGCTAAGATCGAGGAGCAGGAAGAGCAGCGGAAGGTGCAGCAGCTGATGACCAAAGAGAAGCGGAGGCCTGGCGTGCAGCGAGTGGACGAGGGCGGCTGGAACACCGTGCAGGGCGCCAAGAACAGCCGGGTGCTGGACCCCAGCAAGTTCCTGAAGATCACCAAGCCCACCATCGACGAGAAGATCCAGCTGGTGCCCAAGGCCCAGCTCGGCAGCTGGGGCAAGGGCAGCTCAGGTGGCGCCAAGGCCAGCGAGACCGACGCCCTGAGAAGCAGCGCCAGCAGCCTGAACCGGTTCTCTGCCCTGCAGCCTCCTGCCCCTAGCGGCTCCACCCCAAGCACACCCGTGGAGTTCGACAGCCGGCGGACCCTGACCAGCCGGGGCTCCATGGGTCGCGAGAAGAACGACAAGCCCTTACCCAGCGCAACCGCTCGGCCCAACACCTTCATGCGGGGCGGCAGCTCCAAGGACCTGCTGGACAACCAGAGCCAGGAGGAGCAGCGGCGGGAGATGCTGGAGACCGTGAAGCAGCTGACCGGAGGCGTGGACGTGGAGCGGAACAGCACCGAGGCCGAGCGGAACAAGACCCGGGAGAGCGCCAAGCCCGAGATCAGCGCCATGAGCGCCCACGACAAGGCCGCCCTGAGCGAGGAGGAGCTGGAACGGAAGAGCAAGAGCATCATCGACGAGTTCCTGCACATCAACGACTTCAAGGAGGCCATGCAGTGCGTGGAGGAGCTGAACGCCCAGGGCCTGCTGCACGTGTTCGTGCGGGTGGGCGTGGAGAGCACCCTGGAGCGGAGCCAGATCACCCGGGACCACATGGGCCAGCTGCTGTACCAACTGGTGCAGAGCGAGAAGCTGAGCAAGCAGGACTTCTTCAAGGGCTTCAGCGAGACTCTGGAGCTGGCCGACGACATGGCCATCGACATTCCCCACATCTGGCTGTACCTGGCCGAGCTTGTGACCCCAATGCTGAAGGAGGGCGGCATCAGCATGCGGGAGCTGACCATCGAGTTCAGCAAGCCCCTCTTGCCAGTCGGCAGAGCAGGAGTGCTGCTGAGCGAGATCCTGCACCTGCTGTGCAAGCAGATGAGCCACAAGAAGGTGGGCGCCCTGTGGAGGGAGGCCGACCTGAGCTGGAAGGACTTCCTGCCCGAGGGCGAAGACGTGCACAACTTCTTGCTGGAGCAGAAGCTGGACTTCATCGAGAGCGACAGCCCCTGCAGCAGCGAGGCCCTGAGCAAGAAGGAACTGAGCGCCGAGGAGCTGTACAAGCGGCTGGAGAAGCTGATCATCGAGGACAAGGCCAACGACGAGCAGATCTTCGACTGGGTGGAGGCCAACCTGGACGAGATCCAGATGAGCAGCCCCACCTTCCTGCGGGCCCTGATGACCGCCGTGTGCAAGGCCGCCATCATCGCCGACAGCAGCACCTTCCGGGTGGACACCGCCGTGATCAAGCAGCGGGTGCCCATCCTGCTGAAGTACCTGGACAGCGACACCGAGAAGGAGCTGCAGGCCCTGTACGCCCTGCAGGCCAGCATCGTGAAGCTGGACCAGCCCGCCAACCTGCTGCGGATGTTCTTCGACTGCCTGTACGACGAAGAGGTGATCAGCGAGGACGCCTTCTACAAGTGGGAGAGCAGCAAGGACCCCGCCGAGCAGAACGGCAAGGGCGTGGCCCTGAAGAGCGTGACCGCCTTCTTCACCTGGCTGCGAGAGGCCGAGGAGGAGAGCGAGGACAAC |
141 | eIF4G (590-1129) (aa) | GEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQA |
142 | eIF4G (590-1129) (nt) | GGCGAGCAGAAGTACGAGTACAAGAGCGACCAGTGGAAGCCTCTGAACCTGGAGGAGAAGAAGAGATACGACAGAGAGTTCCTGCTGGGCTTCCAGTTCATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCT |
143 | eIF4G3 (aa) | NSQPQTRSPFFQRPQIQPPRATIPNSSPSIRPGAQTPTAVYQANQHIMMVNHLPMPYPVPQGPQYCIPQYRHSGPPYVGPPQQYPVQPPGPGPFYPGPGPGDFPNAYGTPFYPSQPVYQSAPIIVPTQQQPPPAKREKKTIRIRDPNQGGKDITEEIMSGGGSRNPTPPIGRPTSTPTPPQQLPSQVPEHSPVVYGTVESAHLAASTPVTAASDQKQEEKPKPDPVLKSPSPVLRLVLSGEKKEQEGQTSETTAIVSIAELPLPPSPTTVSSVARSTIAAPTSSALSSQPIFTTAIDDRCELSSPREDTIPIPSLTSCTETSDPLPTNENDDDICKKPCSVAPNDIPLVSSTNLINEINGVSEKLSATESIVEIVKQEVLPLTLELEILENPPEEMKLECIPAPITPSTVPSFPPTPPTPPASPPHTPVIVPAAATTVSSPSAAITVQRVLEEDESIRTCLSEDAKEIQNKIEVEADGQTEEILDSQNLNSRRSPVPAQIAITVPKTWKKPKDRTRTTEEMLEAELELKAEEELSIDKVLESEQDKMSQGFHPERDPSDLKKVKAVEENGEEAEPVRNGAESVSEGEGIDANSGSTDSSGDGVTFPFKPESWKPTDTEGKKQYDREFLLDFQFMPACIQKPEGLPPISDVVLDKINQPKLPMRTLDPRILPRGPDFTPAFADFGRQTPGGRGVPLLNVGSRRSQPGQRREPRKIITVSVKEDVHLKKAENAWKPSQKRDSQADDPENIKTQELFRKVRSILNKLTPQMFNQLMKQVSGLTVDTEERLKGVIDLVFEKAIDEPSFSVAYANMCRCLVTLKVPMADKPGNTVNFRKLLLNRCQKEFEKDKADDDVFEKKQKELEAASAPEERTRLHDELEEAKDKARRRSIGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIVKERKTSSRIRFMLQDVIDLRLCNWVSRRADQGPKTIEQIHKEAKIEEQEEQRKVQQLMTKEKRRPGVQRVDEGGWNTVQGAKNSRVLDPSKFLKITKPTIDEKIQLVPKAQLGSWGKGSSGGAKASETDALRSSASSLNRFSALQPPAPSGSTPSTPVEFDSRRTLTSRGSMGREKNDKPLPSATARPNTFMRGGSSKDLLDNQSQEEQRREMLETVKQLTGGVDVERNSTEAERNKTRESAKPEISAMSAHDKAALSEEELERKSKSIIDEFLHINDFKEAMQCVEELNAQGLLHVFVRVGVESTLERSQITRDHMGQLLYQLVQSEKLSKQDFFKGFSETLELADDMAIDIPHIWLYLAELVTPMLKEGGISMRELTIEFSKPLLPVGRAGVLLSEILHLLCKQMSHKKVGALWREADLSWKDFLPEGEDVHNFLLEQKLDFIESDSPCSSEALSKKELSAEELYKRLEKLIIEDKANDEQIFDWVEANLDEIQMSSPTFLRALMTAVCKAAIIADSSTFRVDTAVIKQRVPILLKYLDSDTEKELQALYALQASIVKLDQPANLLRMFFDCLYDEEVISEDAFYKWESSKDPAEQNGKGVALKSVTAFFTWLREAEEESEDN |
144 | eIF4G3 (nt) | AGCAACAGCCAACCCCAGACACGGAGCCCCTTCTTCCAGCGGCCCCAGATCCAGCCACCACGGGCAACCATCCCCAACAGCAGCCCCAGCATCCGACCCGGCGCACAGACACCCACCGCCGTGTACCAGGCCAACCAGCACATCATGATGGTGAACCACCTGCCCATGCCCTACCCCGTGCCACAAGGCCCTCAGTACTGCATCCCACAGTACCGGCACAGCGGTCCTCCCTACGTGGGGCCGCCACAGCAGTACCCCGTTCAGCCTCCTGGACCGGGACCCTTTTATCCGGGACCTGGACCCGGAGACTTCCCCAACGCCTACGGCACACCCTTCTACCCCAGCCAGCCAGTGTACCAGAGCGCGCCCATCATCGTGCCCACCCAGCAGCAGCCTCCACCCGCCAAGCGGGAGAAGAAGACCATCCGGATCCGGGACCCCAACCAGGGCGGCAAGGACATCACCGAGGAGATCATGAGCGGAGGCGGCAGTCGGAACCCCACACCGCCCATCGGCAGACCCACCAGCACCCCAACTCCACCACAGCAGCTGCCCAGCCAGGTGCCCGAGCACAGCCCCGTGGTGTACGGCACCGTGGAAAGCGCCCACCTGGCCGCTAGCACCCCTGTGACCGCCGCCAGCGACCAGAAGCAGGAGGAGAAGCCCAAACCCGACCCCGTGCTGAAGTCTCCCAGCCCCGTGCTGCGTCTGGTGCTGAGCGGCGAGAAGAAGGAGCAGGAGGGCCAGACCAGCGAGACAACCGCCATCGTGAGCATCGCCGAGCTGCCACTGCCTCCCAGTCCCACCACCGTGAGCAGCGTGGCCCGGAGCACCATCGCAGCGCCCACAAGCAGCGCCCTGAGCAGCCAGCCCATCTTCACCACCGCCATCGACGACCGGTGCGAGCTGAGCAGTCCCCGGGAGGACACCATCCCCATCCCCAGCCTGACCAGCTGCACCGAGACCAGCGACCCACTGCCCACCAACGAGAACGACGACGACATCTGCAAGAAGCCCTGCAGCGTGGCACCCAACGACATCCCGCTGGTGAGCAGCACCAACCTGATCAACGAGATCAACGGCGTTAGCGAGAAACTGTCTGCCACCGAGAGCATCGTGGAGATCGTCAAGCAGGAGGTGCTGCCCCTGACCCTGGAGCTAGAGATCCTGGAGAACCCTCCAGAGGAGATGAAGCTGGAGTGCATCCCCGCCCCAATCACCCCGAGCACCGTGCCCAGCTTTCCTCCAACCCCACCCACCCCACCAGCCAGTCCACCTCACACTCCCGTGATCGTGCCTGCCGCCGCTACCACCGTGTCTAGCCCCAGCGCCGCCATCACCGTCCAGCGGGTACTGGAGGAGGACGAGAGCATCCGGACCTGCCTGAGCGAAGACGCCAAGGAGATCCAGAACAAGATCGAGGTGGAGGCCGACGGCCAGACCGAGGAAATCCTGGACAGCCAGAACCTGAATTCCCGGCGAAGCCCTGTGCCCGCACAGATCGCCATCACAGTGCCCAAGACCTGGAAGAAGCCCAAGGACCGGACCCGGACCACAGAGGAAATGCTGGAGGCCGAGCTGGAGCTGAAGGCCGAGGAAGAGCTGAGCATCGACAAGGTGCTGGAGAGCGAGCAGGACAAGATGAGCCAGGGCTTCCACCCTGAGCGGGACCCCAGCGACCTGAAGAAGGTGAAGGCCGTGGAGGAGAACGGCGAGGAGGCAGAGCCTGTGCGGAACGGGGCCGAGAGCGTGAGCGAGGGCGAGGGCATCGACGCCAACAGCGGCAGCACTGACAGCAGCGGCGACGGCGTGACCTTCCCCTTCAAGCCCGAAAGCTGGAAGCCCACCGACACCGAAGGAAAGAAGCAGTACGACCGGGAGTTCCTGCTGGACTTCCAGTTCATGCCCGCCTGCATCCAGAAACCCGAGGGGCTGCCACCAATCAGCGACGTGGTGCTGGACAAGATCAACCAGCCCAAGCTGCCCATGCGGACCCTGGATCCTCGGATCCTTCCCAGAGGCCCCGACTTCACTCCCGCCTTCGCCGACTTCGGCAGGCAGACCCCAGGTGGTCGGGGTGTGCCCCTGCTGAACGTGGGCAGCCGTCGGAGCCAGCCTGGCCAACGGCGGGAACCCCGGAAGATCATCACCGTGAGCGTGAAGGAGGACGTGCATCTGAAGAAGGCCGAGAACGCCTGGAAACCCAGCCAGAAGCGGGACAGCCAAGCCGACGACCCCGAGAACATCAAGACCCAGGAGCTGTTCCGGAAGGTTCGGAGCATCCTGAACAAGCTGACACCCCAGATGTTCAACCAGCTGATGAAGCAGGTGAGCGGCCTGACCGTGGACACCGAGGAGCGGCTGAAGGGCGTGATCGACCTGGTGTTTGAGAAAGCCATTGACGAGCCCAGCTTCAGCGTGGCCTACGCCAACATGTGCCGGTGCCTGGTGACCCTGAAGGTGCCCATGGCCGACAAGCCCGGCAACACCGTGAACTTCCGGAAGCTGCTGCTGAACCGGTGCCAGAAGGAGTTCGAGAAGGACAAGGCAGACGACGACGTGTTCGAGAAGAAGCAGAAAGAGTTAGAGGCCGCAAGCGCCCCTGAGGAGCGGACCCGGCTGCACGACGAGCTGGAGGAGGCCAAAGACAAGGCCCGGCGGAGGAGCATCGGCAACATCAAGTTCATCGGCGAGCTGTTCAAGCTGAAGATGCTGACCGAGGCCATCATGCACGACTGCGTGGTGAAGCTGCTGAAGAACCACGACGAGGAGAGCCTGGAGTGCCTGTGCCGGCTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCCAAGCCCCGGATGGACCAGTACTTCAACCAGATGGAGAAGATCGTGAAGGAGCGGAAGACCAGCAGCCGGATCCGGTTCATGCTGCAGGACGTTATCGACCTGCGGCTGTGCAACTGGGTGAGCCGGAGGGCTGACCAGGGCCCCAAGACCATCGAGCAGATCCACAAGGAGGCTAAGATCGAGGAGCAGGAAGAGCAGCGGAAGGTGCAGCAGCTGATGACCAAAGAGAAGCGGAGGCCTGGCGTGCAGCGAGTGGACGAGGGCGGCTGGAACACCGTGCAGGGCGCCAAGAACAGCCGGGTGCTGGACCCCAGCAAGTTCCTGAAGATCACCAAGCCCACCATCGACGAGAAGATCCAGCTGGTGCCCAAGGCCCAGCTCGGCAGCTGGGGCAAGGGCAGCTCAGGTGGCGCCAAGGCCAGCGAGACCGACGCCCTGAGAAGCAGCGCCAGCAGCCTGAACCGGTTCTCTGCCCTGCAGCCTCCTGCCCCTAGCGGCTCCACCCCAAGCACACCCGTGGAGTTCGACAGCCGGCGGACCCTGACCAGCCGGGGCTCCATGGGTCGCGAGAAGAACGACAAGCCCTTACCCAGCGCAACCGCTCGGCCCAACACCTTCATGCGGGGCGGCAGCTCCAAGGACCTGCTGGACAACCAGAGCCAGGAGGAGCAGCGGCGGGAGATGCTGGAGACCGTGAAGCAGCTGACCGGAGGCGTGGACGTGGAGCGGAACAGCACCGAGGCCGAGCGGAACAAGACCCGGGAGAGCGCCAAGCCCGAGATCAGCGCCATGAGCGCCCACGACAAGGCCGCCCTGAGCGAGGAGGAGCTGGAACGGAAGAGCAAGAGCATCATCGACGAGTTCCTGCACATCAACGACTTCAAGGAGGCCATGCAGTGCGTGGAGGAGCTGAACGCCCAGGGCCTGCTGCACGTGTTCGTGCGGGTGGGCGTGGAGAGCACCCTGGAGCGGAGCCAGATCACCCGGGACCACATGGGCCAGCTGCTGTACCAACTGGTGCAGAGCGAGAAGCTGAGCAAGCAGGACTTCTTCAAGGGCTTCAGCGAGACTCTGGAGCTGGCCGACGACATGGCCATCGACATTCCCCACATCTGGCTGTACCTGGCCGAGCTTGTGACCCCAATGCTGAAGGAGGGCGGCATCAGCATGCGGGAGCTGACCATCGAGTTCAGCAAGCCCCTCTTGCCAGTCGGCAGAGCAGGAGTGCTGCTGAGCGAGATCCTGCACCTGCTGTGCAAGCAGATGAGCCACAAGAAGGTGGGCGCCCTGTGGAGGGAGGCCGACCTGAGCTGGAAGGACTTCCTGCCCGAGGGCGAAGACGTGCACAACTTCTTGCTGGAGCAGAAGCTGGACTTCATCGAGAGCGACAGCCCCTGCAGCAGCGAGGCCCTGAGCAAGAAGGAACTGAGCGCCGAGGAGCTGTACAAGCGGCTGGAGAAGCTGATCATCGAGGACAAGGCCAACGACGAGCAGATCTTCGACTGGGTGGAGGCCAACCTGGACGAGATCCAGATGAGCAGCCCCACCTTCCTGCGGGCCCTGATGACCGCCGTGTGCAAGGCCGCCATCATCGCCGACAGCAGCACCTTCCGGGTGGACACCGCCGTGATCAAGCAGCGGGTGCCCATCCTGCTGAAGTACCTGGACAGCGACACCGAGAAGGAGCTGCAGGCCCTGTACGCCCTGCAGGCCAGCATCGTGAAGCTGGACCAGCCCGCCAACCTGCTGCGGATGTTCTTCGACTGCCTGTACGACGAAGAGGTGATCAGCGAGGACGCCTTCTACAAGTGGGAGAGCAGCAAGGACCCCGCCGAGCAGAACGGCAAGGGCGTGGCCCTGAAGAGCGTGACCGCCTTCTTCACCTGGCTGCGAGAGGCCGAGGAGGAGAGCGAGGACAAC |
145 | eIF4G3-mid (aa) | RTLDPRILPRGPDFTPAFADFGRQTPGGRGVPLLNVGSRRSQPGQRREPRKIITVSVKEDVHLKKAENAWKPSQKRDSQADDPENIKTQELFRKVRSILNKLTPQMFNQLMKQVSGLTVDTEERLKGVIDLVFEKAIDEPSFSVAYANMCRCLVTLKVPMADKPGNTVNFRKLLLNRCQKEFEKDKADDDVFEKKQKELEAASAPEERTRLHDELEEAKDKARRRSIGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIVKERKTSSRIRFMLQDVIDLRLCNWVSRRADQGPKTIEQIHKEAKIEEQEEQRKVQQLMTKEKRRPGVQRVDEGGWNTVQGAKNSRVLDPSKFLKITKPTIDEKIQLVPKAQLGSWGKGSSG |
146 | eIF4G3-mid (nt) | AGCCGGACCCTGGATCCTCGGATCCTTCCCAGAGGCCCCGACTTCACTCCCGCCTTCGCCGACTTCGGCAGGCAGACCCCAGGTGGTCGGGGTGTGCCCCTGCTGAACGTGGGCAGCCGTCGGAGCCAGCCTGGCCAACGGCGGGAACCCCGGAAGATCATCACCGTGAGCGTGAAGGAGGACGTGCATCTGAAGAAGGCCGAGAACGCCTGGAAACCCAGCCAGAAGCGGGACAGCCAAGCCGACGACCCCGAGAACATCAAGACCCAGGAGCTGTTCCGGAAGGTTCGGAGCATCCTGAACAAGCTGACACCCCAGATGTTCAACCAGCTGATGAAGCAGGTGAGCGGCCTGACCGTGGACACCGAGGAGCGGCTGAAGGGCGTGATCGACCTGGTGTTTGAGAAAGCCATTGACGAGCCCAGCTTCAGCGTGGCCTACGCCAACATGTGCCGGTGCCTGGTGACCCTGAAGGTGCCCATGGCCGACAAGCCCGGCAACACCGTGAACTTCCGGAAGCTGCTGCTGAACCGGTGCCAGAAGGAGTTCGAGAAGGACAAGGCAGACGACGACGTGTTCGAGAAGAAGCAGAAAGAGTTAGAGGCCGCAAGCGCCCCTGAGGAGCGGACCCGGCTGCACGACGAGCTGGAGGAGGCCAAAGACAAGGCCCGGCGGAGGAGCATCGGCAACATCAAGTTCATCGGCGAGCTGTTCAAGCTGAAGATGCTGACCGAGGCCATCATGCACGACTGCGTGGTGAAGCTGCTGAAGAACCACGACGAGGAGAGCCTGGAGTGCCTGTGCCGGCTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCCAAGCCCCGGATGGACCAGTACTTCAACCAGATGGAGAAGATCGTGAAGGAGCGGAAGACCAGCAGCCGGATCCGGTTCATGCTGCAGGACGTTATCGACCTGCGGCTGTGCAACTGGGTGAGCCGGAGGGCTGACCAGGGCCCCAAGACCATCGAGCAGATCCACAAGGAGGCTAAGATCGAGGAGCAGGAAGAGCAGCGGAAGGTGCAGCAGCTGATGACCAAAGAGAAGCGGAGGCCTGGCGTGCAGCGAGTGGACGAGGGCGGCTGGAACACCGTGCAGGGCGCCAAGAACAGCCGGGTGCTGGACCCCAGCAAGTTCCTGAAGATCACCAAGCCCACCATCGACGAGAAGATCCAGCTGGTGCCCAAGGCCCAGCTCGGCAGCTGGGGCAAGGGCAGCTCAGGT |
147 | MBP-eIF4G-mid2mut (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKAIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAV |
148 | MBP-eIF4G-mid2mut (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGGCGATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTG |
149 | MBP- eIF4G (590-1129) (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSGEQKYEYKSDQWKPLNLEEKKRYDREFLLGFQFIFASMQKPEGLPHISDVVLDKANKTPLRPLDPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQA |
150 | MBP- eIF4G (590-1129) (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCGGCGAGCAGAAGTACGAGTACAAGAGCGACCAGTGGAAGCCTCTGAACCTGGAGGAGAAGAAGAGATACGACAGAGAGTTCCTGCTGGGCTTCCAGTTCATATTCGCGAGCATGCAGAAGCCTGAAGGTCTGCCTCACATCAGCGACGTGGTGCTGGACAAGGCCAACAAGACCCCTCTTAGACCTCTGGACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGTTCATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCT |
151 | MBP-eIF4G3 (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSNSQPQTRSPFFQRPQIQPPRATIPNSSPSIRPGAQTPTAVYQANQHIMMVNHLPMPYPVPQGPQYCIPQYRHSGPPYVGPPQQYPVQPPGPGPFYPGPGPGDFPNAYGTPFYPSQPVYQSAPIIVPTQQQPPPAKREKKTIRIRDPNQGGKDITEEIMSGGGSRNPTPPIGRPTSTPTPPQQLPSQVPEHSPVVYGTVESAHLAASTPVTAASDQKQEEKPKPDPVLKSPSPVLRLVLSGEKKEQEGQTSETTAIVSIAELPLPPSPTTVSSVARSTIAAPTSSALSSQPIFTTAIDDRCELSSPREDTIPIPSLTSCTETSDPLPTNENDDDICKKPCSVAPNDIPLVSSTNLINEINGVSEKLSATESIVEIVKQEVLPLTLELEILENPPEEMKLECIPAPITPSTVPSFPPTPPTPPASPPHTPVIVPAAATTVSSPSAAITVQRVLEEDESIRTCLSEDAKEIQNKIEVEADGQTEEILDSQNLNSRRSPVPAQIAITVPKTWKKPKDRTRTTEEMLEAELELKAEEELSIDKVLESEQDKMSQGFHPERDPSDLKKVKAVEENGEEAEPVRNGAESVSEGEGIDANSGSTDSSGDGVTFPFKPESWKPTDTEGKKQYDREFLLDFQFMPACIQKPEGLPPISDVVLDKINQPKLPMRTLDPRILPRGPDFTPAFADFGRQTPGGRGVPLLNVGSRRSQPGQRREPRKIITVSVKEDVHLKKAENAWKPSQKRDSQADDPENIKTQELFRKVRSILNKLTPQMFNQLMKQVSGLTVDTEERLKGVIDLVFEKAIDEPSFSVAYANMCRCLVTLKVPMADKPGNTVNFRKLLLNRCQKEFEKDKADDDVFEKKQKELEAASAPEERTRLHDELEEAKDKARRRSIGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIVKERKTSSRIRFMLQDVIDLRLCNWVSRRADQGPKTIEQIHKEAKIEEQEEQRKVQQLMTKEKRRPGVQRVDEGGWNTVQGAKNSRVLDPSKFLKITKPTIDEKIQLVPKAQLGSWGKGSSGGAKASETDALRSSASSLNRFSALQPPAPSGSTPSTPVEFDSRRTLTSRGSMGREKNDKPLPSATARPNTFMRGGSSKDLLDNQSQEEQRREMLETVKQLTGGVDVERNSTEAERNKTRESAKPEISAMSAHDKAALSEEELERKSKSIIDEFLHINDFKEAMQCVEELNAQGLLHVFVRVGVESTLERSQITRDHMGQLLYQLVQSEKLSKQDFFKGFSETLELADDMAIDIPHIWLYLAELVTPMLKEGGISMRELTIEFSKPLLPVGRAGVLLSEILHLLCKQMSHKKVGALWREADLSWKDFLPEGEDVHNFLLEQKLDFIESDSPCSSEALSKKELSAEELYKRLEKLIIEDKANDEQIFDWVEANLDEIQMSSPTFLRALMTAVCKAAIIADSSTFRVDTAVIKQRVPILLKYLDSDTEKELQALYALQASIVKLDQPANLLRMFFDCLYDEEVISEDAFYKWESSKDPAEQNGKGVALKSVTAFFTWLREAEEESEDN |
152 | MBP-eIF4G3 (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCAACAGCCAACCCCAGACACGGAGCCCCTTCTTCCAGCGGCCCCAGATCCAGCCACCACGGGCAACCATCCCCAACAGCAGCCCCAGCATCCGACCCGGCGCACAGACACCCACCGCCGTGTACCAGGCCAACCAGCACATCATGATGGTGAACCACCTGCCCATGCCCTACCCCGTGCCACAAGGCCCTCAGTACTGCATCCCACAGTACCGGCACAGCGGTCCTCCCTACGTGGGGCCGCCACAGCAGTACCCCGTTCAGCCTCCTGGACCGGGACCCTTTTATCCGGGACCTGGACCCGGAGACTTCCCCAACGCCTACGGCACACCCTTCTACCCCAGCCAGCCAGTGTACCAGAGCGCGCCCATCATCGTGCCCACCCAGCAGCAGCCTCCACCCGCCAAGCGGGAGAAGAAGACCATCCGGATCCGGGACCCCAACCAGGGCGGCAAGGACATCACCGAGGAGATCATGAGCGGAGGCGGCAGTCGGAACCCCACACCGCCCATCGGCAGACCCACCAGCACCCCAACTCCACCACAGCAGCTGCCCAGCCAGGTGCCCGAGCACAGCCCCGTGGTGTACGGCACCGTGGAAAGCGCCCACCTGGCCGCTAGCACCCCTGTGACCGCCGCCAGCGACCAGAAGCAGGAGGAGAAGCCCAAACCCGACCCCGTGCTGAAGTCTCCCAGCCCCGTGCTGCGTCTGGTGCTGAGCGGCGAGAAGAAGGAGCAGGAGGGCCAGACCAGCGAGACAACCGCCATCGTGAGCATCGCCGAGCTGCCACTGCCTCCCAGTCCCACCACCGTGAGCAGCGTGGCCCGGAGCACCATCGCAGCGCCCACAAGCAGCGCCCTGAGCAGCCAGCCCATCTTCACCACCGCCATCGACGACCGGTGCGAGCTGAGCAGTCCCCGGGAGGACACCATCCCCATCCCCAGCCTGACCAGCTGCACCGAGACCAGCGACCCACTGCCCACCAACGAGAACGACGACGACATCTGCAAGAAGCCCTGCAGCGTGGCACCCAACGACATCCCGCTGGTGAGCAGCACCAACCTGATCAACGAGATCAACGGCGTTAGCGAGAAACTGTCTGCCACCGAGAGCATCGTGGAGATCGTCAAGCAGGAGGTGCTGCCCCTGACCCTGGAGCTAGAGATCCTGGAGAACCCTCCAGAGGAGATGAAGCTGGAGTGCATCCCCGCCCCAATCACCCCGAGCACCGTGCCCAGCTTTCCTCCAACCCCACCCACCCCACCAGCCAGTCCACCTCACACTCCCGTGATCGTGCCTGCCGCCGCTACCACCGTGTCTAGCCCCAGCGCCGCCATCACCGTCCAGCGGGTACTGGAGGAGGACGAGAGCATCCGGACCTGCCTGAGCGAAGACGCCAAGGAGATCCAGAACAAGATCGAGGTGGAGGCCGACGGCCAGACCGAGGAAATCCTGGACAGCCAGAACCTGAATTCCCGGCGAAGCCCTGTGCCCGCACAGATCGCCATCACAGTGCCCAAGACCTGGAAGAAGCCCAAGGACCGGACCCGGACCACAGAGGAAATGCTGGAGGCCGAGCTGGAGCTGAAGGCCGAGGAAGAGCTGAGCATCGACAAGGTGCTGGAGAGCGAGCAGGACAAGATGAGCCAGGGCTTCCACCCTGAGCGGGACCCCAGCGACCTGAAGAAGGTGAAGGCCGTGGAGGAGAACGGCGAGGAGGCAGAGCCTGTGCGGAACGGGGCCGAGAGCGTGAGCGAGGGCGAGGGCATCGACGCCAACAGCGGCAGCACTGACAGCAGCGGCGACGGCGTGACCTTCCCCTTCAAGCCCGAAAGCTGGAAGCCCACCGACACCGAAGGAAAGAAGCAGTACGACCGGGAGTTCCTGCTGGACTTCCAGTTCATGCCCGCCTGCATCCAGAAACCCGAGGGGCTGCCACCAATCAGCGACGTGGTGCTGGACAAGATCAACCAGCCCAAGCTGCCCATGCGGACCCTGGATCCTCGGATCCTTCCCAGAGGCCCCGACTTCACTCCCGCCTTCGCCGACTTCGGCAGGCAGACCCCAGGTGGTCGGGGTGTGCCCCTGCTGAACGTGGGCAGCCGTCGGAGCCAGCCTGGCCAACGGCGGGAACCCCGGAAGATCATCACCGTGAGCGTGAAGGAGGACGTGCATCTGAAGAAGGCCGAGAACGCCTGGAAACCCAGCCAGAAGCGGGACAGCCAAGCCGACGACCCCGAGAACATCAAGACCCAGGAGCTGTTCCGGAAGGTTCGGAGCATCCTGAACAAGCTGACACCCCAGATGTTCAACCAGCTGATGAAGCAGGTGAGCGGCCTGACCGTGGACACCGAGGAGCGGCTGAAGGGCGTGATCGACCTGGTGTTTGAGAAAGCCATTGACGAGCCCAGCTTCAGCGTGGCCTACGCCAACATGTGCCGGTGCCTGGTGACCCTGAAGGTGCCCATGGCCGACAAGCCCGGCAACACCGTGAACTTCCGGAAGCTGCTGCTGAACCGGTGCCAGAAGGAGTTCGAGAAGGACAAGGCAGACGACGACGTGTTCGAGAAGAAGCAGAAAGAGTTAGAGGCCGCAAGCGCCCCTGAGGAGCGGACCCGGCTGCACGACGAGCTGGAGGAGGCCAAAGACAAGGCCCGGCGGAGGAGCATCGGCAACATCAAGTTCATCGGCGAGCTGTTCAAGCTGAAGATGCTGACCGAGGCCATCATGCACGACTGCGTGGTGAAGCTGCTGAAGAACCACGACGAGGAGAGCCTGGAGTGCCTGTGCCGGCTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCCAAGCCCCGGATGGACCAGTACTTCAACCAGATGGAGAAGATCGTGAAGGAGCGGAAGACCAGCAGCCGGATCCGGTTCATGCTGCAGGACGTTATCGACCTGCGGCTGTGCAACTGGGTGAGCCGGAGGGCTGACCAGGGCCCCAAGACCATCGAGCAGATCCACAAGGAGGCTAAGATCGAGGAGCAGGAAGAGCAGCGGAAGGTGCAGCAGCTGATGACCAAAGAGAAGCGGAGGCCTGGCGTGCAGCGAGTGGACGAGGGCGGCTGGAACACCGTGCAGGGCGCCAAGAACAGCCGGGTGCTGGACCCCAGCAAGTTCCTGAAGATCACCAAGCCCACCATCGACGAGAAGATCCAGCTGGTGCCCAAGGCCCAGCTCGGCAGCTGGGGCAAGGGCAGCTCAGGTGGCGCCAAGGCCAGCGAGACCGACGCCCTGAGAAGCAGCGCCAGCAGCCTGAACCGGTTCTCTGCCCTGCAGCCTCCTGCCCCTAGCGGCTCCACCCCAAGCACACCCGTGGAGTTCGACAGCCGGCGGACCCTGACCAGCCGGGGCTCCATGGGTCGCGAGAAGAACGACAAGCCCTTACCCAGCGCAACCGCTCGGCCCAACACCTTCATGCGGGGCGGCAGCTCCAAGGACCTGCTGGACAACCAGAGCCAGGAGGAGCAGCGGCGGGAGATGCTGGAGACCGTGAAGCAGCTGACCGGAGGCGTGGACGTGGAGCGGAACAGCACCGAGGCCGAGCGGAACAAGACCCGGGAGAGCGCCAAGCCCGAGATCAGCGCCATGAGCGCCCACGACAAGGCCGCCCTGAGCGAGGAGGAGCTGGAACGGAAGAGCAAGAGCATCATCGACGAGTTCCTGCACATCAACGACTTCAAGGAGGCCATGCAGTGCGTGGAGGAGCTGAACGCCCAGGGCCTGCTGCACGTGTTCGTGCGGGTGGGCGTGGAGAGCACCCTGGAGCGGAGCCAGATCACCCGGGACCACATGGGCCAGCTGCTGTACCAACTGGTGCAGAGCGAGAAGCTGAGCAAGCAGGACTTCTTCAAGGGCTTCAGCGAGACTCTGGAGCTGGCCGACGACATGGCCATCGACATTCCCCACATCTGGCTGTACCTGGCCGAGCTTGTGACCCCAATGCTGAAGGAGGGCGGCATCAGCATGCGGGAGCTGACCATCGAGTTCAGCAAGCCCCTCTTGCCAGTCGGCAGAGCAGGAGTGCTGCTGAGCGAGATCCTGCACCTGCTGTGCAAGCAGATGAGCCACAAGAAGGTGGGCGCCCTGTGGAGGGAGGCCGACCTGAGCTGGAAGGACTTCCTGCCCGAGGGCGAAGACGTGCACAACTTCTTGCTGGAGCAGAAGCTGGACTTCATCGAGAGCGACAGCCCCTGCAGCAGCGAGGCCCTGAGCAAGAAGGAACTGAGCGCCGAGGAGCTGTACAAGCGGCTGGAGAAGCTGATCATCGAGGACAAGGCCAACGACGAGCAGATCTTCGACTGGGTGGAGGCCAACCTGGACGAGATCCAGATGAGCAGCCCCACCTTCCTGCGGGCCCTGATGACCGCCGTGTGCAAGGCCGCCATCATCGCCGACAGCAGCACCTTCCGGGTGGACACCGCCGTGATCAAGCAGCGGGTGCCCATCCTGCTGAAGTACCTGGACAGCGACACCGAGAAGGAGCTGCAGGCCCTGTACGCCCTGCAGGCCAGCATCGTGAAGCTGGACCAGCCCGCCAACCTGCTGCGGATGTTCTTCGACTGCCTGTACGACGAAGAGGTGATCAGCGAGGACGCCTTCTACAAGTGGGAGAGCAGCAAGGACCCCGCCGAGCAGAACGGCAAGGGCGTGGCCCTGAAGAGCGTGACCGCCTTCTTCACCTGGCTGCGAGAGGCCGAGGAGGAGAGCGAGGACAAC |
153 | MBP-eIF4G3-mid (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSRTLDPRILPRGPDFTPAFADFGRQTPGGRGVPLLNVGSRRSQPGQRREPRKIITVSVKEDVHLKKAENAWKPSQKRDSQADDPENIKTQELFRKVRSILNKLTPQMFNQLMKQVSGLTVDTEERLKGVIDLVFEKAIDEPSFSVAYANMCRCLVTLKVPMADKPGNTVNFRKLLLNRCQKEFEKDKADDDVFEKKQKELEAASAPEERTRLHDELEEAKDKARRRSIGNIKFIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIVKERKTSSRIRFMLQDVIDLRLCNWVSRRADQGPKTIEQIHKEAKIEEQEEQRKVQQLMTKEKRRPGVQRVDEGGWNTVQGAKNSRVLDPSKFLKITKPTIDEKIQLVPKAQLGSWGKGSSG |
154 | MBP-eIF4G3-mid (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCCGGACCCTGGATCCTCGGATCCTTCCCAGAGGCCCCGACTTCACTCCCGCCTTCGCCGACTTCGGCAGGCAGACCCCAGGTGGTCGGGGTGTGCCCCTGCTGAACGTGGGCAGCCGTCGGAGCCAGCCTGGCCAACGGCGGGAACCCCGGAAGATCATCACCGTGAGCGTGAAGGAGGACGTGCATCTGAAGAAGGCCGAGAACGCCTGGAAACCCAGCCAGAAGCGGGACAGCCAAGCCGACGACCCCGAGAACATCAAGACCCAGGAGCTGTTCCGGAAGGTTCGGAGCATCCTGAACAAGCTGACACCCCAGATGTTCAACCAGCTGATGAAGCAGGTGAGCGGCCTGACCGTGGACACCGAGGAGCGGCTGAAGGGCGTGATCGACCTGGTGTTTGAGAAAGCCATTGACGAGCCCAGCTTCAGCGTGGCCTACGCCAACATGTGCCGGTGCCTGGTGACCCTGAAGGTGCCCATGGCCGACAAGCCCGGCAACACCGTGAACTTCCGGAAGCTGCTGCTGAACCGGTGCCAGAAGGAGTTCGAGAAGGACAAGGCAGACGACGACGTGTTCGAGAAGAAGCAGAAAGAGTTAGAGGCCGCAAGCGCCCCTGAGGAGCGGACCCGGCTGCACGACGAGCTGGAGGAGGCCAAAGACAAGGCCCGGCGGAGGAGCATCGGCAACATCAAGTTCATCGGCGAGCTGTTCAAGCTGAAGATGCTGACCGAGGCCATCATGCACGACTGCGTGGTGAAGCTGCTGAAGAACCACGACGAGGAGAGCCTGGAGTGCCTGTGCCGGCTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCCAAGCCCCGGATGGACCAGTACTTCAACCAGATGGAGAAGATCGTGAAGGAGCGGAAGACCAGCAGCCGGATCCGGTTCATGCTGCAGGACGTTATCGACCTGCGGCTGTGCAACTGGGTGAGCCGGAGGGCTGACCAGGGCCCCAAGACCATCGAGCAGATCCACAAGGAGGCTAAGATCGAGGAGCAGGAAGAGCAGCGGAAGGTGCAGCAGCTGATGACCAAAGAGAAGCGGAGGCCTGGCGTGCAGCGAGTGGACGAGGGCGGCTGGAACACCGTGCAGGGCGCCAAGAACAGCCGGGTGCTGGACCCCAGCAAGTTCCTGAAGATCACCAAGCCCACCATCGACGAGAAGATCCAGCTGGTGCCCAAGGCCCAGCTCGGCAGCTGGGGCAAGGGCAGCTCAGGT |
155 | Gld2 (aa) | FPNSILGRPPFTPNHQQHNNFFTLSPTVYSHQQLIDAQFNFQNADLSRAVSLQQLTYGNVSPIQTSASPLFRGRKRLSDEKNLPLDGKRQRFHSPHQEPTVVNQIVPLSGERRYSMPPLFHTHYVPDIVRCVPPFREIAFLEPREITLPEAKDKLSQQILELFETCQQQISDLKKKELCRTQLQREIQLLFPQSRLFLVGSSLNGFGTRSSDGDLCLVVKEEPCFFQVNQKTEARHILTLVHKHFCTRLSGYIERPQLIRAKVPIVKFRDKVSCVEFDLNVNNIVGIRNTFLLRTYAYLENRVRPLVLVIKKWASHHQINDASRGTLSSYSLVLMVLHYLQTLPEPILPSLQKIYPESFSPAIQLHLVHQAPCNVPPYLSKNESNLGDLLLGFLKYYATEFDWNSQMISVREAKAIPRPDGIEWRNKYICVEEPFDGTNTARAVHEKQKFDMIKDQFLKSWHRLKNKRDLNSILPVRAAVLKR |
156 | Gld2 (nt) | TTCCCTAACAGCATCCTGGGCAGACCTCCTTTCACCCCTAACCACCAGCAGCACAACAACTTCTTCACCCTGAGCCCTACCGTGTACAGCCATCAGCAGCTGATCGACGCCCAGTTCAACTTCCAGAACGCCGACCTGAGCAGAGCCGTGAGCCTGCAGCAACTCACCTACGGCAACGTTAGCCCAATCCAGACCAGCGCCAGCCCTCTGTTCAGAGGCAGAAAGAGACTGAGCGACGAGAAGAACCTGCCTCTGGACGGCAAGAGACAGAGATTCCACAGCCCTCACCAGGAGCCAACAGTGGTGAACCAGATCGTGCCTCTGAGCGGCGAGAGAAGATACAGCATGCCTCCACTGTTCCACACCCACTACGTGCCTGACATCGTGAGGTGCGTGCCACCTTTCAGAGAGATCGCCTTCCTGGAGCCTCGCGAGATTACCCTGCCTGAGGCCAAGGACAAGCTGAGCCAGCAGATTCTGGAACTGTTCGAGACTTGCCAACAACAAATTAGCGACCTGAAGAAGAAGGAGCTGTGCAGAACCCAGCTGCAGCGCGAGATCCAGCTGCTGTTCCCTCAGAGCAGACTGTTCCTGGTGGGCAGCAGCCTGAACGGCTTCGGCACCAGAAGCAGCGACGGCGACCTGTGCCTGGTGGTGAAGGAGGAGCCTTGCTTCTTCCAAGTAAATCAGAAGACCGAGGCCAGACACATCCTGACCCTGGTGCACAAGCACTTCTGCACCAGACTGTCCGGCTACATCGAGCGCCCTCAGCTTATAAGAGCCAAGGTGCCTATCGTGAAGTTCAGAGACAAGGTGAGCTGCGTGGAGTTCGATCTGAACGTGAACAACATCGTGGGCATCAGAAACACCTTCCTGCTGAGAACCTACGCCTACCTGGAGAACAGAGTCAGACCTCTGGTGCTGGTGATCAAGAAGTGGGCTTCTCATCACCAGATCAACGACGCCTCCCGCGGTACTCTGTCTAGCTACAGCCTCGTACTGATGGTGCTGCACTACCTGCAGACTCTCCCTGAACCTATCCTGCCTAGTCTGCAGAAGATCTACCCTGAGAGCTTCAGCCCTGCCATCCAATTGCATCTCGTTCACCAGGCCCCTTGCAACGTTCCTCCTTATTTGAGCAAGAACGAGAGCAACCTGGGAGATCTCCTGCTGGGCTTCCTGAAGTACTACGCCACCGAATTCGATTGGAACAGCCAGATGATCAGCGTGAGAGAAGCAAAGGCCATCCCTAGACCTGACGGCATCGAGTGGAGAAACAAGTACATCTGTGTGGAGGAACCTTTCGACGGCACCAACACCGCCCGCGCAGTACACGAGAAGCAGAAGTTCGACATGATCAAGGACCAGTTCCTCAAGAGCTGGCACAGACTGAAGAACAAGAGAGACTTGAATAGCATCTTGCCGGTGAGAGCCGCCGTGCTGAAGAGA |
157 | MBP-Gld2 (aa) | MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIYGGGGSFPNSILGRPPFTPNHQQHNNFFTLSPTVYSHQQLIDAQFNFQNADLSRAVSLQQLTYGNVSPIQTSASPLFRGRKRLSDEKNLPLDGKRQRFHSPHQEPTVVNQIVPLSGERRYSMPPLFHTHYVPDIVRCVPPFREIAFLEPREITLPEAKDKLSQQILELFETCQQQISDLKKKELCRTQLQREIQLLFPQSRLFLVGSSLNGFGTRSSDGDLCLVVKEEPCFFQVNQKTEARHILTLVHKHFCTRLSGYIERPQLIRAKVPIVKFRDKVSCVEFDLNVNNIVGIRNTFLLRTYAYLENRVRPLVLVIKKWASHHQINDASRGTLSSYSLVLMVLHYLQTLPEPILPSLQKIYPESFSPAIQLHLVHQAPCNVPPYLSKNESNLGDLLLGFLKYYATEFDWNSQMISVREAKAIPRPDGIEWRNKYICVEEPFDGTNTARAVHEKQKFDMIKDQFLKSWHRLKNKRDLNSILPVRAAVLKR |
158 | MBP-Gld2 (nt) | ATGGCCAGCAACTTCACCCAGTTCGTGCTGGTGGACAACGGCGGTACCGGAGACGTGACCGTGGCCCCTTCTAACTTCGCCAACGGCATCGCCGAGTGGATCAGCAGCAACAGCAGAAGCCAGGCCTACAAGGTGACCTGCAGCGTGAGACAGAGCAGCGCCCAGAACAGAAAGTACACCATCAAGGTGGAGGTGCCTAAGGGCGCCTGGAGAAGCTACCTGAACATGGAGCTGACCATCCCTATCTTCGCCACCAACAGCGACTGCGAGCTGATCGTGAAGGCCATGCAGGGCCTGCTGAAGGACGGCAACCCTATCCCTAGCGCCATCGCCGCCAATTCAGGCATCTACGGAGGCGGTGGAAGCTTCCCTAACAGCATCCTGGGCAGACCTCCTTTCACCCCTAACCACCAGCAGCACAACAACTTCTTCACCCTGAGCCCTACCGTGTACAGCCATCAGCAGCTGATCGACGCCCAGTTCAACTTCCAGAACGCCGACCTGAGCAGAGCCGTGAGCCTGCAGCAACTCACCTACGGCAACGTTAGCCCAATCCAGACCAGCGCCAGCCCTCTGTTCAGAGGCAGAAAGAGACTGAGCGACGAGAAGAACCTGCCTCTGGACGGCAAGAGACAGAGATTCCACAGCCCTCACCAGGAGCCAACAGTGGTGAACCAGATCGTGCCTCTGAGCGGCGAGAGAAGATACAGCATGCCTCCACTGTTCCACACCCACTACGTGCCTGACATCGTGAGGTGCGTGCCACCTTTCAGAGAGATCGCCTTCCTGGAGCCTCGCGAGATTACCCTGCCTGAGGCCAAGGACAAGCTGAGCCAGCAGATTCTGGAACTGTTCGAGACTTGCCAACAACAAATTAGCGACCTGAAGAAGAAGGAGCTGTGCAGAACCCAGCTGCAGCGCGAGATCCAGCTGCTGTTCCCTCAGAGCAGACTGTTCCTGGTGGGCAGCAGCCTGAACGGCTTCGGCACCAGAAGCAGCGACGGCGACCTGTGCCTGGTGGTGAAGGAGGAGCCTTGCTTCTTCCAAGTAAATCAGAAGACCGAGGCCAGACACATCCTGACCCTGGTGCACAAGCACTTCTGCACCAGACTGTCCGGCTACATCGAGCGCCCTCAGCTTATAAGAGCCAAGGTGCCTATCGTGAAGTTCAGAGACAAGGTGAGCTGCGTGGAGTTCGATCTGAACGTGAACAACATCGTGGGCATCAGAAACACCTTCCTGCTGAGAACCTACGCCTACCTGGAGAACAGAGTCAGACCTCTGGTGCTGGTGATCAAGAAGTGGGCTTCTCATCACCAGATCAACGACGCCTCCCGCGGTACTCTGTCTAGCTACAGCCTCGTACTGATGGTGCTGCACTACCTGCAGACTCTCCCTGAACCTATCCTGCCTAGTCTGCAGAAGATCTACCCTGAGAGCTTCAGCCCTGCCATCCAATTGCATCTCGTTCACCAGGCCCCTTGCAACGTTCCTCCTTATTTGAGCAAGAACGAGAGCAACCTGGGAGATCTCCTGCTGGGCTTCCTGAAGTACTACGCCACCGAATTCGATTGGAACAGCCAGATGATCAGCGTGAGAGAAGCAAAGGCCATCCCTAGACCTGACGGCATCGAGTGGAGAAACAAGTACATCTGTGTGGAGGAACCTTTCGACGGCACCAACACCGCCCGCGCAGTACACGAGAAGCAGAAGTTCGACATGATCAAGGACCAGTTCCTCAAGAGCTGGCACAGACTGAAGAACAAGAGAGACTTGAATAGCATCTTGCCGGTGAGAGCCGCCGTGCTGAAGAGA |
159 | eIF4G-mid2mut (aa) | DPTRLQGINCGPDFTPSFANLGRTTLSTRGPPRGGPGGELPRGPAGLGPRRSQQGPRKEPRKIIATVLMTEDIKLNKAEKAWKPSSKRTAADKDRGEEDADGSKTQDLFRRVRSILNKLTPQMFQQLMKQVTQLAIDTEERLKGVIDLIFEKAISEPNFSVAYANMCRCLMALKVPTTEKPTVTVNFRKLLLNRCQKEFEKDKDDDEVFEKKQKEMDEAATAEERGRLKEELEEARDIARRRSLGNIKAIGELFKLKMLTEAIMHDCVVKLLKNHDEESLECLCRLLTTIGKDLDFEKAKPRMDQYFNQMEKIIKEKKTSSRIRFMLQDVLDLRGSNWVPRRGDQGPKTIDQIHKEAEMEEHREHIKVQQLMAKGSDKRRGGPPGPPISRGLPLVDDGGWNTVPISKGSRPIDTSRLTKITKPGSIDSNNQLFAPGGRLSWGKGSSGGSGAKPSDAASEAARPATSTLNRFSALQQAV |
160 | eIF4G-mid2mut (nt) | GACCCTACCAGACTGCAGGGCATCAACTGCGGCCCTGACTTCACTCCTTCTTTCGCAAACCTGGGCAGAACCACCCTGAGCACCAGAGGCCCTCCTAGAGGTGGTCCCGGCGGAGAACTCCCCAGGGGTCCTGCCGGCCTGGGCCCTAGACGCTCCCAGCAAGGTCCTAGAAAGGAGCCAAGGAAGATCATCGCCACCGTGCTGATGACCGAGGACATCAAGCTGAACAAAGCTGAGAAGGCCTGGAAGCCTAGCAGCAAGAGAACCGCCGCCGACAAGGACAGAGGCGAGGAGGACGCCGACGGATCCAAGACCCAGGACCTGTTCAGAAGAGTGAGAAGCATCCTCAACAAGCTGACCCCTCAGATGTTCCAGCAGCTGATGAAGCAGGTGACGCAGCTCGCCATCGACACCGAGGAGAGACTGAAGGGCGTGATCGACCTGATCTTTGAGAAGGCTATCTCAGAGCCTAACTTCAGCGTGGCCTACGCCAACATGTGCCGTTGCCTGATGGCATTGAAGGTGCCAACCACCGAGAAGCCTACTGTGACCGTCAATTTCCGTAAACTGCTGCTGAACCGGTGCCAGAAAGAGTTCGAGAAGGATAAGGACGACGACGAGGTCTTCGAGAAGAAACAGAAAGAAATGGACGAGGCCGCCACCGCAGAGGAAAGGGGCCGATTAAAGGAGGAGCTGGAGGAGGCCAGAGACATCGCCAGACGGCGTTCTCTGGGCAACATCAAGGCGATAGGTGAGCTGTTCAAGCTAAAGATGCTCACCGAGGCCATAATGCACGACTGCGTGGTGAAGCTACTGAAGAACCACGACGAAGAAAGCCTGGAGTGCCTGTGCAGACTGCTGACCACCATCGGCAAGGACCTGGACTTCGAGAAGGCAAAGCCTCGAATGGACCAGTACTTCAACCAGATGGAGAAGATTATCAAGGAGAAGAAGACCAGCAGCAGAATCAGATTCATGCTGCAGGACGTACTGGACCTGCGCGGAAGCAACTGGGTGCCAAGGAGAGGGGACCAAGGACCAAAGACCATCGACCAGATCCACAAGGAAGCGGAGATGGAGGAGCACAGAGAGCACATAAAGGTGCAGCAGCTTATGGCCAAGGGCAGCGACAAGCGAAGAGGCGGCCCGCCCGGACCTCCTATCAGCAGAGGCCTTCCTCTGGTAGACGACGGCGGCTGGAACACCGTGCCTATCTCTAAGGGCTCCAGACCTATCGACACTTCCCGTCTTACCAAGATCACCAAGCCAGGATCTATTGACAGCAACAACCAGCTGTTCGCCCCAGGAGGAAGACTTAGCTGGGGCAAGGGAAGTTCCGGCGGATCCGGCGCCAAGCCTTCCGACGCCGCCAGCGAGGCTGCCAGACCTGCCACCAGCACCTTGAACCGCTTTTCCGCTCTGCAGCAAGCTGTG |
在一些實施例中,系鏈分子包含
表 10中所提供之系鏈分子,例如MBP、PCP、Lambda N、U1A或PUF、15.5kd、LARP7或其變異體或片段。在一些實施例中,系鏈分子為MBP。在一些實施例中,系鏈分子為PCP。在一些實施例中,系鏈分子為Lambda N。在一些實施例中,系鏈分子為U1A。在一些實施例中,系鏈分子為PUF。在一些實施例中,系鏈分子為15.5 kd。在一些實施例中,系鏈分子為LARP7。
在一些實施例中,當系鏈分子為MBP (例如野生型MBP、其變異體或片段)時,結合元件為MS2 (例如野生型MS2或其變異體或片段)。
在一些實施例中,當系鏈分子為PCP (例如野生型PCP或其變異體或片段)時,結合元件為PP7 (例如野生型PP7或其變異體或片段)。
在一些實施例中,當系鏈分子為Lambda N (例如野生型Lambda N或其變異體或片段)時,結合元件為BoxB (例如野生型BoxB或其變異體或片段)。
在一些實施例中,當系鏈分子為U1A (例如野生型U1A或其變異體或片段)時,結合元件為U1A髮夾(例如野生型U1A髮夾或其變異體或片段)。
在一些實施例中,當系鏈分子為15.5kd (例如野生型15.5kd或其變異體或片段)時,結合元件為扭結轉角形成序列(例如野生型U1A髮夾或其變異體或片段)。
在一些實施例中,當系鏈分子為PUF (例如野生型PUF或其變異體或片段)時,結合元件為PRE (例如野生型PRE或其變異體或片段)。
在一些實施例中,當系鏈分子為LARP7 (例如野生型LARP7或其變異體或片段)時,結合元件為7SK (例如野生型7SK或其變異體或片段)。
可用作系鏈分子之其他例示性RNA結合蛋白或RNA結合結構域揭示於Corley等人,
Molecular Cell78:1,第9-29頁中,其全部內容係以引用的方式併入本文中。舉例而言,
表 12提供可用作系鏈分子之其他例示性RNA結合蛋白或結構域。在一實施例中,本文所揭示之系鏈分子包含
表 12中所列示之結構域(或其變異體或片段)或蛋白質(或其變異體或片段)。
表 12. 例示性 RNA 結合蛋白及結構域
結構域名稱 | 含有結構域之蛋白質家族 |
冷休克結構域 | 冷休克蛋白質,Y盒蛋白 |
雙股RNA結合結構域 | RNA酶,ADAR,DICER |
解旋酶 | DExH/D盒,Ski2樣,RIGI樣,NS3,UPF1樣RNA結合解旋酶 |
固有無序區(IDR) | 大多數RBP |
K同源 | hnRNP,轉譯調控蛋白 |
La模體(LAM) | La蛋白,La相關蛋白(LARP) |
Piwi-Argonaute-Zwille (PAZ) | Argonaute蛋白,Dicer |
P元件誘導之睪丸功能低下(PIWI) | Argonaute蛋白 |
三角狀五肽重複序列(PPR) | RNA編輯蛋白 |
假尿苷合酶及古嘌苷 轉糖苷酶(PUA) | RNA修飾酶,代謝酶 |
Pumillo樣重複序列(PUM) | PUF蛋白 |
核糖體S1樣 | 核糖體蛋白,轉譯起始因子,RNA酶II,PNP酶 |
RNA識別模體(RRM) | hnRNP,剪接因子 |
Sm及Sm樣(Sm / Lsm) | U1剪接體蛋白,Hfq |
硫尿苷合酶、RNA甲基化酶及假尿苷合酶(THUMP) | tRNA修飾酶 |
YT521-B同源(YTH) | YTH家族m6A閱讀器 |
Zn指 | 轉錄因子,METTL酶 |
在一些實施例中,系鏈分子包含MBP。在一些實施例中,系鏈分子包含
表 11中所提供之胺基酸序列或與其具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列。在一些實施例中,系鏈分子包含SEQ ID NO: 84之胺基酸序列或與其具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之胺基酸序列。
在一些實施例中,系鏈分子由
表 11中所提供之核苷酸序列或與其具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列編碼。在一些實施例中,系鏈分子由SEQ ID NO: 85之核苷酸序列或與其具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%一致性之序列編碼。
在一些實施例中,效應分子為轉譯因子,例如eIF4G;聚A結合蛋白(PABP);eIF3d或其組件;Dazl或其片段或變異體或組合。其他例示性轉譯因子提供於Pelletier及Soneneberg.,Annu. Rev. Biochem. 2019. 88:307-35中,其全部內容係以引用的方式併入本文中。
在一些實施例中,效應分子直接結合至結合元件。效應分子可具有其所結合之特異性靶序列。
在一些實施例中,效應分子進一步包含結合至(例如識別)結合元件(系鏈分子)之多肽。
在一實施例中,包含系鏈分子之效應分子包含含有第一結構域及第二結構域之多肽。在一實施例中,第一結構域與第二結構域可操作地連接。
在一實施例中,在編碼進一步包含系鏈分子之效應分子之第二多核苷酸中,編碼效應分子之核苷酸序列位於編碼系鏈分子之核苷酸序列的上游。在一實施例中,編碼效應分子之核苷酸序列位於編碼系鏈分子之核苷酸序列的下游。在一實施例中,編碼效應分子之核苷酸序列藉由蛋白酶裂解位點或內部核糖體進入位點與編碼系鏈分子之核苷酸序列隔開。
在一實施例中,在編碼進一步包含系鏈分子之效應分子之第二多核苷酸中,編碼效應分子之核苷酸序列與編碼系鏈分子之核苷酸序列毗鄰。
在一些實施例中,效應分子為轉譯因子,其調節(例如促進)核糖體結合,例如募集、起始前複合物形成或RNA解旋。在一些實施例中,效應分子包含eIF4G,例如野生型eIF4G、eIF4G之變異體或其片段。
在一些實施例中,效應分子包含野生型eIF4G。在一些實施例中,野生型eIF4G包含約1600個胺基酸之序列。
在一些實施例中,效應分子包含例如如本文所揭示之eIF4G之片段。在一些實施例中,eIF4G片段保留核糖體結合,例如募集。
在一些實施例中,eIF4G片段之長度為約1,500-200個胺基酸、約1,400-300個胺基酸、約1,300-350個胺基酸、約1,200-400個胺基酸、約1,100-450個胺基酸、約1,000-500個胺基酸、約900-550個胺基酸、約800-600個胺基酸、約1,500-300個胺基酸、1,500-400個胺基酸、1,500-500個胺基酸、約1,500-600個胺基酸、約1,500-700個胺基酸、約1,500-800個胺基酸、約1,500-900個胺基酸、約1,500-1000個胺基酸、約1,500-1,100個胺基酸、約1,500-1,200個胺基酸、約1,500-1,300個胺基酸、約1,500-1,400個胺基酸、約1,400-200個胺基酸、約1,300-200個胺基酸、約1,200-200個胺基酸、約1,100-200個胺基酸、約1,000-200個胺基酸、約900-200個胺基酸、約800-200個胺基酸、約700-200個胺基酸、約600-200個胺基酸或約500-200個胺基酸。
在一些實施例中,eIF4G片段之長度為約500個胺基酸。在一些實施例中,eIF4G片段之長度為約600個胺基酸。在一些實施例中,eIF4G片段之長度為約700個胺基酸。在一些實施例中,eIF4G片段之長度為約800個胺基酸。在一些實施例中,eIF4G片段之長度為約900個胺基酸。在一些實施例中,eIF4G片段之長度為約1000個胺基酸。在一些實施例中,eIF4G片段之長度為約1100個胺基酸。在一些實施例中,eIF4G片段之長度為約1200個胺基酸。在一些實施例中,eIF4G片段之長度為約1300個胺基酸。在一些實施例中,eIF4G片段之長度為約1400個胺基酸。在一些實施例中,eIF4G片段之長度為約1500個胺基酸。
在一些實施例中,效應分子包含例如如本文所揭示之eIF4G之變異體。在一些實施例中,eIF4G變異體保留核糖體結合,例如募集。在一些實施例中,eIF4G變異體包含eIF4G多肽序列中在以下位置中之任一者、兩者、全部或組合處之突變(例如取代):胺基酸768、胺基酸771或胺基酸776。在一些實施例中,eIF4G變異體包含在eIF4G多肽序列位置768處之突變,例如取代,例如在位置768處白胺酸至丙胺酸之取代。在一些實施例中,eIF4G變異體包含在eIF4G多肽序列位置771處之突變,例如取代,例如在位置771處白胺酸至丙胺酸之取代。在一些實施例中,eIF4G變異體包含在eIF4G多肽序列位置776處之突變,例如取代,例如在位置776處苯丙胺酸取代成丙胺酸。在一些實施例中,eIF4G變異體包含在eIF4G多肽序列位置768處之突變,例如取代,例如位置768處之丙胺酸;及在eIF4G多肽序列位置771處之突變,例如取代,例如位置771處之丙胺酸。在一些實施例中,eIF4G變異體包含在eIF4G多肽序列位置768處之突變,例如取代,例如位置768處之丙胺酸;及在eIF4G多肽序列位置776處之突變,例如取代,例如位置776處之丙胺酸。在一些實施例中,eIF4G變異體包含在eIF4G多肽序列位置771處之突變,例如取代,例如位置771處之丙胺酸;及在eIF4G多肽序列位置776處之突變,例如取代,例如位置776處之丙胺酸。在一些實施例中,eIF4G變異體包含在eIF4G多肽序列位置771處之突變,例如取代,例如位置771處之丙胺酸;在eIF4G多肽序列位置771處之突變,例如取代,例如在位置771處之丙胺酸;及在eIF4G多肽序列位置776處之突變,例如取代,例如在位置776處之丙胺酸。
在一些實施例中,效應分子係例如可募集核糖體之eIF3複合物之一部分。在一些實施例中,eIF3複合物包含eIF3d、eIF3c、eIF3e或eIF3i或其片段或其任何組合。
17. 環狀核酸之合成
本揭示案之環狀核酸可根據任何可用技術來製備,包括(但不限於)化學合成及酶促合成。在一些實施例中,可使線性一級構築體或線性mRNA環化以產生本揭示案之環狀RNA。環化機制可經由諸如(但不限於)化學、酶促或核酶催化之方法等方法來進行。新形成之5'鍵聯/3'鍵聯可為分子內鍵聯或分子間鍵聯。
在一個實施例中,可使用化學方法使線性一級構築體或線性mRNA環化,以形成環狀RNA構築體。在化學方法中,核酸(例如線性一級構築體或線性mRNA)之5'端及3'端含有化學反應性基團,當該等基團靠近在一起時,在分子之5'端與3'端之間形成新的共價鍵聯。5'端可含有NHS-酯反應性基團且3'端可含有3'-胺基封端之核苷酸,使得在有機溶劑中,線性RNA分子3'端上之3'-胺基封端之核苷酸將經歷對5'-NHS-酯部分之親核攻擊,從而形成新的5'醯胺鍵/3'醯胺鍵。
在一個實施例中,DNA或RNA連接酶可用於將5'-磷酸化核酸分子(例如線性一級構築體或線性mRNA)酶促連接至核酸之3'-羥基,從而形成新的磷酸二酯鍵聯。在實例反應中,根據製造商之方案,使1 μg核酸分子與1-10個單位之T4 RNA連接酶(New England Biolabs, Ipswich, MA)一起在37℃下培育1小時。連接反應可在分開之寡核苷酸存在下進行,該分開之寡核苷酸能夠與並置之5'區及3'區二者鹼基配對,以有助於酶促連接反應。
在一個實施例中,DNA或RNA連接酶可用於合成環狀多核苷酸。作為非限制性實例,連接酶可為環連接酶或環狀連接酶。
在另一實施例中,蛋白質連接可用於將同線性一級構築體或線性mRNA之5’端締合之第一蛋白質與同線性一級構築體或線性mRNA之3’端締合之第二蛋白質酶促連接。在一個態樣中,第一蛋白質與第二蛋白質可為相同蛋白質。在另一實施例中,第一蛋白質與第二蛋白質係不同的。作為非限制性實例,一種或兩種蛋白質可為RNA結合融合酶。在另一非限制性實例中,一種或兩種蛋白質可為PUF1蛋白,其可源自惡性瘧原蟲(Plasmodium falciparum)。作為另一非限制性實例,一種或兩種蛋白質可與其他酶融合,以使線性一級構築體或線性mRNA環化。
在一個實施例中,蛋白質連接可用於將同線性一級構築體或線性mRNA之5’端締合之第一融合酶與同線性一級構築體或線性mRNA之3’端締合之第二融合酶酶促連接。
在一個實施例中,cDNA模板之5'端或3'端可編碼連接酶核酶序列,使得在活體外轉錄期間,所得核酸分子可含有能夠將核酸分子之5'端連接至核酸分子之3'端的活性核酶序列。連接酶核酶可源自I群內含子、δ肝炎病毒、髮夾核酶,或可由SELEX (指數富集之配位體系統進化)進行選擇。核酶連接酶反應可在介於0℃與37℃之間的溫度下進行1至24小時。
在一個實施例中,可藉由使用至少一個非核酸部分使線性一級構築體或線性mRNA環化。在一個態樣中,該至少一個非核酸部分可與線性一級構築體或線性mRNA之5’末端附近及/或3’末端附近之區域或特徵反應,以使線性一級構築體或線性mRNA環化。在另一態樣中,該至少一個非核酸部分可位於線性一級構築體或線性mRNA之5’末端及/或3’末端中,或與其連接,或在其附近。本發明中所考慮之非核酸部分可為同源的或異源的。作為非限制性實例,非核酸部分可為鍵聯,諸如疏水性鍵聯、離子鍵聯、生物可降解鍵聯及/或可裂解鍵聯。作為另一非限制性實例,非核酸部分為連接部分。作為另一非限制性實例,非核酸部分可為寡核苷酸或肽部分,諸如適配體。
在一個實施例中,線性一級構築體或線性mRNA可由於非核酸部分而環化,該非核酸部分引起位於線性一級構築體或線性mRNA之5’端及3’端處、其附近或與其連接之原子、分子表面之間的吸引。作為非限制性實例,線性一級構築體或線性mRNA可藉由分子間力或分子內力而環化。分子間力之非限制性實例包括偶極-偶極力、偶極誘導之偶極力、誘導偶極誘導之偶極力、凡得瓦力(Van der Waals force)及倫敦分散力(London dispersion force)。分子內力之非限制性實例包括共價鍵、金屬鍵、離子鍵、共振鍵、不可知鍵、偶極鍵、共軛、超共軛及反鍵結。
在一個實施例中,線性一級構築體或線性mRNA可包含在5’末端附近及在3’末端附近之核酶RNA序列。當序列暴露於核酶之其餘部分時,核酶RNA序列可共價連接至肽。在一個態樣中,在5’末端及3’末端附近與核酶RNA序列共價連接之肽可彼此締合,從而使線性一級構築體或線性mRNA環化。在另一態樣中,在5’末端及3’末端附近與核酶RNA共價連接之肽可使線性一級構築體或線性mRNA在使用此項技術中已知之各種方法(諸如但不限於蛋白質連接)經受連接後環化。用於本發明之線性一級構築體或線性RNA中之核酶之非限制性實例或用以併入及/或共價連接肽之方法之非詳盡列表闡述於美國專利申請案第US20030082768號中,該專利申請案之內容係以全文引用的方式併入本文中。
此項技術中亦闡述合成環狀核酸分子之各種方法(例如,參見美國專利第US6210931號、美國專利第US5773244號、美國專利第US5766903號、美國專利第US5712128號、美國專利第US5426180號、美國公開案第US20100137407號、國際公開案第WO1992001813號及國際公開案第WO2010084371號;該等案件各自之內容係以全文引用的方式併入本文中)。
在一些實施例中,設計並合成本揭示案之環狀核酸之過程通常包括以下步驟:基因構築、線性mRNA產生(有或沒有修飾)及純化,以及線性mRNA之環化。在酶促合成方法中,首先選擇編碼所關注多肽之靶多核苷酸序列以將其併入至載體中,該載體將經擴增以產生cDNA模板。視情況,靶多核苷酸序列及/或任何側翼序列可經密碼子最佳化。接著使用該cDNA模板經由活體外轉錄(IVT)產生mRNA。產生後,mRNA可經歷純化及環化過程。下文更詳細地提供產生編碼所關注多肽之線性多核苷酸之步驟,該線性多核苷酸接著可經歷環化過程。
舉例而言,本發明之具有包含式XIV之序列之多核苷酸:
[A
n]-L
1-[B
o],
式 XIV可藉由使具有式XV結構之化合物:
[A
n]-(R
1)
a-(R
2)
b-(R
3)
c-N
3 式 XV與具有式XVI結構之化合物反應來合成:
R
27-(R
5)
d-(R
6)
e-(R
7)
f-[B
o]
式 XVI其中每一A及B獨立地為任何核苷(例如核苷酸);
n及o獨立地為10至10,000,例如10至1000或10至2000;且
L
1具有式XVII結構:
式 XVII其中a、b、c、d、e及f各自獨立地為0或1;
R
1、R
3、R
5及R
7各自獨立地選自視情況經取代之C
1-C
6伸烷基、視情況經取代之C
1-C
6伸雜烷基、O、S及NR
8;
R
2及R
6各自獨立地選自羰基、硫羰基、磺醯基或磷醯基;
R
4為視情況經取代之三氮雜環烯(triazolene);且
R
8為氫、視情況經取代之C
1-C
4烷基、視情況經取代之C
3-C
4烯基、視情況經取代之C
2-C
4炔基、視情況經取代之C
2-C
6雜環基、視情況經取代之C
6-C
12芳基或視情況經取代之C
1-C
7雜烷基;且
R
27為視情況經取代之C
2-C
3炔基或視情況經取代之C
8-C
12環炔基,
其中L
1在核苷中之一者之糖上連接至[A
n]及[B
o]。
本發明之包括式XVIII、式XIX、式XX或式XXI結構之環狀多核苷酸:
、 、
式 XVIII 式 XIX 或
式 XX 式 XXI
可藉由使具有式XXII、式XXIII、式XXIV或式XXV結構之化合物:
、 、
式 XXII 式 XXIII 或
式 XIV 式 XXV
與具有式XXVI或式XXVII結構之化合物反應(例如在[3+2]環加成條件下,在銅源存在或不存在下)來合成:
或
式 XXVI 式 XXVII其中N
1及N
2各自獨立地為核鹼基;
R
9、R
10、R
11、R
12、R
13、R
14、R
15及R
16各自獨立地為H、鹵基、羥基、硫醇、視情況經取代之C
1-C
6烷基、視情況經取代之C
1-C
6雜烷基、視情況經取代之C
2-C
6雜烯基、視情況經取代之C
2-C
6雜炔基、視情況經取代之胺基、疊氮基或視情況經取代之C
6-C
10芳基;
g及h各自獨立地為0或1;
每一X
1及X
4獨立地為O、NH或S;且
R
24及R
27各自獨立地為連接核苷區;且
R
25、R
25’、R
26及R
26’各自獨立地為視情況經取代之C
1-C
6伸烷基或視情況經取代之C
1-C
6伸雜烷基,或者R
25’或R
26’與炔基一起形成視情況經取代之環炔基。
舉例而言,本發明之環狀多核苷酸可如下所示來合成:
。
在一些實施例中,利用此方法可將5'帽結構或聚A尾連接至線性多核苷酸,且該線性多核苷酸可藉由本文所闡述之方法環化。
如下所示可將5'帽結構連接至本發明之多核苷酸:
多核苷酸可在連接5’帽結構後環化。
如下所示可將聚A尾連接至本發明之多核苷酸:
。
多核苷酸可在連接聚A尾後環化。
可環化之多核苷酸可使用各種方法製得。
舉例而言,本發明之多核苷酸可包含式XXVIII或式XXIX之結構:
或
式 XXVIII 式 XXIX
環狀多核苷酸可包含藉由包括以下之方法製得之結構:使具有式XXX或式XXXI結構之化合物:
或
式 XXX 式 XXXI
與具有式XXXII結構之化合物反應(例如在烷基化條件下):
式 XXXII其中N
1及N
2各自獨立地為核鹼基;
R
9、R
10、R
11、R
12、R
13、R
14、R
15及R
16各自獨立地為H、鹵基、羥基、硫醇、視情況經取代之C
1-C
6烷基、視情況經取代之C
1-C
6雜烷基、視情況經取代之C
2-C
6雜烯基、視情況經取代之C
2-C
6雜炔基、視情況經取代之胺基、疊氮基或視情況經取代之C
6-C
10芳基;
g及h各自獨立地為0或1;
每一X
1及X
4獨立地為O、NH或S;
每一X
2獨立地為O或S;且
每一X
3獨立地為OH或SH或其鹽;
R
17及R
19各自獨立地為連接核苷區;且
R
18為鹵素。
本發明之環狀多核苷酸可包括式XXXIII或式XXXIV之結構:
或
式 XXXIII 式 XXXIV
此方法包括使具有式XXXV或式XXXVI結構之化合物:
或
式 XXXV 式 XXXVI
與具有式XXXVII或式XXXVIII結構之化合物反應(例如在施陶丁格(Staudinger)反應條件下):
或
式 XXXVII 式 XXXVIII其中N
1及N
2各自獨立地為核鹼基;
R
9、R
10、R
11、R
12、R
13、R
14、R
15及R
16各自獨立地為H、鹵基、羥基、硫醇、視情況經取代之C
1-C
6烷基、視情況經取代之C
1-C
6雜烷基、視情況經取代之C
2-C
6雜烯基、視情況經取代之C
2-C
6雜炔基、視情況經取代之胺基、疊氮基或視情況經取代之C
6-C
10芳基;
g及h各自獨立地為0或1;
每一X
4獨立地為O、NH或S;且
每一X
1及X
2獨立地為O或S;
每一X
3獨立地為OH、SH或其鹽;
R
20及R
23各自獨立地為連接核苷區;且
R
21及R
22各自獨立地為視情況經取代之C
1-C
6烷氧基。
本發明之環狀多核苷酸包括式XXXIX、式XL、式XLI或式XLII之結構:
、 、
式 XXXIX 式 XL 或 式 XLI 式 XLII。
此方法包括使具有式XLIII、式XLIV、式XLV或式XLVI結構之化合物:
、 、
式 XLIII 式 XLIV 或
式 XLV 式 XLVI
與具有式XLVII或式XLVIII結構之化合物反應(例如在[3+2]環加成條件下,在銅源存在或不存在下):
或
式 XLVII 式 XLVIII其中N
1及N
2各自獨立地為核鹼基;
R
9、R
10、R
11、R
12、R
13、R
14、R
15及R
16各自獨立地為H、鹵基、羥基、硫醇、視情況經取代之C
1-C
6烷基、視情況經取代之C
1-C
6雜烷基、視情況經取代之C
2-C
6雜烯基、視情況經取代之C
2-C
6雜炔基、視情況經取代之胺基、疊氮基或視情況經取代之C
6-C
10芳基;
g及h各自獨立地為0或1;
每一X
1及X
4獨立地不存在,為O、NH或S或其鹽;
R
24及R
27各自獨立地為連接核苷區;且
R
25、R
25’、R
26及R
26’各自獨立地不存在,或為視情況經取代之C
1-C
6伸烷基或視情況經取代之C
1-C
6伸雜烷基,或R
25與炔基一起形成視情況經取代之伸環炔基。
本發明之環狀多核苷酸可如下所示來合成:
。
用於合成本發明之環狀多核苷酸之其他方法如下所示:
a)
;
b)
;
c)
,其中CEO為2-氰基乙氧基,且X為O或S。
用於合成本發明之環狀多核苷酸之其他方法如下所示:
。
應理解,在3’位(或當g或h為1時在4'位)及5’位(或當g或h為1時在6'位)所示之反應性基團可顛倒。舉例而言,鹵素、疊氮基或炔基可連接至5'位(或當g或h為1時為6'位),且硫代磷酸酯、(硫基)磷醯基或疊氮基可連接至3'位(或當g或h為1時為4'位)。
在一些實施例中,線性多核苷酸及/或線性一級構築體可環化以生成本發明之環狀核酸,包括(但不限於) 3種不同的途徑,諸如1)化學,2)酶促,及3)核酶催化。下文概述該等途徑之非限制性實例。新形成之5'鍵聯/3'鍵聯可為分子內的或分子間的。
作為非限制性實例,可環化之線性多核苷酸及線性一級構築體可選自以下中所闡述之彼等線性多核苷酸及線性一級構築體:國際公開案第WO2013151666號、第WO2013151667號、第WO2013151668號、第WO2013151663號、第WO2013151669號、第WO2013151670號、第WO2013151664號、第WO2013151665號、第WO2013151671號、第WO2013151672號、第WO2013151736號,該等公開案各自之內容係以全文引用的方式併入本文中。
在第一途徑中,核酸之5'端及3'端含有一或多個化學反應性基團,該一或多個化學反應性基團靠近在一起時,在分子之5'端與3'端之間形成新的共價鍵聯。5'端可含有(但不限於) NHS-酯反應性基團且3'端可含有(但不限於) 3'-胺基封端之核苷酸,使得在有機溶劑中,合成mRNA分子3'端上之3'-胺基封端之核苷酸將經歷對5'-NHS-酯部分之親核攻擊,從而形成新的5'醯胺鍵/3'醯胺鍵,產生環狀RNA。
在第二途徑中,T4 RNA連接酶可用於將5'-磷酸化核酸分子酶促連接至核酸之3'-羥基,從而形成新的磷酸二酯鍵聯。在非限制性實例反應中,根據製造商之方案,使1 μg核酸分子與1-10個單位之T4 RNA連接酶(New England Biolabs, Ipswich, MA)一起在37℃下培育1小時。連接反應可在分開之寡核苷酸存在下進行,該分開之寡核苷酸能夠與並置之5'區及3'區二者鹼基配對,以有助於酶促連接反應。反應將產生環狀核酸。
在第三途徑中,cDNA模板之5'端或3'端編碼連接酶核酶序列,使得在活體外轉錄期間,所得核酸分子可含有能夠將核酸分子之5'端連接至核酸分子之3'端的活性核酶序列。連接酶核酶可源自I群內含子、δ肝炎病毒、髮夾核酶,或可由SELEX (指數富集之配位體系統進化)進行選擇。核酶連接酶反應可在介於0℃與37℃之間的溫度下進行1至24小時。
本發明之環狀多核苷酸可如下所示來合成:
或者,炔基及疊氮基可經如本文所闡述之其他反應性基團(例如鹵素及硫代磷酸酯或疊氮基及(硫基)磷醯基)置換。
18. 起始密碼子區
本發明亦包括包含起始密碼子區及本文所闡述之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)二者之多核苷酸。在一些實施例中,本揭示案之多核苷酸可具有與起始密碼子區類似或功能類似之區域。
在一些實施例中,多核苷酸之轉譯可自不為起始密碼子AUG之密碼子起始。多核苷酸之轉譯可自替代性起始密碼子起始,諸如(但不限於) ACG、AGG、AAG、CTG/CUG、GTG/GUG、ATA/AUA、ATT/AUU、TTG/UUG (參見Touriol等人,Biology of the Cell 95 (2003) 169-178以及Matsuda及Mauro,PLoS ONE, 2010 5:11;該等參考文獻各自之內容係以全文引用的方式併入本文中)。
作為非限制性實例,多核苷酸之轉譯自替代性起始密碼子ACG開始。作為另一非限制性實例,多核苷酸轉譯自替代性起始密碼子CTG或CUG開始。作為另一非限制性實例,多核苷酸之轉譯自替代性起始密碼子GTG或GUG開始。
已知起始轉譯之密碼子(諸如(但不限於)起始密碼子或替代性起始密碼子)側翼之核苷酸影響多核苷酸之轉譯效率、長度及/或結構。(例如,參見Matsuda及Mauro,PLoS ONE, 2010 5:11;其內容係以全文引用的方式併入本文中)。掩蔽起始轉譯之密碼子側翼之任何核苷酸可用於改變多核苷酸之轉譯起始位置、轉譯效率、長度及/或結構。
在一些實施例中,可在起始密碼子或替代性起始密碼子附近使用掩蔽劑以掩蔽或隱藏密碼子,從而降低在所掩蔽之起始密碼子或替代性起始密碼子處起始轉譯之機率。掩蔽劑之非限制性實例包括反義鎖核酸(LNA)多核苷酸及外顯子連接複合物(EJC) (例如,參見描述掩蔽劑LNA多核苷酸及EJC之Matsuda及Mauro (PLoS ONE, 2010 5:11);其內容係以全文引用的方式併入本文中)。
在一些實施例中,掩蔽劑可用於掩蔽多核苷酸之起始密碼子,以增加轉譯將自替代性起始密碼子起始之可能性。在一些實施例中,掩蔽劑可用於掩蔽第一起始密碼子或替代性起始密碼子,以增加轉譯將自所掩蔽之起始密碼子或替代性起始密碼子下游之起始密碼子或替代性起始密碼子起始之機會。
在一些實施例中,起始密碼子或替代性起始密碼子可位於miRNA結合位點之完全互補序列內。miRNA結合位點之完全互補序列可有助於控制多核苷酸之轉譯、長度及/或結構,類似於掩蔽劑。作為非限制性實例,起始密碼子或替代性起始密碼子可位於miRNA結合位點之完全互補序列之中間。起始密碼子或替代性起始密碼子可位於第一核苷酸、第二核苷酸、第三核苷酸、第四核苷酸、第五核苷酸、第六核苷酸、第七核苷酸、第八核苷酸、第九核苷酸、第十核苷酸、第十一核苷酸、第十二核苷酸、第十三核苷酸、第十四核苷酸、第十五核苷酸、第十六核苷酸、第十七核苷酸、第十八核苷酸、第十九核苷酸、第二十核苷酸或第二十一核苷酸之後。
在一些實施例中,可將多核苷酸之起始密碼子自多核苷酸序列去除,以使多核苷酸之轉譯自不為起始密碼子之密碼子開始。多核苷酸之轉譯可自所去除之起始密碼子後之密碼子開始或自下游起始密碼子或替代性起始密碼子開始。在非限制性實例中,起始密碼子ATG或AUG作為多核苷酸序列之前3個核苷酸被去除,以使轉譯自下游起始密碼子或替代性起始密碼子起始。去除起始密碼子之多核苷酸序列可進一步包含至少一種用於下游起始密碼子及/或替代性起始密碼子之掩蔽劑,以控制或試圖控制轉譯之起始、多核苷酸之長度及/或多核苷酸之結構。
19. 終止密碼子區
本揭示案亦包括包含終止密碼子區及本文所闡述之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)二者之多核苷酸。在一些實施例中,本揭示案之多核苷酸可在3'非轉譯區(UTR)之前包括至少兩個終止密碼子。在DNA之情形下,終止密碼子可選自TGA、TAA及TAG,或在RNA之情形下,選自UGA、UAA及UAG。在一些實施例中,本揭示案之多核苷酸包括終止密碼子TGA (在DNA之情形下)或終止密碼子UGA (在RNA之情形下)及一個額外終止密碼子。在另一實施例中,該額外終止密碼子可為TAA或UAA。在一些實施例中,本揭示案之多核苷酸包括三個連續終止密碼子、四個終止密碼子或更多。
20. mRNA 元件之組合
本文所揭示之任一多核苷酸可包含以下元件中之一者、兩者、三者或全部:(a) 5’-UTR (例如如本文所闡述);(b)包含終止元件之編碼區(例如如本文所闡述);(c) 3’-UTR (例如如本文所闡述);及視情況(d) 3’穩定區(例如如本文所闡述)。本文亦揭示包含多核苷酸之LNP組合物。
在一些實施例中,本揭示案之多核苷酸包含(a)
表 7中所闡述之5’ UTR或其變異體或片段,及(b)包含本文所提供之終止元件之編碼區。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之帽結構,或例如如本文所闡述之聚A尾。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之3’穩定區。
在一些實施例中,本揭示案之多核苷酸包含(a)
表 7中所闡述之5’ UTR或其變異體或片段,及(c)
表 8中所闡述之3’ UTR或其變異體或片段。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之帽結構,或例如如本文所闡述之聚A尾。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之3’穩定區。
在一些實施例中,本揭示案之多核苷酸包含(c)
表 8中所闡述之3’ UTR或其變異體或片段,及(b)包含本文所提供之終止元件之編碼區。在一些實施例中,多核苷酸包含
表 13中所提供之序列。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之帽結構,或例如如本文所闡述之聚A尾。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之3’穩定區。
在一些實施例中,本揭示案之多核苷酸包含(a)
表 7中所闡述之5’ UTR或其變異體或片段;(b)包含本文所提供之終止元件之編碼區;及(c)
表 8中所闡述之3’ UTR或其變異體或片段。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之帽結構,或例如如本文所闡述之聚A尾。在一些實施例中,多核苷酸進一步包含例如如本文所闡述之3’穩定區。
表 13. 例示性 3’ UTR 及終止元件序列
21. 製備多核苷酸之方法
SEQ ID NO | 序列資訊 | 序列 |
161 | 帶有終止C11 (加下劃線)之3’ UTR | UAGGGUUAAGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
162 | 帶有終止C10 (加下劃線)之3’ UTR | UAAAGCUCCGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
163 | 帶有終止C9 (加下劃線)之3’ UTR | UAAGCCCCUGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
164 | 帶有終止C8 (加下劃線)之3’ UTR | UAAGCACCCGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
165 | 帶有終止C7 (加下劃線)之3’ UTR | UAAGCCCCUCCGGGGGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
166 | 帶有終止C6 (加下劃線)之3’ UTR | UAAGGCUAAGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
167 | 帶有終止C5 (加下劃線)之3’ UTR | UAAGUCUCCGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
168 | 帶有終止C4 (加下劃線)之3’ UTR | UAAAGCUAAGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
169 | 帶有終止C3 (加下劃線)之3’ UTR | UAAGUCUAAGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
170 | 帶有C10終止(加下劃線)之3’ UTR | UAAAGCUCCAUAAAGUAGGAAACACUACAGCUGGAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCAUAAAGUAGGAAACACUACAUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCUCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
171 | 帶有C7終止(加下劃線)之3’ UTR | UAAGCCCCUCCGGGGUCCAUAAAGUAGGAAACACUACAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCAUAAAGUAGGAAACACUACAUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCUCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
172 | 帶有C8終止(加下劃線)之3’ UTR | UAAAGCUCCCCGGGGUCCAUAAAGUAGGAAACACUACAGCCUCGGUGGCCUAGCUUCUUGCCCCUUGGGCCUCCAUAAAGUAGGAAACACUACAUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCUCCAUAAAGUAGGAAACACUACAGUGGUCUUUGAAUAAAGUCUGAGUGGGCGGC |
本揭示案亦提供用於製備本揭示案之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)或其互補序列之方法。
在一些態樣中,本文所揭示且編碼治療性多肽之多核苷酸(例如RNA,例如mRNA)可使用活體外轉錄(IVT)來構築。在其他態樣中,本文所揭示且編碼治療性多肽之多核苷酸(例如RNA,例如mRNA)可使用寡核苷酸合成器藉由化學合成來構築。
在其他態樣中,本文所揭示且編碼治療性多肽之多核苷酸(例如RNA,例如mRNA)係藉由使用宿主細胞來製得。在某些態樣中,本文所揭示且編碼治療性多肽之多核苷酸(例如RNA,例如mRNA)係藉由IVT、化學合成、宿主細胞表現或此項技術中已知之任何其他方法之一或多種組合來製得。
天然核苷、非天然核苷或其組合可全部或部分地置換候選核苷酸序列中所存在之天然核苷,且可併入至編碼治療性多肽之序列最佳化核苷酸序列(例如RNA,例如mRNA)中。接著可檢查所得多核苷酸(例如mRNA)產生蛋白質及/或產生治療結果之能力。
a. 活體外轉錄 / 酶促合成
本揭示案亦提供製備本文所揭示之多核苷酸或其互補序列之方法。在一些態樣中,本文所揭示之多核苷酸(例如mRNA)可使用活體外轉錄來構築。
在其他態樣中,本文所揭示之多核苷酸(例如mRNA)可使用寡核苷酸合成器藉由化學合成來構築。在其他態樣中,本文所揭示之多核苷酸(例如mRNA)係藉由使用宿主細胞來製得。在某些態樣中,本文所揭示之多核苷酸(例如mRNA)係藉由IVT、化學合成、宿主細胞表現或此項技術中已知之任何其他方法之一或多種組合來製得。
天然核苷、非天然核苷或其組合可全部或部分地置換候選核苷酸序列中所存在之天然核苷,且可併入至編碼治療性多肽之序列最佳化核苷酸序列(例如mRNA)中。接著可檢查所得mRNA產生治療性多肽及/或產生治療結果之能力。
儘管可使用此項技術中所熟知之方法合成地製備RNA,但在一些實施例中,RNA轉錄本(例如mRNA轉錄本)係藉由使DNA模板與RNA聚合酶(例如T7 RNA聚合酶或T7 RNA聚合酶變異體)在產生RNA轉錄本之條件下接觸來合成。
在一些態樣中,本揭示案提供實施IVT (活體外轉錄)反應之方法,其包括使DNA模板與RNA聚合酶(例如T7 RNA聚合酶,諸如T7 RNA聚合酶變異體)在核苷三磷酸及緩衝液存在下在產生RNA轉錄本之條件下接觸。
本揭示案之其他態樣提供加帽方法,例如共轉錄加帽方法或此項技術中已知之其他方法。在一些實施例中,加帽方法包括使多核苷酸模板與T7 RNA聚合酶變異體、核苷三磷酸及帽類似物在活體外轉錄反應條件下反應,以產生RNA轉錄本。
IVT條件通常需要含有啟動子之經純化線性DNA模板、核苷三磷酸、包括二硫蘇糖醇(DTT)及鎂離子之緩衝系統及RNA聚合酶。轉錄反應中所使用之確切條件取決於具體應用所需之RNA量。典型IVT反應係藉由使DNA模板與RNA聚合酶及核苷三磷酸(包括GTP、ATP、CTP及UTP (或核苷酸類似物))在轉錄緩衝液中培育來實施。自此反應中產生具有5'末端鳥苷三磷酸之RNA轉錄本。
去氧核糖核酸(DNA)僅為RNA聚合酶之核酸模板。DNA模板可包括編碼治療性多肽之多核苷酸。在一些實施例中,DNA模板包括位於編碼治療性多肽之多核苷酸5'且與其可操作地連接之RNA聚合酶啟動子(例如T7 RNA聚合酶啟動子)。DNA模板亦可包括編碼位於所關注基因3'端之多聚腺苷酸化(聚A)尾之核苷酸序列。
所關注之多肽包括(但不限於)生物製品、抗體、抗原(疫苗)及治療性蛋白質。術語「蛋白質」涵蓋肽。
在一些實施例中,RNA轉錄本為IVT反應之產物,且如熟習此項技術者將理解,用於製備RNA分子之DNA模板基於鹼基互補性係已知的。在一些實施例中,RNA轉錄本為信使RNA (mRNA),其包括與聚A尾連接之編碼所關注多肽之核苷酸序列。在一些實施例中,mRNA為經修飾之mRNA (mmRNA),其包括至少一個經修飾之核苷酸。
核苷酸包括含氮鹼基、五碳糖(核糖或去氧核糖)及至少一個磷酸酯基。核苷酸包括核苷單磷酸、核苷二磷酸及核苷三磷酸。核苷單磷酸(NMP)包括與核糖及單個磷酸酯連接之核鹼基;核苷二磷酸(NDP)包括與核糖及兩個磷酸酯連接之核鹼基;且核苷三磷酸(NTP)包括與核糖及三個磷酸酯連接之核鹼基。核苷酸類似物係具有核苷酸之一般結構或在結構上與核苷酸類似之化合物。舉例而言,核苷酸類似物包括核苷酸的核鹼基之類似物、糖之類似物及/或磷酸酯基之類似物。
核苷包括含氮鹼基及5-碳糖。因此,核苷加上磷酸酯基產生核苷酸。核苷類似物係具有核苷之一般結構或在結構上與核苷類似之化合物。舉例而言,核苷類似物包括核苷的核鹼基之類似物及/或糖之類似物。
應理解,除非另有指示,否則術語「核苷酸」包括天然核苷酸、合成核苷酸及經修飾之核苷酸。如本文所提供之用於產生RNA (例如在IVT反應中)之天然核苷酸之實例包括腺苷三磷酸(ATP)、鳥苷三磷酸(GTP)、胞苷三磷酸(CTP)、尿苷三磷酸(UTP)及5-甲基尿苷三磷酸(m
5UTP)。在一些實施例中,使用腺苷二磷酸(ADP)、鳥苷二磷酸(GDP)、胞苷二磷酸(CDP)及/或尿苷二磷酸(UDP)。
核苷酸類似物之實例包括(但不限於)抗病毒核苷酸類似物、磷酸酯類似物(可溶性或固定化的、可水解或不可水解的)、二核苷酸、三核苷酸、四核苷酸(例如帽類似物)或用於酶促加帽之前體/受質(牛痘或連接酶)、經官能基標記以有助於帽或5'部分之連接/結合之核苷酸(IRES)、經5' PO
4標記以有助於帽或5'部分之連接之核苷酸或經可化學或酶促裂解之官能基/保護基團標記之核苷酸。抗病毒核苷酸/核苷類似物之實例包括(但不限於)更昔洛韋(Ganciclovir)、恩替卡韋(Entecavir)、替比夫定(Telbivudine)、阿糖腺苷(Vidarabine)及西多福韋(Cidofovir)。
經修飾之核苷酸可包括經修飾之核鹼基。舉例而言,本揭示案之RNA轉錄本(例如mRNA轉錄本)可包括選自以下之經修飾之核鹼基:假尿苷(ψ)、1-甲基假尿苷(m1ψ)、1-乙基假尿苷、2-硫尿苷、4’-硫尿苷、2-硫基-1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-假尿苷、2-硫基-5-氮雜-尿苷、2-硫基-二氫假尿苷、2-硫基-二氫尿苷、2-硫基-假尿苷、4-甲氧基-2-硫基-假尿苷、4-甲氧基-假尿苷、4-硫基-1-甲基-假尿苷、4-硫基-假尿苷、5-氮雜-尿苷、二氫假尿苷、5-甲基尿苷、5-甲氧基尿苷(mo5U)及2’-O-甲基尿苷。在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括前述經修飾之核鹼基中之至少兩者(例如2者、3者、4者或更多者)之組合。
如本文所提供之核苷三磷酸(NTP)可包含未經修飾或經修飾之ATP、經修飾或未經修飾之UTP、經修飾或未經修飾之GTP及/或經修飾或未經修飾之CTP。在一些實施例中,IVT反應之NTP包含未經修飾之ATP。在一些實施例中,IVT反應之NTP包含經修飾之ATP。在一些實施例中,IVT反應之NTP包含未經修飾之UTP。在一些實施例中,IVT反應之NTP包含經修飾之UTP。在一些實施例中,IVT反應之NTP包含未經修飾之GTP。在一些實施例中,IVT反應之NTP包含經修飾之GTP。在一些實施例中,IVT反應之NTP包含未經修飾之CTP。在一些實施例中,IVT反應之NTP包含經修飾之CTP。
存在於IVT反應中之核苷三磷酸及帽類似物之濃度可變化。在一些實施例中,NTP及帽類似物以等莫耳濃度存在於反應中。在一些實施例中,反應中帽類似物(例如三核苷酸帽)對核苷三磷酸之莫耳比大於1:1。舉例而言,反應中帽類似物對核苷三磷酸之莫耳比可為2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、15:1、20:1、25:1、50:1或100:1。在一些實施例中,反應中帽類似物(例如三核苷酸帽)對核苷三磷酸之莫耳比小於1:1。舉例而言,反應中帽類似物(例如三核苷酸帽)對核苷三磷酸之莫耳比可為1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:15、1:20、1:25、1:50或1:100。
IVT反應中NTP之組成亦可變化。舉例而言,ATP之使用可能超過GTP、CTP及UTP。作為非限制性實例,IVT反應可包括7.5毫莫耳濃度之GTP、7.5毫莫耳濃度之CTP、7.5毫莫耳濃度之UTP及3.75毫莫耳濃度之ATP。同一IVT反應可包括3.75毫莫耳濃度之帽類似物(例如三核苷酸帽)。在一些實施例中,G:C:U:A:帽之莫耳比為1:1:1:0.5:0.5。在一些實施例中,G:C:U:A:帽之莫耳比為1:1:0.5:1:0.5。在一些實施例中,G:C:U:A:帽之莫耳比為1:0.5:1:1:0.5。在一些實施例中,G:C:U:A:帽之莫耳比為0.5:1:1:1:0.5。
在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括選自以下之經修飾之核鹼基:假尿苷(ψ)、1-甲基假尿苷(m
1ψ)、5-甲氧基尿苷(mo
5U)、5-甲基胞苷(m
5C)、α-硫基-鳥苷及α-硫基-腺苷。在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括前述經修飾之核鹼基中之至少兩者(例如2者、3者、4者或更多者)之組合。
在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括假尿苷(ψ)。在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括1-甲基假尿苷(m
1ψ)。在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括5-甲氧基尿苷(mo
5U)。在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括5-甲基胞苷(m
5C)。在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括α-硫基-鳥苷。在一些實施例中,RNA轉錄本(例如mRNA轉錄本)包括α-硫基-腺苷。
在一些實施例中,多核苷酸(例如RNA多核苷酸,諸如mRNA多核苷酸)對於特定修飾而言係均一修飾的(例如完全修飾、遍及整個序列經修飾)。舉例而言,多核苷酸可經1-甲基假尿苷(m
1ψ)均一修飾,此意味著mRNA序列中之所有尿苷殘基均經1-甲基假尿苷(m
1ψ)置換。類似地,可藉由用經修飾之殘基(諸如上文所示彼等經修飾之殘基中之任一者)進行置換對多核苷酸序列中存在之任何類型之核苷殘基進行均一修飾。或者,多核苷酸(例如RNA多核苷酸,諸如mRNA多核苷酸)可不經均一修飾(例如部分修飾、序列之一部分經修飾)。每一可能性代表本揭示案之單獨實施例。
在一些實施例中,緩衝系統含有tris。舉例而言,IVT反應中所使用之tris濃度可為至少10 mM、至少20 mM、至少30 mM、至少40 mM、至少50 mM、至少60 mM、至少70 mM、至少80 mM、至少90 mM、至少100 mM或至少110 mM磷酸鹽。在一些實施例中,磷酸鹽之濃度為20-60 mM或10-100 mM。
在一些實施例中,緩衝系統含有二硫蘇糖醇(DTT)。舉例而言,IVT反應中所使用之DTT濃度可為至少1 mM、至少5 mM或至少50 mM。在一些實施例中,IVT反應中所使用之DTT濃度為1-50 mM或5-50 mM。在一些實施例中,IVT反應中所使用之DTT濃度為5 mM。
在一些實施例中,緩衝系統含有鎂。在一些實施例中,IVT反應中所存在之NTP對鎂離子(Mg
2+;例如MgCl
2)之莫耳比為1:1至1:5。舉例而言,NTP對鎂離子之莫耳比可為1:1、1:2、1:3、1:4或1:5。
在一些實施例中,IVT反應中所存在之NTP加上帽類似物(例如三核苷酸帽,諸如GAG)對鎂離子(Mg
2+;例如MgCl
2)之莫耳比為1:1至1:5。舉例而言,NTP+三核苷酸帽(例如GAG)對鎂離子之莫耳比可為1:1、1:2、1:3、1:4或1:5。
在一些實施例中,緩衝系統含有Tris-HCl、亞精胺(例如濃度為1-30 mM)、TRITON
®X-100 (聚乙二醇對(1,1,3,3-四甲基丁基)-苯基醚)及/或聚乙二醇(PEG)。
向生長中之RNA股之3'端添加核苷三磷酸(NTP)由聚合酶催化,諸如T7 RNA聚合酶,例如本揭示案之T7 RNA聚合酶變異體中之任一或多者(例如G47A)。在一些實施例中,RNA聚合酶(例如T7 RNA聚合酶變異體)以0.01 mg/ml至1 mg/ml之濃度存在於反應(例如IVT反應)中。舉例而言,RNA聚合酶可以0.01 mg/mL、0.05 mg/ml、0.1 mg/ml、0.5 mg/ml或1.0 mg/ml之濃度存在於反應中。
在一些實施例中,本揭示案之多核苷酸為IVT多核苷酸。傳統上,mRNA分子之基本組分至少包括編碼區、5’UTR、3'UTR、5'帽及聚A尾。本揭示案之IVT多核苷酸可起mRNA之作用,但在其功能及/或結構設計特徵上與野生型mRNA不同,該等特徵用於例如克服使用基於核酸之治療劑有效產生多肽之現有問題。
IVT多核苷酸之一級構築體包含連接核苷酸之第一區域,其側翼為第一側翼區及第二側翼區。此第一區域可包括(但不限於)所編碼之多肽。第一側翼區可包括連接核苷之序列,該序列起5’非轉譯區(UTR)之作用,諸如編碼多肽之天然5’ UTR或非天然5’UTR (諸如但不限於異源5’ UTR或合成5’ UTR)之任何核酸之5’ UTR。編碼治療性多肽之IVT可在其5末端包含編碼一或多個信號序列之信號序列區。側翼區可包含含有一或多個完整或不完整5' UTR序列之連接核苷酸區域。側翼區亦可包含5'末端帽。第二側翼區可包含含有一或多個完整或不完整3' UTR之連接核苷酸區域,該等3' UTR可編碼治療性多肽之天然3’ UTR或非天然3’ UTR (諸如但不限於異源3’ UTR或合成3’ UTR)。側翼區亦可包含3'曳尾序列。3’曳尾序列可為(但不限於)聚A尾、聚A-G四聯體及/或莖環序列。
IVT多核苷酸架構之其他及例示性特徵以及製備多核苷酸之方法揭示於2017年5月18日提出申請之PCT國際申請案WO 2017/201325中,該PCT國際申請案之全部內容係以引用的方式併入本文中。
b. 化學合成
可應用標準方法來合成編碼所關注之經分離多肽之經分離多核苷酸序列,諸如本揭示案之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)。舉例而言,可合成含有編碼特定經分離多肽之密碼子最佳化之核苷酸序列的單一DNA或RNA寡聚物。在其他態樣中,可合成編碼期望多肽之部分的若干小寡核苷酸,且接著連接。在一些態樣中,個別寡核苷酸通常含有用於互補組裝之5'或3'懸突。
本文所揭示之多核苷酸(例如RNA,例如mRNA)可使用此項技術中已知之化學合成方法及潛在核鹼基取代來化學合成。例如,參見國際公開案第WO2014093924號、第WO2013052523號;第WO2013039857號、第WO2012135805號、第WO2013151671號;美國公開案第US20130115272號;或美國專利第US8999380號或第US8710200號,所有案件均係以全文引用的方式併入本文中。
c. 編碼目標多肽之所表現多核苷酸之量化
在一些實施例中,本揭示案之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)、其表現產物以及降解產物及代謝物可根據此項技術中已知之方法來量化。
在一些實施例中,本揭示案之多核苷酸可在外泌體中或當源自一或多種體液時量化。如本文所用,「體液」包括外周血、血清、血漿、腹水、尿液、腦脊髓液(CSF)、痰液、唾液、骨髓、滑液、房水、羊水、耵聹、母乳、支氣管肺泡灌洗液、精液、前列腺液、考珀液(cowper's fluid)或預射精液、汗液、糞便、毛髮、淚液、囊液、胸膜及腹膜液、心包液、淋巴、食糜、乳糜、膽汁、間隙液、月經、膿、皮脂、嘔吐物、陰道分泌物、黏膜分泌物、糞便水、胰液、來自竇腔之灌洗液、支氣管肺抽吸物、胚泡腔液及臍帶血。或者,可自選自由以下組成之群的器官中獲取外泌體:肺、心臟、胰臟、胃、腸、膀胱、腎臟、卵巢、睪丸、皮膚、結腸、乳房、前列腺、腦、食管、肝臟及胎盤。
在外泌體量化方法中,自個體獲得不超過2 mL樣品,且藉由粒徑篩析層析、密度梯度離心、差速離心、奈米膜超濾、免疫吸收劑捕獲、親和純化、微流體分離或其組合來分離外泌體。在分析中,多核苷酸之水準或濃度可為所投與構築體之表現水準、存在、不存在、截短或改變。將該水準與一或多種臨床表型或與針對人類疾病生物標記物之分析相關聯係有利的。
可使用構築體特異性探針、細胞計數法、qRT-PCR、即時PCR、PCR、流式細胞術、電泳、質譜或其組合來實施分析,而外泌體可使用諸如酶聯免疫吸附分析(ELISA)方法等免疫組織化學方法來分離。外泌體亦可藉由粒徑篩析層析、密度梯度離心、差速離心、奈米膜超濾、免疫吸收劑捕獲、親和純化、微流體分離或其組合來分離。
該等方法使得研究者能夠即時監測剩餘或所遞送之多核苷酸之水準。此係可能的,此乃因本揭示案之多核苷酸由於結構或化學修飾而與內源性形式不同。
在一些實施例中,可使用諸如(但不限於)紫外可見光譜法(UV/Vis)等方法對多核苷酸進行量化。UV/Vis光譜儀之非限制性實例為NANODROP®光譜儀(ThermoFisher, Waltham, MA)。可對量化之多核苷酸進行分析,以確定該多核苷酸是否可具有適當大小,檢查有沒有發生多核苷酸降解。可藉由諸如(但不限於)以下等方法來檢查多核苷酸之降解:瓊脂糖凝膠電泳、基於HPLC之純化方法(諸如(但不限於)強陰離子交換HPLC、弱陰離子交換HPLC、反相HPLC (RP-HPLC)及疏水性相互作用HPLC (HIC-HPLC))、液相層析-質譜(LCMS)、毛細管電泳(CE)及毛細管凝膠電泳(CGE)。
22. 醫藥組合物及調配物
本揭示案提供醫藥組合物及調配物,其包含上文所闡述之任一多核苷酸。在一些實施例中,組合物或調配物進一步包含遞送劑。
在一些實施例中,組合物或調配物可含有多核苷酸,該多核苷酸包含本文所揭示之編碼治療性多肽之序列最佳化核酸序列。在一些實施例中,組合物或調配物可含有多核苷酸(例如RNA,例如mRNA),該多核苷酸包含與本文所揭示之編碼治療性多肽之序列最佳化核酸序列具有顯著序列一致性之多核苷酸(例如ORF)。在一些實施例中,多核苷酸進一步包含miRNA結合位點,例如結合以下之miRNA結合位點:miR-126、miR-142、miR-144、miR-146、miR-150、miR-155、miR-16、miR-21、miR-223、miR-24、miR-27及miR-26a。
醫藥組合物或調配物可視情況包含一或多種其他活性物質,例如治療及/或預防活性物質。本揭示案之醫藥組合物或調配物可無菌及/或不含熱原。醫藥劑之調配及/或製造中之一般考慮因素可參見例如
Remington: The Science and Practice of Pharmacy,第21版,Lippincott Williams & Wilkins, 2005 (以全文引用的方式併入本文中)。在一些實施例中,將組合物投與給人類、人類患者或個體。出於本揭示案之目的,片語「活性成分」通常係指如本文所闡述欲遞送之多核苷酸。
本文所闡述之調配物及醫藥組合物可藉由藥理學技術中已知或此後開發之任何方法來製備。一般而言,此等製備方法包括以下步驟:使活性成分與賦形劑及/或一或多種其他輔助成分締合,且接著視需要及/或期望將產物分割、成型及/或包裝成期望單一或多劑量單位。
根據本揭示案之醫藥組合物或調配物可以散裝、作為單一單位劑量及/或作為複數個單一單位劑量來製備、包裝及/或出售。如本文所用,「單位劑量」係指包含預定量之活性成分之醫藥組合物之離散量。活性成分之量通常等於將投與給個體之活性成分之劑量及/或此一劑量之便捷分率(諸如此一劑量之二分之一或三分之一)。
根據本揭示案之醫藥組合物中之活性成分、醫藥學上可接受之賦形劑及/或任何其他成分之相對量可端視於所治療個體之屬性(identity)、體型及/或狀況且進一步端視於組合物之投與途徑而變化。
在一些實施例中,本文所闡述之組合物及調配物可含有至少一種本揭示案之多核苷酸。作為非限制性實例,組合物或調配物可含有1、2、3、4或5種本揭示案之多核苷酸。在一些實施例中,本文所闡述之組合物或調配物可包含一種以上類型之多核苷酸。在一些實施例中,組合物或調配物可包含呈線性及環狀形式之多核苷酸。在一些實施例中,組合物或調配物可包含環狀多核苷酸及活體外轉錄(IVT)之多核苷酸。在另一實施例中,組合物或調配物可包含IVT多核苷酸、嵌合多核苷酸及環狀多核苷酸。
儘管對本文所提供之醫藥組合物及調配物之說明主要係關於適於投與給人類之醫藥組合物及調配物,但熟習此項技術者應理解,此等組合物通常適於投與給任何其他動物,例如非人類動物,例如非人類哺乳動物。
本揭示案提供醫藥調配物,其包含本文所闡述之多核苷酸(例如包含編碼治療性多肽之核苷酸序列之多核苷酸)。本文所闡述之多核苷酸可使用一或多種賦形劑來調配,以:(1)增加穩定性;(2)增加細胞轉染;(3)允許持續或延遲釋放(例如自多核苷酸之儲積調配物中);(4)改變生物分佈(例如將多核苷酸靶向至特定組織或細胞類型);(5)增加所編碼蛋白質在活體內之轉譯;及/或(6)改變所編碼蛋白質在活體內之釋放型態。
在本文所揭示之醫藥調配物之一些實施例中,將本文所揭示之多核苷酸(例如RNA,例如mRNA)與遞送劑一起調配,該遞送劑包含LNP-1A、LNP-1B、LNP-2A、LNP-2B、LNP-3A或LNP-3B。在一些實施例中,將本揭示案之多核苷酸(例如RNA,例如mRNA)與LNP-1A一起調配。在一些實施例中,將本揭示案之多核苷酸(例如RNA,例如mRNA)與LNP-1B一起調配。在一些實施例中,將本揭示案之多核苷酸(例如RNA,例如mRNA)與LNP-2A一起調配。在一些實施例中,將本揭示案之多核苷酸(例如RNA,例如mRNA)與LNP-2B一起調配。在一些實施例中,將本揭示案之多核苷酸(例如RNA,例如mRNA)與LNP-3A一起調配。在一些實施例中,將本揭示案之多核苷酸(例如RNA,例如mRNA)與LNP-3B一起調配。
如本文所用,醫藥學上可接受之賦形劑包括(但不限於)適用於特定期望劑型之任何及所有溶劑、分散介質或其他液體媒劑、分散助劑或懸浮助劑、稀釋劑、造粒劑及/或分散劑、表面活性劑、等滲劑、增稠劑或乳化劑、防腐劑、黏合劑、潤滑劑或油、著色劑、甜味劑或矯味劑、穩定劑、抗氧化劑、抗微生物劑或抗真菌劑、滲透壓調整劑、pH調整劑、緩衝劑、螯合劑、低溫保護劑及/或增積劑。用於調配醫藥組合物之各種賦形劑及用於製備組合物之技術為此項技術中所已知(參見Remington: The Science and Practice of Pharmacy,第21版,A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006;以全文引用的方式併入本文中)。
例示性稀釋劑包括(但不限於)碳酸鈣或碳酸鈉、磷酸鈣、磷酸氫鈣、磷酸鈉、乳糖、蔗糖、纖維素、微晶纖維素、高嶺土(kaolin)、甘露醇、山梨醇等及/或其組合。
例示性表面活性劑及/或乳化劑包括(但不限於)天然乳化劑(例如阿拉伯樹膠、瓊脂、海藻酸、海藻酸鈉、黃蓍膠、克羅珠克(chondrux)、膽固醇、黃原膠、果膠、明膠、蛋黃、酪蛋白、羊毛脂、膽固醇、蠟及卵磷脂)、去水山梨醇脂肪酸酯(例如聚氧乙烯去水山梨醇單油酸酯[TWEEN®80]、去水山梨醇單棕櫚酸酯[SPAN®40]、單油酸甘油酯、聚氧乙烯酯、聚乙二醇脂肪酸酯(例如CREMOPHOR®)、聚氧乙烯醚(例如聚氧乙烯月桂基醚[BRIJ®30])、PLUORINC®F 68、POLOXAMER®188等及/或其組合。
例示性黏合劑包括(但不限於)澱粉、明膠、糖(例如蔗糖、葡萄糖、右旋糖、糊精、糖蜜、乳糖、乳糖醇、甘露醇)、胺基酸(例如甘胺酸)、天然及合成膠(例如阿拉伯樹膠、海藻酸鈉)、乙基纖維素、羥乙基纖維素、羥丙基甲基纖維素等及其組合。
氧化係mRNA、尤其液體mRNA調配物之潛在降解路徑。為防止氧化,可向調配物中添加抗氧化劑。例示性抗氧化劑包括(但不限於) α生育酚、抗壞血酸、抗壞血酸棕櫚酸酯、苄醇、丁基羥基茴香醚、間甲酚、甲硫胺酸、二丁基羥基甲苯、一硫代甘油、偏亞硫酸氫鈉或偏亞硫酸氫鉀、丙酸、沒食子酸丙酯、抗壞血酸鈉等及其組合。
例示性螯合劑包括(但不限於)乙二胺四乙酸(EDTA)、檸檬酸一水合物、依地酸二鈉、富馬酸、蘋果酸、磷酸、依地酸鈉、酒石酸、依地酸三鈉等及其組合。
例示性抗微生物劑或抗真菌劑包括(但不限於)苯扎氯胺(benzalkonium chloride)、苄索氯銨(benzethonium chloride)、對羥基苯甲酸甲酯、對羥基苯甲酸乙酯、對羥基苯甲酸丙酯、對羥基苯甲酸丁酯、苯甲酸、羥基苯甲酸、苯甲酸鉀或苯甲酸鈉、山梨酸鉀或山梨酸鈉、丙酸鈉、山梨酸等及其組合。
例示性防腐劑包括(但不限於)維生素A、維生素C、維生素E、β-胡蘿蔔素、檸檬酸、抗壞血酸、丁基羥基茴香醚、乙二胺、月桂基硫酸鈉(SLS)、月桂基醚硫酸鈉(SLES)等及其組合。
在一些實施例中,將多核苷酸溶液之pH維持在pH 5與pH 8之間以改良穩定性。控制pH之例示性緩衝劑可包括(但不限於)磷酸鈉、檸檬酸鈉、琥珀酸鈉、組胺酸(或組胺酸-HCl)、蘋果酸鈉、碳酸鈉等及/或其組合。
例示性潤滑劑包括(但不限於)硬脂酸鎂、硬脂酸鈣、硬脂酸、二氧化矽、滑石、麥芽、氫化植物油、聚乙二醇、苯甲酸鈉、月桂基硫酸鈉或月桂基硫酸鎂等及其組合。
本文所闡述之醫藥組合物或調配物可含有低溫保護劑,以在冷凍期間穩定本文所闡述之多核苷酸。例示性低溫保護劑包括(但不限於)甘露醇、蔗糖、海藻糖、乳糖、甘油、右旋糖等及其組合。
本文所闡述之醫藥組合物或調配物可在凍乾多核苷酸調配物中含有增積劑,以產生「醫藥學上美觀」之餅狀物,在長期(例如36個月)儲存期間穩定凍乾多核苷酸。本揭示案之例示性增積劑可包括(但不限於)蔗糖、海藻糖、甘露醇、甘胺酸、乳糖、棉子糖及其組合。
在一些實施例中,醫藥組合物或調配物進一步包含遞送劑。本揭示案之遞送劑可包括(但不限於)脂質體、脂質奈米顆粒、類脂質、聚合物、脂質複合物、微囊泡、外泌體、肽、蛋白質、經多核苷酸轉染之細胞、玻尿酸酶、奈米顆粒模擬物、奈米管、結合物及其組合。
23. 使用方法
上文所闡述之多核苷酸、醫藥組合物及調配物用於製備、製造及治療用途,以治療及/或預防疾病、病症或疾患(例如與內源性蛋白質缺乏相關之疾病、病症或疾患)。
在一些實施例中,本揭示案之多核苷酸、多肽、醫藥組合物及調配物用於治療或延遲個體(例如人類個體)之疾病之發作及/或進展的方法中,該方法包括:向該個體投與有效量的上文所闡述之多核苷酸、多肽、醫藥組合物及調配物中之任一者。
在一些實施例中,本揭示案之多核苷酸、多肽、醫藥組合物及調配物用於提高個體(例如人類個體)體內之治療性多肽水準之方法中,該方法包括:向該個體投與有效量的上文所闡述之多核苷酸、多肽、醫藥組合物及調配物中之任一者。
在一些實施例中,本揭示案之多核苷酸、多肽、醫藥組合物及調配物用於提高個體(例如人類個體)體內之治療性多肽活性之方法中,該方法包括:向該個體投與有效量的上文所闡述之多核苷酸、多肽、醫藥組合物及調配物中之任一者。
本揭示案之其他態樣係關於將含有多核苷酸之細胞移植至哺乳動物個體。向哺乳動物個體投與細胞為熟習此項技術者所已知,且包括(但不限於)局部植入(例如經表面或皮下投與)、器官遞送或全身注射(例如靜脈內注射或吸入)以及在醫藥學上可接受之載劑中調配細胞。
a. 目標多肽表現水準
本揭示案之某些態樣係關於量測、測定及/或監測個體(例如,動物(例如齧齒類動物、靈長類動物及諸如此類)或人類個體)中治療性蛋白質之一或多種表現水準。動物包括正常、健康或野生型動物。
治療性蛋白質表現水準可藉由任何此項技術所公認之用於測定生物樣品(例如來自血液樣品或針穿生檢)中之蛋白質水準的方法來量測或測定。如本文所用,術語「水準」或「蛋白質水準」較佳意指樣品或個體內之蛋白質重量、質量或濃度。熟習此項技術者將理解,在某些實施例中,樣品可經受(例如)以下中之任一者:純化、沈澱、分離,例如離心及/或HPLC,且隨後例如使用質量分析及/或光譜分析經受對蛋白質水準之測定。在例示性實施例中,可使用酶聯免疫吸附分析(ELISA)來測定蛋白質表現水準。在其他例示性實施例中,根據本發明,可使用蛋白質純化、分離及LC-MS作為測定蛋白質水準之手段。在一些實施例中,在投與單劑量或多個劑量之本揭示案之mRNA療法後,該mRNA療法(例如單次靜脈內劑量)使得個體組織(例如心臟、肝臟、腦或骨骼肌)中之治療性蛋白質表現水準增加(例如增加2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍及/或增加至正常水準之至少50%、至少60%、至少70%、至少75%、80%、至少85%、至少90%、至少95%或至少100%)持續至少6小時、至少12小時、至少24小時、至少36小時、至少48小時、至少60小時、至少72小時、至少84小時、至少96小時、至少108小時、至少122小時。
b. 目標多肽活性
在聯合本揭示案之方法及醫療用途治療之個體中,與正常生理活性水準相比,治療性酶活性可能降低。本揭示案之其他態樣係關於量測、測定及/或監測個體(例如,動物(例如齧齒類動物、靈長類動物及諸如此類)或人類個體)中治療性蛋白質之活性水準(亦即酶活性水準)。活性水準可藉由任何此項技術所公認之用於測定生物樣品中之酶活性水準之方法來量測或測定。如本文所用,術語「活性水準」或「酶活性水準」較佳意指每體積、質量或重量之樣品或樣品內總蛋白質之酶活性。在例示性實施例中,「活性水準」或「酶活性水準」係以每毫升流體(例如體液,例如血清、血漿、尿液及諸如此類)之單位來描述,或以樣品內每重量組織或每重量蛋白質(例如總蛋白質)之單位來描述。酶活性單位(「U」)可以每單位時間水解之受質之重量或質量來描述。在本揭示案特徵之某些實施例中,治療性酶活性係以U/ml血漿或U/mg蛋白質(組織)來描述,其中單位(「U」)係以每小時水解之nmol受質來描述(或nmol/hr)。
在某些實施例中,本揭示案之mRNA療法之特徵在於醫藥組合物,其所包含之mRNA劑量在投與後6至12小時、或12至24小時、24至48小時或48至72小時(例如投與後48或72小時)在組織(例如肝臟)中有效產生至少5 U/mg、至少10 U/mg、至少20 U/mg、至少30 U/mg、至少40 U/mg、至少50 U/mg、至少60 U/mg、至少70 U/mg、至少80 U/mg、至少90 U/mg、至少100 U/mg或至少150 U/mg之多肽活性。
在一些實施例中,在投與單劑量或多個劑量之本揭示案之mRNA療法後,該mRNA療法(例如單次靜脈內劑量)使得個體肝臟組織中之多肽活性水準增加(例如增加2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍及/或增加至正常水準之至少50%、至少60%、至少70%、至少75%、80%、至少85%、至少90%、至少95%或至少100%)持續至少6小時、至少12小時、至少24小時或至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30天或更多天。
在例示性實施例中,本揭示案之mRNA療法之特徵在於醫藥組合物,其包含產生上述活性水準之單次靜脈內劑量之mRNA。在一些實施例中,本揭示案之mRNA療法之特徵在於醫藥組合物,其可以維持上述活性水準之mRNA之多個單次單位靜脈內劑量投與。
24. 投與形式
上文所闡述之本揭示案之多核苷酸、醫藥組合物及調配物可藉由產生治療有效結果之任何途徑來投與,諸如靜脈內(進入靜脈中)投與。該等途徑亦包括(但不限於)經腸(進入腸中)、經胃腸道、硬膜上(進入硬腦膜中)、口服(經由口腔)、經皮、硬膜外、大腦內(進入大腦中)、腦室內(進入腦室中)、皮上(施加至皮膚上)、真皮內(進入皮膚本身中)、皮下(在皮膚下面)、經鼻投與(穿過鼻子)、靜脈內濃注、靜脈內滴注、動脈內(進入動脈中)、肌內(進入肌肉中)、心臟內(進入心臟中)、骨內輸注(進入骨髓中)、鞘內(進入脊椎管中)、腹膜腔內(輸注或注射至腹膜中)、膀胱內輸注、玻璃體內(穿過眼睛)、海綿竇內注射(進入病理腔中)、腔內(進入陰莖根部中)、陰道內投與、子宮內、羊膜外投與、經皮(擴散穿過完整皮膚以達成全身性分佈)、經黏膜(擴散穿過黏膜)、經陰道、吹入(嗅吸)、舌下、唇下、灌腸劑、滴眼劑(於結膜上)、滴耳劑、經耳(在耳朵中或經由耳)、經頰(指向面頰)、結膜、皮膚、經牙齒(施加至一或多個牙齒)、電滲透、子宮頸內、竇內、氣管內、體外、血液透析、浸潤、經間質、腹內、羊膜內、關節內、膽管內、支氣管內、黏液囊內、軟骨內(在軟骨內)、尾部內(在馬尾內)、腦池內(在小腦延髓池內)、角膜內(在角膜內)、牙冠內、冠狀動脈內(在冠狀動脈內)、陰莖海綿體內(在陰莖海綿體之可擴張空間內)、椎間盤內(在椎間盤內)、導管內(在腺導管內)、十二指腸內(在十二指腸內)、硬膜內(在硬膜內或之下)、表皮內(施加至表皮)、食管內(施加至食管)、胃內(在胃內)、牙齦內(在牙齦內)、迴腸內(在小腸之遠端部分內)、病灶內(在局部病灶內或直接引入局部病灶中)、管腔內(在管腔內)、淋巴管內(在淋巴內)、骨髓內(在骨之骨髓腔內)、腦膜內(在腦膜內)、眼內(在眼內)、卵巢內(在卵巢內)、心包內(在心包內)、胸膜內(在胸膜內)、前列腺內(在前列腺內)、肺內(在肺或其支氣管內)、竇內(在鼻或眼窩竇內)、脊柱內(在脊柱內)、滑膜內(在關節之滑液腔內)、腱內(在肌腱內)、睪丸內(在睪丸內)、鞘內(在腦脊髓軸之任何層面上之腦脊髓液內)、胸腔內(在胸腔內)、小管內(在器官之管內)、鼓室內(在中耳內)、血管內(在一或多個血管內)、心室內(在心室內)、離子電滲法(藉助電流,其中可溶性鹽之離子遷移至身體組織中)、沖洗(浸泡或沖洗開放性創傷或體腔)、喉(直接在喉上)、鼻胃(穿過鼻且進入胃中)、封閉敷裹技術(表面途徑投與,其接著由封閉該區域之敷料覆蓋)、眼部(施加至外眼)、口咽(直接施加至口腔及咽)、非經腸、經皮、關節周、硬膜外、神經周、牙周、經直腸、呼吸(在呼吸道內,藉由口或鼻吸入以獲得局部或全身性效應)、眼球後(腦橋後或眼球後)、心肌內(進入心肌中)、軟組織、蛛網膜下、結膜下、黏膜下、表面、經胎盤(通過或穿過胎盤)、經氣管(穿過氣管壁)、經鼓膜(穿過或通過鼓室)、輸尿管(施加至輸尿管)、尿道(施加至尿道)、陰道、骶管阻斷、診斷、神經阻斷、膽灌注、心臟灌注、體外光照治療或脊柱。在具體實施例中,組合物可以容許其穿過血腦障壁、血管障壁或其他上皮障壁之方式投與。在一些實施例中,用於投與途徑之調配物可包括至少一種非活性成分。
25. 等效形式及範圍
熟習此項技術者將認識到,或能夠僅使用常規實驗確定本文所闡述之本發明具體實施例之許多等效形式。本揭示案之範圍不意欲限於以上描述,而是如隨附申請專利範圍中所陳述。
在申請專利範圍中,除非指示相反情形或自上下文中另外明顯可見,否則諸如「一種/個(a、an)」及「該(the)」等冠詞可意指一種/個或一種/個以上。除非指示相反情形或自上下文中另外明顯可見,否則若一個、一個以上或所有群組成員存在於、用於給定產物或製程或以其他方式與給定產物或製程相關,則在群組之一或多個成員之間包括「或」之技術方案或描述視為滿足條件的。本發明包括其中恰好一個群組成員存在於、用於給定產物或製程或以其他方式與給定產物或製程相關之實施例。本發明包括其中一個以上或所有群組成員存在於、用於給定產物或製程或以其他方式與給定產物或製程相關之實施例。
亦應注意,術語「包含」意欲具有開放性,且允許但不需要納入其他要素或步驟。當本文中使用術語「包含」時,由此亦涵蓋且揭示術語「由......組成」。
倘若給出範圍,則端點包括在內。此外,應理解,除非另外指示或自上下文及熟習此項技術者之理解另外明顯可見,否則表示為範圍之值可在本揭示案之不同實施例中假設所陳述範圍內之任一具體值或子範圍,直至該範圍之下限單位之十分之一,除非上下文另外明確指示。
另外,應理解,屬於先前技術內之本揭示案之任何特定實施例可明確地自申請專利範圍之任一或多項中排除。由於認為此等實施例為熟習此項技術者所已知,故可將其排除,即使本文中未明確陳述該排除。本揭示案之組合物之任何特定實施例(例如由其編碼之任何核酸或蛋白質;任何產生方法;任何使用方法;等)可出於任何原因排除在任一或多項技術方案之外,無論是否與先前技術之存在相關。
所有引用之來源、例如參考文獻、出版物、資料庫、資料庫條目及本文所引用之技術均係以引用的方式併入至本申請案中,即使在引用中並未明確說明。倘若引用來源之陳述與本申請案相衝突,則以本申請案中之陳述為準。
章節及表格標題不意欲為限制性的。
實例
提出以下實例以向熟習此項技術者提供如何實施、製備及評估本文所主張之組合物及方法之描述,且該等實例僅意欲為本文所闡述之例示,而不意欲限制本發明者視為其發明之範圍。
實例 1. 本揭示案之 IRES 元件即使在不存在 5’ 帽結構之情形下亦能夠實現線性 mRNA 分子之轉譯。
本實例證明本文所闡述之IRES元件在促進缺少5’帽之線性mRNA分子之轉譯中之效用。另外,本實例中所闡述之資料闡釋了本文所闡述之IRES元件與經化學修飾之核苷(諸如1-甲基假尿苷)相容。
如圖1A中所示,線性RNA分子易於藉助核酸外切酶在5’端及/或3’端降解(上圖)。該等類型之線性RNA分子通常含有5’帽(下圖),以促進核糖體募集且最終促進開放閱讀框之轉譯。圖1B顯示RNA可減輕或避免核酸外切酶降解之例示性方式。在一個實例中(上圖),線性RNA分子可在5’端及/或3’端結合至化學部分,此阻斷核酸外切酶接近RNA分子。在另一實例中(中圖),RNA可環化,使得無5’端或3’端可用於結合至核酸外切酶(且由核酸外切酶裂解)。阻礙該等類型之分子之開發的一個態樣係不存在5’帽,其通常將連接至線性RNA分子之游離5’端以促進核糖體結合及開放閱讀框轉譯。本揭示案藉由提供內部核糖體進入(IRES)元件解決此問題,該等IRES元件以不依賴於帽之方式募集轉譯機構(轉譯因子,例如eIf4g或核糖體自身)(下圖),從而容許RNA同時募集核糖體且以去除/修飾帽之方式經修飾,以避免核溶解降解(例如藉助5’及/或3’封阻部分或藉助RNA環化)。
如圖2中所示,缺少5’帽但含有本揭示案之IRES元件之線性mRNA分子能夠表現功能性蛋白質產物。圖2比較來自三種不同的線性RNA構築體之與降解決定子結構域融合之綠色螢光蛋白(GFP)在HEK293細胞中在60小時時程內之表現。每一線性RNA均含有編碼與降解決定子結構域融合之GFP之開放閱讀框,且每一RNA均缺少5’帽結構。在5’非轉譯區(UTR)內,RNA分子之所測試之IRES元件類型不同。一種構築體在其5’ UTR中含有已知之柯薩奇病毒B3 (CVB3) IRES序列(「G0 lin, 5’ CVB3」,圖表上部);另一構築體含有三個多核苷酸束,其各自含有9個鄰接之未經修飾尿苷殘基,每一束由兩個13核苷間隔區彼此隔開(「G0 lin, 5’ v1.1」,圖表之下線);且另一構築體含有三個多核苷酸束,其各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開(「G5 lin, 5’ 3xU9」,圖表中間)。亦包括陰性對照,其中未向HEK293細胞中提供RNA (圖表之底部平線)。圖2亦包括表格,該表格比較與「G0 lin, 5’ CVB3」構築體及同「G5 lin, 5’3xU9」具有相同組成但亦含有已知之5’帽1結構之構築體相比,由「G5 lin, 5’3xU9」構築體所達成之GFP表現水準。
在圖3A-圖3D中,本發明人亦已證明本揭示案之IRES元件能夠促進缺少5’帽之mRNA分子之轉譯。該等圖提供比較來自三種不同的線性RNA構築體之與降解決定子結構域融合之GFP在各種細胞類型(HeLa (圖3A)、HEK293 (圖3B)、THP1 (圖3C)及Hep3B (圖3D))中之表現之圖表。每一構築體均含有編碼GFP之開放閱讀框,但在5’ UTR內且在5’帽存在/不存在下,構築體之所測試之IRES元件不同。一種構築體含有已知之5’帽1結構(「帽1-A100」,圓形);另一構築體在其5’ UTR中含有CVB3 IRES序列,而無5’帽結構(「CVB3 (G0)」,正方形);且另一構築體含有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開,而無5’帽結構(「3xU9_1 (G5)」,菱形)。亦包括陰性對照,其中未向HEK293細胞中提供RNA (圖表之底部平線)。圖3亦包括表格,該表格比較與「帽1-A100」構築體相比,由「3xU9_1 (G5)」及「CVB3 (G0)」構築體所達成之GFP表現水準。
值得注意的是,圖4A及圖4B展示本揭示案之IRES元件優於此項技術中已知之某些IRES元件。圖4A係顯示實驗設計之示意圖,該實驗設計用於評估靜脈內注射SM86/DMG奈米顆粒之BALB/c小鼠中促紅血球生成素(EPO)之表現,該等奈米顆粒含有五種不同的編碼EPO之RNA構築體中之一者:(i)線性RNA構築體,其含有編碼EPO之開放閱讀框及5’帽1結構(「帽1-A100」,亦稱為「G0帽1」);(ii)線性RNA構築體,其含有編碼EPO之開放閱讀框、含CVB3 IRES之5’ UTR及5’三磷酸酯結構(「lin G0 CVB3, 5’ PPP」);(iii)線性RNA構築體,其含有編碼EPO之開放閱讀框、含CVB3 IRES之5’ UTR及5’生物素-三唑結構(「lin G0 CVB3, 5’ bA」);(iv)線性RNA構築體,其含有編碼EPO之開放閱讀框、含三個多核苷酸束(各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「lin G5 3xU9, 5’ PPP」);及(v)線性RNA構築體,其含有編碼EPO之開放閱讀框、含三個多核苷酸束(各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’生物素-三唑結構(「lin G5 3xU9, 5’ bA」)。向小鼠靜脈內注射SM86-DMG奈米顆粒,且在3小時、6小時、1天及2天後評價血清EPO濃度。圖4B係比較由每一構築體所達成之血清EPO濃度之圖表。
總之,上述資料證明,本揭示案之IRES元件能夠以不依賴於是否存在5’帽結構之方式且以與經化學修飾之核苷相容之方式促進自線性mRNA分子之蛋白質轉譯。
實例 2. 相對於此項技術中已知之 IRES 元件,本揭示案之 IRES 元件展現出降低之免疫原性。
本實例闡述一項實驗之結果,在該項實驗中,評價本揭示案之IRES元件在投與給個體後誘導免疫反應之傾向。
如圖5中所示,進行一系列實驗,以比較靜脈內注射五種不同的編碼EPO之RNA構築體中之一者之BALB/c小鼠中免疫反應標記物IFN-γ誘導蛋白10 (IP10)之分泌。該等構築體為:(i)線性RNA構築體,其含有編碼EPO之開放閱讀框及5’帽1結構(「G0帽1」);(ii)線性RNA構築體,其含有編碼EPO之開放閱讀框、含CVB3 IRES之5’ UTR及5’三磷酸酯結構(「lin G0 CVB3, 5’ PPP」);(iii)線性RNA構築體,其含有編碼EPO之開放閱讀框、含CVB3 IRES之5’ UTR及5’生物素-三唑結構(「lin G0 CVB3, 5’ bA」);(iv)線性RNA構築體,其含有編碼EPO之開放閱讀框、含三個多核苷酸束(各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「lin G5 3xU9, 5’ PPP」);及(v)線性RNA構築體,其含有編碼EPO之開放閱讀框、含三個多核苷酸束(各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’生物素-三唑結構(「lin G5 3xU9, 5’ bA」)。向小鼠靜脈內注射SM86-DMG奈米顆粒,且隨後分析血清IP10濃度。
總而言之,「U9」 IRES元件幾乎不產生顯著之免疫原性。值得注意的是,在至少一個實例中,相對於含有CVB3 IRES之彼等構築體,含有「U9」之IRES元件產生降低之免疫原性。總之,該等資料證明,本揭示案之IRES元件不僅與經化學修飾之核苷相容且甚至在不存在5’帽之情形下促進核糖體募集,且相對於已知之IRES元件,本文所揭示之IRES元件藉由避免免疫原性反應亦展現出改良之安全性。
實例 3. 本揭示案之 IRES 元件可包括各種數量之聚嘧啶 ( 例如聚尿苷或聚 -1- 甲基假尿苷 ) 束。
本實例證明,本文所闡述之IRES元件可含有複數個聚嘧啶束,諸如三至六個聚嘧啶束。
如圖6A中所示,本實例中所闡述之實驗比較在lipofectamine 2000 (L2K)存在下,經三種不同的編碼螢光素酶之RNA構築體中之一者轉染的HeLa細胞中螢光素酶之表現。所測試之構築體為:(i)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_3xU9」);及(ii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,該等束由長度為18-28個核苷之間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_6xU9」);及(iii)線性RNA構築體,其具有與(ii)中相同之結構,唯含有代替5’三磷酸酯結構之5’帽1結構(「G5 lin 5’帽1_v2.0」)。圖6B係表格,其比較圖6A中所測試之構築體在兩種不同的細胞類型HeLa細胞及Hep3B細胞中之螢光素酶表現。
總之,上述資料證明,含有(例如)三至六個聚嘧啶(例如聚尿苷或聚-1-甲基假尿苷)束之IRES元件能夠促進核糖體募集及蛋白質產物之轉譯。
實例 4. 本揭示案之 IRES 元件能夠促進環狀 RNA 分子之轉譯。
本實例證明,本文所闡述之IRES元件能夠促進具有經化學修飾之尿苷核苷(1-甲基假尿苷)代替尿苷之環狀RNA分子之轉譯(無需5’帽結構)。值得注意的是,本實例代表自含有1-甲基假尿苷核苷之環狀RNA分子轉譯之第一個報導實例。
如圖7A中所示,本實例中所進行之實驗之進行目的係比較在根據圖6A中所描述之方法經含有編碼螢光素酶之開放閱讀框之環狀RNA分子轉染的HeLa細胞中螢光素酶之表現。除編碼螢光素酶以外,RNA分子亦藉助RNA內之MS2拴系位點拴系至三種蛋白質中之一者:(i) LACZ (「t-LACZ」),(ii)真核轉譯起始因子4 G (「t-eIF4G」),或(iii) La蛋白(「t-La」)。藉由將編碼MBP之多肽與LACZ (t-Lacz)、4 G (「t-eIF4G」)或(iii) La蛋白(「t-La」)融合來促進拴系。
類似地,圖7B係比較由圖7A中所測試之構築體之線性化形式所達成的螢光素酶表現之圖表;在圖7B中,每一構築體均含有5’三磷酸酯結構及代替環化之3’聚(A)尾。值得注意的是,圖7A及圖7B中所示之資料代表RNA成功轉譯之第一實例,特定而言其中所有尿苷核苷均經1-甲基假尿苷核苷置換之實例。
總之,圖7A及圖7B中所示之資料顯示,本文所闡述之IRES元件以不依賴於是否存在5’帽之方式且以與經化學修飾之核苷相容之方式引起核糖體募集及轉譯。後一觀察結果源於以下事實:介導核糖體募集之相互作用(亦即MS2拴系位點與MS2結合蛋白之間的相互作用)不受是否存在核苷修飾(在此情況下,1-甲基假尿苷)之影響。因此,本揭示案之IRES元件可與經化學修飾之核苷、包括1-甲基假尿苷聯合使用。
實例 5. 本揭示案之 IRES 元件可包括藉助分子間拴系結合轉譯起始因子之 RNA 序列。
本實例中所報告之結果證明,本文所闡述之IRES元件與使轉譯起始因子靠近期望開放閱讀框之分子間系鏈相容。
如圖8A中所示,進行一系列實驗以比較在L2K存在下,經編碼mGreenLantern之RNA構築體轉染之HeLa細胞中mGreenLantern蛋白之表現。測試三種不同的RNA構築體:(i)線性RNA構築體,其含有編碼mGreenLantern之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,該等束由長度為18-28個核苷之間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’帽1_v2.0」);(ii)線性RNA構築體,其含有編碼mGreenLantern之開放閱讀框、含具有SEQ ID NO: 1之核酸序列之IRES的5’ UTR及5’三磷酸酯結構(「G0 lin 5’ PPP_1xApt17」);及(iii)線性RNA構築體,其含有編碼mGreenLantern之開放閱讀框、含IRES (具有SEQ ID NO: 1之核酸序列,其中所有U殘基均經N-甲基假尿苷殘基置換)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_1xApt17」)。類似地,圖8B係圖表,其比較在L2K存在下,經編碼螢光素酶之RNA構築體轉染之HeLa細胞中螢光素酶之表現。測試五種不同的RNA構築體:(i)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’帽1結構(「G5 lin 5’帽1_v1.1」);(ii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_3xU9」);(iii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_6xU9」);(iv)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有SEQ ID NO: 1之核酸序列,其中所有U殘基均經N-甲基假尿苷殘基置換)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_1xApt17」);及(v)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有SEQ ID NO: 1之核酸序列之六個重複序列,其中所有U殘基均經N-甲基假尿苷殘基置換)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_6xApt17」)。
圖9A及圖9B中所彙總之實驗類似地證明,結合轉譯起始因子之IRES元件能夠促進蛋白質合成。圖9A係圖表,其比較經八種不同的編碼螢光素酶之RNA構築體中之一者轉染的HeLa細胞中螢光素酶之表現:(i)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框及5’帽1結構(「C1」);(ii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接尿苷殘基)之5’ UTR及5’-三磷酸酯結構(「v1.1」);(iii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’-三磷酸酯結構(「v2.0 (G5)」);(iv)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接尿苷殘基)之5’ UTR及5’-三磷酸酯結構(「v2.0 (G0)」);(v)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合La蛋白之多核苷酸束,其中該多核苷酸束中之所有尿苷殘基均經1-甲基假尿苷殘基置換)之5’ UTR及5’-三磷酸酯結構(「1xPDCD4 La (G5)」);(vi)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合La蛋白之多核苷酸束)之5’ UTR及5’-三磷酸酯結構(「1xPDCD4 La (G0)」);(vii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合eIF4G蛋白之多核苷酸束,其中該多核苷酸束中之所有尿苷殘基均經1-甲基假尿苷殘基置換)之5’ UTR及5’-三磷酸酯結構(「1xAUAU4 (G5)」);及(viii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合eIF4G蛋白之多核苷酸束)之5’ UTR及5’-三磷酸酯結構(「1xAUAU4 (G0)」)。圖9B提供表格,該表格報告由圖9A中所示之某些構築體所達成之螢光素酶表現佔由「帽1」構築體所達成之螢光素酶表現之百分比。
總之,上述資料證明,結合轉譯起始因子(例如藉助本文所闡述之分子間系鏈)之IRES元件能夠促進蛋白質合成。本文闡述可與本揭示案之組合物及方法聯合使用之其他轉譯起始因子募集序列以及替代性分子系鏈。
實例 6. 本揭示案之 IRES 元件可用於含有 5’ 帽之線性 mRNA 分子中。
本實例中所報告之結果展示出本揭示案之IRES元件之另一重要特徵:除可與缺少5’帽之RNA分子聯合使用以外,本文所闡述之IRES元件在含有5’帽之RNA分子(例如線性mRNA分子)中亦為有利的。在此背景下,本揭示案之IRES元件可提供如下益處:即使在藉助內源性脫帽過程去除5’帽後,RNA亦可藉由該方式進行轉譯。不受機制限制,前述情況代表一種方式,以此方式納入本揭示案之IRES元件可有效地擴展脫帽核酸(例如脫帽線性RNA)實現蛋白質表現之能力。
如圖10A中所示,本實例中所進行之實驗之進行目的係比較經兩種不同的編碼螢光蛋白之RNA構築體中之一者轉染的HeLa細胞中螢光蛋白之表現。所測試之構築體為:(i)線性RNA構築體,其含有5’帽結構、含具有GGGAAAUAAGAGAGAAAAGAAGAGuAAGAAGAAAUAUAAGACCCCGGCGCCGCCACC (SEQ ID NO: 3, 「UTR1」)之核酸序列之IRES之5’ UTR,及編碼GFP之開放閱讀框;及(ii)RNA構築體,其含有5’帽結構、含具有GGGAAAUUUUUUUUUGAUAUUAUAAGAGUUUUUUUUUGAUAUUAAGAAAAUUUUUUUUUGAUAUUAGAAGAGUAAGAAGAAAUAUAAGACCCCGGCGCCGCCACC (SEQ ID NO: 4, 「UTR2」)之核酸序列之IRES之5’ UTR,及編碼GFP之開放閱讀框。出於比較目的,包括陰性對照(「無RNA」)。類似地,圖10B係展示如圖10A中所概述進行實驗,但用HEK293細胞代替HeLa細胞之結果的圖表。
圖10C提供一組圖表,其比較經兩種不同的編碼螢光素酶之RNA構築體中之一者轉染的BALB/c小鼠中螢光素酶之表現:(i)線性RNA構築體,其含有5’帽結構、含具有「UTR1」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼螢光素酶之開放閱讀框;及(ii)線性RNA構築體,其含有5’帽結構、含具有「UTR2」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼螢光素酶之開放閱讀框。出於比較目的,包括陰性對照(「PBS」)。類似地,圖10D提供一組圖表,其比較經兩種不同的編碼促紅血球生成素之RNA構築體中之一者轉染的BALB/c小鼠中促紅血球生成素之表現:(i)線性RNA構築體,其含有5’帽結構、含具有「UTR1」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼促紅血球生成素之開放閱讀框;及(ii)線性RNA構築體,其含有5’帽結構、含具有「UTR2」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼促紅血球生成素之開放閱讀框。出於比較目的,包括陰性對照(「PBS」)。
總之,圖10A-圖10D中所報告之資料證明,本揭示案之IRES元件不僅在缺少5’帽之RNA分子中係有用的(例如,參見實例1及4),且在含有5’帽之RNA分子中亦係有用的,此乃因在此背景中,IRES元件可提供擴展RNA分子即使在內源性脫帽之後亦產生蛋白質產物之能力之手段。
實例 7. 本揭示案之 IRES 元件提供強勁之蛋白質表現,而無需 5’ 帽
本實例證明本文所闡述之IRES元件用於促進表現構築體中基因產物之轉譯之效用。
如圖11中所描述,對含有表14中之IRES元件之構築體中螢光素酶報告基因之表現進行研究。簡言之,使Hep3b細胞或HeLa細胞在L2K存在下經含有表14中所示元件之編碼螢光素酶之RNA構築體轉染。在轉染後2小時、5小時及24小時量測螢光素酶表現(圖11)。發光揭示,5’ huIRES9 (例如SEQ ID NO: 173)具有最高之螢光素酶表現,此為相對於5’ 3xU9 (SEQ ID NO: 202)之改良。
表 14. 圖 11 中所測試之 IRES 元件
元件名稱 | SEQ ID NO: |
5’ 3xU9 | 202 |
5’ 6xU9 | 203 |
5’ huIRES-13 | 191 |
5’ huIRES-9 | 173 |
5’ huIRES-8 | 192 |
如圖12-圖16中所描述,對含有表15中之IRES元件之構築體中GFP報告基因之表現進行研究。簡言之,使HeLa細胞在L2K存在下經含有表15中所示元件之編碼GFP之RNA構築體轉染。GFP與降解決定子結構域融合。如藉由綠色積分密度所量測之結果揭示,5’形狀1 (SEQ ID NO: 174)及5’形狀3 (SEQ ID NO: 176)具有最高之表現,遠高於5’ 6xU9 (SEQ ID NO: 203)。此外,5’形狀2 (SEQ ID NO: 175)優於5’形狀4 (SEQ ID NO: 177)及5’ 6xU9 (SEQ ID NO: 203)。
表 15. 圖 12- 圖 16 中所測試之 IRES 元件
元件名稱 | SEQ ID NO: |
5’ 3xU9 | 202 |
5’ 6xU9 | 203 |
5’形狀1 | 174 |
5’形狀2 | 175 |
5’形狀3 | 176 |
5’形狀4 | 177 |
量測圖12-圖16之曲線下面積(AUC),以量化時間性GFP表現(例如,參見表16)。
表 16. 圖 12- 圖 16 中所測試之構築體之 AUC
元件名稱 | SEQ ID NO: | 相對於帽 1-A100 之 AUC% |
5’ 3xU9 | 202 | 0.43 |
5’ 6xU9 | 203 | 0.86 |
5’ 形狀 4 | 177 | 1.12 |
5’ 形狀 3 | 176 | 5.64 |
5’ 形狀 2 | 175 | 1.68 |
5’ 形狀 1 | 174 | 7.34 |
如圖17-圖20中所描述,對含有表17中之IRES元件之構築體中GFP報告基因之表現進行研究。簡言之,使HeLa細胞在L2K存在下經含有表17中所示元件之編碼GFP之RNA構築體轉染。GFP與降解決定子結構域融合。在一些情況下,本實驗之結果揭示,將本文所揭示之不同IRES元件組合可提供強勁之基因表現。舉例而言,圖17之兩個插入圖表揭示,5’ Apt17+5xU9 (SEQ ID NO: 183或SEQ ID NO: 184)構築體及5’ 5xU9+CCND1 (SEQ ID NO: 182)構築體具有增加之C
最大值。在另一實例中,具有5’ Apt17+5xU9 (SEQ ID NO: 183或SEQ ID NO: 184)之構築體及具有5’ 5xU9+CCND1 (SEQ ID NO: 182)之構築體具有與具有5’ 6xU9 (SEQ ID NO: 203)之構築體相當之表現(圖19)。相反,單一IRES 5’ 1XApt17 (SEQ ID NO: 193)具有顯著更低之GFP表現;然而,其實質上優於5’ 1xAUAU4 (SEQ ID NO: 194)及5’ 1xPDCD4 (SEQ ID NO: 198),後兩者具有相似之時間性表現及C
最大值(圖18)。在圖20中,綠色積分密度資料顯示,具有元件5’ 6xPDCD4 (SEQ ID NO: 198)之構築體具有可觀之表現。此外,具有元件5’ 1xApt17 (SEQ ID NO: 193)之構築體顯示出高於背景之表現。
表 17. 圖 17- 圖 20 中所測試之 IRES 元件
元件名稱 | SEQ ID NO: |
5’ 3xU9 | 202 |
5’ 6xU9 | 203 |
5’ 1xAUAU4 | 194 |
5’ 1xPDCD4_La | 195 |
5’ 6xPDCD4_La | 198 |
5’ 1xCCND1_La | 196 |
5’ 5xU9+CCND1_La | 182 |
5’ CCND1 | 197 |
5’ apt17+5xU9 | 183 |
5’ apt17+5xU9 | 184 |
5’ apt17_1x | 193 |
如圖21-圖23中所描述,對含有表18中之IRES元件之構築體中螢光素酶報告基因之表現進行研究。簡言之,使THP-1細胞(圖21)、Hep3b細胞(圖22)或HeLa細胞(圖23)在L2K存在下經含有表18中所示元件之編碼螢光素酶之RNA構築體轉染。在轉染後4小時及24小時量測螢光素酶表現。在THP-1細胞中,含有5’ 6xU9_v3 (SEQ ID NO: 189)、5’ 6xU9_v4 (SEQ ID NO: 204)或5’ 6xU9_v5 (SEQ ID NO: 205)之構築體具有最高之螢光素酶表現。在Hep3b細胞中,含有5’ 6xU9_v3 (SEQ ID NO: 189)、5’ 6xU9_v4 (SEQ ID NO: 204)及5’ 6xU9_v5 (SEQ ID NO: 205)之構築體具有最高之螢光素酶表現。並且在HeLa細胞中,含有5’ 6xU9_v3 (SEQ ID NO: 189)、5’ 6xU9_v4 (SEQ ID NO: 204)、5’ 6xU9_v5 (SEQ ID NO: 205)及5’ 6xU9_v1 (SEQ ID NO: 187)之構築體具有最高之螢光素酶表現。
表 18. 圖 21- 圖 23 中所測試之 IRES 元件
其他實施例
元件名稱 | SEQ ID NO: |
5’ 3xU9_ | 202 |
5’ 3xU9_m1_ | 186 |
5’_6xU9 | 187 |
5’_定製_IRES_5 | 185 |
5’_定製_IRES_4 | 190 |
5’_定製_IRES_3 | 201 |
5’_定製_IRES_2 | 200 |
5’_定製_IRES_1 | 199 |
5’_6xU9_v3 | 189 |
5’_6xU9_v4 | 204 |
5’_6xU9_v5_ | 205 |
本說明書中所提及之所有公開案、專利及專利申請案均係以引用的方式併入本文中,其併入程度如同每一獨立公開案或專利申請案明確且個別地指示為以引用的方式併入一般。
儘管本發明已結合其具體實施例進行闡述,但應理解,其能夠進一步修改,且本申請案意欲涵蓋本文所闡述之任何變化、用途或更改(通常遵循本文所闡述之原理且包括與本發明之此等背離),該等變化、用途或更改在本發明所屬領域內之已知或慣用實踐內且可應用於上文所陳述之基本特徵,且在申請專利範圍之範圍內。
其他實施例在申請專利範圍內。
圖 1A係圖解說明線性RNA分子易於藉助核酸外切酶在5’端及/或3’端降解之示意圖(上圖)。該等類型之線性RNA分子通常含有5’帽(下圖),以促進核糖體募集且最終促進開放閱讀框之轉譯。
圖 1B係顯示RNA可減輕或避免核酸外切酶降解之方式之示意圖。在一個實例中(上圖),線性RNA分子可在5’端及/或3’端結合至化學部分,此阻斷核酸外切酶接近RNA分子。在另一實例中(中圖),RNA可環化,使得無5’端或3’端可用於結合至核酸外切酶(且由核酸外切酶裂解)。阻礙該等類型之分子之開發的一個態樣係不存在5’帽,其通常將連接至線性RNA分子之游離5’端以促進核糖體結合及開放閱讀框轉譯。本揭示案藉由提供內部核糖體進入(IRES)元件解決此問題,該等IRES元件以不依賴於帽之方式募集核糖體(下圖),從而容許RNA同時募集核糖體且以去除/修飾帽之方式經修飾,以避免核溶解降解(例如藉助5’及/或3’封阻部分或藉助RNA環化)。
圖 2係比較在60小時時程內,來自三種不同的線性RNA構築體之綠色螢光蛋白(GFP)在HEK293細胞中之表現之圖表。每一線性RNA均含有編碼GFP之開放閱讀框,且每一RNA均缺少5’帽結構。在5’非轉譯區(UTR)內,RNA分子之所測試之IRES元件類型不同。一種構築體在其5’ UTR中含有已知之柯薩奇病毒(coxsackievirus) B3 (CVB3) IRES序列(「G0 lin, 5’ CVB3」,圖表上部);另一構築體含有三個多核苷酸束,其各自含有9個鄰接之未經修飾尿苷殘基,每一束由兩個13核苷間隔區彼此隔開(「G0 lin, 5’ v1.1」,圖表之下線);且另一構築體含有三個多核苷酸束,其各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開(「G5 lin, 5’ 3xU9」,圖表中間)。亦包括陰性對照,其中未向HEK293細胞中提供RNA (圖表之底部平線)。圖2亦包括表格,該表格比較與「G0 lin, 5’ CVB3」構築體及同「G5 lin, 5’3xU9」具有相同組成但亦含有已知之5’帽1結構之構築體相比,由「G5 lin, 5’3xU9」構築體所達成之GFP表現水準。
圖 3A- 圖 3D係圖表,其比較來自三種不同的線性RNA構築體之GFP在各種細胞類型(HeLa (圖3A)、HEK293 (圖3B)、THP1 (圖3C)及Hep3B (圖3D))中之表現。每一構築體均含有編碼GFP之開放閱讀框,但在5’ UTR內且在5’帽存在/不存在下,構築體之所測試之IRES元件不同。一種構築體含有已知之5’帽1結構(「帽1-A100」,圓形);另一構築體在其5’ UTR中含有CVB3 IRES序列,而無5’帽結構(「CVB3 (G0)」,正方形);且另一構築體含有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開,而無5’帽結構(「3xU9_1 (G5)」,菱形)。亦包括陰性對照,其中未向HEK293細胞中提供RNA (圖表之底部平線)。圖3亦包括表格,該表格比較與「帽1-A100」構築體相比,由「3xU9_1 (G5)」及「CVB3 (G0)」構築體所達成之GFP表現水準。
圖 4A係顯示實驗設計之示意圖,該實驗設計用於評估靜脈內注射SM86/DMG奈米顆粒之BALB/c小鼠中促紅血球生成素(EPO)之表現,該等奈米顆粒含有五種不同的編碼EPO之RNA構築體中之一者:(i)線性RNA構築體,其含有編碼EPO之開放閱讀框及5’帽1結構(「帽1-A100」,亦稱為「G0帽1」);(ii)線性RNA構築體,其含有編碼EPO之開放閱讀框、含CVB3 IRES之5’ UTR及5’三磷酸酯結構(「lin G0 CVB3, 5’ PPP」);(iii)線性RNA構築體,其含有編碼EPO之開放閱讀框、含CVB3 IRES之5’ UTR及5’生物素-三唑結構(「lin G0 CVB3, 5’ bA」);(iv)線性RNA構築體,其含有編碼EPO之開放閱讀框、含三個多核苷酸束(各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「lin G5 3xU9, 5’ PPP」);及(v)線性RNA構築體,其含有編碼EPO之開放閱讀框、含三個多核苷酸束(各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’生物素-三唑結構(「lin G5 3xU9, 5’ bA」)。向小鼠靜脈內注射SM86-DMG奈米顆粒,且在3小時、6小時、1天及2天後評價血清EPO濃度。
圖 4B係比較由每一構築體所達成之血清EPO濃度之圖表。
圖 5係在與圖4相同之實驗中,在靜脈內注射五種不同的編碼EPO之RNA構築體中之一者之BALB/c小鼠中,在注射後6小時,比較免疫反應標記物IFN-γ誘導蛋白10 (IP10)之分泌之圖表。包括僅媒劑小組(「緩衝劑」)作為陰性對照。向小鼠靜脈內注射SM86-DMG奈米顆粒,且隨後分析血清IP10濃度。
圖 6A係比較在lipofectamine 2000 (L2K)存在下,經三種不同的編碼螢光素酶之RNA構築體中之一者轉染之HeLa細胞中螢光素酶表現之圖表。所測試之構築體為:(i)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,每一束由兩個13核苷間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_3xU9」);及(ii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,該等束由長度為18-28個核苷之間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_6xU9」);及(iii)線性RNA構築體,其具有與(ii)中相同之結構,唯含有代替5’三磷酸酯結構之5’帽1結構(「G5 lin 5’帽1_v2.0」)。
圖 6B係表格,其比較圖6A中所測試之構築體在兩種不同的細胞類型HeLa細胞及Hep3B細胞中之螢光素酶表現。
圖 7A係圖表,其比較在根據圖6A中所描述之方法經含有編碼螢光素酶之開放閱讀框之環狀RNA分子轉染的HeLa細胞中螢光素酶之表現。在每一RNA分子內,尿苷之每一實例均經1-甲基假尿苷置換。除編碼螢光素酶以外,RNA分子亦藉助RNA內之MS2拴系位點拴系至三種蛋白質中之一者:(i) LACZ (「t-LACZ」),(ii)真核轉譯起始因子4 G (「t-eIF4G」),或(iii) La蛋白(「t-La」)。藉由將編碼MBP之多肽與LACZ (t-Lacz)、4 G (「t-eIF4G」)或(iii) La蛋白(「t-La」)融合來促進拴系。
圖 7B係比較由圖7A中所測試之構築體之線性化形式所達成的螢光素酶表現之圖表;在圖7B中,每一構築體含有5’三磷酸酯結構及代替環化之3’聚(A)尾。值得注意的是,圖7A及圖7B中所示之資料代表無帽RNA成功轉譯之第一實例,特定而言其中所有尿苷核苷均經1-甲基假尿苷核苷置換之實例。總之,該等資料證明,本揭示案之IRES元件能夠以不依賴於5’帽是否存在之方式實現核糖體募集及成功之蛋白質轉譯。此外,該等資料顯示,本揭示案之IRES元件可以不依賴於核酸分子之一個核苷是否存在化學修飾之方式實現核糖體募集及成功之蛋白質轉譯,特定而言係由於介導核糖體募集之相互作用(亦即MS2拴系位點與MS2結合蛋白之間的相互作用)不受是否存在核苷修飾(在此情況下,1-甲基假尿苷)之影響。
圖 8A係圖表,其比較在L2K存在下,經編碼mGreenLantern之RNA構築體轉染之HeLa細胞中mGreenLantern蛋白之表現。測試三種不同的RNA構築體:(i)線性RNA構築體,其含有編碼mGreenLantern之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基,該等束由長度為18-28個核苷之間隔區彼此隔開)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’帽1_v2.0」);(ii)線性RNA構築體,其含有編碼mGreenLantern之開放閱讀框、含具有SEQ ID NO: 1之核酸序列之IRES的5’ UTR及5’三磷酸酯結構(「G0 lin 5’ PPP_1xApt17」);及(iii)線性RNA構築體,其含有編碼mGreenLantern之開放閱讀框、含IRES (具有SEQ ID NO: 1之核酸序列,其中所有U殘基均經N-甲基假尿苷殘基置換)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_1xApt17」)。
圖 8B係圖表,其比較在L2K存在下,經編碼螢光素酶之RNA構築體轉染之HeLa細胞中螢光素酶之表現。測試五種不同的RNA構築體:(i)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’帽1結構(「G5 lin 5’帽1_v1.1」);(ii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_3xU9」);(iii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_6xU9」);(iv)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有SEQ ID NO: 1之核酸序列,其中所有U殘基均經N-甲基假尿苷殘基置換)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_1xApt17」);及(v)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有SEQ ID NO: 1之核酸序列之六個重複序列,其中所有U殘基均經N-甲基假尿苷殘基置換)之5’ UTR及5’三磷酸酯結構(「G5 lin 5’ PPP_6xApt17」)。
圖 9A係圖表,其比較經八種不同的編碼螢光素酶之RNA構築體中之一者轉染的HeLa細胞中螢光素酶之表現:(i)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框及5’帽1結構(「C1」);(ii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有三個多核苷酸束,各自含有9個鄰接尿苷殘基)之5’ UTR及5’-三磷酸酯結構(「v1.1」);(iii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接之1-甲基假尿苷殘基)之5’ UTR及5’-三磷酸酯結構(「v2.0 (G5)」);(iv)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有六個多核苷酸束,各自含有9個鄰接尿苷殘基)之5’ UTR及5’-三磷酸酯結構(「v2.0 (G0)」);(v)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合La蛋白之多核苷酸束,其中該多核苷酸束中之所有尿苷殘基均經1-甲基假尿苷殘基置換)之5’ UTR及5’-三磷酸酯結構(「1xPDCD4 La (G5)」);(vi)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合La蛋白之多核苷酸束)之5’ UTR及5’-三磷酸酯結構(「1xPDCD4 La (G0)」);(vii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合eIF4G蛋白之多核苷酸束,其中該多核苷酸束中之所有尿苷殘基均經1-甲基假尿苷殘基置換)之5’ UTR及5’-三磷酸酯結構(「1xAUAU4 (G5)」);及(viii)線性RNA構築體,其含有編碼螢光素酶之開放閱讀框、含IRES (具有特異性結合eIF4G蛋白之多核苷酸束)之5’ UTR及5’-三磷酸酯結構(「1xAUAU4 (G0)」)。
圖 9B提供表格,該表格報告由圖9A中所示之某些構築體所達成之螢光素酶表現佔由「帽1」構築體所達成之螢光素酶表現之百分比。
圖 10A係圖表,其比較經兩種不同的編碼螢光蛋白之RNA構築體中之一者轉染之HeLa細胞中螢光蛋白之表現。所測試之構築體為:(i)線性RNA構築體,其含有5’帽結構、含具有GGGAAAUAAGAGAGAAAAGAAGAGuAAGAAGAAAUAUAAGACCCCGGCGCCGCCACC (SEQ ID NO: 3, 「UTR1」)之核酸序列之IRES之5’ UTR,及與降解決定子結構域融合之編碼GFP之開放閱讀框;及(ii) RNA構築體,其含有5’帽結構、含具有GGGAAAUUUUUUUUUGAUAUUAUAAGAGUUUUUUUUUGAUAUUAAGAAAAUUUUUUUUUGAUAUUAGAAGAGUAAGAAGAAAUAUAAGACCCCGGCGCCGCCACC (SEQ ID NO: 4, 「UTR2」)之核酸序列之IRES之5’ UTR,及與降解決定子結構域融合之編碼GFP之開放閱讀框。出於比較目的,包括陰性對照(「無RNA」)。
圖 10B係展示如圖10A中所概述進行實驗之結果的圖表,但用HEK293細胞代替HeLa細胞。
圖 10C提供一組圖表,其比較經兩種不同的編碼螢光素酶之RNA構築體中之一者轉染的BALB/c小鼠中螢光素酶之表現:(i)線性RNA構築體,其含有5’帽結構、含具有「UTR1」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼螢光素酶之開放閱讀框;及(ii)線性RNA構築體,其含有5’帽結構、含具有「UTR2」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼螢光素酶之開放閱讀框。出於比較目的,包括陰性對照(「PBS」)。
圖 10D提供一組圖表,其比較經兩種不同的編碼促紅血球生成素之RNA構築體中之一者轉染的BALB/c小鼠中促紅血球生成素之表現:(i)線性RNA構築體,其含有5’帽結構、含具有「UTR1」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼促紅血球生成素之開放閱讀框;及(ii)線性RNA構築體,其含有5’帽結構、含具有「UTR2」(如圖10A及圖10B中)之核酸序列之IRES之5’ UTR,及編碼促紅血球生成素之開放閱讀框。出於比較目的,包括陰性對照(「PBS」)。
圖 11A係圖表,其比較在L2K存在下,經含有指示元件(例如,參加x軸)之編碼螢光素酶之RNA構築體轉染之Hep3b細胞中螢光素酶之表現。該等元件之序列提供於表14中(例如,參見實例7)。每一元件之三個條自左至右代表在轉染後2小時、5小時及24小時量測之螢光素酶表現。發光表現資料顯示,5’ huIRES9 (例如SEQ ID NO: 173)具有最高之螢光素酶表現。此為相對於5’ 3xU9 (SEQ ID NO: 202)之改良。
圖 11B係圖表,其比較在L2K存在下,經含有指示元件之編碼螢光素酶之RNA構築體轉染之HeLa細胞中螢光素酶之表現。該等元件之序列提供於表14中(例如,參見實例7)。每一元件之三個條自左至右代表在轉染後2小時、5小時及24小時量測之螢光素酶表現。發光表現資料顯示,5’ 6xU9 (SEQ ID NO: 203)具有最高之螢光素酶表現,且5’ huIRES9 (例如SEQ ID NO: 173)具有第二高之螢光素酶表現。此為相對於5’ 3xU9 (SEQ ID NO: 202)之改良。
圖 12係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表15中(例如,參見實例7)。插入圖表之綠色積分密度顯示,5’形狀1 (SEQ ID NO: 174)及5’形狀3 (SEQ ID NO: 176)顯示最高之表現,遠高於5’ 6xU9 (SEQ ID NO: 203)。此外,5’形狀2 (SEQ ID NO: 175)優於5’形狀4 (SEQ ID NO: 177)及5’ 6xU9。
圖 13係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表15中(例如,參見實例7)。插入圖表之綠色積分密度顯示5’形狀2 (SEQ ID NO: 175)優於5’形狀4 (SEQ ID NO: 177)及5’ 6xU9 (SEQ ID NO: 203)。
圖 14係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表15中(例如,參見實例7)。插入圖表之綠色積分密度顯示5’形狀5 (SEQ ID NO: 178)及5’形狀8 (SEQ ID NO: 180)之性能與5’ 3xU9 (SEQ ID NO: 202)相似。
圖 15係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表15中(例如,參見實例7)。綠色積分密度揭示,5’形狀1 (SEQ ID NO: 174)、5’形狀2 (SEQ ID NO: 175)、5’形狀3 (SEQ ID NO: 176)及5’形狀4 (SEQ ID NO: 177)優於5’ 6xU9 (SEQ ID NO: 203)及5’ 3xU9 (SEQ ID NO: 202),後兩者優於5’形狀7 (SEQ ID NO: 179)及5’形狀8 (SEQ ID NO: 180)。5’形狀9 (SEQ ID NO: 181)之性能與基線及脫帽對照相似。
圖 16係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表15中(例如,參見實例7)。兩個插入圖表之綠色積分密度顯示,5’形狀5 (SEQ ID NO: 178)及5’形狀8 (SEQ ID NO: 180)具有相似之性能,而5’形狀9 (SEQ ID NO: 181)及5’形狀7 (SEQ ID NO: 179)更接近於基線。
圖 17係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表18中(例如,參見實例7)。兩個插入圖表之綠色積分密度顯示,5’ Apt17+5xU9 (SEQ ID NO: 183或SEQ ID NO: 184)構築體及5’ 5xU9+CCND1 (SEQ ID NO: 182)構築體具有增加之C
最大,此表明將本文所揭示之不同IRES元件組合可增加基因表現。
圖 18係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表18中(例如,參見實例7)。綠色積分密度資料顯示,5’ 1XApt17實質上優於5’ 1xAUAU4 (SEQ ID NO: 194)及5’ 1xPDCD4 (SEQ ID NO: 198),後兩者具有相似之時間性表現及C
最大值。
圖 19係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表18中(例如,參見實例7)。綠色積分密度資料顯示,具有5’ Apt17+5xU9 (SEQ ID NO: 183或SEQ ID NO: 184)之構築體及具有5’ 5xU9+CCND1 (SEQ ID NO: 182)之構築體具有與具有5’ 6xU9 (SEQ ID NO: 203)之構築體相似之表現。該資料表明,將本文所揭示之不同IRES元件組合可增加基因表現。
圖 20係圖表,其比較在L2K存在下,經含有指示元件之編碼GFP之RNA構築體轉染的HeLa細胞中GFP之表現;在該情形下,GFP與降解決定子結構域融合。該等元件之序列提供於表18中(例如,參見實例7)。綠色積分密度資料顯示,具有元件5’ 6xPDCD4 (SEQ ID NO: 198)之構築體具有可觀之表現。此外,具有元件5’ 1xApt17 (SEQ ID NO: 193)之構築體顯示出高於背景之表現。
圖 21A係條形圖,其比較在L2K存在下,經含有指示元件之編碼螢光素酶之RNA構築體轉染的THP-1細胞中螢光素酶之表現。該等元件之序列提供於表18中(例如,參見實例7)。發光表現資料顯示,5’ 6xU9_v3 (SEQ ID NO: 189)、5’ 6xU9_v4 (SEQ ID NO: 205)及5’ 6xU9_v5 (SEQ ID NO: 205)具有最高之螢光素酶表現。
圖 21B係與圖21A相同之條形圖,但沒有加帽對照及脫帽對照(以更佳顯示Y軸值)。
圖 22A係條形圖,其比較在L2K存在下,經含有指示元件之編碼螢光素酶之RNA構築體轉染的Hep3b細胞中螢光素酶之表現。該等元件之序列提供於表18中(例如,參見實例7)。每一元件之兩個條自左至右代表在轉染後4小時及24小時量測之螢光素酶表現。發光表現資料顯示,5’ 6xU9_v3 (SEQ ID NO: 189)、5’ 6xU9_v4 (SEQ ID NO: 204)及5’ 6xU9_v5 (SEQ ID NO: 205)具有最高之螢光素酶表現。
圖 22B係與圖22A相同之條形圖,但沒有加帽對照及脫帽對照(以更佳顯示Y軸值)。
圖 23A係條形圖,其比較在L2K存在下,經含有指示元件之編碼螢光素酶之RNA構築體轉染的HeLa細胞中螢光素酶之表現。該等元件之序列提供於表18中(例如,參見實例7)。每一元件之兩個條自左至右代表在轉染後4小時及24小時量測之螢光素酶表現。發光表現資料顯示,5’ 6xU9_v3 (SEQ ID NO: 189)、5’ 6xU9_v4 (SEQ ID NO: 204)、5’ 6xU9_v5 (SEQ ID NO: 205)及5’ 6xU9_v1 (SEQ ID NO: 187)具有最高之螢光素酶表現。
圖 23B係與圖23A相同之條形圖,但沒有加帽對照及脫帽對照(以更佳顯示Y軸值)。
TW202417629A_112129616_SEQL.xml
Claims (187)
- 一種核酸,其包含: (i) 內部核糖體進入位點(IRES),其包含一或多個富含尿苷或經修飾尿苷之多核苷酸束;該IRES可操作地連接至 (ii) 編碼多肽之開放閱讀框。
- 如請求項1之核酸,其中該IRES包含1至20個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項2之核酸,其中該IRES包含2至10個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項3之核酸,其中該IRES包含3至6個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項4之核酸,其中該IRES包含3個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項4之核酸,其中該IRES包含4個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項4之核酸,其中該IRES包含5個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項4之核酸,其中該IRES包含6個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項1至8中任一項之核酸,其中該等多核苷酸束中之每一者中至少70%之核苷為尿苷或經修飾尿苷。
- 如請求項9之核酸,其中該等多核苷酸束中之每一者中至少75%之核苷為尿苷或經修飾尿苷。
- 如請求項10之核酸,其中該等多核苷酸束中之每一者中至少80%之核苷為尿苷或經修飾尿苷。
- 如請求項11之核酸,其中該等多核苷酸束中之每一者中至少85%之核苷為尿苷或經修飾尿苷。
- 如請求項12之核酸,其中該等多核苷酸束中之每一者中至少90%之核苷為尿苷或經修飾尿苷。
- 如請求項13之核酸,其中該等多核苷酸束中之每一者中至少95%之核苷為尿苷或經修飾尿苷。
- 如請求項14之核酸,其中該等多核苷酸束中之每一者中之所有核苷均為尿苷或經修飾尿苷,較佳地其中該等多核苷酸束中之每一者中之所有核苷均為經修飾尿苷。
- 如請求項1至15中任一項之核酸,其中每一多核苷酸束之長度獨立地為5至20個核苷。
- 如請求項16之核酸,其中每一多核苷酸束之長度獨立地為6至15個核苷。
- 如請求項17之核酸,其中每一多核苷酸束之長度獨立地為7至11個核苷。
- 如請求項18之核酸,其中每一多核苷酸束之長度為9個核苷。
- 如請求項1至19中任一項之核酸,其中每一多核苷酸束獨立地包含5至20個鄰接尿苷或經修飾尿苷核苷。
- 如請求項20之核酸,其中每一多核苷酸束獨立地包含6至15個鄰接尿苷或經修飾尿苷核苷。
- 如請求項21之核酸,其中每一多核苷酸束獨立地包含7至11個鄰接尿苷或經修飾尿苷核苷。
- 如請求項1至22中任一項之核酸,其中每一多核苷酸束包含至少9個鄰接尿苷或經修飾尿苷核苷。
- 如請求項23之核酸,其中每一多核苷酸束包含9個鄰接尿苷或經修飾尿苷核苷。
- 如請求項1至24中任一項之核酸,其中每一多核苷酸束富含該經修飾尿苷。
- 如請求項1至25中任一項之核酸,其中該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項26之核酸,其中該經修飾尿苷為1-甲基假尿苷。
- 如請求項1至27中任一項之核酸,其中該IRES位於該核酸之非編碼區(例如5’非轉譯區(UTR))內,該非編碼區可操作地連接至該開放閱讀框。
- 如請求項28之核酸,其中該開放閱讀框進一步可操作地連接至3’ UTR。
- 如請求項1至29中任一項之核酸,其中該等多核苷酸束藉助一或多個間隔區彼此隔開,該一或多個間隔區各自獨立地包含5至100個核苷。
- 如請求項30之核酸,其中該等間隔區各自獨立地包含10至40個核苷。
- 如請求項31之核酸,其中該等間隔區各自獨立地包含11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38個核苷。
- 如請求項1至32中任一項之核酸,其中該IRES由下式表示: [( N) n- ( U’) m] p其中: 每一 N獨立地為任何核苷殘基; 每一 U’獨立地為尿苷或經修飾尿苷; 每一n獨立地為1至100之整數; 每一m獨立地為2至15之整數;且 p為2至20之整數。
- 如請求項33之核酸,其中每一 N獨立地選自腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。
- 如請求項34之核酸,其中每一 N獨立地選自腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
- 如請求項34或35之核酸,其中 N之該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項36之核酸,其中 N之該經修飾尿苷為1-甲基假尿苷。
- 如請求項34、36及37中任一項之核酸,其中 N之該經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林(zebularine)、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶(lysidine)、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
- 如請求項34及36至38中任一項之核酸,其中 N之該經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
- 如請求項34及36至39中任一項之核酸,其中 N之該經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷(wyosine)、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷(wybutosine)、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷(queuosine)、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷(archaeosine)、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
- 如請求項33至40中任一項之核酸,其中 U’之該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項41之核酸,其中 U’之該經修飾尿苷為1-甲基假尿苷。
- 如請求項33至42中任一項之核酸,其中每一n獨立地為10至40之整數。
- 如請求項43之核酸,其中每一n獨立地為11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38。
- 如請求項33至43中任一項之核酸,其中每一m獨立地為2至15之整數。
- 如請求項45之核酸,其中每一m獨立地為7至11之整數。
- 如請求項46之核酸,其中每一m為9。
- 如請求項33至47中任一項之核酸,其中p為2至10之整數。
- 如請求項48之核酸,其中p為3至6之整數,視情況其中p為3或6。
- 如請求項1至49中任一項之核酸,其中該核酸為RNA。
- 如請求項1至50中任一項之核酸,其中該核酸為線性的。
- 如請求項1至50中任一項之核酸,其中該核酸為環狀的。
- 如請求項1至52中任一項之核酸,其中該開放閱讀框係由選自以下之核苷組成:腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。
- 如請求項53之核酸,其中該開放閱讀框係由選自以下之核苷組成:腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
- 如請求項53或54之核酸,其中該開放閱讀框之該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項55之核酸,其中該開放閱讀框之該經修飾尿苷為1-甲基假尿苷。
- 如請求項53、55及56中任一項之核酸,其中 N之該經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
- 如請求項53及55至57中任一項之核酸,其中 N之該經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
- 如請求項53及55至58中任一項之核酸,其中 N之該經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
- 如請求項1至59中任一項之核酸,其中由該開放閱讀框編碼之該多肽為分泌蛋白、細胞介素、生長因子、酶、免疫調節劑、抗體或其抗原結合片段、細胞穿透肽、細胞外膜結合蛋白、細胞內膜結合蛋白、細胞質蛋白、細胞骨架蛋白或核蛋白。
- 如請求項1至60中任一項之核酸,其中該核酸不包含5’帽。
- 如請求項1至51及53至60中任一項之核酸,其中該核酸包含5’帽。
- 如請求項1至62中任一項之核酸,其中該核酸包含與SEQ ID NO: 173-190及202-205中之任一者具有至少75%序列一致性百分比之核苷酸序列。
- 如請求項63之核酸,其中該核酸包含與SEQ ID NO: 173-190及202-205中之任一者具有至少80%序列一致性百分比之核苷酸序列。
- 如請求項64之核酸,其中該核酸包含與SEQ ID NO: 173-190及202-205中之任一者具有至少85%序列一致性百分比之核苷酸序列。
- 如請求項65之核酸,其中該核酸包含與SEQ ID NO: 173-190及202-205中之任一者具有至少90%序列一致性百分比之核苷酸序列。
- 如請求項66之核酸,其中該核酸包含與SEQ ID NO: 173-190及202-205中之任一者具有至少95%序列一致性百分比之核苷酸序列。
- 如請求項67之核酸,其中該核酸包含SEQ ID NO: 173-190及202-205中之任一者之核苷酸序列。
- 一種核酸,其包含: (i) IRES,其包含一或多個多核苷酸,該一或多個多核苷酸特異性結合轉譯起始因子(例如真核轉譯起始因子4 G (eIF4G)、真核轉譯起始因子4G2 (eIF4G2)、真核轉譯起始因子3 (eIF3)、La蛋白或IRES反式作用因子(ITAf))或包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白或ITAf)之融合蛋白;該IRES可操作地連接至 (ii) 編碼多肽之開放閱讀框。
- 如請求項69之核酸,其中該一或多個多核苷酸特異性結合eIF4G。
- 如請求項70之核酸,其中該一或多個多核苷酸各自獨立地具有與ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAA (SEQ ID NO: 1)至少75%一致之核酸序列,視情況其中SEQ ID NO: 1中之每一U殘基經1-甲基假尿苷置換。
- 如請求項71之核酸,其中該一或多個多核苷酸各自獨立地具有與SEQ ID NO: 1之核酸序列至少85%一致之核酸序列(例如與SEQ ID NO: 1之核酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致),視情況其中SEQ ID NO: 1中之每一U殘基經1-甲基假尿苷置換。
- 如請求項69之核酸,其中該IRES包含一或多個特異性結合至融合蛋白之多核苷酸,該融合蛋白包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白或ITAf), 視情況其中該RNA結合蛋白為MS2結合蛋白,且該一或多個多核苷酸包含一或多個MS2 RNA髮夾。
- 如請求項69至73中任一項之核酸,其中該核酸不包含5’帽。
- 如請求項69至73中任一項之核酸,其中該核酸包含5’帽。
- 如請求項69至75中任一項之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少75%序列一致性百分比之核苷酸序列。
- 如請求項76之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少80%序列一致性百分比之核苷酸序列。
- 如請求項77之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少85%序列一致性百分比之核苷酸序列。
- 如請求項78之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少90%序列一致性百分比之核苷酸序列。
- 如請求項79之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少95%序列一致性百分比之核苷酸序列。
- 如請求項80之核酸,其中該核酸包含SEQ ID NO: 191-201中之任一者之核苷酸序列。
- 一種核酸,其包含: (i) IRES,其包含具有足以與核糖體RNA (rRNA)內之區域雜交之互補性的核苷酸序列,該IRES可操作地連接至 (ii) 編碼多肽之開放閱讀框。
- 如請求項82之核酸,其中該IRES不特異性結合至核糖體蛋白質。
- 如請求項82或83之核酸,其中該IRES之核苷酸序列與該rRNA內之區域具有至少70%互補性,視情況其中該IRES與該rRNA內之區域具有至少71%、72%、73%、74%、85%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互補性。
- 如請求項84之核酸,其中該IRES之核苷酸序列與該rRNA區域內之至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或30或更多個鄰接核鹼基具有至少70%互補性。
- 如請求項82或83之核酸,其中該IRES之核苷酸序列與該rRNA區域內之至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或30或更多個鄰接核鹼基具有至少75%互補性,視情況其中該核酸序列與該rRNA區域內之該至少10、該至少11、該至少12、該至少13、該至少14、該至少15、該至少16、該至少17、該至少18、該至少19、該至少20、該至少21、該至少22、該至少23、該至少24、該至少25、該至少26、該至少27、該至少28、該至少29或該30或該更多個鄰接核鹼基具有至少76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互補性。
- 如請求項82至86中任一項之核酸,其中該IRES之核苷酸序列包含至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或30個與該rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
- 如請求項87之核酸,其中該IRES之核苷酸序列包含10至30個與該rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
- 如任一請求項88之核酸,其中該IRES之核苷酸序列包含12至30個與該rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
- 如請求項89之核酸,其中該IRES之核苷酸序列包含15至30個與該rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
- 如請求項90之核酸,其中該IRES之核苷酸序列包含18至30個與該rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
- 如請求項91之核酸,其中該IRES之核苷酸序列包含20至30個與該rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
- 如請求項92之核酸,其中該IRES之核苷酸序列包含25至30個與該rRNA區域內之等長鄰接多核苷酸區段完全互補之鄰接核苷酸。
- 如請求項82至93中任一項之核酸,其中該IRES之核苷酸序列相對於該rRNA區域包含9個或更少之核苷酸錯配,視情況其中反義股相對於該rRNA區域包含8個或更少、7個或更少、6個或更少、5個或更少、4個或更少、3個或更少、2個或更少或僅1個錯配。
- 如請求項82至94中任一項之核酸,其中該IRES包含一或多個富含尿苷或經修飾尿苷之多核苷酸束。
- 如請求項95之核酸,其中該IRES包含1至20個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項96之核酸,其中該IRES包含2至10個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項97之核酸,其中該IRES包含3至6個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項98之核酸,其中該IRES包含3個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項98之核酸,其中該IRES包含4個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項98之核酸,其中該IRES包含5個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項98之核酸,其中該IRES包含6個富含尿苷或經修飾尿苷之該等多核苷酸束。
- 如請求項95至102中任一項之核酸,其中該等多核苷酸束中之每一者中至少70%之核苷為尿苷或經修飾尿苷。
- 如請求項103之核酸,其中該等多核苷酸束中之每一者中至少75%之核苷為尿苷或經修飾尿苷。
- 如請求項104之核酸,其中該等多核苷酸束中之每一者中至少80%之核苷為尿苷或經修飾尿苷。
- 如請求項105之核酸,其中該等多核苷酸束中之每一者中至少85%之核苷為尿苷或經修飾尿苷。
- 如請求項106之核酸,其中該等多核苷酸束中之每一者中至少90%之核苷為尿苷或經修飾尿苷。
- 如請求項107之核酸,其中該等多核苷酸束中之每一者中至少95%之核苷為尿苷或經修飾尿苷。
- 如請求項108之核酸,其中該等多核苷酸束中之每一者中之所有核苷均為尿苷或經修飾尿苷,較佳地其中該等多核苷酸束中之每一者中之所有核苷均為經修飾尿苷。
- 如請求項95至109中任一項之核酸,其中每一多核苷酸束之長度獨立地為5至20個核苷。
- 如請求項110之核酸,其中每一多核苷酸束之長度獨立地為6至15個核苷。
- 如請求項111之核酸,其中每一多核苷酸束之長度獨立地為7至11個核苷。
- 如請求項112之核酸,其中每一多核苷酸束之長度為9個核苷。
- 如請求項95至113中任一項之核酸,其中每一多核苷酸束獨立地包含5至20個鄰接尿苷或經修飾尿苷核苷。
- 如請求項114之核酸,其中每一多核苷酸束獨立地包含6至15個鄰接尿苷或經修飾尿苷核苷。
- 如請求項115之核酸,其中每一多核苷酸束獨立地包含7至11個鄰接尿苷或經修飾尿苷核苷。
- 如請求項95至116中任一項之核酸,其中每一多核苷酸束包含至少9個鄰接尿苷或經修飾尿苷核苷。
- 如請求項117之核酸,其中每一多核苷酸束包含9個鄰接尿苷或經修飾尿苷核苷。
- 如請求項95至118中任一項之核酸,其中每一多核苷酸束富含該經修飾尿苷。
- 如請求項95至119中任一項之核酸,其中該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項120之核酸,其中該經修飾尿苷為1-甲基假尿苷。
- 如請求項95至121中任一項之核酸,其中該IRES位於該核酸之非編碼區(例如5’ UTR)內,該非編碼區可操作地連接至該開放閱讀框。
- 如請求項122之核酸,其中該開放閱讀框進一步可操作地連接至3’ UTR。
- 如請求項95至123中任一項之核酸,其中該等多核苷酸束藉助一或多個間隔區彼此隔開,該一或多個間隔區各自獨立地包含5至100個核苷。
- 如請求項124之核酸,其中該等間隔區各自獨立地包含10至40個核苷。
- 如請求項125之核酸,其中該等間隔區各自獨立地包含11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38個核苷。
- 如請求項95至126中任一項之核酸,其中該IRES包含具有下式之區段: [( N) n- ( U’) m] p其中: 每一 N獨立地為任何核苷殘基; 每一 U’獨立地為尿苷或經修飾尿苷; 每一n獨立地為1至100之整數; 每一m獨立地為2至15之整數;且 p為2至20之整數。
- 如請求項127之核酸,其中每一 N獨立地選自腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。
- 如請求項128之核酸,其中每一 N獨立地選自腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
- 如請求項128或129之核酸,其中 N之該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項130之核酸,其中 N之該經修飾尿苷為1-甲基假尿苷。
- 如請求項128、130及131中任一項之核酸,其中 N之該經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
- 如請求項128及130至132中任一項之核酸,其中 N之該經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
- 如請求項128及130至133中任一項之核酸,其中 N之該經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
- 如請求項127至134中任一項之核酸,其中 U’之該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項135之核酸,其中 U’之該經修飾尿苷為1-甲基假尿苷。
- 如請求項127至136中任一項之核酸,其中每一n獨立地為10至40之整數。
- 如請求項137之核酸,其中每一n獨立地為11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38。
- 如請求項127至137中任一項之核酸,其中每一m獨立地為2至15之整數。
- 如請求項139之核酸,其中每一m獨立地為7至11之整數。
- 如請求項140之核酸,其中每一m為9。
- 如請求項127至141中任一項之核酸,其中p為2至10之整數。
- 如請求項142之核酸,其中p為3至6之整數,視情況其中p為3或6。
- 如請求項95至143中任一項之核酸,其中該核酸為RNA。
- 如請求項95至144中任一項之核酸,其中該核酸為線性的。
- 如請求項95至144中任一項之核酸,其中該核酸為環狀的。
- 如請求項95至146中任一項之核酸,其中該開放閱讀框係由選自以下之核苷組成:腺苷、經修飾腺苷、尿苷、經修飾尿苷、鳥苷、經修飾鳥苷、胞苷及經修飾胞苷。
- 如請求項147之核酸,其中該開放閱讀框係由選自以下之核苷組成:腺苷、尿苷、經修飾尿苷、鳥苷及胞苷。
- 如請求項147或148之核酸,其中該開放閱讀框之該經修飾尿苷為1-甲基假尿苷、假尿苷、吡啶-4-酮核糖核苷、5-氮雜-尿苷、6-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫基-尿苷、4-硫基-尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基-尿苷、5-胺基烯丙基-尿苷、5-鹵基-尿苷、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲基酯、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-羧基羥基甲基-尿苷、5-羧基羥基甲基-尿苷甲基酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫基-尿苷、5-胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-尿苷、5-甲基胺基甲基-2-硫基-尿苷、5-甲基胺基甲基-2-硒基-尿苷、5-胺甲醯基甲基-尿苷、5-羧基甲基胺基甲基-尿苷、5-羧基甲基胺基甲基-2-硫基-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-假尿苷、5-甲基-尿苷、5-甲基-2-硫基-尿苷、1-甲基-4-硫基-假尿苷、4-硫基-1-甲基-假尿苷、3-甲基假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、5,6-二氫尿苷、5-甲基-二氫尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫基-假尿苷、N1-甲基-假尿苷、3-(3-胺基-3-羧基丙基)尿苷、1-甲基-3-(3-胺基-3-羧基丙基)假尿苷、5-(異戊烯基胺基甲基)尿苷、5-(異戊烯基胺基甲基)-2-硫基-尿苷、α-硫基-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫基-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-胺甲醯基甲基-2'-O-甲基-尿苷、5-羧基甲基胺基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(異戊烯基胺基甲基)-2'-O-甲基-尿苷、1-硫基-尿苷、去氧胸苷、2’‐F‐阿糖‐尿苷、2’‐F‐尿苷、2’‐OH‐阿糖‐尿苷、5‐(2‐甲氧羰基乙烯基)尿苷或5‐[3‐(1‐E‐丙烯基胺基)尿苷。
- 如請求項149之核酸,其中該開放閱讀框之該經修飾尿苷為1-甲基假尿苷。
- 如請求項147、149及150中任一項之核酸,其中 N之該經修飾胞苷為5-氮雜-胞苷、6-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基-胞苷、5-甲醯基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-鹵基-胞苷、5-羥基甲基-胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷、4-甲氧基-1-甲基-假異胞苷、立西啶、α-硫基-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙醯基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲醯基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫基-胞苷、2’‐F‐阿糖‐胞苷、2’‐F‐胞苷或2’‐OH‐阿糖‐胞苷。
- 如請求項147及149至151中任一項之核酸,其中 N之該經修飾腺苷為2-胺基-嘌呤、2,6-二胺基嘌呤、2-胺基-6-鹵基-嘌呤、6-鹵基-嘌呤、2-胺基-6-甲基-嘌呤、8-疊氮基-腺苷、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基-嘌呤、7-去氮-8-氮雜-2-胺基-嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲基硫基-N6-甲基-腺苷、N6-異戊烯基-腺苷、2-甲基硫基-N6-異戊烯基-腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基-腺苷、N6-蘇胺醯胺甲醯基-腺苷、N6-甲基-N6-蘇胺醯胺甲醯基-腺苷、2-甲基硫基-N6-蘇胺醯胺甲醯基-腺苷、N6,N6-二甲基-腺苷、N6-羥基正纈胺醯胺甲醯基-腺苷、2-甲基硫基-N6-羥基正纈胺醯胺甲醯基-腺苷、N6-乙醯基-腺苷、7-甲基-腺嘌呤、2-甲基硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫基-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6,N6,2'-O-三甲基-腺苷、1,2'-O-二甲基-腺苷、2'-O-核糖基腺苷、2-胺基-N6-甲基-嘌呤、1-硫基-腺苷、8-疊氮基-腺苷、2’‐F‐阿糖‐腺苷、2’‐F‐腺苷、2’‐OH‐阿糖‐腺苷或N6‐(19‐胺基‐五氧雜十九烷基)-腺苷。
- 如請求項147及149至152中任一項之核酸,其中 N之該經修飾鳥苷為肌苷、1-甲基-肌苷、懷俄苷、甲基懷俄苷、4-去甲基-懷俄苷、異懷俄苷、懷丁苷、過氧懷丁苷、羥基懷丁苷、7-去氮-鳥苷、辮苷、環氧辮苷、半乳糖基-辮苷、甘露糖基-辮苷、7-氰基-7-去氮-鳥苷、7-胺基甲基-7-去氮-鳥苷、古嘌苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基-肌苷、6-甲氧基-鳥苷、1-甲基-鳥苷、N2-甲基-鳥苷、N2,N2-二甲基-鳥苷、N2,7-二甲基-鳥苷、N2,N2,7-二甲基-鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷、N2,N2-二甲基-6-硫基-鳥苷、α-硫基-鳥苷、2'-O-甲基-鳥苷、N2-甲基-2'-O-甲基-鳥苷、N2,N2-二甲基-2'-O-甲基-鳥苷、1-甲基-2'-O-甲基-鳥苷、N2,7-二甲基-2'-O-甲基-鳥苷、2'-O-甲基-肌苷、1,2'-O-二甲基-肌苷、2'-O-核糖基鳥苷、1-硫基-鳥苷、O6-甲基-鳥苷、2’‐F‐阿糖‐鳥苷或2’‐F‐鳥苷。
- 如請求項95至153中任一項之核酸,其中由該開放閱讀框編碼之該多肽為分泌蛋白、細胞介素、生長因子、酶、免疫調節劑、抗體或其抗原結合片段、細胞穿透肽、細胞外膜結合蛋白、細胞內膜結合蛋白、細胞質蛋白、細胞骨架蛋白或核蛋白。
- 如請求項95至154中任一項之核酸,其中該核酸不包含5’帽。
- 如請求項95至145及147至154中任一項之核酸,其中該核酸包含5’帽。
- 如請求項82至156中任一項之核酸,其中該IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190包含至少75%之序列一致性。
- 如請求項157之核酸,其中該IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190包含至少80%之序列一致性。
- 如請求項158之核酸,其中該IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190包含至少85%之序列一致性。
- 如請求項159之核酸,其中該IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190具有至少90%之序列一致性。
- 如請求項160之核酸,其中該IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190具有至少95%之序列一致性,視情況其中該IRES之核苷酸序列與SEQ ID NO: 185或SEQ ID NO: 190具有至少96%、97%、98%或99%之序列一致性。
- 如請求項161之核酸,其中該IRES之核苷酸序列為SEQ ID NO: 185或SEQ ID NO: 190。
- 如請求項82至162中任一項之核酸,其中該IRES包含一或多個多核苷酸,該一或多個多核苷酸特異性結合轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白或TAf)或包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白或ITAf)之融合蛋白。
- 如請求項163之核酸,其中該一或多個多核苷酸特異性結合eIF4G。
- 如請求項164之核酸,其中該一或多個多核苷酸各自獨立地具有與ACUCACUAUUUGUUUUCGCGCCCAGUUGCAAAAA (SEQ ID NO: 1)至少75%一致之核酸序列,視情況其中SEQ ID NO: 1中之每一U殘基經1-甲基假尿苷置換。
- 如請求項165之核酸,其中該一或多個多核苷酸各自獨立地具有與SEQ ID NO: 1之核酸序列至少85%一致之核酸序列(例如與SEQ ID NO: 1之核酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致),視情況其中SEQ ID NO: 1中之每一U殘基經1-甲基假尿苷置換。
- 如請求項163之核酸,其中該IRES包含一或多個特異性結合至融合蛋白之多核苷酸,該融合蛋白包含與RNA結合蛋白融合之轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白或ITAf), 視情況其中該RNA結合蛋白為MS2結合蛋白,且該一或多個多核苷酸包含一或多個MS2 RNA髮夾。
- 如請求項163至167中任一項之核酸,其中該核酸不包含5’帽。
- 如請求項163至167中任一項之核酸,其中該核酸包含5’帽。
- 如請求項163至169中任一項之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少75%序列一致性之核苷酸序列。
- 如請求項170之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少80%序列一致性之核苷酸序列。
- 如請求項171之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少85%序列一致性之核苷酸序列。
- 如請求項172之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少90%序列一致性之核苷酸序列。
- 如請求項173之核酸,其中該核酸包含與SEQ ID NO: 191-201中之任一者具有至少95%序列一致性之核苷酸序列。
- 如請求項174之核酸,其中該核酸包含SEQ ID NO: 191-201中之任一者之核苷酸序列。
- 如請求項82至175中任一項之核酸,其中該rRNA來自60S或40S核糖體亞單元,視情況其中該rRNA選自由以下組成之群:25S、28S、18S、5.8S及5S rRNA。
- 一種多肽表現系統,其包含: (i) 如請求項1至176中任一項之核酸;及 (ii) 包含編碼轉譯起始因子(例如eIF4G、eIF4G2、eIF3、La蛋白或ITAf)之開放閱讀框之核酸。
- 如請求項177之多肽表現系統,其中該(i)之核酸與該(ii)之核酸係單獨的分子。
- 如請求項177或178之多肽表現系統,其中該(ii)之核酸自5’至3’包含: (i) 5’ UTR; (ii) 編碼該eIF4G、該La蛋白或其功能變異體之該開放閱讀框;及 (iii) 3’ UTR。
- 如請求項179之多肽表現系統,其中該(ii)之核酸進一步包含可操作地連接至該5’ UTR之5’帽。
- 一種宿主細胞,其包含如請求項1至176中任一項之核酸或如請求項70至73中任一項之多肽表現系統。
- 如請求項181之宿主細胞,其中該宿主細胞為真核細胞。
- 如請求項182之宿主細胞,其中該真核細胞為哺乳動物細胞。
- 如請求項183之宿主細胞,其中該哺乳動物細胞為人類細胞。
- 一種在個體體內表現多肽之方法,該方法包括向該個體投與如請求項1至176中任一項之核酸或如請求項177至180中任一項之多肽表現系統。
- 一種在細胞或細胞群體中表現多肽之方法,該方法包括向該細胞或細胞群體提供如請求項1至176中任一項之核酸或如請求項177至180中任一項之多肽表現系統。
- 一種治療與內源性多肽缺乏相關之疾病或疾患之方法,該方法包括向個體投與如請求項1至176中任一項之核酸或如請求項177至180中任一項之多肽表現系統,其中由該核酸或該多肽表現系統編碼之多肽對應於其缺乏與該疾病或疾患相關之多肽。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202263395614P | 2022-08-05 | 2022-08-05 | |
US63/395,614 | 2022-08-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202417629A true TW202417629A (zh) | 2024-05-01 |
Family
ID=89849952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112129616A TW202417629A (zh) | 2022-08-05 | 2023-08-07 | 用於改良之多核苷酸轉譯之內部核糖體進入位點 |
Country Status (2)
Country | Link |
---|---|
TW (1) | TW202417629A (zh) |
WO (1) | WO2024031087A2 (zh) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3492109B1 (en) * | 2011-10-03 | 2020-03-04 | ModernaTX, Inc. | Modified nucleosides, nucleotides, and nucleic acids, and uses thereof |
-
2023
- 2023-08-04 WO PCT/US2023/071742 patent/WO2024031087A2/en unknown
- 2023-08-07 TW TW112129616A patent/TW202417629A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024031087A3 (en) | 2024-04-25 |
WO2024031087A2 (en) | 2024-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2973443T3 (es) | Polinucleótidos que codifican galactosa-1-fosfato uridililtransferasa para el tratamiento de galactosemia de tipo 1 | |
US20230398074A1 (en) | Nucleic Acid-Based Therapy of Muscular Dystrophies | |
US20230112986A1 (en) | Polynucleotides encoding porphobilinogen deaminase for the treatment of acute intermittent porphyria | |
JP7210287B2 (ja) | Ii型シトルリン血症の治療のためのシトリンをコードするポリヌクレオチド | |
EP3458107B1 (en) | Polynucleotides encoding jagged1 for the treatment of alagille syndrome | |
EP3458590B1 (en) | Polynucleotides encoding -galactosidase a for the treatment of fabry disease | |
CN109640962B (zh) | 编码松弛素的多核苷酸 | |
AU2017266948B2 (en) | Polynucleotides encoding porphobilinogen deaminase for the treatment of acute intermittent porphyria | |
US20240318187A1 (en) | Polyribonucleotides containing reduced uracil content and uses thereof | |
EP3458106A1 (en) | Polynucleotides encoding lipoprotein lipase for the treatment of hyperlipidemia | |
EP3458108A1 (en) | Polynucleotides encoding cystic fibrosis transmembrane conductance regulator for the treatment of cystic fibrosis | |
CN113164561A (zh) | 用于治疗糖原贮积病的编码葡萄糖-6-磷酸酶的多核苷酸 | |
JP2021504335A (ja) | フェニルケトン尿症の治療用のフェニルアラニンヒドロキシラーゼをコードするポリヌクレオチド | |
JP2023527875A (ja) | フェニルアラニンヒドロキシラーゼバリアント及びその使用 | |
JP2022500444A (ja) | クリグラー−ナジャー症候群の治療のためのウリジン二リン酸グリコシルトランスフェラーゼ1ファミリー、ポリペプチドa1をコードするポリヌクレオチド | |
TW202417629A (zh) | 用於改良之多核苷酸轉譯之內部核糖體進入位點 | |
WO2024129779A1 (en) | Internal ribosome entry sites for improved polynucleotide translation | |
WO2022204369A1 (en) | Polynucleotides encoding methylmalonyl-coa mutase for the treatment of methylmalonic acidemia | |
WO2022271776A1 (en) | Polynucleotides encoding uridine diphosphate glycosyltransferase 1 family, polypeptide a1 for the treatment of crigler-najjar syndrome |