KR20200079497A - 제제 - Google Patents
제제 Download PDFInfo
- Publication number
- KR20200079497A KR20200079497A KR1020207012309A KR20207012309A KR20200079497A KR 20200079497 A KR20200079497 A KR 20200079497A KR 1020207012309 A KR1020207012309 A KR 1020207012309A KR 20207012309 A KR20207012309 A KR 20207012309A KR 20200079497 A KR20200079497 A KR 20200079497A
- Authority
- KR
- South Korea
- Prior art keywords
- lipid
- composition
- mol
- lnp
- rna
- Prior art date
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 339
- 238000009472 formulation Methods 0.000 title description 53
- 150000002632 lipids Chemical class 0.000 claims abstract description 385
- -1 engineered cells Substances 0.000 claims abstract description 153
- 238000000034 method Methods 0.000 claims abstract description 65
- 239000002105 nanoparticle Substances 0.000 claims abstract description 18
- 108020004999 messenger RNA Proteins 0.000 claims description 227
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 208
- 108020005004 Guide RNA Proteins 0.000 claims description 193
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 188
- 108091033409 CRISPR Proteins 0.000 claims description 120
- 230000007935 neutral effect Effects 0.000 claims description 110
- 239000002773 nucleotide Substances 0.000 claims description 90
- 125000003729 nucleotide group Chemical group 0.000 claims description 89
- 150000007523 nucleic acids Chemical class 0.000 claims description 83
- 102000039446 nucleic acids Human genes 0.000 claims description 82
- 108020004707 nucleic acids Proteins 0.000 claims description 82
- 230000004568 DNA-binding Effects 0.000 claims description 72
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 72
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 claims description 72
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 72
- 229940045145 uridine Drugs 0.000 claims description 72
- 230000004048 modification Effects 0.000 claims description 70
- 238000012986 modification Methods 0.000 claims description 70
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims description 68
- 239000011230 binding agent Substances 0.000 claims description 63
- 108700026244 Open Reading Frames Proteins 0.000 claims description 58
- 108090000623 proteins and genes Proteins 0.000 claims description 54
- 101710163270 Nuclease Proteins 0.000 claims description 53
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 claims description 37
- 150000003904 phospholipids Chemical class 0.000 claims description 35
- 235000012000 cholesterol Nutrition 0.000 claims description 34
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 claims description 28
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 27
- 150000001241 acetals Chemical class 0.000 claims description 22
- 238000010362 genome editing Methods 0.000 claims description 18
- 230000001939 inductive effect Effects 0.000 claims description 11
- KILNVBDSWZSGLL-KXQOOQHDSA-N 1,2-dihexadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCC KILNVBDSWZSGLL-KXQOOQHDSA-N 0.000 claims description 10
- 230000027455 binding Effects 0.000 claims description 9
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 6
- HKJAWHYHRVVDHK-UHFFFAOYSA-N 15,16,17-trihydroxyhentriacontane-14,18-dione Chemical compound CCCCCCCCCCCCCC(=O)C(O)C(O)C(O)C(=O)CCCCCCCCCCCCC HKJAWHYHRVVDHK-UHFFFAOYSA-N 0.000 claims 2
- 238000004519 manufacturing process Methods 0.000 claims 1
- 239000003795 chemical substances by application Substances 0.000 abstract description 15
- 238000012384 transportation and delivery Methods 0.000 abstract description 15
- 239000013543 active substance Substances 0.000 abstract description 6
- 229920001223 polyethylene glycol Polymers 0.000 description 124
- 210000004940 nucleus Anatomy 0.000 description 116
- 210000004027 cell Anatomy 0.000 description 95
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 52
- 108020004414 DNA Proteins 0.000 description 43
- 210000002966 serum Anatomy 0.000 description 41
- 210000004185 liver Anatomy 0.000 description 40
- 239000002245 particle Substances 0.000 description 39
- 101000941029 Homo sapiens Endoplasmic reticulum junction formation protein lunapark Proteins 0.000 description 37
- 101000991410 Homo sapiens Nucleolar and spindle-associated protein 1 Proteins 0.000 description 37
- 102100030991 Nucleolar and spindle-associated protein 1 Human genes 0.000 description 37
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 34
- 238000004458 analytical method Methods 0.000 description 33
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 32
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 31
- 102000004169 proteins and genes Human genes 0.000 description 31
- 230000000694 effects Effects 0.000 description 29
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 29
- 108010071690 Prealbumin Proteins 0.000 description 28
- 102000009190 Transthyretin Human genes 0.000 description 28
- 108010034529 leucyl-lysine Proteins 0.000 description 28
- 235000018102 proteins Nutrition 0.000 description 28
- 238000010453 CRISPR/Cas method Methods 0.000 description 27
- 108010092854 aspartyllysine Proteins 0.000 description 23
- 238000005538 encapsulation Methods 0.000 description 23
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 22
- 229930185560 Pseudouridine Natural products 0.000 description 22
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 22
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 22
- 210000004369 blood Anatomy 0.000 description 22
- 239000008280 blood Substances 0.000 description 22
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 22
- 230000000295 complement effect Effects 0.000 description 20
- 238000001727 in vivo Methods 0.000 description 20
- 238000005259 measurement Methods 0.000 description 20
- 239000003981 vehicle Substances 0.000 description 20
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 19
- 239000000543 intermediate Substances 0.000 description 19
- 230000008685 targeting Effects 0.000 description 19
- 241001465754 Metazoa Species 0.000 description 18
- 241000699670 Mus sp. Species 0.000 description 18
- 108010050848 glycylleucine Proteins 0.000 description 18
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 18
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 17
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 16
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 16
- 238000009826 distribution Methods 0.000 description 16
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 16
- 102000040430 polynucleotide Human genes 0.000 description 16
- 108091033319 polynucleotide Proteins 0.000 description 16
- 239000002157 polynucleotide Substances 0.000 description 16
- 229920001184 polypeptide Polymers 0.000 description 16
- 108090000765 processed proteins & peptides Proteins 0.000 description 16
- 102000004196 processed proteins & peptides Human genes 0.000 description 16
- 239000011780 sodium chloride Substances 0.000 description 16
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 15
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 15
- 241000282414 Homo sapiens Species 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000002347 injection Methods 0.000 description 15
- 239000007924 injection Substances 0.000 description 15
- 108010057821 leucylproline Proteins 0.000 description 15
- 210000005229 liver cell Anatomy 0.000 description 15
- 235000000346 sugar Nutrition 0.000 description 15
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 14
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 14
- 150000001413 amino acids Chemical group 0.000 description 14
- 108010062796 arginyllysine Proteins 0.000 description 14
- 239000000872 buffer Substances 0.000 description 14
- 239000005090 green fluorescent protein Substances 0.000 description 14
- 210000003494 hepatocyte Anatomy 0.000 description 14
- 108010025306 histidylleucine Proteins 0.000 description 14
- 238000003780 insertion Methods 0.000 description 14
- 230000037431 insertion Effects 0.000 description 14
- 108010054155 lysyllysine Proteins 0.000 description 14
- 238000010354 CRISPR gene editing Methods 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 230000035772 mutation Effects 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 12
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 12
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 238000007481 next generation sequencing Methods 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 12
- 108010073969 valyllysine Proteins 0.000 description 12
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 11
- 239000007983 Tris buffer Substances 0.000 description 11
- 238000002296 dynamic light scattering Methods 0.000 description 11
- 238000001556 precipitation Methods 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 11
- 108020005345 3' Untranslated Regions Proteins 0.000 description 10
- 108020003589 5' Untranslated Regions Proteins 0.000 description 10
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 10
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 10
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 10
- 102000004127 Cytokines Human genes 0.000 description 10
- 108090000695 Cytokines Proteins 0.000 description 10
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 10
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 10
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 10
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 10
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 10
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 10
- 229960000643 adenine Drugs 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 108010018006 histidylserine Proteins 0.000 description 10
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 10
- 239000002777 nucleoside Substances 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 9
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 9
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 9
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 9
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 9
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 9
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 9
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 9
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 9
- 239000004927 clay Substances 0.000 description 9
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 238000004128 high performance liquid chromatography Methods 0.000 description 9
- 238000002156 mixing Methods 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 229930024421 Adenine Natural products 0.000 description 8
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 8
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 8
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 8
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 8
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 8
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 8
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 8
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 8
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 8
- 108010047562 NGR peptide Proteins 0.000 description 8
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 8
- 108090000848 Ubiquitin Proteins 0.000 description 8
- 102000044159 Ubiquitin Human genes 0.000 description 8
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 8
- 125000005647 linker group Chemical group 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 108010017391 lysylvaline Proteins 0.000 description 8
- 125000003835 nucleoside group Chemical group 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 7
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 229930006000 Sucrose Natural products 0.000 description 7
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 7
- 108091028113 Trans-activating crRNA Proteins 0.000 description 7
- 125000000217 alkyl group Chemical group 0.000 description 7
- 102000034287 fluorescent proteins Human genes 0.000 description 7
- 108091006047 fluorescent proteins Proteins 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 150000003833 nucleoside derivatives Chemical class 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 239000005720 sucrose Substances 0.000 description 7
- CITHEXJVPOWHKC-UUWRZZSWSA-N 1,2-di-O-myristoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCC CITHEXJVPOWHKC-UUWRZZSWSA-N 0.000 description 6
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 6
- 101150077194 CAP1 gene Proteins 0.000 description 6
- 230000007018 DNA scission Effects 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 101150071666 HBA gene Proteins 0.000 description 6
- 108090001005 Interleukin-6 Proteins 0.000 description 6
- 102000004889 Interleukin-6 Human genes 0.000 description 6
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 6
- 101100245221 Mus musculus Prss8 gene Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- 241000700159 Rattus Species 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- 229940024606 amino acid Drugs 0.000 description 6
- 230000037396 body weight Effects 0.000 description 6
- 229960003724 dimyristoylphosphatidylcholine Drugs 0.000 description 6
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 238000003197 gene knockdown Methods 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 6
- 238000000569 multi-angle light scattering Methods 0.000 description 6
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 6
- 239000000546 pharmaceutical excipient Substances 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 239000002953 phosphate buffered saline Substances 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 5
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 5
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 5
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 5
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 5
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 5
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 5
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 5
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 5
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 5
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 5
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 5
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 5
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 5
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 5
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 5
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 5
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 5
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 5
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 5
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 5
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 5
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 5
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 5
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 5
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 5
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 5
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 5
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 5
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 5
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 5
- 101150014715 CAP2 gene Proteins 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 5
- 230000008836 DNA modification Effects 0.000 description 5
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 5
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 5
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 5
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 5
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 5
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 5
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 5
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 5
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 5
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 5
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 5
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 5
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 5
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 5
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 5
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 5
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 5
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 5
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 5
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 5
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 5
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 5
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 5
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 5
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 5
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 5
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 5
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 5
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 5
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 5
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 5
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 5
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 5
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 5
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 5
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 5
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 5
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 5
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 5
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 5
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 5
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 5
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 5
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 5
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 5
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 5
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 5
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 5
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 5
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 5
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 5
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 5
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 5
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 5
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 5
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 5
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 5
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 5
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 5
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 5
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 5
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 5
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 5
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 5
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 5
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 5
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 5
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 5
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 5
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 5
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 5
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 5
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 5
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 5
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 5
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 5
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 5
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 5
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 5
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 5
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 5
- 101100260872 Mus musculus Tmprss4 gene Proteins 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- FZWGECJQACGGTI-UHFFFAOYSA-N N7-methylguanine Natural products NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 5
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 5
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 5
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 5
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 5
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 5
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 5
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 5
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 5
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 5
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 5
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 5
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 5
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 5
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 5
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 5
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 5
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 5
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 5
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 5
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 5
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 5
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 5
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 5
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 5
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 5
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 5
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 5
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 5
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 5
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 5
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 5
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 5
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 5
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 5
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 5
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 5
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 5
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 5
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 5
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 5
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 5
- 108010081404 acein-2 Proteins 0.000 description 5
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 5
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 5
- 108010008355 arginyl-glutamine Proteins 0.000 description 5
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 5
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 239000002577 cryoprotective agent Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 108010079547 glutamylmethionine Proteins 0.000 description 5
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 5
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 5
- 108010087823 glycyltyrosine Proteins 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 108010000761 leucylarginine Proteins 0.000 description 5
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 5
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 5
- 108010031719 prolyl-serine Proteins 0.000 description 5
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 5
- 229940104230 thymidine Drugs 0.000 description 5
- 229940113082 thymine Drugs 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 108010051110 tyrosyl-lysine Proteins 0.000 description 5
- LVNGJLRDBYCPGB-UHFFFAOYSA-N 1,2-distearoylphosphatidylethanolamine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(COP([O-])(=O)OCC[NH3+])OC(=O)CCCCCCCCCCCCCCCCC LVNGJLRDBYCPGB-UHFFFAOYSA-N 0.000 description 4
- NEZDNQCXEZDCBI-UHFFFAOYSA-N 2-azaniumylethyl 2,3-di(tetradecanoyloxy)propyl phosphate Chemical compound CCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCCN)OC(=O)CCCCCCCCCCCCC NEZDNQCXEZDCBI-UHFFFAOYSA-N 0.000 description 4
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 4
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 4
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 4
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 4
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 4
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 4
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 4
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 4
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 4
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 4
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 4
- 108010088751 Albumins Proteins 0.000 description 4
- 102000013918 Apolipoproteins E Human genes 0.000 description 4
- 108010025628 Apolipoproteins E Proteins 0.000 description 4
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 4
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 4
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 4
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 4
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 4
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 4
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 4
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 4
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 4
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 4
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 4
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 4
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 4
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 4
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 4
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 4
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 4
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 4
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 4
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 4
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 4
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 4
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 4
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 4
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 4
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 4
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 4
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 4
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 4
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 4
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 4
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 4
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 4
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 4
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 4
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 4
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 4
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 4
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 4
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 4
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 4
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 4
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 4
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 4
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 4
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 4
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 4
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 4
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 4
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 4
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 4
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 4
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 4
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 4
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 4
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 4
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 4
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 4
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 4
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 4
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 4
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 4
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 4
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 4
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 4
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 4
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 4
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 4
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 4
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 4
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 4
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 4
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 4
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 4
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 4
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 4
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 4
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 4
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 4
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 4
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 4
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 4
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 4
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 4
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 4
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 4
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 4
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 4
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 4
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 4
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 4
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 4
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 4
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 4
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 4
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 4
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 4
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 4
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 4
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 4
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 4
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 4
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 4
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 4
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 4
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 4
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 4
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 4
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 4
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 4
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 4
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 4
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 4
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 4
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 4
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 4
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 4
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 4
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 4
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 4
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 4
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 4
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- WSDRAZIPGVLSNP-UHFFFAOYSA-N O.P(=O)(O)(O)O.O.O.P(=O)(O)(O)O Chemical compound O.P(=O)(O)(O)O.O.O.P(=O)(O)(O)O WSDRAZIPGVLSNP-UHFFFAOYSA-N 0.000 description 4
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 4
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 4
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 4
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 4
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 4
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 4
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 4
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 4
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 4
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 4
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 4
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 4
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 4
- 108010003201 RGH 0205 Proteins 0.000 description 4
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 4
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 4
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 4
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 4
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 4
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 4
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 4
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 4
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 4
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 4
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 4
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 4
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 4
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 108020005038 Terminator Codon Proteins 0.000 description 4
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 4
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 4
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 4
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 4
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 4
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 4
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 4
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 4
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 4
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 4
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 4
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 4
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 4
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 4
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 4
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 4
- 108020004566 Transfer RNA Proteins 0.000 description 4
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 4
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 4
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 4
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 4
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 4
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 4
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 4
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 4
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 4
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 4
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 4
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 4
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 4
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 4
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 4
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 4
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 4
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 4
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 4
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 4
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 4
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- MWRBNPKJOOWZPW-CLFAGFIQSA-N dioleoyl phosphatidylethanolamine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(=O)OCCN)OC(=O)CCCCCCC\C=C/CCCCCCCC MWRBNPKJOOWZPW-CLFAGFIQSA-N 0.000 description 4
- 239000012636 effector Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 4
- 229910052698 phosphorus Inorganic materials 0.000 description 4
- 108010025488 pinealon Proteins 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 150000008163 sugars Chemical class 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 4
- 210000003462 vein Anatomy 0.000 description 4
- PAHHYDSPOXDASW-VGWMRTNUSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-1-[(2s)-2-amino-3-hydroxypropanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO PAHHYDSPOXDASW-VGWMRTNUSA-N 0.000 description 3
- LZLVZIFMYXDKCN-QJWFYWCHSA-N 1,2-di-O-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC LZLVZIFMYXDKCN-QJWFYWCHSA-N 0.000 description 3
- BBGNINPPDHJETF-UHFFFAOYSA-N 5-heptadecylresorcinol Chemical compound CCCCCCCCCCCCCCCCCC1=CC(O)=CC(O)=C1 BBGNINPPDHJETF-UHFFFAOYSA-N 0.000 description 3
- 108010085238 Actins Proteins 0.000 description 3
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 3
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 3
- 108010077840 Complement C3a Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 238000008157 ELISA kit Methods 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 3
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 3
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 3
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 3
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 3
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 101100394291 Mus musculus Hba gene Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 239000004743 Polypropylene Substances 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 101100506286 Rattus norvegicus Hba1 gene Proteins 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- 241000191967 Staphylococcus aureus Species 0.000 description 3
- 239000007984 Tris EDTA buffer Substances 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 108010006025 bovine growth hormone Proteins 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 231100000673 dose–response relationship Toxicity 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 238000003209 gene knockout Methods 0.000 description 3
- 108060003196 globin Proteins 0.000 description 3
- 102000018146 globin Human genes 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 229910052736 halogen Inorganic materials 0.000 description 3
- 150000002367 halogens Chemical class 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000015788 innate immune response Effects 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 125000004437 phosphorous atom Chemical group 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 229920000642 polymer Chemical group 0.000 description 3
- 229920001155 polypropylene Polymers 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 3
- 125000001424 substituent group Chemical group 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000002459 sustained effect Effects 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 108700026220 vif Genes Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- SLKDGVPOSSLUAI-PGUFJCEWSA-N 1,2-dihexadecanoyl-sn-glycero-3-phosphoethanolamine zwitterion Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OCCN)OC(=O)CCCCCCCCCCCCCCC SLKDGVPOSSLUAI-PGUFJCEWSA-N 0.000 description 2
- KBPLFHHGFOOTCA-UHFFFAOYSA-N 1-Octanol Chemical compound CCCCCCCCO KBPLFHHGFOOTCA-UHFFFAOYSA-N 0.000 description 2
- RFVFQQWKPSOBED-PSXMRANNSA-N 1-myristoyl-2-palmitoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)O[C@@H](COP([O-])(=O)OCC[N+](C)(C)C)COC(=O)CCCCCCCCCCCCC RFVFQQWKPSOBED-PSXMRANNSA-N 0.000 description 2
- AAFZKYZZZXQHQU-UHFFFAOYSA-N 4,4-dioctoxybutanenitrile Chemical compound CCCCCCCCOC(CCC#N)OCCCCCCCC AAFZKYZZZXQHQU-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 241000190857 Allochromatium vinosum Species 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 101001082063 Homo sapiens Interferon-induced protein with tetratricopeptide repeats 5 Proteins 0.000 description 2
- 101001045218 Homo sapiens Peroxisomal multifunctional enzyme type 2 Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 102100027355 Interferon-induced protein with tetratricopeptide repeats 1 Human genes 0.000 description 2
- 101710166699 Interferon-induced protein with tetratricopeptide repeats 1 Proteins 0.000 description 2
- 102100027356 Interferon-induced protein with tetratricopeptide repeats 5 Human genes 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000190928 Microscilla marina Species 0.000 description 2
- 101100154776 Mus musculus Ttr gene Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102100022587 Peroxisomal multifunctional enzyme type 2 Human genes 0.000 description 2
- 241001135241 Porphyromonas macacae Species 0.000 description 2
- 101100208299 Rattus norvegicus Ttr gene Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 2
- 241000203587 Streptosporangium roseum Species 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102100040247 Tumor necrosis factor Human genes 0.000 description 2
- 102100021012 Ubiquitin-fold modifier 1 Human genes 0.000 description 2
- 101710082264 Ubiquitin-fold modifier 1 Proteins 0.000 description 2
- 101710082247 Ubiquitin-like protein 5 Proteins 0.000 description 2
- 102100030580 Ubiquitin-like protein 5 Human genes 0.000 description 2
- 102100027266 Ubiquitin-like protein ISG15 Human genes 0.000 description 2
- 102100031319 Ubiquitin-related modifier 1 Human genes 0.000 description 2
- 101710144315 Ubiquitin-related modifier 1 Proteins 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 239000010441 alabaster Substances 0.000 description 2
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 2
- 125000003545 alkoxy group Chemical group 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- OSGAYBCDTDRGGQ-UHFFFAOYSA-L calcium sulfate Chemical compound [Ca+2].[O-]S([O-])(=O)=O OSGAYBCDTDRGGQ-UHFFFAOYSA-L 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- WLNARFZDISHUGS-MIXBDBMTSA-N cholesteryl hemisuccinate Chemical compound C1C=C2C[C@@H](OC(=O)CCC(O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 WLNARFZDISHUGS-MIXBDBMTSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000007979 citrate buffer Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000009295 crossflow filtration Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000011033 desalting Methods 0.000 description 2
- 229960003957 dexamethasone Drugs 0.000 description 2
- 150000001985 dialkylglycerols Chemical class 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 239000012470 diluted sample Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 210000005007 innate immune system Anatomy 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000007914 intraventricular administration Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 208000019423 liver disease Diseases 0.000 description 2
- 210000005228 liver tissue Anatomy 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 229920002113 octoxynol Polymers 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- PTMHPRAIXMAOOB-UHFFFAOYSA-N phosphoramidic acid Chemical compound NP(O)(O)=O PTMHPRAIXMAOOB-UHFFFAOYSA-N 0.000 description 2
- 238000007747 plating Methods 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 238000010992 reflux Methods 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 150000003291 riboses Chemical class 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 125000000547 substituted alkyl group Chemical group 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 238000011287 therapeutic dose Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 229950010342 uridine triphosphate Drugs 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- YKIOPDIXYAUOFN-YACUFSJGSA-N (2-{[(2r)-2,3-bis(icosanoyloxy)propyl phosphonato]oxy}ethyl)trimethylazanium Chemical compound CCCCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCCCC YKIOPDIXYAUOFN-YACUFSJGSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- 125000004191 (C1-C6) alkoxy group Chemical group 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- FVXDQWZBHIXIEJ-LNDKUQBDSA-N 1,2-di-[(9Z,12Z)-octadecadienoyl]-sn-glycero-3-phosphocholine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C/C\C=C/CCCCC FVXDQWZBHIXIEJ-LNDKUQBDSA-N 0.000 description 1
- 229940083937 1,2-diarachidoyl-sn-glycero-3-phosphocholine Drugs 0.000 description 1
- UHUSDOQQWJGJQS-QNGWXLTQSA-N 1,2-dioctadecanoyl-sn-glycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](CO)OC(=O)CCCCCCCCCCCCCCCCC UHUSDOQQWJGJQS-QNGWXLTQSA-N 0.000 description 1
- VKKTUDKKYOOLGG-UHFFFAOYSA-N 1-(diethylamino)propan-1-ol Chemical compound CCC(O)N(CC)CC VKKTUDKKYOOLGG-UHFFFAOYSA-N 0.000 description 1
- RYCNUMLMNKHWPZ-SNVBAGLBSA-N 1-acetyl-sn-glycero-3-phosphocholine Chemical compound CC(=O)OC[C@@H](O)COP([O-])(=O)OCC[N+](C)(C)C RYCNUMLMNKHWPZ-SNVBAGLBSA-N 0.000 description 1
- PZNPLUBHRSSFHT-RRHRGVEJSA-N 1-hexadecanoyl-2-octadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[C@@H](COP([O-])(=O)OCC[N+](C)(C)C)COC(=O)CCCCCCCCCCCCCCC PZNPLUBHRSSFHT-RRHRGVEJSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- IDJBAILPQXINMB-UHFFFAOYSA-N 2-(4-methylanilino)-1H-naphthalene-2-sulfonic acid Chemical compound C1(=CC=C(C=C1)NC1(CC2=CC=CC=C2C=C1)S(=O)(=O)O)C IDJBAILPQXINMB-UHFFFAOYSA-N 0.000 description 1
- WKCYFSZDBICRKL-UHFFFAOYSA-N 3-(diethylamino)propan-1-ol Chemical compound CCN(CC)CCCO WKCYFSZDBICRKL-UHFFFAOYSA-N 0.000 description 1
- WPBFNSZRHYSKPC-UHFFFAOYSA-N 4,4-di(nonoxy)butanoic acid Chemical compound C(CCCCCCCC)OC(CCC(=O)O)OCCCCCCCCC WPBFNSZRHYSKPC-UHFFFAOYSA-N 0.000 description 1
- HKOXWZKSEAHYQI-UHFFFAOYSA-N 4,4-didecoxybutanoic acid Chemical compound C(CCCCCCCCC)OC(CCC(=O)O)OCCCCCCCCCC HKOXWZKSEAHYQI-UHFFFAOYSA-N 0.000 description 1
- DRZCPHGVEATLFR-UHFFFAOYSA-N 4,4-diethoxybutanenitrile Chemical compound CCOC(OCC)CCC#N DRZCPHGVEATLFR-UHFFFAOYSA-N 0.000 description 1
- BBARWIXHYNINDU-UHFFFAOYSA-N 4,4-diheptoxybutanoic acid Chemical compound C(CCCCCC)OC(CCC(=O)O)OCCCCCCC BBARWIXHYNINDU-UHFFFAOYSA-N 0.000 description 1
- LJGQTKVSHAEDAH-UHFFFAOYSA-N 4,4-dihexoxybutanoic acid Chemical compound C(CCCCC)OC(CCC(=O)O)OCCCCCC LJGQTKVSHAEDAH-UHFFFAOYSA-N 0.000 description 1
- KQOYZXMRNJNKNZ-UHFFFAOYSA-N 4,4-dioctoxybutanoic acid Chemical compound C(CCCCCCC)OC(CCC(=O)O)OCCCCCCCC KQOYZXMRNJNKNZ-UHFFFAOYSA-N 0.000 description 1
- FMACOQYXJYPBSK-UHFFFAOYSA-N 4,4-dipentoxybutanoic acid Chemical compound C(CCCC)OC(CCC(=O)O)OCCCCC FMACOQYXJYPBSK-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- 101001082110 Acanthamoeba polyphaga mimivirus Eukaryotic translation initiation factor 4E homolog Proteins 0.000 description 1
- 241000007910 Acaryochloris marina Species 0.000 description 1
- 241001135192 Acetohalobium arabaticum Species 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 241001464929 Acidithiobacillus caldus Species 0.000 description 1
- 241000605222 Acidithiobacillus ferrooxidans Species 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 1
- 229930188104 Alkylresorcinol Natural products 0.000 description 1
- 102000000132 Alpha tubulin Human genes 0.000 description 1
- 241000147155 Ammonifex degensii Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000620196 Arthrospira maxima Species 0.000 description 1
- 240000002900 Arthrospira platensis Species 0.000 description 1
- 235000016425 Arthrospira platensis Nutrition 0.000 description 1
- 241001495183 Arthrospira sp. Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000906059 Bacillus pseudomycoides Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 1
- 241000168061 Butyrivibrio proteoclasticus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 101100455752 Caenorhabditis elegans lys-3 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 102000007590 Calpain Human genes 0.000 description 1
- 108010032088 Calpain Proteins 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000589986 Campylobacter lari Species 0.000 description 1
- 241001496650 Candidatus Desulforudis Species 0.000 description 1
- 241001040999 Candidatus Methanoplasma termitum Species 0.000 description 1
- 241000243205 Candidatus Parcubacteria Species 0.000 description 1
- 241000223282 Candidatus Peregrinibacteria Species 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- BQENDLAVTKRQMS-SBBGFIFASA-L Carbenoxolone sodium Chemical compound [Na+].[Na+].C([C@H]1C2=CC(=O)[C@H]34)[C@@](C)(C([O-])=O)CC[C@]1(C)CC[C@@]2(C)[C@]4(C)CC[C@@H]1[C@]3(C)CC[C@H](OC(=O)CCC([O-])=O)C1(C)C BQENDLAVTKRQMS-SBBGFIFASA-L 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 241000218645 Cedrus Species 0.000 description 1
- 208000034628 Celiac artery compression syndrome Diseases 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 241000907165 Coleofasciculus chthonoplastes Species 0.000 description 1
- 102000012422 Collagen Type I Human genes 0.000 description 1
- 108010022452 Collagen Type I Proteins 0.000 description 1
- 241000065716 Crocosphaera watsonii Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 101001082109 Danio rerio Eukaryotic translation initiation factor 4E-1B Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005947 EBFP2 Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000011891 EIA kit Methods 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101100176848 Escherichia phage N15 gene 15 gene Proteins 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000326311 Exiguobacterium sibiricum Species 0.000 description 1
- 241000605896 Fibrobacter succinogenes Species 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000968725 Gammaproteobacteria bacterium Species 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100028966 HLA class I histocompatibility antigen, alpha chain F Human genes 0.000 description 1
- 101710113864 Heat shock protein 90 Proteins 0.000 description 1
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000986080 Homo sapiens HLA class I histocompatibility antigen, alpha chain F Proteins 0.000 description 1
- 101001016865 Homo sapiens Heat shock protein HSP 90-alpha Proteins 0.000 description 1
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 1
- 101001057508 Homo sapiens Ubiquitin-like protein ISG15 Proteins 0.000 description 1
- 101000823778 Homo sapiens Y-box-binding protein 2 Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108010014726 Interferon Type I Proteins 0.000 description 1
- 102000002227 Interferon Type I Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 102000003814 Interleukin-10 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108010011429 Interleukin-12 Subunit p40 Proteins 0.000 description 1
- 102000014158 Interleukin-12 Subunit p40 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 102000004388 Interleukin-4 Human genes 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- PIWKPBJCKXDKJR-UHFFFAOYSA-N Isoflurane Chemical compound FC(F)OC(Cl)C(F)(F)F PIWKPBJCKXDKJR-UHFFFAOYSA-N 0.000 description 1
- 241001430080 Ktedonobacter racemifer Species 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 241000186679 Lactobacillus buchneri Species 0.000 description 1
- 241000186673 Lactobacillus delbrueckii Species 0.000 description 1
- 241000186606 Lactobacillus gasseri Species 0.000 description 1
- 241000186869 Lactobacillus salivarius Species 0.000 description 1
- 241001148627 Leptospira inadai Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101000986081 Macaca mulatta Mamu class I histocompatibility antigen, alpha chain F Proteins 0.000 description 1
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 1
- 101710091439 Major capsid protein 1 Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 241000501784 Marinobacter sp. Species 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-N Metaphosphoric acid Chemical compound OP(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-N 0.000 description 1
- 241000204637 Methanohalobium evestigatum Species 0.000 description 1
- 241000192710 Microcystis aeruginosa Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000542065 Moraxella bovoculi Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101000772176 Mus musculus Transthyretin Proteins 0.000 description 1
- 102100031911 NEDD8 Human genes 0.000 description 1
- 108700004934 NEDD8 Proteins 0.000 description 1
- 101150107958 NEDD8 gene Proteins 0.000 description 1
- 241000167284 Natranaerobius Species 0.000 description 1
- 238000011887 Necropsy Methods 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588654 Neisseria cinerea Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 241000919925 Nitrosococcus halophilus Species 0.000 description 1
- 241001515112 Nitrosococcus watsonii Species 0.000 description 1
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 1
- 241001223105 Nodularia spumigena Species 0.000 description 1
- 239000006057 Non-nutritive feed additive Substances 0.000 description 1
- 241000192673 Nostoc sp. Species 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 101100532088 Oryza sativa subsp. japonica RUB2 gene Proteins 0.000 description 1
- 101100532090 Oryza sativa subsp. japonica RUB3 gene Proteins 0.000 description 1
- 241000192520 Oscillatoria sp. Species 0.000 description 1
- 241001386755 Parvibaculum lavamentivorans Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 241000142651 Pelotomaculum thermopropionicum Species 0.000 description 1
- 241000983938 Petrotoga mobilis Species 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical compound CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 description 1
- 241000512220 Polaromonas Species 0.000 description 1
- 241001599925 Polaromonas naphthalenivorans Species 0.000 description 1
- 108010068086 Polyubiquitin Proteins 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- 241000878522 Porphyromonas crevioricanis Species 0.000 description 1
- 241001135219 Prevotella disiens Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000590028 Pseudoalteromonas haloplanktis Species 0.000 description 1
- 108010009413 Pyrophosphatases Proteins 0.000 description 1
- 102000009609 Pyrophosphatases Human genes 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 108010012974 RNA triphosphatase Proteins 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241001063963 Smithella Species 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241001501869 Streptococcus pasteurianus Species 0.000 description 1
- 241001518258 Streptomyces pristinaespiralis Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 101150091380 TTR gene Proteins 0.000 description 1
- 241000206213 Thermosipho africanus Species 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000589892 Treponema denticola Species 0.000 description 1
- 241000078013 Trichormus variabilis Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- PGAVKCOVUIYSFO-XVFCMESISA-N UTP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-XVFCMESISA-N 0.000 description 1
- 101710087750 Ubiquitin-like protein ISG15 Proteins 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- CWRILEGKIAOYKP-SSDOTTSWSA-M [(2r)-3-acetyloxy-2-hydroxypropyl] 2-aminoethyl phosphate Chemical compound CC(=O)OC[C@@H](O)COP([O-])(=O)OCCN CWRILEGKIAOYKP-SSDOTTSWSA-M 0.000 description 1
- 241001673106 [Bacillus] selenitireducens Species 0.000 description 1
- 241001531273 [Eubacterium] eligens Species 0.000 description 1
- OLRONOIBERDKRE-XUTVFYLZSA-N [[(2r,3s,4r,5s)-3,4-dihydroxy-5-(1-methyl-2,4-dioxopyrimidin-5-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 OLRONOIBERDKRE-XUTVFYLZSA-N 0.000 description 1
- AGWRKMKSPDCRHI-UHFFFAOYSA-K [[5-(2-amino-7-methyl-6-oxo-1H-purin-9-ium-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-oxidophosphoryl] [[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-oxidophosphoryl]oxy-5-(6-aminopurin-9-yl)-4-methoxyoxolan-2-yl]methoxy-oxidophosphoryl] phosphate Chemical compound COC1C(OP([O-])(=O)OCC2OC(C(O)C2O)N2C=NC3=C2N=C(N)NC3=O)C(COP([O-])(=O)OP([O-])(=O)OP([O-])(=O)OCC2OC(C(O)C2O)N2C=[N+](C)C3=C2N=C(N)NC3=O)OC1N1C=NC2=C1N=CN=C2N AGWRKMKSPDCRHI-UHFFFAOYSA-K 0.000 description 1
- 229940127024 acid based drug Drugs 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229940011019 arthrospira platensis Drugs 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 241000496058 bacterium ND2006 Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- BBWBEZAMXFGUGK-UHFFFAOYSA-N bis(dodecylsulfanyl)-methylarsane Chemical compound CCCCCCCCCCCCS[As](C)SCCCCCCCCCCCC BBWBEZAMXFGUGK-UHFFFAOYSA-N 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 239000012267 brine Substances 0.000 description 1
- 239000000337 buffer salt Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000001369 canonical nucleoside group Chemical group 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000012062 charged aerosol detection Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 108010041758 cleavase Proteins 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000024203 complement activation Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 210000005258 dental pulp stem cell Anatomy 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 150000001982 diacylglycerols Chemical class 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000002338 electrophoretic light scattering Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012948 formulation analysis Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 229940118764 francisella tularensis Drugs 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 108010064833 guanylyltransferase Proteins 0.000 description 1
- 210000004024 hepatic stellate cell Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000007915 intraurethral administration Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 229960002725 isoflurane Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 210000004731 jugular vein Anatomy 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-L methylphosphonate(2-) Chemical compound CP([O-])([O-])=O YACKEPLHDIMKIO-UHFFFAOYSA-L 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000007837 multiplex assay Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- OYHQOLUKZRVURQ-UHFFFAOYSA-M octadeca-9,12-dienoate Chemical compound CCCCCC=CCC=CCCCCCCCC([O-])=O OYHQOLUKZRVURQ-UHFFFAOYSA-M 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 150000002923 oximes Chemical class 0.000 description 1
- 239000006174 pH buffer Substances 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- YHHSONZFOIEMCP-UHFFFAOYSA-O phosphocholine Chemical compound C[N+](C)(C)CCOP(O)(O)=O YHHSONZFOIEMCP-UHFFFAOYSA-O 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229940012957 plasmin Drugs 0.000 description 1
- 102000028499 poly(A) binding Human genes 0.000 description 1
- 108091023021 poly(A) binding Proteins 0.000 description 1
- 229920001281 polyalkylene Polymers 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- AJAMRCUNWLZBDF-MURFETPASA-N propyl linoleate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(=O)OCCC AJAMRCUNWLZBDF-MURFETPASA-N 0.000 description 1
- AJAMRCUNWLZBDF-UHFFFAOYSA-N propyl octadeca-9,12-dienoate Chemical compound CCCCCC=CCC=CCCCCCCCC(=O)OCCC AJAMRCUNWLZBDF-UHFFFAOYSA-N 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- ZDYVRSLAEXCVBX-UHFFFAOYSA-N pyridinium p-toluenesulfonate Chemical compound C1=CC=[NH+]C=C1.CC1=CC=C(S([O-])(=O)=O)C=C1 ZDYVRSLAEXCVBX-UHFFFAOYSA-N 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 101150024074 rub1 gene Proteins 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-N selenophosphoric acid Chemical compound OP(O)([SeH])=O JRPHGDYSKGJTKZ-UHFFFAOYSA-N 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000013223 sprague-dawley female rat Methods 0.000 description 1
- 238000013222 sprague-dawley male rat Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 108091005946 superfolder green fluorescent proteins Proteins 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 239000010981 turquoise Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N uridine-triphosphate Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/48—Preparations in capsules, e.g. of gelatin, of chocolate
- A61K9/50—Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
- A61K9/51—Nanocapsules; Nanoparticles
- A61K9/5107—Excipients; Inactive ingredients
- A61K9/5123—Organic compounds, e.g. fats, sugars
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/88—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0019—Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/10—Dispersions; Emulsions
- A61K9/127—Liposomes
- A61K9/1271—Non-conventional liposomes, e.g. PEGylated liposomes, liposomes coated with polymers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/10—Dispersions; Emulsions
- A61K9/127—Liposomes
- A61K9/1271—Non-conventional liposomes, e.g. PEGylated liposomes, liposomes coated with polymers
- A61K9/1272—Non-conventional liposomes, e.g. PEGylated liposomes, liposomes coated with polymers with substantial amounts of non-phosphatidyl, i.e. non-acylglycerophosphate, surfactants as bilayer-forming substances, e.g. cationic lipids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/321—2'-O-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/346—Spatial arrangement of the modifications having a combination of backbone and sugar modifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/352—Nature of the modification linked to the nucleic acid via a carbon atom
- C12N2310/3521—Methyl
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/32—Special delivery means, e.g. tissue-specific
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Dispersion Chemistry (AREA)
- Nanotechnology (AREA)
- Optics & Photonics (AREA)
- Dermatology (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicinal Preparation (AREA)
Abstract
본 발명은 생물학적 활성제의 전달을 위한 개선된 특성을 갖는 지질 나노입자-기반 조성물, 조작된 세포, 및 작용제의 전달 방법을 제공한다.
Description
본 출원은 2017년 9월 29일자로 출원된 미국 특허 가출원 제62/566,240호의 우선권의 이익을 주장하며, 그 내용은 전문이 본원에 참조로 포함된다.
생물학적 활성제, 특히 RNA, mRNA, 및 가이드 RNA의 전달을 위한 개선된 특성을 갖는 지질 나노입자("LNP") 조성물이 본원에 제공된다. LNP 조성물은 세포막을 가로질러 RNA 작용제의 전달을 용이하게 하고, 특정 구체예에서, 이들은 유전자 편집을 위한 성분 및 조성물을 살아있는 세포에 주입한다.
세포에 전달하기에 특히 어려운 생물학적 활성제는 단백질, 핵산계 약물, 및 이의 유도체를 포함한다. CRISPR/Cas9 시스템 성분의 전달을 위한 것과 같은 유망한 유전자 편집 기술을 세포에 전달하기 위한 조성물이 특히 관심사이다.
생체 내 세포에서 유전자를 편집하기 위한 다수의 성분 및 시스템이 현재 존재하며, 질병 치료를 위한 큰 잠재력을 제공한다. CRISPR/Cas 유전자 편집 시스템은 세포에서 리보핵산단백질 복합체로서 활성이다. RNA-지시된 뉴클레이스는 세포에서 DNA 서열에 결합하고 절단을 지시한다. 이러한 위치-특이적 뉴클레이스 활성은 세포 자체의 자연적 과정을 통해 유전자 편집을 용이하게 한다. 예를 들어, 세포는 비상동 말단 연결(non-homologous end joining, "NHEJ")으로 알려진 오류가 발생하기 쉬운 복구 과정으로써 이중-가닥 DNA 절단(double-stranded DNA break, DSB)에 반응한다. NHEJ 동안, 뉴클레오타이드는 세포에 의해 DNA 말단에서 첨가되거나 제거되어 절단된 서열로부터 변경된 서열을 생성할 수 있다. 다른 상황에서, 세포는 상동성-지시 복구(homology-directed repair, "HDR") 또는 상동 재조합(homologous recombination, "HR") 메커니즘에 의해 DSB를 복구하고, 여기서 내인성 또는 외인성 주형이 절단의 직접 복구에 사용될 수 있다. 이들 편집 기술 중 몇 가지는 단일-가닥 절단(single-stranded break, SSB) 또는 DSB 복구를 위한 세포 메커니즘을 이용한다.
CRISPR/Cas의 단백질 및 핵산 성분을 세포, 예컨대 환자의 세포에 전달하기 위한 조성물이 필요하다. 특히, CRISPR 단백질 성분을 인코딩하는 mRNA를 전달하고, CRISPR 가이드 RNA를 전달하기 위한 조성물이 특히 관심사이다. RNA 성분을 안정화하고 전달할 수 있는 시험관내 및 생체내 전달을 위한 유용한 특성을 갖는 조성물이 또한 특히 관심사이다.
본 발명자들은 본원에서 특히 CRISPR/Cas 유전자 편집 성분의 전달을 위한 유용한 특성을 갖는 지질 나노입자-기반 조성물을 제공한다.
특정 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 50-60 mol-% 아민 지질; (2) 약 8-10 mol-% 중성 지질; 및 (3) 약 2.5-4 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 6이다. 추가적인 구체예에서, LNP 조성물은 (1) RNA 성분; (2) 약 50-60 mol-% 아민 지질; (3) 약 27-39.5 mol-% 헬퍼 지질; (4) 약 8-10 mol-% 중성 지질; 및 (5) 약 2.5-4 mol-% PEG 지질을 포함하고, 여기서 LNP 조성물의 N/P 비율은 약 5-7이다.
다른 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 50-60 mol-% 아민 지질; (2) 약 5-15 mol-% 중성 지질; 및 (3) 약 2.5-4 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이다. 추가적인 구체예에서, LNP 조성물은 (1) 약 40-60 mol-% 아민 지질; (2) 약 5-15 mol-% 중성 지질; 및 (3) 약 2.5-4 mol-% PEG 지질을 포함하는 지질 성분을 포함하고, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 6이다. 또 다른 구체예에서, LNP 조성물은 (1) 약 50-60 mol-% 아민 지질; (2) 약 5-15 mol-% 중성 지질; 및 (3) 약 1.5-10 mol-% PEG 지질을 포함하는 지질 성분을 포함하고, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 6이다.
일부 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 40-60 mol-% 아민 지질; (2) 약 0-5 mol-% 중성 지질, 예를 들어, 인지질; 및 (3) 약 1.5-10 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이다. 일부 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 40-60 mol-% 아민 지질; (2) 약 1 mol-% 미만의 중성 지질, 예를 들어, 인지질; 및 (3) 약 1.5-10 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이다. 특정 구체예에서, LNP 조성물에는 중성 지질이 본질적으로 없다. 일부 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 40-60 mol-% 아민 지질; 및 (2) 약 1.5-10 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이고, 여기서 LNP 조성물에는 중성 지질, 예를 들어, 인지질이 없다. 특정 구체예에서, LNP 조성물에는 중성 인지질이 없거나 본질적으로 없다. 특정 구체예에서, LNP 조성물에는 중성 지질, 예를 들어, 인지질이 없거나 본질적으로 없다.
특정 구체예에서, RNA 성분은 mRNA, 예컨대 RNA-유도 DNA-결합제(예를 들어, Cas 뉴클레이스 또는 클래스 2 Cas 뉴클레이스)를 포함한다. 특정 구체예에서, RNA 성분은 gRNA를 포함한다.
도 1은 1 mpk(도 1A) 또는 0.5 mpk(도 1B)의 단일 용량으로 나타난 LNP 조성물 중의 CRISPR/Cas 유전자 편집 성분 Cas9 mRNA 및 gRNA의 전달 후 마우스 간에서 달성된 TTR 유전자 편집의 백분율을 나타낸다.
도 2는 Cas9 mRNA 및 gRNA를 포함하는 LNP 조성물에 대한 입자 분포 데이터를 나타낸다.
도 3은 조성물에 대한 로그 미분 몰질량(도 3A) 및 평균 분자량 측정치(도 3B)을 비교하는 LNP 조성물의 물리화학적 특성을 나타낸다.
도 4는 도 3의 LNP 조성물을 분석하여, 도 4A에서 다분산도 계산을 나타내고 도 4B에서 Burchard-Stockmeyer 분석을 나타낸다.
도 5는 래트에서 단일 용량 투여 후 혈청 TTR 녹다운, 간에서의 유전자 편집, 및 사이토카인 MCP-1 수준에 대하여 PEG 지질 농도가 증가된 LNP 조성물의 효과를 평가한 실험 결과를 제공한다. 도 5A는 혈청 TTR 수준을 그래프로 나타내며; 도 5B는 간 샘플에서의 편집 퍼센트를 그래프로 나타내며; 도 5C는 pg/mL로 MCP-1 수준을 제공한다.
도 6은 LNP 조성물이 다양한 PEG 지질을 사용한 유전자 편집에 대해 효능을 유지함을 나타낸다 (혈청 TTR 수준에 의해 측정됨 (도 6A 및 6B) 및 편집 퍼센트 (도 6C).
도 7은 지질 A 유사체가 마우스에서 단일 용량 투여 후 간 편집 %에 의해 측정된 바와 같이 LNP 조성물에서 유전자 편집 카르고를 효과적으로 전달함을 나타낸다.
도 8은 일차 시노 간세포에서 다양한 LNP 조성물을 사용한 편집 퍼센트의 용량 반응 곡선을 나타낸다.
도 9A 및 도 9B는 gRNA 대 mRNA의 비율이 변하는 경우 혈청 TTR 및 편집 퍼센트 결과를 나타내고, 도 9C 및 도 9D는 Cas9 mRNA의 양이 일정하게 유지되고 gRNA가 마우스에서 단일 용량 투여 후 변하는 경우 간에서의 혈청 TTR 및 편집 퍼센트 결과를 나타낸다.
도 10A 및 도 10B는 중성 지질을 포함하는 및 포함하지 않는 LNP 조성물의 투여 후 혈청 TTR 및 간 편집 결과를 나타낸다.
도 2는 Cas9 mRNA 및 gRNA를 포함하는 LNP 조성물에 대한 입자 분포 데이터를 나타낸다.
도 3은 조성물에 대한 로그 미분 몰질량(도 3A) 및 평균 분자량 측정치(도 3B)을 비교하는 LNP 조성물의 물리화학적 특성을 나타낸다.
도 4는 도 3의 LNP 조성물을 분석하여, 도 4A에서 다분산도 계산을 나타내고 도 4B에서 Burchard-Stockmeyer 분석을 나타낸다.
도 5는 래트에서 단일 용량 투여 후 혈청 TTR 녹다운, 간에서의 유전자 편집, 및 사이토카인 MCP-1 수준에 대하여 PEG 지질 농도가 증가된 LNP 조성물의 효과를 평가한 실험 결과를 제공한다. 도 5A는 혈청 TTR 수준을 그래프로 나타내며; 도 5B는 간 샘플에서의 편집 퍼센트를 그래프로 나타내며; 도 5C는 pg/mL로 MCP-1 수준을 제공한다.
도 6은 LNP 조성물이 다양한 PEG 지질을 사용한 유전자 편집에 대해 효능을 유지함을 나타낸다 (혈청 TTR 수준에 의해 측정됨 (도 6A 및 6B) 및 편집 퍼센트 (도 6C).
도 7은 지질 A 유사체가 마우스에서 단일 용량 투여 후 간 편집 %에 의해 측정된 바와 같이 LNP 조성물에서 유전자 편집 카르고를 효과적으로 전달함을 나타낸다.
도 8은 일차 시노 간세포에서 다양한 LNP 조성물을 사용한 편집 퍼센트의 용량 반응 곡선을 나타낸다.
도 9A 및 도 9B는 gRNA 대 mRNA의 비율이 변하는 경우 혈청 TTR 및 편집 퍼센트 결과를 나타내고, 도 9C 및 도 9D는 Cas9 mRNA의 양이 일정하게 유지되고 gRNA가 마우스에서 단일 용량 투여 후 변하는 경우 간에서의 혈청 TTR 및 편집 퍼센트 결과를 나타낸다.
도 10A 및 도 10B는 중성 지질을 포함하는 및 포함하지 않는 LNP 조성물의 투여 후 혈청 TTR 및 간 편집 결과를 나타낸다.
상세한 설명
본 발명은 세포로의 전달을 위한 CRISPR/Cas 성분 RNA("카르고")를 포함하는 RNA의 지질 나노입자(LNP) 조성물의 구체예 및 이의 사용 방법을 제공한다. LNP 조성물은 이전의 전달 기술과 비교하여 개선된 특성을 나타낼 수 있다. LNP 조성물은 본원에 정의된 바와 같은 RNA 성분 및 지질 성분을 함유할 수 있다. 특정 구체예에서, RNA 성분은 Cas 뉴클레이스, 예컨대 클래스 2 Cas 뉴클레이스를 포함한다. 특정 구체예에서, 카르고 또는 RNA 성분은 클래스 2 Cas 뉴클레이스를 인코딩하는 mRNA 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 핵산을 포함한다. 유전자 편집 방법 및 조작된 세포 제조 방법이 또한 제공된다.
CRISPR/Cas 카르고
LNP 제제를 통해 전달된 CRISPR/Cas 카르고는 관심 단백질을 인코딩하는 mRNA 분자를 포함할 수 있다. 예를 들어, 녹색 형광 단백질(green fluorescent protein, GFP)과 같은 단백질, 및 RNA-유도 DNA-결합제, 또는 Cas 뉴클레이스를 발현시키기 위한 mRNA가 포함된다. Cas9 단백질의 세포에서의 발현을 허용하는 Cas 뉴클레이스 mRNA, 예를 들어 클래스 2 Cas 뉴클레이스 mRNA를 포함하는 LNP 조성물이 제공된다. 또한, 카르고는 하나 이상의 가이드 RNA 또는 가이드 RNA를 인코딩하는 핵산을 포함할 수 있다. 예를 들어 복구 또는 재조합을 위한 주형 핵산이 조성물에 포함될 수 있거나 주형 핵산이 본원에 기재된 방법에서 사용될 수 있다.
"mRNA"는 폴리펩타이드로 번역될 수 있는 (즉, 리보솜 및 아미노-아실화 tRNA에 의한 번역을 위한 기질로서 작용할 수 있는) 오픈 리딩 프레임을 포함하는 폴리뉴클레오타이드를 지칭한다. mRNA는 리보스 잔기 또는 이의 유사체, 예를 들어, 2'-메톡시 리보스 잔기를 포함하는 포스페이트-당 골격을 포함할 수 있다. 일부 구체예에서, mRNA 포스페이트-당 골격의 당은 리보스 잔기, 2'-메톡시 리보스 잔기, 또는 이들의 조합으로 본질적으로 구성된다. 일반적으로, mRNA는 상당한 양의 티미딘 잔기를 포함하지 않는다 (예를 들어, 0 잔기 또는 30, 20, 10, 5, 4, 3, 또는 2 미만 티미딘 잔기; 또는 10%, 9%, 8%, 7%, 6%, 5%, 4%, 4%, 3%, 2%, 1%, 0.5%, 0.2%, 또는 0.1% 미만 티미딘 함량). mRNA는 이의 우리딘 위치의 일부 또는 전부에서 변형된 우리딘을 포함할 수 있다.
CRISPR/Cas 뉴클레이스 시스템
개시된 제제의 한 성분은 Cas 뉴클레이스와 같은 RNA-유도 DNA-결합제를 인코딩하는 mRNA이다.
본원에서 사용된 "RNA-유도 DNA 결합제"는 RNA 및 DNA 결합 활성을 갖는 폴리펩타이드 또는 폴리펩타이드의 복합체, 또는 그러한 복합체의 DNA-결합 서브유닛을 의미하고, 여기서 DNA 결합 활성은 서열-특이적이고 RNA의 서열에 의존한다. 예시적인 RNA-유도 DNA 결합제는 Cas 클리베이스/닉케이스 및 이의 불활성화 형태("dCas DNA 결합제")를 포함한다. 본원에서 사용된 "Cas 뉴클레이스"는 Cas 클리베이스(cleavase), Cas 닉케이스(nickase), 및 dCas DNA 결합제를 포함한다. Cas 클리베이스/닉케이스 및 dCas DNA 결합제는 타입 III CRISPR 시스템의 Csm 또는 Cmr 복합체, 이의 Cas10, Csm1, 또는 Cmr2 서브유닛, 타입 I CRISPR 시스템의 캐스케이드 복합체, 이의 Cas3 서브유닛, 및 클래스 2 Cas 뉴클레이스를 포함한다. 본원에서 사용된 "클래스 2 Cas 뉴클레이스"는 RNA-유도 DNA 결합 활성을 갖는 단일-사슬 폴리펩타이드이다. 클래스 2 Cas 뉴클레이스는 RNA-유도 DNA 클리베이스 또는 닉케이스 활성을 추가로 갖는 클래스 2 Cas 클리베이스/닉케이스(예를 들어, H840A, D10A, 또는 N863A 변이체), 및 클리베이스/닉케이스 활성이 불활성화되는 클래스 2 dCas DNA 결합제를 포함한다. 클래스 2 Cas 뉴클레이스는, 예를 들어, Cas9, Cpf1, C2c1, C2c2, C2c3, HF Cas9 (예를 들어, N497A, R661A, Q695A, Q926A 변이체), HypaCas9 (예를 들어, N692A, M694A, Q695A, H698A 변이체), eSPCas9(1.0) (예를 들어, K810A, K1003A, R1060A 변이체), 및 eSPCas9(1.1) (예를 들어, K848A, K1003A, R1060A 변이체) 단백질 및 이의 변형을 포함한다. Cpf1 단백질은, Zetsche et al., Cell, 163: 1-13 (2015), Cas9에 상동성이며, RuvC-유사 뉴클레이스 도메인을 포함한다. Zetsche의 Cpf1 서열은 그 전체가 참조로 포함된다. 예를 들어, Zetsche, 표 S1 및 S3을 참조하라. 예를 들어, Makarova et al., Nat Rev Microbiol, 13(11): 722-36 (2015); Shmakov et al., Molecular Cell, 60:385-397 (2015)를 참조하라.
일부 구체예에서, RNA-유도 DNA-결합제는 클래스 2 Cas 뉴클레이스이다. 일부 구체예에서, RNA-유도 DNA-결합제는 이중-가닥 엔도뉴클레이스 활성으로도 지칭될 수 있는 클리베이스 활성을 갖는다. 일부 구체예에서, RNA-유도 DNA-결합제는 Cas 뉴클레이스, 예컨대 클래스 2 Cas 뉴클레이스를 포함한다 (이는, 예를 들어, 타입 II, V, 또는 VI의 Cas 뉴클레이스일 수 있다). 클래스 2 Cas 뉴클레이스는, 예를 들어, Cas9, Cpf1, C2c1, C2c2, 및 C2c3 단백질 및 이의 변형을 포함한다. Cas9 뉴클레이스의 예는 S. 피오게네스, S. 아우레우스, 및 다른 원핵생물(예를 들어, 다음 단락의 목록 참조)의 타입 II CRISPR 시스템, 및 이의 변형된 (예를 들어, 조작된 또는 돌연변이) 버전을 포함한다. 예를 들어, U.S. 2016/0312198 A1; U.S. 2016/0312199 A1을 참조하라. Cas 뉴클레이스의 다른 예는 타입 III CRISPR 시스템의 Csm 또는 Cmr 복합체 또는 이의 Cas10, Csm1, 또는 Cmr2 서브유닛; 및 타입 I CRISPR 시스템의 캐스케이드 복합체, 또는 이의 Cas3 서브유닛을 포함한다. 일부 구체예에서, Cas 뉴클레이스는 타입-IIA, 타입-IIB, 또는 타입-IIC 시스템으로부터 유래할 수 있다. 다양한 CRISPR 시스템 및 Cas 뉴클레이스에 대한 논의에 대해서는, 예를 들어, Makarova et al., Nat. Rev. Microbiol. 9:467-477 (2011); Makarova et al., Nat. Rev. Microbiol, 13: 722-36 (2015); Shmakov et al., Molecular Cell, 60:385-397 (2015)를 참조하라.
Cas 뉴클레이스가 유도될 수 있는 비제한적인 예시적인 종은 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 스트렙토코쿠스 써모필루스(Streptococcus thermophilus), 스트렙토코쿠스 종, 스타필로코쿠스 아우레우스(Staphylococcus aureus), 리스테리아 이노쿠아(Listeria innocua), 락토바실루스 가세리(Lactobacillus gasseri), 프란시셀라 노비시다(Francisella novicida), 월리넬라 석시노제네스(Wolinella succinogenes), 서터렐라 와드스워텐시스(Sutterella wadsworthensis), 감마프로테오박테리움(Gammaproteobacterium), 네이세리아 메닝티디스(Neisseria meningitidis), 캠필로박터 제주니(Campylobacter jejuni), 파스테우렐라 물토시다(Pasteurella multocida), 피브로박터 석시노젠(Fibrobacter succinogene), 로도스피릴럼 러브럼(Rhodospirillum rubrum), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토미세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토미세스 비리도크로모제네스(Streptomyces viridochromogenes), 스트렙토미세스 비리도크로모제네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리시클로바실루스 아시도칼다리우스(Alicyclobacillus acidocaldarius), 바실루스 슈도미코이데스(Bacillus pseudomycoides), 바실루스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시시리컴(Exiguobacterium sibiricum), 락토바실루스 델브루에키(Lactobacillus delbrueckii), 락토바실루스 살리바리우스(Lactobacillus salivarius), 락토바실루스 부크네리(Lactobacillus buchneri), 트레포네마 덴티콜라(Treponema denticola), 미크로실라 마리나(Microscilla marina), 버크홀데리알레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 종, 크로코스페라 왓소니(Crocosphaera watsonii), 시아노테세 종(Cyanothece sp.), 미크로시스티스 에루지노사(Microcystis aeruginosa), 시네초코쿠스 종(Synechococcus sp.), 아세토할로비움 아라박티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시(Ammonifex degensii), 칼디셀룰로시룹토르 베크시(Caldicelulosiruptor becscii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리디움 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에오비스 써모필루스(Natranaerobius thermophilus), 펠로토마쿨룸 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실루스 칼두스(Acidithiobacillus caldus), 아시디티오바실루스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박테르 종(Marinobacter sp.), 니트로소코쿠스 할로필루스(Nitrosococcus halophilus), 니트로소코쿠스 와트소니(Nitrosococcus watsoni), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나바에나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스토크 종(Nostoc sp.), 아르트로스피라 막시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 종(Arthrospira sp.), 링비아 종(Lyngbya sp.), 미크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 종(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus), 스트렙토코쿠스 파스테우리아누스(Streptococcus pasteurianus), 네이세리아 시네레아(Neisseria cinerea), 캄필로박테르 라리(Campylobacter lari), 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 아시다미노코쿠스 종(Acidaminococcus sp.), 라크노스피라세 박테리움(Lachnospiraceae bacterium) ND2006, 및 아카리오클로리스 마리나(Acaryochloris marina)를 포함한다.
일부 구체예에서, Cas 뉴클레이스는 스트렙토코쿠스 피오게네스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 스트렙토코쿠스 써모필루스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 네이세리아 메닝티디스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 스타필로코쿠스 아우레우스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 프란시셀라 노비시다의 Cpf1 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 아시다미노코쿠스 종의 Cpf1 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 라크노스피라세 박테리움 ND2006의 Cpf1 뉴클레이스이다. 추가의 구체예에서, Cas 뉴클레이스는 프란시셀라 툴라렌시스(Francisella tularensis), 라크노스피라세 박테리움(Lachnospiraceae bacterium), 부티리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 페레그리니박테리움(Peregrinibacteria bacterium), 파르쿠박테리아 박테리움(Parcubacteria bacterium), 스미텔라(Smithella), 아시다미노코쿠스(Acidaminococcus), 칸디다투스 메타노플라스마 테르미툼(Candidatus Methanoplasma termitum), 에우박테리움 엘리겐스(Eubacterium eligens), 모락셀라 보보쿨리(Moraxella bovoculi), 렙토스피라 이나다이(Leptospira inadai), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디시엔스(Prevotella disiens), 또는 포르피로모나스 마카카에(Porphyromonas macacae)의 Cpf1 뉴클레이스이다. 특정 구체예에서, Cas 뉴클레이스는 아시다미노코쿠스 또는 라크노스피라세의 Cpf1 뉴클레이스이다.
야생형 Cas9는 두 가지 뉴클레이스 도메인: RuvC 및 HNH를 갖는다. RuvC 도메인은 비표적 DNA 가닥을 절단하고, HNH 도메인은 DNA의 표적 가닥을 절단한다. 일부 구체예에서, Cas9 뉴클레이스는 하나 초과의 RuvC 도메인 및/또는 하나 초과의 HNH 도메인을 포함한다. 일부 구체예에서, Cas9 뉴클레이스는 야생형 Cas9이다. 일부 구체예에서, Cas9는 표적 DNA에서 이중 가닥 파괴를 유도할 수 있다. 특정 구체예에서, Cas 뉴클레이스는 dsDNA를 절단할 수 있거나, dsDNA의 한 가닥을 절단할 수 있거나, 또는 DNA 클리베이스 또는 닉케이스 활성을 갖지 않을 수 있다. 예시적인 Cas9 아미노산 서열은 서열 식별 번호: 3으로 제공된다. 개시 및 종결 코돈을 포함하는 예시적인 Cas9 mRNA ORF 서열은 서열 식별 번호: 4로 제공된다. 융합 단백질에 포함시키기에 적합한 예시적인 Cas9 mRNA 코딩 서열은 서열 식별 번호: 10으로 제공된다.
일부 구체예에서, 키메라 Cas 뉴클레이스가 사용되는데, 여기서 단백질의 한 도메인 또는 영역이 다른 단백질의 일부에 의해 대체된다. 일부 구체예에서, Cas 뉴클레이스 도메인은 Fok1과 같은 다른 뉴클레이스의 도메인으로 대체될 수 있다. 일부 구체예에서, Cas 뉴클레이스는 변형된 뉴클레이스일 수 있다.
다른 구체예에서, Cas 뉴클레이스는 타입-I CRISPR/Cas 시스템으로부터 유래될 수 있다. 일부 구체예에서, Cas 뉴클레이스는 타입-I CRISPR/Cas 시스템의 캐스케이드 복합체의 성분일 수 있다. 일부 구체예에서, Cas 뉴클레이스는 Cas3 단백질일 수 있다. 일부 구체예에서, Cas 뉴클레이스는 타입-III CRISPR/Cas 시스템으로부터 유래될 수 있다. 일부 구체예에서, Cas 뉴클레이스는 RNA 절단 활성을 가질 수 있다.
일부 구체예에서, RNA-유도 DNA-결합제는 단일-가닥 닉케이스 활성을 가지는데, 즉, 하나의 DNA 가닥을 절단하여 "닉(nick)"으로도 알려진 단일-가닥 절단을 생성할 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 Cas 닉케이스를 포함한다. 닉케이스는 dsDNA에서 닉을 생성하는, 즉, 한 가닥을 절단하지만 DNA 이중 나선의 다른 가닥을 절단하지 않는 효소이다. 일부 구체예에서, Cas 닉케이스는 엔도뉴클레이스 활성 자리가, 예를 들어, 촉매 도메인에서 하나 이상의 변경(예를 들어, 점 돌연변이)에 의해 불활성화된 Cas 뉴클레이스(예를 들어, 위에서 논의된 Cas 뉴클레이스)의 버전이다. Cas 닉케이스 및 예시적인 촉매 도메인 변경의 논의에 대해 예를 들어, 미국 특허 제8,889,356호를 참조하라. 일부 구체예에서, Cas 닉케이스 예컨대 Cas9 닉케이스는 불활성화 RuvC 또는 HNH 도메인을 갖는다. 예시적인 Cas9 닉케이스 아미노산 서열은 서열 식별 번호: 6으로 제공된다. 개시 및 종결 코돈을 포함하는 예시적인 Cas9 닉케이스 mRNA ORF 서열은 서열 식별 번호: 7로 제공된다. 융합 단백질에 포함시키기에 적합한 예시적인 Cas9 닉케이스 mRNA 코딩 서열은 서열 식별 번호: 11로 제공된다.
일부 구체예에서, RNA-유도 DNA-결합제는 하나의 기능성 뉴클레이스 도메인만을 포함하도록 변형된다. 예를 들어, 작용제 단백질은 핵산 절단 활성을 감소시키기 위해 뉴클레이스 도메인 중 하나가 돌연변이되거나 완전히 또는 부분적으로 결손되도록 변형될 수 있다. 일부 구체예에서, 활성이 감소된 RuvC 도메인을 갖는 닉케이스가 사용된다. 일부 구체예에서, 불활성 RuvC 도메인을 갖는 닉케이스가 사용된다. 일부 구체예에서, 활성이 감소된 HNH 도메인을 갖는 닉케이스가 사용된다. 일부 구체예에서, 불활성 HNH 도메인을 갖는 닉케이스가 사용된다.
일부 구체예에서, Cas 단백질 뉴클레이스 도메인 내의 보존된 아미노산은 뉴클레이스 활성을 감소시키거나 변경시키기 위해 치환된다. 일부 구체예에서, Cas 뉴클레이스는 RuvC 또는 RuvC-유사 뉴클레이스 도메인에 아미노산 치환을 포함할 수 있다. RuvC 또는 RuvC-유사 뉴클레이스 도메인 중의 예시적인 아미노산 치환은 (S. 피오게네스 Cas9 단백질에 기초한) D10A를 포함한다. 예를 들어, Zetsche et al. (2015) Cell Oct 22:163(3): 759-771을 참조하라. 일부 구체예에서, Cas 뉴클레이스는 HNH 또는 HNH-유사 뉴클레이스 도메인에 아미노산 치환을 포함할 수 있다. HNH 또는 HNH-유사 뉴클레이스 도메인 중의 예시적인 아미노산 치환은 (S. 피오게네스 Cas9 단백질에 기초한) E762A, H840A, N863A, H983A, 및 D986A를 포함한다. 예를 들어, Zetsche et al. (2015)를 참조하라. 추가의 예시적인 아미노산 치환은 (프란시셀라 노비시다 U112 Cpf1 (FnCpf1) 서열 (UniProtKB - A0Q7Q2 (CPF1_FRATN)에 기초한) D917A, E1006A, 및 D1255A를 포함한다.
일부 구체예에서, 닉케이스를 인코딩하는 mRNA는 각각 표적 서열의 센스 및 안티센스 가닥에 상보적인 한 쌍의 가이드 RNA와 조합하여 제공된다. 이 구체예에서, 가이드 RNA는 닉케이스를 표적 서열로 안내하고 표적 서열의 반대 가닥에 닉을 생성하여 DSB를 도입한다 (즉, 이중 닉킹). 일부 구체예에서, 이중 닉킹의 사용은 특이성을 개선하고 비표적(off-target) 효과를 감소시킬 수 있다. 일부 구체예에서, 닉케이스는 표적 DNA에서 이중 닉을 생성하기 위해 DNA의 반대편 가닥을 표적으로 하는 두 개의 개별 가이드 RNA와 함께 사용된다. 일부 구체예에서, 닉케이스는 표적 DNA에서 이중 닉을 생성하기 위해 근접하게 선택되는 두 개의 개별 가이드 RNA와 함께 사용된다.
일부 구체예에서, RNA-유도 DNA-결합제에는 클리베이스 및 닉케이스 활성이 결여되어 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 dCas DNA-결합 폴리펩타이드를 포함한다. dCas 폴리펩타이드는 DNA-결합 활성을 가지면서도 촉매 (클리베이스/닉케이스) 활성이 본질적으로 결여되어 있다. 일부 구체예에서, dCas 폴리펩타이드는 dCas9 폴리펩타이드이다. 일부 구체예에서, 클리베이스 및 닉케이스 활성이 결여된 RNA-유도 DNA-결합제 또는 dCas DNA-결합 폴리펩타이드는 엔도뉴클레이스 활성 자리가, 예를 들어, 촉매 도메인에서 하나 이상의 변경(예를 들어, 점 돌연변이)에 의해 불활성화된 Cas 뉴클레이스(예를 들어, 위에서 논의된 Cas 뉴클레이스)의 버전이다. 예를 들어, U.S. 2014/0186958 A1; U.S. 2015/0166980 A1을 참조하라. 예시적인 dCas9 아미노산 서열은 서열 식별 번호: 8로 제공된다. 개시 및 종결 코돈을 포함하는 예시적인 Cas9 mRNA ORF 서열은 서열 식별 번호: 9로 제공된다. 융합 단백질에 포함시키기에 적합한 예시적인 Cas9 mRNA 코딩 서열은 서열 식별 번호: 12로 제공된다.
일부 구체예에서, RNA-유도 DNA-결합제는 하나 이상의 이종 기능성 도메인을 포함한다 (예를 들어, 융합 폴리펩타이드이거나 이를 포함한다).
일부 구체예에서, 이종 기능성 도메인은 세포의 핵으로 RNA-유도 DNA-결합제의 수송을 용이하게 할 수 있다. 예를 들어, 이종 기능성 도메인은 핵 위치 신호(nuclear localization signal, NLS)일 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 1-10 개의 NLS(들)와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 1-5 개의 NLS(들)와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 하나의 NLS와 융합될 수 있다. 하나의 NLS가 사용되는 경우, NLS는 RNA-유도 DNA-결합제 서열의 N-말단 또는 C-말단에 연결될 수 있다. 이는 또한 RNA-유도 DNA 결합제 서열 내에 삽입될 수 있다. 다른 구체예에서, RNA-유도 DNA-결합제는 하나 초과의 NLS와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 2, 3, 4, 또는 5 개의 NLS와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 두 개의 NLS와 융합될 수 있다. 특정 구체예에서, 두 개의 NLS은 동일하거나 (예를 들어, 두 개의 SV40 NLS) 상이할 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 카르복시 말단에서 연결된 두 개의 SV40 NLS 서열에 융합된다. 일부 구체예에서, RNA-유도 DNA-결합제는 두 개의 NLS와 융합될 수 있으며, 하나는 N-말단에, 하나는 C-말단에 연결된다. 일부 구체예에서, RNA-유도 DNA-결합제는 3 개의 NLS와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 NLS와 융합되지 않을 수 있다. 일부 구체예에서, NLS는 예를 들어, SV40 NLS, PKKKRKV 또는 PKKKRRV와 같은 단일부분 서열일 수 있다. 일부 구체예에서, NLS는 핵플라스민의 NLS, KRPAATKKAGQAKKKK과 같은 이부분 서열일 수 있다. 특정 구체예에서, 단일 PKKKRKV NLS는 RNA-유도 DNA-결합제의 C-말단에 연결될 수 있다. 하나 이상의 링커가 융합 자리에 임의로 포함된다.
일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA 결합제의 세포내 반감기를 변경시킬 수 있다. 일부 구체예에서, RNA-유도 DNA 결합제의 반감기는 증가될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제의 반감기는 감소될 수 있다. 일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제의 안정성을 증가시킬 수 있다. 일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제의 안정성을 감소시킬 수 있다. 일부 구체예에서, 이종 기능성 도메인은 단백질 분해를 위한 신호 펩타이드로서 작용할 수 있다. 일부 구체예에서, 단백질 분해는, 예를 들어, 프로테아솜, 리소좀 프로테이스, 또는 칼페인 프로테이스와 같은 단백질분해 효소에 의해 매개될 수 있다. 일부 구체예에서, 이종 기능성 도메인은 PEST 서열을 포함할 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 유비퀴틴 또는 폴리유비퀴틴 사슬의 첨가에 의해 변형될 수 있다. 일부 구체예에서, 유비퀴틴은 유비퀴틴-유사 단백질(UBL)일 수 있다. 유비퀴틴-유사 단백질의 비제한적 예는 소형 유비퀴틴-유사 변형제(SUMO), 유비퀴틴 교차-반응성 단백질(UCRP, 인터페론-자극 유전자-15(ISG15)로도 알려짐), 유비퀴틴-관련 변형제-1(URM1), 뉴런-전구체-세포-발현 발달 하향조절된 단백질-8(NEDD8, S. 세레비시아에서 Rub1로도 지칭됨), 인간 백혈구 항원 F-관련(FAT10), 자가포식-8(ATG8) 및 -12(ATG12), Fau 유비퀴틴-유사 단백질(FUB1), 막-고정 UBL(MUB), 유비퀴틴 폴드-변형제 -1(UFM1), 및 유비퀴틴-유사 단백질-5(UBL5)를 포함한다.
일부 구체예에서, 이종 기능성 도메인은 마커 도메인일 수 있다. 마커 도메인의 비제한적 예는 형광 단백질, 정제 태그, 에피토프 태그, 및 리포터 유전자 서열을 포함한다. 일부 구체예에서, 마커 도메인은 형광 단백질일 수 있다. 적합한 형광 단백질의 비제한적 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, tagGFP, turboGFP, sfGFP, EGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreen1), 황색 형광 단백질(예를 들어, YFP, EYFP, Citrine, Venus, YPet, PhiYFP, ZsYellow1), 청색 형광 단백질(예를 들어, EBFP, EBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire,), 청록색 형광 단백질(예를 들어, ECFP, Cerulean, CyPet, AmCyan1, Midoriishi-Cyan), 적색 형광 단백질(예를 들어, mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRed1, AsRed2, eqFP611, mRasberry, mStrawberry, Jred), 및 주황색 형광 단백질(mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) 또는 임의의 다른 적합한 형광 단백질을 포함한다. 다른 구체예에서, 마커 도메인은 정제 태그 및/또는 에피토프 태그일 수있다. 비제한적인 예시적인 태그는 글루타티온-S-트랜스퍼레이스(GST), 키틴 결합 단백질(CBP), 말토스 결합 단백질(MBP), 티오레독신(TRX), 폴리(NANP), 탠덤 친화성 정제(TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 6xHis, 8xHis, 비오틴 카르복실 담체 단백질(BCCP), 폴리-His, 및 칼모둘린을 포함한다. 비제한적인 예시적인 리포터 유전자는 글루타치온-S-트랜스퍼레이스(GST), 홀스래디쉬 퍼옥시데이스(HRP), 클로람페니콜 아세틸트랜스퍼레이스(CAT), 베타-갈락토시데이스, 베타-글루쿠로니데이스, 루시퍼레이스, 또는 형광 단백질을 포함한다.
추가적인 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제를 특정 소기관, 세포 유형, 조직, 또는 기관에 표적화할 수 있다. 일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제를 미토콘드리아에 표적화할 수 있다.
추가의 구체예에서, 이종 기능성 도메인은 이펙터 도메인일 수 있다. RNA-유도 DNA-결합제가 이의 표적 서열에 지시될 경우, 예를 들어, Cas 뉴클레이스가 gRNA에 의해 표적 서열에 지시될 경우, 이펙터 도메인은 표적 서열을 변형시키거나 이에 영향을 미칠 수 있다. 일부 구체예에서, 이펙터 도메인은 핵산 결합 도메인, 뉴클레이스 도메인(예를 들어, 비-Cas 뉴클레이스 도메인), 후성유전적 변형 도메인, 전사 활성화 도메인, 또는 전사 억제 도메인으로부터 선택될 수 있다. 일부 구체예에서, 이종 기능성 도메인은 뉴클레이스, 예컨대 FokI 뉴클레이스이다. 예를 들어, 미국 특허 제9,023,649호를 참조하라. 일부 구체예에서, 이종 기능성 도메인은 전사 활성화제 또는 억제제이다. 예를 들어, Qi et al., "Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression," Cell 152:1173-83 (2013); Perez-Pinera et al., "RNA-guided gene activation by CRISPR-Cas9-based transcription factors," Nat. Methods 10:973-6 (2013); Mali et al., "CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering," Nat. Biotechnol. 31:833-8 (2013); Gilbert et al., "CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes," Cell 154:442-51 (2013)을 참조하라. 이와 같이, RNA-유도 DNA-결합제는 본질적으로 가이드 RNA를 사용하여 원하는 표적 서열에 결합하도록 지시될 수 있는 전사 인자가 된다. 특정 구체예에서, DNA 변형 도메인은 메틸화 도메인, 예컨대 탈메틸화 또는 메틸트랜스퍼레이스 도메인이다. 특정 구체예에서, 이펙터 도메인은 DNA 변형 도메인, 예컨대 염기-편집 도메인이다. 특정 구체예에서, DNA 변형 도메인은 DNA에 특정 변형을 도입하는 핵산 편집 도메인, 예컨대 디아미네이스 도메인이다. 예를 들어, WO 2015/089406; U.S. 2016/0304846을 참조하라. WO 2015/089406 및 U.S. 2016/0304846에 기재된 핵산 편집 도메인, 디아미네이스 도메인, 및 Cas9 변이체는 본원에 참조로 포함된다.
뉴클레이스는 가이드 RNA("gRNA")와 상호작용하는 적어도 하나의 도메인을 포함할 수 있다. 또한, 뉴클레이스는 gRNA에 의해 표적 서열에 지시될 수 있다. 클래스 2 Cas 뉴클레이스 시스템에서, gRNA는 뉴클레이스 및 표적 서열과 상호작용하여, 표적 서열에 대한 결합을 지시한다. 일부 구체예에서, gRNA는 표적화된 절단에 대한 특이성을 제공하고, 뉴클레이스는 보편적이며, 상이한 gRNA와 짝을 이루어 상이한 표적 서열을 절단할 수 있다. 클래스 2 Cas 뉴클레이스는 상기 나열된 유형, 오쏘로그, 및 예시적인 종의 gRNA 스캐폴드 구조와 쌍을 이룰 수 있다.
가이드 RNA (gRNA)
본 발명의 일부 구체예에서, LNP 제제를 위한 카르고는 적어도 하나의 gRNA를 포함한다. gRNA는 Cas 뉴클레이스 또는 클래스 2 Cas 뉴클레이스를 표적 핵산 분자 상의 표적 서열로 안내할 수 있다. 일부 구체예에서, gRNA는 클래스 2 Cas 뉴클레이스와 결합하여 절단의 특이성을 제공한다. 일부 구체예에서, gRNA 및 Cas 뉴클레이스는 리보핵산단백질(RNP), 예를 들어, LNP 조성물에 의해 전달될 수 있는 CRISPR/Cas9 복합체와 같은 CRISPR/Cas 복합체를 형성할 수 있다. 일부 구체예에서, CRISPR/Cas 복합체는 타입-II CRISPR/Cas9 복합체일 수 있다. 일부 구체예에서, CRISPR/Cas 복합체는 타입-V CRISPR/Cas 복합체, 예컨대 Cpf1/가이드 RNA 복합체일 수 있다. Cas 뉴클레이스 및 동족(cognate) gRNA는 쌍을 이룰 수 있다. 각각의 클래스 2 Cas 뉴클레이스와 쌍을 이루는 gRNA 스캐폴드 구조는 특정 CRISPR/Cas 시스템에 따라 다르다.
"가이드 RNA", "gRNA", 및 간단히 "가이드 "는 crRNA(CRISPR RNA로도 알려져 있음), 또는 crRNA 및 trRNA의 조합(tracrRNA로도 알려져 있음)을 지칭하도록 상호 교환적으로 본원에서 사용된다. crRNA 및 trRNA는 단일 RNA 분자(단일 가이드 RNA, sgRNA)로서 또는 두 개의 개별 RNA 분자(이중 가이드 RNA, dgRNA)에서 연관될 수 있다. "가이드 RNA" 또는 "gRNA"는 각각의 유형을 지칭한다. trRNA는 자연-발생 서열, 또는 자연-발생 서열과 비교하여 변형 또는 변이를 갖는 trRNA 서열일 수 있다.
본원에 사용된 "가이드 서열"은 표적 서열에 상보적이고 RNA-유도 DNA 결합제에 의한 결합 또는 변형(예를 들어, 절단)을 위해 가이드 RNA를 표적 서열에 안내하는 기능을 하는 가이드 RNA 내의 서열을 지칭한다. "가이드 서열"은 또한 "표적화 서열," 또는 "스페이서 서열"로 지칭될 수 있다. 가이드 서열은, 예를 들어, 스트렙토코쿠스 피오게네스 (즉, Spy Cas9) 및 관련 Cas9 호모로그/오쏘로그의 경우에 길이가 20 염기쌍 길이일 수 있다. 더 짧거나 더 긴 서열이, 예를 들어, 15-, 16-, 17-, 18-, 19-, 21-, 22-, 23-, 24-, 또는 25-뉴클레오타이드 길이로 가이드로서 또한 사용될 수 있다. 일부 구체예에서, 표적 서열은 유전자에 또는 염색체 상에 있으며, 예를 들어, 가이드 서열에 상보적이다. 일부 구체예에서, 가이드 서열과 이에 상응하는 표적 서열 사이의 상보성 또는 동일성의 정도는 약 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 가이드 서열 및 표적 영역은 100% 상보적이거나 동일할 수 있다. 다른 구체예에서, 가이드 서열 및 표적 영역은 적어도 하나의 불일치를 포함할 수 있다. 예를 들어, 가이드 서열 및 표적 서열은 1, 2, 3, 또는 4 개의 불일치를 포함할 수 있으며, 표적 서열의 총 길이는 적어도 17, 18, 19, 20 개 또는 그 이상의 염기쌍이다. 일부 구체예에서, 가이드 서열 및 표적 영역은 1-4 개의 불일치를 포함할 수 있으며 여기서 가이드 서열은 적어도 17, 18, 19, 20 개 또는 그 이상의 뉴클레오타이드를 포함한다. 일부 구체예에서, 가이드 서열 및 표적 영역은 1, 2, 3, 또는 4 개의 불일치를 포함할 수 있으며 여기서 가이드 서열은 20 개의 뉴클레오타이드를 포함한다.
Cas 단백질에 대한 핵산 기질이 이중 가닥 핵산이므로, Cas 단백질에 대한 표적 서열은 게놈 DNA의 양성 및 음성 가닥(즉, 주어진 서열 및 서열의 역 보체)를 모두 포함한다. 따라서, 가이드 서열이 "표적 서열에 상보적"인 것으로 언급되는 경우, 가이드 서열은 가이드 RNA가 표적 서열의 역 보체에 결합하도록 지시할 수 있음을 이해해야 한다. 따라서, 일부 구체예에서, 가이드 서열이 표적 서열의 역 보체에 결합하는 경우, 가이드 서열에서 T에 대한 U의 치환을 제외하고는 가이드 서열은 표적 서열(예를 들어, PAM을 포함하지 않는 표적 서열)의 특정 뉴클레오타이드와 동일하다.
표적화 서열의 길이는 사용된 CRISPR/Cas 시스템 및 성분에 의존할 수 있다. 예를 들어, 상이한 박테리아 종으로부터의 상이한 클래스 2 Cas 뉴클레이스는 다양한 최적화 표적화 서열 길이를 갖는다. 따라서, 표적화 서열은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50 초과의 뉴클레오타이드 길이를 포함할 수 있다. 일부 구체예에서, 표적화 서열 길이는 자연-발생 CRISPR/Cas 시스템의 가이드 서열보다 0, 1, 2, 3, 4, 또는 5 뉴클레오타이드 더 길거나 더 짧다. 특정 구체예에서, Cas 뉴클레이스 및 gRNA 스캐폴드는 동일한 CRISPR/Cas 시스템으로부터 유래될 것이다. 일부 구체예에서, 표적화 서열은 18-24 개의 뉴클레오타이드를 포함하거나 이로 구성될 수 있다. 일부 구체예에서, 표적화 서열은 19-21 개의 뉴클레오타이드를 포함하거나 이로 구성될 수 있다. 일부 구체예에서, 표적화 서열은 20 개의 뉴클레오타이드를 포함하거나 이로 구성될 수 있다.
일부 구체예에서, sgRNA는 Cas9 단백질에 의한 RNA-유도 DNA 절단을 매개할 수 있는 "Cas9 sgRNA"이다. 일부 구체예에서, sgRNA는 Cpf1 단백질에 의한 RNA-유도 DNA 절단을 매개할 수 있는 "Cpf1 sgRNA"이다. 특정 구체예에서, gRNA는 Cas9 단백질과 활성 복합체를 형성하고 RNA-유도 DNA 절단을 매개하기에 충분한 crRNA 및 tracr RNA를 포함한다. 특정 구체예에서, gRNA는 Cpf1 단백질과 활성 복합체를 형성하고 RNA-유도 DNA 절단을 매개하기에 충분한 crRNA를 포함한다. Zetsche 2015를 참조하라.
본 발명의 특정 구체예는 또한 본원에 기재된 gRNA를 인코딩하는 핵산, 예를 들어, 발현 카세트를 제공한다. "가이드 RNA 핵산"은 가이드 RNA (예를 들어 sgRNA 또는 dgRNA) 및 가이드 RNA 발현 카세트를 지칭하기 위해 사용되며, 이는 하나 이상의 가이드 RNA를 인코딩하는 핵산이다.
일부 구체예에서, 핵산은 DNA 분자일 수 있다. 일부 구체예에서, 핵산은 crRNA를 인코딩하는 뉴클레오타이드 서열을 포함할 수 있다. 일부 구체예에서, crRNA를 인코딩하는 뉴클레오타이드 서열은 자연-발생 CRISPR/Cas 시스템으로부터의 반복 서열의 전부 또는 일부가 측면에 있는 표적화 서열을 포함한다. 일부 구체예에서, 핵산은 tracr RNA를 인코딩하는 뉴클레오타이드 서열을 포함할 수 있다. 일부 구체예에서, crRNA 및 tracr RNA는 둘의 별개의 핵산에 의해 인코딩될 수 있다. 다른 구체예에서, crRNA 및 tracr RNA는 단일 핵산에 의해 인코딩될 수 있다. 일부 구체예에서, crRNA 및 tracr RNA는 단일 핵산의 반대 가닥에 의해 인코딩될 수 있다. 다른 구체예에서, crRNA 및 tracr RNA는 단일 핵산의 동일한 가닥에 의해 인코딩될 수 있다. 일부 구체예에서, gRNA 핵산은 sgRNA를 인코딩한다. 일부 구체예에서, gRNA 핵산은 Cas9 뉴클레이스 sgRNA를 인코딩한다. 일부 구체예에서, gRNA 핵산은 Cpf1 뉴클레이스 sgRNA를 인코딩한다.
가이드 RNA를 인코딩하는 뉴클레오타이드 서열은 적어도 하나의 전사 또는 조절 제어 서열, 예컨대 프로모터, 3' UTR, 또는 5' UTR에 작동 가능하게 연결될 수 있다. 한 예에서, 프로모터는 tRNA 프로모터, 예를 들어, tRNALys3, 또는 tRNA 키메라일 수 있다. Mefferd et al., RNA. 2015 21:1683-9; Scherer et al., Nucleic Acids Res. 2007 35: 2620-2628을 참조하라. 특정 구체예에서, 프로모터는 RNA 폴리머레이스 III(Pol III)에 의해 인식될 수 있다. Pol III 프로모터의 비제한적 예는 또한 U6 및 H1 프로모터를 포함한다. 일부 구체예에서, 가이드 RNA를 인코딩하는 뉴클레오타이드 서열은 마우스 또는 인간 U6 프로모터에 작동 가능하게 연결될 수 있다. 일부 구체예에서, gRNA 핵산은 변형된 핵산이다. 특정 구체예에서, gRNA 핵산은 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함한다. 일부 구체예에서, gRNA 핵산은 핵산의 통합을 안정화 및 방지하기 위한 5' 말단 변형, 예를 들어 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함한다. 일부 구체예에서, gRNA 핵산은 각 가닥에서 5' 말단 변형을 갖는 이중-가닥 DNA를 포함한다. 특정 구체예에서, gRNA 핵산은 5' 말단 변형으로서 역전된 디데옥시-T 또는 역전된 무염기 뉴클레오사이드 또는 뉴클레오타이드를 포함한다. 일부 구체예에서, gRNA 핵산은 비오틴, 데스티오비오텐-TEG, 디곡시제닌, 및 예를 들어 FAM, ROX, TAMRA, 및 AlexaFluor를 포함하는 형광 마커와 같은 표지를 포함한다.
특정 구체예에서, 하나 초과의 gRNA 핵산, 예컨대 gRNA가 CRISPR/Cas 뉴클레이스 시스템와 함께 사용될 수 있다. 각각의 gRNA 핵산은 상이한 표적화 서열을 포함할 수 있어, CRISPR/Cas 시스템이 하나 초과의 표적 서열을 절단한다. 일부 구체예에서, 하나 이상의 gRNA는 CRISPR/Cas 복합체 내에서 활성 또는 안정성과 같은 동일하거나 상이한 특성을 가질 수 있다. 하나 초과의 gRNA가 사용되는 경우, 각각의 gRNA는 동일하거나 상이한 gRNA 핵산에서 인코딩될 수있다. 하나 초과의 gRNA의 발현 유도에 사용되는 프로모터는 동일하거나 상이할 수 있다.
변형된 RNA
특정 구체예에서, LNP 조성물은 변형된 RNA를 포함한다.
변형된 뉴클레오사이드 또는 뉴클레오타이드는 RNA, 예를 들어 gRNA 또는 mRNA에 존재할 수 있다. 예를 들어, 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하는 gRNA 또는 mRNA는 표준(canonical) A, G, C, 및 U 잔기 대신 또는 이에 추가하여 사용되는 하나 이상의 비자연 및/또는 자연 발생 성분 또는 구성의 존재를 기재하기 위해 "변형된" RNA로 지칭된다. 일부 구체예에서, 변형된 RNA는 여기서 "변형된"으로 지칭되는 비표준(non-canonical) 뉴클레오사이드 또는 뉴클레오타이드로써 합성된다.
변형된 뉴클레오사이드 및 뉴클레오타이드는 다음 중 하나 이상을 포함할 수 있다: (i) 포스포디에스테르 골격 연결에서 비-연결 포스페이트 산소 중 하나 또는 둘 모두 및/또는 연결 포스페이트 산소 중 하나 이상의 변경, 예를 들어, 대체 (예시적인 골격 변형); (ii) 리보스 당의 성분, 예를 들어, 리보스 당의 2' 하이드록실의 변경, 예를 들어, 대체 (예시적인 당 변형); (iii) 포스페이트 모이어티를 "데포스포(dephospho)" 링커로 대규모 대체 (예시적인 골격 변형); (iv) 비표준 핵염기를 포함하여 자연 발생 핵염기의 변형 또는 대체 (예시적인 염기 변형); (v) 리보스-포스페이트 골격의 대체 또는 변형 (예시적인 골격 변형); (vi) 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 변형, 예를 들어, 말단 포스페이트기 또는 모이어티, 캡 또는 링커의 컨쥬게이션의 제거, 변형 또는 대체 (그러한 3' 또는 5' 캡 변형은 당 및/또는 골격 변형을 포함할 수 있음); 및 (vii) 당의 변형 또는 대체 (예시적인 당 변형). 특정 구체예는 mRNA, gRNA, 또는 핵산에 대한 5' 말단 변형을 포함한다. 특정 구체예는 mRNA, gRNA, 또는 핵산에 대한 3' 말단 변형을 포함한다. 변형된 RNA는 5' 말단 및 3' 말단 변형을 포함할 수 있다. 변형된 RNA는 비-말단 위치에서 하나 이상의 변형된 잔기를 포함할 수 있다. 특정 구체예에서, gRNA는 적어도 하나의 변형된 잔기를 포함한다. 특정 구체예에서, mRNA는 적어도 하나의 변형된 잔기를 포함한다.
본원에 사용된 바와 같이, 제2 서열에 대한 제1 서열의 정렬이 그 전체에서 제2 서열의 위치의 X% 이상이 제1 서열에 일치함을 나타내는 경우, 제1 서열은 제2 서열에 "적어도 X% 동일성을 갖는 서열을 포함하는" 것으로 간주된다. 예를 들어, 서열 AAGA는 서열 AAG와 100% 동일성을 갖는 서열을 포함하는데, 그 이유는 정렬이 제2 서열의 세 위치 모두에 일치한다는 점에서 100% 동일성을 제공하기 때문이다. RNA와 DNA 간의 차이(일반적으로 티미딘으로 우리딘의 교환 또는 그 반대) 및 변형된 우리딘과 같은 뉴클레오사이드 유사체의 존재는 관련 뉴클레오타이드(예컨대 티미딘, 우리딘, 또는 변형된 우리딘)가 동일한 보체를 갖는 한 폴리뉴클레오타이드 간의 동일성 또는 상보성 차이에 기여하지 않는다 (예를 들어, 티미딘, 우리딘, 또는 변형된 우리딘 모두에 대해 아데노신; 또 다른 예는 사이토신 및 5-메틸사이토신이며, 두 가지 모두 보체로서 구아노신 또는 변형된 구아노신을 갖는다). 따라서, 예를 들어, X가 임의의 변형된 우리딘, 예컨대 슈도우리딘, N1-메틸 슈도우리딘, 또는 5-메톡시우리딘인 서열 5'-AXG는 둘 모두가 동일한 서열(5'-CAU)에 대해 완벽하게 상보적이라는 점에서 AUG에 100% 동일한 것으로 간주된다. 예시적인 정렬 알고리즘은 당해 분야에 공지인 Smith-Waterman 및 Needleman-Wunsch 알고리즘이다. 당업자는 정렬될 주어진 서열의 쌍; 일반적으로 유사한 길이 및 아미노산에 대해 >50% 또는 뉴클레오타이드에 대해 >75% 예상되는 동일성의 서열에 대해 어떤 알고리즘 및 파라미터의 설정의 선택이 적합할지 이해할 것이고, www.ebi.ac.uk 웹 서버에서 EBI에 의해 주어진 Needleman-Wunsch 알고리즘 인터페이스의 기본 설정을 갖는 Needleman-Wunsch 알고리즘이 일반적으로 적합하다.
mRNA
일부 구체예에서, 본원에 개시된 조성물 또는 제제는 본원에 기재된 Cas 뉴클레이스, 또는 클래스 2 Cas 뉴클레이스와 같은 RNA-유도 DNA 결합제를 인코딩하는 오픈 리딩 프레임(ORF)을 포함하는 mRNA를 포함한다. 일부 구체예에서, Cas 뉴클레이스 또는 클래스 2 Cas 뉴클레이스와 같은 RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA가 제공, 사용 또는 투여된다. 일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF는 "변형된 RNA-유도 DNA 결합제 ORF" 또는 간단히 "변형된 ORF"이고, 이는 ORF가 다음 방식 중 하나 이상에서 변형됨을 나타내기 위한 약칭으로 사용된다: (1) 변형된 ORF는 최소 우리딘 함량 내지 최소 우리딘 함량의 150% 범위의 우리딘 함량을 갖는다; (2) 변형된 ORF는 최소 우리딘 디뉴클레오타이드 함량 내지 최소 우리딘 디뉴클레오타이드 함량의 150% 범위의 우리딘 디뉴클레오타이드 함량을 갖는다; (3) 변형된 ORF는 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90% 동일성을 갖는다; (4) 변형된 ORF는 코돈의 적어도 75%가 주어진 아미노산에 대한 최소 우리딘 코돈(들), 예를 들어 가장 적은 우리딘을 갖는 코돈(들) (최소 우리딘 코돈이 2 우리딘을 갖는 페닐알라닌에 대한 코돈을 제외하고 보통 0 또는 1)인 코돈의 세트로 구성된다; 또는 (5) 변형된 ORF는 적어도 하나의 변형된 우리딘을 포함한다. 일부 구체예에서, 변형된 ORF는 상기 방식 중 적어도 둘, 셋, 또는 넷에서 변형된다. 일부 구체예에서, 변형된 ORF는 적어도 하나의 변형된 우리딘을 포함하고 상기 (1)-(4) 중 적어도 하나, 둘, 셋 또는 모두에서 변형된다.
"변형된 우리딘"은 본원에서 우리딘과 동일한 수소 결합 수용체 및 우리딘과 하나 이상의 구조적 차이를 갖는 티미딘 이외의 뉴클레오사이드를 지칭하도록 사용된다. 일부 구체예에서, 변형된 우리딘은 치환된 우리딘, 즉, 하나 이상의 비-양성자 치환기(예를 들어, 메톡시와 같은 알콕시)가 양성자를 대신하는 우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 치환된 슈도우리딘, 즉, 하나 이상의 비-양성자 치환기(예를 들어, 메틸과 같은 알킬)가 양성자를 대신하는 슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 치환된 우리딘, 슈도우리딘, 또는 치환된 슈도우리딘 중 임의의 것이다.
본원에서 사용된 "우리딘 위치"는 우리딘 또는 변형된 우리딘이 차지한 폴리뉴클레오타이드에서의 위치를 지칭한다. 따라서, 예를 들어, "우리딘 위치의 100%가 변형된 우리딘"인 폴리뉴클레오타이드는 동일한 서열의 통상적인 RNA(모든 염기가 표준 A, U, C, 또는 G 염기인 경우)에서 우리딘일 모든 위치에서 변형된 우리딘을 포함한다. 달리 지시되지 않는 한, 본 개시 안의 또는 본 개시에 수반하는 서열 표 또는 서열 목록의 폴리뉴클레오타이드 서열에서의 U는 우리딘 또는 변형된 우리딘일 수 있다.
표 1. 최소 우리딘 코돈
아미노산 | 최소 우리딘 코돈 | |
A | 알라닌 | GCA 또는 GCC 또는 GCG |
G | 글라이신 | GGA 또는 GGC 또는 GGG |
V | 발린 | GUC 또는 GUA 또는 GUG |
D | 아스파트산 | GAC |
E | 글루탐산 | GAA 또는 GAG |
I | 이소류신 | AUC 또는 AUA 또는 AUG |
T | 트레오닌 | ACA 또는 ACC 또는 ACG |
N | 아스파라긴 | AAC |
K | 라이신 | AAG 또는 AAA |
S | 세린 | AGC |
R | 아르기닌 | AGA 또는 AGG |
L | 류신 | CUG 또는 CUA 또는 CUC |
P | 프롤린 | CCG 또는 CCA 또는 CCC |
H | 히스티딘 | CAC 또는 CAA 또는 CAG |
Q | 글루타민 | CAG 또는 CAA |
F | 페닐알라닌 | UUC |
Y | 티로신 | UAC |
C | 시스테인 | UGC |
W | 트립토판 | UGG |
M | 메티오닌 | AUG |
임의의 상기 구체예에서, 변형된 ORF는 적어도 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100%의 코돈이 최소 우리딘 코돈의 표에 나열된 코돈인 코돈의 세트로 구성될 수 있다. 임의의 상기 구체예에서, 변형된 ORF는 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90%, 95%, 98%, 99%, 또는 100% 동일성을 갖는 서열을 포함할 수 있다.
임의의 상기 구체예에서, 변형된 ORF는 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90%, 95%, 98%, 99%, 또는 100% 동일성을 갖는 서열을 포함할 수 있다.
임의의 상기 구체예에서, 변형된 ORF는 최소 우리딘 함량 내지 최소 우리딘 함량의 150%, 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102%, 또는 101% 범위인 우리딘 함량을 가질 수 있다.
임의의 상기 구체예에서, 변형된 ORF는 최소 디뉴클레오타이드 우리딘 함량 내지 최소 디뉴클레오타이드 우리딘 함량의 150%, 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102%, 또는 101% 범위인 우리딘 디뉴클레오타이드 함량을 가질 수 있다.
임의의 상기 구체예에서, 변형된 ORF는 적어도 하나의, 복수의, 또는 모든 우리딘 위치에서 변형된 우리딘을 포함할 수 있다. 일부 구체예에서, 변형된 우리딘은 5 위치에서, 예를 들어 할로겐, 메틸, 또는 에틸로 변형된 우리딘이다. 일부 구체예에서, 변형된 우리딘은 1 위치에서, 예를 들어 할로겐, 메틸, 또는 에틸로 변형된 슈도우리딘이다. 변형된 우리딘은, 예를 들어 슈도우리딘, N1-메틸-슈도우리딘, 5-메톡시우리딘, 5-아이오도우리딘, 또는 이들의 조합일 수 있다. 일부 구체예에서, 변형된 우리딘은 5-메톡시우리딘이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 N1-메틸-슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 N1-메틸 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-아이오도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 5-메톡시우리딘의 조합이다.
일부 구체예에서, 본 발명에 따른 mRNA에서 적어도 우리딘 위치의 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100%가 변형된 우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 변형된 우리딘, 예를 들어, 5-메톡시우리딘, 5-아이오도우리딘, N1-메틸 슈도우리딘, 슈도우리딘, 또는 이들의 조합이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이고, 나머지는 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이고, 나머지는 N1-메틸 슈도우리딘이다.
임의의 상기 구체예에서, 변형된 ORF는 감소된 우리딘 디뉴클레오타이드 함량, 예컨대 가능한 가장 낮은 우리딘 디뉴클레오타이드(UU) 함량을 포함할 수 있고, 예를 들어 (a) 모든 위치에서 (위에 논의된 바와 같은) 최소 우리딘 코돈을 사용하고 (b) 주어진 ORF와 동일한 아미노산 서열을 인코딩하는 ORF이다. 우리딘 디뉴클레오타이드(UU) 함량은 ORF에서 UU 디뉴클레오타이드의 열거로서 또는 우리딘 디뉴클레오타이드의 우리딘에 의해 점유되는 위치의 백분율로서 비율 기준으로 절대적인 용어로 표현될 수 있다 (예를 들어, 5 위치 중 2가 우리딘 디뉴클레오타이드의 우리딘에 의해 점유되기 때문에 AUUAU가 40%의 우리딘 디뉴클레오타이드 함량을 가질 것이다). 변형된 우리딘 잔기는 최소 우리딘 디뉴클레오타이드 함량을 평가할 목적에 대해 우리딘과 동등한 것으로 간주된다.
일부 구체예에서, mRNA는 발현된 포유동물 mRNA, 예컨대 구성적으로 발현된 mRNA로부터의 적어도 하나의 UTR을 포함한다. mRNA는 건강한 성체 포유동물의 적어도 하나의 조직에서 지속적으로 전사되는 경우 포유동물에서 구성적으로 발현되는 것으로 간주된다. 일부 구체예에서, mRNA는 발현된 포유동물 RNA, 예컨대 구성적으로 발현된 포유동물 mRNA로부터의 5' UTR, 3' UTR, 또는 5' 및 3' UTR을 포함한다. 액틴 mRNA는 구성적으로 발현된 mRNA의 예이다.
일부 구체예에서, mRNA는 하이드록시스테로이드 17-베타 데하이드로게네이스 4(HSD17B4 또는 HSD)로부터의 적어도 하나의 UTR, 예를 들어, HSD로부터의 5' UTR을 포함한다. 일부 구체예에서, mRNA는 글로빈 mRNA, 예를 들어, 인간 알파 글로빈(HBA) mRNA, 인간 베타 글로빈(HBB) mRNA, 또는 제노푸스 레비스(Xenopus laevis) 베타 글로빈(XBG) mRNA로부터의 적어도 하나의 UTR을 포함한다. 일부 구체예에서, mRNA는 글로빈 mRNA, 예컨대 HBA, HBB, 또는 XBG로부터의 5' UTR, 3' UTR, 또는 5' 및 3' UTR을 포함한다. 일부 구체예에서, mRNA는 소 성장 호르몬, 거대세포바이러스(CMV), 마우스 Hba-a1, HSD, 알부민 유전자, HBA, HBB, 또는 XBG로부터의 5' UTR을 포함한다. 일부 구체예에서, mRNA는 소 성장 호르몬, 거대세포바이러스, 마우스 Hba-a1, HSD, 알부민 유전자, HBA, HBB, 또는 XBG로부터의 3' UTR을 포함한다. 일부 구체예에서, mRNA는 소 성장 호르몬, 거대세포바이러스, 마우스 Hba-a1, HSD, 알부민 유전자, HBA, HBB, XBG, 열 충격 단백질 90(Hsp90), 글리세르알데하이드 3-포스페이트 데하이드로게네이스(GAPDH), 베타-액틴, 알파-튜불린, 종양 단백질(p53), 또는 표피 성장 인자 수용체(EGFR)로부터의 5' 및 3' UTR을 포함한다.
일부 구체예에서, mRNA는 동일한 공급원, 예를 들어, 구성적으로 발현되는 mRNA 예컨대 액틴, 알부민, 또는 글로빈 예컨대 HBA, HBB, 또는 XBG로부터 유래한 5' 및 3' UTR을 포함한다.
일부 구체예에서, mRNA는 5' UTR을 포함하지 않으며, 예를 들어, 5' 캡과 개시 코돈 사이에 추가적인 뉴클레오타이드가 없다. 일부 구체예에서, mRNA는 5' 캡과 개시 코돈 사이에 코작 서열(하기 설명됨)을 포함하지만, 임의의 추가적인 5' UTR을 갖지 않는다. 일부 구체예에서, mRNA는 3' UTR를 포함하지 않으며, 예를 들어, 종결 코돈과 폴리-A 테일 사이에 추가적인 뉴클레오타이드가 없다.
일부 구체예에서, mRNA는 코작 서열을 포함한다. 코작 서열은 번역 개시 및 mRNA로부터 번역된 폴리펩타이드의 전체 수율에 영향을 미칠 수 있다. 코작 서열은 개시 코돈으로서 기능할 수 있는 메티오닌 코돈을 포함한다. 최소 코작 서열은 NNNRUGN이고 여기서 다음 중 적어도 하나가 참이다: 첫 번째 N은 A 또는 G이고 두 번재 N은 G이다. 뉴클레오타이드 서열의 맥락에서, R은 퓨린(A 또는 G)을 의미한다. 일부 구체예에서, 코작 서열은 RNNRUGN, NNNRUGG, RNNRUGG, RNNAUGN, NNNAUGG, 또는 RNNAUGG이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1 또는 2 개의 불일치를 갖는 rccRUGg이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1 또는 2 개의 불일치를 갖는 rccAUGg이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1, 2 또는 3 개의 불일치를 갖는 gccRccAUGG이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1, 2, 3 또는 4 개의 불일치를 갖는 gccAccAUG이다. 일부 구체예에서, 코작 서열은 GCCACCAUG이다. 일부 구체예에서, 코작 서열은 소문자 위치에서 0 개의 불일치 또는 1, 2, 3 또는 4 개의 불일치를 갖는 gccgccRccAUGG이다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 43에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 43의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 44에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 44의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 56에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 56의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 57에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 57의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 58의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 59에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 59의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 60에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 60의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 61에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 61의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.
일부 구체예에서, mRNA는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF를 포함한다.
일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 95%이다. 일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 98%이다. 일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 99%이다. 일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 100%이다.
일부 구체예에서, 본원에 개시된 mRNA는 5' 캡, 예컨대 Cap0, Cap1, 또는 Cap2를 포함한다. 5' 캡은 일반적으로, 5'-트리포스페이트를 통해 mRNA의 5'-투-3' 사슬의 제1 뉴클레오타이드의 5' 위치, 즉, 제1 캡-근위 뉴클레오타이드에 연결된 7-메틸구아닌 리보뉴클레오타이드이다 (이는 예를 들어 ARCA에 대하여 아래 논의된 바와 같이 추가로 변형될 수 있다). Cap0에서, mRNA의 제1 및 제2 캡-근위 뉴클레오타이드의 리보스는 모두 2'-하이드록실을 포함한다. Cap1에서, mRNA의 제1 및 제2 전사된 뉴클레오타이드의 리보스는 각각 2'-메톡시 및 2'-하이드록실을 포함한다. Cap2에서, mRNA의 제1 및 제2 캡-근위 뉴클레오타이드의 리보스는 모두 2'-메톡시를 포함한다. 예를 들어, Katibah et al. (2014) Proc Natl Acad Sci USA 111(33):12025-30; Abbas et al. (2017) Proc Natl Acad Sci USA 114(11):E2106-E2115를 참조하라. 인간 mRNA와 같은 포유동물 mRNA를 포함하는 대부분의 내인성 고등 진핵 mRNA는 Cap1 또는 Cap2를 포함한다. Cap0 및 Cap1 및 Cap2와 상이한 다른 캡 구조는 IFIT-1 및 IFIT-5와 같은 선천성 면역계의 성분에 의해 "비-자기"로 인식됨으로 인해 인간과 같은 포유동물에서 면역원성일 수 있으며, 이는 타입 I 인터페론을 포함하여 상승된 사이토카인 수준을 야기할 수 있다. IFIT-1 및 IFIT-5와 같은 선천성 면역계의 성분은 또한, mRNA의 번역을 잠재적으로 억제하는 Cap1 또는 Cap2 이외의 캡과 mRNA의 결합에 대해 eIF4E와 경쟁할 수 있다.
캡은 공동-전사적으로 포함될 수 있다. 예를 들어, ARCA(안티-리버스 캡 유사체; Thermo Fisher Scientific Cat. No. AM8045)는 구아닌 리보뉴클레오타이드의 5' 위치에 연결된 7-메틸구아닌 3'-메톡시-5'-트리포스페이트를 포함하는 캡 유사체이며 이는 개시에서 전사물에 시험관내 혼입될 수 있다. ARCA는 첫 번째 캡-근위 뉴클레오타이드의 2' 위치가 하이드록실인 Cap0 캡을 야기한다. 예를 들어, Stepinski et al., (2001) "Synthesis and properties of mRNAs containing the novel 'anti-reverse' cap analogs 7-methyl(3'-O-methyl)GpppG and 7-methyl(3'deoxy)GpppG," RNA 7: 1486-1495를 참조하라. ARCA 구조는 아래에 나타난다.
CleanCapTM AG (m7G(5')ppp(5')(2'OMeA)pG; TriLink Biotechnologies Cat. No. N-7113) 또는 CleanCapTM GG (m7G(5')ppp(5')(2'OMeG)pG; TriLink Biotechnologies Cat. No. N-7133)가 Cap1 구조를 공동-전사적으로 제공하기 위해 사용될 수 있다. CleanCapTM AG 및 CleanCapTM GG의 3'-O-메틸화 버전은 또한 각각 Cat. Nos. N-7413 및 N-7433으로서 TriLink Biotechnologies로부터 입수 가능하다. CleanCapTM AG 구조는 아래에 나타난다.
대안으로, 캡은 후-전사적으로 RNA에 첨가될 수 있다. 예를 들어, 백시니아 캡핑 효소는 상업적으로 입수 가능하고 (New England Biolabs Cat. No. M2080S) D1 서브유닛에 의해 제공되는 RNA 트리포스파테이스 및 구아닐릴트랜스퍼레이스 활성, 및 D12 서브유닛에 의해 제공되는 구아닌 메틸트랜스퍼레이스를 갖는다. 그와 같이, 이는 7-메틸구아닌을 RNA에 첨가하여, S-아데노실 메티오닌 및 GTP의 존재에서 Cap0을 제공할 수 있다. 예를 들어, Guo, P. and Moss, B. (1990) Proc. Natl. Acad. Sci. USA 87, 4023-4027; Mao, X. and Shuman, S. (1994) J. Biol. Chem. 269, 24472-24479를 참조하라.
일부 구체예에서, mRNA는 폴리-아데닐화(폴리-A) 테일을 추가로 포함한다. 일부 구체예에서, 폴리-A 테일은 적어도 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 아데닌, 임의로 최대 300 개의 아데닌을 포함한다. 일부 구체예에서, 폴리-A 테일은 95, 96, 97, 98, 99, 또는 100 개의 아데닌 뉴클레오타이드를 포함한다. 일부 예에서, 폴리-A 테일은 폴리-A 테일 내의 하나 이상의 위치에서 하나 이상의 비-아데닌 뉴클레오타이드 "앵커"로써 "중단된다". 폴리-A 테일은 적어도 8개의 연속 아데닌 뉴클레오타이드를 포함할 수 있지만, 또한 하나 이상의 비-아데닌 뉴클레오타이드를 포함할 수 있다. 본원에서 사용된 "비-아데닌 뉴클레오타이드"는 아데닌을 포함하지 않는 임의의 천연 또는 비-천연 뉴클레오타이드를 지칭한다. 구아닌, 타이민, 및 사이토신 뉴클레오타이드는 예시적인 비-아데닌 뉴클레오타이드이다. 따라서, 본원에 기재된 mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 3' 위치한 연속 아데닌 뉴클레오타이드를 포함할 수 있다. 일부 예에서, mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 대해 3' 위치의 비-연속 아데닌 뉴클레오타이드를 포함하며, 여기서 비-아데닌 뉴클레오타이드는 아데닌 뉴클레오타이드를 규칙적으로 또는 불규칙적인 간격으로 중단시킨다.
일부 구체예에서, mRNA는 폴리-아데닐화(폴리-A) 테일을 추가로 포함한다. 일부 구체예에서, 폴리-A 테일은 적어도 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 개의 아데닌, 임의로 최대 300 개의 아데닌을 포함한다. 일부 구체예에서, 폴리-A 테일은 95, 96, 97, 98, 99, 또는 100 개의 아데닌 뉴클레오타이드를 포함한다. 일부 예에서, 폴리-A 테일은 폴리-A 테일 내의 하나 이상의 위치에서 하나 이상의 비-아데닌 뉴클레오타이드 "앵커"로써 "중단된다". 폴리-A 테일은 적어도 8개의 연속 아데닌 뉴클레오타이드를 포함할 수 있지만, 또한 하나 이상의 비-아데닌 뉴클레오타이드를 포함할 수 있다. 본원에서 사용된 "비-아데닌 뉴클레오타이드"는 아데닌을 포함하지 않는 임의의 천연 또는 비-천연 뉴클레오타이드를 지칭한다. 구아닌, 타이민, 및 사이토신 뉴클레오타이드는 예시적인 비-아데닌 뉴클레오타이드이다. 따라서, 본원에 기재된 mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 3' 위치한 연속 아데닌 뉴클레오타이드를 포함할 수 있다. 일부 예에서, mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 대해 3' 위치의 비-연속 아데닌 뉴클레오타이드를 포함하며, 여기서 비-아데닌 뉴클레오타이드는 아데닌 뉴클레오타이드를 규칙적으로 또는 불규칙적인 간격으로 중단시킨다.
일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 연속 아데닌 뉴클레오타이드를 중단시키도록 위치하여 폴리(A) 결합 단백질이 연속 아데닌 뉴클레오타이드의 스트레치에 결합할 수 있다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드(들)는 적어도 8, 9, 10, 11, 또는 12 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8-50 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8-100 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 비-아데닌 뉴클레오타이드는 1, 2, 3, 4, 5, 6 또는 7 개의 아데닌 뉴클레오타이드 뒤에 있으며 적어도 8 개의 연속 아데닌 뉴클레오타이드가 이어진다.
폴리-A 테일은 연속 아데닌 뉴클레오타이드의 한 서열에 이어서 하나 이상의 비-아데닌 뉴클레오타이드, 임으로 이어서 추가의 아데닌 뉴클레오타이드를 포함할 수 있다.
일부 구체예에서, 폴리-A 테일은 하나의 비-아데닌 뉴클레오타이드 또는 2-10 비-아데닌 뉴클레오타이드의 하나의 연속 스트레치를 포함하거나 함유한다. 일부 구체예에서, 비-아데닌 뉴클레오타이드(들)는 적어도 8, 9, 10, 11, 또는 12 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8-50 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다.
일부 구체예에서, 비-아데닌 뉴클레오타이드는 구아닌, 사이토신, 또는 타이민이다. 일부 예에서, 비-아데닌 뉴클레오타이드는 구아닌 뉴클레오타이드이다. 일부 구체예에서, 비-아데닌 뉴클레오타이드는 사이토신 뉴클레오타이드이다. 일부 구체예에서, 비-아데닌 뉴클레오타이드는 타이민 뉴클레오타이드이다. 일부 예에서, 하나 초과의 비-아데닌 뉴클레오타이드가 존재하는 경우, 비-아데닌 뉴클레오타이드는 a) 구아닌 및 타이민 뉴클레오타이드; b) 구아닌 및 사이토신 뉴클레오타이드; c) 타이민 및 사이토신 뉴클레오타이드; 또는 d) 구아닌, 타이민 및 사이토신 뉴클레오타이드로부터 선택될 수 있다. 비-아데닌 뉴클레오타이드를 포함하는 예시적인 폴리-A 테일은 서열 식별 번호: 62로 제공된다.
일부 구체예에서, mRNA는 정제된다. 일부 구체예에서, mRNA는 침전 방법(예를 들어, LiCl 침전, 알코올 침전, 또는 동등한 방법, 예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, mRNA는 크로마토그래피-기반 방법, 예컨대 HPLC-기반 방법 또는 동등한 방법(예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, mRNA는 침전 방법(예를 들어, LiCl 침전) 및 HPLC-기반 방법 모두를 사용하여 정제된다.
일부 구체예에서, 적어도 하나의 gRNA는 본원에 개시된 mRNA와 조합하여 제공된다. 일부 구체예에서, gRNA는 mRNA와 별개의 분자로서 제공된다. 일부 구체예에서, gRNA는 본원에 개시된 mRNA의 일부, 예컨대 UTR의 일부로서 제공된다.
화학적으로 변형된 gRNA
일부 구체예에서, gRNA는 화학적으로 변형된다. 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하는 gRNA는 표준 A, G, C, 및 U 잔기 대신 또는 이에 추가하여 사용되는 하나 이상의 비자연 및/또는 자연 발생 성분 또는 구성의 존재를 설명하기 위해 "변형된" gRNA 또는 "화학적으로 변형된" gRNA로 지칭된다. 일부 구체예에서, 변형된 gRNA는 비표준 뉴클레오사이드 또는 뉴클레오타이드로써 합성되며, 여기서 "변형된"으로 지칭된다. 변형된 뉴클레오사이드 및 뉴클레오타이드는 다음 중 하나 이상을 포함할 수 있다: (i) 포스포디에스테르 골격 연결에서 비-연결 포스페이트 산소 중 하나 또는 둘 모두 및/또는 연결 포스페이트 산소 중 하나 이상의 변경, 예를 들어, 대체 (예시적인 골격 변형); (ii) 리보스 당의 성분, 예를 들어, 리보스 당의 2' 하이드록실의 변경, 예를 들어, 대체 (예시적인 당 변형); (iii) 포스페이트 모이어티를 "데포스포(dephospho)" 링커로 대규모 대체 (예시적인 골격 변형); (iv) 비표준 핵염기를 포함하여 자연 발생 핵염기의 변형 또는 대체 (예시적인 염기 변형); (v) 리보스-포스페이트 골격의 대체 또는 변형 (예시적인 골격 변형); (vi) 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 변형, 예를 들어, 말단 포스페이트기 또는 모이어티, 캡 또는 링커의 컨쥬게이션의 제거, 변형 또는 대체 (그러한 3' 또는 5' 캡 변형은 당 및/또는 골격 변형을 포함할 수 있음); 및 (vii) 당의 변형 또는 대체 (예시적인 당 변형).
일부 구체예에서, gRNA는 일부 또는 모든 우리딘 위치에서 변형된 우리딘을 포함한다. 일부 구체예에서, 변형된 우리딘은 5 위치에서, 예를 들어 할로겐 또는 C1-C6 알콕시로 변형된 우리딘이다. 일부 구체예에서, 변형된 우리딘은 1 위치에서, 예를 들어 C1-C6 알킬로 변형된 슈도우리딘이다. 변형된 우리딘은, 예를 들어 슈도우리딘, N1-메틸-슈도우리딘, 5-메톡시우리딘, 5-아이오도우리딘, 또는 이들의 조합일 수 있다. 일부 구체예에서 변형된 우리딘은 5-메톡시우리딘이다. 일부 구체예에서 변형된 우리딘은 5-아이오도우리딘이다. 일부 구체예에서 변형된 우리딘은 슈도우리딘이다. 일부 구체예에서 변형된 우리딘은 N1-메틸-슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 N1-메틸 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-아이오도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 5-메톡시우리딘의 조합이다.
일부 구체예에서, 본 발명에 따른 gRNA에서 적어도 우리딘 위치의 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100%가 변형된 우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 변형된 우리딘, 예를 들어, 5-메톡시우리딘, 5-아이오도우리딘, N1-메틸 슈도우리딘, 슈도우리딘, 또는 이들의 조합이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이고, 나머지는 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이고, 나머지는 N1-메틸 슈도우리딘이다.
상기 열거된 것과 같은 화학적 변형은 둘, 셋, 넷 또는 그 이상의 변형을 가질 수 있는 뉴클레오사이드 및 뉴클레오타이드(집합적으로 "잔기")를 포함하는 변형된 gRNA를 제공하도록 조합될 수 있다. 예를 들어, 변형된 잔기는 변형된 당 및 변형된 핵염기를 가질 수 있다. 일부 구체예에서, gRNA의 모든 염기는 변형되며, 예를 들어, 모든 염기는 변형된 포스페이트 기, 예컨대 포스포로티오에이트 기를 갖는다. 특정 구체예에서, gRNA 분자의 포스페이트 기의 전부 또는 실질적으로 전부가 포스포로티오에이트 기로 대체된다. 일부 구체예에서, 변형된 gRNA는 RNA의 5' 말단에서 또는 그 근처에서 적어도 하나의 변형된 잔기를 포함한다. 일부 구체예에서, 변형된 gRNA는 RNA의 3' 말단에서 또는 그 근처에서 적어도 하나의 변형된 잔기를 포함한다.
일부 구체예에서, gRNA는 하나, 둘, 셋 또는 그 이상의 변형된 잔기를 포함한다. 일부 구체예에서, 변형된 gRNA 중의 위치의 적어도 5%(예를 들어, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100%)가 변형된 뉴클레오사이드 또는 뉴클레오타이드이다.
비변형 핵산은, 예를 들어 세포내 뉴클레이스 또는 혈청에서 발견되는 것에 의해 분해되기 쉬울 수 있다. 예를 들어, 뉴클레이스는 핵산 포스포디에스테르 결합을 가수분해할 수 있다. 따라서, 한 양태에서 본원에 기재된 gRNA는, 예를 들어 세포내 또는 혈청-기반 뉴클레이스에 대한 안정성을 도입하기 위해 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함할 수 있다. 일부 구체예에서, 본원에 기재된 변형된 gRNA 분자는 생체 내 및 생체 외 모두에서 세포의 집단으로 도입될 때 감소된 선천성 면역 반응을 나타낼 수 있다. 용어 "선천성 면역 반응"은 사이토카인 발현 및 방출, 특히 인터페론, 및 세포 사멸의 유도를 포함하는, 단일 가닥 핵산을 포함하는 외인성 핵산에 대한 세포 반응을 포함한다.
골격 변형의 일부 구체예에서, 변형된 잔기의 포스페이트 기는 하나 이상의 산소를 상이한 치환기로 대체하여 변형될 수 있다. 또한, 변형된 잔기, 예를 들어, 변형된 핵산에 존재하는 변형된 잔기는 본원에 기재된 바와 같이 변형된 포스페이트 기로의 비변형 포스페이트 모이어티의 대규모 대체를 포함할 수 있다. 일부 구체예에서, 포스페이트 골격의 골격 변형은 비하전 링커 또는 비대칭 전하 분포를 갖는 하전된 링커를 야기하는 변경을 포함할 수 있다.
변형된 포스페이트 기의 예는, 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스테르, 하이드로젠 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스테르를 포함한다. 비변형 포스페이트 기의 인 원자는 비카이랄이다. 그러나, 비-가교 산소 중 하나를 상기 원자 또는 원자의 그룹 중 하나로 대체하는 것이 인 원자를 카이랄이 되게 할 수 있다. 입체발생 인 원자는 "R" 배열(여기서 Rp) 또는 "S" 배열(여기서 Sp)을 보유할 수 있다. 골격은 가교 산소(즉, 포스페이트를 뉴클레오사이드에 연결시키는 산소)를 질소(가교된 포스포로아미데이트), 황(가교된 포스포로티오에이트) 및 탄소(가교된 메틸렌포스포네이트)로 대체하여 변형될 수 있다. 대체는 어느 하나의 연결 산소 또는 연결 산소 둘 모두에서 일어날 수 있다.
포스페이트 기는 특정 골격 변형에서 비-인 함유 연결기에 의해 대체될 수 있다. 일부 구체예에서, 하전된 포스페이트 기는 중성 모이어티로 대체될 수 있다. 포스페이트 기를 대체할 수 있는 모이어티의 예는, 제한 없이, 예를 들어 메틸 포스포네이트, 하이드록실아미노, 실록산, 카르보네이트, 카르복시메틸, 카르바메이트, 아미드, 티오에테르, 에틸렌 옥사이드 링커, 설포네이트, 설폰아미드, 티오포름아세탈, 포름아세탈, 옥심, 메틸렌이미노, 메틸렌메틸이미노, 메틸렌하이드라조, 메틸렌디메틸하이드라조 및 메틸렌옥시메틸이미노를 포함할 수 있다.
주형 핵산
본원에 개시된 조성물 및 방법은 주형 핵산을 포함할 수 있다. 주형은 Cas 뉴클레이스에 대한 표적 자리에서 또는 그 근처에서 핵산 서열을 변경 또는 삽입시키기 위해 사용될 수 있다. 일부 구체예에서, 방법은 주형을 세포에 도입하는 것을 포함한다. 일부 구체예에서, 단일 주형이 제공될 수 있다. 다른 구체예에서, 편집이 둘 이상의 표적 자리에서 일어날 수 있도록 둘 이상의 주형이 제공될 수 있다. 예를 들어, 세포에서 단일 유전자, 또는 세포에서 두 가지의 상이한 유전자를 편집하기 위해 상이한 주형이 제공될 수 있다.
일부 구체예에서, 주형은 상동 재조합에서 사용될 수 있다. 일부 구체예에서, 상동 재조합은 주형 서열 또는 주형 서열의 일부를 표적 핵산 분자로 통합시킬 수 있다. 다른 구체예에서, 주형은 상동성-지시 복구(homology-directed repair)에서 사용될 수 있으며, 이는 핵산의 절단 자리에서 DNA 가닥 침입을 포함한다. 일부 구체예에서, 상동성-지시 복구는 편집된 표적 핵산 분자에서 주형 서열 포함을 야기할 수 있다. 또 다른 구체예에서, 주형은 비-상동 말단 연결에 의해 매개되는 유전자 편집에서 사용될 수 있다. 일부 구체예에서, 주형 서열은 절단 자리 근처의 핵산 서열과 유사성이 없다. 일부 구체예에서, 주형 또는 주형 서열의 일부가 혼입된다. 일부 구체예에서, 주형은 측면 역전된 말단 반복(inverted terminal repeat, ITR) 서열을 포함한다.
일부 구체예에서, 주형은 각각 절단 자리의 상류 및 하류에 위치한 서열에 상보적인 제1 상동성 팔(arm) 및 제2 상동성 팔(제1 및 제2 뉴클레오타이드 서열로도 지칭됨)을 포함할 수 있다. 주형이 두 개의 상동성 팔을 포함하는 경우, 각 팔은 동일한 길이 또는 상이한 길이일 수 있고, 상동성 팔 사이의 서열은 상동성 팔 사이의 표적 서열과 실질적으로 유사하거나 동일할 수 있고, 또는 완전히 무관할 수 있다. 일부 구체예에서, 주형 상의 제1 뉴클레오타이드 서열과 절단 자리의 상류 서열 사이, 주형 상의 제2 뉴클레오타이드 서열과 절단 자리의 하류 서열 사이의 상보성의 정도 또는 동일성 퍼센트는, 예를 들어 주형과 표적 핵산 분자 사이의 고충실성(high-fidelity) 상동 재조합과 같은 상동 재조합을 허용할 수 있다. 일부 구체예에서, 상보성의 정도는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 상보성의 정도는 약 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 상보성의 정도는 적어도 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 상보성의 정도는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 약 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 적어도 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 100%일 수 있다.
일부 구체예에서, 주형 서열은 표적 세포의 내인성 서열에 상응하거나 이를 포함하거나 이로 구성될 수 있다. 이는 또한 대안으로 표적 세포의 외인성 서열에 상응하거나 이를 포함하거나 이로 구성될 수 있다. 본원에서 사용된 용어 "내인성 서열"은 세포에 고유한 서열을 지칭한다. 용어 "외인성 서열"은 세포에 고유하지 않은 서열, 또는 세포의 게놈에서의 고유 위치가 상이한 위치에 있는 서열을 지칭한다. 일부 구체예에서, 내인성 서열은 세포의 게놈 서열일 수 있다. 일부 구체예에서, 내인성 서열은 염색체 또는 염색체 외 서열일 수 있다. 일부 구체예에서, 내인성 서열은 세포의 플라스미드 서열일 수 있다. 일부 구체예에서, 주형 서열은 절단 자리에서 또는 그 근처에서 세포의 내인성 서열의 일부와 실질적으로 동일할 수 있지만, 적어도 하나의 뉴클레오타이드 변화를 포함한다. 일부 구체예에서, 절단된 표적 핵산 분자를 주형으로 편집하는 것은 표적 핵산 분자의 하나 이상의 뉴클레오타이드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 야기할 수 있다. 일부 구체예에서, 돌연변이는 표적 서열을 포함하는 유전자로부터 발현된 단백질에서 하나 이상의 아미노산 변화를 야기할 수 있다. 일부 구체예에서, 돌연변이는 표적 유전자로부터 발현된 RNA에서 하나 이상의 뉴클레오타이드 변화를 야기할 수 있다. 일부 구체예에서, 돌연변이는 표적 유전자의 발현 수준을 변경시킬 수 있다. 일부 구체예에서, 돌연변이는 표적 유전자의 발현 증가 또는 감소를 야기할 수 있다. 일부 구체예에서, 돌연변이는 유전자 넉다운을 야기할 수 있다. 일부 구체예에서, 돌연변이는 유전자 넉아웃을 야기할 수 있다. 일부 구체예에서, 돌연변이는 복원된 유전자 기능을 야기할 수 있다. 일부 구체예에서, 절단된 표적 핵산 분자를 주형으로 편집하는 것은 표적 핵산 분자, 예컨대 DNA의 엑손 서열, 인트론 서열, 조절 서열, 전사 제어 서열, 번역 제어 서열, 스플라이싱 자리, 또는 비-코딩 서열 변화를 야기할 수 있다.
다른 구체예에서, 주형 서열은 외인성 서열을 포함할 수 있다. 일부 구체예에서, 외인성 서열은 외인성 프로모터 서열에 작동 가능하에 연결된 단백질 또는 RNA 코딩 서열을 포함할 수 있어서, 외인성 서열의 표적 핵산 분자 내로의 통합 시, 세포는 통합 서열에 의해 인코딩된 단백질 또는 RNA를 발현할 수 있다. 다른 구체예에서, 외인성 서열의 표적 핵산 분자 내로의 통합 시, 통합 서열의 발현은 내인성 프로모터 서열에 의해 조절될 수 있다. 일부 구체예에서, 외인성 서열은 단백질 또는 단백질의 일부를 인코딩하는 cDNA 서열을 제공할 수 있다. 또 다른 구체예에서, 외인성 서열은 엑손 서열, 인트론 서열, 조절 서열, 전사 제어 서열, 번역 제어 서열, 스플라이싱 자리, 또는 비-코딩 서열을 포함하거나 이로 구성될 수 있다. 일부 구체예에서, 외인성 서열의 통합은 복원된 유전자 기능을 야기할 수 있다. 일부 구체예에서, 외인성 서열의 통합은 유전자 넉인을 야기할 수 있다. 일부 구체예에서, 외인성 서열의 통합은 유전자 넉아웃을 야기할 수 있다.
주형은 임의의 적절한 길이일 수 있다. 일부 구체예에서, 주형은 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 이상 뉴클레오타이드 길이를 포함할 수 있다. 주형은 단일-가닥 핵산일 수 있다. 주형은 이중-가닥 또는 부분 이중-가닥 핵산일 수 있다. 특정 구체예에서, 단일 가닥 주형은 20, 30, 40, 50, 75, 100, 125, 150, 175, 또는 200 뉴클레오타이드 길이일 수 있다. 일부 구체예에서, 주형은 표적 서열을 포함하는 표적 핵산 분자의 일부에 상보적인 뉴클레오타이드 서열(즉, "상동성 팔")을 포함할 수 있다. 일부 구체예에서, 주형은 표적 핵산 분자상의 절단 자리의 상류 또는 하류에 위치한 서열에 상보적인 상동성 팔을 포함할 수 있다.
일부 구체예에서, 주형은 측면 역전-말단 반복(invert-terminal repeat, ITR) 서열을 포함하는 ssDNA 또는 dsDNA를 포함한다. 일부 구체예에서, 주형은 벡터, 플라스미드, 미니서클, 나노서클, 또는 PCR 생성물로서 제공된다.
핵산의 정제
일부 구체예에서, 핵산은 정제된다. 일부 구체예에서, 핵산은 침전 방법(예를 들어, LiCl 침전, 알코올 침전, 또는 동등한 방법, 예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, 핵산은 크로마토그래피-기반 방법, 예컨대 HPLC-기반 방법 또는 동등한 방법(예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, 핵산은 침전 방법(예를 들어, LiCl 침전) 및 HPLC-기반 방법 모두를 사용하여 정제된다.
표적 서열
일부 구체예에서, 본 발명의 CRISPR/Cas 시스템은 표적 핵산 분자상의 표적 서열에 지시되고 이를 절단할 수 있다. 예를 들어, 표적 서열은 Cas 뉴클레이스에 의해 인식되고 절단될 수 있다. 특정 구체예에서, Cas 뉴클레이스에 대한 표적 서열은 뉴클레이스의 동족 PAM 서열 근처에 위치한다. 일부 구체예에서, 클래스 2 Cas 뉴클레이스는 gRNA에 의해 표적 핵산 분자의 표적 서열에 지시될 수 있으며, 여기서 gRNA는 클래스 2 Cas 단백질과 혼성화되고 표적 서열을 절단한다. 일부 구체예에서, 가이드 RNA는 클래스 2 Cas 뉴클레이스와 혼성화되고 동족 PAM에 인접하거나 이를 포함하는 표적 서열을 절단한다. 일부 구체예에서, 표적 서열은 가이드 RNA의 표적화 서열에 상보적일 수 있다. 일부 구체예에서, 가이드 RNA의 표적화 서열 및 가이드 RNA에 혼성화되는 상응하는 표적 서열의 일부 사이의 상보성의 정도는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 가이드 RNA의 표적화 서열 및 가이드 RNA에 혼성화되는 상응하는 표적 서열의 일부 사이의 동일성 퍼센트는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 표적의 상동성 영역은 동족 PAM 서열에 인접한다. 일부 구체예에서, 표적 서열은 가이드 RNA의 표적화 서열과 100% 상보적인 서열을 포함할 수 있다. 다른 구체예에서, 표적 서열은 가이드 RNA의 표적화 서열과 비교하여 적어도 하나의 불일치, 결실 또는 삽입을 포함할 수 있다.
표적 서열의 길이는 사용된 뉴클레이스 시스템에 의존할 수 있다. 예를 들어, CRISPR/Cas 시스템에 대한 가이드 RNA의 표적화 서열은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50 초과의 뉴클레오타이드 길이를 포함할 수 있고 표적 서열은 상응하는 길이이며, 임의로 PAM 서열에 인접한다. 일부 구체예에서, 표적 서열은 15-24 뉴클레오타이드 길이를 포함할 수 있다. 일부 구체예에서, 표적 서열은 17-21 뉴클레오타이드 길이를 포함할 수 있다. 일부 구체예에서, 표적 서열은 20 뉴클레오타이드 길이를 포함할 수 있다. 닉케이스가 사용될 때, 표적 서열은 DNA 분자의 반대 가닥을 절단하는 한 쌍의 닉케이스에 의해 인식되는 한 쌍의 표적 서열을 포함할 수 있다. 일부 구체예에서, 표적 서열은 DNA 분자의 동일한 가닥을 절단하는 한 쌍의 닉케이스에 의해 인식되는 한 쌍의 표적 서열을 포함할 수 있다. 일부 구체예에서, 표적 서열은 하나 이상의 Cas 뉴클레이스에 의해 인식되는 한 쌍의 표적 서열의 일부를 포함할 수 있다.
표적 핵산 분자는 세포에 내인성 또는 외인성인 임의의 DNA 또는 RNA 분자일 수 있다. 일부 구체예에서, 표적 핵산 분자는 세포로부터의 또는 세포 안의 에피솜 DNA, 플라스미드, 게놈 DNA, 바이러스 게놈, 미토콘드리아 DNA, 또는 염색체 DNA일 수 있다. 일부 구체예에서, 표적 핵산 분자의 표적 서열은 인간 세포를 포함하는 세포로부터의 또는 세포 안의 게놈 서열일 수 있다.
추가의 구체예에서, 표적 서열은 바이러스 서열일 수 있다. 추가의 구체예에서, 표적 서열은 병원체 서열일 수 있다. 또 다른 구체예에서, 표적 서열은 합성된 서열일 수 있다. 추가의 구체예에서, 표적 서열은 염색체 서열일 수 있다. 특정 구체예에서, 표적 서열은 전위 접합(translocation junction), 예를 들어, 암과 관련된 전위를 포함할 수 있다. 일부 구체예에서, 표적 서열은 진핵생물 염색체, 예컨대 인간 염색체상에 있을 수 있다. 특정 구체예에서, 표적 서열은 간 세포에서 발현된다는 점에서 간-특이적 서열이다.
일부 구체예에서, 표적 서열은 유전자의 코딩 서열, 유전자의 인트론 서열, 조절 서열, 유전자의 전사 제어 서열, 유전자의 번역 제어 서열, 스플라이싱 자리 또는 유전자 사이의 비-코딩 서열에 위치할 수 있다. 일부 구체예에서, 유전자는 단백질 코딩 유전자일 수 있다. 다른 구체예에서, 유전자는 비-코딩 RNA 유전자일 수 있다. 일부 구체예에서, 표적 서열은 질병-관련 유전자의 전부 또는 일부를 포함할 수 있다. 일부 구체예에서, 표적 서열은 게놈 중의 비유전자 기능성 자리, 예를 들어 염색질 조직화의 양태를 제어하는 자리, 예컨대 스캐폴드 자리 또는 유전자자리 제어 영역에 위치할 수 있다.
클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 포함하는 구체예에서, 표적 서열은 프로토스페이서 인접 모티프(protospacer adjacent motif, "PAM")에 인접할 수 있다. 일부 구체예에서, PAM은 표적 서열의 3' 말단의 1, 2, 3, 또는 4, 뉴클레오타이드에 인접하거나 그 안에 있을 수 있다. PAM의 길이 및 서열은 사용된 Cas 단백질에 의존할 수 있다. 예를 들어, PAM은 Ran et al., Nature, 520: 186-191 (2015)의 도 1, 및 Zetsche 2015의 도 S5에 개시된 것을 포함하여, 특정 Cas9 단백질 또는 Cas9 오쏘로그에 대한 컨센서스 또는 특정 PAM 서열로부터 선택될 수 있으며, 각각의 관련 개시는 본원에 참조로 포함된다. 일부 구체예에서, PAM은 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 뉴클레오타이드 길이일 수 있다. 비제한적인 예시적인 PAM 서열은 NGG, NGGNG, NG, NAAAAN, NNAAAAW, NNNNACA, GNNNCNNA, TTN, 및 NNNNGATT를 포함한다 (여기서 N은 임의의 뉴클레오타이드로 정의되고, W는 A 또는 T로 정의된다). 일부 구체예에서, PAM 서열은 NGG일 수 있다. 일부 구체예에서, PAM 서열은 NGGNG일 수 있다. 일부 구체예에서, PAM 서열은 TTN일 수 있다. 일부 구체예에서, PAM 서열은 NNAAAAW일 수 있다.
지질 제제
CRISPR/Cas 카르고를 포함하여 RNA에 대한 LNP 제제의 다양한 구체예가 본원에 개시된다. 그러한 LNP 제제는 헬퍼 지질, 중성 지질, 및 PEG 지질과 함께 "아민 지질"을 포함한다. 일부 구체예에서, 그러한 LNP 제제는 헬퍼 지질 및 PEG 지질과 함께 "아민 지질"을 포함한다. 일부 구체예에서, LNP 제제는 1 퍼센트 미만의 중성 인지질을 포함한다. 일부 구체예에서, LNP 제제는 0.5 퍼센트 미만의 중성 인지질을 포함한다. "지질 나노입자"는 분자간 힘에 의해 서로 물리적으로 관련된 복수의 (즉 하나 초과의) 지질 분자를 포함하는 입자를 의미한다.
아민 지질
생물학적 활성제의 전달을 위한 LNP 조성물은 "아민 지질"을 포함하며, 이는 지질 A의 아세탈 유사체를 포함하여, 지질 A 또는 이의 등가물로 정의된다.
일부 구체예에서, 아민 지질은 지질 A이고, 이는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸) 프로필 옥타데카-9,12-디에노에이트이고, 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트로도 지칭된다. 지질 A는 다음과 같이 나타날 수 있다:
지질 A는 WO2015/095340(예를 들어, pp. 84-86)에 따라 합성될 수 있다. 특정 구체예에서, 아민 지질은 지질 A와 동등하다.
특정 구체예에서, 아민 지질은 지질 A의 유사체이다. 특정 구체예에서, 지질 A 유사체는 지질 A의 아세탈 유사체이다. 특정 LNP 조성물에서, 아세탈 유사체는 C4-C12 아세탈 유사체이다. 일부 구체예에서, 아세탈 유사체는 C5-C12 아세탈 유사체이다. 추가적인 구체예에서, 아세탈 유사체는 C5-C10 아세탈 유사체이다. 추가의 구체예에서, 아세탈 유사체는 C4, C5, C6, C7, C9, C10, C11, 및 C12 아세탈 유사체로부터 선택된다.
본원에 기재된 LNP에서 사용하기에 적합한 아민 지질은 생체 내에서 생분해성이고 RNA와 같은 생물학적 활성제를 세포에 전달하기에 적합하다. 아민 지질은 낮은 독성을 갖는다 (예를 들어, 10 mg/kg 이상의 RNA 카르고의 양으로 부작용 없이 동물 모델에서 허용된다). 특정 구체예에서, 아민 지질을 포함하는 LNP는 적어도 75%의 아민 지질이 8, 10, 12, 24, 또는 48 시간, 또는 3, 4, 5, 6, 7, 또는 10 일 이내에 혈장으로부터 제거되는 것을 포함한다. 특정 구체예에서, 아민 지질을 포함하는 LNP는 적어도 50%의 mRNA 또는 gRNA가 8, 10, 12, 24, 또는 48 시간, 또는 3, 4, 5, 6, 7, 또는 10 일 이내에 혈장으로부터 제거되는 것을 포함한다. 특정 구체예에서, 아민 지질을 포함하는 LNP는 적어도 50%의 LNP가, 예를 들어 지질(예를 들어, 아민 지질), RNA(예를 들어, mRNA), 또는 다른 성분을 측정함으로써 8, 10, 12, 24, 또는 48 시간, 또는 3, 4, 5, 6, 7, 또는 10 일 이내에 혈장으로부터 제거되는 것을 포함한다. 특정 구체예에서, LNP의 지질-캡슐화 대 유리 지질, RNA, 또는 핵산 성분이 측정된다.
지질 제거(clearance)는 문헌에 기재된 바와 같이 측정될 수 있다. Maier, M.A., et al. Biodegradable Lipids Enabling Rapidly Eliminated Lipid Nanoparticles for Systemic Delivery of RNAi Therapeutics. Mol. Ther. 2013, 21(8), 1570-78 ("Maier")를 참조하라. 예를 들어, Maier에서, 루시퍼레이스-표적화 siRNA를 포함하는 LNP-siRNA 시스템이 측부 꼬리 정맥을 통한 정맥 일시 주사에 의해 0.3 mg/kg으로 6 내지 8 주령 C57Bl/6 마우스 수컷에게 투여되었다. 혈액, 간, 및 비장 샘플이 투여 후 0.083, 0.25, 0.5, 1, 2, 4, 8, 24, 48, 96, 및 168 시간에 수집되었다. 조직 수집 전에 마우스에 식염수를 관류하고 혈액 샘플을 처리하여 혈장을 수득했다. 모든 샘플은 LC-MS에 의해 처리 및 분석되었다. 또한, Maier는 LNP-siRNA 제제의 투여 후 독성 평가를 위한 절차를 설명한다. 예를 들어, 루시퍼레이스-표적화 siRNA는 0, 1, 3, 5, 및 10 mg/kg(5 동물/그룹)로 단일 정맥 일시 주사를 통해 5 mL/kg의 용량 부피로 수컷 Sprague-Dawley 래트에게 투여되었다. 24 시간 후, 약 1 mL의 혈액을 의식이 있는 동물의 경정맥으로부터 수득하고 혈청을 단리했다. 투여 후 72 시간에, 모든 동물을 부검을 위해 안락사시켰다. 임상 징후, 체중, 혈청 화학, 장기 중량 및 조직병리의 평가를 수행했다. 비록 Maier가 siRNA-LNP 제제를 평가하는 방법을 설명하기는 하지만, 이러한 방법은 본 발명의 LNP 조성물 투여의 제거, 약동학, 및 독성을 평가하기 위해 적용될 수 있다.
아민 지질은 증가된 제거율(clearance rate)을 야기할 수 있다. 일부 구체예에서, 제거율은 지질 제거율이고, 예를 들어 지질이 혈액, 혈청, 또는 혈장으로부터 제거되는 속도이다. 일부 구체예에서, 제거율은 RNA 제거율이고, 예를 들어 mRNA 또는 gRNA가 혈액, 혈청, 또는 혈장으로부터 제거되는 속도이다. 일부 구체예에서, 제거율은 LNP가 혈액, 혈청, 또는 혈장으로부터 제거되는 속도이다. 일부 구체예에서, 제거율은 LNP가 조직, 예컨대 간 조직 또는 비장 조직으로부터 제거되는 속도이다. 특정 구체예에서, 높은 제거율은 실질적인 부작용 없이 안전성 프로파일을 유발한다. 아민 지질은 순환 및 조직에서 LNP 축적을 감소시킬 수 있다. 일부 구체예에서, 순환 및 조직에서 LNP 축적의 감소는 실질적인 부작용 없이 안전성 프로파일을 유발한다.
본 발명의 아민 지질은 이들이 존재하는 매질의 pH에 따라 이온화 가능하다 (예를 들어, 염을 형성할 수 있다). 예를 들어, 약간 산성인 매질에서, 아민 지질은 양성자화되어 양전하를 가질 수 있다. 반대로, 예를 들어, pH가 대략 7.35인 혈액과 같은 약간 염기성인 매질에서, 아민 지질은 양성자화되어 전하를 갖지 않을 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 적어도 약 9의 pH에서 양성자화될 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 적어도 약 9의 pH에서 양성자화될 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 적어도 약 10의 pH에서 양성자화될 수 있다.
아민 지질이 주로 양성자화되는 pH는 이의 고유의 pKa와 관련된다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.1 내지 약 7.4 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.5 내지 약 6.6 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.6 내지 약 6.4 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.8 내지 약 6.2 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.8 내지 약 6.5 범위의 pKa를 가질 수 있다. 아민 지질의 pKa는, 약 5.1 내지 약 7.4 범위의 pKa를 갖는 양이온성 지질이 예를 들어 간으로의 생체 내 카르고의 전달에 효과적인 것으로 밝혀졌으므로, LNP 제제화에서 중요한 고려사항이 될 수 있다. 또한, 약 5.3 내지 약 6.4 범위의 pKa를 갖는 양이온성 지질이, 예를 들어 종양으로의 생체 내 전달에 효과적인 것으로 밝혀졌다. 예를 들어, WO 2014/136086을 참조하라.
추가적인 지질
본 발명의 지질 조성물에서 사용하기에 적합한 "중성 지질"은, 예를 들어 다양한 중성, 비하전 또는 양쪽이온성 지질을 포함한다. 본 발명에서 사용하기에 적합한 중성 인지질의 예는 5-헵타데실벤젠-1,3-디올(레소르시놀), 디팔미토일포스파티딜콜린(DPPC), 디스테아로일포스파티딜콜린(DSPC), 포스포콜린(DOPC), 디미리스토일포스파티딜콜린(DMPC), 포스파티딜콜린(PLPC), 1,2-디스테아로일-sn-글리세로-3-포스포콜린 (DAPC), 포스파티딜에탄올아민(PE), 에그 포스파티딜콜린(EPC), 디라우릴로일포스파티딜콜린(DLPC), 디미리스토일포스파티딜콜린(DMPC), 1-미리스토일-2-팔미토일 포스파티딜콜린(MPPC), 1-팔미토일-2-미리스토일 포스파티딜콜린(PMPC), 1-팔미토일-2-스테아로일 포스파티딜콜린(PSPC), 1,2-디아라키도일-sn-글리세로-3-포스포콜린(DBPC), 1-스테아로일-2-팔미토일 포스파티딜콜린(SPPC), 1,2-디에이코세노일-sn-글리세로-3-포스포콜린(DEPC), 팔미토일올레오일 포스파티딜콜린(POPC), 리소포스파티딜 콜린, 디올레오일 포스파티딜에탄올아민(DOPE), 디리놀레오일포스파티딜콜린 디스테아로일포스파티딜에탄올아민(DSPE), 디미리스토일 포스파티딜에탄올아민(DMPE), 디팔미토일 포스파티딜에탄올아민(DPPE), 팔미토일올레오일 포스파티딜에탄올아민(POPE), 리소포스파티딜에탄올아민 및 이들의 조합을 포함하지만 이에 제한되지 않는다. 한 구체예에서, 중성 인지질은 디스테아로일포스파티딜콜린(DSPC) 및 디미리스토일 포스파티딜 에탄올아민(DMPE)으로 구성된 군으로부터 선택될 수 있다. 다른 구체예에서, 중성 인지질은 디스테아로일포스파티딜콜린(DSPC)일 수 있다. 다른 구체예에서, 중성 인지질은 디팔미토일포스파티딜콜린(DPPC)일 수 있다.
"헬퍼 지질"은 스테로이드, 스테롤, 및 알킬 레소르시놀을 포함한다. 본 발명에서 사용하기에 적합한 헬퍼 지질은 콜레스테롤, 5-헵타데실레소르시놀, 및 콜레스테롤 헤미석시네이트를 포함하지만 이에 제한되지 않는다. 한 구체예에서, 헬퍼 지질은 콜레스테롤일 수 있다. 한 구체예에서, 헬퍼 지질은 콜레스테롤 헤미석시네이트일 수 있다.
PEG 지질은 나노입자가 생체 내 (예를 들어, 혈액에서) 존재할 수 있는 시간의 길이를 변경하는 스텔스(stealth) 지질이다. PEG 지질은, 예를 들어 입자 응집을 감소시키고 입자 크기를 제어함으로써 제제 과정을 보조할 수 있다. 본원에 사용된 PEG 지질은 LNP의 약동학적 특성을 조절할 수 있다. 전형적으로, PEG 지질은 지질 모이어티 및 PEG에 기반한 고분자 모이어티를 포함한다.
일부 구체예에서, 지질 모이어티는 약 C4 내지 약 C40 포화 또는 불포화 탄소 원자를 독립적으로 포함하는 알킬 사슬 길이를 갖는 디알킬글리세롤 또는 디알킬글리카미드 기를 포함하는 것을 포함하여, 디아실글리세롤 또는 디아실글리카미드로부터 유래할 수 있고, 여기서 사슬은 예를 들어 아미드 또는 에스테르와 같은 하나 이상의 작용기를 포함할 수 있다. 일부 구체예에서, 알킬 사슬 길이는 약 C10 내지 C20를 포함한다. 디알킬글리세롤 또는 디알킬글리카미드 기는 하나 이상의 치환된 알킬 기를 추가로 포함할 수 있다. 사슬 길이는 대칭 또는 비대칭일 수 있다.
달리 지시되지 않는 한, 본원에서 사용된 용어 "PEG"는 임의의 폴리에틸렌 글리콜 또는 다른 폴리알킬렌 에테르 고분자를 의미한다. 한 구체예에서, PEG 모이어티는 에틸렌 글리콜 또는 에틸렌 옥사이드의 임의로 치환된 선형 또는 분지형 고분자이다. 특정 구체예에서, PEG 모이어티는 대안적이고, PEG 모이어티는 예를 들어 하나 이상의 알킬, 알콕시, 아실, 하이드록시, 또는 아릴 기에 의해 치환될 수 있다. 한 구체예에서, PEG 모이어티는 PEG 공중합체, 예컨대 PEG-폴리우레탄 또는 PEG-폴리프로필렌을 포함한다 (예를 들어, J. Milton Harris, Poly(ethylene glycol) chemistry: biotechnical and biomedical applications (1992)를 참조하라); 대안적으로, PEG 모이어티는 PEG 공중합체를 포함하지 않으며, 예를 들어, 이는 PEG 단일중합체일 수 있다. 한 구체예에서, PEG는 약 130 내지 약 50,000, 하위구체예에서, 약 150 내지 약 30,000, 하위구체예에서, 약 150 내지 약 20,000, 하위구체예에서 약 150 내지 약 15,000, 하위구체예에서, 약 150 내지 약 10,000, 하위구체예에서, 약 150 내지 약 6,000, 하위구체예에서, 약 150 내지 약 5,000, 하위구체예에서, 약 150 내지 약 4,000, 하위구체예에서, 약 150 내지 약 3,000, 하위구체예에서, 약 300 내지 약 3,000, 하위구체예에서, 약 1,000 내지 약 3,000, 및 하위구체예에서, 약 1,500 내지 약 2,500의 분자량을 갖는다.
특정 구체예에서, (예를 들어, 지질 모이어티 또는 지질, 예컨대 스텔스 지질과 접합된) PEG는 "PEG 2000"로도 명명되는 "PEG-2K"이며 이는 약 2,000 달톤의 평균 분자량을 갖는다. PEG-2K는 본원에서 하기 화학식 (I)로 나타나며, 여기서 n은 45이고, 이는 수평균 중합도가 약 45 서브유닛을 포함함을 의미한다 . 그러나, 예를 들어, 수평균 중합도가 약 23 서브유닛(n=23), 및/또는 68 서브유닛(n=68)을 포함하는 것을 포함하여 당해 분야에 공지인 다른 PEG 구체예가 사용될 수 있다. 일부 구체예에서, n은 약 30 내지 약 60 범위일 수 있다. 일부 구체예에서, n은 약 35 내지 약 55 범위일 수 있다. 일부 구체예에서, n은 약 40 내지 약 50 범위일 수 있다. 일부 구체예에서, n은 약 42 내지 약 48 범위일 수 있다. 일부 구체예에서, n은 45일 수 있다. 일부 구체예에서, R은 H, 치환된 알킬, 및 비치환 알킬로부터 선택될 수 있다. 일부 구체예에서, R은 비치환 알킬일 수 있다. 일부 구체예에서, R은 메틸일 수 있다.
본원에 기재된 임의의 구체예에서, PEG 지질은 PEG-디라우로일글리세롤, PEG-디미리스토일글리세롤 (PEG-DMG) (NOF, Tokyo, Japan의 카탈로그 # GM-020), PEG-디팔미토일글리세롤, PEG-디스테아로일글리세롤 (PEG-DSPE) (카탈로그 # DSPE-020CN, NOF, Tokyo, Japan), PEG-디라우릴글리카미드, PEG-디미리스틸글리카미드, PEG-디팔미토일글리카미드, 및 PEG-디스테아로일글리카미드, PEG-콜레스테롤 (1-[8'-(콜레스트-5-엔-3[베타]-옥시)카르복스아미도-3',6'-디옥사옥타닐]카르바모일-[오메가]-메틸-폴리(에틸렌 글리콜), PEG-DMB (3,4-디테트라데콕실벤질-[오메가]-메틸-폴리(에틸렌 글리콜)에테르), 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000] (PEG2k-DMG) (Avanti Polar Lipids, Alabaster, Alabama, USA의 cat. #880150P), 1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000] (PEG2k-DSPE) (Avanti Polar Lipids, Alabaster, Alabama, USA의 cat. #880120C), 1,2-디스테아로일-sn-글리세롤, 메톡시폴리에틸렌 글리콜 (PEG2k-DSG; GS-020, NOF Tokyo, Japan), 폴리(에틸렌 글리콜)-2000-디메타크릴레이트 (PEG2k-DMA), 및 1,2-디스테아릴옥시프로필-3-아민-N-[메톡시(폴리에틸렌 글리콜)-2000] (PEG2k-DSA)로부터 선택될 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DMG일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-DSG일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DSPE일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DMA일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-C-DMA일 수 있다. 한 구체예에서, PEG 지질은 WO2016/010840에서 단락 [00240] 내지 [00244]에 개시된 화합물 S027일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DSA일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-C11일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-C14일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-C16일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-C18일 수 있다.
LNP 제제
본 발명의 구체예는 제제 중 성분 지질의 각각의 몰비에 따라 기재된 지질 조성물을 제공한다. 한 구체예에서, 아민 지질의 mol-%는 약 30 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 40 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 45 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 50 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 55 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 50 mol-% 내지 약 55 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 50 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 55 mol-%일 수 있다. 일부 구체예에서, LNP 배치의 아민 지질 mol-%는 표적 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 일부 구체예에서, LNP 배치의 아민 지질 mol-%는 표적 mol-%의 ±4 mol-%, ±3 mol-%, ±2 mol-%, ±1.5 mol-%, ±1 mol-%, ±0.5 mol-%, 또는 ±0.25 mol-%일 것이다. 모든 mol-% 수는 LNP 조성물의 지질 성분의 분율로서 주어진다. 특정 구체예에서, 아민 지질 mol-% 의 LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.
한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 5 mol-% 내지 약 15 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 7 mol-% 내지 약 12 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0 mol-% 내지 약 5 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 5 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 8 mol-% 내지 약 10 mol-%일 수 있다.
한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 5 mol-%, 약 6 mol-%, 약 7 mol-%, 약 8 mol-%, 약 9 mol-%, 약 10 mol-%, 약 11 mol-%, 약 12 mol-%, 약 13 mol-%, 약 14 mol-%, 또는 약 15 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 9 mol-%일 수 있다.
한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 1 mol-% 내지 약 5 mol-%일 수 있다. 한 구체예에서, 중성 지질의 mol-%는 약 0.1 mol-% 내지 약 1 mol-%일 수 있다. 한 구체예에서, 중성 인지질과 같은 중성 지질의 mol-%는 약 0.1 mol-%, 약 0.2 mol-%, 약 0.5 mol-%, 1 mol-%, 약 1.5 mol-%, 약 2 mol-%, 약 2.5 mol-%, 약 3 mol-%, 약 3.5 mol-%, 약 4 mol-%, 약 4.5 mol-%, 또는 약 5 mol-%일 수 있다.
한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 1 mol-% 미만일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0.5 mol-% 미만일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0 mol-%, 약 0.1 mol-%, 약 0.2 mol-%, 약 0.3 mol-%, 약 0.4 mol-%, 약 0.5 mol-%, 약 0.6 mol-%, 약 0.7 mol-%, 약 0.8 mol-%, 약 0.9 mol-%, 또는 약 1 mol-%일 수 있다. 일부 구체예에서, 본원에 개시된 제제에는 중성 지질이 없다 (즉, 0 mol-% 중성 지질). 일부 구체예에서, 본원에 개시된 제제에는 중성 지질이 본질적으로 없다 (즉, 약 0 mol-% 중성 지질). 일부 구체예에서, 본원에 개시된 제제에는 중성 인지질이 없다 (즉, 0 mol-% 중성 인지질). 일부 구체예에서, 본원에 개시된 제제에는 중성 인지질이 본질적으로 없다 (즉, 약 0 mol-% 중성 인지질).
일부 구체예에서, LNP 배치의 중성 지질 mol-%는 표적 중성 지질 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.
한 구체예에서, 헬퍼 지질의 mol-%는 약 20 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 25 mol-% 내지 약 55 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 25 mol-% 내지 약 50 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 25 mol-% 내지 약 40 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 30 mol-% 내지 약 50 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 30 mol-% 내지 약 40 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 아민 지질, 중성 지질, 및 PEG 지질 농도를 기준으로 조정되어 지질 성분을 100 mol-%로 만든다. 한 구체예에서, 헬퍼 지질의 mol-%는 아민 지질 및 PEG 지질 농도를 기준으로 조정되어 지질 성분을 100 mol-%로 만든다. 한 구체예에서, 헬퍼 지질의 mol-%는 아민 지질 및 PEG 지질 농도를 기준으로 조정되어 지질 성분을 적어도 99 mol-%로 만든다. 일부 구체예에서, LNP 배치의 헬퍼 mol-%는 표적 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.
한 구체예에서, PEG 지질의 mol-%는 약 1 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2 mol-% 내지 약 8 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2 mol-% 내지 약 4 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2.5 mol-% 내지 약 4 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 3 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2.5 mol-%일 수 있다. 일부 구체예에서, LNP 배치의 PEG 지질 mol-%는 표적 PEG 지질 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.
특정 구체예에서, 카르고는 RNA-유도 DNA-결합제를 인코딩하는 mRNA(예를 들어 Cas 뉴클레이스, 클래스 2 Cas 뉴클레이스, 또는 Cas9), 및 gRNA 또는 gRNA를 인코딩하는 핵산, 또는 mRNA 및 gRNA의 조합을 포함한다. 한 구체예에서, LNP 조성물은 지질 A 또는 이의 등가물을 포함할 수 있다. 일부 양태에서, 아민 지질은 지질 A이다. 일부 양태에서, 아민 지질은 지질 A 등가물, 예를 들어 지질 A의 유사체이다. 특정 양태에서, 아민 지질은 지질 A의 아세탈 유사체이다. 다양한 구체예에서, LNP 조성물은 아민 지질, 중성 지질, 헬퍼 지질, 및 PEG 지질을 포함한다. 특정 구체예에서, 헬퍼 지질은 콜레스테롤이다. 특정 구체예에서, 중성 지질은 DSPC이다. 특정 구체예에서, PEG 지질은 PEG2k-DMG이다. 일부 구체예에서, LNP 조성물은 지질 A, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 일부 구체예에서, LNP 조성물은 아민 지질, DSPC, 콜레스테롤, 및 PEG 지질을 포함한다. 일부 구체예에서, LNP 조성물은 DMG를 포함하는 PEG 지질을 포함한다. 특정 구체예에서, 아민 지질은 지질 A, 및 지질 A의 아세탈 유사체를 포함하는 지질 A의 등가물로부터 선택된다. 추가적인 구체예에서, LNP 조성물은 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG를 포함한다.
다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함한다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 인지질, 및 PEG 지질을 포함한다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질로 구성된 지질 성분을 포함한다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함한다. 특정 구체예에서, LNP 조성물은 중성 인지질과 같은 중성 지질을 포함하지 않는다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질로 구성된 지질 성분을 포함한다. 특정 구체예에서, 중성 지질은 DSPC, DPPC, DAPC, DMPC, DOPC, DOPE, 및 DSPE 중 하나 이상으로부터 선택된다. 특정 구체예에서, 중성 지질은 DSPC이다. 특정 구체예에서, 중성 지질은 DPPC이다. 특정 구체예에서, 중성 지질은 DAPC이다. 특정 구체예에서, 중성 지질은 DMPC이다. 특정 구체예에서, 중성 지질은 DOPC이다. 특정 구체예에서, 중성 지질은 DOPE이다. 특정 구체예에서, 중성 지질은 DSPE이다. 특정 구체예에서, 헬퍼 지질은 콜레스테롤이다. 특정 구체예에서, PEG 지질은 PEG2k-DMG이다. 일부 구체예에서, LNP 조성물은 지질 A, 헬퍼 지질, 및 PEG 지질을 포함할 수 있다. 일부 구체예에서, LNP 조성물은 지질 A, 헬퍼 지질, 및 PEG 지질로 구성된 지질 성분을 포함할 수 있다. 일부 구체예에서, LNP 조성물은 아민 지질, 콜레스테롤, 및 PEG 지질을 포함한다. 일부 구체예에서, LNP 조성물은 아민 지질, 콜레스테롤, 및 PEG 지질로 구성된 지질 성분을 포함한다. 일부 구체예에서, LNP 조성물은 DMG를 포함하는 PEG 지질을 포함한다. 특정 구체예에서, 아민 지질은 지질 A, 및 지질 A의 아세탈 유사체를 포함하는 지질 A의 등가물로부터 선택된다. 특정 구체예에서, 아민 지질은 지질 A의 C5-C12 또는 C4-C12 아세탈 유사체이다. 추가적인 구체예에서, LNP 조성물은 지질 A, 콜레스테롤, 및 PEG2k-DMG를 포함한다.
본 발명의 구체예는 아민 지질의 양으로 하전된 아민 기(N) 및 캡슐화될 핵산의 음으로 하전된 포스페이트 기(P) 사이의 몰비에 따라 기재된 지질 조성물을 또한 제공한다. 이는 식 N/P에 의해 수학적으로 표현될 수 있다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함하는 지질 성분; 및 핵산 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함하는 지질 성분; 및 핵산 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 헬퍼 지질을 포함하는 지질 성분; 및 RNA 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함하는 지질 성분; 및 RNA 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 한 구체예에서, N/P 비율은 약 5 내지 7일 수 있다. 한 구체예에서, N/P 비율은 약 3 내지 7일 수 있다. 한 구체예에서, N/P 비율은 약 4.5 내지 8일 수 있다. 한 구체예에서, N/P 비율은 약 6일 수 있다. 한 구체예에서, N/P 비율은 6 ± 1일 수 있다. 한 구체예에서, N/P 비율은 6 ± 0.5일 수 있다. 일부 구체예에서, N/P 비율은 표적 N/P 비율의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.
일부 구체예에서, 핵산 성분, 예를 들어 RNA 성분은 mRNA, 예컨대 Cas 뉴클레이스를 인코딩하는 mRNA를 포함할 수 있다. RNA 성분은임의로 추가적인 핵산 및/또는 단백질, 예를 들어 RNP 카르고와 함께 RNA를 포함한다. 한 구체예에서, RNA는 Cas9 mRNA를 포함한다. Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 일부 조성물에서, LNP는 gRNA 핵산, 예컨대 gRNA를 추가로 포함한다. 일부 구체예에서, RNA 성분은 Cas 뉴클레이스 mRNA 및 gRNA를 포함한다. 일부 구체예에서, RNA 성분은 클래스 2 Cas 뉴클레이스 mRNA 및 gRNA를 포함한다.
특정 구체예에서, LNP 조성물은 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA, 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 특정 구체예에서, LNP 조성물은 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA, 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함할 수 있다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 특정 LNP 조성물에서, 헬퍼 지질은 콜레스테롤이다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 다른 조성물에서, 중성 지질은 DSPC이다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 추가적인 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 특정 조성물에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.
일부 구체예에서, LNP 조성물은 gRNA를 포함할 수 있다. 특정 구체예에서, LNP 조성물은 아민 지질, gRNA, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 특정 구체예에서, LNP 조성물은 아민 지질, gRNA, 헬퍼 지질, 및 PEG 지질을 포함할 수 있다. gRNA를 포함하는 특정 LNP 조성물에서, 헬퍼 지질은 콜레스테롤이다. gRNA를 포함하는 일부 조성물에서, 중성 지질은 DSPC이다. gRNA를 포함하는 추가의 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 특정 구체예에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.
한 구체예에서, LNP 조성물은 sgRNA를 포함할 수 있다. 한 구체예에서, LNP 조성물은 Cas9 sgRNA를 포함할 수 있다. 한 구체예에서, LNP 조성물은 Cpf1 sgRNA를 포함할 수 있다. sgRNA를 포함하는 일부 조성물에서, LNP는 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함한다. sgRNA를 포함하는 일부 조성물에서, LNP는 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함한다. sgRNA를 포함하는 특정 조성물에서, 헬퍼 지질은 콜레스테롤이다. sgRNA를 포함하는 다른 조성물에서, 중성 지질은 DSPC이다. sgRNA를 포함하는 추가적인 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 특정 구체예에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.
특정 구체예에서, LNP 조성물은 Cas 뉴클레이스를 인코딩하는 mRNA 및 sgRNA일 수 있는 gRNA를 포함한다. 한 구체예에서, LNP 조성물은 아민 지질, Cas 뉴클레이스를 인코딩하는 mRNA, gRNA, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질로 구성된 지질 성분; 및 Cas 뉴클레이스를 인코딩하는 mRNA, 및 gRNA로 구성된 핵산 성분을 포함할 수 있다. 한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질로 구성된 지질 성분; 및 Cas 뉴클레이스를 인코딩하는 mRNA, 및 gRNA로 구성된 핵산 성분을 포함할 수 있다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 특정 조성물에서, 헬퍼 지질은 콜레스테롤이다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 일부 조성물에서, 중성 지질은 DSPC이다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 특정 조성물은 약 1 mol-% 미만의 중성 지질, 예를 들어 중성 인지질을 포함한다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 특정 조성물은 약 0.5 mol-% 미만의 중성 지질, 예를 들어 중성 인지질을 포함한다. 특정 조성물에서, LNP는 중성 지질, 예를 들어, 중성 인지질을 포함하지 않는다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 추가적인 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 특정 구체예에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.
특정 구체예에서, LNP 조성물은 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas mRNA 및 적어도 하나의 gRNA를 포함한다. 특정 구체예에서, LNP 조성물은 약 25:1 내지 약 1:25의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA의 비율을 포함한다. 특정 구체예에서, LNP 제제는 약 10:1 내지 약 1:10의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA의 비율을 포함한다. 특정 구체예에서, LNP 제제는 약 8:1 내지 약 1:8의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA의 비율을 포함한다. 본원에서 측정된 비율은 중량 기준이다. 일부 구체예에서, LNP 제제는 약 5:1 내지 약 1:5의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas mRNA의 비율을 포함한다. 일부 구체예에서, 비율 범위는 약 3:1 내지 1:3, 약 2:1 내지 1:2, 약 5:1 내지 1:2, 약 5:1 내지 1:1, 약 3:1 내지 1:2, 약 3:1 내지 1:1, 약 3:1, 약 2:1 내지 1:1이다. 일부 구체예에서, gRNA 대 mRNA 비율은 약 3:1 또는 약 2:1이다. 일부 구체예에서 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스의 비율은 약 1:1이다. 비율은 약 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10, 또는 1:25일 수 있다.
본원에 개시된 LNP 조성물은 주형 핵산을 포함할 수 있다. 주형 핵산은 Cas 뉴클레이스를 인코딩하는 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA와 공동-제제화될 수 있다. 일부 구체예에서, 주형 핵산은 가이드 RNA와 공동-제제화될 수 있다. 일부 구체예에서, 주형 핵산은 Cas 뉴클레이스를 인코딩하는 mRNA 및 가이드 RNA 둘 모두와 공동-제제화될 수 있다. 일부 구체예에서, 주형 핵산은 Cas 뉴클레이스를 인코딩하는 mRNA 또는 가이드 RNA와 별도로 제제화될 수 있다. 주형 핵산은 LNP 조성물과 함께 또는 별도로 전달될 수 있다. 일부 구체예에서, 주형 핵산은 원하는 복구 메커니즘에 따라 단일- 또는 이중-가닥일 수 있다. 주형은 표적 DNA, 또는 표적 DNA에 인접한 서열에 대한 상동성 영역을 가질 수 있다.
일부 구체예에서, LNP는 수성 RNA 용액을 유기 용매계 지질 용액, 예를 들어, 100% 에탄올과 혼합하여 형성된다. 적합한 용액 또는 용매는 물, PBS, Tris 버퍼, NaCl, 시트레이트 버퍼, 에탄올, 클로로포름, 디에틸에테르, 사이클로헥산, 테트라하이드로퓨란, 메탄올, 이소프로판올을 포함하거나 함유할 수 있다. 예를 들어, LNP의 생체 내 투여를 위한 약제학적으로 허용되는 버퍼가 사용될 수 있다. 특정 구체예에서, 버퍼는 LNP를 포함하는 조성물의 pH를 pH 6.5 이상으로 유지하기 위해 사용된다. 특정 구체예에서, 버퍼는 LNP를 포함하는 조성물의 pH를 pH 7.0 이상으로 유지하기 위해 사용된다. 특정 구체예에서, 조성물은 약 7.2 내지 약 7.7 범위의 pH를 갖는다. 추가적인 구체예에서, 조성물은 약 7.3 내지 약 7.7 범위 또는 약 7.4 내지 약 7.6 범위의 pH를 갖는다. 추가의 구체예에서, 조성물은 약 7.2, 7.3, 7.4, 7.5, 7.6, 또는 7.7의 pH를 갖는다. 조성물의 pH는 마이크로 pH 프로브로 측정될 수 있다. 특정 구체예에서, 동결보호제(cryoprotectant )가 조성물에 포함된다. 동결보호제의 비제한적 예는 수크로스, 트레할로스, 글리세롤, DMSO, 및 에틸렌 글리콜을 포함한다. 예시적인 조성물은 예를 들어, 수크로스와 같은 최대 10% 동결보호제를 포함할 수 있다. 특정 구체예에서, LNP 조성물은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10% 동결보호제를 포함할 수 있다. 특정 구체예에서, LNP 조성물은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10% 수크로스를 포함할 수 있다. 일부 구체예에서, LNP 조성물은 버퍼를 포함할 수 있다. 일부 구체예에서, 버퍼는 포스페이트 버퍼(PBS), Tris 버퍼, 시트레이트 버퍼, 또는 이들의 혼합을 포함할 수 있다. 특정한 예시적인 구체예에서, 버퍼는 NaCl을 포함한다. 특정 구체예에서, NaCl이 생략된다. NaCl의 예시적인 양은 약 20 mM 내지 약 45 mM 범위일 수 있다. NaCl의 예시적인 양은 약 40 mM 내지 약 50 mM 범위일 수 있다. 일부 구체예에서, NaCl의 양은 약 45 mM이다. 일부 구체예에서, 버퍼는 Tris 버퍼이다. Tris의 예시적인 양은 약 20 mM 내지 약 60 mM 범위일 수 있다. Tris의 예시적인 양은 약 40 mM 내지 약 60 mM 범위일 수 있다. 일부 구체예에서, Tris의 양은 약 50 mM이다. 일부 구체예에서, 버퍼는 NaCl 및 Tris를 포함한다. LNP 조성물의 특정한 예시적인 구체예는 Tris 버퍼 중에 5% 수크로스 및 45 mM NaCl을 함유한다. 다른 예시적인 구체예에서, 조성물은 약 5% w/v의 양의 수크로스, 약 45 mM NaCl, 및 pH 7.5의 약 50 mM Tris를 함유한다. 염, 버퍼, 및 동결보호제 양은 전체 제제의 삼투질농도(osmolality)가 유지되도록 변할 수 있다. 예를 들어, 최종 삼투질농도는 450 mOsm/L 미만에서 유지될 수 있다. 추가의 구체예에서, 삼투질농도는 350 내지 250 mOsm/L이다. 특정 구체예는 300 +/- 20 mOsm/L의 최종 삼투질농도를 갖는다.
일부 구체예에서, 미세유체 혼합, T-혼합, 또는 교차-혼합이 사용된다. 특정 양태에서, 유량, 접합 크기, 접합 기하구조, 접합 형태, 관 직경, 용액, 및/또는 RNA 및 지질 농도가 변할 수 있다. LNP 또는 LNP 조성물은 예를 들어 투석, 접선 유동 여과, 또는 크로마토그래피를 통해 농축 또는 정제될 수 있다. LNP는 예를 들어 현탁액, 유탁액(emulsion), 또는 동결건조 분말로서 보관될 수 있다. 일부 구체예에서, LNP 조성물은 2-8℃에서 보관되고, 특정 양태에서, LNP 조성물은 실온에서 보관된다. 추가적인 구체예에서, LNP 조성물은 예를 들어 -20℃ 또는 -80℃에서 냉동 보관된다. 다른 구체예에서, LNP 조성물은 약 0℃ 내지 약 -80℃ 범위의 온도에서 보관된다. 냉동된 LNP 조성물은, 예를 들어 얼음에서, 실온에서 또는 25℃에서 사용 전에 해동될 수 있다.
LNP는 예를 들어 미소구체(단층 및 다층 막소포(unilamellar and multilamellar vesicles), 예를 들어, "리포솜" 포함- 일부 구체예에서, 실질적으로 구형인 층상 지질 이중층- 보다 특정한 구체예에서, 예를 들어 상당 부분의 RNA 분자를 포함하는 수성 코어를 포함할 수 있음), 유탁액 중의 분산상, 미셀, 또는 현탁액 중의 내부상일 수 있다.
또한, LNP 조성물은 치료적 유효 용량에서 생체 내 세포독성 수준으로 축적되지 않는다는 점에서 생분해성이다. 일부 구체예에서, LNP 조성물은 치료 용량 수준에서 실질적인 부작용을 유발하는 선천성 면역 반응을 야기하지 않는다. 일부 구체예에서, 본원에 제공된 LNP 조성물은 치료 용량 수준에서 독성을 야기하지 않는다.
일부 구체예에서, pdi는 약 0.005 내지 약 0.75 범위일 수 있다. 일부 구체예에서, pdi는 약 0.01 내지 약 0.5 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.4 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.35 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.35 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.3 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.25 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.2 범위일 수 있다. 일부 구체예에서, pdi는 약 0.08, 0.1, 0.15, 0.2, 또는 0.4 미만일 수 있다.
본원에 개시된 LNP는 약 1 내지 약 250 nm의 크기(예를 들어, Z-평균 직경)를 갖는다. 일부 구체예에서, LNP는 약 10 내지 약 200 nm의 크기를 갖는다. 추가의 구체예에서, LNP는 약 20 내지 약 150nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 50 내지 약 150 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 50 내지 약 100 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 50 내지 약 120 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 60 내지 약 100 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 75 내지 약 150 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 75 내지 약 120 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 75 내지 약 100 nm의 크기를 갖는다. 달리 지시되지 않는 한, 본원에서 언급된 모든 크기는 Malvern Zetasizer에서 동적 광산란에 의해 측정된 완전히 형성된 나노입자의 평균 크기(직경)이다. 나노입자 샘플은 계수율이 대략 200-400 kcp가 되도록 포스페이트 완충 식염수(PBS)에 희석된다. 데이터는 강도 측정의 가중 평균(Z-평균 직경)으로 나타난다.
일부 구체예에서, LNP는 약 50% 내지 약 100% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 50% 내지 약 70% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 70% 내지 약 90% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 90% 내지 약 100% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 75% 내지 약 95% 범위의 평균 캡슐화 효율로 형성된다.
일부 구체예에서, LNP는 약 1.00E+05 g/mol 내지 약 1.00E+10 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 5.00E+05 g/mol 내지 약 7.00E+07 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 1.00E+06 g/mol 내지 약 1.00E+10 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 1.00E+07 g/mol 내지 약 1.00E+09 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 5.00E+06 g/mol 내지 약 5.00E+09 g/mol 범위의 평균 분자량으로 형성된다.
일부 구체예에서, 다분산도(Mw/Mn; 중량평균 몰질량(Mw) 대 수평균 몰질량(Mn)의 비율)은 약 1.000 내지 약 2.000 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.00 내지 약 1.500 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.020 내지 약 1.400 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.010 내지 약 1.100 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.100 내지 약 1.350 범위일 수 있다.
세포 조작 방법; 조작된 세포
본원에 개시된 LNP 조성물은 생체내 및 시험관내 모두에서 유전자 편집을 통한 세포 조작 방법에서 사용될 수 있다. 일부 구체예에서, 방법은 세포를 본원에 기재된 LNP 조성물과 접촉시키는 것을 포함한다.
일부 구체예에서, 방법은 대상, 예컨대 포유동물, 예컨대 인간에서 세포를 접촉시키는 것을 포함한다. 일부 구체예에서, 세포는 기관, 예컨대 간, 예컨대 포유동물 간, 예컨대 인간 간에 있다. 일부 구체예에서, 세포는 간 세포(liver cell), 예컨대 포유동물 간 세포, 예컨대 인간 간 세포이다. 일부 구체예에서, 세포는 간세포(hepatocyte), 예컨대 포유동물 간세포, 예컨대 인간 간세포이다. 일부 구체예에서, 간 세포는 줄기 세포이다. 일부 구체예에서, 인간 간 세포는 간 동양 내피세포(liver sinusoidal endothelial cell, LSEC)일 수 있다. 일부 구체예에서, 인간 간 세포는 쿠퍼(Kupffer) 세포일 수 있다. 일부 구체예에서, 인간 간 세포는 간 성상 세포(hepatic stellate cell)일 수 있다. 일부 구체예에서, 인간 간 세포는 종양 세포일 수 있다. 일부 구체예에서, 인간 간 세포는 간 줄기 세포일 수 있다. 추가적인 구체예에서, 세포는 ApoE-결합 수용체를 포함한다. 일부 구체예에서, 간세포(hepatocyte)와 같은 간의 세포(liver cell)는 제자리에 있다(in situ). 일부 구체예에서, 간세포와 같은 간 세포는 예를 들어 배양, 예컨대 일차 배양에서 단리된다. 본원에 개시된 용도에 상응하는 방법이 또한 제공되고, 이는 본원에 개시된 LNP 조성물을 대상에게 투여하는 것 또는 상기 기재된 것과 같은 세포를 본원에 개시된 LNP 조성물과 접촉시키는 것을 포함한다.
일부 구체예에서, 조작된 세포, 예를 들어 이전 단락의 세포 유형 중 임의의 하나로부터 유리한 조작된 세포가 제공된다. 그러한 조작된 세포는 본원에 기재된 방법에 따라 생성된다. 일부 구체예에서, 조작된 세포는 대상 내의 조직 또는 기관, 예를 들어 간 내에 존재한다.
본원에 기재된 일부 방법 및 세포에서, 세포는 표적 서열에서 뉴클레오타이드의 변형, 예를 들어 삽입 또는 결실 ("인델(indel)") 또는 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4 또는 5 개 또는 그 이상의 뉴클레오타이드의 삽입을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 삽입을 포함한다. 다른 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 틀이동(frameshift) 돌연변이를 야기하는 인델을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 주형 핵산, 예를 들어 임의의 본원에 기재된 주형 핵산의 혼입에서 기인한 뉴클레오타이드의 삽입, 결실, 또는 치환 중 하나 이상을 포함한다.
일부 구체예에서, 조작된 세포를 포함하는 세포의 집단, 예를 들어 본원에 기재된 방법에 따라 조작된 세포를 포함하는 세포의 집단이 제공된다. 일부 구체예에서, 집단은 시험관내 배양된 조작된 세포를 포함한다. 일부 구체예에서, 집단은 대상 내의 조직 또는 기관, 예를 들어 간 내에 존재한다. 일부 구체예에서, 집단 내의 세포의 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 또는 그 이상이 조작된다. 특정 구체예에서, 본원에 개시된 방법은 인델의 검출에 의해 정의된 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 편집 효율(또는 "편집 퍼센트")을 야기한다. 다른 구체예에서, 본원에 개시된 방법은 삽입, 결실, 치환 또는 다른 방식에 의한 서열 변화 검출에 의해 정의된 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% DNA 변형 효율을 야기한다. 특정 구체예에서, 본원에 개시된 방법은 세포 집단에서 약 5% 내지 약 100%, 약 10% 내지 약 50%, 약 20 내지 약 100%, 약 20 내지 약 80%, 약 40 내지 약 100%, 또는 약 40 내지 약 80%의 편집 효율 수준 또는 DNA 변형 효율 수준을 야기한다.
본원에 기대된 방법 및 세포 중 일부에서, 집단 내의 세포는 표적 서열에서 변형, 예를 들어 인델 또는 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4 또는 5 개 또는 그 이상의 뉴클레오타이드의 삽입을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 삽입을 포함한다. 다른 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 틀이동 돌연변이를 야기한다. 일부 구체예에서, 변형은 표적 서열에서 틀이동 돌연변이를 야기하는 인델을 포함한다. 일부 구체예에서, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 또는 그 이상의 집단 중의 조작된 세포가 틀이동 돌연변이를 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 주형 핵산, 예를 들어 임의의 본원에 기재된 주형 핵산의 혼입에서 기인한 뉴클레오타이드의 삽입, 결실, 또는 치환 중 하나 이상을 포함한다.
유전자 편집 방법
본원에 개시된 LNP 조성물은 생체내 및 시험관내 유전자 편집에 사용될 수 있다. 한 구체예에서, 본원에 기재된 하나 이상의 LNP 조성물은 이를 필요로 하는 대상에게 투여될 수 있다. 한 구체예에서, 본원에 기재된 하나 이상의 LNP 조성물은 세포와 접촉할 수 있다. 한 구체예에서, 본원에 기재된 치료적 유효량의 조성물이 이를 필요로 하는 대상의 세포와 접촉할 수 있다. 한 구체예에서, 유전자 조작된 세포는 세포를 본원에 기재된 LNP 조성물과 접촉시켜 생성될 수 있다. 다양한 구체예에서, 방법은 상기 제시된 바와 같이 주형 핵산을 세포 또는 대상에게 도입하는 것을 포함한다.
일부 구체예에서, 방법은 LNP 조성물을 간 장애(disorder)와 관련된 세포에 투여하는 것을 포함한다. 일부 구체예에서, 방법은 간 장애를 치료하는 것을 포함한다. 특정 구체예에서, 방법은 간 세포(hepatic cell)를 LNP 조성물과 접촉시키는 것을 포함한다. 특정 구체예에서, 방법은 간세포(hepatocyte)를 LNP 조성물과 접촉시키는 것을 포함한다. 일부 구체예에서, 방법은 ApoE 결합 세포를 LNP 조성물과 접촉시키는 것을 포함한다.
한 구체예에서, 클래스 2 Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 LNP 조성물은 세포, 예컨대 ApoE 결합 세포에 투여될 수 있다. 추가적인 구체예에서, 주형 핵산이 또한 세포에 도입된다. 특정 예에서, 클래스 2 Cas 뉴클레이스 및 sgRNA를 포함하는 LNP 조성물은 세포, 예컨대 ApoE 결합 세포에 투여될 수 있다. 한 구체예에서, 클래스 2 Cas 뉴클레이스를 인코딩하는 mRNA, gRNA, 및 주형을 포함하는 LNP 조성물은 세포에 투여될 수 있다. 특정 예에서, Cas 뉴클레이스 및 sgRNA를 포함하는 LNP 조성물은 간 세포에 투여될 수 있다. 일부 예에서, 간 세포는 대상 안에 있다.
특정 구체예에서, 대상은 단일 용량의 LNP 조성물을 받을 수 있다. 다른 예에서, 대상은 다중 용량의 LNP 조성물을 받을 수 있다. 일부 구체예에서, LNP 조성물은 2-5 회 투여된다. 하나 초과의 용량이 투여되는 경우, 용량은 약 1, 2, 3, 4, 5, 6, 7, 14, 21, 또는 28 일 간격으로; 약 2, 3, 4, 5, 또는 6 개월 간격으로; 또는 약 1, 2, 3, 4, 또는 5 년 간격으로 투여될 수 있다. 특정 구체예에서, 편집은 LNP 조성물의 재투여 시 개선된다.
한 구체예에서, 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 LNP 조성물은 gRNA를 포함하는 조성물의 투여와 별도로 세포에 투여될 수 있다. 한 구체예에서, 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 LNP 조성물은 주형 핵산의 세포로의 투여와 별도로 세포에 투여될 수 있다. 한 구체예에서, 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 LNP 조성물은 세포에 투여되고, 이어서 세포로의 gRNA를 포함하는 LNP 조성물 및 이후 주형의 연속 투여가 이어질 수 있다. Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 LNP 조성물이 gRNA를 포함하는 LNP 조성물 전에 투여되는 구체예에서, 투여는 약 4, 6, 8, 12, 또는 24 시간; 또는 2, 3, 4, 5, 6, 또는 7 일 간격일 수 있다.
한 구체예에서, LNP 조성물은 유전자 넉아웃을 야기하도록 유전자를 편집하기 위해 사용될 수 있다. 한 구체예에서, LNP 조성물은 세포의 집단에서 유전자 넉다운을 야기하도록 유전자를 편집하기 위해 사용될 수 있다. 다른 구체예에서, LNP 조성물은 유전자 교정을 야기하도록 유전자를 편집하기 위해 사용될 수 있다. 추가의 구체예에서, LNP 조성물은 유전자 삽입을 야기하도록 유전자를 편집하기 위해 사용될 수 있다.
한 구체예에서, LNP 조성물의 투여는 지속적인 반응을 야기하는 유전자 편집을 야기할 수 있다. 예를 들어, 투여는 하루, 한 달, 일 년 또는 그 이상의 반응 지속기간을 야기할 수 있다. 본원에서 사용된 "반응 지속기간"은, 본원에 개시된 LNP 조성물을 사용하여 세포가 편집된 후, 결과적인 변형이 LNP 조성물의 투여 후 특정 기간 동안 여전히 존재함을 의미한다. 변형은 표적 단백질 수준을 측정하여 검출될 수 있다. 변형은 표적 DNA를 검출하여 검출될 수 있다. 일부 구체예에서, 반응 기간은 적어도 1 주일 수 있다. 다른 구체예에서, 반응 기간은 적어도 2 주일 수 있다. 한 구체예에서, 반응 기간은 적어도 1 개월일 수 있다. 일부 구체예에서, 반응 기간은 적어도 2 개월일 수 있다. 한 구체예에서, 반응 기간은 적어도 4 개월일 수 있다. 한 구체예에서, 반응 기간은 적어도 6 개월일 수 있다. 특정 구체예에서, 반응 기간은 약 26 주일 수 있다. 일부 구체예에서, 반응 기간은 적어도 1 년일 수 있다. 일부 구체예에서, 반응 기간은 적어도 5 년일 수 있다. 일부 구체예에서, 반응 기간은 적어도 10 년일 수 있다. 일부 구체예에서, 지속적인 반응은 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 15, 18, 21, 또는 24 개월 후에, 표적 단백질 수준 측정 또는 표적 DNA 검출에 의해 검출 가능하다. 일부 구체예에서, 지속적인 반응은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 또는 20 년 후에, 표적 단백질 수준 측정 또는 표적 DNA 검출에 의해 검출 가능하다.
LNP 조성물은 비경구적으로 투여될 수 있다. LNP 조성물은 혈류, 조직, 근육, 또는 내부 기관으로 직접 투여될 수 있다. 투여는 전신, 예를 들어 주사 또는 주입일 수 있다. 투여는 국소적일 수 있다. 투여에 적합한 수단은 정맥내, 동맥내, 척수강내, 심실내, 요도내, 흉골내, 두개내, 망막하, 유리체내, 전실내, 근육내, 활막내, 피내 및 피하를 포함한다. 투여에 적합한 장치는 바늘(미세바늘 포함) 주입기, 무-바늘 주입기, 삼투 펌프, 및 주입 기술을 포함한다.
LNP 조성물은 일반적으로 하나 이상의 약제학적으로 허용되는 부형제와 공동으로 제제로서 투여될 것이지만 반드시 그런 것은 아니다. 용어 "부형제"는 본 발명의 화합물(들) 이외의 임의의 성분, 다른 지질 성분(들) 및 생물학적 활성제를 포함한다. 부형제는 기능성 (예를 들어 약물 방출 속도 제어) 및/또는 비-기능성 (예를 들어 가공 보조제 또는 희석제) 특징을 제제에 부여할 수 있다. 부형제의 선택은 특정 투여 방식, 용해도 및 안정성에 대한 부형제의 효과, 및 제형의 성질과 같은 인자에 크게 의존할 것이다.
비경구 제제는 전형적으로 수성 또는 유성 용액 또는 현탁액이다. 제제가 수성인 경우, 부형제, 예컨대 당 (글루코스, 만니톨, 소르비톨 등을 포함하지만 이에 제한되지 않음) 염, 탄수화물 및 완충제(바람직하게는 3 내지 9의 pH), 그러나, 일부 적용의 경우, 이들은 무균 비수성 용액과 함께 또는 무균, 무발열원 물(pyrogen-free water)(WFI)과 같은 적합한 비히클과 함께 사용될 건조된 형태로서 더욱 적합하게 제제화될 수 있다.
비록 본 발명이 예시된 실시예와 관련하여 설명되었지만, 본 발명을 이러한 실시예로 제한하도록 의도되지 않음이 이해된다. 반대로, 본 발명은 모든 대안, 변형, 및 구체적인 특징의 균등물을 포함한 균등물을 포함하도록 의도되며, 이는 첨부된 청구범위에 의해 정의된 바와 같이 본 발명에 포함될 수 있다.
전술한 일반적인 설명 및 상세한 설명뿐만 아니라, 다음의 실시예는 단지 예시적이고 설명적인 것이며 교시를 제한하지 않는다. 본원에서 사용된 섹션 제목은 단지 조직적 목적을 위한 것이며 어떠한 방식으로든 원하는 발명 대상(subject matter)을 제한하는 것으로 해석되어서는 안된다. 참조로 포함된 임의의 문헌이 본 명세서에 정의된 임의의 용어와 상충하는 경우, 본 명세서가 우선한다. 달리 명시되지 않는 한, 출원에 주어진 모든 범위는 종점을 포함한다.
본 출원에서 사용된 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 다르게 지시되지 않는 한 복수 지시대상을 포함한다는 점에 유의해야 한다. 따라서, 예를 들어 "조성물"에 대한 언급은 복수의 조성물을 포함하고 "세포"에 대한 언급은 복수의 세포 등을 포함한다. "또는"의 사용은 포괄적이며 달리 명시되지 않는 한 "및/또는"을 의미한다.
수치 범위는 범위를 정의하는 숫자를 포함한다. 측정된 값 및 측정 가능한 값은 유효 숫자 및 측정과 관련된 오차를 고려하여 근사값으로 이해된다. 용어 "약" 또는 "대략"은 당업자에 의해 결정된 특정 값에 대한 허용 가능한 오차를 의미하며, 이는 값이 측정되는 또는 결정되는 방법에 부분적으로 의존한다. 범위 앞 또는 값의 목록 앞의 "약"과 같은 수식어의 사용은, 범위의 각각의 종점 또는 목록 내의 각각의 값을 수식한다. "약"은 값 또는 종점을 또한 포함한다. 예를 들어, "약 50-55"는 "약 50 내지 약 55"를 포함한다. 또한, "포함하다(comprise)", "포함하다(comprises)", "포함하는(comprising)", "함유하다(contain)", "함유하다(contains)", "함유하는(containing)", "포함하다(include)", "포함하다(includes), 및 "포함하는(including)의 사용은 제한적이지 않다.
상기 명세서에서 구체적으로 언급되지 않는 한, 다양한 구성요소를 "포함하는"을 언급하는 본 명세서의 구체예는 본 명세서의 구체예 "구성되는" 또는 "본질적으로 구성되는" 것으로 또한 고려되고; 다양한 구성요소로 "구성되는"을 언급하는 본 명세서의 구체예는 언급된 구성요소를 "포함하는" 또는 "본질적으로 구성되는" 것으로 또한 고려되고; "약" 다양한 구성요소를 언급하는 본 명세서의 구체예는 언급된 구성요소"에서"인 것으로 또한 고려되고; 다양한 구성요소로 "본질적으로 구성되는"을 언급하는 본 명세서의 구체예는 언급된 구성요소로 "구성되는" 또는 이를 "포함하는"으로 또한 고려된다 (이러한 상호교환성은 청구범위에서 이들 용어의 사용에는 적용되지 않는다).
실시예
실시예 1 - 마우스에서의 생체 내 편집을 위한 LNP 조성물
다양한 LNP 조성물의 소규모 제제를 제조하여 특성을 조사했다. 마우스에서의 간 편집 퍼센트에 대한 분석에서, 마우스 TTR 서열을 표적으로 하는 Cas9 mRNA 및 화학적으로 변형된 sgRNA를 하기 표 2에 기재된 바와 같이 다양한 PEG mol-%, 지질 A mol-%, 및 N:P 비율을 갖는 LNP로 제제화했다.
표 2. LNP 조성물.
LNP # | 지질 A mol-% | PEG-DMG mol-% | N:P 비율 |
(다양) | 45 | 2, 2.5, 3, 4, 5 | 4.5 |
(다양) | 45 | 2, 2.5, 3, 4, 5 | 6 |
(다양) | 50 | 2, 2.5, 3, 4, 5 | 4.5 |
(다양) | 50 | 2, 2.5, 3, 4, 5 | 6 |
(다양) | 55 | 2, 2.5, 3, 4, 5 | 4.5 |
(다양) | 55 | 2, 2.5, 3, 4, 5 | 6 |
도 1에서, LNP 제제는 "% CL; N:P"로 표지된 지질 A mol-% 및 N:P 비율에 기초하여 X-축에서 식별된다. 도 1의 범례에 나타난 바와 같이, 2, 2.5, 3, 4, 또는 5 mol-%의 PEG-2k-DMG 농도는 (1) 45 mol-% 지질 A; 4.5 N:P ("45; 4.5"); (2) 45 mol-% 지질 A; 6 N:P ("45; 6"); (3) 50 mol-% 지질 A; 4.5 N:P ("50; 4.5"); (4) 50 mol-% 지질 A; 6 N:P ("50; 6"); (5) 55 mol-% 지질 A; 4.5 N:P ("55; 4.5"); 및 (6) 55 mol-% 지질 A; 6 N:P ("55; 6")로써 제제화되었다. DSPC mol-%를 9 mol-%로 일정하게 유지하고 콜레스테롤 mol-%를 첨가하여 각 제제 지질 성분의 잔부를 100 mol-%로 만들었다. 30 제제 각각을 아래에 기재된 바와 같이 제제화하고, 단일 용량으로 kg당 1 mg 또는 kg당 0.5 mg 용량의 총 RNA(각각 도 1A 및 도 1B)로 투여했다.
LNP 제제 - NanoAssemblr
지질 나노입자 성분을 상기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. RNA 카르고를 25 mM 시트레이트, 100 mM NaCl, pH 5.0에 용해시켜, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다. LNP는 약 4.5 또는 약 6의 지질 아민 대 RNA 포스페이트 (N:P) 몰비, 중량으로 1:1의 mRNA 대 gRNA의 비율로 제제화되었다.
LNP는 제조사의 프로토콜에 따라 Precision Nanosystems NanoAssemblrTM Benchtop Instrument를 사용하여 지질 및 RNA 용액의 미세유체 혼합에 의해 형성되었다. 차등 유량을 사용하여 혼합하는 동안 수성 대 유기 용매의 2:1 비율을 유지시켰다. 혼합 후, LNP를 수집하고, 물에 희석하고 (대략 1:1 v/v), 실온에서 1 시간 동안 유지하고, 최종 버퍼 교환 전에 물로 추가로 희석했다 (대략 1:1 v/v). 50 mM Tris, 45 mM NaCl, 5% (w/v) 수크로스, pH 7.5 (TSS)로의 최종 버퍼 교환이 PD-10 탈염 컬럼 (GE)으로 완료되었다. 필요한 경우, 제제를 Amicon 100 kDa 원심분리 필터(Millipore)로 원심분리하여 농축시켰다. 이후 생성된 혼합물을 0.2 μm 멸균 필터를 사용하여 여과했다. 최종 LNP를 추가의 사용까지 -80 ℃에서 보관했다.
제제 분석
동적 광산란("DLS")이 본 발명의 다분산 지수("pdi") 및 LNP의 크기를 특징규명하기 위해 사용된다. DLS는 샘플이 광원에 노출되어 발생하는 빛의 산란을 측정한다. DLS 측정으로부터 결정된 PDI는 집단에서의 입자 크기(대략 평균 입자 크기)의 분포를 나타내며, 완전하게 균일한 집단은 0의 PDI를 갖는다.
전기영동 광산란이 지정된 pH에서 LNP의 표면 전하를 특징분석하기 위해 사용된다. 표면 전하 또는 제타 전위는 LNP 현탁액 중 입자 사이의 정전기적 반발/인력의 크기의 척도이다.
비대칭-유량 필드 흐름 분별 - 다중-각도 광산란(Assymetric-Flow Field Flow Fractionation - Multi-Angle Light Scattering, AF4-MALS)은 수력학적 반경(hydrodynamic radius)에 의해 제제에서 입자를 분리한 다음 분별된 입자의 분자량, 수력학적 반경(hydrodynamic radii) 및 제곱평균제곱근 반경(root mean square radii)을 측정하기 위해 사용된다. 이는 분자량 및 크기 분포 및 이차 특성, 예컨대 Burchard-Stockmeyer 플롯 (입자의 내부 코어 밀도를 암시하는 시간 경과에 따른 제곱평균제곱근("rms") 직경 대 수력학적 반경의 비율) 및 rms 형태 플롯(결과적인 선형 적합의 기울기가 압축 대 신장의 정도를 제공하는 rms 반경의 로그 대 분자량의 로그)을 평가하는 능력을 허용한다.
나노입자 추적 분석(NTA, Malvern Nanosight)이 제제 입자 크기 분포 및 입자 농도를 결정하기 위해 사용될 수 있다. LNP 샘플을 적절하게 희석하여 현미경 슬라이드에 주입한다. 입자가 시야를 통해 천천히 주입될 때 카메라가 산란된 빛을 기록한다. 영상이 캡쳐된 후, 나노입자 추적 분석은 픽셀을 추적하고 확산 계수를 계산하여 영상을 처리한다. 이러한 확산 계수는 입자의 수력학적 반경으로 변환될 수 있다. 기기는 또한 분석에서 계산된 개별 입자의 수를 계수하여 입자 농도를 제공한다.
동결-전자 현미경("cryo-EM")을 사용하여 LNP의 입자 크기, 형태, 및 구조적 특징을 결정할 수 있다.
LNP의 지질 조성물 분석은 액체 크로마토그래피에 이어서 하전 에어로졸 검출(LC-CAD)로부터 결정될 수 있다. 이러한 분석은 실제 지질 함량 대 이론적 지질 함량의 비교를 제공할 수 있다.
LNP 제제는 평균 입자 크기, 다분산 지수(pdi), 총 RNA 함량, RNA의 캡슐화 효율, 및 제타 전위에 대해 분석되었다. LNP 제제는 지질 분석, AF4-MALS, NTA, 및/또는 동결-EM에 의해 추가로 특징규명될 수 있다. 평균 입자 크기 및 다분산도는 Malvern Zetasizer DLS 기기를 사용하여 동적 광산란(DLS)에 의해 측정된다. LNP 샘플을 DLS로 측정하기 전에 PBS에서 30X 희석했다. 평균 입자 크기의 강도-기반 측정인 Z-평균 직경이 수평균 직경 및 pdi와 함께 보고되었다. LNP의 제타 전위를 측정하기 위해 Malvern Zetasizer 기기가 또한 사용된다. 샘플을 측정 전에 0.1X PBS, pH 7.4에서 1:17로 희석한다 (50 μL가 800 μL로).
총 RNA 농도 및 유리 RNA를 결정하기 위해 형광-기반 분석 (Ribogreen® ThermoFisher Scientific)을 사용한다. 캡슐화 효율은 (총 RNA - 유리 RNA)/총 RNA로서 계산된다. LNP 샘플을 0.2% Triton-X 100를 함유하는 1x TE 버퍼로 적절하게 희석하여 총 RNA를 결정하거나 또는 1x TE 버퍼로 유리 RNA를 결정한다. 제제를 제조하기 위해 사용된 출발 RNA 용액을 이용하고 1x TE 버퍼 +/- 0.2% Triton-X 100에서 희석하여 표준 곡선을 제조했다. 이후 (제조사의 지침에 따라) 희석된 RiboGreen® 염료를 표준 및 샘플 각각에 첨가하고 빛이 없는 상태에서 대략 10 분 동안 실온에서 인큐베이션한다. SpectraMax M5 Microplate Reader (Molecular Devices)는 여기, 자동 차단 및 방출 파장이 각각 488 nm, 515 nm, 및 525 nm으로 설정되어 샘플을 판독하도록 사용된다. 총 RNA 및 유리 RNA는 적절한 표준 곡선으로부터 결정된다.
캡슐화 효율은 (총 RNA - 유리 RNA)/총 RNA로서 계산된다. DNA-기반 또는 핵산-함유 카르고 성분의 캡슐화 효율을 결정하기 위해 동일한 절차가 사용될 수 있다. 단일-가닥 DNA에 대해 Oligreen Dye가 사용될 수 있고, 이중-가닥 DNA에 대해 Picogreen Dye가 사용될 수 있다.
AF4-MALS는 분자량 및 크기 분포뿐만 아니라 이러한 계산으로부터의 이차 통계를 보기 위해 사용된다. LNP는 적절하게 희석되고 HPLC 오토샘플러를 사용하여 AF4 분리 채널로 주입되고 여기서 초점을 맞춘 다음 채널을 가로지르는 십자 흐름에서 지수 구배(exponential gradient)로 용리된다. 모든 유체는 HPLC 펌프 및 Wyatt Eclipse 기기에 의해 추진된다. AF4 채널로부터 용리되는 입자는 UV 검출기, 다중-각도 광산란 검출기, 준-탄성 광산란 검출기(quasi-elastic light scattering detector) 및 시차 굴절률 검출기(differential refractive index detector)를 통해 흐른다. 원시 데이터는 Debeye 모델을 사용하여 가공되어 검출기 신호로부터 분자량 및 rms 반경을 결정한다.
LNP 중의 지질 성분은 하전 에어로졸 검출기(CAD)에 연결된 HPLC에 의해 정량적으로 분석된다. 4 지질 성분의 크로마토그래피 분리가 역상 HPLC에 의해 달성된다. CAD는 모든 비-휘발성 화합물을 탐지하는 파괴적인 질량-기반 검출기이며 신호는 분석물 구조에 관계없이 일관된다.
Cas9 mRNA 및 gRNA 카르고
Cas9 mRNA 카르고를 시험관내 전사에 의해 제조했다. 1X NLS를 포함하는 캡핑되고 폴리아데닐화된 Cas9 mRNA(서열 식별 번호:48)를 선형화 플라스미드 DNA 주형 및 T7 RNA 폴리머레이스를 사용하여 시험관내 전사에 의해 생성했다. T7 프로모터 및 100 nt 폴리(A/T) 영역을 포함하는 플라스미드 DNA를 다음 조건: 200 ng/μL 플라스미드, 2 U/μL XbaI(NEB), 및 1x 반응 버퍼에서 37 ℃에서 2 시간 동안 XbaI와 함께 인큐베이션하여 선형화했다. 반응물을 65 ℃에서 20 분 동안 가열하여 XbaI를 불활성화시켰다. 선형화 플라스미드를 실리카 맥시 스핀 컬럼(Epoch Life Sciences)을 사용하여 효소 및 버퍼 염으로부터 정제하고 아가로스 겔로 분석하여 선형화를 확인했다. Cas9 변형된 mRNA를 생성하기 위한 IVT 반응을 다음 조건에서 37 ℃에서 4 시간 동안 인큐베이션했다: 50 ng/μL 선형화 플라스미드; 각각 2 mM의 GTP, ATP, CTP, 및 N1-메틸 슈도-UTP (Trilink); 10 mM ARCA (Trilink); 5 U/μL T7 RNA 폴리머레이스 (NEB); 1 U/μL 뮤린 알엔에이스(RNase) 억제제 (NEB); 0.004 U/μL 무기 대장균 피로포스파테이스 (NEB); 및 1x 반응 버퍼. 4 시간 인큐베이션 후, TURBO 디엔에이스(DNase)(ThermoFisher)를 0.01 U/μL의 최종 농도로 첨가하고, 반응물을 추가 30 분 동안 인큐베이션하여 DNA 주형을 제거했다. Cas9 mRNA를 제조사의 프로토콜(ThermoFisher)에 따라 MegaClear Transcription Clean-up 키트를 사용하여 효소 및 뉴클레오타이드로부터 정제했다. 대안적으로, Cas9 mRNA를 LiCl 침전 방법으로 정제했다.
이 실시예에서 sgRNA는 화학적으로 합성되어 상업적 공급업체로부터 공급받았다. sg282 서열은 하기 제공되고, 하기 제시된 바와 같이 2'-O-메틸 변형 및 포스포로티오에이트 연결을 갖는다 (m = 2'-OMe; * = 포스포로티오에이트):
mU*mU*mA*CAGCCACGUCUACAGCAGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU. (서열 식별 번호:42).
LNP
최종 LNP는 상기 제공된 분석 방법에 따라 캡슐화 효율, 다분산 지수, 및 평균 입자 크기를 결정하도록 특징규명되었다.
LNP를 마우스에게 투여하고 (1 mg/kg 또는 0.5 mg/kg의 단일 용량) 아래에 기재된 바와 같이 NGS 분석을 위해 게놈DNA를 단리했다.
생체내 LNP 전달
6 내지 10 범위 주령의 CD-1 암컷 마우스를 각 연구에서 사용했다. 그룹 평균 중량을 기준으로 투여 용액을 제조하기 위해 동물을 칭량하고 체중에 따라 그룹화했다. LNP를 측면 꼬리 정맥을 통해 동물당 0.2 mL의 부피(체중 킬로그램당 대략 10 mL)로 투여했다. 동물은 부작용에 대해 투약 후 대략 6 시간에 관찰되었다. 투여 후 24 시간에 체중을 측정하고, 이소플루란 마취에서 심장 천자를 통한 실혈에 의해 다양한 시점에 동물을 안락사시켰다. 혈액을 혈청 분리기 튜브 또는 본원에 기재된 바와 같이 혈장용 완충된 소듐 시트레이트를 포함하는 튜브에 수집했다. 생체내 편집을 포함하는 연구를 위해, DNA 추출 및 분석을 위해 각 동물의 중엽 또는 세 개의 독립적인 엽(예를 들어, 우측 중엽, 좌측 중엽, 및 좌측 측엽)으로부터 간 조직을 수집했다.
마우스의 코호트를 차세대 시퀀싱(NGS) 및 혈청 TTR 수준에 의해 간 편집에 대해 측정했다 (데이터는 나타나지 않음).
트랜스티레틴 (TTR) ELISA 분석
지시된 바와 같이 혈액을 수집하고 혈청을 단리했다. 마우스 프리알부민 (Transthyretin) ELISA 키트 (Aviva Systems Biology, Cat. OKIA00111)를 사용하여 총 마우스 TTR 혈청 수준을 결정했다. 제조사의 프로토콜에 따라 래트 특이적 ELISA 키트(Aviva Systems Biology 카탈로그 번호 OKIA00159)를 사용하여 래트 TTR 혈청 수준을 측정했다. 간단히, 혈청을 10,000-배의 최종 희석까지 키트 샘플 희석제로 연속 희석했다. 이후 이러한 희석된 샘플을 ELISA 플레이트에 첨가한 다음 지시에 따라 분석을 수행했다.
NGS 시퀀싱
간단히 말해서, 게놈 안의 표적 위체에서 편집 효율을 정량적으로 결정하기 위해, 게놈 DNA를 단리하고 유전자 편집에 의해 도입된 삽입 및 결실의 존재를 확인하기 위해 딥 시퀀싱을 이용했다.
PCR 프라이머를 표적 자리(예를 들어, TTR) 주위에 설계하고, 관심 게놈 영역을 증폭시켰다. 프라이머 서열은 하기에 제공된다. 추가적인 PCR을 제조사의 프로토콜(Illumina)에 따라 수행하여 시퀀싱에 필요한 화학물질(chemistry)을 추가했다. 앰플리콘은 Illumina MiSeq 기기에서 시퀀싱되었다. 낮은 품질 점수를 갖는 것을 제거한 후 리드(read)를 인간 참조 게놈 (예를 들어, hg38)에 대해 정렬시켰다. 리드를 포함하는 결과 파일을 참조 게놈(BAM 파일)에 매핑하고, 여기서 관심 표적 영역과 중첩되는 리드가 선택되고 야생형 리드의 수 대 삽입, 치환, 또는 결실을 포함하는 리드의 수르 계산했다.
편집 백분율(예를 들어, "편집 효율" 또는 "편집 퍼센트")은 야생형을 포함하여 서열 리드의 총 수에 대한 삽입 또는 결실을 갖는 서열 리드의 총 수로 정의된다.
도 1은 NGS에 의해 측정된 마우스 간에서의 편집 백분율을 나타낸다. 도 1A에 나타난 바와 같이, kg당 1 mg RNA이 투여될 때, 생체내 편집 백분율은 약 20% 내지 60% 이상의 간 편집 범위이다. kg당 0.5 mg 용량, 도 1B에서, 약 10% 내지 60% 간 편집이 관찰되었다. 이러한 마우스 생체내 테스트에서, 모든 조성물은 각 LNP 조성물에 대해 NGS에 의해 측정된 표적 자리에서 활성 CRISPR/Cas 뉴클레이스 활성의 증거와 함께, 간 세포에 효과적으로 Cas9 mRNA 및 gRNA를 전달했다. 5% PEG 지질을 포함하는 LNP는 더 낮은 캡슐화 (데이터는 나타나지 않음), 및 다소 감소된 효능을 갖는다.
실시예 2 - LNP 조성물 분석
LNP의 분석적 특징규명은 증가하는 양의 지질 A 및 PEG-지질로 제제화된 LNP에서 개선된 물리화학적 파라미터를 나타낸다. 2 mol-% 또는 3 mol-% PEG 지질(PEG2k-DMG)을 포함하는 조성물이 하기 표 3에 제공된다.
LNP898 | LNP897 | LNP966 | LNP969 | |
CL/콜레스테롤/DSPC/PEG(이론적 mol-%) | 45/44/9/2 | 45/43/9/3 | 50/38/9/3 | 55/33/9/3 |
mRNA | Cas9 서열 식별 번호:48 | Cas9 서열 식별 번호:48 |
Cas9 U-dep 서열 식별 번호:43 |
Cas9 U-dep 서열 식별 번호:43 |
gRNA | G502서열 식별 번호:70 | G502 서열 식별 번호:70 |
G534 서열 식별 번호:72 |
G534 서열 식별 번호:72 |
N/P | 4.5 | 4.5 | 6.0 | 6.0 |
LNP 제제 - 십자 흐름(Cross Flow)
에탄올 중의 지질을 2 부피의 RNA 용액 및 1 부피의 물과 충돌 제트 혼합(impinging jet mixing)하여 LNP를 형성했다. 에탄올 중의 지질은 2 부피의 RNA 용액과의 혼합 십자가(mixing cross)를 통해 혼합된다. 물의 제4 스트림이 인라인 티(inline tee)를 통해 십자의 출구 흐름과 혼합된다. (WO2016010840 도 2 참조.) LNP를 1 시간 동안 실온에서 유지한 다음, 물로 추가로 희석시켰다 (대략 1:1 v/v). 희석된 LNP를 평판 시트 카트리지 (Sartorius, 100kD MWCO)에서 접선 유동 여과(tangential flow filtration)를 사용하여 농축한 다음 50 mM Tris, 45 mM NaCl, 5% (w/v) 수크로스, pH 7.5 (TSS)로의 정용여과(diafiltration)에 의해 버퍼 교환했다. 대안으로, TSS로의 최종 버퍼 교환을 PD-10 탈염 컬럼(GE)으로 완료했다. 필요한 경우, 제제를 Amicon 100 kDa 원심분리 필터(Millipore)로 원심분리하여 농축시켰다. 이후 생성된 혼합물을 0.2 μm 멸균 필터를 사용하여 여과했다. 최종 LNP를 추가의 사용까지 4℃ 또는 -80℃에서 보관했다.
캡핑되고 폴리-아데닐화된 Cas9 U-고갈(Cas9 Udep) mRNA가 서열 식별 번호:43을 포함함을 제외하고, Cas9 mRNA 및 sgRNA를 실시예 1에서와 같이 제조했다. Sg282는 실시예 1에 기재되고, sg534("G534")에 대한 서열이 아래에 제공된다:
mA*mC*mG*CAAAUAUCAGUCCAGCGGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU (서열 식별 번호:72)
LNP 제제는 실시예 1에 기재된 바와 같이 평균 입자 크기, 다분산도(pdi), 총 RNA 함량 및 RNA의 캡슐화 효율에 대해 분석되엇다.
평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 4에 나타난다. LNP 조성물의 이론적 지질 농도에 추가하여, 지질 분석은 하기 표 5에 나타난 바와 같이 실제 mol-% 지질 수준을 입증했다.
LNP
ID # |
N/P | Z-평균 (nm) |
PDI | 수 평균 (nm) | RNA 농도 (mg/mL) | 캡슐화 (%) |
LNP898 | 4.5 | 87.91 | 0.030 | 71.33 | 1.53 | 98 |
LNP897 | 4.5 | 74.05 | 0.036 | 58.55 | 1.43 | 98 |
LNP966 | 6.0 | 82.78 | 0.010 | 67.86 | 2.12 | 98 |
LNP969 | 6.0 | 92.97 | 0.042 | 75.52 | 2.09 | 97 |
LNP
ID # |
지질 비율 (지질 A/콜레스테롤/ DSPC/PEG) (이론 및 실제) |
지질 A mg/mL (이론 및 실제) |
콜레스테롤 mg/mL (이론 및 실제) |
DSPC mg/mL (이론 및 실제) |
PEG mg/mL (이론 및 실제) |
|
LNP898 | 45/44/9/2 46.1/42.6/9.2/2 |
18.0 18.3 |
8.0 7.7 |
3.3 3.4 |
2.3 2.4 |
|
LNP897 | 45/43/9/3 44.8/42.9/9.2/3.1 |
18.0 17.8 |
7.8 7.7 |
3.3 3.4 |
3.5 3.6 |
|
LNP966 | 50/38/9/350.0/38.0/8.8/3.1 | 33.4 35.6 |
11.5 12.3 |
5.6 5.8 |
5.8 6.5 |
|
LNP969 | 55/33/9/354.8/33.2/8.8/3.2 | 33.4 31.6 |
9.1 8.7 |
5.1 4.7 |
5.3 5.4 |
물리화학적 특성을 추가로 분석하기 위해, LNP897, LNP898, LNP966, 및 LNP969가 비대칭-유량 필드 흐름 분별 - 다중-각도 광산란(AF4-MALS) 분석을 거쳤다. AF4-MALS 기기는 입자 크기 및 분자량 분포를 측정하고, 입자 형태 및 밀도에 대한 정보를 제공한다.
LNP는 HPLC 오토샘플러를 사용하여 AF4 분리 채널로 주입되고 여기서 초점을 맞춘 다음 채널을 가로지르는 십자 흐름에서 지수 구배(exponential gradient)로 용리된다. 모든 유체는 HPLC 펌프 및 Wyatt Eclipse 기기에 의해 추진된다. AF4 채널로부터 용리되는 입자는 UV 검출기, Wyatt Heleos II 다중-각도 광산란 검출기, 준-탄성 광산란 검출기 및 Wyatt Optilab T-rEX 시차 굴절률 검출기를 통해 흐른다. 원시 데이터는 Debeye 모델을 사용하여 Wyatt Astra 7 소프트웨어에서 가공되어 검출기 신호로부터 분자량 및 rms 반경을 결정한다.
LNP에 대한 로그 미분 몰질량 플롯은 도 2A와 같이 제공된다. 간단히 말해서, X-축은 몰질량(g/mol)을 나타내고, Y-축은 미분 수 분율을 나타낸다. 로그 미분 몰질량 플롯은 특정 제제에 대해 측정된 상이한 분자량의 분포를 나타낸다. 이는 제제 내 분자량의 전체 분포뿐만 아니라 분자량의 모드에 대한 데이터를 제공하며, 이는 평균 분자량보다 더 우수한 입자 이질성의 그림을 제공한다.
상이한 LNP 제제의 이질성은 상이한 몰질량 모멘트를 측정하고 무게평균 몰질량(Mw) 대 수평균 몰질량(Mn)의 비율을 계산하여 Mw/Mn의 다분산도를 제공하여 결정된다. 이들 상이한 제제에 대한 다분산도의 그래프가 도 2B에 제공된다.
데이터는 도 2A에 나타나는 바와 같이 N/P 6.0에서 3 mol-% PEG, 및 50 및 55 mol-% 지질 A를 갖는 더 조밀한 입자 분포를 나타낸다. 이는 도 2B에 나타나는 바와 같이 조밀한 다분산도에 반영된다
실시예 3 - AF4 MALS 데이터 - 추가적 제제
LNP의 분석적 특징규명은 증가하는 양의 지질 A로 제제화된 LNP에서 개선된 물리화학적 파라미터를 나타낸다. 45 mol-%, 50 mol-%, 또는 55 mol-% 지질 A를 두 가지 상이한 gRNA와 함께 포함하는 조성물이 하기 표 6에 제공된다.
LNP1021 | LNP1022 | LNP1023 | LNP1024 | LNP1025 | |
CL/콜레스테롤/DSPC/PEG(이론적 mol-%) | 50/38/9/3 | 55/33/9/3 | 45/43/9/3 | 50/38/9/3 | 55/33/9/3 |
mRNA | Cas9 Udep 서열 식별 번호:43 |
Cas9 Udep 서열 식별 번호:43 |
Cas9 Udep 서열 식별 번호:43 |
Cas9 Udep 서열 식별 번호:43 |
Cas9 Udep 서열 식별 번호:43 |
gRNA | G502 서열 식별 번호:70 |
G502 서열 식별 번호:70 |
G502 서열 식별 번호:70 |
G509 서열 식별 번호:71 |
G509 서열 식별 번호:71 |
N/P | 6.0 | 6.0 | 4.5 | 6.0 | 6.0 |
LNP는 실시예 2에 기재된 바와 같이 형성되었다.
Cas9 mRNA 및 sgRNA를 위에 기재된 바와 같이 제조했다.
LNP 조성물은 실시예 1에 기재된 바와 같이 캡슐화 효율, 다분산 지수, 및 평균 입자 크기를 결정하기 위해 특징규명되었다.
평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 7에 나타난다. LNP 조성물의 이론적 지질 농도에 추가하여, 지질 분석은 하기 표 8에 나타난 바와 같이 실제 mol-% 지질 수준을 입증했다.
LNP
ID # |
N/P | Z-평균 (nm) |
PDI | 수 평균 (nm) | RNA 농도 (mg/mL) | 캡슐화 (%) |
LNP1021 | 6.0 | 83.18 | 0.027 | 67.15 | 1.63 | 98 |
LNP1022 | 6.0 | 94.08 | 0.005 | 78.28 | 1.60 | 97 |
LNP1023 | 4.5 | 74.01 | 0.017 | 61.11 | 1.61 | 97 |
LNP1024 | 6.0 | 85.37 | 0.002 | 70.42 | 1.59 | 97 |
LNP1025 | 6.0 | 94.47 | 0.018 | 77.71 | 1.60 | 98 |
LNP
ID # |
지질 비율 (지질 A/콜레스테롤/ DSPC/PEG) (이론 및 실제) |
지질 A mg/mL (이론 및 실제) |
콜레스테롤 mg/mL (이론 및 실제) |
DSPC mg/mL (이론 및 실제) |
PEG mg/mL (이론 및 실제) |
|
LNP1021 | 50/38/9/3 50.9/37.4/8.6/3.1 |
23.6 21.6 |
8.1 7.2 |
3.9 3.4 |
4.1 3.8 |
|
LNP1022 | 55/33/9/3 55.2/33.0/8.7/3.1 |
23.6 20.4 |
6.4 5.5 |
3.6 3.0 |
3.7 3.4 |
|
LNP1023 | 45/43/9/345.9/42.4/8.6/3.1 | 17.7 15.3 |
7.7 6.4 |
3.3 2.7 |
3.4 3.0 |
|
LNP1024 | 50/38/9/350.5/37.9/8.5/3.0 | 23.6 22.4 |
8.1 7.6 |
3.9 3.5 |
4.1 3.9 |
|
LNP1024 | 55/33/9/3 55.5/33.1/8.5/3.0 |
23.6 21.3 |
6.4 5.8 |
3.6 3.0 |
3.7 3.4 |
물리화학적 특성을 추가로 분석하기 위해, LNP1021, LNP1022, LNP1023, LNP1024 및 LNP1025가 비대칭-유량 필드 흐름 분별 - 다중-각도 광산란(AF4-MALS) 분석을 거쳤다. AF4-MALS 기기는 입자 크기 및 분자량 분포를 측정하고, 입자 형태 및 밀도에 대한 정보를 제공한다.
LNP는 실시예 1에 기재된 바와 같이 AF4-MALS에서 실행되었다.
LNP에 대한 로그 미분 몰질량 플롯은 도 3A와 같이 제공된다. 간단히 말해서, X-축은 몰질량(g/mol)을 나타내고, Y-축은 미분 수 분율을 나타낸다. 로그 미분 몰질량 플롯은 특정 제제에 대해 계산된 상이한 분자량의 분포를 나타낸다. 이는 제제 내 분자량의 전체 분포뿐만 아니라 분자량의 모드에 대한 데이터를 제공하며, 이는 평균 분자량보다 더 우수한 입자 이질성의 그림을 제공한다.
평균 분자량은 도 3B에 플로팅된다. 평균 분자량은 전체 분포의 평균이지만 분포의 형상에 대한 정보는 제공하지 않는다. LNP1022 및 LNP1025는 동일한 평균 분자량을 갖지만 LNP1022가 약간 더 넓은 분포를 갖는다.
상이한 LNP 제제의 이질성은 상이한 몰질량 모멘트를 보고 무게평균 몰질량(Mw) 대 수평균 몰질량(Mn)의 비율을 계산하여 Mw/Mn의 다분산도를 제공하여 계산된다. 이들 상이한 제제에 대한 다분산도의 그래프가 도 4A에 제공된다.
또한, LNP 제제의 Burchard-Stockmeyer 플롯이 도 4B에 제공된다. Burchard-Stockmeyer 플롯은 AF4 채널로부터의 제제의 용출에 대한 rms 반경 대 수력학적 반경의 비율을 나타낸다. 이는 지질 나노입자의 내부 밀도에 관한 정보를 제공한다. 도 4B는 LNP1021, LNP1022 및 LNP1023이 이러한 측정에서 상이한 프로파일을 가짐을 나타낸다.
실시예 4 - 증가된 PEG 지질은 감소된 사이토카인 반응으로 효능을 유지함
다른 연구에서, PEG DMG 지질을 2 mol-% 또는 3 mol-%의 PEG 지질을 포함하는 LNP 제제에서 비교했다. 2 mol-%, 또는 3 mol-%, PEG DMG를 포함하는 조성물이 하기 표 9에 제공된다.
LNP809 | LNP810 | |
CL/콜레스테롤/DSPC/PEG(이론적 mol-%) | 45/44/9/2 | 45/43/9/3 |
mRNA | Cas9서열 식별 번호:48 | Cas9 서열 식별 번호:48 |
gRNA | G390서열 식별 번호:69 | G390 서열 식별 번호:69 |
N/P | 4.5 | 4.5 |
LNP는 실시예 2에 기재된 공정에 의해 형성되었다.
Cas9 mRNA 및 sgRNA는 하기 제공된 sg390 ("G390")의 서열과 함께 실시예 1에서와 같이 제조되었다:
mG*mC*mC*GAGUCUGGAGAGCUGCAGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU (서열 식별 번호:69).
LNP 제제는 실시예 1에 기재된 바와 같이 평균 입자 크기, 다분산도(pdi), 총 RNA 함량 및 RNA의 캡슐화 효율에 대해 분석되었다.
평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 10에 나타난다. LNP 조성물의 이론적 지질 농도에 추가하여, 지질 분석은 하기 표 11:에 나타난 바와 같이 실제 mol-% 지질 수준을 입증했다.
LNP
ID # |
N/P | Z-평균 (nm) |
PDI | 수 평균 (nm) | RNA 농도 (mg/mL) | 캡슐화 (%) |
LNP809 | 4.5 | 89.85 | 0.060 | 72.10 | 2.45 | 97 |
LNP810 | 4.5 | 75.26 | 0.025 | 61.17 | 2.14 | 97 |
LNP
ID # |
지질 비율 (지질 A/콜레스테롤/ DSPC/PEG) (이론 및 실제) |
지질 A mg/mL (이론 및 실제) |
콜레스테롤 mg/mL (이론 및 실제) |
DSPC mg/mL (이론 및 실제) |
PEG mg/mL (이론 및 실제) |
|
LNP809 | 45/44/9/2 45.7/43.3/9.0/2.1 |
28.6 30.5 |
12.7 13.1 |
5.3 5.6 |
3.7 4.0 |
|
LNP810 | 45/43/9/3 45.0/42.3/9.7/3.0 |
25.2 24.7 |
10.9 10.5 |
4.7 4.9 |
4.9 4.7 |
래트 혈청 사이토카인을 MCP-1, IL-6, TNF-알파 및 IFN-감마를 분석하는 Luminex 자기 비드 다중 분석(Millipore Sigma, 카탈로그 번호 RECYTMAG-65K의 Milliplex MAP 자기 비드 분석)을 사용하여 평가했다. 분석 비드를 BioRad BioPlex-200에서 판독하고 BioPlex Manager Software 버전 6.1과 함께 4 파라미터 로지스틱 적합을 사용하여 표준 곡선으로부터 사이토카인 농도를 계산했다. 데이터는 도 5에 그래프로 표시된다. 도 5A(혈청 TTR), 도 5B(간 편집), 및 도 5C(사이토카인 p MCP1)를 참조하라.
제조사의 프로토콜에 따라 래트 특이적 ELISA 키트 (Aviva Systems Biology 카탈로그 번호 OKIA00159)를 사용하여 래트 TTR 혈청 수준을 측정했다. 간단히, 혈청을 10,000-배의 최종 희석까지 키트 샘플 희석제로 연속 희석했다. 이후 이러한 희석된 샘플을 ELISA 플레이트에 첨가한 다음 지시에 따라 분석을 수행했다.
게놈 DNA를 대략 10 mg의 간 조직으로부터 단리하고 위에 기재된 바와 같이 NGS를 사용하여 분석했다. 증폭을 위한 PCR 프라이머 서열은 아래 기재된다.
도 5A 및 도 5B는 혈청 TTR 녹다운 및 간 편집이 2 mol-% 및 3 mol-% PEG 제제에서 충분함을 나타낸다. 도 5C는 3 mol-% PEG 제제를 사용하여 MCP-1 반응이 감소됨을 나타낸다.
실시예 5 - 비-인간 영장류로의 LNP 전달
실시예 1에 기재된 바와 같이 제조된 LNP 제제로 세 가지 연구를 수행했다. 특정 몰량 및 카르고가 표 12-26에 제공된다. Cas9 mRNA 및 가이드 RNA(gRNA)를 함유하는 각각의 제제는 중량으로 1:1의 mRNA:gRNA 비율을 가졌다. LNP의 용량(mg/kg, 총 RNA 함량), 투여 경로 및 동물이 덱사메타손의 전처리를 받았는지 여부가 표에 나타난다. 덱사메타손(Dex) 전처리를 받은 동물의 경우, Dex가 LNP 또는 비히클 투여 1 시간 전에 IV 일시 주사에 의해 2 mg/kg로 투여되었다.
혈액 화학 분석을 위해, 측정된 각각의 인자에 대해 하기 표에 나타난 바와 같이 때때로 동물로부터 혈액을 채취했다. 사이토카인 유도는 전처리 및 후처리 NHP에서 측정되었다. 억제되고 의식이 있는 동물의 말초 정맥으로부터 최소 0.5 mL의 전혈을 4 mL 혈청 분리기 튜브로 수집했다. 혈액을 최소 30 분 동안 실온에서 응고시키고 이어서 2000 xg에서 15 분 동안 원심분리했다. 혈청을 각각 120 μL의 2 개의 폴리프로필렌 마이크로튜브에 분취하고 분석할 때까지 -60 내지 -86 ℃에서 보관했다. 분석을 위해 Meso Scale Discovery(MSD)의 비인간 영장류 U-Plex 사이토카인 커스텀 키트를 사용했다. IL-6 및 MCP-1에 초점을 맞추어 다음 파라미터가 분석 INF-g, IL-1b, IL-2, IL-4, IL-6, IL-8, IL-10, IL-12p40, MCP-1 및 TNF-a에 포함되었다. 키트 시약 및 표준물질은 제조업체의 프로토콜에 따라 준비되었다. NHP 혈청을 순수(neat)하게 사용했다. 플레이트를 MSD Discovery work bench 소프트웨어 버전 4012로 수행한 분석과 함께 MSD Sector Imager 6000에서 작동시켰다.
효소 면역분석법에 의해 처리 전 및 처리 후 동물에서 보체 수준을 측정했다. 억제되고 의식이 있는 동물의 말초 정맥으로부터 전혈(0.5 mL)을 0.5 mL k2EDTA를 포함하는 튜브로 수집했다. 혈액을 2000 xg에서 15 분 동안 원심분리했다. 혈장을 각각 120 μL의 2 개의 폴리프로필렌 마이크로튜브에 분취하고 분석할 때까지 -60 내지 -86 ℃에서 보관했다. Quidel MicroVue Complement Plus EIA 키트 (C3a -Cat # A031) 또는 (Bb-Cat # A027)를 분석에 사용했다. 키트 시약 및 표준물질은 제조업체의 프로토콜에 따라 준비되었다. 플레이트를 450 nm에서 광학 밀도로 MSD Sector Imager 6000에서 작동시켰다. 결과는 4-파라미터 곡선 맞춤을 사용하여 분석되었다.
사이토카인 유도 및 보체 활성화에 대한 데이터가 하기 표에 제공된다. "BLQ"는 정량 한계 미만을 의미한다.
표 12. 연구 1.
처리군 | 몰비 (각각 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG | N:P | 카르고 | 샘플 크기 (n) | 경로 | 용량 수준, 총 RNA 함량 (mg/kg) | Dex |
(1) TSS (비히클) | n/a | n/a | n/a | 3 | IV - 주입 | n/a | 아니오 |
(2) LNP699 G502 | 45/44/9/2 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000502 | 3 | IV - 주입 | 3 | 아니오 |
(3) LNP688 G506 | 45/44/9/2 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000506 | 3 | IV - 주입 | 3 | 아니오 |
(4) LNP689 G509 | 45/44/9/2 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000509 | 3 | IV - 주입 | 3 | 아니오 |
(5) LNP690 G510 | 45/44/9/2 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000510 | 3 | IV - 주입 | 3 | 아니오 |
표 13. 연구 2.
처리군 | 몰비 (각각 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG | N:P | 카르고 | 샘플 크기 (n) | 경로 | 용량 수준, 총 RNA 함량 (mg/kg) | Dex |
(1) TSS (비히클) | n/a | n/a | 1 | IV-일시 | n/a | 네 | |
(2) TSS (비히클) | n/a | n/a | 1 | IV-일시 | n/a | 아니오 | |
(3) LNP898 G502 | 45/44/9/2 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000502 | 1 | IV - 주입 | 3 | 네 |
(4) LNP898 G502 | 45/44/9/2 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000502 | 1 | IV - 주입 | 3 | 아니오 |
(5) LNP897 G502 | 45/43/9/3 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000502 | 1 | IV-일시 | 3 | 네 |
(6) LNP897 G502 | 45/43/9/3 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000502 | 1 | IV-일시 | 3 | 아니오 |
(7) LNP897 G502 | 45/43/9/3 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000502 | 1 | IV - 주입 | 3 | 네 |
(8) LNP897 G502 | 45/43/9/3 | 4.5 | Cas9 mRNA (서열 식별 번호:2); G000502 | 1 | IV - 주입 | 3 | 아니오 |
(9)LNP916 GFP | 45/43/9/3 | 4.5 | eGFP mRNA (서열 식별 번호:) | 1 | IV - 주입 | 6 | 네 |
(10) LNP916 GFP |
45/43/9/3 | 4.5 | eGFP mRNA (서열 식별 번호:) | 1 | IV - 주입 | 6 | 아니오 |
표 14. 연구 3.
처리군 | 몰비 (각각 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG | N:P | 카르고 | 샘플 크기 (n) | 경로 | 용량 수준, 총 RNA 함량 (mg/kg) | Dex |
(1) TSS | n/a | n/a | n/a | 3 | IV-일시 | n/a | 아니오 |
(2) LNP1021 G502 | 50/38/9/3 | 6 | Cas9 mRNA (서열 식별 번호:1); G000502 | 3 | IV-일시 | 1 | 아니오 |
(3) LNP1021 G502 | 50/38/9/4 | 6 | Cas9 mRNA (서열 식별 번호:1); G000502 | 1 | IV-일시 | 1 | 네 |
(4) LNP1022 G502 | 55/33/9/3 | 6 | Cas9 mRNA (서열 식별 번호:1); G000502 | 3 | IV-일시 | 1 | 아니오 |
(5) LNP1023 G502 | 45/43/9/3 | 4.5 | Cas9 mRNA (서열 식별 번호:1); G000502 | 3 | IV-일시 | 3 | 아니오 |
(6) LNP1024 G509 | 50/38/9/3 | 6 | Cas9 mRNA (서열 식별 번호:1); G000509 | 3 | IV-일시 | 1 | 아니오 |
(7) LNP1024 G509 | 50/38/9/4 | 6 | Cas9 mRNA (서열 식별 번호:1); G000509 | 1 | IV-일시 | 1 | 네 |
(8) LNP1025 G509 | 55/33/9/3 | 6 | Cas9 mRNA (서열 식별 번호:1); G000509 | 3 | IV-일시 | 1 | 아니오 |
(9) LNP1021 G502 | 50/38/9/3 | 6 | Cas9 mRNA (서열 식별 번호:1); G000502 | 1 | IV-일시 | 3 | 아니오 |
(10) LNP1022 G502 | 50/38/9/3 | 6 | Cas9 mRNA (서열 식별 번호:1); G000502 | 1 | IV-일시 | 3 | 아니오 |
표 15. 연구 1의 IL-6 측정.
처리군 | 사전 출혈 | 6 시간 | 24 시간 |
(1) TSS (비히클) | 5.71±2.70 | 29.1±20.37 | 7.05±3.49 |
(2) LNP699 G502 | 9.73±8.34 | 1296.41±664.71 | 5.43±7.68 |
(3) LNP688 G506 | 16.83±4.08 | 1749.47±1727.22 | 38.57±39.39 |
(4) LNP689 G509 | 18.11±11.51 | 1353.49±766.66 | 32.42±18.40 |
(5) LNP690 G510 | 13.95±1.85 | 11838±17161.74 | 90.07±96.02 |
표 16. 연구 1의 MCP-1 측정.
처리군 | 사전 출혈 | 6 시간 | 24 시간 |
(1) TSS (비히클) | 810.49±178.27 | 1351.16±397.31 | 745.25±56.49 |
(2) LNP699 G502 | 842.31±350.65 | 19298.49±11981.14 | 2092.89±171.21 |
(3) LNP688 G506 | 1190.79±383.64 | 13500.17±12691.60 | 1414.71±422.43 |
(4) LNP689 G509 | 838.63±284.42 | 14427.7±8715.48 | 1590±813.23 |
(5) LNP690 G510 | 785.32±108.97 | 52557.24±48034.68 | 6319.77±983.37 |
표 17. 연구 1의 보체 C3a측정.
처리군 | 사전 출혈 | 6 시간 | 7 일 |
(1) TSS (비히클) | 23.9±11.95 | 25.51±14.79 | 30.67±18.36 |
(2) LNP699 G502 | 32.36±11.29 | 94.33±58.45 | 38.50±12.69 |
(3) LNP688 G506 | 22.30±1.73 | 127.00±22.34 | 37.80±6.86 |
(4) LNP689 G509 | 35.83±21.94 | 174.00±44.51 | 50.83±21.92 |
(5) LNP690 G510 | 36.30±8.21 | 163.00±40.60 | 42.50±12.44 |
표 18. 연구 1의 보체 bb 측정.
처리군 | 04-bb | 사전 출혈 | 6 시간 | 7 일 |
(1) TSS (비히클) | 대조군 | 1.53±0.19 | 3.37±2.13 | 1.43±0.71 |
(2) LNP699 G502 | G502 | 1.45±0.39 | 9.01±5.28 | 1.57±0.54 |
(3) LNP688 G506 | G506 | 1.45±0.78 | 11.78±2.33 | 1.78±0.84 |
(4) LNP689 G509 | G509 | 1.95±0.99 | 15.73±2.23 | 2.83±0.88 |
(5) LNP690 G510 | G510 | 2.12±0.44 | 13.57±1.23 | 2.21±0.72 |
표 19. 연구 2의 IL-6 측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 |
(1) TSS (비히클) | 1.77 | 11.46 | 4.2 | 2.76 | 3.01 |
(2) TSS (비히클) | 5.23 | 18.11 | 20.36 | 13.2 | 6.36 |
(3) LNP898 G502 | 2.02 | 1305.75 | 1138.22 | 383.32 | 16.02 |
(4) LNP898 G502 | 2.34 | 37.19 | 91.59 | 14.11 | 3.07 |
(5) LNP897 G502 | 2.1 | 55.79 | 6.89 | 2.26 | 2.01 |
(6) LNP897 G502 | 6.8 | 10.1 | 44.72 | 5.4 | 2.01 |
(7) LNP897 G502 | 1.97 | 44.87 | 32.61 | 2.97 | 1.11 |
(8) LNP897 G502 | 3.14 | 37.68 | 73.41 | 8.58 | 2.22 |
(9) LNP916 GFP | 1.6 | BLQ | 95.32 | 27.58 | BLQ |
(10) LNP916 GFP | 2.43 | BLQ | 883.01 | 66.71 | BLQ |
표 20. 연구 2의 MCP-1 측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 | |||
(1) TSS (비히클) | 312.12 | 197.24 | 145.36 | 177.02 | 403.82 | |||
(2) TSS (비히클) | 232.44 | 175.08 | 187.72 | 136.64 | 325.69 | |||
(3) LNP898 G502 | 249.1 | 2183.5 | 1814.64 | 1887.41 | 372.38 | |||
(4) LNP898 G502 | 349.51 | 430.49 | 5635.55 | 953.05 | 236.6 | |||
(5) LNP897 G502 | 492.3 | 989.98 | 409.08 | 302.97 | 506.82 | |||
(6) LNP897 G502 | 283.79 | 225.1 | 1141.08 | 484.59 | 259.46 | |||
(7) LNP897 G502 | 223.16 | 349.79 | 398.57 | 172.67 | 287.09 | |||
(8) LNP897 G502 | 584.42 | 853.51 | 3880.81 | 1588.46 | 692.99 | |||
(9) LNP916 GFP | 325.84 | BLQ | 1189.97 | 2279.82 | BLQ | |||
(10) LNP916 GFP | 175.47 | BLQ | 3284.16 | 2023.53 | BLQ |
표 21. 연구 2의 보체 C3a측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 |
(1) TSS (비히클) | 0.087 | 0.096 | 0.048 | 0.033 | 0.038 |
(2) TSS (비히클) | 0.369 | 0.311 | 0.146 | 0.1 | 0.106 |
(3) LNP898 G502 | 0.087 | 0.953 | 0.647 | 0.277 | 0.065 |
(4) LNP898 G502 | 0.099 | 0.262 | 0.123 | 0.049 | 0.044 |
(5) LNP897 G502 | 0.067 | 0.479 | 0.209 | 0.036 | 0.036 |
(6) LNP897 G502 | 0.141 | 0.433 | 0.34 | 0.11 | 0.074 |
(7) LNP897 G502 | 0.1 | 0.345 | 0.396 | 0.096 | 0.127 |
(8) LNP897 G502 | 0.261 | 0.458 | 0.409 | 0.244 | 0.313 |
(9) LNP916 GFP | 0.149 | BLQ | 0.714 | 0.382 | BLQ |
(10) LNP916 GFP | 0.117 | BLQ | 0.752 | 0.723 | BLQ |
표 22. 연구 2의 보체 bb 측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 |
(1) TSS (비히클) | 0.087 | 0.096 | 0.048 | 0.033 | 0.038 |
(2) TSS (비히클) | 0.369 | 0.311 | 0.146 | 0.1 | 0.106 |
(3) LNP898 G502 | 0.087 | 0.953 | 0.647 | 0.277 | 0.065 |
(4) LNP898 G502 | 0.099 | 0.262 | 0.123 | 0.049 | 0.044 |
(5) LNP897 G502 | 0.067 | 0.479 | 0.209 | 0.036 | 0.036 |
(6) LNP897 G502 | 0.141 | 0.433 | 0.34 | 0.11 | 0.074 |
(7) LNP897 G502 | 0.1 | 0.345 | 0.396 | 0.096 | 0.127 |
(8) LNP897 G502 | 0.261 | 0.458 | 0.409 | 0.244 | 0.313 |
(9) LNP916 GFP | 0.149 | BLQ | 0.714 | 0.382 | BLQ |
(10) LNP916 GFP | 0.117 | BLQ | 0.752 | 0.723 | BLQ |
표 23. 연구 3의 IL-6 측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 |
(1) TSS | 1.89±0.97 | 2.56±1.41 | 0.90±0.71 | BLQ | 0.08 |
(2) LNP1021 G502 | 210±0.35 | 7.44±5.16 | 6.94±8.45 | 1.07±1.11 | 1.76±0.98 |
(3) LNP1021 G502 | 0.79 | 2.96 | 4.25 | 0.67 | 0.27 |
(4) LNP1022 G502 | 1.54±1.32 | 20.42±31.60 | 13.94±10.10 | 0.98±0.41 | 2.04±0.65 |
(5) LNP1023 G502 | 2.92±1.68 | 6.28±7.18 | 6.06±2.31 | 3.62±4.68 | 2.00±1.21 |
(6) LNP1024 G509 | 1.43±0.62 | 2.64±1.92 | 7.72±11.96 | 0.45±0.19 | 0.88±0.79 |
(7) LNP1024 G509 | 1.35±0.74 | 2.64±2.35 | 1.71±0.41 | 0.36±0.58 | 0.51±0.32 |
(8) LNP1025 G509 | 1.64 | 2.68 | 25.65 | 0.58 | 2.00 |
(9) LNP1021 G502 | 0.56 | 6.15 | 28.80 | 0.85 | 0.61 |
(10) LNP1022 G502 | 1.76 | 8.66 | 2907.86 | 11.26 | 1.72 |
표 24. 연구 2의 MCP-1 측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 |
(1) TSS | 204.01±46.39 | 197.62±19.54 | 310.84±45.87 | 179.07±20.77 | 234.61±71.79 |
(2) LNP1021 G502 | 303.67±36.37 | 337.63±195.18 | 755.20±581.45 | 339.75±206.20 | 214.82±40.81 |
(3) LNP1021 G502 | 229.30 | 358.10 | 3182.00 | 413.56 | 178.30 |
(4) LNP1022 G502 | 393.63±187.81 | 467.72±221.61 | 1852.94±2199.66 | 497.12±412.30 | 382.19±67.27 |
(5) LNP1023 G502 | 213.72±8.85 | 196.18±62.81 | 1722.18±1413.90 | 197.83±74.01 | 156.16±18.87 |
(6) LNP1024 G509 | 237.76±96.36 | 210.37±95.17 | 468.53±250.42 | 22.32±69.06 | 141.20±71.90 |
(7) LNP1024 G509 | 207.36 | 183.07 | 1885.66 | 235.70 | 163.11 |
(8) LNP1025 G509 | 259.57±112.98 | 299.21±304.89 | 1193.10±974.04 | 258.82±88.53 | 219.86±219.86 |
(9) LNP1021 G502 | 199.29 | 286.04 | 2001.23 | 197.57 | 196.44 |
(10) LNP1022 G502 | 305.81 | 970.65 | 7039.06 | 8379.05 | 203.47 |
표 25. 연구 3의 보체 C3a측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 |
(1) TSS | 42.47±10.30 | 55.40±13.58 | 29.30±14.46 | 41.70±23.65 | 27.43±12.43 |
(2) LNP1021 G502 | 34.37±0.50 | 86.50±3.66 | 90.07±4.85 | 56.60±2.25 | 32.53±0.93 |
(3) LNP1021 G502 | 34.30 | 128.00 | 93.30 | 33.40 | 28.20 |
(4) LNP1022 G502 | 41.55±13.51 | 151.37±109.98 | 82.00±31.82 | 45.57±18.58 | 32.77±6.45 |
(5) LNP1023 G502 | 31.67±3.19 | 74.40±22.08 | 74.13±48.61 | 33.83±9.75 | 27.70±8.05 |
(6) LNP1024 G509 | 56.60±25.61 | 100.37±77.95 | 74.73±70.15 | 55.20±48.34 | 49.97±39.94 |
(7) LNP1024 G509 | 33.80 | 33.90 | 33.70 | 26.10 | 20.90 |
(8) LNP1025 G509 | 39.90±13.01 | 75.73±1.38 | 46.13±30.56 | 25.00±3.80 | 23.90±7.18 |
(9) LNP1021 G502 | 34 | 85.70 | 133.00 | 62.00 | 25.50 |
(10) LNP1022 G502 | 29.8 | 68.10 | 113.00 | 71.70 | 23.30 |
표 26. 연구 3의 보체 bb 측정.
처리군 | 사전 출혈 | 90 분 | 6 시간 | 24 시간 | 7 일 |
(1) TSS | 1.46±0.70 | 2.18±0.78 | 1.96±0.64 | 0.945±0.15 | 1.34±0.50 |
(2) LNP1021 G502 | 1.77±0.60 | 6.51±3.66 | 11.00±4.85 | 3.59±2.25 | 2.07±0.93 |
(3) LNP1021 G502 | 1.24 | 2.90 | 11.50 | 2.97 | 1.24 |
(4) LNP1022 G502 | 1.52±0.34 | 5.67±2.28 | 10.2±3.36 | 3.66±1.68 | 1.84±0.24 |
(5) LNP1023 G502 | 1.65±0.94 | 4.4±1 | 7.68±4.67 | 2.64±1.18 | 2.08±1.32 |
(6) LNP1024 G509 | 1.61±0.13 | 4.52±1.81 | 4.50±3.22 | 1.63±0.84 | 1.63±0.32 |
(7) LNP1024 G509 | 0.96 | 2.99 | 2.64 | 1.13 | 1.07 |
(8) LNP1025 G509 | 1.37±0.17 | 4.9±4.51 | 3.79±3.84 | 1.66±1.43 | 1.35±0.44 |
(9) LNP1021 G502 | 1.41 | 5.67 | 11.50 | 4.64 | 1.38 |
(10) LNP1022 G502 | 1.28 | 5.22 | 14.10 | 5.64 | 1.87 |
실시예 6 -
PEG 지질 스크린
다른 연구에서, 대안의 PEG 지질을 2 mol-% 또는 3 mol-%의 PEG 지질을 포함하는 LNP 제제에서 비교했다.
세 가지 PEG 지질이 연구에서 사용되었다: 지질 1 (DMG-PEG2k; Nof)은 다음과 같이 나타나고:
Heyes, et al., J. Controlled Release, 107 (2005), pp. 278-279 ("Synthesis of PEG2000-C-DMA" 참조)에 기재된 바와 같이 합성된 지질 2는 다음과 같이 나타나고:
WO2016/010840 (화합물 S027, 단락 [00240] 내지 [00244] 참조) 및 WO2011/076807에 개시된 지질 3은 다음과 같이 나타날 수 있다:
지질 A를 각각의 PEG 지질로써 2 mol-% 및 3 mol-%로 제제화했다. 지질 나노입자 성분을 상기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. 요약하면, RNA 카르고를 25 mM 시트레이트, 100 mM NaCl, pH 5.0에서 제조하여, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다. LNP는 약 4.5의 지질 아민 대 RNA 포스페이트 (N:P) 몰비, 중량으로 1:1의 mRNA 대 gRNA의 비율로 제제화되었다.
LNP # |
LNP
784 |
LNP
785 |
LNP
786 |
LNP
787 |
LNP
788 |
LNP
789 |
CL/콜레스테롤/DSPC/PEG (이론적 mol-%) |
45/44/9/2 | 45/43/9/3 | 45/44/9/2 | 45/43/9/3 | 45/44/9/2 | 45/43/9/3 |
mRNA | Cas9 서열 식별 번호:48 | Cas9 서열 식별 번호:48 | Cas9 서열 식별 번호:48 | Cas9 서열 식별 번호:48 | Cas9 서열 식별 번호:48 | Cas9 서열 식별 번호:48 |
gRNA | G282 서열 식별 번호:42 | G282 서열 식별 번호:42 | G282 서열 식별 번호:42 | G282, 서열 식별 번호:42 | G282, 서열 식별 번호:42 | G282 서열 식별 번호:42 |
PEG 유형 | 지질 1 | 지질 1 | 지질 2 | 지질 2 | 지질 3 | 지질 3 |
N/P | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 |
Cas9 mRNA, sg282, 및 LNP를 실시예 1에 기재된 바와 같이 제조했다.지질 1, 지질 2, 또는 지질 3을 포함하는 LNP 조성물을 암컷 CD-1 마우스에게 투여하고 1 mg/kg 및 0.5 mg/kg의 체중으로 실시예 1에 기재된 바와 같이 평가했다 마우스의 코호트를 실시예 1의 방법에 따른 차세대 시퀀싱 (NGS) 및 혈청 TTR 수준에 의해 간 편집에 대해 측정했다.
도 6A 및 도 6B는 PEG 지질 제제 사이의 혈청 TTR 수준을 비교한다. 도 6A는 혈청 TTR을 μg/mL로 나타내고, 도 6B는 녹다운 퍼센트(%TSS)로서 데이터를 나타낸다. 도 6C는 간에서 달성된 편집 퍼센트를 나타낸다. 데이터는 테스트된 PEG 지질 각각을 갖는 LNP 조성물이 2 mol-% 및 3 mol-%에서 효능을 테스트했고, 지질 1이 지질 2 및 지질 3보다 약간 더 일관되게 수행함을 나타낸다.
실시예 7 - 지질 A 유사체
지질 A의 다수의 구조적 유사체를 본원에 기재된 LNP 조성물에서 합성하고 테스트했다.
합성: 지질 A는 4,4-비스(옥틸옥시)부탄산(WO2015/095340의 실시예 13에서 "중간체 13b")을 (9Z,12Z)-3-하이드록시-2-(하이드록시메틸)프로필 옥타데카-9,12-디에노에이트("중간체 13c")와 반응시키고, 그 후 중간체 13b 및 중간체 13c의 생성물을 3-디에틸아미노-1-프로판올과 반응시켜 헤드 그룹을 첨가하여 제조된다. (WO2015/095340의 pp 84-86을 참조하라.)
WO2015/095340의 중간체 13b(4,4 비스(옥틸옥시)부탄산)를 다음과 같이 4,4-비스(옥틸옥시)부탄니트릴을 통해 합성했다:
중간체 13a: 4,4-비스(옥틸옥시)부탄니트릴
4,4-디에톡시부탄니트릴 (9.4 g, 60 mmol) 및 옥탄-1-올 (23.1 g, 178 mmol)의 혼합물에 피리디늄 p-톨루엔설포네이트 (748 mg, 3.0 mmol)를 rt에서 첨가했다. 혼합물을 105℃로 가온하고 반응 용기를 공기 중에 개방하고 환류 응축기가 장착되지 않은 상태에서 18 시간 동안 교반했다. 이후 반응 혼합물을 실온으로 냉각시키고 실리칼 겔에서 정제하여 (헥산 중의 에틸 아세테이트의 0-5% 구배) 10.1 g (31.0 mmol)의 중간체 13a를 투명한 오일로 수득했다. 1H NMR (400 MHz, CDCl3) δ 4.55 (t, J = 5.3 Hz, 1H), 3.60 (dt, J = 9.2, 6.6 Hz, 2H), 3.43 (dt, J = 9.2, 6.6 Hz, 2H), 2.42 (t, J = 7.4 Hz, 2H), 1.94 (td, J = 7.4, 5.3 Hz, 2H), 1.63 - 1.50 (m, 4H), 1.38 - 1.19 (m, 20H), 0.93 - 0.82 (m, 6H) ppm.
다음으로, 에탄올 (30 mL) 중의 중간체 13a (8.42 g, 31 mmol)의 용액에 31 mL의 수성 포타슘 하이드록사이드 (2.5 M, 30.9 mL, 77.3 mmol)를 실온에서 첨가했다. 용기에 환류 응축기를 장착하고, 혼합물을 110 ℃까지 가열하고 24 시간 동안 교반했다. 이후 혼합물을 실온으로 냉각시키고, 수성 하이드로클로라이드 산 (1N)으로 pH 5로 산성화하고, 헥산으로 3 회 추출했다. 조합된 유기 추출물을 물 (2 회) 및 염수(brine)로 세척하고, 무수 마그네슘 설페이트로 건조시키고, 진공에서 농축시켜 8.15 g (23.6 mmol)의 중간체 13b를 투명한 오일로 수득했고, 이를 추가의 정제 없이 사용했다. 1H NMR (400 MHz, CDCl3) δ 4.50 (t, J = 5.5 Hz, 1H), 3.57 (dt, J = 9.4, 6.7 Hz, 2H), 3.41 (dt, J = 9.3, 6.7 Hz, 2H), 2.40 (t, J = 7.4 Hz, 2H), 1.92 (td, J = 7.4, 5.3 Hz, 2H), 1.56 (m, 4H), 1.37 - 1.21 (m, 20H), 0.92 - 0.83 (m, 6H) ppm (하기 구조).
중간체 13b
상기 기재된 방법을 사용하여, 중간체B3-F3로 지칭되고 아래에 도시된 C(5, 6, 7, 9, 및 10)-아세탈 산 중간체를 적절한 알칸-1-올 시약을 사용하여 제조했다.
중간체 B3 4,4-비스(펜틸옥시)부탄산
1H NMR (400 MHz, CDCl3) δ 4.52 (t, J = 5.5 Hz, 1H), 3.58 (dt, J = 9.3, 6.6 Hz, 2H), 3.41 (dt, J = 9.3, 6.7 Hz, 2H), 2.45 (t, J = 7.4 Hz, 2H), 1.94 (m, 2H), 1.57 (m, 4H), 1.32 (m, J = 3.7 Hz, 8H), 0.95 - 0.83 (m, 6H) ppm.
중간체 C3: 4,4-비스(헥실옥시)부탄산
1H NMR (400 MHz, CDCl3) δ 4.44 (t, J = 5.6 Hz, 1H), 3.49 (dt, J = 9.3, 6.9 Hz, 2H), 3.39 (dt, J = 9.3, 6.8 Hz, 2H), 2.12 (t, J = 7.6 Hz, 2H), 1.79 (q, J = 7.0 Hz, 2H), 1.54 (m, 4H), 1.29 (m, 12H), 0.94 - 0.82 (m, 6H) ppm.
중간체 D3: 4,4-비스(헵틸옥시)부탄산
1H NMR (400 MHz, CDCl3) δ 8.85 (br s, 1H), 4.46 (t, J = 5.6 Hz, 1H), 3.52 (dt, J = 9.4, 6.8 Hz, 2H), 3.39 (dt, J = 9.3, 6.8 Hz, 2H), 2.26 (t, J = 7.6 Hz, 2H), 1.85 (q, J = 7.0 Hz, 2H), 1.53 (m, 4H), 1.29 (m, 16H), 0.94 - 0.80 (m, 6H) ppm.
중간체 E3: 4,4-비스(노닐옥시)부탄산
1H NMR (400 MHz, CDCl3) δ 5.32 (br s, 1H), 4.44 (t, J = 5.6 Hz, 1H), 3.49 (dt, J = 9.3, 6.9 Hz, 2H), 3.38 (dt, J = 9.4, 6.9 Hz, 2H), 2.10 (t, J = 7.6 Hz, 2H), 1.78 (q, J = 7.0 Hz, 2H), 1.53 (m, 4H), 1.27 (m, 24H), 0.88 (t, J = 6.6 Hz, 6H) ppm.
중간체 F3: 4,4-비스(데실옥시)부탄산:
1H NMR (400 MHz, CDCl3) δ 4.48 (t, J = 5.5 Hz, 1H), 3.55 (m, 2H), 3.42 (m, 2H), 2.29 (dd, J = 10.8, 7.5 Hz, 2H), 1.90 - 1.82 (m, 2H), 1.55 (m, 4H), 1.27 (m, 28H), 0.88 (t, J = 6.7 Hz, 6H) ppm.
지질 A의 아세탈 유사체 (C(8))를 C(5, 6, 7, 9, 또는 10)-아세탈 산 중간체 (B3-F3)를 중간체 13c과 반응시키고, 그 후 그 단계의 생성물을 3-디에틸아미노-1-프로판올과 반응시켜 합성했다. (WO2015/095340의 pp 84-86을 참조하라.) 각 유사체를 합성하고 1H NMR (데이터는 나타나지 않음)로 특징규명했다.
C7, C9, 및 C10 유사체를 45 mol-% 지질 A 유사체, 2 mol-% DMG-PEG2k, 9 mol-% DSPC, 및 44 mol-% 콜레스테롤에서, 4.5의 N:P 비율로 제제화했다. 각 유사체를 또한 55 mol-% 지질 A 유사체, 2.5 mol-% DMG-PEG2k, 9 mol-% DSPC, 및 38.5 mol-% 콜레스테롤에서, 6의 N:P 비율로 제제화했다. 지질 나노입자 성분을 상기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. RNA 카르고를 25 mM 시트레이트, 100 mM NaCl, pH 5.0에서 제조하여, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다.
RNA 카르고는 위에 기재된 바와 같이 제조된 서열 식별 번호:43 및 sg282를 포함하는 Cas9 mRNA를 포함했다. LNP는 실시예 1에 기재된 바와 같이 형성되었다.
C(5) 및 C(6) 지질 A 유사체를 포함하는 LNP 조성물을 포함하는 아세탈 유사체의 확장된 패널을 이전 패널과 함께 테스트했다. 두 가지 새로운 유사체를 위에 기재된 바와 같이 55 mol-% 지질 A 유사체, 2.5 mol-% DMG-PEG2k, 9 mol-% DPSC, 및 33.5 mol-% 콜레스테롤에서, 6의 N/P 비율로 제제화했다. 분석은 모든 LNP의 크기가 120 nm 미만이고, PDI가 0.2 미만이고 캡슐화된 RNA %가 80% 초과임을 나타냈다. 제제에 대한 분석 결과는 하기 표 28에 있다.
LNP ID | 지질 A 유사체 | 유사체 mol-% | PEG% | N/P |
RNA
농도 (mg/mL) |
%EE | Z-평균 (nm) | PDI | 수 평균 (nm) |
LNP 1122 | C5 유사체 (LP000030-001) |
55 | 2.5 | 6 | 0.063 | 88 | 118.8 | 0.103 | 88.17 |
LNP 1123 | C6 유사체(LP000031-001) | 55 | 2.5 | 6 | 0.067 | 95 | 107.6 | 0.038 | 88.1 |
LNP 1004 | C7 유사체 (LP000020-001) |
55 | 2.5 | 6 | 0.068 | 98 | 100 | 0.012 | 81.55 |
LNP 1002 | LP000001-011 | 55 | 2.5 | 6 | 0.067 | 98 | 95.06 | 0.01 | 78.95 |
LNP 1006 | C9 유사체(LP000021-001) | 55 | 2.5 | 6 | 0.067 | 97 | 95.43 | 0.022 | 80.35 |
LNP 1008 | C10 유사체 (LP000022-001) |
55 | 2.5 | 6 | 0.069 | 95 | 103.9 | 0.008 | 86.79 |
물에 용해된 6-(p-톨루이디노)-6-나프탈렌 설폰산 ("TNS")을 사용하여 pKa에 대해 유사체를 평가했다. 이 분석에서 0.1 M 포스페이트 버퍼를 4.5 내지 10.5 범위의 상이한 pH 값에서 제조했다. 각각의 유사체를 100% 에탄올에서 개별적으로 제조했다. 이후 지질 및 TNS를 개별 pH 버퍼에 첨가하고 플레이트로 옮겨 321-488 nm 파장에서 SpectraMax 플레이트 판독기에서 분석했다. pKa를 생성하기 위해 값을 플로팅했고, logIC50을 pKa로서 사용한다.
실시예 1에 기재된 바에 따라 암컷 CD-1 마우스에게 0.3 mg/kg (도 7A-도 7E), 또는 kg당 0.1 mg (도 7F-도 7G) 투여했다. 요약하면, 그룹당 n=5인 Charles River Laboratories의 CD-1 암컷 마우스에 다양한 용량으로 LNP 조성물을 투여했다. 부검에서 (투여 후 7 일), TTR 분석을 위해 혈청을 수집하고 편집 분석을 위해 간을 수집했다. 혈청 TTR 및 편집 퍼센트 분석을 실시예 1에 기재된 바와 같이 수행했다. 도 7A-도 7E의 혈청 TTR 수준 및 간 편집은 모든 유사체가 체중 킬로그램당 0.3 밀리그램에서 지질 A에 필적하게 수행했음을 나타낸다. 도 7F-도 7G는 지질 A가 가장 높은 효능을 가지지만, 새로 합성된 유사체가 모두 적합한 TTR 녹다운 및 간 편집을 갖는다는 것을 나타낸다.
실시예 8 - 용량 반응 곡선 - 일차 시노 간세포
일차 간 간세포. 일차 시노몰구스 간 간세포(PCH)(Gibco)를 해동하고 보충제(Gibco, Cat. CM7000)를 포함한 간세포 해동 배지에 재현탁시킨 후 80 g에서 4 분 동안 원심분리했다. 상청액을 버리고 펠렛화된 세포를 간세포 플레이팅 배지 더하기 보충제 팩 (Invitrogen, Cat. A1217601 및 CM3000)에 재현탁시켰다. 세포를 계수하고 50,000 세포/웰의 밀도로 Bio-코트 콜라겐 I 코팅된 96-웰 플레이트 (ThermoFisher, Cat. 877272)에 플레이팅했다. LNP 투여 전에 플레이팅된 세포를 조직 배양 인큐베이터 (37℃ 및 5% CO2 대기)에서 24 시간 동안 침강 및 부착시켰다. 인큐베이션 후 세포를 단층 형성으로 확인하고 배지를 간세포 배양 배지를 무혈청 보충제 팩(Invitrogen, Cat. A1217601 및 CM4000)로 교체했다.
이 연구를 위한 LNP 제제(LNP1021, LNP1022, LNP1023, LNP1024, LNP1025, 및 LNP897)를 위에 기재된 바와 같이 제조했다.
변형된 sgRNA를 포함하는 다양한 용량의 지질 나노입자 제제를 일차 시노 간세포에서 테스트하여 용량 반응 곡선을 생성했다. 플레이팅 및 24 시간 배양 후, LNP를 6% 시노 혈청을 함유하는 간세포 유지 배지에서 37℃에서 5 분 동안 인큐베이션했다. 인큐베이션 후 LNP를 100 ng mRNA에서 시작하여 8 점 2-배 용량 반응 곡선에서 일차 사이노 간세포에 첨가했다. 실시예 1에 기재된 바와 같이 NGS 분석을 위한 처리 후 72 시간에 세포를 용해시켰다. 다양한 LNP 조성물에 대해 편집 퍼센트를 측정했고 데이터는 도 8A에 그래프로 나타난다. Cas9 mRNA(서열 식별 번호 48) 및 U-고갈된 Cas9 mRNA(SEQ I NO:43)에 의한 편집 %가 도 8B에 제시된다. LNP 조성물은 표 2(LNP 897) 및 표 5(LNP 1021, 1022, 1023, 1024, 및 1025)에 기재되어 있다.
결과는 비교 효능 평가에 대한 정량 분석을 보여주며, mRNA 및 LNP 조성물 두 가지 모두 효능에 영향을 준다는 것을 입증한다.
실시예 9 - RNA 카르고: mRNA 및 gRNA 공제제
이 연구는 gRNA 대 mRNA의 상이한 비율의 마우스에서 생체내 효능을 평가했다. 서열 식별 번호: 4의 ORF, HSD 5' UTR, 인간 알부민 3' UTR, 코작 서열, 및 폴리-A 테일을 갖는 CleanCap™ 캡핑된 Cas9 mRNA를 우리딘 트리포스페이트 대신 N1-메틸슈도우리딘 트리포스페이트를 사용하여 실시예 1에서 지시된 바와 같이 IVT 합성에 의해 제조했다.
50:38:9:3 몰비의 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG 및 6의 N:P 비율을 갖는, 실시예 2에 기재된 바와 같은 기재된 mRNA 및 sg282(서열 식별 번호: 42; G282)로부터 제조된 LNP 제제. 제제의 gRNA:Cas9 mRNA 중량비가 표 29에 나타났다.
LNP ID | 가이드 : Cas9 mRNA 비율 (w/w) | RNA 농도 (mg/mL) | EE (%) | Z-평균 크기 (nm) | 입자 PDI | 수 평균 (nm) |
1110 | 8:1 | 0.92 | 99 | 69.52 | 0.022 | 56.47 |
1111 | 4:1 | 0.86 | 97 | 76.65 | 0.065 | 57.36 |
1112 | 2:1 | 0.90 | 99 | 76.58 | 0.036 | 63.11 |
1113 | 1:1 | 0.97 | 99 | 76.60 | 0.071 | 58.92 |
1114 | 1:2 | 1.05 | 99 | 76.34 | 0.018 | 62.82 |
1115 | 1:4 | 0.65 | 99 | 82.64 | 0.018 | 66.63 |
1116 | 1:8 | 0.75 | 100 | 82.01 | 0.039 | 65.05 |
생체내 특징규명을 위해, 상기 LNP는 kg당 0.1 mg 총 RNA(mg 가이드 RNA + mg mRNA)로 마우스에게 투여되었다 (그룹당 n=5). 투여 후 7 내지 9 일에, 동물을 희생시키고, 혈액 및 간을 수집하고, 혈청 TTR 및 간 편집을 실시예 1에 기재된 바와 같이 측정했다. 혈청 TTR 및 간 편집 결과는 도 9A 및 9B에 나타난다. 음성 대조군 마우스에 TSS 비히클을 투여했다.
또한, 상기 LNP를 kg당 0.06 mg 내지 kg당 0.4 mg로 gRNA 용량을 변화시키면서 kg당 0.05 mg mRNA의 일정 mRNA 용량에서 마우스에게 투여했다 (그룹당 n=5). 투여 후 7 내지 9 일에, 동물을 희생시키고, 혈액 및 간을 수집하고, 혈청 TTR 및 간 편집을 측정했다. 혈청 TTR 및 간 편집 결과는 도 9C 및 도 9D에 나타난다. 음성 대조군 마우스에 TSS 비히클을 투여했다.
실시예 10 - 중성 지질
LNP의 생체내 효능을 평가하기 위해, LNP 제제는 실시예 2에 기재된 바와 같이 실시예 2의 mRNA 및 sg534(서열 식별 번호: 72; G534)로써 제조되었다. 지질 나노입자 성분을 하기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. 간단히 말하면, RNA 카르고는 pH 5.0에서 25 mM 시트레이트 및 100 mM NaCl의 버퍼에서 제조되어, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다. LNP는 약 6의 지질 아민 대 RNA 포스페이트 (N:P) 몰비로 중량으로 1:2 gRNA 대 mRNA의 비율로 제제화되었다.
LNP 제제는 실시예 1에 기재된 바와 같이 평균 입자 크기, 다분산도(pdi), 총 RNA 함량 및 RNA의 캡슐화 효율에 대해 분석되엇다. 평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 30에 나타난다. 지질의 몰비는 아민 지질 (지질 A)/중성 지질/헬퍼 지질 (콜레스테롤)/PEG 지질 (PEG2k-DMG)로서 제공된다. 중성 지질은 명시된 바와 같이 DSP, DPPC이거나 부재했다.
표 30. LNP 조성물 및 데이터. (지질의 몰비는 아민 지질 (지질 A)/중성 지질/헬퍼 지질 (콜레스테롤)/PEG 지질 (PEG2k-DMG)로 제공됨.)
샘플 ID | 중성 지질 | 몰비 |
RNA
농도 (mg/mL) |
%EE | Z-평균 (nm) | PDI | 수 평균 (nm) | 간 편집 % | 혈청 TTR (μg/mL) | % TTR KD |
TSS 대조군 | 0.0 | 1248.9 | ||||||||
CO241 | - | 50.0/0.0/47.0/3.0 | 1.46 | 94 | 75.64 | 0.090 | 54.21 | 1.8 | 1070.2 | 14.3 |
CO242 | - | 59.0/0.0/38.0/3.0 | 1.51 | 94 | 92.25 | 0.019 | 75.56 | 12.0 | 819.6 | 34.4 |
CO243 | - | 54.5/0.0/42.5/3.0 | 1.62 | 94 | 78.90 | 0.052 | 61.49 | 3.3 | 1260.5 | -0.9 |
CO244 | DSPC | 50.0/9.0/39.0/2.0 | 1.50 | 93 | 101.3 | 0.044 | 80.73 | 27.4 | 741.0 | 40.7 |
CO034 | DSPC | 50.0/9.0/38.0/3.0 | 1.48 | 97 | 84.23 | 0.040 | 66.96 | 34.2 | 630.1 | 49.6 |
CO245 | DSPC | 52.5/4.0/42.5/3.0 | 1.55 | 95 | 81.88 | 0.054 | 64.54 | 5.8 | 846.6 | 32.2 |
CO246 | DPPC | 50.0/9.0/38.0/3.0 | 1.52 | 96 | 87.11 | 0.040 | 70.04 | 35.9 | 528.6 | 57.7 |
CO247 | DPPC | 52.5/4.0/42.5/3.0 | 1.54 | 97 | 83.67 | 0.050 | 66.43 | 18.3 | 726.6 | 41.8 |
생체내 특징규명을 위해, 상기 LNP를 암컷 Sprague Dawley 래트에게 kg 체중당 0.3 mg 총 RNA(가이드 RNA 및 mRNA)로 정맥내 투여했다. 그룹당 다섯 마리의 래트가 있었다. 투여 후 7일에, 동물을 희생시키고, 혈액 및 간을 수집하고, 혈청 TTR 및 간 편집을 실시예 1에 기재된 바와 같이 측정했다. 음성 대조군 동물에 TSS 비히클을 투여했다. 혈청 TTR 및 간 편집 결과는 도 10A 및 10B, 및 (상기) 표 30에 나타난다.
공개된 서열의 간단한 설명
서열 자체에 대해 하기 서열 표를 참조하라. 전사물 서열은 일반적으로 ARCA와 함께 사용하기 위한 최초 세 개의 뉴클레오타이드로서 GGG 또는 CleanCapTM와 함께 사용하기 위한 최초 세 개의 뉴클레오타이드로서 AGG를 포함한다. 따라서, 최초 세 개의 뉴클레오타이드는 백시니아(Vaccinia) 캡핑 효소와 같은 다른 캡핑 접근법과 함께 사용하기 위해 변형될 수 있다. 프로모터 및 폴리-A 서열은 전사물 서열에 포함되지 않는다. 프로모터, 예컨대 T7 프로모터 (서열 식별 번호: 31) 및 폴리-A 서열, 예컨대 서열 식별 번호: 62 또는 63이 5' 및 3' 말단에서 각각 개시된 전사물 서열에 부가될 수 있다. 대부분의 뉴클레오타이드 서열이 DNA로서 제공되지만 Ts를 Us로 변경하여 RNA로 용이하게 전환될 수 있다.
서열 표
다음 서열 표는 본원에 개시된 서열의 목록을 제공한다. DNA 서열 (Ts 포함)이 RNA와 관련하여 참조되는 경우, Ts가 (맥락에 따라 변형된 또는 비변형일 수 있는) Us로 대체되어야 하고, 그 반대도 마찬가지인 것으로 이해된다.
* = PS 연결; 'm' = 2'-O-Me 뉴클레오타이드
마우스 G000282 NGS 프라이머 서열
정방향 프라이머:
CACTCTTTCCCTACACGACGCTCTTCCGATCTGTTTTGTTCCAGAGTCTATCACCG
역방향 프라이머:
GGAGTTCAGACGTGTGCTCTTCCGATCTACACGAATAAGAGCAAATGGGAAC
래트 G000390 NGS 프라이머 서열
정방향 프라이머:
CACTCTTTCCCTACACGACGCTCTTCCGATCTTGCATTTCATGAGACCGAAAACA
역방향 프라이머:
GGAGTTCAGACGTGTGCTCTTCCGATCTGCTACAGTAGAGCTGTACATAAAACTT
GFP 서열:
TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTCTAATACGACTCACTATAGGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGTTGCAGGCCTTATTCGGATCCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAGGAATTATGCAGTCTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAATCTAGACTTAAGCTTGATGAGCTCTAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCG
SEQUENCE LISTING
<110> INTELLIA THERAPEUTICS, INC.
<120> FORMULATIONS
<130> 12793.0014-00304
<140> PCT/US2018/053559
<141> 2018-09-28
<150> 62/566,240
<151> 2017-09-29
<160> 84
<170> PatentIn version 3.5
<210> 1
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 1
atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg atgggcagtc 60
atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa cacagacaga 120
cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga aacagcagaa 180
gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa cagaatctgc 240
tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt cttccacaga 300
ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc gatcttcgga 360
aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca cctgagaaag 420
aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc actggcacac 480
atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga caacagcgac 540
gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga agaaaacccg 600
atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag caagagcaga 660
agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact gttcggaaac 720
ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga cctggcagaa 780
gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa cctgctggca 840
cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag cgacgcaatc 900
ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct gagcgcaagc 960
atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc actggtcaga 1020
cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa cggatacgca 1080
ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa gccgatcctg 1140
gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga cctgctgaga 1200
aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg agaactgcac 1260
gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag agaaaagatc 1320
gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag aggaaacagc 1380
agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa cttcgaagaa 1440
gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa cttcgacaag 1500
aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata cttcacagtc 1560
tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc ggcattcctg 1620
agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag aaaggtcaca 1680
gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag cgtcgaaatc 1740
agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga agacatcgtc 1860
ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa gacatacgca 1920
cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac aggatgggga 1980
agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa gacaatcctg 2040
gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg agacagcctg 2160
cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat cctgcagaca 2220
gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga aaacatcgtc 2280
atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa ggaacacccg 2400
gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca gaacggaaga 2460
gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga cgtcgaccac 2520
atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa gaagatgaag 2640
aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt cgacaacctg 2700
acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat caagagacag 2760
ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag cagaatgaac 2820
acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac actgaagagc 2880
aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga aatcaacaac 2940
taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact gatcaagaag 3000
tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga cgtcagaaag 3060
atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt cttctacagc 3120
aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat cagaaagaga 3180
ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg aagagacttc 3240
gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa gacagaagtc 3300
cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga caagctgatc 3360
gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc gacagtcgca 3420
tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct gaagagcgtc 3480
aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa cccgatcgac 3540
ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa gctgccgaag 3600
tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc aggagaactg 3660
cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta cctggcaagc 3720
cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct gttcgtcgaa 3780
cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag caagagagtc 3840
atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca cagagacaag 3900
ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa cctgggagca 3960
ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac aagcacaaag 4020
gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga aacaagaatc 4080
gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag aaaggtctag 4140
<210> 2
<211> 4143
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 2
atggataaga agtactcaat cgggctggat atcggaacta attccgtggg ttgggcagtg 60
atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa caccgataga 120
cacagcatca agaaaaatct catcggagcc ctgctgtttg actccggcga aaccgcagaa 180
gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa tcgcatctgc 240
tatctgcaag agatcttttc gaacgaaatg gcaaaggtcg acgacagctt cttccaccgc 300
ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc tatctttgga 360
aacatcgtcg acgaagtggc gtaccacgaa aagtacccga ccatctacca tctgcggaag 420
aagttggttg actcaactga caaggccgac ctcagattga tctacttggc cctcgcccat 480
atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga taactccgac 540
gtggataagc ttttcattca actggtgcag acctacaacc aactgttcga agaaaaccca 600
atcaatgcta gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc gaagtcgcgg 660
cgcctcgaaa acctgatcgc acagctgccg ggagagaaaa agaacggact tttcggcaac 720
ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga cctggccgag 780
gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa tttgctggca 840
caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc ggacgcaatc 900
ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct tagcgcctcg 960
atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc gctcgtgaga 1020
cagcaactgc ctgaaaagta caaggagatc ttcttcgacc agtccaagaa tgggtacgca 1080
gggtacatcg atggaggcgc tagccaggaa gagttctata agttcatcaa gccaatcctg 1140
gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga tctgctccgg 1200
aaacagagaa cctttgacaa cggatccatt ccccaccaga tccatctggg tgagctgcac 1260
gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg ggaaaagatc 1320
gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg cggcaattcg 1380
cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa tttcgaggaa 1440
gttgtggata agggagcttc ggcacaaagc ttcatcgaac gaatgaccaa cttcgacaag 1500
aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata cttcactgtc 1560
tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc ggcctttctg 1620
tccggagaac agaagaaagc aattgtcgat ctgctgttca agaccaaccg caaggtgacc 1680
gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc agtggaaatc 1740
agcggggtgg aggacagatt caacgcttcg ctgggaacct atcatgatct cctgaagatc 1800
atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga agatatcgtc 1860
ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa gacctacgct 1920
catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac tggttggggc 1980
cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa aactatcctg 2040
gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcaattgat ccacgacgac 2100
agcctgacct ttaaggagga catccaaaaa gcacaagtgt ccggacaggg agactcactc 2160
catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat tctgcaaact 2220
gtgaaggtgg tcgacgagct ggtgaaggtc atgggacggc acaaaccgga gaatatcgtg 2280
attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaaaaactc ccgcgaaagg 2340
atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa agagcacccg 2400
gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca aaatggacgg 2460
gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga cgtggaccac 2520
atcgttccac agtcctttct gaaggatgac tcgatcgata acaaggtgtt gactcgcagc 2580
gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa gaagatgaag 2640
aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt tgacaatctc 2700
actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat caaacggcag 2760
ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcttggactc ccgcatgaac 2820
actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac cctgaaaagc 2880
aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga aatcaacaac 2940
taccatcacg cgcatgacgc atacctcaac gctgtggtcg gtaccgccct gatcaaaaag 3000
taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga cgtgaggaag 3060
atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt cttttactca 3120
aacatcatga actttttcaa gactgaaatt acgctggcca atggagaaat caggaagagg 3180
ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg cagggacttc 3240
gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa aaccgaagtg 3300
caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga caagctcatt 3360
gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc gactgtcgca 3420
tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaaaaagct caaatccgtc 3480
aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa cccgattgat 3540
ttcctcgagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa actccccaag 3600
tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc cggagaactc 3660
caaaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta tcttgcttcg 3720
cactacgaaa aactcaaagg gtcaccggaa gataacgaac agaagcagct tttcgtggag 3780
cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc aaagcgcgtg 3840
atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca tagagataag 3900
ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa cctgggagcc 3960
ccagccgcct tcaagtactt cgatactact atcgatcgca aaagatacac gtccaccaag 4020
gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga aactaggatc 4080
gatctgtcgc agctgggtgg cgatggcggt ggatctccga aaaagaagag aaaggtgtaa 4140
tga 4143
<210> 3
<211> 1379
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Cas9 sequence"
<400> 3
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 4
<211> 4140
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 4
auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140
<210> 5
<211> 4143
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 5
auggauaaga aguacucaau cgggcuggau aucggaacua auuccguggg uugggcagug 60
aucacggaug aauacaaagu gccguccaag aaguucaagg uccuggggaa caccgauaga 120
cacagcauca agaaaaaucu caucggagcc cugcuguuug acuccggcga aaccgcagaa 180
gcgacccggc ucaaacguac cgcgaggcga cgcuacaccc ggcggaagaa ucgcaucugc 240
uaucugcaag agaucuuuuc gaacgaaaug gcaaaggucg acgacagcuu cuuccaccgc 300
cuggaagaau cuuuccuggu ggaggaggac aagaagcaug aacggcaucc uaucuuugga 360
aacaucgucg acgaaguggc guaccacgaa aaguacccga ccaucuacca ucugcggaag 420
aaguugguug acucaacuga caaggccgac cucagauuga ucuacuuggc ccucgcccau 480
augaucaaau uccgcggaca cuuccugauc gaaggcgauc ugaacccuga uaacuccgac 540
guggauaagc uuuucauuca acuggugcag accuacaacc aacuguucga agaaaaccca 600
aucaaugcua gcggcgucga ugccaaggcc auccuguccg cccggcuguc gaagucgcgg 660
cgccucgaaa accugaucgc acagcugccg ggagagaaaa agaacggacu uuucggcaac 720
uugaucgcuc ucucacuggg acucacuccc aauuucaagu ccaauuuuga ccuggccgag 780
gacgcgaagc ugcaacucuc aaaggacacc uacgacgacg acuuggacaa uuugcuggca 840
caaauuggcg aucaguacgc ggaucuguuc cuugccgcua agaaccuuuc ggacgcaauc 900
uugcuguccg auauccugcg cgugaacacc gaaauaacca aagcgccgcu uagcgccucg 960
augauuaagc gguacgacga gcaucaccag gaucucacgc ugcucaaagc gcucgugaga 1020
cagcaacugc cugaaaagua caaggagauc uucuucgacc aguccaagaa uggguacgca 1080
ggguacaucg auggaggcgc uagccaggaa gaguucuaua aguucaucaa gccaauccug 1140
gaaaagaugg acggaaccga agaacugcug gucaagcuga acagggagga ucugcuccgg 1200
aaacagagaa ccuuugacaa cggauccauu ccccaccaga uccaucuggg ugagcugcac 1260
gccaucuugc ggcgccagga ggacuuuuac ccauuccuca aggacaaccg ggaaaagauc 1320
gagaaaauuc ugacguuccg caucccguau uacgugggcc cacuggcgcg cggcaauucg 1380
cgcuucgcgu ggaugacuag aaaaucagag gaaaccauca cuccuuggaa uuucgaggaa 1440
guuguggaua agggagcuuc ggcacaaagc uucaucgaac gaaugaccaa cuucgacaag 1500
aaucucccaa acgagaaggu gcuuccuaag cacagccucc uuuacgaaua cuucacuguc 1560
uacaacgaac ugacuaaagu gaaauacguu acugaaggaa ugaggaagcc ggccuuucug 1620
uccggagaac agaagaaagc aauugucgau cugcuguuca agaccaaccg caaggugacc 1680
gucaagcagc uuaaagagga cuacuucaag aagaucgagu guuucgacuc aguggaaauc 1740
agcggggugg aggacagauu caacgcuucg cugggaaccu aucaugaucu ccugaagauc 1800
aucaaggaca aggacuuccu ugacaacgag gagaacgagg acauccugga agauaucguc 1860
cugaccuuga cccuuuucga ggaucgcgag augaucgagg agaggcuuaa gaccuacgcu 1920
caucucuucg acgauaaggu caugaaacaa cucaagcgcc gccgguacac ugguuggggc 1980
cgccucuccc gcaagcugau caacgguauu cgcgauaaac agagcgguaa aacuauccug 2040
gauuuccuca aaucggaugg cuucgcuaau cguaacuuca ugcaauugau ccacgacgac 2100
agccugaccu uuaaggagga cauccaaaaa gcacaagugu ccggacaggg agacucacuc 2160
caugaacaca ucgcgaaucu ggccgguucg ccggcgauua agaagggaau ucugcaaacu 2220
gugaaggugg ucgacgagcu ggugaagguc augggacggc acaaaccgga gaauaucgug 2280
auugaaaugg cccgagaaaa ccagacuacc cagaagggcc agaaaaacuc ccgcgaaagg 2340
augaagcgga ucgaagaagg aaucaaggag cugggcagcc agauccugaa agagcacccg 2400
guggaaaaca cgcagcugca gaacgagaag cucuaccugu acuauuugca aaauggacgg 2460
gacauguacg uggaccaaga gcuggacauc aaucgguugu cugauuacga cguggaccac 2520
aucguuccac aguccuuucu gaaggaugac ucgaucgaua acaagguguu gacucgcagc 2580
gacaagaaca gagggaaguc agauaaugug ccaucggagg aggucgugaa gaagaugaag 2640
aauuacuggc ggcagcuccu gaaugcgaag cugauuaccc agagaaaguu ugacaaucuc 2700
acuaaagccg agcgcggcgg acucucagag cuggauaagg cuggauucau caaacggcag 2760
cuggucgaga cucggcagau uaccaagcac guggcgcaga ucuuggacuc ccgcaugaac 2820
acuaaauacg acgagaacga uaagcucauc cgggaaguga aggugauuac ccugaaaagc 2880
aaacuugugu cggacuuucg gaaggacuuu caguuuuaca aagugagaga aaucaacaac 2940
uaccaucacg cgcaugacgc auaccucaac gcuguggucg guaccgcccu gaucaaaaag 3000
uacccuaaac uugaaucgga guuuguguac ggagacuaca aggucuacga cgugaggaag 3060
augauagcca aguccgaaca ggaaaucggg aaagcaacug cgaaauacuu cuuuuacuca 3120
aacaucauga acuuuuucaa gacugaaauu acgcuggcca auggagaaau caggaagagg 3180
ccacugaucg aaacuaacgg agaaacgggc gaaaucgugu gggacaaggg cagggacuuc 3240
gcaacuguuc gcaaagugcu cucuaugccg caagucaaua uugugaagaa aaccgaagug 3300
caaaccggcg gauuuucaaa ggaaucgauc cucccaaaga gaaauagcga caagcucauu 3360
gcacgcaaga aagacuggga cccgaagaag uacggaggau ucgauucgcc gacugucgca 3420
uacuccgucc ucgugguggc caagguggag aagggaaaga gcaaaaagcu caaauccguc 3480
aaagagcugc uggggauuac caucauggaa cgauccucgu ucgagaagaa cccgauugau 3540
uuccucgagg cgaaggguua caaggaggug aagaaggauc ugaucaucaa acuccccaag 3600
uacucacugu ucgaacugga aaauggucgg aagcgcaugc uggcuucggc cggagaacuc 3660
caaaaaggaa augagcuggc cuugccuagc aaguacguca acuuccucua ucuugcuucg 3720
cacuacgaaa aacucaaagg gucaccggaa gauaacgaac agaagcagcu uuucguggag 3780
cagcacaagc auuaucugga ugaaaucauc gaacaaaucu ccgaguuuuc aaagcgcgug 3840
auccucgccg acgccaaccu cgacaaaguc cugucggccu acaauaagca uagagauaag 3900
ccgaucagag aacaggccga gaacauuauc cacuuguuca cccugacuaa ccugggagcc 3960
ccagccgccu ucaaguacuu cgauacuacu aucgaucgca aaagauacac guccaccaag 4020
gaaguucugg acgcgacccu gauccaccaa agcaucacug gacucuacga aacuaggauc 4080
gaucugucgc agcugggugg cgauggcggu ggaucuccga aaaagaagag aaagguguaa 4140
uga 4143
<210> 6
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 6
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 7
<211> 4140
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 7
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140
<210> 8
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 8
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 9
<211> 4140
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 9
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140
<210> 10
<211> 4134
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 10
gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134
<210> 11
<211> 4134
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 11
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134
<210> 12
<211> 4134
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 12
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134
<210> 13
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 13
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 14
<211> 4107
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 14
auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacuag 4107
<210> 15
<211> 4101
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 15
gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga c 4101
<210> 16
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 16
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 17
<211> 4107
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 17
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacuag 4107
<210> 18
<211> 4101
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 18
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga c 4101
<210> 19
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 19
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 20
<211> 4107
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 20
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacuag 4107
<210> 21
<211> 4113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 21
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga cggaggagga agc 4113
<210> 22
<211> 1392
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 22
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro
1370 1375 1380
Lys Lys Lys Arg Lys Val Asp Ser Gly
1385 1390
<210> 23
<211> 4179
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 23
auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140
ggaagcccga agaagaagag aaaggucgac agcggauag 4179
<210> 24
<211> 4173
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 24
gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140
agcccgaaga agaagagaaa ggucgacagc gga 4173
<210> 25
<211> 1392
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 25
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro
1370 1375 1380
Lys Lys Lys Arg Lys Val Asp Ser Gly
1385 1390
<210> 26
<211> 4179
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 26
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140
ggaagcccga agaagaagag aaaggucgac agcggauag 4179
<210> 27
<211> 4173
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 27
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140
agcccgaaga agaagagaaa ggucgacagc gga 4173
<210> 28
<211> 1392
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 28
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro
1370 1375 1380
Lys Lys Lys Arg Lys Val Asp Ser Gly
1385 1390
<210> 29
<211> 4179
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 29
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60
aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120
cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180
gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240
uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300
cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360
aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420
aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480
augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540
gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600
aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660
agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720
cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780
gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840
cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900
cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960
augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020
cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080
ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140
gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200
aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260
gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320
gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380
agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440
gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500
aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560
uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620
agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680
gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740
agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800
aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860
cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920
caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980
agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040
gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100
agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160
cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220
gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280
aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400
gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460
gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520
aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640
aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700
acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760
cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820
acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880
aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940
uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000
uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060
augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120
aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180
ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240
gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300
cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360
gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420
uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480
aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540
uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600
uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660
cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720
cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780
cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840
auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900
ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960
ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020
gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080
gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140
ggaagcccga agaagaagag aaaggucgac agcggauag 4179
<210> 30
<211> 4173
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 30
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60
acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120
agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180
acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240
cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300
gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360
aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420
cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480
aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540
gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600
aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660
cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720
aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780
gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840
aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900
cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960
aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020
cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080
uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140
aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200
cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260
auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320
aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380
uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440
gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500
cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560
aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620
ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680
aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740
ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800
aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860
acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920
cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980
cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040
uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100
cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160
gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220
aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280
gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340
aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400
gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460
auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520
gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580
aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640
uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700
aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760
gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820
aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880
cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940
caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000
ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060
aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120
aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180
cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240
acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300
acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360
agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420
agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480
gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540
cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600
agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660
aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720
uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780
cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840
cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900
aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960
gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020
guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080
cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140
agcccgaaga agaagagaaa ggucgacagc gga 4173
<210> 31
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 31
taatacgact cactata 17
<210> 32
<211> 50
<212> DNA
<213> Homo sapiens
<400> 32
acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc 50
<210> 33
<211> 132
<212> DNA
<213> Homo sapiens
<400> 33
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120
tattttcatt gc 132
<210> 34
<211> 66
<212> DNA
<213> Homo sapiens
<400> 34
cataaaccct ggcgcgctcg cggcccggca ctcttctggt ccccacagac tcagagagaa 60
cccacc 66
<210> 35
<211> 110
<212> DNA
<213> Homo sapiens
<400> 35
gctggagcct cggtggccat gcttcttgcc ccttgggcct ccccccagcc cctcctcccc 60
ttcctgcacc cgtacccccg tggtctttga ataaagtctg agtgggcggc 110
<210> 36
<211> 29
<212> DNA
<213> Xenopus laevis
<400> 36
aagctcagaa taaacgctca actttggcc 29
<210> 37
<211> 130
<212> DNA
<213> Xenopus laevis
<400> 37
accagcctca agaacacccg aatggagtct ctaagctaca taataccaac ttacacttta 60
caaaatgttg tcccccaaaa tgtagccatt cgtatctgct cctaataaaa agaaagtttc 120
ttcacattct 130
<210> 38
<211> 27
<212> DNA
<213> Bos sp.
<400> 38
cagggtcctg tggacagctc accagct 27
<210> 39
<211> 102
<212> DNA
<213> Bos sp.
<400> 39
ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 60
tcccactgtc ctttcctaat aaaatgagga aattgcatcg ca 102
<210> 40
<211> 93
<212> DNA
<213> Mus musculus
<400> 40
gctgccttct gcggggcttg ccttctggcc atgcccttct tctctccctt gcacctgtac 60
ctcttggtct ttgaataaag cctgagtagg aag 93
<210> 41
<211> 61
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
HSD17B4 5' UTR sequence"
<400> 41
tcccgcagtc ggcgtccagc ggctctgctt gttcgtgtgt gtgtcgttgc aggccttatt 60
c 61
<210> 42
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified
<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage
<400> 42
uuacagccac gucuacagca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 43
<211> 4411
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 43
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120
cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180
gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240
cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300
aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360
cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420
acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480
ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540
cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600
cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660
gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720
actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780
cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840
cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900
ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960
cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020
accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080
gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140
caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200
catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260
agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320
cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380
caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440
ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500
gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560
gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620
cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680
aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740
aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800
cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860
cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920
cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980
actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040
atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100
cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160
gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220
acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280
gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340
gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400
gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460
cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520
cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580
ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640
ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700
cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760
aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820
attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880
ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940
catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000
cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060
agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120
ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180
gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240
agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300
caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360
caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420
cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480
cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540
gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600
aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660
catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720
aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780
cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840
gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900
attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960
caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020
gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080
atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140
gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200
gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260
gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320
ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380
tcaattaata aaaaatggaa agaacctcga g 4411
<210> 44
<211> 4405
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 44
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg 120
atgggcagtc atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa 180
cacagacaga cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga 240
aacagcagaa gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa 300
cagaatctgc tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt 360
cttccacaga ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc 420
gatcttcgga aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca 480
cctgagaaag aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc 540
actggcacac atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga 600
caacagcgac gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga 660
agaaaacccg atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag 720
caagagcaga agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact 780
gttcggaaac ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga 840
cctggcagaa gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa 900
cctgctggca cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag 960
cgacgcaatc ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct 1020
gagcgcaagc atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc 1080
actggtcaga cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa 1140
cggatacgca ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa 1200
gccgatcctg gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga 1260
cctgctgaga aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg 1320
agaactgcac gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag 1380
agaaaagatc gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag 1440
aggaaacagc agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa 1500
cttcgaagaa gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa 1560
cttcgacaag aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata 1620
cttcacagtc tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc 1680
ggcattcctg agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag 1740
aaaggtcaca gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag 1800
cgtcgaaatc agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct 1860
gctgaagatc atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga 1920
agacatcgtc ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa 1980
gacatacgca cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac 2040
aggatgggga agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa 2100
gacaatcctg gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat 2160
ccacgacgac agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg 2220
agacagcctg cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat 2280
cctgcagaca gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga 2340
aaacatcgtc atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag 2400
cagagaaaga atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa 2460
ggaacacccg gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca 2520
gaacggaaga gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga 2580
cgtcgaccac atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct 2640
gacaagaagc gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa 2700
gaagatgaag aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt 2760
cgacaacctg acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat 2820
caagagacag ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag 2880
cagaatgaac acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac 2940
actgaagagc aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga 3000
aatcaacaac taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact 3060
gatcaagaag tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga 3120
cgtcagaaag atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt 3180
cttctacagc aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat 3240
cagaaagaga ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg 3300
aagagacttc gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa 3360
gacagaagtc cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga 3420
caagctgatc gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc 3480
gacagtcgca tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct 3540
gaagagcgtc aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa 3600
cccgatcgac ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa 3660
gctgccgaag tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc 3720
aggagaactg cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta 3780
cctggcaagc cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct 3840
gttcgtcgaa cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag 3900
caagagagtc atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca 3960
cagagacaag ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa 4020
cctgggagca ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac 4080
aagcacaaag gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga 4140
aacaagaatc gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag 4200
aaaggtctag ctagccatca catttaaaag catctcagcc taccatgaga ataagagaaa 4260
gaaaatgaag atcaatagct tattcatctc tttttctttt tcgttggtgt aaagccaaca 4320
ccctgtctaa aaaacataaa tttctttaat cattttgcct cttttctctg tgcttcaatt 4380
aataaaaaat ggaaagaacc tcgag 4405
<210> 45
<211> 4188
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 45
atggataaga agtactcgat cgggctggat atcggaacta attccgtggg ttgggcagtg 60
atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa caccgataga 120
cacagcatca agaagaatct catcggagcc ctgctgtttg actccggcga aaccgcagaa 180
gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa tcgcatctgc 240
tatctgcaag aaatcttttc gaacgaaatg gcaaaggtgg acgacagctt cttccaccgc 300
ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc tatctttgga 360
aacatcgtgg acgaagtggc gtaccacgaa aagtacccga ccatctacca tctgcggaag 420
aagttggttg actcaactga caaggccgac ctcagattga tctacttggc cctcgcccat 480
atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga taactccgac 540
gtggataagc tgttcattca actggtgcag acctacaacc aactgttcga agaaaaccca 600
atcaatgcca gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc gaagtcgcgg 660
cgcctcgaaa acctgatcgc acagctgccg ggagagaaga agaacggact tttcggcaac 720
ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga cctggccgag 780
gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa tttgctggca 840
caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc ggacgcaatc 900
ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct tagcgcctcg 960
atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc gctcgtgaga 1020
cagcaactgc ctgaaaagta caaggagatt ttcttcgacc agtccaagaa tgggtacgca 1080
gggtacatcg atggaggcgc cagccaggaa gagttctata agttcatcaa gccaatcctg 1140
gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga tctgctccgc 1200
aaacagagaa cctttgacaa cggaagcatt ccacaccaga tccatctggg tgagctgcac 1260
gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg ggaaaagatc 1320
gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg cggcaattcg 1380
cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa tttcgaggaa 1440
gttgtggata agggagcttc ggcacaatcc ttcatcgaac gaatgaccaa cttcgacaag 1500
aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata cttcactgtc 1560
tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc ggcctttctg 1620
agcggagaac agaagaaagc gattgtcgat ctgctgttca agaccaaccg caaggtgacc 1680
gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc agtggaaatc 1740
agcggagtgg aggacagatt caacgcttcg ctgggaacct atcatgatct cctgaagatc 1800
atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga agatatcgtc 1860
ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa gacctacgct 1920
catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac tggttggggc 1980
cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa aactatcctg 2040
gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcagttgat ccacgacgac 2100
agcctgacct ttaaggagga catccagaaa gcacaagtga gcggacaggg agactcactc 2160
catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat cctgcaaact 2220
gtgaaggtgg tggacgagct ggtgaaggtc atgggacggc acaaaccgga gaatatcgtg 2280
attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaagaactc ccgcgaaagg 2340
atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa agagcacccg 2400
gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca aaatggacgg 2460
gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga cgtggaccac 2520
atcgttccac agtcctttct gaaggatgac tccatcgata acaaggtgtt gactcgcagc 2580
gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa gaagatgaag 2640
aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt tgacaatctc 2700
actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat caaacggcag 2760
ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcctggactc ccgcatgaac 2820
actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac cctgaaaagc 2880
aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga aatcaacaac 2940
taccatcacg cgcatgacgc atacctcaac gctgtggtcg gcaccgccct gatcaagaag 3000
taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga cgtgaggaag 3060
atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt cttttactca 3120
aacatcatga acttcttcaa gactgaaatt acgctggcca atggagaaat caggaagagg 3180
ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg cagggacttc 3240
gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa aaccgaagtg 3300
caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga caagctcatt 3360
gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc gactgtcgca 3420
tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaagaagct caaatccgtc 3480
aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa cccgattgat 3540
ttcctggagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa actgcccaag 3600
tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc cggagaactc 3660
cagaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta tcttgcttcg 3720
cactacgaga aactcaaagg gtcaccggaa gataacgaac agaagcagct tttcgtggag 3780
cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc aaagcgcgtg 3840
atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca tagagataag 3900
ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa cctgggagct 3960
ccagccgcct tcaagtactt cgatactact atcgaccgca aaagatacac gtccaccaag 4020
gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga aactaggatc 4080
gatctgtcgc agctgggtgg cgatggtggc ggtggatcct acccatacga cgtgcctgac 4140
tacgcctccg gaggtggtgg ccccaagaag aaacggaagg tgtgatag 4188
<210> 46
<211> 4459
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 46
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatct gccaccatgg ataagaagta ctcgatcggg ctggatatcg gaactaattc 120
cgtgggttgg gcagtgatca cggatgaata caaagtgccg tccaagaagt tcaaggtcct 180
ggggaacacc gatagacaca gcatcaagaa gaatctcatc ggagccctgc tgtttgactc 240
cggcgaaacc gcagaagcga cccggctcaa acgtaccgcg aggcgacgct acacccggcg 300
gaagaatcgc atctgctatc tgcaagaaat cttttcgaac gaaatggcaa aggtggacga 360
cagcttcttc caccgcctgg aagaatcttt cctggtggag gaggacaaga agcatgaacg 420
gcatcctatc tttggaaaca tcgtggacga agtggcgtac cacgaaaagt acccgaccat 480
ctaccatctg cggaagaagt tggttgactc aactgacaag gccgacctca gattgatcta 540
cttggccctc gcccatatga tcaaattccg cggacacttc ctgatcgaag gcgatctgaa 600
ccctgataac tccgacgtgg ataagctgtt cattcaactg gtgcagacct acaaccaact 660
gttcgaagaa aacccaatca atgccagcgg cgtcgatgcc aaggccatcc tgtccgcccg 720
gctgtcgaag tcgcggcgcc tcgaaaacct gatcgcacag ctgccgggag agaagaagaa 780
cggacttttc ggcaacttga tcgctctctc actgggactc actcccaatt tcaagtccaa 840
ttttgacctg gccgaggacg cgaagctgca actctcaaag gacacctacg acgacgactt 900
ggacaatttg ctggcacaaa ttggcgatca gtacgcggat ctgttccttg ccgctaagaa 960
cctttcggac gcaatcttgc tgtccgatat cctgcgcgtg aacaccgaaa taaccaaagc 1020
gccgcttagc gcctcgatga ttaagcggta cgacgagcat caccaggatc tcacgctgct 1080
caaagcgctc gtgagacagc aactgcctga aaagtacaag gagattttct tcgaccagtc 1140
caagaatggg tacgcagggt acatcgatgg aggcgccagc caggaagagt tctataagtt 1200
catcaagcca atcctggaaa agatggacgg aaccgaagaa ctgctggtca agctgaacag 1260
ggaggatctg ctccgcaaac agagaacctt tgacaacgga agcattccac accagatcca 1320
tctgggtgag ctgcacgcca tcttgcggcg ccaggaggac ttttacccat tcctcaagga 1380
caaccgggaa aagatcgaga aaattctgac gttccgcatc ccgtattacg tgggcccact 1440
ggcgcgcggc aattcgcgct tcgcgtggat gactagaaaa tcagaggaaa ccatcactcc 1500
ttggaatttc gaggaagttg tggataaggg agcttcggca caatccttca tcgaacgaat 1560
gaccaacttc gacaagaatc tcccaaacga gaaggtgctt cctaagcaca gcctccttta 1620
cgaatacttc actgtctaca acgaactgac taaagtgaaa tacgttactg aaggaatgag 1680
gaagccggcc tttctgagcg gagaacagaa gaaagcgatt gtcgatctgc tgttcaagac 1740
caaccgcaag gtgaccgtca agcagcttaa agaggactac ttcaagaaga tcgagtgttt 1800
cgactcagtg gaaatcagcg gagtggagga cagattcaac gcttcgctgg gaacctatca 1860
tgatctcctg aagatcatca aggacaagga cttccttgac aacgaggaga acgaggacat 1920
cctggaagat atcgtcctga ccttgaccct tttcgaggat cgcgagatga tcgaggagag 1980
gcttaagacc tacgctcatc tcttcgacga taaggtcatg aaacaactca agcgccgccg 2040
gtacactggt tggggccgcc tctcccgcaa gctgatcaac ggtattcgcg ataaacagag 2100
cggtaaaact atcctggatt tcctcaaatc ggatggcttc gctaatcgta acttcatgca 2160
gttgatccac gacgacagcc tgacctttaa ggaggacatc cagaaagcac aagtgagcgg 2220
acagggagac tcactccatg aacacatcgc gaatctggcc ggttcgccgg cgattaagaa 2280
gggaatcctg caaactgtga aggtggtgga cgagctggtg aaggtcatgg gacggcacaa 2340
accggagaat atcgtgattg aaatggcccg agaaaaccag actacccaga agggccagaa 2400
gaactcccgc gaaaggatga agcggatcga agaaggaatc aaggagctgg gcagccagat 2460
cctgaaagag cacccggtgg aaaacacgca gctgcagaac gagaagctct acctgtacta 2520
tttgcaaaat ggacgggaca tgtacgtgga ccaagagctg gacatcaatc ggttgtctga 2580
ttacgacgtg gaccacatcg ttccacagtc ctttctgaag gatgactcca tcgataacaa 2640
ggtgttgact cgcagcgaca agaacagagg gaagtcagat aatgtgccat cggaggaggt 2700
cgtgaagaag atgaagaatt actggcggca gctcctgaat gcgaagctga ttacccagag 2760
aaagtttgac aatctcacta aagccgagcg cggcggactc tcagagctgg ataaggctgg 2820
attcatcaaa cggcagctgg tcgagactcg gcagattacc aagcacgtgg cgcagatcct 2880
ggactcccgc atgaacacta aatacgacga gaacgataag ctcatccggg aagtgaaggt 2940
gattaccctg aaaagcaaac ttgtgtcgga ctttcggaag gactttcagt tttacaaagt 3000
gagagaaatc aacaactacc atcacgcgca tgacgcatac ctcaacgctg tggtcggcac 3060
cgccctgatc aagaagtacc ctaaacttga atcggagttt gtgtacggag actacaaggt 3120
ctacgacgtg aggaagatga tagccaagtc cgaacaggaa atcgggaaag caactgcgaa 3180
atacttcttt tactcaaaca tcatgaactt cttcaagact gaaattacgc tggccaatgg 3240
agaaatcagg aagaggccac tgatcgaaac taacggagaa acgggcgaaa tcgtgtggga 3300
caagggcagg gacttcgcaa ctgttcgcaa agtgctctct atgccgcaag tcaatattgt 3360
gaagaaaacc gaagtgcaaa ccggcggatt ttcaaaggaa tcgatcctcc caaagagaaa 3420
tagcgacaag ctcattgcac gcaagaaaga ctgggacccg aagaagtacg gaggattcga 3480
ttcgccgact gtcgcatact ccgtcctcgt ggtggccaag gtggagaagg gaaagagcaa 3540
gaagctcaaa tccgtcaaag agctgctggg gattaccatc atggaacgat cctcgttcga 3600
gaagaacccg attgatttcc tggaggcgaa gggttacaag gaggtgaaga aggatctgat 3660
catcaaactg cccaagtact cactgttcga actggaaaat ggtcggaagc gcatgctggc 3720
ttcggccgga gaactccaga aaggaaatga gctggccttg cctagcaagt acgtcaactt 3780
cctctatctt gcttcgcact acgagaaact caaagggtca ccggaagata acgaacagaa 3840
gcagcttttc gtggagcagc acaagcatta tctggatgaa atcatcgaac aaatctccga 3900
gttttcaaag cgcgtgatcc tcgccgacgc caacctcgac aaagtcctgt cggcctacaa 3960
taagcataga gataagccga tcagagaaca ggccgagaac attatccact tgttcaccct 4020
gactaacctg ggagctccag ccgccttcaa gtacttcgat actactatcg accgcaaaag 4080
atacacgtcc accaaggaag ttctggacgc gaccctgatc caccaaagca tcactggact 4140
ctacgaaact aggatcgatc tgtcgcagct gggtggcgat ggtggcggtg gatcctaccc 4200
atacgacgtg cctgactacg cctccggagg tggtggcccc aagaagaaac ggaaggtgtg 4260
atagctagcc atcacattta aaagcatctc agcctaccat gagaataaga gaaagaaaat 4320
gaagatcaat agcttattca tctctttttc tttttcgttg gtgtaaagcc aacaccctgt 4380
ctaaaaaaca taaatttctt taatcatttt gcctcttttc tctgtgcttc aattaataaa 4440
aaatggaaag aacctcgag 4459
<210> 47
<211> 4453
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 47
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatct atggataaga agtactcgat cgggctggat atcggaacta attccgtggg 120
ttgggcagtg atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa 180
caccgataga cacagcatca agaagaatct catcggagcc ctgctgtttg actccggcga 240
aaccgcagaa gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa 300
tcgcatctgc tatctgcaag aaatcttttc gaacgaaatg gcaaaggtgg acgacagctt 360
cttccaccgc ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc 420
tatctttgga aacatcgtgg acgaagtggc gtaccacgaa aagtacccga ccatctacca 480
tctgcggaag aagttggttg actcaactga caaggccgac ctcagattga tctacttggc 540
cctcgcccat atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga 600
taactccgac gtggataagc tgttcattca actggtgcag acctacaacc aactgttcga 660
agaaaaccca atcaatgcca gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc 720
gaagtcgcgg cgcctcgaaa acctgatcgc acagctgccg ggagagaaga agaacggact 780
tttcggcaac ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga 840
cctggccgag gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa 900
tttgctggca caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc 960
ggacgcaatc ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct 1020
tagcgcctcg atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc 1080
gctcgtgaga cagcaactgc ctgaaaagta caaggagatt ttcttcgacc agtccaagaa 1140
tgggtacgca gggtacatcg atggaggcgc cagccaggaa gagttctata agttcatcaa 1200
gccaatcctg gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga 1260
tctgctccgc aaacagagaa cctttgacaa cggaagcatt ccacaccaga tccatctggg 1320
tgagctgcac gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg 1380
ggaaaagatc gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg 1440
cggcaattcg cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa 1500
tttcgaggaa gttgtggata agggagcttc ggcacaatcc ttcatcgaac gaatgaccaa 1560
cttcgacaag aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata 1620
cttcactgtc tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc 1680
ggcctttctg agcggagaac agaagaaagc gattgtcgat ctgctgttca agaccaaccg 1740
caaggtgacc gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc 1800
agtggaaatc agcggagtgg aggacagatt caacgcttcg ctgggaacct atcatgatct 1860
cctgaagatc atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga 1920
agatatcgtc ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa 1980
gacctacgct catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac 2040
tggttggggc cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa 2100
aactatcctg gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcagttgat 2160
ccacgacgac agcctgacct ttaaggagga catccagaaa gcacaagtga gcggacaggg 2220
agactcactc catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat 2280
cctgcaaact gtgaaggtgg tggacgagct ggtgaaggtc atgggacggc acaaaccgga 2340
gaatatcgtg attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaagaactc 2400
ccgcgaaagg atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa 2460
agagcacccg gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca 2520
aaatggacgg gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga 2580
cgtggaccac atcgttccac agtcctttct gaaggatgac tccatcgata acaaggtgtt 2640
gactcgcagc gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa 2700
gaagatgaag aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt 2760
tgacaatctc actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat 2820
caaacggcag ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcctggactc 2880
ccgcatgaac actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac 2940
cctgaaaagc aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga 3000
aatcaacaac taccatcacg cgcatgacgc atacctcaac gctgtggtcg gcaccgccct 3060
gatcaagaag taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga 3120
cgtgaggaag atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt 3180
cttttactca aacatcatga acttcttcaa gactgaaatt acgctggcca atggagaaat 3240
caggaagagg ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg 3300
cagggacttc gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa 3360
aaccgaagtg caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga 3420
caagctcatt gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc 3480
gactgtcgca tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaagaagct 3540
caaatccgtc aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa 3600
cccgattgat ttcctggagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa 3660
actgcccaag tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc 3720
cggagaactc cagaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta 3780
tcttgcttcg cactacgaga aactcaaagg gtcaccggaa gataacgaac agaagcagct 3840
tttcgtggag cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc 3900
aaagcgcgtg atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca 3960
tagagataag ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa 4020
cctgggagct ccagccgcct tcaagtactt cgatactact atcgaccgca aaagatacac 4080
gtccaccaag gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga 4140
aactaggatc gatctgtcgc agctgggtgg cgatggtggc ggtggatcct acccatacga 4200
cgtgcctgac tacgcctccg gaggtggtgg ccccaagaag aaacggaagg tgtgatagct 4260
agccatcaca tttaaaagca tctcagccta ccatgagaat aagagaaaga aaatgaagat 4320
caatagctta ttcatctctt tttctttttc gttggtgtaa agccaacacc ctgtctaaaa 4380
aacataaatt tctttaatca ttttgcctct tttctctgtg cttcaattaa taaaaaatgg 4440
aaagaacctc gag 4453
<210> 48
<211> 4403
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 48
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc atgcctaaga aaaagcggaa ggtcgacggg gataagaagt actcaatcgg 120
gctggatatc ggaactaatt ccgtgggttg ggcagtgatc acggatgaat acaaagtgcc 180
gtccaagaag ttcaaggtcc tggggaacac cgatagacac agcatcaaga aaaatctcat 240
cggagccctg ctgtttgact ccggcgaaac cgcagaagcg acccggctca aacgtaccgc 300
gaggcgacgc tacacccggc ggaagaatcg catctgctat ctgcaagaga tcttttcgaa 360
cgaaatggca aaggtcgacg acagcttctt ccaccgcctg gaagaatctt tcctggtgga 420
ggaggacaag aagcatgaac ggcatcctat ctttggaaac atcgtcgacg aagtggcgta 480
ccacgaaaag tacccgacca tctaccatct gcggaagaag ttggttgact caactgacaa 540
ggccgacctc agattgatct acttggccct cgcccatatg atcaaattcc gcggacactt 600
cctgatcgaa ggcgatctga accctgataa ctccgacgtg gataagcttt tcattcaact 660
ggtgcagacc tacaaccaac tgttcgaaga aaacccaatc aatgctagcg gcgtcgatgc 720
caaggccatc ctgtccgccc ggctgtcgaa gtcgcggcgc ctcgaaaacc tgatcgcaca 780
gctgccggga gagaaaaaga acggactttt cggcaacttg atcgctctct cactgggact 840
cactcccaat ttcaagtcca attttgacct ggccgaggac gcgaagctgc aactctcaaa 900
ggacacctac gacgacgact tggacaattt gctggcacaa attggcgatc agtacgcgga 960
tctgttcctt gccgctaaga acctttcgga cgcaatcttg ctgtccgata tcctgcgcgt 1020
gaacaccgaa ataaccaaag cgccgcttag cgcctcgatg attaagcggt acgacgagca 1080
tcaccaggat ctcacgctgc tcaaagcgct cgtgagacag caactgcctg aaaagtacaa 1140
ggagatcttc ttcgaccagt ccaagaatgg gtacgcaggg tacatcgatg gaggcgctag 1200
ccaggaagag ttctataagt tcatcaagcc aatcctggaa aagatggacg gaaccgaaga 1260
actgctggtc aagctgaaca gggaggatct gctccggaaa cagagaacct ttgacaacgg 1320
atccattccc caccagatcc atctgggtga gctgcacgcc atcttgcggc gccaggagga 1380
cttttaccca ttcctcaagg acaaccggga aaagatcgag aaaattctga cgttccgcat 1440
cccgtattac gtgggcccac tggcgcgcgg caattcgcgc ttcgcgtgga tgactagaaa 1500
atcagaggaa accatcactc cttggaattt cgaggaagtt gtggataagg gagcttcggc 1560
acaaagcttc atcgaacgaa tgaccaactt cgacaagaat ctcccaaacg agaaggtgct 1620
tcctaagcac agcctccttt acgaatactt cactgtctac aacgaactga ctaaagtgaa 1680
atacgttact gaaggaatga ggaagccggc ctttctgtcc ggagaacaga agaaagcaat 1740
tgtcgatctg ctgttcaaga ccaaccgcaa ggtgaccgtc aagcagctta aagaggacta 1800
cttcaagaag atcgagtgtt tcgactcagt ggaaatcagc ggggtggagg acagattcaa 1860
cgcttcgctg ggaacctatc atgatctcct gaagatcatc aaggacaagg acttccttga 1920
caacgaggag aacgaggaca tcctggaaga tatcgtcctg accttgaccc ttttcgagga 1980
tcgcgagatg atcgaggaga ggcttaagac ctacgctcat ctcttcgacg ataaggtcat 2040
gaaacaactc aagcgccgcc ggtacactgg ttggggccgc ctctcccgca agctgatcaa 2100
cggtattcgc gataaacaga gcggtaaaac tatcctggat ttcctcaaat cggatggctt 2160
cgctaatcgt aacttcatgc aattgatcca cgacgacagc ctgaccttta aggaggacat 2220
ccaaaaagca caagtgtccg gacagggaga ctcactccat gaacacatcg cgaatctggc 2280
cggttcgccg gcgattaaga agggaattct gcaaactgtg aaggtggtcg acgagctggt 2340
gaaggtcatg ggacggcaca aaccggagaa tatcgtgatt gaaatggccc gagaaaacca 2400
gactacccag aagggccaga aaaactcccg cgaaaggatg aagcggatcg aagaaggaat 2460
caaggagctg ggcagccaga tcctgaaaga gcacccggtg gaaaacacgc agctgcagaa 2520
cgagaagctc tacctgtact atttgcaaaa tggacgggac atgtacgtgg accaagagct 2580
ggacatcaat cggttgtctg attacgacgt ggaccacatc gttccacagt cctttctgaa 2640
ggatgactcg atcgataaca aggtgttgac tcgcagcgac aagaacagag ggaagtcaga 2700
taatgtgcca tcggaggagg tcgtgaagaa gatgaagaat tactggcggc agctcctgaa 2760
tgcgaagctg attacccaga gaaagtttga caatctcact aaagccgagc gcggcggact 2820
ctcagagctg gataaggctg gattcatcaa acggcagctg gtcgagactc ggcagattac 2880
caagcacgtg gcgcagatct tggactcccg catgaacact aaatacgacg agaacgataa 2940
gctcatccgg gaagtgaagg tgattaccct gaaaagcaaa cttgtgtcgg actttcggaa 3000
ggactttcag ttttacaaag tgagagaaat caacaactac catcacgcgc atgacgcata 3060
cctcaacgct gtggtcggta ccgccctgat caaaaagtac cctaaacttg aatcggagtt 3120
tgtgtacgga gactacaagg tctacgacgt gaggaagatg atagccaagt ccgaacagga 3180
aatcgggaaa gcaactgcga aatacttctt ttactcaaac atcatgaact ttttcaagac 3240
tgaaattacg ctggccaatg gagaaatcag gaagaggcca ctgatcgaaa ctaacggaga 3300
aacgggcgaa atcgtgtggg acaagggcag ggacttcgca actgttcgca aagtgctctc 3360
tatgccgcaa gtcaatattg tgaagaaaac cgaagtgcaa accggcggat tttcaaagga 3420
atcgatcctc ccaaagagaa atagcgacaa gctcattgca cgcaagaaag actgggaccc 3480
gaagaagtac ggaggattcg attcgccgac tgtcgcatac tccgtcctcg tggtggccaa 3540
ggtggagaag ggaaagagca aaaagctcaa atccgtcaaa gagctgctgg ggattaccat 3600
catggaacga tcctcgttcg agaagaaccc gattgatttc ctcgaggcga agggttacaa 3660
ggaggtgaag aaggatctga tcatcaaact ccccaagtac tcactgttcg aactggaaaa 3720
tggtcggaag cgcatgctgg cttcggccgg agaactccaa aaaggaaatg agctggcctt 3780
gcctagcaag tacgtcaact tcctctatct tgcttcgcac tacgaaaaac tcaaagggtc 3840
accggaagat aacgaacaga agcagctttt cgtggagcag cacaagcatt atctggatga 3900
aatcatcgaa caaatctccg agttttcaaa gcgcgtgatc ctcgccgacg ccaacctcga 3960
caaagtcctg tcggcctaca ataagcatag agataagccg atcagagaac aggccgagaa 4020
cattatccac ttgttcaccc tgactaacct gggagcccca gccgccttca agtacttcga 4080
tactactatc gatcgcaaaa gatacacgtc caccaaggaa gttctggacg cgaccctgat 4140
ccaccaaagc atcactggac tctacgaaac taggatcgat ctgtcgcagc tgggtggcga 4200
ttgatagtct agccatcaca tttaaaagca tctcagccta ccatgagaat aagagaaaga 4260
aaatgaagat caatagctta ttcatctctt tttctttttc gttggtgtaa agccaacacc 4320
ctgtctaaaa aacataaatt tctttaatca ttttgcctct tttctctgtg cttcaattaa 4380
taaaaaatgg aaagaacctc gag 4403
<210> 49
<211> 4409
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 49
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc gccaccatgc ctaagaaaaa gcggaaggtc gacggggata agaagtactc 120
aatcgggctg gatatcggaa ctaattccgt gggttgggca gtgatcacgg atgaatacaa 180
agtgccgtcc aagaagttca aggtcctggg gaacaccgat agacacagca tcaagaaaaa 240
tctcatcgga gccctgctgt ttgactccgg cgaaaccgca gaagcgaccc ggctcaaacg 300
taccgcgagg cgacgctaca cccggcggaa gaatcgcatc tgctatctgc aagagatctt 360
ttcgaacgaa atggcaaagg tcgacgacag cttcttccac cgcctggaag aatctttcct 420
ggtggaggag gacaagaagc atgaacggca tcctatcttt ggaaacatcg tcgacgaagt 480
ggcgtaccac gaaaagtacc cgaccatcta ccatctgcgg aagaagttgg ttgactcaac 540
tgacaaggcc gacctcagat tgatctactt ggccctcgcc catatgatca aattccgcgg 600
acacttcctg atcgaaggcg atctgaaccc tgataactcc gacgtggata agcttttcat 660
tcaactggtg cagacctaca accaactgtt cgaagaaaac ccaatcaatg ctagcggcgt 720
cgatgccaag gccatcctgt ccgcccggct gtcgaagtcg cggcgcctcg aaaacctgat 780
cgcacagctg ccgggagaga aaaagaacgg acttttcggc aacttgatcg ctctctcact 840
gggactcact cccaatttca agtccaattt tgacctggcc gaggacgcga agctgcaact 900
ctcaaaggac acctacgacg acgacttgga caatttgctg gcacaaattg gcgatcagta 960
cgcggatctg ttccttgccg ctaagaacct ttcggacgca atcttgctgt ccgatatcct 1020
gcgcgtgaac accgaaataa ccaaagcgcc gcttagcgcc tcgatgatta agcggtacga 1080
cgagcatcac caggatctca cgctgctcaa agcgctcgtg agacagcaac tgcctgaaaa 1140
gtacaaggag atcttcttcg accagtccaa gaatgggtac gcagggtaca tcgatggagg 1200
cgctagccag gaagagttct ataagttcat caagccaatc ctggaaaaga tggacggaac 1260
cgaagaactg ctggtcaagc tgaacaggga ggatctgctc cggaaacaga gaacctttga 1320
caacggatcc attccccacc agatccatct gggtgagctg cacgccatct tgcggcgcca 1380
ggaggacttt tacccattcc tcaaggacaa ccgggaaaag atcgagaaaa ttctgacgtt 1440
ccgcatcccg tattacgtgg gcccactggc gcgcggcaat tcgcgcttcg cgtggatgac 1500
tagaaaatca gaggaaacca tcactccttg gaatttcgag gaagttgtgg ataagggagc 1560
ttcggcacaa agcttcatcg aacgaatgac caacttcgac aagaatctcc caaacgagaa 1620
ggtgcttcct aagcacagcc tcctttacga atacttcact gtctacaacg aactgactaa 1680
agtgaaatac gttactgaag gaatgaggaa gccggccttt ctgtccggag aacagaagaa 1740
agcaattgtc gatctgctgt tcaagaccaa ccgcaaggtg accgtcaagc agcttaaaga 1800
ggactacttc aagaagatcg agtgtttcga ctcagtggaa atcagcgggg tggaggacag 1860
attcaacgct tcgctgggaa cctatcatga tctcctgaag atcatcaagg acaaggactt 1920
ccttgacaac gaggagaacg aggacatcct ggaagatatc gtcctgacct tgaccctttt 1980
cgaggatcgc gagatgatcg aggagaggct taagacctac gctcatctct tcgacgataa 2040
ggtcatgaaa caactcaagc gccgccggta cactggttgg ggccgcctct cccgcaagct 2100
gatcaacggt attcgcgata aacagagcgg taaaactatc ctggatttcc tcaaatcgga 2160
tggcttcgct aatcgtaact tcatgcaatt gatccacgac gacagcctga cctttaagga 2220
ggacatccaa aaagcacaag tgtccggaca gggagactca ctccatgaac acatcgcgaa 2280
tctggccggt tcgccggcga ttaagaaggg aattctgcaa actgtgaagg tggtcgacga 2340
gctggtgaag gtcatgggac ggcacaaacc ggagaatatc gtgattgaaa tggcccgaga 2400
aaaccagact acccagaagg gccagaaaaa ctcccgcgaa aggatgaagc ggatcgaaga 2460
aggaatcaag gagctgggca gccagatcct gaaagagcac ccggtggaaa acacgcagct 2520
gcagaacgag aagctctacc tgtactattt gcaaaatgga cgggacatgt acgtggacca 2580
agagctggac atcaatcggt tgtctgatta cgacgtggac cacatcgttc cacagtcctt 2640
tctgaaggat gactcgatcg ataacaaggt gttgactcgc agcgacaaga acagagggaa 2700
gtcagataat gtgccatcgg aggaggtcgt gaagaagatg aagaattact ggcggcagct 2760
cctgaatgcg aagctgatta cccagagaaa gtttgacaat ctcactaaag ccgagcgcgg 2820
cggactctca gagctggata aggctggatt catcaaacgg cagctggtcg agactcggca 2880
gattaccaag cacgtggcgc agatcttgga ctcccgcatg aacactaaat acgacgagaa 2940
cgataagctc atccgggaag tgaaggtgat taccctgaaa agcaaacttg tgtcggactt 3000
tcggaaggac tttcagtttt acaaagtgag agaaatcaac aactaccatc acgcgcatga 3060
cgcatacctc aacgctgtgg tcggtaccgc cctgatcaaa aagtacccta aacttgaatc 3120
ggagtttgtg tacggagact acaaggtcta cgacgtgagg aagatgatag ccaagtccga 3180
acaggaaatc gggaaagcaa ctgcgaaata cttcttttac tcaaacatca tgaacttttt 3240
caagactgaa attacgctgg ccaatggaga aatcaggaag aggccactga tcgaaactaa 3300
cggagaaacg ggcgaaatcg tgtgggacaa gggcagggac ttcgcaactg ttcgcaaagt 3360
gctctctatg ccgcaagtca atattgtgaa gaaaaccgaa gtgcaaaccg gcggattttc 3420
aaaggaatcg atcctcccaa agagaaatag cgacaagctc attgcacgca agaaagactg 3480
ggacccgaag aagtacggag gattcgattc gccgactgtc gcatactccg tcctcgtggt 3540
ggccaaggtg gagaagggaa agagcaaaaa gctcaaatcc gtcaaagagc tgctggggat 3600
taccatcatg gaacgatcct cgttcgagaa gaacccgatt gatttcctcg aggcgaaggg 3660
ttacaaggag gtgaagaagg atctgatcat caaactcccc aagtactcac tgttcgaact 3720
ggaaaatggt cggaagcgca tgctggcttc ggccggagaa ctccaaaaag gaaatgagct 3780
ggccttgcct agcaagtacg tcaacttcct ctatcttgct tcgcactacg aaaaactcaa 3840
agggtcaccg gaagataacg aacagaagca gcttttcgtg gagcagcaca agcattatct 3900
ggatgaaatc atcgaacaaa tctccgagtt ttcaaagcgc gtgatcctcg ccgacgccaa 3960
cctcgacaaa gtcctgtcgg cctacaataa gcatagagat aagccgatca gagaacaggc 4020
cgagaacatt atccacttgt tcaccctgac taacctggga gccccagccg ccttcaagta 4080
cttcgatact actatcgatc gcaaaagata cacgtccacc aaggaagttc tggacgcgac 4140
cctgatccac caaagcatca ctggactcta cgaaactagg atcgatctgt cgcagctggg 4200
tggcgattga tagtctagcc atcacattta aaagcatctc agcctaccat gagaataaga 4260
gaaagaaaat gaagatcaat agcttattca tctctttttc tttttcgttg gtgtaaagcc 4320
aacaccctgt ctaaaaaaca taaatttctt taatcatttt gcctcttttc tctgtgcttc 4380
aattaataaa aaatggaaag aacctcgag 4409
<210> 50
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 50
atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg atgggcagtc 60
atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa cacagacaga 120
cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga aacagcagaa 180
gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa cagaatctgc 240
tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt cttccaccgg 300
ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc gatcttcgga 360
aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca cctgagaaag 420
aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc actggcacac 480
atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga caacagcgac 540
gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga agaaaacccg 600
atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag caagagcaga 660
agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact gttcggaaac 720
ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga cctggcagaa 780
gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa cctgctggca 840
cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag cgacgcaatc 900
ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct gagcgcaagc 960
atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc actggtcaga 1020
cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa cggatacgca 1080
ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa gccgatcctg 1140
gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga cctgctgaga 1200
aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg agaactgcac 1260
gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag agaaaagatc 1320
gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag aggaaacagc 1380
agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa cttcgaagaa 1440
gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa cttcgacaag 1500
aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata cttcacagtc 1560
tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc ggcattcctg 1620
agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag aaaggtcaca 1680
gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag cgtcgaaatc 1740
agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga agacatcgtc 1860
ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa gacatacgca 1920
cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac aggatgggga 1980
agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa gacaatcctg 2040
gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg agacagcctg 2160
cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat cctgcagaca 2220
gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga aaacatcgtc 2280
atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340
atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa ggaacacccg 2400
gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca aaacggaaga 2460
gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga cgtcgaccac 2520
atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct gacaagaagc 2580
gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa gaagatgaag 2640
aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt cgacaacctg 2700
acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat caagagacag 2760
ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag cagaatgaac 2820
acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac actgaagagc 2880
aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga aatcaacaac 2940
taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact gatcaagaag 3000
tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga cgtcagaaag 3060
atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt cttctacagc 3120
aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat cagaaagaga 3180
ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg aagagacttc 3240
gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa gacagaagtc 3300
cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga caagctgatc 3360
gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc gacagtcgca 3420
tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct gaagagcgtc 3480
aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa cccgatcgac 3540
ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa gctgccgaag 3600
tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc aggagaactg 3660
cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta cctggcaagc 3720
cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct gttcgtcgaa 3780
cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag caagagagtc 3840
atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca cagagacaag 3900
ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa cctgggagca 3960
ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac aagcacaaag 4020
gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga aacaagaatc 4080
gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag aaaggtctag 4140
<210> 51
<211> 4411
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 51
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120
cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180
gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240
cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300
aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360
cagcttcttc caccggctgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420
acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480
ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540
cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600
cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660
gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720
actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780
cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840
cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900
ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960
cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020
accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080
gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140
caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200
catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260
agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320
cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380
caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440
ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500
gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560
gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620
cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680
aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740
aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800
cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860
cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920
cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980
actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040
atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100
cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160
gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220
acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280
gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340
gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400
gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460
cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520
cctgcaaaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580
ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640
ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700
cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760
aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820
attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880
ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940
catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000
cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060
agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120
ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180
gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240
agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300
caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360
caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420
cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480
cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540
gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600
aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660
catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720
aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780
cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840
gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900
attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960
caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020
gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080
atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140
gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200
gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260
gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320
ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380
tcaattaata aaaaatggaa agaacctcga g 4411
<210> 52
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 52
atggacaaga agtacagcat cggcctggac atcggcacca acagcgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aagttcaagg tgctgggcaa caccgacaga 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180
gccaccagac tgaagagaac cgccagaaga agatacacca gaagaaagaa cagaatctgc 240
tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300
ctggaggaga gcttcctggt ggaggaggac aagaagcacg agagacaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420
aagctggtgg acagcaccga caaggccgac ctgagactga tctacctggc cctggcccac 480
atgatcaagt tcagaggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg ccagactgag caagagcaga 660
agactggaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720
ctgatcgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900
ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgccagc 960
atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgaga 1020
cagcagctgc ccgagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gcccatcctg 1140
gagaagatgg acggcaccga ggagctgctg gtgaagctga acagagagga cctgctgaga 1200
aagcagagaa ccttcgacaa cggcagcatc ccccaccaga tccacctggg cgagctgcac 1260
gccatcctga gaagacagga ggacttctac cccttcctga aggacaacag agagaagatc 1320
gagaagatcc tgaccttcag aatcccctac tacgtgggcc ccctggccag aggcaacagc 1380
agattcgcct ggatgaccag aaagagcgag gagaccatca ccccctggaa cttcgaggag 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgaga gaatgaccaa cttcgacaag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgagaaagcc cgccttcctg 1620
agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaacag aaaggtgacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740
agcggcgtgg aggacagatt caacgccagc ctgggcacct accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860
ctgaccctga ccctgttcga ggacagagag atgatcgagg agagactgaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagagaa gaagatacac cggctggggc 1980
agactgagca gaaagctgat caacggcatc agagacaagc agagcggcaa gaccatcctg 2040
gacttcctga agagcgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160
cacgagcaca tcgccaacct ggccggcagc cccgccatca agaagggcat cctgcagacc 2220
gtgaaggtgg tggacgagct ggtgaaggtg atgggcagac acaagcccga gaacatcgtg 2280
atcgagatgg ccagagagaa ccagaccacc cagaagggcc agaagaacag cagagagaga 2340
atgaagagaa tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccc 2400
gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggcaga 2460
gacatgtacg tggaccagga gctggacatc aacagactga gcgactacga cgtggaccac 2520
atcgtgcccc agagcttcct gaaggacgac agcatcgaca acaaggtgct gaccagaagc 2580
gacaagaaca gaggcaagag cgacaacgtg cccagcgagg aggtggtgaa gaagatgaag 2640
aactactgga gacagctgct gaacgccaag ctgatcaccc agagaaagtt cgacaacctg 2700
accaaggccg agagaggcgg cctgagcgag ctggacaagg ccggcttcat caagagacag 2760
ctggtggaga ccagacagat caccaagcac gtggcccaga tcctggacag cagaatgaac 2820
accaagtacg acgagaacga caagctgatc agagaggtga aggtgatcac cctgaagagc 2880
aagctggtga gcgacttcag aaaggacttc cagttctaca aggtgagaga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gatcaagaag 3000
taccccaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgagaaag 3060
atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120
aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat cagaaagaga 3180
cccctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg cagagacttc 3240
gccaccgtga gaaaggtgct gagcatgccc caggtgaaca tcgtgaagaa gaccgaggtg 3300
cagaccggcg gcttcagcaa ggagagcatc ctgcccaaga gaaacagcga caagctgatc 3360
gccagaaaga aggactggga ccccaagaag tacggcggct tcgacagccc caccgtggcc 3420
tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480
aaggagctgc tgggcatcac catcatggag agaagcagct tcgagaagaa ccccatcgac 3540
ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcatcaa gctgcccaag 3600
tacagcctgt tcgagctgga gaacggcaga aagagaatgc tggccagcgc cggcgagctg 3660
cagaagggca acgagctggc cctgcccagc aagtacgtga acttcctgta cctggccagc 3720
cactacgaga agctgaaggg cagccccgag gacaacgagc agaagcagct gttcgtggag 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagagagtg 3840
atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca cagagacaag 3900
cccatcagag agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960
cccgccgcct tcaagtactt cgacaccacc atcgacagaa agagatacac cagcaccaag 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gaccagaatc 4080
gacctgagcc agctgggcgg cgacggcggc ggcagcccca agaagaagag aaaggtgtga 4140
<210> 53
<211> 4411
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 53
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc gccaccatgg acaagaagta cagcatcggc ctggacatcg gcaccaacag 120
cgtgggctgg gccgtgatca ccgacgagta caaggtgccc agcaagaagt tcaaggtgct 180
gggcaacacc gacagacaca gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag 240
cggcgagacc gccgaggcca ccagactgaa gagaaccgcc agaagaagat acaccagaag 300
aaagaacaga atctgctacc tgcaggagat cttcagcaac gagatggcca aggtggacga 360
cagcttcttc cacagactgg aggagagctt cctggtggag gaggacaaga agcacgagag 420
acaccccatc ttcggcaaca tcgtggacga ggtggcctac cacgagaagt accccaccat 480
ctaccacctg agaaagaagc tggtggacag caccgacaag gccgacctga gactgatcta 540
cctggccctg gcccacatga tcaagttcag aggccacttc ctgatcgagg gcgacctgaa 600
ccccgacaac agcgacgtgg acaagctgtt catccagctg gtgcagacct acaaccagct 660
gttcgaggag aaccccatca acgccagcgg cgtggacgcc aaggccatcc tgagcgccag 720
actgagcaag agcagaagac tggagaacct gatcgcccag ctgcccggcg agaagaagaa 780
cggcctgttc ggcaacctga tcgccctgag cctgggcctg acccccaact tcaagagcaa 840
cttcgacctg gccgaggacg ccaagctgca gctgagcaag gacacctacg acgacgacct 900
ggacaacctg ctggcccaga tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa 960
cctgagcgac gccatcctgc tgagcgacat cctgagagtg aacaccgaga tcaccaaggc 1020
ccccctgagc gccagcatga tcaagagata cgacgagcac caccaggacc tgaccctgct 1080
gaaggccctg gtgagacagc agctgcccga gaagtacaag gagatcttct tcgaccagag 1140
caagaacggc tacgccggct acatcgacgg cggcgccagc caggaggagt tctacaagtt 1200
catcaagccc atcctggaga agatggacgg caccgaggag ctgctggtga agctgaacag 1260
agaggacctg ctgagaaagc agagaacctt cgacaacggc agcatccccc accagatcca 1320
cctgggcgag ctgcacgcca tcctgagaag acaggaggac ttctacccct tcctgaagga 1380
caacagagag aagatcgaga agatcctgac cttcagaatc ccctactacg tgggccccct 1440
ggccagaggc aacagcagat tcgcctggat gaccagaaag agcgaggaga ccatcacccc 1500
ctggaacttc gaggaggtgg tggacaaggg cgccagcgcc cagagcttca tcgagagaat 1560
gaccaacttc gacaagaacc tgcccaacga gaaggtgctg cccaagcaca gcctgctgta 1620
cgagtacttc accgtgtaca acgagctgac caaggtgaag tacgtgaccg agggcatgag 1680
aaagcccgcc ttcctgagcg gcgagcagaa gaaggccatc gtggacctgc tgttcaagac 1740
caacagaaag gtgaccgtga agcagctgaa ggaggactac ttcaagaaga tcgagtgctt 1800
cgacagcgtg gagatcagcg gcgtggagga cagattcaac gccagcctgg gcacctacca 1860
cgacctgctg aagatcatca aggacaagga cttcctggac aacgaggaga acgaggacat 1920
cctggaggac atcgtgctga ccctgaccct gttcgaggac agagagatga tcgaggagag 1980
actgaagacc tacgcccacc tgttcgacga caaggtgatg aagcagctga agagaagaag 2040
atacaccggc tggggcagac tgagcagaaa gctgatcaac ggcatcagag acaagcagag 2100
cggcaagacc atcctggact tcctgaagag cgacggcttc gccaacagaa acttcatgca 2160
gctgatccac gacgacagcc tgaccttcaa ggaggacatc cagaaggccc aggtgagcgg 2220
ccagggcgac agcctgcacg agcacatcgc caacctggcc ggcagccccg ccatcaagaa 2280
gggcatcctg cagaccgtga aggtggtgga cgagctggtg aaggtgatgg gcagacacaa 2340
gcccgagaac atcgtgatcg agatggccag agagaaccag accacccaga agggccagaa 2400
gaacagcaga gagagaatga agagaatcga ggagggcatc aaggagctgg gcagccagat 2460
cctgaaggag caccccgtgg agaacaccca gctgcagaac gagaagctgt acctgtacta 2520
cctgcagaac ggcagagaca tgtacgtgga ccaggagctg gacatcaaca gactgagcga 2580
ctacgacgtg gaccacatcg tgccccagag cttcctgaag gacgacagca tcgacaacaa 2640
ggtgctgacc agaagcgaca agaacagagg caagagcgac aacgtgccca gcgaggaggt 2700
ggtgaagaag atgaagaact actggagaca gctgctgaac gccaagctga tcacccagag 2760
aaagttcgac aacctgacca aggccgagag aggcggcctg agcgagctgg acaaggccgg 2820
cttcatcaag agacagctgg tggagaccag acagatcacc aagcacgtgg cccagatcct 2880
ggacagcaga atgaacacca agtacgacga gaacgacaag ctgatcagag aggtgaaggt 2940
gatcaccctg aagagcaagc tggtgagcga cttcagaaag gacttccagt tctacaaggt 3000
gagagagatc aacaactacc accacgccca cgacgcctac ctgaacgccg tggtgggcac 3060
cgccctgatc aagaagtacc ccaagctgga gagcgagttc gtgtacggcg actacaaggt 3120
gtacgacgtg agaaagatga tcgccaagag cgagcaggag atcggcaagg ccaccgccaa 3180
gtacttcttc tacagcaaca tcatgaactt cttcaagacc gagatcaccc tggccaacgg 3240
cgagatcaga aagagacccc tgatcgagac caacggcgag accggcgaga tcgtgtggga 3300
caagggcaga gacttcgcca ccgtgagaaa ggtgctgagc atgccccagg tgaacatcgt 3360
gaagaagacc gaggtgcaga ccggcggctt cagcaaggag agcatcctgc ccaagagaaa 3420
cagcgacaag ctgatcgcca gaaagaagga ctgggacccc aagaagtacg gcggcttcga 3480
cagccccacc gtggcctaca gcgtgctggt ggtggccaag gtggagaagg gcaagagcaa 3540
gaagctgaag agcgtgaagg agctgctggg catcaccatc atggagagaa gcagcttcga 3600
gaagaacccc atcgacttcc tggaggccaa gggctacaag gaggtgaaga aggacctgat 3660
catcaagctg cccaagtaca gcctgttcga gctggagaac ggcagaaaga gaatgctggc 3720
cagcgccggc gagctgcaga agggcaacga gctggccctg cccagcaagt acgtgaactt 3780
cctgtacctg gccagccact acgagaagct gaagggcagc cccgaggaca acgagcagaa 3840
gcagctgttc gtggagcagc acaagcacta cctggacgag atcatcgagc agatcagcga 3900
gttcagcaag agagtgatcc tggccgacgc caacctggac aaggtgctga gcgcctacaa 3960
caagcacaga gacaagccca tcagagagca ggccgagaac atcatccacc tgttcaccct 4020
gaccaacctg ggcgcccccg ccgccttcaa gtacttcgac accaccatcg acagaaagag 4080
atacaccagc accaaggagg tgctggacgc caccctgatc caccagagca tcaccggcct 4140
gtacgagacc agaatcgacc tgagccagct gggcggcgac ggcggcggca gccccaagaa 4200
gaagagaaag gtgtgactag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260
gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320
ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380
tcaattaata aaaaatggaa agaacctcga g 4411
<210> 54
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 54
atggacaaaa aatacagcat agggctagac atagggacga acagcgtagg gtgggcggta 60
ataacggacg aatacaaagt accgagcaaa aaattcaaag tactagggaa cacggaccga 120
cacagcataa aaaaaaacct aataggggcg ctactattcg acagcgggga aacggcggaa 180
gcgacgcgac taaaacgaac ggcgcgacga cgatacacgc gacgaaaaaa ccgaatatgc 240
tacctacaag aaatattcag caacgaaatg gcgaaagtag acgacagctt cttccaccga 300
ctagaagaaa gcttcctagt agaagaagac aaaaaacacg aacgacaccc gatattcggg 360
aacatagtag acgaagtagc gtaccacgaa aaatacccga cgatatacca cctacgaaaa 420
aaactagtag acagcacgga caaagcggac ctacgactaa tatacctagc gctagcgcac 480
atgataaaat tccgagggca cttcctaata gaaggggacc taaacccgga caacagcgac 540
gtagacaaac tattcataca actagtacaa acgtacaacc aactattcga agaaaacccg 600
ataaacgcga gcggggtaga cgcgaaagcg atactaagcg cgcgactaag caaaagccga 660
cgactagaaa acctaatagc gcaactaccg ggggaaaaaa aaaacgggct attcgggaac 720
ctaatagcgc taagcctagg gctaacgccg aacttcaaaa gcaacttcga cctagcggaa 780
gacgcgaaac tacaactaag caaagacacg tacgacgacg acctagacaa cctactagcg 840
caaatagggg accaatacgc ggacctattc ctagcggcga aaaacctaag cgacgcgata 900
ctactaagcg acatactacg agtaaacacg gaaataacga aagcgccgct aagcgcgagc 960
atgataaaac gatacgacga acaccaccaa gacctaacgc tactaaaagc gctagtacga 1020
caacaactac cggaaaaata caaagaaata ttcttcgacc aaagcaaaaa cgggtacgcg 1080
gggtacatag acgggggggc gagccaagaa gaattctaca aattcataaa accgatacta 1140
gaaaaaatgg acgggacgga agaactacta gtaaaactaa accgagaaga cctactacga 1200
aaacaacgaa cgttcgacaa cgggagcata ccgcaccaaa tacacctagg ggaactacac 1260
gcgatactac gacgacaaga agacttctac ccgttcctaa aagacaaccg agaaaaaata 1320
gaaaaaatac taacgttccg aataccgtac tacgtagggc cgctagcgcg agggaacagc 1380
cgattcgcgt ggatgacgcg aaaaagcgaa gaaacgataa cgccgtggaa cttcgaagaa 1440
gtagtagaca aaggggcgag cgcgcaaagc ttcatagaac gaatgacgaa cttcgacaaa 1500
aacctaccga acgaaaaagt actaccgaaa cacagcctac tatacgaata cttcacggta 1560
tacaacgaac taacgaaagt aaaatacgta acggaaggga tgcgaaaacc ggcgttccta 1620
agcggggaac aaaaaaaagc gatagtagac ctactattca aaacgaaccg aaaagtaacg 1680
gtaaaacaac taaaagaaga ctacttcaaa aaaatagaat gcttcgacag cgtagaaata 1740
agcggggtag aagaccgatt caacgcgagc ctagggacgt accacgacct actaaaaata 1800
ataaaagaca aagacttcct agacaacgaa gaaaacgaag acatactaga agacatagta 1860
ctaacgctaa cgctattcga agaccgagaa atgatagaag aacgactaaa aacgtacgcg 1920
cacctattcg acgacaaagt aatgaaacaa ctaaaacgac gacgatacac ggggtggggg 1980
cgactaagcc gaaaactaat aaacgggata cgagacaaac aaagcgggaa aacgatacta 2040
gacttcctaa aaagcgacgg gttcgcgaac cgaaacttca tgcaactaat acacgacgac 2100
agcctaacgt tcaaagaaga catacaaaaa gcgcaagtaa gcgggcaagg ggacagccta 2160
cacgaacaca tagcgaacct agcggggagc ccggcgataa aaaaagggat actacaaacg 2220
gtaaaagtag tagacgaact agtaaaagta atggggcgac acaaaccgga aaacatagta 2280
atagaaatgg cgcgagaaaa ccaaacgacg caaaaagggc aaaaaaacag ccgagaacga 2340
atgaaacgaa tagaagaagg gataaaagaa ctagggagcc aaatactaaa agaacacccg 2400
gtagaaaaca cgcaactaca aaacgaaaaa ctatacctat actacctaca aaacgggcga 2460
gacatgtacg tagaccaaga actagacata aaccgactaa gcgactacga cgtagaccac 2520
atagtaccgc aaagcttcct aaaagacgac agcatagaca acaaagtact aacgcgaagc 2580
gacaaaaacc gagggaaaag cgacaacgta ccgagcgaag aagtagtaaa aaaaatgaaa 2640
aactactggc gacaactact aaacgcgaaa ctaataacgc aacgaaaatt cgacaaccta 2700
acgaaagcgg aacgaggggg gctaagcgaa ctagacaaag cggggttcat aaaacgacaa 2760
ctagtagaaa cgcgacaaat aacgaaacac gtagcgcaaa tactagacag ccgaatgaac 2820
acgaaatacg acgaaaacga caaactaata cgagaagtaa aagtaataac gctaaaaagc 2880
aaactagtaa gcgacttccg aaaagacttc caattctaca aagtacgaga aataaacaac 2940
taccaccacg cgcacgacgc gtacctaaac gcggtagtag ggacggcgct aataaaaaaa 3000
tacccgaaac tagaaagcga attcgtatac ggggactaca aagtatacga cgtacgaaaa 3060
atgatagcga aaagcgaaca agaaataggg aaagcgacgg cgaaatactt cttctacagc 3120
aacataatga acttcttcaa aacggaaata acgctagcga acggggaaat acgaaaacga 3180
ccgctaatag aaacgaacgg ggaaacgggg gaaatagtat gggacaaagg gcgagacttc 3240
gcgacggtac gaaaagtact aagcatgccg caagtaaaca tagtaaaaaa aacggaagta 3300
caaacggggg ggttcagcaa agaaagcata ctaccgaaac gaaacagcga caaactaata 3360
gcgcgaaaaa aagactggga cccgaaaaaa tacggggggt tcgacagccc gacggtagcg 3420
tacagcgtac tagtagtagc gaaagtagaa aaagggaaaa gcaaaaaact aaaaagcgta 3480
aaagaactac tagggataac gataatggaa cgaagcagct tcgaaaaaaa cccgatagac 3540
ttcctagaag cgaaagggta caaagaagta aaaaaagacc taataataaa actaccgaaa 3600
tacagcctat tcgaactaga aaacgggcga aaacgaatgc tagcgagcgc gggggaacta 3660
caaaaaggga acgaactagc gctaccgagc aaatacgtaa acttcctata cctagcgagc 3720
cactacgaaa aactaaaagg gagcccggaa gacaacgaac aaaaacaact attcgtagaa 3780
caacacaaac actacctaga cgaaataata gaacaaataa gcgaattcag caaacgagta 3840
atactagcgg acgcgaacct agacaaagta ctaagcgcgt acaacaaaca ccgagacaaa 3900
ccgatacgag aacaagcgga aaacataata cacctattca cgctaacgaa cctaggggcg 3960
ccggcggcgt tcaaatactt cgacacgacg atagaccgaa aacgatacac gagcacgaaa 4020
gaagtactag acgcgacgct aatacaccaa agcataacgg ggctatacga aacgcgaata 4080
gacctaagcc aactaggggg ggacgggggg gggagcccga aaaaaaaacg aaaagtatga 4140
<210> 55
<211> 4411
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 55
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc gccaccatgg acaaaaaata cagcataggg ctagacatag ggacgaacag 120
cgtagggtgg gcggtaataa cggacgaata caaagtaccg agcaaaaaat tcaaagtact 180
agggaacacg gaccgacaca gcataaaaaa aaacctaata ggggcgctac tattcgacag 240
cggggaaacg gcggaagcga cgcgactaaa acgaacggcg cgacgacgat acacgcgacg 300
aaaaaaccga atatgctacc tacaagaaat attcagcaac gaaatggcga aagtagacga 360
cagcttcttc caccgactag aagaaagctt cctagtagaa gaagacaaaa aacacgaacg 420
acacccgata ttcgggaaca tagtagacga agtagcgtac cacgaaaaat acccgacgat 480
ataccaccta cgaaaaaaac tagtagacag cacggacaaa gcggacctac gactaatata 540
cctagcgcta gcgcacatga taaaattccg agggcacttc ctaatagaag gggacctaaa 600
cccggacaac agcgacgtag acaaactatt catacaacta gtacaaacgt acaaccaact 660
attcgaagaa aacccgataa acgcgagcgg ggtagacgcg aaagcgatac taagcgcgcg 720
actaagcaaa agccgacgac tagaaaacct aatagcgcaa ctaccggggg aaaaaaaaaa 780
cgggctattc gggaacctaa tagcgctaag cctagggcta acgccgaact tcaaaagcaa 840
cttcgaccta gcggaagacg cgaaactaca actaagcaaa gacacgtacg acgacgacct 900
agacaaccta ctagcgcaaa taggggacca atacgcggac ctattcctag cggcgaaaaa 960
cctaagcgac gcgatactac taagcgacat actacgagta aacacggaaa taacgaaagc 1020
gccgctaagc gcgagcatga taaaacgata cgacgaacac caccaagacc taacgctact 1080
aaaagcgcta gtacgacaac aactaccgga aaaatacaaa gaaatattct tcgaccaaag 1140
caaaaacggg tacgcggggt acatagacgg gggggcgagc caagaagaat tctacaaatt 1200
cataaaaccg atactagaaa aaatggacgg gacggaagaa ctactagtaa aactaaaccg 1260
agaagaccta ctacgaaaac aacgaacgtt cgacaacggg agcataccgc accaaataca 1320
cctaggggaa ctacacgcga tactacgacg acaagaagac ttctacccgt tcctaaaaga 1380
caaccgagaa aaaatagaaa aaatactaac gttccgaata ccgtactacg tagggccgct 1440
agcgcgaggg aacagccgat tcgcgtggat gacgcgaaaa agcgaagaaa cgataacgcc 1500
gtggaacttc gaagaagtag tagacaaagg ggcgagcgcg caaagcttca tagaacgaat 1560
gacgaacttc gacaaaaacc taccgaacga aaaagtacta ccgaaacaca gcctactata 1620
cgaatacttc acggtataca acgaactaac gaaagtaaaa tacgtaacgg aagggatgcg 1680
aaaaccggcg ttcctaagcg gggaacaaaa aaaagcgata gtagacctac tattcaaaac 1740
gaaccgaaaa gtaacggtaa aacaactaaa agaagactac ttcaaaaaaa tagaatgctt 1800
cgacagcgta gaaataagcg gggtagaaga ccgattcaac gcgagcctag ggacgtacca 1860
cgacctacta aaaataataa aagacaaaga cttcctagac aacgaagaaa acgaagacat 1920
actagaagac atagtactaa cgctaacgct attcgaagac cgagaaatga tagaagaacg 1980
actaaaaacg tacgcgcacc tattcgacga caaagtaatg aaacaactaa aacgacgacg 2040
atacacgggg tgggggcgac taagccgaaa actaataaac gggatacgag acaaacaaag 2100
cgggaaaacg atactagact tcctaaaaag cgacgggttc gcgaaccgaa acttcatgca 2160
actaatacac gacgacagcc taacgttcaa agaagacata caaaaagcgc aagtaagcgg 2220
gcaaggggac agcctacacg aacacatagc gaacctagcg gggagcccgg cgataaaaaa 2280
agggatacta caaacggtaa aagtagtaga cgaactagta aaagtaatgg ggcgacacaa 2340
accggaaaac atagtaatag aaatggcgcg agaaaaccaa acgacgcaaa aagggcaaaa 2400
aaacagccga gaacgaatga aacgaataga agaagggata aaagaactag ggagccaaat 2460
actaaaagaa cacccggtag aaaacacgca actacaaaac gaaaaactat acctatacta 2520
cctacaaaac gggcgagaca tgtacgtaga ccaagaacta gacataaacc gactaagcga 2580
ctacgacgta gaccacatag taccgcaaag cttcctaaaa gacgacagca tagacaacaa 2640
agtactaacg cgaagcgaca aaaaccgagg gaaaagcgac aacgtaccga gcgaagaagt 2700
agtaaaaaaa atgaaaaact actggcgaca actactaaac gcgaaactaa taacgcaacg 2760
aaaattcgac aacctaacga aagcggaacg aggggggcta agcgaactag acaaagcggg 2820
gttcataaaa cgacaactag tagaaacgcg acaaataacg aaacacgtag cgcaaatact 2880
agacagccga atgaacacga aatacgacga aaacgacaaa ctaatacgag aagtaaaagt 2940
aataacgcta aaaagcaaac tagtaagcga cttccgaaaa gacttccaat tctacaaagt 3000
acgagaaata aacaactacc accacgcgca cgacgcgtac ctaaacgcgg tagtagggac 3060
ggcgctaata aaaaaatacc cgaaactaga aagcgaattc gtatacgggg actacaaagt 3120
atacgacgta cgaaaaatga tagcgaaaag cgaacaagaa atagggaaag cgacggcgaa 3180
atacttcttc tacagcaaca taatgaactt cttcaaaacg gaaataacgc tagcgaacgg 3240
ggaaatacga aaacgaccgc taatagaaac gaacggggaa acgggggaaa tagtatggga 3300
caaagggcga gacttcgcga cggtacgaaa agtactaagc atgccgcaag taaacatagt 3360
aaaaaaaacg gaagtacaaa cgggggggtt cagcaaagaa agcatactac cgaaacgaaa 3420
cagcgacaaa ctaatagcgc gaaaaaaaga ctgggacccg aaaaaatacg gggggttcga 3480
cagcccgacg gtagcgtaca gcgtactagt agtagcgaaa gtagaaaaag ggaaaagcaa 3540
aaaactaaaa agcgtaaaag aactactagg gataacgata atggaacgaa gcagcttcga 3600
aaaaaacccg atagacttcc tagaagcgaa agggtacaaa gaagtaaaaa aagacctaat 3660
aataaaacta ccgaaataca gcctattcga actagaaaac gggcgaaaac gaatgctagc 3720
gagcgcgggg gaactacaaa aagggaacga actagcgcta ccgagcaaat acgtaaactt 3780
cctataccta gcgagccact acgaaaaact aaaagggagc ccggaagaca acgaacaaaa 3840
acaactattc gtagaacaac acaaacacta cctagacgaa ataatagaac aaataagcga 3900
attcagcaaa cgagtaatac tagcggacgc gaacctagac aaagtactaa gcgcgtacaa 3960
caaacaccga gacaaaccga tacgagaaca agcggaaaac ataatacacc tattcacgct 4020
aacgaaccta ggggcgccgg cggcgttcaa atacttcgac acgacgatag accgaaaacg 4080
atacacgagc acgaaagaag tactagacgc gacgctaata caccaaagca taacggggct 4140
atacgaaacg cgaatagacc taagccaact agggggggac ggggggggga gcccgaaaaa 4200
aaaacgaaaa gtatgactag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260
gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320
ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380
tcaattaata aaaaatggaa agaacctcga g 4411
<210> 56
<211> 4411
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 56
aggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120
cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180
gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240
cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300
aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360
cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420
acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480
ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540
cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600
cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660
gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720
actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780
cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840
cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900
ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960
cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020
accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080
gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140
caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200
catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260
agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320
cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380
caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440
ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500
gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560
gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620
cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680
aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740
aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800
cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860
cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920
cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980
actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040
atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100
cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160
gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220
acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280
gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340
gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400
gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460
cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520
cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580
ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640
ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700
cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760
aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820
attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880
ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940
catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000
cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060
agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120
ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180
gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240
agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300
caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360
caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420
cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480
cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540
gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600
aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660
catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720
aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780
cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840
gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900
attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960
caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020
gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080
atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140
gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200
gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260
gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320
ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380
tcaattaata aaaaatggaa agaacctcga g 4411
<210> 57
<211> 4481
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 57
gggcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac 60
cgatccagcc tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt 120
gactcaccgt ccttgacacg gccaccatgg acaagaagta cagcatcgga ctggacatcg 180
gaacaaacag cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt 240
tcaaggtcct gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc 300
tgttcgacag cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat 360
acacaagaag aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa 420
aggtcgacga cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga 480
agcacgaaag acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt 540
acccgacaat ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga 600
gactgatcta cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag 660
gagacctgaa cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat 720
acaaccagct gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc 780
tgagcgcaag actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag 840
aaaagaagaa cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact 900
tcaagagcaa cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg 960
acgacgacct ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg 1020
cagcaaagaa cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa 1080
tcacaaaggc accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc 1140
tgacactgct gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct 1200
tcgaccagag caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat 1260
tctacaagtt catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca 1320
agctgaacag agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc 1380
accagatcca cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt 1440
tcctgaagga caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg 1500
tcggaccgct ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa 1560
caatcacacc gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca 1620
tcgaaagaat gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca 1680
gcctgctgta cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag 1740
aaggaatgag aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc 1800
tgttcaagac aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga 1860
tcgaatgctt cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg 1920
gaacatacca cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa 1980
acgaagacat cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga 2040
tcgaagaaag actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga 2100
agagaagaag atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag 2160
acaagcagag cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa 2220
acttcatgca gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac 2280
aggtcagcgg acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg 2340
caatcaagaa gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg 2400
gaagacacaa gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga 2460
agggacagaa gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg 2520
gaagccagat cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt 2580
acctgtacta cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca 2640
gactgagcga ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca 2700
tcgacaacaa ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga 2760
gcgaagaagt cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga 2820
tcacacagag aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg 2880
acaaggcagg attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg 2940
cacagatcct ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag 3000
aagtcaaggt catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt 3060
tctacaaggt cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag 3120
tcgtcggaac agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag 3180
actacaaggt ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg 3240
caacagcaaa gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac 3300
tggcaaacgg agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa 3360
tcgtctggga caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg 3420
tcaacatcgt caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc 3480
cgaagagaaa cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg 3540
gaggattcga cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg 3600
gaaagagcaa gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa 3660
gcagcttcga aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga 3720
aggacctgat catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga 3780
gaatgctggc aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt 3840
acgtcaactt cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca 3900
acgaacagaa gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac 3960
agatcagcga attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga 4020
gcgcatacaa caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc 4080
tgttcacact gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg 4140
acagaaagag atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca 4200
tcacaggact gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa 4260
gcccgaagaa gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc 4320
atgagaataa gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt 4380
tggtgtaaag ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt 4440
tctctgtgct tcaattaata aaaaatggaa agaacctcga g 4481
<210> 58
<211> 4348
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 58
gggacatttg cttctgacac aactgtgttc actagcaacc tcaaacagac accggatctg 60
ccaccatgga caagaagtac agcatcggac tggacatcgg aacaaacagc gtcggatggg 120
cagtcatcac agacgaatac aaggtcccga gcaagaagtt caaggtcctg ggaaacacag 180
acagacacag catcaagaag aacctgatcg gagcactgct gttcgacagc ggagaaacag 240
cagaagcaac aagactgaag agaacagcaa gaagaagata cacaagaaga aagaacagaa 300
tctgctacct gcaggaaatc ttcagcaacg aaatggcaaa ggtcgacgac agcttcttcc 360
acagactgga agaaagcttc ctggtcgaag aagacaagaa gcacgaaaga cacccgatct 420
tcggaaacat cgtcgacgaa gtcgcatacc acgaaaagta cccgacaatc taccacctga 480
gaaagaagct ggtcgacagc acagacaagg cagacctgag actgatctac ctggcactgg 540
cacacatgat caagttcaga ggacacttcc tgatcgaagg agacctgaac ccggacaaca 600
gcgacgtcga caagctgttc atccagctgg tccagacata caaccagctg ttcgaagaaa 660
acccgatcaa cgcaagcgga gtcgacgcaa aggcaatcct gagcgcaaga ctgagcaaga 720
gcagaagact ggaaaacctg atcgcacagc tgccgggaga aaagaagaac ggactgttcg 780
gaaacctgat cgcactgagc ctgggactga caccgaactt caagagcaac ttcgacctgg 840
cagaagacgc aaagctgcag ctgagcaagg acacatacga cgacgacctg gacaacctgc 900
tggcacagat cggagaccag tacgcagacc tgttcctggc agcaaagaac ctgagcgacg 960
caatcctgct gagcgacatc ctgagagtca acacagaaat cacaaaggca ccgctgagcg 1020
caagcatgat caagagatac gacgaacacc accaggacct gacactgctg aaggcactgg 1080
tcagacagca gctgccggaa aagtacaagg aaatcttctt cgaccagagc aagaacggat 1140
acgcaggata catcgacgga ggagcaagcc aggaagaatt ctacaagttc atcaagccga 1200
tcctggaaaa gatggacgga acagaagaac tgctggtcaa gctgaacaga gaagacctgc 1260
tgagaaagca gagaacattc gacaacggaa gcatcccgca ccagatccac ctgggagaac 1320
tgcacgcaat cctgagaaga caggaagact tctacccgtt cctgaaggac aacagagaaa 1380
agatcgaaaa gatcctgaca ttcagaatcc cgtactacgt cggaccgctg gcaagaggaa 1440
acagcagatt cgcatggatg acaagaaaga gcgaagaaac aatcacaccg tggaacttcg 1500
aagaagtcgt cgacaaggga gcaagcgcac agagcttcat cgaaagaatg acaaacttcg 1560
acaagaacct gccgaacgaa aaggtcctgc cgaagcacag cctgctgtac gaatacttca 1620
cagtctacaa cgaactgaca aaggtcaagt acgtcacaga aggaatgaga aagccggcat 1680
tcctgagcgg agaacagaag aaggcaatcg tcgacctgct gttcaagaca aacagaaagg 1740
tcacagtcaa gcagctgaag gaagactact tcaagaagat cgaatgcttc gacagcgtcg 1800
aaatcagcgg agtcgaagac agattcaacg caagcctggg aacataccac gacctgctga 1860
agatcatcaa ggacaaggac ttcctggaca acgaagaaaa cgaagacatc ctggaagaca 1920
tcgtcctgac actgacactg ttcgaagaca gagaaatgat cgaagaaaga ctgaagacat 1980
acgcacacct gttcgacgac aaggtcatga agcagctgaa gagaagaaga tacacaggat 2040
ggggaagact gagcagaaag ctgatcaacg gaatcagaga caagcagagc ggaaagacaa 2100
tcctggactt cctgaagagc gacggattcg caaacagaaa cttcatgcag ctgatccacg 2160
acgacagcct gacattcaag gaagacatcc agaaggcaca ggtcagcgga cagggagaca 2220
gcctgcacga acacatcgca aacctggcag gaagcccggc aatcaagaag ggaatcctgc 2280
agacagtcaa ggtcgtcgac gaactggtca aggtcatggg aagacacaag ccggaaaaca 2340
tcgtcatcga aatggcaaga gaaaaccaga caacacagaa gggacagaag aacagcagag 2400
aaagaatgaa gagaatcgaa gaaggaatca aggaactggg aagccagatc ctgaaggaac 2460
acccggtcga aaacacacag ctgcagaacg aaaagctgta cctgtactac ctgcagaacg 2520
gaagagacat gtacgtcgac caggaactgg acatcaacag actgagcgac tacgacgtcg 2580
accacatcgt cccgcagagc ttcctgaagg acgacagcat cgacaacaag gtcctgacaa 2640
gaagcgacaa gaacagagga aagagcgaca acgtcccgag cgaagaagtc gtcaagaaga 2700
tgaagaacta ctggagacag ctgctgaacg caaagctgat cacacagaga aagttcgaca 2760
acctgacaaa ggcagagaga ggaggactga gcgaactgga caaggcagga ttcatcaaga 2820
gacagctggt cgaaacaaga cagatcacaa agcacgtcgc acagatcctg gacagcagaa 2880
tgaacacaaa gtacgacgaa aacgacaagc tgatcagaga agtcaaggtc atcacactga 2940
agagcaagct ggtcagcgac ttcagaaagg acttccagtt ctacaaggtc agagaaatca 3000
acaactacca ccacgcacac gacgcatacc tgaacgcagt cgtcggaaca gcactgatca 3060
agaagtaccc gaagctggaa agcgaattcg tctacggaga ctacaaggtc tacgacgtca 3120
gaaagatgat cgcaaagagc gaacaggaaa tcggaaaggc aacagcaaag tacttcttct 3180
acagcaacat catgaacttc ttcaagacag aaatcacact ggcaaacgga gaaatcagaa 3240
agagaccgct gatcgaaaca aacggagaaa caggagaaat cgtctgggac aagggaagag 3300
acttcgcaac agtcagaaag gtcctgagca tgccgcaggt caacatcgtc aagaagacag 3360
aagtccagac aggaggattc agcaaggaaa gcatcctgcc gaagagaaac agcgacaagc 3420
tgatcgcaag aaagaaggac tgggacccga agaagtacgg aggattcgac agcccgacag 3480
tcgcatacag cgtcctggtc gtcgcaaagg tcgaaaaggg aaagagcaag aagctgaaga 3540
gcgtcaagga actgctggga atcacaatca tggaaagaag cagcttcgaa aagaacccga 3600
tcgacttcct ggaagcaaag ggatacaagg aagtcaagaa ggacctgatc atcaagctgc 3660
cgaagtacag cctgttcgaa ctggaaaacg gaagaaagag aatgctggca agcgcaggag 3720
aactgcagaa gggaaacgaa ctggcactgc cgagcaagta cgtcaacttc ctgtacctgg 3780
caagccacta cgaaaagctg aagggaagcc cggaagacaa cgaacagaag cagctgttcg 3840
tcgaacagca caagcactac ctggacgaaa tcatcgaaca gatcagcgaa ttcagcaaga 3900
gagtcatcct ggcagacgca aacctggaca aggtcctgag cgcatacaac aagcacagag 3960
acaagccgat cagagaacag gcagaaaaca tcatccacct gttcacactg acaaacctgg 4020
gagcaccggc agcattcaag tacttcgaca caacaatcga cagaaagaga tacacaagca 4080
caaaggaagt cctggacgca acactgatcc accagagcat cacaggactg tacgaaacaa 4140
gaatcgacct gagccagctg ggaggagacg gaggaggaag cccgaagaag aagagaaagg 4200
tctagctagc gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa 4260
gtccaactac taaactgggg gatattatga agggccttga gcatctggat tctgcctaat 4320
aaaaaacatt tattttcatt gcctcgag 4348
<210> 59
<211> 4325
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 59
gggaagctca gaataaacgc tcaactttgg ccggatctgc caccatggac aagaagtaca 60
gcatcggact ggacatcgga acaaacagcg tcggatgggc agtcatcaca gacgaataca 120
aggtcccgag caagaagttc aaggtcctgg gaaacacaga cagacacagc atcaagaaga 180
acctgatcgg agcactgctg ttcgacagcg gagaaacagc agaagcaaca agactgaaga 240
gaacagcaag aagaagatac acaagaagaa agaacagaat ctgctacctg caggaaatct 300
tcagcaacga aatggcaaag gtcgacgaca gcttcttcca cagactggaa gaaagcttcc 360
tggtcgaaga agacaagaag cacgaaagac acccgatctt cggaaacatc gtcgacgaag 420
tcgcatacca cgaaaagtac ccgacaatct accacctgag aaagaagctg gtcgacagca 480
cagacaaggc agacctgaga ctgatctacc tggcactggc acacatgatc aagttcagag 540
gacacttcct gatcgaagga gacctgaacc cggacaacag cgacgtcgac aagctgttca 600
tccagctggt ccagacatac aaccagctgt tcgaagaaaa cccgatcaac gcaagcggag 660
tcgacgcaaa ggcaatcctg agcgcaagac tgagcaagag cagaagactg gaaaacctga 720
tcgcacagct gccgggagaa aagaagaacg gactgttcgg aaacctgatc gcactgagcc 780
tgggactgac accgaacttc aagagcaact tcgacctggc agaagacgca aagctgcagc 840
tgagcaagga cacatacgac gacgacctgg acaacctgct ggcacagatc ggagaccagt 900
acgcagacct gttcctggca gcaaagaacc tgagcgacgc aatcctgctg agcgacatcc 960
tgagagtcaa cacagaaatc acaaaggcac cgctgagcgc aagcatgatc aagagatacg 1020
acgaacacca ccaggacctg acactgctga aggcactggt cagacagcag ctgccggaaa 1080
agtacaagga aatcttcttc gaccagagca agaacggata cgcaggatac atcgacggag 1140
gagcaagcca ggaagaattc tacaagttca tcaagccgat cctggaaaag atggacggaa 1200
cagaagaact gctggtcaag ctgaacagag aagacctgct gagaaagcag agaacattcg 1260
acaacggaag catcccgcac cagatccacc tgggagaact gcacgcaatc ctgagaagac 1320
aggaagactt ctacccgttc ctgaaggaca acagagaaaa gatcgaaaag atcctgacat 1380
tcagaatccc gtactacgtc ggaccgctgg caagaggaaa cagcagattc gcatggatga 1440
caagaaagag cgaagaaaca atcacaccgt ggaacttcga agaagtcgtc gacaagggag 1500
caagcgcaca gagcttcatc gaaagaatga caaacttcga caagaacctg ccgaacgaaa 1560
aggtcctgcc gaagcacagc ctgctgtacg aatacttcac agtctacaac gaactgacaa 1620
aggtcaagta cgtcacagaa ggaatgagaa agccggcatt cctgagcgga gaacagaaga 1680
aggcaatcgt cgacctgctg ttcaagacaa acagaaaggt cacagtcaag cagctgaagg 1740
aagactactt caagaagatc gaatgcttcg acagcgtcga aatcagcgga gtcgaagaca 1800
gattcaacgc aagcctggga acataccacg acctgctgaa gatcatcaag gacaaggact 1860
tcctggacaa cgaagaaaac gaagacatcc tggaagacat cgtcctgaca ctgacactgt 1920
tcgaagacag agaaatgatc gaagaaagac tgaagacata cgcacacctg ttcgacgaca 1980
aggtcatgaa gcagctgaag agaagaagat acacaggatg gggaagactg agcagaaagc 2040
tgatcaacgg aatcagagac aagcagagcg gaaagacaat cctggacttc ctgaagagcg 2100
acggattcgc aaacagaaac ttcatgcagc tgatccacga cgacagcctg acattcaagg 2160
aagacatcca gaaggcacag gtcagcggac agggagacag cctgcacgaa cacatcgcaa 2220
acctggcagg aagcccggca atcaagaagg gaatcctgca gacagtcaag gtcgtcgacg 2280
aactggtcaa ggtcatggga agacacaagc cggaaaacat cgtcatcgaa atggcaagag 2340
aaaaccagac aacacagaag ggacagaaga acagcagaga aagaatgaag agaatcgaag 2400
aaggaatcaa ggaactggga agccagatcc tgaaggaaca cccggtcgaa aacacacagc 2460
tgcagaacga aaagctgtac ctgtactacc tgcagaacgg aagagacatg tacgtcgacc 2520
aggaactgga catcaacaga ctgagcgact acgacgtcga ccacatcgtc ccgcagagct 2580
tcctgaagga cgacagcatc gacaacaagg tcctgacaag aagcgacaag aacagaggaa 2640
agagcgacaa cgtcccgagc gaagaagtcg tcaagaagat gaagaactac tggagacagc 2700
tgctgaacgc aaagctgatc acacagagaa agttcgacaa cctgacaaag gcagagagag 2760
gaggactgag cgaactggac aaggcaggat tcatcaagag acagctggtc gaaacaagac 2820
agatcacaaa gcacgtcgca cagatcctgg acagcagaat gaacacaaag tacgacgaaa 2880
acgacaagct gatcagagaa gtcaaggtca tcacactgaa gagcaagctg gtcagcgact 2940
tcagaaagga cttccagttc tacaaggtca gagaaatcaa caactaccac cacgcacacg 3000
acgcatacct gaacgcagtc gtcggaacag cactgatcaa gaagtacccg aagctggaaa 3060
gcgaattcgt ctacggagac tacaaggtct acgacgtcag aaagatgatc gcaaagagcg 3120
aacaggaaat cggaaaggca acagcaaagt acttcttcta cagcaacatc atgaacttct 3180
tcaagacaga aatcacactg gcaaacggag aaatcagaaa gagaccgctg atcgaaacaa 3240
acggagaaac aggagaaatc gtctgggaca agggaagaga cttcgcaaca gtcagaaagg 3300
tcctgagcat gccgcaggtc aacatcgtca agaagacaga agtccagaca ggaggattca 3360
gcaaggaaag catcctgccg aagagaaaca gcgacaagct gatcgcaaga aagaaggact 3420
gggacccgaa gaagtacgga ggattcgaca gcccgacagt cgcatacagc gtcctggtcg 3480
tcgcaaaggt cgaaaaggga aagagcaaga agctgaagag cgtcaaggaa ctgctgggaa 3540
tcacaatcat ggaaagaagc agcttcgaaa agaacccgat cgacttcctg gaagcaaagg 3600
gatacaagga agtcaagaag gacctgatca tcaagctgcc gaagtacagc ctgttcgaac 3660
tggaaaacgg aagaaagaga atgctggcaa gcgcaggaga actgcagaag ggaaacgaac 3720
tggcactgcc gagcaagtac gtcaacttcc tgtacctggc aagccactac gaaaagctga 3780
agggaagccc ggaagacaac gaacagaagc agctgttcgt cgaacagcac aagcactacc 3840
tggacgaaat catcgaacag atcagcgaat tcagcaagag agtcatcctg gcagacgcaa 3900
acctggacaa ggtcctgagc gcatacaaca agcacagaga caagccgatc agagaacagg 3960
cagaaaacat catccacctg ttcacactga caaacctggg agcaccggca gcattcaagt 4020
acttcgacac aacaatcgac agaaagagat acacaagcac aaaggaagtc ctggacgcaa 4080
cactgatcca ccagagcatc acaggactgt acgaaacaag aatcgacctg agccagctgg 4140
gaggagacgg aggaggaagc ccgaagaaga agagaaaggt ctagctagca ccagcctcaa 4200
gaacacccga atggagtctc taagctacat aataccaact tacactttac aaaatgttgt 4260
cccccaaaat gtagccattc gtatctgctc ctaataaaaa gaaagtttct tcacattctc 4320
tcgag 4325
<210> 60
<211> 4325
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 60
aggaagctca gaataaacgc tcaactttgg ccggatctgc caccatggac aagaagtaca 60
gcatcggact ggacatcgga acaaacagcg tcggatgggc agtcatcaca gacgaataca 120
aggtcccgag caagaagttc aaggtcctgg gaaacacaga cagacacagc atcaagaaga 180
acctgatcgg agcactgctg ttcgacagcg gagaaacagc agaagcaaca agactgaaga 240
gaacagcaag aagaagatac acaagaagaa agaacagaat ctgctacctg caggaaatct 300
tcagcaacga aatggcaaag gtcgacgaca gcttcttcca cagactggaa gaaagcttcc 360
tggtcgaaga agacaagaag cacgaaagac acccgatctt cggaaacatc gtcgacgaag 420
tcgcatacca cgaaaagtac ccgacaatct accacctgag aaagaagctg gtcgacagca 480
cagacaaggc agacctgaga ctgatctacc tggcactggc acacatgatc aagttcagag 540
gacacttcct gatcgaagga gacctgaacc cggacaacag cgacgtcgac aagctgttca 600
tccagctggt ccagacatac aaccagctgt tcgaagaaaa cccgatcaac gcaagcggag 660
tcgacgcaaa ggcaatcctg agcgcaagac tgagcaagag cagaagactg gaaaacctga 720
tcgcacagct gccgggagaa aagaagaacg gactgttcgg aaacctgatc gcactgagcc 780
tgggactgac accgaacttc aagagcaact tcgacctggc agaagacgca aagctgcagc 840
tgagcaagga cacatacgac gacgacctgg acaacctgct ggcacagatc ggagaccagt 900
acgcagacct gttcctggca gcaaagaacc tgagcgacgc aatcctgctg agcgacatcc 960
tgagagtcaa cacagaaatc acaaaggcac cgctgagcgc aagcatgatc aagagatacg 1020
acgaacacca ccaggacctg acactgctga aggcactggt cagacagcag ctgccggaaa 1080
agtacaagga aatcttcttc gaccagagca agaacggata cgcaggatac atcgacggag 1140
gagcaagcca ggaagaattc tacaagttca tcaagccgat cctggaaaag atggacggaa 1200
cagaagaact gctggtcaag ctgaacagag aagacctgct gagaaagcag agaacattcg 1260
acaacggaag catcccgcac cagatccacc tgggagaact gcacgcaatc ctgagaagac 1320
aggaagactt ctacccgttc ctgaaggaca acagagaaaa gatcgaaaag atcctgacat 1380
tcagaatccc gtactacgtc ggaccgctgg caagaggaaa cagcagattc gcatggatga 1440
caagaaagag cgaagaaaca atcacaccgt ggaacttcga agaagtcgtc gacaagggag 1500
caagcgcaca gagcttcatc gaaagaatga caaacttcga caagaacctg ccgaacgaaa 1560
aggtcctgcc gaagcacagc ctgctgtacg aatacttcac agtctacaac gaactgacaa 1620
aggtcaagta cgtcacagaa ggaatgagaa agccggcatt cctgagcgga gaacagaaga 1680
aggcaatcgt cgacctgctg ttcaagacaa acagaaaggt cacagtcaag cagctgaagg 1740
aagactactt caagaagatc gaatgcttcg acagcgtcga aatcagcgga gtcgaagaca 1800
gattcaacgc aagcctggga acataccacg acctgctgaa gatcatcaag gacaaggact 1860
tcctggacaa cgaagaaaac gaagacatcc tggaagacat cgtcctgaca ctgacactgt 1920
tcgaagacag agaaatgatc gaagaaagac tgaagacata cgcacacctg ttcgacgaca 1980
aggtcatgaa gcagctgaag agaagaagat acacaggatg gggaagactg agcagaaagc 2040
tgatcaacgg aatcagagac aagcagagcg gaaagacaat cctggacttc ctgaagagcg 2100
acggattcgc aaacagaaac ttcatgcagc tgatccacga cgacagcctg acattcaagg 2160
aagacatcca gaaggcacag gtcagcggac agggagacag cctgcacgaa cacatcgcaa 2220
acctggcagg aagcccggca atcaagaagg gaatcctgca gacagtcaag gtcgtcgacg 2280
aactggtcaa ggtcatggga agacacaagc cggaaaacat cgtcatcgaa atggcaagag 2340
aaaaccagac aacacagaag ggacagaaga acagcagaga aagaatgaag agaatcgaag 2400
aaggaatcaa ggaactggga agccagatcc tgaaggaaca cccggtcgaa aacacacagc 2460
tgcagaacga aaagctgtac ctgtactacc tgcagaacgg aagagacatg tacgtcgacc 2520
aggaactgga catcaacaga ctgagcgact acgacgtcga ccacatcgtc ccgcagagct 2580
tcctgaagga cgacagcatc gacaacaagg tcctgacaag aagcgacaag aacagaggaa 2640
agagcgacaa cgtcccgagc gaagaagtcg tcaagaagat gaagaactac tggagacagc 2700
tgctgaacgc aaagctgatc acacagagaa agttcgacaa cctgacaaag gcagagagag 2760
gaggactgag cgaactggac aaggcaggat tcatcaagag acagctggtc gaaacaagac 2820
agatcacaaa gcacgtcgca cagatcctgg acagcagaat gaacacaaag tacgacgaaa 2880
acgacaagct gatcagagaa gtcaaggtca tcacactgaa gagcaagctg gtcagcgact 2940
tcagaaagga cttccagttc tacaaggtca gagaaatcaa caactaccac cacgcacacg 3000
acgcatacct gaacgcagtc gtcggaacag cactgatcaa gaagtacccg aagctggaaa 3060
gcgaattcgt ctacggagac tacaaggtct acgacgtcag aaagatgatc gcaaagagcg 3120
aacaggaaat cggaaaggca acagcaaagt acttcttcta cagcaacatc atgaacttct 3180
tcaagacaga aatcacactg gcaaacggag aaatcagaaa gagaccgctg atcgaaacaa 3240
acggagaaac aggagaaatc gtctgggaca agggaagaga cttcgcaaca gtcagaaagg 3300
tcctgagcat gccgcaggtc aacatcgtca agaagacaga agtccagaca ggaggattca 3360
gcaaggaaag catcctgccg aagagaaaca gcgacaagct gatcgcaaga aagaaggact 3420
gggacccgaa gaagtacgga ggattcgaca gcccgacagt cgcatacagc gtcctggtcg 3480
tcgcaaaggt cgaaaaggga aagagcaaga agctgaagag cgtcaaggaa ctgctgggaa 3540
tcacaatcat ggaaagaagc agcttcgaaa agaacccgat cgacttcctg gaagcaaagg 3600
gatacaagga agtcaagaag gacctgatca tcaagctgcc gaagtacagc ctgttcgaac 3660
tggaaaacgg aagaaagaga atgctggcaa gcgcaggaga actgcagaag ggaaacgaac 3720
tggcactgcc gagcaagtac gtcaacttcc tgtacctggc aagccactac gaaaagctga 3780
agggaagccc ggaagacaac gaacagaagc agctgttcgt cgaacagcac aagcactacc 3840
tggacgaaat catcgaacag atcagcgaat tcagcaagag agtcatcctg gcagacgcaa 3900
acctggacaa ggtcctgagc gcatacaaca agcacagaga caagccgatc agagaacagg 3960
cagaaaacat catccacctg ttcacactga caaacctggg agcaccggca gcattcaagt 4020
acttcgacac aacaatcgac agaaagagat acacaagcac aaaggaagtc ctggacgcaa 4080
cactgatcca ccagagcatc acaggactgt acgaaacaag aatcgacctg agccagctgg 4140
gaggagacgg aggaggaagc ccgaagaaga agagaaaggt ctagctagca ccagcctcaa 4200
gaacacccga atggagtctc taagctacat aataccaact tacactttac aaaatgttgt 4260
cccccaaaat gtagccattc gtatctgctc ctaataaaaa gaaagtttct tcacattctc 4320
tcgag 4325
<210> 61
<211> 4411
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 61
aggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60
attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120
cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180
gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240
cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300
aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360
cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420
acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480
ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540
cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600
cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660
gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720
actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780
cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840
cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900
ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960
cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020
accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080
gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140
caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200
catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260
agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320
cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380
caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440
ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500
gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560
gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620
cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680
aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740
aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800
cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860
cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920
cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980
actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040
atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100
cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160
gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220
acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280
gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340
gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400
gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460
cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520
cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580
ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640
ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700
cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760
aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820
attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880
ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940
catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000
cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060
agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120
ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180
gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240
agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300
caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360
caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420
cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480
cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540
gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600
aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660
catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720
aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780
cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840
gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900
attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960
caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020
gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080
atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140
gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200
gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260
gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320
ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380
tcaattaata aaaaatggaa agaacctcga g 4411
<210> 62
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 62
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gcgaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaccgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 105
<210> 63
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 63
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 93
<210> 64
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (97)..(99)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage
<400> 64
ccaguccagc gaggcaaagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 65
<211> 3312
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 65
atggcagcat tcaagccgaa ctcgatcaac tacatcctgg gactggacat cggaatcgca 60
tcggtcggat gggcaatggt cgaaatcgac gaagaagaaa acccgatcag actgatcgac 120
ctgggagtca gagtcttcga aagagcagaa gtcccgaaga caggagactc gctggcaatg 180
gcaagaagac tggcaagatc ggtcagaaga ctgacaagaa gaagagcaca cagactgctg 240
agaacaagaa gactgctgaa gagagaagga gtcctgcagg cagcaaactt cgacgaaaac 300
ggactgatca agtcgctgcc gaacacaccg tggcagctga gagcagcagc actggacaga 360
aagctgacac cgctggaatg gtcggcagtc ctgctgcacc tgatcaagca cagaggatac 420
ctgtcgcaga gaaagaacga aggagaaaca gcagacaagg aactgggagc actgctgaag 480
ggagtcgcag gaaacgcaca cgcactgcag acaggagact tcagaacacc ggcagaactg 540
gcactgaaca agttcgaaaa ggaatcggga cacatcagaa accagagatc ggactactcg 600
cacacattct cgagaaagga cctgcaggca gaactgatcc tgctgttcga aaagcagaag 660
gaattcggaa acccgcacgt ctcgggagga ctgaaggaag gaatcgaaac actgctgatg 720
acacagagac cggcactgtc gggagacgca gtccagaaga tgctgggaca ctgcacattc 780
gaaccggcag aaccgaaggc agcaaagaac acatacacag cagaaagatt catctggctg 840
acaaagctga acaacctgag aatcctggaa cagggatcgg aaagaccgct gacagacaca 900
gaaagagcaa cactgatgga cgaaccgtac agaaagtcga agctgacata cgcacaggca 960
agaaagctgc tgggactgga agacacagca ttcttcaagg gactgagata cggaaaggac 1020
aacgcagaag catcgacact gatggaaatg aaggcatacc acgcaatctc gagagcactg 1080
gaaaaggaag gactgaagga caagaagtcg ccgctgaacc tgtcgccgga actgcaggac 1140
gaaatcggaa cagcattctc gctgttcaag acagacgaag acatcacagg aagactgaag 1200
gacagaatcc agccggaaat cctggaagca ctgctgaagc acatctcgtt cgacaagttc 1260
gtccagatct cgctgaaggc actgagaaga atcgtcccgc tgatggaaca gggaaagaga 1320
tacgacgaag catgcgcaga aatctacgga gaccactacg gaaagaagaa cacagaagaa 1380
aagatctacc tgccgccgat cccggcagac gaaatcagaa acccggtcgt cctgagagca 1440
ctgtcgcagg caagaaaggt catcaacgga gtcgtcagaa gatacggatc gccggcaaga 1500
atccacatcg aaacagcaag agaagtcgga aagtcgttca aggacagaaa ggaaatcgaa 1560
aagagacagg aagaaaacag aaaggacaga gaaaaggcag cagcaaagtt cagagaatac 1620
ttcccgaact tcgtcggaga accgaagtcg aaggacatcc tgaagctgag actgtacgaa 1680
cagcagcacg gaaagtgcct gtactcggga aaggaaatca acctgggaag actgaacgaa 1740
aagggatacg tcgaaatcga ccacgcactg ccgttctcga gaacatggga cgactcgttc 1800
aacaacaagg tcctggtcct gggatcggaa aaccagaaca agggaaacca gacaccgtac 1860
gaatacttca acggaaagga caactcgaga gaatggcagg aattcaaggc aagagtcgaa 1920
acatcgagat tcccgagatc gaagaagcag agaatcctgc tgcagaagtt cgacgaagac 1980
ggattcaagg aaagaaacct gaacgacaca agatacgtca acagattcct gtgccagttc 2040
gtcgcagaca gaatgagact gacaggaaag ggaaagaaga gagtcttcgc atcgaacgga 2100
cagatcacaa acctgctgag aggattctgg ggactgagaa aggtcagagc agaaaacgac 2160
agacaccacg cactggacgc agtcgtcgtc gcatgctcga cagtcgcaat gcagcagaag 2220
atcacaagat tcgtcagata caaggaaatg aacgcattcg acggaaagac aatcgacaag 2280
gaaacaggag aagtcctgca ccagaagaca cacttcccgc agccgtggga attcttcgca 2340
caggaagtca tgatcagagt cttcggaaag ccggacggaa agccggaatt cgaagaagca 2400
gacacactgg aaaagctgag aacactgctg gcagaaaagc tgtcgtcgag accggaagca 2460
gtccacgaat acgtcacacc gctgttcgtc tcgagagcac cgaacagaaa gatgtcggga 2520
cagggacaca tggaaacagt caagtcggca aagagactgg acgaaggagt ctcggtcctg 2580
agagtcccgc tgacacagct gaagctgaag gacctggaaa agatggtcaa cagagaaaga 2640
gaaccgaagc tgtacgaagc actgaaggca agactggaag cacacaagga cgacccggca 2700
aaggcattcg cagaaccgtt ctacaagtac gacaaggcag gaaacagaac acagcaggtc 2760
aaggcagtca gagtcgaaca ggtccagaag acaggagtct gggtcagaaa ccacaacgga 2820
atcgcagaca acgcaacaat ggtcagagta gacgtcttcg aaaagggaga caagtactac 2880
ctggtcccga tctactcgtg gcaggtcgca aagggaatcc tgccggacag agcagtcgtc 2940
cagggaaagg acgaagaaga ctggcagctg atcgacgact cgttcaactt caagttctcg 3000
ctgcacccga acgacctggt cgaagtcatc acaaagaagg caagaatgtt cggatacttc 3060
gcatcgtgcc acagaggaac aggaaacatc aacatcagaa tccacgacct ggaccacaag 3120
atcggaaaga acggaatcct ggaaggaatc ggagtcaaga cagcactgtc gttccagaag 3180
taccagatcg acgaactggg aaaggaaatc agaccgtgca gactgaagaa gagaccgccg 3240
gtcagatccg gaaagagaac agcagacgga tcggaattcg aatcgccgaa gaagaagaga 3300
aaggtcgaat ga 3312
<210> 66
<211> 3306
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 66
gcagcattca agccgaactc gatcaactac atcctgggac tggacatcgg aatcgcatcg 60
gtcggatggg caatggtcga aatcgacgaa gaagaaaacc cgatcagact gatcgacctg 120
ggagtcagag tcttcgaaag agcagaagtc ccgaagacag gagactcgct ggcaatggca 180
agaagactgg caagatcggt cagaagactg acaagaagaa gagcacacag actgctgaga 240
acaagaagac tgctgaagag agaaggagtc ctgcaggcag caaacttcga cgaaaacgga 300
ctgatcaagt cgctgccgaa cacaccgtgg cagctgagag cagcagcact ggacagaaag 360
ctgacaccgc tggaatggtc ggcagtcctg ctgcacctga tcaagcacag aggatacctg 420
tcgcagagaa agaacgaagg agaaacagca gacaaggaac tgggagcact gctgaaggga 480
gtcgcaggaa acgcacacgc actgcagaca ggagacttca gaacaccggc agaactggca 540
ctgaacaagt tcgaaaagga atcgggacac atcagaaacc agagatcgga ctactcgcac 600
acattctcga gaaaggacct gcaggcagaa ctgatcctgc tgttcgaaaa gcagaaggaa 660
ttcggaaacc cgcacgtctc gggaggactg aaggaaggaa tcgaaacact gctgatgaca 720
cagagaccgg cactgtcggg agacgcagtc cagaagatgc tgggacactg cacattcgaa 780
ccggcagaac cgaaggcagc aaagaacaca tacacagcag aaagattcat ctggctgaca 840
aagctgaaca acctgagaat cctggaacag ggatcggaaa gaccgctgac agacacagaa 900
agagcaacac tgatggacga accgtacaga aagtcgaagc tgacatacgc acaggcaaga 960
aagctgctgg gactggaaga cacagcattc ttcaagggac tgagatacgg aaaggacaac 1020
gcagaagcat cgacactgat ggaaatgaag gcataccacg caatctcgag agcactggaa 1080
aaggaaggac tgaaggacaa gaagtcgccg ctgaacctgt cgccggaact gcaggacgaa 1140
atcggaacag cattctcgct gttcaagaca gacgaagaca tcacaggaag actgaaggac 1200
agaatccagc cggaaatcct ggaagcactg ctgaagcaca tctcgttcga caagttcgtc 1260
cagatctcgc tgaaggcact gagaagaatc gtcccgctga tggaacaggg aaagagatac 1320
gacgaagcat gcgcagaaat ctacggagac cactacggaa agaagaacac agaagaaaag 1380
atctacctgc cgccgatccc ggcagacgaa atcagaaacc cggtcgtcct gagagcactg 1440
tcgcaggcaa gaaaggtcat caacggagtc gtcagaagat acggatcgcc ggcaagaatc 1500
cacatcgaaa cagcaagaga agtcggaaag tcgttcaagg acagaaagga aatcgaaaag 1560
agacaggaag aaaacagaaa ggacagagaa aaggcagcag caaagttcag agaatacttc 1620
ccgaacttcg tcggagaacc gaagtcgaag gacatcctga agctgagact gtacgaacag 1680
cagcacggaa agtgcctgta ctcgggaaag gaaatcaacc tgggaagact gaacgaaaag 1740
ggatacgtcg aaatcgacca cgcactgccg ttctcgagaa catgggacga ctcgttcaac 1800
aacaaggtcc tggtcctggg atcggaaaac cagaacaagg gaaaccagac accgtacgaa 1860
tacttcaacg gaaaggacaa ctcgagagaa tggcaggaat tcaaggcaag agtcgaaaca 1920
tcgagattcc cgagatcgaa gaagcagaga atcctgctgc agaagttcga cgaagacgga 1980
ttcaaggaaa gaaacctgaa cgacacaaga tacgtcaaca gattcctgtg ccagttcgtc 2040
gcagacagaa tgagactgac aggaaaggga aagaagagag tcttcgcatc gaacggacag 2100
atcacaaacc tgctgagagg attctgggga ctgagaaagg tcagagcaga aaacgacaga 2160
caccacgcac tggacgcagt cgtcgtcgca tgctcgacag tcgcaatgca gcagaagatc 2220
acaagattcg tcagatacaa ggaaatgaac gcattcgacg gaaagacaat cgacaaggaa 2280
acaggagaag tcctgcacca gaagacacac ttcccgcagc cgtgggaatt cttcgcacag 2340
gaagtcatga tcagagtctt cggaaagccg gacggaaagc cggaattcga agaagcagac 2400
acactggaaa agctgagaac actgctggca gaaaagctgt cgtcgagacc ggaagcagtc 2460
cacgaatacg tcacaccgct gttcgtctcg agagcaccga acagaaagat gtcgggacag 2520
ggacacatgg aaacagtcaa gtcggcaaag agactggacg aaggagtctc ggtcctgaga 2580
gtcccgctga cacagctgaa gctgaaggac ctggaaaaga tggtcaacag agaaagagaa 2640
ccgaagctgt acgaagcact gaaggcaaga ctggaagcac acaaggacga cccggcaaag 2700
gcattcgcag aaccgttcta caagtacgac aaggcaggaa acagaacaca gcaggtcaag 2760
gcagtcagag tcgaacaggt ccagaagaca ggagtctggg tcagaaacca caacggaatc 2820
gcagacaacg caacaatggt cagagtagac gtcttcgaaa agggagacaa gtactacctg 2880
gtcccgatct actcgtggca ggtcgcaaag ggaatcctgc cggacagagc agtcgtccag 2940
ggaaaggacg aagaagactg gcagctgatc gacgactcgt tcaacttcaa gttctcgctg 3000
cacccgaacg acctggtcga agtcatcaca aagaaggcaa gaatgttcgg atacttcgca 3060
tcgtgccaca gaggaacagg aaacatcaac atcagaatcc acgacctgga ccacaagatc 3120
ggaaagaacg gaatcctgga aggaatcgga gtcaagacag cactgtcgtt ccagaagtac 3180
cagatcgacg aactgggaaa ggaaatcaga ccgtgcagac tgaagaagag accgccggtc 3240
agatccggaa agagaacagc agacggatcg gaattcgaat cgccgaagaa gaagagaaag 3300
gtcgaa 3306
<210> 67
<211> 3636
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 67
gggagaccca agctggctag cgtttaaact taagcttgga tccgccacca tggcagcatt 60
caagccgaac tcgatcaact acatcctggg actggacatc ggaatcgcat cggtcggatg 120
ggcaatggtc gaaatcgacg aagaagaaaa cccgatcaga ctgatcgacc tgggagtcag 180
agtcttcgaa agagcagaag tcccgaagac aggagactcg ctggcaatgg caagaagact 240
ggcaagatcg gtcagaagac tgacaagaag aagagcacac agactgctga gaacaagaag 300
actgctgaag agagaaggag tcctgcaggc agcaaacttc gacgaaaacg gactgatcaa 360
gtcgctgccg aacacaccgt ggcagctgag agcagcagca ctggacagaa agctgacacc 420
gctggaatgg tcggcagtcc tgctgcacct gatcaagcac agaggatacc tgtcgcagag 480
aaagaacgaa ggagaaacag cagacaagga actgggagca ctgctgaagg gagtcgcagg 540
aaacgcacac gcactgcaga caggagactt cagaacaccg gcagaactgg cactgaacaa 600
gttcgaaaag gaatcgggac acatcagaaa ccagagatcg gactactcgc acacattctc 660
gagaaaggac ctgcaggcag aactgatcct gctgttcgaa aagcagaagg aattcggaaa 720
cccgcacgtc tcgggaggac tgaaggaagg aatcgaaaca ctgctgatga cacagagacc 780
ggcactgtcg ggagacgcag tccagaagat gctgggacac tgcacattcg aaccggcaga 840
accgaaggca gcaaagaaca catacacagc agaaagattc atctggctga caaagctgaa 900
caacctgaga atcctggaac agggatcgga aagaccgctg acagacacag aaagagcaac 960
actgatggac gaaccgtaca gaaagtcgaa gctgacatac gcacaggcaa gaaagctgct 1020
gggactggaa gacacagcat tcttcaaggg actgagatac ggaaaggaca acgcagaagc 1080
atcgacactg atggaaatga aggcatacca cgcaatctcg agagcactgg aaaaggaagg 1140
actgaaggac aagaagtcgc cgctgaacct gtcgccggaa ctgcaggacg aaatcggaac 1200
agcattctcg ctgttcaaga cagacgaaga catcacagga agactgaagg acagaatcca 1260
gccggaaatc ctggaagcac tgctgaagca catctcgttc gacaagttcg tccagatctc 1320
gctgaaggca ctgagaagaa tcgtcccgct gatggaacag ggaaagagat acgacgaagc 1380
atgcgcagaa atctacggag accactacgg aaagaagaac acagaagaaa agatctacct 1440
gccgccgatc ccggcagacg aaatcagaaa cccggtcgtc ctgagagcac tgtcgcaggc 1500
aagaaaggtc atcaacggag tcgtcagaag atacggatcg ccggcaagaa tccacatcga 1560
aacagcaaga gaagtcggaa agtcgttcaa ggacagaaag gaaatcgaaa agagacagga 1620
agaaaacaga aaggacagag aaaaggcagc agcaaagttc agagaatact tcccgaactt 1680
cgtcggagaa ccgaagtcga aggacatcct gaagctgaga ctgtacgaac agcagcacgg 1740
aaagtgcctg tactcgggaa aggaaatcaa cctgggaaga ctgaacgaaa agggatacgt 1800
cgaaatcgac cacgcactgc cgttctcgag aacatgggac gactcgttca acaacaaggt 1860
cctggtcctg ggatcggaaa accagaacaa gggaaaccag acaccgtacg aatacttcaa 1920
cggaaaggac aactcgagag aatggcagga attcaaggca agagtcgaaa catcgagatt 1980
cccgagatcg aagaagcaga gaatcctgct gcagaagttc gacgaagacg gattcaagga 2040
aagaaacctg aacgacacaa gatacgtcaa cagattcctg tgccagttcg tcgcagacag 2100
aatgagactg acaggaaagg gaaagaagag agtcttcgca tcgaacggac agatcacaaa 2160
cctgctgaga ggattctggg gactgagaaa ggtcagagca gaaaacgaca gacaccacgc 2220
actggacgca gtcgtcgtcg catgctcgac agtcgcaatg cagcagaaga tcacaagatt 2280
cgtcagatac aaggaaatga acgcattcga cggaaagaca atcgacaagg aaacaggaga 2340
agtcctgcac cagaagacac acttcccgca gccgtgggaa ttcttcgcac aggaagtcat 2400
gatcagagtc ttcggaaagc cggacggaaa gccggaattc gaagaagcag acacactgga 2460
aaagctgaga acactgctgg cagaaaagct gtcgtcgaga ccggaagcag tccacgaata 2520
cgtcacaccg ctgttcgtct cgagagcacc gaacagaaag atgtcgggac agggacacat 2580
ggaaacagtc aagtcggcaa agagactgga cgaaggagtc tcggtcctga gagtcccgct 2640
gacacagctg aagctgaagg acctggaaaa gatggtcaac agagaaagag aaccgaagct 2700
gtacgaagca ctgaaggcaa gactggaagc acacaaggac gacccggcaa aggcattcgc 2760
agaaccgttc tacaagtacg acaaggcagg aaacagaaca cagcaggtca aggcagtcag 2820
agtcgaacag gtccagaaga caggagtctg ggtcagaaac cacaacggaa tcgcagacaa 2880
cgcaacaatg gtcagagtag acgtcttcga aaagggagac aagtactacc tggtcccgat 2940
ctactcgtgg caggtcgcaa agggaatcct gccggacaga gcagtcgtcc agggaaagga 3000
cgaagaagac tggcagctga tcgacgactc gttcaacttc aagttctcgc tgcacccgaa 3060
cgacctggtc gaagtcatca caaagaaggc aagaatgttc ggatacttcg catcgtgcca 3120
cagaggaaca ggaaacatca acatcagaat ccacgacctg gaccacaaga tcggaaagaa 3180
cggaatcctg gaaggaatcg gagtcaagac agcactgtcg ttccagaagt accagatcga 3240
cgaactggga aaggaaatca gaccgtgcag actgaagaag agaccgccgg tcagatccgg 3300
aaagagaaca gcagacggat cggaattcga atcgccgaag aagaagagaa aggtcgaatg 3360
atagctagct cgagtctaga gggcccgttt aaacccgctg atcagcctcg actgtgcctt 3420
ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 3480
ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 3540
gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3600
atagcaggca tgctggggat gcggtgggct ctatgg 3636
<210> 68
<211> 1103
<212> PRT
<213> Neisseria meningitidis
<400> 68
Met Ala Ala Phe Lys Pro Asn Ser Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu
20 25 30
Glu Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Thr Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asn
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Gly Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Ser Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Leu Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg Ser
1070 1075 1080
Gly Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys
1085 1090 1095
Lys Arg Lys Val Glu
1100
<210> 69
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified
<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage
<400> 69
gccgagucug gagagcugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 70
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified
<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage
<400> 70
acacaaauac caguccagcg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 71
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified
<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage
<400> 71
aaaguucuag augccguccg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 72
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified
<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified
<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage
<400> 72
acgcaaauau caguccagcg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 73
<211> 7
<212> PRT
<213> Simian virus 40
<400> 73
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 74
<211> 7
<212> PRT
<213> Simian virus 40
<400> 74
Pro Lys Lys Lys Arg Arg Val
1 5
<210> 75
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Nucleoplasmin bipartite NLS sequence"
<400> 75
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 76
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
6xHis tag"
<400> 76
His His His His His His
1 5
<210> 77
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
8xHis tag"
<400> 77
His His His His His His His His
1 5
<210> 78
<211> 10
<212> RNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Kozak sequence"
<400> 78
gccrccaugg 10
<210> 79
<211> 13
<212> RNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Kozak sequence"
<400> 79
gccgccrcca ugg 13
<210> 80
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 80
cactctttcc ctacacgacg ctcttccgat ctgttttgtt ccagagtcta tcaccg 56
<210> 81
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 81
ggagttcaga cgtgtgctct tccgatctac acgaataaga gcaaatggga ac 52
<210> 82
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 82
cactctttcc ctacacgacg ctcttccgat cttgcatttc atgagaccga aaaca 55
<210> 83
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 83
ggagttcaga cgtgtgctct tccgatctgc tacagtagag ctgtacataa aactt 55
<210> 84
<211> 3783
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 84
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ctaatacgac tcactatagg 420
gtcccgcagt cggcgtccag cggctctgct tgttcgtgtg tgtgtcgttg caggccttat 480
tcggatccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 540
agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 600
ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 660
ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc 720
acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 780
ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 840
acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 900
tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc 960
agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc 1020
agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1080
acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc 1140
acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1200
acaagtaata ggaattatgc agtctagcca tcacatttaa aagcatctca gcctaccatg 1260
agaataagag aaagaaaatg aagatcaata gcttattcat ctctttttct ttttcgttgg 1320
tgtaaagcca acaccctgtc taaaaaacat aaatttcttt aatcattttg cctcttttct 1380
ctgtgcttca attaataaaa aatggaaaga acctcgagaa aaaaaaaaaa aaaaaaaaaa 1440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1500
aaaaaaaaaa aaaaaaaatc tagacttaag cttgatgagc tctagcttgg cgtaatcatg 1560
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 1620
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 1680
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 1740
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 1800
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 1860
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 1920
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1980
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 2040
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 2100
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 2160
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 2220
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 2280
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 2340
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 2400
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 2460
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 2520
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2580
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2640
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2700
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2760
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2820
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 2880
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2940
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 3000
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 3060
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 3120
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 3180
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 3240
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 3300
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 3360
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 3420
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 3480
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3540
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3600
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3660
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 3720
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 3780
tcg 3783
Claims (75)
- 다음을 포함하는 지질 나노입자("LNP") 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 50-60 mol-% 아민 지질;
약 8-10 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 6임. - 다음을 포함하는 LNP 조성물:
RNA 성분;
약 50-60 mol-% 아민 지질;
약 27-39.5 mol-% 헬퍼 지질;
약 8-10 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 LNP 조성물의 N/P 비율은 약 5-7임. - 제2항에 있어서, N/P 비율은 약 6인 LNP 조성물.
- 다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 50-60 mol-% 아민 지질;
약 5-15 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10임. - 다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 40-60 mol-% 아민 지질;
약 5-15 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 6임. - 다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 50-60 mol-% 아민 지질;
약 5-15 mol-% 중성 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 6임. - 다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 40-60 mol-% 아민 지질;
약 0-10 mol-% 중성 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10임. - 다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 40-60 mol-% 아민 지질;
약 1 mol-% 미만의 중성 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10임. - 다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 40-60 mol-% 아민 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10이고,
여기서 LNP 조성물에는 중성 인지질이 본질적으로 없거나 없음. - 다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 50-60 mol-% 아민 지질;
약 8-10 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-7임. - 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 mRNA를 포함하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 RNA-유도 DNA-결합제, 예컨대 Cas 뉴클레이스 mRNA를 포함하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 클래스 2 Cas 뉴클레이스 mRNA를 포함하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 Cas9 뉴클레이스 mRNA를 포함하는 조성물.
- 제11항 내지 제14항 중 어느 한 항에 있어서, mRNA는 변형된 mRNA인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 RNA-유도 DNA-결합제를 인코딩하는 오픈 리딩 프레임을 포함하는 RNA를 포함하고, 여기서 오픈 리딩 프레임은 최소 우리딘 함량 내지 최소 우리딘 함량의 150% 범위의 우리딘 함량을 갖는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 RNA-유도 DNA-결합제를 인코딩하는 오픈 리딩 프레임을 포함하는 mRNA를 포함하고, 여기서 오픈 리딩 프레임은 최소 우리딘 디뉴클레오타이드 함량 내지 최소 우리딘 디뉴클레오타이드 함량의 150% 범위의 우리딘 디뉴클레오타이드 함량을 갖는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90% 동일성을 갖는 서열을 포함하는 mRNA를 포함하고, 여기서 mRNA는 RNA-유도 DNA-결합제를 인코딩하는 오픈 리딩 프레임을 포함하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 gRNA 핵산을 포함하는 조성물.
- 제19항에 있어서, gRNA 핵산은 gRNA인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 클래스 2 Cas 뉴클레이스 mRNA 및 gRNA를 포함하는 조성물.
- 제19항 내지 제21항 중 어느 한 항에 있어서, gRNA 핵산은 이중-가이드 RNA(dgRNA)이거나 이를 인코딩하는 조성물.
- 제19항 내지 제21항 중 어느 한 항에 있어서, gRNA 핵산은 sgRNA이거나 이를 인코딩하는 조성물.
- 제19항 내지 제23항 중 어느 한 항에 있어서, gRNA는 변형된 조성물.
- 제24항에 있어서, gRNA는 2'-O-메틸(2'-O-Me) 변형된 뉴클레오타이드, 뉴클레오타이드 사이의 포스포로티오에이트(PS) 결합; 및 2'-플루오로(2'-F) 변형된 뉴클레오타이드로부터 선택된 변형을 포함하는 조성물.
- 제24항 내지 제25항 중 어느 한 항에 있어서, gRNA는 5' 말단에서 최초 다섯 개의 뉴클레오타이드 중 하나 이상에서 변형을 포함하는 조성물.
- 제24항 내지 제26항 중 어느 한 항에 있어서, gRNA는 3' 말단에서 최종 다섯 개의 뉴클레오타이드 중 하나 이상에서 변형을 포함하는 조성물.
- 제24항 내지 제27항 중 어느 한 항에 있어서, gRNA는 최초 네 개의 뉴클레오타이드 사이의 PS 결합을 포함하는 조성물.
- 제24항 내지 제28항 중 어느 한 항에 있어서, gRNA는 최종 네 개의 뉴클레오타이드 사이의 PS 결합을 포함하는 조성물.
- 제24항 내지 제29항 중 어느 한 항에 있어서, 5' 말단에서 최초 세 개의 뉴클레오타이드에서 2'-O-Me 변형된 뉴클레오타이드를 추가로 포함하는 조성물.
- 제24항 내지 제30항 중 어느 한 항에 있어서, 3' 말단에서 최종 세 개의 뉴클레오타이드에서 2'-O-Me 변형된 뉴클레오타이드를 추가로 포함하는 조성물.
- 제19항 내지 제31항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 10:1 내지 약 1:10 범위의 비율로 존재하는 조성물.
- 제19항 내지 제31항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 5:1 내지 약 1:5 범위의 비율로 존재하는 조성물.
- 제19항 내지 제33항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 3:1 내지 약 1:1 범위의 비율로 존재하는 조성물.
- 제19항 내지 제34항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 2:1 내지 약 1:1 범위의 비율로 존재하는 조성물.
- 제19항 내지 제35항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 2:1의 비율로 존재하는 조성물.
- 제19항 내지 제35항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 1:1의 비율로 존재하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, 적어도 하나의 주형을 추가로 포함하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, mol-% PEG 지질은 약 3인 조성물
- 전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 약 50인 조성물
- 전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 약 55 조성물
- 전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 ± 3 mol-%인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 ± 2 mol-%인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 47-53 mol-%인 조성물
- 전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 48-53 mol-%인 조성물
- 전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 53-57 mol-%인 조성물
- 전술한 청구항 중 어느 한 항에 있어서, N/P 비율은 6 ± 1인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, N/P 비율은 6 ± 0.5인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, 아민 지질은 지질 A인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, 아민 지질은 지질 A의 유사체인 조성물.
- 제50항에 있어서, 유사체는 아세탈 유사체인 조성물.
- 제51항에 있어서, 아세탈 유사체는 C4-C12 아세탈 유사체인 조성물.
- 제50항에 있어서, 아세탈 유사체는 C5-C12 아세탈 유사체인 조성물.
- 제50항에 있어서, 아세탈 유사체는 C5-C10 아세탈 유사체인 조성물.
- 제50항에 있어서, 아세탈 유사체는 C4, C5, C6, C7, C9, C10, C11, 및 C12 유사체로부터 선택되는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, 헬퍼 지질은 콜레스테롤인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, 중성 지질은 DSPC인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, 중성 지질은 DPPC인 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, PEG 지질은 디미리스토일글리세롤(DMG)을 포함하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, PEG 지질은 PEG-2k를 포함하는 조성물.
- 전술한 청구항 중 어느 한 항에 있어서, PEG 지질은 PEG-DMG인 조성물.
- 제61항에 있어서, PEG-DMG는 PEG2k-DMG인 조성물.
- 제9항에 있어서, LNP 조성물에는 중성 지질이 본질적으로 없는 조성물.
- 제63항에 있어서, 중성 지질은 인지질인 조성물.
- 세포를 제12항 내지 제64항 중 어느 한 항의 LNP 조성물과 접촉시키는 것을 포함하는 유전자 편집 방법.
- 클래스 2 Cas 뉴클레이스 mRNA 및 가이드 RNA 핵산을 세포에 전달하는 것을 포함하고, 여기서 클래스 2 Cas mRNA 및 가이드 RNA 핵산은 제13항 내지 제64항 중 어느 한 항의 적어도 하나의 LNP 조성물로서 제제화되는 유전자 편집 방법.
- 세포를 제12항 내지 제64항 중 어느 한 항의 적어도 하나의 LNP 조성물과 접촉시키는 것을 포함하는 유전자 조작된 세포 제조 방법.
- 제65항 내지 제67항 중 어느 한 항에 있어서, LNP 조성물은 적어도 2 회 투여되는 방법.
- 제68항에 있어서, LNP 조성물은 2-5 회 투여되는 방법.
- 제68항 또는 제69항에 있어서, 편집은 재투여 시 개선되는 방법.
- 제65항 내지 제70항 중 어느 한 항에 있어서, 적어도 하나의 주형 핵산을 세포에 도입하는 것을 추가로 포함하는 방법.
- 제65항 내지 제71항 중 어느 한 항에 있어서, mRNA은 제1 LNP 조성물로 제제화되고 가이드 RNA 핵산은 제2 LNP 조성물로 제제화되는 방법.
- 제72항에 있어서, 제1 및 제2 LNP 조성물은 동시에 투여되는 방법.
- 제72항에 있어서, 제1 및 제2 LNP 조성물은 연속적으로 투여되는 방법.
- 제65항 내지 제73항 중 어느 한 항에 있어서, mRNA 및 가이드 RNA 핵산은 단일 LNP 조성물로 제제화되는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762566240P | 2017-09-29 | 2017-09-29 | |
US62/566,240 | 2017-09-29 | ||
PCT/US2018/053559 WO2019067992A1 (en) | 2017-09-29 | 2018-09-28 | Formulations |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200079497A true KR20200079497A (ko) | 2020-07-03 |
Family
ID=64267891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207012309A KR20200079497A (ko) | 2017-09-29 | 2018-09-28 | 제제 |
Country Status (21)
Country | Link |
---|---|
US (1) | US20230140670A1 (ko) |
EP (2) | EP3688162B1 (ko) |
JP (2) | JP7284179B2 (ko) |
KR (1) | KR20200079497A (ko) |
CN (1) | CN111406108A (ko) |
AR (1) | AR113031A1 (ko) |
AU (1) | AU2018338915A1 (ko) |
BR (1) | BR112020006300A2 (ko) |
CA (1) | CA3077413A1 (ko) |
DK (1) | DK3688162T3 (ko) |
EA (1) | EA202090868A1 (ko) |
FI (1) | FI3688162T3 (ko) |
IL (1) | IL273541A (ko) |
LT (1) | LT3688162T (ko) |
MX (1) | MX2020007148A (ko) |
PL (1) | PL3688162T3 (ko) |
PT (1) | PT3688162T (ko) |
RS (1) | RS65493B1 (ko) |
SG (1) | SG11202002653UA (ko) |
TW (1) | TWI833708B (ko) |
WO (1) | WO2019067992A1 (ko) |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020198697A1 (en) | 2019-03-28 | 2020-10-01 | Intellia Therapeutics, Inc. | Compositions and methods comprising a ttr guide rna and a polynucleotide encoding an rna-guided dna binding agent |
KR20220004984A (ko) | 2019-03-28 | 2022-01-12 | 인텔리아 테라퓨틱스, 인크. | Ttr 유전자 편집을 위한 조성물 및 방법 및 코르티코스테로이드를 포함하는 attr 아밀로이드증의 치료 또는 그의 용도 |
JP2022542839A (ja) | 2019-07-19 | 2022-10-07 | フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー | リコンビナーゼ組成物及び使用方法 |
CN115176001A (zh) * | 2019-12-11 | 2022-10-11 | 因特利亚治疗公司 | 用于基因编辑的修饰的引导rna |
WO2021222287A2 (en) | 2020-04-28 | 2021-11-04 | Intellia Therapeutics, Inc. | Methods of in vitro cell delivery |
EP4153224A1 (en) | 2020-05-20 | 2023-03-29 | Flagship Pioneering Innovations VI, LLC | Coronavirus antigen compositions and their uses |
TW202208629A (zh) | 2020-05-20 | 2022-03-01 | 美商旗艦先鋒創新有限責任公司 | 免疫原性組成物及其用途 |
CA3180101A1 (en) | 2020-05-29 | 2021-12-02 | Flagship Pioneering Innovations Vi, Llc | Trem compositions and methods relating thereto |
EP4158032A2 (en) | 2020-05-29 | 2023-04-05 | Flagship Pioneering Innovations VI, LLC | Trem compositions and methods relating thereto |
MX2023002439A (es) | 2020-09-03 | 2023-05-09 | Flagship Pioneering Innovations Vi Llc | Composiciones immunogénicas y usos de las mismas. |
KR20230124927A (ko) | 2020-11-25 | 2023-08-28 | 아카제라 메디신즈, 인크. | 핵산 전달을 위한 지질 나노입자, 및 관련 사용 방법 |
AU2021396403A1 (en) | 2020-12-11 | 2023-06-29 | Intellia Therapeutics, Inc. | Compositions and methods for reducing mhc class ii in a cell |
IL303506A (en) | 2020-12-11 | 2023-08-01 | Intellia Therapeutics Inc | Polynucleotides, compounds and methods for genome editing involving deamination |
EP4267732A1 (en) | 2020-12-23 | 2023-11-01 | Flagship Pioneering Innovations VI, LLC | Compositions of modified trems and uses thereof |
CA3205042A1 (en) | 2020-12-23 | 2022-06-30 | Intellia Therapeutics, Inc. | Compositions and methods for genetically modifying ciita in a cell |
WO2022140586A2 (en) | 2020-12-23 | 2022-06-30 | Intellia Therapeutics, Inc. | Compositions and methods for reducing hla-a in a cell |
CN116848235A (zh) | 2020-12-30 | 2023-10-03 | 因特利亚治疗公司 | 工程化t细胞 |
EP4313109A1 (en) | 2021-03-31 | 2024-02-07 | Flagship Pioneering Innovations V, Inc. | Thanotransmission polypeptides and their use in treating cancer |
KR20240017791A (ko) | 2021-04-17 | 2024-02-08 | 인텔리아 테라퓨틱스, 인크. | Dna-의존적 단백질 키나제의 억제제 및 이의 조성물 및 용도 |
KR20240032013A (ko) | 2021-06-10 | 2024-03-08 | 인텔리아 테라퓨틱스, 인크. | 유전자 편집을 위한 내부 링커를 포함하는 변형된 가이드 rna |
AU2022296523A1 (en) | 2021-06-22 | 2023-12-21 | Intellia Therapeutics, Inc. | Methods for in vivo editing of a liver gene |
EP4377457A1 (en) | 2021-07-26 | 2024-06-05 | Flagship Pioneering Innovations VI, LLC | Trem compositions and uses thereof |
AR127073A1 (es) | 2021-09-17 | 2023-12-13 | Flagship Pioneering Innovations Vi Llc | Composiciones y métodos para producir polirribonucleótidos circulares |
TW202322826A (zh) | 2021-10-18 | 2023-06-16 | 美商旗艦先鋒創新有限責任公司 | 用於純化多核糖核苷酸之組成物及方法 |
WO2023077053A2 (en) | 2021-10-28 | 2023-05-04 | Regeneron Pharmaceuticals, Inc. | Crispr/cas-related methods and compositions for knocking out c5 |
AU2022382975A1 (en) | 2021-11-03 | 2024-05-02 | Intellia Therapeutics, Inc. | Polynucleotides, compositions, and methods for genome editing |
AU2022398478A1 (en) | 2021-11-24 | 2024-06-13 | Flagship Pioneering Innovations Vi, Llc | Coronavirus immunogen compositions and their uses |
CA3238735A1 (en) | 2021-11-24 | 2023-06-01 | Jennifer A. Nelson | Immunogenic compositions and their uses |
AU2022397292A1 (en) | 2021-11-24 | 2024-05-30 | Flagship Pioneering Innovations Vi, Llc | Varicella-zoster virus immunogen compositions and their uses |
WO2023102550A2 (en) | 2021-12-03 | 2023-06-08 | The Broad Institute, Inc. | Compositions and methods for efficient in vivo delivery |
TW202340461A (zh) | 2021-12-22 | 2023-10-16 | 美商旗艦先鋒創新有限責任公司 | 用於純化多核糖核苷酸之組成物和方法 |
TW202342064A (zh) | 2021-12-23 | 2023-11-01 | 美商旗艦先鋒創新有限責任公司 | 編碼抗融合多肽之環狀多核糖核苷酸 |
WO2023150620A1 (en) | 2022-02-02 | 2023-08-10 | Regeneron Pharmaceuticals, Inc. | Crispr-mediated transgene insertion in neonatal cells |
US11951177B2 (en) | 2022-03-23 | 2024-04-09 | Nanovation Therapeutics Inc. | High sterol-containing lipid nanoparticles |
WO2023185697A2 (en) | 2022-03-29 | 2023-10-05 | Accuredit Therapeutics (Suzhou) Co., Ltd. | Compositions and methods for treatment of transthyretin amyloidosis |
WO2023184038A1 (en) | 2022-04-01 | 2023-10-05 | Nanovation Therapeutics Inc. | Mrna delivery method and composition thereof |
WO2023196634A2 (en) | 2022-04-08 | 2023-10-12 | Flagship Pioneering Innovations Vii, Llc | Vaccines and related methods |
WO2023205148A1 (en) | 2022-04-19 | 2023-10-26 | Intellia Therapeutics, Inc. | Chimeric antigen receptor compositions and uses |
WO2023212677A2 (en) | 2022-04-29 | 2023-11-02 | Regeneron Pharmaceuticals, Inc. | Identification of tissue-specific extragenic safe harbors for gene therapy approaches |
WO2023220603A1 (en) | 2022-05-09 | 2023-11-16 | Regeneron Pharmaceuticals, Inc. | Vectors and methods for in vivo antibody production |
WO2023220083A1 (en) | 2022-05-09 | 2023-11-16 | Flagship Pioneering Innovations Vi, Llc | Trem compositions and methods of use for treating proliferative disorders |
WO2023220729A2 (en) | 2022-05-13 | 2023-11-16 | Flagship Pioneering Innovations Vii, Llc | Double stranded dna compositions and related methods |
WO2023235726A2 (en) | 2022-05-31 | 2023-12-07 | Regeneron Pharmaceuticals, Inc. | Crispr interference therapeutics for c9orf72 repeat expansion disease |
WO2023235725A2 (en) | 2022-05-31 | 2023-12-07 | Regeneron Pharmaceuticals, Inc. | Crispr-based therapeutics for c9orf72 repeat expansion disease |
TW202408595A (zh) | 2022-06-16 | 2024-03-01 | 美商英特利亞醫療公司 | 用於對細胞進行遺傳修飾之方法及組合物 |
WO2023250112A1 (en) | 2022-06-22 | 2023-12-28 | Flagship Pioneering Innovations Vi, Llc | Compositions of modified trems and uses thereof |
WO2024006955A1 (en) | 2022-06-29 | 2024-01-04 | Intellia Therapeutics, Inc. | Engineered t cells |
WO2024026474A1 (en) | 2022-07-29 | 2024-02-01 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle |
US20240042021A1 (en) | 2022-08-01 | 2024-02-08 | Flagship Pioneering Innovations Vii, Llc | Immunomodulatory proteins and related methods |
WO2024035952A1 (en) | 2022-08-12 | 2024-02-15 | Remix Therapeutics Inc. | Methods and compositions for modulating splicing at alternative splice sites |
WO2024061296A2 (en) | 2022-09-22 | 2024-03-28 | Accuredit Therapeutics (Suzhou) Co., Ltd. | Compositions and methods for treatment of hypercholesterolemia and/or cardiovascular disease |
WO2024077191A1 (en) | 2022-10-05 | 2024-04-11 | Flagship Pioneering Innovations V, Inc. | Nucleic acid molecules encoding trif and additionalpolypeptides and their use in treating cancer |
WO2024097664A1 (en) | 2022-10-31 | 2024-05-10 | Flagship Pioneering Innovations Vi, Llc | Compositions and methods for purifying polyribonucleotides |
US20240182561A1 (en) | 2022-11-04 | 2024-06-06 | Regeneron Pharmaceuticals, Inc. | Calcium voltage-gated channel auxiliary subunit gamma 1 (cacng1) binding proteins and cacng1-mediated delivery to skeletal muscle |
WO2024102799A1 (en) | 2022-11-08 | 2024-05-16 | Flagship Pioneering Innovations Vi, Llc | Compositions and methods for producing circular polyribonucleotides |
WO2024102434A1 (en) | 2022-11-10 | 2024-05-16 | Senda Biosciences, Inc. | Rna compositions comprising lipid nanoparticles or lipid reconstructed natural messenger packs |
WO2024107765A2 (en) | 2022-11-14 | 2024-05-23 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG10201407996PA (en) | 2009-12-23 | 2015-01-29 | Novartis Ag | Lipids, lipid compositions, and methods of using them |
US8691750B2 (en) * | 2011-05-17 | 2014-04-08 | Axolabs Gmbh | Lipids and compositions for intracellular delivery of biologically active compounds |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
KR20150095861A (ko) | 2012-12-17 | 2015-08-21 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | Rna-가이드된 인간 게놈 조작 |
ES2887254T3 (es) | 2013-03-08 | 2021-12-22 | Novartis Ag | Lípidos y composiciones lipídicas para el suministro de agentes activos |
CA2906732C (en) * | 2013-03-15 | 2023-08-08 | The University Of British Columbia | Lipid nanoparticles for transfection and related methods |
EP3971287A1 (en) * | 2013-07-11 | 2022-03-23 | ModernaTX, Inc. | Compositions comprising synthetic polynucleotides encoding crispr related proteins and synthetic sgrnas and methods of use |
US20150166982A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting pi3k point mutations |
BR112016013213A2 (pt) * | 2013-12-12 | 2017-12-05 | Massachusetts Inst Technology | administração, uso e aplicações terapêuticas dos sistemas crispr-cas e composições para visar distúrbios e doenças usando componentes de administração de partículas |
ES2774968T3 (es) * | 2013-12-19 | 2020-07-23 | Novartis Ag | Lípidos y composiciones lipídicas para la administración de agentes activos |
ES2949172T3 (es) | 2014-07-16 | 2023-09-26 | Novartis Ag | Método de encapsulamiento de un ácido nucleico en un hospedante de nanopartículas lipídicas |
CN107532161A (zh) | 2015-03-03 | 2018-01-02 | 通用医疗公司 | 具有改变的PAM特异性的工程化CRISPR‑Cas9核酸酶 |
AU2016237148A1 (en) | 2015-03-24 | 2017-11-23 | Kyowa Hakko Kirin Co., Ltd. | Nucleic acid-containing lipid nanoparticles |
US10626393B2 (en) | 2015-06-04 | 2020-04-21 | Arbutus Biopharma Corporation | Delivering CRISPR therapeutics with lipid nanoparticles |
WO2017049074A1 (en) * | 2015-09-18 | 2017-03-23 | Moderna Therapeutics, Inc. | Polynucleotide formulations for use in the treatment of renal diseases |
US11851653B2 (en) | 2015-12-01 | 2023-12-26 | Crispr Therapeutics Ag | Materials and methods for treatment of alpha-1 antitrypsin deficiency |
WO2017109757A1 (en) | 2015-12-23 | 2017-06-29 | Crispr Therapeutics Ag | Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration |
US20210206818A1 (en) | 2016-01-22 | 2021-07-08 | Modernatx, Inc. | Messenger ribonucleic acids for the production of intracellular binding polypeptides and methods of use thereof |
WO2017173054A1 (en) * | 2016-03-30 | 2017-10-05 | Intellia Therapeutics, Inc. | Lipid nanoparticle formulations for crispr/cas components |
KR102551664B1 (ko) * | 2016-12-22 | 2023-07-05 | 인텔리아 테라퓨틱스, 인크. | 알파-1 항트립신 결핍을 치료하기 위한 조성물 및 방법 |
-
2018
- 2018-09-28 TW TW107134481A patent/TWI833708B/zh active
- 2018-09-28 FI FIEP18800355.2T patent/FI3688162T3/fi active
- 2018-09-28 PL PL18800355.2T patent/PL3688162T3/pl unknown
- 2018-09-28 DK DK18800355.2T patent/DK3688162T3/da active
- 2018-09-28 AU AU2018338915A patent/AU2018338915A1/en active Pending
- 2018-09-28 SG SG11202002653UA patent/SG11202002653UA/en unknown
- 2018-09-28 EP EP18800355.2A patent/EP3688162B1/en active Active
- 2018-09-28 LT LTEPPCT/US2018/053559T patent/LT3688162T/lt unknown
- 2018-09-28 US US16/651,911 patent/US20230140670A1/en active Pending
- 2018-09-28 CA CA3077413A patent/CA3077413A1/en active Pending
- 2018-09-28 RS RS20240516A patent/RS65493B1/sr unknown
- 2018-09-28 WO PCT/US2018/053559 patent/WO2019067992A1/en active Application Filing
- 2018-09-28 AR ARP180102822A patent/AR113031A1/es unknown
- 2018-09-28 JP JP2020540244A patent/JP7284179B2/ja active Active
- 2018-09-28 EA EA202090868A patent/EA202090868A1/ru unknown
- 2018-09-28 EP EP24159518.0A patent/EP4385514A2/en active Pending
- 2018-09-28 PT PT188003552T patent/PT3688162T/pt unknown
- 2018-09-28 CN CN201880070589.9A patent/CN111406108A/zh active Pending
- 2018-09-28 BR BR112020006300-2A patent/BR112020006300A2/pt unknown
- 2018-09-28 MX MX2020007148A patent/MX2020007148A/es unknown
- 2018-09-28 KR KR1020207012309A patent/KR20200079497A/ko not_active Application Discontinuation
-
2020
- 2020-03-24 IL IL273541A patent/IL273541A/en unknown
-
2023
- 2023-05-18 JP JP2023082312A patent/JP2023103421A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
IL273541A (en) | 2020-05-31 |
WO2019067992A1 (en) | 2019-04-04 |
MX2020007148A (es) | 2020-10-08 |
JP2023103421A (ja) | 2023-07-26 |
BR112020006300A2 (pt) | 2020-10-20 |
EP3688162B1 (en) | 2024-03-06 |
EA202090868A1 (ru) | 2020-09-16 |
EP3688162A1 (en) | 2020-08-05 |
DK3688162T3 (da) | 2024-05-13 |
JP7284179B2 (ja) | 2023-05-30 |
EP4385514A2 (en) | 2024-06-19 |
CA3077413A1 (en) | 2019-04-04 |
PL3688162T3 (pl) | 2024-06-10 |
AR113031A1 (es) | 2020-01-15 |
AU2018338915A1 (en) | 2020-04-23 |
JP2020536125A (ja) | 2020-12-10 |
TW201924724A (zh) | 2019-07-01 |
FI3688162T3 (fi) | 2024-05-15 |
CN111406108A (zh) | 2020-07-10 |
SG11202002653UA (en) | 2020-04-29 |
PT3688162T (pt) | 2024-04-23 |
TWI833708B (zh) | 2024-03-01 |
US20230140670A1 (en) | 2023-05-04 |
LT3688162T (lt) | 2024-05-27 |
RS65493B1 (sr) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023103421A (ja) | 製剤 | |
KR20200058508A (ko) | 게놈 편집을 위한 폴리뉴클레오티드, 조성물 및 방법 | |
KR20220004648A (ko) | Ttr 가이드 rna, 및 rna-가이드 dna 결합제를 암호화하는 폴리뉴클레오티드를 포함하는 조성물 및 방법 | |
JP2024037904A (ja) | 脂質ナノ粒子を用いるインビトロでのmrnaの送達方法 | |
KR20200058509A (ko) | Attr 아밀로이드증의 ttr 유전자 편집 및 치료를 위한 조성물 및 방법 | |
KR20220004984A (ko) | Ttr 유전자 편집을 위한 조성물 및 방법 및 코르티코스테로이드를 포함하는 attr 아밀로이드증의 치료 또는 그의 용도 | |
CN109475646A (zh) | 用于crispr/cas成分的脂质纳米颗粒制剂 | |
US20230012687A1 (en) | Polynucleotides, Compositions, and Methods for Polypeptide Expression | |
KR20210027389A (ko) | 공여자 폴리뉴클레오티드의 삽입에 의한 게놈 편집을 위한 조성물 및 방법 | |
KR20230042005A (ko) | 반감기가 연장된 mrna 치료제를 포함하는 lnp 조성물 | |
CN116157514A (zh) | 新颖omni-59、61、67、76、79、80、81和82crispr核酸酶 | |
CN115515646A (zh) | 用于治疗代谢性肝病的组合物和方法 | |
TW202309034A (zh) | Dna依賴性蛋白質激酶抑制劑以及其組合物及用途 | |
TWI839337B (zh) | 用於基因組編輯之多核苷酸、組合物及方法 | |
CN117835968A (zh) | 脂质纳米颗粒组合物 | |
CN117479926A (zh) | 脂质纳米颗粒组合物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |