CN113518825A - Wiskott-aldrich综合征的造血干细胞基因疗法 - Google Patents
Wiskott-aldrich综合征的造血干细胞基因疗法 Download PDFInfo
- Publication number
- CN113518825A CN113518825A CN201980092125.2A CN201980092125A CN113518825A CN 113518825 A CN113518825 A CN 113518825A CN 201980092125 A CN201980092125 A CN 201980092125A CN 113518825 A CN113518825 A CN 113518825A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- acid sequence
- seq
- expression vector
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000006110 Wiskott-Aldrich syndrome Diseases 0.000 title claims abstract description 85
- 210000003958 hematopoietic stem cell Anatomy 0.000 title claims description 35
- 238000001415 gene therapy Methods 0.000 title description 12
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 638
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 548
- 239000013598 vector Substances 0.000 claims abstract description 232
- 239000013604 expression vector Substances 0.000 claims abstract description 226
- 108010093528 Wiskott Aldrich Syndrome protein Proteins 0.000 claims abstract description 162
- 102000001392 Wiskott Aldrich Syndrome protein Human genes 0.000 claims abstract description 156
- 230000007170 pathology Effects 0.000 claims abstract description 19
- 230000014509 gene expression Effects 0.000 claims description 414
- 102000040430 polynucleotide Human genes 0.000 claims description 302
- 108091033319 polynucleotide Proteins 0.000 claims description 302
- 239000002157 polynucleotide Substances 0.000 claims description 302
- 210000004027 cell Anatomy 0.000 claims description 238
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 185
- 239000004055 small Interfering RNA Substances 0.000 claims description 184
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 claims description 161
- 239000012212 insulator Substances 0.000 claims description 86
- 102000039446 nucleic acids Human genes 0.000 claims description 78
- 108020004707 nucleic acids Proteins 0.000 claims description 78
- 210000003995 blood forming stem cell Anatomy 0.000 claims description 76
- 238000000034 method Methods 0.000 claims description 66
- 238000011282 treatment Methods 0.000 claims description 39
- 238000011144 upstream manufacturing Methods 0.000 claims description 38
- 238000003197 gene knockdown Methods 0.000 claims description 33
- 239000008194 pharmaceutical composition Substances 0.000 claims description 28
- 230000002950 deficient Effects 0.000 claims description 27
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 23
- 150000003212 purines Chemical class 0.000 claims description 23
- 208000015181 infectious disease Diseases 0.000 claims description 20
- 239000003937 drug carrier Substances 0.000 claims description 19
- 208000010668 atopic eczema Diseases 0.000 claims description 18
- 201000004624 Dermatitis Diseases 0.000 claims description 17
- 230000010354 integration Effects 0.000 claims description 15
- 230000000295 complement effect Effects 0.000 claims description 12
- 208000035415 Reinfection Diseases 0.000 claims description 11
- 206010043554 thrombocytopenia Diseases 0.000 claims description 9
- 241000700605 Viruses Species 0.000 claims description 8
- 230000000735 allogeneic effect Effects 0.000 claims description 8
- 230000002463 transducing effect Effects 0.000 claims description 8
- 208000023275 Autoimmune disease Diseases 0.000 claims description 7
- 206010040047 Sepsis Diseases 0.000 claims description 7
- 206010035664 Pneumonia Diseases 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 201000009906 Meningitis Diseases 0.000 claims description 4
- 206010003246 arthritis Diseases 0.000 claims description 4
- 239000006260 foam Substances 0.000 claims description 4
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 claims description 4
- 208000004235 neutropenia Diseases 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 206010040872 skin infection Diseases 0.000 claims description 4
- 208000028185 Angioedema Diseases 0.000 claims description 3
- 208000010159 IgA glomerulonephritis Diseases 0.000 claims description 3
- 206010021263 IgA nephropathy Diseases 0.000 claims description 3
- 208000022559 Inflammatory bowel disease Diseases 0.000 claims description 3
- 206010033078 Otitis media Diseases 0.000 claims description 3
- 206010046851 Uveitis Diseases 0.000 claims description 3
- 206010047115 Vasculitis Diseases 0.000 claims description 3
- 206010000269 abscess Diseases 0.000 claims description 3
- 201000001981 dermatomyositis Diseases 0.000 claims description 3
- 208000010227 enterocolitis Diseases 0.000 claims description 3
- 208000007475 hemolytic anemia Diseases 0.000 claims description 3
- 208000019206 urinary tract infection Diseases 0.000 claims description 3
- 206010037549 Purpura Diseases 0.000 claims description 2
- 229960001428 mercaptopurine Drugs 0.000 claims description 2
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 claims 5
- 125000003275 alpha amino acid group Chemical group 0.000 claims 3
- 241001672981 Purpura Species 0.000 claims 1
- 208000035868 Vascular inflammations Diseases 0.000 claims 1
- 239000000546 pharmaceutical excipient Substances 0.000 claims 1
- 230000009368 gene silencing by RNA Effects 0.000 abstract description 32
- 108091030071 RNAI Proteins 0.000 abstract 1
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 96
- 108700019146 Transgenes Proteins 0.000 description 92
- 108090000623 proteins and genes Proteins 0.000 description 91
- 108020004414 DNA Proteins 0.000 description 86
- 230000008685 targeting Effects 0.000 description 69
- 108020004459 Small interfering RNA Proteins 0.000 description 62
- 108091070501 miRNA Proteins 0.000 description 57
- 239000002679 microRNA Substances 0.000 description 53
- 101000621427 Homo sapiens Wiskott-Aldrich syndrome protein Proteins 0.000 description 40
- 241000282414 Homo sapiens Species 0.000 description 39
- 239000002773 nucleotide Substances 0.000 description 38
- 230000035772 mutation Effects 0.000 description 37
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 36
- 125000003729 nucleotide group Chemical group 0.000 description 36
- 230000000694 effects Effects 0.000 description 34
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 32
- 108020004999 messenger RNA Proteins 0.000 description 30
- 229960000485 methotrexate Drugs 0.000 description 30
- 239000002299 complementary DNA Substances 0.000 description 26
- 102000004169 proteins and genes Human genes 0.000 description 25
- 201000010099 disease Diseases 0.000 description 24
- 239000000126 substance Substances 0.000 description 22
- 150000001413 amino acids Chemical class 0.000 description 21
- 238000001727 in vivo Methods 0.000 description 21
- 239000000203 mixture Substances 0.000 description 21
- 238000001802 infusion Methods 0.000 description 20
- 230000002441 reversible effect Effects 0.000 description 20
- 238000010361 transduction Methods 0.000 description 20
- 230000026683 transduction Effects 0.000 description 20
- 108020004705 Codon Proteins 0.000 description 19
- 241000713869 Moloney murine leukemia virus Species 0.000 description 19
- 230000002829 reductive effect Effects 0.000 description 19
- 210000000130 stem cell Anatomy 0.000 description 19
- 230000003612 virological effect Effects 0.000 description 19
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 18
- 239000003795 chemical substances by application Substances 0.000 description 18
- 230000003750 conditioning effect Effects 0.000 description 18
- 239000003112 inhibitor Substances 0.000 description 18
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 18
- 239000002088 nanocapsule Substances 0.000 description 18
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 17
- 230000000692 anti-sense effect Effects 0.000 description 17
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 17
- 229960000951 mycophenolic acid Drugs 0.000 description 17
- 230000001225 therapeutic effect Effects 0.000 description 17
- 241000699670 Mus sp. Species 0.000 description 16
- 239000012634 fragment Substances 0.000 description 15
- 238000003780 insertion Methods 0.000 description 15
- 230000037431 insertion Effects 0.000 description 15
- 230000037432 silent mutation Effects 0.000 description 15
- 241000713666 Lentivirus Species 0.000 description 14
- 239000000074 antisense oligonucleotide Substances 0.000 description 14
- 238000012230 antisense oligonucleotides Methods 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 14
- 239000003166 dihydrofolate reductase inhibitor Substances 0.000 description 14
- 230000030279 gene silencing Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 14
- -1 transcript Proteins 0.000 description 14
- 238000002054 transplantation Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 108010077544 Chromatin Proteins 0.000 description 12
- 210000003483 chromatin Anatomy 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 12
- 208000035475 disorder Diseases 0.000 description 12
- 230000001177 retroviral effect Effects 0.000 description 12
- 230000014616 translation Effects 0.000 description 12
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical class N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 11
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- 210000001744 T-lymphocyte Anatomy 0.000 description 11
- 239000003623 enhancer Substances 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- 102100034343 Integrase Human genes 0.000 description 10
- 108010061833 Integrases Proteins 0.000 description 10
- 238000013461 design Methods 0.000 description 10
- 230000029087 digestion Effects 0.000 description 10
- 230000037361 pathway Effects 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 108010077112 prolyl-proline Proteins 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 239000013607 AAV vector Substances 0.000 description 9
- RTRQQBHATOEIAF-UHFFFAOYSA-N AICA riboside Natural products NC1=C(C(=O)N)N=CN1C1C(O)C(O)C(CO)O1 RTRQQBHATOEIAF-UHFFFAOYSA-N 0.000 description 9
- 229940117937 Dihydrofolate reductase inhibitor Drugs 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 9
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 9
- RTRQQBHATOEIAF-UUOKFMHZSA-N acadesine Chemical compound NC1=C(C(=O)N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RTRQQBHATOEIAF-UUOKFMHZSA-N 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000008488 polyadenylation Effects 0.000 description 9
- 238000010186 staining Methods 0.000 description 9
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 8
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 8
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 8
- 108700011259 MicroRNAs Proteins 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 241000283973 Oryctolagus cuniculus Species 0.000 description 8
- 108010022394 Threonine synthase Proteins 0.000 description 8
- 101150023625 WAS gene Proteins 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 102000004419 dihydrofolate reductase Human genes 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 7
- 241000287828 Gallus gallus Species 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 7
- 102000056720 human WAS Human genes 0.000 description 7
- 210000005260 human cell Anatomy 0.000 description 7
- 230000002401 inhibitory effect Effects 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 7
- 238000004806 packaging method and process Methods 0.000 description 7
- 210000005259 peripheral blood Anatomy 0.000 description 7
- 239000011886 peripheral blood Substances 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical compound N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- 239000011534 wash buffer Substances 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 206010020751 Hypersensitivity Diseases 0.000 description 6
- 241001529936 Murinae Species 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- 102000004377 Thiopurine S-methyltransferases Human genes 0.000 description 6
- 108090000958 Thiopurine S-methyltransferases Proteins 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000000903 blocking effect Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 6
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 230000001400 myeloablative effect Effects 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 5
- 208000009329 Graft vs Host Disease Diseases 0.000 description 5
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 5
- 241000725303 Human immunodeficiency virus Species 0.000 description 5
- 206010061598 Immunodeficiency Diseases 0.000 description 5
- 208000029462 Immunodeficiency disease Diseases 0.000 description 5
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 5
- 230000002411 adverse Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 230000032823 cell division Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000000684 flow cytometry Methods 0.000 description 5
- 229950011423 forodesine Drugs 0.000 description 5
- 238000012226 gene silencing method Methods 0.000 description 5
- 208000024908 graft versus host disease Diseases 0.000 description 5
- IWKXDMQDITUYRK-KUBHLMPHSA-N immucillin H Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)N[C@H]1C1=CNC2=C1N=CNC2=O IWKXDMQDITUYRK-KUBHLMPHSA-N 0.000 description 5
- 230000007813 immunodeficiency Effects 0.000 description 5
- 210000001616 monocyte Anatomy 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 4
- 241000283707 Capra Species 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 101100446506 Mus musculus Fgf3 gene Proteins 0.000 description 4
- 101100348848 Mus musculus Notch4 gene Proteins 0.000 description 4
- 101100317378 Mus musculus Wnt3 gene Proteins 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 102000008866 Prostaglandin E receptors Human genes 0.000 description 4
- 108010088540 Prostaglandin E receptors Proteins 0.000 description 4
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 4
- 108091027981 Response element Proteins 0.000 description 4
- 101000767160 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Intracellular protein transport protein USO1 Proteins 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000001185 bone marrow Anatomy 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 4
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 4
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 4
- 210000002540 macrophage Anatomy 0.000 description 4
- FVVLHONNBARESJ-NTOWJWGLSA-H magnesium;potassium;trisodium;(2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanoate;acetate;tetrachloride;nonahydrate Chemical compound O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Mg+2].[Cl-].[Cl-].[Cl-].[Cl-].[K+].CC([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O FVVLHONNBARESJ-NTOWJWGLSA-H 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 230000009437 off-target effect Effects 0.000 description 4
- 230000001124 posttranscriptional effect Effects 0.000 description 4
- 150000003180 prostaglandins Chemical class 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 239000003981 vehicle Substances 0.000 description 4
- MSTNYGQPCMXVAQ-RYUDHWBXSA-N (6S)-5,6,7,8-tetrahydrofolic acid Chemical compound C([C@H]1CNC=2N=C(NC(=O)C=2N1)N)NC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 MSTNYGQPCMXVAQ-RYUDHWBXSA-N 0.000 description 3
- 244000063299 Bacillus subtilis Species 0.000 description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108091032955 Bacterial small RNA Proteins 0.000 description 3
- 208000014644 Brain disease Diseases 0.000 description 3
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 3
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 3
- 208000032274 Encephalopathy Diseases 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 101000896557 Homo sapiens Eukaryotic translation initiation factor 3 subunit B Proteins 0.000 description 3
- 101000988834 Homo sapiens Hypoxanthine-guanine phosphoribosyltransferase Proteins 0.000 description 3
- 108091070494 Homo sapiens miR-22 stem-loop Proteins 0.000 description 3
- 241000714192 Human spumaretrovirus Species 0.000 description 3
- 101710200424 Inosine-5'-monophosphate dehydrogenase Proteins 0.000 description 3
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 3
- 101100439689 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) chs-4 gene Proteins 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 241000288906 Primates Species 0.000 description 3
- 101710101148 Probable 6-oxopurine nucleoside phosphorylase Proteins 0.000 description 3
- 102000030764 Purine-nucleoside phosphorylase Human genes 0.000 description 3
- 102000014450 RNA Polymerase III Human genes 0.000 description 3
- 108010078067 RNA Polymerase III Proteins 0.000 description 3
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 3
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 3
- 102000036693 Thrombopoietin Human genes 0.000 description 3
- 108010041111 Thrombopoietin Proteins 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000001994 activation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 210000003719 b-lymphocyte Anatomy 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 210000004443 dendritic cell Anatomy 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 210000003743 erythrocyte Anatomy 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- QRMZSPFSDQBLIX-UHFFFAOYSA-N homovanillic acid Chemical compound COC1=CC(CC(O)=O)=CC=C1O QRMZSPFSDQBLIX-UHFFFAOYSA-N 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 235000013902 inosinic acid Nutrition 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000014207 opsonization Effects 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 230000006825 purine synthesis Effects 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 239000005460 tetrahydrofolate Substances 0.000 description 3
- 229960003087 tioguanine Drugs 0.000 description 3
- 210000003462 vein Anatomy 0.000 description 3
- PUPZLCDOIYMWBV-UHFFFAOYSA-N (+/-)-1,3-Butanediol Chemical compound CC(O)CCO PUPZLCDOIYMWBV-UHFFFAOYSA-N 0.000 description 2
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- GQCXGHHHNACOGE-SKDRFNHKSA-N (2s)-2-[[5-[2-[(6r)-2-amino-4-oxo-5,6,7,8-tetrahydro-1h-pyrido[2,3-d]pyrimidin-6-yl]ethyl]thiophene-2-carbonyl]amino]pentanedioic acid Chemical compound C([C@@H]1CC=2C(=O)N=C(NC=2NC1)N)CC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)S1 GQCXGHHHNACOGE-SKDRFNHKSA-N 0.000 description 2
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- DCTLYFZHFGENCW-UUOKFMHZSA-N 5'-xanthylic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 DCTLYFZHFGENCW-UUOKFMHZSA-N 0.000 description 2
- 108091034151 7SK RNA Proteins 0.000 description 2
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 2
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 2
- XUBLMYHWSFRACH-CYDGBPFRSA-N Arg-Asn-Gln-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XUBLMYHWSFRACH-CYDGBPFRSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 2
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 2
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 2
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 2
- 102100032912 CD44 antigen Human genes 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- BVFQOPGFOQVZTE-ACZMJKKPSA-N Cys-Gln-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O BVFQOPGFOQVZTE-ACZMJKKPSA-N 0.000 description 2
- 125000000824 D-ribofuranosyl group Chemical group [H]OC([H])([H])[C@@]1([H])OC([H])(*)[C@]([H])(O[H])[C@]1([H])O[H] 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102000009109 Fc receptors Human genes 0.000 description 2
- 108010087819 Fc receptors Proteins 0.000 description 2
- 241000713800 Feline immunodeficiency virus Species 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 2
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 2
- ZGKXAUIVGIBISK-SZMVWBNQSA-N Glu-His-Trp Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]cn1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O ZGKXAUIVGIBISK-SZMVWBNQSA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 2
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 2
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 2
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 2
- 208000032843 Hemorrhage Diseases 0.000 description 2
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 2
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 2
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 2
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 2
- 101000800116 Homo sapiens Thy-1 membrane glycoprotein Proteins 0.000 description 2
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 2
- 208000031814 IgA Vasculitis Diseases 0.000 description 2
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 2
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 2
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 2
- GRSZFWQUAKGDAV-UHFFFAOYSA-N Inosinic acid Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 2
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 2
- 241000282560 Macaca mulatta Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- XXAOSEUPEMQJOF-KKUMJFAQSA-N Phe-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XXAOSEUPEMQJOF-KKUMJFAQSA-N 0.000 description 2
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 2
- ZIQQNOXKEFDPBE-BZSNNMDCSA-N Phe-Lys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N ZIQQNOXKEFDPBE-BZSNNMDCSA-N 0.000 description 2
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 2
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 2
- 102100023715 Poly(A)-specific ribonuclease PARN Human genes 0.000 description 2
- 208000031951 Primary immunodeficiency Diseases 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 2
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- UCTIUWKCVNGEFH-OBJOEFQTSA-N Pro-Val-Gly-Pro Chemical compound N([C@@H](C(C)C)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 UCTIUWKCVNGEFH-OBJOEFQTSA-N 0.000 description 2
- 102000003661 Ribonuclease III Human genes 0.000 description 2
- 108010057163 Ribonuclease III Proteins 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 2
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 102100033523 Thy-1 membrane glycoprotein Human genes 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 2
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 2
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 208000010094 Visna Diseases 0.000 description 2
- 210000001766 X chromosome Anatomy 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 235000010443 alginic acid Nutrition 0.000 description 2
- 229920000615 alginic acid Polymers 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 230000000844 anti-bacterial effect Effects 0.000 description 2
- 230000001093 anti-cancer Effects 0.000 description 2
- 239000000611 antibody drug conjugate Substances 0.000 description 2
- 229940049595 antibody-drug conjugate Drugs 0.000 description 2
- 229940121375 antifungal agent Drugs 0.000 description 2
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000001363 autoimmune Effects 0.000 description 2
- 201000000448 autoimmune hemolytic anemia Diseases 0.000 description 2
- SESFRYSPDFLNCH-UHFFFAOYSA-N benzyl benzoate Chemical compound C=1C=CC=CC=1C(=O)OCC1=CC=CC=C1 SESFRYSPDFLNCH-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000000740 bleeding effect Effects 0.000 description 2
- 208000037815 bloodstream infection Diseases 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 239000001768 carboxy methyl cellulose Substances 0.000 description 2
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 2
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000002648 combination therapy Methods 0.000 description 2
- 231100000135 cytotoxicity Toxicity 0.000 description 2
- 230000003013 cytotoxicity Effects 0.000 description 2
- GHVNFZFCNZKVNT-UHFFFAOYSA-N decanoic acid Chemical compound CCCCCCCCCC(O)=O GHVNFZFCNZKVNT-UHFFFAOYSA-N 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical class [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 2
- 108700004025 env Genes Proteins 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 229960000304 folic acid Drugs 0.000 description 2
- 235000019152 folic acid Nutrition 0.000 description 2
- 239000011724 folic acid Substances 0.000 description 2
- 108700004026 gag Genes Proteins 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 238000011134 hematopoietic stem cell transplantation Methods 0.000 description 2
- 210000000777 hematopoietic system Anatomy 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000002743 insertional mutagenesis Methods 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 230000009021 linear effect Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000008297 liquid dosage form Substances 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- WWZKQHOCKIZLMA-UHFFFAOYSA-N octanoic acid Chemical compound CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 2
- 238000007911 parenteral administration Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 108700004029 pol Genes Proteins 0.000 description 2
- 108010041090 poly(A)-specific ribonuclease Proteins 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000001566 pro-viral effect Effects 0.000 description 2
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000007909 solid dosage form Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- OQQOAWVKVDAJOI-UHFFFAOYSA-N (2-dodecanoyloxy-3-hydroxypropyl) dodecanoate Chemical compound CCCCCCCCCCCC(=O)OCC(CO)OC(=O)CCCCCCCCCCC OQQOAWVKVDAJOI-UHFFFAOYSA-N 0.000 description 1
- AUHDWARTFSKSAC-HEIFUQTGSA-N (2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-(6-oxo-1H-purin-9-yl)oxolane-2-carboxylic acid Chemical compound [C@]1([C@H](O)[C@H](O)[C@@H](CO)O1)(N1C=NC=2C(O)=NC=NC12)C(=O)O AUHDWARTFSKSAC-HEIFUQTGSA-N 0.000 description 1
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- JNYAEWCLZODPBN-JGWLITMVSA-N (2r,3r,4s)-2-[(1r)-1,2-dihydroxyethyl]oxolane-3,4-diol Chemical compound OC[C@@H](O)[C@H]1OC[C@H](O)[C@H]1O JNYAEWCLZODPBN-JGWLITMVSA-N 0.000 description 1
- ZUQBAQVRAURMCL-DOMZBBRYSA-N (2s)-2-[[4-[2-[(6r)-2-amino-4-oxo-5,6,7,8-tetrahydro-1h-pyrido[2,3-d]pyrimidin-6-yl]ethyl]benzoyl]amino]pentanedioic acid Chemical compound C([C@@H]1CC=2C(=O)N=C(NC=2NC1)N)CC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 ZUQBAQVRAURMCL-DOMZBBRYSA-N 0.000 description 1
- OYHQOLUKZRVURQ-NTGFUMLPSA-N (9Z,12Z)-9,10,12,13-tetratritiooctadeca-9,12-dienoic acid Chemical compound C(CCCCCCC\C(=C(/C\C(=C(/CCCCC)\[3H])\[3H])\[3H])\[3H])(=O)O OYHQOLUKZRVURQ-NTGFUMLPSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- 229940058015 1,3-butylene glycol Drugs 0.000 description 1
- RZRNAYUHWVFMIP-KTKRTIGZSA-N 1-oleoylglycerol Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(O)CO RZRNAYUHWVFMIP-KTKRTIGZSA-N 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- 102100022464 5'-nucleotidase Human genes 0.000 description 1
- IZZIWIAOVZOBLF-UHFFFAOYSA-N 5-methoxysalicylic acid Chemical compound COC1=CC=C(O)C(C(O)=O)=C1 IZZIWIAOVZOBLF-UHFFFAOYSA-N 0.000 description 1
- FHVDTGUDJYJELY-UHFFFAOYSA-N 6-{[2-carboxy-4,5-dihydroxy-6-(phosphanyloxy)oxan-3-yl]oxy}-4,5-dihydroxy-3-phosphanyloxane-2-carboxylic acid Chemical compound O1C(C(O)=O)C(P)C(O)C(O)C1OC1C(C(O)=O)OC(OP)C(O)C1O FHVDTGUDJYJELY-UHFFFAOYSA-N 0.000 description 1
- GOKCPVRCLHGTJM-UHFFFAOYSA-N 7h-pyrrolo[2,3-d]pyrimidine-2-carboxylic acid Chemical compound N1C(C(=O)O)=NC=C2C=CN=C21 GOKCPVRCLHGTJM-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 239000005995 Aluminium silicate Substances 0.000 description 1
- 108010079442 Anion Transport Proteins Proteins 0.000 description 1
- 102000012739 Anion Transport Proteins Human genes 0.000 description 1
- 102000008102 Ankyrins Human genes 0.000 description 1
- 108010049777 Ankyrins Proteins 0.000 description 1
- 102100037435 Antiviral innate immune response receptor RIG-I Human genes 0.000 description 1
- 101710127675 Antiviral innate immune response receptor RIG-I Proteins 0.000 description 1
- 108010088141 Argonaute Proteins Proteins 0.000 description 1
- 108091026821 Artificial microRNA Proteins 0.000 description 1
- 102000019260 B-Cell Antigen Receptors Human genes 0.000 description 1
- 108010012919 B-Cell Antigen Receptors Proteins 0.000 description 1
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100024348 Beta-adducin Human genes 0.000 description 1
- 238000011746 C57BL/6J (JAX™ mouse strain) Methods 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 102000016897 CCCTC-Binding Factor Human genes 0.000 description 1
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 1
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 1
- 102100037904 CD9 antigen Human genes 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 239000005632 Capric acid (CAS 334-48-5) Substances 0.000 description 1
- 241000713756 Caprine arthritis encephalitis virus Species 0.000 description 1
- 239000005635 Caprylic acid (CAS 124-07-2) Substances 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 208000014912 Central Nervous System Infections Diseases 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 208000034656 Contusions Diseases 0.000 description 1
- 241000557626 Corvus corax Species 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 229930105110 Cyclosporin A Natural products 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 206010050685 Cytokine storm Diseases 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 108010041052 DNA Topoisomerase IV Proteins 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 206010012444 Dermatitis diaper Diseases 0.000 description 1
- 208000003105 Diaper Rash Diseases 0.000 description 1
- 235000019739 Dicalciumphosphate Nutrition 0.000 description 1
- 102100023114 Dual specificity tyrosine-phosphorylation-regulated kinase 3 Human genes 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000713730 Equine infectious anemia virus Species 0.000 description 1
- 102000016955 Erythrocyte Anion Exchange Protein 1 Human genes 0.000 description 1
- 108010014384 Erythrocyte Anion Exchange Protein 1 Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 102100020715 Fms-related tyrosine kinase 3 ligand protein Human genes 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 241000206672 Gelidium Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 1
- AEMRFAOFKBGASW-UHFFFAOYSA-N Glycolic acid Polymers OCC(O)=O AEMRFAOFKBGASW-UHFFFAOYSA-N 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 108020004202 Guanylate Kinase Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 101000678236 Homo sapiens 5'-nucleotidase Proteins 0.000 description 1
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 description 1
- 101000689619 Homo sapiens Beta-adducin Proteins 0.000 description 1
- 101000738354 Homo sapiens CD9 antigen Proteins 0.000 description 1
- 101001049991 Homo sapiens Dual specificity tyrosine-phosphorylation-regulated kinase 3 Proteins 0.000 description 1
- 101001027128 Homo sapiens Fibronectin Proteins 0.000 description 1
- 101000932480 Homo sapiens Fms-related tyrosine kinase 3 ligand Proteins 0.000 description 1
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 1
- 101001046677 Homo sapiens Integrin alpha-V Proteins 0.000 description 1
- 101000935043 Homo sapiens Integrin beta-1 Proteins 0.000 description 1
- 101000998120 Homo sapiens Interleukin-3 receptor subunit alpha Proteins 0.000 description 1
- 101001043809 Homo sapiens Interleukin-7 receptor subunit alpha Proteins 0.000 description 1
- 101000716729 Homo sapiens Kit ligand Proteins 0.000 description 1
- 101000868279 Homo sapiens Leukocyte surface antigen CD47 Proteins 0.000 description 1
- 101001008874 Homo sapiens Mast/stem cell growth factor receptor Kit Proteins 0.000 description 1
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 description 1
- 101000596234 Homo sapiens T-cell surface protein tactile Proteins 0.000 description 1
- 101150003028 Hprt1 gene Proteins 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 1
- 102000006933 Hydroxymethyl and Formyl Transferases Human genes 0.000 description 1
- 108010072462 Hydroxymethyl and Formyl Transferases Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000018121 Hypoxanthine-guanine phosphoribosyltransferase deficiency Diseases 0.000 description 1
- GRSZFWQUAKGDAV-KQYNXXCUSA-N IMP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-KQYNXXCUSA-N 0.000 description 1
- 108010087227 IMP Dehydrogenase Proteins 0.000 description 1
- 102000006674 IMP dehydrogenase Human genes 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 102100022337 Integrin alpha-V Human genes 0.000 description 1
- 102100025304 Integrin beta-1 Human genes 0.000 description 1
- 102100033493 Interleukin-3 receptor subunit alpha Human genes 0.000 description 1
- 102100021593 Interleukin-7 receptor subunit alpha Human genes 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 239000005639 Lauric acid Substances 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 102100032913 Leukocyte surface antigen CD47 Human genes 0.000 description 1
- 206010024971 Lower respiratory tract infections Diseases 0.000 description 1
- 208000008771 Lymphadenopathy Diseases 0.000 description 1
- 206010025280 Lymphocytosis Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 102100027754 Mast/stem cell growth factor receptor Kit Human genes 0.000 description 1
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 241000713883 Myeloproliferative sarcoma virus Species 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- 102000003729 Neprilysin Human genes 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 208000005141 Otitis Diseases 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 229920001710 Polyorthoester Polymers 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010007568 Protamines Proteins 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 102100031952 Protein 4.1 Human genes 0.000 description 1
- 101710196266 Protein 4.1 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 102000017143 RNA Polymerase I Human genes 0.000 description 1
- 108010013845 RNA Polymerase I Proteins 0.000 description 1
- 108020005093 RNA Precursors Proteins 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 241001068295 Replication defective viruses Species 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- IWUCXVSUMQZMFG-AFCXAGJDSA-N Ribavirin Chemical compound N1=C(C(=O)N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 IWUCXVSUMQZMFG-AFCXAGJDSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 206010039793 Seborrhoeic dermatitis Diseases 0.000 description 1
- 244000000231 Sesamum indicum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 206010040860 Skin haemorrhages Diseases 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- ABBQHOQBGMUPJH-UHFFFAOYSA-M Sodium salicylate Chemical compound [Na+].OC1=CC=CC=C1C([O-])=O ABBQHOQBGMUPJH-UHFFFAOYSA-M 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 108010019965 Spectrin Proteins 0.000 description 1
- 102000005890 Spectrin Human genes 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 102000001435 Synapsin Human genes 0.000 description 1
- 108050009621 Synapsin Proteins 0.000 description 1
- 230000006052 T cell proliferation Effects 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- 108010092262 T-Cell Antigen Receptors Proteins 0.000 description 1
- 102100025237 T-cell surface antigen CD2 Human genes 0.000 description 1
- 102100035268 T-cell surface protein tactile Human genes 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 101150052863 THY1 gene Proteins 0.000 description 1
- 241001365914 Taira Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 108010033576 Transferrin Receptors Proteins 0.000 description 1
- 102100026144 Transferrin receptor protein 1 Human genes 0.000 description 1
- 206010052779 Transplant rejections Diseases 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 206010046306 Upper respiratory tract infection Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000256856 Vespidae Species 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 206010065173 Viral skin infection Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 239000001089 [(2R)-oxolan-2-yl]methanol Substances 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000002250 absorbent Substances 0.000 description 1
- 230000002745 absorbent Effects 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 235000010419 agar Nutrition 0.000 description 1
- 101150084233 ago2 gene Proteins 0.000 description 1
- 229940072056 alginate Drugs 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 238000011316 allogeneic transplantation Methods 0.000 description 1
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 description 1
- 235000020661 alpha-linolenic acid Nutrition 0.000 description 1
- 235000012211 aluminium silicate Nutrition 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000843 anti-fungal effect Effects 0.000 description 1
- 230000000947 anti-immunosuppressive effect Effects 0.000 description 1
- 230000000340 anti-metabolite Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940100197 antimetabolite Drugs 0.000 description 1
- 239000002256 antimetabolite Substances 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 229940114079 arachidonic acid Drugs 0.000 description 1
- 235000021342 arachidonic acid Nutrition 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- OGBUMNBNEWYMNJ-UHFFFAOYSA-N batilol Chemical class CCCCCCCCCCCCCCCCCCOCC(O)CO OGBUMNBNEWYMNJ-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000440 bentonite Substances 0.000 description 1
- 229910000278 bentonite Inorganic materials 0.000 description 1
- SVPXDRXYRYOSEX-UHFFFAOYSA-N bentoquatam Chemical compound O.O=[Si]=O.O=[Al]O[Al]=O SVPXDRXYRYOSEX-UHFFFAOYSA-N 0.000 description 1
- 229960002903 benzyl benzoate Drugs 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229920002988 biodegradable polymer Polymers 0.000 description 1
- 239000004621 biodegradable polymer Substances 0.000 description 1
- 238000012925 biological evaluation Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 238000010322 bone marrow transplantation Methods 0.000 description 1
- 235000019437 butane-1,3-diol Nutrition 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 235000010216 calcium carbonate Nutrition 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- CJZGTCYPCWQAJB-UHFFFAOYSA-L calcium stearate Chemical compound [Ca+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O CJZGTCYPCWQAJB-UHFFFAOYSA-L 0.000 description 1
- 235000013539 calcium stearate Nutrition 0.000 description 1
- 239000008116 calcium stearate Substances 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000020411 cell activation Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000024321 chromosome segregation Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000003246 corticosteroid Substances 0.000 description 1
- 229960001334 corticosteroids Drugs 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 108010019251 cyclosporin H Proteins 0.000 description 1
- 230000016396 cytokine production Effects 0.000 description 1
- 206010052015 cytokine release syndrome Diseases 0.000 description 1
- 230000003436 cytoskeletal effect Effects 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- NEFBYIFKOOEVPA-UHFFFAOYSA-K dicalcium phosphate Chemical compound [Ca+2].[Ca+2].[O-]P([O-])([O-])=O NEFBYIFKOOEVPA-UHFFFAOYSA-K 0.000 description 1
- 229940038472 dicalcium phosphate Drugs 0.000 description 1
- 229910000390 dicalcium phosphate Inorganic materials 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- OZRNSSUDZOLUSN-LBPRGKRZSA-N dihydrofolic acid Chemical compound N=1C=2C(=O)NC(N)=NC=2NCC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OZRNSSUDZOLUSN-LBPRGKRZSA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- XEYBRNLFEZDVAW-ARSRFYASSA-N dinoprostone Chemical compound CCCCC[C@H](O)\C=C\[C@H]1[C@H](O)CC(=O)[C@@H]1C\C=C/CCCC(O)=O XEYBRNLFEZDVAW-ARSRFYASSA-N 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000008298 dragée Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 208000019258 ear infection Diseases 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 101150030339 env gene Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 229940093499 ethyl acetate Drugs 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 230000001036 exonucleolytic effect Effects 0.000 description 1
- 108010032819 exoribonuclease II Proteins 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 150000002240 furans Chemical class 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 101150098622 gag gene Proteins 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 230000001738 genotoxic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000001727 glucose Nutrition 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N glycerine monostearate Natural products CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- RZRNAYUHWVFMIP-HXUWFJFHSA-N glycerol monolinoleate Natural products CCCCCCCCC=CCCCCCCCC(=O)OC[C@H](O)CO RZRNAYUHWVFMIP-HXUWFJFHSA-N 0.000 description 1
- SVUQHVRAGMNPLW-UHFFFAOYSA-N glycerol monostearate Natural products CCCCCCCCCCCCCCCCC(=O)OCC(O)CO SVUQHVRAGMNPLW-UHFFFAOYSA-N 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 102000006638 guanylate kinase Human genes 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 208000034737 hemoglobinopathy Diseases 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 102000055151 human KITLG Human genes 0.000 description 1
- 239000003906 humectant Substances 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- KBIDJCVAURJXFG-PVEDRDFWSA-N immucillin G Chemical compound C=1NC=2C(=O)NC(N)=NC=2C=1[C@@H]1N[C@H](CO)[C@@H](O)[C@H]1O KBIDJCVAURJXFG-PVEDRDFWSA-N 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000002637 immunotoxin Effects 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 229940051026 immunotoxin Drugs 0.000 description 1
- 231100000608 immunotoxin Toxicity 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003701 inert diluent Substances 0.000 description 1
- 230000004968 inflammatory condition Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229940028843 inosinic acid Drugs 0.000 description 1
- 239000004245 inosinic acid Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004068 intracellular signaling Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- NLYAJNPCOHFWQQ-UHFFFAOYSA-N kaolin Chemical compound O.O.O=[Al]O[Si](=O)O[Si](=O)O[Al]=O NLYAJNPCOHFWQQ-UHFFFAOYSA-N 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000011813 knockout mouse model Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 210000002414 leg Anatomy 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 229960004488 linolenic acid Drugs 0.000 description 1
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 229950000909 lometrexol Drugs 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 208000018555 lymphatic system disease Diseases 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000001755 magnesium gluconate Substances 0.000 description 1
- 229960003035 magnesium gluconate Drugs 0.000 description 1
- 235000015778 magnesium gluconate Nutrition 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 229940091250 magnesium supplement Drugs 0.000 description 1
- IAKLPCRFBAZVRW-XRDLMGPZSA-L magnesium;(2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanoate;hydrate Chemical compound O.[Mg+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O IAKLPCRFBAZVRW-XRDLMGPZSA-L 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 210000003593 megakaryocyte Anatomy 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 108091062762 miR-21 stem-loop Proteins 0.000 description 1
- 108091041631 miR-21-1 stem-loop Proteins 0.000 description 1
- 108091044442 miR-21-2 stem-loop Proteins 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 101150110189 minE gene Proteins 0.000 description 1
- 208000008588 molluscum contagiosum Diseases 0.000 description 1
- CQDGTJPVBWZJAZ-UHFFFAOYSA-N monoethyl carbonate Chemical compound CCOC(O)=O CQDGTJPVBWZJAZ-UHFFFAOYSA-N 0.000 description 1
- 101150035528 mukB gene Proteins 0.000 description 1
- 231100000052 myelotoxic Toxicity 0.000 description 1
- 230000002556 myelotoxic effect Effects 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 210000000581 natural killer T-cell Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 239000012457 nonaqueous media Substances 0.000 description 1
- 239000013009 nonpyrogenic isotonic solution Substances 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 229960002446 octanoic acid Drugs 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 239000006186 oral dosage form Substances 0.000 description 1
- 150000002895 organic esters Chemical class 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000006201 parenteral dosage form Substances 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 239000003961 penetration enhancing agent Substances 0.000 description 1
- 230000008823 permeabilization Effects 0.000 description 1
- 206010034754 petechiae Diseases 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- WVDDGKGOMKODPV-ZQBYOMGUSA-N phenyl(114C)methanol Chemical compound O[14CH2]C1=CC=CC=C1 WVDDGKGOMKODPV-ZQBYOMGUSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000004983 pleiotropic effect Effects 0.000 description 1
- 101150088264 pol gene Proteins 0.000 description 1
- 229960000502 poloxamer Drugs 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 239000002745 poly(ortho ester) Substances 0.000 description 1
- 229920001481 poly(stearyl methacrylate) Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108010042121 probasin Proteins 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 229960004063 propylene glycol Drugs 0.000 description 1
- 229950008679 protamine sulfate Drugs 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000004144 purine metabolism Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- LKUNXBRZDFMZOK-UHFFFAOYSA-N rac-1-monodecanoylglycerol Chemical compound CCCCCCCCCC(=O)OCC(O)CO LKUNXBRZDFMZOK-UHFFFAOYSA-N 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 108010056030 retronectin Proteins 0.000 description 1
- 229960000329 ribavirin Drugs 0.000 description 1
- HZCAHMRRMINHDJ-DBRKOABJSA-N ribavirin Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1N=CN=C1 HZCAHMRRMINHDJ-DBRKOABJSA-N 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 150000003873 salicylate salts Chemical class 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 210000003752 saphenous vein Anatomy 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 210000004761 scalp Anatomy 0.000 description 1
- 208000008742 seborrheic dermatitis Diseases 0.000 description 1
- 201000003779 seborrheic infantile dermatitis Diseases 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 150000004760 silicates Chemical class 0.000 description 1
- RMAQACBXLXPBSY-UHFFFAOYSA-N silicic acid Chemical compound O[Si](O)(O)O RMAQACBXLXPBSY-UHFFFAOYSA-N 0.000 description 1
- 235000012239 silicon dioxide Nutrition 0.000 description 1
- 201000009890 sinusitis Diseases 0.000 description 1
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- 230000008591 skin barrier function Effects 0.000 description 1
- 230000004877 small RNA loading onto RISC Effects 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 229960004025 sodium salicylate Drugs 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000001324 spliceosome Anatomy 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 235000012222 talc Nutrition 0.000 description 1
- TUNFSRHWOTWDNC-HKGQFRNVSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCC[14C](O)=O TUNFSRHWOTWDNC-HKGQFRNVSA-N 0.000 description 1
- BSYVTEYKTMYBMK-UHFFFAOYSA-N tetrahydrofurfuryl alcohol Chemical compound OCC1CCCO1 BSYVTEYKTMYBMK-UHFFFAOYSA-N 0.000 description 1
- 238000011287 therapeutic dose Methods 0.000 description 1
- 150000003577 thiophenes Chemical class 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009752 translational inhibition Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011277 treatment modality Methods 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 210000003606 umbilical vein Anatomy 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 210000000605 viral structure Anatomy 0.000 description 1
- 230000010464 virion assembly Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K35/28—Bone marrow; Haematopoietic stem cells; Mesenchymal stem cells of any origin, e.g. adipose-derived stem cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/50—Biochemical production, i.e. in a transformed host cell
- C12N2330/51—Specially adapted vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/15011—Lentivirus, not HIV, e.g. FIV, SIV
- C12N2740/15041—Use of virus, viral particle or viral elements as a vector
- C12N2740/15043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/02—Pentosyltransferases (2.4.2)
- C12Y204/02008—Hypoxanthine phosphoribosyltransferase (2.4.2.8)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Virology (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Cell Biology (AREA)
- Developmental Biology & Embryology (AREA)
- Hematology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本公开提供表达载体,其包含至少两个核酸序列,即编码抗HPRT RNAi的核酸序列,以及编码Wiskott‑Aldrich综合征蛋白的核酸序列。在一些实施方案中,所述表达载体是自我失活的慢病毒载体。在一些实施方案中,Wiskott‑Aldrich综合征蛋白用于减轻与Wiskott‑Aldrich综合征相关的病理。
Description
相关申请的交叉引用
本申请要求于2018年12月23日提交的美国临时申请号62/784,508的申请日的权益,其公开内容整体援引加入本文。
技术领域
本公开一般涉及基因疗法,特别是通过表达载体转导的造血干细胞。
背景技术
Wiskott-Aldrich综合征(WAS)是一种罕见的X连锁原发性免疫缺陷(PID)疾病,其特征在于反复感染、小血小板、微血小板减少症、湿疹以及自身免疫表现和肿瘤的风险增加。Wiskott-Aldrich综合征蛋白(WASP)中的基因突变导致Wiskott-Aldrich 综合征。编码WAS蛋白的基因位于X染色体短臂(XP11.22-11.23),长约9kb,包括 12个外显子,编码502个氨基酸。迄今为止,已在Wiskott-Aldrich综合征患者中鉴定了WASP突变,包括错义/无义、剪接、小缺失、小插入、大缺失和大插入。
Wiskott-Aldrich综合征蛋白是一种造血系统特异性细胞内信号转导分子,富含脯氨酸,并且仅在造血细胞系中表达。Wiskott-Aldrich综合征蛋白据认为是在所有白细胞中表达的肌动蛋白细胞骨架的重要调节物质。据认为其参与动态细胞骨架变化,这对多种细胞功能至关重要,例如粘附、迁移、吞噬、免疫突触形成以及受体介导的细胞活化过程(例如B和T细胞抗原受体)。因此,认为Wiskott-Aldrich综合征患者的先天免疫和细胞适应性免疫均受到影响,使这些患者非常容易受到感染。
一般来说,导致丧失蛋白表达的WAS基因突变导致“经典的Wiskott- Aldrich综合征”。Wiskott-Aldrich综合征蛋白表达减少导致X连锁血小板减少症。 Wiskott-Aldrich综合征蛋白激活功能获得性突变导致X连锁的中性粒细胞减少症。根据WAS基因产物中的突变,临床疾病存在很大差异。在一项154名Wiskott-Aldrich综合征患者的研究中,只有30%的患者具有血小板减少症、小血小板、湿疹和免疫缺陷的典型表现;84%的患者具有血小板减少症的临床指征和症状,80%的患者具有湿疹, 20%的患者仅具有血液学异常,并且5%的患者仅具有感染表现。(参见Sullivan,J Pediatr.1994;125(6Pt 1):876-85)。自身免疫性疾病很常见,并且发生在高达40-70%的患者中。还认为淋巴网状内皮细胞恶性肿瘤的风险显著增加(10-20%),例如淋巴瘤、白血病和骨髓增生异常。另一项对来自法国一家医院的55名Wiskott-Aldrich综合征患者进行了20年的回顾,发现70%的患者患有自身免疫性或炎症病况,最常见的是自身免疫性溶血性贫血。
Wiskott-Aldrich综合征是近40年前通过同种异体造血干细胞移植(HSCT) 成功治疗的首批病况之一(Galy,Roncarolo et al.2008,Candotti 2018)。治疗WAS的基因治疗方法有继续报道,包括,例如,Aiuti et al.(2013),Science,341,p.1233151; Hacein-BeyAbina,et al.(2015)JAMA,313,pp.1550-1563;Koldej et al.(2013),Human GeneTherapy Clinical Development,Vol 24,pp.77-85;Wielgosz et al.(2015);MolecularTherapy:Methods&Clinical Development Vol 2,pp.14063以及Singh et al.(2017),Molecular Therapy:Methods&Clinical Development Vol.4pp.1-16。
骨髓移植据认为仍然是该疾病唯一经证实的治愈方法,对于那些具有HLA 匹配供体的患者(仅适用于不到20%的患者),结果相当不错。造血干细胞基因疗法 (HSC-GT)为缺乏匹配供体的患者提供了一种新的、可能治愈的选择。与同种异体 HSCT相比,基因治疗具有多种潜在优势。其理论上可用于所有患者,并且认为可以降低移植排斥的风险,并且可能避免与移植物抗宿主病(GvHD)相关的风险。
发明内容
修饰人类干细胞的基因治疗策略对于治愈许多人类疾病有广阔前景。但是,基因治疗的问题之一是获得足够水平的植入。据认为可以通过工程化干细胞来增强基因修饰的干细胞的植入,其中敲低次黄嘌呤鸟嘌呤磷酸核糖转移酶(“HPRT”)的表达,从而使得能够通过赋予对鸟嘌呤类似物抗代谢物的抗性来选择遗传修饰的细胞。
在本公开的第一方面,提供一种表达载体,其包含可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott- Aldrich综合征蛋白(例如野生型Wiskott-Aldrich综合征蛋白或密码子优化的Wiskott- Aldrich综合征蛋白)。在一些实施方案中,所述表达载体是慢病毒表达载体。在一些实施方案中,所述慢病毒表达载体是整合缺陷的慢病毒载体。
在一些实施方案中,所述shRNA包含具有SEQ ID NO:32的发夹环序列。在一些实施方案中,所述shRNA与SEQ ID NO:26的核酸序列具有至少95%序列相同性。在一些实施方案中,所述shRNA包含SEQ ID NO:26的序列。在一些实施方案中,所述shRNA与选自SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25的核酸序列具有至少95%序列相同性。在一些实施方案中,所述shRNA包含SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25中任一个的序列。在一些实施方案中,shRNA与选自SEQ ID NO:34和SEQ ID NO:35的核酸序列具有至少95%序列相同性。在一些实施方案中,所述shRNA包含SEQ ID NO:34和SEQ ID NO:35中任一个的序列。在一些实施方案中,所述shRNA与选自SEQ ID NO:21和SEQ ID NO:22的核酸序列具有至少95%序列相同性。在一些实施方案中,所述shRNA包含SEQ ID NO:21和SEQ ID NO:22中任一个的序列。在一些实施方案中,所述shRNA与SEQ ID NO:36的核酸序列具有至少95%序列相同性。在一些实施方案中,所述shRNA包含SEQ ID NO:36的序列。
在一些实施方案中,所述第一表达控制序列包含Pol III启动子或Pol II启动子。在一些实施方案中,所述Pol III启动子是7sk。在一些实施方案中,所述7sk启动子包含与SEQ ID NO:28的核酸序列具有至少95%序列相同性的核酸序列。在一些实施方案中,所述7sk启动子包含SEQ ID NO:28的核酸序列。在一些实施方案中,所述7sk启动子包含SEQ IDNO:29的核酸序列。
在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸包含与 SEQ IDNO:1、2、3和4中的任一个具有至少95%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸包含与SEQ ID NO:1、2、3和4中的任一个具有至少97%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸包含与SEQ IDNO:1、2、3和4中的任一个具有至少99%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸包含这样的序列,其包含SEQ ID NO:1、2、3和4中的任一个。在一些实施方案中,编码Wiskott-Aldrich 综合征蛋白的第二核酸包含与SEQ ID NO:67、68和69中的任一个具有至少95%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸包含与 SEQ ID NO:67、68和69中的任一个具有至少97%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸包含与SEQ ID NO:67、68和69中的任一个具有至少99%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸包含这样的序列,其包含SEQ ID NO:67、68和69中的任一个。在一些实施方案中,所述第二表达控制序列包含MND启动子。在一些实施方案中,所述MND 启动子包含对SEQ ID NO:7、8、9、10、11和12中的任一个至少95%的相同性。在一些实施方案中,所述MND启动子包含对SEQ ID NO:7、8、9、10、11和12中的任一个至少99%的相同性。
在一些实施方案中,第二核酸序列编码肽,所述肽具有与SEQS ID NOS:5 和6中的任一个具有至少95%相同性的氨基酸序列;并且第一核酸序列编码与SEQ ID NO:16或其互补体(complement)具有至少95%相同性的核酸分子。
在一些实施方案中,所述表达载体进一步包含绝缘子。在一些实施方案中,所述绝缘子选自650cHS4绝缘子、400cHS4绝缘子和泡沫病毒绝缘子。在一些实施方案中,所述表达载体进一步包含绝缘子,所述绝缘子与选自SEQ ID NO:38、SEQ ID NO:39和SEQ ID NO:40的核酸序列具有至少95%序列相同性。在一些实施方案中,所述表达载体进一步包含绝缘子,所述绝缘子具有选自SEQ ID NO:38、SEQ ID NO: 39和SEQ ID NO:40的核酸序列。
在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的下游。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列与可操作地连接至第二核酸序列的第二表达控制序列朝向相同方向。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列朝向第一方向,其中可操作地连接至第二核酸序列的第二表达控制序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。
在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的上游。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列与可操作地连接至第二核酸序列的第二表达控制序列朝向相同方向。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列朝向第一方向,其中可操作地连接至第二核酸序列的第二表达控制序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。
在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列朝向第一方向,其中可操作地连接至第二核酸序列的第二表达控制序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的下游。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的上游。
在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列与可操作地连接至第二核酸序列的第二表达控制序列朝向相同方向。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的下游。在一些实施方案中,可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的上游。
在本公开的第二方面,提供一种表达盒,其包含与SEQ ID NO:15的核酸序列具有至少90%相同性的核酸序列。在一些实施方案中,所述表达盒包含与SEQ ID NO:15的核酸序列具有至少95%相同性的核酸序列。在一些实施方案中,所述表达盒包含与SEQ ID NO:15的核酸序列具有至少96%相同性的核酸序列。在一些实施方案中,所述表达盒包含与SEQID NO:15的核酸序列具有至少97%相同性的核酸序列。在一些实施方案中,所述表达盒包含与SEQ ID NO:15的核酸序列具有至少98%相同性的核酸序列。在一些实施方案中,所述表达盒包含与SEQ ID NO:15的核酸序列具有至少99%相同性的核酸序列。在一些实施方案中,所述表达盒包含SEQ ID NO:15。
在本公开的第三方面,提供一种包含表达盒的慢病毒载体,所述表达盒包含与SEQID NO:15的核酸序列具有至少95%相同性的核酸序列,并且进一步包含选自以下的绝缘子:650cHS4绝缘子、400cHS4绝缘子和泡沫病毒绝缘子。在一些实施方案中,所述绝缘子与选自SEQ ID NO:38、SEQ ID NO:39和SEQ ID NO:40的核酸序列具有至少95%序列相同性。在一些实施方案中,所述绝缘子具有选自SEQ ID NO: 38、SEQ ID NO:39和SEQ ID NO:40的核酸序列。在一些实施方案中,所述慢病毒载体进一步包含第二表达盒。在一些实施方案中,所述第二表达盒包括7sk启动子和编码用于敲低HPRT的RNAi的核酸序列。在一些实施方案中,所述第二表达盒包含与 SEQ ID NO:14的核酸序列具有至少90%相同性的核酸序列。在一些实施方案中,所述第二表达盒包含与SEQ ID NO:14的核酸序列具有至少95%相同性的核酸序列。
在本公开的第四方面,提供一种用表达载体转导的宿主细胞,所述表达载体包含可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白。在一些实施方案中,所述shRNA与选自SEQ ID NO:23、SEQ IDNO:24和SEQ ID NO:25的核酸序列具有至少95%序列相同性。在一些实施方案中,所述Wiskott-Aldrich综合征蛋白是野生型Wiskott- Aldrich综合征蛋白。在一些实施方案中,所述Wiskott-Aldrich综合征蛋白是密码子优化的Wiskott-Aldrich综合征蛋白。在一些实施方案中,所述表达载体是慢病毒表达载体。在一些实施方案中,所述宿主细胞是基本上HPRT缺陷的。在一些实施方案中,所述宿主细胞表达Wiskott-Aldrich综合征蛋白。在一些实施方案中,宿主细胞与药学上可接受的载剂一起配制。在一些实施方案中,所述宿主细胞是造血干细胞。
在本公开的第五方面,提供一种用包含表达盒的慢病毒载体转导的宿主细胞,所述表达盒包含与SEQ ID NO:15的核酸序列具有至少95%相同性的核酸序列,并且进一步包含选自以下的绝缘子:650cHS4绝缘子、400cHS4绝缘子和泡沫病毒绝缘子。在一些实施方案中,所述慢病毒载体进一步包含第二表达盒。在一些实施方案中,所述宿主细胞是基本上HPRT缺陷的。在一些实施方案中,所述宿主细胞表达 Wiskott-Aldrich综合征蛋白。在一些实施方案中,宿主细胞与药学上可接受的载剂一起配制。在一些实施方案中,所述宿主细胞是造血干细胞。
在本公开的第六方面,提供一种宿主细胞,其是HPRT缺陷的,并且表达与SEQ IDNO:5和6中任一个的氨基酸序列具有至少95%序列相同性的肽。在一些实施方案中,表达的肽与SEQ ID NO:5和6中的任一个具有至少96%序列相同性。在一些实施方案中,表达的肽与SEQ ID NO:5和6中的任一个具有至少97%序列相同性。在一些实施方案中,表达的肽与SEQ ID NO:5和6中的任一个具有至少98%序列相同性。在一些实施方案中,表达的肽与SEQID NO:5和6中的任一个具有至少99%序列相同性。在一些实施方案中,表达的肽包含SEQID NO:5和6中任一个的氨基酸序列。在一些实施方案中,所述宿主细胞是造血干细胞。
在本公开的第七方面,提供一种宿主细胞,其是HPRT缺陷的,并且表达与SEQ IDNO:5和6中任一个的氨基酸序列具有至少95%序列相同性的肽,其中通过用表达载体转导宿主细胞来制备所述宿主细胞,所述表达载体包含可操作地的连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码 Wiskott-Aldrich综合征蛋白。在一些实施方案中,表达的肽与SEQ ID NO:5和6中的任一个具有至少96%序列相同性。在一些实施方案中,表达的肽与SEQ ID NO:5和6 中的任一个具有至少97%序列相同性。在一些实施方案中,表达的肽与SEQ ID NO:5 和6中的任一个具有至少98%序列相同性。在一些实施方案中,表达的肽与SEQ ID NO:5和6中的任一个具有至少99%序列相同性。在一些实施方案中,表达的肽包含 SEQ ID NO:5和6中任一个的氨基酸序列。在一些实施方案中,所述第二表达控制序列包含MND启动子。在一些实施方案中,所述表达载体进一步包含绝缘子,所述绝缘子与选自SEQ ID NO:38、SEQ ID NO:39和SEQ ID NO:40的核酸序列具有至少95%序列相同性。在一些实施方案中,所述表达载体进一步包含绝缘子,所述绝缘子具有包含SEQID NO:38、39和40中任一个的核酸序列。在一些实施方案中,所述宿主细胞是造血干细胞。
在本公开的第八方面,提供一种包含表达载体的药物组合物,所述表达载体包含可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白;以及药学上可接受的载剂。
在本公开的第九方面,提供一种包含用表达载体转导的宿主细胞的药物组合物,所述表达载体包含可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白;以及药学上可接受的载剂。
在本公开的第十方面,提供一种选择转导的细胞的方法,所述方法包括:用表达载体转导细胞群,所述表达载体包含可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白;以及通过用嘌呤类似物选择转导的细胞来富集转导的细胞群。在一些实施方案中,所述嘌呤类似物选自6-硫鸟嘌呤(“6TG”)和6-巯嘌呤。在一些实施方案中,所述转导的细胞是HSC。在一些实施方案中,所述HSC是同种异体HSC。在一些实施方案中,所述HSC是自体HSC。在一些实施方案中,所述HSC是同胞匹配的HSC。
在本公开的第十一方面,提供一种减轻与Wiskott-Aldrich综合征相关的病理的方法,其包括向需要治疗的患者给药治疗有效量的转导的宿主细胞,其中所述转导的宿主细胞是通过用表达载体转导宿主细胞群来制备的,所述表达载体包含可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT 的shRNA;以及可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白。在一些实施方案中,与Wiskott-Aldrich综合征相关的病理选自微血小板减少症(microthrombocytopenia)、湿疹、自身免疫性疾病和复发性感染。在一些实施方案中,复发性感染包括复发性皮肤感染。在一些实施方案中,复发性感染选自中耳炎、皮肤脓肿、肺炎、小肠结肠炎、脑膜炎、脓毒和泌尿道感染。在一些实施方案中,湿疹是难治性湿疹。在一些实施方案中,自身免疫性疾病选自溶血性贫血、脉管炎、关节炎、中性粒细胞减少症、炎性肠病和IgA肾病、Henoch- 样紫癜、皮肌炎、复发性血管性水肿和葡萄膜炎。
在本公开的第十二方面,提供一种多核苷酸,其包含与SEQ ID NO:14的核酸序列具有至少95%序列相同性的第一核酸序列,以及与SEQ ID NO:15的核酸序列具有至少95%序列相同性的第二核酸序列。在一些实施方案中,所述多核苷酸进一步包含具有SEQ IDNO:13的核酸序列。在一些实施方案中,所述多核苷酸进一步包含具有SEQ ID NO:41的核酸序列。在一些实施方案中,所述多核苷酸进一步包含具有SEQ ID NO:31的核酸序列。在一些实施方案中,所述多核苷酸进一步包含选自 SEQ ID NO:38、SEQ ID NO:39和SEQ ID NO:40的核酸序列。
在一些实施方案中,第一核酸序列位于第二核酸序列的上游。在一些实施方案中,第一核酸序列具有与第二核酸序列相同的方向。在一些实施方案中,所述相同的方向是正向的方向。在一些实施方案中,第一核酸序列具有与第二核酸序列不同的方向。在一些实施方案中,所述不同的方向是相反的方向。
在一些实施方案中,第一核酸序列位于第二核酸序列的下游。在一些实施方案中,第一核酸序列具有与第二核酸序列相同的方向。在一些实施方案中,所述相同的方向是正向的方向。在一些实施方案中,第一核酸序列包含与第二核酸序列不同的方向。在一些实施方案中,所述不同的方向是相反的方向。
在一些实施方案中,第一核酸序列朝向第一方向,其中第二核酸序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。在一些实施方案中,第一核酸序列位于第二核酸序列的下游。在一些实施方案中,第一核酸序列位于第二核酸序列的上游。
在一些实施方案中,第一核酸序列朝向与第二核酸序列相同的方向。在一些实施方案中,第一核酸序列位于第二核酸序列的下游。在一些实施方案中,第一核酸序列位于第二核酸序列的上游。
在本公开的第十三方面,提供一种多核苷酸,其包含与SEQ ID NO:42- 57中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,所述核酸序列与 SEQ ID NO:42-57中的任一个具有至少95%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:42-57中的任一个具有至少96%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:42-57中的任一个具有至少97%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:42-57中的任一个具有至少98%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:42-57中的任一个具有至少99%相同性。
在本公开的第十四方面,提供一种多核苷酸,其具有SEQ ID NO:42-57中任一个的核酸序列。
在本公开的第十五方面,提供一种表达载体,其包含(a)编码pTL20c的核酸序列;(b)编码WASP表达盒的核酸;以及(c)编码7sk/sh734表达盒的核酸。在一些实施方案中,所述表达载体进一步包含编码绝缘子的核酸序列。在一些实施方案中, WASP表达盒位于7sk/sh734表达盒的上游。在一些实施方案中,具有位于7sk/sh734 表达盒上游的WASP表达盒的表达载体具有与SEQ ID NO:44、45、48和49中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,具有位于7sk/sh734表达盒上游的WASP表达盒的表达载体具有与SEQ IDNO:44、45、48和49中的任一个具有至少95%相同性的核酸序列。在一些实施方案中,具有位于7sk/sh734表达盒上游的 WASP表达盒的表达载体具有与SEQ ID NO:51、53、55和57中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,具有位于7sk/sh734表达盒上游的WASP表达盒的表达载体具有与SEQ ID NO:51、53、55和57中的任一个具有至少95%相同性的核酸序列。
在一些实施方案中,WASP表达盒位于7sk/sh734表达盒的下游。在一些实施方案中,具有位于7sk/sh734表达盒下游的WASP表达盒的表达载体具有与SEQ ID NO:42、43、46和47中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,具有位于7sk/sh734表达盒下游的WASP表达盒的表达载体具有与SEQ ID NO:42、 43、46和47中的任一个具有至少95%相同性的核酸序列。在一些实施方案中,具有位于7sk/sh734表达盒下游的WASP表达盒的表达载体具有与SEQ ID NO:50、52、54 和56中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,具有位于 7sk/sh734表达盒下游的WASP表达盒的表达载体具有与SEQ ID NO:50、52、54和56 中的任一个具有至少95%相同性的核酸序列。
在一些实施方案中,7sk/sh734表达盒和WASP表达盒朝向相同方向。在一些实施方案中,7sk/sh734表达盒和WASP表达盒朝向相反方向。在一些实施方案中, 7sk/sh734表达盒朝向相对于WASP盒正向的方向。在一些实施方案中,7sk/sh734表达盒朝向相对于WASP盒反向的方向。
在一些实施方案中,具有相对于7sk/sh734表达盒朝向相同方向的WASP 表达盒的表达载体具有与SEQ ID NO:42、44、46和48中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,具有相对于7sk/sh734表达盒朝向相同方向的 WASP表达盒的表达载体具有与SEQ ID NO:42、44、46和48中的任一个具有至少95%相同性的核酸序列。在一些实施方案中,具有相对于7sk/sh734表达盒朝向相同方向的 WASP表达盒的表达载体具有与SEQ IDNO:50、51、54和55中的任一个具有至少 90%相同性的核酸序列。在一些实施方案中,具有相对于7sk/sh734表达盒朝向相同方向的WASP表达盒的表达载体具有与SEQ ID NO:50、51、54和55中的任一个具有至少95%相同性的核酸序列。
在一些实施方案中,具有相对于7sk/sh734表达盒朝向相反方向的WASP 表达盒的表达载体具有与SEQ ID NO:43、45、47和49中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,具有相对于7sk/sh734表达盒朝向相反方向的 WASP表达盒的表达载体具有与SEQ ID NO:43、45、47和49中的任一个具有至少95%相同性的核酸序列。在一些实施方案中,具有相对于7sk/sh734表达盒朝向相反方向的 WASP表达盒的表达载体具有与SEQ IDNO:52、53、56和57中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,具有相对于7sk/sh734表达盒朝向相反方向的WASP表达盒的表达载体具有与SEQ ID NO:52、53、56和57中的任一个具有至少95%相同性的核酸序列。
本公开的第十六方面是一种多核苷酸,其包含与SEQ ID NO:58具有至少 90%相同性的核酸序列。在一些实施方案中,所述核酸序列与SEQ ID NO:58具有至少95%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:58具有至少96%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:58具有至少97%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:58具有至少98%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:58具有至少99%相同性。
本公开的第十七方面是具有SEQ ID NO:58的多核苷酸。
本公开的第十八方面是一种多核苷酸,其包含与SEQ ID NO:59具有至少90%相同性的核酸序列。在一些实施方案中,所述核酸序列与SEQ ID NO:59具有至少95%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:59具有至少96%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:59具有至少97%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:59具有至少98%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:59具有至少99%相同性。
本公开的第十九方面是具有SEQ ID NO:59的多核苷酸。
本公开的第二十方面是一种多核苷酸,其包含与SEQ ID NO:63和65中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,所述核酸序列与SEQ ID NO:63和65中的任一个具有至少95%相同性。在一些实施方案中,所述核酸序列与 SEQ ID NO:63和65中的任一个具有至少96%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:63和65中的任一个具有至少97%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:63和65中的任一个具有至少98%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:63和65中的任一个具有至少99%相同性。
本公开的第二十一方面是一种多核苷酸,其具有SEQ ID NO:63和65中的任一个。
本公开的第二十二方面是一种多核苷酸,其包含与SEQ ID NO:64和66中的任一个具有至少90%相同性的核酸序列。在一些实施方案中,所述核酸序列与SEQ ID NO:64和66中的任一个具有至少95%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:64和66中的任一个具有至少96%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:64和66中的任一个具有至少97%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:64和66中的任一个具有至少98%相同性。在一些实施方案中,所述核酸序列与SEQ ID NO:64和66中的任一个具有至少99%相同性。
本公开的第二十三方面是一种多核苷酸,其具有SEQ ID NO:64和66中的任一个。
据认为,通过组合调理和化学选择(例如使用嘌呤类似物)的策略,可以实现HPRT缺陷的、含有Wiskott-Aldrich综合征蛋白的造血干细胞的有效和高植入,并且认为这样的高植入可以在较低的总体毒性下实现。据认为,基因修饰HSC的增强植入和化学选择,结合Wiskott-Aldrich综合征蛋白的谱系特异性表达,可以导致足够频数的表达Wiskott-Aldrich综合征蛋白的细胞。作为安全措施,可以对HPRT缺陷细胞进行负选择,例如通过引入二氢叶酸还原酶抑制剂,如甲氨蝶呤(MTX)或麦考酚酸 (MPA),来抑制嘌呤从头合成途径中的二氢叶酸还原酶(DHFR),从而杀死HPRT缺陷细胞。还认为可以使用嘌呤类似物(例如6TG)方案在体内选择HPRT缺陷型HSC,以增强植入。还认为扩增的基因修饰的HSC可以分化为表达Wiskott-Aldrich综合征蛋白转基因的红细胞。
附图说明
图1A示出载体的示意图,所述载体包含编码MND启动子控制下的人 WASP基因的核酸序列。
图1B示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) 编码MND启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的 shRNA的核酸序列,其中7sk/sh734表达盒位于hWASP表达盒的下游。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ ID NO:67)或其变体(例如,包含一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人WASP基因是密码子优化的(例如SEQ IDNO:69)。在一些实施方案中,载体包含对 SEQ ID NO:44至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO: 48至少90%的序列相同性。
图1C示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) 编码MND启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的 shRNA的核酸序列,其中7sk/sh734表达盒位于hWASP表达盒的下游。与图1B所示的载体相比,7sk/sh734表达盒的方向相对相反。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ IDNO:67)或其变体(例如包括一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人WASP基因是密码子优化的(例如SEQ ID NO:69)。在一些实施方案中,载体包含对SEQ ID NO:45至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO:49至少90%的序列相同性。
图1D示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) 编码MND启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的 shRNA的核酸序列,其中7sk/sh734表达盒位于hWASp表达盒的上游。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ ID NO:67)或其变体(例如包括一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人 WASP基因是密码子优化的(例如SEQ IDNO:69)。在一些实施方案中,载体包含对 SEQ ID NO:42至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO: 46至少90%的序列相同性。
图1E示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) 编码MND启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的 shRNA的核酸序列,其中7sk/sh734表达盒位于hWASp表达盒的上游。与图1D所示的载体相比,7sk/sh734表达盒的方向相对相反。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ IDNO:67)或其变体(例如包括一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人WASP基因是密码子优化的(例如SEQ ID NO:69)。在一些实施方案中,载体包含对SEQ ID NO:43至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO:47至少90%的序列相同性。
图1F示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) 编码MND启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的 shRNA的核酸序列,其中7sk/sh734表达盒位于hWASP表达盒的下游。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ ID NO:67)或其变体(例如包括一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人 WASP基因是密码子优化的(例如SEQ IDNO:69)。在一些实施方案中,载体包含对 SEQ ID NO:51至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO: 55至少90%的序列相同性。
图1G示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) MND编码启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的 shRNA的核酸序列,其中7sk/sh734表达盒位于hWASP表达盒的下游。与图1F所示的载体相比,7sk/sh734表达盒的方向相对相反。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ IDNO:67)或其变体(例如包括一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人WASP基因是密码子优化的(例如SEQ ID NO:69)。在一些实施方案中,载体包含对SEQ ID NO:53至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO:57至少90%的序列相同性。
图1H示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) 编码MND启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的 shRNA的核酸序列,其中7sk/sh734表达盒位于hWASp表达盒的上游。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ ID NO:67)或其变体(例如包括一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人 WASP基因是密码子优化的(例如SEQ IDNO:69)。在一些实施方案中,载体包含对 SEQ ID NO:50至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO: 54至少90%的序列相同性。
图1I示出根据本公开的一些实施方案的载体的示意图,所述载体包含(i) 编码MND启动子控制下的人WASP基因的核酸序列,和(ii)编码设计为敲低HPRT的shRNA的核酸序列,其中7sk/sh734表达盒位于hWASp表达盒的上游。与图1H所示的载体相比,7sk/sh734表达盒的方向相对相反。在一些实施方案中,人WASP基因是野生型人WASP基因(例如SEQ IDNO:67)或其变体(例如包括一个、两个、三个或四个沉默突变的)(例如SEQ ID NO:68)。在一些实施方案中,人WASP基因是密码子优化的(例如SEQ ID NO:69)。在一些实施方案中,载体包含对SEQ ID NO:52至少90%的序列相同性。在一些实施方案中,载体包含对SEQ ID NO:56至少90%的序列相同性。
图2说明sh734(还参见SEQ ID NO:26)的二级结构和理论一级DICER切割位点(箭头)。二级结构具有约-30.9kcal/mol的MFE值。
图3说明sh616(还参见SEQ ID NO:23)的二级RNA结构和最小自由能 (dG)。
图4说明sh212(还参见SEQ ID NO:24)的二级RNA结构和最小自由能 (dG)。
图5说明sh734(sh734.1)(还参见SEQ ID NO:25)的修改版本。二级结构具有-36.16kcal/mol的MFE值。
图6说明人工miRNA734(111nt)的从头设计(还参见SEQ ID NO:19)。
图7说明人工miRNA211(111nt)的从头设计(还参见SEQ ID NO:20)。
图8说明嵌入在miRNA-3G骨架中的sh734,这是源自天然miRNA 16-2 结构的第三代miRNA支架(还参见SEQ ID NO:22)。
图9说明嵌入在miRNA-3G骨架中的sh211,这是源自天然miRNA 16-2结构的第三代miRNA支架(还参见SEQ ID NO:21)。
图10说明人7sk启动子突变。说明相对于TATA框(高、细框),在7sk启动子的顺式远端序列增强子(DSE)和近端序列增强子(PSE)元件(长、宽框)中引入的突变 (箭头)和缺失。Boyd,D.C.,Turner,P.C.,Watkins,N.J.,Gerster,T.&Murphy,S.Functional Redundancyof promoter Elements Ensures Efficient Transcription of the Human 7SK Gene invivo.Journal of Molecular Biology 253,677-690(1995)也描述了突变,其公开内容整体援引加入本文。
图11示出根据本公开的某些实施方案用转导的HSC治疗受试者的方法的流程图,包括调理和化学选择的步骤。
图12示出包含MND启动子、WASP密码子优化的cDNA、WPRE元件和 7SK/ShRNA的3kb片段。该片段可以首先在任何克隆质粒载体中“构建”,从而允许快速容易地克隆不同组合的不同模块。然后可以通过MluI和NotI消化来分离表达盒,并克隆到pT20Lc慢病毒载体的特有的MluI和NotI位点中,以产生最终的表达载体。
图13示出莫洛尼鼠白血病(MoMuLV)长末端重复。MND启动子可以源自 MoMuLVLTR。
图14示出HPRT的相对表达水平并且进一步示出截断值,在该点可以用嘌呤类似物选择HPRT缺陷细胞。
图15示出pTL20c-MND/hWASwt-r7SK/sh734和pTL20c-r7SK/sh734- MND/hWASco载体候选物的WASp+细胞和WASp表达的代表性结果(见表15)。
图16提供表15中列出的八种载体候选物和对照的WASp+表达百分比图。
图17提供表15中列出的八种载体候选物和对照的平均荧光强度图。
图18提供四种不同载体候选物的WASp+细胞百分比相比载体拷贝数(VCN)的图。
图19提供条形图,其示出对于四种不同的载体候选物,表示为MFI(平均荧光强度)每载体拷贝数(VCN)的WASp表达的变化。
图20A提供的图示出Jurkat细胞的6TG的初始滴定。进一步说明最佳 6TG剂量。
图20B提供的图示出转导的Jurkat细胞经化学选择后的载体拷贝数(VCN)。
图21示意性地示出WASp敲除小鼠的辐射和随后的鼠HSC的植入。
图22A示出pTL20c_SK734fwd_MND_WAS_650(SEQ ID NO:50)的载体图谱。
图22B示出pTL20c_MND_WAS_SK734fwd_650(SEQ ID NO:51)的载体图谱。
图22C示出pTL20c_SK734rev_MND_WAS_650(SEQ ID NO:52)的载体图谱。
图22D示出pTL20c_MND_WAS_SK734rev_650(SEQ ID NO:53)的载体图谱。
图22E示出pTL20c_SK734fwd_MND_coWAS_650(SEQ ID NO:54)的载体图谱。
图22F示出pTL20c_MND_coWAS_SK734fwd_650(SEQ ID NO:55)的载体图谱。
图22G示出pTL20c_SK734rev_MND_coWAS_650(SEQ ID NO:56)的载体图谱。
图22H示出pTL20c_MND_coWAS_SK734rev_650(SEQ ID NO:57)的载体图谱。
图23A提供的图示出用慢病毒载体候选物转导293T细胞后测量的相对滴度水平。
图23B提供的图示出用慢病毒载体候选物转导293T细胞后测量的相对滴度水平。
图24提供的图示出用慢病毒载体候选物转导293T细胞后测量的相对滴度水平。
序列表
利用如37C.F.R.1.822中定义的核苷酸碱基的标准字母缩写和氨基酸的三字母代码显示所附核酸和氨基酸序列。序列表作为ASCII文本文件提交,命名为“Calimmune-071WO_ST25.txt”,创建于2019年12月18日,311KB,其援引加入本文。
具体实施方式
定义
还应当理解,除非明确指出相反,在本文要求保护的包括一个以上步骤或动作的任何方法中,所述方法的步骤或动作的顺序不必限于列举所述方法的步骤或动作的顺序。
如本文所用,单数术语“一个(a)”、“一个(an)”和“该(the)”包括复数指代,除非上下文另有明确指示。相似地,词语“或”意图包括“和”,除非上下文另有明确指示。
如本文在说明书和权利要求书中所用,关于一个或多个元素的列表,短语“至少一个”应当理解为表示选自元素列表中的任何一个或多个元素的至少一个元素,但是不必包括元素列表内具体列出的每个元素中的至少一个,并且不排除元素列表中的元素的任何组合。这个定义还允许除了短语“至少一个”所指的元素列表内具体标识的元素以外的元素可以任选地存在,无论与那些具体标识的元素相关或不相关。因此,作为非限制性实例,“A和B中的至少一个”(或者相等地,“A或B中的至少一个”,或者相等地,“A和/或B中的至少一个”)在一实施方案中可以指至少一个,任选地包括一个以上,A,不存在B(并且任选地包括除B以外的元素);在另一实施方案中,指至少一个,任选地包括一个以上,B,不存在A(并且任选地包括除A以外的元素);在另一实施方案中,指至少一个,任选地包括一个以上,A,以及至少一个,任选地包括一个以上,B(并且任选地包括其他元素);等等。
如本文所用,术语“包含(comprising)”、“包括(including)”、“具有(having)”等可互换使用,并且具有相同含义。相似地,“包含(comprises)”、“包括(includes)”、“具有(has)”等可互换使用,并且具有相同含义。具体地,每个术语解释为开放术语含义“至少以下”,并且还解释为不排除额外的特征、限制、方面等。因此,例如,具有“组件a、b和c的设备”表示所述设备至少包括组件a、b和c。相似地,短语:“包括步骤a、b和c的方法”表示所述方法至少包括步骤a、b和c。此外,虽然本文中可能以特定顺序列出步骤和过程,但技术人员会认识到排序步骤和过程可以变化。
如本文在说明书和权利要求书中所用,“或”应答理解为具有与如上文定义的“和/或”相同的含义。例如,当分隔列表中的项目时,“或”或者“和/或”应当解释为包含性的,即,包含若干元素或元素列表中的至少一个,但是还包括一个以上,以及任选地,额外的未列出的项目。只有明确指出相反的术语,如“仅其中一个”或“恰好其中一个”,或者,当用于权利要求书时,“由…组成”,是指包括若干元素或元素列表中的恰好一个元素。一般来说,当前面是排他性术语,如“任一”、“其中一个”、“仅其中一个”或“恰好其中一个”,如本文所用的术语“或”应当仅解释为表示排他性可选物(即“一个或另一个但不是两个”)。当在权利要求书中使用时,“基本上由…组成”应当具有其在专利法领域中使用的普通含义。
如本文所用,术语“给药(administer)”或“给药(administering)”是指向需要治疗的受试者(例如人类患者)提供组合物、制剂或特定药剂,包括本文描述的那些。
如本文所用,术语“表达盒”是指载体内的一个或多个基因序列,其可以表达RNA,并且在一些实施方案中,随后表达蛋白。表达盒包含至少一个启动子和至少一个所关注的基因。在一些实施方案中,表达盒包括至少一个启动子,至少一个所关注的基因,以及至少一个编码用于表达的分子(例如RNAi)的额外核酸序列。在一些实施方案中,表达盒在载体内按位置和顺序定向,从而盒中的核酸可以在转化的细胞(例如转导的干细胞)中转录为RNA,并且在必要时翻译为蛋白或多肽,进行活性所需的适当翻译后修饰,并且通过靶向适当的细胞内区室或分泌至细胞外区室来移位至生物活性的适当区室。在一些实施方案中,盒的3'和5'末端适合插入载体,例如,其在每个末端具有限制性内切核酸酶位点。
如本文所用,术语“功能性核酸”是指具有通过与编码蛋白的转录物直接相互作用来减少蛋白表达的能力的分子。siRNA分子、核糖核酸酶和反义核酸构成示例性功能性核酸。
如本文所用,术语“基因”泛指与生物学功能相关的任何DNA片段。基因涵盖序列,包括但不限于编码序列、启动子区、顺式调节序列、调节蛋白的特异性识别序列的非表达的DNA片段、有助于基因表达的非表达的DNA片段、设计为具有期望参数的DNA片段,或者它们的组合。
如本文所用,术语“基因沉默”旨在描述基因、转录物和/或多肽产物的下调、敲低、降解、抑制、压制、阻遏、预防或表达降低。基因沉默和干扰还描述了防止 mRNA转录物翻译为多肽。在一些实施方案中,通过降解mRNA转录物或阻断mRNA 翻译来防止、抑制或减少翻译。
如本文所用,术语“基因表达”是指从DNA序列产生生物活性多肽的细胞过程。
如本文所用,术语“造血细胞移植物”或“造血细胞移植”是指骨髓移植、外周血干细胞移植、脐静脉血移植或多能造血干细胞的任何其他来源。同样地,术语“干细胞移植物”或“移植物”是指包含与药学上可接受的载剂接触(例如悬浮于其中)的干细胞的组合物。这类组合物能够通过导管给药至受试者。
如本文所用,术语“宿主细胞”是指将利用本公开的方法修饰的细胞。在一些实施方案中,宿主细胞是其中表达载体可以表达的哺乳动物细胞。合适的哺乳动物宿主细胞包括但不限于人细胞、鼠细胞、非人灵长类细胞(例如恒河猴细胞)、人祖细胞或干细胞、293细胞、HeLa细胞、D17细胞、MDCK细胞、BHK细胞以及Cf2Th细胞。在某些实施方案中,包含本公开的表达载体的宿主细胞是造血细胞,如造血祖细胞/干细胞(例如CD34阳性造血祖细胞/干细胞)、单核细胞、巨噬细胞、外周血单个核细胞、CD4+T淋巴细胞、CD8+T淋巴细胞或树突细胞。用本公开的表达载体转导的造血细胞(例如CD4+T淋巴细胞、CD8+T淋巴细胞和/或单核细胞/巨噬细胞)可以是同种异体的、自体的或来自匹配的同胞。在一些实施方案中,造血细胞是CD34阳性的,并且可以分离自患者的骨髓或外周血。在一些实施方案中,用如本文描述的表达载体转导分离的CD34阳性造血细胞(和/或本文描述的其他造血细胞)。
如本文所用,术语“造血干细胞”或“HSC”是指能够分化为造血系统的所有细胞类型的多能细胞,包括但不限于粒细胞、单核细胞、红细胞、巨核细胞、淋巴细胞、树突细胞;以及自我更新活性,即分裂并产生至少一个具有与亲本细胞相同(例如,自我更新)特征的子细胞的能力。
如本文所用,“HPRT”是由HPRT1基因编码的参与嘌呤代谢的酶。HPRT1 位于X染色体上,因此在男性中以单拷贝形式存在。HPRT1编码转移酶,其通过将5- 磷酸核糖基从5-磷酸核糖基1-焦磷酸转移至嘌呤来催化次黄嘌呤转化为肌苷单磷酸和鸟嘌呤转化为鸟苷单磷酸。该酶的主要功能是从降解的DNA回收嘌呤用于重新合成嘌呤(还见图37)。
如本文所用,术语“慢病毒”是指能够感染分裂和非分裂细胞的逆转录病毒属。慢病毒的几个实例包括HIV(人免疫缺陷病毒:包括HIV 1型和HIV 2型),人类获得性免疫缺陷综合征(AIDS)的病原体;visna-maedi,其引起绵羊的脑炎(visna)或肺炎(maedi);山羊关节炎-脑炎病毒,其引起山羊的免疫缺陷、关节炎和脑病;马传染性贫血病毒,其引起马的自身免疫性溶血性贫血和脑病;猫免疫缺陷病毒(FIV),其引起猫的免疫缺陷;牛免疫缺陷病毒(BIV),其引起牛的淋巴结病、淋巴细胞增多和可能的中枢神经系统感染;以及猿猴免疫缺陷病毒(SIV),其引起亚人灵长类的免疫缺陷和脑病。
如本文所用,术语“慢病毒载体”用来表示源自慢病毒并用来通过转导将遗传物质转移至细胞中的任何形式的核酸。该术语涵盖慢病毒载体核酸,如DNA和 RNA,这些核酸的包裹形式,以及其中已包装病毒载体核酸的病毒颗粒。
如本文所用,当用来指RNAi对基因表达的影响时,术语“敲低(knock down)”或“敲低(knockdown)”表示基因表达水平被抑制,或者降低至低于在基本上相同的条件但不存在RNAi下检查时通常观察到的水平。
如本文所用,术语“小细胞”是指细菌细胞的无核形式,由二分裂期间细胞分裂与DNA分离的协调紊乱产生。小细胞不同于在某些情况下自发产生和释放的其他小囊泡,并且与小细胞相反,不是由于特定基因重排或游离基因表达。本公开的小细胞是大肠杆菌或其他细菌细胞的无核形式,由二分裂期间细胞分裂与DNA分离的协调紊乱产生。原核染色体复制与正常二分裂有关,其包括中细胞隔膜形成。在大肠杆菌中,例如,min基因如minCD的突变可以消除细胞分裂期间对细胞极处隔膜形成的抑制,导致产生正常的子细胞和无核小细胞。参见de Boer et al.,1992;Raskin&de Boer, 1999;Hu&Lutkenhaus,1999;Harry,2001。小细胞不同于在某些情况下自发产生和释放的其他小囊泡,并且与小细胞相反,不是由于特定基因重排或游离基因表达。为了实施本公开,期望小细胞具有完整的细胞壁(“完整的小细胞”)。除了min操纵子突变,在影响隔膜形成的一系列其他基因重排或突变之后也产生无核小细胞,例如在枯草芽孢杆菌的divIVB1中。参见Reeve and Cornett,1975;Levinet al.,1992。在参与细胞分裂/染色体分离的蛋白的基因表达水平发生扰动之后也可以形成小细胞。例如,minE 的过量表达导致极性分裂和小细胞的产生。相似地,无染色体小细胞可能由染色体分离缺陷所致,例如枯草芽孢杆菌中的smc突变(Britton et al.,1998)、枯草芽孢杆菌中的 spoOJ缺失(Ireton et al.,1994)、大肠杆菌中的mukB突变(Hiraga etal.,1989)和大肠杆菌中的parC突变(Stewart and D'Ari,1992)。基因产物可以反式提供。例如,当从高拷贝数质粒过量表达时,CafA可以提高细胞分裂的速度和/或抑制复制后的染色体分配 (Okada et al.,1994),导致链状细胞和无核小细胞的形成(Wachi et al.,1989;Okada et al., 1993)。小细胞可以制备自革兰氏阳性或革兰氏阴性来源的任何细菌细胞。
如本文所用,术语“miRNA”或“microRNA”是指20-22个核苷酸的小的非编码RNA,通常从称作pre-miRNA的约70个核苷酸的折回(foldback)RNA前体结构中切除。根据miRNA和靶标之间的互补程度,miRNA以两种方式之一对它们的靶标进行负调节。首先,以完全或几乎完全互补的方式与蛋白编码mRNA序列结合的 miRNA诱导RNA介导的干扰(RNAi)途径。通过与其mRNA靶标的3′非翻译区(UTR) 内的不完全互补位点结合来发挥其调节作用的miRNA,通过与用于RNAi途径的相似或可能相同的RISC复合物,显然是在翻译水平上,转录后抑制靶基因表达。与翻译控制一致,使用这种机制的miRNA降低其靶基因的蛋白水平,但是这些基因的mRNA水平仅受到最低限度的影响。miRNA涵盖天然存在的miRNA以及可以特异性地靶向任何mRNA序列的人工设计的miRNA。例如,在一实施方案中,技术人员可以设计表达为人miRNA(例如,miR-30或miR-21)初级转录物的短发夹RNA构建体。这种设计向发夹构建体添加Drosha加工位点,并且已表现出极大地增加敲低效率 (Pusch et al.,2004)。发夹茎由22-nt的dsRNA(例如,反义与期望的靶标具有完美互补性)和来自人miR的约15-约19个核苷酸环组成。据认为与没有microRNA的常规 shRNA设计相比,通过在发夹的任一侧或两侧添加miR环和miR30侧翼序列导致表达的发夹的Drosha和DICER加工增加10倍以上。增加的Drosha和DICER加工翻译为更高的siRNA/miRNA产量和表达的发夹的更大效力。
如本文所用,术语“突变的”是指序列的变化,如核苷酸或氨基酸序列,从各自序列的天然、标准或参考版本,即非突变的序列发生变化。突变的基因可以导致突变的基因产物。突变的基因产物与非突变的基因产物的不同之处在于一个或多个氨基酸残基。在一些实施方案中,导致突变的基因产物的突变的基因可以与相应的非突变的核苷酸序列具有约70%、约75%、约80%、约85%、约90%、约95%或更大的序列相同性。
如本文所用,术语“纳米胶囊”是指具有壳的纳米颗粒,例如聚合物壳,包裹一种或多种组分,例如一种或多种蛋白和/或一种或多种核酸。在一些实施方案中,纳米胶囊具有小于或等于约200纳米(nm)的平均直径,例如约1至200nm,或约5至约200nm,或约10至约150nm,或15至100nm,或约15至约150nm,或约20至约125nm,或约50至约100nm,或约50至约75nm。在其他实施方案中,纳米胶囊的平均直径为约10nm至约20nm、约20至约25nm、约25nm至约30nm、约30nm 至约35nm、约35nm至约40nm、约40nm至约45nm、约45nm至约50nm、约50 nm至约55nm、约55nm至约60nm、约60nm至约65nm、约70至约75nm、约75 nm至约80nm、约80nm至约85nm、约85nm至约90nm、约90nm至约95nm、约 95nm至约100nm或约100nm至约110nm。在一些实施方案中,纳米胶囊设计为在约1小时,或约2小时,或约3小时,或约4小时,或约5小时,或约6或约12小时,或约1天,或约2天,或约1周,或约1个月内降解。在一些实施方案中,纳米胶囊的表面可以具有约1至约15毫伏(mV)的电荷(如在标准磷酸盐溶液中测量的)。在其他实施方案中,纳米胶囊的表面可以具有约1至约10mV的电荷。
如本文所用,术语“可操作地连接”是指核酸表达控制序列(如启动子、信号序列、增强子或转录因子结合位点的阵列)和第二核酸序列之间的功能连接,其中当适当的分子(例如,转录激活蛋白)结合至表达控制序列时,表达控制序列影响对应于第二序列的核酸的转录和/或翻译。
如本文所用,术语“启动子”是指RNA聚合酶结合的多核苷酸(DNA或 RNA)的识别位点。RNA聚合酶启动并转录可操作地连接至启动子的多核苷酸。在一些实施方案中,在哺乳动物细胞中可使用的启动子包含位于转录起始位点上游约25至 30个碱基处的富含AT的区域和/或在转录开始上游约70至约80个碱基处发现的另一序列,例如CNCAAT区,其中N可以是任何核苷酸。
如本文所用,术语“逆转录病毒”是指这样的病毒,其具有通过逆转录病毒逆转录酶逆转录为整合入宿主细胞基因组的cDNA拷贝的RNA基因组。逆转录病毒载体和制备逆转录病毒载体的方法是本领域已知的。简单地说,为了构建逆转录病毒载体,将编码所关注的基因的核酸插入病毒基因组代替某些病毒序列以产生复制缺陷的病毒。为了产生病毒粒子,构建包含gag、pol和env基因但不含LTR和包装组分的包装细胞系(Mann et al.,Cell,Vol.33:153-159,1983)。当将包含cDNA的重组质粒连同逆转录病毒LTR和包装序列引入这个细胞系时,包装序列允许将重组质粒的RNA转录物包装为病毒颗粒,然后将其分泌至培养基中。然后收集包含重组逆转录病毒的培养基,任选地浓缩,并且用于基因转移。
如本文所用,术语“siRNA”或“小干扰RNA”是指由约十个核苷酸至几十个核苷酸组成的短双链RNA,其诱导RNAi(RNA干扰),即诱导靶mRNA的降解或通过切割靶mRNA来抑制靶基因的表达。RNA干扰(“RNAi”)是一种基因表达的转录后抑制的方法,在许多真核生物体中是保守的,并且其是指一种现象,其中将由具有与靶基因的mRNA同源序列的正义RNA和具有与其互补序列的反义RNA组成的双链RNA 引入细胞等,从而其可以选择性地诱导靶基因的mRNA降解或者可以抑制靶基因的表达。RNAi是由细胞中存在的短(即,少于约30个核苷酸)双链RNA分子诱导的(Fire A. et al.,Nature,391:806-811,1998)。当将siRNA引入细胞时,具有与siRNA互补的核苷酸序列的靶基因的mRNA的表达会被抑制。
如本文所用,术语“小发夹RNA”或“shRNA”是指包含反义区、环部分和正义区的RNA分子,其中正义区具有与反义区碱基配对以形成双链茎的互补核苷酸。转录后加工之后,小发夹RNA通过酶DICER介导的切割事件转化为小干扰RNA,所述酶DICER是RNase III家族的成员。如本文所用,短语“转录后加工”是指发生在转录之后并由例如酶DICER和/或Drosha介导的mRNA加工。
如本文所用,术语“受试者”是指哺乳动物如人、小鼠或灵长类动物。通常,所述哺乳动物是人(智人)。
如本文所用,术语“治疗基因”是指可以为了治疗或预防疾病的目的而给药至受试者的基因。
如本文所用,术语“转导(transduce)”或“转导(transduction)”是指利用病毒或逆转录病毒载体通过感染而不是通过转染来递送基因。例如,可以将逆转录病毒载体 (用于将核酸引入细胞的用作载体的修饰的逆转录病毒)携带的抗HPRT基因通过感染和原病毒整合转导至细胞中。因此,“转导的基因”是已通过慢病毒或载体感染以及原病毒整合引入细胞的基因。病毒载体(例如,“转导载体”)将基因转导至“靶细胞”或宿主细胞中。
如本文所用,关于特定疾病状况,术语“治疗(treatment)”、“治疗(treating)”或“治疗(treat)”是指获得期望的药理学和/或生理学效果。在完全或部分预防疾病或其症状方面,效果可以是预防性的,和/或在部分或完全治愈疾病和/或可归因于疾病的不利影响方面,效果可以是治疗性的。如本文所用,“治疗”涵盖对受试者,特别是人的疾病或病症的任何治疗,并且包括:(a)预防可能易患疾病但尚未诊断为患有该疾病的受试者中发生疾病或病症;(b)抑制疾病或病症,即,阻止其发展;以及(c)缓解或减轻疾病或病症,即,引起疾病或病症的消退和/或缓解一种或多种疾病或病症症状。“治疗”还可以涵盖药剂的递送或治疗的给药以提供药理效应,甚至在不存在疾病、病症或疾病状况的情况下。在一些实施方案中,术语“治疗”用来指给药本公开的化合物以减轻宿主(优选哺乳动物受试者,更优选人)的疾病或病症。因此,术语“治疗”可以包括:预防宿主中发生病症,特别是当宿主易患疾病但尚未诊断患有该疾病时;抑制病症;和/或减轻或逆转病症。就本公开的方法涉及预防病症而言,应当理解术语“预防”不要求完全阻止疾病状态。相反,如本文所用,术语预防是指技术人员鉴定易患病症的群体的能力,从而本公开的化合物的给药可以在疾病发作之前发生。该术语并不表示必须完全避免疾病状态。
如本文所用,术语“载体”是指能够介导另一核酸分子进入(例如,转移、转运等)细胞的核酸分子。转移的核酸一般连接至(例如,插入)载体核酸分子。载体可以包括指导自主复制的序列,或者可以包括足以允许整合至宿主细胞DNA中的序列。对本领域普通技术人员来说显而易见的是,除了介导转移的核酸进入的核酸之外,病毒载体可以包括各种病毒组分。许多载体是本领域已知的,包括但不限于线性多核苷酸、与离子或两亲性化合物相关的多核苷酸、质粒以及病毒载体。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体(包括慢病毒载体)等。
表达载体
在一些实施方案中,本公开提供包括至少两种用于表达的核酸序列的表达载体(例如慢病毒表达载体)。在一些实施方案中,所述核酸序列编码核酸分子(例如RNA、mRNA或可以在细胞的细胞质中发现的另一分子)。在一些实施方案中,表达载体包括第一核酸序列,其编码设计为敲低HPRT基因或以其他方式实现HPRT表达降低的物质。在一些实施方案中,表达载体包括编码Wiskott-Aldrich综合征蛋白的第二核酸。
在一些实施方案中,表达载体是自我失活的慢病毒载体。在其他实施方案中,表达载体是逆转录病毒载体。慢病毒基因组一般组织为5'长末端重复(LTR)、gag 基因、pol基因、env基因、辅助基因(nef、vif、vpr、vpu)和3'LTR。病毒LTR分为三个区域,称作U3、R和U5。U3区包含增强子和启动子元件。U5区包含多腺苷酸化信号。R(重复)区将U3和U5区分开,并且R区的转录序列出现在病毒RNA的5'和3' 末端。参见,例如,"RNA Viruses:A PracticalApproach"(Alan J.Cann,Ed.,Oxford University Press,(2000));O Narayan andClements(1989)J.Gen.Virology,Vol.70:1617- 1639;Fields et al.(1990)FundamentalVirology Raven Press.;Miyoshi H,Blamer U, Takahashi M,Gage F H,Verma I M.(1998)J Virol.,Vol.72(10):8150 7和美国专利号 6,013,516。已用来感染HSC的慢病毒载体的实例在以下出版物中进行了描述,每个出版物均整体援引加入本文:Evans et al.,Hum Gene Ther.,Vol.10:1479-1489,1999;Case et al.,Proc Natl Acad Sci USA,Vol.96:2988-2993,1999;Uchida et al.,Proc Natl Acad Sci USA,Vol.95:11939-11944,1998;Miyoshi et al.,Science,Vol.283:682-686,1999;和 Sutton et al.,J.Virol.,Vol.72:5781-5788,1998。
在一些实施方案中,表达载体是修饰的慢病毒,因此能够感染分裂和非分裂细胞。在一些实施方案中,修饰的慢病毒基因组缺少病毒复制所需的慢病毒蛋白的基因,因此防止不期望的复制,如在靶细胞中的复制。在一些实施方案中,在产生重组逆转录病毒或慢病毒期间,在包装细胞系中反式提供修饰的基因组复制所需的蛋白。
在一些实施方案中,表达载体包含来自慢病毒的5'和3'长末端重复(LTR)的序列。在一些实施方案中,载体包含来自慢病毒的5'LTR的R和U5序列以及来自慢病毒的失活的或自我失活的3'LTR。在一些实施方案中,LTR序列是HIV LTR序列。
美国专利申请公开号2018/0112220公开了慢病毒表达载体的额外组分(以及合成和/或产生这类载体的方法),其公开内容整体援引加入本文。例如,慢病毒表达载体可以包括中央多嘌呤束(例如具有SEQ ID NO:41)、WPRE元件(例如具有SEQ ID NO:13)和Rev应答元件(例如具有SEQ ID NO:38)中的一种或多种。这些额外的元件例如在图1A-1E中说明。
在一些实施方案中,本文考虑的慢病毒载体可以是整合的或非整合的(也称作整合缺陷的慢病毒)。如本文所用,术语“整合缺陷的慢病毒”或“IDLV”是指具有整合酶的慢病毒,所述整合酶缺少将病毒基因组整合至宿主细胞基因组中的能力。在一些应用中,使用整合慢病毒载体可以避免整合慢病毒诱导的潜在的插入诱变。整合缺陷的慢病毒载体通常通过突变慢病毒整合酶基因或通过修饰LTR的附着序列来产生(参见,例如Sarkis et al.,Curr.Gene.Ther.,6:430-437(2008))。慢病毒整合酶由HIV-1 Pol区编码,并且不可以将该区缺失,因为其编码其他关键活性,包括逆转录、核输入和病毒颗粒组装。改变整合酶蛋白的pol中的突变属于两类之一:选择性地仅影响整合酶活性的那些(I类);或者具有多效性效应的那些(II类)。贯穿整合酶蛋白的N和C末端以及催化核心区的突变产生影响多种功能的II类突变,包括颗粒形成和逆转录。I类突变限制了它们对催化活性、DNA结合、线性附加体(episome)加工和整合酶的多聚化的影响。最常见的I类突变位点是整合酶催化核心处的三联体残基,包括D64、D116 和E152。每个突变已显示有效抑制整合,整合频率比正常整合载体低达四个对数,同时保持NILV的转基因表达。抑制整合的另一可选方法是在分别在5'和3'LTR末端的 U3区的12个碱基对区内或U5区的11个碱基对区内的整合酶DNA附着位点(LTR att 位点)引入突变。这些序列包括在整合酶介导的末端加工之后暴露的保守的末端CA二核苷酸。在保守的CA/TG二核苷酸处的单突变或双突变导致整合频率降低达3-4个对数;但是,其保留有效病毒转导的所有其他必需功能。
在一些实施方案中,所述载体是腺相关病毒(AAV)载体。如本文所用,术语“腺相关病毒(AAV)载体”表示包含AAV载体基因组(其又包含本文提到的第一表达盒和第二表达盒)的AAV病毒颗粒。其意在包括所有血清型的AAV载体,优选AAV-1至 AAV-9,更优选AAV-1、AAV-2、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9和它们的组合。由不同血清型的组合产生的AAV载体可以称作杂合AAV载体。在一实施方案中,AAV载体选自AAV-1、AAV-2、AAV-4、AAV-5和AAV-6,以及它们的组合。在一实施方案中,AAV载体是AAV-5载体。在一实施方案中,AAV载体是包含 AAV-2反向末端重复序列(ITR)的AAV-5载体。本公开还考虑包含天然存在的病毒蛋白 (例如,一种或多种衣壳蛋白)的变体的AAV载体。
实现HPRT基因敲低的组分
在一些实施方案中,编码设计为敲低HPRT基因或者实现其表达的降低的物质的核酸序列是RNA干扰剂(RNAi)。在一些实施方案中,RNAi剂是shRNA、 microRNA或它们的杂合体。
RNAi
在一些实施方案中,表达载体包含编码RNAi的第一核酸序列。RNA干扰是一种通过复杂的多步酶促过程(例如涉及序列特异性双链小干扰RNA(siRNA)的过程) 触发同源转录物的降解,从而使基因表达转录后沉默的方法。RNAi途径的简化模型是基于两个步骤,每个步骤涉及核糖核酸酶。在第一步中,通过RNase II酶DICER和Drosha将触发RNA(dsRNA或miRNA初级转录物)加工为短的干扰RNA(siRNA)。在第二步中,将siRNA加载至效应复合物RNA诱导的沉默复合物(RISC)中。siRNA在 RISC组装期间解开,并且单链RNA与mRNA靶标杂交。据认为基因沉默是通过 RNase H酶Argonaute(Slicer)对靶向mRNA进行溶核降解的结果。如果siRNA/mRNA 双链体包含错配,则mRNA不被切割。相反,基因沉默是翻译抑制的结果。
在一些实施方案中,RNAi剂是抑制或沉默核酸。如本文所用,“沉默核酸”是指能够与特异性序列相互作用以抑制基因表达的任何多核苷酸。沉默核酸的实例包括RNA双链体(例如siRNA、shRNA)、锁核酸(“LNA”)、反义RNA、编码siRNA或 shRNA的正义和/或反义序列的DNA多核苷酸、DNA酶或核酶。技术人员会理解基因表达的抑制不必是来自特定列举序列的基因表达,并且可以是例如来自该特定序列控制的序列的基因表达。
构建干扰RNA的方法是本领域已知的。例如,干扰RNA可以由两条独立的寡核苷酸组装而成,其中一条链是正义链,另一条是反义链,其中反义链和正义链是自身互补的(即,每条链包含与另一条链中的核苷酸序列互补的核苷酸序列;如其中反义链和正义链形成双链体或双链结构);反义链包含与靶核酸分子或其部分(即,不期望的基因)中的核苷酸序列互补的核苷酸序列,并且正义链包含对应于靶核酸序列或其部分的核苷酸序列。或者,干扰RNA可以由单个寡核苷酸组装而成,其中自身互补的正义区和反义区通过基于核酸或基于非核酸的接头连接。干扰RNA可以是具有双链体、不对称双链体、发夹或不对称发夹二级结构的多核苷酸,具有自身互补的正义和反义区,其中反义区包含与单独的靶核酸分子或其部分中的核苷酸序列互补的核苷酸序列,并且正义区具有对应于靶核酸序列或其部分的核苷酸序列。干扰RNA可以是环状单链多核苷酸,其具有两个或更多个环结构以及包含自身互补的正义区和反义区的茎,其中反义区包含与靶核酸分子或其部分中的核苷酸序列互补的核苷酸序列,并且正义区具有对应于靶核酸序列或其部分的核苷酸序列,并且其中环状多核苷酸可以在体内或体外加工以产生能够介导RNA干扰的活性siRNA分子。
在一些实施方案中,干扰RNA编码区编码具有正义区、反义区和环区的自身互补的RNA分子。当表达时,这样的RNA分子理想地形成“发夹”结构,并且在本文中称作“shRNA”。在一些实施方案中,环区的长度一般在约2至约10个核苷酸之间(仅作为实例,参见SEQ IDNO:32)。在其他实施方案中,环区的长度为约6至约9 个核苷酸。在一些实施方案中,正义区和反义区的长度在约15至约30个核苷酸之间。转录后加工之后,小发夹RNA通过酶DICER介导的切割事件转化为siRNA,所述酶 DICER是RNase III家族的成员。然后siRNA能够抑制与其享有同源性的基因的表达。进一步的细节描述参见Brummelkamp et al.,Science 296:550-553,(2002);Lee et al, Nature Biotechnol.,20,500-505,(2002);Miyagishi andTaira,Nature Biotechnol 20:497- 500,(2002);Paddison et al.Genes&Dev.16:948-958,(2002);Paul,Nature Biotechnol, 20,505-508,(2002);Sui,Proc.Natl.Acad.Sd.USA,99(6),5515-5520,(2002);和Yu et al.Proc NatlAcadSci USA99:6047-6052,(2002),其公开内容整体援引加入本文。
shRNA
在一些实施方案中,第一核酸序列编码靶向HPRT基因的shRNA。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:26 (本文中称为"sh734")的序列具有至少80%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:26的序列具有至少85%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:26的序列具有至少90%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:26的序列具有至少 95%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:26的序列具有至少96%相同性的序列。在进一步的实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ IDNO:26的序列具有至少97%相同性的序列。在甚至进一步的实施方案中,编码靶向HPRT基因的 shRNA的第一核酸序列具有与SEQ ID NO:26的序列具有至少98%相同性的序列。在甚至更进一步的实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与 SEQ ID NO:26的序列具有至少99%相同性的序列。在其他实施方案中,编码靶向 HPRT基因的shRNA的第一核酸序列具有SEQ ID NO:26的序列(还参见图11)。
在一些实施方案中,SEQ ID NO:26的核酸序列可以是修饰的。在一些实施方案中,所述修饰包括:(i)掺入hsa-miR-22环序列(例如CCUGACCCA)(SEQ ID NO:33);(ii)添加5'-3'核苷酸间隔区,如具有两个或三个核苷酸的间隔区(例如TA); (iii)5'起始修饰,如添加一个或多个核苷酸(例如G);和/或(iv)将两个核苷酸5'和3'添加至茎和环(例如5'A和3'T)。一般来说,将第一代shRNA加工为小RNA的异质混合物,并且已显示前体转录物的积累在体内诱导序列依赖性和非依赖性的非特异性脱靶效应。因此,基于目前对DICER加工和特异性的理解,应用设计规则来优化sh734的结构以及DICER持续合成能力(processivity)和效率(还参见Gu,S.,Y.Zhang,L.Jin,Y. Huang,F.Zhang,M.C.Bassik,M.Kampmann,andM.A.Kay.2014.Weak base pairing in both seed and 3′regions reduce RNAi off-targets and enhances si/shRNA designs.Nucleic Acids Research 42:12169-12176)。
在一些实施方案中,通过将两个核苷酸(例如,分别为G和C)5'和3'添加至发夹环(SEQ ID NO:32)来修饰SEQ ID NO:26的核酸序列,从而将引导链的长度从约19个核苷酸延长至约21个核苷酸,并且用hsa-miR-22环CCUGACCCA(SEQ ID NO:33)替代环,以提供SEQ IDNO:27的核苷酸序列。在一些实施方案中,编码靶向 HPRT基因的shRNA的核酸序列具有与SEQ ID NO:27的序列具有至少90%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:27的序列具有至少95%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:27的序列具有至少96%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO: 27的序列具有至少97%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:27的序列具有至少98%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO: 27的序列具有至少99%相同性的序列。在其他实施方案中,编码靶向HPRT基因的 shRNA的核酸序列具有SEQ ID NO:27的序列。据认为与SEQ ID NO:26相比,SEQ ID NO:27编码的shRNA实现相似的HPRT敲低。同样地,据认为通过表达SEQ ID NO:27编码的shRNA敲低HPRT来使HPRT缺陷的细胞允许利用硫鸟嘌呤类似物(例如6TG)进行选择。
在一些实施方案中,存在于载体内的RNAi编码核酸分子,如与SEQ ID NO:16或SEQID NO:17之一具有至少95%序列相同性的核酸分子。在一些实施方案中,存在于载体内的RNAi编码核酸分子,如与SEQ ID NO:16或SEQ ID NO:17之一具有至少97%序列相同性的核酸分子。在一些实施方案中,存在于载体内的RNAi编码核酸分子,如具有SEQ ID NO:16或SEQ ID NO:17之一的核酸分子。在一些实施方案中,在宿主细胞的细胞质中发现具有SEQID NO:16或SEQ ID NO:17的核酸分子。在一些实施方案中,本公开提供一种宿主细胞,其包含至少一种选自SEQ ID NO: 16或SEQ ID NO:17的核酸分子。
在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ IDNO:23(本文中称为“shHPRT 616”)的序列具有至少80%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO: 23的序列具有至少85%相同性的序列。在其他实施方案中,编码靶向HPRT基因的 shRNA的核酸序列具有与SEQ IDNO:23的序列具有至少90%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:23 的序列具有至少95%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:23的序列具有至少96%相同性的序列。在进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:23 的序列具有至少97%相同性的序列。在甚至更进一步的实施方案中,编码靶向HPRT 基因的shRNA的核酸序列具有与SEQ ID NO:23的序列具有至少98%相同性的序列。在甚至进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:23的序列具有至少99%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有SEQ ID NO:23的序列(还参见图3)。
在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ IDNO:24(本文中称为“shHPRT 211”)的序列具有至少80%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO: 24的序列具有至少85%相同性的序列。在其他实施方案中,编码靶向HPRT基因的 shRNA的核酸序列具有与SEQ IDNO:24的序列具有至少90%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:24 的序列具有至少95%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:24的序列具有至少96%相同性的序列。在进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:24 的序列具有至少97%相同性的序列。在甚至进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:24的序列具有至少98%相同性的序列。在甚至进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:24的序列具有至少99%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有SEQ ID NO:24的序列(还参见图4)。
在一些实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与 SEQ ID NO:25(本文中称为“shHPRT 734.1”)的序列具有至少80%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:25的序列具有至少85%相同性的序列。在其他实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:25的序列具有至少90%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:25的序列具有至少95%相同性的序列。在仍然其他的实施方案中,编码靶向HPRT基因的shRNA 的核酸序列具有与SEQ ID NO:25的序列具有至少96%相同性的序列。在进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:25的序列具有至少97%相同性的序列。在甚至进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO:25的序列具有至少98%相同性的序列。在甚至进一步的实施方案中,编码靶向HPRT基因的shRNA的核酸序列具有与SEQ ID NO: 25的序列具有至少99%相同性的序列。在其他实施方案中,编码靶向HPRT基因的 shRNA的核酸序列具有SEQID NO:25的序列(还参见图5)。
MicroRNA
MicroRNA(miR)是一组非编码RNA,其转录后调控其靶基因的表达。据认为这些单链分子与其他蛋白形成miRNA介导的沉默复合物(miRISC),所述其他蛋白结合至它们的靶mRNA的3'非翻译区(UTR)以防止它们在细胞质中翻译。
在一些实施方案中,shRNA序列包埋在micro-RNA二级结构中(“基于 micro-RNA的shRNA”)。在一些实施方案中,靶向HPRT的shRNA核酸序列包埋在 micro-RNA二级结构内。在一些实施方案中,基于micro-RNA的shRNA靶向HPRT内的编码序列以实现HPRT表达的敲低,据认为这等同于利用靶向HPRT的shRNA而没有伴随的途径饱和和细胞毒性或脱靶效应。在一些实施方案中,基于micro-RNA的 shRNA是从头人工microRNA shRNA。Fang,W.&Bartel,David P.The Menu of Features that Define Primary MicroRNAs and Enable De NovoDesign of MicroRNA Genes. Molecular Cell 60,131-145描述了这类从头基于micro-RNA的shRNA的产生,其公开内容整体援引加入本文。
在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:34的序列具有至少80%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA 具有与SEQ ID NO:34的序列具有至少85%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:34的序列具有至少90%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:34的序列具有至少95%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与 SEQ ID NO:34的序列具有至少96%相同性的核酸序列。在一些实施方案中,基于 micro-RNA的shRNA具有与SEQ ID NO:34的序列具有至少97%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:34的序列具有至少 98%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQID NO:34的序列具有至少98%相同性的核酸序列。在一些实施方案中,基于micro- RNA的shRNA具有SEQ ID NO:34("miRNA734-Denovo")的序列(还参见图6)。SEQ ID NO:34的RNA形式可以在SEQ ID NO:19中找到。
在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的序列具有至少80%相同性的序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的序列具有至少85%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQID NO:35的序列具有至少90%相同性的序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的序列具有至少 95%相同性的序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的序列具有至少96%相同性的序列。在一些实施方案中,基于micro-RNA的 shRNA具有与SEQ ID NO:35的序列具有至少97%相同性的序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的序列具有至少98%相同性的序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的序列具有至少 99%相同性的序列。在一些实施方案中,基于micro-RNA的shRNA具有SEQ ID NO: 35("miRNA211-Denovo")的核酸序列(还参见图7)。SEQ ID NO:35的RNA形式可以在 SEQ ID NO:20中找到。
在其他实施方案中,基于micro-RNA的shRNA是第三代miRNA支架修饰的miRNA 16-2(以下称为“miRNA-3G”)(参见,例如,图8和9)。Watanabe,C.,Cuellar, T.L.&Haley,B."Quantitative evaluation of first,second,and third generation hairpin systemsreveals the limit of mammalian vector-based RNAi,"RNA Biology 13,25-33(2016)描述了这类miRNA-3G分子的合成,其公开内容整体援引加入本文。
在一些实施方案中,miRNA-3G具有与SEQ ID NO:21的核酸序列具有至少80%相同性的核酸序列。在一些实施方案中,miRNA-3G具有与SEQ ID NO:21的核酸序列具有至少85%相同性的核酸序列。在一些实施方案中,miRNA-3G具有与 SEQ ID NO:21的核酸序列具有至少90%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ IDNO:35的核酸序列具有至少95%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的核酸序列具有至少96%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA 具有与SEQ ID NO:35的核酸序列具有至少97%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的核酸序列具有至少98%相同性的核酸序列。在一些实施方案中,基于micro-RNA的shRNA具有与SEQ ID NO:35的核酸序列具有至少99%相同性的核酸序列。在一些实施方案中,miRNA-3G具有SEQ IDNO:21("miRNA211-3G")的核酸序列(还参见图9)。
在一些实施方案中,miRNA-3G具有与SEQ ID NO:22的核酸序列具有至少80%相同性的核酸序列。在一些实施方案中,miRNA-3G具有与SEQ ID NO:22的核酸序列具有至少85%相同性的核酸序列。在一些实施方案中,miRNA-3G具有与 SEQ ID NO:22的核酸序列具有至少90%相同性的核酸序列。在一些实施方案中, miRNA-3G具有与SEQ ID NO:22的核酸序列具有至少95%相同性的核酸序列。在一些实施方案中,miRNA-3G具有与SEQ ID NO:22的核酸序列具有至少97%相同性的核酸序列。在一些实施方案中,miRNA-3G具有与SEQ IDNO:22的核酸序列具有至少98%相同性的核酸序列。在一些实施方案中,miRNA-3G具有与SEQ ID NO:22的核酸序列具有至少99%相同性的核酸序列。在其他实施方案中,miRNA-3G具有SEQ ID NO:22("miRNA734-3G")的核酸序列(还参见图8)。
在一些实施方案中,sh734 shRNA适合模拟具有17个核苷酸碱基对茎和4- 核苷酸环的miRNA-451(参见SEQ ID NO:36)结构(miR-451调节药物转运蛋白P-糖蛋白)。值得注意的是,这个结构不需要通过DICER进行加工。据认为pre-451mRNA结构被Ago2切割,随后被poly(A)-特异性核糖核酸酶(PARN)切割以产生成熟的miRNA- 451结构模拟物(SEQ ID NO:37)。据认为Ago-shRNA模拟内源miR-451的结构,并且可能具有不依赖于DICER的优势。据认为这限制随从链(passenger)加载的脱靶效应,具有可变的3'-5'核酸外切活性(23-26nt成熟)(参见Herrera-Carrillo,E.,and B.Berkhout. 2017.DICER-independent processingof small RNA duplexes:mechanistic insights and applications.Nucleic AcidsRes.45:10369-10379)。还认为利用shRNA的非DICER依赖性加工替代物具有优势,包括单个RNAi活性向导的有效减少的脱靶效应,细胞RNAi DICER机制的不饱和,以及较短的RNA双链体不太可能触发先天RIG-I应答。
RNAi的替代物
作为掺入RNAi的替代方案,在一些实施方案中,表达载体可以包括编码反义寡核苷酸的核酸序列,所述反义寡核苷酸结合信使RNA(mRNA)中的位点。本公开的反义寡核苷酸与编码蛋白的核酸特异性地杂交并干扰所述蛋白的转录或翻译。在一些实施方案中,反义寡核苷酸靶向DNA并干扰其复制和/或转录。在其他实施方案中,反义寡核苷酸与RNA(包括pre-mRNA(即前体mRNA,它是mRNA的未成熟单链)和mRNA)特异性地杂交。这类反义寡核苷酸可以影响例如RNA易位至蛋白翻译位点,蛋白从RNA翻译,RNA剪接以产生一种或多种mRNA种类,以及RNA可能参与或促进的催化活性。这种干扰的总体效果是调节、减少或抑制靶蛋白表达。
在一些实施方案中,表达载体并入编码外显子跳跃剂或外显子跳跃转基因的核酸序列。如本文所用,短语“外显子跳跃转基因”或“外显子跳跃剂”是指编码可以产生外显子跳跃的反义寡核苷酸的任何核酸。“外显子跳跃”是指在蛋白产生期间在 pre-mRNA水平被跳跃或去除的外显子。据认为反义寡核苷酸可以干扰外显子内的剪接位点或调节元件。尽管存在基因突变,这可以导致截短、部分功能的蛋白。一般来说,反义寡核苷酸可能是突变特异性的,并且结合至前信使RNA中的突变位点以诱导外显子跳跃。
外显子跳跃转基因编码可以导致外显子跳跃的物质,并且这类物质是反义寡核苷酸。尽管存在基因突变,反义寡核苷酸可以干扰外显子内的剪接位点或调节元件以导致截短、部分功能的蛋白。此外,反义寡核苷酸可能是突变特异性的,并且结合至前信使RNA中的突变位点以诱导外显子跳跃。用于外显子跳跃的反义寡核苷酸是本领域已知的,并且一般称作AON。这类AON包括小核RNA(“snRNA”),其是限制的于细胞核内并参与剪接或其他RNA加工反应的一类小RNA分子。例如,在美国公开号20150225718、20150152415、20150140639、20150057330、20150045415、20140350076、20140350067和20140329762中公开了反义寡核苷酸的实例、设计它们的方法和相关生产方法,其公开内容整体各自援引加入本文。
在一些实施方案中,本公开的表达载体包括编码外显子跳跃剂的核酸,所述外显子跳跃剂在HPRT表达期间导致外显子跳跃或引起HPRT复制突变(例如外显子 4中的复制突变)(参见Baba S,et al.Novel mutation in HPRT1 causing a splicing error withmultiple variations.Nucleosides Nucleotides Nucleic Acids.2017Jan 2;36(1):1-6,其公开内容整体援引加入本文)。
在一些实施方案中,可以通过剪接体反式剪接用修饰的突变序列替代 HPRT,因此促进HPRT的敲低。在一些实施方案中,这(1)需要突变的编码区以替代靶RNA中的编码区,(2)5’或3’剪接位点,和/或(3)结合结构域,即,反义寡核苷酸序列,其与靶HPRT RNA互补。在一些实施方案中,需要所有三个组分。
WASP治疗基因
如本文所述,本公开的表达载体(例如慢病毒载体或AAV载体)还可以包含编码治疗基因(例如WASP)的第二核酸序列,由此所述治疗基因可以纠正靶细胞(例如 HSC)中的缺陷。本领域技术人员应当理解,术语“治疗基因”包括基因组序列、cDNA 序列和较小的工程基因片段,其表达或可以适合表达蛋白、多肽、结构域、融合蛋白和突变体,其维持由治疗基因编码的全长多肽的部分或全部治疗功能。“治疗基因”的定义涵盖“生物学功能等同”的治疗基因。因此,具有约70%序列同源性-约99%序列同源性以及由此衍生的任何范围或量的序列同源性的序列,例如,约70%-约80%,或约 85%和约90%;或约95%-约99%之间;与治疗基因的氨基酸相同或功能等同的氨基酸序列会是生物学功能等同的序列,条件是多肽的生物学活性得以维持。
在一些实施方案中,本公开的表达载体包含编码野生型WASP的核酸序列。“编码野生型WASP的核酸序列”指WASP的核苷酸序列可以(i)处于其天然、非突变形式(参见,例如SEQ ID NO:67);或(ii)不同于其天然、非突变形式,通过包括一个、两个、三个或四个沉默突变(参见,例如,SEQ ID NO:68)。在一些实施方案中,编码野生型WASP的核酸序列可以包括一个沉默突变。在其他实施方案中,编码野生型 WASP的核酸序列可以包括两个沉默突变。在仍然的其他实施方案中,编码野生型 WASP的核酸序列可以包括三个沉默突变。在进一步的实施方案中,编码野生型 WASP的核酸序列可以包括四个沉默突变。在其他实施方案中,本公开的表达载体包括编码密码子优化的WASP的核酸序列。在一些实施方案中,虽然编码野生型WASP 和密码子优化的WASP的核酸序列不同,但它们都编码相同的蛋白序列。在一些实施方案中,据认为,与编码野生型WASP的核酸相比,编码密码子优化的WASP的核酸可以提供(i)更高的表达,(ii)可以导致相对更高的转录水平,因此相对更高的Wiskott-Aldrich综合征蛋白水平;和/或iii)其他优势。在一些实施方案中,使用密码子优化的WASP可以检测所得蛋白在内源WAS上的表达。
在一些实施方案中,表达载体包含编码Wiskott-Aldrich综合征蛋白的核酸序列,即编码WASP的核酸序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:1、2、3或4中任一个具有至少80%相同性的序列。在其他实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:1、 2、3或4中任一个具有至少85%相同性的序列。在仍然的其他实施方案中,编码 Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:1、2、3或4中任一个具有至少90%相同性的序列。在进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:1、2、3或4中任一个具有至少95%相同性的序列。在进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:1、 2、3或4中任一个具有至少96%相同性的序列。在更进一步的实施方案中,编码 Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:1、2、3或4中任一个具有至少97%相同性的序列。在甚至更进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:1、2、3或4中任一个具有至少98%相同性的序列。在甚至更进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与 SEQ ID NO:1、2、3或4中任一个具有至少99%相同性的序列。在甚至更进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有包含SEQ ID NO:1、2、3 或4中任一个的序列。
在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与 SEQ IDNO:67、68和69中任一个具有至少80%相同性的序列。在其他实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:67、68和69中任一个具有至少85%相同性的序列。在仍然的其他实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:67、68和69中任一个具有至少90%相同性的序列。在进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:67、68和69中任一个具有至少95%相同性的序列。在进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:67、68和69中任一个具有至少96%相同性的序列。在甚至更进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:67、68和69中任一个具有至少97%相同性的序列。在甚至更进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQ ID NO:67、68和69中任一个具有至少98%相同性的序列。在甚至更进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有与SEQID NO:67、68 和69中任一个具有至少99%相同性的序列。在甚至更进一步的实施方案中,编码Wiskott-Aldrich综合征蛋白的核酸序列具有包含SEQ ID NO:67、68和69中任一个的序列。
在一些实施方案中,表达载体包含核酸,其编码具有与SEQ ID NO:5或6 中任一个具有至少约80%相同性的氨基酸序列。在其他实施方案中,核酸序列编码与 SEQ ID NO:5或6中任一个具有至少约85%相同性的氨基酸序列。在仍然的其他实施方案中,核酸序列编码与SEQ ID NO:5或6中任一个具有至少约90%相同性的氨基酸序列。在进一步的实施方案中,核酸序列编码与SEQ ID NO:5或6中任一个具有至少约95%相同性的氨基酸序列。在甚至更进一步的实施方案中,核酸序列编码与SEQ ID NO:5或6中任一个具有至少约96%相同性的氨基酸序列。在甚至更进一步的实施方案中,核酸序列编码与SEQ ID NO:5或6中任一个具有至少约97%相同性的氨基酸序列。在甚至更进一步的实施方案中,核酸序列编码与SEQ ID NO:5或6中任一个具有至少约98%相同性的氨基酸序列。在甚至更进一步的实施方案中,核酸序列编码与 SEQ ID NO:5或6中任一个具有至少约99%相同性的氨基酸序列。在甚至更进一步的实施方案中,核酸序列编码包含SEQ ID NO:5或6中任一个的氨基酸。
启动子
在一些实施方案中,不同启动子用来驱动并入所公开的表达载体内的每个核酸序列的表达。例如,编码RNAi(例如抗HPRT shRNA)的第一核酸序列可以从第一启动子表达,而编码治疗基因(例如WAS基因)的第二核酸序列可以从第二启动子表达,其中所述第一启动子和所述第二启动子不同。同样地,作为另一实例,编码基于 micro-RNA的shRNA以下调HPRT的第一核酸序列可以从第一启动子表达,而编码治疗基因(例如WAS基因)的第二核酸序列可以从第二启动子表达,其中所述第一启动子和所述第二启动子不同。
在一些实施方案中,启动子可以是本领域普通技术人员已知的组成型启动子或诱导型启动子。在一些实施方案中,启动子包括至少一部分的HIV LTR(例如 TAR)。
合适的启动子的实例包括但不限于RNA聚合酶I(pol I)、聚合酶II(pol II) 或聚合酶III(pol III)启动子。“RNA聚合酶III启动子”或“RNA pol III启动子”或“聚合酶III启动子”或“pol III启动子”表示任何无脊椎动物、脊椎动物或哺乳动物启动子,例如,人、鼠、猪、牛、灵长类、猿猴等,在其细胞中的天然环境中,与RNA聚合酶 III相关或相互作用以转录其可操作地连接的基因,或者其任何变体,天然的或工程化的,会在所选宿主细胞中与RNA聚合酶III相互作用以转录可操作地连接的核酸序列。适合用于本公开的表达载体的RNA pol III启动子包括但不限于人U6、小鼠U6和人 H1等。
pol II启动子的实例包括但不限于Ef1α、CMV和泛素。其他特定的pol II 启动子包括但不限于锚蛋白启动子(Sabatino DE,et al.,Proc Natl Acad Sd USA. (24):13294-9(2000))、血影蛋白启动子(Gallagher PG,et al.,J Biol Chem.274(10):6062-73,(2000))、转铁蛋白受体启动子(Marziali G,et al.,Oncogene.21(52):7933-44,(2002))、带3/阴离子转运蛋白启动子(Frazar TF,et al.,MoI Cell Biol(14):4753-63,(2003))、带4.1 启动子(Harrison PR,et al.,Exp Cell Res.155(2):321-44,(1984))、BcI-Xl启动子(Tian C, et al.,Blood 15;101(6):2235-42(2003))、EKLF启动子(Xue L,et al.,Blood.103(11):4078- 83(2004)).Epub 2004Feb 5)、ADD2启动子(Yenerel MN,etal.,Exp Hematol.33(7):758- 66(2005))、DYRK3启动子(Zhang D,et al.,Genomics 85(1):117-30(2005))、SOCS启动子(Sarna MK,et al.,Oncogene 22(21):3221-30(2003))、LAF启动子(To MD,et al.,bit J Cancer l;115(4):568-74,(2005))、PSMA启动子(ZengH,et al.,JAndrol(2):215-21,(2005))、 PSA启动子(Li HW,et al.,Biochem BiophysRes Commun 334(4):1287-91,(2005))、 Probasin启动子(Zhang J,et al.,145(l):134-48,(2004)).Epub 2003Sep 18)、ELAM-I启动子/E-选择素(Walton T,et al.,AnticancerRes.18(3A):1357-60,(1998))、突触蛋白启动子 (Thiel G,et al.,ProcNatl Acad SdUSA.,88(8):3431-5(1988))、Willebrand因子启动子 (Jahroudi N,Lynch DC.MoI Cell-5zo/.14(2):999-1008,(1994))、FLTl(Nicklin SA,et al., Hypertension 38(l):65-70,(2001))、Tau启动子(Sadot E,et al.,JMoI Biol.256(5):805-12, (1996))、酪氨酸酶启动子(Lillehammer T,et al.,Cancer Gene Ther.(2005))、pander启动子(Burkhardt BR,et al.,Biochim Biophys Acta.(2005))、神经元特异性烯醇化酶启动子 (Levy YS,etal.,JMolNeurosci.21(2):121-32,(2003))、hTERT启动子(Ito H,et al.,Hum Gene Ther16(6):685-98,(2005))、HRE应答元件(Chadderton N,et al.,IntJRadiat Oncol BiolPhys.62(l):2U-22,(2005)),lck promoter(Zhang DJ,et al.,J Immunol.174(11):6725-31, (2005))、MHCII启动子(De Geest BR,et al.,Blood.101(7):2551-6,(2003),Epub2002 Nov 21)和CDl Ic启动子(Lopez-Rodriguez C,et al.,J Biol Chem.272(46):29120-6(1997)),这些公开整体援引加入本文。
在一些实施方案中,驱动设计为敲低HPRT的物质表达的启动子是RNA pol III启动子。在一些实施方案中,驱动设计为敲低HPRT的物质表达的启动子是7sk 启动子(例如7SK人7S K RNA启动子)。在一些实施方案中,7sk启动子具有 ACCESSION AY578685提供的核酸序列(智人细胞系HEK-293 7SK RNA启动子区,完整序列,ACCESSION AY578685)。
在一些实施方案中,7sk启动子具有与SEQ ID NO:28的核酸序列具有至少90%相同性的序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:28的核酸序列具有至少95%相同性的核酸序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:28的核酸序列具有至少96%相同性的核酸序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:28的核酸序列具有至少97%相同性的核酸序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:28的核酸序列具有至少98%相同性的核酸序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:28的核酸序列具有至少99%相同性的核酸序列。在一些实施方案中,7sk启动子具有SEQ IDNOS:28示出的核酸序列。
在一些实施方案中,与7sk启动子相比,使用的7sk启动子在其核酸序列中包含至少一个突变和/或缺失。Boyd,D.C.,Turner,P.C.,Watkins,N.J.,Gerster,T.& Murphy,S.Functional Redundancy of Promoter Elements Ensures Efficient Transcriptionof the Human 7SK Gene in vivo.Journal of Molecular Biology 253,677-690(1995)描述了合适的7sk启动子突变,其公开内容整体援引加入本文(还参见图10)。在一些实施方案中,7sk启动子中的功能性突变或缺失是在顺式调节元件中进行的,以便调节启动子驱动的转基因(包括sh734)(参见SEQ ID NO:29)的表达水平。所述突变用来建立由Pol III启动子驱动的sh734表达水平之间的相关性,并且引入功能性以在6TG疗法以及长期稳定性和安全性的情况下进行稳定选择。7sk启动子突变的位置在图10中示出。
在一些实施方案中,7sk启动子具有与SEQ ID NO:29的序列具有至少 95%相同性的序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:29的序列具有至少96%相同性的序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:29的序列具有至少97%相同性的序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:29 的序列具有至少98%相同性的序列。在一些实施方案中,7sk启动子具有与SEQ ID NO:29的序列具有至少99%相同性的序列。在一些实施方案中,7sk启动子具有SEQ ID NOS:29示出的序列。
在一些实施方案中,驱动编码WASP的核酸序列表达的启动子是MND启动子。包含MND启动子的表达盒的实例在图1A-1E中示出。据认为,MND启动子在髓和淋巴谱系中提供了更好、更一致的表达,尤其是对于WAS。
MND启动子是合成的病毒启动子。MND启动子定义为“骨髓增殖性肉瘤病毒增强子,负控制区删除的,经dl587rev引物结合位点取代的”。参见Halene,et. al.,"ImprovedExpression in Hematopoietic and Lymphoid Cells in Mice After Transplantationof Bone Marrow Transduced with a Modified Retroviral Vector,"Blood 1999 94:3349-3357(其公开内容整体援引加入本文)。Challita et.al.,"Multiple Modificationsin cis Elements of the Long Terminal Repeat of Retroviral Vectors Lead toIncreased Expression and Decreased DNA Methylation in Embryonic CarcinomaCells,"Journal of Virology,Feb. 1995,p.748-755(其公开内容整体援引加入本文)描述了一系列逆转录病毒载体,含有 MoMuLV(莫洛尼鼠白血病病毒)转录单元的修饰。这样的修饰可以包括(i)用来自MPSV的增强子取代MoMuLV增强子,(ii)缺失NCR,(iii)用dl587rev株的PBS取代 MoMuLV PBS,和(iv)插入从鼠Thy-1基因的59上游区克隆的去甲基化片段。说明对莫洛尼鼠白血病病毒转录单元的上述修饰的位置的示意图示于图13。已经描述了MoMuLV(莫洛尼鼠白血病病毒)转录单元的其他修饰。本领域技术人员会理解本公开上下文中的“MND启动子”涵盖描述的MoMuLV(莫洛尼鼠白血病病毒)转录单元的其他修饰或变体,其适合于驱动编码WASP的核酸序列的表达。例如,US2017/0051308 (其公开内容整体援引加入本文)描述了MoMuLV(莫洛尼鼠白血病病毒)转录单元的其他修饰,其可用于本公开以驱动编码WASP的任何核酸序列的表达。
如Challita et.al.,"Multiple Modifications in cis Elements of the LongTerminal Repeat of Retroviral Vectors Lead to Increased Expression andDecreased DNA Methylation in Embryonic Carcinoma Cells,"Journal of Virology,Feb.1995,p.748-755所述,MND启动子可以源自修饰的MoMuLV长末端重复。例如,并且在一些实施方案中,MND启动子用于驱动包含截短的MND启动子的WASP基因的表达,如图13所示,所述 MND启动子与MoMuLV长末端重复相比是截短的。在一些实施方案中,所述截短包括去除图13中标识的一个或多个区域。在其他实施方案中,所述截短包括去除图13 中标识的一个或多个区域的一部分。在一些实施方案中,用于驱动WASP基因表达的 MND启动子包含MoMuLV长末端重复的U3部分。在其他实施方案中,用于驱动 WASP基因表达的MND启动子包含修饰的U3区域,其中所述U3区域缺少负控制区 (NCR)。在仍然其他的实施方案中,用于驱动WASP基因表达的MND启动子不包括 MoMuLV长末端重复的PBS区域、R区域或U5区域,但包括U3区域的至少一部分。在进一步的实施方案中,用于驱动WASP基因表达的MND启动子包含修饰的U3区域,其中所述U3区域缺少负控制区(NCR);并且其中所述MND启动子不包括MoMuLV 长末端重复的PBS区域、R区域或U5区域。在甚至更进一步的实施方案中,用于驱动WASP基因表达的MND启动子不包括MoMuLV长末端重复的PBS区域。
在一些实施方案中,MND启动子具有与SEQ ID NO:7、8、9、10、11或 12中任一个具有至少90%相同性的核酸序列。在其他实施方案中,MND启动子具有与SEQ ID NO:7、8、9、10、11或12中任一个具有至少95%相同性的核酸序列。在仍然的其他实施方案中,MND启动子具有与SEQ ID NO:7、8、9、10、11或12中任一个具有至少97%相同性的核酸序列。在进一步的实施方案中,MND启动子具有与 SEQ ID NO:7、8、9、10、11或12中任一个具有至少98%相同性的核酸序列。在甚至进一步的实施方案中,MND启动子具有与SEQ ID NO:7、8、9、10、11或12中任一个具有至少99%相同性的核酸序列。在甚至进一步的实施方案中,MND启动子包含 SEQ ID NO:7、8、9、10、11或12中任一个的核酸序列。
不希望受任何特定理论的束缚,认为与其他启动子(例如WS1.6启动子)相比,MND启动子可以驱动更有效的WASP表达。据认为,与MND相比,WS1.6启动子(内源性WAS启动子的一部分)在原代人细胞中的活性较低。还认为WS1.6-huWASp LV在体内介导有限的WASP表达。还认为,移植用MND-huWASp LV转导的干细胞可能会导致所有造血谱系中WASP的持续内源性水平,WASP+T、自然杀伤T和B细胞的渐进选择,T细胞增殖和细胞因子生产的拯救,和/或边缘区(MZ)B细胞的明显恢复。鉴于以上情况,认为MND可以提供最有效的结果。
绝缘子
在一些实施方案中,本公开的表达载体包含绝缘子,例如染色质绝缘子。不希望受任何特定理论的束缚,认为染色质绝缘子元件防止异染色质扩散和基因沉默,降低染色质位置效应,并具有增强子阻断活性。认为这些性质对于随机整合载体的一致可预测表达和安全的转基因递送是期望的。还认为,克服染色质位置效应可以减少治疗效果所需的拷贝数,并降低载体基因毒性的风险。研究表明,绝缘的载体表现出一致、可预测的表达,无论在造血干细胞分化的后代中的整合位点如何,导致整体表达高约2-约4倍。最近的证据还表明,cHS4绝缘的慢病毒载体可以降低细胞癌基因的插入性激活的风险。尽管绝缘的载体具有有益效果,但它们也导致在慢病毒载体的 3'LTR中插入全长1.2Kb cHS4绝缘子元件后滴度显著降低。也有类似的报道称,在3' LTR中包含插入的γ-逆转录病毒载体具有降低的病毒滴度或不稳定的传播。这种滴度的降低据认为实际上限制了用于临床试验的载体生产规模的扩大,尤其是携带相对较大的表达盒的载体。据认为这些结果对用于临床基因治疗的载体的设计具有重要意义。对鸡超敏位点-4(cHS4)元件(一种原型绝缘子)的研究已在cHS4的近端250bp中鉴定了 CTCF和USF-1/2基序(称为“核心”),其提供增强子阻断活性并减少位置效应。然而,单独的核心并不能有效地隔离病毒载体。虽然据认为全长cHS4具有优异的绝缘性能,但其大尺寸严重损害了载体滴度。
在一些实施方案中,通过掺入一种或多种含有全长染色质绝缘子功能性部分的长度缩短的染色质绝缘子,可以增加慢病毒载体的滴度。在一些实施方案中,功能性长度缩短的染色质绝缘子源自鸡超敏位点-4(cHS4)元件。在一些实施方案中,功能性长度缩短的绝缘子是cHS4衍生的绝缘子,具有650个或更少的碱基对。在一些实施方案中,绝缘子是650cHS4、400cHS4或泡沫病毒绝缘子。在一些实施方案中,功能性部分源自一种类型的全长染色质绝缘子。在一些实施方案中,长度缩短的功能性绝缘子包含染色质绝缘子的两个或更多个独立变体的功能性部分。在一些实施方案中,绝缘子具有与SEQ ID NO:38、39或40中任一个具有至少90%相同性的核酸序列。在其他实施方案中,绝缘子具有与SEQ ID NO:38、39或40中任一个具有至少95%相同性的核酸序列。在仍然的其他实施方案中,绝缘子具有与SEQ ID NO:38、39或40中任一个具有至少97%相同性的核酸序列。在进一步的实施方案中,绝缘子具有SEQ ID NO:38、39或40中任一个的核酸序列。其他绝缘子描述于美国专利公开号 2018/0142255和2007/0154456,其公开内容整体援引加入本文。
据认为染色质绝缘子提供两个水平的活性。据认为,它们阻止整合序列的表观遗传沉默。据认为,部分基因组的表观遗传沉默是在HSC分化为细胞谱系期间发生的过程。作为实例,WASP能够在转导的HSC中很好地表达。然而,据认为,一旦 HSC产生分化的细胞,由于这些沉默事件,可能会实现较低的WASP表达。还认为,绝缘子阻止整合位点之外的启动子活性(增强子阻断活性)。例如,如果慢病毒在特定基因(“基因x”)“中”或“附近”整合,它会阻止启动子(例如MND),在WASP和位于整合位点附近的“基因x”上发挥功能。
载体的产生
在一些实施方案中,将表达盒(例如,具有用于表达的特定转基因的表达盒 (如,SEQ ID NO:15))插入表达载体(如慢病毒表达载体),以提供具有至少一种用于表达的转基因的载体。在一些实施方案中,慢病毒表达载体可以选自pTL20c、pTL20d、 FG、pRRL、pCL20、pLKO.1puro、pLKO.1、pLKO.3G、Tet-pLKO-puro、pSico、 pLJM1-EGFP、FUGW、pLVTHM、pLVUT-tTR-KRAB、pLL3.7、pLB、pWPXL、 pWPI、EF.CMV.RFP、pLenti CMV Puro DEST、pLenti-puro、pLOVE、pULTRA、 pLJM1-EGFP、pLX301、pInducer20、pHIV-EGFP、Tet-pLKO-neo、pLV-mCherry、 pCW57.1、pLionII、pSLIK-Hygro和pInducer10-mir-RUP-PheS。在其他实施方案中,慢病毒表达载体可以选自AnkT9W载体、T9Ank2W载体、TNS9载体、lentiglobin HPV569载体、lentiglobin BB305载体、BG-1载体、BGM-1载体、d432βAγ载体、 mLAβΔγV5载体、GLOBE载体、G-GLOBE载体、βAS3-FB载体、V5载体、V5m3载体、V5m3-400载体、G9载体和BCL11Ashmir载体。在一些实施方案中,慢病毒表达载体可以选自pTL20c、pTL20d、FG、pRRL和pCL20。在其他实施方案中,慢病毒表达载体是pTL20c。
例如,可以根据美国专利公开号2018/0112233(其公开内容整体援引加入本文)中描述的方法将具有用于表达的转基因(例如WAS转基因)的表达盒插入pTL20c 载体(SEQ IDNO:18)。该“中间体”示于图1A。在一些实施方案中,pTL20c载体包含载体骨架,其具有与SEQID NO:30的核酸序列具有至少95%相同性的核酸序列。在一些实施方案中,pTL20c载体包含载体骨架,其具有与SEQ ID NO:30的核酸序列具有至少90%相同性的核酸序列。
在一些实施方案中,在将表达盒插入到表达载体之后,将第二表达盒插入具有用于表达的第二转基因的载体。例如,可以将包含用于敲低HPRT的核酸序列(例如SEQ ID NO:14)的表达盒插入具有至少一种用于表达的转基因的载体。
在其他实施方案中,表达盒可以包含可操作地连接至启动子的用于表达的第一转基因,以及至少一个可操作地连接至第二启动子的用于表达的第二转基因。例如,用于插入表达载体的表达盒可以包含用于表达的第一转基因,以及用于敲低 HPRT的第二核酸序列(如,SEQ ID NO:14),例如3.2kb hWASWT盒(SEQ ID NO:58)或 3.2kb hWASCO盒(SEQ ID NO:59)。在一些实施方案中,表达盒包含用于表达的第一转基因,以及第二核酸序列7sk/sh734(如,SEQ ID NO:14)。在一些实施方案中,表达盒包含用于表达的WAS转基因,以及第二核酸序列7sk/sh734(如,SEQ ID NO:14),例如3.2kb hWASWT盒(SEQ ID NO:58)或3.2kb hWASCO盒(SEQ ID NO:59)。在一些实施方案中,表达盒包含可操作地连接至启动子的WAS转基因,以及可操作地连接至启动子的用于敲低HPRT的第二核酸序列,例如3.2kb hWASWT盒(SEQ IDNO:58)或 3.2kb hWASCO盒(SEQ ID NO:59)。在一些实施方案中,包含所述第一转基因和所述第二转基因的表达盒可以插入表达载体。例如,一些实施方案中,包含所述第一转基因和所述第二转基因的表达盒可以以一步插入表达载体。
所得载体的非限制性实例示于图1B-1E。如图1B-1E所示,7sk表达盒(例如,具有SEQ ID NO:14的表达盒)可以插入表达载体的不同位置(例如,相对于WASP 表达盒的不同位置)。此外,7sk表达盒可以以不同的方向插入表达载体(例如,比较图 1B与图1C之间以及图1D与图1E之间的7sk启动子的方向)。据认为,7sk表达盒相对于WASP表达盒的不同位置和/或方向可以增强sh734的表达。不同配置的其他示例如下:
表1:不同载体的各种配置
在一些实施方案中,WASP表达盒位于相对于7sk/sh734表达盒的上游。
在一些实施方案中,WASP表达盒位于相对7sk/sh734表达盒的下游。
在一些实施方案中,7SK/sh734表达盒和WASP表达盒朝向相同的方向。
在一些实施方案中,7SK/sh734表达盒和WASP表达盒朝向相反的方向。
在一些实施方案中,7SK/sh734表达盒朝向相对于WASP盒的正向。
在一些实施方案中,7SK/sh734表达盒朝向相对于WASP表达盒的反向。
在一些实施方案中,7SK/sh734表达盒位于相对于WASP盒的上游并且朝向相对于WASP盒的正向。
在一些实施方案中,7SK/sh734表达盒位于相对于WASP表达盒的上游并且朝向相对于WASP表达盒的反向。
在一些实施方案中,7SK/sh734表达盒位于相对于WASP盒的下游并且朝向相对于WAP盒的正向。
在一些实施方案中,7SK/sh734表达盒位于相对于WASP表达盒的下游并且朝向相对于WASP表达盒的反向。
在一些实施方案中,第一转基因表达盒位于相对于7sk/sh734表达盒的上游。
在一些实施方案中,第一转基因表达盒位于相对于7sk/sh734表达盒的下游。
在一些实施方案中,7SK/sh734表达盒和第一转基因表达盒朝向相同的方向。
在一些实施方案中,7SK/sh734表达盒和第一转基因表达盒朝向相反的方向。
在一些实施方案中,7sk/sh734表达盒朝向相对于第一转基因表达盒的正向。
在一些实施方案中,7SK/sh734表达盒朝向相对于第一转基因表达盒的反向。
在一些实施方案中,7SK/sh734表达盒位于相对于第一转基因表达盒的上游并且朝向相对于第一转基因表达盒的正向。
在一些实施方案中,7SK/sh734表达盒位于第一转基因表达盒的上游并且朝向相对于第一转基因表达盒的反向。
在一些实施方案中,7SK/sh734表达盒位于相对于第一转基因表达盒的下游并且朝向相对于第一转基因表达盒的正向。
在一些实施方案中,7SK/sh734表达盒位于相对于第一转基因表达盒的下游并且朝向相对于第一转基因表达盒的反向。
在甚至其他的实施方案中,表达盒可以包含可操作地连接至启动子的用于表达的第一转基因,以及至少一个第二核酸序列7sk/sh734(例如,SEQ ID NO:14)。在一些实施方案中,表达盒可以包含可操作地连接至启动子的用于表达的第一转基因,以及至少两个核酸序列7sk/sh734(例如,SEQ ID NO:14)。在一些实施方案中,表达盒包含用于表达的WAS转基因,以及至少两个7SK/sh734核酸序列(例如,SEQ ID NO:14)。
合适的表达盒的其他实例,所述表达盒包含可操作地连接至启动子的用于表达的第一转基因,以及可操作地连接至第二启动子的至少一个用于表达的第二转基因,包括:
7SK/sh734_MND/hWASWT_WPRE_7SK/sh734;
r7SK/sh734_MND_hWASCO_WPRE_r7SK/sh734;
r7SK/sh734_MND/hWASWT_WPRE_r7SK/sh734;和
7SK/sh734_MND/hWASCO_WPRE_7SK/sh734。
在一些实施方案中,表达盒可以包含可操作地连接至启动子的用于表达的第一转基因,以及至少两个用于敲低HPRT的核酸序列(例如,SEQ ID NO:14),例如
7SK/sh734_MND/hWASWT_WPRE_7SK/sh734;
r7SK/sh734_MND_hWASCO_WPRE_r7SK/sh734;
r7SK/sh734_MND/hWASWT_WPRE_r7SK/sh734;或
7SK/sh734_MND/hWASCO_WPRE_7SK/sh734。
本领域技术人员应当理解,包含至少两个用于敲低HPRT的核酸序列的这种类型的表达盒可以通过选择性去除所述两个用于敲低HPRT的核酸序列之一来提供对具有7SK/sh734表达盒的不同位置和/或朝向的一系列构建体的进一步获取。
在一些实施方案中,可以将表达盒插入表达载体。例如,可以将包含所述第一转基因和所述第二转基因的表达盒以一步插入表达载体,例如3.2kb hWASWT盒 (SEQ ID NO:58)或3.2kb hWASCO盒(SEQ ID NO:59)。配置的进一步实例示于本文的实施例1和表10。
本领域技术人员应当理解,SEQ ID NO:58或SEQ ID NO:59所述类型的表达盒,在插入表达载体之前、插入表达载体之后或其组合,可以进一步修饰或衍生化,所述表达盒包含可操作地连接至启动子的用于表达的第一转基因,以及至少一个可操作地连接至第二启动子的用于表达的第二转基因。例如,设想表达盒,在插入表达载体之前,可以进一步修饰或衍生化以i)增加一个或多个额外的转基因或遗传元件, ii)去除一个或多个转基因或遗传元件,iii)用一个或多个替代的转基因或遗传元件代替一个或多个转基因或遗传元件,或其组合,所述表达盒包含可操作地连接至启动子的用于表达的第一转基因,以及至少一个可操作地连接至第二启动子的用于表达的第二转基因。
在一些实施方案中,3.2kb hWASWT盒(SEQ ID NO:58)或3.2kb hWASCO盒 (SEQ IDNO:59)可以如上文所述进行修饰或衍生化。在一些实施方案中,3.2kb hWASWT盒或3.2kbhWASCO(SEQ ID NO:58或59)的WAS转基因可以用替代的用于表达的转基因代替,以提供用于插入表达载体的表达盒,所述表达载体包含除了WAS转基因以外的用于表达的转基因,以及用于敲低HPRT的第二核酸序列(例如,SEQ ID NO:14)。在仍然的其他实施方案中,3.2kbhWASWT盒或3.2kb hWASCO(SEQ ID NO: 58或59)的两个7SK/sh734核酸序列中的至少一个可以用替代的用于表达的转基因代替,以提供用于插入表达载体的表达盒,所述表达载体包含除7SK/sh734以外替代的用于表达的转基因,以及WAS转基因。在其他实施方案中,7SK/sh734核酸序列和3.2kb hWASWT盒或3.2kb hWASCO(SEQ ID NO:58或59)的WAS转基因的每一个可以用替代的用于表达的转基因代替,以提供用于插入表达载体的表达盒,所述表达载体包含除了7SK/sh734和WAS转基因之外的替代的用于表达的转基因。特别地,表达盒 (如3.2kb hWASWT盒(SEQ ID NO:58)或3.2kb hWASCO盒(SEQ ID NO:59))中用于表达的第一转基因和用于表达的第二转基因可以用替代的转基因代替,其中的每一个可以相同或不同。因此,提供源自3.2kb hWASWT盒或3.2kb hWASCO(SEQ ID NO:58或59) 的表达盒,所述表达盒包含可操作地连接至第三启动子的用于表达的第三转基因,以及至少一个可操作地连接至第四启动子的用于表达的第四转基因。
或者,设想表达盒,在插入表达载体后,可以进一步修饰或衍生化,以提供i)增加一个或多个额外的转基因或遗传元件,ii)去除一个或多个转基因或遗传元件, iii)用一个或多个替代的转基因或遗传元件代替一个或多个转基因或遗传元件,或其组合,所述表达盒包含可操作地连接至启动子的用于表达的第一转基因,以及至少一个可操作地连接至第二启动子的用于表达的第二转基因。
在一些实施方案中,3.2kb hWASWT盒或3.2kb hWASCO盒,在插入表达载体后,可以修饰或衍生化,例如,在如上文所述的SEQ ID NO:63、64、65或66所述类型的中间载体中。在一些实施方案中,中间载体SEQ ID NO:63、64、65或66中任一个中的3.2kb hWASWT盒的野生型WAS转基因或者3.2kb hWASCO盒的密码子优化 WAS转基因可以用替代的用于表达的转基因代替,以提供表达载体,所述表达载体包含除了WAS转基因以外的用于表达的转基因,以及用于敲低的HPRT的第二核酸序列 (例如,SEQ ID NO:14)。在仍然的其他实施方案中,SEQID NO:63、64、65或66所述类型的中间载体中的3.2kb hWASWT盒或3.2kb hWASCO(SEQ IDNO:58或59)的两个 7SK/sh734核酸序列中的至少一个可以用替代的用于表达的转基因代替,以提供包含除了7SK/sh734以外的替代的用于表达的转基因。在其他实施方案中,SEQID NO:63、 64、65或66所述类型中间载体中的3.2kb hWASWT或3.2kb hWASCO盒的7SK/sh734核酸序列和WAS转基因的每一个可以用替代的用于表达的转基因代替,以提供包含除了7SK/sh734和WAS转基因以外的替代的用于表达的转基因。特别地,SEQ ID NO:63、 64、65或66所述类型中间载体中的表达盒(例如,3.2kb hWASWT或3.2kb hWASCO盒) 的用于表达的第一转基因和用于表达的第二转基因,可以用替代的转基因代替,其中的每一个可以相同或不同。因此,提供源自SEQ ID NO:63、64、65或66所述类型中间载体的表达载体,其包含可操作地连接至第三启动子的用于表达的第三转基因,以及至少一个可操作地连接至第四启动子的用于表达的第四转基因。
多核苷酸
本公开还提供多核苷酸,其与SEQ ID NO:42-57中任一个具有至少90%序列相同性。
在一些实施方案中,多核苷酸与SEQ ID NO:42的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:42的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:42的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:42的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:42的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:42的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:42的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:43的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:43的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:43的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:43的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:43的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:43的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:43的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:44的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:44的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:44的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:44的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:44的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:44的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:44的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:45的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:45的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:45的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:45的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:45的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:45的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:45的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:46的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:46的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:46的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:46的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:46的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:46的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:46的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:47的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:47的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:47的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:47的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:47的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:47的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:47的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:48的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:48的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:48的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:48的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:48的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:48的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:48的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:49的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:49的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:49的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:49的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:49的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:49的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:49的核酸序列。
在一些实施方案中,多核苷酸与SEQ ID NO:50的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:50的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:50的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:50的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:50的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:50的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:50的核酸序列(还参见图1F)。在一些实施方案中,SEQ ID NO:50的多核苷酸包含表2中所示的组分:
表2:载体pBRNGTR20_pTL20c_SK734fwd_MND_WAS_650(“pBRNGTR20”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
7SK启动子 | 正向 | 2396 | 2644 |
shRNA 734 | 正向 | 2645 | 2691 |
MND启动子 | 正向 | 2710 | 3056 |
WAS cDNA(野生型ORF) | 正向 | 3098 | 4606 |
WPRE | 正向 | 4615 | 5204 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
在一些实施方案中,多核苷酸与SEQ ID NO:51的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:51的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:51的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:51的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:51的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:51的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:51的核酸序列(还参见图1G)。在一些实施方案中,SEQ ID NO:51的多核苷酸包含表3中所示的组分:
表3:载体pBRNGTR21_pTL20c_MND_WAS_SK734fwd_650(“pBRNGTR21”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
MND启动子 | 正向 | 2402 | 2748 |
WAS cDNA(野生型ORF) | 正向 | 2790 | 4298 |
WPRE | 正向 | 4307 | 4896 |
7SK启动子 | 正向 | 4909 | 5157 |
shRNA 734 | 正向 | 5158 | 5204 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
在一些实施方案中,多核苷酸与SEQ ID NO:52的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:52的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:52的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:52的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:52的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:52的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:52的核酸序列(还参见图1H)。在一些实施方案中,SEQ ID NO:52的多核苷酸包含表4中所示的组分:
表4:载体pBRNGTR22_pTL20c_SK734rev_MND_WAS_650(“pBRNGTR22”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
shRNA 734 | 反向 | 2402 | 2448 |
7SK启动子 | 反向 | 2449 | 2697 |
MND启动子 | 正向 | 2710 | 3056 |
WAS cDNA(野生型ORF) | 正向 | 3098 | 4606 |
WPRE | 正向 | 4615 | 5204 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
在一些实施方案中,多核苷酸与SEQ ID NO:53的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:53的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:53的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:53的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:53的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:53的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:53的核酸序列(还参见图1I)。在一些实施方案中,SEQ ID NO:53的多核苷酸包含表5中所示的组分:
表5:载体pBRNGTR23_pTL20c_MND_WAS_SK734rev_650(“pBRNGTR23”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
MND启动子 | 正向 | 2402 | 2748 |
WAS cDNA(野生型ORF) | 正向 | 2790 | 4298 |
WPRE | 正向 | 4307 | 4896 |
shRNA 734 | 反向 | 4915 | 4961 |
7SK启动子 | 反向 | 4962 | 5210 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
在一些实施方案中,多核苷酸与SEQ ID NO:54的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:54的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:54的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:54的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:54的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:54的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:54的核酸序列(还参见图1J)。在一些实施方案中,SEQ ID NO:54的多核苷酸包含表6中所示的组分:
表6:载体pTL20c_SK734fwd_MND_coWAS_650(“pBRNGTR24”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
7SK启动子 | 正向 | 2396 | 2644 |
shRNA 734 | 正向 | 2645 | 2691 |
MND启动子 | 正向 | 2710 | 3056 |
WAS cDNA(密码子优化的ORF) | 正向 | 3098 | 4606 |
WPRE | 正向 | 4615 | 5204 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
在一些实施方案中,多核苷酸与SEQ ID NO:55的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:55的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:55的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:55的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:55的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:55的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:55的核酸序列(还参见图1K)。在一些实施方案中,SEQ ID NO:55的多核苷酸包含表7中所示的组分:
表7:载体pTL20c_MND_coWAS_SK734fwd_650(“pBRNGTR25”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
MND启动子 | 正向 | 2402 | 2748 |
WAS cDNA(密码子优化的ORF) | 正向 | 2790 | 4298 |
WPRE | 正向 | 4307 | 4896 |
7SK启动子 | 正向 | 4909 | 5157 |
shRNA 734 | 正向 | 5158 | 5204 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
在一些实施方案中,多核苷酸与SEQ ID NO:56的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:56的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:56的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:56的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:56的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:56的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:56的核酸序列(还参见图1L)。在一些实施方案中,SEQ ID NO:56的多核苷酸包含表8中所示的组分:
表8:载体pTL20c_SK734rev_MND_coWAS_650(“pBRNGTR26”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
shRNA 734 | 反向 | 2402 | 2448 |
7SK启动子 | 反向 | 2449 | 2697 |
MND启动子 | 正向 | 2710 | 3056 |
WAS cDNA(密码子优化的ORF) | 正向 | 3098 | 4606 |
WPRE | 正向 | 4615 | 5204 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
在一些实施方案中,多核苷酸与SEQ ID NO:57的多核苷酸具有90%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:57的多核苷酸具有95%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:57的多核苷酸具有96%相同性。在一些实施方案中,多核苷酸与SEQID NO:57的多核苷酸具有97%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:57的多核苷酸具有98%相同性。在一些实施方案中,多核苷酸与SEQ ID NO:57的多核苷酸具有99%相同性。在一些实施方案中,多核苷酸包含SEQ ID NO:57的核酸序列(还参见图1M)。在一些实施方案中,SEQ ID NO:57 的多核苷酸包含表9中所示的组分:
表9:载体pTL20c_MND_coWAS_SK734rev_650(“pBRNGTR27”)的元件
元件 | 方向 | 起始(nt位置) | 结束(nt位置) |
7tetO启动子 | 正向 | 28 | 315 |
MND启动子 | 正向 | 2402 | 2748 |
WAS cDNA(密码子优化的ORF) | 正向 | 2790 | 4298 |
WPRE | 正向 | 4307 | 4896 |
shRNA 734 | 反向 | 4915 | 4961 |
7SK启动子 | 反向 | 4962 | 5210 |
rcHS4 Ins-650绝缘子 | 正向 | 5340 | 5998 |
兔β珠蛋白多腺苷酸化信号 | 正向 | 6122 | 6570 |
宿主细胞
本公开还提供包含本公开的新表达载体的宿主细胞。“宿主细胞”或“靶细胞”表示利用本公开的方法和表达载体转化的细胞。在一些实施方案中,宿主细胞是其中表达载体可以表达的哺乳动物细胞。合适的哺乳动物宿主细胞包括但不限于人细胞、鼠细胞、非人灵长类细胞(例如恒河猴细胞)、人祖细胞或干细胞、293细胞、HeLa细胞、D17细胞、MDCK细胞、BHK细胞以及Cf2Th细胞。在某些实施方案中,包含本公开的表达载体的宿主细胞是造血细胞,如造血祖细胞/干细胞(例如CD34阳性造血祖细胞/干细胞)、单核细胞、巨噬细胞、外周血单个核细胞、CD4+T淋巴细胞、CD8+T 淋巴细胞或树突细胞。
用本公开的表达载体转导的造血干细胞(例如CD4+T淋巴细胞、CD8+T 淋巴细胞和/或单核细胞/巨噬细胞)可以是同种异体的、自体的或来自匹配的同胞。在一些实施方案中,HSC是CD34阳性的,并且可以分离自患者的骨髓或外周血。在一些实施方案中,用如本文描述的表达载体转导分离的CD34阳性HSC(和/或本文描述的其他造血细胞)。
在一些实施方案中,将宿主细胞或转导的宿主细胞与药学上可接受的载剂组合。在一些实施方案中,用PLASMA-LYTE A(例如用于静脉内给药的无菌的、非致热性的等渗溶液;其中一升的PLASMA-LYTE A的离子浓度为140mEq钠、5mEq钾、 3mEq镁、98mEq氯化物、27mEq乙酸盐和23mEq葡萄糖酸盐)配制宿主细胞或转导的宿主细胞。在其他实施方案中,将宿主细胞或转导的宿主细胞配制于PLASMA- LYTE A溶液中,所述溶液包含约8%至约10%二甲基亚砜(DMSO)。在一些实施方案中,每mL包含PLASMA-LYTE A和DMSO的制剂中存在少于约2x107个宿主细胞/转导的宿主细胞。
在一些实施方案中,在用本公开的载体转导后,使得宿主细胞基本上是 HPRT缺陷的。在一些实施方案中,HPRT基因表达水平降低至少50%。在一些实施方案中,HPRT基因表达水平降低至少55%。在一些实施方案中,HPRT基因表达水平降低至少60%。在一些实施方案中,HPRT基因表达水平降低至少65%。在一些实施方案中,HPRT基因表达水平降低至少70%。在一些实施方案中,HPRT基因表达水平降低至少75%。在一些实施方案中,HPRT基因表达水平降低至少80%。在一些实施方案中,HPRT基因表达水平降低至少85%。在一些实施方案中,HPRT基因表达水平降低至少90%。在一些实施方案中,HPRT基因表达水平降低至少95%。据认为,具有 20%或更少残留HPRT基因表达的细胞(例如,对嘌呤类似物敏感,例如6TG,使得它们允许用嘌呤类似物进行选择(参见,例如,图14)。在一些实施方案中,宿主细胞包含核酸分子,其包含SEQ ID NO:16或SEQ ID NO:17中的至少一个。
在其他实施方案中,可以用表达载体转导宿主细胞,所述表达载体包含(i) 可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低 HPRT的shRNA;和(ii)可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白。在一些实施方案中,使得转导的宿主细胞基本上是HPRT缺陷的。在一些实施方案中,转导的宿主细胞表达Wiskott-Aldrich综合征蛋白。
在一些实施方案中,可以通过使宿主细胞在体外、离体或体内与本公开的表达载体以及一种或多种增加转导效率的化合物接触来增加宿主细胞的转导。例如,在一些实施方案中,增加转导效率的一种或多种化合物是刺激前列腺素EP受体信号传导途径的化合物,即与不存在一种或多种化合物的情况下前列腺素EP受体下游的细胞信号传导活性相比,增加与一种或多种化合物接触的细胞中前列腺素EP受体下游的细胞信号传导活性的一种或多种化合物。在一些实施方案中,增加转导效率的一种或多种化合物是前列腺素EP受体配体,包括但不限于前列腺素E2(PGE2)或者其类似物或衍生物。在其他实施方案中,增加转导效率的一种或多种化合物包括但不限于 RetroNectin(重组人纤连蛋白片段的63kD片段,可获得自Takara);Lentiboost(膜密封泊洛沙姆,可获得自Sirion Biotech)、硫酸鱼精蛋白、环胞素H和雷帕霉素。
药物组合物
本公开还提供组合物,包括药物组合物,其包含如本文公开的一种或多种表达载体和/或非病毒递送媒介物(例如纳米胶囊)。在一些实施方案中,药物组合物包含有效量的至少一种如本文描述的表达载体和/或非病毒递送媒介物以及药学上可接受的载剂。例如,在某些实施方案中,所述药物组合物包含有效量的表达载体和药学上可接受的载剂。本领域技术人员可以基于诸如体型、体重、年龄、健康、受试者的性别、种族和病毒滴度的因素容易地确定有效量。
短语“药学上可接受的”或“药理学上可接受的”是指当给药至动物或人时不产生有害、过敏或其他不良反应的分子实体和组合物。例如,可以用药学上可接受的载剂配制表达载体。如本文所用,“药学上可接受的载剂”包括溶剂、缓冲剂、溶液、分散介质、包衣、抗细菌和抗真菌剂、等渗和吸收延迟剂等,可接受用于配制药物,如适合给药至人的药物。用药物载剂配制化合物制剂的方法是本领域已知的,并且描述于例如Remington'sPharmaceutical Science,(17th ed.Mack Publishing Company, Easton,Pa.1985);和Goodman&Gillman's:The Pharmacological Basis of Therapeutics (11th Edition,McGraw-Hill Professional,2005);其各自的公开内容整体援引加入本文。
在一些实施方案中,所述药物组合物可以包含任何浓度的本文公开的任何表达载体、纳米胶囊或组合物,其允许给药的沉默核酸达到约0.1mg/kg至约1mg/kg 范围内的浓度。在一些实施方案中,所述药物组合物可以包含约0.1重量%至约99.9 重量%的量的表达载体。适合包括在任何药物组合物内的药学上可接受的载剂包括水、缓冲水、盐水溶液如生理盐水或平衡盐水溶液如Hank's或Earle's平衡溶液)、甘氨酸、透明质酸等。可以配制药物组合物用于肠胃外给药,如静脉内、肌肉内或皮下给药。用于肠胃外给药的药物组合物可以包含药学上可接受的无菌水性或非水性溶液、分散液、悬浮液或乳液以及用于重构为无菌可注射溶液或分散液的无菌粉末。合适的水性或非水性载剂、溶剂、稀释剂或媒介物的实例包括水、乙醇、多元醇(如甘油、丙二醇、聚乙二醇等)、羧甲基纤维素和它们的混合物、植物油(如橄榄油)、可注射的有机酯(例如油酸乙酯)。
药物组合物可以配制用于口服给药。用于口服给药的固体剂型可以包括例如片剂、糖锭剂、胶囊剂、丸剂和颗粒剂。在这类固体剂型中,所述组合物可以包含至少一种药学上可接受的载剂如柠檬酸钠和/或磷酸二钙和/或填充剂或增量剂如淀粉、乳糖、蔗糖、葡萄糖、甘露醇和硅酸;粘合剂如羧甲基纤维素、藻酸盐、明胶、聚乙烯吡咯烷酮、蔗糖和阿拉伯胶;湿润剂如甘油;崩解剂如琼脂-琼脂、碳酸钙、马铃薯或木薯淀粉、海藻酸、硅酸盐和碳酸钠;湿润剂如乙酰醇、甘油单硬脂酸酯;吸收剂如白陶土和膨润土;和/或润滑剂如滑石、硬脂酸钙、硬脂酸镁、固体聚乙二醇、十二烷基硫酸钠,以及它们的混合物。用于口服给药的液体剂型可以包括例如药学上可接受的乳剂、溶液剂、混悬剂、糖浆剂和酏剂。液体剂型可以包括惰性稀释剂如水或其他溶剂,增溶剂和/或乳化剂如乙醇、异丙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油(例如,棉子油、玉米油、胚芽油、蓖麻油、橄榄油、芝麻油)、甘油、四氢糠醇、聚乙二醇和脱水山梨糖醇的脂肪酸酯,以及它们的混合物。
药物组合物可以包含渗透促进剂以增强它们的递送。渗透促进剂可以包括脂肪酸如油酸、月桂酸、癸酸、肉豆蔻酸、棕榈酸、硬脂酸、亚油酸、亚麻酸、二癸酸酯、reclineate、甘油单油酸酯、二月桂酸甘油酯、辛酸、花生四烯酸、甘油1-单癸酸酯、单甘油酯和二-甘油酯,以及它们的生理学上可接受的盐。所述组合物可以进一步包括螯合剂,例如,乙二胺四乙酸(EDTA)、柠檬酸、水杨酸盐(例如水杨酸钠、5-甲氧基水杨酸盐、高香草酸盐(homovanilate))。
药物组合物可以包含任何封装形式的本文公开的任何表达载体。例如,表达载体可以封装在纳米胶囊中,例如包含一种或多种生物可降解聚合物(如聚交酯-聚乙交酯(polylactide-polyglycolide)、聚(原酸酯)和聚(酸酐))的纳米胶囊。在一些实施方案中,载体封装在聚合物纳米胶囊中。在其他实施方案中,载体封装在可生物降解和/或易蚀的聚合物纳米胶囊中。在一些实施方案中,聚合物纳米胶囊包含两种不同的带正电的单体,至少一种中性单体以及交联剂。在一些实施方案中,纳米胶囊还包含至少一个靶向部分。在一些实施方案中,纳米胶囊包含2-6个靶向部分。在一些实施方案中,靶向部分是抗体。在一些实施方案中,靶向部分靶向以下中的任何一种:CD117、CD10、CD34、CD38、CD45、CD123、CD127、CD135、CD44、CD47、CD96、CD2、 CD4、CD3和CD9标记。在一些实施方案中,靶向部分靶向人间充质干细胞CD标记中的任何一种,包括CD29、CD44、CD90、CD49a-f、CD51、CD73(SH3)、CD105(SH2)、CD106、CD166和Stro-1标记。在一些实施方案中,靶向部分靶向人造血干细胞CD标记(包括CD34、CD38、CD45RA、CD90和CD49)中的任何一种。
在其他实施方案中,表达载体可以封装在脂质体中或分散在微乳液中。脂质体可以是例如lipofectin或lipofectamine。在另一个实例中,组合物可以包含在无核细菌小细胞中或之上的本文公开的表达载体(Giacalone et al,Cell Microbiology 2006, 8(10):1624-33)。本文公开的表达载体可以与纳米颗粒组合。
试剂盒
在一些实施方案中是包含如本文所述的表达载体或包含表达载体的组合物的试剂盒。所述试剂盒可以包括容器,其中所述容器可以是包含口服或肠胃外剂型的表达载体或组合物的瓶子,每个剂型包含单位剂量的表达载体。所述试剂盒可以包括标签等,指示根据本文描述的方法对受试者进行的治疗。
在一些实施方案中,试剂盒可以包括额外的活性物质。额外的活性物质可以装在与容纳载体或包含载体的组合物的容器分开的容器中。例如,在一些实施方案中,试剂盒可以包含一个或多个剂量的嘌呤类似物(例如6TG)以及任选存在的剂量给药用于调理(conditioning)和/或化学选择的嘌呤类似物的说明书(如本文进一步描述的那些步骤)。在其他实施方案中,所述试剂盒可以包含一个或多个剂量的二氢叶酸还原酶抑制剂(例如,MTX或MPA)以及任选存在的如本文所述剂量给药用于负选择的二氢叶酸还原酶抑制剂的说明书。
治疗方法
作为示例,可以给药包含编码WAS基因的核酸序列的表达载体,以在遗传上纠正Wiskott-Aldrich综合征或减轻与Wiskott-Aldrich综合征相关的病理。在一些实施方案中,可以给药用包含编码WAS基因的核酸序列的表达载体转导的宿主细胞群体,以纠正Wiskott-Aldrich综合征或减轻与Wiskott-Aldrich综合征相关的病理。据认为,这种方法优于目前可用的疗法,因为它适用于所有患者,尤其是那些没有匹配的同胞供体的患者。进一步认为,这种方法也有可能作为一次治疗进行给药,以提供终生纠正。还认为该方法有利地没有任何免疫副作用,并且如果确实出现副作用,则可以如本文所述通过给药二氢叶酸还原酶抑制剂(例如MTX或MPA)来减轻副作用。进一步认为,有效的基因治疗方法会彻底改变Wiskott-Aldrich综合征的治疗方式,最终改善患者的治疗效果。
在一些实施方案中,用本文所述的载体或转导的宿主细胞进行治疗在遗传上纠正或减轻与Wiskott-Aldrich综合征相关的一种或多种病理,如下文概述的那些。在一些实施方案中,可以通过向患者给药表达载体或转导的宿主细胞来遗传上纠正或减轻的病理包括但不限于微血小板减少症、湿疹、自身免疫性疾病和复发性感染。湿疹在经典WAS患者中常见。在婴儿中,湿疹可能出现在面部或头皮上,类似于“乳痂”。它还可能出现严重的尿布疹,或更广泛地说,涉及手臂和腿部。在年龄较大的男孩中,湿疹通常仅限于肘部前部或膝盖后部、耳后或手腕周围的皮肤皱褶处。由于湿疹非常痒,患者经常抓挠自己直到流血,即使在睡觉时也是如此。这些皮肤屏障遭到破坏的区域可以充当细菌的进入点,从而导致皮肤和血流感染。
据认为,血小板减少症(血小板数量减少)是Wiskott-Aldrich综合征患者的共同特征。除了数量减少之外,血小板本身很小且功能失调,不到正常血小板大小的一半。因此,即使没有受伤,Wiskott-Aldrich综合征患者也可能容易出血。在一些实施方案中,皮肤出血可以导致针头大小的蓝红色斑点,称为瘀点,或者它们可能更大并类似于瘀伤。
据认为,与Wiskott-Aldrich综合征相关的免疫缺陷导致B和T淋巴细胞的功能显著异常。因此,感染在Wiskott-Aldrich综合征的经典形式中常见,并且可以涉及所有类别的微生物。在一些实施方案中,这些感染可以包括上呼吸道和下呼吸道感染,例如耳部感染、鼻窦感染和肺炎。更严重的感染,如败血症(血流感染或“血液中毒”)、脑膜炎和严重的病毒感染不太常见,但可能会发生。有时,典型形式的Wiskott- Aldrich综合征患者可能出现由真菌(耶氏(卡氏)肺孢子菌(pneumocystis jiroveci carinii)) 引起的肺炎。在一些实施方案中,在患者抓过湿疹的部位,皮肤可能感染诸如葡萄球菌的细菌。在一些实施方案中,称为传染性软疣的病毒性皮肤感染也常见于Wiskott- Aldrich综合征。据认为,预防感染的疫苗接种通常对Wiskott-Aldrich综合征无效,因为患者不会对疫苗产生正常的保护性抗体应答。
在一些实施方案中,反复感染包括但不限于中耳炎、皮肤脓肿、肺炎、小肠结肠炎、脑膜炎、败血症和泌尿道感染。在一些实施方案中,反复感染是皮肤感染。在一些实施方案中,诊断为患有Wiskott-Aldrich综合征的患者所经历的湿疹归类为难治性湿疹。
作为示例,患有Wiskott-Aldrich综合征的人经常经历的自身免疫疾病包括溶血性贫血、脉管炎、关节炎、中性粒细胞减少症、炎性肠病和IgA肾病、Henoch- 样紫癜、皮肌炎、复发性血管性水肿和葡萄膜炎。在一些实施方案中,反复感染可以由任何细菌、病毒或真菌感染引起。在一些实施方案中,用本文所述的载体或转导的宿主细胞进行治疗在遗传上纠正或减轻与Wiskott-Aldrich综合征相关的多种病理,如下文概述的那些。
如本文所述,除了治疗基因之外,本公开的表达载体包含设计为敲低的试剂(例如抗HPRT shRNA以实现HPRT表达的敲低),并因此提供体内化学选择策略,其利用HPRT在将嘌呤类似物(例如,6TG)代谢成骨髓毒剂方面的重要作用。因为 HPRT缺陷不会损害造血细胞的发育或功能,所以其可以从用于移植的造血细胞中去除。本文进一步讨论使用嘌呤类似物的调理和化学选择。
在治疗或减轻与Wiskott-Aldrich综合征相关的病理的上下文下,并参考图 11,受试者的治疗包括:确定需要治疗的受试者;用本公开的表达载体(例如,慢病毒载体)转导HSC(例如,自体HSC、同种异体HSC、同胞匹配HSC)(步骤120);以及将转导的HSC移植或给药到受试者中(步骤140)。在一些实施方案中,需要治疗的受试者是患有与Wiskott-Aldrich综合征相关的病理的受试者。
在一些实施方案中,治疗血红蛋白病的方法包括(i)用包含至少两个核酸序列的载体转导HSC,即编码用于敲低HPRT基因的shRNA的核酸序列和编码WASP 的核酸序列,和(ii)向哺乳动物受试者(例如,人患者)给药转导的HSC。在一些实施方案中,所述方法还包括在给药转导的HSC之前的清髓性调理步骤(例如,使用嘌呤类似物、化疗、放疗、用一种或多种内化免疫毒素或抗体-药物缀合物治疗,或其任何组合)。在一些实施方案中,所述方法还包括在给药转导的HSC之后利用嘌呤类似物(例如,6TG)进行体内化学选择的步骤。在一些实施方案中,所述方法还包括在出现副作用(例如,GvHD)时,使用二氢叶酸还原酶抑制剂(例如,MTX或MPA)进行负选择的步骤。
在本公开的另一方面是一种减轻与Wiskott-Aldrich综合征相关的一种或多种病理的方法,其包括向哺乳动物受试者(例如,人患者)给药有效量的药物组合物,其中所述药物组合物包含表达载体,所述表达载体包含至少两个核酸序列,以及药学上可接受的载剂。在本公开的另一方面是一种减轻与Wiskott-Aldrich综合征相关的病理的方法,其包括向哺乳动物受试者(例如,人患者)给药有效量的药物组合物,其中所述药物组合物包含用表达载体转导的宿主细胞群体,所述表达载体包含至少两个核酸序列,以及药学上可接受的载剂。在一些实施方案中,表达载体是慢病毒表达载体,其包含编码用于敲低HPRT基因的RNAi的第一核酸;以及编码WASP的第二核酸。在一些实施方案中,所述方法还包括在给药转导的HSC之前的清髓性调理步骤。在一些实施方案中,所述方法还包括在给药转导的HSC之后利用6TG进行体内化学选择的步骤。在一些实施方案中,所述方法还包括在出现副作用(例如,GvHD)时,使用二氢叶酸还原酶抑制剂(例如,MTX或MPA)进行负选择的步骤。
用嘌呤类似物进行调理和化学选择
在一些实施方案中,治疗方法包括额外步骤(i)在HSC移植前进行调理;和/或(ii)体内化学选择。一个或两个步骤可以使用嘌呤类似物。在一些实施方案中,嘌呤类似物是6TG。据认为,植入的缺乏HPRT活性的含有Wiskott-Aldrich综合征蛋白的HSC对引入的嘌呤类似物的细胞毒性具有高抗性。通过调理和化学选择的组合策略,能够实现HPRT缺陷的、含有Wiskott-Aldrich综合征蛋白的HSC的高效和高植入,并且总体毒性低。据认为,所产生的Wiskott-Aldrich综合征蛋白的表达,结合基因修饰HSC的增强植入和化学选择,能够产生足够的蛋白,以减轻与Wiskott-Aldrich综合征相关的病理。
6TG是一种具有抗癌和免疫抑制活性的嘌呤类似物。硫鸟嘌呤与次黄嘌呤和鸟嘌呤竞争次黄嘌呤-鸟嘌呤磷酸核糖转移酶(HGPRTase),并且其自身转化为6-硫鸟苷酸(TGMP)。这种核苷酸在治疗剂量下达到高细胞内浓度。TGMP干扰鸟嘌呤核苷酸的合成的几个点。它通过谷氨酰胺-5-磷酸核糖焦磷酸酰胺转移酶(嘌呤核糖核苷酸从头途径中特有的第一种酶)的假反馈抑制来抑制从头嘌呤生物合成。TGMP还通过与IMP 脱氢酶竞争来抑制肌苷酸(IMP)向黄苷酸(XMP)转化。曾一度认为TGMP是一种重要的 ATP抑制剂:GMP磷酸转移酶(鸟苷酸激酶),但最近的结果表明并非如此。硫鸟苷酸通过代谢鸟嘌呤核苷酸的相同酶进一步转化为二磷酸和三磷酸,硫鸟苷二磷酸(TGDP) 和硫鸟苷三磷酸(TGTP)(以及它们的2'-脱氧核糖类似物)。
本领域技术人员应当理解,鉴于本公开的载体中包含设计为降低HPRT表达的物质(例如敲低HPRT的RNAi物质),所得的转导的HSC是HPRT缺陷的或基本上HPRT缺陷的(例如,具有20%或更少的残留HPRT基因表达的那些)。因此,那些确实表达HPRT的HSC,即HPRT野生型细胞,可以通过给药一个或多个剂量的6TG 来选择性去除。在一些实施方案中,6TG可以用于HPRT野生型受者的清髓性调理和供体细胞的体内化学选择过程。因此,这样的策略据认为允许在体内选择基因修饰的细胞,即用于在体内选择含有Wiskott-Aldrich综合征蛋白的基因修饰细胞。
再次参考图11,在一些实施方案中,在从供体收集HSC(步骤110)之后,用根据本公开的载体转导HSC(步骤120)。所得的HSC是HPRT缺陷的,并表达WAS 基因。平行地,首先用清髓性调理步骤对接受HSC的患者进行治疗(步骤130)。在调理之后,向患者移植或给药转导的HSC(步骤140)。然后,如本文所讨论的,可以使用6TG在体内选择含有WAS基因的HSC(步骤150)。
可以使用高剂量调理辐射、化疗和/或嘌呤类似物(例如,6TG)处理来实现清髓性调理。在一些实施方案中,在用调理方案治疗后约24-约96小时给药HSC。在其他实施方案中,在用调理方案治疗后约24-约72小时用HSC移植物治疗患者。在仍然的其他实施方案中,在用调理方案治疗后约24-约48小时用HSC移植物治疗患者。在一些实施方案中,HSC移植物包含约2x 106个细胞/kg-约15x 106个细胞/kg(患者体重)。在一些实施方案中,HSC移植物包含最少2x 106个细胞/kg,并且目标为大于6x 106个细胞/kg。在一些实施方案中,至少10%给药的细胞用本文所述的慢病毒载体转导。在一些实施方案中,至少20%给药的细胞用本文所述的慢病毒载体转导。在一些实施方案中,至少30%给药的细胞用本文所述的慢病毒载体转导。在一些实施方案中,至少40%给药的细胞用本文所述的慢病毒载体转导。在一些实施方案中,至少50%给药的细胞用本文所述的慢病毒载体转导。
在一些实施方案中,使用低剂量的6TG方案在体内选择含有治疗性基因的 HPRT缺陷的HSC,据认为这对造血外组织具有最小的不利影响。在一些实施方案中,在将HSC引入患者后,向患者提供约0.2mg/kg/天-约0.6mg/kg/天的用于体内化学选择的6TG剂量。在一些实施方案中,剂量为约0.3mg/kg/天-约1mg/kg/天。在一些实施方案中,剂量达约2mg/kg/天。
在一些实施方案中,每剂量给药的6TG的量基于患者HPRT酶活性的确定。本领域普通技术人员会理解,可以向具有较高水平HPRT酶活性的那些患者提供具有较低量6TG的剂量。HPRT水平越高,6TG向有毒代谢物的转化越高。因此,需要给药较低的剂量来实现相同的目标。
在进行6TG调理之前测量TPMT基因型和/或TPMT酶活性可以鉴别具有低TPMT酶活性或缺乏TPMT酶活性的个体。因此,在其他实施方案中,6TG的给药量取决于硫嘌呤S-甲基转移酶(TPMT)水平或TPMT基因型。
在一些实施方案中,用于体内化学选择的6TG剂量以具有选自以下周期的方案每周给药患者1-3次:(i)每周;(ii)每隔一周;(iii)治疗1周,然后停止2、3或4 周;(iv)治疗2周,然后停止1、2、3或4周;(v)治疗3周,然后停止1、2、3、4或 5周;(vi)治疗4周,然后停止1、2、3、4或5周;(vii)治疗5周,然后停止1、2、3、 4或5周;以及(viii)每月。
在一些实施方案中,在1周-约4周的给药期内向患者给药约3-约10个剂量的6TG。在一些实施方案中,在14天内向患者给药4或5个剂量的6TG。
使用二氢叶酸还原酶抑制剂进行负选择
此外,通过使用二氢叶酸还原酶抑制剂(例如,MTX)抑制嘌呤从头合成途径中的二氢叶酸还原酶(DHFR),可以对HPRT缺陷细胞进行负选择。这已被开发为一种安全程序,用于在观察到意外的不利影响时消除基因修饰的HSC。因此,参考图11,如果出现任何不良副作用,可以用二氢叶酸还原酶抑制剂(例如,MTX或MPA)治疗患者(步骤160)。不良副作用包括,例如,异常血细胞计数/克隆扩增,表明特定细胞克隆中的插入诱变或细胞因子风暴。
据认为,二氢叶酸还原酶抑制剂(例如,MTX或MPA)会竞争性抑制二氢叶酸还原酶(DHFR),这是一种参与四氢叶酸(THF)合成的酶。DHFR催化二氢叶酸转化为活性四氢叶酸。DNA合成所需的核苷胸苷的从头合成需要叶酸。此外,叶酸对于嘌呤和嘧啶碱基的生物合成是必不可少的,因此合成会受到抑制。因此,二氢叶酸还原酶抑制剂(例如,MTX或MPA)会抑制DNA、RNA、胸苷酸和蛋白的合成。MTX或 MPA通过抑制DHFR阻断从头途径。在HPRT-/-细胞中,没有补救或从头途径功能,导致没有嘌呤合成,因此细胞死亡。然而,HPRT野生型细胞具有功能性补救途径,它们的嘌呤合成发生并且细胞存活。
鉴于根据本公开制备的修饰的HSC的敏感性,二氢叶酸还原酶抑制剂(例如,MTX或MPA)可以用于选择性消除HPRT缺陷细胞。在一些实施方案中,二氢叶酸还原酶抑制剂(例如,MTX或MPA)作为单剂量给药。在一些实施方案中,给药多剂量的二氢叶酸还原酶抑制剂。
在一些实施方案中,MTX的给药量为约2mg/m2/输注-约100mg/m2/输注。在一些实施方案中,MTX的给药量为约2mg/m2/输注-约90mg/m2/输注。在一些实施方案中,MTX的给药量为约2mg/m2/输注-约80mg/m2/输注。在一些实施方案中, MTX的给药量为约2mg/m2/输注-约70mg/m2/输注。在一些实施方案中,MTX的给药量为约2mg/m2/输注-约60mg/m2/输注。在一些实施方案中,MTX的给药量为约2 mg/m2/输注-约50mg/m2/输注。在一些实施方案中,MTX的给药量为约2mg/m2/输注- 约40mg/m2/输注。在一些实施方案中,MTX的给药量为约2mg/m2/输注-约30mg/m2/ 输注。在一些实施方案中,MTX的给药量为约20mg/m2/输注-约20mg/m2/输注。在一些实施方案中,MTX的给药量为约2mg/m2/输注-约10mg/m2/输注。在一些实施方案中,MTX的给药量为约2mg/m2/输注-约8mg/m2/输注。在其他实施方案中,MTX 的给药量为约2.5mg/m2/输注-约7.5mg/m2/输注。在仍然的其他实施方案中,MTX的给药量为约5mg/m2/输注。在甚至更进一步的实施方案中,MTX的给药量为约7.5 mg/m2/输注。
在一些实施方案中,进行2-6次输注,并且每次输注可以包括相同剂量或不同剂量(例如,递增剂量、递减剂量等)。在一些实施方案中,给药可以每周或每两个月进行。
在一些实施方案中,MPA以每天约500mg-约1500mg的量给药。在一些实施方案中,MPA的剂量以单次推注(bolus)给药。MPA的剂量分为多个单独的剂量,每天总计约500mg-约1500mg。
在一些实施方案中,MTX或MPA的类似物或衍生物可以代替MTX或MPA。MTX的衍生物描述于美国专利号5,958,928和PCT公开号WO/2007/098089中,其公开内容整体援引加入本文。在一些实施方案中,可选试剂可以用于代替MTX或MPA,包括但不限于利巴韦林(ribavarin)(IMPDH抑制剂);VX-497(IMPDH抑制剂) (参见Jain J,VX-497:a novel,selective IMPDH inhibitor and immunosuppressive agent,J Pharm Sci.2001May;90(5):625-37);洛美曲索(lometrexol)(DDATHF,LY249543)(GAR 和/或AICAR抑制剂);噻吩类似物(LY254155)(GAR和/或AICAR抑制剂),呋喃类似物(LY222306)(GAR和/或AICAR抑制剂)(参见Habeck et al.,A Novel Class of Monoglutamated Antifolates ExhibitsTight-binding Inhibition of Human Glycinamide RibonucleotideFormyltransferase and Potent Activity against Solid Tumors,Cancer Research54,1021-2026,Feb.1994);DACTHF(GAR和/或AICAR抑制剂)(参见Cheng et.al. Design,synthesis,and biological evaluation of 10-methanesulfonyl-DDACTHF,10-methanesulfonyl-5-DACTHF,and 10-methylthio-DDACTHF as potent inhibitors ofGAR Tfase and the de novo purine biosynthetic pathway;Bioorg Med Chem.2005May16;13(10):3577-85);AG2034(GAR和/或AICAR抑制剂)(参见Boritzki et.al.AG2034: anovel inhibitor of glycinamide ribonucleotide formyltransferase,Invest NewDrugs. 1996;14(3):295-303);LY309887(GAR和/或AICAR抑制剂)((2S)-2-[[5-[2-[(6R)-2-氨基- 4-氧代-5,6,7,8-四氢-1H-吡啶并[2,3-d]嘧啶-6-基]乙基]噻吩-2-羰基]氨基]戊二酸);力比泰(alimta)(LY231514)(GAR和/或AICAR抑制剂)(参见Shihet.al.LY231514,a pyrrolo[2,3-d]pyrimidine-based antifolate that inhibitsmultiple folate-requiring enzymes, Cancer Res.1997Mar 15;57(6):1116-23);dmAMT(GAR和/或AICAR抑制剂),AG2009 (GAR和/或AICAR抑制剂);呋咯地辛(Immucillin H,BCX-1777;商品名Mundesine 和Fodosine)(嘌呤核苷磷酸化酶[PNP]的抑制剂)(参见Kicskaet.al.,Immucillin H,a powerful transition-state analog inhibitor of purinenucleoside phosphorylase,selectively inhibits human T lymphocytes,PNAS April10,2001.98(8)4593-4598);以及immucillin- G(嘌呤核苷磷酸化酶[PNP]的抑制剂)。
联合疗法
本公开的另一方面是一种联合疗法,其中在将转导的HSC(如上所述)给药或移植入需要治疗的患者(例如减轻与Wiskott-Aldrich综合征相关的病理)之前、期间或之后给药抗细菌、抗真菌和/或抗病毒活性药物成分(当然取决于所呈现的特定感染)。在一些实施方案中,可以在将转导的HSC(如上所述)给药或移植入需要治疗的患者之前、期间或之后,用高剂量静脉内免疫球蛋白(2gm/kg/天)和/或皮质类固醇(2mg/kg/ 天)治疗患有Wiskott-Aldrich综合征并患有严重血小板减少症的患者。或者,可以在用本公开的表达载体或转导的干细胞治疗之前或之后给予来自健康供体的干细胞的同种异体移植。
实施例
实施例1:中间载体产生-包含400bp绝缘子的pTL20c载体
表10:掺入野生型(wt)或密码子优化的(co)WAS转基因、shRNA、cHS4400bp绝缘子、
MND启动子的4个中间载体。
号码 | 名称 | SEQ ID NO: |
Int 1 | pTL20c_7SK/sh734_MND/hWAS<sup>WT</sup>_WPRE_7SK/sh734_Ins400 | 63 |
Int 2 | pTL20c_r7SK/sh734_MND_hWAS<sup>CO</sup>_WPRE_r7SK/sh734_Ins400 | 64 |
Int 3 | pTL20c_r7SK/sh734_MND/hWAS<sup>WT</sup>_WPRE_r7SK/sh734_Ins400 | 65 |
Int 4 | pTL20c_7SK/sh734_MND/hWAS<sup>CO</sup>_WPRE_7SK/sh734_Ins400 | 66 |
通过将3.2kb hWASWT盒(SEQ ID NO:58)插入pTL20c载体的BstBI和NotI 位点产生“Int 1”载体(表10)。合成该3.2kb并且包含(按以下顺序):1)朝向正向的7SK 启动子和短发夹RNA(shRNA)734表达盒(SEQ ID NO:14);2)由MND启动子、 hWASWT cDNA(SEQ ID NO:1)和WPRE元件(SEQ ID NO:13)组成的WAS表达盒;和 3)朝向正向的7SK启动子和短发夹RNA(shRNA)734表达盒(SEQ ID NO:14)。 WASWT cDNA含有两个沉默突变以除去两个内部SfiI位点。
通过将3.2kb hWASCO盒(SED ID:59)插入pTL20c载体的BstBI和NotI位点产生“Int2”载体(表10)。合成该3.2kb并且包含(按以下顺序):1)朝向反向的7SK启动子和短发夹RNA(shRNA)734表达盒(SEQ ID NO:14);2)由MND启动子、 hWASCO cDNA(SEQ ID NO:4)和WPRE元件(SEQ ID NO:13)组成的WAS表达盒;和 3)朝向反向的7SK启动子和短发夹RNA(shRNA)734表达盒(SEQ ID NO:14)。 hWASCO cDNA为密码子优化的。
通过将hWASWT cDNA替代hWASCO cDNA插入pTL20c_r7SK/sh734_MND_hWASCO_WPRE_r7SK/sh734_Ins400载体(SEQ ID No:64)的 AscI/SpeI位点产生含有朝向反向的两个shRNA表达盒的“Int 3”载体(表10)。
通过将hWASCO cDNA替代hWASWT cDNA插入 pTL20c_7SK/sh734_MND_hWASWT_WPRE_7SK/sh734_Ins400载体(SEQ ID NO:63)的 AscI/SpeI位点,产生含有朝向正向的两个shRNA表达盒的“Int 4”载体(表10)。
实施例2:载体产生-包含400bp绝缘子的pTL20c载体
如表11所示制备载体候选物,其包含鸡超敏位点4(chicken hypersensitivitysite 4)绝缘子(cHS4)的400bp延长的核心元件。
表11:掺入野生型(wt)或密码子优化的(co)WAS转基因、shRNA、cHS4 400bp绝缘
子、 MND启动子的8个候选物。
候选物号 | 名称 | SEQ ID NO |
1 | pTL20c-7SK/sh734-MND/hWAS<sup>wt</sup> | 42 |
2 | pTL20c-MND/hWAS<sup>wt</sup>-7SK/sh734 | 43 |
3 | pTL20c-r7SK/sh734-MND/hWAS<sup>wt</sup> | 44 |
4 | pTL20c-MND/hWAS<sup>wt</sup>-r7SK/sh734 | 45 |
5 | pTL20c-r7SK/sh734-MND/hWAS<sup>co</sup> | 46 |
6 | pTL20c-MND/hWAS<sup>co</sup>-r7SK/sh734 | 47 |
7 | pTL20c-7SK/sh734-MND/hWAS<sup>co</sup> | 48 |
8 | pTL20c-MND/hWAS<sup>co</sup>-7SK/sh734 | 49 |
通过移除短发夹RNA(shRNA)734序列之一从中间构建体(表10)制备候选载体。
通过用AgeI消化从“Int 1”载体移除位于hWAS表达盒下游的第二个 7SK/sh734shRNA表达盒然后重新连接产生pTL20c-7SK/sh734-MND/hWASwt载体 (SEQ ID NO:42)。
通过用MluI消化从“Int 1”载体移除位于hWAS表达盒上游的第二个 7SK/sh734shRNA表达盒然后重新连接产生pTL20c-MND/hWASwt-7SK/sh734载体 (SEQ ID NO:43)。
通过用AgeI消化从“Int 3”载体移除位于hWAS表达盒下游的第二个 r7SK/sh734shRNA表达盒然后重新连接产生pTL20c-r7SK/sh734-MND/hWASwt载体 (SEQ ID NO:44)。
通过用MluI消化从“Int 3”载体移除位于hWAS表达盒上游的第二个 r7SK/sh734shRNA表达盒然后重新连接产生pTL20c-MND/hWASwt-r7SK/sh734载体 (SEQ ID NO:45)。
通过用AgeI消化从“Int 4”载体移除位于hWAS表达盒下游的第二个 7SK/sh734shRNA表达盒然后重新连接产生pTL20c-r7SK/sh734-MND/hWASco载体 (SEQ ID NO:46)。
通过用MluI消化从“Int 4”载体移除位于位于hWAS表达盒上游的 r7SK/sh734shRNA表达盒然后重新连接产生pTL20c-MND/hWASco-r7SK/sh734载体 (SEQ ID NO:47)。
通过用AgeI消化从“Int 2”载体移除位于hWAS表达盒下游的第二个 r7SK/sh734shRNA表达盒然后重新连接产生pTL20c-7SK/sh734-MND/hWASco载体 (SEQ ID NO:48)。
通过用MluI消化从“Int 2”载体移除位于hWAS表达盒上游的第二个 r7SK/sh734shRNA表达盒然后重新连接产生pTL20c-MND/hWASco-7SK/sh734(SEQ ID NO:49)。
实施例3:载体产生-包含650bp绝缘子的pTL20c载体
根据以下的方法制备候选载体,其包含鸡超敏位点4绝缘子(cHS4)的650 bp延长的核心元件。
表12:掺入野生型(wt)或密码子优化的(co)WAS转基因、shRNA、cHS4650bp绝缘子、
MND启动子的8个候选物。
候选物号 | 名称 | SEQ ID NO. |
9 | pTL20c_SK734Fwd_pMND_WASwt_Ins650 | 50 |
10 | pTL20c_pMND_WASwt_SK734Fwd_Ins650 | 51 |
11 | pTL20c_SK734Rev_pMND_WASwt_Ins650 | 52 |
12 | pTL20c_pMND_WASwt_SK734Rev_Ins650 | 53 |
13 | pTL20c_SK734Fwd_pMND_WASco_Ins650 | 54 |
14 | pTL20c_pMND_WASco_SK734Fwd_Ins650 | 55 |
15 | pTL20c_SK734Rev_pMND_WASco_Ins650 | 56 |
16 | pTL20c_pMND_WASco_SK734Rev_Ins650 | 57 |
方法
产生pTL20c载体构建体,其包含鸡超敏位点4绝缘子(cHS4)序列的650 bp延长的核心元件(表12;候选物号9-16)。将朝向反向的650bp cHS4序列插入病毒转录物的3’LTR中。通过替换来自前述载体(表11;候选物号1-8)的400bp绝缘子制备这些载体。
用NotI和heI限制性酶消化列于表11的pTL20c载体构建体,即候选物号 1-8,以移除该400bp cHS4绝缘子序列,并胶纯化经消化的载体骨架。
通过4个片段的Gibson组装构建质粒11、12、15和16(表12)。在经 NotI/NheI消化的载体骨架附近,每个组装反应含有650bp cHS4序列的PCR产物和2 个IDT gBlocks基因片段(gBlocks)。该gBlocks在pTL20c构建体中重新引入绝缘子侧翼的序列。使用gBlock 1(SEQ ID NO:60)(表13)重新引入绝缘子和NheI位点之间的序列,这是每个Gibson组装反应共有的。取决于下游位置中缺失还是存在7sk/sh734 表达盒,分别使用gBlock 2(SEQ IDNO:61)(表12,候选物号11和15)或gBlock 3 (SEQ ID NO:62)(表12,候选物号12和16)重新引入NotI位点和绝缘子之间的序列。
表13:gBlock序列
使用传统限制性克隆构建质粒9、10、13和14(表12)。通过用NheI和 NotI限制性消化15(表12)随后胶纯化来分离包含侧翼区的650bp cHS4序列。通过将这个DNA片段与经NotI/NheI消化的载体骨架连接获得最后的质粒。
实施例4:转导
材料
293T细胞和LV-hWASp/sh7载体
方法
293T细胞每孔与LV-hWASp/sh7载体共孵育。
实施例5:初步筛选数据转导和WASp表达(平均荧光强度)
通过流式细胞术检测人Wiskott-Aldrich综合征蛋白(hWASp)的细胞内表达。
材料
用BD 5A5抗hWASp(BD)抗体作为一抗。用缀合APC的山羊抗小鼠IgG (ThermoFisher)抗体作为二抗来结合一抗以帮助检测。还使用BD染色缓冲液(BD)、 BD Cytofix/Cytoperm试剂盒(BD)和Fc受体封闭液(Innovex)(参见表14)。
在具有96孔板读取器的MACSQuant流式细胞仪上进行流式细胞术。
表14:抗体的汇总
类型 | 抗体 | 浓度 | 宿主 | 稀释 | 终浓度 |
一抗 | 5A5抗WASp | 250μg/mL | 小鼠 | 1:25 | 8μg/mL |
二抗 | APC山羊抗小鼠IgG | 1000μg/mL | 山羊 | 1:100 | 10μg/mL |
方法
样品制备
转导后4天,分析转导的细胞。移除培养基并用500μL的PBS洗涤转导的细胞。丢弃PBS并添加200μl的1x TrypLE Express。
在室温下孵育细胞直至细胞脱落。将细胞重悬在1mL的D10培养基中,转移至1.5mLEppendorf管随后在台式离心机中在1,200rpm离心3分钟。随后用移液管移除上清液。
通过在500μL的PBS中重悬洗涤细胞,然后在台式离心机中在1,200rpm 离心3分钟。随后用移液管移除上清液。重复洗涤,随后将细胞重悬在200μL冷BD 染色缓冲液中并移至96孔板(V-底孔)(对照:有和没有染色)。
FC封闭
向每个孔加入100μL的冷BD染色缓冲液。随后在2,000rpm(800x g)离心样品3分钟。通过轻弹板快速移除上清液,并通过向板应用纸巾移除残留液体。加入1滴(大约50μL)的Fc受体封闭液,然后通过用多通道移液枪搅动重悬细胞。
将样品在4℃或冰上孵育30分钟。随后通过向每个孔加入200μL冷BD 染色缓冲液洗涤细胞,然后在2,000rpm(800x g)离心3分钟。再次通过轻弹板快速移除上清液,并通过向板应用纸巾移除残留液体。然后重复洗涤。
固定/透化
向每个孔加入100μL Cytofix/Cytoperm溶液,随后通过用多通道移液枪搅动重悬细胞。将样品在4℃或冰上孵育30分钟,避光。
如上所述制备一抗的主要混合物。制备包含5mL 10x BD Perm/Wash缓冲液+45mL水的1x BD Perm/Wash缓冲液并储存在4℃。用冷1x BD Perm/Wash缓冲液重复洗涤样品。
抗体染色
将细胞重悬在含有一抗的50μL 1x BD Perm/Wash缓冲液中,随后避光在 4℃下孵育20分钟。用1x BD Perm/Wash缓冲液在2,000rpm(800x g)重复洗涤样品3 分钟,然后重悬在含有二抗的50μL 1x BD Perm/Wash缓冲液中。随后避光在4℃下孵育样品20分钟,然后用1x BD Perm/Wash缓冲液重复洗涤。最后,用BD染色缓冲液洗涤样品,然后重悬在200μL BD染色缓冲液中用于分析。
流式细胞术
在装备有96孔板读取器的MACSQuant流式细胞仪进行流式细胞术(参见图15-17)。对染色的293T细胞大小(SSC-A vs.FSC-A)和单细胞(FSC-H vs.FSC-A)圈门。绘出APC+细胞周围的门控。阴性对照门控为(模拟,没有经病毒处理,经hWASp染色):0.5%或更少。
如表15所示加工候选物3、4、5和6用于进一步筛选。
表15:包含400bp绝缘子元件的8个候选载体中,加工4个候选物(3、4、5和6)用于进
一步筛选。
号码 | 名称 | 继续加工 |
1 | pTL20c-7SK/sh734-MND/hWAS<sup>wt</sup> | |
2 | pTL20c-MND/hWAS<sup>wt</sup>-7SK/sh734 | |
3 | pTL20c-r7SK/sh734-MND/hWAS<sup>wt</sup> | √ |
4 | pTL20c-MND/hWAS<sup>wt</sup>-r7SK/sh734 | √ |
5 | pTL20c-r7SK/sh734-MND/hWAS<sup>co</sup> | √ |
6 | pTL20c-MND/hWAS<sup>co</sup>-r7SK/sh734 | √ |
7 | pTL20c-7SK/sh734-MND/hWAS<sup>co</sup> | |
8 | pTL20c-MND/hWAS<sup>co</sup>-7SK/sh734 |
实施例6:感染滴度-载体拷贝相比WASp+
(i)通过U5psi/huRPP30 ddPCR定量转导的人细胞中整合的慢病毒载体拷贝数(VCN)
使用VCN测定确定每宿主细胞基因组整合的慢病毒载体基因组数。
测定使用微滴式数字PCR(ddPCR)技术,并使用具有自动微滴发生器的 Bio-RadQX200 ddPCR系统进行。收获转导的细胞用于提取基因组DNA。通过ddPCR VCN测定分析提取的基因组DNA以确定多重通路格式的每个细胞的平均载体拷贝数。
对于转导的人细胞,ddPCR VCN测定测量慢病毒载体靶标(U5psi)以及人内源参考序列(huRPP30)的绝对浓度(拷贝/μL)。由U5psi比huRPP30的比例计算VCN 并归一化至所使用的细胞类型中huRPP30已知的拷贝数(还参见图18)。
表16:测定结果
(ii)表示为MFI(平均荧光强度)每载体拷贝数(VCN)的WASp表达的变化。
含有0.2-9个拷贝的亲本对照载体和该4个候选载体(n=4)的转导的293T 细胞中表示为MFI(平均荧光强度)每载体拷贝数的WASp表达的变化示于图19。
(iii)感染滴度-包含400-Ins的LV候选物
为了测量感染滴度,通过共孵育包含400-Ins的慢病毒载体候选物与稀释的VCM转导293T细胞。结果示于图23A和23B。还测量用包含650-Ins的慢病毒载体候选物转导的细胞的滴度水平(参见图24)。
实施例7:6TG选择/抗性测定
i)滴定6TG剂量窗口
在96孔板中用不同浓度的6TG(0.01-100μM)孵育Jurkat细胞。2天后,用细胞计算器TC20测量细胞活力。对于Jurkat细胞,最佳6TG剂量估计为大约5μM。选择名义上的2.5μM6TG的浓度用于随后的化学选择(chemo-selection)实验。结果示于图20A。
ii)使用6TG对转导的Jurkat细胞进行化学选择
用MOI=0.5的代表性载体候选物转导Jurkat细胞,并培养3周,然后用 2.5μM 6TG处理2周。在第5周,用没有6TG的新鲜培养基洗涤细胞然后持续培养。通过ddPCR测定(如实施例6所述)分析VCN。所有6个代表性候选物证明6TG处理下的化学选择。结果示于图20B。
实施例8:体内小鼠实验
有NSG和/或WASp-/-的体内小鼠实验
i)小鼠在小鼠中(Mouse in mouse)实验
小鼠
用CD45.2+、5-10周大的雄性和雌性WASp-KO小鼠作为受者,并且 CD45.1+WASp-KO作为供体或相反。CD45.1+、6-10周的C57BL/6J小鼠作为对照。供体可以优选为雌性。
在无菌条件下饲养、处理所有小鼠和进行实验。
细胞制备和移植
根据"Singh et al.(2017).Molecular Therapy-Methods&ClinicalDevelopment,Volume 4,pp.1-16,"描述的方法,牺牲供体小鼠(根据动物伦理准则),并且使用谱系细胞去除试剂盒分离谱系阴性细胞(以>95%的纯度)。用干细胞因子(SCF)和促血小板生成素(TPO)接种供体细胞,并进行两命中(two-hit)慢病毒载体转导。转导后,洗涤细胞以移除病毒并重悬。
使用X射线辐照仪辐射受者小鼠,然后进行两轮的450cGy辐射,辐射之间间隔4小时(参见,例如,图21)。第二次辐射后,使用套管通过尾静脉用所制备的细胞(如上所述)对小鼠进行静脉移植(i.v.)。在移植后的固定时间点(即移植后3、6、9、 12、16周)用种系(strain)特异性的标记(CD45.1和/或CD45.2)分析受者小鼠外周血中的供体细胞植入)。分析包括通过隐静脉(vena saphena)穿刺抽取外周血,用肝素作为抗凝血剂。将血裂解(来移除红细胞)并进行流式细胞术。分析供体细胞的植入和免疫细胞谱系(髓系和淋巴系)的植入。对于长期分析,在移植后20-22周分析小鼠。
ii)人在小鼠中(Human in Mouse)实验
小鼠
使用NOD-SCID-IL-2rg(NSG)小鼠。在如上小鼠在小鼠中实验所述饲养和调理(condition)小鼠,除了NSG小鼠用X-Ray辐照仪以450cGy的剂量辐射一次。
细胞制备和移植
购买G-CSF动员的源自外周血的CD34+细胞并储存(在-180℃)。移植前3 天,解冻合适数目的CD34+细胞并确定细胞数。接种细胞并用人SCF、TPO和FLT3L 预调理48小时。预调理后,用LV转导细胞16小时。转导后,洗涤细胞以移除病毒并移植。用转导的CD34+细胞使用套管通过尾静脉对小鼠进行静脉(i.v.)移植。在固定间隔分析受者小鼠外周血中植入的人细胞(在移植后第3、6、10、12和16周)。在第16 周牺牲小鼠并且收获组织以分析人细胞植入(包括多谱系分析)。对于长期分析,在移植后20-22周分析小鼠。
额外的实施方案
在一些实施方案中是一种组合物,其包含组分,所述组分(i)将编码 Wiskott-Aldrich综合征蛋白(野生型或密码子优化的)的基因引入造血干细胞(“HSC”),和(ii)降低HSC中HPRT的表达。在一些实施方案中,所述组分(例如,核酸序列)包含在慢病毒表达载体中。在一些实施方案中,慢病毒表达载体可以掺入纳米胶囊中,例如适合于靶向HSC的纳米胶囊。在一些实施方案中,所述组合物包含慢病毒载体,其设计为在MND启动子的控制下实现Wiskott-Aldrich综合征蛋白的表达。
在一些实施方案中是一种表达载体,其包含(i)编码RNAi的第一核酸序列;和(ii)编码Wiskott-Aldrich综合征蛋白(例如野生型蛋白或密码子优化蛋白)的第二核酸序列。在一些实施方案中,编码RNAi的第一核酸编码靶向HPRT的小发夹核糖核酸分子(“shRNA”)。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸具有与SEQ ID NO:23-27中任一个具有至少80%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:23-27中任一个具有至少 90%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:23-27中任一个具有至少95%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有与SEQ ID NO:23-27中任一个具有至少97%相同性的序列。在一些实施方案中,编码靶向HPRT基因的shRNA的第一核酸序列具有SEQ ID NO:23-27中任一个的序列。
在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸序列具有与SEQID NO:1、2、3和4中任一个具有至少80%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸序列具有与SEQ ID NO:1、2、3和4中任一个具有至少90%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸序列具有与SEQ ID NO:1、2、3和4中任一个具有至少95%相同性的序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸序列具有与SEQ ID NO:1、2、3和4中任一个具有至少97%相同性的序列。在一些实施方案中,编码 Wiskott-Aldrich综合征蛋白的第二核酸序列具有包含SEQ ID NO:1、2、3和4中任一个的序列。
在一些实施方案中,第一核酸序列可操作地连接至Pol III启动子。在一些实施方案中,Pol III启动子是智人细胞系HEK-293 7sk RNA启动子(参见,例如,SEQ ID NO:28)。在一些实施方案中,Pol III启动子是7sk启动子,与SEQ ID NO:28相比,其在其核酸序列中包含单个突变。在一些实施方案中,Pol III启动子是7sk启动子,与 SEQ ID NO:28相比,其在其核酸序列中包含多个突变。在一些实施方案中,Pol III启动子是7sk启动子,与SEQ IDNO:28相比,其在其核酸序列中包含缺失。在一些实施方案中,Pol III启动子是7sk启动子,与SEQ ID NO:28相比,其在其核酸序列中包含突变和缺失。在一些实施方案中,第一核酸序列可操作地连接至启动子,所述启动子与SEQ ID NO:28的核酸序列具有至少95%相同性。在一些实施方案中,第一核酸序列可操作地连接至启动子,所述启动子与SEQ ID NO:28的核酸序列具有至少97%相同性。在一些实施方案中,第一核酸序列可操作地连接至启动子,所述启动子与 SEQ ID NO:28的核酸序列具有至少98%相同性。在一些实施方案中,第一核酸序列可操作地连接至启动子,其与SEQ ID NO:28的核酸序列具有至少99%相同性。在一些实施方案中,第一核酸序列可操作地连接至启动子,所述启动子具有SEQ ID NO: 28。
在一些实施方案中是一种载体,其包含(i)编码靶向HPRT基因的基于 micro-RNA的shRNA的核酸序列;和(ii)编码WASP的核酸序列。在一些实施方案中,编码Wiskott-Aldrich综合征蛋白的第二核酸序列具有包含SEQ ID NO:1、2、3和4中任一个的序列。在一些实施方案中,编码靶向HPRT基因的基于micro-RNA的shRNA 的核酸序列具有与SEQ IDNO:19、20、21和22中任一个具有至少80%相同性的序列。在一些实施方案中,编码靶向HPRT基因的基于micro-RNA的shRNA的核酸序列具有与SEQ ID NO:19、20、21和22中任一个具有至少90%相同性的序列。在一些实施方案中,编码靶向HPRT基因的基于micro-RNA的shRNA的核酸序列具有与SEQ ID NO:19、20、21和22中任一个具有至少95%相同性的序列。在一些实施方案中,编码靶向HPRT基因的基于micro-RNA的shRNA的核酸序列具有SEQ ID NO:19、20、 21和22中任一个的序列。
在一些实施方案中是一种多核苷酸序列,其包含(a)编码靶向HPRT的 shRNA的第一部分;(b)编码Wiskott-Aldrich综合征蛋白的第二部分。在一些实施方案中,多核苷酸序列还包含(c)编码第一启动子的第三部分以驱动编码靶向HPRT的 shRNA的序列的表达;和(d)编码第二启动子的第四部分以驱动编码WASP的序列的表达。在一些实施方案中,多核苷酸序列还包含(e)编码中央多嘌呤束元件的第五部分;和(f)编码Rev应答元件(SEQ ID NO:31)的第六部分。在一些实施方案中,多核苷酸序列还包含WPRE元件(例如,包含SEQ ID NO:41的WPRE元件)。在一些实施方案中,多核苷酸还包含绝缘子。在一些实施方案中,在多核苷酸序列中包含一个或多个绝缘子,以增强表达载体的安全谱和/或改善转基因表达。在一些实施方案中,绝缘子是染色质绝缘子。在一些实施方案中,绝缘子具有包含SEQ ID NO:38、39和40中任一个的核酸序列。
在一些实施方案中是HSC(例如,CD34+HSC),其已经用表达载体转导,所述表达载体包含Wiskott-Aldrich综合征蛋白转基因以及设计为降低HPRT表达的物质(例如,用于敲低HPRT的RNAi)。在一些实施方案中,转导的HSC构成细胞治疗产品,其可以向需要治疗的受试者给药,例如,用于治疗与Wiskott-Aldrich综合征相关的病理或减轻与Wiskott-Aldrich综合征相关的病理。
在一些实施方案中是HSC,其已经用表达载体转导,所述表达载体包含编码Wiskott-Aldrich综合征蛋白的核酸序列和编码抗HPRT shRNA的核酸。在一些实施方案中,抗HPRT shRNA由7sk启动子驱动,并且其中编码Wiskott-Aldrich综合征蛋白的核酸由MND启动子驱动。在一些实施方案中,由7sk驱动的抗HPRT shRNA朝向相对于Wiskott-Aldrich综合征蛋白盒(例如,SEQ ID NO:15)的正义或反义方向的上游或下游。在一些实施方案中,转导的HSC构成细胞治疗产品,其可以(例如在包含药学上可接受的媒介物的药物组合物中)向需要治疗的受试者给药,例如,治疗或减轻与Wiskott-Aldrich综合征相关的病理。
在一些实施方案中是一种治疗或减轻需要治疗的患者(例如人患者)的与Wiskott-Aldrich综合征相关的病理的方法,其包括(a)用慢病毒表达载体转导HSC,其中所述慢病毒表达载体包含编码抗HPRT shRNA或嵌入microRNA中的抗HPRT shRNA的第一核酸序列;和编码Wiskott-Aldrich综合征蛋白的第二核酸序列;以及(b) 将转导的HSC移植到患者中。在一些实施方案中,HSC是自体或同种异体的。
在一些实施方案中,在移植转导的HSC给药前用清髓性调理对所述患者进行预治疗(例如用嘌呤类似物,包括6-硫鸟嘌呤(“6TG”);用化疗剂;用放射;用抗体药物缀合物,例如在美国专利公开号2017/0360954和2018/0147294以及PCT公开号WO/2017/219025和WO/2017/219029中描述的那些,其公开内容整体援引加入本文)。在一些实施方案中,移植后在体内选择转导的HSC(例如,用6TG)。在一些实施方案中,给药甲氨蝶呤或麦考酚酸以改善移植转导的HSC的任何副作用(例如移植物抗宿主病)。
在一些实施方案中是一种药物组合物,其包含:(a)载体,例如表达载体,其包含(i)编码靶向HPRT基因的shRNA的核酸序列;和(ii)编码Wiskott-Aldrich综合征蛋白的核酸序列;以及(b)药学上可接受的载剂。在一些实施方案中,药物组合物配制成乳剂。在一些实施方案中,药物组合物配制成胶束。在一些实施方案中,药物组合物封装在聚合物中。在一些实施方案中,药物组合物封装在脂质体中。在一些实施方案中,药物组合物封装在小细胞或纳米胶囊中。
在一些实施方案中是一种用于产生病毒滴度的稳定生产者细胞系,其中所述稳定生产者细胞系源自GPR、GPRG、GPRT、GPRGT或GPRT-G包装细胞系之一。在一些实施方案中,稳定生产者细胞系源自GPRT-G细胞系。在一些实施方案中,稳定生产者细胞系通过以下产生:(a)通过将编码抗HPRT shRNA和WASP的核酸序列克隆到重组质粒中合成载体(即合成的载体可以是本文所述载体中的任何一种);(b)从合成的载体产生DNA片段;(c)由(i)从合成的载体产生的DNA片段和(ii)来自抗生素抗性盒质粒的DNA片段形成多联阵列;(d)用形成的多联阵列转染包装细胞系之一;以及(e)分离稳定生产者细胞系。形成稳定生产者细胞系的额外方法公开于2016年5月 12日提交的国际申请号PCT/US2016/031959,其公开内容整体援引加入本文。
本说明书中所引用和/或申请数据表中所列的所有美国专利、美国专利申请公开、美国专利申请、外国专利、外国专利申请和非专利出版物均整体援引加入本文。如果需要,可以修改实施方案的方面以采用各种专利、申请和公开的概念,以便提供进一步的实施方案。
虽然已参考许多说明性实施方案描述了本公开,但是应当理解本领域技术人员可以设计出许多其他修改和实施方案,这些修改和实施方案将落在本公开的原理的精神和范围内。更特别地,在不背离本公开的精神的情况下,在前述公开、附图和所附权利要求书的范围内,本主题组合排列的组成部分和/或排列中的合理变化和修改是可能的。除了组成部分和/或排列中的变化和修改,可选用途对于本领域技术人员来说也是显而易见的。
序列表
<110> YAN, Ming
VONARBURG, Cedric Pierre
LEE, Chi-Lin
GUAN, Chen Chao
AZA, Walid
<120> WISKOTT-ALDRICH综合征的造血干细胞基因疗法
<130> Calimmune-071WO
<150> US 62/784,508
<151> 2018-12-23
<160> 69
<170> PatentIn version 3.5
<210> 1
<211> 1844
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Wild type WASp mRNA
<400> 1
tcctcttctt accctgcacc cagagcctcg ccagagaaga caagggcaga aagcaccatg 60
agtgggggcc caatgggagg aaggcccggg ggccgaggag caccagcggt tcagcagaac 120
ataccctcca ccctcctcca ggaccacgag aaccagcgac tctttgagat gcttggacga 180
aaatgcttga cgctggccac tgcagttgtt cagctgtacc tggcgctgcc ccctggagct 240
gagcactgga ccaaggagca ttgtggggct gtgtgcttcg tgaaggataa cccccagaag 300
tcctacttca tccgccttta cggccttcag gctggtcggc tgctctggga acaggagctg 360
tactcacagc ttgtctactc cacccccacc cccttcttcc acaccttcgc tggagatgac 420
tgccaagcgg ggctgaactt tgcagacgag gacgaggccc aggccttccg ggccctcgtg 480
caggagaaga tacaaaaaag gaatcagagg caaagtggag acagacgcca gctaccccca 540
ccaccaacac cagccaatga agagagaaga ggagggctcc cacccctgcc cctgcatcca 600
ggtggagacc aaggaggccc tccagtgggt ccgctctccc tggggctggc gacagtggac 660
atccagaacc ctgacatcac gagttcacga taccgtgggc tcccagcacc tggacctagc 720
ccagctgata agaaacgctc agggaagaag aagatcagca aagctgatat tggtgcaccc 780
agtggattca agcatgtcag ccacgtgggg tgggaccccc agaatggatt tgacgtgaac 840
aacctcgacc cagatctgcg gagtctgttc tccagggcag gaatcagcga ggcccagctc 900
accgacgccg agacctctaa acttatctac gacttcattg aggaccaggg tgggctggag 960
gctgtgcggc aggagatgag gcgccaggag ccacttccgc cgcccccacc gccatctcga 1020
ggagggaacc agctcccccg gccccctatt gtggggggta acaagggtcg ttctggtcca 1080
ctgccccctg tacctttggg gattgcccca cccccaccaa caccccgggg acccccaccc 1140
ccaggccgag ggggccctcc accaccaccc cctccagcta ctggacgttc tggaccactg 1200
ccccctccac cccctggagc tggtgggcca cccatgccac caccaccgcc accaccgcca 1260
ccgccgccca gctccgggaa tggaccagcc cctcccccac tccctcctgc tctggtgcct 1320
gccgggggcc tggcccctgg tgggggtcgg ggagcgcttt tggatcaaat ccggcaggga 1380
attcagctga acaagacccc tggggcccca gagagctcag cgctgcagcc accacctcag 1440
agctcagagg gactggtggg ggccctgatg cacgtgatgc agaagagaag cagagccatc 1500
cactcctccg acgaagggga ggaccaggct ggcgatgaag atgaagatga tgaatgggat 1560
gactgagtgg ctgagttact tgctgccctg tgctcctccc cgcaggacat ggctccccct 1620
ccacctgctc tgtgcccacc ctccactctc ctcttccagg cccccaaccc cccatttctt 1680
ccccaccaac ccctccaatg ctgttatccc tgcctggtcc tcacactcac ccaacaatcc 1740
caaggccctt tttatacaaa aattctcagt tctcttcact caaggatttt taaagaaaaa 1800
taaaagaatt gtctttctgt ctctctataa aaaaaaaaaa aaaa 1844
<210> 2
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Coding region of wild type WASp mRNA
<400> 2
atgagtgggg gcccaatggg aggaaggccc gggggccgag gagcaccagc ggttcagcag 60
aacataccct ccaccctcct ccaggaccac gagaaccagc gactctttga gatgcttgga 120
cgaaaatgct tgacgctggc cactgcagtt gttcagctgt acctggcgct gccccctgga 180
gctgagcact ggaccaagga gcattgtggg gctgtgtgct tcgtgaagga taacccccag 240
aagtcctact tcatccgcct ttacggcctt caggctggtc ggctgctctg ggaacaggag 300
ctgtactcac agcttgtcta ctccaccccc acccccttct tccacacctt cgctggagat 360
gactgccaag cggggctgaa ctttgcagac gaggacgagg cccaggcctt ccgggccctc 420
gtgcaggaga agatacaaaa aaggaatcag aggcaaagtg gagacagacg ccagctaccc 480
ccaccaccaa caccagccaa tgaagagaga agaggagggc tcccacccct gcccctgcat 540
ccaggtggag accaaggagg ccctccagtg ggtccgctct ccctggggct ggcgacagtg 600
gacatccaga accctgacat cacgagttca cgataccgtg ggctcccagc acctggacct 660
agcccagctg ataagaaacg ctcagggaag aagaagatca gcaaagctga tattggtgca 720
cccagtggat tcaagcatgt cagccacgtg gggtgggacc cccagaatgg atttgacgtg 780
aacaacctcg acccagatct gcggagtctg ttctccaggg caggaatcag cgaggcccag 840
ctcaccgacg ccgagacctc taaacttatc tacgacttca ttgaggacca gggtgggctg 900
gaggctgtgc ggcaggagat gaggcgccag gagccacttc cgccgccccc accgccatct 960
cgaggaggga accagctccc ccggccccct attgtggggg gtaacaaggg tcgttctggt 1020
ccactgcccc ctgtaccttt ggggattgcc ccacccccac caacaccccg gggaccccca 1080
cccccaggcc gagggggccc tccaccacca ccccctccag ctactggacg ttctggacca 1140
ctgccccctc caccccctgg agctggtggg ccacccatgc caccaccacc gccaccaccg 1200
ccaccgccgc ccagctccgg gaatggacca gcccctcccc cactccctcc tgctctggtg 1260
cctgccgggg gcctggcccc tggtgggggt cggggagcgc ttttggatca aatccggcag 1320
ggaattcagc tgaacaagac ccctggggcc ccagagagct cagcgctgca gccaccacct 1380
cagagctcag agggactggt gggggccctg atgcacgtga tgcagaagag aagcagagcc 1440
atccactcct ccgacgaagg ggaggaccag gctggcgatg aagatgaaga tgatgaatgg 1500
gatgac 1506
<210> 3
<211> 1521
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Codon-optimized WASp cDNA
<400> 3
accgccgcca tgtctggcgg acctatggga ggtagacctg gtggaagagg tgctcctgcc 60
gtgcagcaga acatcccttc tacactgctg caggaccacg agaaccagcg gctgtttgag 120
atgctgggca gaaagtgtct gaccctggct acagctgtgg tgcagctgta tctggcactt 180
cctccaggcg ccgagcactg gaccaaagaa cattgtggcg ccgtgtgctt cgtgaaggac 240
aaccctcaga agtcctactt catccggctg tacggactgc aggctggcag actgctgtgg 300
gagcaagagc tgtactccca gctggtgtac agcaccccta cacctttctt ccacaccttt 360
gccggcgacg attgtcaggc cggactgaac tttgccgacg aggatgaagc ccaggccttc 420
agagcactgg tgcaagagaa gatccagaag cggaaccaga gacagagcgg cgacagaagg 480
caactgcctc ctccacctac accagccaac gaggaaagaa gaggcggact gcctccactg 540
cctcttcatc ctggcggaga tcaaggtgga cctcctgtgg gaccactgtc tcttggactg 600
gccaccgtgg acattcagaa ccccgatatc accagcagcc ggtacagagg acttcccgct 660
cctggaccat ctcctgccga caagaagaga tccgggaaga agaagatcag caaggccgac 720
atcggagccc ctagcggctt taaacacgtg tcccacgttg gatgggaccc acagaacggc 780
ttcgacgtga acaatctgga ccccgacctg cggagcctgt tttctagagc cggaatctct 840
gaggcccagc tgaccgatgc cgagacaagc aagctgatct acgacttcat cgaggaccaa 900
ggcggcctgg aagccgtgcg acaagagatg agaaggcaag agcctctgcc accacctcca 960
cctccatcta gaggcggaaa ccagctgcct agacctccta tcgttggcgg caacaaggga 1020
agatctggcc ctctgcctcc tgtgcctctg ggaattgctc caccaccacc aacacctaga 1080
ggcccgcctc caccaggcag aggtggtcct ccgccgccac ctcctccagc aacaggcaga 1140
tctggaccac ttcctcctcc accacctggt gctggtggac ctccaatgcc accgccaccg 1200
cctccgccac ctccgcctcc aagttctgga aatggacctg ctcctcctcc tttgcctcct 1260
gctttggttc ctgctggcgg attggctcca ggcggaggaa gaggcgcact cctggatcag 1320
atcagacagg gcatccagct gaacaagacc cctggcgctc ctgagagttc tgctctgcaa 1380
ccgccaccac agtctagcga aggacttgtg ggagccctga tgcacgtgat gcagaagaga 1440
agcagagcca tccacagcag cgacgaaggc gaagatcaag ctggcgacga agatgaggac 1500
gacgagtggg acgattgata a 1521
<210> 4
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Coding region of codon-optimized WASp cDNA
<400> 4
atgtctggcg gacctatggg aggtagacct ggtggaagag gtgctcctgc cgtgcagcag 60
aacatccctt ctacactgct gcaggaccac gagaaccagc ggctgtttga gatgctgggc 120
agaaagtgtc tgaccctggc tacagctgtg gtgcagctgt atctggcact tcctccaggc 180
gccgagcact ggaccaaaga acattgtggc gccgtgtgct tcgtgaagga caaccctcag 240
aagtcctact tcatccggct gtacggactg caggctggca gactgctgtg ggagcaagag 300
ctgtactccc agctggtgta cagcacccct acacctttct tccacacctt tgccggcgac 360
gattgtcagg ccggactgaa ctttgccgac gaggatgaag cccaggcctt cagagcactg 420
gtgcaagaga agatccagaa gcggaaccag agacagagcg gcgacagaag gcaactgcct 480
cctccaccta caccagccaa cgaggaaaga agaggcggac tgcctccact gcctcttcat 540
cctggcggag atcaaggtgg acctcctgtg ggaccactgt ctcttggact ggccaccgtg 600
gacattcaga accccgatat caccagcagc cggtacagag gacttcccgc tcctggacca 660
tctcctgccg acaagaagag atccgggaag aagaagatca gcaaggccga catcggagcc 720
cctagcggct ttaaacacgt gtcccacgtt ggatgggacc cacagaacgg cttcgacgtg 780
aacaatctgg accccgacct gcggagcctg ttttctagag ccggaatctc tgaggcccag 840
ctgaccgatg ccgagacaag caagctgatc tacgacttca tcgaggacca aggcggcctg 900
gaagccgtgc gacaagagat gagaaggcaa gagcctctgc caccacctcc acctccatct 960
agaggcggaa accagctgcc tagacctcct atcgttggcg gcaacaaggg aagatctggc 1020
cctctgcctc ctgtgcctct gggaattgct ccaccaccac caacacctag aggcccgcct 1080
ccaccaggca gaggtggtcc tccgccgcca cctcctccag caacaggcag atctggacca 1140
cttcctcctc caccacctgg tgctggtgga cctccaatgc caccgccacc gcctccgcca 1200
cctccgcctc caagttctgg aaatggacct gctcctcctc ctttgcctcc tgctttggtt 1260
cctgctggcg gattggctcc aggcggagga agaggcgcac tcctggatca gatcagacag 1320
ggcatccagc tgaacaagac ccctggcgct cctgagagtt ctgctctgca accgccacca 1380
cagtctagcg aaggacttgt gggagccctg atgcacgtga tgcagaagag aagcagagcc 1440
atccacagca gcgacgaagg cgaagatcaa gctggcgacg aagatgagga cgacgagtgg 1500
gacgat 1506
<210> 5
<211> 502
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Protein sequences translated from wild type WASp cDNA
<400> 5
Met Ser Gly Gly Pro Met Gly Gly Arg Pro Gly Gly Arg Gly Ala Pro
1 5 10 15
Ala Val Gln Gln Asn Ile Pro Ser Thr Leu Leu Gln Asp His Glu Asn
20 25 30
Gln Arg Leu Phe Glu Met Leu Gly Arg Lys Cys Leu Thr Leu Ala Thr
35 40 45
Ala Val Val Gln Leu Tyr Leu Ala Leu Pro Pro Gly Ala Glu His Trp
50 55 60
Thr Lys Glu His Cys Gly Ala Val Cys Phe Val Lys Asp Asn Pro Gln
65 70 75 80
Lys Ser Tyr Phe Ile Arg Leu Tyr Gly Leu Gln Ala Gly Arg Leu Leu
85 90 95
Trp Glu Gln Glu Leu Tyr Ser Gln Leu Val Tyr Ser Thr Pro Thr Pro
100 105 110
Phe Phe His Thr Phe Ala Gly Asp Asp Cys Gln Ala Gly Leu Asn Phe
115 120 125
Ala Asp Glu Asp Glu Ala Gln Ala Phe Arg Ala Leu Val Gln Glu Lys
130 135 140
Ile Gln Lys Arg Asn Gln Arg Gln Ser Gly Asp Arg Arg Gln Leu Pro
145 150 155 160
Pro Pro Pro Thr Pro Ala Asn Glu Glu Arg Arg Gly Gly Leu Pro Pro
165 170 175
Leu Pro Leu His Pro Gly Gly Asp Gln Gly Gly Pro Pro Val Gly Pro
180 185 190
Leu Ser Leu Gly Leu Ala Thr Val Asp Ile Gln Asn Pro Asp Ile Thr
195 200 205
Ser Ser Arg Tyr Arg Gly Leu Pro Ala Pro Gly Pro Ser Pro Ala Asp
210 215 220
Lys Lys Arg Ser Gly Lys Lys Lys Ile Ser Lys Ala Asp Ile Gly Ala
225 230 235 240
Pro Ser Gly Phe Lys His Val Ser His Val Gly Trp Asp Pro Gln Asn
245 250 255
Gly Phe Asp Val Asn Asn Leu Asp Pro Asp Leu Arg Ser Leu Phe Ser
260 265 270
Arg Ala Gly Ile Ser Glu Ala Gln Leu Thr Asp Ala Glu Thr Ser Lys
275 280 285
Leu Ile Tyr Asp Phe Ile Glu Asp Gln Gly Gly Leu Glu Ala Val Arg
290 295 300
Gln Glu Met Arg Arg Gln Glu Pro Leu Pro Pro Pro Pro Pro Pro Ser
305 310 315 320
Arg Gly Gly Asn Gln Leu Pro Arg Pro Pro Ile Val Gly Gly Asn Lys
325 330 335
Gly Arg Ser Gly Pro Leu Pro Pro Val Pro Leu Gly Ile Ala Pro Pro
340 345 350
Pro Pro Thr Pro Arg Gly Pro Pro Pro Pro Gly Arg Gly Gly Pro Pro
355 360 365
Pro Pro Pro Pro Pro Ala Thr Gly Arg Ser Gly Pro Leu Pro Pro Pro
370 375 380
Pro Pro Gly Ala Gly Gly Pro Pro Met Pro Pro Pro Pro Pro Pro Pro
385 390 395 400
Pro Pro Pro Pro Ser Ser Gly Asn Gly Pro Ala Pro Pro Pro Leu Pro
405 410 415
Pro Ala Leu Val Pro Ala Gly Gly Leu Ala Pro Gly Gly Gly Arg Gly
420 425 430
Ala Leu Leu Asp Gln Ile Arg Gln Gly Ile Gln Leu Asn Lys Thr Pro
435 440 445
Gly Ala Pro Glu Ser Ser Ala Leu Gln Pro Pro Pro Gln Ser Ser Glu
450 455 460
Gly Leu Val Gly Ala Leu Met His Val Met Gln Lys Arg Ser Arg Ala
465 470 475 480
Ile His Ser Ser Asp Glu Gly Glu Asp Gln Ala Gly Asp Glu Asp Glu
485 490 495
Asp Asp Glu Trp Asp Asp
500
<210> 6
<211> 502
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: WASp amino acid sequence (translated from the
codon-optimized WASp cDNA)
<400> 6
Met Ser Gly Gly Pro Met Gly Gly Arg Pro Gly Gly Arg Gly Ala Pro
1 5 10 15
Ala Val Gln Gln Asn Ile Pro Ser Thr Leu Leu Gln Asp His Glu Asn
20 25 30
Gln Arg Leu Phe Glu Met Leu Gly Arg Lys Cys Leu Thr Leu Ala Thr
35 40 45
Ala Val Val Gln Leu Tyr Leu Ala Leu Pro Pro Gly Ala Glu His Trp
50 55 60
Thr Lys Glu His Cys Gly Ala Val Cys Phe Val Lys Asp Asn Pro Gln
65 70 75 80
Lys Ser Tyr Phe Ile Arg Leu Tyr Gly Leu Gln Ala Gly Arg Leu Leu
85 90 95
Trp Glu Gln Glu Leu Tyr Ser Gln Leu Val Tyr Ser Thr Pro Thr Pro
100 105 110
Phe Phe His Thr Phe Ala Gly Asp Asp Cys Gln Ala Gly Leu Asn Phe
115 120 125
Ala Asp Glu Asp Glu Ala Gln Ala Phe Arg Ala Leu Val Gln Glu Lys
130 135 140
Ile Gln Lys Arg Asn Gln Arg Gln Ser Gly Asp Arg Arg Gln Leu Pro
145 150 155 160
Pro Pro Pro Thr Pro Ala Asn Glu Glu Arg Arg Gly Gly Leu Pro Pro
165 170 175
Leu Pro Leu His Pro Gly Gly Asp Gln Gly Gly Pro Pro Val Gly Pro
180 185 190
Leu Ser Leu Gly Leu Ala Thr Val Asp Ile Gln Asn Pro Asp Ile Thr
195 200 205
Ser Ser Arg Tyr Arg Gly Leu Pro Ala Pro Gly Pro Ser Pro Ala Asp
210 215 220
Lys Lys Arg Ser Gly Lys Lys Lys Ile Ser Lys Ala Asp Ile Gly Ala
225 230 235 240
Pro Ser Gly Phe Lys His Val Ser His Val Gly Trp Asp Pro Gln Asn
245 250 255
Gly Phe Asp Val Asn Asn Leu Asp Pro Asp Leu Arg Ser Leu Phe Ser
260 265 270
Arg Ala Gly Ile Ser Glu Ala Gln Leu Thr Asp Ala Glu Thr Ser Lys
275 280 285
Leu Ile Tyr Asp Phe Ile Glu Asp Gln Gly Gly Leu Glu Ala Val Arg
290 295 300
Gln Glu Met Arg Arg Gln Glu Pro Leu Pro Pro Pro Pro Pro Pro Ser
305 310 315 320
Arg Gly Gly Asn Gln Leu Pro Arg Pro Pro Ile Val Gly Gly Asn Lys
325 330 335
Gly Arg Ser Gly Pro Leu Pro Pro Val Pro Leu Gly Ile Ala Pro Pro
340 345 350
Pro Pro Thr Pro Arg Gly Pro Pro Pro Pro Gly Arg Gly Gly Pro Pro
355 360 365
Pro Pro Pro Pro Pro Ala Thr Gly Arg Ser Gly Pro Leu Pro Pro Pro
370 375 380
Pro Pro Gly Ala Gly Gly Pro Pro Met Pro Pro Pro Pro Pro Pro Pro
385 390 395 400
Pro Pro Pro Pro Ser Ser Gly Asn Gly Pro Ala Pro Pro Pro Leu Pro
405 410 415
Pro Ala Leu Val Pro Ala Gly Gly Leu Ala Pro Gly Gly Gly Arg Gly
420 425 430
Ala Leu Leu Asp Gln Ile Arg Gln Gly Ile Gln Leu Asn Lys Thr Pro
435 440 445
Gly Ala Pro Glu Ser Ser Ala Leu Gln Pro Pro Pro Gln Ser Ser Glu
450 455 460
Gly Leu Val Gly Ala Leu Met His Val Met Gln Lys Arg Ser Arg Ala
465 470 475 480
Ile His Ser Ser Asp Glu Gly Glu Asp Gln Ala Gly Asp Glu Asp Glu
485 490 495
Asp Asp Glu Trp Asp Asp
500
<210> 7
<211> 551
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: MND Promoter Sequence including MMLV and MPSV
sequences
<400> 7
atcgattagt ccaatttgtt aaagacagga tatcagtggt ccaggctcta gttttgactc 60
aacaatatca ccagctgaag cctatagagt acgagccata gataaaataa aagattttat 120
ttagtctcca gaaaaagggg ggaatgaaag accccacctg taggtttggc aagctaggat 180
caaggttagg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 240
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 300
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 360
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 420
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 480
cgcttctgct ccccgagctc aataaaagag cccacaaccc ctcactcggc gcgacgcgtc 540
atgccaccat g 551
<210> 8
<211> 399
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: MND Promoter Sequence
<400> 8
tttatttagt ctccagaaaa aggggggaat gaaagacccc acctgtaggt ttggcaagct 60
aggatcaagg ttaggaacag agagacagca gaatatgggc caaacaggat atctgtggta 120
agcagttcct gccccggctc agggccaaga acagttggaa cagcagaata tgggccaaac 180
aggatatctg tggtaagcag ttcctgcccc ggctcagggc caagaacaga tggtccccag 240
atgcggtccc gccctcagca gtttctagag aaccatcaga tgtttccagg gtgccccaag 300
gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc agttcgcttc tcgcttctgt 360
tcgcgcgctt ctgctccccg agctcaataa aagagccca 399
<210> 9
<211> 309
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: MND Promoter Sequence
<400> 9
gaacagagag acagcagaat atgggccaaa caggatatct gtggtaagca gttcctgccc 60
cgctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat atctgtggta 120
agcagttcct gccccgctca gggccaagaa cagatggtcc ccagatgcgg tcccgccctc 180
agcagtttct agagaaccat cagatgtttc cagggtgccc caaggacctg aaatgaccct 240
gtgccttatt tgaactaacc aatcagttcg cttctcgctt ctgttcgcgc gcttctgctc 300
cccgagctc 309
<210> 10
<211> 459
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: MND Promoter Sequence including the translation
initiation codon
<400> 10
gaacagagag acagcagaat atgggccaaa caggatatct gtggtaagca gttcctgccc 60
cgctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat atctgtggta 120
agcagttcct gccccgctca gggccaagaa cagatggtcc ccagatgcgg tcccgccctc 180
agcagtttct agagaaccat cagatgtttc cagggtgccc caaggacctg aaatgaccct 240
gtgccttatt tgaactaacc aatcagttcg cttctcgctt ctgttcgcgc gcttctgctc 300
cccgagctct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 360
ccacgctgtt ttgacctcca tagaagacac cgactctaga ggatcgatcc cccgggctgc 420
aggaattcaa gcgagaagac aagggcagaa agcaccatg 459
<210> 11
<211> 311
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: MND Promoter Sequence
<400> 11
gaacagagag acagcagaat atgggccaaa caggatatct gtggtaagca gttcctgccc 60
cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga tatctgtggt 120
aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc ggtcccgccc 180
tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc tgaaatgacc 240
ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc gcgcttctgc 300
tccccgagct c 311
<210> 12
<211> 424
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: MND Promoter Sequence including the translation
initiation codon
<400> 12
gaacagagag acagcagaat atgggccaaa caggatatct gtggtaagca gttcctgccc 60
cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga tatctgtggt 120
aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc ggtcccgccc 180
tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc tgaaatgacc 240
ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc gcgcttctgc 300
tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagacgcc 360
atccacgctg ttttgacctc catagaagac accgactcta gaggatccac cggtcgccac 420
catg 424
<210> 13
<211> 590
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: WPRE Sequence
<400> 13
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgttc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca 590
<210> 14
<211> 299
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: 7sk/sh734 expression cassette sequence
<400> 14
accatcgacg tgcagtattt agcatgcccc acccatctgc aaggcattct ggatagtgtc 60
aaaacagccg gaaatcaagt ccgtttatct caaactttag cattttggga ataaatgata 120
tttgctatgc tggttaaatt agattttagt taaatttcct gctgaagctc tagtacgata 180
agtaacttga cctaagtgta aagttgagat ttccttcagg tttatatagc ttgtgcgccg 240
cctgggtacc tcaggatatg cccttgacta tttgtccgac atagtcaagg gcatatcct 299
<210> 15
<211> 3051
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: WASp expression cassette
<400> 15
acgcgtgcga tcgcaccggt ggatcctcga ttagtccaat ttgttaaaga caggatatca 60
gtggtccagg ctctagtttt gactcaacaa tatcaccagc tgaagcctat agagtacgag 120
ccatagataa aataaaagat tttatttagt ctccagaaaa aggggggaat gaaagacccc 180
acctgtaggt ttggcaagct aggatcaagg ttaggaacag agagacagca gaatatgggc 240
caaacaggat atctgtggta agcagttcct gccccggctc agggccaaga acagttggaa 300
cagcagaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 360
caagaacaga tggtccccag atgcggtccc gccctcagca gtttctagag aaccatcaga 420
tgtttccagg gtgccccaag gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc 480
agttcgcttc tcgcttctgt tcgcgcgctt ctgctccccg agctcaataa aagagcccac 540
aacccctcac tcggcgcgcc aattcaagcg agaagacaag ggcagccgcc accatgtctg 600
gcggacctat gggaggtaga cctggtggaa gaggtgctcc tgccgtgcag cagaacatcc 660
cttctacact gctgcaggac cacgagaacc agcggctgtt tgagatgctg ggcagaaagt 720
gtctgaccct ggctacagct gtggtgcagc tgtatctggc acttcctcca ggcgccgagc 780
actggaccaa agaacattgt ggcgccgtgt gcttcgtgaa ggacaaccct cagaagtcct 840
acttcatccg gctgtacgga ctgcaggctg gcagactgct gtgggagcaa gagctgtact 900
cccagctggt gtacagcacc cctacacctt tcttccacac ctttgccggc gacgattgtc 960
aggccggact gaactttgcc gacgaggatg aagcccaggc cttcagagca ctggtgcaag 1020
agaagatcca gaagcggaac cagagacaga gcggcgacag aaggcaactg cctcctccac 1080
ctacaccagc caacgaggaa agaagaggcg gactgcctcc actgcctctt catcctggcg 1140
gagatcaagg tggacctcct gtgggaccac tgtctcttgg actggccacc gtggacattc 1200
agaaccccga tatcaccagc agccggtaca gaggacttcc cgctcctgga ccatctcctg 1260
ccgacaagaa gagatccggg aagaagaaga tcagcaaggc cgacatcgga gcccctagcg 1320
gctttaaaca cgtgtcccac gttggatggg acccacagaa cggcttcgac gtgaacaatc 1380
tggaccccga cctgcggagc ctgttttcta gagccggaat ctctgaggcc cagctgaccg 1440
atgccgagac aagcaagctg atctacgact tcatcgagga ccaaggcggc ctggaagccg 1500
tgcgacaaga gatgagaagg caagagcctc tgccaccacc tccacctcca tctagaggcg 1560
gaaaccagct gcctagacct cctatcgttg gcggcaacaa gggaagatct ggccctctgc 1620
ctcctgtgcc tctgggaatt gctccaccac caccaacacc tagaggcccg cctccaccag 1680
gcagaggtgg tcctccgccg ccacctcctc cagcaacagg cagatctgga ccacttcctc 1740
ctccaccacc tggtgctggt ggacctccaa tgccaccgcc accgcctccg ccacctccgc 1800
ctccaagttc tggaaatgga cctgctcctc ctcctttgcc tcctgctttg gttcctgctg 1860
gcggattggc tccaggcgga ggaagaggcg cactcctgga tcagatcaga cagggcatcc 1920
agctgaacaa gacccctggc gctcctgaga gttctgctct gcaaccgcca ccacagtcta 1980
gcgaaggact tgtgggagcc ctgatgcacg tgatgcagaa gagaagcaga gccatccaca 2040
gcagcgacga aggcgaagat caagctggcg acgaagatga ggacgacgag tgggacgatt 2100
gataatacta gtgtcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt 2160
attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 2220
catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 2280
tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 2340
gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 2400
ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 2460
tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg 2520
tcctttccat ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 2580
tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 2640
cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 2700
tccccgcctg gaattcgagc tcggtacctg gtaaccatcg acgtgcagta tttagcatgc 2760
cccacccatc tgcaaggcat tctggatagt gtcaaaacag ccggaaatca agtccgttta 2820
tctcaaactt tagcattttg ggaataaatg atatttgcta tgctggttaa attagatttt 2880
agttaaattt cctgctgaag ctctagtacg ataagtaact tgacctaagt gtaaagttga 2940
gatttccttc aggtttatat agcttgtgcg ccgcctgggt acctcaggat atgcccttga 3000
ctatttgtcc gacatagtca agggcatatc cttttttgcg tacgcggccg c 3051
<210> 16
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: shRNA targeting an HPRT gene
<400> 16
aggatatgcc cttgactatt tgtccgacat agtcaagggc atatcc 46
<210> 17
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: shRNA targeting an HPRT gene
<400> 17
tcctatacgg gaactgataa acaggctgta tcagttcccg tatagg 46
<210> 18
<211> 6565
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c Plasmid Sequence
<400> 18
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggccgcctc ggccaaacag 420
cccttgagtt taccactccc tatcagtgat agagaaaagt gaaagtcgag tttaccactc 480
cctatcagtg atagagaaaa gtgaaagtcg agtttaccac tccctatcag tgatagagaa 540
aagtgaaagt cgagtttacc actccctatc agtgatagag aaaagtgaaa gtcgagttta 600
ccagtcccta tcagtgatag agaaaagtga aagtcgagtt taccactccc tatcagtgat 660
agagaaaagt gaaagtcgag tttaccactc cctatcagtg atagagaaaa gtgaaagtcg 720
agctcgccat gggaggcgtg gcctgggcgg gactggggag tggcgagccc tcagatcctg 780
catataagca gctgcttttt gcctgtactg ggtctctctg gttagaccag atctgagcct 840
gggagctctc tggctaacta gggaacccac tgcttaagcc tcaataaagc ttgccttgag 900
tgcttcaagt agtgtgtgcc cgtctgttgt gtgactctgg taactagaga tccctcagac 960
ccttttagtc agtgtggaaa atctctagca gtggcgcccg aacagggact tgaaagcgaa 1020
agggaaacca gaggagctct ctcgacgcag gactcggctt gctgaagcgc gcacggcaag 1080
aggcgagggg cggcgactgg tgagtacgcc aaaaattttg actagcggag gctagaagga 1140
gagagatggg tgcgagagcg tcagtattaa gcgggggaga attagatcgc gatgggaaaa 1200
aattcggtta aggccagggg gaaagaaaaa atataaatta aaacatatag tatgggcaag 1260
cagggagcta gaacgattcg cagttaatac tggcctgtta gaaacatcag aaggctgtag 1320
acaaatactg ggacagctac aaccatccct tcagacagga tcagaagaac ttagatcatt 1380
atataataca gtagcaaccc tctattgtgt gcatcaaagg atagagataa aagacaccaa 1440
ggaagcttta gacaagatag aggaagagca aaacaaaagt aagaaaaaag cacagcaagc 1500
agcaggatct tcagacctgg aaattcccta caatccccaa agtcaaggag tagtagaatc 1560
tatgaataaa gaattaaaga aaattatagg acaggtaaga gatcaggctg aacatcttaa 1620
gacagcagta caaatggcag tattcatcca caattttaaa agaaaagggg ggattggggg 1680
gtacagtgca ggggaaagaa tagtagacat aatagcaaca gacatacaaa ctaaagaatt 1740
acaaaaacaa attacaaaaa ttcaaaattt tcgggtttat tacagggaca gcagaaatcc 1800
actttggaaa ggaccagcaa agctcctctg gaaaggtgaa ggggcagtag taatacaaga 1860
taatagtgac ataaaagtag tgccaagaag aaaagcaaag atcattaggg attatggaaa 1920
acagatggca ggtgatgatt gtgtggcaag tagacaggat gaggattaga acatggaaaa 1980
gtttagtaaa acaccataag gaggagatat gagggacaat tggagaagtg aattatataa 2040
atataaagta gtaaaaattg aaccattagg agtagcaccc accaaggcaa agagaagagt 2100
ggtgcagaga gaaaaaagag cagtgggaat aggagctttg ttccttgggt tcttgggagc 2160
agcaggaagc actatgggcg cagcgtcaat gacgctgacg gtacaggcca gacaattatt 2220
gtctggtata gtgcagcagc agaacaattt gctgagggct attgaggcgc aacagcatct 2280
gttgcaactc acagtctggg gcatcaagca gctccaggca agaatcctgg ctgtggaaag 2340
atacctaaag gatcaacagc tcctggggat ttggggttgc tctggaaaac tcatttgcac 2400
cactgctgtg ccttggaatg ctagttggag taataaatct ctggaacaga tttggaatca 2460
cacgacctgg atggagtggg acagagaaat taacaattac acaagcttaa tacactcctt 2520
aattgaagaa tcgcaaaacc agcaagaaaa gaatgaacaa gaattattgg aattagataa 2580
atgggcaagt ttgtggaatt ggtttaacat aacaaattgg ctgtggtata taaaattatt 2640
cataatgata gtaggaggct tggtaggttt aagaatagtt tttgctgtac tttctatagt 2700
gaatagagtt aggcagggat attcaccatt atcgtttcag acccacctcc caaccccgag 2760
gggaccgagc tcaagcttcg aacgcgtgcg gccgcatcga tgccgtagta cctttaagac 2820
caatgactta caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg 2880
aagggctaat tcactcccaa agaagacaag atccctgcag gcattcaagg ccaggctgga 2940
tgtggctctg ggcagcctgg gctgctggtt gatgaccctg cacatagcag ggggttggat 3000
ctggatgagc actgtgctcc tttgcaaccc aggccgttct atgattctgt cattctaaat 3060
ctctctttca gcctaaagct ttttccccgt atccccccag gtgtctgcag gctcaaagag 3120
cagcgagaag cgttcagagg aaagcgatcc cgtgccacct tccccgtgcc cgggctgtcc 3180
ccgcacgctg ccggctcggg gatgcggggg gagcgccgga ccggagcgga gccccgggcg 3240
gctcgctgct gccccctagc gggggaggga cgtaattaca tccctggggg ctttgggggg 3300
gggctgtccc cgtgagctcc ccagatctgc tttttgcctg tactgggtct ctctggttag 3360
accagatctg agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat 3420
aaagcttcag ctgctcgagc tagcagatct ttttccctct gccaaaaatt atggggacat 3480
catgaagccc cttgagcatc tgacttctgg ctaataaagg aaatttattt tcattgcaat 3540
agtgtgttgg aattttttgt gtctctcact cggaaggaca tatgggaggg caaatcattt 3600
aaaacatcag aatgagtatt tggtttagag tttggcaaca tatgcccata tgctggctgc 3660
catgaacaaa ggttggctat aaagaggtca tcagtatatg aaacagcccc ctgctgtcca 3720
ttccttattc catagaaaag ccttgacttg aggttagatt ttttttatat tttgttttgt 3780
gttatttttt tctttaacat ccctaaaatt ttccttacat gttttactag ccagattttt 3840
cctcctctcc tgactactcc cagtcatagc tgtccctctt ctcttatgga gatccctcga 3900
cctgcagccc aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 3960
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4020
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4080
acctgtcgtg ccagcggatc cgcatctcaa ttagtcagca accatagtcc cgcccctaac 4140
tccgcccatc ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact 4200
aatttttttt atttatgcag aggccgaggc cgcctcggcc tctgagctat tccagaagta 4260
gtgaggaggc ttttttggag gcctaggctt ttgcaaaaag ctgtcgactg cagaggcctg 4320
catgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 4380
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 4440
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 4500
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 4560
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 4620
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 4680
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 4740
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 4800
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 4860
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 4920
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 4980
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 5040
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 5100
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 5160
tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 5220
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 5280
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 5340
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 5400
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 5460
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 5520
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 5580
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 5640
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 5700
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 5760
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 5820
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 5880
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 5940
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 6000
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 6060
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 6120
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 6180
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 6240
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 6300
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 6360
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 6420
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 6480
cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac ctataaaaat 6540
aggcgtatca cgaggccctt tcgtc 6565
<210> 19
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic: miRNA734 de novo (RNA form)
<400> 19
acccguacau auuuuugugu agcucuaguu uauagucaag ggcauauccu uguguuuuuu 60
uugaaggaua ugcccuugac uauaaacuag cgcuacacuu uuucgucuug u 111
<210> 20
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic: miRNA211 de novo (RNA form)
<400> 20
acccguacau auuuuugugu agcucuaguu auaaaucaag gucauaaccu uguguuuuuu 60
uugaagguua ugaccuugau uuauaacuag cgcuacacuu uuucgucuug u 111
<210> 21
<211> 166
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: miRNA211-3G
<400> 21
ccggatcaac gccctaggtt tatgtttgga tgaactgaca tacgcgtatc cgtcttttaa 60
atcaaggtca taaccgtagt gaaatatata ttaaacaggt tatgaccttg atttaaaata 120
cggtaacgcg gaattcgcaa ctattttatc aattttttgc gtcgac 166
<210> 22
<211> 166
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: miRNA734-3G
<400> 22
ccggatcaac gccctaggtt tatgtttgga tgaactgaca tacgcgtatc cgtcttatag 60
tcaagggcat atcctgtagt gaaatatata ttaaacaagg atatgccctt gactataata 120
cggtaacgcg gaattcgcaa ctattttatc aattttttgc gtcgac 166
<210> 23
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: shHPRT 616
<400> 23
gcaggcagta taatccaaat acctgaccca tatttggatt atactgcctg cttttt 56
<210> 24
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: shHPRT 211
<400> 24
ggttatgacc ttgatttata cctgacccat attaaatcaa ggtcataacc ttttt 55
<210> 25
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: shHPRT 734.1
<400> 25
gggatatgcc cttgactaat acctgaccca tattagtcaa gggcatatcc cttttt 56
<210> 26
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: shHPRT 734
<400> 26
aggatatgcc cttgactatt tgtccgacat agtcaagggc atatcctttt tt 52
<210> 27
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic: Modified sh734
<400> 27
aggauaugcc cuugacuaug cccugaccca gcauagucaa gggcauaucc u 51
<210> 28
<211> 248
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Homo sapiens cell-line HEK-293 7SK RNA promoter region
<400> 28
tcgacgtgca gtatttagca tgccccaccc atctgcaagg cattctggat agtgtcaaaa 60
cagccggaaa tcaagtccgt ttatctcaaa ctttagcatt ttgggaataa atgatatttg 120
ctatgctggt taaattagat tttagttaaa tttcctgctg aagctctagt acgataagta 180
acttgaccta agtgtaaagt tgagatttcc ttcaggttta tatagcttgt gcgccgcctg 240
ggtacctc 248
<210> 29
<211> 248
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Homo sapiens cell-line HEK-293 7SK RNA promoter region
with mutation
<400> 29
tcgacgtgca gtcgggctac tgccccaccc atagtaccgg cattctggat agtgtcaaaa 60
cagccggaaa tcaagtccgt ttatctcaaa ctttagcatt ttgggaataa atgatatttg 120
ctatgctggt taaattagat tttagttaaa tttcctgctg aagctctagt acgataagta 180
acttgaccta agtgtaaagt tgagatttcc ttcaggttta tatagcttgt gcgccgcctg 240
ggtacctc 248
<210> 30
<211> 3901
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: TL20 viral Backbone
<400> 30
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga acgcgtgcgg ccgcatcgat 2400
gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag ccacttttta 2460
aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga tccctgcagg 2520
cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg atgaccctgc 2580
acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca ggccgttcta 2640
tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta tccccccagg 2700
tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc gtgccacctt 2760
ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg agcgccggac 2820
cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac gtaattacat 2880
ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct ttttgcctgt 2940
actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 3000
ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt tttccctctg 3060
ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc taataaagga 3120
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 3180
atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt ttggcaacat 3240
atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat cagtatatga 3300
aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga ggttagattt 3360
tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt tccttacatg 3420
ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct gtccctcttc 3480
tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc atagctgttt 3540
cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 3600
tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 3660
cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat tagtcagcaa 3720
ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 3780
ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctcggcct 3840
ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 3900
t 3901
<210> 31
<211> 769
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: REV response element
<400> 31
aggaggagat atgagggaca attggagaag tgaattatat aaatataaag tagtaaaaat 60
tgaaccatta ggagtagcac ccaccaaggc aaagagaaga gtggtgcaga gagaaaaaag 120
agcagtggga ataggagctt tgttccttgg gttcttggga gcagcaggaa gcactatggg 180
cgcagcgtca atgacgctga cggtacaggc cagacaatta ttgtctggta tagtgcagca 240
gcagaacaat ttgctgaggg ctattgaggc gcaacagcat ctgttgcaac tcacagtctg 300
gggcatcaag cagctccagg caagaatcct ggctgtggaa agatacctaa aggatcaaca 360
gctcctgggg atttggggtt gctctggaaa actcatttgc accactgctg tgccttggaa 420
tgctagttgg agtaataaat ctctggaaca gatttggaat cacacgacct ggatggagtg 480
ggacagagaa attaacaatt acacaagctt aatacactcc ttaattgaag aatcgcaaaa 540
ccagcaagaa aagaatgaac aagaattatt ggaattagat aaatgggcaa gtttgtggaa 600
ttggtttaac ataacaaatt ggctgtggta tataaaatta ttcataatga tagtaggagg 660
cttggtaggt ttaagaatag tttttgctgt actttctata gtgaatagag ttaggcaggg 720
atattcacca ttatcgtttc agacccacct cccaaccccg aggggaccg 769
<210> 32
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Hairpin loop sequence of sh734
<400> 32
ttgtccgac 9
<210> 33
<211> 9
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic: hsa-miR-22 loop sequence
<400> 33
ccugaccca 9
<210> 34
<211> 111
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: miRNA734 de novo (DNA form)
<400> 34
acccgtacat atttttgtgt agctctagtt tatagtcaag ggcatatcct tgtgtttttt 60
ttgaaggata tgcccttgac tataaactag cgctacactt tttcgtcttg t 111
<210> 35
<211> 111
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: miRNA211 de novo (DNA form)
<400> 35
acccgtacat atttttgtgt agctctagtt ataaatcaag gtcataacct tgtgtttttt 60
ttgaaggtta tgaccttgat ttataactag cgctacactt tttcgtcttg t 111
<210> 36
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: miRNA 451 hairpin sequence
<400> 36
aaaccgttac cattactgag tttagtaatg gtaatggttc tc 42
<210> 37
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Agosh 734 5-3
<400> 37
atagtcaagg gcatatcctc aagaaggata tgcccttgac tac 43
<210> 38
<211> 649
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: 650-bp cHS4 insulator sequence
<400> 38
acggggacag ccccccccca aagcccccag ggatgtaatt acgtccctcc cccgctaggg 60
ggcagcagcg agccgcccgg ggctccgctc cggtccggcg ctccccccgc atccccgagc 120
cggcagcgtg cggggacagc ccgggcacgg ggaaggtggc acgggatcgc tttcctctga 180
acgcttctcg ctgctctttg agcctgcaga cacctggggg gatacgggga aaaagcttta 240
ggcttgtgtc tgagcctgca tgtttgatgg tgtctggatg caagcagaag gggtggaaga 300
gcttgcctgg agagatacag ctgggtcagt aggactggga caggcagctg gagaattgcc 360
atgtagatgt tcatacaatc gtcaaatcat gaaggctgga aaagccctcc aagatcccca 420
agaccaaccc caacccaccc accgtgccca ctggccatgt ccctcagtgc cacatcccca 480
cagttcttca tcacctccag ggacggtgac ccccccacct ccgtgggcag ctgtgccact 540
gcagcaccgc tctttggaga aggtaaatct tgctaaatcc agcccgaccc tcccctggca 600
caacgtaagg ccattatctc tcatccaact ccaggacgga gtcagtgag 649
<210> 39
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Foamy virus 36-bp insulator sequence
<400> 39
aagggagaca tctagtgata taagtgtgaa ctacac 36
<210> 40
<211> 412
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: reverse chicken HS4 400 bp chromatin insulator
<400> 40
atccctgcag gcattcaagg ccaggctgga tgtggctctg ggcagcctgg gctgctggtt 60
gatgaccctg cacatagcag ggggttggat ctggatgagc actgtgctcc tttgcaaccc 120
aggccgttct atgattctgt cattctaaat ctctctttca gcctaaagct ttttccccgt 180
atccccccag gtgtctgcag gctcaaagag cagcgagaag cgttcagagg aaagcgatcc 240
cgtgccacct tccccgtgcc cgggctgtcc ccgcacgctg ccggctcggg gatgcggggg 300
gagcgccgga ccggagcgga gccccgggcg gctcgctgct gccccctagc gggggaggga 360
cgtaattaca tccctggggg ctttgggggg gggctgtccc cgtgagctcc cc 412
<210> 41
<211> 476
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: cPPT sequence
<400> 41
attccctaca atccccaaag tcaaggagta gtagaatcta tgaataaaga attaaagaaa 60
attataggac aggtaagaga tcaggctgaa catcttaaga cagcagtaca aatggcagta 120
ttcatccaca attttaaaag aaaagggggg attggggggt acagtgcagg ggaaagaata 180
gtagacataa tagcaacaga catacaaact aaagaattac aaaaacaaat tacaaaaatt 240
caaaattttc gggtttatta cagggacagc agaaatccac tttggaaagg accagcaaag 300
ctcctctgga aaggtgaagg ggcagtagta atacaagata atagtgacat aaaagtagtg 360
ccaagaagaa aagcaaagat cattagggat tatggaaaac agatggcagg tgatgattgt 420
gtggcaagta gacaggatga ggattagaac atggaaaagt ttagtaaaac accata 476
<210> 42
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_SK734fwd_MND_WAS_400
<400> 42
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtatcga 2400
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 2460
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 2520
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 2580
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 2640
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttgacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg agtgggggcc caatgggagg 3120
aaggcccggg ggccgaggag caccagcggt tcagcagaac ataccctcca ccctcctcca 3180
ggaccacgag aaccagcgac tctttgagat gcttggacga aaatgcttga cgctggccac 3240
tgcagttgtt cagctgtacc tggcgctgcc ccctggagct gagcactgga ccaaggagca 3300
ttgtggggct gtgtgcttcg tgaaggataa cccccagaag tcctacttca tccgccttta 3360
cggccttcag gctggtcggc tgctctggga acaggagctg tactcacagc ttgtctactc 3420
cacccccacc cccttcttcc acaccttcgc tggagatgac tgccaagcgg ggctgaactt 3480
tgcagacgag gacgaggccc aggccttccg ggcactcgtg caggagaaga tacaaaaaag 3540
gaatcagagg caaagtggag acagacgcca gctaccccca ccaccaacac cagccaatga 3600
agagagaaga ggagggctcc cacccctgcc cctgcatcca ggtggagacc aaggaggccc 3660
tccagtgggt ccgctctccc tggggctggc gacagtggac atccagaacc ctgacatcac 3720
gagttcacga taccgtgggc tcccagcacc tggacctagc ccagctgata agaaacgctc 3780
agggaagaag aagatcagca aagctgatat tggtgcaccc agtggattca agcatgtcag 3840
ccacgtgggg tgggaccccc agaatggatt tgacgtgaac aacctcgacc cagatctgcg 3900
gagtctgttc tccagggcag gaatcagcga ggcccagctc accgacgccg agacctctaa 3960
acttatctac gacttcattg aggaccaggg tgggctggag gctgtgcggc aggagatgag 4020
gcgccaggag ccacttccgc cgcccccacc gccatctcga ggagggaacc agctcccccg 4080
gccccctatt gtggggggta acaagggtcg ttctggtcca ctgccccctg tacctttggg 4140
gattgcccca cccccaccaa caccccgggg acccccaccc ccaggccgag ggggtcctcc 4200
accaccaccc cctccagcta ctggacgttc tggaccactg ccccctccac cccctggagc 4260
tggtgggcca cccatgccac caccaccgcc accaccgcca ccgccgccca gctccgggaa 4320
tggaccagcc cctcccccac tccctcctgc tctggtgcct gccgggggcc tggcccctgg 4380
tgggggtcgg ggagcgcttt tggatcaaat ccggcaggga attcagctga acaagacccc 4440
tggggcccca gagagctcag cgctgcagcc accacctcag agctcagagg gactggtggg 4500
ggccctgatg cacgtgatgc agaagagaag cagagccatc cactcctccg acgaagggga 4560
ggaccaggct ggcgatgaag atgaagatga tgaatgggat gactgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 43
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_SK734rev_MND_WAS_400
<400> 43
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtcaaaa 2400
aaggatatgc ccttgactat gtcggacaaa tagtcaaggg catatcctga ggtacccagg 2460
cggcgcacaa gctatataaa cctgaaggaa atctcaactt tacacttagg tcaagttact 2520
tatcgtacta gagcttcagc aggaaattta actaaaatct aatttaacca gcatagcaaa 2580
tatcatttat tcccaaaatg ctaaagtttg agataaacgg acttgatttc cggctgtttt 2640
gacactatcc agaatgcctt gcagatgggt ggggcatgct aaatactgca cgtcgatacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg agtgggggcc caatgggagg 3120
aaggcccggg ggccgaggag caccagcggt tcagcagaac ataccctcca ccctcctcca 3180
ggaccacgag aaccagcgac tctttgagat gcttggacga aaatgcttga cgctggccac 3240
tgcagttgtt cagctgtacc tggcgctgcc ccctggagct gagcactgga ccaaggagca 3300
ttgtggggct gtgtgcttcg tgaaggataa cccccagaag tcctacttca tccgccttta 3360
cggccttcag gctggtcggc tgctctggga acaggagctg tactcacagc ttgtctactc 3420
cacccccacc cccttcttcc acaccttcgc tggagatgac tgccaagcgg ggctgaactt 3480
tgcagacgag gacgaggccc aggccttccg ggcactcgtg caggagaaga tacaaaaaag 3540
gaatcagagg caaagtggag acagacgcca gctaccccca ccaccaacac cagccaatga 3600
agagagaaga ggagggctcc cacccctgcc cctgcatcca ggtggagacc aaggaggccc 3660
tccagtgggt ccgctctccc tggggctggc gacagtggac atccagaacc ctgacatcac 3720
gagttcacga taccgtgggc tcccagcacc tggacctagc ccagctgata agaaacgctc 3780
agggaagaag aagatcagca aagctgatat tggtgcaccc agtggattca agcatgtcag 3840
ccacgtgggg tgggaccccc agaatggatt tgacgtgaac aacctcgacc cagatctgcg 3900
gagtctgttc tccagggcag gaatcagcga ggcccagctc accgacgccg agacctctaa 3960
acttatctac gacttcattg aggaccaggg tgggctggag gctgtgcggc aggagatgag 4020
gcgccaggag ccacttccgc cgcccccacc gccatctcga ggagggaacc agctcccccg 4080
gccccctatt gtggggggta acaagggtcg ttctggtcca ctgccccctg tacctttggg 4140
gattgcccca cccccaccaa caccccgggg acccccaccc ccaggccgag ggggtcctcc 4200
accaccaccc cctccagcta ctggacgttc tggaccactg ccccctccac cccctggagc 4260
tggtgggcca cccatgccac caccaccgcc accaccgcca ccgccgccca gctccgggaa 4320
tggaccagcc cctcccccac tccctcctgc tctggtgcct gccgggggcc tggcccctgg 4380
tgggggtcgg ggagcgcttt tggatcaaat ccggcaggga attcagctga acaagacccc 4440
tggggcccca gagagctcag cgctgcagcc accacctcag agctcagagg gactggtggg 4500
ggccctgatg cacgtgatgc agaagagaag cagagccatc cactcctccg acgaagggga 4560
ggaccaggct ggcgatgaag atgaagatga tgaatgggat gactgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 44
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_MND_WAS_SK734fwd_400
<400> 44
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgagtggggg cccaatggga ggaaggcccg 2820
ggggccgagg agcaccagcg gttcagcaga acataccctc caccctcctc caggaccacg 2880
agaaccagcg actctttgag atgcttggac gaaaatgctt gacgctggcc actgcagttg 2940
ttcagctgta cctggcgctg ccccctggag ctgagcactg gaccaaggag cattgtgggg 3000
ctgtgtgctt cgtgaaggat aacccccaga agtcctactt catccgcctt tacggccttc 3060
aggctggtcg gctgctctgg gaacaggagc tgtactcaca gcttgtctac tccaccccca 3120
cccccttctt ccacaccttc gctggagatg actgccaagc ggggctgaac tttgcagacg 3180
aggacgaggc ccaggccttc cgggcactcg tgcaggagaa gatacaaaaa aggaatcaga 3240
ggcaaagtgg agacagacgc cagctacccc caccaccaac accagccaat gaagagagaa 3300
gaggagggct cccacccctg cccctgcatc caggtggaga ccaaggaggc cctccagtgg 3360
gtccgctctc cctggggctg gcgacagtgg acatccagaa ccctgacatc acgagttcac 3420
gataccgtgg gctcccagca cctggaccta gcccagctga taagaaacgc tcagggaaga 3480
agaagatcag caaagctgat attggtgcac ccagtggatt caagcatgtc agccacgtgg 3540
ggtgggaccc ccagaatgga tttgacgtga acaacctcga cccagatctg cggagtctgt 3600
tctccagggc aggaatcagc gaggcccagc tcaccgacgc cgagacctct aaacttatct 3660
acgacttcat tgaggaccag ggtgggctgg aggctgtgcg gcaggagatg aggcgccagg 3720
agccacttcc gccgccccca ccgccatctc gaggagggaa ccagctcccc cggcccccta 3780
ttgtgggggg taacaagggt cgttctggtc cactgccccc tgtacctttg gggattgccc 3840
cacccccacc aacaccccgg ggacccccac ccccaggccg agggggtcct ccaccaccac 3900
cccctccagc tactggacgt tctggaccac tgccccctcc accccctgga gctggtgggc 3960
cacccatgcc accaccaccg ccaccaccgc caccgccgcc cagctccggg aatggaccag 4020
cccctccccc actccctcct gctctggtgc ctgccggggg cctggcccct ggtgggggtc 4080
ggggagcgct tttggatcaa atccggcagg gaattcagct gaacaagacc cctggggccc 4140
cagagagctc agcgctgcag ccaccacctc agagctcaga gggactggtg ggggccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccactcctc cgacgaaggg gaggaccagg 4260
ctggcgatga agatgaagat gatgaatggg atgactgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtat cgacgtgcag 4920
tatttagcat gccccaccca tctgcaaggc attctggata gtgtcaaaac agccggaaat 4980
caagtccgtt tatctcaaac tttagcattt tgggaataaa tgatatttgc tatgctggtt 5040
aaattagatt ttagttaaat ttcctgctga agctctagta cgataagtaa cttgacctaa 5100
gtgtaaagtt gagatttcct tcaggtttat atagcttgtg cgccgcctgg gtacctcagg 5160
atatgccctt gactatttgt ccgacatagt caagggcata tccttttttg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 45
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_MND_WAS_SK734rev_400
<400> 45
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgagtggggg cccaatggga ggaaggcccg 2820
ggggccgagg agcaccagcg gttcagcaga acataccctc caccctcctc caggaccacg 2880
agaaccagcg actctttgag atgcttggac gaaaatgctt gacgctggcc actgcagttg 2940
ttcagctgta cctggcgctg ccccctggag ctgagcactg gaccaaggag cattgtgggg 3000
ctgtgtgctt cgtgaaggat aacccccaga agtcctactt catccgcctt tacggccttc 3060
aggctggtcg gctgctctgg gaacaggagc tgtactcaca gcttgtctac tccaccccca 3120
cccccttctt ccacaccttc gctggagatg actgccaagc ggggctgaac tttgcagacg 3180
aggacgaggc ccaggccttc cgggcactcg tgcaggagaa gatacaaaaa aggaatcaga 3240
ggcaaagtgg agacagacgc cagctacccc caccaccaac accagccaat gaagagagaa 3300
gaggagggct cccacccctg cccctgcatc caggtggaga ccaaggaggc cctccagtgg 3360
gtccgctctc cctggggctg gcgacagtgg acatccagaa ccctgacatc acgagttcac 3420
gataccgtgg gctcccagca cctggaccta gcccagctga taagaaacgc tcagggaaga 3480
agaagatcag caaagctgat attggtgcac ccagtggatt caagcatgtc agccacgtgg 3540
ggtgggaccc ccagaatgga tttgacgtga acaacctcga cccagatctg cggagtctgt 3600
tctccagggc aggaatcagc gaggcccagc tcaccgacgc cgagacctct aaacttatct 3660
acgacttcat tgaggaccag ggtgggctgg aggctgtgcg gcaggagatg aggcgccagg 3720
agccacttcc gccgccccca ccgccatctc gaggagggaa ccagctcccc cggcccccta 3780
ttgtgggggg taacaagggt cgttctggtc cactgccccc tgtacctttg gggattgccc 3840
cacccccacc aacaccccgg ggacccccac ccccaggccg agggggtcct ccaccaccac 3900
cccctccagc tactggacgt tctggaccac tgccccctcc accccctgga gctggtgggc 3960
cacccatgcc accaccaccg ccaccaccgc caccgccgcc cagctccggg aatggaccag 4020
cccctccccc actccctcct gctctggtgc ctgccggggg cctggcccct ggtgggggtc 4080
ggggagcgct tttggatcaa atccggcagg gaattcagct gaacaagacc cctggggccc 4140
cagagagctc agcgctgcag ccaccacctc agagctcaga gggactggtg ggggccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccactcctc cgacgaaggg gaggaccagg 4260
ctggcgatga agatgaagat gatgaatggg atgactgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtca aaaaaggata 4920
tgcccttgac tatgtcggac aaatagtcaa gggcatatcc tgaggtaccc aggcggcgca 4980
caagctatat aaacctgaag gaaatctcaa ctttacactt aggtcaagtt acttatcgta 5040
ctagagcttc agcaggaaat ttaactaaaa tctaatttaa ccagcatagc aaatatcatt 5100
tattcccaaa atgctaaagt ttgagataaa cggacttgat ttccggctgt tttgacacta 5160
tccagaatgc cttgcagatg ggtggggcat gctaaatact gcacgtcgat accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 46
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_SK734fwd_MND_coWAS_400
<400> 46
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtatcga 2400
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 2460
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 2520
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 2580
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 2640
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttgacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg tctggcggac ctatgggagg 3120
tagacctggt ggaagaggtg ctcctgccgt gcagcagaac atcccttcta cactgctgca 3180
ggaccacgag aaccagcggc tgtttgagat gctgggcaga aagtgtctga ccctggctac 3240
agctgtggtg cagctgtatc tggcacttcc tccaggcgcc gagcactgga ccaaagaaca 3300
ttgtggcgcc gtgtgcttcg tgaaggacaa ccctcagaag tcctacttca tccggctgta 3360
cggactgcag gctggcagac tgctgtggga gcaagagctg tactcccagc tggtgtacag 3420
cacccctaca cctttcttcc acacctttgc cggcgacgat tgtcaggccg gactgaactt 3480
tgccgacgag gatgaagccc aggccttcag agcactggtg caagagaaga tccagaagcg 3540
gaaccagaga cagagcggcg acagaaggca actgcctcct ccacctacac cagccaacga 3600
ggaaagaaga ggcggactgc ctccactgcc tcttcatcct ggcggagatc aaggtggacc 3660
tcctgtggga ccactgtctc ttggactggc caccgtggac attcagaacc ccgatatcac 3720
cagcagccgg tacagaggac ttcccgctcc tggaccatct cctgccgaca agaagagatc 3780
cgggaagaag aagatcagca aggccgacat cggagcccct agcggcttta aacacgtgtc 3840
ccacgttgga tgggacccac agaacggctt cgacgtgaac aatctggacc ccgacctgcg 3900
gagcctgttt tctagagccg gaatctctga ggcccagctg accgatgccg agacaagcaa 3960
gctgatctac gacttcatcg aggaccaagg cggcctggaa gccgtgcgac aagagatgag 4020
aaggcaagag cctctgccac cacctccacc tccatctaga ggcggaaacc agctgcctag 4080
acctcctatc gttggcggca acaagggaag atctggccct ctgcctcctg tgcctctggg 4140
aattgctcca ccaccaccaa cacctagagg cccgcctcca ccaggcagag gtggtcctcc 4200
gccgccacct cctccagcaa caggcagatc tggaccactt cctcctccac cacctggtgc 4260
tggtggacct ccaatgccac cgccaccgcc tccgccacct ccgcctccaa gttctggaaa 4320
tggacctgct cctcctcctt tgcctcctgc tttggttcct gctggcggat tggctccagg 4380
cggaggaaga ggcgcactcc tggatcagat cagacagggc atccagctga acaagacccc 4440
tggcgctcct gagagttctg ctctgcaacc gccaccacag tctagcgaag gacttgtggg 4500
agccctgatg cacgtgatgc agaagagaag cagagccatc cacagcagcg acgaaggcga 4560
agatcaagct ggcgacgaag atgaggacga cgagtgggac gattgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 47
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_SK734rev_MND_coWAS_400
<400> 47
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtcaaaa 2400
aaggatatgc ccttgactat gtcggacaaa tagtcaaggg catatcctga ggtacccagg 2460
cggcgcacaa gctatataaa cctgaaggaa atctcaactt tacacttagg tcaagttact 2520
tatcgtacta gagcttcagc aggaaattta actaaaatct aatttaacca gcatagcaaa 2580
tatcatttat tcccaaaatg ctaaagtttg agataaacgg acttgatttc cggctgtttt 2640
gacactatcc agaatgcctt gcagatgggt ggggcatgct aaatactgca cgtcgatacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg tctggcggac ctatgggagg 3120
tagacctggt ggaagaggtg ctcctgccgt gcagcagaac atcccttcta cactgctgca 3180
ggaccacgag aaccagcggc tgtttgagat gctgggcaga aagtgtctga ccctggctac 3240
agctgtggtg cagctgtatc tggcacttcc tccaggcgcc gagcactgga ccaaagaaca 3300
ttgtggcgcc gtgtgcttcg tgaaggacaa ccctcagaag tcctacttca tccggctgta 3360
cggactgcag gctggcagac tgctgtggga gcaagagctg tactcccagc tggtgtacag 3420
cacccctaca cctttcttcc acacctttgc cggcgacgat tgtcaggccg gactgaactt 3480
tgccgacgag gatgaagccc aggccttcag agcactggtg caagagaaga tccagaagcg 3540
gaaccagaga cagagcggcg acagaaggca actgcctcct ccacctacac cagccaacga 3600
ggaaagaaga ggcggactgc ctccactgcc tcttcatcct ggcggagatc aaggtggacc 3660
tcctgtggga ccactgtctc ttggactggc caccgtggac attcagaacc ccgatatcac 3720
cagcagccgg tacagaggac ttcccgctcc tggaccatct cctgccgaca agaagagatc 3780
cgggaagaag aagatcagca aggccgacat cggagcccct agcggcttta aacacgtgtc 3840
ccacgttgga tgggacccac agaacggctt cgacgtgaac aatctggacc ccgacctgcg 3900
gagcctgttt tctagagccg gaatctctga ggcccagctg accgatgccg agacaagcaa 3960
gctgatctac gacttcatcg aggaccaagg cggcctggaa gccgtgcgac aagagatgag 4020
aaggcaagag cctctgccac cacctccacc tccatctaga ggcggaaacc agctgcctag 4080
acctcctatc gttggcggca acaagggaag atctggccct ctgcctcctg tgcctctggg 4140
aattgctcca ccaccaccaa cacctagagg cccgcctcca ccaggcagag gtggtcctcc 4200
gccgccacct cctccagcaa caggcagatc tggaccactt cctcctccac cacctggtgc 4260
tggtggacct ccaatgccac cgccaccgcc tccgccacct ccgcctccaa gttctggaaa 4320
tggacctgct cctcctcctt tgcctcctgc tttggttcct gctggcggat tggctccagg 4380
cggaggaaga ggcgcactcc tggatcagat cagacagggc atccagctga acaagacccc 4440
tggcgctcct gagagttctg ctctgcaacc gccaccacag tctagcgaag gacttgtggg 4500
agccctgatg cacgtgatgc agaagagaag cagagccatc cacagcagcg acgaaggcga 4560
agatcaagct ggcgacgaag atgaggacga cgagtgggac gattgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 48
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_MND_coWAS_SK734fwd_400
<400> 48
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgtctggcgg acctatggga ggtagacctg 2820
gtggaagagg tgctcctgcc gtgcagcaga acatcccttc tacactgctg caggaccacg 2880
agaaccagcg gctgtttgag atgctgggca gaaagtgtct gaccctggct acagctgtgg 2940
tgcagctgta tctggcactt cctccaggcg ccgagcactg gaccaaagaa cattgtggcg 3000
ccgtgtgctt cgtgaaggac aaccctcaga agtcctactt catccggctg tacggactgc 3060
aggctggcag actgctgtgg gagcaagagc tgtactccca gctggtgtac agcaccccta 3120
cacctttctt ccacaccttt gccggcgacg attgtcaggc cggactgaac tttgccgacg 3180
aggatgaagc ccaggccttc agagcactgg tgcaagagaa gatccagaag cggaaccaga 3240
gacagagcgg cgacagaagg caactgcctc ctccacctac accagccaac gaggaaagaa 3300
gaggcggact gcctccactg cctcttcatc ctggcggaga tcaaggtgga cctcctgtgg 3360
gaccactgtc tcttggactg gccaccgtgg acattcagaa ccccgatatc accagcagcc 3420
ggtacagagg acttcccgct cctggaccat ctcctgccga caagaagaga tccgggaaga 3480
agaagatcag caaggccgac atcggagccc ctagcggctt taaacacgtg tcccacgttg 3540
gatgggaccc acagaacggc ttcgacgtga acaatctgga ccccgacctg cggagcctgt 3600
tttctagagc cggaatctct gaggcccagc tgaccgatgc cgagacaagc aagctgatct 3660
acgacttcat cgaggaccaa ggcggcctgg aagccgtgcg acaagagatg agaaggcaag 3720
agcctctgcc accacctcca cctccatcta gaggcggaaa ccagctgcct agacctccta 3780
tcgttggcgg caacaaggga agatctggcc ctctgcctcc tgtgcctctg ggaattgctc 3840
caccaccacc aacacctaga ggcccgcctc caccaggcag aggtggtcct ccgccgccac 3900
ctcctccagc aacaggcaga tctggaccac ttcctcctcc accacctggt gctggtggac 3960
ctccaatgcc accgccaccg cctccgccac ctccgcctcc aagttctgga aatggacctg 4020
ctcctcctcc tttgcctcct gctttggttc ctgctggcgg attggctcca ggcggaggaa 4080
gaggcgcact cctggatcag atcagacagg gcatccagct gaacaagacc cctggcgctc 4140
ctgagagttc tgctctgcaa ccgccaccac agtctagcga aggacttgtg ggagccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccacagcag cgacgaaggc gaagatcaag 4260
ctggcgacga agatgaggac gacgagtggg acgattgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtat cgacgtgcag 4920
tatttagcat gccccaccca tctgcaaggc attctggata gtgtcaaaac agccggaaat 4980
caagtccgtt tatctcaaac tttagcattt tgggaataaa tgatatttgc tatgctggtt 5040
aaattagatt ttagttaaat ttcctgctga agctctagta cgataagtaa cttgacctaa 5100
gtgtaaagtt gagatttcct tcaggtttat atagcttgtg cgccgcctgg gtacctcagg 5160
atatgccctt gactatttgt ccgacatagt caagggcata tccttttttg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 49
<211> 9395
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pTL20c_MND_coWAS_SK734rev_400
<400> 49
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgtctggcgg acctatggga ggtagacctg 2820
gtggaagagg tgctcctgcc gtgcagcaga acatcccttc tacactgctg caggaccacg 2880
agaaccagcg gctgtttgag atgctgggca gaaagtgtct gaccctggct acagctgtgg 2940
tgcagctgta tctggcactt cctccaggcg ccgagcactg gaccaaagaa cattgtggcg 3000
ccgtgtgctt cgtgaaggac aaccctcaga agtcctactt catccggctg tacggactgc 3060
aggctggcag actgctgtgg gagcaagagc tgtactccca gctggtgtac agcaccccta 3120
cacctttctt ccacaccttt gccggcgacg attgtcaggc cggactgaac tttgccgacg 3180
aggatgaagc ccaggccttc agagcactgg tgcaagagaa gatccagaag cggaaccaga 3240
gacagagcgg cgacagaagg caactgcctc ctccacctac accagccaac gaggaaagaa 3300
gaggcggact gcctccactg cctcttcatc ctggcggaga tcaaggtgga cctcctgtgg 3360
gaccactgtc tcttggactg gccaccgtgg acattcagaa ccccgatatc accagcagcc 3420
ggtacagagg acttcccgct cctggaccat ctcctgccga caagaagaga tccgggaaga 3480
agaagatcag caaggccgac atcggagccc ctagcggctt taaacacgtg tcccacgttg 3540
gatgggaccc acagaacggc ttcgacgtga acaatctgga ccccgacctg cggagcctgt 3600
tttctagagc cggaatctct gaggcccagc tgaccgatgc cgagacaagc aagctgatct 3660
acgacttcat cgaggaccaa ggcggcctgg aagccgtgcg acaagagatg agaaggcaag 3720
agcctctgcc accacctcca cctccatcta gaggcggaaa ccagctgcct agacctccta 3780
tcgttggcgg caacaaggga agatctggcc ctctgcctcc tgtgcctctg ggaattgctc 3840
caccaccacc aacacctaga ggcccgcctc caccaggcag aggtggtcct ccgccgccac 3900
ctcctccagc aacaggcaga tctggaccac ttcctcctcc accacctggt gctggtggac 3960
ctccaatgcc accgccaccg cctccgccac ctccgcctcc aagttctgga aatggacctg 4020
ctcctcctcc tttgcctcct gctttggttc ctgctggcgg attggctcca ggcggaggaa 4080
gaggcgcact cctggatcag atcagacagg gcatccagct gaacaagacc cctggcgctc 4140
ctgagagttc tgctctgcaa ccgccaccac agtctagcga aggacttgtg ggagccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccacagcag cgacgaaggc gaagatcaag 4260
ctggcgacga agatgaggac gacgagtggg acgattgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtca aaaaaggata 4920
tgcccttgac tatgtcggac aaatagtcaa gggcatatcc tgaggtaccc aggcggcgca 4980
caagctatat aaacctgaag gaaatctcaa ctttacactt aggtcaagtt acttatcgta 5040
ctagagcttc agcaggaaat ttaactaaaa tctaatttaa ccagcatagc aaatatcatt 5100
tattcccaaa atgctaaagt ttgagataaa cggacttgat ttccggctgt tttgacacta 5160
tccagaatgc cttgcagatg ggtggggcat gctaaatact gcacgtcgat accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaaga 5340
tccctgcagg cattcaaggc caggctggat gtggctctgg gcagcctggg ctgctggttg 5400
atgaccctgc acatagcagg gggttggatc tggatgagca ctgtgctcct ttgcaaccca 5460
ggccgttcta tgattctgtc attctaaatc tctctttcag cctaaagctt tttccccgta 5520
tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga aagcgatccc 5580
gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg atgcgggggg 5640
agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg ggggagggac 5700
gtaattacat ccctgggggc tttggggggg ggctgtcccc gtgagctccc cagatctgct 5760
ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta 5820
actagggaac ccactgctta agcctcaata aagcttcagc tgctcgagct agcagatctt 5880
tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct gacttctggc 5940
taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc 6000
ggaaggacat atgggagggc aaatcattta aaacatcaga atgagtattt ggtttagagt 6060
ttggcaacat atgcccatat gctggctgcc atgaacaaag gttggctata aagaggtcat 6120
cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc cttgacttga 6180
ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc cctaaaattt 6240
tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc agtcatagct 6300
gtccctcttc tcttatggag atccctcgac ctgcagccca agcttggcgt aatcatggtc 6360
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6420
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6480
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagcggatcc gcatctcaat 6540
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 6600
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 6660
gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 6720
tgcaaaaagc tgtcgactgc agaggcctgc atgcaagctt ggcgtaatca tggtcatagc 6780
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 6840
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 6900
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 6960
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 7020
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 7080
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 7140
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7200
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7260
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7320
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7380
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7440
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7500
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7560
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7620
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7680
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7740
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7800
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7860
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7920
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7980
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 8040
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 8100
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8160
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8220
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8280
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8340
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8400
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8460
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8520
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8580
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8640
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8700
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8760
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8820
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8880
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 8940
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 9000
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 9060
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 9120
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 9180
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 9240
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 9300
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 9360
agtcacgacg ttgtaaaacg acggccagtg aattc 9395
<210> 50
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR20: pTL20c_SK734fwd_MND_WAS_650
<400> 50
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtatcga 2400
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 2460
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 2520
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 2580
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 2640
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttgacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg agtgggggcc caatgggagg 3120
aaggcccggg ggccgaggag caccagcggt tcagcagaac ataccctcca ccctcctcca 3180
ggaccacgag aaccagcgac tctttgagat gcttggacga aaatgcttga cgctggccac 3240
tgcagttgtt cagctgtacc tggcgctgcc ccctggagct gagcactgga ccaaggagca 3300
ttgtggggct gtgtgcttcg tgaaggataa cccccagaag tcctacttca tccgccttta 3360
cggccttcag gctggtcggc tgctctggga acaggagctg tactcacagc ttgtctactc 3420
cacccccacc cccttcttcc acaccttcgc tggagatgac tgccaagcgg ggctgaactt 3480
tgcagacgag gacgaggccc aggccttccg ggcactcgtg caggagaaga tacaaaaaag 3540
gaatcagagg caaagtggag acagacgcca gctaccccca ccaccaacac cagccaatga 3600
agagagaaga ggagggctcc cacccctgcc cctgcatcca ggtggagacc aaggaggccc 3660
tccagtgggt ccgctctccc tggggctggc gacagtggac atccagaacc ctgacatcac 3720
gagttcacga taccgtgggc tcccagcacc tggacctagc ccagctgata agaaacgctc 3780
agggaagaag aagatcagca aagctgatat tggtgcaccc agtggattca agcatgtcag 3840
ccacgtgggg tgggaccccc agaatggatt tgacgtgaac aacctcgacc cagatctgcg 3900
gagtctgttc tccagggcag gaatcagcga ggcccagctc accgacgccg agacctctaa 3960
acttatctac gacttcattg aggaccaggg tgggctggag gctgtgcggc aggagatgag 4020
gcgccaggag ccacttccgc cgcccccacc gccatctcga ggagggaacc agctcccccg 4080
gccccctatt gtggggggta acaagggtcg ttctggtcca ctgccccctg tacctttggg 4140
gattgcccca cccccaccaa caccccgggg acccccaccc ccaggccgag ggggtcctcc 4200
accaccaccc cctccagcta ctggacgttc tggaccactg ccccctccac cccctggagc 4260
tggtgggcca cccatgccac caccaccgcc accaccgcca ccgccgccca gctccgggaa 4320
tggaccagcc cctcccccac tccctcctgc tctggtgcct gccgggggcc tggcccctgg 4380
tgggggtcgg ggagcgcttt tggatcaaat ccggcaggga attcagctga acaagacccc 4440
tggggcccca gagagctcag cgctgcagcc accacctcag agctcagagg gactggtggg 4500
ggccctgatg cacgtgatgc agaagagaag cagagccatc cactcctccg acgaagggga 4560
ggaccaggct ggcgatgaag atgaagatga tgaatgggat gactgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 51
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR21_pTL20c_MND_WAS_SK734fwd_650
<400> 51
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgagtggggg cccaatggga ggaaggcccg 2820
ggggccgagg agcaccagcg gttcagcaga acataccctc caccctcctc caggaccacg 2880
agaaccagcg actctttgag atgcttggac gaaaatgctt gacgctggcc actgcagttg 2940
ttcagctgta cctggcgctg ccccctggag ctgagcactg gaccaaggag cattgtgggg 3000
ctgtgtgctt cgtgaaggat aacccccaga agtcctactt catccgcctt tacggccttc 3060
aggctggtcg gctgctctgg gaacaggagc tgtactcaca gcttgtctac tccaccccca 3120
cccccttctt ccacaccttc gctggagatg actgccaagc ggggctgaac tttgcagacg 3180
aggacgaggc ccaggccttc cgggcactcg tgcaggagaa gatacaaaaa aggaatcaga 3240
ggcaaagtgg agacagacgc cagctacccc caccaccaac accagccaat gaagagagaa 3300
gaggagggct cccacccctg cccctgcatc caggtggaga ccaaggaggc cctccagtgg 3360
gtccgctctc cctggggctg gcgacagtgg acatccagaa ccctgacatc acgagttcac 3420
gataccgtgg gctcccagca cctggaccta gcccagctga taagaaacgc tcagggaaga 3480
agaagatcag caaagctgat attggtgcac ccagtggatt caagcatgtc agccacgtgg 3540
ggtgggaccc ccagaatgga tttgacgtga acaacctcga cccagatctg cggagtctgt 3600
tctccagggc aggaatcagc gaggcccagc tcaccgacgc cgagacctct aaacttatct 3660
acgacttcat tgaggaccag ggtgggctgg aggctgtgcg gcaggagatg aggcgccagg 3720
agccacttcc gccgccccca ccgccatctc gaggagggaa ccagctcccc cggcccccta 3780
ttgtgggggg taacaagggt cgttctggtc cactgccccc tgtacctttg gggattgccc 3840
cacccccacc aacaccccgg ggacccccac ccccaggccg agggggtcct ccaccaccac 3900
cccctccagc tactggacgt tctggaccac tgccccctcc accccctgga gctggtgggc 3960
cacccatgcc accaccaccg ccaccaccgc caccgccgcc cagctccggg aatggaccag 4020
cccctccccc actccctcct gctctggtgc ctgccggggg cctggcccct ggtgggggtc 4080
ggggagcgct tttggatcaa atccggcagg gaattcagct gaacaagacc cctggggccc 4140
cagagagctc agcgctgcag ccaccacctc agagctcaga gggactggtg ggggccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccactcctc cgacgaaggg gaggaccagg 4260
ctggcgatga agatgaagat gatgaatggg atgactgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtat cgacgtgcag 4920
tatttagcat gccccaccca tctgcaaggc attctggata gtgtcaaaac agccggaaat 4980
caagtccgtt tatctcaaac tttagcattt tgggaataaa tgatatttgc tatgctggtt 5040
aaattagatt ttagttaaat ttcctgctga agctctagta cgataagtaa cttgacctaa 5100
gtgtaaagtt gagatttcct tcaggtttat atagcttgtg cgccgcctgg gtacctcagg 5160
atatgccctt gactatttgt ccgacatagt caagggcata tccttttttg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 52
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR22_pTL20c_SK734rev_MND_WAS_650
<400> 52
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtcaaaa 2400
aaggatatgc ccttgactat gtcggacaaa tagtcaaggg catatcctga ggtacccagg 2460
cggcgcacaa gctatataaa cctgaaggaa atctcaactt tacacttagg tcaagttact 2520
tatcgtacta gagcttcagc aggaaattta actaaaatct aatttaacca gcatagcaaa 2580
tatcatttat tcccaaaatg ctaaagtttg agataaacgg acttgatttc cggctgtttt 2640
gacactatcc agaatgcctt gcagatgggt ggggcatgct aaatactgca cgtcgatacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg agtgggggcc caatgggagg 3120
aaggcccggg ggccgaggag caccagcggt tcagcagaac ataccctcca ccctcctcca 3180
ggaccacgag aaccagcgac tctttgagat gcttggacga aaatgcttga cgctggccac 3240
tgcagttgtt cagctgtacc tggcgctgcc ccctggagct gagcactgga ccaaggagca 3300
ttgtggggct gtgtgcttcg tgaaggataa cccccagaag tcctacttca tccgccttta 3360
cggccttcag gctggtcggc tgctctggga acaggagctg tactcacagc ttgtctactc 3420
cacccccacc cccttcttcc acaccttcgc tggagatgac tgccaagcgg ggctgaactt 3480
tgcagacgag gacgaggccc aggccttccg ggcactcgtg caggagaaga tacaaaaaag 3540
gaatcagagg caaagtggag acagacgcca gctaccccca ccaccaacac cagccaatga 3600
agagagaaga ggagggctcc cacccctgcc cctgcatcca ggtggagacc aaggaggccc 3660
tccagtgggt ccgctctccc tggggctggc gacagtggac atccagaacc ctgacatcac 3720
gagttcacga taccgtgggc tcccagcacc tggacctagc ccagctgata agaaacgctc 3780
agggaagaag aagatcagca aagctgatat tggtgcaccc agtggattca agcatgtcag 3840
ccacgtgggg tgggaccccc agaatggatt tgacgtgaac aacctcgacc cagatctgcg 3900
gagtctgttc tccagggcag gaatcagcga ggcccagctc accgacgccg agacctctaa 3960
acttatctac gacttcattg aggaccaggg tgggctggag gctgtgcggc aggagatgag 4020
gcgccaggag ccacttccgc cgcccccacc gccatctcga ggagggaacc agctcccccg 4080
gccccctatt gtggggggta acaagggtcg ttctggtcca ctgccccctg tacctttggg 4140
gattgcccca cccccaccaa caccccgggg acccccaccc ccaggccgag ggggtcctcc 4200
accaccaccc cctccagcta ctggacgttc tggaccactg ccccctccac cccctggagc 4260
tggtgggcca cccatgccac caccaccgcc accaccgcca ccgccgccca gctccgggaa 4320
tggaccagcc cctcccccac tccctcctgc tctggtgcct gccgggggcc tggcccctgg 4380
tgggggtcgg ggagcgcttt tggatcaaat ccggcaggga attcagctga acaagacccc 4440
tggggcccca gagagctcag cgctgcagcc accacctcag agctcagagg gactggtggg 4500
ggccctgatg cacgtgatgc agaagagaag cagagccatc cactcctccg acgaagggga 4560
ggaccaggct ggcgatgaag atgaagatga tgaatgggat gactgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 53
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR23_pTL20c_MND_WAS_SK734rev_650
<400> 53
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgagtggggg cccaatggga ggaaggcccg 2820
ggggccgagg agcaccagcg gttcagcaga acataccctc caccctcctc caggaccacg 2880
agaaccagcg actctttgag atgcttggac gaaaatgctt gacgctggcc actgcagttg 2940
ttcagctgta cctggcgctg ccccctggag ctgagcactg gaccaaggag cattgtgggg 3000
ctgtgtgctt cgtgaaggat aacccccaga agtcctactt catccgcctt tacggccttc 3060
aggctggtcg gctgctctgg gaacaggagc tgtactcaca gcttgtctac tccaccccca 3120
cccccttctt ccacaccttc gctggagatg actgccaagc ggggctgaac tttgcagacg 3180
aggacgaggc ccaggccttc cgggcactcg tgcaggagaa gatacaaaaa aggaatcaga 3240
ggcaaagtgg agacagacgc cagctacccc caccaccaac accagccaat gaagagagaa 3300
gaggagggct cccacccctg cccctgcatc caggtggaga ccaaggaggc cctccagtgg 3360
gtccgctctc cctggggctg gcgacagtgg acatccagaa ccctgacatc acgagttcac 3420
gataccgtgg gctcccagca cctggaccta gcccagctga taagaaacgc tcagggaaga 3480
agaagatcag caaagctgat attggtgcac ccagtggatt caagcatgtc agccacgtgg 3540
ggtgggaccc ccagaatgga tttgacgtga acaacctcga cccagatctg cggagtctgt 3600
tctccagggc aggaatcagc gaggcccagc tcaccgacgc cgagacctct aaacttatct 3660
acgacttcat tgaggaccag ggtgggctgg aggctgtgcg gcaggagatg aggcgccagg 3720
agccacttcc gccgccccca ccgccatctc gaggagggaa ccagctcccc cggcccccta 3780
ttgtgggggg taacaagggt cgttctggtc cactgccccc tgtacctttg gggattgccc 3840
cacccccacc aacaccccgg ggacccccac ccccaggccg agggggtcct ccaccaccac 3900
cccctccagc tactggacgt tctggaccac tgccccctcc accccctgga gctggtgggc 3960
cacccatgcc accaccaccg ccaccaccgc caccgccgcc cagctccggg aatggaccag 4020
cccctccccc actccctcct gctctggtgc ctgccggggg cctggcccct ggtgggggtc 4080
ggggagcgct tttggatcaa atccggcagg gaattcagct gaacaagacc cctggggccc 4140
cagagagctc agcgctgcag ccaccacctc agagctcaga gggactggtg ggggccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccactcctc cgacgaaggg gaggaccagg 4260
ctggcgatga agatgaagat gatgaatggg atgactgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtca aaaaaggata 4920
tgcccttgac tatgtcggac aaatagtcaa gggcatatcc tgaggtaccc aggcggcgca 4980
caagctatat aaacctgaag gaaatctcaa ctttacactt aggtcaagtt acttatcgta 5040
ctagagcttc agcaggaaat ttaactaaaa tctaatttaa ccagcatagc aaatatcatt 5100
tattcccaaa atgctaaagt ttgagataaa cggacttgat ttccggctgt tttgacacta 5160
tccagaatgc cttgcagatg ggtggggcat gctaaatact gcacgtcgat accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 54
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR24_pTL20c_SK734fwd_MND_coWAS_650
<400> 54
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtatcga 2400
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 2460
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 2520
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 2580
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 2640
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttgacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg tctggcggac ctatgggagg 3120
tagacctggt ggaagaggtg ctcctgccgt gcagcagaac atcccttcta cactgctgca 3180
ggaccacgag aaccagcggc tgtttgagat gctgggcaga aagtgtctga ccctggctac 3240
agctgtggtg cagctgtatc tggcacttcc tccaggcgcc gagcactgga ccaaagaaca 3300
ttgtggcgcc gtgtgcttcg tgaaggacaa ccctcagaag tcctacttca tccggctgta 3360
cggactgcag gctggcagac tgctgtggga gcaagagctg tactcccagc tggtgtacag 3420
cacccctaca cctttcttcc acacctttgc cggcgacgat tgtcaggccg gactgaactt 3480
tgccgacgag gatgaagccc aggccttcag agcactggtg caagagaaga tccagaagcg 3540
gaaccagaga cagagcggcg acagaaggca actgcctcct ccacctacac cagccaacga 3600
ggaaagaaga ggcggactgc ctccactgcc tcttcatcct ggcggagatc aaggtggacc 3660
tcctgtggga ccactgtctc ttggactggc caccgtggac attcagaacc ccgatatcac 3720
cagcagccgg tacagaggac ttcccgctcc tggaccatct cctgccgaca agaagagatc 3780
cgggaagaag aagatcagca aggccgacat cggagcccct agcggcttta aacacgtgtc 3840
ccacgttgga tgggacccac agaacggctt cgacgtgaac aatctggacc ccgacctgcg 3900
gagcctgttt tctagagccg gaatctctga ggcccagctg accgatgccg agacaagcaa 3960
gctgatctac gacttcatcg aggaccaagg cggcctggaa gccgtgcgac aagagatgag 4020
aaggcaagag cctctgccac cacctccacc tccatctaga ggcggaaacc agctgcctag 4080
acctcctatc gttggcggca acaagggaag atctggccct ctgcctcctg tgcctctggg 4140
aattgctcca ccaccaccaa cacctagagg cccgcctcca ccaggcagag gtggtcctcc 4200
gccgccacct cctccagcaa caggcagatc tggaccactt cctcctccac cacctggtgc 4260
tggtggacct ccaatgccac cgccaccgcc tccgccacct ccgcctccaa gttctggaaa 4320
tggacctgct cctcctcctt tgcctcctgc tttggttcct gctggcggat tggctccagg 4380
cggaggaaga ggcgcactcc tggatcagat cagacagggc atccagctga acaagacccc 4440
tggcgctcct gagagttctg ctctgcaacc gccaccacag tctagcgaag gacttgtggg 4500
agccctgatg cacgtgatgc agaagagaag cagagccatc cacagcagcg acgaaggcga 4560
agatcaagct ggcgacgaag atgaggacga cgagtgggac gattgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 55
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR25_pTL20c_MND_coWAS_SK734fwd_650
<400> 55
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgtctggcgg acctatggga ggtagacctg 2820
gtggaagagg tgctcctgcc gtgcagcaga acatcccttc tacactgctg caggaccacg 2880
agaaccagcg gctgtttgag atgctgggca gaaagtgtct gaccctggct acagctgtgg 2940
tgcagctgta tctggcactt cctccaggcg ccgagcactg gaccaaagaa cattgtggcg 3000
ccgtgtgctt cgtgaaggac aaccctcaga agtcctactt catccggctg tacggactgc 3060
aggctggcag actgctgtgg gagcaagagc tgtactccca gctggtgtac agcaccccta 3120
cacctttctt ccacaccttt gccggcgacg attgtcaggc cggactgaac tttgccgacg 3180
aggatgaagc ccaggccttc agagcactgg tgcaagagaa gatccagaag cggaaccaga 3240
gacagagcgg cgacagaagg caactgcctc ctccacctac accagccaac gaggaaagaa 3300
gaggcggact gcctccactg cctcttcatc ctggcggaga tcaaggtgga cctcctgtgg 3360
gaccactgtc tcttggactg gccaccgtgg acattcagaa ccccgatatc accagcagcc 3420
ggtacagagg acttcccgct cctggaccat ctcctgccga caagaagaga tccgggaaga 3480
agaagatcag caaggccgac atcggagccc ctagcggctt taaacacgtg tcccacgttg 3540
gatgggaccc acagaacggc ttcgacgtga acaatctgga ccccgacctg cggagcctgt 3600
tttctagagc cggaatctct gaggcccagc tgaccgatgc cgagacaagc aagctgatct 3660
acgacttcat cgaggaccaa ggcggcctgg aagccgtgcg acaagagatg agaaggcaag 3720
agcctctgcc accacctcca cctccatcta gaggcggaaa ccagctgcct agacctccta 3780
tcgttggcgg caacaaggga agatctggcc ctctgcctcc tgtgcctctg ggaattgctc 3840
caccaccacc aacacctaga ggcccgcctc caccaggcag aggtggtcct ccgccgccac 3900
ctcctccagc aacaggcaga tctggaccac ttcctcctcc accacctggt gctggtggac 3960
ctccaatgcc accgccaccg cctccgccac ctccgcctcc aagttctgga aatggacctg 4020
ctcctcctcc tttgcctcct gctttggttc ctgctggcgg attggctcca ggcggaggaa 4080
gaggcgcact cctggatcag atcagacagg gcatccagct gaacaagacc cctggcgctc 4140
ctgagagttc tgctctgcaa ccgccaccac agtctagcga aggacttgtg ggagccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccacagcag cgacgaaggc gaagatcaag 4260
ctggcgacga agatgaggac gacgagtggg acgattgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtat cgacgtgcag 4920
tatttagcat gccccaccca tctgcaaggc attctggata gtgtcaaaac agccggaaat 4980
caagtccgtt tatctcaaac tttagcattt tgggaataaa tgatatttgc tatgctggtt 5040
aaattagatt ttagttaaat ttcctgctga agctctagta cgataagtaa cttgacctaa 5100
gtgtaaagtt gagatttcct tcaggtttat atagcttgtg cgccgcctgg gtacctcagg 5160
atatgccctt gactatttgt ccgacatagt caagggcata tccttttttg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 56
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR26_pTL20c_SK734rev_MND_coWAS_650
<400> 56
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtcaaaa 2400
aaggatatgc ccttgactat gtcggacaaa tagtcaaggg catatcctga ggtacccagg 2460
cggcgcacaa gctatataaa cctgaaggaa atctcaactt tacacttagg tcaagttact 2520
tatcgtacta gagcttcagc aggaaattta actaaaatct aatttaacca gcatagcaaa 2580
tatcatttat tcccaaaatg ctaaagtttg agataaacgg acttgatttc cggctgtttt 2640
gacactatcc agaatgcctt gcagatgggt ggggcatgct aaatactgca cgtcgatacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg tctggcggac ctatgggagg 3120
tagacctggt ggaagaggtg ctcctgccgt gcagcagaac atcccttcta cactgctgca 3180
ggaccacgag aaccagcggc tgtttgagat gctgggcaga aagtgtctga ccctggctac 3240
agctgtggtg cagctgtatc tggcacttcc tccaggcgcc gagcactgga ccaaagaaca 3300
ttgtggcgcc gtgtgcttcg tgaaggacaa ccctcagaag tcctacttca tccggctgta 3360
cggactgcag gctggcagac tgctgtggga gcaagagctg tactcccagc tggtgtacag 3420
cacccctaca cctttcttcc acacctttgc cggcgacgat tgtcaggccg gactgaactt 3480
tgccgacgag gatgaagccc aggccttcag agcactggtg caagagaaga tccagaagcg 3540
gaaccagaga cagagcggcg acagaaggca actgcctcct ccacctacac cagccaacga 3600
ggaaagaaga ggcggactgc ctccactgcc tcttcatcct ggcggagatc aaggtggacc 3660
tcctgtggga ccactgtctc ttggactggc caccgtggac attcagaacc ccgatatcac 3720
cagcagccgg tacagaggac ttcccgctcc tggaccatct cctgccgaca agaagagatc 3780
cgggaagaag aagatcagca aggccgacat cggagcccct agcggcttta aacacgtgtc 3840
ccacgttgga tgggacccac agaacggctt cgacgtgaac aatctggacc ccgacctgcg 3900
gagcctgttt tctagagccg gaatctctga ggcccagctg accgatgccg agacaagcaa 3960
gctgatctac gacttcatcg aggaccaagg cggcctggaa gccgtgcgac aagagatgag 4020
aaggcaagag cctctgccac cacctccacc tccatctaga ggcggaaacc agctgcctag 4080
acctcctatc gttggcggca acaagggaag atctggccct ctgcctcctg tgcctctggg 4140
aattgctcca ccaccaccaa cacctagagg cccgcctcca ccaggcagag gtggtcctcc 4200
gccgccacct cctccagcaa caggcagatc tggaccactt cctcctccac cacctggtgc 4260
tggtggacct ccaatgccac cgccaccgcc tccgccacct ccgcctccaa gttctggaaa 4320
tggacctgct cctcctcctt tgcctcctgc tttggttcct gctggcggat tggctccagg 4380
cggaggaaga ggcgcactcc tggatcagat cagacagggc atccagctga acaagacccc 4440
tggcgctcct gagagttctg ctctgcaacc gccaccacag tctagcgaag gacttgtggg 4500
agccctgatg cacgtgatgc agaagagaag cagagccatc cacagcagcg acgaaggcga 4560
agatcaagct ggcgacgaag atgaggacga cgagtgggac gattgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 57
<211> 9642
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: pBRNGTR27_pTL20c_MND_coWAS_SK734rev_650
<400> 57
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtggatc 2400
cgaacagaga gacagcagaa tatgggccaa acaggatatc tgtggtaagc agttcctgcc 2460
ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg atatctgtgg 2520
taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg cggtcccgcc 2580
ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac ctgaaatgac 2640
cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg cgcgcttctg 2700
ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcgg cgcgccaatt 2760
caagcgagaa gacaagggca gccgccacca tgtctggcgg acctatggga ggtagacctg 2820
gtggaagagg tgctcctgcc gtgcagcaga acatcccttc tacactgctg caggaccacg 2880
agaaccagcg gctgtttgag atgctgggca gaaagtgtct gaccctggct acagctgtgg 2940
tgcagctgta tctggcactt cctccaggcg ccgagcactg gaccaaagaa cattgtggcg 3000
ccgtgtgctt cgtgaaggac aaccctcaga agtcctactt catccggctg tacggactgc 3060
aggctggcag actgctgtgg gagcaagagc tgtactccca gctggtgtac agcaccccta 3120
cacctttctt ccacaccttt gccggcgacg attgtcaggc cggactgaac tttgccgacg 3180
aggatgaagc ccaggccttc agagcactgg tgcaagagaa gatccagaag cggaaccaga 3240
gacagagcgg cgacagaagg caactgcctc ctccacctac accagccaac gaggaaagaa 3300
gaggcggact gcctccactg cctcttcatc ctggcggaga tcaaggtgga cctcctgtgg 3360
gaccactgtc tcttggactg gccaccgtgg acattcagaa ccccgatatc accagcagcc 3420
ggtacagagg acttcccgct cctggaccat ctcctgccga caagaagaga tccgggaaga 3480
agaagatcag caaggccgac atcggagccc ctagcggctt taaacacgtg tcccacgttg 3540
gatgggaccc acagaacggc ttcgacgtga acaatctgga ccccgacctg cggagcctgt 3600
tttctagagc cggaatctct gaggcccagc tgaccgatgc cgagacaagc aagctgatct 3660
acgacttcat cgaggaccaa ggcggcctgg aagccgtgcg acaagagatg agaaggcaag 3720
agcctctgcc accacctcca cctccatcta gaggcggaaa ccagctgcct agacctccta 3780
tcgttggcgg caacaaggga agatctggcc ctctgcctcc tgtgcctctg ggaattgctc 3840
caccaccacc aacacctaga ggcccgcctc caccaggcag aggtggtcct ccgccgccac 3900
ctcctccagc aacaggcaga tctggaccac ttcctcctcc accacctggt gctggtggac 3960
ctccaatgcc accgccaccg cctccgccac ctccgcctcc aagttctgga aatggacctg 4020
ctcctcctcc tttgcctcct gctttggttc ctgctggcgg attggctcca ggcggaggaa 4080
gaggcgcact cctggatcag atcagacagg gcatccagct gaacaagacc cctggcgctc 4140
ctgagagttc tgctctgcaa ccgccaccac agtctagcga aggacttgtg ggagccctga 4200
tgcacgtgat gcagaagaga agcagagcca tccacagcag cgacgaaggc gaagatcaag 4260
ctggcgacga agatgaggac gacgagtggg acgattgata actagtaatc aacctctgga 4320
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 4380
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 4440
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 4500
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 4560
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 4620
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 4680
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgttcgcct gtgttgccac 4740
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 4800
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 4860
gacgagtcgg atctcccttt gggccgcctc cccgcacgta cgaccggtca aaaaaggata 4920
tgcccttgac tatgtcggac aaatagtcaa gggcatatcc tgaggtaccc aggcggcgca 4980
caagctatat aaacctgaag gaaatctcaa ctttacactt aggtcaagtt acttatcgta 5040
ctagagcttc agcaggaaat ttaactaaaa tctaatttaa ccagcatagc aaatatcatt 5100
tattcccaaa atgctaaagt ttgagataaa cggacttgat ttccggctgt tttgacacta 5160
tccagaatgc cttgcagatg ggtggggcat gctaaatact gcacgtcgat accggtgcgg 5220
ccgcatcgat gccgtagtac ctttaagacc aatgacttac aaggcagctg tagatcttag 5280
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaaa gaagacaagg 5340
ccccatcctc actgactccg tcctggagtt ggatgagaga taatggcctt acgttgtgcc 5400
aggggagggt cgggctggat ttagcaagat ttaccttctc caaagagcgg tgctgcagtg 5460
gcacagctgc ccacggaggt gggggggtca ccgtccctgg aggtgatgaa gaactgtggg 5520
gatgtggcac tgagggacat ggccagtggg cacggtgggt gggttggggt tggtcttggg 5580
gatcttggag ggcttttcca gccttcatga tttgacgatt gtatgaacat ctacatggca 5640
attctccagc tgcctgtccc agtcctactg acccagctgt atctctccag gcaagctctt 5700
ccaccccttc tgcttgcatc cagacaccat caaacatgca ggctcagcct aaagcttttt 5760
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5820
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5880
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 5940
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6000
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6060
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6120
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6180
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6240
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6300
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6360
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6420
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6480
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6540
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6600
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6660
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6720
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6780
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6840
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6900
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 6960
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7200
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7260
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7320
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7380
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7440
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7500
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7560
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7620
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7680
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7740
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7800
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7860
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7920
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 7980
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8040
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8100
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8160
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8220
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8280
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8340
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8400
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8460
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8520
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8580
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8640
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8700
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8760
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8820
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8880
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 8940
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9000
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9060
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9120
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9180
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9240
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9300
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9360
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9420
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9480
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9540
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9600
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9642
<210> 58
<211> 3160
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: 7SK/sh734_MND/hWASWT_WPRE_7SK/sh734 cassette:
<400> 58
aagcttcgaa gcgatcgcac gcgtatcgac gtgcagtatt tagcatgccc cacccatctg 60
caaggcattc tggatagtgt caaaacagcc ggaaatcaag tccgtttatc tcaaacttta 120
gcattttggg aataaatgat atttgctatg ctggttaaat tagattttag ttaaatttcc 180
tgctgaagct ctagtacgat aagtaacttg acctaagtgt aaagttgaga tttccttcag 240
gtttatatag cttgtgcgcc gcctgggtac ctcaggatat gcccttgact atttgtccga 300
catagtcaag ggcatatcct tttttacgcg tggatccgaa cagagagaca gcagaatatg 360
ggccaaacag gatatctgtg gtaagcagtt cctgccccgg ctcagggcca agaacagttg 420
gaacagcaga atatgggcca aacaggatat ctgtggtaag cagttcctgc cccggctcag 480
ggccaagaac agatggtccc cagatgcggt cccgccctca gcagtttcta gagaaccatc 540
agatgtttcc agggtgcccc aaggacctga aatgaccctg tgccttattt gaactaacca 600
atcagttcgc ttctcgcttc tgttcgcgcg cttctgctcc ccgagctcta tataagcaga 660
gctcgtttag tgaaccgtca gatcggcgcg ccaattcaag cgagaagaca agggcagccg 720
ccaccatgag tgggggccca atgggaggaa ggcccggggg ccgaggagca ccagcggttc 780
agcagaacat accctccacc ctcctccagg accacgagaa ccagcgactc tttgagatgc 840
ttggacgaaa atgcttgacg ctggccactg cagttgttca gctgtacctg gcgctgcccc 900
ctggagctga gcactggacc aaggagcatt gtggggctgt gtgcttcgtg aaggataacc 960
cccagaagtc ctacttcatc cgcctttacg gccttcaggc tggtcggctg ctctgggaac 1020
aggagctgta ctcacagctt gtctactcca cccccacccc cttcttccac accttcgctg 1080
gagatgactg ccaagcgggg ctgaactttg cagacgagga cgaggcccag gccttccggg 1140
cactcgtgca ggagaagata caaaaaagga atcagaggca aagtggagac agacgccagc 1200
tacccccacc accaacacca gccaatgaag agagaagagg agggctccca cccctgcccc 1260
tgcatccagg tggagaccaa ggaggccctc cagtgggtcc gctctccctg gggctggcga 1320
cagtggacat ccagaaccct gacatcacga gttcacgata ccgtgggctc ccagcacctg 1380
gacctagccc agctgataag aaacgctcag ggaagaagaa gatcagcaaa gctgatattg 1440
gtgcacccag tggattcaag catgtcagcc acgtggggtg ggacccccag aatggatttg 1500
acgtgaacaa cctcgaccca gatctgcgga gtctgttctc cagggcagga atcagcgagg 1560
cccagctcac cgacgccgag acctctaaac ttatctacga cttcattgag gaccagggtg 1620
ggctggaggc tgtgcggcag gagatgaggc gccaggagcc acttccgccg cccccaccgc 1680
catctcgagg agggaaccag ctcccccggc cccctattgt ggggggtaac aagggtcgtt 1740
ctggtccact gccccctgta cctttgggga ttgccccacc cccaccaaca ccccggggac 1800
ccccaccccc aggccgaggg ggtcctccac caccaccccc tccagctact ggacgttctg 1860
gaccactgcc ccctccaccc cctggagctg gtgggccacc catgccacca ccaccgccac 1920
caccgccacc gccgcccagc tccgggaatg gaccagcccc tcccccactc cctcctgctc 1980
tggtgcctgc cgggggcctg gcccctggtg ggggtcgggg agcgcttttg gatcaaatcc 2040
ggcagggaat tcagctgaac aagacccctg gggccccaga gagctcagcg ctgcagccac 2100
cacctcagag ctcagaggga ctggtggggg ccctgatgca cgtgatgcag aagagaagca 2160
gagccatcca ctcctccgac gaaggggagg accaggctgg cgatgaagat gaagatgatg 2220
aatgggatga ctgataacta gtaatcaacc tctggattac aaaatttgtg aaagattgac 2280
tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt 2340
gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt 2400
gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt 2460
gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg 2520
gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg 2580
ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaaatc 2640
atcgtccttt ccttggctgt tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt 2700
ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc 2760
tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc 2820
cgcctccccg cacgtacgac cggtatcgac gtgcagtatt tagcatgccc cacccatctg 2880
caaggcattc tggatagtgt caaaacagcc ggaaatcaag tccgtttatc tcaaacttta 2940
gcattttggg aataaatgat atttgctatg ctggttaaat tagattttag ttaaatttcc 3000
tgctgaagct ctagtacgat aagtaacttg acctaagtgt aaagttgaga tttccttcag 3060
gtttatatag cttgtgcgcc gcctgggtac ctcaggatat gcccttgact atttgtccga 3120
catagtcaag ggcatatcct tttttgaccg gtgcggccgc 3160
<210> 59
<211> 3161
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: r7SK/sh734R_MND/hWASCO_WPRE_r7SK/sh734 cassette
<400> 59
aagcttcgaa gcgatcgcac gcgtcaaaaa aggatatgcc cttgactatg tcggacaaat 60
agtcaagggc atatcctgag gtacccaggc ggcgcacaag ctatataaac ctgaaggaaa 120
tctcaacttt acacttaggt caagttactt atcgtactag agcttcagca ggaaatttaa 180
ctaaaatcta atttaaccag catagcaaat atcatttatt cccaaaatgc taaagtttga 240
gataaacgga cttgatttcc ggctgttttg acactatcca gaatgccttg cagatgggtg 300
gggcatgcta aatactgcac gtcgatacgc gtggatccga acagagagac agcagaatat 360
gggccaaaca ggatatctgt ggtaagcagt tcctgccccg gctcagggcc aagaacagtt 420
ggaacagcag aatatgggcc aaacaggata tctgtggtaa gcagttcctg ccccggctca 480
gggccaagaa cagatggtcc ccagatgcgg tcccgccctc agcagtttct agagaaccat 540
cagatgtttc cagggtgccc caaggacctg aaatgaccct gtgccttatt tgaactaacc 600
aatcagttcg cttctcgctt ctgttcgcgc gcttctgctc cccgagctct atataagcag 660
agctcgttta gtgaaccgtc agatcggcgc gccaattcaa gcgagaagac aagggcagcc 720
gccaccatgt ctggcggacc tatgggaggt agacctggtg gaagaggtgc tcctgccgtg 780
cagcagaaca tcccttctac actgctgcag gaccacgaga accagcggct gtttgagatg 840
ctgggcagaa agtgtctgac cctggctaca gctgtggtgc agctgtatct ggcacttcct 900
ccaggcgccg agcactggac caaagaacat tgtggcgccg tgtgcttcgt gaaggacaac 960
cctcagaagt cctacttcat ccggctgtac ggactgcagg ctggcagact gctgtgggag 1020
caagagctgt actcccagct ggtgtacagc acccctacac ctttcttcca cacctttgcc 1080
ggcgacgatt gtcaggccgg actgaacttt gccgacgagg atgaagccca ggccttcaga 1140
gcactggtgc aagagaagat ccagaagcgg aaccagagac agagcggcga cagaaggcaa 1200
ctgcctcctc cacctacacc agccaacgag gaaagaagag gcggactgcc tccactgcct 1260
cttcatcctg gcggagatca aggtggacct cctgtgggac cactgtctct tggactggcc 1320
accgtggaca ttcagaaccc cgatatcacc agcagccggt acagaggact tcccgctcct 1380
ggaccatctc ctgccgacaa gaagagatcc gggaagaaga agatcagcaa ggccgacatc 1440
ggagccccta gcggctttaa acacgtgtcc cacgttggat gggacccaca gaacggcttc 1500
gacgtgaaca atctggaccc cgacctgcgg agcctgtttt ctagagccgg aatctctgag 1560
gcccagctga ccgatgccga gacaagcaag ctgatctacg acttcatcga ggaccaaggc 1620
ggcctggaag ccgtgcgaca agagatgaga aggcaagagc ctctgccacc acctccacct 1680
ccatctagag gcggaaacca gctgcctaga cctcctatcg ttggcggcaa caagggaaga 1740
tctggccctc tgcctcctgt gcctctggga attgctccac caccaccaac acctagaggc 1800
ccgcctccac caggcagagg tggtcctccg ccgccacctc ctccagcaac aggcagatct 1860
ggaccacttc ctcctccacc acctggtgct ggtggacctc caatgccacc gccaccgcct 1920
ccgccacctc cgcctccaag ttctggaaat ggacctgctc ctcctccttt gcctcctgct 1980
ttggttcctg ctggcggatt ggctccaggc ggaggaagag gcgcactcct ggatcagatc 2040
agacagggca tccagctgaa caagacccct ggcgctcctg agagttctgc tctgcaaccg 2100
ccaccacagt ctagcgaagg acttgtggga gccctgatgc acgtgatgca gaagagaagc 2160
agagccatcc acagcagcga cgaaggcgaa gatcaagctg gcgacgaaga tgaggacgac 2220
gagtgggacg attgataact agtaatcaac ctctggatta caaaatttgt gaaagattga 2280
ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 2340
tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 2400
tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 2460
tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 2520
ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 2580
gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat 2640
catcgtcctt tccttggctg ttcgcctgtg ttgccacctg gattctgcgc gggacgtcct 2700
tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 2760
ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 2820
ccgcctcccc gcacgtacga ccggtcaaaa aaggatatgc ccttgactat gtcggacaaa 2880
tagtcaaggg catatcctga ggtacccagg cggcgcacaa gctatataaa cctgaaggaa 2940
atctcaactt tacacttagg tcaagttact tatcgtacta gagcttcagc aggaaattta 3000
actaaaatct aatttaacca gcatagcaaa tatcatttat tcccaaaatg ctaaagtttg 3060
agataaacgg acttgatttc cggctgtttt gacactatcc agaatgcctt gcagatgggt 3120
ggggcatgct aaatactgca cgtcgatacc ggtgcggccg c 3161
<210> 60
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: gBlock 1
<400> 60
gctgtccccg tgagctcccc agatctgctt tttgcctgta ctgggtctct ctggttagac 60
cagatctgag cctgggagct ctctggctaa ctagggaacc cactgcttaa gcctcaataa 120
agcttcagct gctcgagcta gcagatcttt ttccctctgc caaaaattat ggggacatc 179
<210> 61
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: gBlock 2
<400> 61
ctttgggccg cctccccgca cgtacgaccg gtgcggccgc atcgatgccg tagtaccttt 60
aagaccaatg acttacaagg cagctgtaga tcttagccac tttttaaaag aaaagggggg 120
actggaaggg ctaattcact cccaaagaag acaaggcccc atcctcactg actccgtcct 180
ggagttgga 189
<210> 62
<211> 187
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: gBlock 3
<400> 62
gcatgctaaa tactgcacgt cgataccggt gcggccgcat cgatgccgta gtacctttaa 60
gaccaatgac ttacaaggca gctgtagatc ttagccactt tttaaaagaa aaggggggac 120
tggaagggct aattcactcc caaagaagac aaggccccat cctcactgac tccgtcctgg 180
agttgga 187
<210> 63
<211> 9702
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Int Vector 1
<400> 63
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtatcga 2400
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 2460
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 2520
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 2580
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 2640
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttacgc 2700
gtggatccga acagagagac agcagaatat gggccaaaca ggatatctgt ggtaagcagt 2760
tcctgccccg gctcagggcc aagaacagtt ggaacagcag aatatgggcc aaacaggata 2820
tctgtggtaa gcagttcctg ccccggctca gggccaagaa cagatggtcc ccagatgcgg 2880
tcccgccctc agcagtttct agagaaccat cagatgtttc cagggtgccc caaggacctg 2940
aaatgaccct gtgccttatt tgaactaacc aatcagttcg cttctcgctt ctgttcgcgc 3000
gcttctgctc cccgagctct atataagcag agctcgttta gtgaaccgtc agatcggcgc 3060
gccaattcaa gcgagaagac aagggcagcc gccaccatga gtgggggccc aatgggagga 3120
aggcccgggg gccgaggagc accagcggtt cagcagaaca taccctccac cctcctccag 3180
gaccacgaga accagcgact ctttgagatg cttggacgaa aatgcttgac gctggccact 3240
gcagttgttc agctgtacct ggcgctgccc cctggagctg agcactggac caaggagcat 3300
tgtggggctg tgtgcttcgt gaaggataac ccccagaagt cctacttcat ccgcctttac 3360
ggccttcagg ctggtcggct gctctgggaa caggagctgt actcacagct tgtctactcc 3420
acccccaccc ccttcttcca caccttcgct ggagatgact gccaagcggg gctgaacttt 3480
gcagacgagg acgaggccca ggccttccgg gcactcgtgc aggagaagat acaaaaaagg 3540
aatcagaggc aaagtggaga cagacgccag ctacccccac caccaacacc agccaatgaa 3600
gagagaagag gagggctccc acccctgccc ctgcatccag gtggagacca aggaggccct 3660
ccagtgggtc cgctctccct ggggctggcg acagtggaca tccagaaccc tgacatcacg 3720
agttcacgat accgtgggct cccagcacct ggacctagcc cagctgataa gaaacgctca 3780
gggaagaaga agatcagcaa agctgatatt ggtgcaccca gtggattcaa gcatgtcagc 3840
cacgtggggt gggaccccca gaatggattt gacgtgaaca acctcgaccc agatctgcgg 3900
agtctgttct ccagggcagg aatcagcgag gcccagctca ccgacgccga gacctctaaa 3960
cttatctacg acttcattga ggaccagggt gggctggagg ctgtgcggca ggagatgagg 4020
cgccaggagc cacttccgcc gcccccaccg ccatctcgag gagggaacca gctcccccgg 4080
ccccctattg tggggggtaa caagggtcgt tctggtccac tgccccctgt acctttgggg 4140
attgccccac ccccaccaac accccgggga cccccacccc caggccgagg gggtcctcca 4200
ccaccacccc ctccagctac tggacgttct ggaccactgc cccctccacc ccctggagct 4260
ggtgggccac ccatgccacc accaccgcca ccaccgccac cgccgcccag ctccgggaat 4320
ggaccagccc ctcccccact ccctcctgct ctggtgcctg ccgggggcct ggcccctggt 4380
gggggtcggg gagcgctttt ggatcaaatc cggcagggaa ttcagctgaa caagacccct 4440
ggggccccag agagctcagc gctgcagcca ccacctcaga gctcagaggg actggtgggg 4500
gccctgatgc acgtgatgca gaagagaagc agagccatcc actcctccga cgaaggggag 4560
gaccaggctg gcgatgaaga tgaagatgat gaatgggatg actgataact agtaatcaac 4620
ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 4680
cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 4740
tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 4800
ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 4860
gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 4920
cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 4980
ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ttcgcctgtg 5040
ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 5100
cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 5160
gccctcagac gagtcggatc tccctttggg ccgcctcccc gcacgtacga ccggtatcga 5220
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 5280
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 5340
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 5400
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 5460
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttgacc 5520
ggtgcggccg catcgatgcc gtagtacctt taagaccaat gacttacaag gcagctgtag 5580
atcttagcca ctttttaaaa gaaaaggggg gactggaagg gctaattcac tcccaaagaa 5640
gacaagatcc ctgcaggcat tcaaggccag gctggatgtg gctctgggca gcctgggctg 5700
ctggttgatg accctgcaca tagcaggggg ttggatctgg atgagcactg tgctcctttg 5760
caacccaggc cgttctatga ttctgtcatt ctaaatctct ctttcagcct aaagcttttt 5820
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5880
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5940
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 6000
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6060
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6120
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6180
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6240
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6300
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6360
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6420
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6480
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6540
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6600
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6660
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6720
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6780
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6840
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6900
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6960
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 7020
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7080
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7140
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7200
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7260
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7320
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7380
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7440
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7500
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7560
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7620
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7680
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7740
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7800
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7860
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7920
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7980
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 8040
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8100
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8160
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8220
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8280
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8340
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8400
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8460
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8520
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8580
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8640
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8700
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8760
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8820
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8880
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8940
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 9000
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9060
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9120
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9180
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9240
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9300
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9360
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9420
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9480
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9540
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9600
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9660
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9702
<210> 64
<211> 9703
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Int Vector 2
<400> 64
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtcaaaa 2400
aaggatatgc ccttgactat gtcggacaaa tagtcaaggg catatcctga ggtacccagg 2460
cggcgcacaa gctatataaa cctgaaggaa atctcaactt tacacttagg tcaagttact 2520
tatcgtacta gagcttcagc aggaaattta actaaaatct aatttaacca gcatagcaaa 2580
tatcatttat tcccaaaatg ctaaagtttg agataaacgg acttgatttc cggctgtttt 2640
gacactatcc agaatgcctt gcagatgggt ggggcatgct aaatactgca cgtcgatacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg tctggcggac ctatgggagg 3120
tagacctggt ggaagaggtg ctcctgccgt gcagcagaac atcccttcta cactgctgca 3180
ggaccacgag aaccagcggc tgtttgagat gctgggcaga aagtgtctga ccctggctac 3240
agctgtggtg cagctgtatc tggcacttcc tccaggcgcc gagcactgga ccaaagaaca 3300
ttgtggcgcc gtgtgcttcg tgaaggacaa ccctcagaag tcctacttca tccggctgta 3360
cggactgcag gctggcagac tgctgtggga gcaagagctg tactcccagc tggtgtacag 3420
cacccctaca cctttcttcc acacctttgc cggcgacgat tgtcaggccg gactgaactt 3480
tgccgacgag gatgaagccc aggccttcag agcactggtg caagagaaga tccagaagcg 3540
gaaccagaga cagagcggcg acagaaggca actgcctcct ccacctacac cagccaacga 3600
ggaaagaaga ggcggactgc ctccactgcc tcttcatcct ggcggagatc aaggtggacc 3660
tcctgtggga ccactgtctc ttggactggc caccgtggac attcagaacc ccgatatcac 3720
cagcagccgg tacagaggac ttcccgctcc tggaccatct cctgccgaca agaagagatc 3780
cgggaagaag aagatcagca aggccgacat cggagcccct agcggcttta aacacgtgtc 3840
ccacgttgga tgggacccac agaacggctt cgacgtgaac aatctggacc ccgacctgcg 3900
gagcctgttt tctagagccg gaatctctga ggcccagctg accgatgccg agacaagcaa 3960
gctgatctac gacttcatcg aggaccaagg cggcctggaa gccgtgcgac aagagatgag 4020
aaggcaagag cctctgccac cacctccacc tccatctaga ggcggaaacc agctgcctag 4080
acctcctatc gttggcggca acaagggaag atctggccct ctgcctcctg tgcctctggg 4140
aattgctcca ccaccaccaa cacctagagg cccgcctcca ccaggcagag gtggtcctcc 4200
gccgccacct cctccagcaa caggcagatc tggaccactt cctcctccac cacctggtgc 4260
tggtggacct ccaatgccac cgccaccgcc tccgccacct ccgcctccaa gttctggaaa 4320
tggacctgct cctcctcctt tgcctcctgc tttggttcct gctggcggat tggctccagg 4380
cggaggaaga ggcgcactcc tggatcagat cagacagggc atccagctga acaagacccc 4440
tggcgctcct gagagttctg ctctgcaacc gccaccacag tctagcgaag gacttgtggg 4500
agccctgatg cacgtgatgc agaagagaag cagagccatc cacagcagcg acgaaggcga 4560
agatcaagct ggcgacgaag atgaggacga cgagtgggac gattgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtcaaa 5220
aaaggatatg cccttgacta tgtcggacaa atagtcaagg gcatatcctg aggtacccag 5280
gcggcgcaca agctatataa acctgaagga aatctcaact ttacacttag gtcaagttac 5340
ttatcgtact agagcttcag caggaaattt aactaaaatc taatttaacc agcatagcaa 5400
atatcattta ttcccaaaat gctaaagttt gagataaacg gacttgattt ccggctgttt 5460
tgacactatc cagaatgcct tgcagatggg tggggcatgc taaatactgc acgtcgatac 5520
cggtgcggcc gcatcgatgc cgtagtacct ttaagaccaa tgacttacaa ggcagctgta 5580
gatcttagcc actttttaaa agaaaagggg ggactggaag ggctaattca ctcccaaaga 5640
agacaagatc cctgcaggca ttcaaggcca ggctggatgt ggctctgggc agcctgggct 5700
gctggttgat gaccctgcac atagcagggg gttggatctg gatgagcact gtgctccttt 5760
gcaacccagg ccgttctatg attctgtcat tctaaatctc tctttcagcc taaagctttt 5820
tccccgtatc cccccaggtg tctgcaggct caaagagcag cgagaagcgt tcagaggaaa 5880
gcgatcccgt gccaccttcc ccgtgcccgg gctgtccccg cacgctgccg gctcggggat 5940
gcggggggag cgccggaccg gagcggagcc ccgggcggct cgctgctgcc ccctagcggg 6000
ggagggacgt aattacatcc ctgggggctt tggggggggg ctgtccccgt gagctcccca 6060
gatctgcttt ttgcctgtac tgggtctctc tggttagacc agatctgagc ctgggagctc 6120
tctggctaac tagggaaccc actgcttaag cctcaataaa gcttcagctg ctcgagctag 6180
cagatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt gagcatctga 6240
cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat tttttgtgtc 6300
tctcactcgg aaggacatat gggagggcaa atcatttaaa acatcagaat gagtatttgg 6360
tttagagttt ggcaacatat gcccatatgc tggctgccat gaacaaaggt tggctataaa 6420
gaggtcatca gtatatgaaa cagccccctg ctgtccattc cttattccat agaaaagcct 6480
tgacttgagg ttagattttt tttatatttt gttttgtgtt atttttttct ttaacatccc 6540
taaaattttc cttacatgtt ttactagcca gatttttcct cctctcctga ctactcccag 6600
tcatagctgt ccctcttctc ttatggagat ccctcgacct gcagcccaag cttggcgtaa 6660
tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 6720
cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 6780
attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gcggatccgc 6840
atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 6900
cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 6960
ccgaggccgc ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 7020
taggcttttg caaaaagctg tcgactgcag aggcctgcat gcaagcttgg cgtaatcatg 7080
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 7140
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 7200
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 7260
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 7320
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 7380
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 7440
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 7500
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 7560
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 7620
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 7680
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 7740
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 7800
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 7860
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 7920
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 7980
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 8040
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 8100
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 8160
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 8220
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 8280
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 8340
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 8400
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 8460
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 8520
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 8580
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 8640
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 8700
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 8760
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 8820
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 8880
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 8940
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 9000
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 9060
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 9120
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 9180
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 9240
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 9300
tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt 9360
cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg 9420
tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt 9480
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 9540
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 9600
attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg 9660
gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa ttc 9703
<210> 65
<211> 9703
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Int Vector 3
<400> 65
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtcaaaa 2400
aaggatatgc ccttgactat gtcggacaaa tagtcaaggg catatcctga ggtacccagg 2460
cggcgcacaa gctatataaa cctgaaggaa atctcaactt tacacttagg tcaagttact 2520
tatcgtacta gagcttcagc aggaaattta actaaaatct aatttaacca gcatagcaaa 2580
tatcatttat tcccaaaatg ctaaagtttg agataaacgg acttgatttc cggctgtttt 2640
gacactatcc agaatgcctt gcagatgggt ggggcatgct aaatactgca cgtcgatacg 2700
cgtggatccg aacagagaga cagcagaata tgggccaaac aggatatctg tggtaagcag 2760
ttcctgcccc ggctcagggc caagaacagt tggaacagca gaatatgggc caaacaggat 2820
atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc cccagatgcg 2880
gtcccgccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc ccaaggacct 2940
gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct tctgttcgcg 3000
cgcttctgct ccccgagctc tatataagca gagctcgttt agtgaaccgt cagatcggcg 3060
cgccaattca agcgagaaga caagggcagc cgccaccatg agtgggggcc caatgggagg 3120
aaggcccggg ggccgaggag caccagcggt tcagcagaac ataccctcca ccctcctcca 3180
ggaccacgag aaccagcgac tctttgagat gcttggacga aaatgcttga cgctggccac 3240
tgcagttgtt cagctgtacc tggcgctgcc ccctggagct gagcactgga ccaaggagca 3300
ttgtggggct gtgtgcttcg tgaaggataa cccccagaag tcctacttca tccgccttta 3360
cggccttcag gctggtcggc tgctctggga acaggagctg tactcacagc ttgtctactc 3420
cacccccacc cccttcttcc acaccttcgc tggagatgac tgccaagcgg ggctgaactt 3480
tgcagacgag gacgaggccc aggccttccg ggcactcgtg caggagaaga tacaaaaaag 3540
gaatcagagg caaagtggag acagacgcca gctaccccca ccaccaacac cagccaatga 3600
agagagaaga ggagggctcc cacccctgcc cctgcatcca ggtggagacc aaggaggccc 3660
tccagtgggt ccgctctccc tggggctggc gacagtggac atccagaacc ctgacatcac 3720
gagttcacga taccgtgggc tcccagcacc tggacctagc ccagctgata agaaacgctc 3780
agggaagaag aagatcagca aagctgatat tggtgcaccc agtggattca agcatgtcag 3840
ccacgtgggg tgggaccccc agaatggatt tgacgtgaac aacctcgacc cagatctgcg 3900
gagtctgttc tccagggcag gaatcagcga ggcccagctc accgacgccg agacctctaa 3960
acttatctac gacttcattg aggaccaggg tgggctggag gctgtgcggc aggagatgag 4020
gcgccaggag ccacttccgc cgcccccacc gccatctcga ggagggaacc agctcccccg 4080
gccccctatt gtggggggta acaagggtcg ttctggtcca ctgccccctg tacctttggg 4140
gattgcccca cccccaccaa caccccgggg acccccaccc ccaggccgag ggggtcctcc 4200
accaccaccc cctccagcta ctggacgttc tggaccactg ccccctccac cccctggagc 4260
tggtgggcca cccatgccac caccaccgcc accaccgcca ccgccgccca gctccgggaa 4320
tggaccagcc cctcccccac tccctcctgc tctggtgcct gccgggggcc tggcccctgg 4380
tgggggtcgg ggagcgcttt tggatcaaat ccggcaggga attcagctga acaagacccc 4440
tggggcccca gagagctcag cgctgcagcc accacctcag agctcagagg gactggtggg 4500
ggccctgatg cacgtgatgc agaagagaag cagagccatc cactcctccg acgaagggga 4560
ggaccaggct ggcgatgaag atgaagatga tgaatgggat gactgataac tagtaatcaa 4620
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 4680
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 4740
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 4800
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 4860
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 4920
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 4980
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gttcgcctgt 5040
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 5100
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 5160
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcacgtacg accggtcaaa 5220
aaaggatatg cccttgacta tgtcggacaa atagtcaagg gcatatcctg aggtacccag 5280
gcggcgcaca agctatataa acctgaagga aatctcaact ttacacttag gtcaagttac 5340
ttatcgtact agagcttcag caggaaattt aactaaaatc taatttaacc agcatagcaa 5400
atatcattta ttcccaaaat gctaaagttt gagataaacg gacttgattt ccggctgttt 5460
tgacactatc cagaatgcct tgcagatggg tggggcatgc taaatactgc acgtcgatac 5520
cggtgcggcc gcatcgatgc cgtagtacct ttaagaccaa tgacttacaa ggcagctgta 5580
gatcttagcc actttttaaa agaaaagggg ggactggaag ggctaattca ctcccaaaga 5640
agacaagatc cctgcaggca ttcaaggcca ggctggatgt ggctctgggc agcctgggct 5700
gctggttgat gaccctgcac atagcagggg gttggatctg gatgagcact gtgctccttt 5760
gcaacccagg ccgttctatg attctgtcat tctaaatctc tctttcagcc taaagctttt 5820
tccccgtatc cccccaggtg tctgcaggct caaagagcag cgagaagcgt tcagaggaaa 5880
gcgatcccgt gccaccttcc ccgtgcccgg gctgtccccg cacgctgccg gctcggggat 5940
gcggggggag cgccggaccg gagcggagcc ccgggcggct cgctgctgcc ccctagcggg 6000
ggagggacgt aattacatcc ctgggggctt tggggggggg ctgtccccgt gagctcccca 6060
gatctgcttt ttgcctgtac tgggtctctc tggttagacc agatctgagc ctgggagctc 6120
tctggctaac tagggaaccc actgcttaag cctcaataaa gcttcagctg ctcgagctag 6180
cagatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt gagcatctga 6240
cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat tttttgtgtc 6300
tctcactcgg aaggacatat gggagggcaa atcatttaaa acatcagaat gagtatttgg 6360
tttagagttt ggcaacatat gcccatatgc tggctgccat gaacaaaggt tggctataaa 6420
gaggtcatca gtatatgaaa cagccccctg ctgtccattc cttattccat agaaaagcct 6480
tgacttgagg ttagattttt tttatatttt gttttgtgtt atttttttct ttaacatccc 6540
taaaattttc cttacatgtt ttactagcca gatttttcct cctctcctga ctactcccag 6600
tcatagctgt ccctcttctc ttatggagat ccctcgacct gcagcccaag cttggcgtaa 6660
tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 6720
cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 6780
attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gcggatccgc 6840
atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 6900
cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 6960
ccgaggccgc ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 7020
taggcttttg caaaaagctg tcgactgcag aggcctgcat gcaagcttgg cgtaatcatg 7080
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 7140
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 7200
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 7260
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 7320
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 7380
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 7440
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 7500
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 7560
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 7620
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 7680
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 7740
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 7800
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 7860
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 7920
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 7980
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 8040
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 8100
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 8160
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 8220
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 8280
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 8340
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 8400
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 8460
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 8520
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 8580
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 8640
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 8700
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 8760
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 8820
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 8880
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 8940
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 9000
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 9060
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 9120
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 9180
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 9240
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 9300
tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt 9360
cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg 9420
tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt 9480
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 9540
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 9600
attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg 9660
gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa ttc 9703
<210> 66
<211> 9702
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Int Vector 4
<400> 66
ggccgcctcg gccaaacagc ccttgagttt accactccct atcagtgata gagaaaagtg 60
aaagtcgagt ttaccactcc ctatcagtga tagagaaaag tgaaagtcga gtttaccact 120
ccctatcagt gatagagaaa agtgaaagtc gagtttacca ctccctatca gtgatagaga 180
aaagtgaaag tcgagtttac cagtccctat cagtgataga gaaaagtgaa agtcgagttt 240
accactccct atcagtgata gagaaaagtg aaagtcgagt ttaccactcc ctatcagtga 300
tagagaaaag tgaaagtcga gctcgccatg ggaggcgtgg cctgggcggg actggggagt 360
ggcgagccct cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg 420
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 480
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 540
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga 600
acagggactt gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg 660
ctgaagcgcg cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga 720
ctagcggagg ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa 780
ttagatcgcg atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa 840
aacatatagt atgggcaagc agggagctag aacgattcgc agttaatact ggcctgttag 900
aaacatcaga aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat 960
cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga 1020
tagagataaa agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta 1080
agaaaaaagc acagcaagca gcaggatctt cagacctgga aattccctac aatccccaaa 1140
gtcaaggagt agtagaatct atgaataaag aattaaagaa aattatagga caggtaagag 1200
atcaggctga acatcttaag acagcagtac aaatggcagt attcatccac aattttaaaa 1260
gaaaaggggg gattgggggg tacagtgcag gggaaagaat agtagacata atagcaacag 1320
acatacaaac taaagaatta caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt 1380
acagggacag cagaaatcca ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag 1440
gggcagtagt aatacaagat aatagtgaca taaaagtagt gccaagaaga aaagcaaaga 1500
tcattaggga ttatggaaaa cagatggcag gtgatgattg tgtggcaagt agacaggatg 1560
aggattagaa catggaaaag tttagtaaaa caccataagg aggagatatg agggacaatt 1620
ggagaagtga attatataaa tataaagtag taaaaattga accattagga gtagcaccca 1680
ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc agtgggaata ggagctttgt 1740
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 1800
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 1860
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 1920
gaatcctggc tgtggaaaga tacctaaagg atcaacagct cctggggatt tggggttgct 1980
ctggaaaact catttgcacc actgctgtgc cttggaatgc tagttggagt aataaatctc 2040
tggaacagat ttggaatcac acgacctgga tggagtggga cagagaaatt aacaattaca 2100
caagcttaat acactcctta attgaagaat cgcaaaacca gcaagaaaag aatgaacaag 2160
aattattgga attagataaa tgggcaagtt tgtggaattg gtttaacata acaaattggc 2220
tgtggtatat aaaattattc ataatgatag taggaggctt ggtaggttta agaatagttt 2280
ttgctgtact ttctatagtg aatagagtta ggcagggata ttcaccatta tcgtttcaga 2340
cccacctccc aaccccgagg ggaccgagct caagcttcga agcgatcgca cgcgtatcga 2400
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 2460
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 2520
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 2580
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 2640
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttacgc 2700
gtggatccga acagagagac agcagaatat gggccaaaca ggatatctgt ggtaagcagt 2760
tcctgccccg gctcagggcc aagaacagtt ggaacagcag aatatgggcc aaacaggata 2820
tctgtggtaa gcagttcctg ccccggctca gggccaagaa cagatggtcc ccagatgcgg 2880
tcccgccctc agcagtttct agagaaccat cagatgtttc cagggtgccc caaggacctg 2940
aaatgaccct gtgccttatt tgaactaacc aatcagttcg cttctcgctt ctgttcgcgc 3000
gcttctgctc cccgagctct atataagcag agctcgttta gtgaaccgtc agatcggcgc 3060
gccaattcaa gcgagaagac aagggcagcc gccaccatgt ctggcggacc tatgggaggt 3120
agacctggtg gaagaggtgc tcctgccgtg cagcagaaca tcccttctac actgctgcag 3180
gaccacgaga accagcggct gtttgagatg ctgggcagaa agtgtctgac cctggctaca 3240
gctgtggtgc agctgtatct ggcacttcct ccaggcgccg agcactggac caaagaacat 3300
tgtggcgccg tgtgcttcgt gaaggacaac cctcagaagt cctacttcat ccggctgtac 3360
ggactgcagg ctggcagact gctgtgggag caagagctgt actcccagct ggtgtacagc 3420
acccctacac ctttcttcca cacctttgcc ggcgacgatt gtcaggccgg actgaacttt 3480
gccgacgagg atgaagccca ggccttcaga gcactggtgc aagagaagat ccagaagcgg 3540
aaccagagac agagcggcga cagaaggcaa ctgcctcctc cacctacacc agccaacgag 3600
gaaagaagag gcggactgcc tccactgcct cttcatcctg gcggagatca aggtggacct 3660
cctgtgggac cactgtctct tggactggcc accgtggaca ttcagaaccc cgatatcacc 3720
agcagccggt acagaggact tcccgctcct ggaccatctc ctgccgacaa gaagagatcc 3780
gggaagaaga agatcagcaa ggccgacatc ggagccccta gcggctttaa acacgtgtcc 3840
cacgttggat gggacccaca gaacggcttc gacgtgaaca atctggaccc cgacctgcgg 3900
agcctgtttt ctagagccgg aatctctgag gcccagctga ccgatgccga gacaagcaag 3960
ctgatctacg acttcatcga ggaccaaggc ggcctggaag ccgtgcgaca agagatgaga 4020
aggcaagagc ctctgccacc acctccacct ccatctagag gcggaaacca gctgcctaga 4080
cctcctatcg ttggcggcaa caagggaaga tctggccctc tgcctcctgt gcctctggga 4140
attgctccac caccaccaac acctagaggc ccgcctccac caggcagagg tggtcctccg 4200
ccgccacctc ctccagcaac aggcagatct ggaccacttc ctcctccacc acctggtgct 4260
ggtggacctc caatgccacc gccaccgcct ccgccacctc cgcctccaag ttctggaaat 4320
ggacctgctc ctcctccttt gcctcctgct ttggttcctg ctggcggatt ggctccaggc 4380
ggaggaagag gcgcactcct ggatcagatc agacagggca tccagctgaa caagacccct 4440
ggcgctcctg agagttctgc tctgcaaccg ccaccacagt ctagcgaagg acttgtggga 4500
gccctgatgc acgtgatgca gaagagaagc agagccatcc acagcagcga cgaaggcgaa 4560
gatcaagctg gcgacgaaga tgaggacgac gagtgggacg attgataact agtaatcaac 4620
ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 4680
cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 4740
tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 4800
ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 4860
gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 4920
cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 4980
ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ttcgcctgtg 5040
ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 5100
cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 5160
gccctcagac gagtcggatc tccctttggg ccgcctcccc gcacgtacga ccggtatcga 5220
cgtgcagtat ttagcatgcc ccacccatct gcaaggcatt ctggatagtg tcaaaacagc 5280
cggaaatcaa gtccgtttat ctcaaacttt agcattttgg gaataaatga tatttgctat 5340
gctggttaaa ttagatttta gttaaatttc ctgctgaagc tctagtacga taagtaactt 5400
gacctaagtg taaagttgag atttccttca ggtttatata gcttgtgcgc cgcctgggta 5460
cctcaggata tgcccttgac tatttgtccg acatagtcaa gggcatatcc ttttttgacc 5520
ggtgcggccg catcgatgcc gtagtacctt taagaccaat gacttacaag gcagctgtag 5580
atcttagcca ctttttaaaa gaaaaggggg gactggaagg gctaattcac tcccaaagaa 5640
gacaagatcc ctgcaggcat tcaaggccag gctggatgtg gctctgggca gcctgggctg 5700
ctggttgatg accctgcaca tagcaggggg ttggatctgg atgagcactg tgctcctttg 5760
caacccaggc cgttctatga ttctgtcatt ctaaatctct ctttcagcct aaagcttttt 5820
ccccgtatcc ccccaggtgt ctgcaggctc aaagagcagc gagaagcgtt cagaggaaag 5880
cgatcccgtg ccaccttccc cgtgcccggg ctgtccccgc acgctgccgg ctcggggatg 5940
cggggggagc gccggaccgg agcggagccc cgggcggctc gctgctgccc cctagcgggg 6000
gagggacgta attacatccc tgggggcttt gggggggggc tgtccccgtg agctccccag 6060
atctgctttt tgcctgtact gggtctctct ggttagacca gatctgagcc tgggagctct 6120
ctggctaact agggaaccca ctgcttaagc ctcaataaag cttcagctgc tcgagctagc 6180
agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 6240
ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 6300
ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 6360
ttagagtttg gcaacatatg cccatatgct ggctgccatg aacaaaggtt ggctataaag 6420
aggtcatcag tatatgaaac agccccctgc tgtccattcc ttattccata gaaaagcctt 6480
gacttgaggt tagatttttt ttatattttg ttttgtgtta tttttttctt taacatccct 6540
aaaattttcc ttacatgttt tactagccag atttttcctc ctctcctgac tactcccagt 6600
catagctgtc cctcttctct tatggagatc cctcgacctg cagcccaagc ttggcgtaat 6660
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 6720
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 6780
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag cggatccgca 6840
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 6900
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 6960
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 7020
aggcttttgc aaaaagctgt cgactgcaga ggcctgcatg caagcttggc gtaatcatgg 7080
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 7140
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 7200
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 7260
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 7320
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 7380
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 7440
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 7500
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 7560
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 7620
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 7680
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 7740
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 7800
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 7860
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 7920
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 7980
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 8040
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 8100
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 8160
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 8220
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 8280
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 8340
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 8400
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 8460
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 8520
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 8580
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 8640
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 8700
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 8760
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 8820
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 8880
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 8940
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 9000
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 9060
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 9120
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 9180
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 9240
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 9300
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 9360
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 9420
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 9480
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 9540
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 9600
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 9660
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tc 9702
<210> 67
<211> 1512
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Wild Type hWAS cDNA
<400> 67
atgagtgggg gcccaatggg aggaaggccc gggggccgag gagcaccagc ggttcagcag 60
aacataccct ccaccctcct ccaggaccac gagaaccagc gactctttga gatgcttgga 120
cgaaaatgct tgacgctggc cactgcagtt gttcagctgt acctggcgct gccccctgga 180
gctgagcact ggaccaagga gcattgtggg gctgtgtgct tcgtgaagga taacccccag 240
aagtcctact tcatccgcct ttacggcctt caggctggtc ggctgctctg ggaacaggag 300
ctgtactcac agcttgtcta ctccaccccc acccccttct tccacacctt cgctggagat 360
gactgccaag cggggctgaa ctttgcagac gaggacgagg cccaggcctt ccgggccctc 420
gtgcaggaga agatacaaaa aaggaatcag aggcaaagtg gagacagacg ccagctaccc 480
ccaccaccaa caccagccaa tgaagagaga agaggagggc tcccacccct gcccctgcat 540
ccaggtggag accaaggagg ccctccagtg ggtccgctct ccctggggct ggcgacagtg 600
gacatccaga accctgacat cacgagttca cgataccgtg ggctcccagc acctggacct 660
agcccagctg ataagaaacg ctcagggaag aagaagatca gcaaagctga tattggtgca 720
cccagtggat tcaagcatgt cagccacgtg gggtgggacc cccagaatgg atttgacgtg 780
aacaacctcg acccagatct gcggagtctg ttctccaggg caggaatcag cgaggcccag 840
ctcaccgacg ccgagacctc taaacttatc tacgacttca ttgaggacca gggtgggctg 900
gaggctgtgc ggcaggagat gaggcgccag gagccacttc cgccgccccc accgccatct 960
cgaggaggga accagctccc ccggccccct attgtggggg gtaacaaggg tcgttctggt 1020
ccactgcccc ctgtaccttt ggggattgcc ccacccccac caacaccccg gggaccccca 1080
cccccaggcc gagggggccc tccaccacca ccccctccag ctactggacg ttctggacca 1140
ctgccccctc caccccctgg agctggtggg ccacccatgc caccaccacc gccaccaccg 1200
ccaccgccgc ccagctccgg gaatggacca gcccctcccc cactccctcc tgctctggtg 1260
cctgccgggg gcctggcccc tggtgggggt cggggagcgc ttttggatca aatccggcag 1320
ggaattcagc tgaacaagac ccctggggcc ccagagagct cagcgctgca gccaccacct 1380
cagagctcag agggactggt gggggccctg atgcacgtga tgcagaagag aagcagagcc 1440
atccactcct ccgacgaagg ggaggaccag gctggcgatg aagatgaaga tgatgaatgg 1500
gatgactgat aa 1512
<210> 68
<211> 1512
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Wild Type hWAS with silent mutations
<400> 68
atgagtgggg gcccaatggg aggaaggccc gggggccgag gagcaccagc ggttcagcag 60
aacataccct ccaccctcct ccaggaccac gagaaccagc gactctttga gatgcttgga 120
cgaaaatgct tgacgctggc cactgcagtt gttcagctgt acctggcgct gccccctgga 180
gctgagcact ggaccaagga gcattgtggg gctgtgtgct tcgtgaagga taacccccag 240
aagtcctact tcatccgcct ttacggcctt caggctggtc ggctgctctg ggaacaggag 300
ctgtactcac agcttgtcta ctccaccccc acccccttct tccacacctt cgctggagat 360
gactgccaag cggggctgaa ctttgcagac gaggacgagg cccaggcctt ccgggccctc 420
gtgcaggaga agatacaaaa aaggaatcag aggcaaagtg gagacagacg ccagctaccc 480
ccaccaccaa caccagccaa tgaagagaga agaggagggc tcccacccct gcccctgcat 540
ccaggtggag accaaggagg ccctccagtg ggtccgctct ccctggggct ggcgacagtg 600
gacatccaga accctgacat cacgagttca cgataccgtg ggctcccagc acctggacct 660
agcccagctg ataagaaacg ctcagggaag aagaagatca gcaaagctga tattggtgca 720
cccagtggat tcaagcatgt cagccacgtg gggtgggacc cccagaatgg atttgacgtg 780
aacaacctcg acccagatct gcggagtctg ttctccaggg caggaatcag cgaggcccag 840
ctcaccgacg ccgagacctc taaacttatc tacgacttca ttgaggacca gggtgggctg 900
gaggctgtgc ggcaggagat gaggcgccag gagccacttc cgccgccccc accgccatct 960
cgaggaggga accagctccc ccggccccct attgtggggg gtaacaaggg tcgttctggt 1020
ccactgcccc ctgtaccttt ggggattgcc ccacccccac caacaccccg gggaccccca 1080
cccccaggcc gagggggccc tccaccacca ccccctccag ctactggacg ttctggacca 1140
ctgccccctc caccccctgg agctggtggg ccacccatgc caccaccacc gccaccaccg 1200
ccaccgccgc ccagctccgg gaatggacca gcccctcccc cactccctcc tgctctggtg 1260
cctgccgggg gcctggcccc tggtgggggt cggggagcgc ttttggatca aatccggcag 1320
ggaattcagc tgaacaagac ccctggggcc ccagagagct cagcgctgca gccaccacct 1380
cagagctcag agggactggt gggggccctg atgcacgtga tgcagaagag aagcagagcc 1440
atccactcct ccgacgaagg ggaggaccag gctggcgatg aagatgaaga tgatgaatgg 1500
gatgactgat aa 1512
<210> 69
<211> 1512
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: Codon-optimized hWAS cDNA
<400> 69
atgtctggcg gacctatggg aggtagacct ggtggaagag gtgctcctgc cgtgcagcag 60
aacatccctt ctacactgct gcaggaccac gagaaccagc ggctgtttga gatgctgggc 120
agaaagtgtc tgaccctggc tacagctgtg gtgcagctgt atctggcact tcctccaggc 180
gccgagcact ggaccaaaga acattgtggc gccgtgtgct tcgtgaagga caaccctcag 240
aagtcctact tcatccggct gtacggactg caggctggca gactgctgtg ggagcaagag 300
ctgtactccc agctggtgta cagcacccct acacctttct tccacacctt tgccggcgac 360
gattgtcagg ccggactgaa ctttgccgac gaggatgaag cccaggcctt cagagcactg 420
gtgcaagaga agatccagaa gcggaaccag agacagagcg gcgacagaag gcaactgcct 480
cctccaccta caccagccaa cgaggaaaga agaggcggac tgcctccact gcctcttcat 540
cctggcggag atcaaggtgg acctcctgtg ggaccactgt ctcttggact ggccaccgtg 600
gacattcaga accccgatat caccagcagc cggtacagag gacttcccgc tcctggacca 660
tctcctgccg acaagaagag atccgggaag aagaagatca gcaaggccga catcggagcc 720
cctagcggct ttaaacacgt gtcccacgtt ggatgggacc cacagaacgg cttcgacgtg 780
aacaatctgg accccgacct gcggagcctg ttttctagag ccggaatctc tgaggcccag 840
ctgaccgatg ccgagacaag caagctgatc tacgacttca tcgaggacca aggcggcctg 900
gaagccgtgc gacaagagat gagaaggcaa gagcctctgc caccacctcc acctccatct 960
agaggcggaa accagctgcc tagacctcct atcgttggcg gcaacaaggg aagatctggc 1020
cctctgcctc ctgtgcctct gggaattgct ccaccaccac caacacctag aggcccgcct 1080
ccaccaggca gaggtggtcc tccgccgcca cctcctccag caacaggcag atctggacca 1140
cttcctcctc caccacctgg tgctggtgga cctccaatgc caccgccacc gcctccgcca 1200
cctccgcctc caagttctgg aaatggacct gctcctcctc ctttgcctcc tgctttggtt 1260
cctgctggcg gattggctcc aggcggagga agaggcgcac tcctggatca gatcagacag 1320
ggcatccagc tgaacaagac ccctggcgct cctgagagtt ctgctctgca accgccacca 1380
cagtctagcg aaggacttgt gggagccctg atgcacgtga tgcagaagag aagcagagcc 1440
atccacagca gcgacgaagg cgaagatcaa gctggcgacg aagatgagga cgacgagtgg 1500
gacgattgat aa 1512
Claims (148)
1.一种表达载体,其包含
可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及
可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白。
2.权利要求1的表达载体,其中所述shRNA包含SEQ ID NO:32的发夹环序列。
3.权利要求1的表达载体,其中所述shRNA包含SEQ ID NO:26的核酸序列。
4.权利要求1的表达载体,其中所述shRNA与选自SEQ ID NO:23、SEQ ID NO:24和SEQID NO:25的核酸序列具有至少95%序列相同性。
5.权利要求1的表达载体,其中所述shRNA与选自SEQ ID NO:34和SEQ ID NO:35的核酸序列具有至少95%序列相同性。
6.权利要求1的表达载体,其中所述shRNA与选自SEQ ID NO:21和SEQ ID NO:22的核酸序列具有至少95%序列相同性。
7.权利要求1的表达载体,其中所述shRNA与SEQ ID NO:36的核酸序列具有至少95%序列相同性。
8.前述权利要求中任一项的表达载体,其中所述第一表达控制序列包含Pol III启动子或Pol II启动子。
9.权利要求8的表达载体,其中所述Pol III启动子包含7sk。
10.权利要求9的表达载体,其中所述7sk启动子具有与SEQ ID NO:28的核酸序列具有至少95%序列相同性的核酸序列。
11.权利要求9的表达载体,其中所述7sk启动子具有SEQ ID NO:28的核酸序列。
12.权利要求9的表达载体,其中所述7sk启动子具有SEQ ID NO:29的核酸序列。
13.前述权利要求中任一项的表达载体,其中所述第二核酸编码野生型Wiskott-Aldrich综合征蛋白。
14.前述权利要求中任一项的表达载体,其中所述第二核酸编码密码子优化的Wiskott-Aldrich综合征蛋白。
15.权利要求1-12中任一项的表达载体,其中编码Wiskott-Aldrich综合征蛋白的第二核酸具有与SEQ ID NO:1、2、3和4中任一个具有至少95%相同性的序列。
16.权利要求1-12中任一项的表达载体,其中编码Wiskott-Aldrich综合征蛋白的第二核酸具有与SEQ ID NO:1、2、3和4中任一个具有至少97%相同性的序列。
17.权利要求1-12中任一项的表达载体,其中编码Wiskott-Aldrich综合征蛋白的第二核酸具有与SEQ ID NO:1、2、3和4中任一个具有至少99%相同性的序列。
18.权利要求1-12中任一项的表达载体,其中编码Wiskott-Aldrich综合征蛋白的第二核酸具有包含SEQ ID NO:1、2、3和4中任一个的序列。
19.前述权利要求中任一项的表达载体,其中所述第二表达控制序列包含MND启动子。
20.权利要求19的表达载体,其中所述MND启动子具有与SEQ ID NO:7、8、9、10、11和12中任一个具有至少95%相同性的核酸序列。
21.前述权利要求中任一项的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的下游。
22.权利要求21的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列与可操作地连接至第二核酸序列的第二表达控制序列朝向相同方向。
23.权利要求21的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列朝向第一方向,其中可操作地连接至第二核酸序列的第二表达控制序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。
24.权利要求1-20中任一项的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的上游。
25.权利要求24的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列与可操作地连接至第二核酸序列的第二表达控制序列朝向相同方向。
26.权利要求24的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列朝向第一方向,其中可操作地连接至第二核酸序列的第二表达控制序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。
27.权利要求1-20中任一项的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列朝向第一方向,其中可操作地连接至第二核酸序列的第二表达控制序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。
28.权利要求27的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的下游。
29.权利要求27的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的上游。
30.权利要求1-20中任一项的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列与可操作地连接至第二核酸序列的第二表达控制序列朝向相同方向。
31.权利要求30的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的下游。
32.权利要求30的表达载体,其中可操作地连接至第一核酸序列的第一表达控制序列位于可操作地连接至第二核酸序列的第二表达控制序列的上游。
33.权利要求1-12中任一项的表达载体,其中所述第二核酸序列编码肽,所述肽包含与SEQS ID NO:5和6中任一个具有至少95%相同性的氨基酸序列;并且所述第一核酸序列编码核酸分子,所述核酸分子与SEQ ID NO:16或其互补序列具有至少95%相同性。
34.前述权利要求中任一项的表达载体,其中所述表达载体进一步包含选自以下的绝缘子:650cHS4绝缘子、400cHS4绝缘子和泡沫病毒绝缘子。
35.前述权利要求中任一项的表达载体,其中所述表达载体进一步包含绝缘子,所述绝缘子具有选自SEQ ID NO:38、SEQ ID NO:39和SEQ ID NO:40的核酸序列。
36.前述权利要求中任一项的表达载体,其中所述表达载体是慢病毒表达载体。
37.权利要求36的表达载体,其中所述慢病毒表达载体是整合缺陷型慢病毒载体。
38.一种表达盒,其包含与SEQ ID NO:15的核酸序列具有至少90%相同性的核酸序列。
39.权利要求38的表达盒,其中所述核酸序列与SEQ ID NO:15的核酸序列具有至少95%相同性。
40.一种慢病毒表达载体,其包含权利要求38-39中任一项的表达盒,并且进一步包含选自以下的绝缘子:650cHS4绝缘子、400cHS4绝缘子和泡沫病毒绝缘子。
41.权利要求40的慢病毒表达载体,其中所述绝缘子具有选自SEQ ID NO:38、SEQ IDNO:39和SEQ ID NO:40的核酸序列。
42.一种宿主细胞,其用权利要求1-37中任一项的表达载体或者权利要求40-41中任一项的慢病毒表达载体转导。
43.权利要求42的宿主细胞,其中所述宿主细胞是基本上HPRT缺陷的。
44.权利要求42-43中任一项的宿主细胞,其中所述宿主细胞表达Wiskott-Aldrich综合征蛋白。
45.权利要求42-44中任一项的宿主细胞,其中所述宿主细胞用药学上可接受的载剂配制。
46.权利要求42-45中任一项的宿主细胞,其中所述宿主细胞是造血干细胞。
47.一种宿主细胞,其是基本上HPRT缺陷的,并且表达包含SEQ ID NO:5和6中任一个的氨基酸序列的肽。
48.权利要求47的宿主细胞,其中所述宿主细胞是造血干细胞。
49.一种宿主细胞,其是基本上HPRT缺陷的,并且表达与SEQ ID NO:5和6中任一个的氨基酸序列具有至少95%相同性的肽,其中所述宿主细胞通过用表达载体转导HSC来制备,
所述表达载体包含
可操作地连接至第一核酸序列的第一表达控制序列,所述第一核酸序列编码用于敲低HPRT的shRNA;以及
可操作地连接至第二核酸序列的第二表达控制序列,所述第二核酸序列编码Wiskott-Aldrich综合征蛋白。
50.权利要求49的宿主细胞,其中所述第二核酸编码野生型Wiskott-Aldrich综合征蛋白。
51.权利要求49的宿主细胞,其中所述第二核酸编码密码子优化的Wiskott-Aldrich综合征蛋白。
52.权利要求49-51中任一项的宿主细胞,其中所述第二表达控制序列是MND启动子。
53.权利要求49-52中任一项的宿主细胞,其中所述表达载体进一步包含绝缘子,所述绝缘子具有包含SEQ ID NO:38、39和40中任一个的核酸序列。
54.权利要求49-53中任一项的宿主细胞,其中所述宿主细胞是造血干细胞。
55.一种药物组合物,其包含权利要求1-37中任一项的表达载体或者权利要求40-41中任一项的慢病毒表达载体,以及药学上可接受的载剂。
56.一种药物组合物,其包含权利要求42-54中任一项的宿主细胞。
57.一种选择转导的细胞的方法,其包括:用权利要求1-37中任一项的表达载体或者权利要求40-41中任一项的慢病毒表达载体转导细胞群;以及通过用嘌呤类似物选择转导的细胞来富集转导的细胞群。
58.权利要求57的方法,其中所述嘌呤类似物选自6TG和6-巯嘌呤。
59.权利要求57-58中任一项的方法,其中所述转导的细胞是HSC。
60.权利要求57的方法,其中所述HSC是同种异体HSC。
61.权利要求57的方法,其中所述HSC是自体HSC。
62.权利要求57的方法,其中所述HSC是同胞匹配的HSC。
63.一种减轻与Wiskott-Aldrich综合征相关的病理的方法,其包括向需要治疗的患者给药治疗有效量的权利要求42-54中任一项的宿主细胞。
64.权利要求63的方法,其中所述与Wiskott-Aldrich综合征相关的病理选自微血小板减少症、湿疹、自身免疫性疾病和复发性感染。
65.权利要求63的方法,其中所述复发性感染包括复发性皮肤感染。
66.权利要求65的方法,其中所述复发性感染选自中耳炎、皮肤脓肿、肺炎、小肠结肠炎、脑膜炎、脓毒和泌尿道感染。
67.权利要求64的方法,其中所述湿疹是难治性湿疹。
69.一种多核苷酸,其包含与SEQ ID NO:14的核酸序列具有至少95%序列相同性的第一核酸序列,以及与SEQ ID NO:15的核酸序列具有至少95%序列相同性的第二核酸序列。
70.权利要求69的多核苷酸,其进一步包含具有SEQ ID NO:13的核酸序列。
71.权利要求69的多核苷酸,其进一步包含具有SEQ ID NO:41的核酸序列。
72.权利要求69的多核苷酸,其进一步包含具有SEQ ID NO:31的核酸序列。
73.权利要求69的多核苷酸,其进一步包含选自SEQ ID NO:38、SEQ ID NO:39和SEQ IDNO:40的核酸序列。
74.权利要求69-73中任一项的多核苷酸,其中所述第一核酸序列位于所述第二核酸序列的上游。
75.权利要求74的多核苷酸,其中所述第一核酸序列包含与所述第二核酸序列相同的方向。
76.权利要求75的多核苷酸,其中所述相同的方向是正向的方向。
77.权利要求75的多核苷酸,其中所述第一核酸序列包含与所述第二核酸序列不同的方向。
78.权利要求77的多核苷酸,其中所述不同的方向是相反的方向。
79.权利要求69-73中任一项的多核苷酸,其中所述第一核酸序列位于所述第二核酸序列的下游。
80.权利要求79的多核苷酸,其中所述第一核酸序列包含与所述第二核酸序列相同的方向。
81.权利要求80的多核苷酸,其中所述相同的方向是正向的方向。
82.权利要求79的多核苷酸,其中所述第一核酸序列包含与所述第二核酸序列不同的方向。
83.权利要求82的多核苷酸,其中所述不同的方向是相反的方向。
84.权利要求69-73中任一项的多核苷酸,其中所述第一核酸序列朝向第一方向,其中所述第二核酸序列朝向第二方向,并且其中所述第一方向和所述第二方向相反。
85.权利要求84的多核苷酸,其中所述第一核酸序列位于所述第二核酸序列的下游。
86.权利要求84的多核苷酸,其中所述第一核酸序列位于所述第二核酸序列的上游。
87.权利要求69-73中任一项的多核苷酸,其中所述第一核酸序列朝向与所述第二核酸序列相同的方向。
88.权利要求87的多核苷酸,其中所述第一核酸序列位于所述第二核酸序列的下游。
89.权利要求87的多核苷酸,其中所述第一核酸序列位于所述第二核酸序列的上游。
90.一种多核苷酸,其包含与SEQ ID NO:42-57中任一个具有至少90%相同性的核酸序列。
91.权利要求90的多核苷酸,其中所述核酸序列与SEQ ID NO:42-57中任一个具有至少95%相同性。
92.权利要求90的多核苷酸,其中所述核酸序列与SEQ ID NO:42-57中任一个具有至少97%相同性。
93.权利要求90的多核苷酸,其中所述核酸序列与SEQ ID NO:42-57中任一个具有至少98%相同性。
94.权利要求90的多核苷酸,其中所述核酸序列与SEQ ID NO:42-57中任一个具有至少99%相同性。
95.一种多核苷酸,其具有SEQ ID NO:42-57中的任一个。
96.一种表达载体,其包含(a)编码pTL20c的核酸序列;(b)编码WASP表达盒的核酸;以及(c)编码7sk/sh734表达盒的核酸。
97.权利要求96的表达载体,其进一步包含编码绝缘子的核酸序列。
98.权利要求96的表达载体,其中所述WASP表达盒位于所述7sk/sh734表达盒的上游。
99.权利要求98的表达载体,其中所述表达载体具有与SEQ ID NO:44、45、48和49中任一个具有至少90%相同性的核酸序列。
100.权利要求98的表达载体,其中所述表达载体具有与SEQ ID NO:44、45、48和49中任一个具有至少95%相同性的核酸序列。
101.权利要求98的表达载体,其中所述表达载体具有与SEQ ID NO:51、53、55和57中任一个具有至少90%相同性的核酸序列。
102.权利要求98的表达载体,其中所述表达载体具有与SEQ ID NO:51、53、55和57中任一个具有至少95%相同性的核酸序列。
103.权利要求96的表达载体,其中所述WASP表达盒位于所述7sk/sh734表达盒的上游,并且其中所述7sk/sh734表达盒包含相对于所述WASP表达盒相反的方向。
104.权利要求103的表达载体,其中所述表达载体具有与SEQ ID NO:45、49、53、57中任一个具有至少90%相同性的核酸序列。
105.权利要求103的表达载体,其中所述表达载体具有与SEQ ID NO:45、49、53、57中任一个具有至少95%相同性的核酸序列。
106.权利要求96的表达载体,其中所述WASP表达盒位于所述7sk/sh734表达盒的上游,并且其中所述7sk/sh734表达盒与所述WASP表达盒朝向相同的方向。
107.权利要求106的表达载体,其中所述表达载体具有与SEQ ID NO:44、48、51、55中任一个具有至少90%相同性的核酸序列。
108.权利要求106的表达载体,其中所述表达载体具有与SEQ ID NO:44、48、51、55中任一个具有至少95%相同性的核酸序列。
109.权利要求96的表达载体,其中所述WASP表达盒位于所述7sk/sh734表达盒的下游。
110.权利要求109的表达载体,其中所述表达载体具有与SEQ ID NO:42、43、46和47中任一个具有至少90%相同性的核酸序列。
111.权利要求109的表达载体,其中所述表达载体具有与SEQ ID NO:42、43、46和47中任一个具有至少95%相同性的核酸序列。
112.权利要求109的表达载体,其中所述表达载体具有与SEQ ID NO:50、52、54和56中任一个具有至少90%相同性的核酸序列。
113.权利要求109的表达载体,其中所述表达载体具有与SEQ ID NO:50、52、54和56中任一个具有至少95%相同性的核酸序列。
114.权利要求96的表达载体,其中所述WASP表达盒位于所述7sk/sh734表达盒的下游,并且其中所述7sk/sh734表达盒包含相对于所述WASP表达盒相反的方向。
115.权利要求114的表达载体,其中所述表达载体具有与SEQ ID NO:43、47、52和56中任一个具有至少90%相同性的核酸序列。
116.权利要求114的表达载体,其中所述表达载体具有与SEQ ID NO:43、47、52和56中任一个具有至少95%相同性的核酸序列。
117.权利要求96的表达载体,其中所述WASP表达盒位于所述7sk/sh734表达盒的下游,并且其中所述7sk/sh734表达盒和所述WASP表达盒朝向相同方向。
118.权利要求117的表达载体,其中所述表达载体具有与SEQ ID NO:42、46、50和54中任一个具有至少90%相同性的核酸序列。
119.权利要求117的表达载体,其中所述表达载体具有与SEQ ID NO:42、46、50和54中任一个具有至少95%相同性的核酸序列。
120.权利要求96-119中任一项的表达载体在制备用于治疗Wiskott-Aldrich综合征的药物组合物中的用途,所述药物组合物包含宿主细胞以及药学上可接受的载剂或赋形剂。
121.一种多核苷酸,其包含与SEQ ID NO:58具有至少90%相同性的核酸序列。
122.权利要求121的多核苷酸,其中所述核酸序列与SEQ ID NO:58具有至少95%相同性。
123.权利要求121的多核苷酸,其中所述核酸序列与SEQ ID NO:58具有至少96%相同性。
124.权利要求121的多核苷酸,其中所述核酸序列与SEQ ID NO:58具有至少97%相同性。
125.权利要求121的多核苷酸,其中所述核酸序列与SEQ ID NO:58具有至少98%相同性。
126.权利要求121的多核苷酸,其中所述核酸序列与SEQ ID NO:58具有至少99%相同性。
127.一种多核苷酸,其具有SEQ ID NO:58。
128.一种多核苷酸,其包含与SEQ ID NO:59具有至少90%相同性的核酸序列。
129.权利要求128的多核苷酸,其中所述核酸序列与SEQ ID NO:59具有至少95%相同性。
130.权利要求128的多核苷酸,其中所述核酸序列与SEQ ID NO:59具有至少96%相同性。
131.权利要求128的多核苷酸,其中所述核酸序列与SEQ ID NO:59具有至少97%相同性。
132.权利要求128的多核苷酸,其中所述核酸序列与SEQ ID NO:59具有至少98%相同性。
133.权利要求128的多核苷酸,其中所述核酸序列与SEQ ID NO:59具有至少99%相同性。
134.一种多核苷酸,其具有SEQ ID NO:59。
135.一种多核苷酸,其包含与SEQ ID NO:63和65中任一个具有至少90%相同性的核酸序列。
136.权利要求135的多核苷酸,其中所述核酸序列与SEQ ID NO:63和65中任一个具有至少95%相同性。
137.权利要求135的多核苷酸,其中所述核酸序列与SEQ ID NO:63和65中任一个具有至少96%相同性。
138.权利要求135的多核苷酸,其中所述核酸序列与SEQ ID NO:63和65中任一个具有至少97%相同性。
139.权利要求135的多核苷酸,其中所述核酸序列与SEQ ID NO:63和65中任一个具有至少98%相同性。
140.权利要求135的多核苷酸,其中所述核酸序列与SEQ ID NO:63和65中任一个具有至少99%相同性。
141.一种多核苷酸,其具有SEQ ID NO:63和65中的任一个。
142.一种多核苷酸,其包含与SEQ ID NO:64和66中任一个具有至少90%相同性的核酸序列。
143.权利要求142的多核苷酸,其中所述核酸序列与SEQ ID NO:64和66中任一个具有至少95%相同性。
144.权利要求142的多核苷酸,其中所述核酸序列与SEQ ID NO:64和66中任一个具有至少96%相同性。
145.权利要求142的多核苷酸,其中所述核酸序列与SEQ ID NO:64和66中任一个具有至少97%相同性。
146.权利要求142的多核苷酸,其中所述核酸序列与SEQ ID NO:64和66中任一个具有至少98%相同性。
147.权利要求142的多核苷酸,其中所述核酸序列与SEQ ID NO:64和66中任一个具有至少99%相同性。
148.一种多核苷酸,其具有SEQ ID NO:64和66中的任一个。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862784508P | 2018-12-23 | 2018-12-23 | |
US62/784,508 | 2018-12-23 | ||
PCT/US2019/068233 WO2020139796A1 (en) | 2018-12-23 | 2019-12-23 | Haematopoietic stem cell-gene therapy for wiskott-aldrich syndrome |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113518825A true CN113518825A (zh) | 2021-10-19 |
Family
ID=69326699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980092125.2A Pending CN113518825A (zh) | 2018-12-23 | 2019-12-23 | Wiskott-aldrich综合征的造血干细胞基因疗法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20210316013A1 (zh) |
EP (1) | EP3897745A1 (zh) |
JP (1) | JP2022514955A (zh) |
KR (1) | KR20210118402A (zh) |
CN (1) | CN113518825A (zh) |
AU (1) | AU2019417697A1 (zh) |
BR (1) | BR112021012240A2 (zh) |
WO (1) | WO2020139796A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111093715A (zh) * | 2017-09-18 | 2020-05-01 | 儿童医院医疗中心 | 强绝缘子和其在基因递送中的用途 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4329822A1 (en) | 2021-04-26 | 2024-03-06 | CSL Behring L.L.C. | Lentiviral vectors useful for the treatment of disease |
CN114990163A (zh) * | 2022-03-31 | 2022-09-02 | 中海峡(福建)细胞生物科技有限公司 | 用于干细胞基因修饰的慢病毒载体及其构建方法和应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080254008A1 (en) * | 2005-02-16 | 2008-10-16 | Boro Dropulic | Lentiviral Vectors and Their Use |
CN104805120A (zh) * | 2014-01-27 | 2015-07-29 | 苟德明 | 一种shRNA-Ago2共表达慢病毒RNAi载体、重组质粒及其构建方法 |
CN105793425A (zh) * | 2013-06-17 | 2016-07-20 | 布罗德研究所有限公司 | 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用 |
CN106061510A (zh) * | 2013-12-12 | 2016-10-26 | 布罗德研究所有限公司 | 用于基因组编辑的crispr‑cas系统和组合物的递送、用途和治疗应用 |
WO2017143266A1 (en) * | 2016-02-19 | 2017-08-24 | The Regents Of The University Of California | Short hairpin rna (shrna734) and use of same to positively select and eliminate genetically modified cells |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU5015896A (en) | 1995-03-27 | 1996-10-16 | Chugai Seiyaku Kabushiki Kaisha | Drug containing methotrexate derivative |
US6013516A (en) | 1995-10-06 | 2000-01-11 | The Salk Institute For Biological Studies | Vector and method of use for nucleic acid delivery to non-dividing cells |
EP1191097A1 (en) | 2000-09-21 | 2002-03-27 | Leids Universitair Medisch Centrum | Induction of exon skipping in eukaryotic cells |
US9023617B2 (en) | 2004-02-17 | 2015-05-05 | University Of Florida Research Foundation, Inc. | Insulated herpesvirus-derived gene expression cassettes for sustained and regulatable gene expression |
EP3808845A1 (en) | 2004-06-28 | 2021-04-21 | The University Of Western Australia | Antisense oligonucleotides for inducing exon skipping and methods of use thereof |
WO2007098089A2 (en) | 2006-02-17 | 2007-08-30 | Novacea, Inc. | Treatment of hyperproliferative diseases with methotrexate n-oxide and analogs |
AU2007261806B2 (en) | 2006-06-21 | 2013-08-15 | Uniqure Ip B.V. | Vectors with modified initiation codon for the translation of AAV-Rep78 useful for production of AAV in insect cells |
US8871918B2 (en) | 2008-10-24 | 2014-10-28 | Sarepta Therapeutics, Inc. | Multiple exon skipping compositions for DMD |
KR102581868B1 (ko) | 2009-11-12 | 2023-10-04 | 더 유니버시티 오브 웨스턴 오스트레일리아 | 안티센스 분자 및 이를 이용한 질환 치료방법 |
US20110294114A1 (en) | 2009-12-04 | 2011-12-01 | Cincinnati Children's Hospital Medical Center | Optimization of determinants for successful genetic correction of diseases, mediated by hematopoietic stem cells |
AU2012245269B2 (en) * | 2011-04-20 | 2016-09-29 | The Regents Of The University Of California | Method for combined conditioning and chemoselection in a single cycle |
US20130085139A1 (en) | 2011-10-04 | 2013-04-04 | Royal Holloway And Bedford New College | Oligomers |
ES2686727T3 (es) | 2012-09-06 | 2018-10-19 | The University Of Chicago | Polinucleótidos antisentido para inducir la omisión de exón y procedimientos de tratamiento de distrofias |
JP2016516066A (ja) | 2013-03-15 | 2016-06-02 | サレプタ セラピューティクス, インコーポレイテッド | 筋ジストロフィを処置するための改善された組成物 |
US20140363454A1 (en) | 2013-06-06 | 2014-12-11 | Igenica Biotherapeutics, Inc. | Antibody-Drug Conjugates, Compositions and Methods of Use |
US10774343B2 (en) | 2014-04-25 | 2020-09-15 | Bluebird Bio, Inc. | MND promoter chimeric antigen receptors |
CA2985828C (en) | 2015-05-13 | 2020-07-14 | Calimmune, Inc. | Bio-production of lentiviral vectors |
CN108026543A (zh) | 2015-05-18 | 2018-05-11 | 卡琳缪恩股份有限公司 | 用于hiv的治疗的基因疗法及其用途 |
BR112018076263A2 (pt) | 2016-06-17 | 2019-03-26 | Magenta Therapeutics, Inc. | composições e métodos para a depleção de células |
MX2018015684A (es) | 2016-06-17 | 2019-08-29 | Magenta Therapeutics Inc | Composiciones y metodos para el agotamiento de celulas cd117. |
CN111164211B (zh) * | 2017-07-18 | 2024-08-02 | 杰特贝林基因治疗股份有限公司 | 用于治疗β-血红蛋白病的组合物和方法 |
CN112639109A (zh) * | 2018-08-24 | 2021-04-09 | Csl贝林基因治疗股份有限公司 | 无血清培养基中的载体生产 |
-
2019
- 2019-12-23 AU AU2019417697A patent/AU2019417697A1/en active Pending
- 2019-12-23 BR BR112021012240A patent/BR112021012240A2/pt unknown
- 2019-12-23 CN CN201980092125.2A patent/CN113518825A/zh active Pending
- 2019-12-23 JP JP2021536371A patent/JP2022514955A/ja active Pending
- 2019-12-23 KR KR1020217023216A patent/KR20210118402A/ko unknown
- 2019-12-23 EP EP19842992.0A patent/EP3897745A1/en active Pending
- 2019-12-23 WO PCT/US2019/068233 patent/WO2020139796A1/en unknown
-
2021
- 2021-06-21 US US17/353,586 patent/US20210316013A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080254008A1 (en) * | 2005-02-16 | 2008-10-16 | Boro Dropulic | Lentiviral Vectors and Their Use |
CN105793425A (zh) * | 2013-06-17 | 2016-07-20 | 布罗德研究所有限公司 | 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用 |
CN106061510A (zh) * | 2013-12-12 | 2016-10-26 | 布罗德研究所有限公司 | 用于基因组编辑的crispr‑cas系统和组合物的递送、用途和治疗应用 |
CN104805120A (zh) * | 2014-01-27 | 2015-07-29 | 苟德明 | 一种shRNA-Ago2共表达慢病毒RNAi载体、重组质粒及其构建方法 |
WO2017143266A1 (en) * | 2016-02-19 | 2017-08-24 | The Regents Of The University Of California | Short hairpin rna (shrna734) and use of same to positively select and eliminate genetically modified cells |
CN108495640A (zh) * | 2016-02-19 | 2018-09-04 | 加利福尼亚大学董事会 | 短发夹rna(shrna734)及其用于阳性选择和消除遗传修饰的细胞的用途 |
Non-Patent Citations (3)
Title |
---|
CHRISTOPHER C. PORTER ET AL.: "Interfering RNA-mediated purine analog resistance for in vitro and in vivo cell selection", 《BLOOD》, vol. 112, no. 12, pages 4467 - 4468 * |
MATTHEW M WIELGOSZ ET AL.: "Generation of a lentiviral vector producer cell clone for human Wiskott-Aldrich syndrome gene therapy", 《MOLECULAR THERAPY-METHODS & CLINICAL DEVELOPMENT》, vol. 2, pages 8 - 9 * |
RASHMI CHOUDHARY ET AL.: "Knockdown of HPRT for Selection of Genetically Modified Human Hematopoietic Progenitor Cells", 《PLOS ONE》, vol. 8, no. 3, pages 2 - 3 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111093715A (zh) * | 2017-09-18 | 2020-05-01 | 儿童医院医疗中心 | 强绝缘子和其在基因递送中的用途 |
Also Published As
Publication number | Publication date |
---|---|
WO2020139796A1 (en) | 2020-07-02 |
KR20210118402A (ko) | 2021-09-30 |
JP2022514955A (ja) | 2022-02-16 |
BR112021012240A2 (pt) | 2022-01-18 |
US20210316013A1 (en) | 2021-10-14 |
EP3897745A1 (en) | 2021-10-27 |
AU2019417697A1 (en) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102370675B1 (ko) | 표적 핵산의 변형을 위한 개선된 방법 | |
AU2016203445B2 (en) | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion | |
KR102319845B1 (ko) | 조류 숙주 세포에 대한 crispr-cas 시스템 | |
US10704061B2 (en) | Lentiviral vectors | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
CN109563505A (zh) | 用于真核细胞的组装系统 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
KR20130032897A (ko) | 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거 | |
CN112204147A (zh) | 基于Cpf1的植物转录调控系统 | |
CN113518825A (zh) | Wiskott-aldrich综合征的造血干细胞基因疗法 | |
CN109475619A (zh) | 神经元蜡样脂褐质沉积症的基因治疗 | |
KR20220034212A (ko) | 재조합으로 변형된 아데노 연관 바이러스 헬퍼 벡터 및 재조합으로 변형된 아데노 연관 바이러스의 패키징 효율을 개선하기 위한 그의 용도 | |
KR20220002910A (ko) | 효율적인 rna 트랜스-스플라이싱을 위한 삼중 나선 종결인자 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
KR20220078607A (ko) | 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들 | |
CN101883843A (zh) | 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量 | |
CN113302303A (zh) | 经修饰的丝状真菌宿主细胞 | |
KR20240095087A (ko) | 질병의 치료에 유용한 렌티바이러스 벡터 | |
TW202228728A (zh) | 用於同時調節基因表現之組合物及方法 | |
CN113543848A (zh) | 具有杀伤开关的供体t细胞 | |
US20240165154A1 (en) | Methods and agents for modulating adoptive immunotherapy | |
CN114645066B (zh) | 一种用于艾滋病基因治疗的核酸构建体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |