CN1309710A - 用于产生和传递蛋白的IFN-α2基因编码区上游的基因组序列 - Google Patents
用于产生和传递蛋白的IFN-α2基因编码区上游的基因组序列 Download PDFInfo
- Publication number
- CN1309710A CN1309710A CN99808195A CN99808195A CN1309710A CN 1309710 A CN1309710 A CN 1309710A CN 99808195 A CN99808195 A CN 99808195A CN 99808195 A CN99808195 A CN 99808195A CN 1309710 A CN1309710 A CN 1309710A
- Authority
- CN
- China
- Prior art keywords
- cell
- ifna2
- nucleic acid
- construction
- isolating nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011144 upstream manufacturing Methods 0.000 title claims abstract description 33
- 108091026890 Coding region Proteins 0.000 title abstract description 24
- 108010078049 Interferon alpha-2 Proteins 0.000 title description 2
- 230000014616 translation Effects 0.000 title 1
- 108020004414 DNA Proteins 0.000 claims abstract description 120
- 238000002744 homologous recombination Methods 0.000 claims abstract description 74
- 230000006801 homologous recombination Effects 0.000 claims abstract description 74
- 230000008685 targeting Effects 0.000 claims abstract description 67
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 38
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 38
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 38
- 101150043201 IFNA2 gene Proteins 0.000 claims abstract description 37
- 210000004027 cell Anatomy 0.000 claims description 198
- 238000010276 construction Methods 0.000 claims description 121
- 101000959794 Homo sapiens Interferon alpha-2 Proteins 0.000 claims description 95
- 102100040018 Interferon alpha-2 Human genes 0.000 claims description 93
- 239000002773 nucleotide Substances 0.000 claims description 73
- 125000003729 nucleotide group Chemical group 0.000 claims description 73
- 238000012163 sequencing technique Methods 0.000 claims description 66
- 108090000623 proteins and genes Proteins 0.000 claims description 61
- 239000003550 marker Substances 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 34
- 230000008859 change Effects 0.000 claims description 27
- 230000000295 complement effect Effects 0.000 claims description 26
- 230000001105 regulatory effect Effects 0.000 claims description 26
- 230000014509 gene expression Effects 0.000 claims description 24
- 241001465754 Metazoa Species 0.000 claims description 17
- 108091081024 Start codon Proteins 0.000 claims description 17
- 239000012634 fragment Substances 0.000 claims description 17
- 210000004962 mammalian cell Anatomy 0.000 claims description 12
- 230000002103 transcriptional effect Effects 0.000 claims description 8
- 230000028327 secretion Effects 0.000 claims description 6
- 238000003153 stable transfection Methods 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 5
- 101100508407 Caenorhabditis elegans mua-6 gene Proteins 0.000 claims 1
- 102000053602 DNA Human genes 0.000 abstract description 2
- 241000282414 Homo sapiens Species 0.000 description 28
- 241000700605 Viruses Species 0.000 description 18
- 238000001890 transfection Methods 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 17
- 208000015181 infectious disease Diseases 0.000 description 15
- 238000001415 gene therapy Methods 0.000 description 12
- 238000004321 preservation Methods 0.000 description 11
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- 239000000463 material Substances 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 230000004888 barrier function Effects 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 239000002609 medium Substances 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 102000008186 Collagen Human genes 0.000 description 5
- 108010035532 Collagen Proteins 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 230000014621 translational initiation Effects 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 229920001436 collagen Polymers 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000035479 physiological effects, processes and functions Effects 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 101100396576 Gallus gallus IFNB gene Proteins 0.000 description 3
- 208000007514 Herpes zoster Diseases 0.000 description 3
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000004115 adherent culture Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 239000007943 implant Substances 0.000 description 3
- 238000002513 implantation Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 238000007912 intraperitoneal administration Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- -1 methane amide Chemical class 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000008521 reorganization Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102100034613 Annexin A2 Human genes 0.000 description 2
- 108090000668 Annexin A2 Proteins 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 208000003322 Coinfection Diseases 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 102100037362 Fibronectin Human genes 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- 241000700721 Hepatitis B virus Species 0.000 description 2
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241001631646 Papillomaviridae Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 2
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 2
- 241000009328 Perro Species 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 102000004338 Transferrin Human genes 0.000 description 2
- 108090000901 Transferrin Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 201000003740 cowpox Diseases 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 208000002672 hepatitis B Diseases 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 229920000915 polyvinyl chloride Polymers 0.000 description 2
- 239000004800 polyvinyl chloride Substances 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 239000012581 transferrin Substances 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 101150006508 82 gene Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000178270 Canarypox virus Species 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 101710145505 Fiber protein Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 102100031547 HLA class II histocompatibility antigen, DO alpha chain Human genes 0.000 description 1
- 101000866278 Homo sapiens HLA class II histocompatibility antigen, DO alpha chain Proteins 0.000 description 1
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 1
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 102000000422 Matrix Metalloproteinase 3 Human genes 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 102000003945 NF-kappa B Human genes 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091093105 Nuclear DNA Proteins 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 102000012335 Plasminogen Activator Inhibitor 1 Human genes 0.000 description 1
- 108010022233 Plasminogen Activator Inhibitor 1 Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- VRDIULHPQTYCLN-UHFFFAOYSA-N Prothionamide Chemical compound CCCC1=CC(C(N)=S)=CC=N1 VRDIULHPQTYCLN-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 1
- 206010039105 Rhinoviral infections Diseases 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- 102000005876 Tissue Inhibitor of Metalloproteinases Human genes 0.000 description 1
- 108010005246 Tissue Inhibitor of Metalloproteinases Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- 102100035071 Vimentin Human genes 0.000 description 1
- 108010065472 Vimentin Proteins 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002155 anti-virotic effect Effects 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 210000000069 breast epithelial cell Anatomy 0.000 description 1
- 102220369445 c.668T>C Human genes 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 230000030944 contact inhibition Effects 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000003725 endotheliocyte Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000010359 gene isolation Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000007236 host immunity Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000002490 intestinal epithelial cell Anatomy 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 229920002492 poly(sulfone) Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 239000002213 purine nucleotide Substances 0.000 description 1
- 239000002516 radical scavenger Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 102220023257 rs387907546 Human genes 0.000 description 1
- 210000004706 scrotum Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 108091007196 stromelysin Proteins 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 210000005048 vimentin Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/555—Interferons [IFN]
- C07K14/56—IFN-alpha
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/44—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Animal Behavior & Ethology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Communicable Diseases (AREA)
- Virology (AREA)
- Oncology (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
在严格条件下与IFNA2基因的编码区上游的限定的基因组区杂交、或与其具有至少80%序列同一性的分离的核酸分子,以及包含为同源重组的导向序列的所述DNA分子的DNA构建物。
Description
发明领域
本发明涉及基因组DNA。
发明背景
目前用治疗蛋白治疗疾病的方法包括给予在体外生产的蛋白和基因治疗。体外生产蛋白一般包括将编码目的蛋白的外源DNA引入到合适的宿主细胞中培养。在另一方面,基因疗法包括给予患者包含目的治疗蛋白编码序列的细胞、质粒或病毒。
也可以用基因导向技术,以所需的方式通过改变某些治疗蛋白的内源基因的表达来生产所述治疗蛋白。参阅例如美国专利第5,641,670、5,733,761和5,272,071号,美国专利申请序号08/406,030,WO 91/06666、WO 91/06667和WO 90/11354,所有这些都通过引用整体结合到本文中。
发明概述
本发明是基于对5′至人干扰素-α2(“IFNA2”)基因的编码序列的基因组DNA的鉴定和测序。此DNA例如可以用于DNA构建物,当将该构建物通过同源重组整合到哺乳动物细胞的基因组时,所述构建物改变(例如增加)内源IFNA2基因在该细胞中的表达。“内源IFNA2基因”意指编码IFNA2的基因组(即染色体)基因。所述构建物包含导向序列和转录调节序列,所述导向序列包括或来自于最近公开的5′非编码序列。所述转录调节序列最好在序列上与内源IFNA2基因的转录调节序列不同。所述导向序列引导所述调节序列整合到内源IFNA2编码序列的上游区中,以使该调节序列操作性连接至所述内源编码序列。所述“操作性连接的”是指所述调节序列可以控制内源IFNA2编码序列的表达。所述构建物还可以包含易于选择已稳定整合所述构建物的细胞的选择性标记基因和/或另一个连接至启动子的编码序列。
在一个实施方案中,所述DNA构建物包括:(a)导向序列,(b)调节序列,(c)外显子,(d)剪接供体位点,(e)内含子,和(f)剪接受体位点,其中所述导向序列引导其本身和元件(b)-(f)整合,以使元件(b)-(f)处于所述内源基因之中或其上游。然后所述调节序列控制生产转录物,所述转录物不仅包括元件(c)-(f),而且包括所述内源IFNA2编码序列。最好使所述内含子和所述剪接受体位点位于所述构建物剪接供体位点的下游。
所述导向序列与发生同源重组的基因组中预先选择的靶位点同源。它包含SEQ ID NO:12的至少20(例如至少30、50、100或1000)个连续的核苷酸;并可以包含例如SEQ ID NO:7的至少20(例如至少30、50或100)个连续的核苷酸、SEQ ID NO:8的至少20(例如至少30或50)个连续的核苷酸或SEQ ID NO:13的至少20(例如至少30、50、100或1000)个连续的核苷酸。另外,所述导向序列可以包含SEQID NO:16的至少20(例如至少30、50或100)个连续的核苷酸、SEQID NO:17的至少20个连续的核苷酸、SEQ ID NO:18的至少20(例如至少30或50)个连续的核苷酸或SEQ ID NO:19的至少20(例如至少30、50、100或1000)个连续的核苷酸。SEQ ID NO:7相当于SEQ IDNO:12的核苷酸1至278;SEQ ID NO:8相当于SEQ ID NO:12的核苷酸3492至3564;而SEQ ID NO:13相当于SEQ ID NO:12的核苷酸279至3491。所述“同源”是指所述导向序列与其基因组靶位点相同或足够相似,以使所述导向序列和靶位点可以在人细胞中进行同源重组。只要同源重组可以以有效频率发生,那么小部分的碱基对错配可以接受。为了易于同源重组,所述导向序列最好为至少约20(例如至少50、100、250、400或1000)个碱基对(“bp”)长。所述导向序列也可以包括SEQ ID NO:12所包含区以外的基因组序列,只要其包括此区中的至少20个核苷酸。例如,可以由位于SEQ ID NO:8和IFNA2基因的内源转录起始序列之间的序列产生另外的导向序列。
由于存在于IFNA2基因的基因座上的多态性,在任何给定的哺乳动物物种中任何给定的基因组靶位点的核苷酸组分都可以发生微小改变。对应于SEQ ID NO:7、8、12、13、16、17、18和19的这种多态变体(尤其是人多态变体)的导向序列属于本发明的范围。
在同源重组时,将所述构建物的调节序列整合到细胞染色体中IFNA2基因的编码序列上游的预先选定的区。产生的包含得自所述构建物的调节序列的新转录单位改变了靶IFNA2基因的表达。如此产生的IFNA2蛋白在序列上与未改变的内源基因编码的IFNA2蛋白可以相同,或者由于同源重组引入的变化,与野生型IFNA2蛋白相比可以包含氨基酸残基的添加、置换或减少。
改变基因表达包括使在所获得的细胞中通常沉默(即基本不表达)的基因活化(或引起表达),增加或减少基因的表达水平,并改变基因的调节模式,使得该模式不同于在所获得的细胞中的模式。“所获得的细胞”意指在同源重组前的细胞。
使用本发明的DNA构建物改变内源IFNA2基因在哺乳动物细胞中表达的方法也属于本发明的范围。该方法包括以下步骤:(ⅰ)将所述DNA构建物引入到哺乳动物细胞中;(ⅱ)将所述细胞保持在允许所述构建物和与所述导向序列同源的基因组靶位点之间发生同源重组的条件下,以产生同源重组细胞;和(ⅲ)将所述同源重组细胞保持在允许IFNA2编码序列于得自所述构建物的调节序列控制下表达的条件下。至少部分所述基因组靶位点是5′至内源IFNA2基因的编码序列。即所述基因组靶位点可以包含编码序列以及5′非编码序列。
本发明的特征还在于转染或感染的细胞,在所述细胞中所述构建物与在一个或两个内源IFNA2基因的等位基因中的内源ATG起始密码子上游的基因组DNA进行同源重组。这种转染或感染的细胞也称为同源重组细胞,具有改变的IFNA2表达模式。这些细胞特别用于体外生产IFNA2和通过基因治疗传递IFNA2。制备和使用这种细胞的方法也包含在本发明中。所述细胞可以是脊椎动物源,诸如哺乳动物(例如人、非人类的灵长类、母牛、猪、马、山羊、绵羊、猫、狗、兔、小鼠、豚鼠、仓鼠或大鼠)源。
本发明还涉及体外或体内将上述构建物经同源重组引入到宿主细胞的基因组中产生哺乳动物IFNA2蛋白的方法。然后将所述同源重组细胞保持在使所述IFNA2蛋白转录、翻译和可选地分泌的条件下。
本发明的特征还在于分离的核酸,所述核酸包含SEQ ID NO:12或其互补物的至少20(例如至少30、50、100、200或1000)个连续核苷酸的序列,或包含与SEQ ID NO:12相同、除外不妨碍与所述导向序列同源重组的多态改变或其它微小改变(例如少于序列的5%)的序列。例如,所述分离的DNA可以包含SEQ ID NO:7或其互补物的至少20(例如至少30、50或100)个连续的核苷酸、SEQ ID NO:8或其互补物的至少20(例如至少30或50)个连续的核苷酸、SEQ IDNO:13或其互补物的至少20(例如至少30、50、100或1000)个连续的核苷酸、SEQ ID NO:16或其互补物的至少20(例如至少30、50或100)个连续的核苷酸、SEQ ID NO:17或其互补物的至少20个连续的核苷酸、SEQ ID NO:18或其互补物的至少20(例如至少30或50)个连续的核苷酸或SEQ ID NO:19或其互补物的至少20(例如至少30、50、100或1000)个连续的核苷酸。
在一个实施方案中,本发明的分离的核酸包括SEQ ID NO:12的连续100个碱基对的区段。例如所述分离的DNA可以包含SEQ IDNO:12或其互补物的核苷酸1-100、101-200、201-300、301-400、401-500、501-600、601-700、701-800、801-900、901-1000、1001-1100、1101-1200、1201-1300、1301-1400、1401-1500、1501-1600、1601-1700、1701-1800、1801-1900、1901-2000、2001-2100、2101-2200、2201-2300、2301-2400、2401-2500、2501-2600、2601-2700、2701-2800、2801-2900、2901-3000、3001-3100、3101-3100、3101-3200、3201-3300、3301-3400、3401-3500或3465-3564。SEQ ID NO:12或其互补物的这些区段也用作本发明构建物中的导向序列。
在所述分离的DNA中,得自SEQ ID NO:12的序列没有连接至编码完整IFNA2的序列,或至少没有以和在任何野生型基因组中出现的构型相同的构型(即被相同的非编码序列分隔)连接。因此本文使用的术语“分离的DNA”不表示染色体或大段的基因组DNA(这可能掺入到粘粒或酵母人工染色体中),它不仅包括部分或全部SEQ IDNO:12,而且包括完整的IFNA2编码序列和所有的位于IFNA2编码序列和存在于细胞基因组中对应于SEQ ID NO:12的序列之间的序列。它确实包括但不限于,(ⅰ)掺入到质粒或病毒中的DNA;或(ⅱ)作为不依赖于其它序列的单独分子存在的DNA,例如通过聚合酶链式反应(“PCR”)或限制性内切核酸酶处理产生的片段。所述分离的DNA最好不包含编码完整IFNA2前体(即IFNA2以内源分泌信号肽互补结束)的序列。
本发明还包括包含一种链的分离的DNA,所述链包含至少100(例如至少200、400或1000)个核苷酸长并在或中等严格或高度严格条件下与SEQ ID NO:7、8、12、13、16、17、18和/或19或SEQID NO:7、8、12、13、16、17、18和/或19的互补物杂交的序列。该序列没有连接至IFNA2编码序列,或至少没有以和在任何野生型基因组中出现的构型相同的构型连接。所述中等严格条件意指在Church缓冲液(7%SDS、0.5%NaHPO4、1M EDTA、1%牛血清白蛋白)中于50℃杂交并于50℃用2×SSC清洗。高度严格条件定义为:在50%甲酰胺存在下于42℃杂交;用包含1%SDS的2×SSC于65℃第一次清洗;接着用0.1×SSC于65℃第二次清洗。
本发明还包括包含一种链的分离的DNA,所述链包含(1)至少50(例如至少70或100)个核苷酸长并(2)与SEQ ID NO:12的片段或全部或与所述片段的互补物具有至少80%(例如至少85%、90%、95%或98%)序列同一性的序列。该序列例如可以包括SEQ ID NO:7、8、13、16、17、18或19的部分或全部。所述序列没有连接至完整IFNA2编码序列,或至少没有以和在任何野生型基因组中出现的构型相同的构型连接。
在个别多肽或核酸分子被认为与参照多肽或核酸分子具有明确百分率的同一性或保守性的情况下,通过Myers和Miller,CABIOS(1989)的算法确定同一性或保守性的百分率,所述算法具体为ALIGN程序(2.0版)或其等效程序中,需要时使用12的隙宽补偿参数和4的缺口补偿参数。其它所有参数都设定为它们的默认状态。ALIGN的使用权很容易获得。参见例如国际互联网http:∥www2.igh.cnrs.fr/bi/align-guess.cgi。
本发明的特征还在于通过提供其内源IFNA2基因已如本文所述活化的细胞,并将该细胞植入动物(例如哺乳动物如人、非人类的灵长类、母牛、猪、马、山羊、绵羊、猫、狗、兔、小鼠、豚鼠、仓鼠或大鼠)中,所述细胞在所述动物中分泌IFNA2,从而将IFNA2传递给所述动物的方法。本发明还包括通过提供其内源IFNA2基因已如本文所述活化的细胞,并在允许该细胞表达和分泌IFNA2的条件下体外培养该细胞,从而产生IFNA2的方法。
本发明进一步包括与质粒pA2HB(下文描述)的部分HindⅢ-BamHⅠ插入片段(例如至少约20、50、100、400或1000bp长)具有至少80%(例如至少85%、90%或95%)序列同一性,或在高度或中等严格条件下与其杂交的分离的DNA。该部分插入片段的3′末端位于包括于所述质粒插入片段的IFNA2编码序列的ATG翻译起始密码子上游的至少511bp。
本发明的分离的DNA例如可以用作用于(当与合适的下游引物共同使用时)获得内源IFNA2基因的调节区和/或全编码序列的上游PCR引物源,或用作指示在人染色体制备物中染色体9存在的杂交探针。它也可以如下所述用于改变内源IFNA2基因在脊椎动物细胞中表达的方法。
除非另有定义,否则本文使用的所有科技术语都具有和本发明所属领域的一般技术人员的通常理解相同的含义。以下描述了典型方法和材料,但是与本文描述的方法和材料相似或等同的方法和材料也可以用来实施和检验本发明。所有出版物、专利申请、专利和本文提及的其它参考文献都通过引用整体结合到本文中。在有冲突的情况下,以本说明书包括定义为准。所述材料、方法和实施例仅起说明作用,并无限制意图。
由以下的详述和权利要求将明显看出本发明的其它特征和优势。
附图简述
图1显示人IFNA2编码序列和某些侧翼5′和3′非编码序列(GenBank HUMIFNAA)的公开序列(SEQ ID NO:1)。箭头代表PCR引物IFN1、IFN2、IFN6和IFN7的序列。
图2是一幅示意图,显示包括在质粒pA2HB的插入片段中的人IFNA2基因组区。
图3表示人IFNA2基因的编码序列的上游区的核苷酸序列(SEQID NO:7)。以前不曾报道过此核苷酸序列。
图4表示人IFNA2编码序列和某些侧翼5′和3′非编码序列的序列(SEQ ID NO:9)。下划线序列(SEQ ID NO:8)以前没有报道过。也显示了由此基因编码的多肽序列(SEQ ID NO:2)。“成熟”表示成熟多肽的N末端。
图5是一幅显示本发明构建物的示意图。该构建物包含第一个导向序列(1);可扩增的标记基因(AM);选择性标记基因(SM);调节序列;加帽位点;外显子;剪接供体位点(SD);内含子;剪接受体位点(SA);和第二个导向序列(2)。黑框表示编码DNA,而点框表示已转录但未翻译的序列。
图6表示5′至人IFNA2编码序列的基因组序列(SEQ ID NO:11),并包括某些编码序列。下划线序列以前报道过,但其余部分(-4074至-511;SEQ ID NO:12)是新的。框架序列是SEQ ID NO:13。5′至SEQID NO:13的序列是SEQ ID NO:7。在所述框架区域和所述下划线序列之间的序列是SEQ ID NO:8。核苷酸-4074至-3270是SEQ ID NO:16。核苷酸-3267至-3239是SEQ ID NO:17。核苷酸-3241至-3137是SEQID NO:18。核苷酸-3139至-511是SEQID NO:19。
图7表示用于本发明构建物的第一个导向序列(SEQ ID NO:14)。
图8表示用于本发明构建物的第二个导向序列(SEQ ID NO:15)。
发明详述
本发明基于对人IFNA2基因的编码序列的上游序列的核苷酸组成的研究。
干扰素-α由具有14个基因的复合基因家族构成,所述基因群集在染色体9的短臂上。包括IFNA2基因的这些基因中没有一个具有内含子。干扰素-α由巨噬细胞、T细胞和B细胞以及各种各样的其它许多细胞产生。干扰素-α具有显著的抗病毒作用,并已经显示对治疗乳头瘤病毒、乙型肝炎和丙型肝炎病毒、牛痘、单纯疱疹病毒、水痘样带状疱疹病毒(herpes zoster varicellosus virus)和鼻病毒的感染有效。
人IFNA2基因编码包含23个氨基酸的信号肽的188个氨基酸的前体蛋白(SEQ ID NO:2)。人IFNA2基因的基因组图谱示于图1。该图谱的构建基于1733个碱基对(“bp”)的公开序列(HUMIFNAA,GenBank保藏号J00207和V00544;SEQ ID NO:1),所述公开序列始于相对于翻译起始位点的-510位(除非另有说明,否则本文指出的所有位置均为相对于翻译起始位点),并终止于+1,223位。加帽位点位于-67位。IFNA2基因的5′特异性序列以及它们在改变内源IFNA2基因表达中的用途
为获得包含IFNA2基因上游序列的基因组DNA,用由PCR产生的332bp的探针筛选在λEMBL3(Clontech目录# HL1006d)中的人淋巴细胞基因组文库。此探针对应于在位置-263和+69之间的基因组区,并使用称为IFN7和IFN6的寡核苷酸引物由人基因组DNA扩增,IFN7和IFN6都利用IFNA2基因组DNA序列(图1)设计。引物IFN7的5′末端对应于位置-263,其序列为5′-AGTTTCTAAAAAGGCTCTGGGGTA-3′(SEQ ID NO:3)。引物IFN6的5′末端对应于位置+69,其序列为5′-GCCCACAGAGCAGCTTGAC-3′(SEQ ID NO:4)。
用放射性标记的332bp的探针筛选大约一百万个重组噬菌体。由原筛选板分离60个阳性噬菌斑。由30个这些噬菌斑中分离λ噬菌体DNA,并使用寡核苷酸引物IFN1和IFN2进行PCR分析。IFN1和IFN2都得自IFNA2基因的3′非翻译区;它们的序列可以在WWW站点“http:∥www.ncbi.nlm.nih.gov/dbSTS,”使用识别码“NCBIID:42433”获得。引物IFN1的5′末端对应于位置+639,其序列为5′-AAAGACTCATGTTTCTGCTATGACC-3′(SEQ ID NO:5)。引物IFN2的5′末端对应于位置+853,其序列为5′-GGTGCACATGACATAATATGAACA-3′(SEQ ID NO:6)。在30个噬菌体样本中,两个产生预期的215bp的PCR产物。两个噬菌体噬菌斑中的一个通过另外两轮杂交筛选进一步纯化,产生噬菌体克隆4-4-1。
将来自噬菌体4-4-1的8.3kb的HindⅢ-BamHⅠ片段亚克隆到pBluescriptⅡSK+(Stratagene,La Jolla,CA)中,以产生pA2HB,它包含IFNA2基因的未转录上游序列的约4.3kb、蛋白编码区(1.1kb)以及下游序列的约2.8kb。8.3kb的HindⅢ-BamHⅠ片段的限制图谱示于图2。
利用Sanger法对pA2HB质粒测序。以下列出了其5′末端位于5′末端的HindⅢ位点的278bp的序列(也参阅图3):
AAGCTTTTATAGGTGTAAATTTTCCACTTAGTACTGCTTTTG
TAATGTTGTCTTTTTATTTTCATTTATCTCAAGATGTTTTCT
AATTTCTCTTGACTTCCTTCTTAAATTCTTACCTCATGTAGA
CATACATTTTTGGCCCTATGCATTGGGATGCAAAACCAGACT
AATTTACTTTGTACAAAAAGAAAAATGAGAAAGAAATATATT
TGGTCTTGTGAGCACTATATGGAAATACTTTATATTCCATTT
GTTTCATCATATTCATATATCCCTTT(SEQ ID NO:7)
所述HindⅢ位点位于位置-4,073。也鉴定了以前未公开的在位置-583和-511之间的序列,示于以下并在图4中用下划线表示。
CATTGGATACTCCATCACCTGCTGTGATATTATGAATGTCTG
CCTATATAAATATTCACTATTCCATAACACA(SEQ ID
NO:8)也鉴定了在对应于SEQ ID NO:7和8的区之间的序列(SEQ IDNO:13)。
在位置-4,074和-511之间的基因组序列(SEQ ID NO:12)是在图6中没有下划线的序列。SEQ ID NO:7和8分别对应于SEQ ID NO:12的核苷酸1-278和核苷酸3492-3564。
为改变内源IFNA2基因的表达,将包含SEQ ID NO:12的核苷酸279-3311的DNA片段克隆到质粒中,以产生导向构建物pGA402。SEQ ID NO:12的核苷酸279-3311称为SEQ ID NO:14。将该片段插入到CMV启动子和新霉素抗性基因的上游,并在图5中示意标出。关于图5中的第二个导向序列,将包含示于图1的IFNA2基因序列的核苷酸-68至69的DNA片段克隆到CMV启动子和新霉素抗性基因的下游。IFNA2基因的核苷酸-68至69称为SEQ ID NO:15。将pGA402质粒引入到几乎不表达或不表达IFNA2基因的人成纤维细胞中,以使其可与内源IFNA2基因同源重组。在引入质粒后筛选抗G418的细胞,以鉴别IFNA2基因表达增加的细胞,这应可预计在pGA402和基因组DNA之间的同源重组事件是否发生在内源IFNA2基因附近。一般方法学改变内源IFNA2表达
使用上述IFNA2上游序列,采用如在美国专利第5,641,670号中一般描述的方法,可以改变内源人IFNA2基因的表达。在图5中显示了一个策略。在此策略中,设计的导向构建物包括与所述基因上游的第一个靶位点同源的第一个导向序列、可扩增的标记基因、选择性标记基因、调节区、加帽位点、外显子、剪接供体位点、内含子、剪接受体位点以及与所述第一个靶位点下游的第二个靶位点同源并终止于IFNA2编码序列之中或上游的第二个导向序列。按照此策略,为了避免在转录序列中的不需要的ATG起始密码子,所述第二个靶位点的5′末端最好小于正常IFNA2翻译起始位点上游的107bp。由同源重组基因座产生的转录物包括由所述构建物产生的外显子、由所述构建物产生的剪接供体位点、由所述构建物产生的内含子、由所述构建物产生的剪接受体位点、在任何这些元件之间的任何序列以及从所述构建物产生的剪接受体位点经整个内源编码序列至IFNA2基因的转录终止位点的序列。剪接此转录物将产生可以翻译产生人IFNA2前体的mRNA,它根据由所述构建物产生的外显子的特征,或者具有正常IFNA2分泌信号序列,或者具有基因工程分泌信号序列。外源内含子的大小和由此外源调节区相对于所述基因编码区的位置可以改变,以使所述调节区的功能最佳。
在任何活化策略中,所述第一个和第二个靶位点互相之间不需要紧接乃至相近。当它们互相之间不紧接时,IFNA2基因的正常上游区的一部分和/或所述编码区的一部分在同源重组时应缺失。
可以通过同源重组,将易于改变内源IFNA2表达的突变引入到染色体DNA中。例如,可能需要清除正确的ATG起始密码子上游和在同源重组基因座中所述外源调节区和所述内源IFNA2编码区之间的虚假的和不需要的ATG起始密码子。为了这样做,可以使用具有与跨过了不需要的ATG起始密码子的基因组位点同源的导向序列的导向构建物。此导向序列包含对应于目的突变的核苷酸,例如包含代替了ATG的ATT。所述导向构建物可选地包括一个或多个易于选择同源重组细胞的选择性标记。然后可以使用本发明的表达改变方法,将所述外源调节区引入到同源重组细胞上游的改变位点中。
另一方面,可以将所述外源调节区和目的序列突变在一步中引入到基因组DNA中。在此实施方案中使用的DNA构建物可以包含所述外源调节区和包含对应于目的突变的核苷酸的导向序列。也可以将两个单独的构建物共转染或共感染到靶细胞中,其中一个构建物包含所述调节区,而另一个构建物包含对应于目的突变的核苷酸。
如果需要,可以例如在不需要的ATG起始密码子和正确的ATG起始密码子之间的位点,以相似的方式,将哺乳动物剪接受体位点引入到所述基因组DNA中。用于此目的的DNA构建物包含导向序列,该序列与正确的IFNA2起始密码子的上游基因组位点同源,并邻近对应于目的剪接受体位点的同源序列或嵌入其中。然后用包含外源调节区和在其3′末端具有未配对的剪接供体位点的外显子的第二个构建物,与引导所述第二个构建物至插入的剪接受体位点的上游基因组区的导向序列一起,转染或感染包含正确重组的IFNA2基因座的细胞。在外源调节区控制下产生的初级转录物包括外源外显子、外源剪接供体位点、外源剪接受体位点、在这些元件之间的任何序列,以及在外源剪接受体位点和内源IFNA2基因的转录终止位点之间的序列。在剪接时,所述转录物的剪接供体位点被剪接至剪接受体位点,并将除去可能包含不需要的AUG起始密码子的间插内含子RNA。从而避免任何与在转录起始位点和IFNA2编码序列之间具有不需要的AUG翻译起始密码子的转录物相关的问题。当然,可以在一步中引入所述调节区、外显子、剪接供体位点和剪接受体位点来代替。在此实施方案中使用的DNA构建物包含调节区、外显子、剪接供体位点、内含子、剪接受体位点、与在正确的IFNA2起始密码子和不需要的ATG密码子之间的基因组位点同源的导向序列,以及可选地包括一个或多个选择性标记。另一方面,可以使用两个单独的导向构建物,其中一个包含所述调节区、所述外显子和所述剪接供体位点,而另一个包含所述剪接受体位点。可以将这两个构建物在一步中引入到靶细胞中。DNA构建物
本发明的DNA构建物至少包括导向序列和调节序列。它还可以包括外显子;或外显子和剪接供体位点;或外显子、剪接供体位点、内含子和剪接受体位点。在所述构建物中,如果所述外显子存在,则在所述调节序列的3′,而如果所述剪接供体位点存在,则在所述外显子的3′端。如果存在所述内含子和所述剪接受体位点,则在所述剪接供体位点的3′。另外,在所述构建物中可以有多个外显子和内含子(以及合适的剪接供体和受体位点)。在所述构建物中的DNA被认为是外源,因为该DNA不是宿主细胞基因组的原始部分。外源DNA可以具有与在通过病毒载体转染或感染之前的细胞中存在的部分内源基因组DNA相同或不同的序列。本文使用的“转染”是指通过非病毒(例如化学或物理)方法,诸如磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染、电穿孔、微注射、微粒轰击或biolistic介导的吸收,将质粒引入到细胞中。“感染”是指通过病毒感染将病毒载体引入到细胞中。在下文详细描述了包括于本发明的DNA构建物中的各种元件。
所述DNA构建物还可以包括顺式作用或反式作用病毒序列(例如包装信号),从而能够将所述构建物经病毒载体感染传递到细胞的核中。必要时,所述DNA构建物可以由病毒生活周期的各步(诸如在逆转录病毒中整合酶介导的整合或附加体维持)中脱离出来。通过病毒序列的合适的缺失或突变,诸如在逆转录病毒载体中整合酶编码区的缺失,可以实现脱离。关于所述构建物的其它细节和病毒载体的用途见于Robbins等人,Pharmacol.Ther.80:35-47,1998;和Gunzburg等人,Mol.Med.Today 1:410-417,1995,通过引用结合到本文中。导向序列
导向序列使得目的序列同源重组到在宿主基因组中选定位点。导向序列与其各自在宿主基因组中的靶位点同源(即能够与其同源重组)。
环状DNA构建物可以使用一个导向序列,或两个或两个以上单独的导向序列。线性DNA构建物可以包含两个或两个以上单独的导向序列。与已知的导向序列同源的靶位点可以位于IFNA2基因的编码区内、位于所述编码区的上游并紧接所述编码区或位于所述编码区的上游并距所述编码区有一段距离。
在所述构建物中的两个导向序列的第一个(或者如果在该构建物中只有一个导向序列,则是完整导向序列)得自新近公开的IFNA2编码序列的上游基因组区。此导向序列例如包含SEQ ID NO:12的一部分(例如20或更多个连续的核苷酸)、SEQ ID NO:7、8或13的一部分。
在所述构建物中的两个导向序列的第二个可以引导所述编码序列的上游基因组区或引导所述编码序列自身的部分或全部。作为实例,第二个导向序列可以在其3′末端含有与IFNA2编码序列的最初几个密码子相同的“外源”编码区。在同源重组时,所述外源编码区与内源IFNA2编码序列的目标部分重组。如果需要,所述外源编码区可以编码异源氨基酸序列,只要所述外源编码区与它替代的内源编码区保持足够的同源性,以能够同源重组。
所述导向序列另外可以包括得自以前公开的IFNA2基因区的序列,包括本文描述的那些区,以及在构建物上未特征鉴定但本领域技术人员可以作出图谱的上游更远的区。
可以利用基因组片段与包含全部或部分SEQ ID NO:12的探针杂交的能力鉴定用作导向序列的所述基因组片段。所述探针可使用得自SEQ ID NO:12的引物经PCR产生。调节序列
所述DNA构建物的调节序列可以包含一个或多个启动子(例如组成型启动子、组织特异性启动子或诱导型启动子)、增强子、支架结构连接区或基质附着部位、负调节元件、转录因子结合部位,或这些元件的组合。
所述调节序列可以得自真核生物(例如哺乳动物)或病毒基因组。有用的调节序列包括但不限于调节SV40早期或晚期基因、巨细胞病毒基因和腺病毒主要晚期基因表达的那些调节序列。它们还包括得自编码小鼠金属硫蛋白-Ⅰ、延伸因子-1α、胶原蛋白(例如胶原蛋白Ⅰα1、胶原蛋白Ⅰα2和胶原蛋白Ⅳ)、肌动蛋白(例如γ-肌动蛋白)、免疫球蛋白、HMG-辅酶A还原酶、甘油醛磷酸脱氢酶、3-磷酸甘油酸激酶、胶原酶、溶基质素、纤连蛋白、波形蛋白、纤溶酶原激活物抑制剂Ⅰ、胸腺素β4、组织金属蛋白酶抑制剂、核糖体蛋白、主要组织相溶性复合体分子和人淋巴细胞抗原的基因的调节区。
所述调节序列最好包含转录因子结合部位,诸如TATA框、CCAAT框、AP1、Sp1或NF-κB结合部位。标记基因
如果需要,所述构建物可以包括编码目的多肽、操作性连接至其自身启动子的序列。其实例应为选择性标记基因,它可用来易化对导向事件的鉴别。也可以包括可扩增的标记基因,它用来易化对具有共扩增的侧翼DNA序列的细胞的选择。可以通过在选择表达可扩增基因的介质存在下培养,鉴别包含扩增拷贝的可扩增标记基因的细胞。活化的内源IFNA2基因将同扩增的选择性标记基因串联扩增。包含多拷贝活化内源基因的细胞可以产生很高水平的IFNA2,并因此用于体外产生蛋白和基因治疗。
选择性标记基因和可扩增的标记基因互相之间不必处于紧接状态。可扩增的标记基因和选择性标记基因可以是相同的基因。一个或两个所述标记基因可以位于所述DNA构建物的内含子中。在美国专利第5,641,670中描述了合适的可扩增的标记基因和选择性标记基因。剪接供体位点和剪接受体位点
所述DNA构建物可以进一步包含外显子、在所述外显子的3′末端的剪接供体位点、内含子和剪接受体位点。
剪接供体位点是一种序列,它控制将RNA转录物的一个外显子剪接至该转录物的另一个外显子的剪接受体位点,从而除去在所述两个位点之间的内含子。通常,第一个外显子位于第二个外显子的5′,而位于第一个外显子的3′末端的所述剪接供体位点与位于第二个外显子5′侧的剪接受体位点匹配。剪接供体位点具有表征为(A/C)AGGURAGU(其中R表示嘌呤核苷酸)的共有序列,GU必须在第4和第5位(Jackson,Nucleic Acids Research 19:3715-3798,1991)。所述剪接供体共有位点的前三个碱基是所述外显子的后三个碱基:即它们未被剪除。剪接供体位点的功能定义为其对在mRNA剪接途径中合适反应的影响能力。
在本发明构建物中的剪接受体位点与剪接供体位点一起,控制将一个外显子剪接至另一个外显子。剪接受体位点具有表征为(Y)10NYAG(SEQ ID NO:10)的序列,其中Y表示任何嘧啶,而N表示任何核苷酸(Jackson,Nucleic Acids Research 19:3715-3798,1991)。加帽位点
所述DNA构建物可以可选地包含加帽位点。加帽位点是与所述调节区有关并由其使用的特异性转录起始位点。此加帽位点在所述构建物中位于相对于所述调节序列的位置,以便同源重组后,所述调节序列控制在所述加帽位点开始合成转录物。另一方面,在所述构建物中不包括加帽位点,转录装置将由于缺乏合适的位点而定位于用作加帽位点的靶基因中。另外的DNA元件
所述构建物可以另外包含影响通过同源重组产生的RNA或蛋白的构建物或稳定性的序列。所述DNA构建物可选地可以包括细菌复制起点和细菌抗生素抗性标记或其它的选择性标记,便于它们在细菌或任何其它合适的克隆/宿主系统中大规模繁殖质粒。
所述DNA构建物的所有上述元件互相之间都可操作性连接或以功能方式排列。即在所述构建物和靶基因组DNA之间同源重组时,所述调节序列可以操纵初级RNA转录物的生产,所述初级RNA转录物起始于加帽位点(可选地包括在所述构建物中),并包括位于所述加帽位点和内源IFNA2基因转录终止位点之间的序列。根据所述加帽位点的位置,该序列的部分可以包括IFNA2基因内源调节区以及邻近该区的通常未被转录的序列。如果在所述构建物中存在外显子、剪接供体位点和剪接受体位点,则所述初级转录物也包括所述外显子、所述两个剪接位点和在这两个位点之间的所述内含子。
在所述DNA构建物中元件的顺序可以改变。当所述构建物是环状质粒或病毒载体时,在产生的结构中元件的相对顺序例如可以是:导向序列、质粒DNA(包含在微生物和其它适合的宿主中用于选择和/或复制导向质粒的序列)、选择性标记、调节序列、外显子、剪接供体位点、内含子和剪接受体位点。
当所述构建物为线性时,该顺序例如可以是:第一个导向序列、选择性标记基因、调节序列、外显子、剪接供体位点、内含子、剪接受体位点和第二个导向序列;或为另一种顺序:第一个导向序列、调节序列、外显子、剪接供体位点、内含子、剪接受体位点、选择性标记基因、可选的内部核糖体进入位点和第二个导向序列。
另一方面,所述顺序可以是:第一个导向序列、第一个选择性标记基因、调节序列、外显子、剪接供体位点、内含子、剪接受体位点、第二个导向序列和第二个选择性标记基因;或为:第一个导向序列、调节序列、外显子、剪接供体位点、内含子、剪接受体位点、第一个选择性标记基因、第二个导向序列和第二个选择性标记基因。在位于所述第一个选择性标记侧翼的导向序列和在宿主基因组中的同源序列之间的重组导致对所述第一个选择性标记的目的整合,而所述第二个选择性标记未被整合。目的转染或感染的细胞是那些用第一个选择性标记而不是第二个选择性标记稳定转染或感染的细胞。可以通过在包含选择表达第一个标记的介质和选择抗第二个标记的另一种介质的培养基中生长,选择这样的细胞。预计已通过非同源重组机制不正确整合导向构建物的转染或感染的细胞应表达所述第二个标记基因,从而在所选择培养基中被杀死。
有时在所述构建物中包括正选择性标记,以便于选择包含扩增拷贝的该标记的细胞。在此实施方案中,构建物元件的顺序例如可以是:第一个导向序列、可扩增的正选择性标记、第二个选择性标记(可选)、调节序列、外显子、剪接供体位点、内含子、剪接受体位点和第二个导向DNA序列。
所述构建物的各种元件可以由天然来源(例如基因组DNA)获得,或者可以使用基因工程技术或合成方法产生。所述构建物的调节区、加帽位点、剪接供体位点、内含子、剪接受体位点可以作为完整单元由例如人延伸因子-1α(GenBank序列HUMEF1A)基因或巨细胞病毒(GenBank序列HEHCMVP1)立即早期区中分离。这些元件还可以由单独的基因分离。转染或感染和同源重组
可以将本发明的DNA构建物作为单个DNA构建物或作为单独的DNA序列加入到转染或感染细胞的染色体或核DNA中,引入到诸如初级细胞、次级细胞或无限增殖化细胞的细胞中。所述“转染细胞”是指通过非使用病毒载体的方法将DNA或RNA分子引入到其中(或其祖细胞中)的细胞。所述“感染细胞”是指使用病毒载体将DNA或RNA分子引入到其中(或其祖细胞中)的细胞。已知用作载体的病毒包括腺病毒、腺伴随病毒、疱疹病毒、腮腺炎病毒、脊髓灰质炎病毒、慢病毒、逆转录病毒、Sindbis病毒和诸如金丝雀痘病毒的牛痘病毒。所述DNA可以作为线性、双链(在一个或两个末端具有或不具有单链区)、单链或环状分子引入。当将所述构建物以两个独立的DNA片段引入到宿主细胞中时,所述两个片段在一个片段的3′末端和在另一个片段的5′末端具有DNA序列同源性(重叠),同时一个片段具有第一个导向序列,而另一个片段具有第二个导向序列。当引入到细胞中时,所述两个片段可以进行同源重组,以形成具有第一个和第二个导向序列的单个分子,该分子位于在原来两个片段之间的重叠区侧翼。于是产物分子的形式适于和细胞靶位点同源重组。可以使用多于两个的片段,设计它们中的每一个,以使它们互相之间进行同源重组,最终形成适于同如上所述的细胞靶位点同源重组的产物。
本发明的DNA构建物如果自身不含有选择性标记,则其可与包含这种标记的另一个构建物共转染或共感染。可以用限制酶在一个或多个位点切割导向质粒,以在转染或感染前产生线性或有间隙的分子。产生的游离DNA末端增加了目的同源重组事件的发生频率。此外,可以用外切核酸酶处理所述游离的DNA末端,以产生突出的5′或3′单链DNA末端(例如至少30个核苷酸长,最好100-1000个核苷酸长),增加目的同源重组事件的发生频率。在此实施方案中,在所述导向序列和基因组靶之间的同源重组将产生两个拷贝所述导向序列,位于包含在引入的质粒中的元件侧翼。
可以通过各种物理或化学方法,包括电穿孔、微注射、微粒轰击、磷酸钙沉淀、脂质体传递或聚凝胺(Polybrene)或DEAE葡聚糖介导的转染,(最好在体外)将所述DNA构建物转染到细胞中。
如本领域所述,将转染或感染的细胞保持在允许同源重组的条件下(参阅例如Capecchi,Science 24:1288-1292,1989)。当将所述同源重组细胞保持在足以允许所述DNA转录的条件下时,由所述DNA构建物引入的调节区将改变IFNA2基因的转录。
可以通过表型筛选或通过用针对IFNA2的酶联免疫吸附测定(ELISA)分析培养上清液,鉴定同源重组细胞(即已进行目的同源重组的细胞)。可由Biosource International(Camarillo,CA)获得检测IFNA2的市售ELISA试剂盒。还可以通过DNA和RNA印迹分析或通过聚合酶链式反应(PCR)筛选,鉴定同源重组细胞。
本文使用的术语“初级细胞”包括(ⅰ)存在于分离自脊椎动物组织源的细胞悬浮液中的细胞(在它们贴壁之前,即粘附到在诸如碟或烧瓶中的组织培养支持底物之前),(ⅱ)存在于得自组织的外植块中的细胞,(ⅲ)第一次贴壁培养的细胞,和(ⅳ)由这些贴壁培养细胞产生细胞悬浮液。初级细胞也可以是在人或动物中天然产生的细胞。
次级细胞是在随后的所有步骤培养的细胞。即从培养支持底物除去第一次贴壁培养的初级细胞并再次平板培养(传代细胞),本文将它们称为次级细胞,包括在随后传代中的所有细胞。次级细胞株包括已经传代一次或几次的次级细胞。通常次级细胞在培养中具有有限数目的平均群体倍增,并具有接触抑制、贴壁依赖性生长的特性(贴壁依赖性不适用于在悬浮培养中繁殖的细胞)。初级和次级细胞不是无限增殖的。
无限增殖化细胞是在培养中具有明显地非限制性生命期的细胞系(与细胞株相反,所述定义“株”专用于初级和次级细胞)。
选择性用于转染或感染的细胞可以分为四种类型或四类:(ⅰ)获得的产生或包含不超过痕量的IFNA2蛋白的细胞,(ⅱ)产生或包含蛋白的细胞,但蛋白量不同于所需的量(诸如其量低于所获得的细胞类型生理正常的水平),(ⅲ)在所获得的细胞类型以生理正常的水平产生所述蛋白的细胞,但其含量或产量可增大或增强,和(ⅳ)需要改变其中的编码所述蛋白的基因的调节或诱导形式的细胞。
通过本发明方法转染或感染的初级、次级和无限增殖化细胞可以由各种组织获得并包括可以在培养中保持的所有合适的细胞类型。例如,合适的初级和次级细胞包括成纤维细胞、角质形成细胞、上皮细胞(例如乳房上皮细胞、肠上皮细胞)、内皮细胞、神经胶质细胞、神经细胞、血液的组成成分(例如淋巴细胞、骨髓细胞)、肌细胞和这些体细胞类型的前体。当要在基因治疗中使用所述同源重组细胞时,最好由要给予转染或感染初级或次级细胞的个体获得初级细胞。然而,可以由上述物种的供体(即不是受体的个体)获得初级细胞。
用于蛋白产生或基因治疗的无限增殖化人细胞系的实例包括但不限于,2780AD卵巢癌细胞(Van der Blick等,Cancer Res.,48:5927-5932,1988)、A549(美国典型培养物保藏中心(“ATCC”)CCL185)、BeWo(ATCC CCL 98)、Bowes黑素瘤细胞(ATCC CRL9607)、CCRF-CEM(ATCC CCL 119)、CCRF-HSB-2(ATCC CCL120.1)、COLO201(ATCC CCL 224)、COLO205(ATCC CCL 222)、COLO320DM(ATCC CCL 220)、COLO 320HSR(ATCC CCL 220.1)、Daudi细胞(ATCC CCL 213)、Detroit 562(ATCC CCL 138)、HeLa细胞及HeLa细胞衍生物(ATCC CCL 2、2.1和2.2)、HCT116(ATCCCCL 247)、HL-60细胞(ATCC CCL 240)、HT1080细胞(ATCC CCL121)、IMR-32(ATCC CCL 127)、Jurkat细胞(ATCC TIB 152)、K-562白血病细胞(ATCC CCL 243)、KB癌细胞(ATCC CCL 17)、KG-1(ATCC CCL 246)、KG-1a(ATCC CCL 246.1)、LS123(ATCC CCL255)、LS174T(ATCC CCL CL-188)、LS180(ATCC CCL CL-187)、MCF-1乳癌细胞(ATCC BTH 22)、MOLT-4细胞(ATCC CRL 1582)、Namalwa细胞(ATCC CRL 1432)、NCI-H498(ATCC CCL 254)、NCI-H508(ATCC CCL 253)、NCI-H548(ATCC CCL 249)、NCI-H716(ATCC CCL 251)、NCI-H747(ATCC CCL 252)、NCI-H1688(ATCC CCL 257)、NCI-H2126(ATCC CCL 256)、Raji细胞(ATCC CCL 86)、RD(ATCC CCL 136)、RPMI 2650(ATCC CCL30)、RPMI 8226细胞(ATCC CCL 155)、SNU-C2A(ATCC CCL250.1)、SNU-C2B(ATCC CCL 250)、SW-13(ATCC CCL 105)、SW48(ATCC CCL 231)、SW403(ATCC CCL 230)、SW480(ATCCCCL 227)、SW620(ATCC CCL 227)、SW837(ATCC CCL 235)、SW948(ATCC CCL 237)、SW1116(ATCC CCL 233)、SW1417(ATCCCCL 238)、SW1463(ATCC CCL 234)、T84(ATCC CCL 248)、U-937细胞(ATCC CRL 1593)、WiDr(ATCC CCL 218)和WI-38VA13亚系2R4细胞(ATCC CCL 75.1)以及通过融合人细胞和其它物种的细胞产生的异种杂交瘤细胞。可以使用次级人成纤维细胞株,诸如WI-38(ATCC CCL 75)和MRC-5(ATCC CCL 171)。此外,初级、次级或无限增殖化人细胞,以及来自其它物种的初级、次级或无限增殖化细胞,可以用于体外产生蛋白或基因治疗。表达IFNA-2的细胞
本发明的同源重组细胞在所需的水平上表达IFNA2,并用于体外产生IFNA2和基因治疗。产生蛋白
按照本发明的同源重组细胞可以用于体外生产IFNA2。所述细胞保持在本领域描述的导致表达蛋白的条件下。可以由细胞裂解物或细胞上清液中纯化所述IFNA2蛋白。可以通过本领域已知的常规药物途径(例如口服、静脉内、肌内、鼻内、肺、跨粘膜、皮内、直肠、鞘内、经皮肤、皮下、腹膜内或病灶内),将包含所述IFNA2蛋白的药用组合物传递给人或动物。口服给予可能需要采取保护蛋白以免在胃肠道降解的措施:例如包囊在聚合的微囊中。基因治疗
本发明的同源重组细胞用作同源重组细胞系群、同源重组初级或次级细胞群、同源重组克隆细胞株或细胞系、同源重组异源细胞株或细胞系以及细胞混合物,在该混合物中至少存在一种代表前述四类同源重组细胞之一的细胞。这些细胞可在传递体系中用于治疗(ⅰ)由诸如乳头瘤病毒、乙型肝炎和丙型肝炎病毒、牛痘、单纯疱疹病毒、水痘样带状疱疹病毒和鼻病毒的病毒引起的感染,和(ⅱ)任何其它可用IFNA2治疗的病症。
将同源重组初级细胞、克隆细胞株或异源细胞株以足够的量通过合适的途径,给予需要治疗或预防异常或不良症状的个体,以表达或产生在生理学相关水平上有效的蛋白或外源DNA。生理学相关水平接近体内通常产生所述产物的水平或为导致异常或不良症状改善的水平。如果所述细胞与具有免疫能力的受体同源,则所述细胞可以静脉内、动脉内、皮下、腹膜内、网膜内、肾下囊(subrenal capsularly)、鞘内、颅内或肌内给予或植入。
如果所述细胞不同源而所述受体具有免疫能力,则可以将要给予的所述同源重组细胞封入一个或多个半透性屏障装置中。所述装置的渗透性特性使得在将所述细胞植入到受治疗者中时防止其离开所述装置,但治疗性蛋白可以自由透过,并可以离开所述屏障装置进入植入体附近的局部区域或进入体循环。参见例如美国专利第5,641,670、5,470,731、5,620,883、5,487,737号和1999年4月16日提交的标题为“治疗性蛋白的传递”的共有美国专利申请(发明人:Justin C,Lamsa和Douglas A.Treco),所有这些文献都通过引用结合到本文中。所述屏障装置可以在任何合适的位置植入:例如腹膜内、鞘内、皮下、肌内、肾囊内或网膜内。
屏障装置特别有用,使得可以植入同源重组无限增殖化细胞、来自其它物种的同源重组细胞(同源重组异种细胞)或来自非组织相容性匹配供体的细胞(同源重组同种异体细胞)治疗患者。所述装置将细胞保留在体内的固定位置,同时保护所述细胞免受宿主免疫系统的排斥。当治疗方案由于任一原因要停止时,屏障装置还通过使所述细胞立即去除,提供方便的短期(即瞬时)治疗。在没有用于短期基因治疗的屏障装置的情况下,也可以使用转染或感染的异种细胞和同种异体细胞。在此情况下,将在体内传递由所述细胞产生的IFNA2,直至宿主的免疫系统排斥所述细胞为止。
为此目的可以使用许多合成、半合成或天然的滤膜,包括但不限于纤维素、乙酸纤维素、硝化纤维、聚砜、聚偏二氟乙烯、聚氯乙烯聚合物和聚氯乙烯衍生物的聚合物。可以使用屏障装置,以使得来自其它物种的初级、次级或无限增殖化细胞用于对人的基因治疗。
用于本发明的基因治疗的另一类装置是其中嵌入所述细胞的可植入的胶原基质。在WO 97/15195中描述了这种可以包含将所述细胞附着于微珠上的装置,该文献通过引用结合到本文中。所述装置可以如上所述植入。
给予剂量或植入需要的细胞的数量取决于几种因素,包括所述蛋白的表达水平、宿主动物的大小和状态以及与植入方法相关的限制。通常在成年人或其它类似大小的动物中植入的细胞的数量在1×104至5×1010的范围内,最好为1×108至1×109。如果需要,它们可以在患者的多个部位同时或者在几个月或几年的时间内植入。所述剂量可以根据需要重复。保藏
根据国际承认用于专利程序的微生物保存布达佩斯条约的条款,质粒pA2HB于1998年5月12日保藏在美国典型培养物保藏中心(ATCC),Rockville,MD,美国。获得的保藏号为209872。
申请人的代理机构Transkaryotic Therapies,Inc.表示ATCC是提供永久保藏的保藏单位,并且如果专利获得批准,则公众立即可以由该单位获得保藏物。一旦批准了专利,则所有关于公众获得如此保藏的物质的限制都不可挽回地被取消。在专利未决期间,专利局局长根据37 CFR 1.14和35 U.S.C.§122的授权确定的人将可获得所述物质。对保藏物质的保藏必须非常注意,以在提供保藏物质样品的最近要求之后至少5年,并在任何情况下,在保藏日后至少30年或在专利实施期内(无论哪个时间都更长)保持其存活并不受污染。申请人的代理机构承认他们的责任是,如果要求提供样品时由于所述保藏物的情况保藏机构不能提供样品,则更换所述保藏物。
其它实施方案
应当理解,虽然已经描述了本发明及其详述,但先前的描述意在说明,并不限制由所附权利要求书的范围确立的本发明的范围。
其它方面、优势和修改在以下权利要求书的范围内。
序列表<110>Transkaryotic Therapies Inc.<120>用于产生和传递蛋白的基因组序列<130>07236/018WO1<150>US 60/086,555<151>1998年5月21日<150>US 60/084,648<151>1998年5月7日<160>19<170>FastSEQ for Windows,版本3.0<210>1<211>1733<212>DNA<213>Homo sapiens<400>1gcgcctctta tgtacccaca aaaatctatt ttcaaaaaag ttgctctaag aatatagtta 60tcaagttaag taaaatgtca atagcctttt aatttaattt ttaattgttt tatcattctt 120tgcaataata aaacattaac tttatacttt ttaatttaat gtatagaata gagatataca 180taggatatgt aaatagatac acagtgtata tgtgattaaa atataatggg agattcaatc 240agaaaaaagt ttctaaaaag gctctggggt aaaagaggaa ggaaacaata atgaaaaaaa 300tgtggtgaga aaaacagctg aaaacccatg taaagagtgt ataaagaaag caaaaagaga 360agtagaaagt aacacagggg catttggaaa atgtaaacga gtatgttccc tatttaaggc 420taggcacaaa gcaaggtctt cagagaacct ggagcctaag gtttaggctc acccatttca 480accagtctag cagcatctgc aacatetaca atggccttga cctttgcttt actggtggcc 540ctcctggtgc tcagctgcaa gtcaagctgc tctgtgggct gtgatctgcc tcaaacccac 600agcctgggta gcaggaggac cttgatgctc ctggcacaga tgaggagaat ctctcttttc 660tcctgcttga aggacagaca tgactttgga tttccccagg aggagtttgg caaccagttc 720caaaaggctg aaaccatccc tgtcctccat gagatgatcc agcagatctt caatctcttc 780agcacaaagg actcatctgc tgcttgggat gagaccctcc tagacaaatt ctacactgaa 840ctctaccagc agctgaatga cctggaagcc tgtgtgatac agggggtggg ggtgacagag 900actcccctga tgaaggagga ctccattctg gctgtgagga aatacttcca aagaatcact 960ctctatctga aagagaagaa atacagccct tgtgcctggg aggttgtcag agcagaaatc 1020atgagatctt tttctttgtc aacaaacttg caagaaagtt taagaagtaa ggaatgaaaa 1080ctggttcaac atggaaatga ttttcattga ttcgtatgcc agctcacctt tttatgatct 1140gccatttcaa agactcatgt ttctgctatg accatgacac gatttaaatc ttttcaaatg 1200tttttaggag tattaatcaa cattgtattc agctcttaag gcactagtcc cttacagagg 1260accatgctga ctgatccatt atctatttaa atatttttaa aatattattt atttaactat 1320ttataaaaca acttattttt gttcatatta tgtcatgtgc acctttgcac agtggttaat 1380gtaataaaat gtgttctttg tatttggtaa atttattttg tgttgttcat tgaacttttg 1440ctatggaact tttgtacttg tttattcttt aaaatgaaat tccaagccta attgtgcaac 1500ctgattacag aataactggt acacttcatt tgtccatcaa tattatattc aagatataag 1560taaaaataaa ctttctgtaa accaagttgt atgttgtact caagataaca gggtgaacct 1620aacaaataca attctgctct cttgtgtatt tgatttttgt atgaaaaaaa ctaaaaatgg 1680taatcatact taattatcag ttatggtaaa tggtatgaag agaagaagga acg 1733<210>2<211>188<212>蛋白<213>Homo sapiens<400>2 Met Ala Leu Thr Phe Ala Leu Leu Val Ala Leu Leu Val Leu Ser Cys
1 5 10 15Lys Ser Ser Cys Ser Val Gly Cys Asp Leu Pro Gln Thr His Ser Leu
20 25 30Gly Ser Arg Arg Thr Leu Met Leu Leu Ala Gln Met Arg Arg Ile Ser
35 40 45Leu Phe Ser Cys Leu Lys Asp Arg His Asp Phe Gly Phe Pro Gln Glu
50 55 60Glu Phe Gly Asn Gln Phe Gln Lys Ala Glu Thr Ile Pro Val Leu His65 70 75 80Glu Met Ile Gln Gln Ile Phe Asn Leu Phe Ser Thr Lys Asp Ser Ser
85 90 95Ala Ala Trp Asp Glu Thr Leu Leu Asp Lys Phe Tyr Thr Glu Leu Tyr
100 105 110Gln Gln Leu Asn Asp Leu Glu Ala Cys Val Ile Gln Gly Val Gly Val
115 120 125Thr Glu Thr Pro Leu Met Lys Glu Asp Ser Ile Leu Ala Val Arg Lys
130 135 140Tyr Phe Gln Arg Ile Thr Leu Tyr Leu Lys Glu Lys Lys Tyr Ser Pro145 150 155 160Cys Ala Trp Glu Val Val Arg Ala Glu Ile Met Arg Ser Phe Ser Leu
165 170 l75Ser Thr Asn Leu Gln Glu Ser Leu Arg Ser Lys Glu
180 185<210> 3<211> 24<212> DNA<213> Homo sapiens<400> 3agtttctaaa aaggctctgg ggta 24<210> 4<211> 19<212> DNA<213> Homo sapiens<400> 4gcccacagag cagcttgac 19<210> 5<211> 25<212> DNA<213> Homo sapiens<400> 5aaagactcat gtttctgcta tgacc 25<210> 6<211> 24<212> DNA<213> Homo sapiens<400> 6ggtgcacatg acataatatg aaca 24<210> 7<211> 278<212> DNA<213> Homo sapiens <400> 7aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atcccttt 278<210> 8<211> 73<212> DNA<213> Homo sapiens<400> 8cattggatac tccatcacct gctgtgatat tatgaatgtc tgcctatata aatattcact 60attccataac aca 73<210> 9<211> 1806<212> DNA<213> Homo sapiens<400> 9cattggatac tccatcacct gctgtgatat tatgaatgtc tgcctatata aatattcact 60attccataac acagcgcctc ttatgtaccc acaaaaatct attttcaaaa aagttgctct 120aagaatatag ttatcaagtt aagtaaaatg tcaatagcct tttaatttaa tttttaattg 180ttttatcatt ctttgcaata ataaaacatt aactttatac tttttaattt aatgtataga 240atagagatat acataggata tgtaaataga tacacagtgt atatgtgatt aaaatataat 300gggagattca atcagaaaaa agtttctaaa aaggctctgg ggtaaaagag gaaggaaaca 360ataatgaaaa aaatgtggtg agaaaaacag ctgaaaaccc atgtaaagag tgtataaaga 420aagcaaaaag agaagtagaa agtaacacag gggcatttgg aaaatgtaaa cgagtatgtt 480ccctatttaa ggctaggcac aaagcaaggt cttcagagaa cctggagcct aaggtttagg 540ctcacccatt tcaaccagtc tagcagcatc tgcaacatct acaatggcct tgacctttgc 600tttactggtg gccctcctgg tgctcagctg caagtcaagc tgctctgtgg gctgtgatct 660gcctcaaacc cacagcctgg gtagcaggag gaccttgatg ctcctggcac agatgaggag 720aatctctctt ttctcctgct tgaaggacag acatgacttt ggatttcccc aggaggagtt 780tggcaaccag ttccaaaagg ctgaaaccat ccctgtcctc catgagatga tccagcagat 840cttcaatctc ttcagcacaa aggactcatc tgctgcttgg gatgagaccc tcctagacaa 900attctacact gaactctacc agcagctgaa tgacctggaa gcctgtgtga tacagggggt 960gggggtgaca gagactcccc tgatgaagga ggactccatt ctggctgtga ggaaatactt 1020ccaaagaatc actctctatc tgaaagagaa gaaatacagc ccttgtgcct gggaggttgt 1080cagagcagaa atcatgagat ctttttcttt gtcaacaaac ttgcaagaaa gtttaagaag 1140taaggaatga aaactggttc aacatggaaa tgattttcat tgattcgtat gccagctcac 1200ctttttatga tctgccattt caaagactca tgtttctgct atgaccatga cacgatttaa 1260atcttttcaa atgtttttag gagtattaat caacattgta ttcagctctt aaggcactag 1320tcccttacag aggaccatgc tgactgatcc attatctatt taaatatttt taaaatatta 1380tttatttaac tatttataaa acaacttatt tttgttcata ttatgtcatg tgcacctttg 1440cacagtggtt aatgtaataa aatgtgttct ttgtatttgg taaatttatt ttgtgttgtt 1500cattgaactt ttgctatgga acttttgtac ttgtttattc tttaaaatga aattccaagc 1560ctaattgtgc aacctgatta cagaataact ggtacacttc atttgtccat caatattata 1620ttcaagatat aagtaaaaat aaactttctg taaaccaagt tgtatgttgt actcaagata 1680acagggtgaa cctaacaaat acaattctgc tctcttgtgt atttgatttt tgtatgaaaa 1740aaactaaaaa tggtaatcat acttaattat cagttatggt aaatggtatg aagagaagaa 1800ggaacg 1806<210> 10<211> 4090<212> DNA<213> Homo sapiens<400> 10aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag ttcccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagtgcagg aaaggtggaa gattgatgat ttgggggaat 840tagagctacc acaccccaga gggtggtatg gtatgttgtc tgttgtgagc tgtgtgaatc 900agagagtttg atttagacat atatttagaa agaggaaaga tgaaccaatc aaaaataata 960actataatga cttttcaaga tatagacaat acagttaaga tataaatgga aacaaaaaaa 1020gttaaaagtg gggagatgaa gtctgatttt ttggtttttt tttttttttg cttttttgtt 1080tgtttatgta atcagtgtta ccagtttaaa ataatgggtt ataagacact atatgcaagc 1140 ctcatggtaa cctccaatct aaaacataca acaaatacac acaaaataaa aaggagaaat 1200taaaacacac caccagagaa aatcacctac attaaaagaa agacaaatag gaagaaaata 1260agaaagagaa ggccatcaaa taatcagaaa atgaataaca aaatgacagg aataagtcct 1120cataaataat aacattgaat gtaaatggac taagctctcc aatgaaagac agggagtggc 1380tgaatgtatt ttaaaaaaaa tattacaccg agctgtgcgt ggtgtctcac acctataatc 1440ccagcatttt gggagactga gccgggtgga tcacttgagc ccaggagttc gagaccagcc 1500tggccaacat ggcaaaaccc tgtctctact aaaaatacaa aaaattagct gaacatggtg 1560gcacatgcct gtggttccag ctactagaga ggctgaggca gaagaattgc ttgaacttgg 1620gaggtggagg ttgcagtgag ctaagattga tggagccact gcaccccagc ctaggtgaca 1680gaataagact ctgcctcaaa aaaaaaaagc aaaacaaaac aaaacaaaaa acccttagac 1740ccaatgattc attgcctaca agaagtatgc ttcaccttta aagacacata tagactgaag 1800gtaaagggat ggaaaaatat tctatgccta tggaaacaaa caaaaagaag cagaagctac 1860atttatatca gacaaaatag actgcaagac aaaaactatg aaaagagaga aagaaggtca 1920ttatatagtg ataaaggggt ccatttagca agagcattta acaattctaa atatatattc 1980acccaatact ggagtactca ggtatataaa gcaaatatta ttagagccaa agagagagat 2040agacagaccc ccatacaata ataactggag acttcaacac cccactttca gcattggaca 2100gatcatccag acagaaaatt aacaaacatc aaatttcatc tgcaccatag gtcaaatgga 2160cctagtagat atttacagaa catttgatcc aacagctgta gaatacacat tcttctcctc 2220agcacatgga taattctcaa ggatatacca aatgctaggt cacaaaacaa atcttaaaat 2280ttagaaaaaa agtgaaataa tatcaaacgt tttctctcac cacagactaa gaaaaaaaga 2340agtcccaaat aaatacaatc tgagataaaa aaggagacga gacaaccaat accacaaaaa 2400attaaaggat cattagaaga tactatgaaa ctatatgcta ataaattgga aaacctgaac 2460aaaatagata attcctagaa acatacaaca tactggtctg ttcaggtttt gtattttttc 2520atagtaccat gaagaaatac aagaattgtt tctagaacca ttcttgtatt tcttcatggt 2580ttttgtattt cttcatggaa ccatgaagaa atacaaaatg tgaacaggcc aataacaagt 2640aatgagacag aagccatact aaaaagtatc ccagaaaaga actcaggatc tgatggcttc 2700actgatgaat tttgccaaat atttaaaaaa ctaataccaa tccaactcaa attattaaaa 2760aaatagaggt ggacagaatc tttccaaatg tattctatga ggccagtgtt ttttctgatt 2820gaatctccca ttatatttta atcacatata aaaccagaga aagacacatt aaaaagaaag 2880aaaactgtag gccaatatct ctgatgaaca ttgatgcaga aatcctcaac aacaaattag 2940caaactgaat tcaagaacac attaaaacaa tcattcatca tgaccaagtg gaatttgtcc 3000tagagattca agtgtggtta ggtatgtgca gatcaatggg tttaatgttg tccaatgaac 3060ataatgtcct ccagctccat ccatgttctt gcaaatgaca ggatctcatt cttttttatg 3120gctaagtagt actccattgt gtataagtgc catattttct ttatccattc atctgttaga 3180cacctaagtt gcttccaaat cttagctatt gtgaatagtg ctgcaataaa catgggagtg 3240taaatatttt gttgacatac tgatttcatt tcctttggat aaatacccag tagtgggatt 3300gctggatcat atgggggaaa atggagatgg ctaacgggct caaaaatata gttagaaaaa 3360atgaatatga tttagtattc gatagcacaa taggatgact actgttaatg ataatttatt 3420atatattata aaataactaa aatagtataa atgggatgta tgtagcagag agaaatgata 3480aatgtttgaa gcattggata ctccatcacc tgctgtgata ttatgaatgt ctgcctatat 3540aaatattcac tattccataa cacagcgcct cttatgtacc cacaaaaatc tattttcaaa 3600aaagttgctc taagaatata gttatcaagt taagtaaaat gtcaatagcc ttttaattta 3660atttttaatt gttttatcat tctttgcaat aataaaacat taactttata ctttttaatt 3720taatgtatag aatagagata tacataggat atgtaaatag atacacagtg tatatgtgat 3780taaaatataa tgggagattc aatcagaaaa aagtttctaa aaaggctctg gggtaaaaga 3840ggaaggaaac aataatgaaa aaaatgtggt gagaaaaaca gctgaaaacc catgtaaaga 3900gtgtataaag aaagcaaaaa gagaagtaga aagtaacaca ggggcatttg gaaaatgtaa 3960acgagtatgt tccctattta aggctaggca caaagcaagg tcttcagaga acctggagcc 4020taaggtttag gctcacccat ttcaaccagt ctagcagcat ctgcaacatc tacaatggcc 4080ttgacctttg 4090<210> 11<211> 3564<212> DNA<213> Homo sapiens<400> 11aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag ttcccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600 aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagtgcagg aaaggtggaa gattgatgat ttgggggaat 840tagagctacc acaccccaga gggtggtatg gtatgttgtc tgttgtgagc tgtgtgaatc 900agagagtttg atttagacat atatttagaa agaggaaaga tgaaccaatc aaaaataata 960actataatga cttttcaaga tatagacaat acagttaaga tataaatgga aacaaaaaaa 1020gttaaaagtg gggagatgaa gtctgatttt ttggtttttt tttttttttg cttttttgtt 1080tgtttatgta atcagtgtta ccagtttaaa ataatgggtt ataagacact atatgcaagc 1140ctcatggtaa cctccaatct aaaacataca acaaatacac acaaaataaa aaggagaaat 1200taaaacacac caccagagaa aatcacctac attaaaagaa agacaaatag gaagaaaata 1260agaaagagaa ggccatcaaa taatcagaaa atgaataaca aaatgacagg aataagtcct 1320cataaataat aacattgaat gtaaatggac taagctctcc aatgaaagac agggagtggc 1380tgaatgtatt ttaaaaaaaa tattacaccg agctgtgcgt ggtgtctcac acctataatc 1440ccagcatttt gggagactga gccgggtgga tcacttgagc ccaggagttc gagaccagcc 1500tggccaacat ggcaaaaccc tgtctctact aaaaatacaa aaaattagct gaacatggtg 1560gcacatgcct gtggttccag ctactagaga ggctgaggca gaagaattgc ttgaacttgg 1620gaggtggagg ttgcagtgag ctaagattga tggagccact gcaccccagc ctaggtgaca 1680gaataagact ctgcctcaaa aaaaaaaagc aaaacaaaac aaaacaaaaa acccttagac 1740ccaatgattc attgcctaca agaagtatgc ttcaccttta aagacacata tagactgaag 1800gtaaagggat ggaaaaatat tctatgccta tggaaacaaa caaaaagaag cagaagctac 1860atttatatca gacaaaatag actgcaagac aaaaactatg aaaagagaga aagaaggtca 1920ttatatagtg ataaaggggt ccatttagca agagcattta acaattctaa atatatattc 1980acccaatact ggagtactca ggtatataaa gcaaatatta ttagagccaa agagagagat 2040agacagaccc ccatacaata ataactggag acttcaacac cccactttca gcattggaca 2100gatcatcaag acagaaaatt aacaaacatc aaatttcatc tgcaccatag gtcaaatgga 2160cctagtagat atttacagaa catttgatcc aacagctgta gaatacacat tcttctcctc 2220agcacatgga taattctcaa ggatatacca aatgctaggt cacaaaacaa atcttaaaat 2280ttagaaaaaa agtgaaataa tatcaaacgt tttctctcac cacagactaa gaaaaaaaga 2340agtcccaaat aaatacaatc tgagataaaa aaggagacga gacaaccaat accacaaaaa 2400attaaaggat cattagaaga tactatgaaa ctatatgcta ataaattgga aaacctgaac 2460aaaatagata attcctagaa acatacaaca tactggtctg ttcaggtttt gtattttttc 2520atagtaccat gaagaaatac aagaattgtt tctagaacca ttcttgtatt tcttcatggt 2580ttttgtattt cttcatggaa ccatgaagaa atacaaaatg tgaacaggcc aataacaagt 2640aatgagacag aagccatact aaaaagtatc ccagaaaaga actcaggatc tgatggcttc 2700actgatgaat tttgccaaat atttaaaaaa ctaataccaa tccaactcaa attattaaaa 2760aaatagaggt ggacagaatc tttccaaatg tattctatga ggccagtgtt ttttctgatt 2820gaatctccca ttatatttta atcacatata aaaccagaga aagacacatt aaaaagaaag 2880aaaactgtag gccaatatct ctgatgaaca ttgatgcaga aatcctcaac aacaaattag 2940caaactgaat tcaagaacac attaaaacaa tcattcatca tgaccaagtg gaatttgtcc 3000tagagattca agtgtggtta ggtatgtgca gatcaatggg tttaatgttg tccaatgaac 3060ataatgtcct ccagctccat ccatgttctt gcaaatgaca ggatctcatt cttttttatg 3120gctaagtagt actccattgt gtataagtgc catattttct ttatccattc atctgttaga 3180cacctaagtt gcttccaaat cttagctatt gtgaatagtg ctgcaataaa catgggagtg 3240taaatatttt gttgacatac tgatttcatt tcctttggat aaatacccag tagtgggatt 3300gctggatcat atgggggaaa atggagatgg ctaacgggct caaaaatata gttagaaaaa 3360atgaatatga tttagtattc gatagcacaa taggatgact actgttaatg ataatttatt 3420atatattata aaataactaa aatagtataa atgggatgta tgtagcagag agaaatgata 3480aatgtttgaa gcattggata ctccatcacc tgctgtgata ttatgaatgt ctgcctatat 3540aaatattcac tattccataa caca 3564<210> 12<211> 3213<212> DNA<213> Homo sapiens<400> 12actaacataa agctgaaggt gaataaaaaa atcagggtta gccaaacaaa ttttcatggt 60caaataccac ataaaaagta aatatactta agttcccagc aaaatctgaa ttgaacgtag 120acaaaatgct catttctcag tgtttgacag acttaacagt ttgagccaat aaaaatgtac 180tgactagata aactactaaa agttgttaat ttttgcaatg tatatttctg aaaagaaagt 240ttatctatta tagaaattcc tgtgcccatt taagaacttt gagcatttta attgtttaat 300aatatagttt aattgcatca tgaaaataat caataataca atttatttgg tttatttaaa 360aaaactgatt ctttctgctc tctctataca tagactgatt ttatactaat gttgcctaaa 420gatcaccaaa ttgtttgaag cctaggtttc tgagggatgg aaaatgatgt cacaactatt 480tacagttcac acacacattc tggggattta atacatcctt tacaagtgca ggaaaggtgg 540aagattgatg atttggggga attagagcta ccacacccca gagggtggta tggtatgttg 600tctgttgtga gctgtgtgaa tcagagagtt tgatttagac atatatttag aaagaggaaa 660gatgaaccaa tcaaaaataa taactataat gacttttcaa gatatagaca atacagttaa 720gatataaatg gaaacaaaaa aagttaaaag tggggagatg aagtctgatt ttttggtttt 780tttttttttt tgcttttttg tttgtttatg taatcagtgt taccagttta aaataatggg 840ttataagaca ctatatgcaa gcctcatggt aacctccaat ctaaaacata caacaaatac 900acacaaaata aaaaggagaa attaaaacac accaccagag aaaatcacct acattaaaag 960aaagacaaat aggaagaaaa taagaaagag aaggccatca aataatcaga aaatgaataa 1020caaaatgaca ggaataagtc ctcataaata ataacattga atgtaaatgg actaagctct 1080ccaatgaaag acagggagtg gctgaatgta ttttaaaaaa aatattacac cgagctgtgc 1140gtggtgtctc acacctataa tcccagcatt ttgggagact gagccgggtg gatcacttga 1200gcccaggagt tcgagaccag cctggccaac atggcaaaac cctgtctcta ctaaaaatac 1260aaaaaattag ctgaacatgg tggcacatgc ctgtggttcc agctactaga gaggctgagg 1320cagaagaatt gcttgaactt gggaggtgga ggttgcagtg agctaagatt gatggagcca 1380ctgcacccca gcctaggtga cagaataaga ctctgcctca aaaaaaaaaa gcaaaacaaa 1440acaaaacaaa aaacccttag acccaatgat tcattgccta caagaagtat gcttcacctt 1500taaagacaca tatagactga aggtaaaggg atggaaaaat attctatgcc tatggaaaca 1560aacaaaaaga agcagaagct acatttatat cagacaaaat agactgcaag acaaaaacta 1620tgaaaagaga gaaagaaggt cattatatag tgataaaggg gtccatttag caagagcatt 1680taacaattct aaatatatat tcacccaata ctggagtact caggtatata aagcaaatat 1740tattagagcc aaagagagag atagacagac ccccatacaa taataactgg agacttcaac 1800accccacttt cagcattgga cagatcatcc agacagaaaa ttaacaaaca tcaaatttca 1860tctgcaccat aggtcaaatg gacctagtag atatttacag aacatttgat ccaacagctg 1920tagaatacac attcttctcc tcagcacatg gataattctc aaggatatac caaatgctag 1980gtcacaaaac aaatcttaaa atttagaaaa aaagtgaaat aatatcaaac gttttctctc 2040accacagact aagaaaaaaa gaagtcccaa ataaatacaa tctgagataa aaaaggagac 2100gagacaacca ataccacaaa aaattaaagg atcattagaa gatactatga aactatatgc 2160taataaattg gaaaacctga acaaaataga taattcctag aaacatacaa catactggtc 2220tgttcaggtt ttgtattttt tcatagtacc atgaagaaat acaagaattg tttctagaac 2280cattcttgta tttcttcatg gtttttgtat ttcttcatgg aaccatgaag aaatacaaaa 2340tgtgaacagg ccaataacaa gtaatgagac agaagccata ctaaaaagta tcccagaaaa 2400gaactcagga tctgatggct tcactgatga attttgccaa atatttaaaa aactaatacc 2460aatccaactc aaattattaa aaaaatagag gtggacagaa tctttccaaa tgtattctat 2520gaggccagtg ttttttctga ttgaatctcc cattatattt taatcacata taaaaccaga 2580gaaagacaca ttaaaaagaa agaaaactgt aggccaatat ctctgatgaa cattgatgca 2640gaaatcctca acaacaaatt agcaaactga attcaagaac acattaaaac aatcattcat 2700catgaccaag tggaatttgt cctagagatt caagtgtggt taggtatgtg cagatcaatg 2760ggtttaatgt tgtccaatga acataatgtc ctccagctcc atccatgttc ttgcaaatga 2820caggatctca ttctttttta tggctaagta gtactccatt gtgtataagt gccatatttt 2880ctttatccat tcatctgtta gacacctaag ttgcttccaa atcttagcta ttgtgaatag 2940tgctgcaata aacatgggag tgtaaatatt ttgttgacat actgatttca tttcctttgg 3000ataaataccc agtagtggga ttgctggatc atatggggga aaatggagat ggctaacggg 3060ctcaaaaata tagttagaaa aaatgaatat gatttagtat tcgatagcac aataggatga 3120ctactgttaa tgataattta ttatatatta taaaataact aaaatagtat aaatgggatg 3180tatgtagcag agagaaatga taaatgtttg aag 3213<210> 13<211> 3033<212> DNA<213> Homo sapiens<400> 13actaacataa agctgaaggt gaataaaaaa atcagggtta gccaaacaaa ttttcatggt 60caaataccac ataaaaagta aatatactta agttcccagc aaaatctgaa ttgaacgtag 120acaaaatgct catttctcag tgtttgacag acttaacagt ttgagccaat aaaaatgtac 180tgactagata aactactaaa agttgttaat ttttgcaatg tatatttctg aaaagaaagt 240ttatctatta tagaaattcc tgtgcccatt taagaacttt gagcatttta attgtttaat 300aatatagttt aattgcatca tgaaaataat caataataca atttatttgg tttatttaaa 360aaaactgatt ctttctgctc tctctatata tagactgatt ttatactaat gttgcctaaa 420gatcaccaaa ttgtttgaag cctaggtttc tgagggatgg aaaatgatgt cacaactatt 480tacagttcac acacacattc tggggattta atacatcctt tacaagtgca ggaaaggtgg 540aagattgatg atttggggga attagagcta ccacacccca gagggtggta tggtatgttg 600tctgttgtga gctgtgtgaa tcagagagtt tgatttagac atatatttag aaagaggaaa 660gatgaaccaa tcaaaaataa taactataat gacttttcaa gatatagaca atacagttaa 720gatataaatg gaaacaaaaa aagttaaaag tggggagatg aagtctgatt ttttggtttt 780tttttttttt tgcttttttg tttgtttatg taatcagtgt taccagttta aaataatggg 840ttataagaca ctatatgcaa gcctcatggt aacctccaat ctaaaacata caacaaatac 900acacaaaata aaaaggagaa attaaaacac accaccagag aaaatcacct acattaaaag 960aaagacaaat aggaagaaaa taagaaaga9 aaggccatca aataatcaga aaatgaataa 1020caaaatgaca ggaataagtc ctcataaata ataacattga atgtaaatgg actaagctct 1080ccaatgaaag acagggagtg gctgaatgta ttttaaaaaa aatattacac cgagctgtgc 1140gtggtgtctc acacctataa tcccagcatt ttgggagact gagccgggtg gatcacttga 1200gcccaggagt tcgagaccag cctggccaac atggcaaaac cctgtctcta ctaaaaatac 1260aaaaaattag ctgaacatgg tggcacatgc ctgtggttcc agctactaga gaggctgagg 1320cagaagaatt gcttgaactt gggaggtgga ggttgcagtg agctaagatt gatggagcca 1380ctgcacccca gcctaggtga cagaataaga ctctgcctca aaaaaaaaaa gcaaaacaaa 1440acaaaacaaa aaacccttag acccaatgat tcattgccta caagaagtat gcttcacctt 1500taaagacaca tatagactga aggtaaaggg atggaaaaat attctatgcc tatggaaaca 1560aacaaaaaga agcagaagct acatttatat cagacaaaat agactgcaag acaaaaacta 1620tgaaaagaga gaaagaaggt cattatatag tgataaaggg gtccatttag caagagcatt 1680taacaattct aaatatatat tcacccaata ctggagtact caggtatata aagcaaatat 1740tattagagcc aaagagagag atagacagac ccccatacaa taataactgg agacttcaac 1800accccacttt cagcattgga cagatcatcc agacagaaaa ttaacaaaca tcaaatttca 1860tctgcaccat aggtcaaatg gacctagtag atatttacag aacatttgat ccaacagctg 1920tagaatacac attcttctcc tcagcacatg gataattctc aaggatatac caaatgctag 1980gtcacaaaac aaatcttaaa atttagaaaa aaagtgaaat aatatcaaac gttttctctc 2040accacagact aagaaaaaaa gaagtcccaa ataaatacaa tctgagataa aaaaggagac 2100gagacaacca ataccacaaa aaattaaagg atcattagaa gatactatga aactatatgc 2160taataaattg gaaaacctga acaaaataga taattcctag aaacatacaa catactggtc 2220tgttcaggtt ttgtattttt tcatagtacc atgaagaaat acaagaattg tttctagaac 2280cattcttgta tttcttcatg gtttttgtat ttcttcatgg aaccatgaag aaatacaaaa 2340tgtgaacagg ccaataacaa gtaatgagac agaagccata ctaaaaagta tcccagaaaa 2400gaactcagga tctgatggct tcactgatga attttgccaa atatttaaaa aactaatacc 2460aatccaactc aaattattaa aaaaatagag gtggacagaa tctttccaaa tgtattctat 2520gaggccagtg ttttttctga ttgaatctcc cattatattt taatcacata taaaaccaga 2580gaaagacaca ttaaaaagaa agaaaactgt aggccaatat ctctgatgaa cattgatgca 2640gaaatcctca acaacaaatt agcaaactga attcaagaac acattaaaac aatcattcat 2700catgaccaag tggaatttgt cctagagatt caagtgtggt taggtatgtg cagatcaatg 2760ggtttaatgt tgtccaatga acataatgtc ctccagctcc atccatgttc ttgcaaatga 2820caggatctca ttctttttta tggctaagta gtactccatt gtgtataagt gccatatttt 2880ctttatccat tcatctgtta gacacctaag ttgcttccaa atcttagcta ttgtgaatag 2940tgctgcaata aacatgggag tgtaaatatt ttgttgacat actgatttca tttcctttgg 3000ataaataccc agtagtggga ttgctggatc ata 3033<210> 14<211> 137<212> DNA<213> Homo sapiens<400> 14gagaacctgg agcctaaggt ttaggctcac ccatttcaac cagtctagca gcatctgcaa 60catctacaat ggccttgacc tttgctttac tggtggccct cctggtgctc agctgcaagt 120caagctgctc tgtgggc 137<210> 15<211> 805<212> DNA<213> Homo sapiens<400> 15 aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag tccccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagt 805<210> 16<211> 29<212> DNA<213> Homo sapiens<400> 16aggaaaggtg gaagattgat gatttgggg 29<210> 17<211> 105<212> DNA<213> Homo sapiens<400> 17ggggaattag agctaccaca ccccagaggg tggtatggta tgttgtctgt tgtgagctgt 60gtgaatcaga gagtttgatt tagacatata tttagaaaga ggaaa 105<210> 18<211> 2629<212> DNA<213> Homo sapiens<400> 18 aaagatgaac caatcaaaaa taataactat aatgactttt caagatatag acaatacagt 60taagatataa atggaaacaa aaaaagttaa aagtggggag atgaagtctg attttttggt 120tttttttttt ttttgctttt ttgtttgttt atgtaatcag tgttaccagt ttaaaataat 180gggttataag acactatatg caagcctcat ggtaacctcc aatctaaaac atacaacaaa 240tacacacaaa ataaaaagga gaaattaaaa cacaccacca gagaaaatca cctacattaa 300aagaaagaca aataggaaga aaataagaaa gagaaggcca tcaaataatc agaaaatgaa 360taacaaaatg acaggaataa gtcctcataa ataataacat tgaatgtaaa tggactaagc 420tctccaatga aagacaggga gtggctgaat gtattttaaa aaaaatatta caccgagctg 480tgcgtggtgt ctcacaccta taatcccagc attttgggag actgagccgg gtggatcact 540tgagcccagg agttcgagac cagcctggcc aacatggcaa aaccctgtct ctactaaaaa 600tacaaaaaat tagctgaaca tggtggcaca tgcctgtggt tccagctact agagaggctg 660aggcagaaga attgcttgaa cttgggaggt ggaggttgca gtgagctaag attgatggag 720ccactgcacc ccagcctagg tgacagaata agactctgcc tcaaaaaaaa aaagcaaaac 780aaaacaaaac aaaaaaccct tagacccaat gattcattgc ctacaagaag tatgcttcac 840ctttaaagac acatatagac tgaaggtaaa gggatggaaa aatattctat gcctatggaa 900acaaacaaaa agaagcagaa gctacattta tatcagacaa aatagactgc aagacaaaaa 960ctatgaaaag agagaaagaa ggtcattata tagtgataaa ggggtccatt tagcaagagc 1020atttaacaat tctaaatata tattcaccca atactggagt actcaggtat ataaagcaaa 1080tattattaga gccaaagaga gagatagaca gacccccata caataataac tggagacttc 1140aacaccccac tttcagcatt ggacagatca tccagacaga aaattaacaa acatcaaatt 1200tcatctgcac cataggtcaa atggacctag tagatattta cagaacattt gatccaacag 1260ctgtagaata cacattcttc tcctcagcac atggataatt ctcaaggata taccaaatgc 1320taggtcacaa aacaaatctt aaaatttaga aaaaaagtga aataatatca aacgttttct 1380ctcaccacag actaagaaaa aaagaagtcc caaataaata caatctgaga taaaaaagga 1440gacgagacaa ccaataccac aaaaaattaa aggatcatta gaagatacta tgaaactata 1500tgctaataaa ttggaaaacc tgaacaaaat agataattcc tagaaacata caacatactg 1560gtctgttcag gttttgtatt ttttcatagt accatgaaga aatacaagaa ttgtttctag 1620aaccattctt gtatttcttc atggtttttg tatttcttca tggaaccatg aagaaataca 1680aaatgtgaac aggccaataa caagtaatga gacagaagcc atactaaaaa gtatcccaga 1740aaagaactca ggatctgatg gcttcactga tgaattttgc caaatattta aaaaactaat 1800accaatccaa ctcaaattat taaaaaaata gaggtggaca gaatctttcc aaatgtattc 1860tatgaggcca gtgttttttc tgattgaatc tcccattata ttttaatcac atataaaacc 1920agagaaagac acattaaaaa gaaagaaaac tgtaggccaa tatctctgat gaacattgat 1980gcagaaatcc tcaacaacaa attagcaaac tgaattcaag aacacattaa aacaatcatt 2040catcatgacc aagtggaatt tgtcctagag attcaagtgt ggttaggtat gtgcagatca 2100atgggtttaa tgttgtccaa tgaacataat gtcctccagc tccatccatg ttcttgcaaa 2160tgacaggatc tcattctttt ttatggctaa gtagtactcc attgtgtata agtgccatat 2220tttctttatc cattcatctg ttagacacct aagttgcttc caaatcttag ctattgtgaa 2280tagtgctgca ataaacatgg gagtgtaaat attttgttga catactgatt tcatttcctt 2340tggataaata cccagtagtg ggattgctgg atcatatggg ggaaaatgga gatggctaac 2400gggctcaaaa atatagttag aaaaaatgaa tatgatttag tattcgatag cacaatagga 2460tgactactgt taatgataat ttattatata ttataaaata actaaaatag tataaatggg 2520atgtatgtag cagagagaaa tgataaatgt ttgaagcatt ggatactcca tcacctgctg 2580tgatattatg aatgtctgcc tatataaata ttcactattc cataacaca 2629<210> 19<211> 14<212> DNA<213> Homo sapiens<220><221> misc_特征<222> (1)…(14)<223> n=A,T,C或G<400> 19yyyyyyyyyy nyag 14
Claims (46)
1.一种DNA构建物,该DNA构建物当通过同源重组整合到哺乳动物细胞基因组中时,在该细胞中改变内源IFNA2基因的表达,该构建物包含(ⅰ)包含SEQ ID NO:12的至少20个连续核苷酸的导向序列,和(ⅱ)转录调节序列。
2.权利要求1的DNA构建物,其中所述构建物还包含外显子、剪接供体位点、内含子和剪接受体位点。
3.权利要求1的DNA构建物,其中所述构建物还包含选择性标记基因。
4.权利要求1的DNA构建物,其中所述导向序列包含SEQ IDNO:12的至少50个连续核苷酸。
5.一种DNA构建物,该DNA构建物当通过同源重组整合到哺乳动物细胞基因组中时,在该细胞中改变内源IFNA2基因的表达,该构建物包含(ⅰ)包含SEQ ID NO:7的至少20个连续核苷酸的导向序列,和(ⅱ)转录调节序列。
6.权利要求5的DNA构建物,其中所述构建物还包含外显子、剪接供体位点、内含子和剪接受体位点。
7.一种DNA构建物,该DNA构建物当通过同源重组整合到哺乳动物细胞基因组中时,在该细胞中改变内源IFNA2基因的表达,该构建物包含(ⅰ)包含SEQ ID NO:8的至少20个连续核苷酸的导向序列,和(ⅱ)转录调节序列。
8.权利要求7的DNA构建物,其中所述构建物还包含外显子、剪接供体位点、内含子和剪接受体位点。
9.包含SEQ ID NO:12或其互补物的至少20个连续核苷酸的分离的核酸,其中所述分离的核酸不编码全长干扰素-α2。
10.权利要求9的分离的核酸,其中所述分离的核酸包含SEQ IDNO:12或其互补物的至少50个连续的核苷酸。
11.权利要求9的分离的核酸,其中所述分离的核酸包含SEQID NO:12或其互补物的至少100个连续的核苷酸。
12.权利要求9的分离的核酸,其中所述分离的核酸包含SEQID NO:12或其互补物的至少200个连续的核苷酸。
13.权利要求9的分离的核酸,其中所述分离的核酸包含SEQID NO:7或其互补物。
14.权利要求9的分离的核酸,其中所述分离的核酸包含SEQID NO:8或其互补物。
15.权利要求9的分离的核酸,其中所述分离的核酸包含SEQID NO:12或其互补物。
16.权利要求9的分离的核酸,其中所述分离的核酸包含SEQID NO:7或其互补物的至少20个连续的核苷酸。
17.权利要求9的分离的核酸,其中所述分离的核酸包含SEQID NO:8或其互补物的至少20个连续的核苷酸。
18.一种分离的核酸,它包含含有核苷酸序列的链,所述核苷酸序列(ⅰ)为至少100个核苷酸长并(ⅱ)在高度严格条件下与SEQ IDNO:12或SEQ ID NO:12的互补物杂交。
19.权利要求18的分离的核酸,其中所述核苷酸序列为至少200个核苷酸长。
20.权利要求18的分离的核酸,其中所述核苷酸序列为至少400个核苷酸长。
21.权利要求18的分离的核酸,其中所述核苷酸序列为至少1000个核苷酸长。
22.包含含有核苷酸序列的链的分离的核酸,所述核苷酸序列(ⅰ)为至少100个核苷酸长并(ⅱ)在高度严格条件下与SEQ ID NO:7或SEQID NO:7的互补物杂交。
23.包含含有核苷酸序列的链的分离的核酸,所述核苷酸序列(ⅰ)为至少50个核苷酸长并(ⅱ)在高度严格条件下与SEQ ID NO:8或SEQID NO:8的互补物杂交。
24.包含含有核苷酸序列的链的分离的核酸,所述核苷酸序列(ⅰ)为至少50个核苷酸长并(ⅱ)和与其具有同样长度的SEQ ID NO:12的核苷酸序列片段具有至少80%的序列同一性。
25.权利要求24的分离的核酸,其中所述核苷酸序列为至少100个核苷酸长。
26.权利要求24的分离的核酸,其中所述片段为SEQ ID NO:7的部分或全部。
27.权利要求24的分离的核酸,其中所述片段为SEQ ID NO:8的部分或全部。
28.用权利要求1的DNA构建物稳定转染的同源重组哺乳动物细胞,所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。
29.用权利要求2的DNA构建物稳定转染的同源重组哺乳动物细胞,所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。
30.用权利要求3的DNA构建物稳定转染的同源重组细胞,所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。
31.用权利要求4的DNA构建物稳定转染的同源重组细胞,所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。
32.改变内源IFNA2基因在哺乳动物细胞中表达的方法,该方法包括将权利要求1的DNA构建物引入到所述细胞中,并将所述细胞保持在允许所述构建物和内源IFNA2基因的编码序列的5′靶位点之间发生同源重组的条件下。
33.将IFNA2传递给动物的方法,包括提供权利要求28的细胞;并将该细胞植入到所述动物中,其中所述细胞分泌IFNA2。
34.将IFNA2传递给动物的方法,包括提供权利要求29的细胞;并将该细胞植入到所述动物中,其中所述细胞分泌IFNA2。
35.将IFNA2传递给动物的方法,包括提供权利要求30的细胞;并将该细胞植入到所述动物中,其中所述细胞分泌IFNA2。
36.将IFNA2传递给动物的方法,包括提供权利要求31的细胞;并将该细胞植入到所述动物中,其中所述细胞分泌IFNA2。
37.产生IFNA2的方法,包括提供权利要求28的细胞,并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。
38.产生IFNA2的方法,包括提供权利要求29的细胞,并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。
39.产生IFNA2的方法,包括提供权利要求30的细胞,并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。
40.产生IFNA2的方法,包括提供权利要求31的细胞,并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。
41.当通过同源重组整合到哺乳动物细胞的基因组中时,在该细胞中改变内源IFNA2基因表达的DNA构建物,该构建物包含(ⅰ)含有SEQ ID NO:16、17、18和19中的一个或多个的至少20个连续核苷酸的导向序列,和(ⅱ)转录调节序列。
42.包含SEQ ID NO:16、17、18和19中的一个或多个的至少20个连续核苷酸、或包含SEQ ID NO:16、17、18和19中的一个或多个的互补物中的至少20个连续核苷酸的分离的核酸,其中所述分离的核酸不编码全长干扰素-α2。
43.用权利要求39的DNA构建物稳定转染的同源重组哺乳动物细胞,所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。
44.改变内源IFNA2基因在哺乳动物细胞中表达的方法,该方法包括将权利要求39的DNA构建物引入到所述细胞中,并将所述细胞保持在允许所述构建物和所述内源IFNA2基因的编码序列的5′靶位点之间发生同源重组的条件下。
45.将IFNA2传递给动物的方法,包括提供权利要求41的细胞;并将该细胞植入到所述动物中,其中所述细胞分泌IFNA2。
46.产生IFA2的方法,包括提供权利要求41的细胞,并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US8464898P | 1998-05-07 | 1998-05-07 | |
US60/084,648 | 1998-05-07 | ||
US8655598P | 1998-05-21 | 1998-05-21 | |
US60/086,555 | 1998-05-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1309710A true CN1309710A (zh) | 2001-08-22 |
Family
ID=26771248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN99808195A Pending CN1309710A (zh) | 1998-05-07 | 1999-05-05 | 用于产生和传递蛋白的IFN-α2基因编码区上游的基因组序列 |
Country Status (14)
Country | Link |
---|---|
EP (1) | EP1075531A1 (zh) |
JP (1) | JP2002513580A (zh) |
KR (1) | KR20010052278A (zh) |
CN (1) | CN1309710A (zh) |
AR (1) | AR016264A1 (zh) |
AU (1) | AU3788899A (zh) |
CA (1) | CA2328459A1 (zh) |
CZ (1) | CZ299418B6 (zh) |
HU (1) | HUP0102517A3 (zh) |
IL (1) | IL139433A0 (zh) |
NO (1) | NO20005585L (zh) |
PL (1) | PL344517A1 (zh) |
TR (1) | TR200003271T2 (zh) |
WO (1) | WO1999057292A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001042442A2 (en) | 1999-12-10 | 2001-06-14 | Cytos Biotechnology Ag | Activation of endogenous genes by genomic introduction of a replicon |
FR2817559B1 (fr) * | 2000-12-06 | 2003-12-12 | Genodyssee | Procede de determination d'un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d'un gene "candidat" fonctionnel preselectionne et ses applications |
CN103620034B (zh) * | 2011-04-13 | 2016-12-14 | 加拿大国家研究委员会 | 具有来自IFNα2的SAR元件的表达系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5641670A (en) * | 1991-11-05 | 1997-06-24 | Transkaryotic Therapies, Inc. | Protein production and protein delivery |
-
1999
- 1999-05-05 HU HU0102517A patent/HUP0102517A3/hu unknown
- 1999-05-05 WO PCT/US1999/009925 patent/WO1999057292A1/en not_active Application Discontinuation
- 1999-05-05 JP JP2000547246A patent/JP2002513580A/ja active Pending
- 1999-05-05 AU AU37888/99A patent/AU3788899A/en not_active Abandoned
- 1999-05-05 CZ CZ20003705A patent/CZ299418B6/cs not_active IP Right Cessation
- 1999-05-05 EP EP99920375A patent/EP1075531A1/en not_active Withdrawn
- 1999-05-05 CA CA002328459A patent/CA2328459A1/en not_active Abandoned
- 1999-05-05 KR KR1020007012066A patent/KR20010052278A/ko not_active Application Discontinuation
- 1999-05-05 TR TR2000/03271T patent/TR200003271T2/xx unknown
- 1999-05-05 PL PL99344517A patent/PL344517A1/xx not_active Application Discontinuation
- 1999-05-05 CN CN99808195A patent/CN1309710A/zh active Pending
- 1999-05-05 IL IL13943399A patent/IL139433A0/xx unknown
- 1999-05-06 AR ARP990102133A patent/AR016264A1/es not_active Application Discontinuation
-
2000
- 2000-11-06 NO NO20005585A patent/NO20005585L/no not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
HUP0102517A2 (hu) | 2001-11-28 |
AU3788899A (en) | 1999-11-23 |
JP2002513580A (ja) | 2002-05-14 |
IL139433A0 (en) | 2001-11-25 |
CZ299418B6 (cs) | 2008-07-16 |
NO20005585D0 (no) | 2000-11-06 |
NO20005585L (no) | 2001-01-05 |
HUP0102517A3 (en) | 2004-06-28 |
AR016264A1 (es) | 2001-06-20 |
WO1999057292A1 (en) | 1999-11-11 |
CA2328459A1 (en) | 1999-11-11 |
PL344517A1 (en) | 2001-11-05 |
CZ20003705A3 (cs) | 2001-04-11 |
EP1075531A1 (en) | 2001-02-14 |
WO1999057292A9 (en) | 1999-12-16 |
TR200003271T2 (tr) | 2001-03-21 |
KR20010052278A (ko) | 2001-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113412818B (zh) | 具有人源化分化簇274基因的非人动物 | |
AU725832B2 (en) | Protein production and delivery | |
KR20090117675A (ko) | 도처에 있는 염색질 개방 요소(유씨오이)를 포함하는 폴리뉴클레오티드 | |
AU3788799A (en) | Genomic sequences upstream of the coding region of the g-csf gene for protein production and delivery | |
CN1308673A (zh) | 通过同源重组修饰FSHβ基因的表达 | |
CN1309710A (zh) | 用于产生和传递蛋白的IFN-α2基因编码区上游的基因组序列 | |
KR20140015999A (ko) | 신규 MARs 및 이를 이용하여 목적 단백질을 생산하는 방법 | |
Orkin | Molecular genetics and potential gene therapy | |
CN112301056B (zh) | 一种针对人源化免疫系统小鼠的基因编辑方法及其用途 | |
CN117642187A (zh) | 用于治疗听力损失的基因疗法构建体和方法 | |
EP2307550A2 (en) | Transfer vehicle for producing proteins in transgenic animals | |
Johnston | Coordinate expression of neutrophil secondary granule protein genes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1078079 Country of ref document: HK |