JP2004523211A - 高温ポリメラーゼ活性を有する酵素およびその使用方法 - Google Patents
高温ポリメラーゼ活性を有する酵素およびその使用方法 Download PDFInfo
- Publication number
- JP2004523211A JP2004523211A JP2002525742A JP2002525742A JP2004523211A JP 2004523211 A JP2004523211 A JP 2004523211A JP 2002525742 A JP2002525742 A JP 2002525742A JP 2002525742 A JP2002525742 A JP 2002525742A JP 2004523211 A JP2004523211 A JP 2004523211A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- nucleic acid
- polypeptide
- seq
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 245
- 230000000694 effects Effects 0.000 title claims abstract description 82
- 102000004190 Enzymes Human genes 0.000 title claims description 92
- 108090000790 Enzymes Proteins 0.000 title claims description 92
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 115
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 115
- 239000002157 polynucleotide Substances 0.000 claims abstract description 115
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims abstract description 60
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims abstract description 60
- 150000007523 nucleic acids Chemical class 0.000 claims description 302
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 301
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 290
- 229920001184 polypeptide Polymers 0.000 claims description 289
- 102000039446 nucleic acids Human genes 0.000 claims description 241
- 108020004707 nucleic acids Proteins 0.000 claims description 241
- 108020004414 DNA Proteins 0.000 claims description 169
- 125000003729 nucleotide group Chemical group 0.000 claims description 130
- 239000002773 nucleotide Substances 0.000 claims description 125
- 108090000623 proteins and genes Proteins 0.000 claims description 94
- 238000006243 chemical reaction Methods 0.000 claims description 90
- 239000012634 fragment Substances 0.000 claims description 89
- 239000000523 sample Substances 0.000 claims description 78
- 150000001413 amino acids Chemical class 0.000 claims description 69
- 230000000295 complement effect Effects 0.000 claims description 64
- 102000053602 DNA Human genes 0.000 claims description 61
- 238000004422 calculation algorithm Methods 0.000 claims description 61
- 239000013598 vector Substances 0.000 claims description 60
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 58
- 102000004169 proteins and genes Human genes 0.000 claims description 53
- 238000002703 mutagenesis Methods 0.000 claims description 52
- 231100000350 mutagenesis Toxicity 0.000 claims description 52
- 108091034117 Oligonucleotide Proteins 0.000 claims description 36
- 238000004458 analytical method Methods 0.000 claims description 34
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 33
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 32
- 238000004519 manufacturing process Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 28
- 150000003384 small molecules Chemical class 0.000 claims description 25
- 230000014509 gene expression Effects 0.000 claims description 23
- 239000002299 complementary DNA Substances 0.000 claims description 19
- 238000013500 data storage Methods 0.000 claims description 19
- 239000013612 plasmid Substances 0.000 claims description 19
- 239000011942 biocatalyst Substances 0.000 claims description 17
- 230000002210 biocatalytic effect Effects 0.000 claims description 17
- 230000004048 modification Effects 0.000 claims description 17
- 238000012986 modification Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 16
- 239000000203 mixture Substances 0.000 claims description 16
- 239000001226 triphosphate Substances 0.000 claims description 14
- 235000011178 triphosphate Nutrition 0.000 claims description 14
- 239000000758 substrate Substances 0.000 claims description 13
- 238000001727 in vivo Methods 0.000 claims description 11
- 108020004999 messenger RNA Proteins 0.000 claims description 11
- 230000002829 reductive effect Effects 0.000 claims description 11
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 11
- 238000003556 assay Methods 0.000 claims description 10
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 10
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 10
- -1 7-deaza-dGTP Chemical compound 0.000 claims description 9
- 239000005549 deoxyribonucleoside Substances 0.000 claims description 9
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 9
- 238000012408 PCR amplification Methods 0.000 claims description 8
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 8
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 8
- 230000001965 increasing effect Effects 0.000 claims description 8
- 108010010677 Phosphodiesterase I Proteins 0.000 claims description 7
- 230000001568 sexual effect Effects 0.000 claims description 7
- 230000004075 alteration Effects 0.000 claims description 6
- 238000007845 assembly PCR Methods 0.000 claims description 6
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 6
- 229930010555 Inosine Natural products 0.000 claims description 5
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 claims description 5
- 238000012219 cassette mutagenesis Methods 0.000 claims description 5
- 239000007795 chemical reaction product Substances 0.000 claims description 5
- 229960003786 inosine Drugs 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 5
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 claims description 4
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 claims description 4
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 claims description 4
- ZXZIQGYRHQJWSY-NKWVEPMBSA-N [hydroxy-[[(2s,5r)-5-(6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 ZXZIQGYRHQJWSY-NKWVEPMBSA-N 0.000 claims description 4
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 claims description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 claims description 3
- 230000001747 exhibiting effect Effects 0.000 claims description 3
- 239000007788 liquid Substances 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- PJHMNWIITGYZDY-UHFFFAOYSA-N 6-amino-1h-pyrimidin-2-one;guanidine Chemical compound NC(N)=N.NC=1C=CNC(=O)N=1 PJHMNWIITGYZDY-UHFFFAOYSA-N 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 230000009088 enzymatic function Effects 0.000 claims description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 2
- 239000013641 positive control Substances 0.000 claims description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims 4
- 239000002853 nucleic acid probe Substances 0.000 claims 4
- 230000008439 repair process Effects 0.000 claims 3
- 230000000155 isotopic effect Effects 0.000 claims 1
- 230000000869 mutational effect Effects 0.000 claims 1
- 230000002441 reversible effect Effects 0.000 claims 1
- 241001143203 Fumaria Species 0.000 abstract description 9
- 235000006961 Fumaria officinalis Nutrition 0.000 abstract description 9
- 235000001014 amino acid Nutrition 0.000 description 83
- 210000004027 cell Anatomy 0.000 description 74
- 238000003752 polymerase chain reaction Methods 0.000 description 73
- 229940024606 amino acid Drugs 0.000 description 68
- 229940088598 enzyme Drugs 0.000 description 67
- 239000013615 primer Substances 0.000 description 67
- 230000008569 process Effects 0.000 description 62
- 238000009396 hybridization Methods 0.000 description 55
- 229910052757 nitrogen Inorganic materials 0.000 description 55
- 235000018102 proteins Nutrition 0.000 description 50
- 230000006798 recombination Effects 0.000 description 43
- 238000005215 recombination Methods 0.000 description 40
- 230000015572 biosynthetic process Effects 0.000 description 32
- 239000000047 product Substances 0.000 description 32
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 31
- 238000003199 nucleic acid amplification method Methods 0.000 description 30
- 230000003321 amplification Effects 0.000 description 29
- 238000003786 synthesis reaction Methods 0.000 description 27
- 239000000126 substance Substances 0.000 description 26
- 230000035772 mutation Effects 0.000 description 24
- 108020004705 Codon Proteins 0.000 description 20
- 150000001875 compounds Chemical class 0.000 description 20
- 239000000872 buffer Substances 0.000 description 19
- 239000000243 solution Substances 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 18
- 239000013604 expression vector Substances 0.000 description 17
- 108091026890 Coding region Proteins 0.000 description 16
- 108700005078 Synthetic Genes Proteins 0.000 description 15
- 238000012217 deletion Methods 0.000 description 15
- 230000037430 deletion Effects 0.000 description 15
- 238000012900 molecular simulation Methods 0.000 description 15
- 238000012163 sequencing technique Methods 0.000 description 15
- 238000012216 screening Methods 0.000 description 14
- 241000894006 Bacteria Species 0.000 description 13
- 241000588724 Escherichia coli Species 0.000 description 12
- 238000013459 approach Methods 0.000 description 12
- 238000010367 cloning Methods 0.000 description 12
- 230000037361 pathway Effects 0.000 description 12
- 150000003839 salts Chemical class 0.000 description 12
- 108010006785 Taq Polymerase Proteins 0.000 description 11
- 238000007792 addition Methods 0.000 description 11
- 230000007613 environmental effect Effects 0.000 description 11
- 239000000499 gel Substances 0.000 description 11
- 230000002068 genetic effect Effects 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 10
- 238000004925 denaturation Methods 0.000 description 10
- 230000036425 denaturation Effects 0.000 description 10
- 125000000524 functional group Chemical group 0.000 description 10
- 108091008053 gene clusters Proteins 0.000 description 10
- 239000007858 starting material Substances 0.000 description 10
- 229940079593 drug Drugs 0.000 description 9
- 239000003814 drug Substances 0.000 description 9
- 238000005755 formation reaction Methods 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 230000004071 biological effect Effects 0.000 description 8
- 239000003623 enhancer Substances 0.000 description 8
- 210000003527 eukaryotic cell Anatomy 0.000 description 8
- 244000005700 microbiome Species 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 108091092195 Intron Proteins 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- 230000004544 DNA amplification Effects 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 102100031780 Endonuclease Human genes 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 239000011777 magnesium Substances 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 238000001712 DNA sequencing Methods 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000006911 enzymatic reaction Methods 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 238000002844 melting Methods 0.000 description 5
- 230000008018 melting Effects 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 231100000219 mutagenic Toxicity 0.000 description 5
- 230000003505 mutagenic effect Effects 0.000 description 5
- 210000001236 prokaryotic cell Anatomy 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 238000002864 sequence alignment Methods 0.000 description 5
- 239000004094 surface-active agent Substances 0.000 description 5
- 230000009897 systematic effect Effects 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 241000701161 unidentified adenovirus Species 0.000 description 5
- 101100263837 Bovine ephemeral fever virus (strain BB7721) beta gene Proteins 0.000 description 4
- 101100316840 Enterobacteria phage P4 Beta gene Proteins 0.000 description 4
- 229920001213 Polysorbate 20 Polymers 0.000 description 4
- 241000531151 Pyrolobus Species 0.000 description 4
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000001851 biosynthetic effect Effects 0.000 description 4
- 239000003054 catalyst Substances 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000004587 chromatography analysis Methods 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 4
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000007423 screening assay Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 4
- 241000972773 Aulopiformes Species 0.000 description 3
- 230000006820 DNA synthesis Effects 0.000 description 3
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000701959 Escherichia virus Lambda Species 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 3
- 238000002869 basic local alignment search tool Methods 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 239000013599 cloning vector Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 239000013601 cosmid vector Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 101150066555 lacZ gene Proteins 0.000 description 3
- 229910001425 magnesium ion Inorganic materials 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000010647 peptide synthesis reaction Methods 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 239000002987 primer (paints) Substances 0.000 description 3
- 230000001915 proofreading effect Effects 0.000 description 3
- 238000002708 random mutagenesis Methods 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- WBEJYOJJBDISQU-UHFFFAOYSA-N 1,2-Dibromo-3-chloropropane Chemical compound ClCC(Br)CBr WBEJYOJJBDISQU-UHFFFAOYSA-N 0.000 description 2
- MDSPECLCFVWIGQ-UHFFFAOYSA-N 2-bromoprop-2-enal Chemical compound BrC(=C)C=O MDSPECLCFVWIGQ-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 2
- 241000204051 Mycoplasma genitalium Species 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 102000004140 Oncostatin M Human genes 0.000 description 2
- 108090000630 Oncostatin M Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102000003992 Peroxidases Human genes 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 102000002727 Protein Tyrosine Phosphatase Human genes 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 241000204671 Pyrodictium Species 0.000 description 2
- 102000001218 Rec A Recombinases Human genes 0.000 description 2
- 108010055016 Rec A Recombinases Proteins 0.000 description 2
- 108020005091 Replication Origin Proteins 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 102000004584 Somatomedin Receptors Human genes 0.000 description 2
- 108010017622 Somatomedin Receptors Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- PQYJRMFWJJONBO-UHFFFAOYSA-N Tris(2,3-dibromopropyl) phosphate Chemical compound BrCC(Br)COP(=O)(OCC(Br)CBr)OCC(Br)CBr PQYJRMFWJJONBO-UHFFFAOYSA-N 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 230000006229 amino acid addition Effects 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 238000000376 autoradiography Methods 0.000 description 2
- 238000005842 biochemical reaction Methods 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000012411 cloning technique Methods 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000013401 experimental design Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 210000004408 hybridoma Anatomy 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 238000005805 hydroxylation reaction Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 101150109249 lacI gene Proteins 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 230000036438 mutation frequency Effects 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108020000494 protein-tyrosine phosphatase Proteins 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 102000004217 thyroid hormone receptors Human genes 0.000 description 2
- 108090000721 thyroid hormone receptors Proteins 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 229910052721 tungsten Inorganic materials 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- 229940100682 1,2-dibromo-3-chloropropane Drugs 0.000 description 1
- LSFHGNFJQKUZHR-UHFFFAOYSA-N 1-hydroxy-3-methyl-2H-imidazol-2-amine Chemical compound CN1C=CN(O)C1N LSFHGNFJQKUZHR-UHFFFAOYSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- ABEXEQSGABRUHS-UHFFFAOYSA-N 16-methylheptadecyl 16-methylheptadecanoate Chemical compound CC(C)CCCCCCCCCCCCCCCOC(=O)CCCCCCCCCCCCCCC(C)C ABEXEQSGABRUHS-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- QUVSFZCWYBQJJK-UHFFFAOYSA-N 7-(bromomethyl)benzo[a]anthracene Chemical compound C1=CC2=CC=CC=C2C2=C1C(CBr)=C(C=CC=C1)C1=C2 QUVSFZCWYBQJJK-UHFFFAOYSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 241001149092 Arabidopsis sp. Species 0.000 description 1
- 101100238293 Arabidopsis thaliana MOR1 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 206010068051 Chimerism Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 102000003915 DNA Topoisomerases Human genes 0.000 description 1
- 108090000323 DNA Topoisomerases Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000700662 Fowlpox virus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 229910004373 HOAc Inorganic materials 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- 241000976761 Humaria Species 0.000 description 1
- 102000000589 Interleukin-1 Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 1
- 241000204675 Methanopyrus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- FSVCELGFZIQNCK-UHFFFAOYSA-N N,N-bis(2-hydroxyethyl)glycine Chemical compound OCCN(CCO)CC(O)=O FSVCELGFZIQNCK-UHFFFAOYSA-N 0.000 description 1
- QYFQSQCBYZOECM-UHFFFAOYSA-N N-Hydroxy-IQ Chemical compound C1=CC2=NC=CC=C2C2=C1N(C)C(NO)=N2 QYFQSQCBYZOECM-UHFFFAOYSA-N 0.000 description 1
- DCVWQAGUQFBCTF-UHFFFAOYSA-N N-hydroxy-PhIP Chemical compound C1=C2N(C)C(NO)=NC2=NC=C1C1=CC=CC=C1 DCVWQAGUQFBCTF-UHFFFAOYSA-N 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108700020962 Peroxidase Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 241000231739 Rutilus rutilus Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 241000205180 Thermococcus litoralis Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 208000034953 Twin anemia-polycythemia sequence Diseases 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 238000003277 amino acid sequence analysis Methods 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 125000005605 benzo group Chemical group 0.000 description 1
- DQEPMTIXHXSFOR-UHFFFAOYSA-N benzo[a]pyrene diol epoxide I Chemical compound C1=C2C(C3OC3C(C3O)O)=C3C=C(C=C3)C2=C2C3=CC=CC2=C1 DQEPMTIXHXSFOR-UHFFFAOYSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000007998 bicine buffer Substances 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- DMVOXQPQNTYEKQ-UHFFFAOYSA-N biphenyl-4-amine Chemical group C1=CC(N)=CC=C1C1=CC=CC=C1 DMVOXQPQNTYEKQ-UHFFFAOYSA-N 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 150000001844 chromium Chemical class 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 239000012847 fine chemical Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 101150056310 gem1 gene Proteins 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000036252 glycation Effects 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000012872 hydroxylapatite chromatography Methods 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005417 image-selected in vivo spectroscopy Methods 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 238000012739 integrated shape imaging system Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000138 intercalating agent Substances 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012803 optimization experiment Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- HFHZKZSRXITVMK-UHFFFAOYSA-N oxyphenbutazone Chemical compound O=C1C(CCCC)C(=O)N(C=2C=CC=CC=2)N1C1=CC=C(O)C=C1 HFHZKZSRXITVMK-UHFFFAOYSA-N 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 229940080469 phosphocellulose Drugs 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 125000005575 polycyclic aromatic hydrocarbon group Chemical group 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920005597 polymer membrane Polymers 0.000 description 1
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 1
- 238000011533 pre-incubation Methods 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 230000030788 protein refolding Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 208000009305 pseudorabies Diseases 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 229940043131 pyroglutamate Drugs 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 108091035233 repetitive DNA sequence Proteins 0.000 description 1
- 102000053632 repetitive DNA sequence Human genes 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 238000002804 saturated mutagenesis Methods 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 241001148471 unidentified anaerobic bacterium Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本発明は、90℃から113℃の範囲の温度でポリメラーゼ活性を有する耐熱性ポリメラーゼ(例えばPyrolobus fumariaに由来するもの)および前記ポリメラーゼをコードするポリヌクレオチドに関する。さらに本発明は、新規な耐熱性DNAポリメラーゼをデザインする方法、およびその使用方法もまた提供する。前記ポリメラーゼは、高いpHおよび温度で高い活性および安定性を有する。
Description
【0001】
本発明は一般に、酵素、前記酵素をコードするポリヌクレオチド、前記のポリヌクレオチドおよびポリペプチドの使用に関し、より具体的には高温でポリメラーゼ活性を有する酵素に関する。
【0002】
【従来技術】
好熱細菌は、高活性の耐熱酵素の供給源として大きな注目を浴びてきた。好熱細菌由来のDNAポリメラーゼに対する関心は核酸増幅方法の発明とともに高まった。現に存在する核酸を最初に存在した量と比較して大量に増幅させるために耐熱酵素(例えば米国特許4,165,188号に記載されたようなもの)を使用することについては米国特許第4,683,195号および4,683,202号(これらはPCRの方法について記載している)で開示された(前記特許は引用により本明細書に含まれる)。
【0003】
前記PCRの方法は、標的核酸の変性、プライマーのハイブリダイゼーションおよびDNAポリメラーゼによって触媒される相補鎖の合成を伴う。各プライマーの増幅生成物は、所望の核酸配列の生成のための鋳型になる。使用されるポリメラーゼが耐熱性酵素であれば、熱によってポリメラーゼ活性が破壊されないので、ポリメラーゼを変性工程後に毎回添加する必要がない。熱耐性DNAポリメラーゼは、PCRによるDNAの増幅を実施しているときに例えば93℃から95℃に短時間加熱されたときでも不可逆的に活性を失うことはない。対照的に、前記のような温度上昇で大腸菌(E. coli)のPolIは不活化される。
【0004】
超好熱古細菌、例えばピロジクチウム(Pyrodictium)およびメタノピルス(Methanopyrus)は約110℃の温度で増殖し、80℃以下では増殖できない(例えば以下の文献を参照されたい:Stetter et al., 1990, FEMS Microbiology Reviews 75:117−124(前記文献は引用により本明細書に含まれる))。前記の硫黄還元性、偏性嫌気性細菌は海底環境から単離される。例えば、P.アビッシー(abyssi)は、グエイマスメキシコ(Guaymas Mexico)のはずれの深海(深さ2000メートル)にある活動性“スモーカー”の噴気口の噴出水(320℃)から単離された(Pley et al., 1991, Systematic and Applied Microbiology 14:245)。知られるかぎり最高の温度に生息する超好熱細菌、ピロロブス・フマリア(Pyrolobus fumaria)は、熱水噴出口(時にスモーカーと称され、ここを通って超高熱の鉱物に富む液体が噴出する)の壁内で増殖する。ピロロブス・フマリアは、約105℃の環境でもっともよく繁殖し、113℃までの温度で分裂することができるが、90℃以下の温度で増殖を停止する。
【0005】
より一般的な好熱細菌は、約90℃の最適増殖温度および100℃または100℃近くの最高増殖温度を有する。前記より穏やかな超好熱細菌は培養で増殖させることができる。例えば、DNAポリメラーゼをコードする遺伝子が、テルモコッカス・リトラリス(Thermococcus litoralis)からクローニングされ、配列を決定された(EP455430号)。
しかしながら、超好熱細菌の培養は、固形寒天培地で増殖できないために困難である。例えば、ピロジクチウムの個々の細胞は極めて壊れやすく、さらにこの細菌は線維状ネットワークとして増殖し、通常の発酵装置のスチール部分に目詰まりをもたらす。したがってピロジクチウムの培養は標準的な細菌発酵技術では極めて難しい。(例えば以下を参照されたい:J.T. Staley et al. eds., Bergey’s Manual of Systematic Bacteriology, 1989, Williams and Wilkins, Baltimore(この文献は引用により本明細書に含まれる))。前記の問題およびその他の問題は、性状決定およびアミノ酸配列分析のために大量の精製された核酸ポリメラーゼ酵素を調製する実験室培養を困難にするであろう。
当技術分野では、PCRの工程を改善するために、さらにPCR以外の他の遺伝子組換え技術(例えばDNA配列決定、ニック−トランスレーションおよび逆転写)で耐熱性DNAポリメラーゼを用いたときに得られる結果を改善するために用いることができる、熱安定性が強化された耐熱性DNAを製造することが所望される。
【0006】
発明の概要
本発明は、配列番号:1、3、5、7、9、11、13、15に示される配列、および配列番号:1、3、5、7、9、11、13、15と少なくとも50%の配列同一性をもつその変種の配列を有し、4時間からそれ以上の時間の超高温(例えば95℃から113℃)でポリメラーゼ活性を有するポリペプチドをコードする単離核酸を提供することによって、前記および他の要求に応える。
本発明の特徴の1つは、配列番号:1、3、5、7、9、11、13、15に示される配列、前記配列と実質的に同一の配列および前記に相補的な配列を有する単離核酸である。
【0007】
本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示される配列、前記配列と実質的に同一の配列、および前記配列と相補的な配列の少なくとも10個の連続した塩基配列を含む単離核酸である。
さらに別の特徴では、本発明は、配列番号:2、4、6、8、10、12、14、16に示される配列を有するポリペプチド、および前記配列と少なくとも50%の配列同一性を有するその変種をコードし、さらに95℃から113℃の範囲の温度で耐熱性ポリメラーゼ活性を有するポリペプチドをコードする単離核酸を提供する。
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一である配列を有するポリペプチドまたはその機能的フラグメントをコードする単離核酸である。
【0008】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一の配列の少なくとも10個の連続したアミノ酸を含むポリペプチドをコードする単離核酸である。
さらに別の特徴では、本発明は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一の配列を有する精製ポリペプチドを提供する。
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一の配列を有するポリペプチドと特異的に結合する単離または精製抗体である。
【0009】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16のポリペプチドおよび前記と実質的に同一の配列の1つの少なくとも10個の連続したアミノ酸を有するポリペプチドと特異的に結合する、単離もしくは精製抗体またはその結合フラグメントである。
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16に示される配列および前記配列と実質的に同一の配列を有するポリペプチドを製造する方法である。前記方法は、前記ポリペプチドをコードする核酸を宿主細胞に導入し、前記宿主細胞を前記核酸の発現が許容される条件下で培養することを含み、ここで前記核酸はプロモーターに作働できるように連結されている。
【0010】
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16に示される配列および前記配列と実質的に同一の配列の少なくとも10個のアミノ酸を有するポリペプチドを製造する方法である。前記方法は、前記ポリペプチドをコードする核酸を宿主細胞に導入し、前記宿主細胞を前記核酸の発現が許容される条件下で培養し、それによって前記ポリペプチドを製造することを含み、ここで前記核酸はプロモーターに作働的に連結されてある。
本発明のまた別の特徴は変種を作製する方法であって、前記方法は、配列番号:1、3、5、7、9、11、13、15に示される配列、前記配列と実質的に同一の配列、配列番号:1、3、5、7、9、11、13、15の配列と相補的な配列、前出の配列の少なくとも30個の連続したヌクレオチドを含むフラグメントを入手し、さらに前記配列の1つまたは2つ以上のヌクレオチドを別のヌクレオチドに変更し、前記配列の1つまたは2つ以上のヌクレオチドを欠失させ、または前記配列に1つまたは2つ以上のヌクレオチドを付加することを含む。
【0011】
本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列が保存されてあるコンピューター読取り可能媒体である。
本発明のまた別の特徴はプロセッサおよびデータ保存装置を含むコンピュータシステムであり、ここで前記データ保存装置には、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一の配列が保存されてある。
【0012】
本発明の別の特徴は第一の配列とリファレンス配列を比較する方法で、ここで前記第一の配列は、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一のポリペプチドコードを有する核酸である。前記方法は、配列を比較するコンピュータプログラムを使用して前記第一の配列およびリファレンス配列を読み出し、さらに前記第一の配列と前記リファレンス配列との間の相違を決定する工程を含む。
本発明のまた別の特徴は、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示される配列および前記配列と実質的に同一の配列を有するポリペプチドの特性を同定する方法であって、前記方法は、配列の特性を同定するコンピュータープログラムを使用して前記配列を読み出し、さらに前記コンピュータープログラムにより配列の特性を同定する工程を含む。
【0013】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一の配列のフラグメントまたは変種であって、配列番号:2、4、6、8、10、12、14、16のポリメラーゼの超高温ポリメラーゼ活性(すなわち4時間またはそれ以上の時間で95℃から113℃の温度)を保持するものを同定するためのアッセイである。前記アッセイは、配列番号1、3、5、7、9、11、13、15および前記配列と実質的に同一の配列と少なくとも50%の相同性を有する核酸によってコードされるポリペプチド、または配列番号1、3、5、7、9、11、13、15によってコードされるポリペプチドフラグメントまたは変種を利用して、超高温で4時間またはそれ以上の時間、前記ポリペプチドまたはフラグメントまたは変種が機能できる条件下でPCR増幅でDNAポリメラーゼ活性を発揮させ、さらに増幅生成物の生成を検出することを含み、ここで増幅生成物の生成は、機能的なDNAポリメラーゼポリペプチドまたはフラグメントまたは変種の表示となる。
【0014】
ある実施態様では、本発明は、本発明のポリメラーゼを用いてDNA分子の配列を決定する方法を提供する。前記方法は、(a)プライマーを第一のDNA分子とハイブリダイズさせ;(b)前記第一のDNA分子とデオキシリボヌクレオシド三リン酸、本発明のDNAポリメラーゼ(例えば配列番号:16)およびターミネーター分子と接触させて混合物を形成し;(c)前記第一のDNA分子と相補的なDNA分子のランダム集団を合成するために十分な条件下で前記混合物をインキュベートし、さらにここで合成されたDNA分子はその5’末端にターミネーターヌクレオチドを含み;さらに(d)前記第一のDNA分子のヌクレオチド配列の少なくとも一部分を決定することができるように、前記合成されたDNA分子を分離する工程を含む。前記デオキシリボヌクレオシド三リン酸には、イノシンdATP、dCTP、dGTP、dTTP、dITP、7−デアザ−dGTP、dUTP、[α−S]dATP、[α−S]dTTP、[α−S]dGTP、または[α−S]dCTPが含まれるが、ただしこれらに限定されない。ターミネーターヌクレオチドは、例えばddTTP、ddATP、ddGTP、ddITP、またはddCTPを含むことができる。
【0015】
また別の実施態様では、本発明は、本発明のポリメラーゼを利用し、さらに前記ポリメラーゼの逆転写酵素(RT)活性によってmRNAからcDNAを調製する方法を提供する。前記方法は、(a)mRNAをオリゴ(dT)プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成し;(b)cDNAが得られる条件下で、工程(a)で生成されたハイブリッドを請求項1のDNAポリメラーゼおよび4種の異なるdNTPと接触させる工程を含む。
【0016】
本発明はまた、例えばPCR反応によって二本鎖DNA分子を増幅する方法を提供する。前記方法は、第一および第二のプライマーを提供し(ここで前記第一のプライマーは、前記DNA分子の第一の鎖の3’末端または3’末端近くの配列と相補的であり、さらに前記第二のプライマーは、前記DNA分子の第二の鎖の3’末端または3’末端近くの配列と相補的である);本発明のDNAポリメラーゼ(例えば配列番号:16)の存在下で、第一の鎖と相補的な第三のDNA分子および第二の鎖と相補的な第四のDNA分子が合成される条件下で、前記プライマーを第一の鎖と、さらに第二のプライマーを第二の鎖とハイブリダイズさせ;第一の鎖と第三の鎖、および第二の鎖と第四の鎖を変性させ;さらに1番目から3番目までの工程を1回または2回以上繰り返して、増幅DNA分子を生成することを含む。いったん増幅されたDNAが得られたならば、前記DNA分子をベクター、例えばプラスミドでクローニングすることができる(すなわち平滑端クローニング)。
本発明はまた、非天然のヌクレオチドまたはヌクレオチド類似体をDNA分子に取り込ませる方法を提供する。前記方法は、本発明のポリメラーゼをコードするポリヌクレオチドによってコードされるポリペプチドをDNA鋳型とPCR増幅反応で接触させることを含む。前記ヌクレオチドには、例えばイノシン、2−アミノプリンまたは5−メチルシトシンが含まれる。
【0017】
(発明の詳細な記載)
本発明はDNAポリメラーゼおよび前記をコードするポリヌクレオチドに関する。ポリヌクレオチド配列番号:15は、もともとピロロブス・フマリア(Pyrolobus fumaria)のゲノム遺伝子ライブラリーから回収された。この2412塩基対のポリヌクレオチドは、推定される803個のアミノ酸配列(配列番号:16)を有するタンパク質をコードする。配列番号:1、3、5、7、9、11、13は、ポリメラーゼをコードするさらに別の新規な核酸配列をコードし、さらに配列番号:2、4、6、8、10、12および14は対応するタンパク質である。
【0018】
本発明は精製された熱耐性DNAポリメラーゼを提供する。前記ポリメラーゼは、相補的なポリヌクレオチドを鋳型として用いながら、ポリヌクレオチド鎖の3’末端にデオキシヌクレオチドを付加することによってDNA合成を触媒する。生成される収量は、以前に同定されているポリメラーゼを用いた場合よりも多い。天然に存在するヌクレオチド、アデニン、グアニン、シトシン、チミン、ウラシルを付加する能力の他に、本発明のポリメラーゼは、改変ヌクレオチドまたは非天然ヌクレオチド(例えばグアニン、シトシン、チミン、ウラシルの類似体(デオキシを含む))の取込みにも有用である。例えば、本発明のポリメラーゼは、2−アミノプリン、イノシン、5−メチルシトシンまたは他の非天然もしくは改変ヌクレオチドの付加に有用である。
【0019】
精製酵素の具体例は、本明細書でピロロブス・フマリア(Pyrolobus fumaria)と呼ぶ微生物に由来するポリメラーゼである。前記微生物は、高熱のミネラルに富む液体が噴出する熱水噴出口の壁の中で増殖する超好熱細菌である。ピロロブス・フマリアは、約105℃の環境でもっともよく繁殖し、さらに113℃までの温度で増殖することができるが、90℃より低い温度で増殖を停止する。前記の例示的な酵素(図1Bに示す配列)を用いて所望のDNAを生成できる。本発明のポリメラーゼ酵素は非常に高い耐熱性および反応処理能力を有する。ピロロブス・フマリアのポリメラーゼは、95℃から113℃の高温で4時間またはそれ以上の時間の後でさえ高い活性を維持する。したがって、前記ポリメラーゼは、長さが20kbより大きくおよび/またはGC含有量が約90%より高い鋳型分子のPCR増幅のために特に有用で信頼性が高い(前記GC含有量の高い鋳型は典型的にはより長い増幅時間およびより高温を必要とする)。
【0020】
ピロロブス・フマリアのDNAポリメラーゼ酵素で見出された特性であって、天然のTaq DNAポリメラーゼおよび天然のTth DNAポリメラーゼには存在しない特性の1つは3’→5’エキソヌクレアーゼ活性である。前記の3’→5’エキソヌクレアーゼ活性(一般的には“読みとり保証”(プルーフリーディング)活性として知られている)は、合成される核酸配列の塩基の取り込みミスまたは不適合が前記活性によって排除されるので概ね望ましいと考えられている。したがって、3’→5’エキソヌクレアーゼ活性を有するポリメラーゼ(例えば本発明のピロロブス・フマリアDNAポリメラーゼ酵素)を利用するPCRは信頼性が高くなる。しかしながら、DNAポリメラーゼ酵素で見出される3’→5’エキソヌクレアーゼ活性は、プライマーの3’末端を改変することによってPCRでの非特異的バックグラウンド増幅を増加させることもある。3’→5’エキソヌクレアーゼ活性は、一本鎖DNA(例えばプライマーまたは一本鎖の鋳型)を排除することができる。本質的に、一本鎖プライマーまたは鋳型の3’ヌクレオチドはいずれも不適合として前記酵素によって処理され、したがって分解される。PCRでのプライマーの分解を回避するために、プライマーの3’末端にホスホロチオエートを付加することができる。ホスホロチオエート修飾ヌクレオチドは、3’→5’エキソヌクレアーゼによる除去に対してより抵抗性を有する。
【0021】
所望されるものが天然のピリロブス・フマリアDNAポリメラーゼであれ、または前記酵素の誘導体もしくは同族体であれ、前記ポリメラーゼのリコンビナント型の生成は、典型的には、発現ベクターの構築、宿主細胞の前記ベクターによる形質転換、および発現が生じるような条件下での前記形質転換宿主細胞の培養を伴う。前記発現ベクターを構築するためにDNAを入手する。前記DNAは、成熟酵素(本明細書では全てのムテインを包含するために用いられる)または活性を破壊しない付加配列と前記ポリメラーゼの融合物、または制御条件下(例えばペプチダーゼによる処理)で切断して活性なタンパク質を生じることができる付加配列との融合物をコードするDNAである。続いて前記コード配列を発現ベクター内の適切な制御配列と動作可能なように連結させる。前記ベクターは、宿主細胞内で自立的に複製するか、または宿主細胞の染色体DNAに組み込まれるようにデザインすることができる。前記ベクターを用いて適切な宿主を形質転換し、リコンビナントポリメラーゼの発現に適した条件下で前記形質転換宿主を培養する。リコンビナントポリメラーゼを培養液または細胞から単離する。前記タンパク質の回収および精製は、ある程度の不純物は許容できるいくつかの事例では必要ではないかもしれない。
【0022】
定義
本明細書で用いられるように、“DNAポリメラーゼ”という用語は、加水分解酵素活性を有する酵素、例えばPCR増幅工程で鋳型配列を増幅するために用いることができる酵素を包含する。
本明細書で用いられる“核酸”または“核酸配列”という用語は、オリゴヌクレオチド、ヌクレオチド、ポリヌクレオチド、または前記のいずれかのフラグメントを指し、またゲノム起源もしくは合成起源のDNAまたはRNA(一本鎖でも二本鎖でもよく、さらにセンス鎖でもアンチセンス鎖でもよい)を指し、またペプチド核酸(PNA)、任意のDNA様もしくはRNA様物質(天然または合成起源)を指す。
【0023】
本明細書で用いられる“ヌクレオチド”とは塩基−糖−リン酸結合体を指す。ヌクレオチドは核酸配列(DNAおよびRNA)のモノマーユニットである。ヌクレオチドという用語には、デオキシリボヌクレオシド三リン酸、例えばdATP、dCTP、dITP、dUTP、dGTP、dTTPまたはその誘導体が含まれる。前記誘導体には、例えば[α]dATP、7−デアザ−dGTPおよび7−デアザ−dATPが含まれる。本明細書で用いられるヌクレオチドという用語はまた、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびその誘導体を指す。ジデオキシリボヌクレオシド三リン酸の例にはddATP、ddCTP、ddGTP、ddITPおよびddTTPが含まれるが、ただしこれらに限定されない。本発明にしたがえば、“ヌクレオチド”は標識されてなくても、また検出できるように周知の技術によって標識されてあってもよい。検出可能な標識には、例えば放射能活性アイソトープ、蛍光標識、化学発光標識、生物発光標識および酵素標識が含まれる。
【0024】
“コード配列”または特にポリペプチドまたはタンパク質を“コードするヌクレオチド配列”とは、適切な調節配列の制御下に配置されたとき、転写され、ポリペプチドまたはタンパク質に翻訳される核酸配列である。
“遺伝子”という用語は、ポリペプチド鎖の生成に関与するDNAセグメントを指す。前記用語は、コード領域の前後領域(リーダー部分およびトレーラー部分)の他に、適切な場合には個々のコードセグメント(エクソン)間の介在配列(イントロン)を含む。
本明細書で用いられる、“アミノ酸”または“アミノ酸配列”とは、オリゴペプチド、ペプチド、ポリペプチドまたはタンパク質配列、または前記のいずれかのフラグメント、部分もしくはサブユニット、および天然に存在する分子もしくは合成分子を指す。
【0025】
本明細書で用いられる、“ポリペプチド”という用語は、ペプチド結合または修飾ペプチド結合(すなわちペプチド同配体(peptide isosteres))によって互いに結合したアミノ酸を指し、遺伝子によってコードされる20のアミノ酸以外の改変アミノ酸を含むことができる。前記ポリペプチドは、自然のプロセッシング(例えば翻訳後プロセッシング)によって、または当技術分野で周知の化学的改変技術によって改変されてもよい。改変はポリペプチドのいずれの場所(ペプチド骨格、アミノ酸側鎖およびアミノまたはカルボキシ末端を含む)にあってもよい。同じタイプの改変が、与えられたポリペプチドのいくつかの場所に同じ程度でまたは種々の程度で存在し得ることは理解されよう。さらに、与えられたポリペプチドは多くのタイプの改変を含むこともできる。改変にはアセチル化、アシル化、ADP−リボシル化、アミド化、フラビンの共有結合付加、ヘム部分の共有結合付加、ヌクレオチドまたはヌクレオチドの共有結合付加、脂質または脂質誘導体の共有結合付加、ホスホチジルイノシトールの共有結合付加、架橋環状化、ジスルフィド結合生成、脱メチル化、共有架橋結合の生成、システインの生成、ピログルタメートの生成、ホルミル化、ガンマカルボキシル化、グリコシル化、GPIアンカー生成、ヒドロキシル化、ヨウ素化、メチル化、ミリストイル化(myristolyation)、酸化、パージレーション(pergylation)、タンパク分解処理、リン酸化、プレニル化、ラセミ化、セレノイル化、硫酸化、およびタンパク質へのt−RNA介在アミノ酸付加(例えばアルギニル化)が含まれる。(例えば以下の文献を参照されたい:Proteins−Structure and Molecular Properties 2nd Ed., T.E. Creighton, W.H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, pp.1−12(1983))。
【0026】
本明細書で用いられる、“単離された”という用語は、物質がその本来の環境(例えば前記物質が天然に存在する場合は前記天然の環境)から取り出されることを意味する。例えば、生きた動物中に存在している天然のポリヌクレオチドまたはポリペプチドは単離されてはいないが、同じポリヌクレオチドまたはポリペプチドであって、前記天然の系に一緒に存在するいくつかの物質または全ての物質から分離されたものは単離されたものである。前記ポリヌクレオチドはベクターの一部であってもよく、および/または前記ポリヌクレオチドまたはポリペプチドは組成物の一部であってもよく、前記ベクターまたは組成物はその天然の環境の一部分ではないということでなお前記ポリヌクレオチドまたはポリペプチドは単離されている。
【0027】
本明細書で用いられる、“精製された”という用語は完全に純粋であることを必要とせず、むしろ前記用語は相対的な限定を意図する。ライブラリーから得られる個々の核酸は電気泳動的に均一に常法によって精製されている。これらクローンから得られる配列は、前記ライブラリーからもヒトの全DNAからも直接には入手することはできない。本発明の精製核酸は、当該生物のゲノムDNAの残りの部分から少なくとも104−106倍精製されている。しかしながら、“精製された”という用語はまた、ゲノムDNAの残りの部分から、またはライブラリーの他の配列から、または他の環境から少なくとも1オーダーの規模で、典型的には2または3オーダー、より典型的に4または5オーダーの規模で精製された核酸も含む。
【0028】
本明細書で用いられる、“増幅”とは、DNAポリメラーゼを用いてヌクレオチド配列のコピー数を増加させる任意のin vitroまたはin vivoの方法を指す。核酸の増幅は、DNA分子またはプライマーへのヌクレオチドを取り込み、それによってDNA鋳型と相補的な新しいDNA分子の生成をもたらす。前記生成されたDNA分子およびその鋳型は、さらに別のDNA分子を合成するための鋳型として用いることができる。本明細書で用いられるように、1つの増幅反応は、何ラウンドものDNA複製から成るものであってもよい。DNA増幅反応には例えばポリメラーゼ連鎖反応(PCR)が含まれる。1つのPCR反応は、例えば数“サイクル”から30サイクル、100サイクルのDNA分子の変性と合成から成るものであってもよい。
【0029】
本明細書で用いられる、“プライマー”という用語は、天然であれ合成であれ、プライマーの伸長が開始される条件下に置かれたとき、合成の開始点として機能することができるオリゴヌクレオチドをいう。ある核酸の鎖と相補的なプライマー伸長生成物の合成は、適切な温度の適切な緩衝液中でヌクレオシド三リン酸およびDNAポリメラーゼまたは逆転写酵素の存在下で開始される。“緩衝液”は補助因子(例えば二価金属イオン)および塩(適切なイオン強度を提供するため)を含み、所望のpHに調節される。本発明のポリメラーゼの場合、前記緩衝液は、好ましくは約60mMのトリス塩酸(pH10.0)、25mMのNaOAc、2mMのMg(OAc)2(二価のマグネシウムイオンを提供するため)、および0.002%NP−40/トゥイーン−20を含む。
【0030】
プライマーは好ましくは一本鎖のオリゴデオキシリボヌクレオチドである。プライマーの適切な長さはプライマーの使用目的に左右されるが、典型的には15から35ヌクレオチドの範囲である。短いプライマー分子は、鋳型との十分に安定なハイブリッド複合体の形成のために一般により低い温度を要求する。プライマーは鋳型の正確な配列を再現する必要はないが、鋳型とハイブリダイズするために十分に相補的でなければならない。
【0031】
“プライマー”という用語は、特に増幅されるべき標的領域の一端または両端に関する情報にある程度の不明確さがある場合には2つ以上のプライマーを指すことがある。例えば、核酸配列がタンパク質配列から推論される場合は、“プライマー”は実際には、遺伝暗号の縮退に基づいて全ての可能なコドンの変種を表す配列を含むプライマーオリゴヌクレオチドの集合物である。前記集合物中のプライマーの1つは標的配列の末端と相同であろう。同様に、“保存”領域が集団内で顕著なレベルの多形性を示す場合、隣接する配列を増幅するプライマー混合物を調製することができる。
【0032】
プライマーは、鋳型の特定の配列の鎖と“実質的に”相補的であってもよい。プライマーは、プライマーの伸長が生じる鋳型の鎖とハイブリダイズするために十分相補的でなければならない。プライマー配列は鋳型の正確な配列を再現する必要はない。例えば、非相補的なヌクレオチドフラグメントをプライマーの5’末端に結合させ、プライマー配列の残りの部分は実質的に前記鎖と相補的であることができる。プライマー配列がハイブリダイズさせる鋳型の配列と十分な相補性を有し、それによってプライマーの伸長生成物の合成のための鋳型プライマー複合体を生成することを条件に、非相補的な塩基または長い配列をプライマー中に散在させることができる。
【0033】
プライマーは、所望の場合は、分光光度法的、光化学的、生化学的、免疫化学的、または化学的手段によって検出できる標識を取り込ませることによって標識することができる。例えば、有用な標識には32P、蛍光染料、高電子試薬、酵素(ELISAで一般的に用いられるもの)、ビオチンまたはハプテン、および抗血清もしくはモノクローナル抗体が利用できるタンパク質が含まれる。標識はまた、プライマーを“捕捉”するために用いられ、プライマーまたはプライマー伸長生成物(例えば増幅されたDNA)のいずれかを固相支持体に固定し易くすることができる。
本明細書で用いられる、“耐熱性ポリメラーゼ”および“耐熱性酵素”は、熱に対して安定で、4時間またはそれ以上の超高温の熱に対して耐性を示し、さらに適切な態様のヌクレオチドの組み合わせを触媒して、鋳型の核酸鎖と相補的なプライマー伸長生成物を形成する酵素を指す。一般に、プライマー伸長生成物の合成は、プライマーの3’末端で開始し、合成が終了するまで鋳型鎖に沿って5’方向に進行する。
【0034】
本発明の耐熱性酵素は、米国特許第4,965,188号(この文献は引用により本明細書に含まれる)に記載されたように、ポリメラーゼ連鎖反応またはPCRとして知られている増幅反応で効率的に使用するための要件を満たしている。本発明の酵素は、二本鎖核酸を変性させる(PCR反応の重要な工程)ために必要な時間高温に付したときに不可逆的に変性しない(不活化されない)。本明細書でいう不可逆的変性は永久的および完全な酵素活性の消失を指す。核酸の変性に必要な加熱条件は、例えば緩衝液の塩濃度並びに変性させる核酸の組成および長さに左右されるが、典型的には約90℃から約105℃で、時間は主に温度と核酸の長さに依存し、典型的には数秒から4分までである。
【0035】
より高い温度が、緩衝液の塩濃度および/または核酸のGC組成が増加するにつれ要求されるであろう。本発明の酵素は、4時間またはそれ以上の間約95℃から113℃の温度に暴露することで不可逆的に変性することはない。本発明のDNAポリメラーゼ酵素の超耐熱性は、以前に性状を調べた耐熱性酵素よりもさらに新たな利点を提供する。本発明の前には、113℃の変性温度での有効なPCRは示されなかった。前記を目的とする耐熱性DNAポリメラーゼは報告されたことがない。しかしながら、標的核酸のG/C含有量が増すにつれ、二重鎖を変性させるために必要な温度もまた増加する。95℃を越える変性工程を必要とする標的配列の場合、これまでのプロトコルでは二重鎖を部分的に不安定にさせる溶媒がPCRに取り入れれ、有効な変性温度を低下させる。
【0036】
例えばグリセロール、DMSOまたはホルムアミドのような薬剤がPCRにおいて前記の態様で用いられてきた[Korge et al., 1992, Proc. Natl. Acad. Sci. USA, 89:910−914; Wong et al., 1991, Nuc. Acids Res. 19:2251−2259(前記文献は引用により本明細書に含まれる)]。しかしながら、これらの薬剤は、二重鎖DNAの脱安定化の他にも、プライマーの安定性に影響を与え、酵素活性を抑制し、さらに種々の濃度のDMSOまたはホルムアミドは好熱性DNAポリメラーゼの熱抵抗性(すなわち半減期)を低下させる。したがって、前記の補助溶媒を利用するときは、極めて多くの最適化実験および反応条件を検討する必要がある。対照的に、本発明のDNAポリメラーゼを用いる場合は、単純に100℃から113℃に変性温度を上昇させ、それ以外は標準的なPCRによってPCR生成物の完全な鎖の分離が促進され、DNAらせんの脱安定化薬剤の必要性が排除できる。
本明細書で開示する超好熱ポリメラーゼは100℃を超える温度で、さらに113℃でさえも他の既知のポリメラーゼで予想される標的DNAの完全性を犠牲にすることなく安定である[Ekert and Kunkel, 1992, ”PCR: A Practical Approach,” eds. McPherson, Quirke and Taylor, Oxford University Press, pages 225−244(前記文献は引用により本明細書に含まれる)]。
【0037】
本明細書で用いられる、“リコンビナント”という用語は、該当核酸が天然の環境では隣接していない“骨格”核酸と隣接していることを意味する。さらにまた、該当核酸が“濃縮された”というためには、核酸骨格分子集団中の核酸挿入物の数が5%またはそれ以上であろう。本発明の骨格分子には、核酸、例えば発現ベクター、自己複製核酸、ウイルス、組み込み用核酸、および他のベクターまたは問題の核酸挿入物の維持もしくは操作に用いられる核酸が含まれる。典型的には、前記濃縮された核酸とは、リコンビナント骨格分子の集団中における核酸挿入物の数が15%またはそれ以上を表す。より典型的には、前記濃縮された核酸は、リコンビナント骨格分子の集団中における核酸挿入物の数が50%またはそれ以上である。ある実施態様では、前記濃縮された核酸は、リコンビナント骨格分子の集団中における核酸挿入物の数が90%またはそれ以上である。
【0038】
本明細書において、“リコンビナント”ポリペプチドまたはタンパク質とは、リコンビナントDNA技術によって生成された、すなわち所望のポリペプチドまたはタンパク質をコードする外因性DNA構築物によって形質転換された細胞から産生されたポリペプチドまたはタンパク質を指す。“合成”ポリペプチドまたはタンパク質は化学合成によって製造されたものである。固相ペプチド化学合成もまた本発明のポリペプチドまたはフラグメントの合成に用いることができる。前記の方法は、1960年代の初めから当技術分野では公知で(R.B. Merrifield, 1963, J. Am. Chem. Soc., 85:2149−2154; J.M. Stewart and J.D. Young, Solid Phase Peptide Synthesis, 2nd ed., Pierce Chemical Co., Rockford, Ill., pp. 11−12)、さらに最近は市販の実験室用ペプチドデザインおよび合成キットで利用されている(Cambridge Research Biochemicals)。前記の市販の実験室用キットは一般的に文献(H.M. Geysen et al., 1984, Proc. Natl. Acad. Sci., USA, 81:3998)に報告された考えを利用し、その全てが一枚のプレーとに連結された多数の“ロッド”または“ピン”の先端でタンパク質を合成する。前記の系を利用するときは、ロッドまたはピンを含むプレートを逆さまにし、対応するウェルまたは液溜めをもつ第二のプレートに挿入する(前記ウェルまたは液溜めは適切なアミノ酸をピンまたはロッドの先端に付着または定着させるための溶液を含む)。前記の反応工程を繰り返すことによって(すなわち裏返し、さらに適切な溶液にロッドおよびピンの先端を挿入することによって)、アミノ酸が所望のペプチドを構築する。さらに、多数のFMOCペプチド合成系も利用できる。例えば、ポリペプチドまたはフラグメントの組み立ては、アプライドバイオシステム社(Applied Biosystems, Inc.)のモデル431A自動ペプチド合成装置を用いて固相支持体上で実施できる。前記の装置は、直接合成によって、または他の既知の技術によって結合させることができる一連のフラグメントの合成によって容易に本発明のペプチドを提供する。
【0039】
プロモーターで転写を開始させるRNAポリメラーゼによってコード配列がmRNAに転写されるときは、前記プロモーター配列は前記コード配列に“動作可能に連結”されているという。
“プラスミド”は小文字のpによって示され、大文字および/または数字がそれに先行するかおよび/またはその後に続く。本明細書の出発プラスミドは、市販されているか、非制限的な基準で公的に入手可能であるか、または入手可能なプラスミドを基にして文献に報告された方法にしたがって構築できる。さらに、本明細書に記載したプラスミドと同等なプラスミドは当技術分野で公知であり、当業者には明白であろう。
【0040】
DNAの“消化”とは、DNAの一定の配列でのみ作用する制限酵素によるDNAの触媒的切断を指す。本明細書で用いられる種々の制限酵素は市販されており、それらの反応条件、補助因子および他の要件は当業者に公知のものを用いた。分析を目的とする場合は、典型的には1μgのプラスミドまたはDNAフラグメントを約2単位の酵素とともに約20μLの緩衝液中で用いる。プラスミド構築のためにDNAを単離する場合は、典型的には5から50μgのDNAを20から50単位の酵素でより大容積中で消化する。具体的な制限酵素に対する適切な緩衝液および基質の量は製造元によって特定される。37℃で約1時間のインキュベーションが常套的に用いられているが、供給元の指示にしたがって変動させることができる。消化後に、ゲル電気泳動を実施して所望のフラグメントを単離することができる。
【0041】
“オリゴヌクレオチド”は、一本鎖ポリデオキシヌクレオチドまたは2本の相補的なポリデオキシヌクレオチド鎖のいずれをも意味し、前記ポリデオキシヌクレオチドは化学的に合成できる。そのような合成オリゴヌクレオチドは5’リン酸をもたず、したがってキナーゼ存在下でATPを用いてホスフェートを付加しなければまた別のオリゴヌクレオチドに連結できない。合成オリゴヌクレオチドは脱リン酸されていないフラグメントに連結される。
2つの核酸またはポリペプチドについていう場合、“実質的に同一”という語句は、最大の一致を得るように比較およびアラインメントを施して、公知の配列比較アルゴリズムを用いるか、または目で精査して測定したとき、少なくとも50%、60%、70%、80%、さらにいくつかの特徴では90−95%のヌクレオチドまたはアミノ酸残基の同一性を有する2つまたは3つ以上の配列を指す。典型的には、実質的な同一性は、少なくとも約100残基の領域にわたって存在し、もっとも一般的には配列は少なくとも約150−200残基にわたって実質的に同一である。いくつかの実施態様では、コード領域の全長にわたって実質的に同一である。
【0042】
さらに、“実質的に同一な”アミノ酸配列とは、1つまたは2つ以上の保存的または非保存的アミノ酸置換、欠失または挿入によりリファレンス配列と異なる配列であり、特にそのような置換が前記分子の活性部位ではない部位に生じ、前記ポリペプチドが本質的にその機能を保持していることを条件とする。保存的アミノ酸置換は、例えば、1つのアミノ酸と同じ種類の別のアミノ酸との置換である[例えば1つの疎水性アミノ酸(例えばイソロイシン、バリン、ロイシンまたはメチオニン)で別の疎水性アミノ酸を置換するか、または1つの極性アミノ酸を別の極性アミノ酸で置換する(例えばアルギニンでリジンを、グルタミン酸でアスパラギン酸を、またはグルタミンでアスパラギンを置換)]。1つまたは2つ以上のアミノ酸を、例えばポリメラーゼポリペプチドから欠失させ、その生物学的活性を顕著に変化させることなく前記ポリペプチドの構造を改変することができる。例えば、ポリメラーゼの生物学的活性に要求されないアミノ末端またはカルボキシル末端のアミノ酸を除去することができる。
【0043】
本発明のポリメラーゼポリペプチド配列(上記のように改変したものを含む)は、多くの任意の方法(DNAの重合化(例えば重合速度および読み取りの正確さ)を含む)によってポリメラーゼの生物学的活性についてアッセイすることができる。例えば、本発明のポリメラーゼの読み取りの正確さについてのアッセイには、本発明のポリメラーゼによって重合させたDNAの配列を既知の配列と正確さについて比較することなどが含まれる。
本発明に含まれるポリメラーゼポリペプチドは、図1Bに示したポリメラーゼ(配列番号:2)のアミノ酸配列を有するか、または配列番号:2、4、6、8、10、12、14、16と50%の相同性を有するアミノ酸配列を有し、前記ポリメラーゼは超高温、例えば約90℃から113℃、約95℃から113℃、約100℃から107℃、または100℃から105℃でポリメラーゼ活性を保持することができる。好ましくは、前記ポリメラーゼは、前記のような温度で1時間またはそれ以上、2時間またはそれ以上、好ましくは4時間またはそれ以上活性を有する。図11は、配列番号:16の85℃、90℃および95℃で4時間の間の耐熱性を示すグラフである。
【0044】
本明細書で用いられる “フラグメント”とは、少なくとも2つの異なるコンフォーメーションで存在することができる天然に存在するタンパク質の部分である。フラグメントは、天然に存在するタンパク質と同じまたは実質的に同じアミノ酸配列を有することができる。“実質的に同じ”とは、アミノ酸配列の大部分(全部ではなく)が同じであり、前記配列が関連を有する配列の少なくとも1つの機能的活性を保持することを意味する。一般には、2つのアミノ酸配列が少なくとも約85%同一である場合は、それらは“実質的に同じ”または“実質的に相同”である。異なる三次元構造を有する天然に存在するフラグメントもまた含まれる。前記の例は“プロ−フォーム”分子、例えば切断によって改変され極めて高い活性をもつ成熟ポリメラーゼを生成する低活性プロタンパク質である。
【0045】
“ハイブリダイゼーション”とは、核酸の鎖が塩基対形成により相補鎖と結合する過程を指す。ハイブリダイゼーション反応は鋭敏でさらに選択性を有し、したがって対象の個々の配列を、前記配列が低濃度で存在するサンプル中においてさえも同定することができる。適切にストリンジェントな条件は、例えば、予備ハイブリダイゼーション溶液およびハイブリダイゼーション溶液中の塩またはホルムアルデヒドの濃度によって、またはハイブリダイゼーションの温度によって規定することができ、前記は当技術分野で周知である。特に、ストリンジェンシーは塩濃度を減少させるか、ホルムアルデヒドの濃度を高めるか、またはハイブリダイゼーションの温度を上昇させることによって高めることができる。
【0046】
例えば、高ストリンジェンシー条件下でのハイブリダイゼーションは、約50%のホルムアルデヒドで約37℃から42℃で生じるであろう。ハイブリダイゼーションは、低ストリンジェンシー条件下、約35%から25%のホルムアミドで約30℃から35℃で生じ得るであろう。特に高ストリンジェンシー条件下でのハイブリダイゼーションは42℃で、50%のホルムアミド、5×SSPE、0.3%のSDS、および200ng/mLのせん断変性サケ精子DNA中で起こり得る。低ストリンジェンシー条件下でのハイブリダイゼーションは上記のような条件で、ただし35%ホルムアミド中で35℃の低い温度で起こり得る。特定のレベルのストリンジェンシーに対応する温度範囲は、問題の核酸のプリン対ピリミジン比を計算し、さらにそれにしたがって温度を調整することによってさらに狭めることができる。上記範囲および条件に関する変動はこの技術分野で良く知られたものである。
【0047】
“変種”という用語は、1つまたは2つ以上の(それぞれ)塩基対、コドン、イントロン、エクソンまたはアミノ酸残基において改変され、なお本発明のポリメラーゼ活性を保持する本発明のポリヌクレオチドまたはポリペプチドを指す。変種は例えば以下を含む多数の任意の手段によって製造できる:変異性PCR(error−prone PCR)、シャフリング(入れ換え、shuffling)、オリゴヌクレオチド特異的突然変異導入、アッセンブリーPCR、有性PCR突然変異導入、in vivo突然変異導入、カセット突然変異導入、循環アンサンブル(recursive ensemble)突然変異導入、指数的アンサンブル突然変異導入、部位特異的突然変異導入、連結再アッセンブリー、GSSMおよび前記の任意の組み合わせ。
【0048】
本明細書で用いられる“鋳型”という用語は、増幅、合成または配列決定されるべき二本鎖または一本鎖のDNA分子を指す。二本鎖DNA分子の場合は、これら分子の増幅、合成または配列決定の前に、その鎖を変性させて第一および第二の鎖を生成させる。プライマー(DNA鋳型の一部分と相補的である)を適切な条件下でハイブリダイズさせ、続いて本発明のDNAポリメラーゼが前記鋳型またはその一部分と相補的なDNA分子を合成することができる。本発明にしたがって新しく合成されたDNA分子は、最初のDNA鋳型と長さが等しいかまたは短い。新しく合成されるDNA分子の合成または伸長中のミスマッチの取り込みは、1つまたは多数の塩基対のミスマッチをもたらす。したがって、合成されたDNA分子はDNA鋳型と正確に相補的であるとは限らない。
【0049】
特に本発明のポリメラーゼは、よく知られたDNA配列決定、DNA標識、DNA増幅およびクローニング反応並びにcDNA合成反応で極めて有用である。特に本発明のポリメラーゼは、dNTPおよびddNTPを区別せず、したがってDNA配列決定、DNA標識、並びにDNA増幅反応およびcDNA合成に極めて有用である。周知のように、配列決定反応(等温DNAシークェンシング法およびDNAサイクルシークェンシング法)はDNAポリメラーゼの使用を必要とする。ジデオキシ仲介配列決定は、DNAポリメラーゼによる伸長のための特別なポリマー、塩基特異的連鎖ターミネーターを使用する鎖停止技術、およびポリアクリルアミドゲルの使用を含む。ポリアクリルアミドゲルの使用によって、新しく合成された鎖停止DNA分子をサイズによって分離し、その結果、最初のDNA分子のヌクレオチド配列の少なくとも一部分を決定することができる。特に、DNA分子は、各々が異なる塩基特異的ターミネーターを含む4種の別個のDNA配列反応を用いて配列決定される。例えば、第一の反応はG−特異的ターミネーターを含み、第二の反応はT−特異的ターミネーターを含み、第三の反応はA−特異的ターミネーターを含み、第四の反応はC−特異的ターミネーターを含むことができる。好ましいターミネーターヌクレオチドにはジデオキシリボヌクレオシド三燐酸(ddNTP)、例えばddATP、ddTTP、ddGTP、ddITPおよびddCTPが含まれる。ジデオキシリボヌクレオシド三燐酸の類似体もまた使用することができ、当技術分野では周知である。
【0050】
DNA分子の配列を決定するとき、ddNTPはデオキシリボース塩基の3’位にヒドロキシル残基を欠き、したがって、伸長DNA鎖にDNAポリメラーゼによって取り込まれるが、その3’−ヒドロキシ残基が欠如しているために次のホスホジエステル結合の生成が妨げられてDNA分子の伸長が停止する。したがって、配列決定反応混合物に1つのddNTPが少量含まれるとき、配列を決定されるべきDNA鋳型よりも短い合成されたDNA分子集団が生じる。4種の異なるddNTPを4つの別個の酵素反応で用いることによって、合成DNA集団をサイズにより分離して、最初のDNA分子のヌクレオチド配列の少なくとも一部分を決定できる。ジデオキシヌクレオチドによるDNAの配列決定は周知であり、文献に記載されている(Sambrook et al., ”Molecular Cloning, a Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989))。容易に理解されるとおり、本発明のポリメラーゼは前記の配列決定反応で用いることができる。
【0051】
周知のように、典型的には検出できるように標識したヌクレオチドが配列決定反応に含まれる。多数の標識ヌクレオチドを配列決定(または標識)反応で用いることができる。前記標識ヌクレオチドには、放射性同位元素、蛍光標識、化学発光標識、生物発光標識および酵素標識が含まれるが、ただしこれらに限定されない。本発明の野生型および変異型DNAポリメラーゼは、配列決定(または標識)反応時にαSヌクレオチドの取り込みのために有用であることが判明した。例えば、[α35S]dATP(配列決定反応で一般的に用いられる検出可能標識ヌクレオチド)は、Taq DNAポリメラーゼよりも効率的に本発明のDNAポリメラーゼにより取り込まれる。したがって、本発明の酵素は、[α35S]dNTPを用いるDNA分子の配列決定または標識に特に適している。
【0052】
周知のDNA増幅技術であるポリメラーゼ連鎖反応(PCR)は、DNAポリメラーゼとデオキシリボヌクレオシド三燐酸を用いて標的DNA鋳型を増幅させる工程である。前記のPCR反応では、2つのプライマー(1つは増幅されるべきDNA分子の第一の鎖の3’末端(または3’末端近傍)と相補的であり、第二のプライマーは増幅されるべきDNA分子の第二の鎖の3’末端(または3’末端近傍)と相補的である)を、その対応するDNA鎖とハイブリダイズさせる。ハイブリダイゼーションの後、デオキシリボヌクレオシド三燐酸の存在下で、DNAポリメラーゼは、増幅されるべきDNA分子の第一の鎖と相補的な第三のDNA分子および第二の鎖と相補的な第四のDNA分子を合成させる。前記の合成によって、2つの二本鎖DNA分子がもたらされる。続いて、DNAポリメラーゼ、プライマーおよびデオキシリボヌクレオシド三燐酸を提供することによって、前記の二本鎖DNA分子をさらに新たなDNA分子の合成のための鋳型として用いることができる。周知のように、前記のさらに新たな合成は、(過剰なプライマーおよびデオキシリボヌクレオシド三燐酸を用いて)最初の反応を“サイクル”させて、何回もの変性と合成工程を可能にすることによって実施される。典型的には、二本鎖DNA分子の変性による一本鎖DNA鋳型の生成は高温によって達成される。本発明の野生型および変種DNAポリメラーゼは熱に安定なDNAポリメラーゼで、したがってDNA増幅反応時の前記温度サイクルに耐えるであろう。したがって、本発明の野生型および変種DNAポリメラーゼは、PCR反応、特に増幅時に高温を用いてDNA分子を変性させるPCR反応に理想的である。
【0053】
本発明のDNAポリメラーゼおよび変異体はまた、mRNA鋳型からcDNAを調製するためにも用いることができる。例えば米国特許第5,405,776号および第5,244,797号を参照されたい(前記文献は引用により本明細書に含まれる)。したがって、本発明はまたmRNAからcDNAを調製する方法に関し、前記方法は以下の(a)および(b)の工程を含む:(a)mRNAをオリゴ(dT)プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成し;さらに(b)工程(a)で生成されたハイブリッドを本発明のDNAポリメラーゼまたはその変種および4種のdNTPと接触させ、それによってcDNA−RNAハイブリッドを得る。
【0054】
前記反応混合物が、工程(b)で生成されるcDNAと相補的である適切なオリゴヌクレオチドをさらに含む場合は、第一の鎖の合成の後でdsDNAを得ることもまた可能である。したがって本発明はまた、本発明のDNAポリメラーゼまたはその変種を用いてdsDNAを調製する方法を目的とする。
酵素は高度に選択的な触媒である。それらの特徴は、優れた立体的選択性、部位選択性(regio)および化学的選択性を有する反応の触媒能力で、それらは通常の化学的合成とは比較にならない。さらにまた、酵素は極めて高い融通性を有する。それらは種々に手を加えることによって、有機溶媒中で機能し、さらに極端なpH(例えば高pHおよび低pH)、極端な温度(例えば高温および低温)、極端な塩分レベル(例えば高い塩分および低い塩分)で働き、それらの天然の生理学的な基質とは構造的に無関係の化合物との反応を触媒する。
【0055】
酵素は広範囲の天然および非天然基質に対して反応性を有し、したがって実質的に任意の有機主要化合物の改変を可能にする。さらにまた、通常の化学触媒と異なり、酵素は高い鏡像選択性および部位選択性を有する。酵素によって示される官能基の高度の特異性は、新規な活性化合物へと続く一連の合成反応で各反応の進路を追うことを可能にする。酵素はまた、それらの天然の生理学的機能とは無関係の多くの多様な反応を触媒することができる。例えば、ペルオキシダーゼは、過酸化水素によってフェノール酸化を触媒する。ペルオキシダーゼはまた、前記酵素の天然の機能とは無関係のヒドロキシル化反応を触媒することができる。他の例は、ポリペプチドの分解を触媒するタンパク質である。有機溶液中では、いくつかのプロテアーゼは糖をアシル化することができるが、前記はこれらの酵素の天然の機能とは無関係の機能である。
【0056】
本発明は酵素の固有の触媒特性を利用する。化学物質の形質転換における生物触媒(すなわち精製または粗酵素、非生細胞または生細胞)の使用は、通常は、特定の出発化合物と反応する個々の生物触媒の同定を必要とするが、本発明では、多くの出発化合物に存在する官能基に特異的である選別した生物触媒および反応条件が使用される。
各生物触媒は1つの官能基(またはいくつかの関連する官能基)に特異的で、前記官能基を含む多くの出発化合物と反応することができる。
生物触媒による反応は1つの出発化合物から誘導体の集団を生成する。前記誘導体をさらにもう1回の生物触媒反応に付し、第二の誘導体化合物集団を生成することができる。生物触媒による誘導反応を繰り返すたびに最初の化合物に由来する何千もの変種を生成することができる。
【0057】
酵素は出発化合物の特異的な部位で反応し、分子の残りの部分には影響を与えない。これは慣習的な化学的方法では達成することが非常に難しい反応である。生物触媒のこの高度な特異性は、ライブラリー中のただ1個の活性化合物を同定する手段を提供する。ライブラリーは、それを生成するために用いられた生物触媒による一連の反応、いわゆる“生合成歴”によって特徴が表される。生物学的活性についてライブラリーをスクリーニングし、その生合成歴を追跡することによって、前記活性化合物を生成する特定の反応を見つけ出すことができる。前記一連の反応を繰り返し、合成された化合物の構造を決定する。このような同定方法は、他の合成およびアプローチ方法と異なり固定技術を必要とせず、実質的に任意のタイプのスクリーニングアッセイを用いて、化合物を溶液中で遊離の状態で合成および検査することができる。官能基に対する酵素反応の高度な特異性が、生物触媒により生成されるライブラリーを完成させた特異的な酵素反応の追跡を可能にすることを特記することは重要である。
【0058】
1日当たり何千もの生物触媒反応およびスクリーニングアッセイを高レベルの正確さと再現性を担保しつつ実施することを可能にするロボットによる自動化を用いて、多数の工程が実施される。結果として、従来の化学的な方法を用いれば何年も要する誘導化合物ライブラリーが数週間程度で生成できる。[分子(小分子を含む)の改変についての更なる説明のためにはPCT/US94/09174を参照されたい(前記文献は引用により本明細書に含まれる)]。
ある特徴では、本発明は、合成遺伝子再アッセンブリーと称される非確率的方法を提供する。前記方法は、いくぶん確率的シャッフリングと関連するが、ただし核酸構築ブロックはランダムにシャッフリング、連結またはキメラ化されることはなく、むしろ非確率的に組み立てられる。
【0059】
合成遺伝子再アッセンブリー法は、シャッフリングすべきポリヌクレオチド間に高レベルの相同性が存在することを必要としない。本発明を用いて、10100を越える種々のキメラで構成された子孫分子ライブラリー(またはセット)を非確率的に生成することができる。おそらく、合成遺伝子再アッセンブリーは、101000をも越える種々の子孫キメラで構成されるライブラリーの生成に用いることができる。
したがってある特徴では、本発明は、意図的に選択された全体の組み立て順序を有する完成キメラ核酸分子のセットを生成する、以下の工程を含む非確率的方法を提供する:利用可能な相互に適合する連結可能末端を有する、複数の特定の核酸構築ブロックを計画的に生成し、さらに意図した全体の組み立て順序を達成できるように前記核酸構築ブロックを組み立てる。
【0060】
組み立てられるべき核酸構築ブロックの相互に適合する連結可能な末端は、それらが構築ブロックを予め定めた順序で結合させることを可能にする場合は、このタイプの順序付けられた組み立てに“利用可能”であると考えられる。したがって、ある特徴では、核酸構築ブロックが結合される全体の組み立て順序は連結可能な末端のデザインによって指定することができ、さらに、2つ以上の組み立て工程が用いられる場合は、核酸構築ブロックが結合される全体の組み立て順序もまた前記組み立て工程の連続する順序によって指定される。本発明のある実施態様では、アニールされる構築片は酵素、例えばリガーゼ(例えばT4 DNAリガーゼ)で処理され、前記構築片の共有結合が達成される。
【0061】
別の実施態様では、核酸構築ブロックのデザインは、完成されたキメラ核酸分子の子孫セットを生成するための基礎として機能する原型(progenitor)核酸鋳型セットの配列分析を基にして得られる。これらの原型核酸鋳型は、したがって、突然変異を誘発されるべき、すなわちキメラ化または入れ換え(シャフリング)を実施されるべき核酸構築ブロックのデザインに役立つ配列情報の供給源として機能する。
ある実施態様では、本発明は、関連遺伝子類のキメラ化およびそれらによってコードされる関連ポリメラーゼ類を提供する。本発明のポリメラーゼは本明細書に記載した方法にしたがって突然変異を導入することができる。
【0062】
したがって、本発明の特徴の1つにしたがえば、1つまたは2つ以上の境界設定ポイント(demarcation point)を選択するために、複数の原型核酸鋳型の配列(例えば配列番号:1、3、5、7、9、11、13、15)にアラインメントが施される(前記境界設定ポイントは相同性領域に位置することができる)。前記境界設定ポイントを用いて、生成されるべき核酸構築ブロックの境界を正確に示すことができる。したがって、前記原型分子で同定し選択した境界設定ポイントは、子孫分子の組み立てで潜在的なキメラ化ポイントとして機能する。
典型的には、有用な境界設定ポイントは、少なくとも2つの原型鋳型によって共有される相同性領域(少なくとも1つの相同なヌクレオチド塩基で構成される)であるが、前記境界設定ポイントは、少なくとも半分の原型鋳型、少なくとも2/3の原型鋳型、少なくとも3/4の原型鋳型、好ましくはほとんど全ての原型鋳型によって共有される相同性領域であってもよい。さらに好ましい有用な境界設定ポイントは、全原型鋳型によって共有される相同領域である。
【0063】
ある実施態様では、前記連結再アッセンブリー方法は、包括的ライブラリーを生成するために余すところなく実施される。換言すれば、全ての可能な順序をもつ核酸構築ブロックの組合わせが、完成されたキメラ核酸分子セット中に出現する。同時に、各々の組合わせにおける組み立ての順序(すなわち完成された各キメラ核酸の5’から3’方向の配列中の各構築ブロックの組み立ての順序)は、計画的(または非確率的)である。前記方法の非確率的な特性のために、望ましくない副生成物の可能性が大幅に減少する。
【0064】
別の実施態様では、本方法で提供されるのものは、例えば体系的に区画化したライブラリーを生成するために、(例えば1つずつ)体系的にスクリーニングすることができる区画による連結再アッセンブリー方法の体系的な実施である。換言すれば、本発明が提供するものは、特定の核酸構築ブロックの慎重な選択により、(アッセンブリー反応の連続工程の慎重な選択と組み合わせて)、いくつかの反応容器の各々に特定の子孫生成物セットが製造される実験デザインを達成できるということである。これによって、体系的な実験およびスクリーニング方法の実施が可能になる。したがって、本方法は、潜在的に非常に大量の子孫分子をより小さなグループで体系的に調べることを可能にする。
【0065】
高度に順応性を有し、しかも同時に包括的で体系的な態様で、(特に原型分子に低レベルの相同性しか存在しないときに)キメラ化を実施できるその能力のために、本発明は、多数の子孫分子で構成されたライブラリー(またはセット)の生成を提供する。本発明の連結再アッセンブリーの非確率的特性のために、生成される子孫分子は、好ましくは、意図的に選択された全体の組み立て順序を有する完成キメラ核酸分子のライブラリーを構成する。特別な実施態様では、前記生成ライブラリーは103から101000を超える種々の子孫分子種で構成される。
【0066】
ある特徴では、上記のようにして生成される完成キメラ核酸分子セットは、ポリペプチドをコードするポリヌクレオチドを含む。ある実施態様に従えば、前記ポリヌクレオチドは遺伝子であり、前記は人工遺伝子でもよい。
別の実施態様に従えば、前記ポリヌクレオチドは遺伝子経路であり、前記は人工の遺伝子経路でもよい。本発明にしたがえば、本発明によって生成された1つまたは2つ以上の人工遺伝子を人工の遺伝子経路(例えば真核生物(植物を含む)中で作働可能な経路)に取り込ませることができる。
【0067】
別の実施態様では、構築ブロックが生成される工程が合成的であるという性質によって、ヌクレオチド(例えば1つまたは2つ以上のヌクレオチド、前記は例えばコドンでもイントロンでもまたは調節配列でもよい)のデザインおよび導入が可能になる。前記ヌクレオチドは、後で場合によってin vitroプロセス(例えば突然変異誘発によって)またはin vivoプロセス(例えば宿主生物の遺伝子スプライシング能力によって)で除去することができる。多くの事例で、前記ヌクレオチドの導入はまた、有用な境界設定ポイントの創出という潜在的な利益以外に他の多くの理由から所望されることは理解されよう。
【0068】
したがって、別の実施態様では、本発明はイントロンに導入するために用いることができる核酸構築ブロックを提供する。本発明はしたがって、本発明の人工遺伝子への機能的イントロンの導入を提供する。本発明はまた、本発明の人工遺伝子経路への機能的イントロンの導入を提供する。したがって、本発明は、1つ(または2つ以上)の人工的に導入されたイントロンを含む人工遺伝子であるキメラポリヌクレオチドの生成を提供する。
したがって本発明はまた、1つ(または2つ以上)の人工的に導入されたイントロンを含む人工遺伝子経路であるキメラポリヌクレオチドの生成を提供する。好ましくは、前記人工的に導入されたイントロンは、天然に存在するイントロンが遺伝子スプライシングで機能的に作用する態様とほぼ同様に、1つまたは2つ以上の宿主細胞で遺伝子スプライシングのための機能を有する。本発明は、遺伝子組換えおよび/またはスプライシングのために宿主生物に導入される人工イントロンを含むポリヌクレオチドの製造方法を提供する。
【0069】
本発明を用いて製造された人工遺伝子はまた別の核酸との組換えのための基質として機能することができる。同様に、本発明を用いて製造された人工遺伝子経路はまた別の核酸との組換えのための基質として機能することができる。好ましい事例では、組換えは、人工イントロン含有遺伝子と組換えパートナーとして機能する核酸との間の相同領域によって促進され、また同領域で発生するであろう。特に好ましい事例では、前記組換えパートナーはまた本発明によって生成される核酸(人工遺伝子または人工遺伝子経路を含む)であってもよい。組換えは、1つ(または2つ以上)の人工的に導入された人工遺伝子内イントロンに存在する相同領域によって促進され、または同領域で発生するであろう。
【0070】
本発明の合成的連結再アッセンブリーの方法は複数の核酸構築ブロックを用い、前記ブロックの各々は好ましくは2つの連結可能末端を有する。各核酸構築ブロックの前記2つの連結可能末端は2つが平滑端(すなわち各々はオーバーハングヌクレオチドをもたない)であってもよいが、好ましくは1つが平滑端で1つがオーバーハングを有するか、またはより好ましくは2つの末端がオーバーハングを有する。
前記の目的のために利用可能なオーバーハングは3’オーバーハングまたは5’オーバーハングであろう。したがって、核酸構築ブロックは、3’オーバーハング、また別には5’オーバーハング、また別には2つの3’オーバーハング、また別には2つの5’オーバーハングを有することができる。前記核酸構築ブロックが組み立てられて完成したキメラ核酸分子を生成する全体的な順序は、意図的な実験デザインによって決定され、ランダムではない。
【0071】
好ましい実施態様の1つに従えば、核酸構築ブロックは、2つの一本鎖核酸(一本鎖オリゴとも称する)を化学合成し、さらにそれらをアニールさせるために接触させて二本鎖核酸構築ブロックを生成することによって作製される。
二本鎖核酸構築ブロックは種々のサイズを有することができる。これらの構築ブロックのサイズは小さくても大きくてもよい。構築ブロックの好ましいサイズは1塩基対(いずれのオーバーハングも含まない)から100000塩基対(いずれのオーバーハングも含まない)の範囲である。他の好ましいサイズ範囲も提供される。それらは、下限が1塩基対から10000bp(その間の整数値を全て含む)で、上限が2bpから100000bp(その間の整数値を全て含む)である。
二本鎖核酸構築ブロックを生成する本発明で有用な多くの方法が存在する。前記は当技術分野で公知であり、当業者は容易に実施することができる。
【0072】
ある実施態様に従えば、二本鎖核酸構築ブロックは、先ず2つの一本鎖核酸を生成し、それらをアニールさせて二本鎖核酸構築ブロックを形成することによって作製される。二本鎖核酸構築ブロックの2本の鎖は、オーバーハングを形成するヌクレオチド以外は全てのヌクレオチドが相補的で、したがってオーバーハングは別としてミスマッチを含まない。別の実施態様に従えば、二本鎖核酸構築ブロックの2本の鎖は、オーバーハングを形成するヌクレオチドはさておき、全ヌクレオチド未満のヌクレオチドにおいて相補的である。したがって、本実施態様に従えば、二本鎖核酸構築ブロックを用いてコドンの縮退を導入することができる。好ましくはコドンの縮退は、本明細書で述べる部位特異的突然変異導入により、1つまたは2つ以上のN、N、G/TまたはN、N、C/Tカセットを用いて、また別には1つまたは2つ以上のN、N、Nカセットを用いて導入される。
【0073】
本発明のin vivo遺伝子組換え方法は、未知のハイブリッドまたは特定のポリヌクレオチドもしくは配列の対立遺伝子プールについて非計画的に実施することができる。しかしながら、特定のポリヌクレオチドの実際のDNAまたはRNA配列を知る必要はない。
遺伝子の混合集団内の組換えを利用するアプローチは、任意の有用なタンパク質、例えばインターロイキン1、抗体、tPAおよび成長因子の生成に有用であろう。前記アプローチは、特異性または活性が変化したタンパク質の生成に用いることができる。前記アプローチはまた、ハイブリッド核酸配列、例えば遺伝子のプロモーター領域、イントロン、エクソン、エンハンサー配列、31非翻訳領域、または51非翻訳領域の生成にも有用であろう。したがって、前記アプローチを用いて、発現速度の速い遺伝子を生成することができる。前記アプローチはまた、反復DNA配列の研究でも有用であろう。最後に、本アプローチは、リボザイムまたはアプタマー(aptamer)を変異させるために有用であろう。
【0074】
ある特徴では、本発明は、高度に複雑な直鎖状配列(例えばDNA、RNAまたはタンパク質)の誘導分子進化を可能にする、減数再組合せ(reductive reassortment)、組換えおよび選別で構成されるサイクルを繰り返して用いることに関する。
分子のin vivoシャッフリングは変種の提供に有用で、マルチマーを組換える細胞の天然の特性を利用して実施することができる。In vivo組換えは分子の多様性への主要な天然の経路を提供してきたが、一方、遺伝子組換えは依然として比較的複雑なプロセスであり以下の工程を含む:1)相同性の認識;2)鎖の切断、鎖への侵入および組換え交差をもたらす代謝工程;および3)別個の組換え分子への交差の分解。交差の形成は相同性配列の認識を必要とする。
【0075】
別の実施態様では、本発明は、少なくとも第一のポリヌクレオチドおよび第二のポリヌクレオチドからハイブリッドポリヌクレオチドを生成する方法を含む。本発明を用い、部分的な配列相同性を有する少なくとも1つの領域を共有する少なくとも第一のポリヌクレオチドおよび第二のポリヌクレオチドを適切な宿主細胞に導入することによって、ハイブリッドポリヌクレオチドを生成することができる。部分的配列相同性を有する領域は、ハイブリッドポリヌクレオチドを生成する配列再構成を生じるプロセスを促進する。本明細書において、“ハイブリッドポリヌクレオチド”という用語は、本発明の方法で得られ、少なくとも2つの最初のポリヌクレオチド配列に由来する配列を含む任意のヌクレオチド配列である。ハイブリッドポリヌクレオチドは、DNA分子間の配列の組込みを促進する分子間組換え事象によりもたらされる。さらに、そのようなハイブリッドポリヌクレオチドは、DNA分子内のヌクレオチド配列を変化させるために繰返し配列を利用する分子内減数再組合せプロセスから得ることができる。
【0076】
本発明は、生物学的に活性なハイブリッドポリペプチド(例えばハイブリッドポリメラーゼ)をコードすることができるハイブリッドポリヌクレオチドを生成する手段を提供する。ある特徴では、もともとのポリヌクレオチドは生物学的に活性なポリペプチドをコードする。本発明の方法は、生成されたハイブリッドポリヌクレオチドが元の生物学的に活性なポリペプチドに由来する活性を示すポリペプチドをコードすることができるように、元のポリヌクレオチドの配列を組み込む細胞性プロセスを利用することによって、新規なハイブリッドポリペプチドを生成する。
【0077】
例えば、元のポリヌクレオチドは異なる微生物に由来する特定のポリメラーゼをコードしてもよい。1つの生物または変種に由来する第一のポリヌクレオチドによってコードされるポリメラーゼは、例えば特定の環境条件(例えば高い塩分)の下で効率的に機能するものであってもよい。異なる生物または変種に由来する第二のポリヌクレオチドによってコードされるポリメラーゼは、異なる環境(例えば超高温)で効率的に機能するものであってもよい。第一および第二の最初のポリヌクレオチドに由来する配列を含むハイブリッドポリヌクレオチドは、元のポリヌクレオチドによってコードされる両酵素の特徴を示す酵素をコードすることができる。したがって、ハイブリッドポリヌクレオチドによってコードされる酵素は、第一および第二のポリヌクレオチドによってコードされる酵素の各々によって共有される環境条件(例えば高塩分および超高温)で効率的に機能することができ、特に超高温、例えば約95℃から113℃の温度でポリメラーゼ活性を示すであろう。いくつかの改変ポリヌクレオチドは、150℃までの温度でポリメラーゼ活性を示すことができ、前記温度は現在のところ、生命形態が、DNAおよび他の必須の分子の完全性を維持する化学結合の分解を防ぐことができる理論的限界であろうと考えられる。
【0078】
本発明のポリヌクレオチドによってコードされる酵素にはヒドラーゼ、例えばポリメラーゼが含まれるが、ただしこれらに限定されない。本発明の方法によって得られるハイブリッドポリペプチドは、元の酵素が示さない特殊な酵素活性を示すことができる。例えば、ポリメラーゼ活性をコードするポリヌクレオチドの組換えおよび/または減数再組合せに続いて、ハイブリッドポリヌクレオチドによってコードされる生成ハイブリッドポリペプチドは、元の酵素の各々から得られた特殊化されたポリメラーゼ活性について、すなわち前記ポリメラーゼが3’−5’エクソヌクレアーゼ活性を有するか否か、前記ポリメラーゼのDNA伸長速度、野生型ポリメラーゼと比較して異なるpHでの%残留活性、およびポリメラーゼ活性の最適温度および上限温度についてスクリーニングすることができる。したがって例えば、ハイブリッドポリメラーゼを元のポリメラーゼから区別する化学的機能性、例えば、温度安定性の上限、上限温度での温度安定性の持続時間、またはハイブリッドポリペプチドが機能するpHまたは塩濃度を確認するために、前記ポリメラーゼをスクリーニングすることができる。スクリーニングすることができるさらに別の所望されるポリメラーゼの特徴には、長さが20kbより大きいか、または90%を越えるグアニジン−シトシン(GC)含有量を含む鋳型分子のPCRでのハイブリッドポリメラーゼの有用性が含まれる。
【0079】
元のポリヌクレオチドの供給源は、個々の生物(“単離株”)、限定培地(“富裕培地”)で増殖させた生物集合物、または未培養生物(“環境サンプル”)から単離できる。環境サンプルから新規な生物活性をコードするポリヌクレオチドを誘導する培養非依存性アプローチを使用することがもっとも好ましい。なぜならば、前記のアプローチは、未開発の多様な生物資源にアクセスすることができるからである。
【0080】
“環境ライブラリー”は環境サンプルから生成され、適切な原核細胞宿主で増殖させることができるクローニングベクター内に保存された天然に存在する生物のゲノム集合である。クローン化DNAは先ず初めに環境サンプルから直接抽出されるので、前記ライブラリーは純粋な培養で増殖できる原核細胞の小部分に限定されない。さらに、原核細胞宿主で産生することができるポリメラーゼは、工業的製造のために容易にスケールアップすることができる。前記サンプルに存在する環境性DNAの標準化によって、最初のサンプルに存在する全種に由来するDNAのより均等な表現を可能にすることができるであろう。これによって、優勢な種と比較して数オーダー低く現れる可能性があるサンプルのマイナーな構成成分に由来する重要な遺伝子の発見効率が劇的に高められるであろう。
【0081】
例えば、1つまたは2つ以上の未培養微生物から生成された遺伝子ライブラリーが問題の活性についてスクリーニングされる。問題の生物活性分子をコードする潜在的経路は、遺伝子発現ライブラリーの形態で先ず初めに原核細胞で捕捉される。問題の活性をコードするポリヌクレオチドを前記ライブラリーから単離し、宿主細胞に導入する。新規な活性または活性の強化を示す潜在的に活性を有する生物分子を創出する組換えおよび/または減数再組合わせを促進する条件下で前記宿主細胞を増殖させる。
【0082】
配列番号:1、3、5、7、9、11、13、15を有する本発明のポリヌクレオチドが由来する微生物はピロロブス・フマリアである。さらに新たなポリヌクレオチドを原核微生物(例えば真正細菌および古細菌)および下等真核微生物(例えば真菌、いくつかの藻類および原虫)から調製することができる。ポリヌクレオチドは環境サンプルから単離できる。その場合、前記核酸は、生物を培養することなく回収することができ、または1つまたは2つ以上の培養生物から回収することができる。約90℃から約150℃までの範囲(例えば113℃まで)でポリメラーゼ活性を有するために、前記微生物は好ましくは、陸上の温泉または深海の熱噴出口で100℃を越える温度で機能する超好熱細菌である。超好熱細菌によって産生されるポリメラーゼは低い温度では酵素活性が失われるかもしれない。例えば、ピロロブス・フマリアは90℃以下の温度で増殖を停止する。
【0083】
上記で述べたように選別され単離されたポリヌクレオチドは適切な宿主に導入される。適切な宿主細胞は、組換えおよび/または減数再組合せを促進することができる任意の細胞である。選択したポリヌクレオチドは、適切な制御配列を含むベクターに好ましくは既に収納されてある。宿主細胞は高等真核細胞(例えば哺乳類細胞)、または下等真核細胞(例えば酵母細胞)であろう。または宿主細胞は、好ましくは原核細胞(例えば細菌細胞)であろう。構築物の前記宿主細胞への導入は、リン酸カルシウムトランスフェクション、DEAE−デキストラン仲介トランスフェクション、または電気穿孔(Davis et al.1986)によって実施できる。
適切な宿主の代表的な例として以下を挙げることができる:細菌細胞、例えば大腸菌、ストレプトミセス(Streptomyces)、ネズミチフス菌(Salmonella typhimurium);真菌細胞、例えば酵母;昆虫細胞、例えばショウジョウバエ(Drosophila)S2およびスポディプテラ(Spodiptera)Sf9;動物細胞、例えばCHO、COSまたはボウズ(Bowes)メラノーマ;アデノウイルス;および植物細胞。適切な宿主の選択は、本明細書の記載にしたがって当業者が選択できると考えられる。
【0084】
組換えタンパク質の発現に用いることができる種々の哺乳類細胞培養系を特に示せば、哺乳類発現系の例には、サル腎臓線維芽細胞のCOS−7株(以下の文献に記載されている:Gluzman, 1981,”SV40−transformed simian cell support the replication of early SV40 mutants”)、および適合するベクターを発現させることができる他の細胞株、例えばC127、3T3、CHO、HeLaおよびBHK細胞株が含まれる。哺乳類発現ベクターは、複製起点、適切なプロモーターおよびエンハンサー、さらにまた必要ないずれかのリボソーム結合部位、ポリアデニル化部位、スプライスドナーおよびアクセプター部位、転写終了配列、並びに5’フランキング非転写配列を含むであろう。SV40スプライスに由来するDNA配列およびポリアデニル化部位を用いて、必要な非転写遺伝子エレメントを提供することができる。
【0085】
問題のポリヌクレオチドを含む宿主細胞を、プロモーターを活性化させるために適切に改変した通常の栄養培養液で培養し、形質転換体を選別し、さらに遺伝子を増幅させることができる。前記培養条件、例えば温度およびpHなどは、発現のために選択した宿主細胞に関して以前に用いられたものであり、当業者には明白であろう。70℃から約113℃までの範囲の温度で固有のポリメラーゼ活性を有することが認定されたクローンの配列を決定し、前記ポリメラーゼをコードするポリヌクレオチド配列を同定することができる。
【0086】
遺伝子クラスターDNAは種々の生物から単離し、さらにベクター、特に発現調節配列を含むベクターに連結することができる(前記発現調節配列は、前記連結遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレーの活性が生成されるのを制御および調節することができる)。外因性DNAの導入のために極めて大きな能力をもつベクターの使用は、特に前記遺伝子クラスターとともに用いる場合に特に適切で、本明細書では大腸菌のf−因子(稔性因子)を含む実施例として記載されている。前記大腸菌のf−因子は、接合中にそれ自体の高頻度移入に影響を与えるプラスミドで、大型のDNAフラグメント(例えば混合微生物サンプルの遺伝子クラスター)の安定な増殖のために理想的である。特に好ましい実施態様は、クローニングベクター(“フォスミド”または細菌性人工染色体(BAC)ベクターと称される)を使用することである。前記ベクターは、ゲノムDNAの大きなセグメントを安定に組み込むことができる大腸菌f−因子に由来する。混合非培養環境サンプルに由来するDNAとともに組み込まれたとき、前記は大きなゲノムフラグメントを“環境性DNAライブラリー”の形態で入手することを可能にする。
【0087】
本発明で使用されるまた別のタイプのベクターは、コスミドベクターである。コスミドベクターは、本来大きなゲノムDNAセグメントをクローニングし増殖させるためにデザインされたものである。コスミドベクターでのクローニングは下記文献に詳細に記載されている:”Molecular Cloning: A laboratory Manual”(Sambrook et al., 1989)。いったん適切なベクターに連結したら、種々のポリペプチド合成遺伝子クラスターを含む2つまたは3つ以上のベクターを適切な宿主細胞に導入することができる。遺伝子クラスターによって共有される部分的配列相同性領域は、ハイブリッド遺伝子クラスターを生じる配列再構成をもたらすプロセスを促進するであろう。続いて、前記の新規なハイブリッド遺伝子クラスターを、本来の遺伝子クラスターで見出されないポリメラーゼ活性について、または本来の遺伝子クラスターで見出されるものから変化したポリメラーゼ活性についてスクリーニングすることができる。
【0088】
したがってある実施態様では、本発明は、以下の工程によって生物学的に活性なハイブリッドポリペプチドを生成し、前記ポリペプチドを活性の強化についてスクリーニングする方法に関する:
1)動作可能なように連結された少なくとも第一のポリヌクレオチドおよび動作可能なように連結された第二のポリヌクレオチドを適切な宿主細胞に導入することであって、前記第一のポリヌクレオチドおよび前記第二のポリヌクレオチドは部分的な配列相同性を有する少なくとも1つの領域を共有しており;
2)配列認識を促進する条件下で前記宿主細胞を増殖させ、動作可能なように連結されたハイブリッドポリヌクレオチドを生成し;
3)前記ハイブリッドポリヌクレオチドによってコードされるハイブリッドポリペプチドを発現させ;
4)生物学的活性の強化の同定を容易にする条件下で前記ハイブリッドポリペプチドをスクリーニングし;
5)前記ハイブリッドポリペプチドをコードするポリヌクレオチドを単離する。
ポリメラーゼ活性についてスクリーニングする方法は当業者には公知で、本明細書を通して考察されている。そのような方法は、本発明のポリペプチドおよびポリヌクレオチドを単離した時に用いることができる。
【0089】
使用することができる発現ベクターの代表的な例として以下を挙げることができる:ウイルス粒子、バキュロウイルス、ファージ、プラスミド、ファージミド、コスミド、フォスミド、細菌人工染色体、ウイルスDNA(例えばワクシニア、アデノウイルス、鶏痘ウイルス、仮性狂犬病およびSV40誘導体)、P1系人工染色体、酵母人工染色体、および問題の固有の宿主(例えばバチルス、アスペルギルス、および酵母)に特異的な任意の他のベクター。したがって、例えば前記DNAはポリペプチドを発現させるために多様な発現ベクターのいずれかに含有させることができる。前記ベクターには、染色体配列、非染色体配列および合成DNA配列が含まれる。多数の適切なベクターが当業者には公知で、さらに市販されている。以下のベクターは例として提供される:細菌性:pQEベクター(Qiagen)、pBluescriptプラスミド、pNHベクター(λ−ZAPベクター(Stratagene));ptc99a、pKK223−3、pDR540、pRIT2T(Pharmacia);真核細胞性:pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。しかしながら、他のいずれのプラスミドまたは他のいずれのベクターもそれらが宿主細胞で複製可能で生存可能である限り用いることができる。低コピー数ベクターまたは高コピー数ベクターも本発明で用いることができる。
【0090】
発現ベクター内のDNA配列は、RNA合成を指令する適切な発現制御配列(プロモーター)に機能的に連結される。特に列挙すれば、細菌プロモーターには、lacI、lacZ、T3、T7、gpt、lambdaPR、PLおよびtrpが含まれる。真核細胞プロモーターには、CMV極初期、HSVチミジンキナーゼ、初期および後期SV40、レトロウイルス由来LTR、およびマウスのメタロチオネン−Iが含まれる。適切なベクターおよびプロモーターの選択は当業者に周知である。前記発現ベクターはまた、翻訳開始のためのリボソーム結合部位および転写ターミネーターを含む。前記ベクターはまた発現増幅のための適切な配列を含むことができる。プロモーター領域は、CAT(クロラムフェニコールトランスフェラーゼ)ベクターまたは選別可能マーカーを含む他のベクターを用いて任意の所望の遺伝子から選択できる。さらに、発現ベクターは好ましくは1つまたは2つ以上の選別可能マーカー遺伝子を含み、形質転換細胞の選別のための表現型特性、例えば真核細胞の場合はジヒドロフォレートレダクターゼまたはネオマイシン耐性、大腸菌のテトラサイクリンまたはアンピシリン耐性を提供する。
【0091】
in vivo再組合せは、包括的には“組換え”と称される“分子間”プロセスに依存し、細菌では一般に“RecA依存”現象とみなされる。本発明は、配列を組換えて再度組み合わせるために宿主細胞の組換えプロセスに依存するか、または細胞内の擬似反復配列のコンプレキシティーを欠失によって減少させる減数プロセスを仲介する細胞の能力に依存する。この“減数再組合せ”のプロセスは“分子間”RecA非依存プロセスによって生じる。
【0092】
したがって、本発明の別の実施態様では、新規なポリヌクレオチドは減数再組合せのプロセスによって生成できる。前記方法は、連続配列(最初のコード配列)を含む構築物の生成、それらの適切なベクターへの挿入、続いて適切な宿主細胞へのそれらの導入を必要とする。個々の分子の認定本体(identities)の再組合せは、相同性領域を有する構築物中の連続配列間または擬似反復ユニット間の結合プロセスによって生じる。前記再組合せプロセスは、反復配列のコンプレキシティーおよび程度の再組換えおよび/または減少をもたらし、さらに新規な分子種の生成をもたらす。種々の処置を適用して、再組合せ速度を高めることができる。前記処置には、紫外線またはDNA損傷化学物質による処置および/または“遺伝的不安定性”のレベルが強化された宿主細胞株の使用が含まれる。したがって、再組合せプロセスは相同性組換え、またはそれ自身の進化を誘導する擬似反復配列の天然の特性を必要とする。
【0093】
反復配列または“擬似反復”配列は遺伝的不安定性において役割を果たす。本発明では、“擬似リピート”はそれらの本来のユニット構造に限定されない反復物である。擬似反復ユニットは、構築物中の配列アレー、同様な配列の連続ユニットとして提示することができる。いったん連結されたら、連続配列間の結合部は本質的に見分けることができなくなり、生じた構築物の擬似反復特性は分子レベルではもはや連続的である。生成される構築物のコンプレキシティーを減少させるために細胞が行う前記欠失プロセスは擬似反復配列間で生じる。前記擬似反復ユニットは、すべり現象をもたらす鋳型の実用的な無限のレパートリーを提供する。したがって、擬似リピートを含む構築物は、実質的に擬似反復ユニット内の任意の場所に欠失(および潜在的には挿入)事象を生じる十分な分子の順応性を効果的に提供する。
【0094】
前記擬似反復配列が全て同じ向きに(例えばヘッド−テール結合またはその逆)連結されたとき、細胞は個々のユニットを識別することができない。結果として、減数プロセスが配列全体に発生し得る。対照的に、前記ユニットがヘッド−テール結合ではなくヘッド−ヘッド結合で存在するとき、前記倒置によって隣接ユニットの終末点が明確に示され、欠失形成は離散的ユニットの損失を促進するであろう。したがって、本発明の方法に関しては配列が同じ向きにあることが好ましい。擬似反復配列のランダムな方向性は再組合せ効率の低下をもたらすが、一定の方向性の配列はもっとも高い効率を提供するであろう。しかしながら、同じ向きの連続配列の数が少なければ前記効率は低下するが、一方、前記はなお新規な分子の効果的な回収について十分な順応性を提供することができる。構築物は同じ向きの擬似反復配列を用いて作製し、より高い効率を可能にすることができる。
【0095】
配列は、以下を含む任意の多様な方法を用いてヘッド−テール結合の向きで組み立てることができる:
a)ポリAヘッドおよびポリT尾部(一本鎖を作製するときは、前記によって方向性が提供される)を含むプライマーを利用することができる。これは、プライマーの最初の数塩基をRNAで生成することによって(したがってRNaseHによって容易に分解できる)達成できる。
b)固有の制限部位を含むプライマーを用いることができる。多数の部位、一連の固有配列および合成と連結の工程の繰返しが要求されよう。
c)プライマーの内部の数塩基をチオール化し、さらにエキソヌクレアーゼを用いて適切なテールを有する分子を生成することができよう。
【0096】
再組合せされた配列の回収は、RIが低いクローニングベクターの同定に依存する。前記の再組合せされたコード配列を続いて増幅によって回収する。生成物を再クローンニングし発現させる。RIが低いクローニングベクターの回収は以下によって実施できる:
1)構築物のコンプレキシティーが減少したときにのみ安定に維持されるベクターを使用する。
2)短縮ベクターの物理的方法による回収。この場合、クローニングベクターは標準的なプラスミド単離方法を用いて回収され、さらにアガロースゲルまたはカラムのいずれかで標準的な方法を利用して低分子量カットオフによりサイズで分画されるであろう。
3)挿入物サイズが減少したときに選別できる介在遺伝子を含むベクターを回収する。
4)発現ベクターおよび適切な選別を用いる直接選別技術を使用する。
【0097】
関連する生物由来のコード配列(例えば遺伝子)は高度な相同性を示し、多様なタンパク生成物をコードするであろう。前記のようなタイプの配列は、擬似反復配列として本発明で特に有用である。しかしながら、下記に例示した実施例ではほとんど同一のオリジナルコード配列(擬似反復配列)の再組合せを示したが、本プロセスはそのようなほぼ同一の反復配列に限定されない。
以下の実施例によって本発明の方法が立証される。3つの固有種に由来するコード核酸配列(擬似反復配列)について述べる。各配列は、別個の一組の特性を有するタンパク質をコードする。配列の各々は、その中の固有の位置に1つまたは数塩基対の相違を有する。前記擬似反復配列を別々に、または一緒に増幅し、さらに、全ての可能な並べ換えおよび組合せが連結分子集団で得られるようにランダムに連結して集合物にする。擬似反復配列ユニットの数はアッセンブリー条件によって制御することができる。構築物中の擬似反復ユニットの平均数は反復指標(RI)と定義される。
【0098】
いったん形成したら、前記構築物は文献に記載されたプロトコルに従ってサイズにより分画し(またはしなくてもよい)、適切な宿主細胞にトランスフェクトすることができる。続いて細胞を増殖させ、“減数再組み合わせ”を実施する。減数再組合せプロセスの速度は、所望の場合はDNA損傷の誘発によって促進することができる。RIの減少が、“分子内”メカニズムによる反復配列間の欠失形成によって仲介されるか、または“分子間”メカニズムによる組換え様事象によって仲介されるかは重要ではない。最終的に得られるものは、前記分子の再組合せによる可能な全ての組合せである。
【0099】
場合によって前記方法はさらに別の工程を含む。前記工程は、シャッフリング実施プールのライブラリー構成物をスクリーニングし、シャッフリングを実施したライブラリーで、予め定めた巨大分子(例えばタンパク質性レセプター、オリゴ糖、ヴァイロン(viron))または他の予め定めた化合物または構造と結合もしくは相互作用する能力、または前記との特定の増幅反応を触媒する能力を有する個々の構成物質を同定する。
前記ライブラリーから同定されたポリペプチドは、治療、診断、研究および関連する目的(例えば触媒、水溶液の浸透圧を増加させるための溶質など)のために用いることができ、および/または、もう1回または2回以上のさらに別のシャッフリングおよび/または選別サイクルに付すことができる。
【0100】
別の特徴では、組換えまたは再組合せの前またはその最中に、変異をオリジナルのポリヌクレオチドに導入しやすくする薬剤またはプロセスに本発明の方法によって生成されたポリヌクレオチドを付すことが考慮される。前記変異の導入は、生成されるハイブリッドポリヌクレオチドおよびそれらからコードされるポリペプチドの多様性を高めるであろう。突然変異導入を促進する薬剤またはプロセスには以下が含まれるが、ただしこれらに限定されない:(+)−CC−1065または合成類似体、例えば(+)−CC−1065−(N3−アデニン)(Sun and Hurley, 1992);DNA合成を抑制することができるN−アセチル化または脱アセチル化4’−フルオロ−4−アミノビフェニルアダクツ(例えば、van de Poll et al., 1992);またはDNA合成を抑制することができるN−アセチル化または脱アセチル化4−アミノビフェニルアダクツ(例えばまた以下を参照されたい:van de Poll et al., 1992, pp.751−758);3価クロム、3価クロム塩、DNA複製を抑制することができる多環式芳香族炭化水素(”PAH”)DNAアダクツ、例えば7−ブロモメチル−ベンゾ[a]アントラセン(“BMA”)、トリス(2,3−ジブロモプロピル)ホスフェート(“トリス−BP”)、1,2−ジブロモ−3−クロロプロパン(“DBCP”)、2−ブロモアクロレイン(2BA)、ベンゾ[a]ピレン−7,8−ジヒドロジオール−9−10−エポキシド(“BPDE”)、ハロゲン白金塩(II)、N−ヒドロキシ−2−アミノ−3−メチルイミダゾール[4,5−f]−キノリン(“N−ヒドロキシ−IQ”)、およびN−ヒドロキシ−2−アミノ−1−メチル−6−フェニルイミダゾール[4,5−f]ピリジン(“N−ヒドロキシ−PhIP”)。PCR増幅を遅くするかまたは停止させる特に好ましい手段は、UV光(+)−CC1065および(+)−CC−1065−(N3−アデニン)から成る。特に包含される手段は、DNAアダクツまたはポリヌクレオチドもしくはポリヌクレオチドプール由来のDNAアダクツを含むポリヌクレオチドであり、前記は、更なる処理の前にポリヌクレオチドを含む溶液の加熱を含むプロセスによって遊離または除去される。
【0101】
別の特徴では、本発明は、野生型タンパク質をコードする二本鎖鋳型ポリヌクレオチドを含むサンプルを、ハイブリッドまたは再組合せポリヌクレオチドを提供する本発明の条件の下で処理することによって、生物学的活性を有するリコンビナントタンパク質を生成する方法を目的とする。
本発明はまた、点変異をポリヌクレオチドに導入して、全範囲の単一アミノ酸置換が各アミノ酸部位において出現する子孫ポリペプチドセットを生成するための専用コドンプライマー(縮退N,N,N配列を含む)の使用を提供する(遺伝子部位飽和突然変異導入(gene site saturated mutagenesis, GSSM))。使用されるオリゴは、連続的に第一の相同配列、縮退N,N,N配列および必ずというわけではないが好ましくは第二の相同配列を含む。N,N,N配列の縮退は20個のアミノ酸全てに対するコドンを含むので、下流の子孫ポリペプチドの翻訳生成物は、前記ポリペプチドに沿って各アミノ酸サイトで全ての可能なアミノ酸変更を含む。
【0102】
ある特徴では、前記のような縮退オリゴ(縮退N,N,Nカセットで構成される)の1つを用いて、親のポリヌクレオチド鋳型の各オリジナルコドンが完全なコドン置換に付される。別の特徴では、少なくとも2つの縮退N,N,Nカセット(同じオリゴまたは異なるオリゴ)を用いて、親のポリヌクレオチド鋳型の少なくとも2つのオリジナルコドンが完全なコドン置換に付される。したがって、2つ以上のN,N,N配列を1つのオリゴに含ませて、2つ以上の部位にアミノ酸変異を導入することができる。この複数のN,N,N配列は直接接していてもよいが、また1つまたは2つ以上の別のヌクレオチド配列によって分離されてあってもよい。別の特徴では、付加および欠失を導入するために有用なオリゴを、単独またはN,N,N配列を含むコドンと組み合わせて用いて、アミノ酸の付加、欠失および/または置換の任意の組合せまたは並べ換えを導入することができる。
【0103】
特別な実施態様では、連続的なN,N,Nトリプレット(すなわち縮退(N,N,N)n配列)を含むオリゴを用いて、2つまたは3つ以上のアミノ酸の位置を同時に変異させることができる。
また別の特徴では、本発明は、N,N,N配列よりも少ない縮退を有する縮退カセットの使用を提供する。例えば、いくつかの事例では、(例えばオリゴとして)ただ1種のN(この場合Nはトリプレットの一番目、二番目または三番目の位置にあるものであってよい)で構成された縮退トリプレット配列を用いることが望ましいであろう。他のいずれの塩基(その任意の組合せおよび並べ換えを含む)も前記トリプレットの残りの2つの位置で用いることができる。また別には、いくつかの事例では、縮退N,N,Nトリプレット配列、N,N,G/T、またはN,N,G/Cトリプレット配列を(オリゴとして)用いることが所望されるであろう。
【0104】
しかしながら、本発明で開示した縮退トリプレット(例えばN,N,G/TまたはN,N,G/Cトリプレット配列)の使用が、いくつかの理由から有利であることは理解されるところである。ある特徴では、本発明は、可能なアミノ酸(合計20個のアミノ酸について)をポリペプチド内の各々および全てのアミノ酸の位置で完全に、系統的にさらにかなり容易に置換させる手段を提供する。したがって、100個のアミノ酸のポリペプチドの場合、本発明は、系統的にさらにかなり容易に2000個の異なる種(すなわち各位置につき20個の可能なアミノ酸×100アミノ酸の位置)を生成する方法を提供する。縮退N,N,G/TまたはN,N,G/Cトリプレット配列を収納するオリゴの使用により、20個の可能なアミノ酸をコードする32個の別個の配列が提供されることは理解されよう。したがって、前記のような1つのオリゴを用いて親のポリヌクレオチド配列が飽和変異導入に付されている反応容器内には、20個の異なるポリペプチドをコードする32個の異なる子孫ポリヌクレオチドが存在する。対照的に、部位特異的突然変異導入で非縮退オリゴを使用することによって各反応容器につきただ1つの子孫ポリペプチド生成物が生じる。
【0105】
本発明はまた非縮退オリゴの使用を提供し、前記非縮退オリゴは、場合によって開示の縮退プライマーと組み合わせて用いられる。いくつかの状況では、非縮退オリゴを用いて、問題のポリヌクレオチドで特定の点変異を生成するのが有利であることは理解されよう。前記は、特定の非発現点変異、対応するアミノ酸の変化をもたらす点変異、並びに終止コドンの生成および対応するポリペプチドフラグメントの発現をもたらす点変異を創出する手段を提供する。
【0106】
したがって、本発明の好ましい実施態様では、各飽和突然変異導入反応容器は、親のポリヌクレオチドで突然変異を誘発したコドンの位置に対応する1つの固有のアミノ酸の位置に20個のアミノ酸全てが出現するように少なくとも20個の子孫ポリペプチド分子をコードするポリヌクレオチドを含む。各飽和突然変異導入反応容器から生成される32倍の縮退子孫ポリペプチドをクローン増幅(例えば発現ベクターを用いて大腸菌宿主でクローニングする)に付し、さらに発現スクリーニングに付すことができる。スクリーニングして好ましい特性変化を表示させることによって個々の子孫ポリペプチドを認定したとき、前記ポリペプチドの配列を決定し、その中に含まれている対応する個々の好ましいアミノ酸置換を同定することができる。
【0107】
本明細書に開示した飽和突然変異導入を用いて親のポリペプチドの各々および全てのアミノ酸の位置を変異させるときに、2つ以上のアミノ酸の位置で好ましいアミノ酸の変化を同定できることは理解されよう。これら好ましいアミノ酸置換の全てまたは一部分を含む1つまたは2つ以上の新規な子孫分子を生成することができる。例えば、2つの固有の好ましいアミノ酸の変化がポリペプチド内の3つのアミノ酸各位置に同定される場合、順列は各位置で3つの可能性(本来のアミノ酸から変化がないもの、および2つの好ましい変化のうちのそれぞれ1つ)を3つの位置で含む。したがって、可能性の合計は3×3×3または27で、これは以前に調べた7つ、すなわち6つの単一点変異(すなわち3つの位置の各々について2個)およびいずれの位置にも変化がないものを含む。
【0108】
さらに別の特徴では、部位飽和突然変異導入は、シャッフリング、キメラ化、組換えおよび他の突然変異導入プロセスとと共にスクリーニングと合わせて用いることができる。本発明は、任意の突然変異導入プロセス(飽和突然変異導入を含む)の反復態様における使用を提供する。ある実施態様では、任意の突然変異導入プロセスの反復使用がスクリーニングと組み合わせて用いられる。
したがって非制限的に例示すれば、本発明は、さらに別の突然変異導入プロセスと組み合わせた飽和突然変異導入の使用を提供する。前記別の突然変異導入プロセスは、例えば、2つまたは3つ以上の関連ポリヌクレオチドを適切な宿主細胞に導入し、ハイブリッドポリヌクレオチドを組換えおよび減数再組合せによって生成するものである。
【0109】
遺伝子の完全な配列に対して突然変異導入を実施する他に、本発明はポリヌクレオチド内の任意の数の塩基をそれぞれ置換することができる突然変異の使用を提供する。突然変異を誘発される前記塩基数は、好ましくは15から100000までの全ての整数である。したがって、分子の任意の位置に突然変異を誘発する代わりに、任意の数の塩基または一定の数の塩基(好ましくは総数15から100000のサブセット)を突然変異導入に付すことができる。好ましくは、ばらばらのヌクレオチドが、ポリヌクレオチド配列の各位置または数ヶ所の位置を含むグループの突然変異導入のために用いられる。突然変異導入を実施される3ヶ所の位置を含むグループはコドンであってもよい。変異は、好ましくは突然変異導入性プライマー(突然変異導入性カセットとも称される異種カセットを含む)を用いて導入される。好ましいカセットは1から500塩基を有することができる。前記異種カセットの各ヌクレオチドの配置は、N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/GまたはEで、ここでEは、A、C、GまたはTではない任意の塩基である(Eはデザイナーオリゴと称することもできる)。
【0110】
一般的な意味で、飽和突然変異導入は、突然変異導入を実施されるべき一定の範囲のポリヌクレオチド(突然変異導入されるべき前記配列は好ましくは長さが約15から100000塩基である)内の完全な一組の突然変異導入性カセット(各カセットは好ましくは1−500塩基の長さである)を突然変異導入することを含む。したがって、数変異(1から100個の範囲の変異)を含む1つのグループが、突然変異を誘発されるべき各カセットに導入される。1ラウンドの飽和突然変異導入適用中に、1つのカセットに導入されるべき変異の集合は、第二のカセットに導入されるべき第二の変異の集合と同じでも異なっていてもよい。前記集合は例示すれば欠失、付加、特定コドンの集合、および特定ヌクレオチドカセットの集合である。
【0111】
突然変異を誘発されるべき一定の範囲の配列は、完全な遺伝子、経路、cDNA、完全なオペロン読み枠(ORF)および完全なプロモーター、エンハンサー、リプレッサー/トランスアクチベーター、複製起点、イントロン、オペレーターまたは任意のポリヌクレオチド機能群を含む。一般的には、本目的のための“一定の範囲の配列”とは、15塩基のポリヌクレオチド配列、さらに長さが15塩基から15000塩基の間のポリヌクレオチド配列の任意のポリヌクレオチドであろう(本発明では特に前記の間の全ての整数が指定される)。コドンの集合の選択で考慮されるべきこと事柄には、縮退突然変異導入性カセットによってコードされるアミノ酸タイプが含まれる。
突然変異導入性カセットに導入できる変異の集合の特に好ましい実施例で、本発明は特に、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19および20個のアミノ酸を各位置でコードする縮退コドン置換(縮退オリゴを用いる)およびそれらによってコードされるポリペプチドライブラリーを提供する。
【0112】
本発明の特徴の1つは、1、3、5、7、9、11、13、15の配列、および前記配列と実質的に同一の配列、前記配列と相補的な配列の1つ、またはグループAの核酸配列の配列(または前記配列と相補的な配列)の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメントを含む単離核酸である。前記単離された核酸は、DNA(cDNA、ゲノムDNAおよび合成DNAを含む)を含む。前記DNAは二本鎖でも一本鎖でもよく、一本鎖の場合はコード鎖でも非コード鎖でもよい。また別には、前記単離核酸はRNAでもよい。
下記でさらに詳細に説明するように、配列番号:1、3、5、7、9、11、13、15および前記配列と実質的に同一の配列の1つの単離核酸を用いて、グループBのアミノ酸配列および前記配列と実質的に同一の配列を有するポリペプチドの1つ、または配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列の1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントを製造できる。
【0113】
したがって本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチド、または配列番号:2、4、6、8、10、12、14、16のポリペプチドの1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントをコードする単離核酸である。前記核酸のコード配列は、配列番号:1、3、5、7、9、11、13、15の核酸の1つのコード配列またはそのフラグメントの1つと同一であるか、または、遺伝暗号の重複もしくは縮退の結果として、縮退配列番号:2、4、6、8、10、12、14、16のポリペプチド、前記と実質的に同一の配列、および配列番号:2、4、6、8、10、12、14、16のポリペプチドの1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つをコードする異なるコード配列であろう。前記遺伝暗号は当業者には周知で、例えば以下の文献(B.Lewin, Genes VI, Oxford University Press, 1997)の214ページに記載されている(前記文献は引用により本明細書に含まれる)。
【0114】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドの1つをコードする単離核酸は、以下のもの(ただしこれらに限定されない)を含むことができる:配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の1つのコード配列のみ、およびさらに別のコード配列(例えばリーダー配列またはプロタンパク質配列)、および非コード配列(例えばイントロンまたはコード配列の5’および/または3’非コード配列)。したがって本明細書で用いられるように、“ポリペプチドをコードするポリヌクレオチド”という用語は、ポリペプチドのコード配列のみを含むポリヌクレオチドとともに、さらに別のコードおよび/または非コード配列も含むポリヌクレオチドを包含する。
【0115】
また別には、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の核酸配列に、通常の技術、例えば部位特異的突然変異、または当業者に周知の他の技術を用いて突然変異を誘発し、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列のポリヌクレオチドにサイレント変化を導入することができる。本明細書において、“サイレント変化”には、例えばポリヌクレオチドによってコードされるアミノ酸配列を変更しない変化が含まれる。前記変化は、前記ポリペプチドをコードするベクターを含む宿主細胞によって産生されるポリペプチドレベルを、宿主生物で頻繁に生じるコドンまたはコドン対を導入することによって高めるために所望されるであろう。
【0116】
本発明はまた、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチドにおいてアミノ酸置換、付加、欠失、融合および末端切断をもたらすヌクレオチド変化を有するポリヌクレオチドに関する。前記のヌクレオチド変化は、例えば部位特異的突然変異導入、化学物質によるランダムな突然変異導入、エキソヌクレアーゼIIIによる欠失、および他のDNA組換え技術を用いて導入することができる。あるいは、このようなヌクレオチド変化は天然に生じる対立遺伝子座変種であってもよく、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列(または前記と相補的な配列)の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むプローブと、本明細書で提供される高い、中等度または低いストリンジェンシー条件下で特異的にハイブリダイズする核酸を同定することによって単離される。
【0117】
配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、前記と相補的な配列、または配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列または前記と相補的な配列の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメントの単離核酸をまた用いて、生物学的サンプル(例えば土壌サンプル)が本発明の核酸配列を有する生物を含むか否か、または前記核酸が得られた生物を含むか否かを決定することができる。そのような方法では、前記核酸が単離された生物を含む可能性がある生物学的サンプルを入手し、そのサンプルから核酸を入手する。プローブがサンプル中に存在する一切の相補的な配列と特異的にハイブリダイズすることができる条件下で、そのプローブと核酸を接触させる。
【0118】
必要な場合には、相補的な配列とプローブが特異的にハイブリダイズすることができる条件は、相補的な配列を含むことが判明しているサンプルに由来する相補的な配列とともに前記相補的な配列を含まないコントロール配列を前記プローブと接触させることによって決定してもよい。ハイブリダイゼーションの条件、例えばハイブリダイゼーション緩衝液の塩濃度、ハイブリダイゼーション緩衝液のホルムアミドの濃度、またはハイブリダイゼーションの温度を変動させて、プローブを相補的核酸と特異的にハイブリダイズさせる条件を同定することができる。
【0119】
前記核酸が単離された生物を前記サンプルが含んでいる場合は、プローブの固有のハイブリダイゼーションが検出される。ハイブリダイゼーションは、プローブを検出可能な薬剤(例えば放射性同位元素、蛍光染料、または検出可能な生成物の生成を触媒することができる酵素)で標識することによって検出することができる。
サンプル中の相補的な核酸の存在を検出する標識プローブを使用する多くの方法は当業者には周知である。前記方法には、サザンブロット、ノザンブロット、コロニーハイブリダイゼーションおよびドットブロットが含まれる。これらの方法の各々に関するプロトコルは以下の文献に提供されている:Ausubel et al. ”Current Protocols in Molecular Biology,” John Wiley 503 Sons, Inc. 1997;およびSambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press, 1989(前記文献は引用により本明細書に含まれる)。
【0120】
あるいは、2つ以上のプローブ(そのうちの少なくとも1つは核酸サンプル中に存在する一切の相補的配列と特異的にハイブリダイズすることができる)を増幅反応で用いて、前記サンプルが本発明の核酸を含む生物(例えば前記核酸が単離された生物)を含むか否かを決定してもよい。典型的には前記プローブはオリゴヌクレオチドを含む。ある実施態様では、前記増幅反応はPCR反応を含むことができる。PCR反応は上掲書(AusubelおよびSambrook)に記載されている。また別には、前記増幅はリガーゼ連鎖反応、3SRまたは鎖置換反応を含むことができる(例えば以下の文献を参照されたい:F. Barany, ” The Ligase Chain Reaction in a PCR World”, PCR Methods and Applications 1:5−16,1991; E. Fahy et al., ”Self−sustained Sequence Replication(3SR): An Isothermal Transcription−based Amplification System Alternative to PCR”, PCR Methods and Applications 1:25−33,1991; G.T. Walker et al., ” Strand Displacement Amplification−an Isothermal in vitro DNA Amplification Technique”, Nucleic Acid Research 20:1691−1696,1992(前記文献は引用により本明細書に含まれる))。これらの方法では、サンプル中の核酸をプローブと接触し、増幅反応を実施し、さらに得られた増幅反応生成物を全て検出する。前記増幅生成物は、反応生成物を用いてゲル電気泳動を実施し、前記ゲルをインターカレーター(例えば臭化エチジウム)で染色して検出できる。また別には、1つまたは2つ以上のプローブを放射性同位元素で標識し、ゲル電気泳動後にオートラジオグラフィーによって放射性の増幅生成物の存在を検出してもよい。
【0121】
また配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の末端近くの配列に由来するプローブを染色体ウォーキング法で用いて、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の近傍に位置するゲノム配列を含むクローンを特定してもよい。前記の方法は、宿主生物からさらに別のタンパク質をコードする遺伝子の単離を可能にする。
配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、前記と相補的な配列、または配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列または前記と相補的な配列の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメントの単離核酸をプローブとして用いて、関連する核酸を同定または単離することができる。いくつかの実施態様では、関連する核酸は、前記核酸が単離された生物以外の生物のcDNAまたはゲノムDNAであろう。例えば、前記他の生物は関連を有する生物であろう。前記の方法では、プローブが関連する核酸と特異的にハイブリダイズできる条件下で核酸サンプルをプローブと接触させる。続いて、プローブと関連する生物由来の核酸とのハイブリダイゼーションを上記に述べた方法のいずれかを用いて検出する。
【0122】
核酸ハイブリダイゼーション反応では、特定のレベルのストリンジェンシーを達成するために用いられる条件は、ハイブリダイズされる核酸の性質によって変動するであろう。例えば、ハイブリダイズさせる核酸領域の長さ、相補性の程度、ヌクレオチド配列の組成(例えばGC対AT含有量)、および核酸のタイプ(例えばRNAかDNAか)は、ハイブリダイゼーション条件の選択で考慮されるであろう。さらに、核酸の1つが例えばフィルターに固定されているか否かが考慮されるであろう。
【0123】
ハイブリダイゼーションは、低ストリンジェンシー、中等度ストリンジェンシーまたは高ストリンジェンシー条件下で実施できる。核酸ハイブリダイゼーションの例を挙げれば、固定化した変性核酸を含むポリマーメンブレンを先ず30分、45℃で、0.9MのNaCl、50mMのNaH2PO4(pH7.0)、5.0mMのNa2EDTA、0.5%SDS、10×デンハルト溶液および0.5mg/mLのポリリボアデニル酸から成る溶液中で予備ハイブリダイズする。続いて前記溶液に、約2×107cpm(比活性4−9×108cpm/μg)の32P末端標識オリゴヌクレオチドを添加する。12−16時間のインキュベーションの後で、前記メンブレンを室温で0.5%のSDSを含む1×SET(150mLのNaCl、20mMのトリス塩酸(pH7.8)、1mMのNa2EDTA)で洗浄し、続いて新しい1×SETで30分、前記オリゴヌクレオチドプローブのTm−10℃で洗浄する。続いて前記のメンブレンをオートラジオグラフィーフィルムに曝露しハイブリダイゼーションシグナルを検出する。
【0124】
検出可能プローブとハイブリダイズする核酸(例えばcDNAまたはゲノムDNA)を検出するために用いるハイブリダイゼーション条件のストリンジェンシーを変動させることによって、前記プローブと種々のレベルの相同性を有する核酸を同定し、単離することができる。ストリンジェンシーは、プローブの溶融温度より低い種々の温度でハイブリダイゼーションを実施することによって変動させることができる。溶融温度Tmは、(特定のイオン強度およびpHで)標的配列の50%が完全に相補的なプローブとハイブリダイズする温度である。非常にストリンジェントな条件は、個々のプローブのTmと等しいかまたは約5℃低くなるように選択される。プローブの溶融温度は以下の式を用いて計算される:
長さが14から70ヌクレオチドのプローブについては、溶融温度(Tm)は次の式を用いて計算される:Tm=81.5+16.6(log[Na+])+0.41(G+Cの割合)−(600/N)、式中Nはプローブの長さである。
ハイブリダイゼーションがホルムアミドを含む溶液で実施される場合は、溶融温度は次の式を用いて計算できる:Tm=81.5+16.6(log[Na+])+0.41(G+Cの割合)−(0.63%ホルムアミド)−(600/N)、式中Nはプローブの長さである。
ハイブリダイゼーションは、6×SSC、5×デンハルト試薬、0.5%SDS、100μgの変性フラグメント化サケ精子DNA、または6×SSC、5×デンハルト試薬、0.5%SDS、100μgの変性フラグメント化サケ精子DNA、50%のホルムアミド中で実施できる。SSCおよびデンハルト試薬の処方は上掲書(Sambrook et al.)に記載されている。
【0125】
ハイブリダイゼーションは、上記に挙げた予備ハイブリダイゼーション溶液に検出可能なプローブを添加することによって実施できる。プローブが二本鎖DNAを含む場合は、ハイブリダイゼーション溶液に添加する前に前記プローブを変性させる。プローブと相補的な配列または相同な配列を含むcDNAまたはゲノムDNAとプローブをハイブリダイズさせるために十分な時間、前記フィルターをハイブリダイゼーション溶液と接触させる。長さが200ヌクレオチドを越えるプローブの場合は、ハイブリダイゼーションはTmより15−25℃低い温度で実施することができる。より短いプローブの場合(例えばオリゴヌクレオチドプローブ)、ハイブリダイゼーションはTmより5−10℃低い温度で実施できる。典型的には6×SSCでのハイブリダイゼーションの場合は、ハイブリダイゼーションは約68℃で実施される。通常、50%のホルムアミドを含む溶液中でのハイブリダイゼーションの場合は、ハイブリダイゼーションは約42℃で実施される。
前述のハイブリダイゼーションのいずれも高ストリンジェンシー条件下であると考えられる。
【0126】
ハイブリダイゼーションに続いて、フィルターを洗浄して非特異的に結合した検出用プローブの一切を除去する。フィルターを洗浄するために用いるストリンジェンシーもまた、ハイブリダイズさせる核酸の性質、ハイブリダイズさせる核酸の長さ、相補性の程度、ヌクレオチド配列の組成(例えばGC対AT含有量)、および核酸のタイプ(例えばRNAかDNAか)に応じて変動させることができる。徐々に高くなるストリンジェンシー条件の洗浄の例は以下のとおりである:2×SSC、0.1%SDS、室温で15分(低ストリンジェンシー);0.1×SSC、0.5%SDS、室温で30分から1時間(中等度のストリンジェンシー);0.1×SSC、0.5%SDS、ハイブリダイゼーション温度から68℃で15分から30分(高ストリンジェンシー);および0.15MのNaCl、72℃で15分(超ストリンジェンシー)。最後の低ストリンジェンシー洗浄は、0.1×SSCで室温で実施できる。上記の例は、フィルターの洗浄に用いることができる単なる条件一式の例示である。当業者は、種々のストリンジェンシーの洗浄用レシピーが多数存在することを認識しているであろう。他のいくつかの例は下記で示す。
プローブにハイブリダイズした核酸はオートラジオグラフィーまたは他の通常の技術によって同定される。
【0127】
上記の方法を改変して、プローブ配列と相同性レベルが低い核酸を同定できる。例えば、検出用プローブとの相同性が低い核酸を得るために、ストリンジェンシーがより低い条件を用いることができる。例えばハイブリダイゼーション温度は、約1MのNa+濃度を有するハイブリダイゼーション緩衝液中で、68℃から42℃まで5℃ずつ低下させることができる。ハイブリダイゼーションに続いて、フィルターを2×SSC、0.5%のSDSでハイブリダイゼーション温度で洗浄することができる。前記の条件は、50℃以上で“中等度”の条件、50℃未満で“低い”条件であると考えられる。“中等度”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが55℃で実施されるときである。“低ストリンジェンシー”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが45℃で実施されるときである。
【0128】
あるいは、ハイブリダイゼーションは緩衝液、例えばホルムアミドを含む6×SSC中で42℃の温度で実施できる。前記の場合、ハイブリダイゼーション緩衝液中のホルムアミドの濃度は、50%から0%まで5%ずつ減少させ、プローブと相同性のレベルが低いクローンを同定できる。ハイブリダイゼーションの後で、フィルターを6×SSC、0.5%のSDSで50℃で洗浄できる。前記の条件は、25%を超えるホルムアミドで“中等度”の条件、25%より低いホルムアミドで“低い”条件と考えられる。“中等度”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが30%のホルムアミドで実施されるときである。“低ストリンジェンシー”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが10%のホルムアミドで実施されるときである。
【0129】
例えば前述の方法は、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、または前記の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメント、および前記と相補的な配列の1つから成る群から選択される核酸配列と少なくとも約97%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも75%、少なくとも70%、少なくとも65%、少なくとも55%、または少なくとも約50%の相同性を有する配列をもつ核酸の単離に用いることができる。相同性はアラインメントアルゴリズムを用いて測定できる。例えば、相同なポリヌクレオチドは、本明細書に記載したコード配列の1つの天然に存在する対立遺伝子座変種であるコード配列を有するであろう。前記対立遺伝子座変種は、配列番号:1、3、5、7、9、11、13、15または前記と相補的な配列と比較したとき、1つまたは2つ以上のヌクレオチドの置換、欠失、または付加を有するであろう。
【0130】
さらに、上記の方法は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列、または前記の1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つの配列を有するポリペプチドと、配列アラインメントアルゴリズム(例えばデフォルトパラメーターを有するFASTAバージョン3.0t78アルゴリズム)を用いて決定したとき、少なくとも約99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも75%、少なくとも70%、少なくとも65%、少なくとも60%、少なくとも55%、または少なくとも約50%の相同性を有するポリペプチドをコードする核酸の単離に用いることができる。
【0131】
本発明のまた別の特徴は、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、または前記の1つの少なくとも5、10、15、20、25、30、35、40、50、75、100、または150の連続したアミノ酸を含むフラグメントの1つの配列を含む単離または精製ポリペプチドである。上記で述べたように、前記ポリペプチドは、前記ポリペプチドをコードする核酸をベクターに挿入することによって得ることができる。前記コード配列は、適切な宿主細胞で前記コードされたポリペプチドの発現を駆動することができる配列と動作可能なように連結される。例えば、発現ベクターは、プロモーター、翻訳開始のためのリボソーム結合部位および転写ターミネーターを含むことができる。前記ベクターはまた発現を増幅する適切な配列を含むことができる。
【0132】
ポリペプチドまたはそのフラグメントを細菌で発現させるために適したプロモーターには、大腸菌のlacまたはtrpプロモーター、lacIプロモーター、lacZプロモーター、T3プロモーター、T7プロモーター、gptプロモーター、λPRプロモーター、λPLプロモーター、糖分解酵素(例えばホスホグリセレートキナーゼ(PGK))をコードするオペロン由来のプロモーター、および酸性ホスファターゼプロモーターが含まれる。真菌のプロモーターには、∀因子プロモーターが含まれる。真核細胞プロモーターには、CMV極初期プロモーター、HSVチミジンキナーゼプロモーター、熱ショックプロモーター、初期および後期SV40プロモーター、レトロウイルス由来プロモーター、およびマウスのメタロチオネイン−Iプロモーターが含まれる。原核細胞または真核細胞またはそれらのウイルスで遺伝子が発現をすることが判明している他のプロモーターもまた用いることができる。
【0133】
哺乳類発現ベクターはまた、複製起点、必要な任意のリボソーム結合部位、ポリアデニル化部位、スプライシングドナーおよびアクセプター部位、転写終了配列、および5’フランキング非転写配列を含むことができる。いくつかの実施態様では、SV40スプライスおよびポリアデニル化部位に由来するDNA配列を用いて、必要な非転写遺伝子エレメントを提供することができる。
ポリペプチドまたはそのフラグメントを真核細胞で発現するためのベクターはまた、発現レベルを高めるエンハンサーを含むことができる。エンハンサーはcis−作動性DNAエレメントで、通常長さが約10から約300bpでプロモーター上で作用してその転写を高める。例を挙げれば、複製起点の後期側100から270bp上のSV40エンハンサー、サイトメガロウイルスの初期プロモーターエンハンサー、複製起点の後期側にあるポリオーマエンハンサーおよびアデノウイルスエンハンサーが含まれる。
【0134】
さらに、前記発現ベクターは典型的には1つまたは2つ以上の選別可能なマーカー遺伝子を含み、前記ベクターを含む宿主細胞の選別を可能にする。前記選別可能マーカーには、真核細胞培養のためのジヒドロフォレートレダクターゼをコードする遺伝子またはネオマイシン耐性を付与する遺伝子、大腸菌でテトラサイクリンまたはアンピシリン耐性を付与する遺伝子、およびビール酵母菌(S. cerevisiae)TRP1遺伝子が含まれる。
いくつかの実施態様では、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つをコードする核酸が、翻訳された前記ポリペプチドまたはそのフラグメントの分泌を指令することができるリーダー配列を用いて適切な相で組み立てられる。場合によって、前記核酸は融合ポリペプチドをコードすることができる。前記融合ポリペプチドでは、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチド、または前記の少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つが、異種ペプチドまたはポリペプチド、例えば所望の特徴(例えば安定性の強化または精製の簡素化)を付与するN−末端認定ペプチドと融合される。
【0135】
適切なDNA配列を多様な方法によってベクターに挿入することができる。一般に、DNA配列は、挿入物およびベクターを適切な制限エンドヌクレアーゼで消化した後、ベクターの所望の位置に連結される。また別には、挿入物およびベクターの両方の平滑末端を連結してもよい。種々のクローニング技術が以下の文献に記載されている:Ausubel et al. ”Current Protocols in Molecular Biology,” John Wiley 503 Sons, Inc. 1997;およびSambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press, 1989(前記文献は引用により本明細書に含まれる)。前記の方法および他の方法は当業者に公知である。
【0136】
前記ベクターは、例えばプラスミド、ウイルス粒子、またはファージの形態であってもよい。他のベクターには、染色体、非染色体および合成DNA配列、SV40の誘導体;細菌プラスミド、ファージDNA、バキュロウイルス、酵母プラスミド、プラスミドおよびファージDNAの組合せに由来するベクター、ウイルスDNA、例えばワクシニア、アデノウイルス、鶏痘ウイルス、および仮性狂犬病ウイルスが含まれる。原核細胞および真核細胞宿主とともに用いることができる種々のクローニングおよび発現ベクターが、文献(Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor , N.Y. 1989(前記文献は引用により本明細書に含まれる))に記載されている。
【0137】
使用することができる具体的な細菌ベクターには、以下の周知のクローニングベクターの遺伝的エレメントを含む市販のプラスミドが含まれる:pBR322(ATCC37017)、pKK223−3(Pharmacia Fine Chemicals, Uppsala, Sweden)、GEM1(Promega Biotec, Madison, WI, USA)、pQE70、pQE60、pQE−9(Qiagen)、pD10、psiX174、pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223−3、pKK233−3、pDR540、pRIT5(Pharmacia)、pKK232−8およびpCM7。具体的な真核細胞用ベクターには、pSV2CAT、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSGおよびpSLV(Pharmacia)が含まれる。しかしながら、他のいずれのベクターも、宿主細胞で複製し生存するかぎり用いることができる。
【0138】
宿主細胞は当業者に公知のいずれの宿主細胞でもよい。前記細胞には、原核細胞、真核細胞、哺乳類細胞、昆虫細胞、または植物細胞が含まれる。適切な宿主の代表的な例として以下を挙げることができる:細菌細胞、例えば大腸菌、ストレプトミセス、枯草菌(Bacillus subtilis)、ネズミチフス菌(Salmonella typhimurium)並びにシュードモナス属、ストレプトミセス属およびスタフィロコッカス属の様々な種;真菌細胞、例えば酵母;昆虫細胞、例えばキイロショウジョウバエS2およびスポドプテラ(Spodoptera)Sf9;動物細胞、例えばCHO、COSまたはボウズ(Bowes)メラノーマ;およびアデノウイルス。適切な宿主の選択は当業者には公知である。
【0139】
ベクターは、多様な技術のいずれか(形質転換、トランスフェクション、形質導入、ウイルス感染、遺伝子銃、またはTi仲介遺伝子移転を含む)を用いて宿主細胞に導入できる。具体的な方法には、リン酸カルシウムトランスフェクション、DEAE−デキストラン仲介トランスフェクション、リポフェクチンまたは電気穿孔(L. Davis, M. Dibner, I. Battey, Basic Methods in Molecular Biology, 1986)が含まれる。
適切な場合には、前記のベクター導入宿主細胞を、プロモーターの活性化、形質転換体の選別または本発明の遺伝子の増幅に適切なように改変した通常の栄養培養液で培養することができる。適切な宿主株を選択し、さらに前記宿主株を適切な細胞密度まで増殖させた後で、前記の選択したプロモーターを適切な手段(例えば温度シフトまたは化学的誘発)で誘発することができる。さらに前記細胞をさらに新たな期間培養して所望のポリペプチドまたはそのフラグメントを産生させることができる。
【0140】
細胞は、典型的には遠心分離によって集め、物理的または化学的手段で破壊し、得られた粗抽出物を更なる精製のために維持する。タンパク質の発現に用いた微生物細胞は通常の任意の手段によって破壊することができる。前記手段には、反復凍結融解、超音波処理、機械的破壊、または細胞溶解剤の使用が含まれる。前記の方法は当業者には周知である。発現されたポリペプチドまたはそのフラグメントを回収し、リコンビナント細胞培養から以下を含む方法によって精製することができる:硫安もしくはエタノール沈澱、酸抽出、陰イオンもしくは陽イオン交換クロマトグラフィー、ホスホセルロースクロマトグラフィー、疎水性相互作用クロマトグラフィー、アフィニティークロマトグラフィー、ヒドロキシルアパタイトクロマトグラフィー、およびレクチンクロマトグラフィー。必要な場合には、ポリペプチドの立体配置を完成させるため、タンパク質再折り畳み工程を用いることができる。所望する場合には、高速液体クロマトグラフィー(HPLC)を最終精製工程で用いることができる。
【0141】
さらにまた種々の哺乳類細胞培養系を用いて、組換えタンパク質を発現させることができる。哺乳類発現系の例には、サル腎線維芽細胞のCOS−7株(Gluzman, Cell, 23:175, 1981に記載されている)、および適合ベクターからタンパク質を発現させることができる他の細胞株、例えばC127、3T3、CHO、HeLaおよびBHK細胞株が含まれる。
宿主細胞中の構築物を通常の態様で用いて、組換え配列によってコードされた遺伝子生成物を産生させることができる。組換え体生成方法で用いる宿主にしたがって、前記ベクターを含む宿主細胞によって産生されるポリペプチドは糖化されたりされなかったりするであろう。本発明のポリペプチドはまた先頭のメチオニン残基を含んだり含まなかったりするであろう。
【0142】
また別には、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントは、通常のペプチド合成装置によって合成してもよい。他の実施態様では、ポリペプチドのフラグメントまたは部分をペプチド合成によって対応する完全長のポリペプチドを製造するために用いることができる。したがって、前記フラグメントは、完全長のポリペプチドの製造用中間体として用いることができる。
【0143】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つを、前記ポリペプチドまたはそのフラグメントをコードする核酸に作働的に連結されたプロモーターを含むDNA構築物から転写されたmRNAを用いて製造するために無細胞翻訳系もまた利用することができる。いくつかの実施態様では、前記DNA構築物はin vitro転写反応を実施する前に直線化することができる。続いて転写mRNAを適切な無細胞翻訳抽出物(例えばウサギの網状赤血球抽出物)とともにインキュベートし、所望のポリペプチドまたはそのフラグメントを生成することができる。
【0144】
本発明はまた、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの変種に関する。“変種”という用語は前記ポリペプチドの誘導体または類似体を含む。特に、前記変種は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチドと、1つまたは2つ以上の置換、付加、欠失、融合および末端短縮(これらはいずれの組合せにも存在することができる)によってアミノ酸配列が相違する。
【0145】
前記変種は天然に存在するものでもin vitroで創出されたものでもよい。特に前記変種は、遺伝子操作技術(例えば部位特異的突然変異導入、化学的ランダム突然変異導入、エキソヌクレアーゼIII欠失方法、および標準的クローニング技術)を用いて創出することができる。また別には、前記変種、フラグメント、類似体または誘導体は、化学的合成または改変方法を用いて創出してもよい。
変種を作製する他の方法もまた当業者には知られている。前記方法には、天然の単離物から得られた核酸配列を改変して、それらの工業的または研究的利用価値を高める特性を有するポリペプチドをコードする核酸を生成する方法が含まれる。前記の方法では、天然の単離物から得られた配列に対して1つまたは2つ以上のヌクレオチドの相違を有する多数の変種配列が生成され性状を調べられる。典型的には、これらのヌクレオチドの相違は、天然の単離物の核酸によってコードされるポリペプチドに対してアミノ酸変化をもたらす。
【0146】
例えば、変種は変異性PCR(error prone PCR)を用いて創出することができる。変異性PCRでは、PCRは、高率の点変異がPCR生成物の全長にわたって得られるように、DNAポリメラーゼの複製信頼度が低い状態で実施される。変異性PCRは以下の文献に記載されている:D.W. Leung et al., Technique, 1:11−15,1989;R.C. Caldwell & G.F. Joyce, PCR Methods Applic., 2:28−33,1992(前記文献は引用により本明細書に含まれる)。簡単に記せば、そのような方法では、PCR生成物の全長にわたって高率の点変異を達成するために、突然変異を誘発されるべき核酸を、PCRプライマー、反応緩衝液、MgCl2、MnCl2、Taqポリメラーゼおよび適切な濃度のdNTPと混合する。例えば、突然変異を誘発されるべき核酸を20fmol、各PCRプライマーを30pmol、50mMのKCl、10mMのトリス塩酸(pH8.3)および0.01%のゼラチン、7mMのMgCl2,0.5mMのMnCl2、5単位のTaqポリメラーゼ、0.2mMのdGTP、0.2mMのdATP、1mMのdCTPおよび1mMのdTTPを含む反応緩衝液を用いて反応を実施できる。PCRは、94℃1分、45℃1分および72℃1分の30サイクルで実施できる。しかしながら、前記のパラメーターは適宜変動可能であることは理解されよう。突然変異が誘発された核酸を適切なベクターでクローニングし、前記変異核酸によってコードされたポリペプチドの活性を調べる。
【0147】
変種はまた、注目する任意のクローン化DNAで位置特異的変異を生成するためにオリゴヌクレオチド誘導突然変異導入を用いて創出してもよい。オリゴヌクレオチド突然変異導入は以下の文献に記載されている:J.F. Reidhaar−Olson & R.T. Sauer et al., Science, 241:53−57, 1988(前記文献は引用により本明細書に含まれる)。簡単に記せば、そのような方法では、クローン化DNAに導入されるべき1つまたは2つ以上の変異を含む複数の二本鎖オリゴヌクレオチドが合成され、前記突然変異を誘発されるべきクローン化DNAに導入される。突然変異を誘発されたDNAを含むクローンを回収し、それらがコードするポリペプチドの活性を評価する。
【0148】
変種を創出するまた別の方法は、アッセンブリーPCRである。アッセンブリーPCRは、小さなDNAフラグメントの混合物からPCR生成物を組み立てることを必要とする。同一のバイアル中で多数の異なるPCR反応が実施され、1つの反応の生成物が別の反応の生成物のプライマーの役割を果たす。アッセンブリーPCRは米国特許第5,965,408号(1996年6月9日出願、発明の名称“Method of DNA Reassembly by Interrupting Synthesis”)(前記文献は引用により本明細書に含まれる)に記載されている。
【0149】
変種を創出するまた別の方法は有性PCR突然変異導入(sexual PCR mutagenesis)である。有性PCR突然変異導入では、強制的相同性組換えが、相違を有するが高度に関連性を有するDNA配列をもつDNA分子間でin vitroで生じる。前記組換えは、配列相同性を基準にしたDNA分子のランダムフラグメント化と、それに続く、PCR反応におけるプライマー伸長による交差の固定の結果として得られる。有性PCR突然変異導入は以下の文献に記載されている:W.P. Stemmer, PNAS, USA, 91:10747−10751, 1994(前記文献は引用により本明細書に含まれる)。簡単に記せば、このような方法では、組換えられるべき複数の核酸をデオキシリボヌクレアーゼで消化して、平均サイズが50−200ヌクレオチドのフラグメントを生成する。所望の平均サイズのフラグメントを精製し、PCR混合物に再懸濁させる。前記核酸フラグメント間の組換えを促進する条件下でPCRを実施する。例えば、PCRは、前記精製フラグメントを10−30ng/μLの濃度で以下の組成の溶液に再懸濁させて実施できる:0.2mMの各dNTP、2.2mMのMgCl2、50mMのKCl、10mMのトリス塩酸(pH9.0)および0.1%トリトンX−100。反応混合物100μLにつき2.5単位のTaqポリメラーゼを添加し、PCRを以下のように実施する:94℃60秒、94℃30秒、50−55℃30秒、72℃30秒(30−45回)および72℃5分。しかしながら、前記のパラメーターは適宜変動可能であることは理解されよう。いくつかの実施態様では、オリゴヌクレオチドをPCR反応に含ませることができる。他の実施態様では、DNAポリメラーゼIのクレノーフラグメントを第一回目のPCR反応に用い、Taqポリメラーゼをその後のPCR反応サイクルで用いることができる。リコンビナント配列を単離し、それらがコードするポリペプチドの活性を評価する。
【0150】
変種はまたin vivo突然変異導入によって創出できる。いくつかの実施態様では、問題の配列を細菌株、例えば大腸菌株(前記の細菌株はDNA修復経路の1つまたは2つ以上に変異を有する)で増殖させることによって前記配列にランダム変異を創出する。前記の“変異導入体”株は野生型の親株よりも高いランダム変異率を有する。前記DNAをこれらの株の1つで増殖させることによって、最終的に前記DNA内にランダム変異が生成されるであろう。In vivo突然変異導入で使用するために適した変異導入体株は、PCT公開番号WO91/16427号(1991年10月31日公開、発明の名称:”Methods for Phenotype Creation from Multiple Gene Populations”)に記載されている(前記文献は引用により本明細書に含まれる)。
【0151】
変種はまたカセット突然変異導入を用いて創出できる。カセット突然変異導入では、二本鎖DNA分子の小さな領域が、天然の配列とは異なる合成オリゴヌクレオチド“カセット”で置換される。前記オリゴヌクレオチドはしばしば、完全および/または部分的に任意抽出された天然の配列を含む。
循環アンサンブル突然変異導入もまた変種の創出に用いることができる。循環アンサンブル突然変異導入は、表現型が関連する多様な集団でその構成メンバーのアミノ酸配列が異なっているものを作製するために開発されたタンパク質工学(タンパク質突然変異導入)用アルゴリズムである。前記方法は、フィードバックメカニズムを用いて組合せカセットの連続する突然変異導入ラウンドを制御する。循環アンサンブル突然変異導入は以下の文献に記載されている:A.P. Arkin & D.C. Youvan, PNAS, USA, 89:7811−7815, 1992(前記文献は引用により本明細書に含まれる)。
【0152】
いくつかの実施態様では、変種は指数的アンサンブル突然変異導入を用いて創出される。指数的アンサンブル突然変異導入は、固有で機能的な変異体を高いパーセントで含む組合せライブラリーを作製するプロセスである。前記プロセスでは、短い残基群が並列的に任意抽出され、機能的タンパク質を生じるアミノ酸を各々異なる位置で同定する。指数的アンサンブル突然変異導入は以下の文献に記載されている:S. Delegrave & D.C. Youvan, Biotechnology Research, 11:1548−1552,1993(前記文献は引用により本明細書に含まれる)。ランダム突然変異導入および部位特異的突然変異導入は以下の文献に記載されている:F.H. Arnold, Current Opinion in Biotechnology, 4:450−455, 1993(前記文献は引用により本明細書に含まれる)。
【0153】
いくつかの実施態様では、変種はシャッフリングを用いて創出される。シャッフリングでは、別個のポリペプチドをコードする複数の核酸の部分が一緒に融合され、キメラポリペプチドをコードするキメラ核酸配列が創出される。前記は以下の文献に記載されている:米国特許第5,965,408号(1996年7月9日出願、発明の名称:”Method of DNA Reassembly by Interrupting Synthesis”;および米国特許第5,939,250号(1996年5月22日出願、発明の名称”Production of Enzymes Having Desired Activities by Mutagenesis”)(前記文献は引用により本明細書に含まれる)。
【0154】
配列番号:2、4、6、8、10、12、14、16のポリペプチドの変種は、配列番号:2、4、6、8、10、12、14、16のポリペプチドのアミノ酸残基の1つまたは2つ以上が、保存的または非保存的アミノ酸残基(好ましくは保存的アミノ酸残基)で置換された変種であろう。さらに前記置換されたアミノ酸残基は遺伝暗号によってコードされたものでもよいが、そうでないものでもよい。
保存的置換は、ポリペプチド内のあるアミノ酸を同様な特性をもつ別のアミノ酸で置換するものである。保存的置換として典型的に認められるものは以下の置換である:脂肪族アミノ酸(例えばAla、Val、LeuおよびIle)の別の脂肪族アミノ酸による置換:SerのThrによる置換;酸性残基(例えばAspおよびGlu)の別の酸性残基による置換;アミド基をもつ残基(たとえばAsnおよびGln)のアミド基をもつ別の残基による置換;塩基性残基(たとえばLysおよびArg)の別の塩基性残基による交換および芳香族残基(例えばPhe、Tyr)の別の芳香族残基による置換。
【0155】
他の変種は、配列番号:2、4、6、8、10、12、14、16に記載のポリペプチドのアミノ酸残基の1つまたは2つ以上が置換基を含むものである。
さらに他の変種は、ポリペプチドが別の化合物、例えば前記ポリペプチドの半減期を延長する化合物(例えばポリエチレングリコール)と結合されているものである。
さらに別の変種は、さらに別のアミノ酸がポリペプチドに融合されているものである。前記別のアミノ酸は、例えばリーダー配列、分泌配列、プロタンパク質配列、または前記ポリペプチドの精製、濃縮もしくは安定化を促進する配列である。
いくつかの実施態様では、前記フラグメント、誘導体および類似体は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドと同じ生物学的機能または活性を保持する。他の実施態様では、前記フラグメント、誘導体または類似体は、プロタンパク質の切断によって活性化され、活性ポリペプチドを生じるプロタンパク質を含む。
【0156】
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つと少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約95%を越える相同性を有するポリペプチドまたはそのフラグメントである。相同性は、比較されるポリペプチドまたはフラグメントでアラインメントを実施し、それらの間のアミノ酸同一性または類似性の程度を決定する、上記で説明した任意のプログラムを用いて決定することができる。アミノ酸の“相同性”は、上記で述べたような保存的アミノ酸置換も含むことは理解されよう。
【0157】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つと相同性を有するポリペプチドまたはフラグメントは、上記の技術を用いて前記をコードする核酸を単離することによって得ることができる。
あるいは、相同なポリペプチドまたはフラグメントは生化学的な濃縮または精製方法により得ることができる。潜在的に相同なポリペプチドまたはフラグメントの配列は、タンパク質分解消化、ゲル電気泳動および/またはミクロ配列決定によって決定できる。相同性が予想されるポリペプチドまたはフラグメントの配列は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくともあるいはの連続アミノ酸を含むフラグメントの1つと、上記に記載したプログラムのいずれかを用いて比較することができる。
【0158】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のフラグメントまたは変種であって、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドの酵素機能を保持するものを同定するためのアッセイである。例えば、前記ポリペプチドのフラグメントまたは変種は生化学的反応を触媒するために用いることができる(前記生化学的反応は、前記フラグメントまたは変種が配列番号:2、4、6、8、10、12、14、16のポリペプチドの酵素活性を保持することを提示する)。
【0159】
フラグメントまたは変種が、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドの酵素活性を保持するか否かを決定するためのアッセイは以下の工程を含む:ポリペプチドフラグメントまたは変種を基質分子と、ポリペプチドフラグメントまたは変種が機能することができる条件下で接触させ、さらに基質レベルの低下、または前記ポリペプチドと基質との間の反応の特異的反応生成物レベルの増加を検出する。
【0160】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントを多様な用途に用いることができる。例えば、前記ポリペプチドまたはそのフラグメントを用いて、生化学的配列を触媒することができる。本発明の特徴の1つにしたがえば、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記ポリペプチドをコードするポリヌクレオチドをグリコシド結合の加水分解に用いる方法が提供される。前記方法では、グリコシド結合を含む物質(例えば澱粉)を、配列番号:2、4、6、8、10、12、14、16または前記と実質的に同一の配列を有するポリペプチドと、前記グリコシド結合の加水分解を促進する条件下で接触させる。
【0161】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントをまた用いて、前記ポリペプチドまたはフラグメントと特異的に結合する抗体を生成することができる。得られた抗体は、前記ポリペプチドの単離もしくは精製に、または生物学的サンプルにおける前記ポリペプチドの有無の決定にイムノアフィニティークロマトグラフィー手法で用いることができる。前記の手法では、タンパク質調製物(例えば抽出物)または生物学的サンプルを、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つと特異的に結合することができる抗体と接触させる。
【0162】
イムノアフィニティー法では、抗体を固相支持体(例えばビーズまたは他のカラムマトリックス)に結合させる。前記抗体が配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、またはそのフラグメントと特異的に結合する条件下で、前記タンパク調製物を前記抗体と接触させる。非特異的に結合したタンパク質を除去するために洗浄した後、特異的に結合した前記ポリペプチドを溶出させる。
生物学的サンプル中のタンパク質の前記抗体と結合する能力は、当業者に知られている種々の方法のいずれかを用いて決定できる。例えば結合は、抗体を検出可能な標識(例えば蛍光薬剤、酵素標識または放射性同位元素)で標識することによって決定できる。また別には、抗体のサンプルへの結合は、前記のような検出可能な標識をその上に有する二次抗体を用いて検出することができる。具体的なアッセイには、ELISAアッセイ、サンドイッチアッセイ、放射性イムノアッセイおよびウェスタンブロットが含まれる。
【0163】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントに対して作製されたポリクローナル抗体は、前記ポリペプチドを動物に直接注射するか、または動物(例えばヒト以外の動物)に前記ポリペプチドを投与することによって得ることができる。前記のようにして得られた抗体はポリペプチドそのものに結合するであろう。前記の態様では、前記ポリペプチドのフラグメントのみをコードする配列でさえ、完全な天然のポリペプチドと結合することができる抗体の生成に用いることができる。そのような抗体は、前記のポリペプチドを発現している細胞からポリペプチドを単離するために用いることができる。
【0164】
モノクローナル抗体を調製する場合は、継続的な細胞株培養によって産生される抗体を提供するいずれの技術も用いることができる。その例には、ハイブリドーマ技術(Kohler and Milstein, Nature, 256:495−497, 1975:前記文献は引用により本明細書に含まれる)、トリオーマ技術、ヒトB細胞ハイブリドーマ技術(Kozbor et al. Immunology Today, 4:72,1983:前記文献は引用により本明細書に含まれる)、およびEBV−ハイブリドーマ技術(Cole et al., ”Monoclonal Antibodies and Cancer Therapy”, Alan R. Liss, Inc., pp.77−96(1985):前記文献は引用により本明細書に含まれる)が含まれる。
【0165】
単鎖抗体製造のために報告された技術(米国特許第4,946,778号:前記文献は引用により本明細書に含まれる)を応用して、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントに対する単鎖抗体を製造することができる。また別には、遺伝子導入マウスを用いて、前記ポリペプチドまたはそのフラグメントに対するヒト化抗体を発現させることができる。
【0166】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントに対して作製した抗体を、他の生物およびサンプルに由来する同様なポリペプチドのスクリーニングで用いることができる。前記の技術では、前記生物に由来するポリペプチドを前記抗体と接触させ、さらに前記抗体と特異的に結合するポリペプチドを検出する。上記で述べた方法のいずれも、抗体の結合検出に用いることができる。前記スクリーニングアッセイの1つが以下の文献に記載されている:”Methods for Measuring Cellulase Activities”, Methods in Enzymology, Vol. 160, pp.87−116(前記文献は引用により本明細書に含まれる)。
【0167】
本明細書において、“配列番号:1、3、5、7、9、11、13、15に示す核酸配列”という用語は、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列を有するヌクレオチド配列とともに、配列番号:1、3、5、7、9、11、13、15と相同な配列およびそのフラグメント、並びに前記配列の全てと相補的である配列を包含する。前記フラグメントには、配列番号:1、3、5、7、9、11、13、15の部分が含まれ、前記部分は、配列番号:1、3、5、7、9、11、13、15の少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400または500の連続したヌクレオチド、および実質的に前記と同一の配列を含む。配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一な配列と相同な配列およびフラグメントとは、前記配列に対して少なくとも約99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%、または50%の相同性を有する配列を指す。相同性は、本明細書に記載した任意のコンピュータプログラムおよびパラメーター(デフォルトパラメーターを用いるFASTAバージョン3.0t78を含む)を用いて決定することができる。相同な配列はまたRNA配列を含み、この場合、配列番号:1、3、5、7、9、11、13、15に示す核酸配列でチミジンはウリジンに置き換えられる。相同な配列は、本明細書に記載した方法のいずれかを用いて得られるか、または配列決定エラーの修正から得ることができる。配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列は、伝統的な一文字形式(”Biochemistry”(Stryer, Lubert, 3rd ed., W,H. Freeman & Co., New york)の裏表紙の内側を参照されたい)または一続きのヌクレオチドそのものを表示する他の任意の様式で表すことができる。
【0168】
本明細書において、“配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列”という用語は、配列番号:2、4、6、8、10、12、14、16およびこれらと実質的に同一の配列を有するポリペプチド配列(前記は配列番号:1、3、5、7、9、11、13、15に示す配列によってコードされる)、配列番号:2、4、6、8、10、12、14、16およびこれらと実質的に同一の配列を有するポリペプチドと相同なポリペプチド配列、または前記配列のいずれかのフラグメントを包含する。相同なポリペプチド配列とは、配列番号:2、4、6、8、10、12、14、16ポリペプチド配列の1つと少なくとも約99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%、または50%の相同性を有するポリペプチド配列を指す。相同性は、本明細書に記載した任意のコンピュータプログラムおよびパラメーター(デフォルトパラメーターまたは任意の改変パラメーターを用いるFASTAバージョン3.0t78を含む)を用いて決定することができる。相同な配列は、本明細書に記載した方法のいずれかを用いるか、または配列決定エラーの修正から得ることができる。前記ポリペプチドフラグメントは、配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一の配列を有するポリペプチドの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含む。配列番号:2、4、6、8、10、12、14、16に示すポリペプチドコードおよび前記配列と実質的に同一の配列は、伝統的な一文字表記または3文字表記(”Biochemistry”(Stryer, Lubert, 3rd ed., W,H. Freeman & Co., New york)の裏表紙の内側を参照されたい)または一続きのポリペプチドそのものを表示する他の任意の様式で表すことができる。
【0169】
配列番号:1、3、5、7、9、11、13、15に示す核酸配列および配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列は、コンピュータによって読取り可能であって、さらにアクセスできる任意の媒体に保存、記録および処理することができることは当業者には理解されよう。本明細書で用いられるように、“記録”および“保存”という語は、コンピュータ媒体に情報を保存するプロセスを指す。当業者には、コンピュータ読取り可能な媒体に情報を記録するためにこれまでに知られている任意の方法を容易に利用して、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の1つまたは2つ以上、並びに配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列の1つまたは2つ以上を含む製品を作製することができる。本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の少なくとも2、5、10、15または20個の核酸配列を保存した、コンピュータ読取り可能媒体である。
【0170】
本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の1つまたは2つ以上を保存したコンピュータ読取り可能媒体である。本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列の1つまたは2つ以上を保存したコンピュータ読取り可能媒体である。本発明のまた別の特徴は、上記に示す配列の少なくとも2、5、10、15または20個を保存したコンピュータ読取り可能媒体である。
コンピュータ読取り可能媒体には、磁気により読み出すことができる媒体、光学的に読み出すことができる媒体、電子的に読み出すことができる媒体および磁気/光媒体が含まれる。例えば、前記コンピュータ読取り可能媒体はハードディスク、フレキシブルディスク、磁気テープ、CD−ROM、デジタル多用途ディスク(DVD)、ランダムアクセスメモリー(RAM)、または読み出し専用メモリー(ROM)とともに当業者に公知の他の媒体の他のタイプであろう。
【0171】
本発明の実施態様には、システム(例えばインターネットをベースにするシステム)、特に本明細書で述べた配列情報を保存し処理するコンピュータシステムが含まれる。コンピュータシステム100の一例は、図2の組立て分解図で示されている。本明細書で用いられるように、“コンピュータシステム”とは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列を分析するために用いられるハードウェア成分、ソフトウェア成分およびデータ保存成分を指す。コンピュータシステム100は典型的には配列データの加工、アクセスおよび処理のためのプロセッサを含む。前記プロセッサ105は任意の中央演算ユニットで、例えばインテル社のペンティアム(登録商標)IIIまたはサン、モトローラ、コンパック、AMDもしくはIBM(international Business Machines)の同様なプロセッサであろう。
【0172】
典型的には前記コンピュータシステム100は、プロセッサ105およびデータ保存用の1つまたは2つ以上の内部データ保存構成部110、およびデータ保存構成部に保存されたデータを検索する1つまたは2つ以上のデータ検索装置を含む汎用システムである。当業者には、現在利用可能なコンピュータシステムのいずれも適切であることは理解されよう。
ある特定の実施態様では、前記コンピュータシステム100は、メインメモリー115(好ましくはRAMとして提供される)に連結されたバスに連結されたプロセッサ105および1つまたは2つ以上の内部データ保存装置110、例えばハードドライブおよび/またはそれにデータを記録させる他のコンピュータ読出し可能媒体を含む。いくつかの実施態様では、前記コンピュータシステム100はさらに、内部データ保存装置110に保存されたデータを読み出すための1つまたは2つ以上のデータ検索装置118を含む。
【0173】
前記データ検索装置118は、フレキシブルディスクドライブ、コンパクトディスクドライブ、磁気テープドライブ、または遠隔地のデータ保存システムと接続できる(例えばインターネットにより)モデムなどであろう。いくつかの実施態様では、前記内部データ保存装置110は、取り外し可能なコンピュータ読取り能媒体、例えばフレキシブルディスク、コンパクトディスク、磁気テープなどで、コントロールロジックおよび/またはそれに記録されたデータを含む。前記コンピュータシステム100は有利には、データ検索装置にいったん挿入されたデータ保存装置のコントロールロジックおよび/またはデータを読み出すための適切なソフトを含むか、またはそれによってプログラムされるであろう。
【0174】
前記コンピュータシステム100は、コンピュータ使用者に出力を表示するために用いられるディスプレー120を含む。前記コンピュータシステム100は、ネットワークまたは広域ネットワークで他のコンピュータシステム125a−cと連結され、コンピュータシステム100への中央管理アクセスを提供する。
配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列にアクセスするため、またはこれを加工するためにソフト(例えば検索ツール、比較ツール、および模型製作ツールなど)が、実行中にメーンメモリー115に存在する。
【0175】
いくつかの実施態様では、前記コンピュータシステム100は、コンピュータの読出し可能媒体に保存された、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の核酸配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列を、コンピュータ読出し可能媒体に保存されたリファレンスヌクレオチドまたはポリペプチド配列と比較するために配列比較アルゴリズムをさらに含む。“配列比較アルゴリズム”とは、あるヌクレオチドをデータ保存手段内に保存された他のヌクレオチドおよび/または化合物と比較するために前記コンピュータシステム100に(局所的にまたは遠隔的に)実装される1つまたは2つ以上のプログラムを指す。例えば、前記配列比較アルゴリズムは、コンピュータ読出し可能媒体に保存された、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列を、コンピュータ読出し可能媒体に保存されたリファレンス配列と比較し、相同性または構造モチーフを同定することができる。
【0176】
本特許出願明細書のいずれかの場所で明らかにした種々の配列比較プログラムが、特に本発明の前記特徴で使用するために意図される。タンパク質および/または核酸配列相同性は、種々の配列比較アルゴリズムおよび当業者に公知のプログラムのいずれかを用いて評価できる。前記のアルゴリズムおよびプログラムには以下が含まれるが、ただしこれらに限定されない:TBLASTN、BLASTP、FASTA、TFASTAおよびCLUSTALW(Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444−2448, 1988; Altschul et al., J. Mol. Biol. 215(3):403−410, 1990; Thompon et al., Nucleic Acids Res. 22(2):4673−4680, 1994; Higgins et al., Methods Enzymol. 266:383−402,1996; Altschul et al., J. Mol. Biol. 215(3):403−410, 1990; Altschul et al., Nature Genetics 3:266−272, 1993)。
【0177】
相同性および同一性は、しばしば配列分析ソフト(例えばウィスコンシン大学生物工学センター(1710 University Avenue, Madison, WI53705)、遺伝学コンピュータ群の配列分析ソフトウェアパッケージ)を用いて測定される。前記ソフトは、種々の欠失、置換および他の改変に対して相同性の程度を定めることによって類似する配列をマッチさせる。2つまたは3つ以上の核酸もしくはポリペプチド配列について“相同性”および“同一性”という用語は、任意の数の配列比較アルゴリズムを用いるかまたは手動アラインメントと目視観察によって測定したとき、比較ウィンドーまたは指定領域について最大の一致を目指して比較しアラインメントを実施したときに同じであるか、または特定の百分率のアミノ酸残基もしくはヌクレオチドが同じである2つまたは3つ以上の配列もしくはサブ配列を指す。
【0178】
配列比較の場合、典型的には1つの配列はリファレンス配列として機能し、前記に対してテスト配列を比較する。配列比較アルゴリズムを用いるときは、テスト配列およびリファレンス配列をコンピュータに入力し、サブ配列座標(coordinate)を必要な場合には指定し、さらに配列アルゴリズムプログラムのパラメーターを指定する。デフォルトプログラムパラメーターを用いてもよいし、また別のパラメーターを指定してもよい。続いて配列比較アルゴリズムは、前記プログラムパラメーターを基準にしてリファレンス配列に対するテスト配列のパーセント配列同一性を計算する。
【0179】
本明細書において、“比較ウィンドー”は、20から600、通常は約50から約200、より通常は約100から約150から成る群から選択される任意の数の連続した位置数を有するセグメントに対するリファレンスを含む。ある配列は、比較配列と最適なアラインメントを行った後、前記比較ウィンドー内で同じ数の連続した配置のリファレンス配列と比較される。比較のために配列アラインメントを実施する方法は当技術分野で周知である。比較のために最適な配列アラインメントは、例えば以下によって実施できる:Smith & Waterman(Adv. Appl. Math. 2:482, 1981)の局所相同性アルゴリズム、Needleman & Wunsch(J. Mol. Biol. 48:443, 1970)の相同性アラインメントアルゴリズム、Person & Lipman(Proc. Natl. Acad. Sci. USA 85:2444, 1998)の類似性検索法、前記アルゴリズムのコンピュータによる提供(ウィスコンシン大学生物工学センター(1710 University Avenue, Madison, WI53705)、遺伝学コンピュータ群の配列分析ソフトウェアパッケージのGAP、BESTFIT、FASTAおよびTFASTA)、および手動アラインメントと目視。
【0180】
相同性または同一性を決定するための他のアルゴリズムには、例えばBLASTプログラム(Basic Local Alignment Search Tool)の他に以下が含まれる:ALIGN、AMAS(Analysis of Multiply Aligned Sequences)、AMPS(Protein Multiple Sequence Alignment)、ASSET(Aligned Segment Satistical Evaluation Tool)、BANDS、BESTSCOR、BIOSCAN(Biological Sequence Comparative Analysis Node)、BLIMPS(Blocks IMProved Searcher)、FASTA、インターバルズ・アンド・ポインツ(Intervals & Points)、BMB、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、スミス・ウォーターマンアルゴリズム、DARWIN、ラスベガスアルゴリズム、FNAT(Forced Nucleotide Alignment Tool)、フレームアライン、フレームサーチ、DYNAMIC、FILTER、FSAP(Fristensky Sequence Analysis Package)、GAP(Global Alignment Program)、GENAL、GIBBS、GenQuest、ISSC(Sensitive Sequence Comparison)、LALIGN(Local Sequence Alignment)、LCP(Local Content Program)、MACAW(Multiple Alignment Construction & Analysis Workbench)、MAP(Multiple Alignment Program)、MBLKP、MBLKN、PIMA(Pattern−Induced Multi−sequence Alignment)、SAGA(Sequence Alignment by Genetic Algorithm)およびWHAT−IFが含まれる。
【0181】
前記アラインメントプログラムはまた、ゲノムデータベースのスクリーニングに用いて、実質的に同一の配列を有するポリヌクレオチド配列を同定することができる。多数のゲノムデータベースが利用可能である。例えば、ヒトゲノムの実質的な部分を、ヒトゲノム配列決定プロジェクト(J. Roach, http://weber.u.Washington.edu/〜roach/human_genome_progress2.html)(Gibbs, 1995)の部分として利用することができる。少なくとも21個の他のゲノムが既に配列を決定されている。これらには、例えばM.ジェニタリウム(M. genitalium; Fraser et al., 1995)、M.ヤナシー(M. Jannaschii; Bult et al., 1996)、インフルエンザ菌(H. influenzae; Fleischmann et al., 1995)、大腸菌(Blattner et al., 1997)、酵母(S. cerevisiae; Mewes et al., 1977)およびショウジョウバエ(D. melanogaster; Adams et al., 2000)が含まれる。顕著な進展が、モデル生物、例えばマウス、C.エレガンス(C. elegans)およびシロイヌナズナ(Arabidopsis sp.)のゲノム配列決定でも達成されている。いくつかの実用的な情報が付されたゲノム情報を含むいくつかのデータベースが種々の機構によって維持されており、例えば以下のようにインターネットを介してアクセスできる:http://wwwtigr.org/tdb; http://www.genetics.wisc.edu; http://genome−www.stanford.edu/〜ball; http://hiv−web.lanl.gov; http://www.ncbi.nlm.nih.gov; http://www.ebi.ac.uk; http://pasteur.fr/other/biology; http://www.genome.wi.mit.edu.。
【0182】
有用なアルゴリズムの一例はBLASTおよびBLAST2.0アルゴリズムで、前記は、それぞれ以下の文献に記載されている:Altschul et al., Nuc. Acids Res. 25:3389−3402, 1977およびAltschul et al., J. Mol. Biol. 215:403−410, 1990。BLAST分析を実施するためのソフトは、公的機関(National Center for Biotechnology Information)を介して一般に(http://www.ncbi.nlm.nih.gov/)開放されている。このアルゴリズムは、照会配列中で、データベース中の同じ長さを有するワードとアラインメントを実施したとき、いくつかの正の値をもつ閾値スコアTと適合するか、またはこれを満足させる長さWの短いワードを同定することによって、先ず初めに高いスコアを有する配列対(high scoring sequence; HSP)を同定することを含む。Tは隣接ワードスコア閾値(Altschul et al., 上掲書)と称される。これら最初の隣接ワードの的中は、それらを含むより長いHSPを発見するための検索開始用の種として機能する。
【0183】
前記ワードの的中を両方向に向けて各配列に沿って、累積アラインメントスコアが増加するかぎり伸長する。累積スコアは、ヌクレオチド配列の場合はパラメーターM(マッチする残基対については褒賞スコア;常に>0)を用いて計算する。アミノ酸配列の場合は、スコアリングマトリックスが累積スコアの計算に用いられる。各方向のワード的中の伸長は以下の場合に停止される:累積アラインメントスコアがその最大達成値から量Xだけ低下したとき;1つまたは2つ以上の陰性スコア値を有する残基アラインメントのために累積スコアが0またはそれより小さくなったとき;またはいずれかに配列の末端に達したとき。BLASTアルゴリズムパラメーターW、TおよびXはアラインメントの感度および速度を決定する。BLASTプログラム(ヌクレオチド配列用)はデフォルトとして、11のワード長(W)、10の期待値(E)、M=5、N=−4および両鎖の比較を用いる。アミノ酸配列の場合は、BLASTプログラムはデフォルトとして、3のワード長、および10の期待値(E)、およびBLOSUM62スコアリングマトリックス(以下の文献を参照されたい:Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989)、50のアラインメント(B)、10の期待値(E)、M=5、N=−4、および両鎖の比較を用いる。
【0184】
BLASTアルゴリズムはまた2つの配列間の類似性の統計分析を実施する(例えば以下の文献を参照されたい:Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993)。BLASTアルゴリズムによって提供される類似性の基準の1つは最小総和確率[smallest sum probability(P(N))]で、前記は2つのヌクレオチドまたはアミノ酸の間でマッチが偶然生じる確率の指標を提供する。例えば、テスト核酸とリファレンス核酸の比較で最小和確率が約0.2未満、より好ましくは約0.01未満、もっとも好ましくは約0.001未満であるならば、核酸はリファレンス配列と類似であると考えられる。
【0185】
ある実施態様では、タンパク質および核酸配列の相同性は、ベーシック・ローカル・アラインメント検索ツール“BLAST”(Basic Local Alignment Search Tool)を用いて評価される。特に、5つの固有のBLASTプログラムが、以下のタスクの実施に用いられる:
(1)BLASTPおよびBLAST3は、タンパク質配列データベースに対してアミノ酸照会配列を比較する;
(2)BLASTNは、ヌクレオチド配列データベースに対してヌクレオチド照会配列を比較する;
(3)BLASTXは、タンパク質配列データベースに対して照会ヌクレオチド配列(両鎖)の6フレームの仮想翻訳生成物を比較する;
(4)TBLASTNは、6つの全ての読み枠(両鎖)で翻訳されるヌクレオチド配列データベースに対して照会タンパク質配列を比較する;および
(5)TBLASTXは、ヌクレオチド配列データベースの6フレームの翻訳に対してヌクレオチド照会配列の6フレームの翻訳を比較する。
【0186】
BLASTプログラムは、照会アミノ酸または核酸配列とテスト配列(前記は好ましくはタンパク質または核酸配列データベースから入手される)間で、類似セグメント(前記は本明細書では“高いスコアをもつセグメント対”と称される)を同定することによって相同な配列を同定する。高いスコアをもつセグメント対は、好ましくはスコアリングマトリックス(それらの多くは当技術分野で周知である)の手段によって同定される(すなわちアラインメントを実施される)。好ましくは、使用されるスコアリングマトリックスはBLOSUM62マトリックスである(Gonnet et al., Science 256:1443−1445, 1992; Henikoff and Henikoff, Proteins 17:49−61, 1993)。前記よりも劣るが、PAMまたはPAM250マトリックスもまた使用することができる(例えば以下の文献を参照されたい:Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation)。BLASTプログラムは米国立医学図書館を介して、例えばwww.ncbi.nlm.nih.gov.でアクセスできる。
【0187】
上記のアルゴリズムとともに用いることができるパラメーターは、配列の長さおよび調査される相同性の程度に応じて改変させることができる。いくつかの実施態様では、前記パラメーターは、ユーザーの指示がない状態でアルゴリズムによって使用されるデフォルトパラメーターであってもよい。
図3は、新規なヌクレオチドまたはタンパク質配列と配列データベースとの間の相同性レベルを決定するために、前記新しい配列をデータベースの配列と比較するプロセス200の実施態様の1つを示す作業工程図である。前記配列データベースは、コンピュータシステム100内に保存された個人のデータベースでも、または公的なデータベース(例えばGENBANK、インターネットを介して利用できる)であってもよい。
プロセス200は、開始状態201で始まり、続いて状態202に進む。状態202では、比較されるべき新規な配列はコンピュータシステム内のメモリーに保存される。上記で考察したように、前記メモリーはいずれのタイプのメモリーでもよく、これにはRAMまたは内部保存装置が含まれる。
【0188】
続いてプロセス200は状態204に進み、ここで配列データベースが分析と比較のために開かれる。さらにプロセス200は状態206に進み、ここで前記データベースに保存された第一の配列はコンピュータのメモリー内に読み出される。続いて比較が状態210で実施され、第一の配列が第二の配列と同じか否かが決定される。前記工程は前記新規な配列とデータベース中の第一の配列との間の正確な比較を実施することに限定されないことを特記することは重要である。2つのヌクレオチドまたはタンパク質配列を、たとえそれらが同一でなくとも比較できる周知の方法が当業者には知られている。例えば、ギャップを1つの配列に導入し、2つのテストされる配列間の相同性レベルを高めることができる。比較時にギャップまたは他の特徴を配列に導入するか否かを制御するパラメーターは、通常は前記コンピュータシステムの使用者によってエンターされる。
【0189】
いったん状態210で比較を実施したら、前記2つの配列が同じか否かの決定が状態210で行われる。もちろん、“同じ”という用語は完全に同一の配列に限定されない。使用者がエンターした相同性パラメーターの範囲内にある配列はプロセス200では“同じ”と表示されるであろう。
2つの配列が同じであると表示されたならば、プロセス200は状態214に進み、ここでは前記データベースの配列の名称が使用者に表示される。前記状態は、表示の名称をもつ配列が、エンターされた相同性の制約を満たすことを使用者に報告する。保存されている配列名が使用者に表示されたら、プロセス200は決定状態218に進み、ここでさらに多くの配列がデータベースに存在するか否かの決定が行われる。それ以上の配列がデータベースに存在しない場合、プロセス200は終了状態220で停止する。しかしながら、データベースにそれ以上の配列が存在する場合は、プロセス200は状態224に進み、ここでポインターはデータベースの次の配列に移動し、前記の新規な配列と比較することができる。このようにして、データベース内の全ての配列と前記新規な配列はアラインメントを実施され比較される。
配列が相同でないという決定が決定状態212で行われる場合、他のいずれかの配列がデータベースで比較に利用できるか否かを決定するために、プロセス200は直ちに決定状態218に進むことは特記されねばならない。
【0190】
したがって、本発明の特徴の1つは、プロセッサ、データ保存装置および比較を実施するための配列比較装置を含むコンピュータシステムである。前記データ保存装置は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列がそれに保存されてあり、さらに前記データ保存装置には、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列と比較されるべきリファレンスヌクレオチド配列またはポリペプチド配列がそれに保存されてある。前記配列比較装置は、配列間の相同性レベルを表示するか、または、配列番号:1、3、5、7、9、11、13、15および前記配列と実質的に同一の配列の上記核酸コード、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列における構造モチーフを同定するか、または、前記配列比較装置は、前記核酸コードまたはポリペプチドコードと比較される配列の構造モチーフを同定する。いくつかの実施態様では、データ保存装置は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列の少なくとも2、5、10、15、20、25、30もしくは40またはそれ以上の配列を保存する。
【0191】
本発明のまた別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列とリファレンスヌクレオチド配列との間の相同性レベルを決定する方法である。前記方法は、核酸コードまたはポリペプチドコードおよびリファレンスヌクレオチドまたはポリペプチド配列を、相同性レベルを決定するコンピュータプログラムを用いて読み出し、さらに核酸コードまたはポリペプチドコードおよびリファレンスヌクレオチドまたはポリペプチド配列との間の相同性を前記コンピュータプログラムを用いて決定することを含む。前記コンピュータプログラムは相同性レベルを決定する多数のコンピュータプログラムのいずれでもよいが、特に本明細書に挙げたもの(例えばデフォルトパラメーターまたは任意の改変パラメーターを有するBLAST2N)が含まれる。前記方法は、上記で述べたコンピュータシステムを用いて実施することができる。前記方法はまた、配列番号:1、3、5、7、9、11、13、15に示す上記核酸配列の少なくとも2、5、10、15、20、25、30もしくは40またはそれ以上の配列またはグループBに示すポリペプチド配列を前記コンピュータプログラムにより読み出し、さらに前記核酸コードまたはポリペプチドコードとリファレンスヌクレオチド配列またはポリペプチド配列との間の相同性を決定することによって実施してもよい。
【0192】
図4は、2つの配列が相同であるか否かを決定するコンピュータプロセス250の実施態様の1つを示す作業工程図である。プロセス250は、開始状態252で開始し状態254に進み、ここで比較されるべき第一の配列がメモリーに保存される。続いて状態256で比較されるべき第二の配列がメモリーに保存される。続いてプロセス250は状態260に進み、ここで第一の配列の第一の文字が読み出され、続いて状態262に進み、ここで第二の配列の第一の文字が読み出される。前記配列がヌクレオチド配列の場合、前記文字は通常はA、T、C、GまたはUであろうということは理解されよう。前記配列がタンパク質配列の場合は、前記文字は、前記第一および第二の配列を容易に比較できるように、好ましくは一文字アミノ酸コードである。
【0193】
続いて決定状態264で、前記2つの文字が同じものであるか否か決定が行われる。それらが同じである場合、前記プロセス250は状態268に進み、ここで第一および第二の配列の次の文字が読み出される。続いて、前記次の文字が同じものであるか否かの決定が行われる。それらが同じである場合は、さらに、プロセス250は、2つの文字が同じでなくなるまで前記ループを繰返す。次の2つの文字が同じでないという決定が行われた場合、プロセス250は決定状態274に進み、ここでさらにそれ以上の読み出すべき文字がいずれかの配列に存在するか否かが決定される。
読み出すべき文字がもはや存在しない場合は、プロセス250は状態276に進み、第一の配列と第二の配列との間の相同性レベルが使用者に表示される。前記相同性レベルは、第一の配列の文字総数のうち同じであった配列間の文字の割合を計算することによって決定される。したがって、第一の100個のヌクレオチドの配列の全ての文字が第二の配列の全ての文字と並ぶならば、相同性レベルは100%であろう。
【0194】
また別には、前記コンピュータプログラムは、本発明に示す核酸配列のヌクレオチド配列を1つまたは2つ以上のリファレンスヌクレオチドと比較し、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の核酸コードがリファレンス核酸配列と1つまたは2つ以上の位置で異なるか否かを決定するコンピュータプログラムであってもよい。場合によって、前記のプログラムは、リファレンスポリヌクレオチドまたは配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のいずれかについて挿入、欠失または置換させたヌクレオチドの長さまたその同一性を記録する。ある実施態様では、前記コンピュータプログラムは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列がリファレンスヌクレオチド配列に対して単一ヌクレオチド多型(SNP)を含むか否かを決定するプログラムであろう。
【0195】
したがって、本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列がリファレンスヌクレオチド配列と1つまたは2つ以上のヌクレオチドで相違するか否かを決定する方法である。前記方法は、核酸配列間の相違を同定するコンピュータプログラムを使用して前記核酸コードおよびリファレンスヌクレオチド配列を読み出し、さらに前記コンピュータプログラムにより前記核酸コードとリファレンスヌクレオチド配列間の相違を同定する工程を含む。いくつかの実施態様では、前記コンピュータプログラムは、シングルヌクレオチド多形性を同定するプログラムである。前記方法は、上記のコンピュータシステムおよび図4に示す方法によって実施することができる。前記方法はまた、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の少なくとも2、5、10、15、20、25、30もしくは40またはそれ以上の配列およびリファレンス配列を前記コンピュータプログラムを使用して読み出し、さらに前記コンピュータプログラムにより前記核酸コードとリファレンスヌクレオチド配列間の相違を同定することによって実施することができる。
【0196】
他の実施態様では、前記コンピュータ支援システムは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列内の特徴を同定するための認識機構(アイデンティファイアー)をさらに含むことができる。
“認識機構”とは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列内の一定の特徴を同定する1つまたは2つ以上のプログラムを指す。ある実施態様では、前記アイデンティファイアーは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列内の開放読み枠を同定するプログラムを含むことができる。
【0197】
図5は、配列内の特徴の存在を検出する認識機構によるプロセス300の実施態様の1つを示す作業工程図である。前記プロセス300は開始状態302で始まり、状態304に進み、ここで特徴についてチェックされるべき第一の配列がコンピュータシステムのメモリー115に保存される。続いてプロセス300は状態306に進み、ここで配列特徴のデータベースが開かれる。前記データベースは、特徴の名称とともに各特徴の属性のリストが含まれるであろう。例えば、特徴の名称は“開始コドン”であり、その属性は“ATG”であろう。また別の例は、特徴の名称は“TAATAAボックス”で特徴の属性は“TAATAA”であろう。前記データベース例は、ウィスコンシン大学遺伝学コンピュータグループ(www.gcg.com)によって作製されている。また別には、前記特徴は構造的ポリペプチドモチーフ、例えばアルフヘリックス、ベータシート、または機能的ポリペプチドモチーフ、例えば酵素の活性部位、ヘリックス−ターン−ヘリックスモチーフ、または当業者に公知のモチーフでもよい。
【0198】
いったん特徴のデータベースが状態306で開かれたら、前記プロセス300は状態308に進み、ここで第一の特徴がデータベースから読み出される。第一の特徴の属性と第一の配列との比較が状態310で行われる。続いて、前記特徴の属性が第一の配列で見出されるか否かが決定状態316で決定される。前記属性が見出されたら、プロセス300は状態318に進み、ここで見出された特徴の名称が使用者に表示される。
続いてプロセス300は決定状態320に進み、ここでさらにそれ以上の特徴がデータベースに存在するか否かが決定される。それ以上の特徴が存在しない場合は、プロセス300は終了状態324で終了する。しかしながら、それ以上の特徴がデータベースに存在する場合は、プロセス300は状態326で次の配列特徴を読み出し、状態310に戻り、ここで次の特徴の属性が第一の配列に対して比較される。
特徴の属性が決定状態316で第一の配列で見出されない場合は、プロセス300は決定状態320に直接進み、さらにそれ以上の特徴がデータベースに存在するか否かが決定されることは特記されるべきであろう。
【0199】
したがって、本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列内の特徴を同定する方法である。前記方法は、核酸コードまたはポリペプチドコードを、その中に存在する特徴を同定するコンピュータプログラムを用いて読み出し、さらに前記コンピュータプログラムにより核酸コード内の特徴を同定することを含む。ある実施態様では、コンピュータプログラムは、開放読み枠を同定するコンピュータプログラムを含む。前記方法は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列のただ1つの配列、または少なくとも2、5、10、15、20、25、30もしくは40個を前記コンピュータプログラムを使用して読み出し、さらに前記核酸コードまたはポリペプチドコード内の特徴を前記コンピュータプログラムにより同定することによって実施することができる。
【0200】
配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列は、多様なデータプロセッサプログラムで多様なフォーマットで保存し処理することができる。例えば、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列は、ワードプロセッシングファイル、例えばマイクロソフトワードもしくはワードパーフェクトでテキストとして、または当業者に周知の多様なデータベースプログラム、例えばDB2、SYBASEまたはORACLEでアスキーファイルとして保存することができる。さらに、多くのコンピュータプログラムおよびデータベースを、配列比較アルゴリズム、アイデンティファイアー、または配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列と比較されるべきリファレンスヌクレオチド配列またはポリペプチド配列の供給源として使用することができる。以下のリストは、本発明を制限しようとするものではないが、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列に関して有用なプログラムおよびデータベースの手引きを提供する。
【0201】
使用することができるプログラムおよびデータベースには以下が含まれる(ただしこれらに限定されない):マックパターン(MacPattern; EMBL)、ディスカバリーベース(DiscoveryBase; Molecular Applications Group)、ジーンマイン(GeneMine; Molecular Applications Group)、ルック(Look; Molecular Applications Group)、マックルック(MacLook; Molecular Applications Group)、BLASTおよびBLAST2(NCBI)、BLASTNおよびBLASTX(Altschul et al., J. Mol. Biol. 215:403, 1990)、FASTA(Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85:2444, 1988)、FASTDB(Brutlag et al., Comp. App. Biosci. 6:237−245, 1990)、カタリスト(Catalyst; Molecular Simulations Inc.)、カタリスト/SHAPE(Molecular Simulations Inc.)、セリウス2.DBアクセス(Cerius2.DBAccess; Molecular Simulations Inc.)、ハイポジェン(HypoGen; Molecular Simulations Inc.)、インサイトII(Insight II; Molecular Simulations Inc.)、ディスカバー(Discover; Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、フェリックス(Felix; Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、クォンテMM(QuanteMM; Molecular Simulations Inc.)、ホモロジー(Homology; Molecular Simulations Inc.)、モデラー(Modeler; Molecular Simulations Inc.)、ISIS(Molecular Simulations Inc.)、クォンタ/プロテインデザイン(Quanta/Protein Design; Molecular Simulations Inc.)、ウェブラブ(WebLab; Molecular Simulations Inc.)、ウェブラブダイバーシティエクスプローラー(WebLab Diversity Explorer; Molecular Simulations Inc.)、ジーンエクスプローラー(Gene Explorer; Molecular Simulations Inc.)、セクフォールド(SeqFold; Molecular Simulations Inc.)、MDLアベイラブルケミカルズディレクトリーデータベース(the MDL Available Chemicals Directory database)、MDLドラッグデータレポートデータベース(the MDL Drug Data Report database)、コンプリヘンシブメディシナルケミストリーデータベース(the Comprehensive Medicinal Chemistry database)、ダーウェントのワールドドラッグインデックスデータベース(Derwent´s World Drug Index database)、バイオバイトマスターファイルデータベース(the BioByteMasterFile database)、ジェンバンクデータベース(the Genbank database)、およびジェンシークンデータベース(the Genseqn database)。本開示によって多くの他のプログラムおよびデータベースが当業者には明白であろう。
【0202】
上記のプログラムを用いて検出できるモチーフには以下が含まれる(ただしこれらに限定されない):ロイシンジッパー、ヘリックス−ターン−ヘリックスモチーフ、糖化部位、ユビキチン付加部位、アルファヘリックスおよびベータシートをコードする配列、シグナルペプチド(コードされたタンパク質の分泌を指令する)をコードするシグナル配列、転写調節に関連する配列(例えばホメオボックス)、酸性ストレッチ、酵素活性部位、基質結合部位、および酵素切断部位。
【0203】
本発明は酵素の固有の触媒特性を利用する。化学物質の変換における生物触媒(すなわち精製または粗酵素、非生細胞または生細胞)の使用は、特定の出発化合物と反応する個々の生物触媒の同定を通常必要とするが、本発明は、多くの出発化合物、例えば小分子に存在する官能基に特異的な、選択した生物触媒および反応条件を用いる。各生物触媒は、1つの官能基または関連するいくつかの官能基に特異的で、この官能基を含む多くの出発化合物と反応することができる。
前記生物触媒反応は、単一の出発化合物から誘導体の集団を生成する。これら誘導体はさらにもう一回生物触媒反応に付され、第二の誘導化合物集団を生成することができる。最初の小分子または化合物の数千の変種が、生物触媒の誘導体生成反応を繰り返すたびに生成される。
【0204】
酵素は出発化合物の特異的部位で反応し、前記分子の残りの部分に影響を与えず、このプロセスは伝統的な化学的方法を用いて達成することは非常に困難である。前記高度な生物触媒反応の特異性は、ライブラリー内のただ1つの活性化合物を同定する手段を提供する。前記ライブラリーは、それを生成するために用いられた生物触媒反応シリーズ、いわゆる“生合成歴”によって特徴付けられる。前記ライブラリーを生物学的活性についてスクリーニングし、生合成歴を追跡することによって、活性化合物を生成する特異的な一連の反応が同定される。前記一連の反応が繰り返され、合成された化合物の構造が決定される。この同定態様は、他の合成およびスクリーニングアプローチと異なり、固定化技術を必要とせず、化合物は溶液中で自由に合成することが可能で、さらに、実質的に任意のタイプのスクリーニングアッセイを用いて溶液中で自由にテストすることができる。官能基上の酵素反応の高度な特異性は、生物触媒により生成されたライブラリーを作製する特異的な酵素反応の追跡を可能にする。
【0205】
前記手順の工程の多くはロボットによる自動化を用いて実施され、前記自動化は、1日につき何千もの生物触媒反応およびスクリーニングの実施を可能にするとともに高レベルの正確さおよび再現性を担保する。結果として、誘導化合物ライブラリーは数週間で作製することが可能で、従来の化学的な方法によれば作製に数年を要するであろう。
【0206】
特定の実施態様では本発明は小分子を改変する方法を提供する。前記方法は、本明細書に記載したポリヌクレオチドによってコードされるポリペプチドまたは酵素的に活性なそのフラグメントを小分子と接触させ、改変小分子を生成することを含む。改変小分子ライブラリーを調べて、所望の活性を示す改変小分子がライブラリー内に存在するか否かを決定する。所望の活性をもつ前記改変小分子を生成する特異的な生物触媒反応は、ライブラリーの一部分を作製するために用いられる生物触媒反応の各々を系統的に消去し、さらに所望の活性をもつ改変小分子の有無についてライブラリーの一部分で生成された小分子をテストすることによって同定される。所望の活性をもつ改変小分子を生成する特異的な生物触媒反応は場合によって繰り返される。この生物触媒反応は、小分子の構造内に見出される別々の構造部分と反応する一群の生物触媒を用いて実施され、各生物触媒は一つの構造部分又は一つの関連する構造部分群に特異的であり、さらに各生物触媒は、前記個々の構造部分を含む多くの異なる小分子と反応する。
【0207】
本発明の構成要素はキットの構成に適切である。特に、配列番号:2、4、6、8、10、12、14、16のアミノ酸配列またはその相同な配列を有する生成タンパク質であって、約90℃から113℃の範囲の温度でポリメラーゼ活性を有するものを収納する少なくとも1つの容器を含むキットを提供する。好ましい実施態様では、前記タンパク質は、約90℃から113℃の範囲の温度でポリメラーゼ活性を有する配列番号:16またはその相同な配列である。ある特徴では、前記キットはさらに少なくとももう1つの容器を含み、前記容器にはdNTP、PCR用調製済み水、標準の長いGCリッチ陽性対照鋳型、対照プライマーセットまたはその任意の組合せを収納する。
本発明は以下の実施例を参考にしながらさらに説明されるが、本発明はそのような実施例に限定されないことは理解されるべきである。
【0208】
(実施例)
実施例1:配列番号:16のポリメラーゼのための最適化試験
最適化試験を実施し、85℃から95℃の範囲の温度のPCRで配列番号14,16のDNAポリメラーゼをポリメラーゼ活性のために利用する場合にもっとも有利な条件を決定した。調べたパラメーターは、緩衝液、pH、塩および塩濃度、Mgイオン供給源、界面活性剤および界面活性剤濃度であった。
調べた緩衝液はトリス−HCl、トリス−HOAc、リン酸緩衝液、バイシン(Bicine)、HEPES、MOPSおよびTAPSであった。もっとも理想的な緩衝液はHClであった。
調べたpH範囲は7.5から10.0であった。もっとも理想的なpHは10.0であった。
調べた塩は、濃度が5mMから200mMのNaCl、NaOAc、KCl、(NH4)2SO4、NH4OAcおよびLiClであった。もっとも有利な塩は25mMのNaOAcであった。
調べたマグネシウムイオン供給源は、濃度が0.5mMから5mMのMgCl2、Mg(OAc)2、MgSO4であった。前記のうちでもっとも有利なものは2から2.5mMのMg(KOAc)2であった。
調べた界面活性剤は、濃度が0.001から0.5体積%のNP−40、トゥイーン−20(登録商標)およびトリトンX−100(登録商標)界面活性剤であった。最良の条件は、濃度が0.002%のNP−40とトゥイーン−20界面活性剤の混合物であった。
これらの結果から、配列番号:16のDNAポリメラーゼを用いるPCRの実施にもっとも有利な緩衝液は、60mMのトリス−HCl(pH10.0)、25mMのNaOAc、2mMのMg(OAc)2および0.002% NP−40/トゥイーン−20を用いる。
【0209】
実施例2:配列番号:16のDNAポリメラーゼの高い正確性
3.3kbのlacZ遺伝子を増幅しクローニングした。文献に記載されたように(W.M. Barnes, (1994) Proc. Natl. Acad. Sci., 91/:2216−2220)、β−ガラクトシダーゼアッセイを実施した。
配列番号:16のポリメラーゼとTaqとの比較の結果は図6に示されている。相対的変異頻度は、配列番号:16のDNAポリメラーゼの場合よりもTaqで高いことが図から分かる。鋳型が倍になる毎に塩基対当たりの変異頻度は配列番号:16のDNAポリメラーゼで6.0×10−5で、一方Taqでは1.8×10−4であった。
【0210】
実施例3:配列番号:16のDNAポリメラーゼの収量および融通性
3種のcDNA鋳型、長い鋳型およびGCリッチ鋳型を配列番号:16のDNAポリメラーゼを用いて増幅した。結果は図7、8および9に示されている。
以下の3種のcDNA鋳型を調製した:3.0kbの甲状腺ホルモンレセプター共働活性化因子、3.3kbのオンコスタチン−M特異的レセプターベータ遺伝子およびタンパク質チロシンホスファターゼレセプターベータ遺伝子の2.1kb部分。前記3つの全ての鋳型を、HeLa第一鎖cDNA10ナノグラムを用い30サイクルのPCRで増幅した。PCRは各鋳型について2回、最初に配列番号:16のDNAポリメラーゼを、2回目はTaqをポリメラーゼとして用いて実施した。SDS−PAGEゲルを泳動して配列番号:16のDNAポリメラーゼによる結果とTaqによる結果を比較した。得られたゲルによれば、配列番号:16のポリメラーゼは、Taqで達成された収量と同様な収量で3つの鋳型全てを増幅させることができた。
【0211】
さらに、種々の長さを有するラムダファージのゲノムDNAを、配列番号:16のDNAポリメラーゼを用い最適化を実施させずにPCRによって増幅させた。SDS−PAGEゲルを泳動して各鋳型の増幅量を決定した。得られたゲルによれば、配列番号:16のポリメラーゼは、最適化を実施することなく10、15、20および25kbの鋳型を増幅することができた。
インスリン様成長因子レセプターII(IGFRII)(前記は90%を越えるGC含有量を有する)を、3つの別個のポリメラーゼ、配列番号:16のDNAポリメラーゼ、Taqポリメラーゼ、およびアドバーンテージ−GC(登録商標)を用いてPCRによって増幅した。各増幅は最適化を実施しないでPCR25サイクルを用いた。SDS−PAGEゲルを泳動して、各酵素による結果を比較した。結果は、配列番号:16のDNAポリメラーゼは前記鋳型を増幅できること示した。
【0212】
図7は、配列番号:16は多数の鋳型を増幅することができ、Taqポリメラーゼと比較して大きな収量を生成できることを明瞭に示している。レーンの上に示したように、サンプルは配列番号:16またはTaqのいずれによっても増幅された。増幅ではPCR 30サイクルについて10ナノグラムのHeLa第一鎖cDNAを用いた。レーン1,4:3.0kbの甲状腺ホルモンレセプター共働活性化因子;レーン2,5:3.3kbのオンコスタチン−M特異的レセプターベータ遺伝子;レーン3,6:タンパク質チロシンホスファターゼレセプターベータ遺伝子の2.1kb部分。
図8は、配列番号:16は、さらに最適化を実施することなく、25kbまでのラムダファージゲノムDNA鋳型を増幅できることを明瞭に示している。
図9は、3種のDNAポリメラーゼを用いた、インスリン様成長因子レセプターII(IGFRII)の500bp領域(90%を越えるGC含有量を有する)の増幅を示す。各増幅は、最適化を実施しないでPCR 25サイクルにより実施された。レーン1:配列番号:16;レーン2:Taqポリメラーゼ;レーン3:アドバーンテージ−GC(登録商標)(Invitrogen)。図9のレーン1は、配列番号:16は、他の市販のDNAポリメラーゼよりもIGFRII cDNAの一部分(GCが90%を越える)を良好に増幅することを示している。
【0213】
実施例4:配列番号:16の較正(プルーフリーディング)活性
配列番号:16のプルーフリーディング活性は平滑端を有するPCR生成物を生じる。したがって、前記PCR生成物は、例えばTOPO(登録商標)ブラントクローニング法(TOPO BLUNT Cloning methods; Invitrogen, San Diego, CA)または類似のシステムを用いてクローニングできる。TOPO(登録商標)クローニングは、迅速5分連結法によりPCR生成物をより迅速にさらに効率的にクローニングする。TOPO(登録商標)クローニングにとって重要なものは酵素トポイソメラーゼIである。前記酵素の通常の役割は切れ目を入れスーパーコイルDNAをリラックスさせ、続いて複製中に末端を再結合させることである。トポイソメラーゼの再結合活性の利点を有する種々のクローニングおよび発現ベクターがデザインされ、わずか5分でPCR生成物を結合することを可能にした。下記のリストは、配列番号:16のDNAポリメラーゼで増幅したPCR生成物の増幅のために現在利用可能なTOPO(登録商標)ベクターのいくつかの概略である:pCR(登録商標)−BluntII−TOPO(登録商標);pCR(登録商標)4Blunt−TOPO(登録商標);pUniBlunt/V5−His−TOPO(登録商標);pUniD/V5−His−TPPO(登録商標)。
【0214】
実施例5:配列番号:16の逆転写酵素活性
ポリdT DNAプライマーを用いてポリAテールをもつメッセンジャーRNAとハイブリダイズさせた。これに以下を添加した:PCR緩衝液(種々の濃度のMn++とともにMg++含有または非含有)、dATP、dCTP、dGTP、配列番号:16のポリメラーゼ、およびアルファ−3H−dTTP。前記混合物を72℃でインキュベートし、その後TCA沈澱を行った。この沈殿により酵素により取り込まれたものから遊離ヌクレオチドは分離除去される。サンプルに取り込まれた放射能活性(CPM(カウント/分))は前記反応の逆転写活性を示している。図10は、Mg++の存在下および非存在下での配列番号:16のRT活性の比較を示す。
【0215】
実施例6:耐熱性アッセイ
活性化ウシ胸腺DNA伸長反応におけるアルファ−3H−dTTPのポリメラーゼによる取り込みによって酵素活性を測定した。以下を用いて反応混合物を準備した:PCR緩衝液、dATP、dGTP、dCTP、活性化ウシ胸腺DNA、およびアルファ−3H−dTTP。ポリメラーゼ酵素(緩衝液中)を85℃、90℃または95℃で種々の時間(0から240分)予備インキュベートした。前記熱処理の後、前記酵素を反応混合物に添加し、同じ温度で一定時間インキュベートした。続いてTCA沈澱を実施し、酵素によって取り込まれたヌクレオチドから遊離ヌクレオチドを分離した。ヌクレオチド取り込みサンプルの放射能活性(CPM)は反応時のポリメラーゼ活性量を示す。各温度について予備インキュベーションに対するCPMの表(酵素の耐熱性を示す)を作製することができる(図11参照)。
本発明を上記の実施例を参考に述べてきたが、改変および変更は本発明の範囲内に包含されることは理解されよう。したがって、本発明は特許請求の範囲によってのみ限定される。
添付の図面は本発明の実施態様の説明であって、請求の範囲によって包含される本発明の範囲を限定しようとするものではない。
【図面の簡単な説明】
【図1】図1Aから1Eは、ピロロブス・フマリア(Pyrolobus fumaria)由来のDNAポリメラーゼ(1PY2)のヌクレオチド配列および推定されるアミノ酸配列を示す(それぞれ配列番号:13および14)。再配列決定したところ、ヌクレオチド配列および推定されるアミノ酸配列は、配列番号:13および14に対して99%を越える相同性を示した(それぞれ配列番号:15および16を参照されたい)(図1F−1H(DNA)および図1I(アミノ酸))。
【図2】図2はコンピュータシステムのブロック図である。
【図3】図3は、新規なヌクレオチド配列またはタンパク質配列を配列データベースで比較し、新規な配列とデータベースの配列との間の相同性レベルを決定するプロセスの実施態様の1つを示したフローチャートである。
【図4】図4は、2つの配列が相同であるか否かを決定するコンピュータプロセスの実施態様の1つを示したフローチャートである。
【図5】図5は、配列内の特徴の有無を検出するアイデンティファイアープロセス300の実施態様の1つを示したフローチャートである。
【図6】図6は、実施例2で説明したように、配列番号:15によってコードされるポリメラーゼ(ポリペプチド=配列番号:16)およびTaqポリメラーゼを用いた変異の相対頻度を示す表である。
【図7】図7はゲルを示しており、配列番号:16が多数の鋳型を増幅し、Taqポリメラーゼと比較して大きな収量を生成できることを示している。
【図8】図8は、配列番号:16が25kbまでのラムダファージゲノムDNA鋳型をまた別に最適化を実施することなく増幅できることを示すゲルを提示している。
【図9】図9はゲルを示しており、レーン1は、GC含有量が90%を越えるIGFRIIのcDNAの一部を配列番号:16が良好に増幅できることを示している。
【図10】図10は、Mg++の存在下および非存在下での配列番号:16のRT活性の比較を示す。
【図11】図11は、85℃、90℃および95℃で4時間までの間の配列番号:16の安定性およびポリメラーゼ活性を示すグラフである。
本発明は一般に、酵素、前記酵素をコードするポリヌクレオチド、前記のポリヌクレオチドおよびポリペプチドの使用に関し、より具体的には高温でポリメラーゼ活性を有する酵素に関する。
【0002】
【従来技術】
好熱細菌は、高活性の耐熱酵素の供給源として大きな注目を浴びてきた。好熱細菌由来のDNAポリメラーゼに対する関心は核酸増幅方法の発明とともに高まった。現に存在する核酸を最初に存在した量と比較して大量に増幅させるために耐熱酵素(例えば米国特許4,165,188号に記載されたようなもの)を使用することについては米国特許第4,683,195号および4,683,202号(これらはPCRの方法について記載している)で開示された(前記特許は引用により本明細書に含まれる)。
【0003】
前記PCRの方法は、標的核酸の変性、プライマーのハイブリダイゼーションおよびDNAポリメラーゼによって触媒される相補鎖の合成を伴う。各プライマーの増幅生成物は、所望の核酸配列の生成のための鋳型になる。使用されるポリメラーゼが耐熱性酵素であれば、熱によってポリメラーゼ活性が破壊されないので、ポリメラーゼを変性工程後に毎回添加する必要がない。熱耐性DNAポリメラーゼは、PCRによるDNAの増幅を実施しているときに例えば93℃から95℃に短時間加熱されたときでも不可逆的に活性を失うことはない。対照的に、前記のような温度上昇で大腸菌(E. coli)のPolIは不活化される。
【0004】
超好熱古細菌、例えばピロジクチウム(Pyrodictium)およびメタノピルス(Methanopyrus)は約110℃の温度で増殖し、80℃以下では増殖できない(例えば以下の文献を参照されたい:Stetter et al., 1990, FEMS Microbiology Reviews 75:117−124(前記文献は引用により本明細書に含まれる))。前記の硫黄還元性、偏性嫌気性細菌は海底環境から単離される。例えば、P.アビッシー(abyssi)は、グエイマスメキシコ(Guaymas Mexico)のはずれの深海(深さ2000メートル)にある活動性“スモーカー”の噴気口の噴出水(320℃)から単離された(Pley et al., 1991, Systematic and Applied Microbiology 14:245)。知られるかぎり最高の温度に生息する超好熱細菌、ピロロブス・フマリア(Pyrolobus fumaria)は、熱水噴出口(時にスモーカーと称され、ここを通って超高熱の鉱物に富む液体が噴出する)の壁内で増殖する。ピロロブス・フマリアは、約105℃の環境でもっともよく繁殖し、113℃までの温度で分裂することができるが、90℃以下の温度で増殖を停止する。
【0005】
より一般的な好熱細菌は、約90℃の最適増殖温度および100℃または100℃近くの最高増殖温度を有する。前記より穏やかな超好熱細菌は培養で増殖させることができる。例えば、DNAポリメラーゼをコードする遺伝子が、テルモコッカス・リトラリス(Thermococcus litoralis)からクローニングされ、配列を決定された(EP455430号)。
しかしながら、超好熱細菌の培養は、固形寒天培地で増殖できないために困難である。例えば、ピロジクチウムの個々の細胞は極めて壊れやすく、さらにこの細菌は線維状ネットワークとして増殖し、通常の発酵装置のスチール部分に目詰まりをもたらす。したがってピロジクチウムの培養は標準的な細菌発酵技術では極めて難しい。(例えば以下を参照されたい:J.T. Staley et al. eds., Bergey’s Manual of Systematic Bacteriology, 1989, Williams and Wilkins, Baltimore(この文献は引用により本明細書に含まれる))。前記の問題およびその他の問題は、性状決定およびアミノ酸配列分析のために大量の精製された核酸ポリメラーゼ酵素を調製する実験室培養を困難にするであろう。
当技術分野では、PCRの工程を改善するために、さらにPCR以外の他の遺伝子組換え技術(例えばDNA配列決定、ニック−トランスレーションおよび逆転写)で耐熱性DNAポリメラーゼを用いたときに得られる結果を改善するために用いることができる、熱安定性が強化された耐熱性DNAを製造することが所望される。
【0006】
発明の概要
本発明は、配列番号:1、3、5、7、9、11、13、15に示される配列、および配列番号:1、3、5、7、9、11、13、15と少なくとも50%の配列同一性をもつその変種の配列を有し、4時間からそれ以上の時間の超高温(例えば95℃から113℃)でポリメラーゼ活性を有するポリペプチドをコードする単離核酸を提供することによって、前記および他の要求に応える。
本発明の特徴の1つは、配列番号:1、3、5、7、9、11、13、15に示される配列、前記配列と実質的に同一の配列および前記に相補的な配列を有する単離核酸である。
【0007】
本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示される配列、前記配列と実質的に同一の配列、および前記配列と相補的な配列の少なくとも10個の連続した塩基配列を含む単離核酸である。
さらに別の特徴では、本発明は、配列番号:2、4、6、8、10、12、14、16に示される配列を有するポリペプチド、および前記配列と少なくとも50%の配列同一性を有するその変種をコードし、さらに95℃から113℃の範囲の温度で耐熱性ポリメラーゼ活性を有するポリペプチドをコードする単離核酸を提供する。
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一である配列を有するポリペプチドまたはその機能的フラグメントをコードする単離核酸である。
【0008】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一の配列の少なくとも10個の連続したアミノ酸を含むポリペプチドをコードする単離核酸である。
さらに別の特徴では、本発明は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一の配列を有する精製ポリペプチドを提供する。
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14または16に示される配列および前記配列と実質的に同一の配列を有するポリペプチドと特異的に結合する単離または精製抗体である。
【0009】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16のポリペプチドおよび前記と実質的に同一の配列の1つの少なくとも10個の連続したアミノ酸を有するポリペプチドと特異的に結合する、単離もしくは精製抗体またはその結合フラグメントである。
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16に示される配列および前記配列と実質的に同一の配列を有するポリペプチドを製造する方法である。前記方法は、前記ポリペプチドをコードする核酸を宿主細胞に導入し、前記宿主細胞を前記核酸の発現が許容される条件下で培養することを含み、ここで前記核酸はプロモーターに作働できるように連結されている。
【0010】
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16に示される配列および前記配列と実質的に同一の配列の少なくとも10個のアミノ酸を有するポリペプチドを製造する方法である。前記方法は、前記ポリペプチドをコードする核酸を宿主細胞に導入し、前記宿主細胞を前記核酸の発現が許容される条件下で培養し、それによって前記ポリペプチドを製造することを含み、ここで前記核酸はプロモーターに作働的に連結されてある。
本発明のまた別の特徴は変種を作製する方法であって、前記方法は、配列番号:1、3、5、7、9、11、13、15に示される配列、前記配列と実質的に同一の配列、配列番号:1、3、5、7、9、11、13、15の配列と相補的な配列、前出の配列の少なくとも30個の連続したヌクレオチドを含むフラグメントを入手し、さらに前記配列の1つまたは2つ以上のヌクレオチドを別のヌクレオチドに変更し、前記配列の1つまたは2つ以上のヌクレオチドを欠失させ、または前記配列に1つまたは2つ以上のヌクレオチドを付加することを含む。
【0011】
本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列が保存されてあるコンピューター読取り可能媒体である。
本発明のまた別の特徴はプロセッサおよびデータ保存装置を含むコンピュータシステムであり、ここで前記データ保存装置には、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一の配列が保存されてある。
【0012】
本発明の別の特徴は第一の配列とリファレンス配列を比較する方法で、ここで前記第一の配列は、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一のポリペプチドコードを有する核酸である。前記方法は、配列を比較するコンピュータプログラムを使用して前記第一の配列およびリファレンス配列を読み出し、さらに前記第一の配列と前記リファレンス配列との間の相違を決定する工程を含む。
本発明のまた別の特徴は、配列番号:1、3、5、7、9、11、13、15に示される配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示される配列および前記配列と実質的に同一の配列を有するポリペプチドの特性を同定する方法であって、前記方法は、配列の特性を同定するコンピュータープログラムを使用して前記配列を読み出し、さらに前記コンピュータープログラムにより配列の特性を同定する工程を含む。
【0013】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一の配列のフラグメントまたは変種であって、配列番号:2、4、6、8、10、12、14、16のポリメラーゼの超高温ポリメラーゼ活性(すなわち4時間またはそれ以上の時間で95℃から113℃の温度)を保持するものを同定するためのアッセイである。前記アッセイは、配列番号1、3、5、7、9、11、13、15および前記配列と実質的に同一の配列と少なくとも50%の相同性を有する核酸によってコードされるポリペプチド、または配列番号1、3、5、7、9、11、13、15によってコードされるポリペプチドフラグメントまたは変種を利用して、超高温で4時間またはそれ以上の時間、前記ポリペプチドまたはフラグメントまたは変種が機能できる条件下でPCR増幅でDNAポリメラーゼ活性を発揮させ、さらに増幅生成物の生成を検出することを含み、ここで増幅生成物の生成は、機能的なDNAポリメラーゼポリペプチドまたはフラグメントまたは変種の表示となる。
【0014】
ある実施態様では、本発明は、本発明のポリメラーゼを用いてDNA分子の配列を決定する方法を提供する。前記方法は、(a)プライマーを第一のDNA分子とハイブリダイズさせ;(b)前記第一のDNA分子とデオキシリボヌクレオシド三リン酸、本発明のDNAポリメラーゼ(例えば配列番号:16)およびターミネーター分子と接触させて混合物を形成し;(c)前記第一のDNA分子と相補的なDNA分子のランダム集団を合成するために十分な条件下で前記混合物をインキュベートし、さらにここで合成されたDNA分子はその5’末端にターミネーターヌクレオチドを含み;さらに(d)前記第一のDNA分子のヌクレオチド配列の少なくとも一部分を決定することができるように、前記合成されたDNA分子を分離する工程を含む。前記デオキシリボヌクレオシド三リン酸には、イノシンdATP、dCTP、dGTP、dTTP、dITP、7−デアザ−dGTP、dUTP、[α−S]dATP、[α−S]dTTP、[α−S]dGTP、または[α−S]dCTPが含まれるが、ただしこれらに限定されない。ターミネーターヌクレオチドは、例えばddTTP、ddATP、ddGTP、ddITP、またはddCTPを含むことができる。
【0015】
また別の実施態様では、本発明は、本発明のポリメラーゼを利用し、さらに前記ポリメラーゼの逆転写酵素(RT)活性によってmRNAからcDNAを調製する方法を提供する。前記方法は、(a)mRNAをオリゴ(dT)プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成し;(b)cDNAが得られる条件下で、工程(a)で生成されたハイブリッドを請求項1のDNAポリメラーゼおよび4種の異なるdNTPと接触させる工程を含む。
【0016】
本発明はまた、例えばPCR反応によって二本鎖DNA分子を増幅する方法を提供する。前記方法は、第一および第二のプライマーを提供し(ここで前記第一のプライマーは、前記DNA分子の第一の鎖の3’末端または3’末端近くの配列と相補的であり、さらに前記第二のプライマーは、前記DNA分子の第二の鎖の3’末端または3’末端近くの配列と相補的である);本発明のDNAポリメラーゼ(例えば配列番号:16)の存在下で、第一の鎖と相補的な第三のDNA分子および第二の鎖と相補的な第四のDNA分子が合成される条件下で、前記プライマーを第一の鎖と、さらに第二のプライマーを第二の鎖とハイブリダイズさせ;第一の鎖と第三の鎖、および第二の鎖と第四の鎖を変性させ;さらに1番目から3番目までの工程を1回または2回以上繰り返して、増幅DNA分子を生成することを含む。いったん増幅されたDNAが得られたならば、前記DNA分子をベクター、例えばプラスミドでクローニングすることができる(すなわち平滑端クローニング)。
本発明はまた、非天然のヌクレオチドまたはヌクレオチド類似体をDNA分子に取り込ませる方法を提供する。前記方法は、本発明のポリメラーゼをコードするポリヌクレオチドによってコードされるポリペプチドをDNA鋳型とPCR増幅反応で接触させることを含む。前記ヌクレオチドには、例えばイノシン、2−アミノプリンまたは5−メチルシトシンが含まれる。
【0017】
(発明の詳細な記載)
本発明はDNAポリメラーゼおよび前記をコードするポリヌクレオチドに関する。ポリヌクレオチド配列番号:15は、もともとピロロブス・フマリア(Pyrolobus fumaria)のゲノム遺伝子ライブラリーから回収された。この2412塩基対のポリヌクレオチドは、推定される803個のアミノ酸配列(配列番号:16)を有するタンパク質をコードする。配列番号:1、3、5、7、9、11、13は、ポリメラーゼをコードするさらに別の新規な核酸配列をコードし、さらに配列番号:2、4、6、8、10、12および14は対応するタンパク質である。
【0018】
本発明は精製された熱耐性DNAポリメラーゼを提供する。前記ポリメラーゼは、相補的なポリヌクレオチドを鋳型として用いながら、ポリヌクレオチド鎖の3’末端にデオキシヌクレオチドを付加することによってDNA合成を触媒する。生成される収量は、以前に同定されているポリメラーゼを用いた場合よりも多い。天然に存在するヌクレオチド、アデニン、グアニン、シトシン、チミン、ウラシルを付加する能力の他に、本発明のポリメラーゼは、改変ヌクレオチドまたは非天然ヌクレオチド(例えばグアニン、シトシン、チミン、ウラシルの類似体(デオキシを含む))の取込みにも有用である。例えば、本発明のポリメラーゼは、2−アミノプリン、イノシン、5−メチルシトシンまたは他の非天然もしくは改変ヌクレオチドの付加に有用である。
【0019】
精製酵素の具体例は、本明細書でピロロブス・フマリア(Pyrolobus fumaria)と呼ぶ微生物に由来するポリメラーゼである。前記微生物は、高熱のミネラルに富む液体が噴出する熱水噴出口の壁の中で増殖する超好熱細菌である。ピロロブス・フマリアは、約105℃の環境でもっともよく繁殖し、さらに113℃までの温度で増殖することができるが、90℃より低い温度で増殖を停止する。前記の例示的な酵素(図1Bに示す配列)を用いて所望のDNAを生成できる。本発明のポリメラーゼ酵素は非常に高い耐熱性および反応処理能力を有する。ピロロブス・フマリアのポリメラーゼは、95℃から113℃の高温で4時間またはそれ以上の時間の後でさえ高い活性を維持する。したがって、前記ポリメラーゼは、長さが20kbより大きくおよび/またはGC含有量が約90%より高い鋳型分子のPCR増幅のために特に有用で信頼性が高い(前記GC含有量の高い鋳型は典型的にはより長い増幅時間およびより高温を必要とする)。
【0020】
ピロロブス・フマリアのDNAポリメラーゼ酵素で見出された特性であって、天然のTaq DNAポリメラーゼおよび天然のTth DNAポリメラーゼには存在しない特性の1つは3’→5’エキソヌクレアーゼ活性である。前記の3’→5’エキソヌクレアーゼ活性(一般的には“読みとり保証”(プルーフリーディング)活性として知られている)は、合成される核酸配列の塩基の取り込みミスまたは不適合が前記活性によって排除されるので概ね望ましいと考えられている。したがって、3’→5’エキソヌクレアーゼ活性を有するポリメラーゼ(例えば本発明のピロロブス・フマリアDNAポリメラーゼ酵素)を利用するPCRは信頼性が高くなる。しかしながら、DNAポリメラーゼ酵素で見出される3’→5’エキソヌクレアーゼ活性は、プライマーの3’末端を改変することによってPCRでの非特異的バックグラウンド増幅を増加させることもある。3’→5’エキソヌクレアーゼ活性は、一本鎖DNA(例えばプライマーまたは一本鎖の鋳型)を排除することができる。本質的に、一本鎖プライマーまたは鋳型の3’ヌクレオチドはいずれも不適合として前記酵素によって処理され、したがって分解される。PCRでのプライマーの分解を回避するために、プライマーの3’末端にホスホロチオエートを付加することができる。ホスホロチオエート修飾ヌクレオチドは、3’→5’エキソヌクレアーゼによる除去に対してより抵抗性を有する。
【0021】
所望されるものが天然のピリロブス・フマリアDNAポリメラーゼであれ、または前記酵素の誘導体もしくは同族体であれ、前記ポリメラーゼのリコンビナント型の生成は、典型的には、発現ベクターの構築、宿主細胞の前記ベクターによる形質転換、および発現が生じるような条件下での前記形質転換宿主細胞の培養を伴う。前記発現ベクターを構築するためにDNAを入手する。前記DNAは、成熟酵素(本明細書では全てのムテインを包含するために用いられる)または活性を破壊しない付加配列と前記ポリメラーゼの融合物、または制御条件下(例えばペプチダーゼによる処理)で切断して活性なタンパク質を生じることができる付加配列との融合物をコードするDNAである。続いて前記コード配列を発現ベクター内の適切な制御配列と動作可能なように連結させる。前記ベクターは、宿主細胞内で自立的に複製するか、または宿主細胞の染色体DNAに組み込まれるようにデザインすることができる。前記ベクターを用いて適切な宿主を形質転換し、リコンビナントポリメラーゼの発現に適した条件下で前記形質転換宿主を培養する。リコンビナントポリメラーゼを培養液または細胞から単離する。前記タンパク質の回収および精製は、ある程度の不純物は許容できるいくつかの事例では必要ではないかもしれない。
【0022】
定義
本明細書で用いられるように、“DNAポリメラーゼ”という用語は、加水分解酵素活性を有する酵素、例えばPCR増幅工程で鋳型配列を増幅するために用いることができる酵素を包含する。
本明細書で用いられる“核酸”または“核酸配列”という用語は、オリゴヌクレオチド、ヌクレオチド、ポリヌクレオチド、または前記のいずれかのフラグメントを指し、またゲノム起源もしくは合成起源のDNAまたはRNA(一本鎖でも二本鎖でもよく、さらにセンス鎖でもアンチセンス鎖でもよい)を指し、またペプチド核酸(PNA)、任意のDNA様もしくはRNA様物質(天然または合成起源)を指す。
【0023】
本明細書で用いられる“ヌクレオチド”とは塩基−糖−リン酸結合体を指す。ヌクレオチドは核酸配列(DNAおよびRNA)のモノマーユニットである。ヌクレオチドという用語には、デオキシリボヌクレオシド三リン酸、例えばdATP、dCTP、dITP、dUTP、dGTP、dTTPまたはその誘導体が含まれる。前記誘導体には、例えば[α]dATP、7−デアザ−dGTPおよび7−デアザ−dATPが含まれる。本明細書で用いられるヌクレオチドという用語はまた、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびその誘導体を指す。ジデオキシリボヌクレオシド三リン酸の例にはddATP、ddCTP、ddGTP、ddITPおよびddTTPが含まれるが、ただしこれらに限定されない。本発明にしたがえば、“ヌクレオチド”は標識されてなくても、また検出できるように周知の技術によって標識されてあってもよい。検出可能な標識には、例えば放射能活性アイソトープ、蛍光標識、化学発光標識、生物発光標識および酵素標識が含まれる。
【0024】
“コード配列”または特にポリペプチドまたはタンパク質を“コードするヌクレオチド配列”とは、適切な調節配列の制御下に配置されたとき、転写され、ポリペプチドまたはタンパク質に翻訳される核酸配列である。
“遺伝子”という用語は、ポリペプチド鎖の生成に関与するDNAセグメントを指す。前記用語は、コード領域の前後領域(リーダー部分およびトレーラー部分)の他に、適切な場合には個々のコードセグメント(エクソン)間の介在配列(イントロン)を含む。
本明細書で用いられる、“アミノ酸”または“アミノ酸配列”とは、オリゴペプチド、ペプチド、ポリペプチドまたはタンパク質配列、または前記のいずれかのフラグメント、部分もしくはサブユニット、および天然に存在する分子もしくは合成分子を指す。
【0025】
本明細書で用いられる、“ポリペプチド”という用語は、ペプチド結合または修飾ペプチド結合(すなわちペプチド同配体(peptide isosteres))によって互いに結合したアミノ酸を指し、遺伝子によってコードされる20のアミノ酸以外の改変アミノ酸を含むことができる。前記ポリペプチドは、自然のプロセッシング(例えば翻訳後プロセッシング)によって、または当技術分野で周知の化学的改変技術によって改変されてもよい。改変はポリペプチドのいずれの場所(ペプチド骨格、アミノ酸側鎖およびアミノまたはカルボキシ末端を含む)にあってもよい。同じタイプの改変が、与えられたポリペプチドのいくつかの場所に同じ程度でまたは種々の程度で存在し得ることは理解されよう。さらに、与えられたポリペプチドは多くのタイプの改変を含むこともできる。改変にはアセチル化、アシル化、ADP−リボシル化、アミド化、フラビンの共有結合付加、ヘム部分の共有結合付加、ヌクレオチドまたはヌクレオチドの共有結合付加、脂質または脂質誘導体の共有結合付加、ホスホチジルイノシトールの共有結合付加、架橋環状化、ジスルフィド結合生成、脱メチル化、共有架橋結合の生成、システインの生成、ピログルタメートの生成、ホルミル化、ガンマカルボキシル化、グリコシル化、GPIアンカー生成、ヒドロキシル化、ヨウ素化、メチル化、ミリストイル化(myristolyation)、酸化、パージレーション(pergylation)、タンパク分解処理、リン酸化、プレニル化、ラセミ化、セレノイル化、硫酸化、およびタンパク質へのt−RNA介在アミノ酸付加(例えばアルギニル化)が含まれる。(例えば以下の文献を参照されたい:Proteins−Structure and Molecular Properties 2nd Ed., T.E. Creighton, W.H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, pp.1−12(1983))。
【0026】
本明細書で用いられる、“単離された”という用語は、物質がその本来の環境(例えば前記物質が天然に存在する場合は前記天然の環境)から取り出されることを意味する。例えば、生きた動物中に存在している天然のポリヌクレオチドまたはポリペプチドは単離されてはいないが、同じポリヌクレオチドまたはポリペプチドであって、前記天然の系に一緒に存在するいくつかの物質または全ての物質から分離されたものは単離されたものである。前記ポリヌクレオチドはベクターの一部であってもよく、および/または前記ポリヌクレオチドまたはポリペプチドは組成物の一部であってもよく、前記ベクターまたは組成物はその天然の環境の一部分ではないということでなお前記ポリヌクレオチドまたはポリペプチドは単離されている。
【0027】
本明細書で用いられる、“精製された”という用語は完全に純粋であることを必要とせず、むしろ前記用語は相対的な限定を意図する。ライブラリーから得られる個々の核酸は電気泳動的に均一に常法によって精製されている。これらクローンから得られる配列は、前記ライブラリーからもヒトの全DNAからも直接には入手することはできない。本発明の精製核酸は、当該生物のゲノムDNAの残りの部分から少なくとも104−106倍精製されている。しかしながら、“精製された”という用語はまた、ゲノムDNAの残りの部分から、またはライブラリーの他の配列から、または他の環境から少なくとも1オーダーの規模で、典型的には2または3オーダー、より典型的に4または5オーダーの規模で精製された核酸も含む。
【0028】
本明細書で用いられる、“増幅”とは、DNAポリメラーゼを用いてヌクレオチド配列のコピー数を増加させる任意のin vitroまたはin vivoの方法を指す。核酸の増幅は、DNA分子またはプライマーへのヌクレオチドを取り込み、それによってDNA鋳型と相補的な新しいDNA分子の生成をもたらす。前記生成されたDNA分子およびその鋳型は、さらに別のDNA分子を合成するための鋳型として用いることができる。本明細書で用いられるように、1つの増幅反応は、何ラウンドものDNA複製から成るものであってもよい。DNA増幅反応には例えばポリメラーゼ連鎖反応(PCR)が含まれる。1つのPCR反応は、例えば数“サイクル”から30サイクル、100サイクルのDNA分子の変性と合成から成るものであってもよい。
【0029】
本明細書で用いられる、“プライマー”という用語は、天然であれ合成であれ、プライマーの伸長が開始される条件下に置かれたとき、合成の開始点として機能することができるオリゴヌクレオチドをいう。ある核酸の鎖と相補的なプライマー伸長生成物の合成は、適切な温度の適切な緩衝液中でヌクレオシド三リン酸およびDNAポリメラーゼまたは逆転写酵素の存在下で開始される。“緩衝液”は補助因子(例えば二価金属イオン)および塩(適切なイオン強度を提供するため)を含み、所望のpHに調節される。本発明のポリメラーゼの場合、前記緩衝液は、好ましくは約60mMのトリス塩酸(pH10.0)、25mMのNaOAc、2mMのMg(OAc)2(二価のマグネシウムイオンを提供するため)、および0.002%NP−40/トゥイーン−20を含む。
【0030】
プライマーは好ましくは一本鎖のオリゴデオキシリボヌクレオチドである。プライマーの適切な長さはプライマーの使用目的に左右されるが、典型的には15から35ヌクレオチドの範囲である。短いプライマー分子は、鋳型との十分に安定なハイブリッド複合体の形成のために一般により低い温度を要求する。プライマーは鋳型の正確な配列を再現する必要はないが、鋳型とハイブリダイズするために十分に相補的でなければならない。
【0031】
“プライマー”という用語は、特に増幅されるべき標的領域の一端または両端に関する情報にある程度の不明確さがある場合には2つ以上のプライマーを指すことがある。例えば、核酸配列がタンパク質配列から推論される場合は、“プライマー”は実際には、遺伝暗号の縮退に基づいて全ての可能なコドンの変種を表す配列を含むプライマーオリゴヌクレオチドの集合物である。前記集合物中のプライマーの1つは標的配列の末端と相同であろう。同様に、“保存”領域が集団内で顕著なレベルの多形性を示す場合、隣接する配列を増幅するプライマー混合物を調製することができる。
【0032】
プライマーは、鋳型の特定の配列の鎖と“実質的に”相補的であってもよい。プライマーは、プライマーの伸長が生じる鋳型の鎖とハイブリダイズするために十分相補的でなければならない。プライマー配列は鋳型の正確な配列を再現する必要はない。例えば、非相補的なヌクレオチドフラグメントをプライマーの5’末端に結合させ、プライマー配列の残りの部分は実質的に前記鎖と相補的であることができる。プライマー配列がハイブリダイズさせる鋳型の配列と十分な相補性を有し、それによってプライマーの伸長生成物の合成のための鋳型プライマー複合体を生成することを条件に、非相補的な塩基または長い配列をプライマー中に散在させることができる。
【0033】
プライマーは、所望の場合は、分光光度法的、光化学的、生化学的、免疫化学的、または化学的手段によって検出できる標識を取り込ませることによって標識することができる。例えば、有用な標識には32P、蛍光染料、高電子試薬、酵素(ELISAで一般的に用いられるもの)、ビオチンまたはハプテン、および抗血清もしくはモノクローナル抗体が利用できるタンパク質が含まれる。標識はまた、プライマーを“捕捉”するために用いられ、プライマーまたはプライマー伸長生成物(例えば増幅されたDNA)のいずれかを固相支持体に固定し易くすることができる。
本明細書で用いられる、“耐熱性ポリメラーゼ”および“耐熱性酵素”は、熱に対して安定で、4時間またはそれ以上の超高温の熱に対して耐性を示し、さらに適切な態様のヌクレオチドの組み合わせを触媒して、鋳型の核酸鎖と相補的なプライマー伸長生成物を形成する酵素を指す。一般に、プライマー伸長生成物の合成は、プライマーの3’末端で開始し、合成が終了するまで鋳型鎖に沿って5’方向に進行する。
【0034】
本発明の耐熱性酵素は、米国特許第4,965,188号(この文献は引用により本明細書に含まれる)に記載されたように、ポリメラーゼ連鎖反応またはPCRとして知られている増幅反応で効率的に使用するための要件を満たしている。本発明の酵素は、二本鎖核酸を変性させる(PCR反応の重要な工程)ために必要な時間高温に付したときに不可逆的に変性しない(不活化されない)。本明細書でいう不可逆的変性は永久的および完全な酵素活性の消失を指す。核酸の変性に必要な加熱条件は、例えば緩衝液の塩濃度並びに変性させる核酸の組成および長さに左右されるが、典型的には約90℃から約105℃で、時間は主に温度と核酸の長さに依存し、典型的には数秒から4分までである。
【0035】
より高い温度が、緩衝液の塩濃度および/または核酸のGC組成が増加するにつれ要求されるであろう。本発明の酵素は、4時間またはそれ以上の間約95℃から113℃の温度に暴露することで不可逆的に変性することはない。本発明のDNAポリメラーゼ酵素の超耐熱性は、以前に性状を調べた耐熱性酵素よりもさらに新たな利点を提供する。本発明の前には、113℃の変性温度での有効なPCRは示されなかった。前記を目的とする耐熱性DNAポリメラーゼは報告されたことがない。しかしながら、標的核酸のG/C含有量が増すにつれ、二重鎖を変性させるために必要な温度もまた増加する。95℃を越える変性工程を必要とする標的配列の場合、これまでのプロトコルでは二重鎖を部分的に不安定にさせる溶媒がPCRに取り入れれ、有効な変性温度を低下させる。
【0036】
例えばグリセロール、DMSOまたはホルムアミドのような薬剤がPCRにおいて前記の態様で用いられてきた[Korge et al., 1992, Proc. Natl. Acad. Sci. USA, 89:910−914; Wong et al., 1991, Nuc. Acids Res. 19:2251−2259(前記文献は引用により本明細書に含まれる)]。しかしながら、これらの薬剤は、二重鎖DNAの脱安定化の他にも、プライマーの安定性に影響を与え、酵素活性を抑制し、さらに種々の濃度のDMSOまたはホルムアミドは好熱性DNAポリメラーゼの熱抵抗性(すなわち半減期)を低下させる。したがって、前記の補助溶媒を利用するときは、極めて多くの最適化実験および反応条件を検討する必要がある。対照的に、本発明のDNAポリメラーゼを用いる場合は、単純に100℃から113℃に変性温度を上昇させ、それ以外は標準的なPCRによってPCR生成物の完全な鎖の分離が促進され、DNAらせんの脱安定化薬剤の必要性が排除できる。
本明細書で開示する超好熱ポリメラーゼは100℃を超える温度で、さらに113℃でさえも他の既知のポリメラーゼで予想される標的DNAの完全性を犠牲にすることなく安定である[Ekert and Kunkel, 1992, ”PCR: A Practical Approach,” eds. McPherson, Quirke and Taylor, Oxford University Press, pages 225−244(前記文献は引用により本明細書に含まれる)]。
【0037】
本明細書で用いられる、“リコンビナント”という用語は、該当核酸が天然の環境では隣接していない“骨格”核酸と隣接していることを意味する。さらにまた、該当核酸が“濃縮された”というためには、核酸骨格分子集団中の核酸挿入物の数が5%またはそれ以上であろう。本発明の骨格分子には、核酸、例えば発現ベクター、自己複製核酸、ウイルス、組み込み用核酸、および他のベクターまたは問題の核酸挿入物の維持もしくは操作に用いられる核酸が含まれる。典型的には、前記濃縮された核酸とは、リコンビナント骨格分子の集団中における核酸挿入物の数が15%またはそれ以上を表す。より典型的には、前記濃縮された核酸は、リコンビナント骨格分子の集団中における核酸挿入物の数が50%またはそれ以上である。ある実施態様では、前記濃縮された核酸は、リコンビナント骨格分子の集団中における核酸挿入物の数が90%またはそれ以上である。
【0038】
本明細書において、“リコンビナント”ポリペプチドまたはタンパク質とは、リコンビナントDNA技術によって生成された、すなわち所望のポリペプチドまたはタンパク質をコードする外因性DNA構築物によって形質転換された細胞から産生されたポリペプチドまたはタンパク質を指す。“合成”ポリペプチドまたはタンパク質は化学合成によって製造されたものである。固相ペプチド化学合成もまた本発明のポリペプチドまたはフラグメントの合成に用いることができる。前記の方法は、1960年代の初めから当技術分野では公知で(R.B. Merrifield, 1963, J. Am. Chem. Soc., 85:2149−2154; J.M. Stewart and J.D. Young, Solid Phase Peptide Synthesis, 2nd ed., Pierce Chemical Co., Rockford, Ill., pp. 11−12)、さらに最近は市販の実験室用ペプチドデザインおよび合成キットで利用されている(Cambridge Research Biochemicals)。前記の市販の実験室用キットは一般的に文献(H.M. Geysen et al., 1984, Proc. Natl. Acad. Sci., USA, 81:3998)に報告された考えを利用し、その全てが一枚のプレーとに連結された多数の“ロッド”または“ピン”の先端でタンパク質を合成する。前記の系を利用するときは、ロッドまたはピンを含むプレートを逆さまにし、対応するウェルまたは液溜めをもつ第二のプレートに挿入する(前記ウェルまたは液溜めは適切なアミノ酸をピンまたはロッドの先端に付着または定着させるための溶液を含む)。前記の反応工程を繰り返すことによって(すなわち裏返し、さらに適切な溶液にロッドおよびピンの先端を挿入することによって)、アミノ酸が所望のペプチドを構築する。さらに、多数のFMOCペプチド合成系も利用できる。例えば、ポリペプチドまたはフラグメントの組み立ては、アプライドバイオシステム社(Applied Biosystems, Inc.)のモデル431A自動ペプチド合成装置を用いて固相支持体上で実施できる。前記の装置は、直接合成によって、または他の既知の技術によって結合させることができる一連のフラグメントの合成によって容易に本発明のペプチドを提供する。
【0039】
プロモーターで転写を開始させるRNAポリメラーゼによってコード配列がmRNAに転写されるときは、前記プロモーター配列は前記コード配列に“動作可能に連結”されているという。
“プラスミド”は小文字のpによって示され、大文字および/または数字がそれに先行するかおよび/またはその後に続く。本明細書の出発プラスミドは、市販されているか、非制限的な基準で公的に入手可能であるか、または入手可能なプラスミドを基にして文献に報告された方法にしたがって構築できる。さらに、本明細書に記載したプラスミドと同等なプラスミドは当技術分野で公知であり、当業者には明白であろう。
【0040】
DNAの“消化”とは、DNAの一定の配列でのみ作用する制限酵素によるDNAの触媒的切断を指す。本明細書で用いられる種々の制限酵素は市販されており、それらの反応条件、補助因子および他の要件は当業者に公知のものを用いた。分析を目的とする場合は、典型的には1μgのプラスミドまたはDNAフラグメントを約2単位の酵素とともに約20μLの緩衝液中で用いる。プラスミド構築のためにDNAを単離する場合は、典型的には5から50μgのDNAを20から50単位の酵素でより大容積中で消化する。具体的な制限酵素に対する適切な緩衝液および基質の量は製造元によって特定される。37℃で約1時間のインキュベーションが常套的に用いられているが、供給元の指示にしたがって変動させることができる。消化後に、ゲル電気泳動を実施して所望のフラグメントを単離することができる。
【0041】
“オリゴヌクレオチド”は、一本鎖ポリデオキシヌクレオチドまたは2本の相補的なポリデオキシヌクレオチド鎖のいずれをも意味し、前記ポリデオキシヌクレオチドは化学的に合成できる。そのような合成オリゴヌクレオチドは5’リン酸をもたず、したがってキナーゼ存在下でATPを用いてホスフェートを付加しなければまた別のオリゴヌクレオチドに連結できない。合成オリゴヌクレオチドは脱リン酸されていないフラグメントに連結される。
2つの核酸またはポリペプチドについていう場合、“実質的に同一”という語句は、最大の一致を得るように比較およびアラインメントを施して、公知の配列比較アルゴリズムを用いるか、または目で精査して測定したとき、少なくとも50%、60%、70%、80%、さらにいくつかの特徴では90−95%のヌクレオチドまたはアミノ酸残基の同一性を有する2つまたは3つ以上の配列を指す。典型的には、実質的な同一性は、少なくとも約100残基の領域にわたって存在し、もっとも一般的には配列は少なくとも約150−200残基にわたって実質的に同一である。いくつかの実施態様では、コード領域の全長にわたって実質的に同一である。
【0042】
さらに、“実質的に同一な”アミノ酸配列とは、1つまたは2つ以上の保存的または非保存的アミノ酸置換、欠失または挿入によりリファレンス配列と異なる配列であり、特にそのような置換が前記分子の活性部位ではない部位に生じ、前記ポリペプチドが本質的にその機能を保持していることを条件とする。保存的アミノ酸置換は、例えば、1つのアミノ酸と同じ種類の別のアミノ酸との置換である[例えば1つの疎水性アミノ酸(例えばイソロイシン、バリン、ロイシンまたはメチオニン)で別の疎水性アミノ酸を置換するか、または1つの極性アミノ酸を別の極性アミノ酸で置換する(例えばアルギニンでリジンを、グルタミン酸でアスパラギン酸を、またはグルタミンでアスパラギンを置換)]。1つまたは2つ以上のアミノ酸を、例えばポリメラーゼポリペプチドから欠失させ、その生物学的活性を顕著に変化させることなく前記ポリペプチドの構造を改変することができる。例えば、ポリメラーゼの生物学的活性に要求されないアミノ末端またはカルボキシル末端のアミノ酸を除去することができる。
【0043】
本発明のポリメラーゼポリペプチド配列(上記のように改変したものを含む)は、多くの任意の方法(DNAの重合化(例えば重合速度および読み取りの正確さ)を含む)によってポリメラーゼの生物学的活性についてアッセイすることができる。例えば、本発明のポリメラーゼの読み取りの正確さについてのアッセイには、本発明のポリメラーゼによって重合させたDNAの配列を既知の配列と正確さについて比較することなどが含まれる。
本発明に含まれるポリメラーゼポリペプチドは、図1Bに示したポリメラーゼ(配列番号:2)のアミノ酸配列を有するか、または配列番号:2、4、6、8、10、12、14、16と50%の相同性を有するアミノ酸配列を有し、前記ポリメラーゼは超高温、例えば約90℃から113℃、約95℃から113℃、約100℃から107℃、または100℃から105℃でポリメラーゼ活性を保持することができる。好ましくは、前記ポリメラーゼは、前記のような温度で1時間またはそれ以上、2時間またはそれ以上、好ましくは4時間またはそれ以上活性を有する。図11は、配列番号:16の85℃、90℃および95℃で4時間の間の耐熱性を示すグラフである。
【0044】
本明細書で用いられる “フラグメント”とは、少なくとも2つの異なるコンフォーメーションで存在することができる天然に存在するタンパク質の部分である。フラグメントは、天然に存在するタンパク質と同じまたは実質的に同じアミノ酸配列を有することができる。“実質的に同じ”とは、アミノ酸配列の大部分(全部ではなく)が同じであり、前記配列が関連を有する配列の少なくとも1つの機能的活性を保持することを意味する。一般には、2つのアミノ酸配列が少なくとも約85%同一である場合は、それらは“実質的に同じ”または“実質的に相同”である。異なる三次元構造を有する天然に存在するフラグメントもまた含まれる。前記の例は“プロ−フォーム”分子、例えば切断によって改変され極めて高い活性をもつ成熟ポリメラーゼを生成する低活性プロタンパク質である。
【0045】
“ハイブリダイゼーション”とは、核酸の鎖が塩基対形成により相補鎖と結合する過程を指す。ハイブリダイゼーション反応は鋭敏でさらに選択性を有し、したがって対象の個々の配列を、前記配列が低濃度で存在するサンプル中においてさえも同定することができる。適切にストリンジェントな条件は、例えば、予備ハイブリダイゼーション溶液およびハイブリダイゼーション溶液中の塩またはホルムアルデヒドの濃度によって、またはハイブリダイゼーションの温度によって規定することができ、前記は当技術分野で周知である。特に、ストリンジェンシーは塩濃度を減少させるか、ホルムアルデヒドの濃度を高めるか、またはハイブリダイゼーションの温度を上昇させることによって高めることができる。
【0046】
例えば、高ストリンジェンシー条件下でのハイブリダイゼーションは、約50%のホルムアルデヒドで約37℃から42℃で生じるであろう。ハイブリダイゼーションは、低ストリンジェンシー条件下、約35%から25%のホルムアミドで約30℃から35℃で生じ得るであろう。特に高ストリンジェンシー条件下でのハイブリダイゼーションは42℃で、50%のホルムアミド、5×SSPE、0.3%のSDS、および200ng/mLのせん断変性サケ精子DNA中で起こり得る。低ストリンジェンシー条件下でのハイブリダイゼーションは上記のような条件で、ただし35%ホルムアミド中で35℃の低い温度で起こり得る。特定のレベルのストリンジェンシーに対応する温度範囲は、問題の核酸のプリン対ピリミジン比を計算し、さらにそれにしたがって温度を調整することによってさらに狭めることができる。上記範囲および条件に関する変動はこの技術分野で良く知られたものである。
【0047】
“変種”という用語は、1つまたは2つ以上の(それぞれ)塩基対、コドン、イントロン、エクソンまたはアミノ酸残基において改変され、なお本発明のポリメラーゼ活性を保持する本発明のポリヌクレオチドまたはポリペプチドを指す。変種は例えば以下を含む多数の任意の手段によって製造できる:変異性PCR(error−prone PCR)、シャフリング(入れ換え、shuffling)、オリゴヌクレオチド特異的突然変異導入、アッセンブリーPCR、有性PCR突然変異導入、in vivo突然変異導入、カセット突然変異導入、循環アンサンブル(recursive ensemble)突然変異導入、指数的アンサンブル突然変異導入、部位特異的突然変異導入、連結再アッセンブリー、GSSMおよび前記の任意の組み合わせ。
【0048】
本明細書で用いられる“鋳型”という用語は、増幅、合成または配列決定されるべき二本鎖または一本鎖のDNA分子を指す。二本鎖DNA分子の場合は、これら分子の増幅、合成または配列決定の前に、その鎖を変性させて第一および第二の鎖を生成させる。プライマー(DNA鋳型の一部分と相補的である)を適切な条件下でハイブリダイズさせ、続いて本発明のDNAポリメラーゼが前記鋳型またはその一部分と相補的なDNA分子を合成することができる。本発明にしたがって新しく合成されたDNA分子は、最初のDNA鋳型と長さが等しいかまたは短い。新しく合成されるDNA分子の合成または伸長中のミスマッチの取り込みは、1つまたは多数の塩基対のミスマッチをもたらす。したがって、合成されたDNA分子はDNA鋳型と正確に相補的であるとは限らない。
【0049】
特に本発明のポリメラーゼは、よく知られたDNA配列決定、DNA標識、DNA増幅およびクローニング反応並びにcDNA合成反応で極めて有用である。特に本発明のポリメラーゼは、dNTPおよびddNTPを区別せず、したがってDNA配列決定、DNA標識、並びにDNA増幅反応およびcDNA合成に極めて有用である。周知のように、配列決定反応(等温DNAシークェンシング法およびDNAサイクルシークェンシング法)はDNAポリメラーゼの使用を必要とする。ジデオキシ仲介配列決定は、DNAポリメラーゼによる伸長のための特別なポリマー、塩基特異的連鎖ターミネーターを使用する鎖停止技術、およびポリアクリルアミドゲルの使用を含む。ポリアクリルアミドゲルの使用によって、新しく合成された鎖停止DNA分子をサイズによって分離し、その結果、最初のDNA分子のヌクレオチド配列の少なくとも一部分を決定することができる。特に、DNA分子は、各々が異なる塩基特異的ターミネーターを含む4種の別個のDNA配列反応を用いて配列決定される。例えば、第一の反応はG−特異的ターミネーターを含み、第二の反応はT−特異的ターミネーターを含み、第三の反応はA−特異的ターミネーターを含み、第四の反応はC−特異的ターミネーターを含むことができる。好ましいターミネーターヌクレオチドにはジデオキシリボヌクレオシド三燐酸(ddNTP)、例えばddATP、ddTTP、ddGTP、ddITPおよびddCTPが含まれる。ジデオキシリボヌクレオシド三燐酸の類似体もまた使用することができ、当技術分野では周知である。
【0050】
DNA分子の配列を決定するとき、ddNTPはデオキシリボース塩基の3’位にヒドロキシル残基を欠き、したがって、伸長DNA鎖にDNAポリメラーゼによって取り込まれるが、その3’−ヒドロキシ残基が欠如しているために次のホスホジエステル結合の生成が妨げられてDNA分子の伸長が停止する。したがって、配列決定反応混合物に1つのddNTPが少量含まれるとき、配列を決定されるべきDNA鋳型よりも短い合成されたDNA分子集団が生じる。4種の異なるddNTPを4つの別個の酵素反応で用いることによって、合成DNA集団をサイズにより分離して、最初のDNA分子のヌクレオチド配列の少なくとも一部分を決定できる。ジデオキシヌクレオチドによるDNAの配列決定は周知であり、文献に記載されている(Sambrook et al., ”Molecular Cloning, a Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989))。容易に理解されるとおり、本発明のポリメラーゼは前記の配列決定反応で用いることができる。
【0051】
周知のように、典型的には検出できるように標識したヌクレオチドが配列決定反応に含まれる。多数の標識ヌクレオチドを配列決定(または標識)反応で用いることができる。前記標識ヌクレオチドには、放射性同位元素、蛍光標識、化学発光標識、生物発光標識および酵素標識が含まれるが、ただしこれらに限定されない。本発明の野生型および変異型DNAポリメラーゼは、配列決定(または標識)反応時にαSヌクレオチドの取り込みのために有用であることが判明した。例えば、[α35S]dATP(配列決定反応で一般的に用いられる検出可能標識ヌクレオチド)は、Taq DNAポリメラーゼよりも効率的に本発明のDNAポリメラーゼにより取り込まれる。したがって、本発明の酵素は、[α35S]dNTPを用いるDNA分子の配列決定または標識に特に適している。
【0052】
周知のDNA増幅技術であるポリメラーゼ連鎖反応(PCR)は、DNAポリメラーゼとデオキシリボヌクレオシド三燐酸を用いて標的DNA鋳型を増幅させる工程である。前記のPCR反応では、2つのプライマー(1つは増幅されるべきDNA分子の第一の鎖の3’末端(または3’末端近傍)と相補的であり、第二のプライマーは増幅されるべきDNA分子の第二の鎖の3’末端(または3’末端近傍)と相補的である)を、その対応するDNA鎖とハイブリダイズさせる。ハイブリダイゼーションの後、デオキシリボヌクレオシド三燐酸の存在下で、DNAポリメラーゼは、増幅されるべきDNA分子の第一の鎖と相補的な第三のDNA分子および第二の鎖と相補的な第四のDNA分子を合成させる。前記の合成によって、2つの二本鎖DNA分子がもたらされる。続いて、DNAポリメラーゼ、プライマーおよびデオキシリボヌクレオシド三燐酸を提供することによって、前記の二本鎖DNA分子をさらに新たなDNA分子の合成のための鋳型として用いることができる。周知のように、前記のさらに新たな合成は、(過剰なプライマーおよびデオキシリボヌクレオシド三燐酸を用いて)最初の反応を“サイクル”させて、何回もの変性と合成工程を可能にすることによって実施される。典型的には、二本鎖DNA分子の変性による一本鎖DNA鋳型の生成は高温によって達成される。本発明の野生型および変種DNAポリメラーゼは熱に安定なDNAポリメラーゼで、したがってDNA増幅反応時の前記温度サイクルに耐えるであろう。したがって、本発明の野生型および変種DNAポリメラーゼは、PCR反応、特に増幅時に高温を用いてDNA分子を変性させるPCR反応に理想的である。
【0053】
本発明のDNAポリメラーゼおよび変異体はまた、mRNA鋳型からcDNAを調製するためにも用いることができる。例えば米国特許第5,405,776号および第5,244,797号を参照されたい(前記文献は引用により本明細書に含まれる)。したがって、本発明はまたmRNAからcDNAを調製する方法に関し、前記方法は以下の(a)および(b)の工程を含む:(a)mRNAをオリゴ(dT)プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成し;さらに(b)工程(a)で生成されたハイブリッドを本発明のDNAポリメラーゼまたはその変種および4種のdNTPと接触させ、それによってcDNA−RNAハイブリッドを得る。
【0054】
前記反応混合物が、工程(b)で生成されるcDNAと相補的である適切なオリゴヌクレオチドをさらに含む場合は、第一の鎖の合成の後でdsDNAを得ることもまた可能である。したがって本発明はまた、本発明のDNAポリメラーゼまたはその変種を用いてdsDNAを調製する方法を目的とする。
酵素は高度に選択的な触媒である。それらの特徴は、優れた立体的選択性、部位選択性(regio)および化学的選択性を有する反応の触媒能力で、それらは通常の化学的合成とは比較にならない。さらにまた、酵素は極めて高い融通性を有する。それらは種々に手を加えることによって、有機溶媒中で機能し、さらに極端なpH(例えば高pHおよび低pH)、極端な温度(例えば高温および低温)、極端な塩分レベル(例えば高い塩分および低い塩分)で働き、それらの天然の生理学的な基質とは構造的に無関係の化合物との反応を触媒する。
【0055】
酵素は広範囲の天然および非天然基質に対して反応性を有し、したがって実質的に任意の有機主要化合物の改変を可能にする。さらにまた、通常の化学触媒と異なり、酵素は高い鏡像選択性および部位選択性を有する。酵素によって示される官能基の高度の特異性は、新規な活性化合物へと続く一連の合成反応で各反応の進路を追うことを可能にする。酵素はまた、それらの天然の生理学的機能とは無関係の多くの多様な反応を触媒することができる。例えば、ペルオキシダーゼは、過酸化水素によってフェノール酸化を触媒する。ペルオキシダーゼはまた、前記酵素の天然の機能とは無関係のヒドロキシル化反応を触媒することができる。他の例は、ポリペプチドの分解を触媒するタンパク質である。有機溶液中では、いくつかのプロテアーゼは糖をアシル化することができるが、前記はこれらの酵素の天然の機能とは無関係の機能である。
【0056】
本発明は酵素の固有の触媒特性を利用する。化学物質の形質転換における生物触媒(すなわち精製または粗酵素、非生細胞または生細胞)の使用は、通常は、特定の出発化合物と反応する個々の生物触媒の同定を必要とするが、本発明では、多くの出発化合物に存在する官能基に特異的である選別した生物触媒および反応条件が使用される。
各生物触媒は1つの官能基(またはいくつかの関連する官能基)に特異的で、前記官能基を含む多くの出発化合物と反応することができる。
生物触媒による反応は1つの出発化合物から誘導体の集団を生成する。前記誘導体をさらにもう1回の生物触媒反応に付し、第二の誘導体化合物集団を生成することができる。生物触媒による誘導反応を繰り返すたびに最初の化合物に由来する何千もの変種を生成することができる。
【0057】
酵素は出発化合物の特異的な部位で反応し、分子の残りの部分には影響を与えない。これは慣習的な化学的方法では達成することが非常に難しい反応である。生物触媒のこの高度な特異性は、ライブラリー中のただ1個の活性化合物を同定する手段を提供する。ライブラリーは、それを生成するために用いられた生物触媒による一連の反応、いわゆる“生合成歴”によって特徴が表される。生物学的活性についてライブラリーをスクリーニングし、その生合成歴を追跡することによって、前記活性化合物を生成する特定の反応を見つけ出すことができる。前記一連の反応を繰り返し、合成された化合物の構造を決定する。このような同定方法は、他の合成およびアプローチ方法と異なり固定技術を必要とせず、実質的に任意のタイプのスクリーニングアッセイを用いて、化合物を溶液中で遊離の状態で合成および検査することができる。官能基に対する酵素反応の高度な特異性が、生物触媒により生成されるライブラリーを完成させた特異的な酵素反応の追跡を可能にすることを特記することは重要である。
【0058】
1日当たり何千もの生物触媒反応およびスクリーニングアッセイを高レベルの正確さと再現性を担保しつつ実施することを可能にするロボットによる自動化を用いて、多数の工程が実施される。結果として、従来の化学的な方法を用いれば何年も要する誘導化合物ライブラリーが数週間程度で生成できる。[分子(小分子を含む)の改変についての更なる説明のためにはPCT/US94/09174を参照されたい(前記文献は引用により本明細書に含まれる)]。
ある特徴では、本発明は、合成遺伝子再アッセンブリーと称される非確率的方法を提供する。前記方法は、いくぶん確率的シャッフリングと関連するが、ただし核酸構築ブロックはランダムにシャッフリング、連結またはキメラ化されることはなく、むしろ非確率的に組み立てられる。
【0059】
合成遺伝子再アッセンブリー法は、シャッフリングすべきポリヌクレオチド間に高レベルの相同性が存在することを必要としない。本発明を用いて、10100を越える種々のキメラで構成された子孫分子ライブラリー(またはセット)を非確率的に生成することができる。おそらく、合成遺伝子再アッセンブリーは、101000をも越える種々の子孫キメラで構成されるライブラリーの生成に用いることができる。
したがってある特徴では、本発明は、意図的に選択された全体の組み立て順序を有する完成キメラ核酸分子のセットを生成する、以下の工程を含む非確率的方法を提供する:利用可能な相互に適合する連結可能末端を有する、複数の特定の核酸構築ブロックを計画的に生成し、さらに意図した全体の組み立て順序を達成できるように前記核酸構築ブロックを組み立てる。
【0060】
組み立てられるべき核酸構築ブロックの相互に適合する連結可能な末端は、それらが構築ブロックを予め定めた順序で結合させることを可能にする場合は、このタイプの順序付けられた組み立てに“利用可能”であると考えられる。したがって、ある特徴では、核酸構築ブロックが結合される全体の組み立て順序は連結可能な末端のデザインによって指定することができ、さらに、2つ以上の組み立て工程が用いられる場合は、核酸構築ブロックが結合される全体の組み立て順序もまた前記組み立て工程の連続する順序によって指定される。本発明のある実施態様では、アニールされる構築片は酵素、例えばリガーゼ(例えばT4 DNAリガーゼ)で処理され、前記構築片の共有結合が達成される。
【0061】
別の実施態様では、核酸構築ブロックのデザインは、完成されたキメラ核酸分子の子孫セットを生成するための基礎として機能する原型(progenitor)核酸鋳型セットの配列分析を基にして得られる。これらの原型核酸鋳型は、したがって、突然変異を誘発されるべき、すなわちキメラ化または入れ換え(シャフリング)を実施されるべき核酸構築ブロックのデザインに役立つ配列情報の供給源として機能する。
ある実施態様では、本発明は、関連遺伝子類のキメラ化およびそれらによってコードされる関連ポリメラーゼ類を提供する。本発明のポリメラーゼは本明細書に記載した方法にしたがって突然変異を導入することができる。
【0062】
したがって、本発明の特徴の1つにしたがえば、1つまたは2つ以上の境界設定ポイント(demarcation point)を選択するために、複数の原型核酸鋳型の配列(例えば配列番号:1、3、5、7、9、11、13、15)にアラインメントが施される(前記境界設定ポイントは相同性領域に位置することができる)。前記境界設定ポイントを用いて、生成されるべき核酸構築ブロックの境界を正確に示すことができる。したがって、前記原型分子で同定し選択した境界設定ポイントは、子孫分子の組み立てで潜在的なキメラ化ポイントとして機能する。
典型的には、有用な境界設定ポイントは、少なくとも2つの原型鋳型によって共有される相同性領域(少なくとも1つの相同なヌクレオチド塩基で構成される)であるが、前記境界設定ポイントは、少なくとも半分の原型鋳型、少なくとも2/3の原型鋳型、少なくとも3/4の原型鋳型、好ましくはほとんど全ての原型鋳型によって共有される相同性領域であってもよい。さらに好ましい有用な境界設定ポイントは、全原型鋳型によって共有される相同領域である。
【0063】
ある実施態様では、前記連結再アッセンブリー方法は、包括的ライブラリーを生成するために余すところなく実施される。換言すれば、全ての可能な順序をもつ核酸構築ブロックの組合わせが、完成されたキメラ核酸分子セット中に出現する。同時に、各々の組合わせにおける組み立ての順序(すなわち完成された各キメラ核酸の5’から3’方向の配列中の各構築ブロックの組み立ての順序)は、計画的(または非確率的)である。前記方法の非確率的な特性のために、望ましくない副生成物の可能性が大幅に減少する。
【0064】
別の実施態様では、本方法で提供されるのものは、例えば体系的に区画化したライブラリーを生成するために、(例えば1つずつ)体系的にスクリーニングすることができる区画による連結再アッセンブリー方法の体系的な実施である。換言すれば、本発明が提供するものは、特定の核酸構築ブロックの慎重な選択により、(アッセンブリー反応の連続工程の慎重な選択と組み合わせて)、いくつかの反応容器の各々に特定の子孫生成物セットが製造される実験デザインを達成できるということである。これによって、体系的な実験およびスクリーニング方法の実施が可能になる。したがって、本方法は、潜在的に非常に大量の子孫分子をより小さなグループで体系的に調べることを可能にする。
【0065】
高度に順応性を有し、しかも同時に包括的で体系的な態様で、(特に原型分子に低レベルの相同性しか存在しないときに)キメラ化を実施できるその能力のために、本発明は、多数の子孫分子で構成されたライブラリー(またはセット)の生成を提供する。本発明の連結再アッセンブリーの非確率的特性のために、生成される子孫分子は、好ましくは、意図的に選択された全体の組み立て順序を有する完成キメラ核酸分子のライブラリーを構成する。特別な実施態様では、前記生成ライブラリーは103から101000を超える種々の子孫分子種で構成される。
【0066】
ある特徴では、上記のようにして生成される完成キメラ核酸分子セットは、ポリペプチドをコードするポリヌクレオチドを含む。ある実施態様に従えば、前記ポリヌクレオチドは遺伝子であり、前記は人工遺伝子でもよい。
別の実施態様に従えば、前記ポリヌクレオチドは遺伝子経路であり、前記は人工の遺伝子経路でもよい。本発明にしたがえば、本発明によって生成された1つまたは2つ以上の人工遺伝子を人工の遺伝子経路(例えば真核生物(植物を含む)中で作働可能な経路)に取り込ませることができる。
【0067】
別の実施態様では、構築ブロックが生成される工程が合成的であるという性質によって、ヌクレオチド(例えば1つまたは2つ以上のヌクレオチド、前記は例えばコドンでもイントロンでもまたは調節配列でもよい)のデザインおよび導入が可能になる。前記ヌクレオチドは、後で場合によってin vitroプロセス(例えば突然変異誘発によって)またはin vivoプロセス(例えば宿主生物の遺伝子スプライシング能力によって)で除去することができる。多くの事例で、前記ヌクレオチドの導入はまた、有用な境界設定ポイントの創出という潜在的な利益以外に他の多くの理由から所望されることは理解されよう。
【0068】
したがって、別の実施態様では、本発明はイントロンに導入するために用いることができる核酸構築ブロックを提供する。本発明はしたがって、本発明の人工遺伝子への機能的イントロンの導入を提供する。本発明はまた、本発明の人工遺伝子経路への機能的イントロンの導入を提供する。したがって、本発明は、1つ(または2つ以上)の人工的に導入されたイントロンを含む人工遺伝子であるキメラポリヌクレオチドの生成を提供する。
したがって本発明はまた、1つ(または2つ以上)の人工的に導入されたイントロンを含む人工遺伝子経路であるキメラポリヌクレオチドの生成を提供する。好ましくは、前記人工的に導入されたイントロンは、天然に存在するイントロンが遺伝子スプライシングで機能的に作用する態様とほぼ同様に、1つまたは2つ以上の宿主細胞で遺伝子スプライシングのための機能を有する。本発明は、遺伝子組換えおよび/またはスプライシングのために宿主生物に導入される人工イントロンを含むポリヌクレオチドの製造方法を提供する。
【0069】
本発明を用いて製造された人工遺伝子はまた別の核酸との組換えのための基質として機能することができる。同様に、本発明を用いて製造された人工遺伝子経路はまた別の核酸との組換えのための基質として機能することができる。好ましい事例では、組換えは、人工イントロン含有遺伝子と組換えパートナーとして機能する核酸との間の相同領域によって促進され、また同領域で発生するであろう。特に好ましい事例では、前記組換えパートナーはまた本発明によって生成される核酸(人工遺伝子または人工遺伝子経路を含む)であってもよい。組換えは、1つ(または2つ以上)の人工的に導入された人工遺伝子内イントロンに存在する相同領域によって促進され、または同領域で発生するであろう。
【0070】
本発明の合成的連結再アッセンブリーの方法は複数の核酸構築ブロックを用い、前記ブロックの各々は好ましくは2つの連結可能末端を有する。各核酸構築ブロックの前記2つの連結可能末端は2つが平滑端(すなわち各々はオーバーハングヌクレオチドをもたない)であってもよいが、好ましくは1つが平滑端で1つがオーバーハングを有するか、またはより好ましくは2つの末端がオーバーハングを有する。
前記の目的のために利用可能なオーバーハングは3’オーバーハングまたは5’オーバーハングであろう。したがって、核酸構築ブロックは、3’オーバーハング、また別には5’オーバーハング、また別には2つの3’オーバーハング、また別には2つの5’オーバーハングを有することができる。前記核酸構築ブロックが組み立てられて完成したキメラ核酸分子を生成する全体的な順序は、意図的な実験デザインによって決定され、ランダムではない。
【0071】
好ましい実施態様の1つに従えば、核酸構築ブロックは、2つの一本鎖核酸(一本鎖オリゴとも称する)を化学合成し、さらにそれらをアニールさせるために接触させて二本鎖核酸構築ブロックを生成することによって作製される。
二本鎖核酸構築ブロックは種々のサイズを有することができる。これらの構築ブロックのサイズは小さくても大きくてもよい。構築ブロックの好ましいサイズは1塩基対(いずれのオーバーハングも含まない)から100000塩基対(いずれのオーバーハングも含まない)の範囲である。他の好ましいサイズ範囲も提供される。それらは、下限が1塩基対から10000bp(その間の整数値を全て含む)で、上限が2bpから100000bp(その間の整数値を全て含む)である。
二本鎖核酸構築ブロックを生成する本発明で有用な多くの方法が存在する。前記は当技術分野で公知であり、当業者は容易に実施することができる。
【0072】
ある実施態様に従えば、二本鎖核酸構築ブロックは、先ず2つの一本鎖核酸を生成し、それらをアニールさせて二本鎖核酸構築ブロックを形成することによって作製される。二本鎖核酸構築ブロックの2本の鎖は、オーバーハングを形成するヌクレオチド以外は全てのヌクレオチドが相補的で、したがってオーバーハングは別としてミスマッチを含まない。別の実施態様に従えば、二本鎖核酸構築ブロックの2本の鎖は、オーバーハングを形成するヌクレオチドはさておき、全ヌクレオチド未満のヌクレオチドにおいて相補的である。したがって、本実施態様に従えば、二本鎖核酸構築ブロックを用いてコドンの縮退を導入することができる。好ましくはコドンの縮退は、本明細書で述べる部位特異的突然変異導入により、1つまたは2つ以上のN、N、G/TまたはN、N、C/Tカセットを用いて、また別には1つまたは2つ以上のN、N、Nカセットを用いて導入される。
【0073】
本発明のin vivo遺伝子組換え方法は、未知のハイブリッドまたは特定のポリヌクレオチドもしくは配列の対立遺伝子プールについて非計画的に実施することができる。しかしながら、特定のポリヌクレオチドの実際のDNAまたはRNA配列を知る必要はない。
遺伝子の混合集団内の組換えを利用するアプローチは、任意の有用なタンパク質、例えばインターロイキン1、抗体、tPAおよび成長因子の生成に有用であろう。前記アプローチは、特異性または活性が変化したタンパク質の生成に用いることができる。前記アプローチはまた、ハイブリッド核酸配列、例えば遺伝子のプロモーター領域、イントロン、エクソン、エンハンサー配列、31非翻訳領域、または51非翻訳領域の生成にも有用であろう。したがって、前記アプローチを用いて、発現速度の速い遺伝子を生成することができる。前記アプローチはまた、反復DNA配列の研究でも有用であろう。最後に、本アプローチは、リボザイムまたはアプタマー(aptamer)を変異させるために有用であろう。
【0074】
ある特徴では、本発明は、高度に複雑な直鎖状配列(例えばDNA、RNAまたはタンパク質)の誘導分子進化を可能にする、減数再組合せ(reductive reassortment)、組換えおよび選別で構成されるサイクルを繰り返して用いることに関する。
分子のin vivoシャッフリングは変種の提供に有用で、マルチマーを組換える細胞の天然の特性を利用して実施することができる。In vivo組換えは分子の多様性への主要な天然の経路を提供してきたが、一方、遺伝子組換えは依然として比較的複雑なプロセスであり以下の工程を含む:1)相同性の認識;2)鎖の切断、鎖への侵入および組換え交差をもたらす代謝工程;および3)別個の組換え分子への交差の分解。交差の形成は相同性配列の認識を必要とする。
【0075】
別の実施態様では、本発明は、少なくとも第一のポリヌクレオチドおよび第二のポリヌクレオチドからハイブリッドポリヌクレオチドを生成する方法を含む。本発明を用い、部分的な配列相同性を有する少なくとも1つの領域を共有する少なくとも第一のポリヌクレオチドおよび第二のポリヌクレオチドを適切な宿主細胞に導入することによって、ハイブリッドポリヌクレオチドを生成することができる。部分的配列相同性を有する領域は、ハイブリッドポリヌクレオチドを生成する配列再構成を生じるプロセスを促進する。本明細書において、“ハイブリッドポリヌクレオチド”という用語は、本発明の方法で得られ、少なくとも2つの最初のポリヌクレオチド配列に由来する配列を含む任意のヌクレオチド配列である。ハイブリッドポリヌクレオチドは、DNA分子間の配列の組込みを促進する分子間組換え事象によりもたらされる。さらに、そのようなハイブリッドポリヌクレオチドは、DNA分子内のヌクレオチド配列を変化させるために繰返し配列を利用する分子内減数再組合せプロセスから得ることができる。
【0076】
本発明は、生物学的に活性なハイブリッドポリペプチド(例えばハイブリッドポリメラーゼ)をコードすることができるハイブリッドポリヌクレオチドを生成する手段を提供する。ある特徴では、もともとのポリヌクレオチドは生物学的に活性なポリペプチドをコードする。本発明の方法は、生成されたハイブリッドポリヌクレオチドが元の生物学的に活性なポリペプチドに由来する活性を示すポリペプチドをコードすることができるように、元のポリヌクレオチドの配列を組み込む細胞性プロセスを利用することによって、新規なハイブリッドポリペプチドを生成する。
【0077】
例えば、元のポリヌクレオチドは異なる微生物に由来する特定のポリメラーゼをコードしてもよい。1つの生物または変種に由来する第一のポリヌクレオチドによってコードされるポリメラーゼは、例えば特定の環境条件(例えば高い塩分)の下で効率的に機能するものであってもよい。異なる生物または変種に由来する第二のポリヌクレオチドによってコードされるポリメラーゼは、異なる環境(例えば超高温)で効率的に機能するものであってもよい。第一および第二の最初のポリヌクレオチドに由来する配列を含むハイブリッドポリヌクレオチドは、元のポリヌクレオチドによってコードされる両酵素の特徴を示す酵素をコードすることができる。したがって、ハイブリッドポリヌクレオチドによってコードされる酵素は、第一および第二のポリヌクレオチドによってコードされる酵素の各々によって共有される環境条件(例えば高塩分および超高温)で効率的に機能することができ、特に超高温、例えば約95℃から113℃の温度でポリメラーゼ活性を示すであろう。いくつかの改変ポリヌクレオチドは、150℃までの温度でポリメラーゼ活性を示すことができ、前記温度は現在のところ、生命形態が、DNAおよび他の必須の分子の完全性を維持する化学結合の分解を防ぐことができる理論的限界であろうと考えられる。
【0078】
本発明のポリヌクレオチドによってコードされる酵素にはヒドラーゼ、例えばポリメラーゼが含まれるが、ただしこれらに限定されない。本発明の方法によって得られるハイブリッドポリペプチドは、元の酵素が示さない特殊な酵素活性を示すことができる。例えば、ポリメラーゼ活性をコードするポリヌクレオチドの組換えおよび/または減数再組合せに続いて、ハイブリッドポリヌクレオチドによってコードされる生成ハイブリッドポリペプチドは、元の酵素の各々から得られた特殊化されたポリメラーゼ活性について、すなわち前記ポリメラーゼが3’−5’エクソヌクレアーゼ活性を有するか否か、前記ポリメラーゼのDNA伸長速度、野生型ポリメラーゼと比較して異なるpHでの%残留活性、およびポリメラーゼ活性の最適温度および上限温度についてスクリーニングすることができる。したがって例えば、ハイブリッドポリメラーゼを元のポリメラーゼから区別する化学的機能性、例えば、温度安定性の上限、上限温度での温度安定性の持続時間、またはハイブリッドポリペプチドが機能するpHまたは塩濃度を確認するために、前記ポリメラーゼをスクリーニングすることができる。スクリーニングすることができるさらに別の所望されるポリメラーゼの特徴には、長さが20kbより大きいか、または90%を越えるグアニジン−シトシン(GC)含有量を含む鋳型分子のPCRでのハイブリッドポリメラーゼの有用性が含まれる。
【0079】
元のポリヌクレオチドの供給源は、個々の生物(“単離株”)、限定培地(“富裕培地”)で増殖させた生物集合物、または未培養生物(“環境サンプル”)から単離できる。環境サンプルから新規な生物活性をコードするポリヌクレオチドを誘導する培養非依存性アプローチを使用することがもっとも好ましい。なぜならば、前記のアプローチは、未開発の多様な生物資源にアクセスすることができるからである。
【0080】
“環境ライブラリー”は環境サンプルから生成され、適切な原核細胞宿主で増殖させることができるクローニングベクター内に保存された天然に存在する生物のゲノム集合である。クローン化DNAは先ず初めに環境サンプルから直接抽出されるので、前記ライブラリーは純粋な培養で増殖できる原核細胞の小部分に限定されない。さらに、原核細胞宿主で産生することができるポリメラーゼは、工業的製造のために容易にスケールアップすることができる。前記サンプルに存在する環境性DNAの標準化によって、最初のサンプルに存在する全種に由来するDNAのより均等な表現を可能にすることができるであろう。これによって、優勢な種と比較して数オーダー低く現れる可能性があるサンプルのマイナーな構成成分に由来する重要な遺伝子の発見効率が劇的に高められるであろう。
【0081】
例えば、1つまたは2つ以上の未培養微生物から生成された遺伝子ライブラリーが問題の活性についてスクリーニングされる。問題の生物活性分子をコードする潜在的経路は、遺伝子発現ライブラリーの形態で先ず初めに原核細胞で捕捉される。問題の活性をコードするポリヌクレオチドを前記ライブラリーから単離し、宿主細胞に導入する。新規な活性または活性の強化を示す潜在的に活性を有する生物分子を創出する組換えおよび/または減数再組合わせを促進する条件下で前記宿主細胞を増殖させる。
【0082】
配列番号:1、3、5、7、9、11、13、15を有する本発明のポリヌクレオチドが由来する微生物はピロロブス・フマリアである。さらに新たなポリヌクレオチドを原核微生物(例えば真正細菌および古細菌)および下等真核微生物(例えば真菌、いくつかの藻類および原虫)から調製することができる。ポリヌクレオチドは環境サンプルから単離できる。その場合、前記核酸は、生物を培養することなく回収することができ、または1つまたは2つ以上の培養生物から回収することができる。約90℃から約150℃までの範囲(例えば113℃まで)でポリメラーゼ活性を有するために、前記微生物は好ましくは、陸上の温泉または深海の熱噴出口で100℃を越える温度で機能する超好熱細菌である。超好熱細菌によって産生されるポリメラーゼは低い温度では酵素活性が失われるかもしれない。例えば、ピロロブス・フマリアは90℃以下の温度で増殖を停止する。
【0083】
上記で述べたように選別され単離されたポリヌクレオチドは適切な宿主に導入される。適切な宿主細胞は、組換えおよび/または減数再組合せを促進することができる任意の細胞である。選択したポリヌクレオチドは、適切な制御配列を含むベクターに好ましくは既に収納されてある。宿主細胞は高等真核細胞(例えば哺乳類細胞)、または下等真核細胞(例えば酵母細胞)であろう。または宿主細胞は、好ましくは原核細胞(例えば細菌細胞)であろう。構築物の前記宿主細胞への導入は、リン酸カルシウムトランスフェクション、DEAE−デキストラン仲介トランスフェクション、または電気穿孔(Davis et al.1986)によって実施できる。
適切な宿主の代表的な例として以下を挙げることができる:細菌細胞、例えば大腸菌、ストレプトミセス(Streptomyces)、ネズミチフス菌(Salmonella typhimurium);真菌細胞、例えば酵母;昆虫細胞、例えばショウジョウバエ(Drosophila)S2およびスポディプテラ(Spodiptera)Sf9;動物細胞、例えばCHO、COSまたはボウズ(Bowes)メラノーマ;アデノウイルス;および植物細胞。適切な宿主の選択は、本明細書の記載にしたがって当業者が選択できると考えられる。
【0084】
組換えタンパク質の発現に用いることができる種々の哺乳類細胞培養系を特に示せば、哺乳類発現系の例には、サル腎臓線維芽細胞のCOS−7株(以下の文献に記載されている:Gluzman, 1981,”SV40−transformed simian cell support the replication of early SV40 mutants”)、および適合するベクターを発現させることができる他の細胞株、例えばC127、3T3、CHO、HeLaおよびBHK細胞株が含まれる。哺乳類発現ベクターは、複製起点、適切なプロモーターおよびエンハンサー、さらにまた必要ないずれかのリボソーム結合部位、ポリアデニル化部位、スプライスドナーおよびアクセプター部位、転写終了配列、並びに5’フランキング非転写配列を含むであろう。SV40スプライスに由来するDNA配列およびポリアデニル化部位を用いて、必要な非転写遺伝子エレメントを提供することができる。
【0085】
問題のポリヌクレオチドを含む宿主細胞を、プロモーターを活性化させるために適切に改変した通常の栄養培養液で培養し、形質転換体を選別し、さらに遺伝子を増幅させることができる。前記培養条件、例えば温度およびpHなどは、発現のために選択した宿主細胞に関して以前に用いられたものであり、当業者には明白であろう。70℃から約113℃までの範囲の温度で固有のポリメラーゼ活性を有することが認定されたクローンの配列を決定し、前記ポリメラーゼをコードするポリヌクレオチド配列を同定することができる。
【0086】
遺伝子クラスターDNAは種々の生物から単離し、さらにベクター、特に発現調節配列を含むベクターに連結することができる(前記発現調節配列は、前記連結遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレーの活性が生成されるのを制御および調節することができる)。外因性DNAの導入のために極めて大きな能力をもつベクターの使用は、特に前記遺伝子クラスターとともに用いる場合に特に適切で、本明細書では大腸菌のf−因子(稔性因子)を含む実施例として記載されている。前記大腸菌のf−因子は、接合中にそれ自体の高頻度移入に影響を与えるプラスミドで、大型のDNAフラグメント(例えば混合微生物サンプルの遺伝子クラスター)の安定な増殖のために理想的である。特に好ましい実施態様は、クローニングベクター(“フォスミド”または細菌性人工染色体(BAC)ベクターと称される)を使用することである。前記ベクターは、ゲノムDNAの大きなセグメントを安定に組み込むことができる大腸菌f−因子に由来する。混合非培養環境サンプルに由来するDNAとともに組み込まれたとき、前記は大きなゲノムフラグメントを“環境性DNAライブラリー”の形態で入手することを可能にする。
【0087】
本発明で使用されるまた別のタイプのベクターは、コスミドベクターである。コスミドベクターは、本来大きなゲノムDNAセグメントをクローニングし増殖させるためにデザインされたものである。コスミドベクターでのクローニングは下記文献に詳細に記載されている:”Molecular Cloning: A laboratory Manual”(Sambrook et al., 1989)。いったん適切なベクターに連結したら、種々のポリペプチド合成遺伝子クラスターを含む2つまたは3つ以上のベクターを適切な宿主細胞に導入することができる。遺伝子クラスターによって共有される部分的配列相同性領域は、ハイブリッド遺伝子クラスターを生じる配列再構成をもたらすプロセスを促進するであろう。続いて、前記の新規なハイブリッド遺伝子クラスターを、本来の遺伝子クラスターで見出されないポリメラーゼ活性について、または本来の遺伝子クラスターで見出されるものから変化したポリメラーゼ活性についてスクリーニングすることができる。
【0088】
したがってある実施態様では、本発明は、以下の工程によって生物学的に活性なハイブリッドポリペプチドを生成し、前記ポリペプチドを活性の強化についてスクリーニングする方法に関する:
1)動作可能なように連結された少なくとも第一のポリヌクレオチドおよび動作可能なように連結された第二のポリヌクレオチドを適切な宿主細胞に導入することであって、前記第一のポリヌクレオチドおよび前記第二のポリヌクレオチドは部分的な配列相同性を有する少なくとも1つの領域を共有しており;
2)配列認識を促進する条件下で前記宿主細胞を増殖させ、動作可能なように連結されたハイブリッドポリヌクレオチドを生成し;
3)前記ハイブリッドポリヌクレオチドによってコードされるハイブリッドポリペプチドを発現させ;
4)生物学的活性の強化の同定を容易にする条件下で前記ハイブリッドポリペプチドをスクリーニングし;
5)前記ハイブリッドポリペプチドをコードするポリヌクレオチドを単離する。
ポリメラーゼ活性についてスクリーニングする方法は当業者には公知で、本明細書を通して考察されている。そのような方法は、本発明のポリペプチドおよびポリヌクレオチドを単離した時に用いることができる。
【0089】
使用することができる発現ベクターの代表的な例として以下を挙げることができる:ウイルス粒子、バキュロウイルス、ファージ、プラスミド、ファージミド、コスミド、フォスミド、細菌人工染色体、ウイルスDNA(例えばワクシニア、アデノウイルス、鶏痘ウイルス、仮性狂犬病およびSV40誘導体)、P1系人工染色体、酵母人工染色体、および問題の固有の宿主(例えばバチルス、アスペルギルス、および酵母)に特異的な任意の他のベクター。したがって、例えば前記DNAはポリペプチドを発現させるために多様な発現ベクターのいずれかに含有させることができる。前記ベクターには、染色体配列、非染色体配列および合成DNA配列が含まれる。多数の適切なベクターが当業者には公知で、さらに市販されている。以下のベクターは例として提供される:細菌性:pQEベクター(Qiagen)、pBluescriptプラスミド、pNHベクター(λ−ZAPベクター(Stratagene));ptc99a、pKK223−3、pDR540、pRIT2T(Pharmacia);真核細胞性:pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。しかしながら、他のいずれのプラスミドまたは他のいずれのベクターもそれらが宿主細胞で複製可能で生存可能である限り用いることができる。低コピー数ベクターまたは高コピー数ベクターも本発明で用いることができる。
【0090】
発現ベクター内のDNA配列は、RNA合成を指令する適切な発現制御配列(プロモーター)に機能的に連結される。特に列挙すれば、細菌プロモーターには、lacI、lacZ、T3、T7、gpt、lambdaPR、PLおよびtrpが含まれる。真核細胞プロモーターには、CMV極初期、HSVチミジンキナーゼ、初期および後期SV40、レトロウイルス由来LTR、およびマウスのメタロチオネン−Iが含まれる。適切なベクターおよびプロモーターの選択は当業者に周知である。前記発現ベクターはまた、翻訳開始のためのリボソーム結合部位および転写ターミネーターを含む。前記ベクターはまた発現増幅のための適切な配列を含むことができる。プロモーター領域は、CAT(クロラムフェニコールトランスフェラーゼ)ベクターまたは選別可能マーカーを含む他のベクターを用いて任意の所望の遺伝子から選択できる。さらに、発現ベクターは好ましくは1つまたは2つ以上の選別可能マーカー遺伝子を含み、形質転換細胞の選別のための表現型特性、例えば真核細胞の場合はジヒドロフォレートレダクターゼまたはネオマイシン耐性、大腸菌のテトラサイクリンまたはアンピシリン耐性を提供する。
【0091】
in vivo再組合せは、包括的には“組換え”と称される“分子間”プロセスに依存し、細菌では一般に“RecA依存”現象とみなされる。本発明は、配列を組換えて再度組み合わせるために宿主細胞の組換えプロセスに依存するか、または細胞内の擬似反復配列のコンプレキシティーを欠失によって減少させる減数プロセスを仲介する細胞の能力に依存する。この“減数再組合せ”のプロセスは“分子間”RecA非依存プロセスによって生じる。
【0092】
したがって、本発明の別の実施態様では、新規なポリヌクレオチドは減数再組合せのプロセスによって生成できる。前記方法は、連続配列(最初のコード配列)を含む構築物の生成、それらの適切なベクターへの挿入、続いて適切な宿主細胞へのそれらの導入を必要とする。個々の分子の認定本体(identities)の再組合せは、相同性領域を有する構築物中の連続配列間または擬似反復ユニット間の結合プロセスによって生じる。前記再組合せプロセスは、反復配列のコンプレキシティーおよび程度の再組換えおよび/または減少をもたらし、さらに新規な分子種の生成をもたらす。種々の処置を適用して、再組合せ速度を高めることができる。前記処置には、紫外線またはDNA損傷化学物質による処置および/または“遺伝的不安定性”のレベルが強化された宿主細胞株の使用が含まれる。したがって、再組合せプロセスは相同性組換え、またはそれ自身の進化を誘導する擬似反復配列の天然の特性を必要とする。
【0093】
反復配列または“擬似反復”配列は遺伝的不安定性において役割を果たす。本発明では、“擬似リピート”はそれらの本来のユニット構造に限定されない反復物である。擬似反復ユニットは、構築物中の配列アレー、同様な配列の連続ユニットとして提示することができる。いったん連結されたら、連続配列間の結合部は本質的に見分けることができなくなり、生じた構築物の擬似反復特性は分子レベルではもはや連続的である。生成される構築物のコンプレキシティーを減少させるために細胞が行う前記欠失プロセスは擬似反復配列間で生じる。前記擬似反復ユニットは、すべり現象をもたらす鋳型の実用的な無限のレパートリーを提供する。したがって、擬似リピートを含む構築物は、実質的に擬似反復ユニット内の任意の場所に欠失(および潜在的には挿入)事象を生じる十分な分子の順応性を効果的に提供する。
【0094】
前記擬似反復配列が全て同じ向きに(例えばヘッド−テール結合またはその逆)連結されたとき、細胞は個々のユニットを識別することができない。結果として、減数プロセスが配列全体に発生し得る。対照的に、前記ユニットがヘッド−テール結合ではなくヘッド−ヘッド結合で存在するとき、前記倒置によって隣接ユニットの終末点が明確に示され、欠失形成は離散的ユニットの損失を促進するであろう。したがって、本発明の方法に関しては配列が同じ向きにあることが好ましい。擬似反復配列のランダムな方向性は再組合せ効率の低下をもたらすが、一定の方向性の配列はもっとも高い効率を提供するであろう。しかしながら、同じ向きの連続配列の数が少なければ前記効率は低下するが、一方、前記はなお新規な分子の効果的な回収について十分な順応性を提供することができる。構築物は同じ向きの擬似反復配列を用いて作製し、より高い効率を可能にすることができる。
【0095】
配列は、以下を含む任意の多様な方法を用いてヘッド−テール結合の向きで組み立てることができる:
a)ポリAヘッドおよびポリT尾部(一本鎖を作製するときは、前記によって方向性が提供される)を含むプライマーを利用することができる。これは、プライマーの最初の数塩基をRNAで生成することによって(したがってRNaseHによって容易に分解できる)達成できる。
b)固有の制限部位を含むプライマーを用いることができる。多数の部位、一連の固有配列および合成と連結の工程の繰返しが要求されよう。
c)プライマーの内部の数塩基をチオール化し、さらにエキソヌクレアーゼを用いて適切なテールを有する分子を生成することができよう。
【0096】
再組合せされた配列の回収は、RIが低いクローニングベクターの同定に依存する。前記の再組合せされたコード配列を続いて増幅によって回収する。生成物を再クローンニングし発現させる。RIが低いクローニングベクターの回収は以下によって実施できる:
1)構築物のコンプレキシティーが減少したときにのみ安定に維持されるベクターを使用する。
2)短縮ベクターの物理的方法による回収。この場合、クローニングベクターは標準的なプラスミド単離方法を用いて回収され、さらにアガロースゲルまたはカラムのいずれかで標準的な方法を利用して低分子量カットオフによりサイズで分画されるであろう。
3)挿入物サイズが減少したときに選別できる介在遺伝子を含むベクターを回収する。
4)発現ベクターおよび適切な選別を用いる直接選別技術を使用する。
【0097】
関連する生物由来のコード配列(例えば遺伝子)は高度な相同性を示し、多様なタンパク生成物をコードするであろう。前記のようなタイプの配列は、擬似反復配列として本発明で特に有用である。しかしながら、下記に例示した実施例ではほとんど同一のオリジナルコード配列(擬似反復配列)の再組合せを示したが、本プロセスはそのようなほぼ同一の反復配列に限定されない。
以下の実施例によって本発明の方法が立証される。3つの固有種に由来するコード核酸配列(擬似反復配列)について述べる。各配列は、別個の一組の特性を有するタンパク質をコードする。配列の各々は、その中の固有の位置に1つまたは数塩基対の相違を有する。前記擬似反復配列を別々に、または一緒に増幅し、さらに、全ての可能な並べ換えおよび組合せが連結分子集団で得られるようにランダムに連結して集合物にする。擬似反復配列ユニットの数はアッセンブリー条件によって制御することができる。構築物中の擬似反復ユニットの平均数は反復指標(RI)と定義される。
【0098】
いったん形成したら、前記構築物は文献に記載されたプロトコルに従ってサイズにより分画し(またはしなくてもよい)、適切な宿主細胞にトランスフェクトすることができる。続いて細胞を増殖させ、“減数再組み合わせ”を実施する。減数再組合せプロセスの速度は、所望の場合はDNA損傷の誘発によって促進することができる。RIの減少が、“分子内”メカニズムによる反復配列間の欠失形成によって仲介されるか、または“分子間”メカニズムによる組換え様事象によって仲介されるかは重要ではない。最終的に得られるものは、前記分子の再組合せによる可能な全ての組合せである。
【0099】
場合によって前記方法はさらに別の工程を含む。前記工程は、シャッフリング実施プールのライブラリー構成物をスクリーニングし、シャッフリングを実施したライブラリーで、予め定めた巨大分子(例えばタンパク質性レセプター、オリゴ糖、ヴァイロン(viron))または他の予め定めた化合物または構造と結合もしくは相互作用する能力、または前記との特定の増幅反応を触媒する能力を有する個々の構成物質を同定する。
前記ライブラリーから同定されたポリペプチドは、治療、診断、研究および関連する目的(例えば触媒、水溶液の浸透圧を増加させるための溶質など)のために用いることができ、および/または、もう1回または2回以上のさらに別のシャッフリングおよび/または選別サイクルに付すことができる。
【0100】
別の特徴では、組換えまたは再組合せの前またはその最中に、変異をオリジナルのポリヌクレオチドに導入しやすくする薬剤またはプロセスに本発明の方法によって生成されたポリヌクレオチドを付すことが考慮される。前記変異の導入は、生成されるハイブリッドポリヌクレオチドおよびそれらからコードされるポリペプチドの多様性を高めるであろう。突然変異導入を促進する薬剤またはプロセスには以下が含まれるが、ただしこれらに限定されない:(+)−CC−1065または合成類似体、例えば(+)−CC−1065−(N3−アデニン)(Sun and Hurley, 1992);DNA合成を抑制することができるN−アセチル化または脱アセチル化4’−フルオロ−4−アミノビフェニルアダクツ(例えば、van de Poll et al., 1992);またはDNA合成を抑制することができるN−アセチル化または脱アセチル化4−アミノビフェニルアダクツ(例えばまた以下を参照されたい:van de Poll et al., 1992, pp.751−758);3価クロム、3価クロム塩、DNA複製を抑制することができる多環式芳香族炭化水素(”PAH”)DNAアダクツ、例えば7−ブロモメチル−ベンゾ[a]アントラセン(“BMA”)、トリス(2,3−ジブロモプロピル)ホスフェート(“トリス−BP”)、1,2−ジブロモ−3−クロロプロパン(“DBCP”)、2−ブロモアクロレイン(2BA)、ベンゾ[a]ピレン−7,8−ジヒドロジオール−9−10−エポキシド(“BPDE”)、ハロゲン白金塩(II)、N−ヒドロキシ−2−アミノ−3−メチルイミダゾール[4,5−f]−キノリン(“N−ヒドロキシ−IQ”)、およびN−ヒドロキシ−2−アミノ−1−メチル−6−フェニルイミダゾール[4,5−f]ピリジン(“N−ヒドロキシ−PhIP”)。PCR増幅を遅くするかまたは停止させる特に好ましい手段は、UV光(+)−CC1065および(+)−CC−1065−(N3−アデニン)から成る。特に包含される手段は、DNAアダクツまたはポリヌクレオチドもしくはポリヌクレオチドプール由来のDNAアダクツを含むポリヌクレオチドであり、前記は、更なる処理の前にポリヌクレオチドを含む溶液の加熱を含むプロセスによって遊離または除去される。
【0101】
別の特徴では、本発明は、野生型タンパク質をコードする二本鎖鋳型ポリヌクレオチドを含むサンプルを、ハイブリッドまたは再組合せポリヌクレオチドを提供する本発明の条件の下で処理することによって、生物学的活性を有するリコンビナントタンパク質を生成する方法を目的とする。
本発明はまた、点変異をポリヌクレオチドに導入して、全範囲の単一アミノ酸置換が各アミノ酸部位において出現する子孫ポリペプチドセットを生成するための専用コドンプライマー(縮退N,N,N配列を含む)の使用を提供する(遺伝子部位飽和突然変異導入(gene site saturated mutagenesis, GSSM))。使用されるオリゴは、連続的に第一の相同配列、縮退N,N,N配列および必ずというわけではないが好ましくは第二の相同配列を含む。N,N,N配列の縮退は20個のアミノ酸全てに対するコドンを含むので、下流の子孫ポリペプチドの翻訳生成物は、前記ポリペプチドに沿って各アミノ酸サイトで全ての可能なアミノ酸変更を含む。
【0102】
ある特徴では、前記のような縮退オリゴ(縮退N,N,Nカセットで構成される)の1つを用いて、親のポリヌクレオチド鋳型の各オリジナルコドンが完全なコドン置換に付される。別の特徴では、少なくとも2つの縮退N,N,Nカセット(同じオリゴまたは異なるオリゴ)を用いて、親のポリヌクレオチド鋳型の少なくとも2つのオリジナルコドンが完全なコドン置換に付される。したがって、2つ以上のN,N,N配列を1つのオリゴに含ませて、2つ以上の部位にアミノ酸変異を導入することができる。この複数のN,N,N配列は直接接していてもよいが、また1つまたは2つ以上の別のヌクレオチド配列によって分離されてあってもよい。別の特徴では、付加および欠失を導入するために有用なオリゴを、単独またはN,N,N配列を含むコドンと組み合わせて用いて、アミノ酸の付加、欠失および/または置換の任意の組合せまたは並べ換えを導入することができる。
【0103】
特別な実施態様では、連続的なN,N,Nトリプレット(すなわち縮退(N,N,N)n配列)を含むオリゴを用いて、2つまたは3つ以上のアミノ酸の位置を同時に変異させることができる。
また別の特徴では、本発明は、N,N,N配列よりも少ない縮退を有する縮退カセットの使用を提供する。例えば、いくつかの事例では、(例えばオリゴとして)ただ1種のN(この場合Nはトリプレットの一番目、二番目または三番目の位置にあるものであってよい)で構成された縮退トリプレット配列を用いることが望ましいであろう。他のいずれの塩基(その任意の組合せおよび並べ換えを含む)も前記トリプレットの残りの2つの位置で用いることができる。また別には、いくつかの事例では、縮退N,N,Nトリプレット配列、N,N,G/T、またはN,N,G/Cトリプレット配列を(オリゴとして)用いることが所望されるであろう。
【0104】
しかしながら、本発明で開示した縮退トリプレット(例えばN,N,G/TまたはN,N,G/Cトリプレット配列)の使用が、いくつかの理由から有利であることは理解されるところである。ある特徴では、本発明は、可能なアミノ酸(合計20個のアミノ酸について)をポリペプチド内の各々および全てのアミノ酸の位置で完全に、系統的にさらにかなり容易に置換させる手段を提供する。したがって、100個のアミノ酸のポリペプチドの場合、本発明は、系統的にさらにかなり容易に2000個の異なる種(すなわち各位置につき20個の可能なアミノ酸×100アミノ酸の位置)を生成する方法を提供する。縮退N,N,G/TまたはN,N,G/Cトリプレット配列を収納するオリゴの使用により、20個の可能なアミノ酸をコードする32個の別個の配列が提供されることは理解されよう。したがって、前記のような1つのオリゴを用いて親のポリヌクレオチド配列が飽和変異導入に付されている反応容器内には、20個の異なるポリペプチドをコードする32個の異なる子孫ポリヌクレオチドが存在する。対照的に、部位特異的突然変異導入で非縮退オリゴを使用することによって各反応容器につきただ1つの子孫ポリペプチド生成物が生じる。
【0105】
本発明はまた非縮退オリゴの使用を提供し、前記非縮退オリゴは、場合によって開示の縮退プライマーと組み合わせて用いられる。いくつかの状況では、非縮退オリゴを用いて、問題のポリヌクレオチドで特定の点変異を生成するのが有利であることは理解されよう。前記は、特定の非発現点変異、対応するアミノ酸の変化をもたらす点変異、並びに終止コドンの生成および対応するポリペプチドフラグメントの発現をもたらす点変異を創出する手段を提供する。
【0106】
したがって、本発明の好ましい実施態様では、各飽和突然変異導入反応容器は、親のポリヌクレオチドで突然変異を誘発したコドンの位置に対応する1つの固有のアミノ酸の位置に20個のアミノ酸全てが出現するように少なくとも20個の子孫ポリペプチド分子をコードするポリヌクレオチドを含む。各飽和突然変異導入反応容器から生成される32倍の縮退子孫ポリペプチドをクローン増幅(例えば発現ベクターを用いて大腸菌宿主でクローニングする)に付し、さらに発現スクリーニングに付すことができる。スクリーニングして好ましい特性変化を表示させることによって個々の子孫ポリペプチドを認定したとき、前記ポリペプチドの配列を決定し、その中に含まれている対応する個々の好ましいアミノ酸置換を同定することができる。
【0107】
本明細書に開示した飽和突然変異導入を用いて親のポリペプチドの各々および全てのアミノ酸の位置を変異させるときに、2つ以上のアミノ酸の位置で好ましいアミノ酸の変化を同定できることは理解されよう。これら好ましいアミノ酸置換の全てまたは一部分を含む1つまたは2つ以上の新規な子孫分子を生成することができる。例えば、2つの固有の好ましいアミノ酸の変化がポリペプチド内の3つのアミノ酸各位置に同定される場合、順列は各位置で3つの可能性(本来のアミノ酸から変化がないもの、および2つの好ましい変化のうちのそれぞれ1つ)を3つの位置で含む。したがって、可能性の合計は3×3×3または27で、これは以前に調べた7つ、すなわち6つの単一点変異(すなわち3つの位置の各々について2個)およびいずれの位置にも変化がないものを含む。
【0108】
さらに別の特徴では、部位飽和突然変異導入は、シャッフリング、キメラ化、組換えおよび他の突然変異導入プロセスとと共にスクリーニングと合わせて用いることができる。本発明は、任意の突然変異導入プロセス(飽和突然変異導入を含む)の反復態様における使用を提供する。ある実施態様では、任意の突然変異導入プロセスの反復使用がスクリーニングと組み合わせて用いられる。
したがって非制限的に例示すれば、本発明は、さらに別の突然変異導入プロセスと組み合わせた飽和突然変異導入の使用を提供する。前記別の突然変異導入プロセスは、例えば、2つまたは3つ以上の関連ポリヌクレオチドを適切な宿主細胞に導入し、ハイブリッドポリヌクレオチドを組換えおよび減数再組合せによって生成するものである。
【0109】
遺伝子の完全な配列に対して突然変異導入を実施する他に、本発明はポリヌクレオチド内の任意の数の塩基をそれぞれ置換することができる突然変異の使用を提供する。突然変異を誘発される前記塩基数は、好ましくは15から100000までの全ての整数である。したがって、分子の任意の位置に突然変異を誘発する代わりに、任意の数の塩基または一定の数の塩基(好ましくは総数15から100000のサブセット)を突然変異導入に付すことができる。好ましくは、ばらばらのヌクレオチドが、ポリヌクレオチド配列の各位置または数ヶ所の位置を含むグループの突然変異導入のために用いられる。突然変異導入を実施される3ヶ所の位置を含むグループはコドンであってもよい。変異は、好ましくは突然変異導入性プライマー(突然変異導入性カセットとも称される異種カセットを含む)を用いて導入される。好ましいカセットは1から500塩基を有することができる。前記異種カセットの各ヌクレオチドの配置は、N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/GまたはEで、ここでEは、A、C、GまたはTではない任意の塩基である(Eはデザイナーオリゴと称することもできる)。
【0110】
一般的な意味で、飽和突然変異導入は、突然変異導入を実施されるべき一定の範囲のポリヌクレオチド(突然変異導入されるべき前記配列は好ましくは長さが約15から100000塩基である)内の完全な一組の突然変異導入性カセット(各カセットは好ましくは1−500塩基の長さである)を突然変異導入することを含む。したがって、数変異(1から100個の範囲の変異)を含む1つのグループが、突然変異を誘発されるべき各カセットに導入される。1ラウンドの飽和突然変異導入適用中に、1つのカセットに導入されるべき変異の集合は、第二のカセットに導入されるべき第二の変異の集合と同じでも異なっていてもよい。前記集合は例示すれば欠失、付加、特定コドンの集合、および特定ヌクレオチドカセットの集合である。
【0111】
突然変異を誘発されるべき一定の範囲の配列は、完全な遺伝子、経路、cDNA、完全なオペロン読み枠(ORF)および完全なプロモーター、エンハンサー、リプレッサー/トランスアクチベーター、複製起点、イントロン、オペレーターまたは任意のポリヌクレオチド機能群を含む。一般的には、本目的のための“一定の範囲の配列”とは、15塩基のポリヌクレオチド配列、さらに長さが15塩基から15000塩基の間のポリヌクレオチド配列の任意のポリヌクレオチドであろう(本発明では特に前記の間の全ての整数が指定される)。コドンの集合の選択で考慮されるべきこと事柄には、縮退突然変異導入性カセットによってコードされるアミノ酸タイプが含まれる。
突然変異導入性カセットに導入できる変異の集合の特に好ましい実施例で、本発明は特に、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19および20個のアミノ酸を各位置でコードする縮退コドン置換(縮退オリゴを用いる)およびそれらによってコードされるポリペプチドライブラリーを提供する。
【0112】
本発明の特徴の1つは、1、3、5、7、9、11、13、15の配列、および前記配列と実質的に同一の配列、前記配列と相補的な配列の1つ、またはグループAの核酸配列の配列(または前記配列と相補的な配列)の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメントを含む単離核酸である。前記単離された核酸は、DNA(cDNA、ゲノムDNAおよび合成DNAを含む)を含む。前記DNAは二本鎖でも一本鎖でもよく、一本鎖の場合はコード鎖でも非コード鎖でもよい。また別には、前記単離核酸はRNAでもよい。
下記でさらに詳細に説明するように、配列番号:1、3、5、7、9、11、13、15および前記配列と実質的に同一の配列の1つの単離核酸を用いて、グループBのアミノ酸配列および前記配列と実質的に同一の配列を有するポリペプチドの1つ、または配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列の1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントを製造できる。
【0113】
したがって本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチド、または配列番号:2、4、6、8、10、12、14、16のポリペプチドの1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントをコードする単離核酸である。前記核酸のコード配列は、配列番号:1、3、5、7、9、11、13、15の核酸の1つのコード配列またはそのフラグメントの1つと同一であるか、または、遺伝暗号の重複もしくは縮退の結果として、縮退配列番号:2、4、6、8、10、12、14、16のポリペプチド、前記と実質的に同一の配列、および配列番号:2、4、6、8、10、12、14、16のポリペプチドの1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つをコードする異なるコード配列であろう。前記遺伝暗号は当業者には周知で、例えば以下の文献(B.Lewin, Genes VI, Oxford University Press, 1997)の214ページに記載されている(前記文献は引用により本明細書に含まれる)。
【0114】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドの1つをコードする単離核酸は、以下のもの(ただしこれらに限定されない)を含むことができる:配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の1つのコード配列のみ、およびさらに別のコード配列(例えばリーダー配列またはプロタンパク質配列)、および非コード配列(例えばイントロンまたはコード配列の5’および/または3’非コード配列)。したがって本明細書で用いられるように、“ポリペプチドをコードするポリヌクレオチド”という用語は、ポリペプチドのコード配列のみを含むポリヌクレオチドとともに、さらに別のコードおよび/または非コード配列も含むポリヌクレオチドを包含する。
【0115】
また別には、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の核酸配列に、通常の技術、例えば部位特異的突然変異、または当業者に周知の他の技術を用いて突然変異を誘発し、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列のポリヌクレオチドにサイレント変化を導入することができる。本明細書において、“サイレント変化”には、例えばポリヌクレオチドによってコードされるアミノ酸配列を変更しない変化が含まれる。前記変化は、前記ポリペプチドをコードするベクターを含む宿主細胞によって産生されるポリペプチドレベルを、宿主生物で頻繁に生じるコドンまたはコドン対を導入することによって高めるために所望されるであろう。
【0116】
本発明はまた、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチドにおいてアミノ酸置換、付加、欠失、融合および末端切断をもたらすヌクレオチド変化を有するポリヌクレオチドに関する。前記のヌクレオチド変化は、例えば部位特異的突然変異導入、化学物質によるランダムな突然変異導入、エキソヌクレアーゼIIIによる欠失、および他のDNA組換え技術を用いて導入することができる。あるいは、このようなヌクレオチド変化は天然に生じる対立遺伝子座変種であってもよく、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列(または前記と相補的な配列)の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むプローブと、本明細書で提供される高い、中等度または低いストリンジェンシー条件下で特異的にハイブリダイズする核酸を同定することによって単離される。
【0117】
配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、前記と相補的な配列、または配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列または前記と相補的な配列の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメントの単離核酸をまた用いて、生物学的サンプル(例えば土壌サンプル)が本発明の核酸配列を有する生物を含むか否か、または前記核酸が得られた生物を含むか否かを決定することができる。そのような方法では、前記核酸が単離された生物を含む可能性がある生物学的サンプルを入手し、そのサンプルから核酸を入手する。プローブがサンプル中に存在する一切の相補的な配列と特異的にハイブリダイズすることができる条件下で、そのプローブと核酸を接触させる。
【0118】
必要な場合には、相補的な配列とプローブが特異的にハイブリダイズすることができる条件は、相補的な配列を含むことが判明しているサンプルに由来する相補的な配列とともに前記相補的な配列を含まないコントロール配列を前記プローブと接触させることによって決定してもよい。ハイブリダイゼーションの条件、例えばハイブリダイゼーション緩衝液の塩濃度、ハイブリダイゼーション緩衝液のホルムアミドの濃度、またはハイブリダイゼーションの温度を変動させて、プローブを相補的核酸と特異的にハイブリダイズさせる条件を同定することができる。
【0119】
前記核酸が単離された生物を前記サンプルが含んでいる場合は、プローブの固有のハイブリダイゼーションが検出される。ハイブリダイゼーションは、プローブを検出可能な薬剤(例えば放射性同位元素、蛍光染料、または検出可能な生成物の生成を触媒することができる酵素)で標識することによって検出することができる。
サンプル中の相補的な核酸の存在を検出する標識プローブを使用する多くの方法は当業者には周知である。前記方法には、サザンブロット、ノザンブロット、コロニーハイブリダイゼーションおよびドットブロットが含まれる。これらの方法の各々に関するプロトコルは以下の文献に提供されている:Ausubel et al. ”Current Protocols in Molecular Biology,” John Wiley 503 Sons, Inc. 1997;およびSambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press, 1989(前記文献は引用により本明細書に含まれる)。
【0120】
あるいは、2つ以上のプローブ(そのうちの少なくとも1つは核酸サンプル中に存在する一切の相補的配列と特異的にハイブリダイズすることができる)を増幅反応で用いて、前記サンプルが本発明の核酸を含む生物(例えば前記核酸が単離された生物)を含むか否かを決定してもよい。典型的には前記プローブはオリゴヌクレオチドを含む。ある実施態様では、前記増幅反応はPCR反応を含むことができる。PCR反応は上掲書(AusubelおよびSambrook)に記載されている。また別には、前記増幅はリガーゼ連鎖反応、3SRまたは鎖置換反応を含むことができる(例えば以下の文献を参照されたい:F. Barany, ” The Ligase Chain Reaction in a PCR World”, PCR Methods and Applications 1:5−16,1991; E. Fahy et al., ”Self−sustained Sequence Replication(3SR): An Isothermal Transcription−based Amplification System Alternative to PCR”, PCR Methods and Applications 1:25−33,1991; G.T. Walker et al., ” Strand Displacement Amplification−an Isothermal in vitro DNA Amplification Technique”, Nucleic Acid Research 20:1691−1696,1992(前記文献は引用により本明細書に含まれる))。これらの方法では、サンプル中の核酸をプローブと接触し、増幅反応を実施し、さらに得られた増幅反応生成物を全て検出する。前記増幅生成物は、反応生成物を用いてゲル電気泳動を実施し、前記ゲルをインターカレーター(例えば臭化エチジウム)で染色して検出できる。また別には、1つまたは2つ以上のプローブを放射性同位元素で標識し、ゲル電気泳動後にオートラジオグラフィーによって放射性の増幅生成物の存在を検出してもよい。
【0121】
また配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の末端近くの配列に由来するプローブを染色体ウォーキング法で用いて、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の近傍に位置するゲノム配列を含むクローンを特定してもよい。前記の方法は、宿主生物からさらに別のタンパク質をコードする遺伝子の単離を可能にする。
配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、前記と相補的な配列、または配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列または前記と相補的な配列の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメントの単離核酸をプローブとして用いて、関連する核酸を同定または単離することができる。いくつかの実施態様では、関連する核酸は、前記核酸が単離された生物以外の生物のcDNAまたはゲノムDNAであろう。例えば、前記他の生物は関連を有する生物であろう。前記の方法では、プローブが関連する核酸と特異的にハイブリダイズできる条件下で核酸サンプルをプローブと接触させる。続いて、プローブと関連する生物由来の核酸とのハイブリダイゼーションを上記に述べた方法のいずれかを用いて検出する。
【0122】
核酸ハイブリダイゼーション反応では、特定のレベルのストリンジェンシーを達成するために用いられる条件は、ハイブリダイズされる核酸の性質によって変動するであろう。例えば、ハイブリダイズさせる核酸領域の長さ、相補性の程度、ヌクレオチド配列の組成(例えばGC対AT含有量)、および核酸のタイプ(例えばRNAかDNAか)は、ハイブリダイゼーション条件の選択で考慮されるであろう。さらに、核酸の1つが例えばフィルターに固定されているか否かが考慮されるであろう。
【0123】
ハイブリダイゼーションは、低ストリンジェンシー、中等度ストリンジェンシーまたは高ストリンジェンシー条件下で実施できる。核酸ハイブリダイゼーションの例を挙げれば、固定化した変性核酸を含むポリマーメンブレンを先ず30分、45℃で、0.9MのNaCl、50mMのNaH2PO4(pH7.0)、5.0mMのNa2EDTA、0.5%SDS、10×デンハルト溶液および0.5mg/mLのポリリボアデニル酸から成る溶液中で予備ハイブリダイズする。続いて前記溶液に、約2×107cpm(比活性4−9×108cpm/μg)の32P末端標識オリゴヌクレオチドを添加する。12−16時間のインキュベーションの後で、前記メンブレンを室温で0.5%のSDSを含む1×SET(150mLのNaCl、20mMのトリス塩酸(pH7.8)、1mMのNa2EDTA)で洗浄し、続いて新しい1×SETで30分、前記オリゴヌクレオチドプローブのTm−10℃で洗浄する。続いて前記のメンブレンをオートラジオグラフィーフィルムに曝露しハイブリダイゼーションシグナルを検出する。
【0124】
検出可能プローブとハイブリダイズする核酸(例えばcDNAまたはゲノムDNA)を検出するために用いるハイブリダイゼーション条件のストリンジェンシーを変動させることによって、前記プローブと種々のレベルの相同性を有する核酸を同定し、単離することができる。ストリンジェンシーは、プローブの溶融温度より低い種々の温度でハイブリダイゼーションを実施することによって変動させることができる。溶融温度Tmは、(特定のイオン強度およびpHで)標的配列の50%が完全に相補的なプローブとハイブリダイズする温度である。非常にストリンジェントな条件は、個々のプローブのTmと等しいかまたは約5℃低くなるように選択される。プローブの溶融温度は以下の式を用いて計算される:
長さが14から70ヌクレオチドのプローブについては、溶融温度(Tm)は次の式を用いて計算される:Tm=81.5+16.6(log[Na+])+0.41(G+Cの割合)−(600/N)、式中Nはプローブの長さである。
ハイブリダイゼーションがホルムアミドを含む溶液で実施される場合は、溶融温度は次の式を用いて計算できる:Tm=81.5+16.6(log[Na+])+0.41(G+Cの割合)−(0.63%ホルムアミド)−(600/N)、式中Nはプローブの長さである。
ハイブリダイゼーションは、6×SSC、5×デンハルト試薬、0.5%SDS、100μgの変性フラグメント化サケ精子DNA、または6×SSC、5×デンハルト試薬、0.5%SDS、100μgの変性フラグメント化サケ精子DNA、50%のホルムアミド中で実施できる。SSCおよびデンハルト試薬の処方は上掲書(Sambrook et al.)に記載されている。
【0125】
ハイブリダイゼーションは、上記に挙げた予備ハイブリダイゼーション溶液に検出可能なプローブを添加することによって実施できる。プローブが二本鎖DNAを含む場合は、ハイブリダイゼーション溶液に添加する前に前記プローブを変性させる。プローブと相補的な配列または相同な配列を含むcDNAまたはゲノムDNAとプローブをハイブリダイズさせるために十分な時間、前記フィルターをハイブリダイゼーション溶液と接触させる。長さが200ヌクレオチドを越えるプローブの場合は、ハイブリダイゼーションはTmより15−25℃低い温度で実施することができる。より短いプローブの場合(例えばオリゴヌクレオチドプローブ)、ハイブリダイゼーションはTmより5−10℃低い温度で実施できる。典型的には6×SSCでのハイブリダイゼーションの場合は、ハイブリダイゼーションは約68℃で実施される。通常、50%のホルムアミドを含む溶液中でのハイブリダイゼーションの場合は、ハイブリダイゼーションは約42℃で実施される。
前述のハイブリダイゼーションのいずれも高ストリンジェンシー条件下であると考えられる。
【0126】
ハイブリダイゼーションに続いて、フィルターを洗浄して非特異的に結合した検出用プローブの一切を除去する。フィルターを洗浄するために用いるストリンジェンシーもまた、ハイブリダイズさせる核酸の性質、ハイブリダイズさせる核酸の長さ、相補性の程度、ヌクレオチド配列の組成(例えばGC対AT含有量)、および核酸のタイプ(例えばRNAかDNAか)に応じて変動させることができる。徐々に高くなるストリンジェンシー条件の洗浄の例は以下のとおりである:2×SSC、0.1%SDS、室温で15分(低ストリンジェンシー);0.1×SSC、0.5%SDS、室温で30分から1時間(中等度のストリンジェンシー);0.1×SSC、0.5%SDS、ハイブリダイゼーション温度から68℃で15分から30分(高ストリンジェンシー);および0.15MのNaCl、72℃で15分(超ストリンジェンシー)。最後の低ストリンジェンシー洗浄は、0.1×SSCで室温で実施できる。上記の例は、フィルターの洗浄に用いることができる単なる条件一式の例示である。当業者は、種々のストリンジェンシーの洗浄用レシピーが多数存在することを認識しているであろう。他のいくつかの例は下記で示す。
プローブにハイブリダイズした核酸はオートラジオグラフィーまたは他の通常の技術によって同定される。
【0127】
上記の方法を改変して、プローブ配列と相同性レベルが低い核酸を同定できる。例えば、検出用プローブとの相同性が低い核酸を得るために、ストリンジェンシーがより低い条件を用いることができる。例えばハイブリダイゼーション温度は、約1MのNa+濃度を有するハイブリダイゼーション緩衝液中で、68℃から42℃まで5℃ずつ低下させることができる。ハイブリダイゼーションに続いて、フィルターを2×SSC、0.5%のSDSでハイブリダイゼーション温度で洗浄することができる。前記の条件は、50℃以上で“中等度”の条件、50℃未満で“低い”条件であると考えられる。“中等度”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが55℃で実施されるときである。“低ストリンジェンシー”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが45℃で実施されるときである。
【0128】
あるいは、ハイブリダイゼーションは緩衝液、例えばホルムアミドを含む6×SSC中で42℃の温度で実施できる。前記の場合、ハイブリダイゼーション緩衝液中のホルムアミドの濃度は、50%から0%まで5%ずつ減少させ、プローブと相同性のレベルが低いクローンを同定できる。ハイブリダイゼーションの後で、フィルターを6×SSC、0.5%のSDSで50℃で洗浄できる。前記の条件は、25%を超えるホルムアミドで“中等度”の条件、25%より低いホルムアミドで“低い”条件と考えられる。“中等度”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが30%のホルムアミドで実施されるときである。“低ストリンジェンシー”のハイブリダイゼーション条件の具体的な例は、上記のハイブリダイゼーションが10%のホルムアミドで実施されるときである。
【0129】
例えば前述の方法は、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、または前記の1つの少なくとも10、15、20、25、30、35、40、45、50、75、100、150、200、300、400または500の連続した塩基を含むフラグメント、および前記と相補的な配列の1つから成る群から選択される核酸配列と少なくとも約97%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも75%、少なくとも70%、少なくとも65%、少なくとも55%、または少なくとも約50%の相同性を有する配列をもつ核酸の単離に用いることができる。相同性はアラインメントアルゴリズムを用いて測定できる。例えば、相同なポリヌクレオチドは、本明細書に記載したコード配列の1つの天然に存在する対立遺伝子座変種であるコード配列を有するであろう。前記対立遺伝子座変種は、配列番号:1、3、5、7、9、11、13、15または前記と相補的な配列と比較したとき、1つまたは2つ以上のヌクレオチドの置換、欠失、または付加を有するであろう。
【0130】
さらに、上記の方法は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列、または前記の1つの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つの配列を有するポリペプチドと、配列アラインメントアルゴリズム(例えばデフォルトパラメーターを有するFASTAバージョン3.0t78アルゴリズム)を用いて決定したとき、少なくとも約99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも75%、少なくとも70%、少なくとも65%、少なくとも60%、少なくとも55%、または少なくとも約50%の相同性を有するポリペプチドをコードする核酸の単離に用いることができる。
【0131】
本発明のまた別の特徴は、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列、または前記の1つの少なくとも5、10、15、20、25、30、35、40、50、75、100、または150の連続したアミノ酸を含むフラグメントの1つの配列を含む単離または精製ポリペプチドである。上記で述べたように、前記ポリペプチドは、前記ポリペプチドをコードする核酸をベクターに挿入することによって得ることができる。前記コード配列は、適切な宿主細胞で前記コードされたポリペプチドの発現を駆動することができる配列と動作可能なように連結される。例えば、発現ベクターは、プロモーター、翻訳開始のためのリボソーム結合部位および転写ターミネーターを含むことができる。前記ベクターはまた発現を増幅する適切な配列を含むことができる。
【0132】
ポリペプチドまたはそのフラグメントを細菌で発現させるために適したプロモーターには、大腸菌のlacまたはtrpプロモーター、lacIプロモーター、lacZプロモーター、T3プロモーター、T7プロモーター、gptプロモーター、λPRプロモーター、λPLプロモーター、糖分解酵素(例えばホスホグリセレートキナーゼ(PGK))をコードするオペロン由来のプロモーター、および酸性ホスファターゼプロモーターが含まれる。真菌のプロモーターには、∀因子プロモーターが含まれる。真核細胞プロモーターには、CMV極初期プロモーター、HSVチミジンキナーゼプロモーター、熱ショックプロモーター、初期および後期SV40プロモーター、レトロウイルス由来プロモーター、およびマウスのメタロチオネイン−Iプロモーターが含まれる。原核細胞または真核細胞またはそれらのウイルスで遺伝子が発現をすることが判明している他のプロモーターもまた用いることができる。
【0133】
哺乳類発現ベクターはまた、複製起点、必要な任意のリボソーム結合部位、ポリアデニル化部位、スプライシングドナーおよびアクセプター部位、転写終了配列、および5’フランキング非転写配列を含むことができる。いくつかの実施態様では、SV40スプライスおよびポリアデニル化部位に由来するDNA配列を用いて、必要な非転写遺伝子エレメントを提供することができる。
ポリペプチドまたはそのフラグメントを真核細胞で発現するためのベクターはまた、発現レベルを高めるエンハンサーを含むことができる。エンハンサーはcis−作動性DNAエレメントで、通常長さが約10から約300bpでプロモーター上で作用してその転写を高める。例を挙げれば、複製起点の後期側100から270bp上のSV40エンハンサー、サイトメガロウイルスの初期プロモーターエンハンサー、複製起点の後期側にあるポリオーマエンハンサーおよびアデノウイルスエンハンサーが含まれる。
【0134】
さらに、前記発現ベクターは典型的には1つまたは2つ以上の選別可能なマーカー遺伝子を含み、前記ベクターを含む宿主細胞の選別を可能にする。前記選別可能マーカーには、真核細胞培養のためのジヒドロフォレートレダクターゼをコードする遺伝子またはネオマイシン耐性を付与する遺伝子、大腸菌でテトラサイクリンまたはアンピシリン耐性を付与する遺伝子、およびビール酵母菌(S. cerevisiae)TRP1遺伝子が含まれる。
いくつかの実施態様では、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つをコードする核酸が、翻訳された前記ポリペプチドまたはそのフラグメントの分泌を指令することができるリーダー配列を用いて適切な相で組み立てられる。場合によって、前記核酸は融合ポリペプチドをコードすることができる。前記融合ポリペプチドでは、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチド、または前記の少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つが、異種ペプチドまたはポリペプチド、例えば所望の特徴(例えば安定性の強化または精製の簡素化)を付与するN−末端認定ペプチドと融合される。
【0135】
適切なDNA配列を多様な方法によってベクターに挿入することができる。一般に、DNA配列は、挿入物およびベクターを適切な制限エンドヌクレアーゼで消化した後、ベクターの所望の位置に連結される。また別には、挿入物およびベクターの両方の平滑末端を連結してもよい。種々のクローニング技術が以下の文献に記載されている:Ausubel et al. ”Current Protocols in Molecular Biology,” John Wiley 503 Sons, Inc. 1997;およびSambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press, 1989(前記文献は引用により本明細書に含まれる)。前記の方法および他の方法は当業者に公知である。
【0136】
前記ベクターは、例えばプラスミド、ウイルス粒子、またはファージの形態であってもよい。他のベクターには、染色体、非染色体および合成DNA配列、SV40の誘導体;細菌プラスミド、ファージDNA、バキュロウイルス、酵母プラスミド、プラスミドおよびファージDNAの組合せに由来するベクター、ウイルスDNA、例えばワクシニア、アデノウイルス、鶏痘ウイルス、および仮性狂犬病ウイルスが含まれる。原核細胞および真核細胞宿主とともに用いることができる種々のクローニングおよび発現ベクターが、文献(Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor , N.Y. 1989(前記文献は引用により本明細書に含まれる))に記載されている。
【0137】
使用することができる具体的な細菌ベクターには、以下の周知のクローニングベクターの遺伝的エレメントを含む市販のプラスミドが含まれる:pBR322(ATCC37017)、pKK223−3(Pharmacia Fine Chemicals, Uppsala, Sweden)、GEM1(Promega Biotec, Madison, WI, USA)、pQE70、pQE60、pQE−9(Qiagen)、pD10、psiX174、pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223−3、pKK233−3、pDR540、pRIT5(Pharmacia)、pKK232−8およびpCM7。具体的な真核細胞用ベクターには、pSV2CAT、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSGおよびpSLV(Pharmacia)が含まれる。しかしながら、他のいずれのベクターも、宿主細胞で複製し生存するかぎり用いることができる。
【0138】
宿主細胞は当業者に公知のいずれの宿主細胞でもよい。前記細胞には、原核細胞、真核細胞、哺乳類細胞、昆虫細胞、または植物細胞が含まれる。適切な宿主の代表的な例として以下を挙げることができる:細菌細胞、例えば大腸菌、ストレプトミセス、枯草菌(Bacillus subtilis)、ネズミチフス菌(Salmonella typhimurium)並びにシュードモナス属、ストレプトミセス属およびスタフィロコッカス属の様々な種;真菌細胞、例えば酵母;昆虫細胞、例えばキイロショウジョウバエS2およびスポドプテラ(Spodoptera)Sf9;動物細胞、例えばCHO、COSまたはボウズ(Bowes)メラノーマ;およびアデノウイルス。適切な宿主の選択は当業者には公知である。
【0139】
ベクターは、多様な技術のいずれか(形質転換、トランスフェクション、形質導入、ウイルス感染、遺伝子銃、またはTi仲介遺伝子移転を含む)を用いて宿主細胞に導入できる。具体的な方法には、リン酸カルシウムトランスフェクション、DEAE−デキストラン仲介トランスフェクション、リポフェクチンまたは電気穿孔(L. Davis, M. Dibner, I. Battey, Basic Methods in Molecular Biology, 1986)が含まれる。
適切な場合には、前記のベクター導入宿主細胞を、プロモーターの活性化、形質転換体の選別または本発明の遺伝子の増幅に適切なように改変した通常の栄養培養液で培養することができる。適切な宿主株を選択し、さらに前記宿主株を適切な細胞密度まで増殖させた後で、前記の選択したプロモーターを適切な手段(例えば温度シフトまたは化学的誘発)で誘発することができる。さらに前記細胞をさらに新たな期間培養して所望のポリペプチドまたはそのフラグメントを産生させることができる。
【0140】
細胞は、典型的には遠心分離によって集め、物理的または化学的手段で破壊し、得られた粗抽出物を更なる精製のために維持する。タンパク質の発現に用いた微生物細胞は通常の任意の手段によって破壊することができる。前記手段には、反復凍結融解、超音波処理、機械的破壊、または細胞溶解剤の使用が含まれる。前記の方法は当業者には周知である。発現されたポリペプチドまたはそのフラグメントを回収し、リコンビナント細胞培養から以下を含む方法によって精製することができる:硫安もしくはエタノール沈澱、酸抽出、陰イオンもしくは陽イオン交換クロマトグラフィー、ホスホセルロースクロマトグラフィー、疎水性相互作用クロマトグラフィー、アフィニティークロマトグラフィー、ヒドロキシルアパタイトクロマトグラフィー、およびレクチンクロマトグラフィー。必要な場合には、ポリペプチドの立体配置を完成させるため、タンパク質再折り畳み工程を用いることができる。所望する場合には、高速液体クロマトグラフィー(HPLC)を最終精製工程で用いることができる。
【0141】
さらにまた種々の哺乳類細胞培養系を用いて、組換えタンパク質を発現させることができる。哺乳類発現系の例には、サル腎線維芽細胞のCOS−7株(Gluzman, Cell, 23:175, 1981に記載されている)、および適合ベクターからタンパク質を発現させることができる他の細胞株、例えばC127、3T3、CHO、HeLaおよびBHK細胞株が含まれる。
宿主細胞中の構築物を通常の態様で用いて、組換え配列によってコードされた遺伝子生成物を産生させることができる。組換え体生成方法で用いる宿主にしたがって、前記ベクターを含む宿主細胞によって産生されるポリペプチドは糖化されたりされなかったりするであろう。本発明のポリペプチドはまた先頭のメチオニン残基を含んだり含まなかったりするであろう。
【0142】
また別には、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントは、通常のペプチド合成装置によって合成してもよい。他の実施態様では、ポリペプチドのフラグメントまたは部分をペプチド合成によって対応する完全長のポリペプチドを製造するために用いることができる。したがって、前記フラグメントは、完全長のポリペプチドの製造用中間体として用いることができる。
【0143】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つを、前記ポリペプチドまたはそのフラグメントをコードする核酸に作働的に連結されたプロモーターを含むDNA構築物から転写されたmRNAを用いて製造するために無細胞翻訳系もまた利用することができる。いくつかの実施態様では、前記DNA構築物はin vitro転写反応を実施する前に直線化することができる。続いて転写mRNAを適切な無細胞翻訳抽出物(例えばウサギの網状赤血球抽出物)とともにインキュベートし、所望のポリペプチドまたはそのフラグメントを生成することができる。
【0144】
本発明はまた、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの変種に関する。“変種”という用語は前記ポリペプチドの誘導体または類似体を含む。特に、前記変種は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のポリペプチドと、1つまたは2つ以上の置換、付加、欠失、融合および末端短縮(これらはいずれの組合せにも存在することができる)によってアミノ酸配列が相違する。
【0145】
前記変種は天然に存在するものでもin vitroで創出されたものでもよい。特に前記変種は、遺伝子操作技術(例えば部位特異的突然変異導入、化学的ランダム突然変異導入、エキソヌクレアーゼIII欠失方法、および標準的クローニング技術)を用いて創出することができる。また別には、前記変種、フラグメント、類似体または誘導体は、化学的合成または改変方法を用いて創出してもよい。
変種を作製する他の方法もまた当業者には知られている。前記方法には、天然の単離物から得られた核酸配列を改変して、それらの工業的または研究的利用価値を高める特性を有するポリペプチドをコードする核酸を生成する方法が含まれる。前記の方法では、天然の単離物から得られた配列に対して1つまたは2つ以上のヌクレオチドの相違を有する多数の変種配列が生成され性状を調べられる。典型的には、これらのヌクレオチドの相違は、天然の単離物の核酸によってコードされるポリペプチドに対してアミノ酸変化をもたらす。
【0146】
例えば、変種は変異性PCR(error prone PCR)を用いて創出することができる。変異性PCRでは、PCRは、高率の点変異がPCR生成物の全長にわたって得られるように、DNAポリメラーゼの複製信頼度が低い状態で実施される。変異性PCRは以下の文献に記載されている:D.W. Leung et al., Technique, 1:11−15,1989;R.C. Caldwell & G.F. Joyce, PCR Methods Applic., 2:28−33,1992(前記文献は引用により本明細書に含まれる)。簡単に記せば、そのような方法では、PCR生成物の全長にわたって高率の点変異を達成するために、突然変異を誘発されるべき核酸を、PCRプライマー、反応緩衝液、MgCl2、MnCl2、Taqポリメラーゼおよび適切な濃度のdNTPと混合する。例えば、突然変異を誘発されるべき核酸を20fmol、各PCRプライマーを30pmol、50mMのKCl、10mMのトリス塩酸(pH8.3)および0.01%のゼラチン、7mMのMgCl2,0.5mMのMnCl2、5単位のTaqポリメラーゼ、0.2mMのdGTP、0.2mMのdATP、1mMのdCTPおよび1mMのdTTPを含む反応緩衝液を用いて反応を実施できる。PCRは、94℃1分、45℃1分および72℃1分の30サイクルで実施できる。しかしながら、前記のパラメーターは適宜変動可能であることは理解されよう。突然変異が誘発された核酸を適切なベクターでクローニングし、前記変異核酸によってコードされたポリペプチドの活性を調べる。
【0147】
変種はまた、注目する任意のクローン化DNAで位置特異的変異を生成するためにオリゴヌクレオチド誘導突然変異導入を用いて創出してもよい。オリゴヌクレオチド突然変異導入は以下の文献に記載されている:J.F. Reidhaar−Olson & R.T. Sauer et al., Science, 241:53−57, 1988(前記文献は引用により本明細書に含まれる)。簡単に記せば、そのような方法では、クローン化DNAに導入されるべき1つまたは2つ以上の変異を含む複数の二本鎖オリゴヌクレオチドが合成され、前記突然変異を誘発されるべきクローン化DNAに導入される。突然変異を誘発されたDNAを含むクローンを回収し、それらがコードするポリペプチドの活性を評価する。
【0148】
変種を創出するまた別の方法は、アッセンブリーPCRである。アッセンブリーPCRは、小さなDNAフラグメントの混合物からPCR生成物を組み立てることを必要とする。同一のバイアル中で多数の異なるPCR反応が実施され、1つの反応の生成物が別の反応の生成物のプライマーの役割を果たす。アッセンブリーPCRは米国特許第5,965,408号(1996年6月9日出願、発明の名称“Method of DNA Reassembly by Interrupting Synthesis”)(前記文献は引用により本明細書に含まれる)に記載されている。
【0149】
変種を創出するまた別の方法は有性PCR突然変異導入(sexual PCR mutagenesis)である。有性PCR突然変異導入では、強制的相同性組換えが、相違を有するが高度に関連性を有するDNA配列をもつDNA分子間でin vitroで生じる。前記組換えは、配列相同性を基準にしたDNA分子のランダムフラグメント化と、それに続く、PCR反応におけるプライマー伸長による交差の固定の結果として得られる。有性PCR突然変異導入は以下の文献に記載されている:W.P. Stemmer, PNAS, USA, 91:10747−10751, 1994(前記文献は引用により本明細書に含まれる)。簡単に記せば、このような方法では、組換えられるべき複数の核酸をデオキシリボヌクレアーゼで消化して、平均サイズが50−200ヌクレオチドのフラグメントを生成する。所望の平均サイズのフラグメントを精製し、PCR混合物に再懸濁させる。前記核酸フラグメント間の組換えを促進する条件下でPCRを実施する。例えば、PCRは、前記精製フラグメントを10−30ng/μLの濃度で以下の組成の溶液に再懸濁させて実施できる:0.2mMの各dNTP、2.2mMのMgCl2、50mMのKCl、10mMのトリス塩酸(pH9.0)および0.1%トリトンX−100。反応混合物100μLにつき2.5単位のTaqポリメラーゼを添加し、PCRを以下のように実施する:94℃60秒、94℃30秒、50−55℃30秒、72℃30秒(30−45回)および72℃5分。しかしながら、前記のパラメーターは適宜変動可能であることは理解されよう。いくつかの実施態様では、オリゴヌクレオチドをPCR反応に含ませることができる。他の実施態様では、DNAポリメラーゼIのクレノーフラグメントを第一回目のPCR反応に用い、Taqポリメラーゼをその後のPCR反応サイクルで用いることができる。リコンビナント配列を単離し、それらがコードするポリペプチドの活性を評価する。
【0150】
変種はまたin vivo突然変異導入によって創出できる。いくつかの実施態様では、問題の配列を細菌株、例えば大腸菌株(前記の細菌株はDNA修復経路の1つまたは2つ以上に変異を有する)で増殖させることによって前記配列にランダム変異を創出する。前記の“変異導入体”株は野生型の親株よりも高いランダム変異率を有する。前記DNAをこれらの株の1つで増殖させることによって、最終的に前記DNA内にランダム変異が生成されるであろう。In vivo突然変異導入で使用するために適した変異導入体株は、PCT公開番号WO91/16427号(1991年10月31日公開、発明の名称:”Methods for Phenotype Creation from Multiple Gene Populations”)に記載されている(前記文献は引用により本明細書に含まれる)。
【0151】
変種はまたカセット突然変異導入を用いて創出できる。カセット突然変異導入では、二本鎖DNA分子の小さな領域が、天然の配列とは異なる合成オリゴヌクレオチド“カセット”で置換される。前記オリゴヌクレオチドはしばしば、完全および/または部分的に任意抽出された天然の配列を含む。
循環アンサンブル突然変異導入もまた変種の創出に用いることができる。循環アンサンブル突然変異導入は、表現型が関連する多様な集団でその構成メンバーのアミノ酸配列が異なっているものを作製するために開発されたタンパク質工学(タンパク質突然変異導入)用アルゴリズムである。前記方法は、フィードバックメカニズムを用いて組合せカセットの連続する突然変異導入ラウンドを制御する。循環アンサンブル突然変異導入は以下の文献に記載されている:A.P. Arkin & D.C. Youvan, PNAS, USA, 89:7811−7815, 1992(前記文献は引用により本明細書に含まれる)。
【0152】
いくつかの実施態様では、変種は指数的アンサンブル突然変異導入を用いて創出される。指数的アンサンブル突然変異導入は、固有で機能的な変異体を高いパーセントで含む組合せライブラリーを作製するプロセスである。前記プロセスでは、短い残基群が並列的に任意抽出され、機能的タンパク質を生じるアミノ酸を各々異なる位置で同定する。指数的アンサンブル突然変異導入は以下の文献に記載されている:S. Delegrave & D.C. Youvan, Biotechnology Research, 11:1548−1552,1993(前記文献は引用により本明細書に含まれる)。ランダム突然変異導入および部位特異的突然変異導入は以下の文献に記載されている:F.H. Arnold, Current Opinion in Biotechnology, 4:450−455, 1993(前記文献は引用により本明細書に含まれる)。
【0153】
いくつかの実施態様では、変種はシャッフリングを用いて創出される。シャッフリングでは、別個のポリペプチドをコードする複数の核酸の部分が一緒に融合され、キメラポリペプチドをコードするキメラ核酸配列が創出される。前記は以下の文献に記載されている:米国特許第5,965,408号(1996年7月9日出願、発明の名称:”Method of DNA Reassembly by Interrupting Synthesis”;および米国特許第5,939,250号(1996年5月22日出願、発明の名称”Production of Enzymes Having Desired Activities by Mutagenesis”)(前記文献は引用により本明細書に含まれる)。
【0154】
配列番号:2、4、6、8、10、12、14、16のポリペプチドの変種は、配列番号:2、4、6、8、10、12、14、16のポリペプチドのアミノ酸残基の1つまたは2つ以上が、保存的または非保存的アミノ酸残基(好ましくは保存的アミノ酸残基)で置換された変種であろう。さらに前記置換されたアミノ酸残基は遺伝暗号によってコードされたものでもよいが、そうでないものでもよい。
保存的置換は、ポリペプチド内のあるアミノ酸を同様な特性をもつ別のアミノ酸で置換するものである。保存的置換として典型的に認められるものは以下の置換である:脂肪族アミノ酸(例えばAla、Val、LeuおよびIle)の別の脂肪族アミノ酸による置換:SerのThrによる置換;酸性残基(例えばAspおよびGlu)の別の酸性残基による置換;アミド基をもつ残基(たとえばAsnおよびGln)のアミド基をもつ別の残基による置換;塩基性残基(たとえばLysおよびArg)の別の塩基性残基による交換および芳香族残基(例えばPhe、Tyr)の別の芳香族残基による置換。
【0155】
他の変種は、配列番号:2、4、6、8、10、12、14、16に記載のポリペプチドのアミノ酸残基の1つまたは2つ以上が置換基を含むものである。
さらに他の変種は、ポリペプチドが別の化合物、例えば前記ポリペプチドの半減期を延長する化合物(例えばポリエチレングリコール)と結合されているものである。
さらに別の変種は、さらに別のアミノ酸がポリペプチドに融合されているものである。前記別のアミノ酸は、例えばリーダー配列、分泌配列、プロタンパク質配列、または前記ポリペプチドの精製、濃縮もしくは安定化を促進する配列である。
いくつかの実施態様では、前記フラグメント、誘導体および類似体は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドと同じ生物学的機能または活性を保持する。他の実施態様では、前記フラグメント、誘導体または類似体は、プロタンパク質の切断によって活性化され、活性ポリペプチドを生じるプロタンパク質を含む。
【0156】
本発明の別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つと少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約95%を越える相同性を有するポリペプチドまたはそのフラグメントである。相同性は、比較されるポリペプチドまたはフラグメントでアラインメントを実施し、それらの間のアミノ酸同一性または類似性の程度を決定する、上記で説明した任意のプログラムを用いて決定することができる。アミノ酸の“相同性”は、上記で述べたような保存的アミノ酸置換も含むことは理解されよう。
【0157】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも約5、10、15、20、25、30、35、40、50、75、100または150の連続アミノ酸を含むフラグメントの1つと相同性を有するポリペプチドまたはフラグメントは、上記の技術を用いて前記をコードする核酸を単離することによって得ることができる。
あるいは、相同なポリペプチドまたはフラグメントは生化学的な濃縮または精製方法により得ることができる。潜在的に相同なポリペプチドまたはフラグメントの配列は、タンパク質分解消化、ゲル電気泳動および/またはミクロ配列決定によって決定できる。相同性が予想されるポリペプチドまたはフラグメントの配列は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくともあるいはの連続アミノ酸を含むフラグメントの1つと、上記に記載したプログラムのいずれかを用いて比較することができる。
【0158】
本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列のフラグメントまたは変種であって、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドの酵素機能を保持するものを同定するためのアッセイである。例えば、前記ポリペプチドのフラグメントまたは変種は生化学的反応を触媒するために用いることができる(前記生化学的反応は、前記フラグメントまたは変種が配列番号:2、4、6、8、10、12、14、16のポリペプチドの酵素活性を保持することを提示する)。
【0159】
フラグメントまたは変種が、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチドの酵素活性を保持するか否かを決定するためのアッセイは以下の工程を含む:ポリペプチドフラグメントまたは変種を基質分子と、ポリペプチドフラグメントまたは変種が機能することができる条件下で接触させ、さらに基質レベルの低下、または前記ポリペプチドと基質との間の反応の特異的反応生成物レベルの増加を検出する。
【0160】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントを多様な用途に用いることができる。例えば、前記ポリペプチドまたはそのフラグメントを用いて、生化学的配列を触媒することができる。本発明の特徴の1つにしたがえば、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記ポリペプチドをコードするポリヌクレオチドをグリコシド結合の加水分解に用いる方法が提供される。前記方法では、グリコシド結合を含む物質(例えば澱粉)を、配列番号:2、4、6、8、10、12、14、16または前記と実質的に同一の配列を有するポリペプチドと、前記グリコシド結合の加水分解を促進する条件下で接触させる。
【0161】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントをまた用いて、前記ポリペプチドまたはフラグメントと特異的に結合する抗体を生成することができる。得られた抗体は、前記ポリペプチドの単離もしくは精製に、または生物学的サンプルにおける前記ポリペプチドの有無の決定にイムノアフィニティークロマトグラフィー手法で用いることができる。前記の手法では、タンパク質調製物(例えば抽出物)または生物学的サンプルを、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントの1つと特異的に結合することができる抗体と接触させる。
【0162】
イムノアフィニティー法では、抗体を固相支持体(例えばビーズまたは他のカラムマトリックス)に結合させる。前記抗体が配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、またはそのフラグメントと特異的に結合する条件下で、前記タンパク調製物を前記抗体と接触させる。非特異的に結合したタンパク質を除去するために洗浄した後、特異的に結合した前記ポリペプチドを溶出させる。
生物学的サンプル中のタンパク質の前記抗体と結合する能力は、当業者に知られている種々の方法のいずれかを用いて決定できる。例えば結合は、抗体を検出可能な標識(例えば蛍光薬剤、酵素標識または放射性同位元素)で標識することによって決定できる。また別には、抗体のサンプルへの結合は、前記のような検出可能な標識をその上に有する二次抗体を用いて検出することができる。具体的なアッセイには、ELISAアッセイ、サンドイッチアッセイ、放射性イムノアッセイおよびウェスタンブロットが含まれる。
【0163】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントに対して作製されたポリクローナル抗体は、前記ポリペプチドを動物に直接注射するか、または動物(例えばヒト以外の動物)に前記ポリペプチドを投与することによって得ることができる。前記のようにして得られた抗体はポリペプチドそのものに結合するであろう。前記の態様では、前記ポリペプチドのフラグメントのみをコードする配列でさえ、完全な天然のポリペプチドと結合することができる抗体の生成に用いることができる。そのような抗体は、前記のポリペプチドを発現している細胞からポリペプチドを単離するために用いることができる。
【0164】
モノクローナル抗体を調製する場合は、継続的な細胞株培養によって産生される抗体を提供するいずれの技術も用いることができる。その例には、ハイブリドーマ技術(Kohler and Milstein, Nature, 256:495−497, 1975:前記文献は引用により本明細書に含まれる)、トリオーマ技術、ヒトB細胞ハイブリドーマ技術(Kozbor et al. Immunology Today, 4:72,1983:前記文献は引用により本明細書に含まれる)、およびEBV−ハイブリドーマ技術(Cole et al., ”Monoclonal Antibodies and Cancer Therapy”, Alan R. Liss, Inc., pp.77−96(1985):前記文献は引用により本明細書に含まれる)が含まれる。
【0165】
単鎖抗体製造のために報告された技術(米国特許第4,946,778号:前記文献は引用により本明細書に含まれる)を応用して、配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントに対する単鎖抗体を製造することができる。また別には、遺伝子導入マウスを用いて、前記ポリペプチドまたはそのフラグメントに対するヒト化抗体を発現させることができる。
【0166】
配列番号:2、4、6、8、10、12、14、16および前記と実質的に同一の配列を有するポリペプチド、または前記の少なくとも5、10、15、20、25、30、40、50、75、100または150の連続したアミノ酸を含むフラグメントに対して作製した抗体を、他の生物およびサンプルに由来する同様なポリペプチドのスクリーニングで用いることができる。前記の技術では、前記生物に由来するポリペプチドを前記抗体と接触させ、さらに前記抗体と特異的に結合するポリペプチドを検出する。上記で述べた方法のいずれも、抗体の結合検出に用いることができる。前記スクリーニングアッセイの1つが以下の文献に記載されている:”Methods for Measuring Cellulase Activities”, Methods in Enzymology, Vol. 160, pp.87−116(前記文献は引用により本明細書に含まれる)。
【0167】
本明細書において、“配列番号:1、3、5、7、9、11、13、15に示す核酸配列”という用語は、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列を有するヌクレオチド配列とともに、配列番号:1、3、5、7、9、11、13、15と相同な配列およびそのフラグメント、並びに前記配列の全てと相補的である配列を包含する。前記フラグメントには、配列番号:1、3、5、7、9、11、13、15の部分が含まれ、前記部分は、配列番号:1、3、5、7、9、11、13、15の少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400または500の連続したヌクレオチド、および実質的に前記と同一の配列を含む。配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一な配列と相同な配列およびフラグメントとは、前記配列に対して少なくとも約99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%、または50%の相同性を有する配列を指す。相同性は、本明細書に記載した任意のコンピュータプログラムおよびパラメーター(デフォルトパラメーターを用いるFASTAバージョン3.0t78を含む)を用いて決定することができる。相同な配列はまたRNA配列を含み、この場合、配列番号:1、3、5、7、9、11、13、15に示す核酸配列でチミジンはウリジンに置き換えられる。相同な配列は、本明細書に記載した方法のいずれかを用いて得られるか、または配列決定エラーの修正から得ることができる。配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列は、伝統的な一文字形式(”Biochemistry”(Stryer, Lubert, 3rd ed., W,H. Freeman & Co., New york)の裏表紙の内側を参照されたい)または一続きのヌクレオチドそのものを表示する他の任意の様式で表すことができる。
【0168】
本明細書において、“配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列”という用語は、配列番号:2、4、6、8、10、12、14、16およびこれらと実質的に同一の配列を有するポリペプチド配列(前記は配列番号:1、3、5、7、9、11、13、15に示す配列によってコードされる)、配列番号:2、4、6、8、10、12、14、16およびこれらと実質的に同一の配列を有するポリペプチドと相同なポリペプチド配列、または前記配列のいずれかのフラグメントを包含する。相同なポリペプチド配列とは、配列番号:2、4、6、8、10、12、14、16ポリペプチド配列の1つと少なくとも約99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%、または50%の相同性を有するポリペプチド配列を指す。相同性は、本明細書に記載した任意のコンピュータプログラムおよびパラメーター(デフォルトパラメーターまたは任意の改変パラメーターを用いるFASTAバージョン3.0t78を含む)を用いて決定することができる。相同な配列は、本明細書に記載した方法のいずれかを用いるか、または配列決定エラーの修正から得ることができる。前記ポリペプチドフラグメントは、配列番号:2、4、6、8、10、12、14、16および前記配列と実質的に同一の配列を有するポリペプチドの少なくとも5、10、15、20、25、30、35、40、50、75、100または150の連続したアミノ酸を含む。配列番号:2、4、6、8、10、12、14、16に示すポリペプチドコードおよび前記配列と実質的に同一の配列は、伝統的な一文字表記または3文字表記(”Biochemistry”(Stryer, Lubert, 3rd ed., W,H. Freeman & Co., New york)の裏表紙の内側を参照されたい)または一続きのポリペプチドそのものを表示する他の任意の様式で表すことができる。
【0169】
配列番号:1、3、5、7、9、11、13、15に示す核酸配列および配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列は、コンピュータによって読取り可能であって、さらにアクセスできる任意の媒体に保存、記録および処理することができることは当業者には理解されよう。本明細書で用いられるように、“記録”および“保存”という語は、コンピュータ媒体に情報を保存するプロセスを指す。当業者には、コンピュータ読取り可能な媒体に情報を記録するためにこれまでに知られている任意の方法を容易に利用して、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の1つまたは2つ以上、並びに配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列の1つまたは2つ以上を含む製品を作製することができる。本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の少なくとも2、5、10、15または20個の核酸配列を保存した、コンピュータ読取り可能媒体である。
【0170】
本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の1つまたは2つ以上を保存したコンピュータ読取り可能媒体である。本発明のまた別の特徴は、配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列の1つまたは2つ以上を保存したコンピュータ読取り可能媒体である。本発明のまた別の特徴は、上記に示す配列の少なくとも2、5、10、15または20個を保存したコンピュータ読取り可能媒体である。
コンピュータ読取り可能媒体には、磁気により読み出すことができる媒体、光学的に読み出すことができる媒体、電子的に読み出すことができる媒体および磁気/光媒体が含まれる。例えば、前記コンピュータ読取り可能媒体はハードディスク、フレキシブルディスク、磁気テープ、CD−ROM、デジタル多用途ディスク(DVD)、ランダムアクセスメモリー(RAM)、または読み出し専用メモリー(ROM)とともに当業者に公知の他の媒体の他のタイプであろう。
【0171】
本発明の実施態様には、システム(例えばインターネットをベースにするシステム)、特に本明細書で述べた配列情報を保存し処理するコンピュータシステムが含まれる。コンピュータシステム100の一例は、図2の組立て分解図で示されている。本明細書で用いられるように、“コンピュータシステム”とは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列を分析するために用いられるハードウェア成分、ソフトウェア成分およびデータ保存成分を指す。コンピュータシステム100は典型的には配列データの加工、アクセスおよび処理のためのプロセッサを含む。前記プロセッサ105は任意の中央演算ユニットで、例えばインテル社のペンティアム(登録商標)IIIまたはサン、モトローラ、コンパック、AMDもしくはIBM(international Business Machines)の同様なプロセッサであろう。
【0172】
典型的には前記コンピュータシステム100は、プロセッサ105およびデータ保存用の1つまたは2つ以上の内部データ保存構成部110、およびデータ保存構成部に保存されたデータを検索する1つまたは2つ以上のデータ検索装置を含む汎用システムである。当業者には、現在利用可能なコンピュータシステムのいずれも適切であることは理解されよう。
ある特定の実施態様では、前記コンピュータシステム100は、メインメモリー115(好ましくはRAMとして提供される)に連結されたバスに連結されたプロセッサ105および1つまたは2つ以上の内部データ保存装置110、例えばハードドライブおよび/またはそれにデータを記録させる他のコンピュータ読出し可能媒体を含む。いくつかの実施態様では、前記コンピュータシステム100はさらに、内部データ保存装置110に保存されたデータを読み出すための1つまたは2つ以上のデータ検索装置118を含む。
【0173】
前記データ検索装置118は、フレキシブルディスクドライブ、コンパクトディスクドライブ、磁気テープドライブ、または遠隔地のデータ保存システムと接続できる(例えばインターネットにより)モデムなどであろう。いくつかの実施態様では、前記内部データ保存装置110は、取り外し可能なコンピュータ読取り能媒体、例えばフレキシブルディスク、コンパクトディスク、磁気テープなどで、コントロールロジックおよび/またはそれに記録されたデータを含む。前記コンピュータシステム100は有利には、データ検索装置にいったん挿入されたデータ保存装置のコントロールロジックおよび/またはデータを読み出すための適切なソフトを含むか、またはそれによってプログラムされるであろう。
【0174】
前記コンピュータシステム100は、コンピュータ使用者に出力を表示するために用いられるディスプレー120を含む。前記コンピュータシステム100は、ネットワークまたは広域ネットワークで他のコンピュータシステム125a−cと連結され、コンピュータシステム100への中央管理アクセスを提供する。
配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列にアクセスするため、またはこれを加工するためにソフト(例えば検索ツール、比較ツール、および模型製作ツールなど)が、実行中にメーンメモリー115に存在する。
【0175】
いくつかの実施態様では、前記コンピュータシステム100は、コンピュータの読出し可能媒体に保存された、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の核酸配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列を、コンピュータ読出し可能媒体に保存されたリファレンスヌクレオチドまたはポリペプチド配列と比較するために配列比較アルゴリズムをさらに含む。“配列比較アルゴリズム”とは、あるヌクレオチドをデータ保存手段内に保存された他のヌクレオチドおよび/または化合物と比較するために前記コンピュータシステム100に(局所的にまたは遠隔的に)実装される1つまたは2つ以上のプログラムを指す。例えば、前記配列比較アルゴリズムは、コンピュータ読出し可能媒体に保存された、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のヌクレオチド配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列を、コンピュータ読出し可能媒体に保存されたリファレンス配列と比較し、相同性または構造モチーフを同定することができる。
【0176】
本特許出願明細書のいずれかの場所で明らかにした種々の配列比較プログラムが、特に本発明の前記特徴で使用するために意図される。タンパク質および/または核酸配列相同性は、種々の配列比較アルゴリズムおよび当業者に公知のプログラムのいずれかを用いて評価できる。前記のアルゴリズムおよびプログラムには以下が含まれるが、ただしこれらに限定されない:TBLASTN、BLASTP、FASTA、TFASTAおよびCLUSTALW(Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444−2448, 1988; Altschul et al., J. Mol. Biol. 215(3):403−410, 1990; Thompon et al., Nucleic Acids Res. 22(2):4673−4680, 1994; Higgins et al., Methods Enzymol. 266:383−402,1996; Altschul et al., J. Mol. Biol. 215(3):403−410, 1990; Altschul et al., Nature Genetics 3:266−272, 1993)。
【0177】
相同性および同一性は、しばしば配列分析ソフト(例えばウィスコンシン大学生物工学センター(1710 University Avenue, Madison, WI53705)、遺伝学コンピュータ群の配列分析ソフトウェアパッケージ)を用いて測定される。前記ソフトは、種々の欠失、置換および他の改変に対して相同性の程度を定めることによって類似する配列をマッチさせる。2つまたは3つ以上の核酸もしくはポリペプチド配列について“相同性”および“同一性”という用語は、任意の数の配列比較アルゴリズムを用いるかまたは手動アラインメントと目視観察によって測定したとき、比較ウィンドーまたは指定領域について最大の一致を目指して比較しアラインメントを実施したときに同じであるか、または特定の百分率のアミノ酸残基もしくはヌクレオチドが同じである2つまたは3つ以上の配列もしくはサブ配列を指す。
【0178】
配列比較の場合、典型的には1つの配列はリファレンス配列として機能し、前記に対してテスト配列を比較する。配列比較アルゴリズムを用いるときは、テスト配列およびリファレンス配列をコンピュータに入力し、サブ配列座標(coordinate)を必要な場合には指定し、さらに配列アルゴリズムプログラムのパラメーターを指定する。デフォルトプログラムパラメーターを用いてもよいし、また別のパラメーターを指定してもよい。続いて配列比較アルゴリズムは、前記プログラムパラメーターを基準にしてリファレンス配列に対するテスト配列のパーセント配列同一性を計算する。
【0179】
本明細書において、“比較ウィンドー”は、20から600、通常は約50から約200、より通常は約100から約150から成る群から選択される任意の数の連続した位置数を有するセグメントに対するリファレンスを含む。ある配列は、比較配列と最適なアラインメントを行った後、前記比較ウィンドー内で同じ数の連続した配置のリファレンス配列と比較される。比較のために配列アラインメントを実施する方法は当技術分野で周知である。比較のために最適な配列アラインメントは、例えば以下によって実施できる:Smith & Waterman(Adv. Appl. Math. 2:482, 1981)の局所相同性アルゴリズム、Needleman & Wunsch(J. Mol. Biol. 48:443, 1970)の相同性アラインメントアルゴリズム、Person & Lipman(Proc. Natl. Acad. Sci. USA 85:2444, 1998)の類似性検索法、前記アルゴリズムのコンピュータによる提供(ウィスコンシン大学生物工学センター(1710 University Avenue, Madison, WI53705)、遺伝学コンピュータ群の配列分析ソフトウェアパッケージのGAP、BESTFIT、FASTAおよびTFASTA)、および手動アラインメントと目視。
【0180】
相同性または同一性を決定するための他のアルゴリズムには、例えばBLASTプログラム(Basic Local Alignment Search Tool)の他に以下が含まれる:ALIGN、AMAS(Analysis of Multiply Aligned Sequences)、AMPS(Protein Multiple Sequence Alignment)、ASSET(Aligned Segment Satistical Evaluation Tool)、BANDS、BESTSCOR、BIOSCAN(Biological Sequence Comparative Analysis Node)、BLIMPS(Blocks IMProved Searcher)、FASTA、インターバルズ・アンド・ポインツ(Intervals & Points)、BMB、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、スミス・ウォーターマンアルゴリズム、DARWIN、ラスベガスアルゴリズム、FNAT(Forced Nucleotide Alignment Tool)、フレームアライン、フレームサーチ、DYNAMIC、FILTER、FSAP(Fristensky Sequence Analysis Package)、GAP(Global Alignment Program)、GENAL、GIBBS、GenQuest、ISSC(Sensitive Sequence Comparison)、LALIGN(Local Sequence Alignment)、LCP(Local Content Program)、MACAW(Multiple Alignment Construction & Analysis Workbench)、MAP(Multiple Alignment Program)、MBLKP、MBLKN、PIMA(Pattern−Induced Multi−sequence Alignment)、SAGA(Sequence Alignment by Genetic Algorithm)およびWHAT−IFが含まれる。
【0181】
前記アラインメントプログラムはまた、ゲノムデータベースのスクリーニングに用いて、実質的に同一の配列を有するポリヌクレオチド配列を同定することができる。多数のゲノムデータベースが利用可能である。例えば、ヒトゲノムの実質的な部分を、ヒトゲノム配列決定プロジェクト(J. Roach, http://weber.u.Washington.edu/〜roach/human_genome_progress2.html)(Gibbs, 1995)の部分として利用することができる。少なくとも21個の他のゲノムが既に配列を決定されている。これらには、例えばM.ジェニタリウム(M. genitalium; Fraser et al., 1995)、M.ヤナシー(M. Jannaschii; Bult et al., 1996)、インフルエンザ菌(H. influenzae; Fleischmann et al., 1995)、大腸菌(Blattner et al., 1997)、酵母(S. cerevisiae; Mewes et al., 1977)およびショウジョウバエ(D. melanogaster; Adams et al., 2000)が含まれる。顕著な進展が、モデル生物、例えばマウス、C.エレガンス(C. elegans)およびシロイヌナズナ(Arabidopsis sp.)のゲノム配列決定でも達成されている。いくつかの実用的な情報が付されたゲノム情報を含むいくつかのデータベースが種々の機構によって維持されており、例えば以下のようにインターネットを介してアクセスできる:http://wwwtigr.org/tdb; http://www.genetics.wisc.edu; http://genome−www.stanford.edu/〜ball; http://hiv−web.lanl.gov; http://www.ncbi.nlm.nih.gov; http://www.ebi.ac.uk; http://pasteur.fr/other/biology; http://www.genome.wi.mit.edu.。
【0182】
有用なアルゴリズムの一例はBLASTおよびBLAST2.0アルゴリズムで、前記は、それぞれ以下の文献に記載されている:Altschul et al., Nuc. Acids Res. 25:3389−3402, 1977およびAltschul et al., J. Mol. Biol. 215:403−410, 1990。BLAST分析を実施するためのソフトは、公的機関(National Center for Biotechnology Information)を介して一般に(http://www.ncbi.nlm.nih.gov/)開放されている。このアルゴリズムは、照会配列中で、データベース中の同じ長さを有するワードとアラインメントを実施したとき、いくつかの正の値をもつ閾値スコアTと適合するか、またはこれを満足させる長さWの短いワードを同定することによって、先ず初めに高いスコアを有する配列対(high scoring sequence; HSP)を同定することを含む。Tは隣接ワードスコア閾値(Altschul et al., 上掲書)と称される。これら最初の隣接ワードの的中は、それらを含むより長いHSPを発見するための検索開始用の種として機能する。
【0183】
前記ワードの的中を両方向に向けて各配列に沿って、累積アラインメントスコアが増加するかぎり伸長する。累積スコアは、ヌクレオチド配列の場合はパラメーターM(マッチする残基対については褒賞スコア;常に>0)を用いて計算する。アミノ酸配列の場合は、スコアリングマトリックスが累積スコアの計算に用いられる。各方向のワード的中の伸長は以下の場合に停止される:累積アラインメントスコアがその最大達成値から量Xだけ低下したとき;1つまたは2つ以上の陰性スコア値を有する残基アラインメントのために累積スコアが0またはそれより小さくなったとき;またはいずれかに配列の末端に達したとき。BLASTアルゴリズムパラメーターW、TおよびXはアラインメントの感度および速度を決定する。BLASTプログラム(ヌクレオチド配列用)はデフォルトとして、11のワード長(W)、10の期待値(E)、M=5、N=−4および両鎖の比較を用いる。アミノ酸配列の場合は、BLASTプログラムはデフォルトとして、3のワード長、および10の期待値(E)、およびBLOSUM62スコアリングマトリックス(以下の文献を参照されたい:Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989)、50のアラインメント(B)、10の期待値(E)、M=5、N=−4、および両鎖の比較を用いる。
【0184】
BLASTアルゴリズムはまた2つの配列間の類似性の統計分析を実施する(例えば以下の文献を参照されたい:Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993)。BLASTアルゴリズムによって提供される類似性の基準の1つは最小総和確率[smallest sum probability(P(N))]で、前記は2つのヌクレオチドまたはアミノ酸の間でマッチが偶然生じる確率の指標を提供する。例えば、テスト核酸とリファレンス核酸の比較で最小和確率が約0.2未満、より好ましくは約0.01未満、もっとも好ましくは約0.001未満であるならば、核酸はリファレンス配列と類似であると考えられる。
【0185】
ある実施態様では、タンパク質および核酸配列の相同性は、ベーシック・ローカル・アラインメント検索ツール“BLAST”(Basic Local Alignment Search Tool)を用いて評価される。特に、5つの固有のBLASTプログラムが、以下のタスクの実施に用いられる:
(1)BLASTPおよびBLAST3は、タンパク質配列データベースに対してアミノ酸照会配列を比較する;
(2)BLASTNは、ヌクレオチド配列データベースに対してヌクレオチド照会配列を比較する;
(3)BLASTXは、タンパク質配列データベースに対して照会ヌクレオチド配列(両鎖)の6フレームの仮想翻訳生成物を比較する;
(4)TBLASTNは、6つの全ての読み枠(両鎖)で翻訳されるヌクレオチド配列データベースに対して照会タンパク質配列を比較する;および
(5)TBLASTXは、ヌクレオチド配列データベースの6フレームの翻訳に対してヌクレオチド照会配列の6フレームの翻訳を比較する。
【0186】
BLASTプログラムは、照会アミノ酸または核酸配列とテスト配列(前記は好ましくはタンパク質または核酸配列データベースから入手される)間で、類似セグメント(前記は本明細書では“高いスコアをもつセグメント対”と称される)を同定することによって相同な配列を同定する。高いスコアをもつセグメント対は、好ましくはスコアリングマトリックス(それらの多くは当技術分野で周知である)の手段によって同定される(すなわちアラインメントを実施される)。好ましくは、使用されるスコアリングマトリックスはBLOSUM62マトリックスである(Gonnet et al., Science 256:1443−1445, 1992; Henikoff and Henikoff, Proteins 17:49−61, 1993)。前記よりも劣るが、PAMまたはPAM250マトリックスもまた使用することができる(例えば以下の文献を参照されたい:Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation)。BLASTプログラムは米国立医学図書館を介して、例えばwww.ncbi.nlm.nih.gov.でアクセスできる。
【0187】
上記のアルゴリズムとともに用いることができるパラメーターは、配列の長さおよび調査される相同性の程度に応じて改変させることができる。いくつかの実施態様では、前記パラメーターは、ユーザーの指示がない状態でアルゴリズムによって使用されるデフォルトパラメーターであってもよい。
図3は、新規なヌクレオチドまたはタンパク質配列と配列データベースとの間の相同性レベルを決定するために、前記新しい配列をデータベースの配列と比較するプロセス200の実施態様の1つを示す作業工程図である。前記配列データベースは、コンピュータシステム100内に保存された個人のデータベースでも、または公的なデータベース(例えばGENBANK、インターネットを介して利用できる)であってもよい。
プロセス200は、開始状態201で始まり、続いて状態202に進む。状態202では、比較されるべき新規な配列はコンピュータシステム内のメモリーに保存される。上記で考察したように、前記メモリーはいずれのタイプのメモリーでもよく、これにはRAMまたは内部保存装置が含まれる。
【0188】
続いてプロセス200は状態204に進み、ここで配列データベースが分析と比較のために開かれる。さらにプロセス200は状態206に進み、ここで前記データベースに保存された第一の配列はコンピュータのメモリー内に読み出される。続いて比較が状態210で実施され、第一の配列が第二の配列と同じか否かが決定される。前記工程は前記新規な配列とデータベース中の第一の配列との間の正確な比較を実施することに限定されないことを特記することは重要である。2つのヌクレオチドまたはタンパク質配列を、たとえそれらが同一でなくとも比較できる周知の方法が当業者には知られている。例えば、ギャップを1つの配列に導入し、2つのテストされる配列間の相同性レベルを高めることができる。比較時にギャップまたは他の特徴を配列に導入するか否かを制御するパラメーターは、通常は前記コンピュータシステムの使用者によってエンターされる。
【0189】
いったん状態210で比較を実施したら、前記2つの配列が同じか否かの決定が状態210で行われる。もちろん、“同じ”という用語は完全に同一の配列に限定されない。使用者がエンターした相同性パラメーターの範囲内にある配列はプロセス200では“同じ”と表示されるであろう。
2つの配列が同じであると表示されたならば、プロセス200は状態214に進み、ここでは前記データベースの配列の名称が使用者に表示される。前記状態は、表示の名称をもつ配列が、エンターされた相同性の制約を満たすことを使用者に報告する。保存されている配列名が使用者に表示されたら、プロセス200は決定状態218に進み、ここでさらに多くの配列がデータベースに存在するか否かの決定が行われる。それ以上の配列がデータベースに存在しない場合、プロセス200は終了状態220で停止する。しかしながら、データベースにそれ以上の配列が存在する場合は、プロセス200は状態224に進み、ここでポインターはデータベースの次の配列に移動し、前記の新規な配列と比較することができる。このようにして、データベース内の全ての配列と前記新規な配列はアラインメントを実施され比較される。
配列が相同でないという決定が決定状態212で行われる場合、他のいずれかの配列がデータベースで比較に利用できるか否かを決定するために、プロセス200は直ちに決定状態218に進むことは特記されねばならない。
【0190】
したがって、本発明の特徴の1つは、プロセッサ、データ保存装置および比較を実施するための配列比較装置を含むコンピュータシステムである。前記データ保存装置は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列がそれに保存されてあり、さらに前記データ保存装置には、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列と比較されるべきリファレンスヌクレオチド配列またはポリペプチド配列がそれに保存されてある。前記配列比較装置は、配列間の相同性レベルを表示するか、または、配列番号:1、3、5、7、9、11、13、15および前記配列と実質的に同一の配列の上記核酸コード、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列における構造モチーフを同定するか、または、前記配列比較装置は、前記核酸コードまたはポリペプチドコードと比較される配列の構造モチーフを同定する。いくつかの実施態様では、データ保存装置は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列の少なくとも2、5、10、15、20、25、30もしくは40またはそれ以上の配列を保存する。
【0191】
本発明のまた別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列とリファレンスヌクレオチド配列との間の相同性レベルを決定する方法である。前記方法は、核酸コードまたはポリペプチドコードおよびリファレンスヌクレオチドまたはポリペプチド配列を、相同性レベルを決定するコンピュータプログラムを用いて読み出し、さらに核酸コードまたはポリペプチドコードおよびリファレンスヌクレオチドまたはポリペプチド配列との間の相同性を前記コンピュータプログラムを用いて決定することを含む。前記コンピュータプログラムは相同性レベルを決定する多数のコンピュータプログラムのいずれでもよいが、特に本明細書に挙げたもの(例えばデフォルトパラメーターまたは任意の改変パラメーターを有するBLAST2N)が含まれる。前記方法は、上記で述べたコンピュータシステムを用いて実施することができる。前記方法はまた、配列番号:1、3、5、7、9、11、13、15に示す上記核酸配列の少なくとも2、5、10、15、20、25、30もしくは40またはそれ以上の配列またはグループBに示すポリペプチド配列を前記コンピュータプログラムにより読み出し、さらに前記核酸コードまたはポリペプチドコードとリファレンスヌクレオチド配列またはポリペプチド配列との間の相同性を決定することによって実施してもよい。
【0192】
図4は、2つの配列が相同であるか否かを決定するコンピュータプロセス250の実施態様の1つを示す作業工程図である。プロセス250は、開始状態252で開始し状態254に進み、ここで比較されるべき第一の配列がメモリーに保存される。続いて状態256で比較されるべき第二の配列がメモリーに保存される。続いてプロセス250は状態260に進み、ここで第一の配列の第一の文字が読み出され、続いて状態262に進み、ここで第二の配列の第一の文字が読み出される。前記配列がヌクレオチド配列の場合、前記文字は通常はA、T、C、GまたはUであろうということは理解されよう。前記配列がタンパク質配列の場合は、前記文字は、前記第一および第二の配列を容易に比較できるように、好ましくは一文字アミノ酸コードである。
【0193】
続いて決定状態264で、前記2つの文字が同じものであるか否か決定が行われる。それらが同じである場合、前記プロセス250は状態268に進み、ここで第一および第二の配列の次の文字が読み出される。続いて、前記次の文字が同じものであるか否かの決定が行われる。それらが同じである場合は、さらに、プロセス250は、2つの文字が同じでなくなるまで前記ループを繰返す。次の2つの文字が同じでないという決定が行われた場合、プロセス250は決定状態274に進み、ここでさらにそれ以上の読み出すべき文字がいずれかの配列に存在するか否かが決定される。
読み出すべき文字がもはや存在しない場合は、プロセス250は状態276に進み、第一の配列と第二の配列との間の相同性レベルが使用者に表示される。前記相同性レベルは、第一の配列の文字総数のうち同じであった配列間の文字の割合を計算することによって決定される。したがって、第一の100個のヌクレオチドの配列の全ての文字が第二の配列の全ての文字と並ぶならば、相同性レベルは100%であろう。
【0194】
また別には、前記コンピュータプログラムは、本発明に示す核酸配列のヌクレオチド配列を1つまたは2つ以上のリファレンスヌクレオチドと比較し、配列番号:1、3、5、7、9、11、13、15および前記と実質的に同一の配列の核酸コードがリファレンス核酸配列と1つまたは2つ以上の位置で異なるか否かを決定するコンピュータプログラムであってもよい。場合によって、前記のプログラムは、リファレンスポリヌクレオチドまたは配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列のいずれかについて挿入、欠失または置換させたヌクレオチドの長さまたその同一性を記録する。ある実施態様では、前記コンピュータプログラムは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列がリファレンスヌクレオチド配列に対して単一ヌクレオチド多型(SNP)を含むか否かを決定するプログラムであろう。
【0195】
したがって、本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列がリファレンスヌクレオチド配列と1つまたは2つ以上のヌクレオチドで相違するか否かを決定する方法である。前記方法は、核酸配列間の相違を同定するコンピュータプログラムを使用して前記核酸コードおよびリファレンスヌクレオチド配列を読み出し、さらに前記コンピュータプログラムにより前記核酸コードとリファレンスヌクレオチド配列間の相違を同定する工程を含む。いくつかの実施態様では、前記コンピュータプログラムは、シングルヌクレオチド多形性を同定するプログラムである。前記方法は、上記のコンピュータシステムおよび図4に示す方法によって実施することができる。前記方法はまた、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列の少なくとも2、5、10、15、20、25、30もしくは40またはそれ以上の配列およびリファレンス配列を前記コンピュータプログラムを使用して読み出し、さらに前記コンピュータプログラムにより前記核酸コードとリファレンスヌクレオチド配列間の相違を同定することによって実施することができる。
【0196】
他の実施態様では、前記コンピュータ支援システムは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列内の特徴を同定するための認識機構(アイデンティファイアー)をさらに含むことができる。
“認識機構”とは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列内の一定の特徴を同定する1つまたは2つ以上のプログラムを指す。ある実施態様では、前記アイデンティファイアーは、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列内の開放読み枠を同定するプログラムを含むことができる。
【0197】
図5は、配列内の特徴の存在を検出する認識機構によるプロセス300の実施態様の1つを示す作業工程図である。前記プロセス300は開始状態302で始まり、状態304に進み、ここで特徴についてチェックされるべき第一の配列がコンピュータシステムのメモリー115に保存される。続いてプロセス300は状態306に進み、ここで配列特徴のデータベースが開かれる。前記データベースは、特徴の名称とともに各特徴の属性のリストが含まれるであろう。例えば、特徴の名称は“開始コドン”であり、その属性は“ATG”であろう。また別の例は、特徴の名称は“TAATAAボックス”で特徴の属性は“TAATAA”であろう。前記データベース例は、ウィスコンシン大学遺伝学コンピュータグループ(www.gcg.com)によって作製されている。また別には、前記特徴は構造的ポリペプチドモチーフ、例えばアルフヘリックス、ベータシート、または機能的ポリペプチドモチーフ、例えば酵素の活性部位、ヘリックス−ターン−ヘリックスモチーフ、または当業者に公知のモチーフでもよい。
【0198】
いったん特徴のデータベースが状態306で開かれたら、前記プロセス300は状態308に進み、ここで第一の特徴がデータベースから読み出される。第一の特徴の属性と第一の配列との比較が状態310で行われる。続いて、前記特徴の属性が第一の配列で見出されるか否かが決定状態316で決定される。前記属性が見出されたら、プロセス300は状態318に進み、ここで見出された特徴の名称が使用者に表示される。
続いてプロセス300は決定状態320に進み、ここでさらにそれ以上の特徴がデータベースに存在するか否かが決定される。それ以上の特徴が存在しない場合は、プロセス300は終了状態324で終了する。しかしながら、それ以上の特徴がデータベースに存在する場合は、プロセス300は状態326で次の配列特徴を読み出し、状態310に戻り、ここで次の特徴の属性が第一の配列に対して比較される。
特徴の属性が決定状態316で第一の配列で見出されない場合は、プロセス300は決定状態320に直接進み、さらにそれ以上の特徴がデータベースに存在するか否かが決定されることは特記されるべきであろう。
【0199】
したがって、本発明の別の特徴は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列内の特徴を同定する方法である。前記方法は、核酸コードまたはポリペプチドコードを、その中に存在する特徴を同定するコンピュータプログラムを用いて読み出し、さらに前記コンピュータプログラムにより核酸コード内の特徴を同定することを含む。ある実施態様では、コンピュータプログラムは、開放読み枠を同定するコンピュータプログラムを含む。前記方法は、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列のただ1つの配列、または少なくとも2、5、10、15、20、25、30もしくは40個を前記コンピュータプログラムを使用して読み出し、さらに前記核酸コードまたはポリペプチドコード内の特徴を前記コンピュータプログラムにより同定することによって実施することができる。
【0200】
配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列は、多様なデータプロセッサプログラムで多様なフォーマットで保存し処理することができる。例えば、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列は、ワードプロセッシングファイル、例えばマイクロソフトワードもしくはワードパーフェクトでテキストとして、または当業者に周知の多様なデータベースプログラム、例えばDB2、SYBASEまたはORACLEでアスキーファイルとして保存することができる。さらに、多くのコンピュータプログラムおよびデータベースを、配列比較アルゴリズム、アイデンティファイアー、または配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列と比較されるべきリファレンスヌクレオチド配列またはポリペプチド配列の供給源として使用することができる。以下のリストは、本発明を制限しようとするものではないが、配列番号:1、3、5、7、9、11、13、15に示す核酸配列および前記配列と実質的に同一の配列、または配列番号:2、4、6、8、10、12、14、16に示すポリペプチド配列および前記配列と実質的に同一の配列に関して有用なプログラムおよびデータベースの手引きを提供する。
【0201】
使用することができるプログラムおよびデータベースには以下が含まれる(ただしこれらに限定されない):マックパターン(MacPattern; EMBL)、ディスカバリーベース(DiscoveryBase; Molecular Applications Group)、ジーンマイン(GeneMine; Molecular Applications Group)、ルック(Look; Molecular Applications Group)、マックルック(MacLook; Molecular Applications Group)、BLASTおよびBLAST2(NCBI)、BLASTNおよびBLASTX(Altschul et al., J. Mol. Biol. 215:403, 1990)、FASTA(Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85:2444, 1988)、FASTDB(Brutlag et al., Comp. App. Biosci. 6:237−245, 1990)、カタリスト(Catalyst; Molecular Simulations Inc.)、カタリスト/SHAPE(Molecular Simulations Inc.)、セリウス2.DBアクセス(Cerius2.DBAccess; Molecular Simulations Inc.)、ハイポジェン(HypoGen; Molecular Simulations Inc.)、インサイトII(Insight II; Molecular Simulations Inc.)、ディスカバー(Discover; Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、フェリックス(Felix; Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、クォンテMM(QuanteMM; Molecular Simulations Inc.)、ホモロジー(Homology; Molecular Simulations Inc.)、モデラー(Modeler; Molecular Simulations Inc.)、ISIS(Molecular Simulations Inc.)、クォンタ/プロテインデザイン(Quanta/Protein Design; Molecular Simulations Inc.)、ウェブラブ(WebLab; Molecular Simulations Inc.)、ウェブラブダイバーシティエクスプローラー(WebLab Diversity Explorer; Molecular Simulations Inc.)、ジーンエクスプローラー(Gene Explorer; Molecular Simulations Inc.)、セクフォールド(SeqFold; Molecular Simulations Inc.)、MDLアベイラブルケミカルズディレクトリーデータベース(the MDL Available Chemicals Directory database)、MDLドラッグデータレポートデータベース(the MDL Drug Data Report database)、コンプリヘンシブメディシナルケミストリーデータベース(the Comprehensive Medicinal Chemistry database)、ダーウェントのワールドドラッグインデックスデータベース(Derwent´s World Drug Index database)、バイオバイトマスターファイルデータベース(the BioByteMasterFile database)、ジェンバンクデータベース(the Genbank database)、およびジェンシークンデータベース(the Genseqn database)。本開示によって多くの他のプログラムおよびデータベースが当業者には明白であろう。
【0202】
上記のプログラムを用いて検出できるモチーフには以下が含まれる(ただしこれらに限定されない):ロイシンジッパー、ヘリックス−ターン−ヘリックスモチーフ、糖化部位、ユビキチン付加部位、アルファヘリックスおよびベータシートをコードする配列、シグナルペプチド(コードされたタンパク質の分泌を指令する)をコードするシグナル配列、転写調節に関連する配列(例えばホメオボックス)、酸性ストレッチ、酵素活性部位、基質結合部位、および酵素切断部位。
【0203】
本発明は酵素の固有の触媒特性を利用する。化学物質の変換における生物触媒(すなわち精製または粗酵素、非生細胞または生細胞)の使用は、特定の出発化合物と反応する個々の生物触媒の同定を通常必要とするが、本発明は、多くの出発化合物、例えば小分子に存在する官能基に特異的な、選択した生物触媒および反応条件を用いる。各生物触媒は、1つの官能基または関連するいくつかの官能基に特異的で、この官能基を含む多くの出発化合物と反応することができる。
前記生物触媒反応は、単一の出発化合物から誘導体の集団を生成する。これら誘導体はさらにもう一回生物触媒反応に付され、第二の誘導化合物集団を生成することができる。最初の小分子または化合物の数千の変種が、生物触媒の誘導体生成反応を繰り返すたびに生成される。
【0204】
酵素は出発化合物の特異的部位で反応し、前記分子の残りの部分に影響を与えず、このプロセスは伝統的な化学的方法を用いて達成することは非常に困難である。前記高度な生物触媒反応の特異性は、ライブラリー内のただ1つの活性化合物を同定する手段を提供する。前記ライブラリーは、それを生成するために用いられた生物触媒反応シリーズ、いわゆる“生合成歴”によって特徴付けられる。前記ライブラリーを生物学的活性についてスクリーニングし、生合成歴を追跡することによって、活性化合物を生成する特異的な一連の反応が同定される。前記一連の反応が繰り返され、合成された化合物の構造が決定される。この同定態様は、他の合成およびスクリーニングアプローチと異なり、固定化技術を必要とせず、化合物は溶液中で自由に合成することが可能で、さらに、実質的に任意のタイプのスクリーニングアッセイを用いて溶液中で自由にテストすることができる。官能基上の酵素反応の高度な特異性は、生物触媒により生成されたライブラリーを作製する特異的な酵素反応の追跡を可能にする。
【0205】
前記手順の工程の多くはロボットによる自動化を用いて実施され、前記自動化は、1日につき何千もの生物触媒反応およびスクリーニングの実施を可能にするとともに高レベルの正確さおよび再現性を担保する。結果として、誘導化合物ライブラリーは数週間で作製することが可能で、従来の化学的な方法によれば作製に数年を要するであろう。
【0206】
特定の実施態様では本発明は小分子を改変する方法を提供する。前記方法は、本明細書に記載したポリヌクレオチドによってコードされるポリペプチドまたは酵素的に活性なそのフラグメントを小分子と接触させ、改変小分子を生成することを含む。改変小分子ライブラリーを調べて、所望の活性を示す改変小分子がライブラリー内に存在するか否かを決定する。所望の活性をもつ前記改変小分子を生成する特異的な生物触媒反応は、ライブラリーの一部分を作製するために用いられる生物触媒反応の各々を系統的に消去し、さらに所望の活性をもつ改変小分子の有無についてライブラリーの一部分で生成された小分子をテストすることによって同定される。所望の活性をもつ改変小分子を生成する特異的な生物触媒反応は場合によって繰り返される。この生物触媒反応は、小分子の構造内に見出される別々の構造部分と反応する一群の生物触媒を用いて実施され、各生物触媒は一つの構造部分又は一つの関連する構造部分群に特異的であり、さらに各生物触媒は、前記個々の構造部分を含む多くの異なる小分子と反応する。
【0207】
本発明の構成要素はキットの構成に適切である。特に、配列番号:2、4、6、8、10、12、14、16のアミノ酸配列またはその相同な配列を有する生成タンパク質であって、約90℃から113℃の範囲の温度でポリメラーゼ活性を有するものを収納する少なくとも1つの容器を含むキットを提供する。好ましい実施態様では、前記タンパク質は、約90℃から113℃の範囲の温度でポリメラーゼ活性を有する配列番号:16またはその相同な配列である。ある特徴では、前記キットはさらに少なくとももう1つの容器を含み、前記容器にはdNTP、PCR用調製済み水、標準の長いGCリッチ陽性対照鋳型、対照プライマーセットまたはその任意の組合せを収納する。
本発明は以下の実施例を参考にしながらさらに説明されるが、本発明はそのような実施例に限定されないことは理解されるべきである。
【0208】
(実施例)
実施例1:配列番号:16のポリメラーゼのための最適化試験
最適化試験を実施し、85℃から95℃の範囲の温度のPCRで配列番号14,16のDNAポリメラーゼをポリメラーゼ活性のために利用する場合にもっとも有利な条件を決定した。調べたパラメーターは、緩衝液、pH、塩および塩濃度、Mgイオン供給源、界面活性剤および界面活性剤濃度であった。
調べた緩衝液はトリス−HCl、トリス−HOAc、リン酸緩衝液、バイシン(Bicine)、HEPES、MOPSおよびTAPSであった。もっとも理想的な緩衝液はHClであった。
調べたpH範囲は7.5から10.0であった。もっとも理想的なpHは10.0であった。
調べた塩は、濃度が5mMから200mMのNaCl、NaOAc、KCl、(NH4)2SO4、NH4OAcおよびLiClであった。もっとも有利な塩は25mMのNaOAcであった。
調べたマグネシウムイオン供給源は、濃度が0.5mMから5mMのMgCl2、Mg(OAc)2、MgSO4であった。前記のうちでもっとも有利なものは2から2.5mMのMg(KOAc)2であった。
調べた界面活性剤は、濃度が0.001から0.5体積%のNP−40、トゥイーン−20(登録商標)およびトリトンX−100(登録商標)界面活性剤であった。最良の条件は、濃度が0.002%のNP−40とトゥイーン−20界面活性剤の混合物であった。
これらの結果から、配列番号:16のDNAポリメラーゼを用いるPCRの実施にもっとも有利な緩衝液は、60mMのトリス−HCl(pH10.0)、25mMのNaOAc、2mMのMg(OAc)2および0.002% NP−40/トゥイーン−20を用いる。
【0209】
実施例2:配列番号:16のDNAポリメラーゼの高い正確性
3.3kbのlacZ遺伝子を増幅しクローニングした。文献に記載されたように(W.M. Barnes, (1994) Proc. Natl. Acad. Sci., 91/:2216−2220)、β−ガラクトシダーゼアッセイを実施した。
配列番号:16のポリメラーゼとTaqとの比較の結果は図6に示されている。相対的変異頻度は、配列番号:16のDNAポリメラーゼの場合よりもTaqで高いことが図から分かる。鋳型が倍になる毎に塩基対当たりの変異頻度は配列番号:16のDNAポリメラーゼで6.0×10−5で、一方Taqでは1.8×10−4であった。
【0210】
実施例3:配列番号:16のDNAポリメラーゼの収量および融通性
3種のcDNA鋳型、長い鋳型およびGCリッチ鋳型を配列番号:16のDNAポリメラーゼを用いて増幅した。結果は図7、8および9に示されている。
以下の3種のcDNA鋳型を調製した:3.0kbの甲状腺ホルモンレセプター共働活性化因子、3.3kbのオンコスタチン−M特異的レセプターベータ遺伝子およびタンパク質チロシンホスファターゼレセプターベータ遺伝子の2.1kb部分。前記3つの全ての鋳型を、HeLa第一鎖cDNA10ナノグラムを用い30サイクルのPCRで増幅した。PCRは各鋳型について2回、最初に配列番号:16のDNAポリメラーゼを、2回目はTaqをポリメラーゼとして用いて実施した。SDS−PAGEゲルを泳動して配列番号:16のDNAポリメラーゼによる結果とTaqによる結果を比較した。得られたゲルによれば、配列番号:16のポリメラーゼは、Taqで達成された収量と同様な収量で3つの鋳型全てを増幅させることができた。
【0211】
さらに、種々の長さを有するラムダファージのゲノムDNAを、配列番号:16のDNAポリメラーゼを用い最適化を実施させずにPCRによって増幅させた。SDS−PAGEゲルを泳動して各鋳型の増幅量を決定した。得られたゲルによれば、配列番号:16のポリメラーゼは、最適化を実施することなく10、15、20および25kbの鋳型を増幅することができた。
インスリン様成長因子レセプターII(IGFRII)(前記は90%を越えるGC含有量を有する)を、3つの別個のポリメラーゼ、配列番号:16のDNAポリメラーゼ、Taqポリメラーゼ、およびアドバーンテージ−GC(登録商標)を用いてPCRによって増幅した。各増幅は最適化を実施しないでPCR25サイクルを用いた。SDS−PAGEゲルを泳動して、各酵素による結果を比較した。結果は、配列番号:16のDNAポリメラーゼは前記鋳型を増幅できること示した。
【0212】
図7は、配列番号:16は多数の鋳型を増幅することができ、Taqポリメラーゼと比較して大きな収量を生成できることを明瞭に示している。レーンの上に示したように、サンプルは配列番号:16またはTaqのいずれによっても増幅された。増幅ではPCR 30サイクルについて10ナノグラムのHeLa第一鎖cDNAを用いた。レーン1,4:3.0kbの甲状腺ホルモンレセプター共働活性化因子;レーン2,5:3.3kbのオンコスタチン−M特異的レセプターベータ遺伝子;レーン3,6:タンパク質チロシンホスファターゼレセプターベータ遺伝子の2.1kb部分。
図8は、配列番号:16は、さらに最適化を実施することなく、25kbまでのラムダファージゲノムDNA鋳型を増幅できることを明瞭に示している。
図9は、3種のDNAポリメラーゼを用いた、インスリン様成長因子レセプターII(IGFRII)の500bp領域(90%を越えるGC含有量を有する)の増幅を示す。各増幅は、最適化を実施しないでPCR 25サイクルにより実施された。レーン1:配列番号:16;レーン2:Taqポリメラーゼ;レーン3:アドバーンテージ−GC(登録商標)(Invitrogen)。図9のレーン1は、配列番号:16は、他の市販のDNAポリメラーゼよりもIGFRII cDNAの一部分(GCが90%を越える)を良好に増幅することを示している。
【0213】
実施例4:配列番号:16の較正(プルーフリーディング)活性
配列番号:16のプルーフリーディング活性は平滑端を有するPCR生成物を生じる。したがって、前記PCR生成物は、例えばTOPO(登録商標)ブラントクローニング法(TOPO BLUNT Cloning methods; Invitrogen, San Diego, CA)または類似のシステムを用いてクローニングできる。TOPO(登録商標)クローニングは、迅速5分連結法によりPCR生成物をより迅速にさらに効率的にクローニングする。TOPO(登録商標)クローニングにとって重要なものは酵素トポイソメラーゼIである。前記酵素の通常の役割は切れ目を入れスーパーコイルDNAをリラックスさせ、続いて複製中に末端を再結合させることである。トポイソメラーゼの再結合活性の利点を有する種々のクローニングおよび発現ベクターがデザインされ、わずか5分でPCR生成物を結合することを可能にした。下記のリストは、配列番号:16のDNAポリメラーゼで増幅したPCR生成物の増幅のために現在利用可能なTOPO(登録商標)ベクターのいくつかの概略である:pCR(登録商標)−BluntII−TOPO(登録商標);pCR(登録商標)4Blunt−TOPO(登録商標);pUniBlunt/V5−His−TOPO(登録商標);pUniD/V5−His−TPPO(登録商標)。
【0214】
実施例5:配列番号:16の逆転写酵素活性
ポリdT DNAプライマーを用いてポリAテールをもつメッセンジャーRNAとハイブリダイズさせた。これに以下を添加した:PCR緩衝液(種々の濃度のMn++とともにMg++含有または非含有)、dATP、dCTP、dGTP、配列番号:16のポリメラーゼ、およびアルファ−3H−dTTP。前記混合物を72℃でインキュベートし、その後TCA沈澱を行った。この沈殿により酵素により取り込まれたものから遊離ヌクレオチドは分離除去される。サンプルに取り込まれた放射能活性(CPM(カウント/分))は前記反応の逆転写活性を示している。図10は、Mg++の存在下および非存在下での配列番号:16のRT活性の比較を示す。
【0215】
実施例6:耐熱性アッセイ
活性化ウシ胸腺DNA伸長反応におけるアルファ−3H−dTTPのポリメラーゼによる取り込みによって酵素活性を測定した。以下を用いて反応混合物を準備した:PCR緩衝液、dATP、dGTP、dCTP、活性化ウシ胸腺DNA、およびアルファ−3H−dTTP。ポリメラーゼ酵素(緩衝液中)を85℃、90℃または95℃で種々の時間(0から240分)予備インキュベートした。前記熱処理の後、前記酵素を反応混合物に添加し、同じ温度で一定時間インキュベートした。続いてTCA沈澱を実施し、酵素によって取り込まれたヌクレオチドから遊離ヌクレオチドを分離した。ヌクレオチド取り込みサンプルの放射能活性(CPM)は反応時のポリメラーゼ活性量を示す。各温度について予備インキュベーションに対するCPMの表(酵素の耐熱性を示す)を作製することができる(図11参照)。
本発明を上記の実施例を参考に述べてきたが、改変および変更は本発明の範囲内に包含されることは理解されよう。したがって、本発明は特許請求の範囲によってのみ限定される。
添付の図面は本発明の実施態様の説明であって、請求の範囲によって包含される本発明の範囲を限定しようとするものではない。
【図面の簡単な説明】
【図1】図1Aから1Eは、ピロロブス・フマリア(Pyrolobus fumaria)由来のDNAポリメラーゼ(1PY2)のヌクレオチド配列および推定されるアミノ酸配列を示す(それぞれ配列番号:13および14)。再配列決定したところ、ヌクレオチド配列および推定されるアミノ酸配列は、配列番号:13および14に対して99%を越える相同性を示した(それぞれ配列番号:15および16を参照されたい)(図1F−1H(DNA)および図1I(アミノ酸))。
【図2】図2はコンピュータシステムのブロック図である。
【図3】図3は、新規なヌクレオチド配列またはタンパク質配列を配列データベースで比較し、新規な配列とデータベースの配列との間の相同性レベルを決定するプロセスの実施態様の1つを示したフローチャートである。
【図4】図4は、2つの配列が相同であるか否かを決定するコンピュータプロセスの実施態様の1つを示したフローチャートである。
【図5】図5は、配列内の特徴の有無を検出するアイデンティファイアープロセス300の実施態様の1つを示したフローチャートである。
【図6】図6は、実施例2で説明したように、配列番号:15によってコードされるポリメラーゼ(ポリペプチド=配列番号:16)およびTaqポリメラーゼを用いた変異の相対頻度を示す表である。
【図7】図7はゲルを示しており、配列番号:16が多数の鋳型を増幅し、Taqポリメラーゼと比較して大きな収量を生成できることを示している。
【図8】図8は、配列番号:16が25kbまでのラムダファージゲノムDNA鋳型をまた別に最適化を実施することなく増幅できることを示すゲルを提示している。
【図9】図9はゲルを示しており、レーン1は、GC含有量が90%を越えるIGFRIIのcDNAの一部を配列番号:16が良好に増幅できることを示している。
【図10】図10は、Mg++の存在下および非存在下での配列番号:16のRT活性の比較を示す。
【図11】図11は、85℃、90℃および95℃で4時間までの間の配列番号:16の安定性およびポリメラーゼ活性を示すグラフである。
Claims (114)
- 配列番号:1、3、5、7、9、11、13、15に記載の配列、および、その変種であって配列番号:1、3、5、7、9、11、13、15に記載の配列と少なくとも約50%の同一性を有しかつ約90℃から113℃の範囲の温度でポリメラーゼ活性を有するポリペプチドをコードする前記変種、から成る群から選択される配列を含む単離核酸。
- 配列番号:1、3、5、7、9、11、13、15に記載の配列、前記配列と実質的に同一の配列、および前記配列と相補的な配列、から成る群から選択される配列を含む請求項1に記載の単離核酸。
- 前記単離核酸がDNAである請求項1記載の単離核酸。
- 前記DNAがcDNA、ゲノムDNAまたは合成DNAである請求項3記載の単離核酸。
- 請求項1記載の核酸と高ストリンジェンシー条件下でハイブリダイズする単離核酸。
- 請求項1記載の核酸と中等度のストリンジェンシー条件下でハイブリダイズする単離核酸。
- 請求項1記載の核酸と低ストリンジェンシー条件下でハイブリダイズする単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも約55%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも約60%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも約65%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも70%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも約75%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも80%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも約85%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも90%の相同性を有する単離核酸。
- 配列比較アルゴリズムによる分析で決定したとき、請求項1記載の核酸と少なくとも約95%の相同性を有する単離核酸。
- 前記配列比較アルゴリズムが、デフォルトパラメーターを用いたFASTAバージョン3.0t78である請求項1、2、8、9、10、11、12、13、14、15または16記載の単離核酸。
- 配列番号:1、3、5、7、9、11、13、15に記載の配列、前記配列と実質的に同一の配列、および前記配列と相補的な配列から成る群から選択される配列の少なくとも10個の連続した塩基を含む単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも約50%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも約55%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも約60%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも65%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも70%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも75%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも80%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも85%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも90%の相同性を有する単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項1記載の核酸と少なくとも95%の相同性を有する単離核酸。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列から成る群から選択される配列を有するポリペプチドをコードする単離核酸。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列から成る群から選択される配列を有するポリペプチドの少なくとも10個の連続するアミノ酸を含むポリペプチドをコードする単離核酸。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと実質的に同一の精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約50%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約55%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約60%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約65%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも70%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約75%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも80%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約85%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約90%の相同性を有する精製ポリペプチド。
- 配列比較アルゴリズムまたはデフォルトパラメーターを用いたFASTAバージョン3.0t78による分析で決定したとき、請求項29または30記載のポリペプチドと少なくとも約95%の相同性を有する精製ポリペプチド。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列を有する精製ポリペプチドであって、約70℃から113℃の範囲の温度でポリメラーゼ活性を有する前記精製ポリペプチド。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列を有する精製ポリペプチドであって、3’→5’エキソヌクレアーゼ活性を有する前記精製ポリペプチド。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列から成る群から選択される配列を含むポリペプチドと特異的に結合する精製抗体。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列から成る群から選択されるポリペプチドの少なくとも10個の連続したアミノ酸を有するポリペプチドと特異的に結合する精製抗体。
- ポリクローナルである請求項44または45記載の抗体。
- モノクローナルである請求項44または45記載の抗体。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列を有するポリペプチドを製造する方法であって、前記方法が、前記ポリペプチドをコードする核酸を、前記ポリペプチドの発現を許容する条件下で宿主細胞に導入し、さらに前記ポリペプチドを回収することを含む前記ポリペプチドを製造する方法。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列、および前記配列と実質的に同一の配列から成る群から選択される配列の少なくとも10個の連続したアミノ酸を含むポリペプチドを製造する方法であって、プロ−モーターに連結された前記ポリペプチドをコードする核酸を、前記ポリペプチドの発現を許容する条件下で宿主細胞に導入し、さらに前記ポリペプチドを回収することを含む前記ポリペプチドを製造する方法。
- 配列番号:1、3、5、7、9、11、13、15に記載の配列、前記配列と実質的に同一の配列、前記配列と相補的な配列、少なくとも30個の連続した前記ヌクレオチドを含むフラグメント、および配列番号:1、3、5、7、9、11または13、15に記載の配列と相補的な配列の少なくとも約30個の連続したヌクレオチドを含むフラグメントから成る群から選択される配列を含む核酸を入手し;さらに
前記配列中の1つまたは2つ以上のヌクレオチドを別のヌクレオチドに改変するか、前記配列中の1つまたは2つ以上のヌクレオチドを欠失させるか、または前記配列に1つまたは2つ以上のヌクレオチドを付加することを含む、変種の作製方法。 - 改変が、変異性PCR、シャッフリング、オリゴヌクレオチド特異的突然変異導入、アッセンブリーPCR、有性PCR突然変異導入、in vivo突然変異導入、カセット突然変異導入、循環アンサンブル突然変異導入、指数的アンサンブル突然変異導入、部位特異的突然変異導入、遺伝子再アッセンブリー、遺伝子部位飽和突然変異導入および前記の任意の組み合わせから成る群から選択される方法によって導入される請求項50記載の方法。
- 改変が変異性PCRによって導入される請求項50記載の方法。
- 改変がシャッフリングによって導入される請求項50記載の方法。
- 改変がオリゴヌクレオチド特異的突然変異導入によって導入される請求項50記載の方法。
- 改変がアッセンブリーPCRによって導入される請求項50記載の方法。
- 改変が有性PCR突然変異導入によって導入される請求項50記載の方法。
- 改変がin vivo突然変異導入によって導入される請求項50記載の方法。
- 改変がカセット突然変異導入によって導入される請求項50記載の方法。
- 改変が循環アンサンブル突然変異導入によって導入される請求項50記載の方法。
- 改変が指数的アンサンブル突然変異導入によって導入される請求項50記載の方法。
- 前変が部位特異的突然変異導入によって導入される請求項50記載の方法。
- 改変が遺伝子再アッセンブリーによって導入される請求項50記載の方法。
- 改変が遺伝子部位飽和突然変異導入によって導入される請求項50記載の方法。
- 配列番号:1、3、5、7、9、11、13、15に記載の配列および前記配列と実質的に同一の配列から成る群から選択される核酸配列、または、配列配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列、から成る群から選択されるポリペプチド配列を保存したコンピュータ読取り可能媒体。
- プロセッサおよびデータ保存装置を含むコンピュータシステムであって、前記データ保存装置が、配列番号:1、3、5、7、9、11および13、15に記載の配列、並びに前記配列と実質的に同一の配列から成る群から選択される核酸配列、または配列配列番号:2、4、6、8、10、12、14、16に記載の配列、および前記配列と実質的に同一の配列から成る群から選択されるポリペプチド配列を保存してある前記コンピュータシステム。
- さらに配列比較アルゴリズムおよび少なくとも1つのリファレンス配列が保存してあるデータ保存装置を含む請求項65記載のコンピュータシステム。
- 配列比較アルゴリズムが、多形性を表示するコンピュータプログラムを含む請求項66記載のコンピュータシステム。
- さらに配列の特徴を同定する認識機構を含む請求項65記載のコンピュータシステム。
- 第一の配列とリファレンス配列を比較する方法であって、第一の配列が、配列番号:1、3、5、7、9、11、13、15に記載の配列および前記配列と実質的に同一の配列から成る群から選択される核酸配列、または、配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列から成る群から選択されるポリペプチド配列であって、
前記第一の配列およびリファレンス配列を、配列を比較するコンピュータプログラムを使用して読取り、さらに
前記第一の配列と前記リファレンス配列との間の相違を前記コンピュータプログラムにより決定することを含む、前記方法。 - 第一の配列とリファレンス配列との間の相違の決定が多型性を同定することを含む請求項69に記載の方法。
- 配列番号:1、3、5、7、9、11、13、15に記載の配列、前記配列と実質的に同一の配列から成る群から選択される配列、または配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列から成る群から選択されるポリペプチド配列における特徴を同定する方法であって、
配列の特性を認識するコンピュータプログラムを使用して前記配列を読取り、さらに
前記コンピュータプログラムにより前記配列の特徴を認識することを含む、前記配列の特徴を同定する方法。 - 熱に対して安定であり、耐熱性であり、さらに核酸配列の生成または修復を触媒する酵素であり、さらに、約60℃から113℃の温度に曝露した後で復元可能であって活性を取り戻すことができる酵素である、請求項1記載の精製ポリペプチド。
- 配列番号:2、4、6、8、10、12、14、16に記載の配列、および少なくとも50%の相同性を有する配列から成る群から選択されるポリペプチドであって、さらにポリメラーゼ酵素活性を有するポリペプチドと核酸とを含むサンプルを、核酸配列の生成または修復を促進する条件下で接触させることを含む、核酸配列の生成または修復を触媒する方法。
- 配列番号1、3、5、7、9、11、13、15に記載の配列のフラグメントおよび前記配列と実質的に同一の配列のフラグメントによってコードされる機能的ポリペプチドフラグメントまたは変種であって、配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列を有するポリペプチドの酵素機能を保持するものを同定するアッセイであって、
配列番号:2、4、6、8、10、12、14、16に記載の配列および前記配列と実質的に同一の配列のポリペプチド、または配列番号1、3、5、7、9、11、13もしくは15によってコードされるポリペプチドフラグメントまたは変種を、前記ポリペプチドまたはフラグメントまたは変種が機能できる条件下で基質と接触させること;および、
基質レベルの低下または前記ポリペプチドと基質間の反応における反応生成物のレベルの増加を検出することを含み、
基質レベルの低下または反応生成物のレベル増加が機能的ポリペプチドまたはフラグメントまたは変種の指標となる前記アッセイ。 - 請求項1記載のポリヌクレオチドによってコードされるポリペプチドをPCR増幅反応においてDNA鋳型と接触させることを含むポリヌクレオチドの製造方法であって、前記鋳型分子の長さが約20kbより大きい前記ポリヌクレオチドの製造方法。
- 請求項1記載のポリヌクレオチドによってコードされるポリペプチドをPCR増幅反応においてDNA鋳型と接触させることを含むポリヌクレオチドの製造方法であって、前記鋳型分子が約90%を越えるグアニジン−シトシン(GC)含有量を含む前記製造方法。
- 約10から50ヌクレオチド長のオリゴヌクレオチドを含み、さらに配列番号:1、3、5、7、9、11、13、および15に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも50%相補的である少なくとも10個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的:ローブ二重鎖を生成する核酸プローブ。
- オリゴヌクレオチドがDNAである請求項77記載のプローブ。
- 核酸標的領域と少なくとも55%の相補性を有する請求項77記載のプローブ。
- 核酸標的領域と少なくとも60%の相補性を有する請求項77記載のプローブ。
- 核酸標的領域と少なくとも65%の相補性を有する請求項77記載のプローブ。
- 核酸標的領域と少なくとも70%の相補性を有する請求項77記載のプローブ。
- 核酸標的領域と少なくとも75%の相補性を有する請求項77記載のプローブ。
- オリゴヌクレオチドが、核酸標的領域と80%の相補性を有する請求項77記載のプローブ。
- 核酸標的領域と少なくとも85%の相補性を有する請求項77記載のプローブ。
- オリゴヌクレオチドが、核酸標的領域と90%の相補性を有する配列を含む請求項77記載のプローブ。
- 核酸標的領域と少なくとも95%の相補性を有する請求項77記載のプローブ。
- 核酸標的領域と完全に相補的である請求項77記載のプローブ。
- オリゴヌクレオチドの長さが15−50ヌクレオチドである請求項77記載のプローブ。
- プローブがさらに検出可能なアイソトープ標識を含む請求項77記載のプローブ。
- プローブがさらに、蛍光分子、化学発光分子、酵素、補助因子、酵素基質およびハプテンから成る群から選択される非アイソトープ標識を含む請求項77記載のプローブ。
- 長さが約15から50ヌクレオチドのオリゴヌクレオチドを含み、さらに配列番号:1、3、5、7、9、11、13、および15に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも90%相補性である少なくとも15個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的:プローブ二重鎖を生成する核酸プローブ。
- 長さが約15から50ヌクレオチドのオリゴヌクレオチドを含み、さらに配列番号:1、3、5、7、9、11、13、および15に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも95%相補性である少なくとも15個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的:プローブ二重鎖を生成する核酸プローブ。
- 長さが約15から50ヌクレオチドのオリゴヌクレオチドを含み、さらに配列番号:1、3、5、7、9、11、13および15に記載の配列から成る群から選択される核酸配列の核酸標的領域と少なくとも97%相補的である少なくとも15個の連続したヌクレオチド領域を有し、さらに前記核酸標的領域と中等度から高度にストリンジェントな条件下でハイブリダイズして検出可能な標的:プローブ二重鎖を生成する核酸プローブ。
- 配列番号:1、3、5、7、9、11、13または15に記載の配列の少なくとも一部分と同じであるかまたは相補的である配列を有する、ポリメラーゼ遺伝子を単離または同定するためのポリヌクレオチドプローブ。
- 請求項19または32のいずれかに記載のポリペプチドを含む液体酵素調製物。
- 請求項19または32のいずれかに記載のポリペプチドを含む乾燥酵素調製物。
- 請求項1のポリヌクレオチドによってコードされるポリペプチドまたはそのフラグメントを小分子と混合して、改変小分子を生成することを含む小分子の改変方法。
- 改変小分子ライブラリーを試験して、所望の活性を示す改変小分子が前記ライブラリーに存在するか否かを決定する請求項98記載の方法。
- ライブラリーの一部分を生成するために用いられた生物触媒反応の各々を系統的に除去し、続いて前記ライブラリーの一部分で生成された小分子を所望の活性を有する改変小分子の有無について分析することによって、所望の活性をもつ改変小分子を生成する特異的な生物触媒反応を同定する請求項99記載の方法。
- 所望の活性をもつ前記改変小分子を生成する特異的な生物触媒反応が場合により繰り返される請求項100記載の方法。
- (a)生物触媒反応が、小分子の構造内に見出される別々の構造部分と反応する一群の生物触媒によって行われ;
(b)各生物触媒は1つの構造部分または一群の関連する構造部分について特異的であり;さらに
(c)各生物触媒は別個の構造部分を含む多くの異なる小分子と反応する、
請求項100または101記載の方法。 - 配列番号:2、4、6、8、10、12もしくは14、16に記載の配列または前記配列と相同な配列であるアミノ酸配列を有し、約90℃から113℃の範囲の温度でポリメラーゼ活性を有する精製タンパク質を収納する少なくとも1つの容器を含むキット。
- タンパク質が配列番号:16に記載の配列または前記配列と相同な配列で、約90℃から113℃の範囲の温度でポリメラーゼ活性を有する請求項103記載のキット。
- dNTP、PCR用調製水、標準長のGC富裕陽性コントロール鋳型、コントロールプライマーセット、または前記の任意の組み合わせを収納した少なくとも1つの容器をさらに含む請求項103記載のキット。
- 以下を含むDNA分子の配列を決定する方法:
(a)プライマーを第一のDNA分子とハイブリダイズさせること;
(b)前記第一のDNA分子をデオキシリボヌクレオシド三リン酸、請求項1記載のDNAポリメラーゼおよびターミネーター分子と接触させて混合物を作製すること;
(c)前記第一のDNA分子と相補的なDNA分子のランダムな集団を合成するために十分な条件下で前記混合物をインキュベートすることであって、前記合成されたDNA分子はその5’末端にターミネーターヌクレオチドを含んでおり;さらに
(d)前記第一のDNA分子のヌクレオチド配列の少なくとも一部分を決定することができるように前記合成されたDNA分子をサイズによって分離すること。 - デオキシリボヌクレオシド三リン酸が、イノシンdATP、dCTP、dGTP、dTTP、dITP、7−デアザ−dGTP、dUTP、[α−S]dATP、[α−S]dTTP、[α−S]dGTP、または[α−S]dCTPである請求項106の方法。
- ターミネーターヌクレオチドがddTTP、ddATP、ddGTP、ddITP、またはddCTPである請求項106の方法。
- 以下を含む、mRNAからcDNAを調製する方法:
(a)mRNAをオリゴ(dT)プライマーまたは他の相補性プライマーと接触させてハイブリッドを生成すること;および、
(b)cDNAが得られる条件下で、工程(a)で生成される前記ハイブリッドを請求項1のDNAポリメラーゼおよび4種の異なるdNTPと接触させること。 - 以下を含む二本鎖DNAの増幅方法:
(a)第一および第二のプライマーを提供することであって、ここで前記第一のプライマーは前記DNA分子の第一の鎖の3’末端または3’末端近くの配列と相補的で、さらに、前記第二のプライマーは前記DNA分子の第二の鎖の3’末端または3’末端近くの配列と相補的であり;
(b)請求項1のDNAポリメラーゼの存在下で、前記第一の鎖と相補的な第三のDNA分子および前記第二の鎖と相補的な第四の鎖が合成されるような条件下で、前記第一の鎖と前記プライマーをハイブリダイズさせ、および、前記第二の鎖と前記第二のプライマーをハイブリダイズさせること;
(c)前記第一と第三の鎖、および前記第二と第四の鎖を変性させること;および、
(d)(a)から(c)までの工程を1回または2回以上繰り返して増幅DNA分子を生成すること。 - さらに増幅DNA分子をベクターに挿入することを含む請求項110記載の方法。
- ベクターがプラスミドである請求項111記載の方法。
- 請求項1記載のポリヌクレオチドによってコードされるポリペプチドをPCR増幅反応でDNA鋳型と接触させることを含む、非天然ヌクレオチドまたはヌクレオチド類似体をDNA分子に取り込ませる方法。
- ヌクレオチドがイノシン、2−アミノプリンまたは5−メチルシトシンから選択される請求項113記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/656,309 US7049101B1 (en) | 1997-08-06 | 2000-09-06 | Enzymes having high temperature polymerase activity and methods of use thereof |
PCT/US2001/028007 WO2002020735A2 (en) | 2000-09-06 | 2001-09-06 | Enzymes having high temperature polymerase activity and methods of use thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004523211A true JP2004523211A (ja) | 2004-08-05 |
JP2004523211A5 JP2004523211A5 (ja) | 2005-04-28 |
Family
ID=24632506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002525742A Pending JP2004523211A (ja) | 2000-09-06 | 2001-09-06 | 高温ポリメラーゼ活性を有する酵素およびその使用方法 |
Country Status (6)
Country | Link |
---|---|
US (5) | US7049101B1 (ja) |
EP (1) | EP1315803A2 (ja) |
JP (1) | JP2004523211A (ja) |
AU (1) | AU2001288859A1 (ja) |
CA (1) | CA2419975A1 (ja) |
WO (1) | WO2002020735A2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPS115502A0 (en) * | 2002-03-18 | 2002-04-18 | Diatech Pty Ltd | Assessing data sets |
BR0314558A (pt) * | 2002-10-10 | 2005-08-09 | Diversa Corp | Proteases, ácidos nucléicos codificando as mesmas e processos para preparar e usar as mesmas |
US7960157B2 (en) * | 2002-12-20 | 2011-06-14 | Agilent Technologies, Inc. | DNA polymerase blends and uses thereof |
EP1601332A4 (en) * | 2003-03-07 | 2012-05-02 | Verenium Corp | HYDROLASES, NUCLEIC ACIDS ENCODING THEM, AND METHODS OF MAKING AND USING SAME |
US20080070291A1 (en) | 2004-06-16 | 2008-03-20 | David Lam | Compositions and Methods for Enzymatic Decolorization of Chlorophyll |
WO2006031699A2 (en) | 2004-09-10 | 2006-03-23 | Diversa Corporation | Compositions and methods for making and modifying oils |
WO2006030455A1 (en) * | 2004-09-17 | 2006-03-23 | Prokaria Ehf. | Dna polymerases having strand displacement activity |
US20110245094A1 (en) * | 2008-05-02 | 2011-10-06 | Immunetics, Inc. | Detection of microbial nucleic acids |
GB201007384D0 (en) | 2010-04-30 | 2010-06-16 | Medical Res Council | Enzymes |
US9309501B2 (en) | 2012-12-24 | 2016-04-12 | Industrial Technology Research Institute | Isolated DNA polymerases, kits and applications thereof |
US10494665B2 (en) * | 2014-08-20 | 2019-12-03 | Huawei Yang | Test kit and method for testing target nucleic acid in sample |
WO2019143622A1 (en) | 2018-01-19 | 2019-07-25 | Bio-Rad Laboratories, Inc. | Mutant dna polymerases |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1531A (en) * | 1840-03-31 | Kockiltor-chaib | ||
US4165188A (en) | 1977-02-17 | 1979-08-21 | Sycor, Inc. | Ribbon mask and guide for dot matrix impact printers |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
IL95738A (en) * | 1989-09-23 | 1996-11-14 | Hoechst Ag | Antibodies against the well-preserved amino acid sequences of insulin, a process for their preparation and use in immunoassay |
US5322785A (en) | 1990-04-26 | 1994-06-21 | New England Biolabs, Inc. | Purified thermostable DNA polymerase obtainable from thermococcus litoralis |
US5770429A (en) * | 1990-08-29 | 1998-06-23 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
US5541311A (en) | 1992-12-07 | 1996-07-30 | Third Wave Technologies, Inc. | Nucleic acid encoding synthesis-deficient thermostable DNA polymerase |
US5491086A (en) | 1993-05-14 | 1996-02-13 | Hoffmann-La Roche Inc. | Purified thermostable nucleic acid polymerase and DNA coding sequences from pyrodictium species |
USH1531H (en) | 1994-04-18 | 1996-05-07 | Blumentals; Ilse I. | Thermophilic DNA polymerase |
JP3132624B2 (ja) | 1994-05-09 | 2001-02-05 | 東洋紡績株式会社 | 超好熱始原菌由来のdnaポリメラーゼ遺伝子およびその用途 |
JP3498808B2 (ja) | 1994-06-09 | 2004-02-23 | タカラバイオ株式会社 | Dnaポリメラーゼ遺伝子 |
US6077664A (en) | 1995-06-07 | 2000-06-20 | Promega Corporation | Thermophilic DNA polymerases from Thermotoga neapolitana |
US5939250A (en) * | 1995-12-07 | 1999-08-17 | Diversa Corporation | Production of enzymes having desired activities by mutagenesis |
EP0822256B1 (en) | 1996-07-29 | 2003-09-24 | Toyo Boseki Kabushiki Kaisha | Modified thermostable DNA polymerase, and DNA polymerase composition for nucleic acid amplification |
US6057098A (en) * | 1997-04-04 | 2000-05-02 | Biosite Diagnostics, Inc. | Polyvalent display libraries |
US5948666A (en) * | 1997-08-06 | 1999-09-07 | Diversa Corporation | Isolation and identification of polymerases |
-
2000
- 2000-09-06 US US09/656,309 patent/US7049101B1/en not_active Expired - Fee Related
-
2001
- 2001-09-06 AU AU2001288859A patent/AU2001288859A1/en not_active Abandoned
- 2001-09-06 CA CA002419975A patent/CA2419975A1/en not_active Abandoned
- 2001-09-06 JP JP2002525742A patent/JP2004523211A/ja active Pending
- 2001-09-06 EP EP01968622A patent/EP1315803A2/en not_active Withdrawn
- 2001-09-06 WO PCT/US2001/028007 patent/WO2002020735A2/en not_active Application Discontinuation
- 2001-12-21 US US10/034,849 patent/US20020115108A1/en not_active Abandoned
- 2001-12-21 US US10/034,621 patent/US7781198B2/en not_active Expired - Fee Related
- 2001-12-21 US US10/029,382 patent/US20020164618A1/en not_active Abandoned
-
2010
- 2010-07-02 US US12/830,157 patent/US8148126B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8148126B2 (en) | 2012-04-03 |
AU2001288859A1 (en) | 2002-03-22 |
WO2002020735A3 (en) | 2003-03-06 |
EP1315803A2 (en) | 2003-06-04 |
US20110195479A1 (en) | 2011-08-11 |
US20020115108A1 (en) | 2002-08-22 |
US20020132997A1 (en) | 2002-09-19 |
US7781198B2 (en) | 2010-08-24 |
US20020164618A1 (en) | 2002-11-07 |
CA2419975A1 (en) | 2002-03-14 |
US7049101B1 (en) | 2006-05-23 |
WO2002020735A2 (en) | 2002-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9453211B2 (en) | Dehalogenases, nucleic acids encoding them and methods for making and using them | |
US20030044956A1 (en) | Enzymes having carboxymethyl cellulase activity and methods of use thereof | |
US8148126B2 (en) | Polymerase | |
JP4261799B2 (ja) | 鏡像異性的に純粋なα−置換カルボン酸の製造方法 | |
US20050186605A1 (en) | Phosphatase -encoding nucleic acids and methods of making and using them | |
US20020132295A1 (en) | Enzymes having transaminase and aminotransferase activity and methods of use thereof | |
US20020137171A1 (en) | Hydrolase enzymes and their use in kinetic resolution | |
US20050202494A1 (en) | Catalases | |
US7056703B2 (en) | Polypeptides having polymerase activity and methods of use thereof | |
US20050221364A1 (en) | Enzymes having alpha-galactosidase activity and methods of use thereof | |
US7288400B2 (en) | Nucleic acids encoding esterases and methods of making and using them | |
US20020137185A1 (en) | Enzymes having amidase activity and methods of use thereof | |
US20020120118A1 (en) | Enzymes having endoglucanase activity and methods of use thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060306 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060731 |