JP2021131901A - 酵素バリアントの自動スクリーニング - Google Patents
酵素バリアントの自動スクリーニング Download PDFInfo
- Publication number
- JP2021131901A JP2021131901A JP2021089944A JP2021089944A JP2021131901A JP 2021131901 A JP2021131901 A JP 2021131901A JP 2021089944 A JP2021089944 A JP 2021089944A JP 2021089944 A JP2021089944 A JP 2021089944A JP 2021131901 A JP2021131901 A JP 2021131901A
- Authority
- JP
- Japan
- Prior art keywords
- substrate
- protein
- sequence
- enzyme
- variants
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004190 Enzymes Human genes 0.000 title abstract description 205
- 108090000790 Enzymes Proteins 0.000 title abstract description 203
- 238000012216 screening Methods 0.000 title abstract description 108
- 238000000034 method Methods 0.000 abstract description 351
- 239000000758 substrate Substances 0.000 abstract description 229
- 230000000694 effects Effects 0.000 abstract description 91
- 238000003032 molecular docking Methods 0.000 abstract description 77
- 238000006555 catalytic reaction Methods 0.000 abstract description 16
- 230000002349 favourable effect Effects 0.000 abstract description 12
- 102000004169 proteins and genes Human genes 0.000 description 209
- 108090000623 proteins and genes Proteins 0.000 description 208
- 235000018102 proteins Nutrition 0.000 description 205
- 229940088598 enzyme Drugs 0.000 description 200
- 238000006243 chemical reaction Methods 0.000 description 114
- 239000003446 ligand Substances 0.000 description 113
- 230000008569 process Effects 0.000 description 109
- 230000027455 binding Effects 0.000 description 73
- 238000012163 sequencing technique Methods 0.000 description 70
- 108090000765 processed proteins & peptides Proteins 0.000 description 67
- 102000004196 processed proteins & peptides Human genes 0.000 description 58
- 230000035772 mutation Effects 0.000 description 54
- 150000007523 nucleic acids Chemical class 0.000 description 52
- 229920001184 polypeptide Polymers 0.000 description 52
- 239000012634 fragment Substances 0.000 description 47
- 102000039446 nucleic acids Human genes 0.000 description 47
- 108020004707 nucleic acids Proteins 0.000 description 47
- 108020004414 DNA Proteins 0.000 description 44
- 108091034117 Oligonucleotide Proteins 0.000 description 38
- 125000004429 atom Chemical group 0.000 description 37
- 230000003197 catalytic effect Effects 0.000 description 37
- 238000003041 virtual screening Methods 0.000 description 37
- 238000000338 in vitro Methods 0.000 description 34
- 235000001014 amino acid Nutrition 0.000 description 33
- 239000006225 natural substrate Substances 0.000 description 33
- 150000001413 amino acids Chemical class 0.000 description 32
- 238000003752 polymerase chain reaction Methods 0.000 description 31
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 230000003993 interaction Effects 0.000 description 29
- 239000002773 nucleotide Substances 0.000 description 29
- 239000000126 substance Substances 0.000 description 29
- 239000000047 product Substances 0.000 description 28
- 210000004027 cell Anatomy 0.000 description 24
- 239000000543 intermediate Substances 0.000 description 24
- 108091033319 polynucleotide Proteins 0.000 description 24
- 102000040430 polynucleotide Human genes 0.000 description 24
- 239000002157 polynucleotide Substances 0.000 description 24
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 23
- 231100000350 mutagenesis Toxicity 0.000 description 22
- 238000000126 in silico method Methods 0.000 description 21
- 230000006798 recombination Effects 0.000 description 21
- 238000005215 recombination Methods 0.000 description 21
- KWOLFJPFCHCOCG-UHFFFAOYSA-N Acetophenone Chemical compound CC(=O)C1=CC=CC=C1 KWOLFJPFCHCOCG-UHFFFAOYSA-N 0.000 description 20
- 238000002703 mutagenesis Methods 0.000 description 19
- 238000006722 reduction reaction Methods 0.000 description 19
- 230000007704 transition Effects 0.000 description 19
- 102000004316 Oxidoreductases Human genes 0.000 description 18
- 108090000854 Oxidoreductases Proteins 0.000 description 18
- 125000003275 alpha amino acid group Chemical group 0.000 description 18
- 238000003556 assay Methods 0.000 description 18
- 230000009467 reduction Effects 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 16
- 102000005751 Alcohol Oxidoreductases Human genes 0.000 description 14
- 108010031132 Alcohol Oxidoreductases Proteins 0.000 description 14
- 241000894007 species Species 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000006460 hydrolysis reaction Methods 0.000 description 12
- 150000002500 ions Chemical class 0.000 description 12
- 230000007246 mechanism Effects 0.000 description 12
- -1 transition states Substances 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 11
- 238000004590 computer program Methods 0.000 description 11
- 230000007062 hydrolysis Effects 0.000 description 11
- 230000000670 limiting effect Effects 0.000 description 11
- 238000000329 molecular dynamics simulation Methods 0.000 description 11
- 230000003647 oxidation Effects 0.000 description 11
- 238000007254 oxidation reaction Methods 0.000 description 11
- 230000002441 reversible effect Effects 0.000 description 11
- PTKRUDMLGIIORX-ITGWJZMWSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2r,3s,4r,5r)-5-(3-carbamoyl-4h-pyridin-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl hydrogen phosphate;cyclohexanamine Chemical compound NC1CCCCC1.NC1CCCCC1.NC1CCCCC1.NC1CCCCC1.C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 PTKRUDMLGIIORX-ITGWJZMWSA-N 0.000 description 10
- 239000011324 bead Substances 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 150000002466 imines Chemical class 0.000 description 10
- 230000015654 memory Effects 0.000 description 10
- 238000007481 next generation sequencing Methods 0.000 description 10
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 108091093088 Amplicon Proteins 0.000 description 9
- 108090000340 Transaminases Proteins 0.000 description 9
- 102000003929 Transaminases Human genes 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 238000013459 approach Methods 0.000 description 9
- 239000007806 chemical reaction intermediate Substances 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 230000009881 electrostatic interaction Effects 0.000 description 9
- 150000002576 ketones Chemical class 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 8
- 102000010909 Monoamine Oxidase Human genes 0.000 description 8
- 108010062431 Monoamine oxidase Proteins 0.000 description 8
- 108010033272 Nitrilase Proteins 0.000 description 8
- 238000005411 Van der Waals force Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 125000000524 functional group Chemical group 0.000 description 8
- 239000003112 inhibitor Substances 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 238000004886 process control Methods 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 7
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 7
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 7
- 125000003277 amino group Chemical group 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 150000003944 halohydrins Chemical class 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 125000004430 oxygen atom Chemical group O* 0.000 description 7
- 238000007614 solvation Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 108700023418 Amidases Proteins 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 102000004317 Lyases Human genes 0.000 description 6
- 108090000856 Lyases Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 102000005922 amidase Human genes 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 238000000137 annealing Methods 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 6
- 108010013164 halohydrin dehalogenase Proteins 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- 108090000769 Isomerases Proteins 0.000 description 5
- 102000004195 Isomerases Human genes 0.000 description 5
- 102000003960 Ligases Human genes 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 5
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 5
- 108091005804 Peptidases Proteins 0.000 description 5
- 125000002252 acyl group Chemical group 0.000 description 5
- 239000000556 agonist Substances 0.000 description 5
- 239000005557 antagonist Substances 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000005695 dehalogenation reaction Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 5
- 235000019441 ethanol Nutrition 0.000 description 5
- 239000007850 fluorescent dye Substances 0.000 description 5
- 238000010353 genetic engineering Methods 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 238000000734 protein sequencing Methods 0.000 description 5
- 238000012175 pyrosequencing Methods 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- 101150051438 CYP gene Proteins 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 102000004157 Hydrolases Human genes 0.000 description 4
- 108090000604 Hydrolases Proteins 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- 238000005481 NMR spectroscopy Methods 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 102000004357 Transferases Human genes 0.000 description 4
- 108090000992 Transferases Proteins 0.000 description 4
- 229910052782 aluminium Inorganic materials 0.000 description 4
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 150000005829 chemical entities Chemical class 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000011835 investigation Methods 0.000 description 4
- 125000000468 ketone group Chemical group 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 4
- QKFJKGMPGYROCL-UHFFFAOYSA-N phenyl isothiocyanate Chemical compound S=C=NC1=CC=CC=C1 QKFJKGMPGYROCL-UHFFFAOYSA-N 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 230000005610 quantum mechanics Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000002922 simulated annealing Methods 0.000 description 4
- 230000000707 stereoselective effect Effects 0.000 description 4
- 238000012916 structural analysis Methods 0.000 description 4
- 238000006276 transfer reaction Methods 0.000 description 4
- 238000004627 transmission electron microscopy Methods 0.000 description 4
- 235000011178 triphosphate Nutrition 0.000 description 4
- 239000001226 triphosphate Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 101710088194 Dehydrogenase Proteins 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 108010029182 Pectin lyase Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 239000011248 coating agent Substances 0.000 description 3
- 238000000576 coating method Methods 0.000 description 3
- 239000005515 coenzyme Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000013400 design of experiment Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000013537 high throughput screening Methods 0.000 description 3
- 238000006317 isomerization reaction Methods 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 238000010641 nitrile hydrolysis reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000033116 oxidation-reduction process Effects 0.000 description 3
- 238000000053 physical method Methods 0.000 description 3
- 239000011148 porous material Substances 0.000 description 3
- 239000013641 positive control Substances 0.000 description 3
- 230000003334 potential effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 238000002708 random mutagenesis Methods 0.000 description 3
- 238000009790 rate-determining step (RDS) Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000007841 sequencing by ligation Methods 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 2
- 102000016912 Aldehyde Reductase Human genes 0.000 description 2
- 108010053754 Aldehyde reductase Proteins 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108010065511 Amylases Proteins 0.000 description 2
- 102000013142 Amylases Human genes 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 102000004867 Hydro-Lyases Human genes 0.000 description 2
- 108090001042 Hydro-Lyases Proteins 0.000 description 2
- RRHGJUQNOFWUDK-UHFFFAOYSA-N Isoprene Chemical compound CC(=C)C=C RRHGJUQNOFWUDK-UHFFFAOYSA-N 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- 108010029541 Laccase Proteins 0.000 description 2
- 108010054320 Lignin peroxidase Proteins 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 108010084650 alpha-N-arabinofuranosidase Proteins 0.000 description 2
- 235000019418 amylase Nutrition 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 108010055059 beta-Mannosidase Proteins 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000012938 design process Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 229910003460 diamond Inorganic materials 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 238000012203 high throughput assay Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002858 neurotransmitter agent Substances 0.000 description 2
- 150000002825 nitriles Chemical class 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010087558 pectate lyase Proteins 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 229940117953 phenylisothiocyanate Drugs 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- PJGSXYOJTGTZAV-UHFFFAOYSA-N pinacolone Chemical compound CC(=O)C(C)(C)C PJGSXYOJTGTZAV-UHFFFAOYSA-N 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 238000006479 redox reaction Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 238000007671 third-generation sequencing Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- GETQZCLCWQTVFV-UHFFFAOYSA-N trimethylamine Chemical compound CN(C)C GETQZCLCWQTVFV-UHFFFAOYSA-N 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000002424 x-ray crystallography Methods 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- DFUSDJMZWQVQSF-XLGIIRLISA-N (2r)-2-methyl-2-[(4r,8r)-4,8,12-trimethyltridecyl]-3,4-dihydrochromen-6-ol Chemical class OC1=CC=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1 DFUSDJMZWQVQSF-XLGIIRLISA-N 0.000 description 1
- FHUDAMLDXFJHJE-UHFFFAOYSA-N 1,1,1-trifluoropropan-2-one Chemical compound CC(=O)C(F)(F)F FHUDAMLDXFJHJE-UHFFFAOYSA-N 0.000 description 1
- TUSDEZXZIZRFGC-UHFFFAOYSA-N 1-O-galloyl-3,6-(R)-HHDP-beta-D-glucose Natural products OC1C(O2)COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC1C(O)C2OC(=O)C1=CC(O)=C(O)C(O)=C1 TUSDEZXZIZRFGC-UHFFFAOYSA-N 0.000 description 1
- PQMRRAQXKWFYQN-UHFFFAOYSA-N 1-phenyl-2-sulfanylideneimidazolidin-4-one Chemical class S=C1NC(=O)CN1C1=CC=CC=C1 PQMRRAQXKWFYQN-UHFFFAOYSA-N 0.000 description 1
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 1
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 102000005369 Aldehyde Dehydrogenase Human genes 0.000 description 1
- 108020002663 Aldehyde Dehydrogenase Proteins 0.000 description 1
- 102100026452 Aldo-keto reductase family 1 member B15 Human genes 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 101710197852 Baeyer-Villiger monooxygenase Proteins 0.000 description 1
- 238000006220 Baeyer-Villiger oxidation reaction Methods 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 229910014033 C-OH Inorganic materials 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 102000007132 Carboxyl and Carbamoyl Transferases Human genes 0.000 description 1
- 108010072957 Carboxyl and Carbamoyl Transferases Proteins 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 229910014570 C—OH Inorganic materials 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 108020005199 Dehydrogenases Proteins 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 108700034637 EC 3.2.-.- Proteins 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 101710095439 Erlin Proteins 0.000 description 1
- 101100145035 Escherichia coli rns gene Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 101710137307 FAD-containing monooxygenase EthA Proteins 0.000 description 1
- 239000001263 FEMA 3042 Substances 0.000 description 1
- 108010042891 Farnesol dehydrogenase Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 1
- 108091005973 GFP derivatives Proteins 0.000 description 1
- 108010015133 Galactose oxidase Proteins 0.000 description 1
- 108010093031 Galactosidases Proteins 0.000 description 1
- 102000002464 Galactosidases Human genes 0.000 description 1
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- 108020000311 Glutamate Synthase Proteins 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000008015 Hemeproteins Human genes 0.000 description 1
- 108010089792 Hemeproteins Proteins 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 1
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 238000004510 Lennard-Jones potential Methods 0.000 description 1
- 101001110310 Lentilactobacillus kefiri NADP-dependent (R)-specific alcohol dehydrogenase Proteins 0.000 description 1
- 102000003820 Lipoxygenases Human genes 0.000 description 1
- 108090000128 Lipoxygenases Proteins 0.000 description 1
- 108030004480 Long-chain acyl-[acyl-carrier-protein] reductases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 244000241838 Lycium barbarum Species 0.000 description 1
- 108010059896 Manganese peroxidase Proteins 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108010063372 N-Glycosyl Hydrolases Proteins 0.000 description 1
- 102000010722 N-Glycosyl Hydrolases Human genes 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283283 Orcinus orca Species 0.000 description 1
- 108700005081 Overlapping Genes Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108010044725 Pectate disaccharide-lyase Proteins 0.000 description 1
- 108010073038 Penicillin Amidase Proteins 0.000 description 1
- LRBQNJMCXXYXIU-PPKXGCFTSA-N Penta-digallate-beta-D-glucose Natural products OC1=C(O)C(O)=CC(C(=O)OC=2C(=C(O)C=C(C=2)C(=O)OC[C@@H]2[C@H]([C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)O2)OC(=O)C=2C=C(OC(=O)C=3C=C(O)C(O)=C(O)C=3)C(O)=C(O)C=2)O)=C1 LRBQNJMCXXYXIU-PPKXGCFTSA-N 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 102000015439 Phospholipases Human genes 0.000 description 1
- 108010064785 Phospholipases Proteins 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 244000173207 Phyllanthus amarus Species 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091007187 Reductases Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101000666920 Streptomyces hygroscopicus subsp. limoneus Validoxylamine A 7'-phosphate phosphatase Proteins 0.000 description 1
- 102000019259 Succinate Dehydrogenase Human genes 0.000 description 1
- 108010012901 Succinate Dehydrogenase Proteins 0.000 description 1
- 108020004530 Transaldolase Proteins 0.000 description 1
- 102100028601 Transaldolase Human genes 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 108010043652 Transketolase Proteins 0.000 description 1
- 102000014701 Transketolase Human genes 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 108010093941 acetylxylan esterase Proteins 0.000 description 1
- 108700014220 acyltransferase activity proteins Proteins 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000008484 agonism Effects 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 238000012884 algebraic function Methods 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 1
- 108010061261 alpha-glucuronidase Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 102000006614 amidinotransferase Human genes 0.000 description 1
- 108020004134 amidinotransferase Proteins 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229940025131 amylases Drugs 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- WFDXOXNFNRHQEC-GHRIWEEISA-N azoxystrobin Chemical compound CO\C=C(\C(=O)OC)C1=CC=CC=C1OC1=CC(OC=2C(=CC=CC=2)C#N)=NC=N1 WFDXOXNFNRHQEC-GHRIWEEISA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229910001423 beryllium ion Inorganic materials 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- YSNRTFFURISHOU-UHFFFAOYSA-N beta-farnesene Natural products C=CC(C)CCC=C(C)CCC=C(C)C YSNRTFFURISHOU-UHFFFAOYSA-N 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000003739 carbamimidoyl group Chemical group C(N)(=N)* 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000002144 chemical decomposition reaction Methods 0.000 description 1
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 231100000481 chemical toxicant Toxicity 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000004581 coalescence Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 150000001945 cysteines Chemical class 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 108091007734 digestive enzymes Proteins 0.000 description 1
- 102000038379 digestive enzymes Human genes 0.000 description 1
- 229910001882 dioxygen Inorganic materials 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000036267 drug metabolism Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000027721 electron transport chain Effects 0.000 description 1
- 238000000132 electrospray ionisation Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 229940066758 endopeptidases Drugs 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 150000002118 epoxides Chemical class 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 108010093305 exopolygalacturonase Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229920000140 heteropolymer Polymers 0.000 description 1
- 108010018734 hexose oxidase Proteins 0.000 description 1
- 238000012188 high-throughput screening assay Methods 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- OUUQCZGPVNCOIJ-UHFFFAOYSA-N hydroperoxyl Chemical compound O[O] OUUQCZGPVNCOIJ-UHFFFAOYSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- JDNTWHVOXJZDSN-UHFFFAOYSA-N iodoacetic acid Chemical group OC(=O)CI JDNTWHVOXJZDSN-UHFFFAOYSA-N 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000001948 isotopic labelling Methods 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 150000002611 lead compounds Chemical class 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 238000006977 lyase reaction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 108010003007 mannose isomerase Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 238000012900 molecular simulation Methods 0.000 description 1
- 238000005817 monooxygenase reaction Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 238000003203 nucleic acid sequencing method Methods 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 108010072638 pectinacetylesterase Proteins 0.000 description 1
- 102000004251 pectinacetylesterase Human genes 0.000 description 1
- 108020004410 pectinesterase Proteins 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000000596 photon cross correlation spectroscopy Methods 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000012429 reaction media Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000027756 respiratory electron transport chain Effects 0.000 description 1
- 108010035322 rhamnogalacturonan acetylesterase Proteins 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000002804 saturated mutagenesis Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000007250 stereoselective catalysis Methods 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 230000006918 subunit interaction Effects 0.000 description 1
- 229920002258 tannic acid Polymers 0.000 description 1
- LRBQNJMCXXYXIU-NRMVVENXSA-N tannic acid Chemical compound OC1=C(O)C(O)=CC(C(=O)OC=2C(=C(O)C=C(C=2)C(=O)OC[C@@H]2[C@H]([C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)O2)OC(=O)C=2C=C(OC(=O)C=3C=C(O)C(O)=C(O)C=3)C(O)=C(O)C=2)O)=C1 LRBQNJMCXXYXIU-NRMVVENXSA-N 0.000 description 1
- 229940033123 tannic acid Drugs 0.000 description 1
- 235000015523 tannic acid Nutrition 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000001550 time effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 238000005891 transamination reaction Methods 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000005820 transferase reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C99/00—Subject matter not provided for in other groups of this subclass
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1089—Design, preparation, screening or analysis of libraries using computer algorithms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1058—Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Analytical Chemistry (AREA)
- Ecology (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本願は、米国特許法§119(e)に基づき、米国仮特許出願第61/883,838
号(2013年9月27日出願、名称「AUTOMATED SCREENING OF
ENZYME VARIANTS」)の利益を主張し、上記出願は、あらゆる目的のた
めにその全体が参照により本明細書に引用される。
理由がなくてもそれだけで困難なタスクであることが長い間知られている。タンパク質の
配列空間は、広大であり、当技術分野で現在公知の方法を使用して網羅的に探索すること
は不可能である。これらの方法は、有用なポリペプチドを識別するために要求される時間
およびコストによって制限されることが多い。問題の一部は、シーケンシング、スクリー
ニング、およびアッセイされなければならない多数のポリペプチドバリアントから生じる
。指向進化方法は、有利な性質を有する候補生体分子に絞り込むことにおいて効率を増大
させる。今日では、タンパク質の指向進化は、反復して実施されることが多い、様々なハ
イスループットスクリーニングおよび組換えフォーマットが大部分を占める。
れらの手法は、その黎明期にあり、かなりの進歩が依然として必要とされている。したが
って、候補生体分子をスクリーニング、シーケンシング、およびアッセイする効率を改善
する新しい方法が非常に望ましい。
システムの分野に関する。これらの方法を実施するための、デジタルシステムなどのシス
テムおよびシステムソフトウェアも提供される。本開示の方法は、工業的および治療的使
用のためのタンパク質の最適化において有用性を有する。本方法およびシステムは、特定
の基質の触媒反応に関して所望の活性および選択性を有する酵素を設計および開発するた
めに特に有用である。
かつ/または指向進化プログラムをガイドするための方法に関する。本開示は、複雑な生
体分子ライブラリーまたはこのようなライブラリーのセットから所望の性質を有する(ま
たはそのような性質に向けた指向進化に最も適した)生体分子を識別するための方法を提
示する。本開示の一部の実施形態は、特定の基質に対する触媒反応に関して所望の活性お
よび選択性について酵素を仮想スクリーニングするための方法を提供する。一部の実施形
態は、所望の性質を有するタンパク質および酵素を設計および開発するために、スクリー
ニングと指向進化とを組み合わせている。本方法を実施するシステムおよびコンピュータ
ープログラム製品も提供される。
リーニングするための方法を提供する。一部の実施形態では、本方法は、1つまたは複数
のプロセッサーおよびシステムメモリーを含むコンピューターシステムを使用して実施さ
れる。本方法は、(a)各酵素バリアントごとに、コンピューターシステムによって、基
質の計算上の表示を、酵素バリアントの活性部位の計算上の表示にドッキングするステッ
プであって、ドッキングは、(i)活性部位における基質の複数のポーズを生成し、(i
i)活性部位における基質のエネルギー的に好ましいポーズを識別する、ステップと、(
b)各エネルギー的に好ましいポーズごとに、ポーズが活性であるかどうかを決定するス
テップであって、活性ポーズは、活性部位で触媒作用を受けるという基質に関する1つま
たは複数の制約を満たす、ステップと、(c)1つまたは複数の活性ポーズを有すると決
定された酵素バリアントの少なくとも1つを選択するステップとを含む。
数を含む。一部の実施形態では、制約は、基質上の特定の部分と、活性部位における特定
の残基または残基部分との間の距離を含む。一部の実施形態では、制約は、リガンド上の
特定の部分と、活性部位における理想的に配置された天然リガンドとの間の距離を含む。
表示する。種は、基質、基質の反応中間体、または基質の遷移状態から選択される。一部
の実施形態では、スクリーニングされたバリアントは、複数の基質を転換することができ
る酵素のパネルから選択され、パネルのメンバーは、参照配列と比べて少なくとも1つの
変異を有する。一部の実施形態では、少なくとも1つの変異は、単一残基の変異である。
一部の実施形態では、少なくとも1つの変異は、酵素の活性部位におけるものである。一
部の実施形態では、複数のバリアントとして、ケトンの還元、アミノ基転移反応、酸化、
ニトリルの加水分解、イミンの還元、エノンの還元、アシル加水分解、およびハロヒドリ
ンの脱ハロゲン化から選択される化学反応を触媒することができる1つまたは複数の酵素
が挙げられる。一部の実施形態では、酵素は、ケトンレダクターゼ、トランスアミナーゼ
、シトクロムP450、バイヤー−ビリガーモノオキシゲナーゼ、モノアミンオキシダー
ゼ、ニトリラーゼ、イミンレダクターゼ、エノンレダクターゼ、アシラーゼ、およびハロ
ヒドリンデハロゲナーゼから選択される。しかしながら、任意の適当な酵素が本発明の方
法において有用であるため、本発明がいずれかの特定の酵素または酵素のクラスに限定さ
れることは意図されない。一部の実施形態では、バリアントは、1または複数のラウンド
のin vitroおよび/またはin silicoの指向進化によって生成されたラ
イブラリーのメンバーである。
ングする。他の実施形態では、本方法は、少なくとも約1000種の異なるバリアントを
スクリーニングする。
モロジーモデルから提供される。一部の実施形態では、タンパク質バリアントに関する3
次元ホモロジーモデルを生成するための方法が提供される。一部の実施形態では、本方法
は、複数の基質をスクリーニングするために適用される。
天然基質、天然基質の反応中間体、または天然基質の遷移状態の1つまたは複数のポーズ
を識別することによって、触媒された化学変換を受けるという基質に関する制約を識別す
るための方法を提供する。
用するための方法であって、1つまたは複数の酵素の制約は、天然基質が野生型酵素の存
在下で触媒された化学変換を受けるときの野生型酵素の制約に類似している、方法を提供
する。
ーション、グリッドベースのアニーリングのシミュレートによる改良、および最終的なグ
リッドベースのまたは完全な力場の最小化(full force field min
imization)の1つまたは複数を含むドッキングオペレーションにより得られる
。一部の実施形態では、リガンドの複数のポーズは、活性部位における基質の少なくとも
約10のポーズを含む。
トとの比較により、多数の活性ポーズを有すると決定されたバリアントを識別するステッ
プを伴う。一部の実施形態では、(c)での選択するステップは、バリアントが有する活
性ポーズの数、活性ポーズのドッキングスコア、および活性ポーズの結合エネルギーの1
つまたは複数によりバリアントをランク付けするステップを伴う。次いでバリアントは、
ランクに基づき選択される。一部の実施形態では、ドッキングスコアは、ファンデルワー
ルス力および静電相互作用に基づく。一部の実施形態では、結合エネルギーは、ファンデ
ルワールス力、静電相互作用、および溶媒和エネルギーの1つまたは複数に基づく。
ントの少なくとも一部を含有するかまたはコードする複数のオリゴヌクレオチドを調製す
るステップも伴う。本方法は、複数のオリゴヌクレオチドを使用して1または複数のラウ
ンドの指向進化を実施するステップをさらに伴う。一部の実施形態では、複数のオリゴヌ
クレオチドを調製するステップは、核酸シンセサイザーを使用してオリゴヌクレオチドを
合成することを伴う。一部の実施形態では、1または複数のラウンドの指向進化を実施す
るステップは、複数のオリゴヌクレオチドを断片化して組み換えるステップを含む。一部
の実施形態では、1または複数のラウンドの指向進化を実施するステップは、複数のオリ
ゴヌクレオチドに飽和変異誘発を実施するステップを含む。
/または選択性を有する。また一部の実施形態の方法は、スクリーニングから選択された
酵素を合成するステップも伴う。
ニングすることができる。一部の実施形態は、リガンドとの相互作用について複数のタン
パク質バリアントをスクリーニングするための方法を提供する。本方法は、(a)各タン
パク質バリアントごとに、コンピューターシステムによって、リガンドの計算上の表示を
、酵素バリアントの活性部位の計算上の表示にドッキングするステップであって、ドッキ
ングは、(i)活性部位におけるリガンドの複数のポーズを生成し、(ii)活性部位に
おけるリガンドのエネルギー的に好ましいポーズを識別する、ステップと、(b)各エネ
ルギー的に好ましいポーズごとに、ポーズが活性であるかどうかを決定するステップであ
って、活性ポーズは、タンパク質バリアントとの特定の相互作用を受けるというリガンド
に関する1つまたは複数の制約を満たす、ステップと、(c)1つまたは複数の活性ポー
ズを有すると決定されたタンパク質バリアントの少なくとも1つを選択するステップとを
伴う。一部の実施形態では、リガンドは、基質、中間体、遷移状態、生成物、阻害剤、ア
ゴニスト、および/またはアンタゴニストから選択されてもよい。
るコンピュータープログラム製品およびコンピューターシステムも提供される。
本発明の実施形態において、例えば以下の項目が提供される。
(項目1)
基質との活性について複数の異なる酵素バリアントをスクリーニングするための1つま
たは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステムを使用し
て実施される方法であって、
(a)各酵素バリアントごとに、該コンピューターシステムによって、該基質の計算上
の表示を、該酵素バリアントの活性部位の計算上の表示にドッキングするステップであっ
て、ドッキングは、(i)該活性部位における該基質の複数のポーズを生成し、(ii)
該活性部位における該基質のエネルギー的に好ましいポーズを識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決定
するステップであって、活性ポーズは、該活性部位で触媒作用を受けるという該基質に関
する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該酵素バリアントの少なくと
も1つを選択するステップと
を含む、方法。
(項目2)
前記基質に対して(c)で選択された酵素バリアントの少なくとも1つを、化学反応を
生じさせることによってスクリーニングするステップをさらに含む、項目1に記載の方法
。
(項目3)
前記基質の前記計算上の表示が、前記酵素活性に関する反応座標に沿って種を表示し、
該種は、該基質、該基質の反応中間体、または該基質の遷移状態から選択される、前記項
目のいずれかに記載の方法。
(項目4)
前記複数の酵素バリアントが、複数の基質を転換することができる酵素のパネルを含み
、該パネルのメンバーは、参照配列と比べて少なくとも1つの変異を有する、前記項目の
いずれかに記載の方法。
(項目5)
前記少なくとも1つの変異が、前記酵素の前記活性部位における単一残基の変異である
、項目4に記載の方法。
(項目6) 複数のバリアントが、酸化還元、トランスフェレーション、加水分解、異性
化、ライゲーション、および加水分解、酸化、または還元以外の反応による化学結合の破
断から選択される化学反応を触媒することができる1つまたは複数の酵素を含む、前記項
目のいずれかに記載の方法。
(項目7)
前記酵素が、オキシドレダクターゼ、トランスフェラーゼ、ヒドロラーゼ、イソメラー
ゼ、リガーゼ、およびリアーゼから選択される、項目6に記載の方法。
(項目8)
前記複数のバリアントが、ケトンの還元、アミノ基転移反応、酸化、ニトリルの加水分
解、イミンの還元、エノンの還元、アシル加水分解、およびハロヒドリンの脱ハロゲン化
から選択される化学反応を触媒することができる1つまたは複数の酵素を含む、項目6に
記載の方法。
(項目9)
前記酵素が、ケトンレダクターゼ、トランスアミナーゼ、シトクロムP450、バイヤ
ー−ビリガーモノオキシゲナーゼ、モノアミンオキシダーゼ、ニトリラーゼ、イミンレダ
クターゼ、エノンレダクターゼ、アシラーゼ、およびハロヒドリンデハロゲナーゼから選
択される、項目8に記載の方法。
(項目10)
前記複数のバリアントが、in vitroおよび/またはin silicoの1つ
または複数のラウンドの指向進化によって生成されたライブラリーのメンバーを含む、前
記項目のいずれかに記載の方法。
(項目11)
前記複数のバリアントが、少なくとも約10種の異なるバリアントを含む、前記項目の
いずれかに記載の方法。
(項目12)
前記複数のバリアントが、少なくとも約1000種の異なるバリアントを含む、前記項
目のいずれかに記載の方法。
(項目13)
活性部位の前記計算上の表示が、前記複数のバリアントに関する3次元ホモロジーモデ
ルから提供される、前記項目のいずれかに記載の方法。
(項目14)
前記複数のバリアントに関する前記3次元ホモロジーモデルを生成するステップをさら
に含む、項目13に記載の方法。
(項目15)
前記基質の前記計算上の表示が、該基質の3次元モデルである、前記項目のいずれかに
記載の方法。
(項目16)
複数の基質をスクリーニングするために適用される、前記項目のいずれかに記載の方法
。
(項目17)
天然基質が野生型酵素によって触媒された化学変換を受けるときの、該天然基質、該天
然基質の反応中間体、または該天然基質の遷移状態の1つまたは複数のポーズを識別する
ことによって、触媒された化学変換を受けるという該基質に関する制約を識別するステッ
プをさらに含む、前記項目のいずれかに記載の方法。
(項目18)
前記制約が、位置の制約、距離の制約、角度の制約、およびねじれの制約の1つまたは
複数を含む、前記項目のいずれかに記載の方法。
(項目19)
前記制約が、前記基質上の特定の部分と、前記活性部位における特定の残基または残基
部分との間の距離を含む、前記項目のいずれかに記載の方法。
(項目20)
前記制約が、前記基質上の特定の部分と、コファクター上の特定の残基または残基部分
との間の距離を含む、前記項目のいずれかに記載の方法。
(項目21)
前記制約が、前記基質上の特定の部分と、前記活性部位における理想的に配置された天
然基質との間の距離を含む、前記項目のいずれかに記載の方法。
(項目22)
前記複数の酵素バリアントに1つまたは複数の酵素の制約のセットを適用するステップ
をさらに含み、該1つまたは複数の酵素の制約は、天然基質が野生型酵素の存在下で触媒
された化学変換を受ける場合の該野生型酵素の制約に類似している、前記項目のいずれか
に記載の方法。
(項目23)
前記基質の前記複数のポーズが、高温での分子動力学、ランダムなローテーション、グ
リッドベースのアニーリングのシミュレートによる改良、グリッドベースのまたは十分な
力場の最小化、およびそれらのいずれかの組合せからなる群から選択される1つまたは複
数のドッキングオペレーションにより得られる、前記項目のいずれかに記載の方法。
(項目24)
リガンドの前記複数のポーズが、前記活性部位における前記基質の少なくとも約10の
ポーズを含む、前記項目のいずれかに記載の方法。
(項目25)
(c)における前記選択するステップが、他のバリアントとの比較により、多数の活性
ポーズを有すると決定されたバリアントを識別するステップを含む、前記項目のいずれか
に記載の方法。
(項目26)
(c)における前記選択するステップが、
前記バリアントが有する活性ポーズの数、該活性ポーズのドッキングスコア、および該
活性ポーズの結合エネルギーの1つまたは複数により該バリアントをランク付けするステ
ップと、
該バリアントのランクに基づきバリアントを選択するステップと
を含む、前記項目のいずれかに記載の方法。
(項目27)
前記ドッキングスコアが、ファンデルワールス力および静電相互作用に基づいている、
項目26に記載の方法。
(項目28)
前記結合エネルギーが、ファンデルワールス力、静電相互作用、および溶媒和エネルギ
ーの1つまたは複数に基づいている、項目26に記載の方法。
(項目29)
(c)で選択された少なくとも1つのバリアントの少なくとも一部を含有するかまたは
コードする複数のオリゴヌクレオチドを調製するステップと、
該複数のオリゴヌクレオチドを使用して1つまたは複数のラウンドの指向進化を実施す
るステップと
をさらに含む、前記項目のいずれかに記載の方法。
(項目30)
複数のオリゴヌクレオチドを調製するステップが、前記オリゴヌクレオチドを核酸シン
セサイザーを使用して合成するステップを含む、項目29に記載の方法。
(項目31)
1つまたは複数のラウンドの指向進化を実施するステップが、前記複数のオリゴヌクレ
オチドを断片化して組み換えるステップを含む、項目29から30のいずれかに記載の方
法。
(項目32)
1つまたは複数のラウンドの指向進化を実施するステップが、前記複数のオリゴヌクレ
オチドに対して飽和変異誘発を実施するステップを含む、項目29から31のいずれかに
記載の方法。
(項目33)
前記酵素バリアントの少なくとも1つが、所望の触媒活性および/または選択性を有す
る、前記項目のいずれかに記載の方法。
(項目34)
(c)で選択された前記酵素バリアントの少なくとも1つを合成するステップをさらに
含む、前記項目のいずれかに記載の方法。
(項目35)
コンピューターシステムの1つまたは複数のプロセッサーによって実行されるとき、該
コンピューターシステムが酵素バリアントの仮想スクリーニングのための方法を実施する
コンピューター実行可能命令を記憶した1つまたは複数のコンピューター可読非一時的記
憶媒体を含むコンピュータープログラム製品であって、該命令は、
(a)各酵素バリアントごとに、基質の計算上の表示を、該酵素バリアントの活性部位
の計算上の表示にドッキングするステップであって、ドッキングは、(i)該活性部位に
おける該基質の複数のポーズを生成し、(ii)該活性部位における該基質のエネルギー
的に好ましいポーズを識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決定
するステップであって、活性ポーズは、該活性部位で触媒作用を受けるという該基質に関
する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該酵素バリアントの少なくと
も1つを選択するステップと
を含む、コンピュータープログラム製品。
(項目36)
コンピューターシステムの1つまたは複数のプロセッサーによって実行されるとき、該
コンピューターシステムが項目2から28のいずれかに記載の方法を実施するコンピュー
ター実行可能命令をさらに含む、項目35に記載のコンピュータープログラム製品。
(項目37)
1つまたは複数のプロセッサーと、
システムメモリーと
を含むシステムであって、
該1つまたは複数のプロセッサーおよびメモリーは、基質との活性について酵素バリア
ントを仮想スクリーニングするための方法を実施するように設計されており、該方法は、
(a)各酵素バリアントごとに、該基質の計算上の表示を、該酵素バリアントの活性
部位の計算上の表示にドッキングするステップであって、ドッキングは、(i)該活性部
位における該基質の複数のポーズを生成し、(ii)該活性部位における該基質のエネル
ギー的に好ましいポーズを識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決
定するステップであって、活性ポーズは、該活性部位で触媒作用を受けるという該基質に
関する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該酵素バリアントの少なく
とも1つを選択するステップと
を含む、システム。
(項目38)
前記1つまたは複数のプロセッサーおよびメモリーが、項目2から28のいずれかに記
載の方法を実施するように設計される、項目37に記載のシステム。
(項目39)
リガンドとの相互作用について複数のタンパク質バリアントをスクリーニングするため
の1つまたは複数のプロセッサーおよびシステムメモリーを含むコンピューターシステム
を使用して実施される方法であって、
(a)各タンパク質バリアントごとに、該コンピューターシステムによって、該リガン
ドの計算上の表示を、該タンパク質バリアントの活性部位の計算上の表示にドッキングす
るステップであって、ドッキングは、(i)該活性部位における該リガンドの複数のポー
ズを生成し、(ii)該活性部位における該リガンドのエネルギー的に好ましいポーズを
識別する、ステップと、
(b)各エネルギー的に好ましいポーズごとに、該ポーズが活性であるかどうかを決定
するステップであって、活性ポーズは、タンパク質バリアントとの特定の相互作用を受け
るという該リガンドに関する1つまたは複数の制約を満たす、ステップと、
(c)1つまたは複数の活性ポーズを有すると決定された該タンパク質バリアントの少
なくとも1つを選択するステップと
を含む、方法。
(項目40)
前記リガンドが、基質、基質の中間体、基質の遷移状態、基質の生成物、タンパク質バ
リアントの阻害剤、タンパク質バリアントのアゴニスト、およびタンパク質バリアントの
アンタゴニストから選択される、項目39に記載の方法。
タンパク質および酵素のスクリーニングは、リガンドおよび基質と相互作用するタンパ
ク質および酵素分子の化学的および物理的性質の測定を含む実際的な方法で実施すること
ができる。実際の測定は、時間および資源を消費し、根底にある物理的および化学的機構
はしばしば可視化または操作が困難である。本明細書で開示される「仮想」スクリーニン
グ方法およびシステムは、酵素、タンパク質、ならびにそれらの基質およびリガンドの構
造および動力学を可視化または操作するためのツールを提供する。これらのツールは、分
子を研究するための時間および/または材料を節約することができる。
質の指向進化で使用される。仮想スクリーニングは、これらの指向進化の実施形態の様々
な段階中に物理的なスクリーニングの代わりに使用され、実際のスクリーニングが必要と
する物理的な材料または時間を必要とせずに多数の分子および反応を研究することを可能
にする。これらの実施形態は、所望の性質を有するタンパク質および酵素を得るためのプ
ロセスをスピードアップすることができる。また材料および資源も、プロセスにおいて節
約することができる。一部の実施形態は、特定の基質が関与する触媒反応に関する所望の
活性および/または選択性を有する酵素を設計および開発するために特に有用である。
(I.定義)
科学用語は、当業者が一般に理解するのと同じ意味を有する。本明細書に含まれる用語を
含む様々な科学辞書が、当業者に周知であり、利用可能である。本明細書に記載のものと
同様のまたは等価な任意の方法および材料は、本明細書に開示の実施形態の実行において
使用を見出す。
される。定義は、特定の実施形態を記載することのみを目的とし、本明細書に記載の複雑
な概念の理解を助ける。これらは、本開示の全範囲を限定するように意図されていない。
具体的には、本開示は、記載の特定の配列、組成、アルゴリズム、システム、方法論、プ
ロトコル、および試薬に限定されないことが理解されるべきである。なぜなら、これらは
、これらが当業者によって使用される場面に応じて変動し得るためである。
1つの(an)」、および「その(the)」は、内容および文脈により別段に明確に要
求されない限り、複数形の指示対象を含む。したがって例えば、「デバイス」への言及は
、このようなデバイスの2つまたはそれより多くの組合せを含む、などである。別段に示
されていない限り、「または」の接続詞は、ブール論理演算子としてその正確な意味で使
用されることが意図されており、選択状況における特徴の選択(Aの選択がBから互に排
他的であるAまたはB)ならびに結合状況における特徴の選択(AおよびBの両方が選択
されるAまたはB)を包含する。
の計算上の表示の、生体分子(例えば、酵素またはタンパク質)の活性部位の計算上の表
示への結合をシミュレートおよび/または特徴付けるためのコンピューターによるプロセ
スを指す。ドッキングは、典型的には、「ドッカー」コンピュータープログラムを使用し
たコンピューターシステムで実施される。典型的には、ドッキングプロセスの結果は、特
異的な「ポーズ」で活性部位に「ドッキングした」分子の計算上の表示である。複数のド
ッキングプロセスは、分子の同じ計算上の表示と活性部位の同じ計算上の表示との間で実
施されてもよく、それにより結果として活性部位における複数の異なる分子の「ポーズ」
がもたらされる。活性部位の計算上の表示における複数の異なる「ポーズ」の構造、コン
ホメーション、およびエネルギー学を評価することにより、ある特定の「ポーズ」を、リ
ガンドと生体分子との結合に関してよりエネルギー的に好ましいと識別することができる
。
分子との相互作用に関して「活性」であるかどうかを決定する。「活性ポーズ」は、検討
中の活性に関する1つまたは複数の制約を満たすポーズである。「制約」は、ポーズの構
造、幾何学的配置、コンホメーション、エネルギー学などを制限する可能性がある。ある
特定の実施形態では、酵素の活性部位における基質の計算上の表示の「活性ポーズ」は、
酵素による触媒作用に関する条件を満たす。ドッキングが、活性部位の計算上の表示にお
ける基質の計算上の表示の非常に多くの活性ポーズを識別する場合、表示された具体的な
酵素は、基質の生成物への化学変換を触媒するために好ましいと選択されてもよい。
または他の生体分子における目的の活性部位の計算結果表示との間のドッキングプロセス
を、コンピューターによりシミュレートおよび/または特徴付けるコンピュータープログ
ラムである。
と共同して一時的または永久に記憶される場合のあるソフトウェアとして実装される。市
販のドッキングプログラムとしては、CDocker(Accelrys)、DOCK(
カリフォルニア大学、San Francisco)、AutoDock(Scripp
s Research Institute)、FlexX(tripos.com)、
GOLD(ccdc.cam.ac.uk)、およびGLIDE(schrodinge
r.com)がある。
の計算上の表示の「ポーズ」を生成する。これらのポーズは、ドッキングスコアを生成し
、または他の方法でドッキングを評価するために使用され得る。一部の実施形態では、ポ
ーズは、ドッカーによって計算された相互作用エネルギーの値と関連する。一部のポーズ
は、他のポーズよりエネルギー的に好ましい。一部の実施形態では、ドッカーは、ドッキ
ングを評価するために使用するためにユーザーがいくつかのポーズ(n)を指定すること
を可能にする。最良のドッキングスコアを有する上位n個のポーズのみが、ドッキングを
評価するために考慮される。一部の実施形態では、規定された基準を満たす好ましい相互
作用エネルギーを有するポーズのみが選択されて、活性または不活性ポーズとして分類さ
れる。
体分子との好ましい相互作用エネルギーを有する場合、その基質またはリガンドは生体分
子と結合する可能性が高いことを決定することができる。結合したリガンドは、アゴニス
トまたはアンタゴニストとして作用し得る。様々なドッカーが、基質またはリガンドと生
体分子との間のドッキングスコアまたは他の結合尺度を出力する。生体分子の活性部位と
基質またはリガンドとの一部の組合せに関して、ドッキングプログラムは、結合が起こる
可能性が低いことを決定する。このような場合では、ドッキングプログラムは、基質また
はリガンドは生体分子と結合しないという結論を出力する。
のようなドッキングの、それが起こった場合の品質を出力するようにプログラムされる場
合がある。ドッキングの見込みおよび品質は、リガンドが生体分子と結合する見込みを提
示する。一レベルにおいて、ドッカーは、リガンドが生体分子の活性部位に結合する見込
みがあるか否かを判定する。ドッカーのロジックが、結合の見込みがない、または結合が
高度に不都合であると結論付ける場合、これは、「洗練されたポーズが見つからなかった
」という結果を出力し得る。これは、ドッキングプログラムが生成したすべてのコンホメ
ーションが活性部位との不都合なファンデルワールス衝突および/または静電反発を有す
るとき起こり得る。ドッキング手順の上記例では、第2のオペレーションにより、閾値未
満のソフトエネルギーを有するポーズを見つけることができない場合、ドッカーは、「洗
練されたポーズが見つからなかった」などの結果を返し得る。ソフトエネルギーは、ファ
ンデルワールス力および静電気力を含めた非結合相互作用を主に考慮するので、「洗練さ
れたポーズが見つからなかった」という結果は、リガンドが、所与の数のポーズについて
、生体分子の受容体との厳しい立体的衝突および/または静電反発を有することを意味す
る。
用を表すドッキングスコアを出力する。ドッカーは、リガンド−生体分子相互作用の様々
な特徴を算出し得る。一例では、出力は単に、リガンドと生体分子との間の相互作用エネ
ルギーである。別の実施形態では、全エネルギーが出力される。全エネルギーは、リガン
ド−生体分子相互作用エネルギーとリガンドの歪みとの組合せであると理解される場合が
ある。ある特定の実施では、このようなエネルギーは、CHARMmなどの力場を使用し
て算出され得る。
の複数のポーズを考慮することによってこのような出力を生成する。各ポーズは、独自の
関連したエネルギー値を有する。一部の実施形態では、ドッキングプログラムは、ポーズ
をランク付けし、高ランクのポーズの1つまたは複数と関連したエネルギーを考慮する。
一部の場合では、これは、ある特定の高ランクのポーズのエネルギーを平均し、または他
の方法で上位ランクのポーズの統計分析を実施し得る。他の実施形態では、これは単に、
上位ランクのポーズに支持された値を選択し、これをドッキングについて得られたエネル
ギーとして出力する。
る酵素反応の反応座標に沿った分子種に対応する。一部の実施形態では、基質の計算上の
表示は、基質分子それ自体を表示する。一部の実施形態では、基質の計算上の表示は、反
応座標に沿って形成される基質の中間体構造(すなわち、「基質の反応中間体」)を表示
する。一部の実施形態では、基質の計算上の表示は、酵素反応座標に沿って形成される遷
移状態の構造(すなわち、「基質の遷移状態」)を表示する。
が反応座標に沿って所望の生成物に進行しない分子種を表示することができる。例えば、
リガンドの計算上の表示は、酵素の阻害剤またはタンパク質(例えば、受容体)の強く結
合するアンタゴニストもしくはアゴニストについてスクリーニングするために、強い阻害
剤を表示することができる。
である。ポーズでは、リガンドのいくつかまたはすべての原子の3次元位置が、活性部位
中の原子のいくつかまたはすべての位置に対して指定される。コンホメーションは活性部
位を考慮しないので、リガンドのコンホメーションはそのポーズではないが、コンホメー
ションを、ポーズを判定するために使用することができる。一部の実施形態では、リガン
ドの配向およびコンホメーションが一緒にポーズを定義する。一部の実施形態では、ポー
ズは、リガンドの配向/コンホメーションの組合せが、参照活性部位における定義された
閾値エネルギーレベルを満たす場合のみ存在する。
る。例としては、回転可能な結合についての系統的または確率論的ねじれサーチ(tor
sional search)、分子動力学シミュレーション、および新しい低エネルギ
ーコンホメーションを「進化させる」ための遺伝的アルゴリズムがある。これらの技法が
使用されて、「ポーズ空間」を探索するためのリガンドおよび/または活性部位の計算上
の表示が修正される。
する。一部の実施形態では、これらは、上述した相互作用タイプの1つまたは複数(例え
ば、ファンデルワールス力)に基づいて相互作用のエネルギーを算出することによってこ
れを行う。この情報は、ドッキングを特徴付け、一部の場合では、ドッキングスコアを生
成するために使用される。一部の実施では、ドッカーは、ドッキングスコアに基づいてポ
ーズをランク付けする。一部の実施では、ドッカーは、考慮事項から不都合なドッキング
スコアを有するポーズを除去する。
、ポーズが活性であるか否かを判定する。ポーズは、それが検討中の所望の活性にとって
重要であることが分かっている定義された制約を満たす場合、活性であると見なされる。
一例として、仮想タンパク質スクリーニングシステムは、ポーズが活性部位におけるリガ
ンドの触媒的変換をサポートするか否かを判定し得る。
分子を含有する安定な複合体を形成する分子または複合体である。リガンドおよび生体分
子に加えて、安定な複合体は、他の化学エンティティ、例えば、有機および無機コファク
ター(例えば、補酵素および補欠分子族)、金属イオンなどを含み得る(時に必要とする
)。リガンドは、アゴニストまたはアンタゴニストであり得る。
含有するか、および/またはそれらと結合することができる生体分子の構造によって規定
される部位である。多くのタイプの活性部位が企図されており、これらの一部は本明細書
の他所で説明される。しばしば活性部位は、基質またはリガンドとの結合相互作用を形成
することができる化学的および/または物理的な特徴(例えば、アミノ酸残基)を含有す
る。一部の実施形態では(例えば、生体分子が酵素である場合)、「活性部位」は、少な
くとも1つの触媒性残基および複数の結合残基、および時には他の化学エンティティ、例
えば有機および無機コファクター(例えば、補酵素および補欠分子族)、金属イオンなど
を含む。活性部位の少なくとも1つの触媒性残基は、基質の転換を触媒する触媒性部分を
含有していてもよい。活性部位の結合残基は基質との結合相互作用をもたらし、立体選択
的および/または位置選択的な方式で活性部位中にそれを保持する。このような相互作用
としては、ファンデルワールス相互作用、静電相互作用、水素結合、親水性相互作用、疎
水性相互作用、溶媒相互作用、共有結合などを挙げることができる。
をドッキングし、それによって、活性部位との好ましい相互作用に関して評価することが
できるポーズを生成するために使用できる(例えば、ポーズについての結合エネルギーの
決定)。
的に規定される。一部の実施形態では、活性部位は、選択された物体(例えば、リガンド
および/または構造鋳型中の他の化学エンティティ)の質量中心をそれらが含まれるよう
に調整された半径で取り巻く球体を作製することによって規定される。最小半径は5Åで
あるが、活性部位のサイズは、球体の半径を1Å、2Å、3Å、4Å、6Å、8Å、10
Åなど増加させることによって拡張することができる。一部の実施において、半径のサイ
ズは、基質近傍の残基を捕捉するように選択される。それゆえに、より大きい基質は、よ
り大きい半径に関連し、小さい基質は、より小さい半径に関連する。本開示がいずれの特
定の半径の値に限定されることは意図されない。一部の実施形態では、活性部位は、受容
体の空洞から規定することができ、その場合、活性部位は、構造鋳型中で検出された空洞
の1つから誘導された。一部の実施形態では、構造鋳型のタンパク質データバンク(PD
B)ファイルはサイトの記録を使用して規定された活性部位を含むことが多いため、活性
部位は、PDBサイトの記録から規定することができる。構造鋳型を使用して全てのホモ
ロジーモデルが作製され得るため、規定された活性部位は、全てのホモロジーモデルに移
行可能である。
び/または酵素上の部分を参照してユーザーがカスタマイズ可能な形状(例えば、楕円ま
たは基質の構造を反映した不規則な形状)などによって規定することができる。
ド分子と直接的に(例えば、ファンデルワールス相互作用、静電相互作用、水素結合を介
して)相互作用しないが、活性部位の計算上の表示で他のアミノ酸と相互作用し、それに
よって基質またはリガンドのポーズの評価に影響を与えるアミノ酸を含むように規定する
ことができる。
たような活性部位の計算上の表示の外側に存在していてもよい。このような残基は、変異
または組換えのための候補として活性部位以外の残基を検討することによって、指向進化
中に改変されてもよい。
である。基質の「遷移状態」は、反応経路に沿った最高ポテンシャルエネルギーに相当す
る状態にある基質である。一過性の存在を有する傾向がある遷移状態において、反応物分
子の衝突が進行して生成物を形成する。本開示では、基質があるプロセスにおいて記載さ
れている場合に時には、中間体および遷移状態も、そのプロセスにとって適当であり得る
。このような局面では、基質、中間体、および遷移状態は、「リガンド」と総称して呼ば
れる場合がある。一部の場合には、複数の中間体が、基質の触媒的変換において生成され
る。ある特定の実施形態では、分析のために選択されるリガンド種(基質または中間体ま
たは遷移状態)は、触媒的変換の律速段階に関連していると公知であるものである。一例
として、酵素コファクターに共有結合的に結合した基質は、律速の段階において化学修飾
され得る。このような場合には、基質−コファクター種が相互作用をモデル化するために
使用される。
よる化学変換を受けることができる「基質」分子も含み得る。いくつかのリガンドは、活
性部位と結合するが、触媒的変換を起こさない。例としては、薬物設計分野において評価
されるリガンドがある。このようなリガンドは、薬理学的目的のために標的生体分子と非
共有結合的に結合するその能力について選択される低分子であり得る。一部の場合には、
リガンドは、生体分子の天然の挙動を増強、活性化、または阻害するその能力について評
価される。
機体によって生成される分子を指す。一部の実施形態では、生物学的分子は、複数のサブ
ユニットを有するポリマー生物学的巨大分子(すなわち、「バイオポリマー」)を含む。
典型的な生体分子としては、タンパク質、酵素、および他のポリペプチド、DNA、RN
Aおよび他のポリヌクレオチドが挙げられ、さらに、天然に存在するポリマー、例えばR
NA(ヌクレオチドサブユニットから形成される)、DNA(ヌクレオチドサブユニット
から形成される)、およびペプチドまたはポリペプチド(アミノ酸サブユニットから形成
される)といくつかの構造的特徴を共有する分子、例えば、RNA類似体、DNA類似体
、ポリペプチド類似体、ペプチド核酸(PNA)、RNAおよびDNAの組合せ(例えば
、キメラプラスト)なども挙げることができる。生体分子がいずれかの特定の分子に限定
されることは意図されていない。なぜなら、それだけに限らないが、例えば、脂質、炭水
化物、または1つもしくは複数の遺伝的にコード可能な分子(例えば、1つもしくは複数
の酵素もしくは酵素経路)などによって作製される他の有機分子などを含めて、任意の適
当な生物学的分子が本開示において有用であるためである。本開示の一部の態様にとって
特に目的のものは、リガンドと相互作用して化学的または生物学的変換、例えば、基質の
触媒変換、生体分子の活性化、または生体分子、特に酵素の不活化を行う活性部位を有す
る生体分子である。
基質結合親和性(KM)、触媒効率(kcat/KM)、基質特異性、化学選択性、位置
選択性、立体選択性、立体特異性、リガンド特異性、受容体アゴニズム、受容体アンタゴ
ニズム、コファクターの転換、酸素安定性、タンパク質発現レベル、溶解度、熱活性、熱
安定性、pH活性、pH安定性(例えば、アルカリ性もしくは酸性pHにおける)、グル
コース阻害、ならびに/または阻害剤(例えば、酢酸、レクチン、タンニン酸、およびフ
ェノール化合物)およびプロテアーゼに対する耐性、の1つまたはそれより多くの増大ま
たは低下である。他の所望の活性として、特定の刺激に対する応答におけるプロファイル
の変化;例えば、温度および/またはpHプロファイルの変化を挙げることができる。合
理的なリガンド設計において、標的化共有結合的阻害(TCI)の最適化は、活性の一タ
イプである。一部の実施形態では、本明細書に記載するようにスクリーニングされる2種
またはそれより多くのバリアントは、同じ基質に対して作用するが、以下の活性:生成物
形成の速度、基質から生成物へのパーセント転換、選択性、および/またはコファクター
のパーセント転換の1つまたはそれより多くに関して異なる。本開示がいずれかの特定の
有益な性質および/または所望の活性に限定されることは意図されていない。
うより限定された概念を記述するために使用される。関連した酵素特性は、特定の生成物
、例えば、鏡像異性体または位置選択的生成物などに対するその「選択性」である。本明
細書に提示される「活性」の広い定義には選択性が含まれるが、慣例的に、選択性は、時
に酵素活性と異なるとみなされる。
飾(例えば、グリコシル化、リン酸化、脂質修飾、ミリスチル化(myristilat
ion)、ユビキチン化など)にかかわらず、アミド結合によって共有結合的に連結され
た少なくとも2つのアミノ酸のポリマーを表すために互換的に使用される。一部の場合に
は、ポリマーは、少なくとも約30のアミノ酸残基、通常少なくとも約50のアミノ酸残
基を有する。より典型的には、これらは、少なくとも約100のアミノ酸残基を含有する
。この用語は、全長タンパク質またはペプチドの断片であると慣例的に見なされる組成物
を含む。この定義内に含まれるのは、D−およびL−アミノ酸、ならびにD−とL−アミ
ノ酸の混合物である。本明細書に記載のポリペプチドは、遺伝的にコードされるアミノ酸
に制限されない。実際に、遺伝的にコードされるアミノ酸に加えて、本明細書に記載のポ
リペプチドは、全体的にまたは部分的に、天然に存在するおよび/または合成の非コード
アミノ酸で構成され得る。一部の実施形態では、ポリペプチドは、全長親ポリペプチドの
アミノ酸配列と比較した場合に、アミノ酸の付加もしくは欠失(例えば、ギャップ)、お
よび/または置換を含有するが、依然として機能活性(例えば、触媒活性)を保持する全
長祖先または親ポリペプチドの一部である。
生体分子または生物は、それが自然に発生するときに典型的な形態の種の表現型を有する
ものである。時には、野生型の生体分子は、天然に存在する源から単離される。他の場合
には、野生型の生体分子は、実験室の環境で誘導される。通常、野生型の生体分子は、変
異ゲノムとは対照的に、正常なまたは参照ゲノムの遺伝子配列に関するか、またはそれに
よってコードされている。「野生型の生体分子」の定義内には、天然型と同一な配列を有
するポリペプチドまたはポリヌクレオチドの組換え形態が含まれる。野生型の生体分子と
反応する基質またはリガンドは、時には、「天然」基質またはリガンドとみなされる。
、および「バリアント配列」は、標準または参照配列(例えば、一部の実施形態では、親
配列)といくつかの点で異なる生物学的配列を指す。この差異は、「変異」と呼ばれる場
合がある。一部の実施形態では、変異体は、少なくとも1つの置換、挿入、クロスオーバ
ー、欠失、および/または他の遺伝子操作によって変更されたポリペプチドまたはポリヌ
クレオチド配列である。本開示の目的に関して、変異体およびバリアントは、これらが生
成される特定の方法に限定されない。一部の実施形態では、変異体またはバリアント配列
は、親配列と比較して、増大した、低下した、または実質的に同様の活性または性質を有
する。一部の実施形態では、バリアントポリペプチドは、野生型ポリペプチド(例えば、
親ポリペプチド)のアミノ酸配列と比較した場合に変異させられた1つまたはそれより多
くのアミノ酸残基を含む。一部の実施形態では、ポリペプチドの1つまたはそれより多く
のアミノ酸残基は、複数のポリペプチドを構成するバリアントポリペプチドにおいて、親
ポリペプチドと比較した場合に一定に保たれ、不変であり、または変異させられていない
。一部の実施形態では、親ポリペプチドは、改善された安定性、活性、または任意の他の
所望の性質を有するバリアントを生成するための基盤として使用される。
は、特にこれらの機能において参照酵素と同様であるが、これらを野生型または別の参照
酵素と配列が異なったものにするこれらのアミノ酸配列中の変異を有する酵素に言及して
使用される。酵素バリアントは、当業者に周知の多種多様な異なる変異誘発技法によって
作製することができる。さらに、変異誘発キットも、多くの商業的な分子生物学の供給業
者から入手可能である。規定のアミノ酸における特異的置換(部位指向性)、遺伝子の局
所領域内の特異的もしくはランダム変異(位置特異的)、または遺伝子全体にわたるラン
ダム変異誘発(例えば、飽和変異誘発)を行う方法が利用可能である。酵素バリアントを
生成するための多数の適当な方法が当業者に公知であり、これらとしては、それだけに限
らないが、PCRを使用する一本鎖DNAもしくは二本鎖DNAの部位指向性変異誘発、
カセット変異誘発、遺伝子合成、エラープローンPCR、シャッフリング、および化学的
飽和変異誘発、または当技術分野で公知の任意の他の適当な方法がある。バリアントが生
成された後、これらを所望の性質(例えば、高いもしくは増大した;または低いもしくは
低減された活性、増大した熱安定性および/またはアルカリ安定性など)についてスクリ
ーニングすることができる。
酵素の群である。一部の実施形態では、パネルのメンバーは、それぞれが同じ反応を起こ
して複数の基質を一括して転換することができる。多くの場合、パネルメンバーは、複数
の基質を効率的に転換するように選択される。一部の場合には、パネルは、市販されてい
る。他の場合には、これらは、ある企業体が独占している。例えば、パネルは、スクリー
ニング手順でヒットとして識別された様々な酵素を含み得る。ある特定の実施形態では、
パネルの1つまたはそれより多くのメンバーは、計算上の表示としてのみ存在する。言い
換えれば、その酵素は、仮想の酵素である。
元位置の集合物、または表示されているエンティティの部分として提供される。モデルは
、活性部位または酵素バリアントの他の態様の計算的に生成された表示を含有することが
多い。本明細書の実施形態に関連したモデルの例は、ホモロジーモデリング、タンパク質
スレッディング、またはRosetta(rosettacommons.org/so
ftware/)などのルーチンを使用するab initioタンパク質モデリング、
または分子動力学シミュレーションから生成される。
質またはタンパク質の一部の3次元モデルである。ホモロジーモデリングは、タンパク質
構造が相同タンパク質間で保存される傾向があるという観察結果に依拠する。ホモロジー
モデルは、骨格および側鎖を含めた残基の3次元位置を提供する。モデルは、モデル化さ
れた配列の構造に類似する可能性が高い相同タンパク質の構造鋳型から生成される。一部
の実施形態では、構造鋳型は、「配列を鋳型にアライメントする」および「ホモロジーモ
デルを構築する」という2つのステップで使用される。
の構造鋳型配列にアライメントし、ホモロジーモデルを構築するための入力配列アライメ
ントを準備する。アラインメントにより、モデル配列と構造鋳型配列(複数可)との間の
ギャップおよび相違する他の領域が識別される。
拘束を導出する。空間的拘束はひいては、例えば、共役勾配およびシミュレーテッドアニ
ーリング最適化手順を使用してモデルタンパク質構造を生成するために使用される。鋳型
の構造的特徴は、NMRまたはX線結晶構造解析法などの技法から得られ得る。このよう
な技法の例は、Qu X、Swanson R、Day R、Tsai、J.、Curr
Protein Pept Sci.、2009年6月;10巻(3号):270〜8
5頁による総説「A Guide to Template Based Struct
ure Prediction」において見つけることができる。
させることを可能にするタンパク質(例えば、酵素)のコンホメーションについての言及
において使用される。
共有結合的結合などのいくつかの所望の役割を果たすポーズである。
り逆が還元である可逆的な化学反応を指して互換的に使用される。この用語はまた、原子
がそれらの酸化状態を変化させる全ての化学反応を指すためにも使用され、一般的に、酸
化還元反応は、種間の電子の移動を含む。これは、簡単な酸化還元プロセス、例えば炭素
が酸化されて二酸化炭素(CO2)が生じるプロセス、もしくは炭素が水素で還元されて
メタン(CH4)が生じるプロセス、または複雑なプロセス、例えば一連の複雑な電子伝
達プロセスを介したヒトの体におけるグルコース(C6H12O6)の酸化のいずれかで
あり得る。
て、一方の化合物から他方の化合物に官能基を移す化学反応を指すものとして使用される
。「トランスフェラーゼ」は、トランスフェレーション反応を触媒する様々な酵素のいず
れかを指すために使用される。
に使用され、この反応は、水由来の水素カチオンおよび水酸化物アニオンの付加による化
学結合の開裂を含む。
である。
て2つの分子を合体させるあらゆる化学反応を指すために使用される。一部の実施形態で
は、ライゲーション反応は、より大きい分子の1つに属する小さい化学基の加水分解を含
む。一部の実施形態では、酵素は2つの化合物を一緒に連結させることを触媒し、例えば
C−O、C−S、C−Nなどの合体を触媒する酵素である。ライゲーション反応を触媒す
る酵素は、「リガーゼ」と称される。
する酵素である。一部の実施形態では、リアーゼ反応は、新しい二重結合または新しい環
構造を形成する。
にケト基をヒドロキシル基に還元する酵素である(例えば、WO2008103248A
2、WO2009029554A2、WO2009036404A2、WO200904
2984A1、WO2009046153A1、およびWO2010025238A2で
開示されたバリアントを参照)。
酸とのアミノ基転移反応を触媒する酵素であり、アミノ酸上のアミン基NH2がα−ケト
酸上のケト基=Oと交換される(例えば、WO2010081053A2およびWO20
10099501A2で開示されたバリアントを参照)。
酵素である。一例は、シトクロムP450酵素である。CYP酵素の基質としては、これ
らに限定されないが、代謝中間体、例えば脂質およびステロイドホルモン、加えて生体異
物、例えば薬物および他の有毒化学物質が挙げられる。CYPは、薬物代謝および生体内
活性化に関与する主要な酵素である。CYPは、酵素反応における基質として、様々な低
分子および大分子を使用する。シトクロムP450によって触媒される最も一般的な反応
は、モノオキシゲナーゼ反応であり、例えば、一方の酸素原子を有機基質(RH)に挿入
し、同時に他方の酸素原子は還元されて水になる。シトクロムP450酵素は、ヘムコフ
ァクターを含有するタンパク質のスーパーファミリーに属しており、そのためヘムタンパ
ク質である。一般的にこれらは、電子伝達鎖において末端のオキシダーゼ酵素である。C
odexisより入手可能なMicroCyp(登録商標)スクリーニングプレートおよ
び酵素は、薬物生成代謝産物および新規のリード化合物の生成に有用である(例えば、W
O2002083868A2、WO2005017105A2、WO200501711
6A2、およびWO2003008563A2で開示されたバリアントを参照)。
るためにNADPHおよび分子酸素を採用する酵素であり、酸素原子は、カルボニル系基
質の炭素−炭素結合に挿入される(例えば、WO2011071982A2およびWO2
012078800A2におけるバリアントを参照)。
H2−CH2−)により芳香環に接続されている1つのアミノ基を含有する、神経伝達物
質および神経調節物質であるモノアミンの酸化を触媒する酵素である。MAOは、フラビ
ン含有アミンオキシドレダクターゼのタンパク質ファミリーに属する(例えば、WO20
10008828A2におけるバリアントを参照)。
離の」アミド中間体の形成を伴わずにカルボン酸およびアンモニアへのニトリルの加水分
解を触媒する酵素である(例えば、WO2011011630A2におけるバリアントを
参照)。
し、電子を窒素原子に供与して二重結合を破断させる酵素である。
を触媒し、ケトまたはアルケン二重結合を破断させる酵素である(例えば、WO2010
075574A2で開示されたバリアントを参照)。
である(例えば、WO2010054319A2におけるペニシリンGアシラーゼのバリ
アントを参照)。
する酵素である。例えば、Agrobacterium radiobacter AD
1において、ハロヒドリンデハロゲナーゼは、ハロヒドリンの脱ハロゲン化を触媒して対
応するエポキシドを生成する(例えば、WO2010080635A2で開示されたバリ
アントを参照)。
互作用する遺伝子についての遺伝子配列のコレクション、遺伝子、核酸配列、タンパク質
、ペプチド、ポリペプチド、多糖などを含めた任意の生物学的配列の順序およびアイデン
ティティーを指すために本明細書で使用される。一部の文脈では、「配列」は、タンパク
質中のアミノ酸残基の順序およびアイデンティティー(すなわち、タンパク質配列もしく
はタンパク質文字列)、または核酸中のヌクレオチドの順序およびアイデンティティー(
すなわち、核酸配列もしくは核酸文字列)を指す。配列は、文字列によって表示され得る
。「核酸配列」は、核酸を構成するヌクレオチドの順序およびアイデンティティーを指す
。「タンパク質配列」は、タンパク質またはペプチドを構成するアミノ酸の順序およびア
イデンティティーを指す。
する、またはタンパク質合成を開始もしくは停止する3つの連続したヌクレオチドの特異
的配列を指す。
を指すために広く使用される。したがって、遺伝子は、コード配列および任意選択で、こ
れらの発現に要求される制御配列を含む。遺伝子は、例えば、他のタンパク質の認識配列
を形成する非発現核酸セグメントも任意選択で含む。遺伝子は、目的の源からのクローニ
ング、または公知のもしくは予測された配列情報からの合成を含めて、様々な源から得る
ことができ、所望のパラメータを有するように設計された配列を含み得る。
得る分子の一部であり、一方、官能基は、これらの分子の特徴的な化学反応を担う分子内
の原子または結合の群である。
の性質が決定されるプロセスを指す。例えば、典型的なスクリーニングプロセスには、1
つまたはそれより多くのライブラリーの1つまたはそれより多くのメンバーの1つまたは
それより多くの性質が決定されるものが含まれる。スクリーニングは、生体分子の計算モ
デルおよび生体分子の仮想環境を使用して計算的に実施することができる。一部の実施形
態では、仮想タンパク質スクリーニングシステムが、所望の活性および選択性の選択され
た酵素について提供される。
を発現させるための系である。
化」は、人為的な淘汰、変異、組換え、または他の操作によって1つまたはそれより多く
の生体分子配列(またはその配列を表示する文字列)を人工的に変化させるin sil
ico、in vitro、またはin vivoプロセスを指す。一部の実施形態では
、指向進化は、(1)個体の品種、(2)遺伝性遺伝情報を有するいくつかの品種、(3
)適合度の異なるいくつかの品種が存在する再現集団(reproductive po
pulation)内で生じる。再現の成功は、有益な特性などの所定の特性についての
選択の転帰によって決定される。再現集団は、例えば、in vitroプロセスにおけ
る物理的集団、またはin silicoプロセスにおけるコンピューターシステム内の
仮想集団とすることができる。
ライブラリーを生成するために、ポリヌクレオチドに容易に適用されることができる。変
異誘発法および指向進化方法は、当技術分野で周知である(例えば、米国特許第5,60
5,793号、同第5,830,721号、同第6,132,970号、同第6,420
,175号、同第6,277,638号、同第6,365,408号、同第6,602,
986号、同第7,288,375号、同第6,287,861号、同第6,297,0
53号、同第6,576,467号、同第6,444,468号、同第5,811238
号、同第6,117,679号、同第6,165,793号、同第6,180,406号
、同第6,291,242号、同第6,995,017号、同第6,395,547号、
同第6,506,602号、同第6,519,065号、同第6,506,603号、同
第6,413,774号、同第6,573,098号、同第6,323,030号、同第
6,344,356号、同第6,372,497号、同第7,868,138号、同第5
,834,252号、同第5,928,905号、同第6,489,146号、同第6,
096,548号、同第6,387,702号、同第6,391,552号、同第6,3
58,742号、同第6,482,647号、同第6,335,160号、同第6,65
3,072号、同第6,355,484号、同第6,03,344号、同第6,319,
713号、同第6,613,514号、同第6,455,253号、同第6,579,6
78号、同第6,586,182号、同第6,406,855号、同第6,946,29
6号、同第7,534,564号、同第7,776,598号、同第5,837,458
号、同第6,391,640号、同第6,309,883号、同第7,105,297号
、同第7,795,030号、同第6,326,204号、同第6,251,674号、
同第6,716,631号、同第6,528,311号、同第6,287,862号、同
第6,335,198号、同第6,352,859号、同第6,379,964号、同第
7,148,054号、同第7,629,170号、同第7,620,500号、同第6
,365,377号、同第6,358,740号、同第6,406,910号、同第6,
413,745号、同第6,436,675号、同第6,961,664号、同第7,4
30,477号、同第7,873,499号、同第7,702,464号、同第7,78
3,428号、同第7,747,391号、同第7,747,393号、同第7,751
,986号、同第6,376,246号、同第6,426,224号、同第6,423,
542号、同第6,479,652号、同第6,319,714号、同第6,521,4
53号、同第6,368,861号、同第7,421,347号、同第7,058,51
5号、同第7,024,312号、同第7,620,502号、同第7,853,410
号、同第7,957,912号、同第7,904,249号、およびすべての関連した非
米国対応物;Lingら、Anal.Biochem、254巻(2号):157〜78
頁[1997年];Daleら、Meth.Mol.Biol.、57巻:369〜74
頁[1996年];Smith、Ann.Rev.Genet.、19巻:423〜46
2頁[1985年];Botsteinら、Science、229巻:1193〜12
01頁[1985年];Carter、Biochem.J.、237巻:1〜7頁[1
986年];Kramerら、Cell、38巻:879〜887頁[1984年];W
ellsら、Gene、34巻:315〜323頁[1985年];Minshullら
、Curr.Op.Chem.Biol.、3巻:284〜290頁[1999年];C
hristiansら、Nat.Biotechnol.、17巻:259〜264頁[
1999年];Crameriら、Nature、391巻:288〜291頁[199
8年];Crameriら、Nat.Biotechnol.、15巻:436〜438
頁[1997年];Zhangら、Proc.Nat.Acad.Sci.U.S.A.
、94巻:4504〜4509頁[1997年];Crameriら、Nat.Biot
echnol.、14巻:315〜319頁[1996年];Stemmer、Natu
re、370巻:389〜391頁[1994年];Stemmer、Proc.Nat
.Acad.Sci.USA、91巻:10747〜10751頁[1994年];WO
95/22625;WO97/0078;WO97/35966;WO98/27230
;WO00/42651;WO01/75767;およびWO2009/152336を
参照。これらのすべては、参照により本明細書に組み込まれている)。
ードする遺伝子を組み換えることによって、および親タンパク質バリアントライブラリー
内のバリアントをコードする遺伝子を組み換えることによってタンパク質バリアントライ
ブラリーを生成する。この方法は、親バリアントライブラリーの少なくとも1種のタンパ
ク質をコードする配列または部分配列を含むオリゴヌクレオチドを使用し得る。親バリア
ントライブラリーのオリゴヌクレオチドのいくつかは、他のバリアントと、組換えによっ
て変更されるように選択された代替アミノ酸のコドンの選択においてのみ異なって密接に
関連している場合がある。この方法は、所望の結果が実現されるまで1回または複数回の
サイクルについて実施され得る。複数のサイクルが使用される場合、各々は、典型的には
、許容される、または改善された性能を有し、少なくとも1つの後続の組換えサイクルで
使用するための候補であるバリアントを識別するためのスクリーニングステップを伴う。
一部の実施形態では、スクリーニングステップは、所望の基質についての酵素の触媒活性
および選択性を決定するための仮想タンパク質スクリーニングシステムを伴う。
よってタンパク質バリアントを生成する。これらの定義された残基は、典型的には、結合
部位の構造解析、量子化学分析、配列相同性分析、配列活性モデルなどによって識別され
る。一部の実施形態は、特異的部位または遺伝子の狭い領域におけるすべての可能な(ま
たは可能な限り近い)変異を生成するように試みる飽和変異誘発を使用する。
親ポリヌクレオチドの断片のコレクションを組み換える指向進化方法のタイプである。あ
る特定の実施形態では、鎖伸長サイクルの1つまたはそれより多くは、セルフプライミン
グであり、すなわち、断片自体以外のプライマーの付加を伴うことなく実施される。各サ
イクルは、ハイブリダイゼーションによる一本鎖断片のアニーリング、鎖伸長によるアニ
ールされた断片の後続の伸長、および変性を伴う。シャッフリングの過程にわたって、成
長中の核酸鎖は、典型的には、「鋳型切り替え」と時に呼ばれるプロセスにおいて複数の
異なるアニーリングパートナーにさらされる。このプロセスは、1つの核酸に由来する1
つの核酸ドメインを第2の核酸に由来する第2のドメインと切り替えることを伴う(すな
わち、第1および第2の核酸がシャッフリング手順における鋳型として機能を果たす)。
メラ配列が生成される。クロスオーバーは、アニーリング、伸長、および変性の複数のサ
イクルの間の鋳型が切り替えられた組換えによって生成される。したがって、シャッフリ
ングにより、典型的には、バリアントポリヌクレオチド配列が生成される。一部の実施形
態では、バリアント配列は、バリアントの「ライブラリー」(すなわち、複数のバリアン
トを含む群)を含む。これらのライブラリーの一部の実施形態では、バリアントは、2つ
またはそれより多くの親ポリヌクレオチドに由来する配列セグメントを含む。
オチドは、異なる親に由来する断片が、シャッフリングサイクルで使用されるアニーリン
グ条件下でハイブリダイズするほど十分に相同である。一部の実施形態では、シャッフリ
ングは、相対的に制限された/低い相同性レベルを有する親ポリヌクレオチドの組換えを
可能にする。多くの場合、個々の親ポリヌクレオチドは、目的の別個のおよび/もしくは
固有のドメイン、ならびに/または他の配列特性を有する。別個の配列特性を有する親ポ
リヌクレオチドを使用するとき、シャッフリングは、高度に多様なバリアントポリヌクレ
オチドを生成することができる。
,882号、同第7,776,598号、同第8,029,988号、同第7,024,
312号、および同第7,795,030号を参照。これらのすべては、その全体が参照
により本明細書に組み込まれている。
Extension」または「gene SOEing」を使用する。これは、制限部位
に依存することなくDNA配列を組み換え、そしてin vitroで変異させられたD
NA断片を直接生成するPCRベース方法である。この技法の一部の実施において、最初
のPCRにより、完全長生成物を作製するために第2のPCRのための鋳型DNAとして
使用される重なった遺伝子セグメントが生成される。内部PCRプライマーは、中間セグ
メントに重なった相補的3’末端を生成し、遺伝子スプライシングのためのヌクレオチド
置換、挿入、または欠失を導入する。これらの中間セグメントの重なった鎖は、第2のP
CRにおいて3’領域でハイブリダイズし、伸長されて完全長生成物を生成する。様々な
用途において、全長生成物は、クローニング目的で発現ベクター中に生成物を挿入するた
めの制限酵素部位を含むことができるフランキングプライマーによって増幅される。例え
ば、Hortonら、Biotechniques、8巻(5号):528〜35頁[1
990年]を参照。「変異誘発」は、標準配列または参照配列、例えば、親核酸または親
ポリペプチドなどの中に変異を導入するプロセスである。
な方法が有用である。したがって、代替としてまたは追加的に、変異体は、遺伝子合成、
飽和ランダム変異誘発、残基の半合成組み合わせのライブラリー、再帰的配列組換え(「
RSR」)(例えば、その全体が本明細書に参照により組み込まれている、米国特許出願
公開第2006/0223143号を参照)、遺伝子シャッフリング、エラープローンP
CR、および/または任意の他の適当な方法によってもたらされ得る。
記載されており、これは、その全体が参照により本明細書に組み込まれている。
けに限らないが、ポリペプチドまたはポリヌクレオチド配列の切断を含めた当技術分野で
公知の任意の適当な方法を使用して生成され得る。一部の実施形態では、断片は、ポリヌ
クレオチドを切断するヌクレアーゼを使用することによって生成される。一部の追加の実
施形態では、断片は、化学的および/または生物学的合成技法を使用して生成される。一
部の実施形態では、断片は、相補的核酸(複数可)の部分的鎖伸長を使用して生成される
少なくとも1つの親配列の部分配列を含む。in silico技法を伴う一部の実施形
態では、化学的および/または生物学的技法によって生成される断片の結果を模倣するた
めに、仮想断片が計算的に生成される。一部の実施形態では、ポリペプチド断片は、完全
長ポリペプチドの活性を呈し、一方、一部の他の実施形態では、ポリペプチド断片は、完
全長ポリペプチドが呈する活性を有しない。
、野生型ポリペプチド、野生型ポリヌクレオチド、または指向進化などの多様性生成手順
における出発点として使用されるバリアントを指すために使用される。一部の実施形態で
は、親自体が、シャッフリングまたは他の多様性生成手順(複数可)を介して生成される
。一部の実施形態では、指向進化で使用される変異体は、親ポリペプチドに直接関連する
。一部の実施形態では、親ポリペプチドは、極度の温度、pH、および/または溶媒条件
にさらされるとき安定であり、シャッフリングのためのバリアントを生成するための基盤
として機能を果たすことができる。一部の実施形態では、親ポリペプチドは、極度の温度
、pH、および/または溶媒条件に対して安定でなく、親ポリペプチドは、ロバストなバ
リアントを作製するために進化させられる。
またはモデル、例えば、核酸配列(例えば、遺伝子、オリゴヌクレオチドなど)、または
これらに由来する発現生成物(例えば、酵素または他のタンパク質)などのコレクション
を指す。ライブラリーまたは集団は一般に、いくつかの異なる分子を含む。例えば、ライ
ブラリーまたは集団は、典型的には、少なくとも約10の異なる分子を含む。大きいライ
ブラリーは、典型的には、少なくとも約100の異なる分子、より典型的には、少なくと
も約1000の異なる分子を含む。一部の用途については、ライブラリーは、少なくとも
約10000またはそれより多くの異なる分子を含む。しかし、本発明が異なる分子の具
体的な数に限定されることは意図されていない。ある特定の実施形態では、ライブラリー
は、指向進化手順によって生成されるある数のバリアントまたはキメラ核酸またはタンパ
ク質を含む。
可)が生成されるとき、「組み換えられる」。2つの配列は、核酸の両方が組換えの基質
であるとき、「直接」組み換えられる。
質を有すると識別されるプロセスを指す。したがって、例えば、ライブラリーをスクリー
ニングして、1つまたはそれより多くのライブラリーメンバーの1つまたはそれより多く
の性質を決定することができる。ライブラリーメンバーのうちの1つまたはそれより多く
が目的の性質を持っていると識別される場合、それは、選択される。選択は、ライブラリ
ーメンバーの分離を含むことができるが、これは必要ではない。さらに、選択およびスク
リーニングは、同時であることができ、同時であることが多い。本明細書に開示の一部の
実施形態は、望ましい活性および/または選択性の酵素をスクリーニングおよび選択する
ためのシステムおよび方法を提供する。
方において様々な生物学的な配列との関係を説明するあらゆる数学モデルを指す。
照配列」は、バリエーションを規定するために使用される。このような配列は、所望の活
性の最高値(または最高値の1つ)を有するとモデルによって予測された配列であっても
よい。別の場合には、参照配列は、元のタンパク質バリアントライブラリーのメンバーの
配列であってもよい。ある特定の実施形態では、参照配列は、親のタンパク質または核酸
の配列である。
ングプロセスを並列化し、数千または数百万の配列を一度に生成するシーケンシング技法
である。適当な次世代シーケンシング法の例としては、それだけに限らないが、単一分子
リアルタイムシーケンシング(例えば、Pacific Biosciences、Me
nlo Park、California)、イオン半導体シーケンシング(例えば、I
on Torrent、South San Francisco、Californi
a)、パイロシーケンシング(例えば、454、Branford、Connectic
ut)、ライゲーションによるシーケンシング(例えば、Life Technolog
ies、Carlsbad、CaliforniaのSOLiDシーケンシング)、合成
および可逆性ターミネーターによるシーケンシング(例えば、Illumina、San
Diego、California)、透過型電子顕微鏡法などの核酸イメージング技
術などがある。
リズム(GA)は、完全には特徴付けられていないか、または複雑すぎて完全な特徴付け
ができないが、何らかの分析的評価が利用可能である問題を解決するために多種多様な分
野で使用される。すなわち、GAは、解の相対値(または少なくとも、別のものとの比較
における1つの潜在的な解の相対値)について何らかの定量化可能な尺度によって評価す
ることができる問題を解決するために使用される。本開示の場合において、遺伝的アルゴ
リズムは、典型的には文字列が1種または複数の生物学的分子(例えば、核酸、タンパク
質など)または配列活性モデルなどのモデルを訓練するために使用されるデータに対応す
る場合に、コンピューターで文字列を選択または操作するためのプロセスである。
価する。「適合度関数」は、集団のメンバーを評価し、高い活性などの1つまたは複数の
基準に基づきそれらをランク付けする。高くランク付けされた文字列は、第2世代に昇格
させるために、および/または第2世代のための「子供の文字列」を生成するためにメイ
ティングするために選択される。第2の世代における集団は、適合度関数によって同様に
評価され、高ランクのメンバーが、第1の世代と同様に昇格させられ、かつ/またはメイ
ティングされる。遺伝的アルゴリズムは、後続の世代についてこの様式で「収束基準」が
満たされるまで継続し、その時点でアルゴリズムは、1つまたは複数の高ランクの個体を
結論付ける。
伝的操作を指し、ここで、文字列の任意のタイプの任意の集団の(かつしたがってこのよ
うな列によってコードされる物理的物体の任意の物理的性質の)すべての変化は、論理代
数関数の有限のセットのランダムなおよび/または所定の適用の結果として記述すること
ができる。GOの例としては、それだけに限らないが、増殖、クロスオーバー、組換え、
変異、ライゲーション、断片化などがある。
II.仮想タンパク質スクリーニング
応を効率的かつ選択的に触媒することなどの所望の活性を有する可能性が高い生体分子バ
リアントをコンピューターにより識別することに関連する様々なオペレーションを実施す
るように設計される。仮想タンパク質スクリーニングシステムは、入力として、バリアン
トと相互作用することが意図された1つまたは1つより多くのリガンドの表示を取り入れ
てもよい。システムは、他の入力として、生体分子バリアント、またはこれらのバリアン
トの少なくとも活性部位の表示を取り入れる場合がある。表示は、リガンドおよび/また
はバリアントの原子および/または部分の3次元位置を含有し得る。ホモロジーモデルは
、生体分子バリアントの表示の例である。仮想タンパク質スクリーニングシステムは、バ
リアントの機能を査定するためにドッキング情報および活性の制約を適用する場合がある
。
活性ポーズとを区別するために1つまたは複数の制約を適用する。このようなポーズは、
上述したようなドッカーによって、または別のツールによって生成され得る。リガンドの
ポーズをその環境で評価して、触媒変換または他の規定された活性がもたらされるように
リガンドの1つまたは複数の特徴がその環境中に配置されるかどうかを決定する。問題と
なる環境は、典型的には酵素または他の生体分子の活性部位である。
質問は、それが「活性な」方式で結合するのかどうかということである。典型的なドッキ
ングプログラムは、リガンドが活性部位に結合するか否かを答えることはできるが、リガ
ンドが「活性な」方式で結合するかどうかに答えることはない。
または複数のポーズを検討することによって決定される。各ポーズを評価して、それが目
的の活性(例えば、「所望の活性」)に関連する制約を満たすのかどうかを決定する。活
性ポーズは、リガンドが触媒変換を受けるか、または結合部位との共有結合などの何らか
の所望の役割を果たす可能性が高いポーズである。
、特定の反応に関連していることが分かっているポーズを識別するように構成してもよい
。一部の実施形態では、これは、基質自体ではなく、反応中間体または遷移状態を考慮す
る。転換に加えて、ポーズを、他のタイプの活性、例えば、鏡像異性体の立体選択的合成
、薬物発見に重要であると識別された標的生体分子の受容体への結合、生成物の位置選択
的な変換などに関して評価してもよい。一部の場合には、活性は、非可逆性または可逆性
共有結合であり、例えば、標的化共有結合阻害(TCI)などである。
報に基づいて決定されてもよい。1つのアプローチにおいて、研究者は、野生型タンパク
質に関する活性部位および天然基質を評価する。これは、野生型タンパク質は、生来その
天然基質のために進化していることが分かっており、したがって最適な触媒定数(kca
t)を有するためである。一部の場合には、野生型タンパク質および天然基質または中間
複合体の結晶構造がすでに解析されている。次いで、構造分析に基づき、制約をセットア
ップすることができる。これは、制約を決定するための「直接的なアプローチ」と称され
る。このような結晶構造が利用できない場合には、評価は、例えばドッキングプログラム
を用いて行なわれてもよい。プログラムを使用して、研究者は、野生型タンパク質におけ
る天然基質の触媒変換に関連する制約を識別する。これは、制約を決定するための手動的
または実験的アプローチと称される。別のアプローチにおいて、制約は、量子力学計算を
使用して決定される。例えば、研究者は、量子力学を使用して、触媒性残基(例えば、T
yr)の官能基および/またはコファクター(例えば、NADHP)の存在下で基質また
は中間体または遷移状態を最適化して、それらの状況と類似するように制約を設定するこ
とができる。このアプローチは、時には自動的または非経験的アプローチと称される。こ
のアプローチを使用する市販のツールの例は、www|.|Gaussian.comよ
り入手可能なGaussianである。
全部のこれらの制約は、3次元空間においてリガンドのポーズ中の1つまたは複数の原子
の相対的な位置を特定する幾何学的な制約である。一部の実施形態では、空間は、活性部
位における原子の位置に対して規定されていてもよい。
的配置を評価する制約である。ある特定の実施形態では、参加物の1つは、リガンド上の
部分または他の化学種である。一部の実施形態では、他の参加物は、生体分子の活性部位
の部分または他の化学的特徴である。活性部位の部分または他の化学的特徴は、生体分子
の活性部位における残基(例えば、アミノ酸残基の側鎖)、コファクターにおける特徴ま
たは典型的には活性部位および/もしくは触媒作用に関連する他の化合物などに関連して
いてもよい。一例として、ケトレダクターゼタンパク質によるケトンの還元において、基
質のカルボニル基は、幾何学的な制約における1つの参加物であってもよく、酵素活性部
位のチロシン部分は、幾何学的な制約における第2の参加物であってもよい。
環境の1つまたは複数の特徴に関して作成される。一部の実施形態では、環境は、ペプチ
ド骨格(または側鎖)の残基位置および/またはコファクターあるいは活性部位に通常存
在する他の非骨格材料を含み得る。
間のねじれ関係などに対して規定され得る。時には、制約は、活性を特徴付けるために使
用される、複数の基礎となる幾何学的な制約を含む。例えば、基質の位置に対する制約は
、2つまたはそれより多くの原子対間の距離によって規定され得る。図1に例を示す。ね
じれ関係の場合には、基質および活性部位環境の特徴が共通の回転軸を有する名目上平行
なプレートとみなされる場合に制約は適切であり得る。これらのプレートの軸周りの相対
的な角度位置は、ねじれの制約を規定する。
できるワークフローの例を表す。表されたワークフローでは、野生型酵素がケトンレダク
ターゼであり、天然基質がアセトフェノンであると仮定される。図1の左上隅に表される
ように、天然の反応は、アセトフェノンを、立体選択的な触媒作用により対応するアルコ
ールに転換する。この反応は、ケトン基質のアセチル炭素にキラル中心を導入する。野生
型ケトンレダクターゼは、R鏡像異性体のみが生成されるように転換を制御する。この反
応は、コファクターとしてのNADPHの存在下で達成される。この反応は、図1の左上
隅で模式的に表される。
不活性ポーズとを区別するために使用される幾何学的な制約を規定するときに検討される
。プロセスの一部として、研究者または自動システムは、アセトフェノン基質の配向を、
野生型ケトンレダクターゼにおけるその触媒環境に対して決定する。一般的に、関連する
環境は、触媒変換が起こるときに存在する周辺の残基、コファクターなどを含む。
は、(1)野生型酵素の骨格のチロシン残基および(2)コファクターであるNADPH
における原子の位置である。活性ポーズにおける基質の他の関連する環境の特徴は、活性
部位内のサブポケットである。これらは、図1には示されていない。サブポケットの1つ
はアセトフェノン基質のフェニル基を収容し、別のサブポケットはアセトフェノンのメチ
ル基を収容する。これらのサブポケットが一緒になって、反応の立体特異性を決定付ける
配向に基質を保持する。一部の実施形態では、上記の情報は、野生型ケトンレダクターゼ
と天然アセトフェノン基質との複合体の結晶構造の構造分析に基づき集められる。したが
って、幾何学的な制約を直接規定することができる。
によって表される。具体的には、NADPHは、アセトフェノンのカルボニル炭素とカッ
プリングしているヒドリドイオンを介して電子を供与する。同時に、アセトフェノンのカ
ルボニル酸素からの電子対はチロシン残基のプロトンに供与され、チロシンのヒドロキシ
ル酸素からの電子対は、NADP(H)のリボース部分のプロトンに供与され、そこで基
質の対応するアルコールへの転換が完了する。述べたように、この反応は、1つのより大
きいサブポケット中に基質のフェニル基が保持され、それより小さい下位のサブポケット
中にそのメチル基が保持され、チロシンのヒドロキシル基にごく近接してそのケトン基が
保持されている間に進行する。
」と称される異なる基質の転換を立体特異的に触媒するバリアントケトンレダクターゼに
進化させられる。図1の中央に表されるように、所望の反応は、メチルtert−ブチル
ケトンの対応するアルコールのS鏡像異性体(1tert−ブチルエチルアルコール)へ
の転換である。この反応は、転換に最適化されたバリアント酵素の活性部位でコファクタ
ーNADPHと共に触媒されると推測される。
定されるべきである。天然基質は、野生型ケトンレダクターゼによってR鏡像異性体に転
換され、所望の基質は、バリアントによってS鏡像異性体に転換されることに留意された
い。それゆえに、所望の基質のtert−ブチル基が、天然のアセトフェノン基質のメチ
ル基を通常収容するサブポケット中に配置され、所望の基質のメチル基が、天然基質のフ
ェニル基を収容するサブポケット中に配置されることを検討することができる。
もよい。そこで示したように、最大の転換(kcat)を得るために、結晶構造における
WT酵素の活性部位に天然基質が存在するときのように、天然基質の3次元位置に関連し
て様々な制約が規定される。言い換えれば、図1の右上隅における図表に関して決定され
るように、触媒による転換を決定付けるカルボニル炭素およびカルボニル酸素、ならびに
立体選択性決定するカルボニル炭素に隣接する2つの炭素のいずれかなどの天然基質の主
要な官能基の配向は、X、Y、Z座標に変換される。全てのバリアントのホモロジーモデ
ルは鋳型としてWTの構造を使用して構築されたので、X、Y、Z座標は、バリアントに
移行可能である。この参照のフレームを用いて、所望の基質の主要な官能基(C1(C2
)C=O)の位置は、触媒性チロシン残基およびNADPHコファクターに対して最適な
配向で存在すると予測される天然基質の対応する4個の原子の位置と比較することができ
る。注目すべきことに、触媒作用(例えば、チロシン)に関する残基およびコファクター
(NADPH)結合に関する残基は全てのバリアントで保存されており、このチロシンお
よびNADPHについては、全てのバリアントにおいてわずかな立体配座または位置の変
化しか予測されない。これを念頭に置いて、図1の左下隅に表された位置の制約は、所望
の基質のカルボニル炭素原子、カルボニル酸素原子、および中央のtert−ブチル原子
の、それに対応する天然基質のカルボニル炭素原子、カルボニル酸素原子、およびメチル
炭素原子の位置に対する位置の範囲を特定する。所望の基質の原子と天然基質の対応する
原子との位置的な差の範囲は、距離d1、d2、およびd3によって表される。一例とし
て、これらの距離のそれぞれは、所望の基質のポーズが活性ポーズとみなされるためには
、1オングストロームまたはそれ超もしくはそれ未満であることが必要な場合がある。制
約の値は通常、バリアント中の触媒性チロシンおよびコファクターのわずかなコンホメー
ション変化を反映する一定のフレキシビリティーを可能とする範囲になるように設定され
る。一部の実施において、これらの距離に関する基準は、機械学習アルゴリズムによって
改良される。
に近い。上記の位置の制約を満たすポーズにおいて所望の基質とドッキングされたケトレ
ダクターゼバリアントは、触媒活性でありS選択的であることが期待される。
的な制約も適用することができる。一部の実施において、上記システムは、参加物間の絶
対距離を適用する。例えば、基質カルボニル基中の酸素原子と活性部位のチロシン基の原
子との間の距離が、制約として特定されてもよい(例えば、これらの原子間の距離は、2
ű0.5Åでなければならない)。別の例において、カルボニル基中の炭素原子と酸素
原子との間の軸によって規定される1本の線と、活性部位中のフェニル基の軸に沿った別
の線との間の角度は、120°±20°である。
素またはコファクター(または他のエンティティ)の1つまたは複数の原子との間で規定
された、幾何学的な制約のタイプの例を表す。距離の制約は、基質における原子と、活性
部位残基、コファクターなどにおける原子との間の距離として規定される。角度の制約は
、基質およびその環境において規定された2本またはそれより多くの軸間の角度の関係に
よってポーズに関して規定される。軸は、共有結合、基質の原子と結合ポケット中の部分
との間の線などであり得る。例えば、角度は、基質における2つの原子間で規定された1
本の軸と、残基における原子および基質における原子の分離線として規定された別の軸と
の間で規定されていてもよい。一部の他の実施形態では、1つの軸は、残基側鎖における
2つの原子間で規定され、別の軸は、基質における原子と残基における原子との分離線に
よって規定される。追加のタイプの幾何学的な制約は、図1の右下隅に表される。このタ
イプの制約は、「ねじれの制約」と称され、結合ポケット中の2つの別個のエンティティ
(それらの1つは、典型的には基質の全部または一部である)が共通の回転軸を有すると
仮定される。ねじれの制約は、一方のエンティティの、共通の回転軸周りの他方に対する
角度位置の範囲によって規定され得る。
された幾何学的位置または配向に対して適用されてもよい。このような位置または配向は
、例えば、結合ポケット中の天然基質における活性な部分の代表的な位置によって特定す
ることができる。一例として、検討中の基質のカルボニル基の炭素および酸素原子は、結
合ポケット中の天然基質におけるカルボニル基の炭素および酸素原子の位置から1Å以内
になければならない。図1の左下隅に示される位置の制約を参照されたい。図1の左下隅
における位置の制約が、所望の基質と天然基質との間に存在していることに留意されたい
。しかしながら、位置の制約は、図1の下の中央および右隅における幾何学的な制約に対
応する所望の基質と酵素バリアントとの関係に変換することができる。
に決定することに加えて、スクリーニング結果により制約を改良することもできる。例え
ば、所望の反応に関して、実験室でのスクリーニングにより、1つまたは1つより多くの
バリアントが活性であると識別され、一方でそれ以外のいくつかが不活性であると識別さ
れる場合、それらのポーズをさらに分析してもよく、制約を訓練してもよい。
ルケトン)を使用しているが、指向進化の試みにおいてそれよりもはるかに大きくより複
雑な基質がしばしば評価される。
ーを示す。多くの様々な活性が検討され得るが、この実施形態では重要視される活性は、
基質の触媒的変換である。変換は、エナンチオ選択的または位置選択的であり得る。この
ような場合には、バリアントは、酵素である。この図の説明において、用語「基質」が使
用される場合、その概念は、反応生成物への基質の触媒的変換における律速段階において
重要な反応中間体または遷移状態などの関連リガンドにも及ぶ。
別することにより、プロセスが始まる。ブロック201を参照されたい。一部の場合には
、制約は、ドッキングによって識別される。このようなプロセスにおいて、研究者は、基
質または反応中間体または遷移状態と酵素の活性部位との相互作用を検討に入れる。プロ
セスにおいて、研究者は、所望の活性(例えば、基質の立体特異的な触媒的変換)をもた
らす制約を識別する。研究者は、酵素および関連する基質、中間体、または遷移状態の表
示を提供する構造解析、ドッキングプログラムおよび/または量子力学計算の助けによっ
てこれを行ってもよい。ドッカーを用いてなされるドッキングは、時には「実験的な」ド
ッキングアプローチと称され、量子力学ツールを用いてなされる最適化は、時には「非経
験的」アプローチと称される。一部の実施形態では、ドッキングは、野生型酵素および天
然基質、中間体、または遷移状態を用いて実施される。ブロック201を参照されたい。
上記で説明したように、一部の制約は、図1の左下隅で示されるような、所望の基質中の
部分と天然基質または関連するコファクター中の部分との相対的な位置を表示する幾何学
的な制約である。一部の実施において、制約は、所望の基質と酵素バリアントとの関係と
して規定することができ、例えば図1の下の中央および右隅に示される幾何学的な制約で
ある。
ること以外の技術によって識別することもできる。例えば、触媒反応に関連する部分を識
別し、量子力学および分子動力学ツールを使用して識別された部分間の関係を規定するこ
とも可能である。
関して検討しようとする複数のバリアント生体分子のそれぞれに関する構造モデルを生成
するかまたはそれを受け取る。ブロック203を参照されたい。説明したように、構造モ
デルは、活性部位または酵素バリアントの他の態様のコンピューターにより生成された3
次元表示である。これらのモデルを、その後のデータベースまたは他のデータリポジトリ
での使用のために保存することができる。一部の場合には、モデルの少なくとも1つは、
ワークフローで使用するために生成される。一部の場合には、モデルの少なくとも1つが
事前に生成されたが、この場合には、プロセスは単にこのようなモデルを受け取る。
プロセスで使用される。これは、ドッキングプログラムを利用する従来のワークフローと
は対照的であるはずである。従来のワークフローは、単一の標的または配列に焦点を当て
ている。一部の場合には、従来のワークフローは受容体の複数の事例を検討するが、これ
らは同じ配列に基づく。事例のそれぞれは、NMRまたは分子動力学シミュレーションか
ら生成される異なる3次元座標を有する。
位置に関連する位置における、1つまたは複数のアミノ酸残基のモデルにおける挿入、欠
失、または置き換えにより互いに異なっていてもよい。構造モデルは、様々な技術によっ
て生成され得る。一実施形態では、それらはホモロジーモデリングによって生成される。
グシステムは、検討のために選択されたバリアントに反復適用される。反復適用の制御は
、ブロック205によって例示されており、これは、検討する次のバリアント酵素が分析
のために選択されていることを示す。このオペレーションおよび図2の残りのオペレーシ
ョンは、ソフトウェアまたはデジタル論理によって実施されてもよい。
、所望の基質をバリアントの活性部位にドッキングすることを試みる。ブロック207を
参照。このプロセスは、従来のドッキング手順に対応していてもよい。それゆえに、基質
がバリアント中の活性部位とドッキングできるか否かを決定するためにドッカーが利用さ
れる場合がある。この決定は、ブロック209に示される。所望の基質は、時には、制約
を生成するために使用された可能性がある天然基質と異なることに留意されたい。
する場合、プロセス制御はブロック220に方向付けられ、そこでシステムは、検討すべ
きそれ以上のバリアントがあるかどうかを決定する。検討すべきさらなるバリアントがな
い場合、提示されているように任意選択のオペレーション223でプロセスは完了する。
一方で、検討されるべき1つまたは複数のバリアントが残っている場合、プロセス制御は
、プロセスステップ205に戻るよう方向付けられ、そこで検討のための次のバリアント
が選択される。次いでこのバリアントは、ブロック207および209に関して上述した
ように、検討中の基質をドッキングするその能力に関して評価される。
プロセス制御は、アルゴリズムの一部に方向付けられ、そこで複数のポーズが検討され、
それぞれ活性に関して評価される。後述するように、この分析は、ブロック211、21
3、215、および217によって表される。
施形態では、ドッカーは、ポーズの選択を助ける。説明したように、ドッカーは、活性部
位において非常に多くの基質のポーズを生成することができる。またドッカーは、例えば
ドッキングスコア、エネルギーに関する検討などの1つまたは複数の基準に基づいてもポ
ーズをランク付けすることができる。他所で説明したように、全エネルギーおよび/また
は相互作用エネルギーが検討されてもよい。どのようにポーズが生成および/またはラン
ク付けされるかに関係なく、ワークフローは、特定の数のポーズを検討するように設計さ
れていてもよい。検討しようとするポーズの数は、任意に設定することができる。一実施
形態では、少なくとも上位の約10のポーズが検討される。別の実施形態では、少なくと
も約20のポーズが検討されるか、または少なくとも約50のポーズ、もしくは少なくと
も約100のポーズが検討される。しかしながら、本発明がポーズの具体的な数に限定さ
れることは意図されない。
次いで現在選択されているポーズは、ブロック201で識別された制約に対して評価され
て、そのポーズが活性ポーズであるかどうかが決定される。説明したように、このような
制約は、基質が所望の触媒的変換を受ける可能性が高いように、基質の1つまたは複数の
部分が活性部位内に位置するかどうかを決定する幾何学的な制約であってもよい。
場合、仮想タンパク質スクリーニングシステムは、次に、検討中の現在のバリアントのた
めに検討すべきそれ以上のいずれかのポーズがあるかどうかを決定する。ブロック215
を参照。検討すべきさらなるポーズがあると仮定すると、プロセス制御は、ブロック21
1に戻るよう方向付けられ、そこで次のポーズが検討される。
あると決定すると仮定すると、このポーズはその後の検討のために記録される。ブロック
217を参照。一部の実施形態では、仮想タンパク質スクリーニングシステムは、現在検
討中のバリアントに関する活性ポーズの数のランニングタリー(running tal
ly)を維持してもよい。
に方向付けられ、そこで仮想タンパク質スクリーニングシステムは、検討すべきそれ以上
のポーズがあるかどうかを決定する。検討中のバリアントに関して全ての利用可能なポー
ズの検討を繰り返した後、仮想タンパク質スクリーニングシステムは、検討すべきさらな
るポーズがないと決定し、プロセス制御は、現在のバリアントの可能性がある活性を特徴
付けるブロック218に方向付けられる。特徴付けは、これらに限定されないが、検討中
のバリアントに関する活性ポーズの数および関連するドッキングスコア、ならびに本明細
書で説明されるような他の検討などの様々な技術によって行うことができる。ブロック2
18のオペレーションが完了した後、プロセス制御は、検討すべきそれ以上のいずれかの
バリアントがあるかどうかを決定する決定オペレーション220に方向付けられる。検討
すべき追加のバリアントがある場合、プロセス制御は、ブロック205に戻され、そこで
ワークフローは上述したように継続される。
ムは、1つまたは複数の基準、例えばバリアントが有する活性ポーズの数、活性ポーズの
1つまたは複数のドッキングスコア、および/または活性ポーズの1つまたは複数の結合
エネルギーに基づき、それらをランク付けしてもよい。ブロック223を参照。活性ポー
ズとして識別されたポーズ(ブロック217)のみが、ブロック223のランク付けを実
施して評価する必要がある。この方式において、ワークフロー中のオペレーションは、活
性ポーズから不活性ポーズをフィルタリングして、バリアントのランク付けに関連するコ
ンピューターの労力を節約するために役立つ。図2では示されないが、バリアントは、そ
れらのランク付けに基づきさらなる調査のために選択されてもよい。
に、結合エネルギーを算出するためのプロトコルが実行される。一部の実施では、このプ
ロトコルは、ファンデルワールス力、静電相互作用、および溶媒和エネルギーを考慮し得
る。溶媒和は、典型的には、ドッカーによって実施される算出において考慮されない。様
々な溶媒和モデルが結合エネルギーを算出するために利用可能であり、これらとしては、
それだけに限らないが、距離依存性誘電体、ペアワイズ加算を用いた一般化ボルン(Ge
nBorn)、インプリシットメンブレン(Implicit Membrane)を用
いた一般化ボルン(GBIM)、分子体積統合(Molecular Volume i
ntegration)を用いた一般化ボルン(GBMV)、単純スイッチング(sim
ple switching)を用いた一般化ボルン(GBSW)、および非極性表面積
(PBSA)を用いたポアソン−ボルツマン方程式がある。結合エネルギーを算出するた
めのプロトコルは、ドッカープログラムと異なり、またはそれと別個である。これらは一
般に、これらの算出において溶媒和効果を含めることに部分的に起因して、ドッキングス
コアより正確である結果を生じさせる。様々な実施では、結合エネルギーは、活性である
と見なされているポーズについてのみ算出される。
A.それぞれ活性部位を含有する複数の生体分子のモデルの生成
供することができる。3次元モデルは、タンパク質バリアントの全長配列の一部またはす
べての計算上の表示である。典型的には最低でも、計算表示は、少なくともタンパク質バ
リアントの活性部位をカバーする。
て調製されるホモロジーモデルである。3次元モデルは、タンパク質バリアントがこれら
のアミノ酸配列において相違する構造鋳型を使用する。一般に、構造鋳型は、モデル配列
に相同である配列についてX線結晶構造解析法またはNMRによって以前に解析された構
造である。ホモロジーモデルの品質は、構造鋳型の配列アイデンティティーおよび分解能
に依存する。ある特定の実施形態では、3次元モデルは、現在または将来のプロジェクト
に必要な場合に使用するためにデータベース中に記憶され得る。
成され得る。一例は、タンパク質スレッディングであり、これも構造鋳型を必要とする。
別の例は、構造鋳型を必要とせず、根本的な物理的原理に基づくab initioまた
はde novoタンパク質モデリングである。ab initio技法の例としては、
分子動力学シミュレーションおよびRosettaソフトウェアスイートを使用するシミ
ュレーションがある。
る。一部の場合では、活性部位は、活性部位のアミノ酸配列中の少なくとも1つの変異に
よって互いに異なる。変異は、野生型タンパク質配列または一部の他の参照タンパク質配
列において行われ得る。一部の場合では、タンパク質バリアントの2つまたはそれより多
くは、活性部位について同じアミノ酸配列を共有するが、タンパク質の別の領域のアミノ
酸配列が異なる。一部の場合では、2つのタンパク質バリアントは、少なくとも約2つの
アミノ酸、または少なくとも約3つのアミノ酸、または少なくとも約4つのアミノ酸だけ
互いに異なる。しかし、本発明がタンパク質バリアント間のアミノ酸差異の具体的な数に
限定されることは意図されていない。
によって生成されるライブラリーのメンバーを含む。指向進化で使用される多様性生成技
法としては、遺伝子シャフリング、変異誘発、組換えなどがある。指向進化技法の例は、
その全体が参照により本明細書に組み込まれている米国特許出願公開第2006/022
3143号に記載されている。
バリアント、または少なくとも約100の異なるバリアント、または少なくとも約100
0の異なるバリアントを含む。しかしながら、本発明がタンパク質バリアントの具体的な
数に限定されることは意図されない。
B.複数の異なるタンパク質バリアントにおけるリガンドの評価
複数のバリアントの活性部位の計算上の表示を使用する適切にプログラムされたコンピュ
ーターシステムによって行われる。
構成され得る:
1.ランダムな種を用いた高温分子動力学を使用して一組のリガンドコンホメーション
を生成する。ドッカーは、リガンドの環境を考慮することなくこのようなコンホメーショ
ンを生成し得る。したがって、ドッカーは、内部歪みまたはリガンドだけに特異的な他の
考慮事項のみを考慮することによって好ましいコンホメーションを識別し得る。生成され
るべきコンホメーションの数は、自由裁量で設定することができる。一実施形態では、少
なくとも約10のコンホメーションが生成される。別の実施形態では、少なくとも約20
コンホメーション、または少なくとも約50コンホメーション、または少なくとも約10
0のコンホメーションが生成される。しかし、本発明がコンホメーションの具体的な数に
限定されることは意図されていない。
2.リガンドの中心を受容体活性部位内の指定場所に並行移動し、一連結のランダムな
回転を実施することによってコンホメーションのランダムな向きを生成する。洗練するた
めの向きの数は、自由裁量で設定することができる。一実施形態では、少なくとも約10
の向きが生成される。別の実施形態では、少なくとも約20の向き、または少なくとも約
50の向き、または少なくとも約100の向きが生成される。しかし、本発明が向きのど
んな具体的な数にも限定されることは意図されていない。ある特定の実施形態では、ドッ
カーは、向きとコンホメーションのさらなる組合せを生成するための「柔軟化(soft
ened)」エネルギーを算出する。ドッカーは、活性部位中のある特定の向きの許容性
について物理的に非現実的な仮定を使用して柔軟化エネルギーを算出する。例えば、ドッ
カーは、リガンド原子および活性部位原子が、パウリ反発および立体的配慮に基づいて不
可能である、本質的に同じ空間を占有することができると仮定し得る。この柔軟化された
仮定は、例えば、コンホメーション空間を探索するときのレナード−ジョーンズポテンシ
ャルの緩和形式を使用することによって実施することができる。柔軟化エネルギー算出を
使用することによって、ドッカーは、物理的に現実的なエネルギー考慮事項を使用して利
用可能であるものより、コンホメーションの完全な探索を可能にする。特定の向きにおけ
るコンホメーションの柔軟化エネルギーが指定された閾値より低い場合、コンホメーショ
ン−向きは保たれる。これらの低エネルギーコンホメーションは、「ポーズ」として保持
される。ある特定の実施では、このプロセスは、所望の数の低エネルギーポーズが見つか
るか、または最大数の悪いポーズが見つかるまで継続する。
3.ステップ2からの各保持されたポーズにシミュレーテッドアニーリング分子動力学
を受けさせ、ポーズを洗練する。温度が高い値まで上昇され、次いで標的温度に冷却され
る。ドッカーは、柔軟化エネルギー算出によって提供されるより物理的に現実的な向きお
よび/またはコンホメーションを提供するためにこれを行い得る。
4.非柔軟化ポテンシャルを使用して剛性受容体(rigid receptor)に
おけるリガンドの最終的な最小化を実施する。これは、保持されたポーズについてより正
確なエネルギー値をもたらす。しかし、この算出は、ポーズのエネルギーについて部分的
な情報しかもたらさない場合がある。
5.各最終ポーズについて全エネルギー((受容体−リガンド相互作用エネルギー)+
(リガンド内部歪み))と相互作用エネルギー単独とを算出する。算出は、CHARMm
を使用して実施され得る。ポーズは、CHARMmエネルギーによって並び替えられ、上
位スコアの(最も否定的(most negative)、したがって結合に好ましい)
ポーズが保持される。一部の実施形態では、このステップ(および/またはステップ4)
により、エネルギー的に不都合であるポーズが除去される。
led Analysis of Grid−Based Molecular Doc
king:A Case Study of CDOCKER − A CHARMm−
Based MD Docking Algorithm、J.Computation
al Chem.、24巻、13号、1549〜62頁(2003年)。これは、その全
体が参照により本明細書に組み込まれている。
にスクリーニングシステムによって使用された情報の1つまたは複数のピースを提供する
ことができる。このような情報としては、所望の基質とのドッキングが起こりそうにない
バリアントのアイデンティティーが挙げられる。このようなバリアントは、活性などに関
して評価する必要はない。ドッカーによって提供される他の情報としては、活性に関して
検討することができるポーズのセット(各バリアントにつき1つのセット)が挙げられる
。さらに他の情報としては、セット中のポーズのドッキングスコアが挙げられる。
C.ドッキングされたリガンドのポーズが活性であるかどうかの決定
リーニングシステムは以下のオペレーション:(i)検討中のタンパク質バリアントの活
性部位におけるリガンドの計算上の表示の複数のポーズを検討すること、および(ii)
存在する場合、複数のポーズのどれが活性であるかを決定することを行う。
るための1つまたは複数の制約を満たすポーズである。リガンドが基質であり、タンパク
質が酵素である場合、活性な結合は、基質が触媒による化学変換、特に立体特異的変換を
起こすことを可能にする結合であり得る。一部の実施では、制約は、リガンド中の1つも
しくは複数の原子ならびにタンパク質および/またはタンパク質に会合したコファクター
中の1つもしくは複数の原子の相対的な位置の範囲を規定する幾何学的な制約である。
生型酵素によって触媒による化学変換を受けるときの中間体の1つまたは複数のコンホメ
ーションから識別される。ある特定の実施形態では、制約としては、(i)基質および/
もしくは後続の中間体上の特定の部分と活性部位中の特定の残基もしくは残基部分との間
の距離、(ii)基質および/もしくは後続の中間体上の特定の部分と活性部位中の特定
のコファクターとの間の距離、ならびに/または(iii)基質および/もしくは後続の
中間体上の特定の部分と活性部位中の理想的に位置された天然の基質および/もしくは後
続の中間体上の特定の部分との間の距離がある。ある特定の実施形態では、制約は、化学
結合間の角度、軸周りのねじれ、または化学結合における歪みを含み得る。
質バリアントの計算上の表示に関して生成され得る。複数のポーズは、様々な技法によっ
て生成され得る。このような技法の一般的な例として、回転可能な結合についての系統的
または確率論的ねじりサーチ、分子動力学シミュレーション、および低エネルギーコンホ
メーションを場所特定するように設計された遺伝的アルゴリズムがある。一例では、ポー
ズは、高温分子動力学を使用して生成され、その後、ランダム回転、グリッド−ベースシ
ミュレーテッドアニーリングによる洗練、ならびに最終的なグリッドベースもしくは力場
最小化が行われて、計算上の表示の活性部位中の基質および/もしくは後続の中間体のコ
ンホメーションおよび/もしくは配向を生成する。これらのオペレーションのいくつか、
例えば、グリッド−ベースシミュレーテッドアニーリングによる洗練、およびグリッド−
ベースまたは力場最小化は任意選択である。
とも約20、または少なくとも約50、または少なくとも約100、または少なくとも約
200、または少なくとも約500である。しかし、本発明が考慮されるポーズの具体的
な数に限定されることは意図されていない。
的に好ましい1つまたは複数のポーズを有すると決定される。ある特定の実施形態では、
さらなる検討のために選択されたバリアントは、他のバリアントとの比較において多数の
活性なコンホメーションを有すると決定されたバリアントである。ある特定の実施形態で
は、バリアントは、それらが有する活性ポーズの数、活性ポーズに関する1つまたは複数
のドッキングスコア、および/または活性ポーズに関する1つまたは複数の結合エネルギ
ーに基づきバリアントをランク付けすることによって選択される。例として、検討される
可能性があるドッキングスコアのタイプとしては、ファンデルワールス力および/または
静電相互作用に基づくスコアが挙げられる。例として、検討される可能性がある結合エネ
ルギーのタイプとしては、ファンデルワールス力、静電相互作用、および溶媒和エネルギ
ーが挙げられる。
らなる調査、合成、生成などのために選択されてもよい。一例において、選択されたタン
パク質バリアントは、1または複数のラウンドの指向進化を導入するために使用される。
一例として、1ラウンドの指向進化は、(i)選択されたタンパク質バリアントの少なく
とも一部を含有するかまたはコードする複数のオリゴヌクレオチドを調製するステップと
、(ii)複数のオリゴヌクレオチドを使用して1ラウンドの指向進化を実施するステッ
プとを含み得る。オリゴヌクレオチドは、これらに限定されないが、選択されたタンパク
質バリアントの一部または全部をコードする核酸の遺伝子合成、断片化などの任意の適当
な手段によって調製されてもよい。ある特定の実施形態では、指向進化のラウンドは、複
数のオリゴヌクレオチドを断片化して組み換えるステップを含む。ある特定の実施形態で
は、指向進化のラウンドは、複数のオリゴヌクレオチドに飽和変異誘発を実施するステッ
プを含む。
れないが、例えば、ケトンの還元、アミノ基転移反応、酸化、ニトリルの加水分解、イミ
ンの還元、エノンの還元、アシル加水分解、およびハロヒドリンの脱ハロゲン化が挙げら
れる。制約を使用して評価される複数のバリアントを提供することができる酵素クラスの
例としては、これらに限定されないが、ケトンレダクターゼ、トランスアミナーゼ、シト
クロムP450、バイヤー−ビリガーモノオキシゲナーゼ、モノアミンオキシダーゼ、ニ
トリラーゼ、イミンレダクターゼ、エノンレダクターゼ、アシラーゼ、およびハロヒドリ
ンデハロゲナーゼが挙げられる。合理的にリガンドを設計する状況において、標的化され
た共有結合阻害(TCI)の最適化は、制約の使用のためにスクリーニングすることがで
きる活性のタイプである。TCI適用の例は、その全体が参照により本明細書に組み込ま
れているSinghら、The resurgence of covalent dr
ugs、Nature Reviews Drug Discovery、10巻、30
7〜317頁(2011年)で説明されている。一部の実施において、TCI活性は、タ
ンパク質中の求核性アミノ酸(例えば、システイン)を識別することによって見出される
。本明細書に記載されるプロセスは、阻害しようとする生体分子と反応することができる
、阻害に重要な求電子性部分の理想的な配向を規定する制約を満たす阻害剤(推定上の阻
害剤)の識別を助けることができる。
III.酵素を設計するための仮想タンパク質スクリーニングシステムの使用
デリングし、スクリーニングして、それによって所望の性質、例えば触媒活性および選択
性を有する酵素を識別するためのプロセスを提供する。一部の実施形態では、現実の酵素
のファミリーを、仮想でモデリングして、最初のバリアントライブラリーとしてスクリー
ニングすることができる。一部の実施形態は、親のポリペプチドまたは参照配列として最
初のライブラリーから仮想スクリーニングによって選択された1つまたは複数の酵素を反
復して使用して、in silico、in vitro、またはin vivoの技術
によって新しいバリアントライブラリーを生成することができる。一部の実施形態では、
本明細書に記載されるようなシステムによって高くランク付けされた1つまたは複数の酵
素は、親のポリペプチドとして選択される。新しいバリアントライブラリーは、親のポリ
ペプチドの配列とは異なるタンパク質配列を含み、かつ/またはその後のバリエーション
を導入するための前駆体として使用することができる。
の新しいライブラリーを生成するために変異誘発および/または組換えベースの多様性生
成機構を実施することによって改変される。一部の実施形態では、親のポリペプチドは、
少なくとも1つの置換、挿入、交差、欠失、および/または他の遺伝子操作によって変更
される。指向進化は、ポリペプチドに対して直接的に(例えば、in silicoのプ
ロセスで)、またはポリペプチドをコードする核酸に対して間接的に(例えば、in v
itroのプロセスで)実施されてもよい。新しいライブラリーを使用して、さらなるス
クリーニングおよび指向進化のために新しいホモロジーモデルを生成することができる。
を満たす1つまたは複数の酵素に出会うまでin silicoで反復して実施される。
例えば、基準は、特定の結合エネルギーまたはスコア、またはそれらの改善であり得る。
他の実施形態は、in silicoの技術と物理的な(例えば、in vitroまた
はin vivoの)技術とを組み合わせてもよい。例えば、in vitroのスクリ
ーニングおよびシーケンシングによって誘導された酵素を使用した酵素設計プロセスを開
始することが可能である。in vitroのシーケンシングは、次世代のシーケンシン
グによって実施してもよい。次いで、酵素設計プロセスは、指向進化、モデリング、およ
びさらなるスクリーニングのためにin silicoの方法を使用することができる。
本プロセスは、最終的に、生物系で酵素を検証するためにin vitroおよび/また
はin vivoの技術を使用することができる。様々な適用のためにin silic
oおよび物理的な技術の他の組合せおよび順番が好適である。実際に、本発明が方法のい
ずれかの具体的な組合せおよび/または順番に限定されることは意図されない。
他の実施形態では、ポリペプチドは、核酸シンセサイザーを使用してオリゴヌクレオチド
または核酸配列を合成し、ヌクレオチド配列を翻訳して、ポリペプチドを得ることによっ
て生成される。
しいライブラリーを生成するために1つまたは複数の組換えベースの多様性生成機構を実
施することによって改変されてもよい。このような組換え機構としては、これらに限定さ
れないが、例えば、シャッフリング、鋳型切り換え、オーバーラップ伸長による遺伝子ス
プライシング、エラープローンPCR、残基の半合成コンビナトリアルライブラリー、繰
り返し配列組換え(「RSR」)(例えば、その全体が参照により本明細書に組み込まれ
ている米国特許出願公開第2006/0223143号を参照)が挙げられる。一部の実
施形態では、これらの組換え機構の一部は、in vitroで実施されてもよい。一部
の実施形態では、これらの組換え機構の一部は、生物学的機構を模擬するためにコンピュ
ーターによりin silicoで実施されてもよい。
そのようにして選択された1つまたは複数の位置における、部位特異的変異方法、例えば
飽和変異誘発を実行することを含む。一部の実施形態では、位置は、本文書中の他所で論
じられたように、活性部位の構造および/または触媒反応に関する制約を評価することに
よって選択される。一部の実施形態では、仮想スクリーニングを配列−活性モデリングと
組み合わせることが有用である。これらの実施形態では、指向進化のプロセスは、配列−
活性モデルの項の係数を評価し、それによって目的の活性に寄与する残基の1つまたは複
数を識別することによって位置を選択することができる。米国特許第7,783,428
号(その全体が参照により本明細書に組み込まれている)は、変異誘発のためのアミノ酸
を識別するために使用できる配列活性モデルの例を提供する。
ーのメンバーの1つまたは複数を選択するステップを伴う。次いでこれらのバリアントの
1つまたは複数は、合成されてもよいし、および/または発現系で発現されてもよい。具
体的な実施形態では、本方法は、以下の方式:(i)新しいタンパク質バリアントライブ
ラリーの選択されたメンバーを発現することができる発現系を提供するステップと、(i
i)新しいタンパク質バリアントライブラリーの選択されたメンバーを発現するステップ
とにおいて継続される。
子の配列を設計するためのワークフローの例を示す流れ図である。図3Aは、複数の開始
配列の配列情報を生体分子のパネル、例えば酵素のパネルから受け取るステップで開始さ
れるプロセス300に関する流れ図を示す。ブロック302を参照。次いでプロセスは、
仮想タンパク質スクリーニングシステムを使用して現在受け取っている配列の仮想スクリ
ーニングを実施する。ブロック304を参照。一部の実施形態では、仮想タンパク質スク
リーニングシステムは、開始配列の3次元ホモロジーモデルを作製して、上述したように
基質のポーズを検討することによって1つまたは複数の基質をホモロジーモデルとドッキ
ングし、それによって開始配列に関するドッキングスコアを生成することができる。また
仮想タンパク質スクリーニングシステムは、ドッキング参加物(酵素および基質)の相互
作用エネルギーおよび内部エネルギーを計算することもできる。さらに、仮想タンパク質
スクリーニングシステムは、ポーズの様々な制約を評価して、ポーズが活性であるかどう
か、すなわち基質の触媒的転換を引き起こす可能性の高い方式で基質が酵素と結合するか
どうかを決定することができる。さらに、一部の実施形態では、制約の評価はまた、触媒
反応の生成物がエナンチオ選択的および/または位置選択的であるかどうかに関する推論
も提供する。一部の実施形態では、プロセスは、仮想スクリーニングシステムによって決
定された結合エネルギー、活性、および選択性に基づき1つまたは複数の配列を選択する
。ブロック306を参照。次いでプロセスは、ステップ308で選択された配列のさらな
る調査を実行することが必要であるかどうかを評価する。必要な場合、この例におけるプ
ロセスは、選択された配列をコンピューターにより変異させる。変異は、上述した様々な
多様性生成機構、例えば変異誘発または組換えに基づく。ブロック310を参照。次いで
コンピューターにより変異させた配列は、仮想タンパク質スクリーニングシステムによる
仮想スクリーニングの新しいラウンドに提供される。ブロック304を参照。仮想スクリ
ーニングおよび選択は、配列のさらなる調査の必要性がなくなるまで反復適用のために実
施されてもよく、このような必要性は、反復適用の具体的な回数および/または所望の活
性の特定のレベルなどの事前設定された基準によって決定することができる。その時点で
、生体分子(例えば、酵素)を設計するプロセスをステップ312において完了させる。
し、このプロセスは、300のプロセスと比較して一部類似しているが一部異なる要素を
有する。プロセス320は、生体分子(例えば、酵素)の複数の開始配列のin vit
ro合成で開始され、これは、既存の生体分子パネルが利用できない場合に必要であるか
または有用である可能性がある。ブロック322を参照。また合成された配列をアッセイ
して配列に関するデータを収集してもよく、このデータは、仮想スクリーニングシステム
によりデータを得ることができない所望の性質の生体分子を設計するために有用な場合が
ある。次いでプロセスは、プロセス300のステップ304に類似するブロック324に
表された仮想タンパク質スクリーニングシステムを使用して合成された配列の仮想スクリ
ーニングを実施する。次いでプロセスは、仮想スクリーニングシステムによって決定され
た結合エネルギー、活性、および選択性に基づき1つまたは複数の配列を選択する。ブロ
ック326を参照。次いでプロセスは、ステップ328で選択された配列のさらなる指向
進化を実施することが必要かどうかを評価する。必要な場合、この例におけるプロセスは
、in silicoまたはin vitroで選択された配列を変異させる。変異は、
上述した様々な多様性生成機構に基づく。ブロック330を参照。次いで変異させた配列
は、仮想タンパク質スクリーニングシステムによる仮想スクリーニングの新しいラウンド
に提供される。ブロック324を参照。仮想スクリーニングおよび選択は、配列のさらな
る進化の必要性がなくなるまで反復適用のために実行されてもよく、このような必要性は
、反復適用の具体的な回数および/または所望の活性の特定のレベルなどの事前設定され
た基準によって決定することができる。その時点で、仮想スクリーニングシステムによっ
て選択された配列を合成し、発現させて、現実の酵素を生成する。ブロック332を参照
。生成された酵素は、仮想スクリーニングプロセスの結果を検証するために使用できる目
的の活性についてアッセイすることができる。ブロック334を参照。アッセイ後、指向
進化プロセスをステップ336において終結させる。
す。プロセス340は、in vitroの指向進化で開始して、生体分子(例えば、酵
素)の複数の開始配列を誘導する。ブロック342を参照。プロセス320におけるよう
に、誘導された配列をアッセイして、配列が所望の活性または選択性などの一定の基準を
満たすかどうかを決定する。基準を満たす配列は、さらなる開発のためのヒットとして決
定される。ブロック344を参照。次いでプロセスは、プロセス300のステップ304
に類似するブロック346に表された仮想タンパク質スクリーニングシステムを使用して
ヒットの仮想スクリーニングを実施する。一部の実施形態では、プロセスはまた、上述し
たような仮想スクリーニングシステムによって決定された結合エネルギー、活性、および
選択性にも基づいて、1つまたは複数の配列を選択する。次いでプロセスは、ステップ3
48で選択された配列の指向進化のさらなるラウンドを実施することが必要かどうかを評
価する。必要な場合、プロセスは、新しい反復適用におけるin vitroの指向進化
のさらなるラウンドのために選択された配列を提供する。ブロック342を参照。仮想ス
クリーニングおよび選択は、配列のさらなる進化の必要性がなくなるまで反復適用のため
に実施されてもよく、このような必要性は、事前設定された基準によって決定することが
できる。その時点で、生体分子(例えば、酵素)を設計するプロセスをステップ350に
おいて終了させる。
IV.タンパク質バリアントライブラリーの生成
または複数の残基を有する複数のタンパク質の群を含む。これらのライブラリーは、本明
細書に記載の方法および/または当技術分野において公知の任意の適当な手段を使用して
生成することができる。様々な実施形態では、これらのライブラリーは、仮想タンパク質
スクリーニングシステムのための候補酵素を提供する。一部の実施形態では、ライブラリ
ーは、最初のラウンドではin silicoで提供されスクリーニングされてもよく、
その結果として得られた、その後のまたは最後のラウンドから仮想スクリーニングシステ
ムによって選択されたタンパク質は、in vitroでシーケンシングおよび/または
スクリーニングされてもよい。スクリーニングの最初のラウンドはin silicoで
実施されるため、スクリーニングのための時間およびコストを顕著に低減することができ
る。タンパク質バリアントライブラリー中に含まれるタンパク質の数は、従来の物理的な
スクリーニングと比較して、一部の実施におけるスクリーニングの最初のラウンドで容易
に増加させることができる。本開示が、本開示の方法で使用されるタンパク質ライブラリ
ー中のいずれかの特定のタンパク質数に限定されることは意図されない。さらに、本開示
が、いずれかの特定のタンパク質バリアントライブラリー(単数または複数)に限定され
ることも意図されない。
子ファミリーによってコードされ得る1つまたは複数の天然に存在するタンパク質、また
は他の実施形態では酵素のパネルから生成される。他の開始点としては、これらに限定さ
れないが、公知のタンパク質の組換え物および/または新規の合成タンパク質が挙げられ
る。ライブラリーは、これらの「シード」または「開始」タンパク質から様々な技術によ
って生成され得る。一例において、ライブラリーは、生物学的または化学的な技術を反映
する仮想プロセス、例えば、Stemmer(1994年)Proceedings o
f the National Academy of Sciences、USA、1
0747〜10751頁およびWO95/22625(両方とも、参照により本明細書に
組み込まれている)で説明されているようなDNA断片化媒介組換え、Nessら(20
02年)Nature Biotechnology 20巻:1251〜1255頁お
よびWO00/42561(両方とも、参照により本明細書に組み込まれている)で説明
されているような合成オリゴヌクレオチド媒介組換え、または1つまたは複数の親のタン
パク質の一部または全部をコードする核酸によって生成される。これらの方法の組合せが
使用され得(例えば、DNAフラグメントおよび合成オリゴヌクレオチドの組換え)、加
えて、当技術分野において公知の他の組換えベースの方法、例えば両方とも参照により本
明細書に組み込まれているWO97/20078およびWO98/27230が使用され
得る。タンパク質バリアントライブラリーを生成するために使用される任意の適当な方法
が、本開示において有用である。実際に、本開示が、バリアントライブラリーを生成する
ためのいずれかの特定の方法に限定されることは意図されない。
デリングプロセスで使用される変異の群を規定する目的のために利用され得る。一部の実
施形態では、1つより多くの開始配列がある。一部の追加の実施形態では、開始配列の少
なくとも1つは、野生型配列である。ある特定の実施形態では、変異は、(a)基質特異
性、選択性、安定性、および/または他のいずれかの目的の性質に影響を及ぼすものとし
て、文献において識別され、かつ/または(b)タンパク質のフォールディングパターン
の改善(例えば、タンパク質の内部残基をパッキングすること)、リガンドの結合の改善
、サブユニットの相互作用の改善、または多種多様な相同体間のファミリーシャッフリン
グ方法の改善などのために、コンピューターにより予測される。本発明が目的の性質また
は機能のいずれかの具体的な選択に限定されることは意図されない。
、有益な性質について仮想スクリーニングされてもよい。部位指向変異誘発は、変異を導
入するための有用な技術の一例であるが、任意の適当な方法が利用される。したがって、
代替的にまたは付加的に、変異体は、遺伝子合成、飽和ランダム変異誘発、残基の半合成
コンビナトリアルライブラリー、指向進化、繰り返し配列組換え(「RSR」)(例えば
、その全体が参照により本明細書に組み込まれている米国特許出願公開第2006/02
23143号を参照)、遺伝子シャッフリング、エラープローンPCR、および/または
他の任意の適当な方法によって提供されてもよい。好適な飽和変異誘発手順の一例は、そ
の全体が参照により本明細書に組み込まれている米国特許出願公開第2010/0093
560号で説明されている。
一部の実施形態では、開始配列は、野生型タンパク質の配列である。一部の実施形態では
、開始配列は、野生型タンパク質に存在しない変異を含む。一部の実施形態では、開始配
列は、共通の性質を有するタンパク質の群、例えばタンパク質のファミリーに由来するコ
ンセンサス配列である。
触媒された化学変換としては、これらに限定されないが、例えば、ケトンの還元、アミノ
基転移反応、酸化、ニトリルの加水分解、イミンの還元、エノンの還元、アシル加水分解
、およびハロヒドリンの脱ハロゲン化が挙げられる。評価される複数のバリアントを提供
することができる酵素クラスの例としては、これらに限定されないが、ケトンレダクター
ゼ、トランスアミナーゼ、シトクロムP450、バイヤー−ビリガーモノオキシゲナーゼ
、モノアミンオキシダーゼ、ニトリラーゼ、イミンレダクターゼ、エノンレダクターゼ、
アシラーゼ、およびハロヒドリンデハロゲナーゼが挙げられる。
は、これらに限定されないが、オキシドレダクターゼ(E.C.1);トランスフェラー
ゼ(E.C.2);ヒドロリアーゼ(E.C.3);リアーゼ(E.C.4);イソメラ
ーゼ(E.C.5)およびリガーゼ(E.C.6)を含む。オキシドレダクターゼのより
具体的であるが非限定的なサブグループは、デヒドロゲナーゼ(例えば、アルコールデヒ
ドロゲナーゼ(カルボニルレダクターゼ)、キシルロースレダクターゼ、アルデヒドレダ
クターゼ、ファルネソールデヒドロゲナーゼ、乳酸デヒドロゲナーゼ、アラビノースデヒ
ドロゲナーゼ、グルコースデヒドロゲナーゼ(dehyrodgenase)、フルクト
ースデヒドロゲナーゼ、キシロースレダクターゼおよびコハク酸デヒドロゲナーゼ(de
hyrogenase))、オキシダーゼ(例えば、グルコースオキシダーゼ、ヘキソー
スオキシダーゼ、ガラクトースオキシダーゼおよびラッカーゼ)、モノアミンオキシダー
ゼ、リポキシゲナーゼ、ペルオキシダーゼ、アルデヒドデヒドロゲナーゼ、レダクターゼ
、長鎖アシル−[アシル担体タンパク質]レダクターゼ、アシル−CoAデヒドロゲナー
ゼ、エンレダクターゼ、シンターゼ(例えば、グルタミン酸シンターゼ)、硝酸レダクタ
ーゼ、モノおよびジオキシゲナーゼ、ならびにカタラーゼを含む。トランスフェラーゼの
より具体的であるが非限定的なサブグループは、メチル、アミジノ、およびカルボキシル
トランスフェラーゼ、トランスケトラーゼ、トランスアルドラーゼ、アシルトランスフェ
ラーゼ、グリコシルトランスフェラーゼ、トランスアミナーゼ、トランスグルタミナーゼ
およびポリメラーゼを含む。ヒドロラーゼのより具体的であるが非限定的なサブグループ
は、エステルヒドロラーゼ、ペプチダーゼ、グリコシラーゼ、アミラーゼ、セルラーゼ、
ヘミセルラーゼ、キシラナーゼ、キチナーゼ、グルコシダーゼ、グルカナーゼ、グルコア
ミラーゼ、アシラーゼ、ガラクトシダーゼ、プルラナーゼ、フィターゼ、ラクターゼ、ア
ラビノシダーゼ、ヌクレオシダーゼ、ニトリラーゼ、ホスファターゼ、リパーゼ、ホスホ
リパーゼ、プロテアーゼ、ATPアーゼ、およびデハロゲナーゼを含む。リアーゼのより
具体的であるが非限定的なサブグループは、デカルボキシラーゼ、アルドラーゼ、ヒドラ
ターゼ、デヒドラターゼ(例えば、炭酸脱水酵素)、シンターゼ(例えば、イソプレン、
ピネンおよびファルネセンシンターゼ)、ペクチナーゼ(例えば、ペクチンリアーゼ)お
よびハロヒドリンデヒドロゲナーゼを含む。イソメラーゼのより具体的であるが非限定的
なサブグループは、ラセマーゼ、エピメラーゼ、イソメラーゼ(例えば、キシロース、ア
ラビノース、リボース、グルコース、ガラクトースおよびマンノースイソメラーゼ)、ト
ートメラーゼ、およびムターゼ(例えばアシル転移ムターゼ、ホスホムターゼ、およびア
ミノムターゼを含む。リガーゼのより具体的な、ただし非限定的なサブグループは、エス
テルシンターゼを含む。親配列の源として使用され得る他の酵素のファミリーまたはクラ
スは、トランスアミナーゼ、プロテアーゼ、キナーゼ、およびシンターゼを含む。この列
挙は、本開示の可能性のある酵素のある特定の具体的な態様を例示しているが、網羅的で
あるとはみなされず、限定を示したりまたは本開示の範囲の境界を定めたりしない。
オ選択的な還元反応などのエナンチオ選択的な反応を触媒することができる。このような
酵素は、例えば医薬化合物の合成において有用な中間体の作製に使用できる。
キシロシダーゼ(EC3.2.1.37);アルファ−L−アラビノフラノシダーゼ(E
C3.2.1.55);アルファ−グルクロニダーゼ(EC3.2.1.139);アセ
チルキシランエステラーゼ(EC3.1.1.72);フェルロイルエステラーゼ(EC
3.1.1.73);クマロイルエステラーゼ(EC3.1.1.73);アルファ−ガ
ラクトシダーゼ(EC3.2.1.22);ベータ−ガラクトシダーゼ(EC3.2.1
.23);ベータ−マンナナーゼ(EC3.2.1.78);ベータ−マンノシダーゼ(
EC3.2.1.25);エンド−ポリガラクツロナーゼ(EC3.2.1.15);ペ
クチンメチルエステラーゼ(EC3.1.1.11);エンド−ガラクタナーゼ(EC3
.2.1.89);ペクチンアセチルエステラーゼ(EC3.1.1.6);エンド−ペ
クチンリアーゼ(EC4.2.2.10);ペクチン酸リアーゼ(EC4.2.2.2)
;アルファラムノシダーゼ(EC3.2.1.40);エキソ−ポリアルファ−ガラクツ
ロノシダーゼ(galacturonosidase)(EC3.2.1.82);1,
4−アルファ−ガラクツロニダーゼ(galacturonidase)(EC3.2.
1.67);エキソポリガラクツロネート(exopolygalacturonate
)リアーゼ(EC4.2.2.9);ラムノガラクツロナンエンドリアーゼ(endol
yase)EC(4.2.2.B3);ラムノガラクツロナンアセチルエステラーゼ(E
C3.2.1.B11);ラムノガラクツロナンガラクツロノヒドロラーゼ(galac
turonohydrolase)(EC3.2.1.B11);エンド−アラビナナー
ゼ(arabinanase)(EC3.2.1.99);ラッカーゼ(EC1.10.
3.2);マンガン依存性ペルオキシダーゼ(EC1.10.3.2);アミラーゼ(E
C3.2.1.1)、グルコアミラーゼ(EC3.2.1.3)、プロテアーゼ、リパー
ゼ、およびリグニンペルオキシダーゼ(EC1.11.1.14)から選択される。1、
2、3、4、5種、または5種より多くの酵素の任意の組合せが、本開示の組成物におい
て有用である。本発明が、いずれかの特定の数の酵素および/または酵素クラスに限定さ
れることは意図されない。
めのいずれかの特定の方法に限定されることは意図されない。本開示の1つまたは複数の
実施形態では、ライブラリーを生成するために、単一の開始配列は様々な方式で改変され
る。一部の実施形態では、ライブラリーは、開始配列の個々の残基を系統的に変化させる
ことによって生成される。ライブラリーの系統的に変化させた配列のセットは、データセ
ット中の配列を規定するために実験計画(DOE)方法を使用して演繹的に設計されても
よい。DOE方法の説明は、Diamond, W.J.(2001年)Practic
al Experiment Designs: for Engineers and
Scientists、John Wiley & Sons、およびWilliam
J Drummondによる「Practical Experimental De
sign for Engineers and Scientists」(1981年
)Van Nostrand Reinhold Co New York、「Stat
istics for experimenters」George E.P. Box
、William G HunterおよびJ. Stuart Hunter(197
8年)John Wiley and Sons、New Yorkに、または例えばワ
ールドワイドウェブにおいてitl.nist.gov/div898/handboo
k/で見出すことができる。関連する数学を実施するために利用可能な数々のコンピュー
ター用パッケージがあり、例えば、Statistics Toolbox(MATLA
B(登録商標))、JMP(登録商標)、STATISTICA(登録商標)、およびS
TAT−EASE(登録商標)DESIGN EXPERT(登録商標)が挙げられる。
結果は、本明細書で開示された仮想タンパク質スクリーニングシステムによりスクリーニ
ングするために適当な配列の系統的に変化させた直交分散データのセットである。またD
OEベースのデータセットは、当技術分野で公知のようなプラケット−バーマンまたはフ
ラクショナルファクトリアルデザイン(Fractional Factorial D
esign)のいずれかを使用しても容易に生成することができる。Diamond,
W.J.(2001年)。
できるため、一部の実施形態は、通常バリアントの数が従来の物理的な方法でスクリーニ
ングするには多すぎる場合、利用可能な配列の一部または全部を使用して、タンパク質バ
リアントライブラリーを提供することができる。例えば、それぞれ20種の可能性のある
アミノ酸を有する15個の位置を有する配列について、300個の可能性のある位置対ア
ミノ酸の対が存在し、
種の異なるバリアント配列が存在する。一部の実施において、ライブラリーは、利用可能
な計算能力および用途の必要性に応じて、この可能性のあるプールからの数百、数千、数
万、数十万、またはそれより多くのバリアントを含む可能性がある。本開示が、ライブラ
リー中のいずれかの特定のバリアント数に限定されることは意図されない。
V.タンパク質バリアントのシーケンシング
アントの活性部位のコンピューターによるモデルを生成するために、物理的なタンパク質
バリアントが使用される。一部の実施形態では、仮想スクリーニングから得られたタンパ
ク質バリアントは、上述した様々な方法を使用して物理的に生成される。一部の実施形態
では、物理的に生成されたタンパク質バリアントは、1つまたは複数の目的のリガンドに
対するそれらの反応に関してアッセイされる。様々な実施形態では、物理的なタンパク質
バリアントの配列は、タンパク質シーケンシング方法によって確認され、その方法の一部
はさらに後述される。
つかのタンパク質シーケンシング技法は、タンパク質がとるコンホメーション、およびタ
ンパク質が任意の非ペプチド分子と複合体形成される程度も決定する。質量分析法および
エドマン分解反応は、タンパク質のアミノ酸の配列を直接決定するために使用される場合
がある。
する。一部の実施形態では、自動エドマンシーケンサーをタンパク質バリアントの配列を
決定するために使用することができる。自動エドマンシーケンサーは、ますますより長い
配列(例えば、最大でおよそ長さ50アミノ酸の配列)のペプチドをシーケンシングする
ことができる。一部の実施形態では、エドマン分解を実施するタンパク質シーケンシング
プロセスは、以下のうちの1つ以上を伴う。
−− 還元剤、例えば、2−メルカプトエタノールを用いてタンパク質中のジスルフィ
ド架橋をブレイクする。ヨード酢酸などの保護基を、結合の再形成を妨げるために使用し
得る。
−− 1つを超えて存在する場合、タンパク質複合体の個々の鎖を分離および精製する
。
−− 各鎖のアミノ酸組成を決定する
−− 各鎖の末端アミノ酸を決定する
−− 各鎖をブレイクして断片、例えば、長さ50アミノ酸未満の断片にする。
−− 断片を分離および精製する
−− エドマン分解反応を使用して各断片の配列を決定する
−− アミノ酸配列の追加のリード(複数可)をもたらすために異なるパターンの切断
を適用して上記ステップを繰り返す。
−− アミノ酸配列リードから全体的なタンパク質の配列を構築する。
シーケンシングを促進するために小さい断片にブレイクされるべきである。より長い配列
の消化は、トリプシンもしくはペプシンなどのエンドペプチダーゼによって、または臭化
シアンなどの化学試薬によって実施することができる。異なる酵素は、異なる切断パター
ンを与え、断片同士の重複を、全体的な配列を構築するために使用することができる。
ている。一部の実施形態では、1つの適当な基板は、ポリブレン、カチオン性ポリマーで
被覆されたガラス繊維である。エドマン試薬、フェニルイソチオシアネート(PITC)
が、トリメチルアミンの弱塩基性緩衝液と一緒に吸着されたペプチドに添加される。この
反応溶液は、N末端アミノ酸のアミン基と反応する。次いで末端アミノ酸を、無水酸を添
加することによって選択的に引き離すことができる。次いで誘導体が異性化して置換フェ
ニルチオヒダントインを与え、これを洗い落とし、クロマトグラフィーによって識別する
ことができる。次いでこのサイクルを繰り返すことができる。
定することによってアミノ酸配列を決定することができる。多重荷電した断片に対応する
ピークを含む質量スペクトルを決定することができ、この場合、異なる同位体に対応する
ピーク同士の距離は、断片上の電荷に反比例する。質量スペクトルは、例えば、以前にシ
ーケンシングされたタンパク質のデータベースに対する比較によって分析されて、断片の
配列が決定される。次いでこのプロセスが異なる消化酵素を用いて繰り返され、配列にお
ける重複が使用されて、完全なアミノ酸配列が構築される。
多い。一部の実施形態では、エレクトロスプレーイオン化がペプチドをスペクトル計に送
達するために使用される。タンパク質は、エンドプロテアーゼによって消化され、得られ
た溶液は、高圧液体クロマトグラフィーカラムを通過させられる。このカラムの末端で、
溶液は、質量分析計中に噴霧され、陽電位で荷電される。溶液滴上の電荷が、これらを単
一イオンに断片化させる。次いでペプチドが断片化され、断片の質量対電荷比が測定され
る。
ることも可能である。核酸シーケンシング方法、例えば、様々な次世代シーケンシング方
法が、DNAまたはRNA配列を決定するために使用され得る。一部の実施において、タ
ンパク質配列は、タンパク質をコードするヌクレオチドの知識なしで新しく単離される。
このような実施において、直接タンパク質シーケンシング方法の1つを使用して短いポリ
ペプチド配列を最初に決定し得る。タンパク質のRNAの相補的マーカーを、この短い配
列から決定することができる。次いでこれを、このタンパク質をコードするmRNAを単
離するために使用することができ、次いでこのmRNAをポリメラーゼ連鎖反応で複製し
てかなりの量のDNAを得ることができ、次いでこのDNAを、DNAシーケンシング方
法を使用してシーケンシングすることができる。次いでタンパク質のアミノ酸配列を、D
NA配列から演繹することができる。演繹法では、mRNAが翻訳された後に除去される
アミノ酸を考慮に入れることが必要である。
における様々な段階で使用することができる。1つまたはそれより多くの実施形態では、
配列データは、第1の世代のシーケンシング方法と見なされる例えば、サンガーシーケン
シングまたはマクサム−ギルバートシーケンシングを含めたバルクシーケンシング方法を
使用して得ることができる。標識されたジデオキシ鎖ターミネーターを使用することを伴
うサンガーシーケンシングは、当技術分野で周知である。例えば、Sangerら、Pr
oceedings of the National Academy of Sci
ences of the United States of America、74
巻、5463〜5467頁(1997年)を参照。核酸試料の断片に対して複数の部分的
な化学分解反応を実施し、その後断片を検出および分析して配列を推測することを伴うマ
クサム−ギルバートシーケンシングも当技術分野で周知である。例えば、Maxamら、
Proceedings of the National Academy of S
ciences of the United States of America、
74巻、560〜564頁(1977年)を参照。別のバルクシーケンシング方法は、ハ
イブリダイゼーションによるシーケンシングであり、このシーケンシングでは、試料の配
列が、例えば、マイクロアレイまたは遺伝子チップ上の複数の配列へのそのハイブリダイ
ゼーション性質に基づいて演繹される。例えば、Drmanacら、Nature Bi
otechnology、16巻、54〜58頁(1998年)を参照。
を使用して得られる。次世代シーケンシングは、ハイスループットシーケンシングとも呼
ばれる。この技法は、シーケンシングプロセスを並列化し、数千または数百万の配列を一
度に生成する。適当な次世代シーケンシング方法の例としては、それだけに限らないが、
単一分子リアルタイムシーケンシング(例えば、Menlo Park、Califor
niaのPacific Biosciences)、イオン半導体シーケンシング(例
えば、South San Francisco、CaliforniaのIon To
rrent)、パイロシーケンシング(例えば、Branford、Connectic
utの454)、ライゲーションによるシーケンシング(例えば、Carlsbad、C
aliforniaのLife Technologiesが所有するSOLiDシーケ
ンシング)、合成および可逆性ターミネーターによるシーケンシング(例えば、San
Diego、CaliforniaのIllumina)、透過型電子顕微鏡法などの核
酸イメージング技術などがある。
にin vitroクローニングステップを使用する。エマルジョンPCR(emPCR
)は、油相内の水滴においてプライマー被覆ビーズとともに個々のDNA分子を単離する
。PCRは、DNA分子のコピーを生成し、これらはビーズ上のプライマーに結合し、そ
の後、後のシーケンシングのために固定化される。emPCRは、Marguilisら
(454 Life Sciences、Branford、CTによって商品化された
)、ShendureおよびPorrecaら(「ポロニーシーケンシング」としても公
知)による方法、ならびにSOLiDシーケンシング(Applied Biosyst
ems Inc.、Foster City、CA)で使用される。M.Marguli
esら(2005年)、「Genome sequencing in microfa
bricated high−density picolitre reactors
」、Nature、437巻:376〜380頁;J.Shendureら(2005年
)、「Accurate Multiplex Polony Sequencing
of an Evolved Bacterial Genome」、Science、
309巻(5741号):1728〜1732頁を参照。in vitroクローン増幅
は、「ブリッジPCR」によっても実施することができ、この場合、断片は、プライマー
が固体表面に付着されると増幅される。Braslavskyらは、この増幅ステップを
省略し、DNA分子を表面に直接固定する単一分子方法を開発した(Helicos B
iosciences Corp.、Cambridge、MAによって商品化された)
。I.Braslavskyら(2003年)、「Sequence informat
ion can be obtained from single DNA mole
cules」、Proceedings of the National Acade
my of Sciences of the United States of A
merica、100巻:3960〜3964頁。
成によるシーケンシング」では、相補鎖は、DNAポリメラーゼを使用して鋳型鎖の配列
に基づいて構築される。色素停止電気泳動シーケンシングのように、可逆性ターミネータ
ー方法(Illumina,Inc.、San Diego、CAおよびHelicos
Biosciences Corp.、Cambridge、MAによって商品化され
た)は、色素ターミネーターの可逆バージョンを使用し、一度に1つのヌクレオチドを付
加して、別のヌクレオチドの重合を可能にするためにブロッキング基を繰り返し除去する
ことによって、リアルタイムで各位置における蛍光を検出する。「パイロシーケンシング
」も、DNA重合を使用し、一度に1つのヌクレオチドを付加し、結合していたピロリン
酸の遊離によって放出された光によって所与の場所に付加されたヌクレオチドの数を検出
および定量化する(454 Life Sciences、Branford、CTによ
って商品化された)。M.Ronaghiら(1996年)、「Real−time D
NA sequencing using detection of pyropho
sphate release」、Analytical Biochemistry、
242巻:84〜89頁を参照。
1つまたはそれより多くの実施は、本発明の原理から逸脱することなく、以下のシーケン
シング方法の1つまたはそれより多くを使用し得る。
Biosciencesが開発した、合成技術による並列化された単一分子DNAシーケ
ンシングである。単一分子リアルタイムシーケンシングは、ゼロモード導波路(ZMW)
を利用する。単一のDNAポリメラーゼ酵素が、鋳型としてのDNAの単一分子とともに
ZMWの底部に固定される。ZMWは、DNAポリメラーゼによって組み込まれているD
NAの単一のヌクレオチド(塩基としても公知)のみを観察するために十分小さい照らさ
れた観察体積を生成する構造体である。4つのDNA塩基の各々には、4つの異なる蛍光
色素の1つが結合されている。ヌクレオチドがDNAポリメラーゼによって組み込まれる
とき、蛍光タグが切り離され、ZMWの観察エリア外に拡散し、ここで、その蛍光は、も
はや観察可能でない。検出器は、ヌクレオチド組込みの蛍光シグナルを検出し、色素の対
応する蛍光にしたがって塩基のコールが行われる。
le Molecule Sequencing(tSMS)技術(例えば、Harri
s T.D.ら、Science、320巻:106〜109頁[2008年]に記載さ
れた)である。tSMS技法では、DNA試料が切断されておよそ100〜200ヌクレ
オチドの鎖にされ、polyA配列が各DNA鎖の3’末端に付加される。各鎖は、蛍光
標識アデノシンヌクレオチドの付加によって標識される。次いでDNA鎖は、フローセル
表面に固定化された数百万のオリゴ−T捕捉部位を含むフローセルにハイブリダイズされ
る。ある特定の実施形態では、鋳型は、約1億の鋳型/cm2の密度とすることができる
。次いでフローセルは、計測器、例えば、HeliScope(商標)シーケンサー中に
装填され、レーザーがフローセルの表面を照らし、各鋳型の位置を明らかにする。CCD
カメラは、フローセル表面上の鋳型の位置をマッピングすることができる。次いで鋳型の
蛍光標識が切断され、洗い流される。シーケンシング反応は、DNAポリメラーゼおよび
蛍光標識ヌクレオチドを導入することによって始まる。オリゴ−T核酸は、プライマーと
して機能を果たす。ポリメラーゼは、鋳型指向様式でプライマーに標識ヌクレオチドを組
み込む。ポリメラーゼおよび組み込まれなかったヌクレオチドは、除去される。蛍光標識
ヌクレオチドの組込みを示す鋳型は、フローセル表面をイメージングすることによって見
分けられる。イメージング後、切断ステップにより、蛍光標識が除去され、プロセスは、
所望のリード長が達成されるまで他の蛍光標識ヌクレオチドを用いて繰り返される。配列
情報は、各ヌクレオチド付加ステップで収集される。単一分子シーケンシング技術による
全ゲノムシーケンシングは、シーケンシングライブラリーの調製におけるPCRベースの
増幅を除外し、または典型的には不要にし、この方法は、試料のコピーの測定ではなくそ
の試料の直接測定を可能にする。
くDNAシーケンシングの方法である。これは、シーケンシング中に相補鎖が鋳型鎖の配
列に基づいて構築される「合成によるシーケンシング」の一方法である。シーケンシング
される鋳型DNA鎖を含むマイクロウェルは、単一種のデオキシリボヌクレオチド三リン
酸(dNTP)であふれさせられる。導入されるdNTPがリーディング鋳型ヌクレオチ
ド(leading template nucleotide)に相補的である場合、
それは、成長中の相補鎖に組み込まれる。これは、反応が起こったことを示す、ISFE
Tイオンセンサーを作動させる水素イオンの放出を引き起こす。ホモポリマーリピートが
鋳型配列中に存在する場合、複数のdNTP分子が単一のサイクルで組み込まれる。これ
は、対応する数の水素の放出および比例してより高い電子シグナルをもたらす。この技術
は、修飾ヌクレオチドまたは光学系が使用されないという点で他のシーケンシング技術と
異なる。イオン半導体シーケンシングは、イオントレントシーケンシング、pH媒介シー
ケンシング、シリコンシーケンシング、または半導体シーケンシングと呼ばれる場合もあ
る。
スルフリラーゼによってアデノシン5’ホスホ硫酸と反応させられてATPを生成する。
次いでATPは、ルシフェラーゼによるルシフェリンのオキシルシフェリンおよび光への
転換を推進する。蛍光は一過性であるので、蛍光を排除する別個のステップは、この方法
では必要でない。一タイプのデオキシリボヌクレオチド三リン酸(dNTP)が一度に付
加され、配列情報は、どのdNTPが反応部位において有意なシグナルを生成するかによ
って見分けられる。市販のRoche GS FLX計測器は、この方法を使用して配列
を取得する。この技法およびその用途は、例えば、Ronaghiら、Analytic
al Biochemistry、242巻、84〜89頁(1996年)、およびMa
rguliesら、Nature、437巻、376〜380頁(2005年)(Nat
ure、441巻、120頁(2006年)の誤植)に詳細に論じられている。市販のパ
イロシーケンシング技術は、454シーケンシング(Roche)(例えば、Margu
lies,M.ら、Nature、437巻:376〜380頁[2005年]に記載さ
れた)である。
ヌクレオチドを、オーバーハングを有するシーケンシングされている核酸に接合するため
に、リガーゼ酵素が使用される。ライゲーションが起こるために、オーバーハングは、相
補的でなければならない。部分的に二本鎖のオリゴヌクレオチドのオーバーハング中の塩
基は、部分的に二本鎖のオリゴヌクレオチドおよび/または部分的に二本鎖のオリゴヌク
レオチドの別の一部にハイブリダイズする第2のオリゴヌクレオチドにコンジュゲートし
たフルオロフォアによって識別することができる。蛍光データを取得した後、ライゲーシ
ョンされた複合体は、その認識部位(部分的に二本鎖のオリゴヌクレオチド中に含まれて
いた)から固定距離をカットするII型制限酵素、例えば、Bbvlなどによって、ライ
ゲーション部位の上流で切断される。この切断反応により、先のオーバーハングのすぐ上
流に新しいオーバーハングが露出され、このプロセスが繰り返される。この技法およびそ
の用途は、例えば、Brennerら、Nature Biotechnology、1
8巻、630〜634頁(2000年)に詳細に論じられている。一部の実施形態では、
ライゲーションシーケンシングは、環状核酸分子のローリングサークル増幅生成物を得、
ライゲーションシーケンシングの鋳型としてローリングサークル増幅生成物を使用するこ
とによって、本発明の方法に適応されている。
ied Biosystems)である。SOLiD(商標)のライゲーションによるシ
ーケンシングでは、ゲノムDNAがせん断されて断片にされ、アダプターが断片の5’お
よび3’末端に結合されて断片ライブラリーが生成される。あるいは、アダプターを断片
の5’および3’末端にライゲーションし、断片を環状化し、環状化した断片を消化して
内部アダプターを生成し、アダプターを得られた断片の5’および3’末端に結合させる
ことによって内部アダプターを導入して、メイトペアのライブラリーを生成することがで
きる。次に、クローンのビーズ集団が、ビーズ、プライマー、鋳型、およびPCRコンポ
ーネントを含むマイクロリアクター内で調製される。PCRの後、鋳型が変性され、伸長
した鋳型を有するビーズを分離するためにビーズが濃縮される。選択されたビーズ上の鋳
型は、ガラススライドへの結合を可能にする3’修飾に付される。配列は、特異的フルオ
ロフォアによって識別される中央決定塩基(central determined b
ase)(または塩基の対)を有する部分的にランダムなオリゴヌクレオチドを逐次ハイ
ブリサイズおよびライゲーションすることによって決定することができる。色が記録され
た後、ライゲーションされたオリゴヌクレオチドが切断および除去され、次いでこのプロ
セスが繰り返される。
ターミネーターである蛍光色素標識ヌクレオチド類似体が、単一塩基伸長反応で組み込ま
れる。塩基のアイデンティティーは、フルオロフォアによって決定される。言い換えれば
、各塩基は、異なるフルオロフォアと対形成される。蛍光/配列データが取得された後、
フルオロフォアおよびブロッキング基は、化学的に除去され、サイクルは、次の塩基の配
列情報を取得するために繰り返される。Illumina GA計測器は、この方法によ
って動作する。この技法およびその用途は、例えば、Ruparelら、Proceed
ings of the National Academy of Sciences
of the United States of America、102巻、59
32〜5937頁(2005年)、およびHarrisら、Science、320巻、
106〜109頁(2008年)に詳細に論じられている。
シーケンシングおよび可逆性ターミネーターベースのシーケンシング(例えば、Bent
leyら、Nature、6巻:53〜59頁[2009年]に記載された)である。I
lluminaのシーケンシング技術は、断片化されたゲノムDNAの、オリゴヌクレオ
チドアンカーが結合している平面の光学的に透明な表面への結合を利用する。鋳型DNA
が末端修復されて5’−リン酸化平滑末端が生成され、クレノウ断片のポリメラーゼ活性
が使用されて、平滑リン酸化DNA断片の3’末端に単一のA塩基が付加される。この付
加により、オリゴヌクレオチドアダプターへのライゲーションのためのDNA断片が調製
され、このアダプターは、その3’末端に単一のT塩基のオーバーハングを有することに
よってライゲーション効率を増大させる。アダプターオリゴヌクレオチドは、フローセル
アンカーと相補的である。限界希釈条件下で、アダプター修飾一本鎖鋳型DNAがフロー
セルに添加され、アンカーへのハイブリダイゼーションによって固定化される。結合した
DNA断片は、伸長および架橋増幅されて、それぞれが約1,000コピーの同じ鋳型を
含む数億のクラスターを有する超高密度シーケンシングフローセルが生成される。鋳型は
、除去可能な蛍光色素を有する可逆性ターミネーターを使用するロバストな4色のDNA
の合成によるシーケンシング技術を使用してシーケンシングされる。高感度蛍光検出が、
レーザー励起および全内部反射光学系を使用して達成される。約20〜40bp、例えば
、36bpの短い配列リードが繰り返しマスクされた参照ゲノムに対してアラインメント
され、この短い配列リードの参照ゲノムへの固有のマッピングが、特別に開発されたデー
タ解析パイプラインソフトウェアを使用して識別される。繰り返しマスクされていない参
照ゲノムも使用することができる。繰り返しマスクされた参照ゲノムが使用されても、繰
り返しマスクされていない参照ゲノムが使用されても、参照ゲノムにユニークにマッピン
グするリードのみがカウントされる。最初のリードが完了した後、断片の反対の末端から
の第2のリードを可能にするために、鋳型をin situで再生することができる。し
たがって、DNA断片のシングルエンドまたはペアエンドシーケンシングのいずれかを使
用することができる。試料中に存在するDNA断片の部分的なシーケンシングが実施され
、既知の参照ゲノムにマッピングされる所定の長さ、例えば、36bpのリードを含む配
列タグがカウントされる。
孔に通され、一本鎖核酸分子が細孔を通過する際に得られるデータを分析することによっ
て配列が演繹される。データは、イオン電流データとすることができ、ここで各塩基は、
例えば、細孔を通過する電流を異なる、区別可能な程度に部分的に遮断することによって
電流を変化させる。
顕微鏡法(TEM)を使用して配列情報を得るステップを含む。本方法は、重原子マーカ
ーで選択的に標識された高分子量(150kbまたはそれ超)DNAの単原子分解能透過
型電子顕微鏡イメージングを利用するステップ、および一貫した塩基間間隔を有する超高
密度(3nmの鎖間)並列アレイにおいて超薄膜上にこれらの分子を配列するステップを
含む。電子顕微鏡は、膜上の分子をイメージングして重原子マーカーの位置を決定し、D
NAから塩基配列情報を抽出するために使用される。本方法は、PCT特許公開第WO2
009/046445号にさらに記載されている。
のシーケンシングを使用して配列情報を得るステップを含む。第3の世代のシーケンシン
グでは、多くの小さい(約50nm)穴を有するアルミニウム被膜を含むスライドがゼロ
モード導波路として使用される(例えば、Leveneら、Science、299巻、
682〜686頁(2003年)を参照)。アルミニウム表面は、ポリホスホネート化学
、例えば、ポリビニルホスホネート化学によってDNAポリメラーゼの結合から保護され
ている(例えば、Korlachら、Proceedings of the Nati
onal Academy of Sciences of the United S
tates of America、105巻、1176〜1181頁(2008年)を
参照)。これは、アルミニウム被膜の穴中の露出したシリカへのDNAポリメラーゼ分子
の優先的な結合をもたらす。この設定は、蛍光バックグラウンドを低減させるためにエバ
ネッセント波現象を使用することを可能にし、より高い濃度の蛍光標識されたdNTPの
使用を可能にする。フルオロフォアは、dNTPの終端リン酸に結合されており、その結
果、dNTPが組み込まれると蛍光が放出されるが、フルオロフォアは、新しく組み込ま
れたヌクレオチドに結合されたままでなく、これは、複合体が、組込みの別のラウンドの
ために直ちに準備ができることを意味する。この方法によって、アルミニウム被膜の穴の
中に存在する個々のプライマー−鋳型複合体へのdNTPの組込みを検出することができ
る。例えば、Eidら、Science、323巻、133〜138号(2009年)を
参照。
(VI.遺伝子およびタンパク質バリアントのアッセイ)
クリーニングのためのタンパク質バリアントを発現させるように細胞内に任意選択でクロ
ーニングされる(またはスクリーニングされる生成物を作製するためにin vitro
転写反応で使用される)。さらに、タンパク質バリアントをコードする核酸は、in v
itroで濃縮し、シーケンシングし、発現させ、増幅し、または任意の他の一般的な組
換え方法で処理することができる。
を含めた本明細書で有用な分子生物学的技法を記載する一般的な教科書としては、Ber
gerおよびKimmel、Guide to Molecular Cloning
Techniques,Methods in Enzymology、152巻、Ac
ademic Press,Inc.、San Diego、CA(Berger);S
ambrookら、Molecular Cloning − A Laborator
y Manual(2版)、1〜3巻、Cold Spring Harbor Lab
oratory、Cold Spring Harbor、New York、1989
年(Sambrook)、ならびにCurrent Protocols in Mol
ecular Biology、F.M.Ausubelら編、Current Pro
tocols、Greene Publishing Associates,Inc.
とJohn Wiley & Sons,Inc.、New Yorkとの間のジョイン
トベンチャー(2000年にかけて補足された)(Ausubel))がある。核酸を植
物および動物細胞を含めた細胞に形質導入する方法と同様に、このような核酸によってコ
ードされるタンパク質を発現させる方法も、一般に利用可能である。Berger、Au
subel、およびSambrookに加えて、動物細胞の培養についての有用な一般的
な参考文献としては、Freshney(Culture of Animal Cel
ls,a Manual of Basic Technique、3版、Wiley−
Liss、New York(1994年))、およびその中に引用された参考文献、
Humason(Animal Tissue Techniques、4版、W.H.
Freeman and Company(1979年))、ならびにRicciard
elliら、In Vitro Cell Dev.Biol.、25巻:1016〜1
024頁(1989年)がある。植物細胞のクローニング、培養、および再生についての
参考文献としては、Payneら(1992年)、Plant Cell and Ti
ssue Culture in Liquid Systems、John Wile
y & Sons,Inc.、New York、NY(Payne);ならびにGam
borgおよびPhillips(編)(1995年)、Plant Cell,Tis
sue and Organ Culture; Fundamental Metho
ds Springer Lab Manual、Springer−Verlag(B
erlin Heidelberg New York)(Gamborg)がある。様
々な細胞培養培地が、AtlasおよびParks(編)、The Handbook
of Microbiological Media(1993年)、CRC Pres
s、Boca Raton、FL(Atlas)に記載されている。植物細胞培養につい
ての追加の情報は、市販の文献、例えば、Sigma−Aldrich,Inc.(St
Louis、MO)からのthe Life Science Research C
ell Culture Catalogue(1998年)(Sigma−LSRCC
C)、および例えば、同様にSigma−Aldrich,Inc.(St Louis
、MO)からのthe Plant Culture Catalogue and s
upplement(1997年)(Sigma−PCCS)に見つかる。
幅方法に当業者を導くために十分な技法の例として、ポリメラーゼ連鎖反応(PCR)、
リガーゼ連鎖反応(LCR)、Qβ−レプリカーゼ増幅、および他のRNAポリメラーゼ
媒介技法(例えば、NASBA)がある。これらの技法は、Berger、Sambro
ok、およびAusubel、上記、ならびにMullisら(1987年)、米国特許
第4,683,202号;PCR Protocols A Guide to Met
hods and Applications(Innisら編)、Academic
Press Inc.、San Diego、CA(1990年)(Innis);Ar
nheimおよびLevinson(1990年10月1日)C&EN、36〜47頁;
The Journal Of NIH Research(1991年)、3巻、81
〜94頁;Kwohら(1989年)、Proc.Natl.Acad.Sci.USA
、86巻、1173頁;Guatelliら(1990年)、Proc.Natl.Ac
ad.Sci.USA、87巻、1874頁;Lomellら(1989年)、J.Cl
in.Chem、35巻、1826頁;Landegrenら(1988年)、Scie
nce、241巻、1077〜1080頁;Van Brunt(1990年)、Bio
technology、8巻、291〜294頁;WuおよびWallace(1989
年)、Gene、4巻、560頁;Barringerら(1990年)、Gene、8
9巻、117頁、ならびにSooknananおよびMalek(1995年)、Bio
technology、13巻:563〜564頁に見つかる。増幅核酸をin vit
roでクローニングする改良方法は、Wallaceら、米国特許第5,426,039
号に記載されている。PCRによって大きい核酸を増幅する改良方法は、Chengら(
1994年)、Nature、369巻:684〜685頁、およびその中の参考文献に
要約されており、これらの中で最大で40kbのPCRアンプリコンが生成されている。
本質的に任意のRNAを、制限消化、PCR拡大、ならびに逆転写酵素およびポリメラー
ゼを使用するシーケンシングに適した二本鎖DNAに変換することができることを当業者
は理解する。Ausubel、Sambrook、およびBerger、すべて上記を参
照。
オチドの組込みについて点検される。これは、例えば、Sambrook、Berger
、およびAusubel、上記に本質的に教示されているように、核酸をクローニングお
よびシーケンシングすることによって、かつ/または制限消化によって行うことができる
。さらに、配列をPCR増幅し、直接シーケンシングすることができる。したがって、例
えば、Sambrook、Berger、Ausubel、およびInnis(上記)に
加えて、追加のPCRシーケンシング方法論も特に有用である。例えば、PCR中のホウ
素化ヌクレアーゼ耐性ヌクレオチドのアンプリコン中への選択的な組み込み、および大き
さを合わせた鋳型断片を生成するためのヌクレアーゼを用いたアンプリコンの消化による
PCR生成アンプリコンの直接シーケンシングが実施された(Porterら(1997
年)、Nucleic Acids Research、25巻(8号):1611〜1
617頁)。この方法では、鋳型に対して4つのPCR反応が実施され、その各々におい
て、PCR反応混合物中のヌクレオチド三リン酸の1つが2’デオキシヌクレオシド5’
−[P−ボラノ]−三リン酸と部分的に置換される。ホウ素化ヌクレオチドは、鋳型のP
CR断片の入れ子集合においてPCRアンプリコンに沿った様々な位置でPCR生成物中
に確率論的に組み込まれる。組み込まれたホウ素化ヌクレオチドによって遮断されたエキ
ソヌクレアーゼがPCRアンプリコンを切断するために使用される。次いで切断されたア
ンプリコンは、ポリアクリルアミドゲル電気泳動を使用してサイズによって分離され、ア
ンプリコンの配列をもたらす。この方法の利点は、それが、PCRアンプリコンの標準的
なサンガースタイルシーケンシングを実施するより、少ない生化学的操作を使用すること
である。
およびこれらがコードするタンパク質の性質は、宿主細胞内でこれらを発現させた後に容
易に検査することができる。合成遺伝子は、in vitro(無細胞)転写および翻訳
によってポリペプチド生成物を生成するためにも使用することができる。したがって、ポ
リヌクレオチドおよびポリペプチドを、様々な所定のリガンド、低分子、およびイオン、
または他のタンパク質およびポリペプチドエピトープを含めたポリマーおよびヘテロポリ
マー物質、ならびに微生物細胞壁、ウイルスの粒子、表面、および膜に結合するこれらの
能力について検査することができる。
リペプチドによる化学反応の触媒作用に関連した表現型をコードするポリヌクレオチドを
検出するために使用することができる。もっぱら例示の目的のために、かつ目的の特定の
所定の化学反応の細目に応じて、これらの方法は、基質(複数可)と生成物(複数可)と
の間の物理的差異、または化学反応と関連した反応媒体の変化(例えば、電磁放射線、吸
着、散逸、および蛍光(UV、可視、もしくは赤外(熱)であってもなくても)の変化)
を説明する当技術分野で公知の多数の技法を含み得る。これらの方法は、以下のうちの任
意の組合せから選択することができる:質量分析;核磁気共鳴;同位体分布または標識生
成物形成を説明する同位体標識材料、分割法およびスペクトル法;反応生成物(複数可)
のイオンまたは元素の組成における付随する変化(pH、無機および有機イオンなどの変
化を含む)を検出するためのスペクトル法および化学的方法。本明細書の方法で使用する
ために適した物理的なアッセイの他の方法は、レポーター性質を有する抗体を含むもの、
またはレポーター遺伝子の発現および活性とカップリングしたin vivo親和性認識
に基づくものを含めた反応生成物(複数可)に特異的なバイオセンサーの使用に基づくこ
とができる。in vivoでの反応生成物検出および細胞寿命−細胞死−細胞増殖選択
のための酵素併用アッセイも、適切な場合使用することができる。物理的なアッセイの特
異的な性質にかかわらず、これらはすべて、目的の生体分子によってもたらされ、または
コードされる所望の活性または所望の活性の組合せを選択するために使用される。
体、リガンド、酵素、基質などについての多くのアッセイが公知である。フォーマットと
しては、固定化されたコンポーネントへの結合、細胞または生物生存能、レポーター組成
物の生成などがある。
ために特に適している。ハイスループットアッセイでは、1日で、最大で数千の異なるバ
リアントをスクリーニングすることが可能である。例えば、マイクロタイタープレートの
各ウェルを、別個のアッセイを走らせるために使用することができ、または濃度もしくは
インキュベーション時間効果が観察される場合、5〜10ウェル毎に、単一のバリアント
を(例えば、異なる濃度で)試験することができる。したがって、単一の標準的なマイク
ロタイタープレートは、約100(例えば、96)の反応をアッセイすることができる。
1536ウェルプレートが使用される場合、単一のプレートは、約100〜約1500の
異なる反応を容易にアッセイすることができる。1日当たりに数個の異なるプレートをア
ッセイすることが可能であり、最大で約6,000〜20,000の異なるアッセイ(す
なわち、異なる核酸、コードされるタンパク質、濃度などを伴う)のアッセイスクリーニ
ングが、本発明の総合システムを使用して可能である。さらに最近では、試薬操作に対す
るマイクロ流体手法が、例えば、Caliper Technologies(Moun
tain View、CA)によって開発されており、これは、非常にハイスループット
なマイクロ流体アッセイ方法をもたらすことができる。
Corp.、Hopkinton、MA;Air Technical Indust
ries、Mentor、OH;Beckman Instruments,Inc.、
Fullerton、CA;Precision Systems,Inc.、Nati
ck、MAなどを参照)。これらのシステムは、典型的には、すべての試料および試薬の
ピペット操作、液体分注、時限インキュベーション、ならびにアッセイに適切な検出器(
複数可)におけるマイクロプレートの最終的な読み取りを含む全手順を自動化する。これ
らの構成可能なシステムは、ハイスループットで迅速な開始、ならびに高度の柔軟性およ
びカスタマイゼーションを提供する。
めの詳細なプロトコルを提供している。したがって例えば、Zymark Corp.は
、遺伝子転写の調節、リガンド結合などを検出するためのスクリーニングシステムを記載
する技術告示を提供している。
MAC OS、WINDOWS(登録商標)ファミリー、またはUNIX(登録商標)ベ
ース(例えば、SUNTMワークステーション)コンピューターを使用して、デジタル化
されたビデオ、またはデジタル化された光学もしくは他のアッセイ画像をデジタル化、記
憶、および分析するために、様々な市販の周辺装置およびソフトウェアが利用可能である
。
を指示するためのソフトウェアを使用する特殊なアルゴリズムを実施するように具体的に
プログラムされたデジタルコンピューターを含み、かつ任意選択で、例えば、次世代シー
ケンシングプラットフォーム制御ソフトウェア、ハイスループット液体制御ソフトウェア
、画像解析ソフトウェア、データ解釈ソフトウェア、源からデジタルコンピューターに作
動可能に連結した移動先に溶液を移動させるためのロボット液体制御アーマチュア、ロボ
ット液体制御アーマチュアによるオペレーションまたはハイスループット液体移動を制御
するためにデジタルコンピューターにデータを入力するための入力デバイス(例えば、コ
ンピューターキーボード)、および任意選択で、標識されたアッセイコンポーネントから
の標識シグナルをデジタル化するためのイメージスキャナーも含む。イメージスキャナー
は、プローブ標識強度の測定値をもたらすように画像解析ソフトウェアとインターフェー
スをとることができる。典型的には、プローブ標識強度測定値は、データ解釈ソフトウェ
アによって解釈されて、標識プローブが固体支持体上のDNAにハイブリダイズするか否
かが示される。
in silicoで組み換えられた核酸の物理的な実施形態を含む細胞、ウイルスプラ
ーク、胞子などは、固体培地上で分離されて個々のコロニー(またはプラーク)を生成す
ることができる。自動コロニーピッカー(例えば、Q−bot、Genetix、U.K
.)を使用して、コロニーまたはプラークが識別され、摘み取られ、最大で10,000
の異なる変異体が、2個の3mmのガラス玉/ウェルを含む96ウェルマイクロタイター
皿に接種される。Q−botは、コロニー全体を摘み取るのではなく、コロニーの中心を
通じてピンを挿入し、細胞(または菌糸体)および胞子(またはプラーク用途におけるウ
イルス)を少し試料採取して終了する。ピンがコロニー中に存在する時間、培養培地に接
種するためのディップの数、ピンがその培地中に存在する時間、各効果の接種量、および
各パラメータは、制御および最適化することができる。
誤差が減少し、培養を確立する速度が増大する(おおよそ10,000/4時間)。これ
らの培養物は、温度および湿度が制御されたインキュベーター内で任意選択で振盪される
。マイクロタイタープレート中の任意選択のガラス玉は、発酵槽のブレードと同様に細胞
の均一な通気および細胞(例えば、菌糸体)断片の分散を促進するように作用する。目的
の培養物に由来するクローンは、限界希釈によって単離することができる。やはり上記に
記載したように、ライブラリーを構成するプラークまたは細胞は、ハイブリダイゼーショ
ン、タンパク質活性、抗体へのタンパク質結合などのいずれかを検出することによって、
タンパク質の生成について直接スクリーニングすることもできる。十分なサイズのプール
を識別する機会を増大させるために、処理される変異体の数を10倍増大させるプレスク
リーニングを使用することができる。一次スクリーニングの目標は、親株(複数可)と等
しい、またはそれより良好な生成物力価を有する変異体を迅速に識別すること、およびこ
れらの変異体のみを後続の分析のために液体細胞培養に進めることである。
ヌクレオチドバリアント、例えば、酵素バリアントをコードするポリヌクレオチドを発現
する細胞をスクリーニングすることである。吸収、蛍光、またはFRETを使用する大量
並列固相スクリーニング装置が利用可能である。例えば、Bylinaらの米国特許第5
,914,245号(1999年)を参照。http://www|.|kairos−
scientific.com/;Youvanら(1999年)「Fluoresce
nce Imaging Micro−Spectrophotometer (FIM
S)」、Biotechnologyその他、<www|.|et−al.com>、1
巻:1〜16頁;Yangら(1998年)、「High Resolution Im
aging Microscope (HIRIM)」、Biotechnologyそ
の他、<www|.|et−al.com>、4巻:1〜20頁;およびwww|.|k
airos−scientific.com.に書き込まれたYouvanら(1999
年)、「Calibration of Fluorescence Resonanc
e Energy Transfer in Microscopy Using Ge
netically Engineered GFP Derivatives on
Nickel Chelating Beads」も参照。これらの技法によってスクリ
ーニングされた後、目的の分子は、典型的には単離され、当技術分野で公知である方法を
使用して任意選択でシーケンシングされる。次いで配列情報が本明細書に示したように使
用されて、新しいタンパク質バリアントライブラリーが設計される。
反応のために開発された。これらのシステムとしては、Takeda Chemical
Industries,LTD.(大阪、日本)によって開発された自動合成装置のよ
うな自動ワークステーション、および科学者によって実施されるマニュアル合成操作を模
倣する、ロボットアームを利用する多くのロボットシステム(Zymate II、Zy
mark Corporation、Hopkinton、Mass.;Orca、Be
ckman Coulter,Inc.(Fullerton、CA))がある。上記デ
バイスのいずれも、本発明で使用するために、例えば、本明細書に記載されるように進化
させられた核酸によってコードされる分子のハイスループットスクリーニングに適してい
る。これらのデバイスを本明細書に論じたように操作することができるようにこれらを改
良すること(もしあれば)の特質および実施は、当業者に明らかとなるであろう。
(VII.デジタル装置およびシステム)
くのコンピューターシステム内に記憶された、またはこれらによって移された命令および
/またはデータの制御下で作用するプロセスを使用する。本明細書に開示の実施形態は、
これらのオペレーションを実施するための装置にも関する。一部の実施形態では、装置は
、要求される目的のために特別に設計および/または構築されており、またはこれは、コ
ンピューター中に記憶されたコンピュータープログラムおよび/またはデータ構造によっ
て選択的に稼働させられ、または再構成される汎用コンピューターであり得る。本開示に
よって提供されるプロセスは、任意の特定のコンピューターまたは他の具体的な装置に本
質的に関係しない。特に、様々な汎用マシンが、本明細書の教示に従って書かれたプログ
ラムを用いた使用を見出す。しかし、一部の実施形態では、特殊な装置が、要求される方
法のオペレーションを実施するために構築される。様々なこれらのマシンについての特定
の構造の一実施形態を以下に記載する。
ョンを実施するためのプログラム命令および/またはデータ(データ構造を含む)を含む
コンピューター読み取り可能な媒体またはコンピュータープログラム製品に関する。コン
ピューター読み取り可能な媒体の例としては、それだけに限らないが、ハードディスクな
どの磁気媒体;CD−ROMデバイスおよびホログラフィックデバイスなどの光媒体;光
磁気媒体;ならびにフラッシュメモリーなどの半導体メモリーデバイスがある。ハードウ
ェアデバイス、例えば、リードオンリーメモリーデバイス(ROM)およびランダムアク
セスメモリデバイス(RAM)などが、プログラム命令を記憶するために構成され得る。
ハードウェアデバイス、例えば、特定用途向け集積回路(ASIC)およびプログラマブ
ルロジックデバイス(PLD)などが、プログラム命令を実行し、記憶するために構成さ
れ得る。本開示がコンピューター実装されたオペレーションを実施するための命令および
/またはデータを含むどんな特定のコンピューター読み取り可能な媒体またはどんな他の
コンピュータープログラム製品にも限定されることは意図されていない。
るものなどの低レベルコード、およびインタープリターを使用してコンピューターによっ
て実行され得るより高いレベルのコードを含むファイルがある。さらに、プログラム命令
としては、それだけに限らないが、マシンコード、ソースコード、および本開示に従って
計算機のオペレーションを直接または間接的に制御する任意の他のコードが含まれる。コ
ードは、入力、出力、算出、条件文、ブランチ、反復ループなどを指定し得る。
設計されたコンピューティングデバイスにロードされた場合に、デバイスに、1つまたは
複数のリガンドと相互作用する1つまたは複数の生体分子バリアントの仮想スクリーニン
グを実施させる論理命令および/またはデータを含有する固定媒体または伝達可能なプロ
グラム要素で具体化される。図4は、媒体817、ネットワークポート819、ユーザー
入力キーボード809、ユーザー入力811、または他の入力手段からの命令を読むこと
ができる論理装置である例示的なデジタルデバイス800を示す。その後、装置800は
、それらの命令を使用して、例えば、リガンド部分と活性部位、コファクターなどの1つ
または複数の特徴との幾何学的関係を評価するための(例えば、活性部位中の天然基質の
位置と、タンパク質バリアントの活性部位中の検討中の基質の位置との間の距離を決定す
るための)データ空間中での統計オペレーションを指示することができる。開示した実施
形態を具現化することができる一タイプの論理装置は、CPU 807、任意選択のユー
ザー入力デバイスキーボード809、およびGUIポインティングデバイス811、なら
びに周辺コンポーネント、例えば、ディスクドライブ815およびモニター805(これ
は、GO改変された文字列をディスプレイし、ユーザーによるこのような文字列のサブセ
ットの簡易化された選択をもたらす)などを含むコンピューターシステム800のような
コンピューターシステムである。固定媒体817が、総合システムをプログラムするため
に任意選択で使用され、これらとして、例えば、ディスクタイプ光媒体もしくは磁気媒体
、または他の電子メモリー記憶素子を挙げることができる。通信ポート819をシステム
をプログラムするために使用することができ、これは、任意のタイプの通信接続を表すこ
とができる。
ックデバイス(PLD)の電気回路内でも具現化することができる。このような場合では
、実施形態は、ASICまたはPLDを作製するために使用することができるコンピュー
ター読み取り可能な記述言語で実装される。本開示の一部の実施形態は、様々な他のデジ
タル装置、例えば、PDA、ラップトップコンピューターシステム、ディスプレイ、画像
編集設備などの電気回路または論理プロセッサー内で実装される。
プロセッサーによって実行されると、コンピューターシステムにタンパク質バリアントの
仮想スクリーニングおよび/または所望の活性を有するタンパク質のin silico
指向進化のための方法を実装させるコンピューター実行可能命令を記憶した1つまたはそ
れより多くのコンピューター読み取り可能な記憶媒体を含むコンピュータープログラム製
品に関する。このような方法は、図および疑似コードによって包含されるものなどの本明
細書に記載の任意の方法であり得る。一部の実施形態では、例えば、本方法は、複数の酵
素に関する配列データを受け取り、生体分子の3次元ホモロジーモデルを生成し、酵素の
ホモロジーモデルを基質の1つまたは複数の計算上の表示とドッキングし、所望の触媒活
性および選択性を有する酵素を選択する。一部の実施形態では、本方法は、スクリーニン
グプロセスによって高くランク付けされたバリアントからバリアントライブラリーをさら
に開発することができる。バリアントライブラリーは、繰り返しの指向進化およびスクリ
ーニングで使用することができ、これは所望の有益な性質を有する酵素をもたらすことが
できる。
上の表示とのドッキングは、本明細書に記載の様式でリガンドの計算上の表示および複数
のバリアントの活性部位の計算上の表示を使用するコンピューターシステム上のドッキン
グプログラムによって行われる。様々な実施形態では、ドッキングを決定するための方法
は、基質および酵素のポーズ間の結合エネルギーを評価することを含む。リガンドとうま
くドッキングするタンパク質バリアントについて、仮想タンパク質スクリーニングシステ
ムは、検討中のタンパク質バリアントの活性部位におけるリガンドの計算上の表示の複数
のポーズを検討して、存在する場合、複数のポーズのどれが活性であるかを決定する。様
々な実施形態では、活性ポーズを決定するための方法は、リガンド中の1つまたは複数の
原子と、タンパク質および/またはそのタンパク質に会合するコファクター中の1つまた
は複数の原子との相対的な位置の範囲を規定する地理的な制約を評価することを含む。
(VIII.ウェブサイトおよびクラウドコンピューティングにおける実施形態)
よびコンピューターネットワークを含む。相互接続したコンピューターは、様々なサービ
ス、例えば、電子メール、ftp、ワールドワイドウェブ(「WWW」)、およびセキュ
アなサービスを含めた他のサービスなどを使用して情報を交換する。WWWサービスは、
サーバーコンピューターシステム(例えば、Webサーバーまたはウェブサイト)が情報
のウェブページを遠隔のクライアントの情報家電またはコンピューターシステムに送るこ
とを可能にするものとして理解することができる。そのとき遠隔のクライアントコンピュ
ーターシステムは、ウェブページをディスプレイすることができる。一般に、WWWの各
リソース(例えば、コンピューターまたはウェブページ)は、ユニフォームリソースロケ
ーター(「URL」)によってユニークに識別可能である。具体的なウェブページを閲覧
し、またはそれと相互作用するために、クライアントコンピューターシステムは、リクエ
ストでそのウェブページのURLを指定する。リクエストは、そのウェブページをサポー
トするサーバーに転送される。サーバーがリクエストを受け取ると、これは、そのウェブ
ページをクライアント情報システムに送る。クライアントコンピューターシステムがその
ウェブページを受け取ると、これは、ブラウザを使用してウェブページをディスプレイす
ることができ、またはウェブページまたは別段に提供されるインターフェースと相互作用
することができる。ブラウザは、ウェブページをリクエストすること、およびウェブペー
ジをディスプレイすることまたはそれと相互作用することを行う論理モジュールである。
HTML」)を使用して定義される。HTMLは、ウェブページがどのようにディスプレ
イされるべきかを定義するタグの標準セットを提供する。HTMLドキュメントは、テキ
スト、グラフィックス、コントロール、および他の特徴をディスプレイすることを制御す
る様々なタグを含む。HTMLドキュメントは、そのサーバーコンピューターシステムま
たは他のサーバーコンピューターシステム上で利用可能な他のウェブページのURLを含
み得る。URLは、必ずしもユーザーに情報をディスプレイすることなく、遠隔情報家電
またはサーバーと通信するために情報家電が使用するCGIスクリプトまたは実行可能な
インターフェースのようなものなどを含めた他のタイプのインターフェースを示すことも
できる。
なる。サービスは、インターネットによって購入者に電子的に送達されるアイテム(例え
ば、音楽または株価)を含むことができる。サービスは、慣例的な流通チャネル(例えば
、一般的なキャリア)によって送達され得るアイテム(例えば、食料品、書籍、または化
学的もしくは生物学的化合物など)の注文のハンドリングも含むことができる。サービス
は、購入者が後の時間にアクセスする航空会社または劇場の予約などのアイテムの注文の
ハンドリングも含み得る。サーバーコンピューターシステムは、利用可能であるアイテム
またはサービスを列挙するインターフェースの電子版を提供し得る。ユーザーまたは潜在
的な購入者は、ブラウザを使用してインターフェースにアクセスし、目的の様々なアイテ
ムを選択し得る。ユーザーが所望のアイテムの選択を完了したとき、次いでサーバーコン
ピューターシステムは、サービスを完了するために必要な情報をユーザーに促す場合があ
る。このトランザクション固有の注文情報は、購入者の名称もしくは他の識別、支払いの
識別(企業の発注番号もしくはアカウント番号など)、または飛行情報などのサービスを
完了するために必要な追加の情報を含み得る。
されることができるものは、生物学的データおよび生物学的データベースである。このよ
うなサービスには、国立衛生研究所(NIH)の国立バイオテクノロジー情報センター(
NCBI)によって提供される様々なサービスが含まれる。NCBIは、分子生物学、生
化学、および遺伝学についての知識を記憶および分析するための自動システムを作製し;
研究団体および医学界によるこのようなデータベースおよびソフトウェアの使用を促進し
;全国的および国際的の両方でバイオテクノロジー情報を集める取り組みを調整し;生物
学的に重要な分子の構造および機能を分析するためのコンピューターベース情報処理の高
度な方法の研究を実施することを担当している。
。このデータベースは、個々の研究所、ならびに国際的なヌクレオチド配列データベース
、ヨーロッパ分子生物学研究所(EMBL)、および日本のDNAデータベース(DDB
J)とのデータ交換によって提出された配列から構築されており、米国特許商標庁に提出
される特許配列データを含む。GenBank(登録商標)に加えて、NCBIは、医学
界および科学界のために様々なデータベースをサポートおよび配信する。これらとしては
、オンライン版ヒトメンデル遺伝(OMIM)、3Dタンパク質構造の分子モデリングデ
ータベース(MMDB)、ユニークヒト遺伝子配列コレクション(Unique Hum
an Gene Sequence Collection)(UniGene)、ヒト
ゲノムの遺伝子地図、分類学ブラウザ、および国立がん研究所と共同したがんゲノム解剖
学プロジェクト(Cancer Genome Anatomy Project)(C
GAP)がある。Entrezは、ユーザーに配列、マッピング、分類学、および構造デ
ータへの統合アクセスを提供するNCBIのサーチ(search)および検索(ret
rieval)システムである。Entrezは、配列および染色体マップのグラフィカ
ルビューも提供する。Entrezの特徴は、関連した配列、構造、および参考文献を検
索する能力である。本明細書に記載のBLASTは、全DNAデータベースに対して配列
サーチを実行することができる、遺伝子および遺伝子の特徴を識別するためにNCBIで
開発された配列類似性サーチのためのプログラムである。NCBIによって提供されてい
る追加のソフトウェアツールとしては、オープンリーディングフレームファインダー(O
RF Finder)、電子PCR、ならびに配列提出ツール(sequence su
bmission tool)であるSequinおよびBankItがある。NCBI
の様々なデータベースおよびソフトウェアツールが、WWWから、FTPによって、また
はe−mailサーバーによって利用可能である。さらなる情報は、www|.|ncb
i.nlm.nih.govで利用可能である。
イン」または他の実行可能なコードで一般に閲覧されるデータである。このようなシステ
ムの一例は、CHIME、生物学的な分子構造を含めた分子構造の相互作用的仮想3次元
ディスプレイを可能にするブラウザのプラグインである。CHIMEに関するさらなる情
報は、www|.|mdlchime.com/chime/で利用可能である。
る。このようなシステムの例は、www|.|genosys.com/ oligo_
custinfo.cfmまたはwww|.|genomictechnologies
.com/Qbrowser2_FP.htmlで見つけることができる。典型的には、
これらのシステムは、所望の生体化合物(オリゴヌクレオチド、DNA鎖、RNA鎖、ア
ミノ酸配列など)のいくつかの記述子を受け入れ、次いでリクエストされた化合物が製造
され、溶液または他の適切な形態で顧客に発送される。
れ得るので、本開示の一部の実施形態によって生成されるポリペプチドまたはポリヌクレ
オチドを伴う計算結果または物理的結果は、上述した生物情報および化合物と同様の様式
でインターネットを通じて提供され得る。
環境で実装することができる。分散環境では、本方法は、複数のプロセッサーを含む単一
のコンピューターまたは多数のコンピューターで実装され得る。コンピューターを例えば
、共通のバスを通じてリンクすることができるが、より好ましくはコンピューター(複数
可)は、ネットワーク上のノードである。ネットワークは、汎用または専用のローカルま
たはワイドエリアネットワークとすることができ、ある特定の好適な実施形態では、コン
ピューターは、イントラネットまたはインターネットのコンポーネントであり得る。
ザを実行し、Webサーバーを実行するサーバーコンピューターにカップリングされてい
る。ウェブブラウザは、典型的には、IBMのWeb Explorer、Micros
oftのインターネットエクスプローラー、NetScape、Opera、またはMo
saicなどのプログラムである。Webサーバーは、典型的には、しかし必ずしもでは
ないが、IBMのHTTP Daemonまたは他のwww daemon(例えば、プ
ログラムのLINUX(登録商標)ベース形式)などのプログラムである。クライアント
コンピューターは、ラインによって、またはワイヤレスシステムを介してサーバーコンピ
ューターと双方向でカップリングされている。次に、サーバーコンピューターは、ウェブ
サイト(ウェブサイトをホストしているサーバー)と双方向でカップリングされており、
本発明の方法を実装するソフトウェアへのアクセスをもたらしている。
ユーザーは、クライアントに、本発明の方法の実装を提供するアプリケーション(複数可
)をホストしているウェブサイト(複数可)の一部であるリソースをリクエストさせ得る
。次いでサーバープログラム(複数可)は、リクエストを処理して指定されたリソースを
返す(これらが現在利用可能であると仮定して)。標準的な命名規則(すなわち、ユニフ
ォームリソースロケーター(「URL」))は、ハイパーテキスト転送プロトコル(「h
ttp」)、ファイル転送プロトコル(「ftp」)、ゴーファー、および広域情報サー
ビス(「WAIS」)などのサブクラスを現在含む、いくつかのタイプのロケーション名
を包含する。リソースがダウンロードされるとき、それは、追加のリソースのURLを含
み得る。したがって、クライアントのユーザーは、彼または彼女が具体的にはリクエスト
していなかった新しいリソースの存在を容易に学習することができる。
キテクチャ内でウェブサイトをホストするサーバー上で局所的に稼働することができる。
したがって、クライアントコンピューターは、リクエストをホストサーバーに知らせ、こ
れは、リクエストされた処理(複数可)を局所的に稼働させ、次いでクライアントに結果
をダウンロードする。代わりに、本発明の方法を、本方法(複数可)のコンポーネントが
クライアントによって局所的に実施される「マルチティア」フォーマットで実装すること
ができる。これは、クライアントによるリクエストに対してサーバーからダウンロードさ
れたソフトウェア(例えば、Java(登録商標)アプリケーション)によって実装する
ことができ、またはこれは、クライアント上に「永続的に」インストールされたソフトウ
ェアによって実装することができる。
分配される。このパラダイムでは、特徴または機能性のコレクションほどではなく、代わ
りに別々のフレームまたはビューのコレクションとしてアプリケーションを見ることが有
用である。例えば、典型的なアプリケーションは一般に、一組のメニューアイテムを含み
、その各々は、特定のフレーム、すなわち、アプリケーションのある特定の機能性を顕在
化する形式を呼び起こす。この観点で、アプリケーションは、コードのモノリシック体と
してではなく、アプレットのコレクションまたは機能性の束として見られる。ブラウザ内
からこのようにして、ユーザーは、ウェブページリンクを選択し、これはひいては、アプ
リケーションの特定のフレーム(すなわち、サブアプリケーション)を呼び起こす。した
がって、例えば、1つまたはそれより多くのフレームは、生物学的分子(複数可)を1つ
またはそれより多くのデータ空間に入力および/またはエンコードするための機能性を提
供し得る一方、別のフレームは、データ空間のモデルを洗練するためのツールを提供する
。
る1つまたは複数のフレームとして実装される:2つまたはそれより多くの生物学的分子
を文字列にエンコードして2つまたはそれより多くの異なる最初の文字列のコレクション
をもたらす機能(複数可)であって、前記生物学的分子の各々は、サブユニットの選択さ
れたセットを含む、機能;文字列から少なくとの2つの部分文字列を選択する機能;部分
文字列を繋ぎ合わせて、最初の文字列の1つまたはそれより多くとほぼ同じ長さの1つま
たはそれより多くの生成文字列を形成する機能;文字列のコレクションに生成文字列を付
加(配置)する機能;酵素および基質の計算上の表示/モデルを作製およびマニピュレー
トする機能、基質(例えば、リガンド)の計算上の表示を酵素(例えば、タンパク質)の
計算上の表示とドッキングする機能;分子モデルに分子動力学を適用する機能;分子を伴
う化学反応に影響する分子同士間の様々な制約(例えば、基質部分と酵素活性部位との間
の距離または角度)を算出する機能;および本明細書に示した任意の特徴を実施する機能
。
コンピューター上で実装され得る。これらの機能、例えば、生物学的分子のコンピュータ
ーモデルを作製またはマニピュレートするための機能は、ユーザーが生物学的分子の表示
(複数可)を挿入またはマニピュレートすることができる1つまたはそれより多くのウィ
ンドウを提供することができる。さらに、諸機能はまた任意選択で、ローカルネットワー
クおよび/またはイントラネットによってアクセス可能な私的なおよび/または公共のデ
ータベースへのアクセスを提供し、それによってデータベース中に含まれる1つまたはそ
れより多くの配列を本発明の方法に入力することができる。したがって、例えば、一実施
形態では、ユーザーは任意選択で、GenBank(登録商標)のサーチをリクエストし
、このようなサーチによって返された配列の1つまたはそれより多くをエンコーディング
および/または多様性生成機能に入力する能力を有することができる。
ントラネット実施形態を実装する方法は、当業者に周知であり、非常に詳細に文書提供さ
れている(例えば、Cluerら(1992年)、「A General Framew
ork for the Optimization of Object−Orien
ted Queries」、Proc SIGMOD International C
onference on Management of Data、San Dieg
o、California、1992年6月2〜5日、SIGMOD Record、2
1巻、2号、1992年6月;Stonebraker,M.編;ACM Press、
383〜392頁;ISO−ANSI、作業草案、「Information Tech
nology−Database Language SQL」、Jim Melton
編、International Organization for Standar
dization and American National Standards
Institute、1992年7月;Microsoft Corporation
、「ODBC 2.0 Programmer’s Reference and SD
K Guide.The Microsoft Open Database Stan
dard for Microsoft Windows(登録商標).TM and
Windows(登録商標) NTTM,Microsoft Open Databa
se Connectivity.TM.Software Development
Kit」、1992年、1993年、1994年、Microsoft Press、3
〜30頁および41〜56頁;ISO作業草案、「Database Language
SQL−Part 2:Foundation (SQL/Foundation)」
、CD9075−2:199.chi.SQL、1997年9月11日などを参照)。ウ
ェブベースアプリケーションに関する追加の該当する詳細は、Selifonovおよび
Stemmerによる「METHODS OF POPULATING DATA ST
RUCTURES FOR USE IN EVOLUTIONARY SIMULAT
IONS」という表題のWO00/42559に見つかる。
グ、および/または開発する方法は、コンピューターネットワークを介して分布した複数
のプロセシングユニットおよびメモリーを含むコンピューターシステム上のマルチユーザ
ーシステムとして実装することができ、ここでネットワークは、LAN上のイントラネッ
トおよび/またはインターネットを含み得る。一部の実施形態では、分散コンピューティ
ングアーキテクチャは、計算およびデータ記憶のためにコンピューターネットワークを介
して利用可能なコンピューターシステムのコレクションである「クラウド」を伴う。クラ
ウドを伴うコンピューター環境は、クラウドコンピューティング環境と呼ばれる。一部の
実施形態では、1人または複数のユーザーが、イントラネットおよび/またはインターネ
ットを介して分布したクラウドのコンピューターにアクセスすることができる。一部の実
施形態では、ユーザーは、上述したタンパク質バリアントをスクリーニングおよび/また
は開発する方法を実装するウェブクライアント、サーバーコンピューターによって遠隔で
アクセスし得る。
ーバーコンピューター上にプロビジョニングされており、仮想計算機の結果をユーザーに
送り返すことができる。仮想計算機(VM)は、コンピューターのソフトウェアベースエ
ミュレーションである。仮想計算機は、仮定的コンピューターの仕様に基づき得るか、ま
たは実世界のコンピューターのコンピューターアーキテクチャおよび機能をエミュレート
し得る。VMの構造および機能は、当技術分野で周知である。典型的には、VMは、シス
テムハードウェアを含むホストプラットフォーム上にインストールされ、VM自体は、仮
想システムハードウェアおよびゲストソフトウェアを含む。
U)、メモリー、1つまたはそれより多くのハードディスク、および様々な他のデバイス
を含む。VMの仮想システムハードウェアは、1つまたはそれより多くの仮想CPU、仮
想メモリー、1つまたはそれより多くの仮想ハードディスク、および1つまたはそれより
多くの仮想デバイスを含む。VMのゲストソフトウェアは、ゲストシステムソフトウェア
およびゲストアプリケーションを含む。一部の実装では、ゲストシステムソフトウェアは
、仮想デバイスのドライバーを伴ったゲストオペレーティングシステムを含む。一部の実
装では、VMのゲストアプリケーションは、上述した仮想タンパク質スクリーニングシス
テムの少なくとも1つの事例を含む。
荷に対して増減することができる。一部の実施形態では、ユーザーは、クラウドからの仮
想計算機、仮想スクリーニングシステムを含むVMをリクエストすることができる。一部
の実施形態では、クラウドコンピューティング環境は、ユーザーのリクエストに基づいて
VMをプロビジョニングすることができる。一部の実施形態では、VMは、イメージリポ
ジトリー中に記憶させることができる以前に記憶されたVMイメージで存在し得る。クラ
ウドコンピューティング環境は、イメージをサーチし、サーバーまたはユーザーシステム
に転送することができる。次いでクラウドコンピューティング環境は、サーバーまたはユ
ーザーシステム上でイメージを起動することができる。
(実施例1)
以下の実施例は、酵素バリアントを仮想スクリーニングし、様々な実施形態を実施する
所望の触媒活性および選択性を有する酵素を開発するプロセスを例示する。
素パネルのメンバーを仮想スクリーニングして、(a)活性ポーズで基質とドッキングし
た、(b)プロ−Sコンホメーションでドッキングした、(c)活性ポーズで、かつプロ
−Sコンホメーションでドッキングしたもののなかでも最も低い全結合エネルギー(また
はドッキングスコア)を有した第1のバリアントを選択することを含んでいた。次いでプ
ロセスは、ラウンド1の骨格または親配列として第1のバリアントを使用して、仮想指向
進化のための仮想変異誘発技術を使用したラウンド1の仮想バリアントライブラリーを生
成した。次いで、プロセスは、ラウンド1の仮想バリアントライブラリーのメンバーのモ
デルを生成し、ラウンド1の仮想バリアントライブラリーをスクリーニングし、ラウンド
1の骨格を選択したときと類似した選択方法を使用してラウンド2の骨格として第2のバ
リアントを選択した。プロセスはまた、ラウンド1の仮想バリアントライブラリーから追
加のバリアントも選択した。追加のバリアントは、(a)活性ポーズで基質とドッキング
し、(b)活性ポーズでドッキングするもののなかでも低い全結合エネルギー(またはド
ッキングスコア)を有した。次いでプロセスは、ラウンド2の骨格を追加のバリアントと
組み換えて、ラウンド2のバリアントライブラリーに多様性を導入した。最終的に、プロ
セスは、バリアントをコンピューターによりモデリングし、スクリーニングし、選択して
、ラウンド1およびラウンド2の骨格と比較して改善された活性および選択性を有する仮
想酵素バリアントを得た。
モデルを生成するステップによって開始した。これらの酵素は、所望の基質に構造的また
は機能的に関連する天然基質を触媒する。プロセスは、所望の基質をホモロジーモデルに
ドッキングし、実際の酵素パネルのメンバーを仮想スクリーニングして、(a)活性ポー
ズで所望の基質とドッキングし、(b)プロ−Sコンホメーションでドッキングした唯一
のバリアントを見出した。活性ポーズでの結合の成功は、リガンドが、触媒的変換を受け
るか、または結合部位との共有結合などのなんらかの所望の役割を果たす可能性が高いこ
とを示唆していた。所望の基質およびパネルのメンバーのドッキングを、上記で詳細に説
明されたドッキング方法によって実施した。所望の基質の機能的に関連する部分と天然基
質とを、ドッキング空間中の同じX、Y、Z座標にこの2つの基質を置くことによって比
較した。所望の基質のポーズが、活性であるか、プロ−Sであるか、またはプロ−Rであ
るかどうかを、所望の基質および天然基質の部分間の距離によって決定した。この実施例
について、距離の基準を1.25Åに設定した。基準値およびルール(距離の平均、最小
、最大などが基準より小さいことが求められる)は、異なる適用において、および指向進
化の様々なラウンドにおいて、調整が可能である。
ことができることが見出された。バリアントはそれほど選択的ではない可能性があると考
えられた。所望の基質に関して活性でありS選択的な酵素を誘導するために、このバリア
ントをラウンド1の骨格として選択して、in silicoの指向進化の第1のラウン
ドにおける変異誘発によって、ラウンド1のバリアントライブラリーを生成した。このラ
ウンド1の骨格中の15個の活性部位の位置が識別され、各位置につきラウンド1の骨格
バリアントとは異なる19種の可能性のあるアミノ酸があり、合計で285種の異なる可
能性のある点変異があった。ラウンド1の進化において、ラウンド1のバリアントライブ
ラリーのために1000種の変異体が生成され、各変異体はランダムな数の変異を有し、
ここでこのランダムな数は、平均=4およびSD=2のガウス分布から選択された。28
5種の可能性のある点変異から、変異をランダムに選択した。
とは対照的により厳格な値である1Åに設定したことを除き、実際の酵素パネルに関して
上述した方法に類似したドッキングおよびスクリーニング方法を使用した。プロセスは、
活性でありプロ−Sのポーズで結合する全ての変異体のなかでも最も低い全結合エネルギ
ーを有する変異を含むものとして1つのバリアントを識別した。実際に、このバリアント
における変異は、望ましくないプロ−Rコンホメーションでの基質の結合を防ぎ、これは
、選択性に関して有益な変異を示していた。したがってプロセスは、このバリアントを、
ラウンド2の指向進化のための骨格として選択した。
は、ラウンド1の骨格に関して決定された結合エネルギー(−4.005kcal/mo
l)と比較しても比較的高く、これは、進化により酵素の有益な性質をさらに改善できる
ことを示唆していた。ラウンド2の指向進化を、ラウンド2の骨格に29種の変異を導入
することによってin silicoで実施した。ラウンド1の進化から得られた全ての
バリアントのなかでも最も低い結合エネルギーを有するラウンド1のライブラリーの29
種のバリアントから、29種の変異を誘導した。ラウンド2の進化において、1000種
の変異体を生成してラウンド2のバリアントライブラリーを生成し、各変異体は、ランダ
ムな数の変異を有し、ここでこのランダムな数は、平均=6およびSD=4のガウス分布
から選択された。29種のバリアントから誘導された29種の可能性のある変異から、変
異をランダムに選択した。
使用して、ほとんどのバリアントが所望のプロ−Sコンホメーションのみでの基質との結
合を選び、少なくとも10種のバリアントが、ラウンド1およびラウンド2の骨格より優
れた結合エネルギーを有することを決定した。ラウンド2の進化からの改善されたバリア
ントならびにラウンド1およびラウンド2の骨格の結合エネルギーに関しては、表1を参
照されたい。表1のデータを示すことに加えて、図5は、ラウンド2の進化からの10種
の改善されたバリアント、ならびにラウンド1およびラウンド2の骨格の選択性を示す。
この図は、酵素パネルの仮想スクリーニングは、最初に、低い結合エネルギーを有するが
S−選択的ではないラウンド1の骨格を識別したことを例示する。次いでプロセスは、i
n silicoの指向進化(変異誘発)を使用してS−選択性を改善し、ラウンド2の
骨格を得た。最終的にプロセスは、ラウンド2の進化において基質結合を組換えにより改
善し、所望の基質と高親和性を有しエナンチオ選択的な酵素バリアントを得た。
変異誘発および組換えによって生成した。一部の用途において、仮想タンパク質スクリー
ニング方法は、指向進化方法をガイドする配列−活性モデルと組み合わせてもよい。米国
特許第7,783,428号に記載された方法にしたがう多重線形回帰技術を用いて配列
活性モデルを構築した。図6Aにおいて、配列活性モデルの予測された結合エネルギーは
、配列の試験セットに関して仮想スクリーニングシステムにより得られた観察されたエネ
ルギーに対してプロットされている。試験セットから除外された配列の検証セットを試験
することによって、配列活性モデルのクロスバリデーションを行った。このモデルは、試
験セットにおける分散の90.9%(R2=0.909)を占める。図6Bにおけるクロ
スバリデーションのデータは、特定の位置に特定の変異を有する配列から結合エネルギー
を予測することにおいて配列活性モデルが正確であったことを示し、検証セットにおいて
分散の82.9%(R2=0.829)を占める。
をガイドするために配列活性モデルを使用する他の方式のなかでも、1つの方式は、タン
パク質活性への変異の寄与率を反映する特定の位置における特定の残基の特定の変異に関
する回帰係数に依存する。具体的には、指向進化のプロセスは、配列−活性モデルの項の
係数を評価して、仮想スクリーニングシステムによって計算された実質的な結合エネルギ
ーに寄与する1つまたは複数のアミノ酸を識別することによって変異のための位置を選択
することができた。例えば、この実施例において、変異1は大きい正の係数を有しており
、これは、変異1が大幅に活性を増加させることを示唆している。図6Cを参照。それと
は対照的に、変異27は大きい負の係数を有しており、これは、図6Cで測定されたよう
に、高い活性を得るためにこの変異は回避されるべきであることを示唆している。
実施例2は、図7の上に示した反応のような、プロ−キラルケトンからのキラルアルコ
ールのR−鏡像異性体についてのケトレダクターゼバリアントの仮想スクリーニングの実
験的な検証を提供する。
96ウェルのフォーマット)の3次元ホモロジーモデルを生成し、ケトレダクターゼパネ
ルの192種のメンバーを仮想スクリーニングして、(a)活性ポーズで基質とドッキン
グし、(b)プロ−Rコンホメーションでドッキングし、(c)好ましいドッキングスコ
アを有するバリアントを選択することを含んでいた。
のバリアントを識別したが、さらなる開発およびスクリーニングのためにこれに優先順位
を付けてもよい。仮想in silicoスクリーニング結果の有用性および妥当性を検
証するために、プロセスはさらに、標準的なプロトコルを用いて全ての192種のメンバ
ーに対してin vitroのスクリーニングも実施し、高速液体クロマトグラフィー(
HPLC)を用いて基質/生成物を検出した。
)−アルコール)÷(ピーク面積(R)−アルコール+ピーク面積(S)−アルコール+
ピーク面積ケトン)×100%として計算された転換%であり、y軸は、(ピーク面積(
R)−アルコール−ピーク面積(S)−アルコール)÷(ピーク面積(R)−アルコール
+ピーク面積(S)−アルコール)×100%として計算された所望のR生成物に対する
e.e.%(エナンチオ選択性の指標)である。仮想スクリーニングによって優先順位を
付けられた24種のバリアントを赤色の四角形として強調表示し、残りのバリアントを青
色のひし形としてハイライトした。結果から、1)仮想スクリーニングは、任意のin
vitroのスクリーニングの前に酵素バリアントのセットを用いて所望の転化が実現可
能であるかどうかの決定を助けることができること;2)このような小さくフレキシブル
な基質は通常、モデリングにとって難題であるとみなされているという事実にもかかわら
ず、相当量の予測されたバリアントが実際に高い活性(転化%)およびエナンチオ選択性
(e.e.%)をもたらしたことが示唆される。それゆえに仮想スクリーニングは、in
vitroのスクリーニングのために起こる可能性が極めて低い反応をフィルタリング
して除き、試験のためにより少ない試料を選択することができ(このケースでは192種
に対して24種)、それにより顕著な時間およびコストの節約をもたらすことができる。
実施例3は、図8の上に示された反応のような立体選択的なC=OのCH−NH2への
還元に関するトランスアミナーゼの仮想指向進化の実験的な検証を提供する。
228種の仮想配列の3次元ホモロジーモデルを生成し(12個の位置×位置1個当たり
19種のAA=228種のバリアント、バリアント1種当たり1種の変異)、228種の
仮想バリアントを仮想スクリーニングして、(a)活性ポーズで基質とドッキングし、(
b)所望の立体選択性をもたらすコンホメーションでドッキングし、(c)活性ポーズで
かつ標的のコンホメーションでドッキングしたもののなかでも最も低い全結合エネルギー
を有するバリアントを選択することを含んだ。
12種のバリアントまたは12種の変異を識別した。12種の変異を使用してライブラリ
ーを合成し、これをin vitroでスクリーニングした。特許化されているプロトコ
ルを用いて360種のバリアント(バリアント1種当たり1種または1種より多くの変異
)に対してin vitroのスクリーニングを実施した。HPLCを用いて基質/生成
物を検出した。
、ここでx軸は、スクリーニングされた試料であり、y軸は、FIOPCであり、これは
、陽性対照に対する改善の倍率(Fold Improvement Over Pos
itive Control)と定義され、(転換バリアント%−転換陰性対照%)÷(
転換陽性対照%−転換陰性対照%)×100%として計算される。陽性対照は、仮想スク
リーニングおよびin vitroのスクリーニングの骨格であり、陰性対照は、酵素を
含まない空のベクターである。
するバリアントおよび5.3%のFIOPC>2を有するバリアントをもたらした。最上
位のヒットは、2.4のFIOPCを有した。それゆえに仮想スクリーニングは、in
vitroのスクリーニングにとって有害な変異をフィルタリングして除き、より標的化
されたライブラリーの設計を助けることができ、それにより顕著な時間およびコストの節
約をもたらすことができる。例えば、本発明者らがin vitroで飽和変異誘発ステ
ップを行わなければならない場合、少なくともさらなる800種のバリアントをスクリー
ニングする必要がある。
変更を本開示の真の射程から逸脱することなく行うことができることが、本開示を読むこ
とによって当業者に明らかとなるであろう。例えば、上述したすべての技法および装置は
、様々な組合せで使用され得る。本願で引用したすべての刊行物、特許、特許出願、また
は他の文書は、各個々の刊行物、特許、特許出願、または他の文献が、すべての目的に関
して参照により組み込まれるように個々に示されているのと同じ程度に、すべての目的に
関してその全体が参照により組み込まれている。
Claims (1)
- 本願図面に記載の発明。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361883838P | 2013-09-27 | 2013-09-27 | |
US61/883,838 | 2013-09-27 | ||
JP2018237169A JP2019083025A (ja) | 2013-09-27 | 2018-12-19 | 酵素バリアントの自動スクリーニング |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018237169A Division JP2019083025A (ja) | 2013-09-27 | 2018-12-19 | 酵素バリアントの自動スクリーニング |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021131901A true JP2021131901A (ja) | 2021-09-09 |
Family
ID=51662390
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016516874A Active JP6857029B2 (ja) | 2013-09-27 | 2014-09-26 | 酵素バリアントの自動スクリーニング |
JP2018237169A Withdrawn JP2019083025A (ja) | 2013-09-27 | 2018-12-19 | 酵素バリアントの自動スクリーニング |
JP2021089944A Pending JP2021131901A (ja) | 2013-09-27 | 2021-05-28 | 酵素バリアントの自動スクリーニング |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016516874A Active JP6857029B2 (ja) | 2013-09-27 | 2014-09-26 | 酵素バリアントの自動スクリーニング |
JP2018237169A Withdrawn JP2019083025A (ja) | 2013-09-27 | 2018-12-19 | 酵素バリアントの自動スクリーニング |
Country Status (15)
Country | Link |
---|---|
US (3) | US10696964B2 (ja) |
EP (2) | EP3049973B1 (ja) |
JP (3) | JP6857029B2 (ja) |
KR (1) | KR102342205B1 (ja) |
CN (1) | CN105765592B (ja) |
AU (1) | AU2014324669B2 (ja) |
BR (1) | BR112016006285B1 (ja) |
CA (1) | CA2923755C (ja) |
DK (2) | DK3049973T3 (ja) |
ES (2) | ES2693150T3 (ja) |
HU (2) | HUE039618T2 (ja) |
IL (1) | IL244457B (ja) |
RU (2) | RU2016116253A (ja) |
SG (1) | SG11201601695WA (ja) |
WO (1) | WO2015048572A1 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3049973B1 (en) | 2013-09-27 | 2018-08-08 | Codexis, Inc. | Automated screening of enzyme variants |
NZ717647A (en) | 2013-09-27 | 2020-06-26 | Codexis Inc | Structure based predictive modeling |
JP6667447B2 (ja) * | 2013-11-15 | 2020-03-18 | ヒンジ セラピューティクス,インコーポレイテッド | 治療設計のためのコンピュータ支援モデル化 |
SG11201703258PA (en) | 2014-11-25 | 2017-05-30 | Codexis Inc | Engineered imine reductases and methods for the reductive amination of ketone and amine compounds |
WO2016105889A1 (en) | 2014-12-22 | 2016-06-30 | Codexis, Inc. | Human alpha-galactosidase variants |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
WO2017155945A1 (en) * | 2016-03-09 | 2017-09-14 | President And Fellows Of Harvard College | Methods and systems of cell-free enzyme discovery and optimization |
AU2018217495B2 (en) | 2017-02-13 | 2021-03-04 | Codexis, Inc. | Engineered phenylalanine ammonia lyase polypeptides |
JP6917050B2 (ja) * | 2017-03-06 | 2021-08-11 | 学校法人早稲田大学 | 最適特性を有する非天然型タンパク質の製造方法 |
CA3061133A1 (en) * | 2017-04-27 | 2018-11-01 | Codexis, Inc. | Ketoreductase polypeptides and polynucleotides |
SG11201909957TA (en) * | 2017-05-08 | 2019-11-28 | Codexis Inc | Engineered ligase variants |
EP3404567A1 (en) * | 2017-05-19 | 2018-11-21 | Fujitsu Limited | A system and a method for discovery of predicted site-specific protein phosphorylation candidates |
BR112019027179A2 (pt) * | 2017-06-19 | 2020-06-30 | Jungla Llc | interpretação de variantes genéticas e genômicas por meio de uma estrutura de aprendizagem profunda de mutação computacional e experimental integrada |
EP3645711A4 (en) | 2017-06-30 | 2021-04-21 | Codexis, Inc. | T7 RNA POLYMERASE VARIANTS |
CN111417724A (zh) | 2017-06-30 | 2020-07-14 | 科德克希思公司 | T7 rna聚合酶变体 |
EP3652328A1 (en) * | 2017-07-14 | 2020-05-20 | c-LEcta GmbH | Ketoreductases |
CN107832577B (zh) * | 2017-10-30 | 2021-07-13 | 中国农业大学 | 一种筛选几丁质酶OfChtⅠ抑制剂的方法 |
CN107974484A (zh) * | 2017-11-10 | 2018-05-01 | 嘉兴欣贝莱生物科技有限公司 | 根皮素生物合成过程中查尔酮合成酶建模方法 |
US12100485B2 (en) * | 2018-03-05 | 2024-09-24 | The Board Of Trustees Of The Leland Stanford Junior University | Machine learning and molecular simulation based methods for enhancing binding and activity prediction |
EP3613855A1 (en) * | 2018-08-23 | 2020-02-26 | Clariant Produkte (Deutschland) GmbH | Method for the production of a nucleic acid library |
CN112739712A (zh) | 2018-09-11 | 2021-04-30 | 格罗宁根大学 | 具有可调孔径的生物纳米孔及其作为分析工具的用途 |
EP3640864A1 (en) * | 2018-10-18 | 2020-04-22 | Fujitsu Limited | A computer-implemented method and apparatus for inferring a property of a biomedical entity |
BR112021008186A2 (pt) | 2018-10-29 | 2021-08-17 | Codexis, Inc. | dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase. |
EP3893860A4 (en) | 2018-12-14 | 2023-03-29 | Codexis, Inc. | ENGINEERED TYROSINE AMMONIA LYASE |
AU2019403323A1 (en) | 2018-12-20 | 2021-07-01 | Codexis, Inc. | Human alpha-galactosidase variants |
CN109841263B (zh) * | 2019-02-22 | 2023-08-15 | 成都分迪科技有限公司 | 蛋白降解药物分子库及其构建方法 |
JP7344509B2 (ja) * | 2019-09-20 | 2023-09-14 | 公立大学法人 富山県立大学 | 光学活性フルオロアルコールおよび光学活性クロロフルオロアルコールの製造方法 |
US20230227797A1 (en) * | 2019-10-28 | 2023-07-20 | Asymchem Laboratories (Tianjin) Co., Ltd. | Transaminase mutant and use thereof |
US11970722B2 (en) | 2019-12-20 | 2024-04-30 | Codexis, Inc. | Engineered acid alpha-glucosidase variants |
CN111681703A (zh) * | 2020-05-09 | 2020-09-18 | 北京纽伦智能科技有限公司 | 一种蛋白结构的对接方法及分布式蛋白结构对接系统 |
CN114822717A (zh) * | 2021-01-28 | 2022-07-29 | 腾讯科技(深圳)有限公司 | 基于人工智能的药物分子处理方法、装置、设备及存储介质 |
WO2023022783A1 (en) * | 2021-08-17 | 2023-02-23 | University Of Southern California | System and method for computational enzyme design based on maximum entropy |
CN113921082B (zh) * | 2021-10-27 | 2023-04-07 | 云舟生物科技(广州)股份有限公司 | 基因搜索权重调整方法、计算机存储介质及电子设备 |
CN117511725B (zh) * | 2023-12-21 | 2024-09-20 | 北京康润诚业生物科技有限公司 | 一种酶分子定向进化生物信息分析装置及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020099506A1 (en) * | 2000-03-23 | 2002-07-25 | Floriano Wely B. | Methods and apparatus for predicting ligand binding interactions |
US20020133297A1 (en) * | 2001-01-17 | 2002-09-19 | Jinn-Moon Yang | Ligand docking method using evolutionary algorithm |
US6969763B1 (en) * | 1999-05-12 | 2005-11-29 | Isis Pharmaceuticals, Inc. | Molecular interaction sites of interleukin-2 RNA and methods of modulating the same |
US20060121455A1 (en) * | 2003-04-14 | 2006-06-08 | California Institute Of Technology | COP protein design tool |
JP2009525274A (ja) * | 2006-01-23 | 2009-07-09 | ジョゼフ・ピー・エリコ | 標的薬物開発の方法および組成物 |
WO2010077470A2 (en) * | 2008-11-19 | 2010-07-08 | University Of Washington | Enzyme catalysts for diels-alder reactions |
Family Cites Families (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
JPH04179495A (ja) | 1990-11-14 | 1992-06-26 | M D Res Kk | 融合蛋白質、およびペプチド又は蛋白質の製造方法 |
US5426039A (en) | 1993-09-08 | 1995-06-20 | Bio-Rad Laboratories, Inc. | Direct molecular cloning of primer extended DNA containing an alkane diol |
US6165793A (en) | 1996-03-25 | 2000-12-26 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5928905A (en) | 1995-04-18 | 1999-07-27 | Glaxo Group Limited | End-complementary polymerase reaction |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
US20060257890A1 (en) | 1996-05-20 | 2006-11-16 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6995017B1 (en) | 1994-02-17 | 2006-02-07 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6309883B1 (en) | 1994-02-17 | 2001-10-30 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6406855B1 (en) | 1994-02-17 | 2002-06-18 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
US6506602B1 (en) | 1996-03-25 | 2003-01-14 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US7148054B2 (en) | 1997-01-17 | 2006-12-12 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
US6326204B1 (en) | 1997-01-17 | 2001-12-04 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
DK1717322T3 (da) | 1997-01-17 | 2012-10-22 | Codexis Mayflower Holdings Llc | Udvikling af hele celler og organismer ved rekursiv sekvensrekombination |
US5914245A (en) | 1998-04-20 | 1999-06-22 | Kairos Scientific Inc. | Solid phase enzyme kinetics screening in microcolonies |
US6365408B1 (en) | 1998-06-19 | 2002-04-02 | Maxygen, Inc. | Methods of evolving a polynucleotides by mutagenesis and recombination |
JP4221100B2 (ja) | 1999-01-13 | 2009-02-12 | エルピーダメモリ株式会社 | 半導体装置 |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
US6917882B2 (en) | 1999-01-19 | 2005-07-12 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US6368861B1 (en) | 1999-01-19 | 2002-04-09 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
WO2000042559A1 (en) | 1999-01-18 | 2000-07-20 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
EP1062614A1 (en) | 1999-01-19 | 2000-12-27 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides |
US7024312B1 (en) | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US20070065838A1 (en) | 1999-01-19 | 2007-03-22 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US7702464B1 (en) | 2001-08-21 | 2010-04-20 | Maxygen, Inc. | Method and apparatus for codon determining |
US6961664B2 (en) | 1999-01-19 | 2005-11-01 | Maxygen | Methods of populating data structures for use in evolutionary simulations |
US6365377B1 (en) | 1999-03-05 | 2002-04-02 | Maxygen, Inc. | Recombination of insertion modified nucleic acids |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
US6519065B1 (en) | 1999-11-05 | 2003-02-11 | Jds Fitel Inc. | Chromatic dispersion compensation device |
EP1272967A2 (en) | 2000-03-30 | 2003-01-08 | Maxygen, Inc. | In silico cross-over site selection |
US7465567B2 (en) | 2001-04-16 | 2008-12-16 | California Institute Of Technology | Peroxide-driven cytochrome P450 oxygenase variants |
WO2003008563A2 (en) | 2001-07-20 | 2003-01-30 | California Institute Of Technology | Improved cytochrome p450 oxygenases |
DK1493027T3 (en) | 2002-03-01 | 2014-11-17 | Codexis Mayflower Holdings Llc | Methods, systems and software for identifying functional biomolecules |
US7747391B2 (en) | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US20050084907A1 (en) | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
AU2003213846A1 (en) | 2002-03-09 | 2003-09-29 | Maxygen, Inc. | Optimization of crossover points for directed evolution |
US20060099667A1 (en) * | 2002-10-28 | 2006-05-11 | Francois Andre | Method for performing restrained dynamics docking of one or multiple substrates on multi-specific enzymes |
CN1468959A (zh) * | 2003-06-02 | 2004-01-21 | 复旦大学 | 非典型性肺炎冠状病毒蛋白质空间构象模型及其应用 |
US7524664B2 (en) | 2003-06-17 | 2009-04-28 | California Institute Of Technology | Regio- and enantioselective alkane hydroxylation with modified cytochrome P450 |
US8005620B2 (en) | 2003-08-01 | 2011-08-23 | Dna Twopointo Inc. | Systems and methods for biopolymer engineering |
WO2005017116A2 (en) | 2003-08-11 | 2005-02-24 | California Institute Of Technology | Thermostable peroxide-driven cytochrome p450 oxygenase variants and methods of use |
JP2005309877A (ja) | 2004-04-22 | 2005-11-04 | National Institute Of Advanced Industrial & Technology | 機能性生体分子の配列解析方法 |
US20060136139A1 (en) | 2004-10-12 | 2006-06-22 | Elcock Adrian H | Rapid computational identification of targets |
WO2006121455A1 (en) | 2005-05-10 | 2006-11-16 | The Salk Institute For Biological Studies | Dynamic signal processing |
RU2008140858A (ru) | 2006-03-15 | 2010-04-20 | Ксир (Za) | Способ скрининга соединений, обладающих активностью ингибитора глутамин синтетазы |
US8685687B2 (en) | 2006-07-05 | 2014-04-01 | The Scripps Research Institute | Chimeric zinc finger recombinases optimized for catalysis by directed evolution |
US7814234B2 (en) | 2006-10-30 | 2010-10-12 | Microsoft Corporation | Offline execution of web based applications |
JP2010517574A (ja) | 2007-02-08 | 2010-05-27 | コデクシス, インコーポレイテッド | ケトレダクターゼおよびその使用 |
WO2009008908A2 (en) | 2007-02-12 | 2009-01-15 | Codexis, Inc. | Structure-activity relationships |
US7977078B2 (en) | 2007-08-24 | 2011-07-12 | Codexis, Inc. | Ketoreductase polypeptides for the production of (R)-3-hydroxythiolane |
US8748143B2 (en) | 2007-09-13 | 2014-06-10 | Codexis, Inc. | Ketoreductase polypeptides for the reduction of acetophenones |
CN101889081B (zh) | 2007-09-28 | 2014-06-18 | 科德克希思公司 | 酮还原酶多肽及其用途 |
JP5646328B2 (ja) | 2007-10-01 | 2014-12-24 | コデクシス, インコーポレイテッド | アゼチジノンの生産のためのケトレダクターゼポリペプチド |
JP2010539991A (ja) | 2007-10-04 | 2010-12-24 | ハルシオン モレキュラー | 電子顕微鏡を用いた核酸ポリマーの配列決定 |
EP2216429A4 (en) | 2007-11-12 | 2011-06-15 | In Silico Sciences Inc | SILICO SCREENING SYSTEM AND SILICO SCREENING METHOD |
US8383346B2 (en) | 2008-06-13 | 2013-02-26 | Codexis, Inc. | Combined automated parallel synthesis of polynucleotide variants |
DK3023494T3 (en) | 2008-06-13 | 2019-02-25 | Codexis Inc | PROCEDURE FOR SYNTHESIS OF POLYNUCLEOTIDE VARIETIES |
US8178333B2 (en) | 2008-06-24 | 2012-05-15 | Codexis, Inc. | Biocatalytic processes for the preparation of substantially stereomerically pure fused bicyclic proline compounds |
AU2009273130B2 (en) | 2008-07-25 | 2014-10-16 | Glaxo Group Limited | Novel compositions and methods |
WO2010025238A2 (en) | 2008-08-27 | 2010-03-04 | Codexis, Inc. | Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine |
US8247192B2 (en) | 2008-11-10 | 2012-08-21 | Codexis, Inc. | Penicillin-G acylases |
EP2379713A4 (en) | 2008-12-18 | 2013-07-10 | Codexis Inc | RECOMBINANT HALOHYDRIN DEHALOGENASE POLYPEPTIDES |
EP2382308B1 (en) | 2008-12-25 | 2015-03-04 | Codexis, Inc. | Enone reductases |
SG172891A1 (en) | 2009-01-08 | 2011-08-29 | Codexis Inc | Transaminase polypeptides |
JP5707344B2 (ja) | 2009-02-26 | 2015-04-30 | コデクシス, インコーポレイテッド | トランスアミナーゼ生体触媒 |
US8614081B2 (en) | 2009-07-23 | 2013-12-24 | Codexis, Inc. | Nitrilase biocatalysts |
SI2510089T1 (sl) | 2009-12-08 | 2015-12-31 | Codexis, Inc. | Sinteza prazolnih spojin |
CA2793596A1 (en) | 2009-12-30 | 2011-07-07 | Pioneer Hi-Bred International, Inc. | Methods and compositions for targeted polynucleotide modification |
EP2649187B1 (en) | 2010-12-08 | 2017-11-22 | Codexis, Inc. | Biocatalysts and methods for the synthesis of armodafinil |
CN102156823B (zh) * | 2011-02-18 | 2015-04-22 | 复旦大学 | 一种靶向作用于蛋白激酶非活性构象的化合物筛选方法 |
NZ703347A (en) | 2012-06-29 | 2016-05-27 | Wisconsin Alumni Res Found | Use of 2-methylene-19-nor-(20s)-1α,25-dihydroxyvitamin d3 to treat secondary hyperparathyroidism |
US20140303952A1 (en) | 2013-04-08 | 2014-10-09 | City University Of Hong Kong | Protein-ligand docking |
CN103265635A (zh) * | 2013-04-28 | 2013-08-28 | 中山大学附属第一医院 | 一种通用的靶向蛋白嵌合型分子化合物的构建方法 |
CN103324861B (zh) * | 2013-07-10 | 2016-07-20 | 南京大学 | 基于分子动力学模拟的核受体介导内分泌干扰物质的虚拟筛选方法 |
NZ717647A (en) | 2013-09-27 | 2020-06-26 | Codexis Inc | Structure based predictive modeling |
EP3049973B1 (en) | 2013-09-27 | 2018-08-08 | Codexis, Inc. | Automated screening of enzyme variants |
-
2014
- 2014-09-26 EP EP14781426.3A patent/EP3049973B1/en active Active
- 2014-09-26 CA CA2923755A patent/CA2923755C/en active Active
- 2014-09-26 US US14/498,864 patent/US10696964B2/en active Active
- 2014-09-26 EP EP18187438.9A patent/EP3418929B1/en active Active
- 2014-09-26 HU HUE14781426A patent/HUE039618T2/hu unknown
- 2014-09-26 KR KR1020167010661A patent/KR102342205B1/ko active IP Right Grant
- 2014-09-26 RU RU2016116253A patent/RU2016116253A/ru unknown
- 2014-09-26 DK DK14781426.3T patent/DK3049973T3/en active
- 2014-09-26 JP JP2016516874A patent/JP6857029B2/ja active Active
- 2014-09-26 HU HUE18187438A patent/HUE053049T2/hu unknown
- 2014-09-26 AU AU2014324669A patent/AU2014324669B2/en active Active
- 2014-09-26 WO PCT/US2014/057899 patent/WO2015048572A1/en active Application Filing
- 2014-09-26 BR BR112016006285-0A patent/BR112016006285B1/pt active IP Right Grant
- 2014-09-26 ES ES14781426.3T patent/ES2693150T3/es active Active
- 2014-09-26 SG SG11201601695WA patent/SG11201601695WA/en unknown
- 2014-09-26 RU RU2019140645A patent/RU2019140645A/ru unknown
- 2014-09-26 CN CN201480065215.XA patent/CN105765592B/zh active Active
- 2014-09-26 ES ES18187438T patent/ES2857711T3/es active Active
- 2014-09-26 DK DK18187438.9T patent/DK3418929T3/da active
-
2016
- 2016-03-06 IL IL244457A patent/IL244457B/en active IP Right Grant
-
2018
- 2018-12-19 JP JP2018237169A patent/JP2019083025A/ja not_active Withdrawn
-
2020
- 2020-05-15 US US16/875,848 patent/US11535845B2/en active Active
-
2021
- 2021-05-28 JP JP2021089944A patent/JP2021131901A/ja active Pending
-
2022
- 2022-11-02 US US17/979,711 patent/US20230048421A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6969763B1 (en) * | 1999-05-12 | 2005-11-29 | Isis Pharmaceuticals, Inc. | Molecular interaction sites of interleukin-2 RNA and methods of modulating the same |
US20020099506A1 (en) * | 2000-03-23 | 2002-07-25 | Floriano Wely B. | Methods and apparatus for predicting ligand binding interactions |
US20020133297A1 (en) * | 2001-01-17 | 2002-09-19 | Jinn-Moon Yang | Ligand docking method using evolutionary algorithm |
US20060121455A1 (en) * | 2003-04-14 | 2006-06-08 | California Institute Of Technology | COP protein design tool |
JP2009525274A (ja) * | 2006-01-23 | 2009-07-09 | ジョゼフ・ピー・エリコ | 標的薬物開発の方法および組成物 |
WO2010077470A2 (en) * | 2008-11-19 | 2010-07-08 | University Of Washington | Enzyme catalysts for diels-alder reactions |
Non-Patent Citations (1)
Title |
---|
MARTIN R. HEDIGER ET AL.: "A computational Methodology to Screen Activities of Enzyme Variants", PLOS ONE, vol. 7, no. 12, JPN6018036661, 17 December 2012 (2012-12-17), pages 1 - 10, ISSN: 0005045310 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021131901A (ja) | 酵素バリアントの自動スクリーニング | |
US11342046B2 (en) | Methods and systems for engineering biomolecules | |
KR20210005325A (ko) | 상호작용 성분을 이용하여 생체분자를 확인하기 위한 방법, 시스템, 및 소프트웨어 | |
Miton et al. | Statistical analysis of mutational epistasis to reveal intramolecular interaction networks in proteins | |
Appel et al. | uPIC–M: efficient and scalable preparation of clonal single mutant libraries for high-throughput protein biochemistry | |
NZ717658B2 (en) | Automated screening of enzyme variants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220704 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230425 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230724 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231215 |