JP2004500544A - 高分子原子構造の汎ゲノム決定方法 - Google Patents
高分子原子構造の汎ゲノム決定方法 Download PDFInfo
- Publication number
- JP2004500544A JP2004500544A JP2000595146A JP2000595146A JP2004500544A JP 2004500544 A JP2004500544 A JP 2004500544A JP 2000595146 A JP2000595146 A JP 2000595146A JP 2000595146 A JP2000595146 A JP 2000595146A JP 2004500544 A JP2004500544 A JP 2004500544A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- database
- target protein
- information
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 229920000642 polymer Polymers 0.000 title claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 15
- 108090000623 proteins and genes Proteins 0.000 claims description 208
- 102000004169 proteins and genes Human genes 0.000 claims description 187
- 239000013078 crystal Substances 0.000 claims description 71
- 238000002447 crystallographic data Methods 0.000 claims description 35
- 230000014509 gene expression Effects 0.000 claims description 29
- 238000012216 screening Methods 0.000 claims description 27
- 238000002425 crystallisation Methods 0.000 claims description 20
- 230000008025 crystallization Effects 0.000 claims description 20
- 230000002547 anomalous effect Effects 0.000 claims description 16
- 238000010367 cloning Methods 0.000 claims description 12
- 238000000746 purification Methods 0.000 claims description 11
- 150000001875 compounds Chemical class 0.000 claims description 10
- 238000012926 crystallographic analysis Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 10
- 230000014616 translation Effects 0.000 claims description 10
- 238000013461 design Methods 0.000 claims description 9
- 238000001243 protein synthesis Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000007710 freezing Methods 0.000 claims description 8
- 230000008014 freezing Effects 0.000 claims description 8
- 230000020978 protein processing Effects 0.000 claims description 8
- RJFAYQIBOAGBLC-BYPYZUCNSA-N Selenium-L-methionine Chemical compound C[Se]CC[C@H](N)C(O)=O RJFAYQIBOAGBLC-BYPYZUCNSA-N 0.000 claims description 7
- RJFAYQIBOAGBLC-UHFFFAOYSA-N Selenomethionine Natural products C[Se]CCC(N)C(O)=O RJFAYQIBOAGBLC-UHFFFAOYSA-N 0.000 claims description 7
- 238000009510 drug design Methods 0.000 claims description 7
- 229960002718 selenomethionine Drugs 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 7
- 238000002441 X-ray diffraction Methods 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 108020004635 Complementary DNA Proteins 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 239000013604 expression vector Substances 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001742 protein purification Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 77
- 238000002474 experimental method Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 16
- 239000003814 drug Substances 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 9
- 238000002050 diffraction method Methods 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 238000005452 bending Methods 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000005469 synchrotron radiation Effects 0.000 description 4
- 238000002424 x-ray crystallography Methods 0.000 description 4
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 229910052770 Uranium Inorganic materials 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008236 biological pathway Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 238000003255 drug test Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- JFALSRSLKYAFGM-UHFFFAOYSA-N uranium(0) Chemical compound [U] JFALSRSLKYAFGM-UHFFFAOYSA-N 0.000 description 3
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000008238 biochemical pathway Effects 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000007877 drug screening Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 238000003875 gradient-accelerated spectroscopy Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000203069 Archaea Species 0.000 description 1
- 102100037674 Bis(5'-adenosyl)-triphosphatase Human genes 0.000 description 1
- 102000000905 Cadherin Human genes 0.000 description 1
- 108050007957 Cadherin Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 101710156248 Purine nucleoside phosphoramidase Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- 241000219873 Vicia Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003277 amino acid sequence analysis Methods 0.000 description 1
- 150000001413 amino acids Chemical group 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 108010005713 bis(5'-adenosyl)triphosphatase Proteins 0.000 description 1
- 229910052797 bismuth Inorganic materials 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000017455 cell-cell adhesion Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002380 cytological effect Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000012912 drug discovery process Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000002296 dynamic light scattering Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000005421 electrostatic potential Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229910052741 iridium Inorganic materials 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 229910052745 lead Inorganic materials 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 239000013081 microcrystal Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910052762 osmium Inorganic materials 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 229910052702 rhenium Inorganic materials 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000001073 sample cooling Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- -1 small molecule compounds Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229910052716 thallium Inorganic materials 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229910052724 xenon Inorganic materials 0.000 description 1
- FHNFHKCVQCLJFQ-UHFFFAOYSA-N xenon atom Chemical compound [Xe] FHNFHKCVQCLJFQ-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/30—Extraction; Separation; Purification by precipitation
- C07K1/306—Extraction; Separation; Purification by precipitation by crystallization
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/20—Heterogeneous data integration
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
【課題】全生命体を代表する構造の総合的分析のためのシステム及び工程を提供する。
【解決手段】3次元高分子原子構造の汎ゲノム決定方法は、構成要素の独自の結合を用いる。すべての既知の構造情報、配列情報及び機能情報はゲノムデータベースに体系的に組織化される。
【選択図】図3
【解決手段】3次元高分子原子構造の汎ゲノム決定方法は、構成要素の独自の結合を用いる。すべての既知の構造情報、配列情報及び機能情報はゲノムデータベースに体系的に組織化される。
【選択図】図3
Description
【0001】
【従来の技術】
(発明の背景)
遺伝子分析及びゲノム配列決定プロジェクトの最近の進歩は、全ての生命体の基本的普遍性に関する揺るがぬ証拠を提供している。例えば、大部分の人間の遺伝子は例えばマウス、虫や時に微生物さえにも相同性を有することが示されている。更に、個々の生物体の多くの蛋白質が互いに関連している。C.elegans中には100,000以上のヒト遺伝子と19,000以上の蛋白質をコードしている遺伝子が存在しているが、地球上の全生命体中に存在する別種蛋白質は10,000の位であると信じられている。実際の数は類似性の粒度のレベルに依存する。
【0002】
現在多くの微生物、及び1種類の多細胞生物、線虫であるC.elegansについて全遺伝子配列が知られている。更に、ヒトゲノム配列決定プロジェクトもかなり進行している。幾つかのベンチャー企業がほぼ全てのヒト遺伝子のコード領域の配列を決定した。機能的ゲノミクスに関わる学究的施設及びベンチャー企業は、遺伝子生成物の機能を解き明かすことを目的に遺伝子発現のパターンのマッピングを進行中である。
【0003】
数年前まで科学者は全ゲノムの配列決定について論争していた。しかし非寄生性生物の全ゲノムが初めて4年間で配列決定されて以来、ゲノミクス、即ち全ゲノムの配列決定に基づく学問は、基礎生物学及び医学に於ける多くの最も重要な疑問に対するアプローチを大きく変えた。配列決定に基づくゲノミクスは、ゲノムを越え、及び種を越えて膨大な蛋白質の組合せを分類することを可能にした。ゲノムレベルのDNA配列研究にて進行中の配列決定は、生物学に対する価値ある洞察と大きな商業化の機会を提供する。しかし、新規蛋白質分子が実際に生物学的作用に影響する存在であって初めてより大きな洞察、及び商業化の機会が遺伝子生成物より得ることができるのである。原子レベルでの構造決定は遙かに遅れているが、しかし蓄積された結果により折り畳みのパターンに反復性があること、そして多くの蛋白質がモジュラー構造体を持つことが明らかにされた。蛋白質は構造及び機能のファミリーに分類される。推測は極めて広範囲であるが、特有の折り畳みの数は恐らく数千に過ぎないだろう。現在、これらの内僅か数百のものしか知られていない。未知構造体を分析するための体系的且つ迅速な方法が商業化されており、科学的な価値を持っている。
【0004】
ゲノム配列情報は確かに有益であるが、それは1次元のものに過ぎず、従って限界を持っている。直線状の配列データに基づくゲノミクスの持つ、生物学的分子が持つ3次元の普遍性を理解する上での価値は限定的である。直線配列は、それらに対応する3次元(3D)構造に降り畳まれときにのみ生物学的に活性であり、医薬品、除草剤またはその他バイオテクノロジー製品の対象物になる。現在構造情報とゲノム情報との統合は殆どない。従って、一般にはゲノムに起因する標的同定には構造は影響しない。
【0005】
生化学的及び細胞学的プロセスを理解することは、蛋白質及びその他生物高分子の3次元分子構造の知識によって大きく進歩する。3次元構造情報は、例えばゲノム情報が標的同定に利用され、そしてコンビナトリアル化学がその発見に影響する薬物設計にとって重要な構成要素である。薬物研究者は、結合阻害剤が利用できる場合には標的の構造を経験的に決定し、構造情報を利用して新規化合物を合成してきた。代替的には、薬物研究者は既知阻害剤の構造特性、又はそれ自体の結合部位の構造特性を利用して、結合をもたらす所定の大きさ、形状及び化学的ならびに物理的特性を持つ新規薬物の候補に関して、化学データベースを検索する。
【0006】
現在に至るまで、標的同定及び発見につながるコンビナトリアル化学へのゲノミクスの利用が構造による影響を本式に受けることはなかった。しかし、特定の場合に、構造に関する知識が標的認識及び推測、薬物アッセイ及びスクリーニング、先行化合物の選択、及びコンビナトリアルライブラリーの設計に利用できることは既知であるため、これらを利用することをゲノミクスと統合する構造情報の総合的なデータベースが利用可能であれば構造志向型のアプローチの役割が増すと考えられている。通常技術を使用した構造決定は、それ自体有益であるが配列決定に比べよりコストがかかるという欠点を持っている。
【0007】
配列決定ベースのゲノミクス及び通常構造決定技術の持つこれら制限は、構造ゲノミクスの新規科学によって取り除かれるだろう。構造ゲノミクスは、配列ゲノミクスがゲノムの直線情報内容に付加するパノラマ的理解同種の構造生物学の科学も提供する。構造ゲノミクスはヒトゲノムによりコードされると考えられている約100,000種類の発現蛋白質(’プロテオーム’と呼ばれる)を含む総合的な構造データベースを必要とすることが示唆されている。これら構造の全てを解明することは超人的な作業であるが、作業の達成により我々は例えばバクテリア、酵母、古生物や植物の蛋白質についてより多く知ることができるであろう。配列ゲノミクスにより詳細に示されているように、構造体の総合データベースには多くの利用がある。
【0008】
構造ゲノミクスより獲得される情報は、従来の構造生物学により提供される情報と根本的に異なる特性を有しており、予想外の生物学的関連性への本質的な洞察、及び特定の生物学的問題の対象となる蛋白質モチーフまたは折り畳みに関する理解を提供し、これにより我々は伝統的な詳細な構造研究を実行する能力を更に高めることができる。
【0009】
構造生物学者は伝統的に、分子作用体の構造的理解により最も良く解答できると思われる生物学的機能上重要な問題を表す問題に目を向けている。このことは単に構造決定だけでなく特定の機能問題についても詳細な解析を必要とする。構造ゲノミクスはこの様な活動にとって重要なツールとなるだろう。コンピューターによる構造予測の正確性は総合的分類データベースの実現により改善され、これらアプローチが実行的であること、そして実際に実験的構造決定にとって代わることが示唆されている。
【0010】
ゲノム配列決定の進歩に加え、結晶学の様な構造決定に関する技術、バイオインフォマティクスの様な配列及び構造分析に関する技術も進歩している。この様な進歩を急激に進んでいる遺伝子配列情報と組み合わせることで、薬物発見の様な商業応用を含む生物学に関する構造的な基礎の総合的研究に適したツールがもたらされる。
【0011】
バイオインフォマティクスとは、実験、モデル化、データベース検索及び機器研究により得た生物学情報及びデータを解析することを目的に、コンピューターシステムとコンピューター応用解決技術を利用する学問である。バイオインフォマティクスは、ゲノムデータ及び構造データの体系的分析を目的とした新規のコンピューター利用法の使用を含む。BLASTの様な広く使用されている配列分析プログラムに加え、最近は新世代の“先進”ツールも利用され初めている。これらツールの利用によって、かすかな別種相同体の特定に大きな進歩がもたらされた。しかし、配列分析法は、同様の機能を持つ多くの蛋白質に明瞭な配列同一性がないという基本的な制約を受ける。
【0012】
3次元構造情報はこの問題に対する最終解決を提供する。類似アミノ酸配列を持つ蛋白質は必ず類似の3D構造と関連する生物学的機能を持つ。更に、通常の比較方法でそれら配列が無関係な場合でさえ、蛋白質構造はしばしば似ている。「畳み込み認識」法は構造情報を用いて、蛋白質と異なる配列との相関性を同定する。これら方法は、構造パラダイムのデータベースが散在的に構成されているため、一部で成功しているに過ぎない。
【0013】
各ファミリー及び全てのファミリーの代表メンバーの構造決定は、幾つかのレベルで全発現蛋白質の包括的概観を提供し得る。蛋白質ファミリーは独立モジュールに対応する、あるいは対応しないであろう全ての蛋白質、ドメイン又は配列モチーフを含み得る。利用可能な全ての蛋白質ファミリーを用いることで、例えば必須膜蛋白質を最終的に大規模構造決定し得る。ファミリーベースの構造データベースは、蛋白質の作用を決定するためのデータを提供し、それにより、もちろん構造決定をもたらさない例外的ファミリーもあるが、自然状態に於ける蛋白質の折り畳みに対する理解を改善するための貴重な資源を提供する。データベースはまた構造解析を通し新しい機能上の洞察に光を当てるための情報も提供する。
【0014】
配列ゲノミクスに於ける特徴的配列モチーフの認識による蛋白質キナーゼ同定と同様にして、構造ゲノミクスは配列ベースの方法に比べ強力である3次元構造中の相同性検証により同目的を達成し得る。従って、構造ゲノミクスの有望な産物は、配列単独をベースでは同定不可能な「予想外」の構造的相同性、そしてある場合には機能的相同性を特定することであろう。構造ゲノミクスのこの機能は従来の仮説誘導的方法を使った場合には決定することができなかった、あるいは少なくとも極めて難しかった生物学的経路内での予想外の繋がりを推測し得る。
【0015】
ファミリー代表の既知構造に基づく相同モデル化により、恐らく大部分を構成するであろう各ファミリー中の未解決メンバーが視覚化され得る。相同モデル化により、1ファミリーメンバーに由来する3D構造を利用することで、その他ファミリーメンバーに関する有用なモデルを推測することができる。比較的大きな構造データベースの支援を受け構築されたこれらモデルは、通常の技術を利用して達成されたものに比べ良好であり、そして二次構造予測の様なモデル化技術にとっての基礎を提供する。
【0016】
X−線結晶学は蛋白質の様な生物学的高分子の分子レベルの3D構造を作るための技術である。結晶により回折されるX線の強度は正確に測定することができ、そして回折強度の3Dパターンは3D分子像に変換される。3Åおよびそれ以上の解析に対応するパターンについては、原子の位置はÅの数十分の一の正確さをもって結合長の分画内に規定される。ウイルスまたはリボソームの様な巨大高分子集合体の結晶のX線回折パターンでさえ同様にして分析できる。核磁気共鳴分光法や電子顕微鏡の様な他技術も代替的に構造決定に利用できるだろう。しかし、これらその他方法はX線結晶学にて利用可能な大きな潜在能力は示していない。
【0017】
X線法は一般に配列決定法に比べ時間がかかる。3D構造決定はゲノム配列決定に比べ遙かに遅れている。しかし、X線結晶学の装置及び方法の最近の進歩は構造決定の速度を劇的に促進する機会を提供している。過去数年間に成熟し、シンクロトロン放射源に最も大きなインパクトを求め、得ている新規の発展には、(1)アンジュレータ挿入装置、(2)電荷結合素子(CCD)検出器、(3)結晶の凍結保護法、(4)多波長型異常回折(MAD)位相法、そして(5)セレノメチオニル蛋白質がある。これら最近の技術進歩は大規模な構造決定作業に適した結晶学装置を進歩させる。
【0018】
アンジュレータは驚異的な輝度を持つ、X線のレーザー様光線を生ずる第3世代型シンクロトロン内の磁気列である。新世代シンクロトロン放射源は迅速な結晶学構造決定を可能にする。アルゴンナショナルラボラトリー(Argone National Laboratory)のアドバンスフォトンソース(APS)の有焦点アンジュレータビームラインはそれ自体のベンディングマグネットビームライン又はブルックヘブンにある国立シンクロトロンライトソース(NSLS)の様な第2世代光源のそれに比べ、100倍以上のフラックスを有している。使用される電子検出器はこのフラックスに適合できるものでなければならない。適当な大きさを持つ適当なCCD検出器が昨年利用できるようになった。例えば2K×2KのCCDアレイが多くの販社より入手できる様になった。
【0019】
フラッシュ凍結法による凍結保護は放射による損傷から結晶を保護する。凍結溶媒への移動に関する方法、この数年でようやく完成されたに過ぎない。アンジュレータを利用する微小結晶(10−50ミクロン断面)には凍結保護が必須である。結晶凍結はX線実験の応用性の拡大、大量のデータコピー量を必要とするMADについて、その拡大にインパクトを与えた。最高の毛細管はりつけ結晶についてのみしか有効なデータを得られなかった様な非常に不良な結晶でも、現在では実験の適用範囲内にある。
【0020】
構造決定を大きく簡素化するMAD法による位相評価は1994年に実現された。MADはシンクロトロン放射を必要とし、アンジュレータの優れたエネルギー分解能を必要とする。セレノメチオニンを組換え体蛋白質内に体系的に取り込ませる方法が日常化したことで、結晶構造の解析方法が変化した。セレノメチノニル蛋白質のMAD位相法は、今後構造ゲノミクスの構造決定法の主流になることだろう。セレノメチオニル蛋白質は大部分の組換え体発現システムにて容易に発現でき、同型誘導体に関ししばしば困難である研究ステージを不要にする。
【0021】
アンジュレータビームラインはMAD実験に適したネルギー解像度を持つ非常に明るいX線を提供する。最新世代のCCD検出器と組合せることで、構造解析に必要な全データを提供する単独MAD実験をこれまで通常であった数日間ではなく、数時間、あるいは1時間の分画からさえ得ることができるだろう。
【0022】
ごく最近のその他進歩は、構造ゲノミクスを更に現実的なものにしている。その第1は、上記の如く配列ベースゲノミクスである。これは蛋白質の配列のゲノム内又はゲノム間の知的分類を提供し、それにより目標候補のリストを作る手段を提供している。
【0023】
これら蛋白質を発現させるためには、容易にできるものをまず実施すべきであるとされている。例えば、細菌内での発現に注目した細菌ファミリーメンバーが存在する場合で且つ例えば好熱性の蛋白質が大腸菌に発現できる場合には、通常組換え体細胞抽出物を煮沸することで実質的精製は達成できる。同定可能な細菌相同体がない蛋白質分類は細菌発現システムを試すこともできるが、最終的には真核細胞システムが必要であろう。この「簡単にできることを最初に」という方法では、その配列から解析可能と思われる比較的小さな蛋白質にまず応用されるだろう。多ドメイン型蛋白質や単一膜貫通型蛋白質の場合には、分析的な配列ベース法を適用し、続いて発現試験、限定蛋白質溶解及びマススペクトロメトリー試験を適用してドメインを規定すべきであるという新しい意見がある。統合膜蛋白質については、結晶化に関するより良い方法、又はNMR分光分析法による構造決定が可能とする進歩を待つことになるだろう。
【0024】
ファミリーをベースとした方法は、古典的な方法に対し、蛋白質が困難な対象であることが証明されれば、我々はより証明が簡単である同じファミリーの別のメンバーに交換することができるという大きな利点を提供する。複数のファミリーメンバーについて、少なくとも発現及び結晶化段階を通し同時並行して研究を進め、次に容易に作業できるものに限り続けることも提案されている。並列的な研究は、構造決定法の持続的な技術的進歩と合わせ研究時間の大幅な短縮に関し楽観するに足る根拠を提供している。
【0025】
多くの部分に関し、構造ゲノミクスはまだ計画段階にある。一部構造ゲノミクスから学び取れるものが不明であり、そして3次元構造が配列ベースの知識以上に大きな進歩をもたらすかについて不明であるという意見もある。その他、総合的構造データベースが他のツールと統合され、新しい洞察をどの様に提供できるのかについても未知である。
【0026】
【課題を解決するための手段】
本発明の目的は、全生命体を代表する構造の総合的分析のためのシステム及び工程を提供することである。
【0027】
本発明の別の目的は、全生命体の全ての主要蛋白質ファミリーを表す原子レベルの構造パラダイムを高効率に生成するためのシステム及び工程を提供することである。
【0028】
本発明の別の目的は、コンビナトリアル法の応用性を拡大するためのゲノミクスにより構造の利用を統合する構造情報の総合的データベースを生成するためのシステム及び工程を提供することである。
【0029】
本発明の更に別の目的は、各ファミリー内の詳細な構造情報を提供しながら、可能な限り多くの遺伝子ファミリーを広範にカバーするゲノミクスを利用した構造体の利用を統合する構造情報の総合的データベースを生成するためのシステム及び工程を提供することである。データベースは詳細な表面特性、保存パターン及び活性部位を利用した機能的洞察も提供する。分子名、遺伝子ファミリー名、蛋白質ファミリー又は蛋白質名、代謝経路又は特定の配列を指定することで情報にアクセスしてもよい。3D構造、全ての関連蛋白質及び他データベースとのリンクを含む所望分子に関連した全ての情報がこのデータベースから得られてもよい。この蓄積情報は、標的同定及び評価、発見の指針、薬物アッセイの設計、スクリーニング及びコンビナトリアルライブラリーを含む多くの方法で利用され得る。
【0030】
本発明は、それぞれが対応する蛋白質に関連している複数の3次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも1つのバイオインフォーマティクスツールと、
少なくとも1つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するX−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも1分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも1つのバイオインフォーマティクスツールを用いて更新されるシステムを提供する。
【0031】
また、本発明は、以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の3次元原子構造体を実験的に決定する方法であって、
(a)複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
(b)少なくとも1つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
(c)複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階(b)で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
(d)段階(c)にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
(e)複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階(d)にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
(f)段階(e)にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記1つの標的蛋白質について複数の標本結晶から好適体を決定し、
(g)段階(f)にて決定された前記1つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記1つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記1つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
(h)前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の3次元構造体に対応した情報を利用し、段階(g)にてデータベース内に蓄積された前記1つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記1つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記1つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも1分類を決定し、
(i)相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記1つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも1つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
(j)他標的蛋白質のそれぞれについて段階(f)から(i)を実行する
段階を含む方法を提供する。
【0032】
また、本発明は、以下の段階を含む、本発明による3次元高分子原子構造体の汎ゲノム決定に関する工程も提供する。
【0033】
(1)本工程により決定された独占構造及びその他既知構造を含む全ての既知構造情報を体系的にユーザーに親しみやすいデータベースに組織化すること、及び情報が必要とされる時に追加構造、配列及び/又は機能情報を追加しデータベースを更新する段階、
(2)全既知遺伝子生成物を相同配列のファミリーに分類するバイオインフォマティクスの先進ツールを利用する段階、
(3)その様なファミリーのそれぞれについて並列的に、適当な代表的種からの幾つかのcDNAsを幾つかの発現システムに適した発現ベクター内に同時にクローニングする段階、
(4)発現に適した構築体をスクリーニングし、調製段階に進めるのに適したものをスクリーニングする段階、
(5)発現された蛋白質を調製し、精製し、そして特徴付けする段階、
(6)結晶化スクリーニングと並列的に精製蛋白質を結晶化する段階、
(7)好適な回折特性について成長した結晶を試験する段階、
(8)好適な結晶を凍結する段階、及びアンジュレータその他ビームラインを利用した高処理型の結晶学用に特に設計されたシンクロトロンストレージリングに多波長型異常回折法を用い回折データを測定する段階、
(9)多波長型異常回折位相法又はその他技術により回折データを分析し、原子モデルを構築し、そして回折データに対しモデルを精製する段階、
(10)他ファミリーメンバーからの配列情報内、及びその他既知3D構造体の内部にある精製モデルを分析し、活性部位及び高分子接触部位を特定することを目的として、機能的モチーフ(即ち空間的な、機能的に重要な残基の幾何学的配置)及び表面特性について分析する段階、
(11)関連構造体に関し、例えばGRASPプログラムの様な活性部位特性情報を用いて、結合能を持つと予測される化合物のクラスを特定する段階、
(12)相同モデル構築に適したコンピューターツールを利用し、相同体に関するモデルを構築する段階、
(13)標的選択、薬物設計、及び/又は実験的分析により適当な構築体の設計に関し相同モデルを用いる段階、
(14)バイオインフォマティクスツールの有効性を更に高めるために全既知構築体の集合を利用する段階。
【0034】
【発明の実施の形態】
本出願は、その内容が参照されここに取り込まれている1999年1月22日出願の米国連続番号09/235,986号の優先権を主張している。
【0035】
本発明は、それぞれが対応する蛋白質に関連している複数の3次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも1つのバイオインフォーマティクスツールと、
少なくとも1つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するX−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも1分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも1つのバイオインフォーマティクスツールを用いて更新されるシステムを提供する。
【0036】
また、本発明は結晶化手段によって好適であることが決定された標的蛋白質の複数の標本結晶の好適体を凍結するクリオ保護手段を備え、結晶化手段によって好適であると決定された標本結晶は、回折測定手段によって回折データが測定される前にクリオ保護手段により凍結されてもよい。
【0037】
蛋白質合成手段は、少なくとも一つのインフォマティクスツールにより決定された各ファミリーに対して並列的に、適切な代表ファミリーメンバーに対応するcDNAを、複数の発現システムに対する発現ベクターにクローニングするクローニング手段を有し、スクリーニング手段は、クローニング手段により得られた発現構造をスクリーニングして蛋白質として有効であるものを決定し、蛋白質処理手段はスクリーニング手段により有効であることが決定された発現蛋白質を処理してもよい。
【0038】
X線結晶学分析手段は、多波長異常回折法による高速処理型結晶学分析法に適した波状光線を有するシンクロトロンストレージリングを備えてもよく、分析手段は、多波長異常回折位相法により回折データを分析してもよい。
【0039】
蛋白質合成手段により合成された標的蛋白質内にセレノメチオニンが取り込まれていてもよく、多波長異常回折位相法を用いた分析手段はセレノメチオニル蛋白質に対応した回折データを分析してもよい。
【0040】
相同モデル構築ツールにより構築された相同モデルは、標的選択、薬剤設計および実験的分析により適した構築体の設計の少なくとも1つに使用されてもよい。
【0041】
また、本発明は、以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の3次元原子構造体を実験的に決定する方法であって、
(a)複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
(b)少なくとも1つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
(c)複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階(b)で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
(d)段階(c)にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
(e)複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階(d)にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
(f)段階(e)にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記1つの標的蛋白質について複数の標本結晶から好適体を決定し、
(g)段階(f)にて決定された前記1つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記1つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記1つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
(h)前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の3次元構造体に対応した情報を利用し、段階(g)にてデータベース内に蓄積された前記1つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記1つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記1つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも1分類を決定し、
(i)相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記1つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも1つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
(j)他標的蛋白質のそれぞれについて段階(f)から(i)を実行する
段階を含む方法を提供する。
【0042】
段階(f)にて好適であることが決定された一つの標的蛋白質の複数の標本結晶の好適な一つを凍結する工程を有し、好適であると決定された複数の標本結晶は、段階(g)で回折データが測定される前に凍結されてもよい。
【0043】
また、段階(c)は、段階(b)にて決定された各ファミリーについて、適当な代表的ファミリーメンバーに対応するcDNAを並列的に複数の発現システムに適した複数の発現ベクターにクローニングする工程を有ししてもよく、クローニングにより得られた構造は、蛋白質として有効である一つを決定するために発現がスクリーニングされ、有効であると決定された発現蛋白質は段階(d)で処理されてもよい。
【0044】
階(g)に於ける高処理結晶学分析は、多波長異常位相法とともに波状光線を有するシンクロトロンストレージリングを用いて実行されてもよく、段階(g)で測定された前記回折データは多波長異常回折位相法により分析されてもよい。
【0045】
段階(c)にて合成された複数の標的蛋白質内にセレノメチオニンが取り込まれてもよく、多波長異常回折位相法はセレノメチオニル蛋白質について測定された回折データを分析するのに用いられてもよい。
【0046】
実験分析に関する標的選択、薬物設計及びより適当な構築体の設計の少なくとも1つに段階(i)にて構築された相同モデルを利用する段階を更に備えてもよい。
【0047】
本発明は蛋白質機能を演繹するために構造情報を直接探索するためのツールを提供する。実験的に決定された構築体とホモロジーモデル化された構築体の両方の表面特性に関する詳細記述を含む総合的データベースが開発される。また、この情報は新規配列/構造/機能関連性を同定するのに利用される。蛋白質の3次元構造は、その正常機能がいかなるものであり、それがどの様にしてその生化学的作用を発揮し、そしてどの様な生物学的経路がそれに関連しているかについての洞察を得るために研究される。また、構造証明の蓄積は、機能に関する洞察をもたらす蛋白質表面上の特徴的パターン(静電性、曲率等)の示唆のために研究される。
【0048】
本発明の実施態様は、図1を参照しながら以下に説明される。
【0049】
本発明の第1部分は構造的ゲノミクスデータベースの開発である。データベース1aは既知の構造情報、配列情報及び機能情報を用いて構築される。データベース1aは利用者に分かり易い様式に体系的に組織化され、コンピューター使用初心者でさえ容易に利用できる様にするためのインターフェースを含む。
【0050】
3D構造が本発明の中心を構成するが、データベース自体はデータベースを通し利用可能な構造情報によってのみ可能となる方法で組織化され、そして分析される大量のデータを有する膨大な情報を含む。データベースはリンクしたデータベースと先進の分析ツールから成る完全型ゲノミクスデータベースシステムを構成する。データベース構造の一例では、利用可能な形で提供される構造情報を含む遺伝子及び生化学経路を関連づけるポインターにより、各遺伝子は1またはそれ以上のファミリーに関連付けされている。各遺伝子ファミリーに関し、情報は種を越えたファミリーメンバーのリスト、複数の配列及び構造アラインメント、進化樹、保存パターン及び活性部位残基、生化学経路との結び付き、及び利用可能な薬剤に関する医薬品アッセイ情報(結合データの様な)を有してもよい。注釈は、静電的特性、表面及びその他機能的に重要な領域の物理−化学的特性、ドメイン規定、進化パターン、機能的エピトープ、派生する医薬品体、及び最終的にスクリーニングされた小分子化合物の「仮想」ライブラリーを有していてもよい。データベースは情報項目及び項目間の関連性について持続的に更新されて動的特性を残す様に構築されてもよい。
【0051】
システム構成要素1はデータベース1a及びデータベース1aの更新を管理するコントローラ1bを含む。コントローラ1bはシステム内の他要素に管理情報も提供する。データベース1aは、その他ソースより得た情報と同様に本発明の工程及びシステムにより決定された専有構造を含む新たに獲得された構造、配列、機能情報を受け付けた時に更新される。
【0052】
三次元構造情報はアミノ酸配列分析に於ける最近の進歩と結びつけて活用され、データベースが構築されてもよい。先進のバイオインフォマティクスツール2は全ての既知遺伝子生成物を相同配列のファミリーにクラスター分けするのに使用される。クラスター化された遺伝子生成物は典型的には約30%の同一性で類似しており、誤差確率は<0.001である。代表メンバーの構造が各ファミリー及びそれぞれのファミリーについて決定される。蛋白質分類は独立したモジュールに対応する、又はしない全蛋白質、ドメイン又は配列を含むだろう。各ファミリーの、おそらく大部分を構成する未確定メンバーは以下示す様に、ファミリー代表の既知構造をベースとした相同モデル化により確認できるだろう。
【0053】
BLSAT及びその他ツールの様な配列分析プログラムが利用され得る。その他ツールは、(1)配列探索とファミリー同定の対話式サイクル、(2)ファミリー分析に基づくプロファイル検索、及び(3)ドメイン同定の様な方策を実装してもよい。これら他ツールは、遠い配列相同体の同定の促進に利用され得る。幾つかのバイオインフォマティクスツールは、構造情報を利用し大きく異なる配列を持つ蛋白質間の関連性を同定する折り畳み認識法を実行する。
【0054】
バイオインフォマティクスツール2は、実験、モデル化、データベース検索及び機器分析により得たゲノムや構造、そしてその他生物学に関するデータ及び情報的を分析するためのコンピューター処理技術を含むソフトウェアを作動させる1またはそれ以上のコンピューターシステムを有していてもよい。
【0055】
一度遺伝子生成物がファミリーに組織化されれば、結晶は(1)選択された標的の分子クローニング、(2)蛋白質発現、(3)生化学的精製、及び(4)結晶化を含む一連の段階を利用し、生産される。
【0056】
構成要素3は適当な代表種の情報を利用し、そのようなそれぞれのファミリーについて並列的に要素蛋白質を同時合成するのに利用される。例えば、蛋白質合成ユニット3は代表種由来の幾つかのcDNAsを、幾つかの発現システムにクローニングするのに利用し得る。3ないし6種類のcDNAsがクローニング目的に選択され、1ないし4種類の発現システムが利用され得る。大腸菌、バキュロウイルス感染昆虫細胞、ショウジョウバエ、ビチア酵母、及びチャイニーズハムスター卵巣細胞を含む各種発現システムが確立されている。細胞質及び分泌システムの両方が、アフィニティータグを用いてあるいは用いられずに適当に利用され得る。その速度及び経済性より、大腸菌での発現が強調されており、それは封入体からの尿素抽出及び巻き戻しを含む。また、大腸菌発現は、セレノメチオニン取り込みの容易さに関して遊離であり、それは生成物発現の開始に当たって日常的に利用され得る。クローニング及び発現段階を含む自動化は、可能な限りにおいて導入され得る。
【0057】
代替的には、蛋白質合成ユニット3は、あるいはポリペプチドの化学合成とそれに続く原蛋白質への巻き戻しを実施してもよい。別の想定しうる代替法は、インビトロ翻訳又は蛋白質が合成できるその他方法による合成であろう。
【0058】
次にシステム構成要素4はクローニングの結果得た構築体について、発現に関しスクリーニングするのに利用できる。構成要素4は、調製段階に進むことができる構築体を決定する。可能であれば、結晶は自家用装置でスクリーニングされる。
【0059】
構成要素4により同定された発現蛋白質は装置5を用いて調製され、精製され、そして特徴付けられる。しばしば、多波長型異常回折(MAD)位相法による構造決定に用いられたセレノメチオニル類似体を出発材料として調製発現が準備される。各蛋白質は類縁タグにより精製でき、大きさ、配列確実性、可溶性、均一性及び単分散性について特徴付けられる。精製機能は、1段階又は多段階により達成されるだろう。例えば、従来技術によるクロマトグラフィー及び電気泳動精製が用いられる。特徴付け作業は、超遠心分離、核磁気共鳴分光法、マススペクトロスコピー、及び動的光散乱法を含む数多くの既知技術の何れかを利用して実施されるだろう。
【0060】
装置5は、それぞれが1またはそれ以上の調製、精製、及び特徴付け作業を実行する1又はそれ以上の物理的ユニットを具備している。調製、精製及び特徴付け段階でのデータはコントローラ1bに送られ、コントローラ1bは装置5にコントロール情報を供給する。
【0061】
装置5により処理された精製蛋白質は結晶化装置6に供給される。精製蛋白質は、結晶化装置6で結晶体がスクリーニングするのに対して並列的に結晶化するように設定される。次に、成長した結晶は所定の回折特性について試験され、結晶が回折測定に関し好適であるかが決定される。結晶化はロボット化により作られる蒸気拡散装置内の要因配置実験を利用してもよい。
【0062】
結晶化装置6により好適であると決定された結晶は、凍結保護装置7に供給され、凍結される。装置7は典型的にはフラッシュ凍結を利用する。しかしながら、他のクリオ保護技術も利用できるだろう。
【0063】
凍結結晶は凍結保護装置7から取り出され、X線結晶学装置8に供給される。装置8は高処理型結晶学に合わせ特に設計されたアンジュレータビームラインを利用するシンクロトロンストレージリングを含む。適当な大きさの適当な電子検出器が使用される。検出器は2k×2k型電荷結合素子(CCD)アレイでよい。CMOSのようなピクセルアレー、又はその他先進の検出器も代替器として利用できるだろう。
【0064】
結晶構造体の分析は(1)結晶特徴付け、(2)回折測定、(3)位相決定、(4)密度マップの解釈、及び(5)構造の精製を含む、一連の段階を有する。分析の進め方は、発現及びシンクロトロンの部分と密接に一体化しており、標準物質としてのセレノメチオニンの取り込み、及び小凍結結晶に対するMAD位相合わせを含む。大部分のデータはシンクロトロン装置にて測定されるが、実行可能であれば(分子置換構造体の場合の様に)、自家用装置も利用できるだろう。標準的及び特別に開発されたコンピュータープログラムをPCのシステム及びワークステーションコンピュータに利用することができ、好ましくは情報をグラフィカルに表示する。
【0065】
結晶に関する回折データは、MAD法により装置8を利用し測定される。典型的には、この場合セレノメチオニル蛋白質からのSeの特性が探索されるが、複数のその他重原子についても利用できる。代替的に又はMAD実験と組合せ、分析は多異種同体置換(MIR)法を含んでもよい。次に装置8を用い、回折データはMAD位相化法又はその他技術により分析され、原子モデルが構築され、さらにモデルは回折データに対し精製される。精密化したモデルはデータベース1a内に記憶される。
【0066】
装置8は高処理型高分子結晶学に最適化された装置である。装置は2つのアンジュレータビームラインと1つのベンディングマグネットビームラインをAPSの1セクターにて実行可能な様に含んでもよく、当業者の能力範囲内の適当な設計に該当する。典型的にはビームラインは、シンクロトロンに関する構築費用の一部を回収することを目的として、ビームラインの一部が別の研究者に供給される様な条件で作動する。典型的な実験は、第2世代ソースでは3日間を要するが、APSの様な第3世代ソースでは数時間のみである。ブルックヘブンにあるNSLSの様な施設に比べて10倍程度高い処理能力でありながら、装置8を利用し年間当たり400以上の新規の専有構造体が生成され、この数は現在の全世界に於ける産生速度に匹敵するものであり、真の新たな結果の生成の2倍以上である。
【0067】
APSの能力の持つ4つの観点が、それを施設としての有用なモデルにしている。第1に、高処理であることが優先されるため、現在典型的な蛋白質結晶の場合にも、通常のベンディングマグネットに比べAPSアンジュレータからのフラックス自体が大きく強化されていることが重要である。更に、アンジュレータ放射が明るいことは、その他方法では扱い難いサンプルから構造を解明する上で必須である。輝度はエネルギー分解能、空間分解能及び角度分解能をもたらす。MAD位相化に関するシグナルは、その最適化に関して高エネルギー分解能(2eV未満)を必要とする極めて短い寿命を持つことが多い電子項遷移に依存している。現状ではこれが達成されることは稀であるが、APSアンジュレータからの偏差が本質的に小さいことは狭バンド幅モノクロメーターに良好に適合する。全アンジュレータ出力を極めて小さい点、例えば50から100ミクロンの点に集める能力により、微小結晶(20ミクロン以下)からの回折を実行可能にする。より大きなサイズまで成長させるより小さな結晶を得ることの方がより容易であることが多く、そしてより小さい結晶はより完全且つ容易に凍結することができる。幾つかの分子は、500Å以上のセルエッジを持つ様な大型ユニットセルに結晶化される。この場合も、ビームの開きが小さいことは大きな利点であり、一般に検出器表面での空間解像度を改善し、ほぼあらゆる問題に関しデータの正確性を高める。
【0068】
挿入装置(ID)及び1APSセクターのベンディングマグネット(BM)ビームラインが利用され得る。BMビームラインは結晶を特性付けと、強い回折を示す結晶に関するデータ収集を行うための単一ステーションを有してもよい。IDビームラインは、前後に配置され、独立に回転可能なアンジュレータを装備した2カ所の実験ステーションを有してもよい。末端のステーションはAPSのセクター19に、構造生物学センター共同アクセスチームビームラインのものと同様の光学装置を持ち、サイドステーションは欧州シンクロトロン放射線施設にあるTROIKA及びQUADRIGAビームラインに設置されている様なダイヤモンド結晶技術を利用し得る。
【0069】
MAD実験は約3.5から35keVの範囲のX線受容範囲にある広範な吸収遷移状態について実施され得る。これはカルシウムからキセノン(Z=20−54)に至るKエッジ、カドミウムからウラニウムまで(Z=48−92)のLエッジ、そして例外的に強力なウラニウムのMエッジまでを含んでいる。ID及びステーション、そしてBMビームラインがこの完全な実験範囲を可能にしなければならない。完全範囲の端部にある実験はより困難であるが、しかし今日までに鉄(7.1keV)KエッジからウラニウムLIII−エッジ(16.7keV)までの範囲でほとんど全てのMAD応用が成功している。他の仕様に束縛される中で、ビームライン光学はこの様な実験について最適化され得る。
【0070】
ダイヤモンド結晶サイドステーションの幾何学により、受容可能なエネルギースパンを必然的に拘束する。しかしながら10ないし14keVの拘束範囲は、重要なSe及びBrのK−エッジ、そして原子番号74から83(W、Re、Os、Ir、Pt、Au、Hg、Tl、Pb、Bi)の重金属に関するLIII−エッジを含む中心的な応用に適用している。このスパンに関する放射を最適化するために、3.3cm周期装置のそれよりもこの範囲を通してより高い第1調和強度を生成するより短い周期のアンジュレータ装置が用いられるべきである。MAD実験はアンジュレータギャップの調製を必要とし、ダイヤモンドモノクロメーターは下流スペクトラムからの選択的放射を除くため、同一吸収エッジでの同時実験に対してスケジューリング拘束が組み込まれるだろう。もちろんベンディングマグネットラインは常に独立して運転できる。
【0071】
ビームライン光学及び実験用装置は、小型結晶に関するMAD位相合わせのサポートに於ける迅速且つ正確な回折実験について最適化されていなければならない。従って、ビームは典型的には100ミクロン以下の範囲の錯乱状態に焦点合わせされる。アンジュレータからのビーム分散は本質的には小さい。モノクロメーター結晶は、高エネルギー解像度をもたらす様に選択すべきである。検出器は迅速に読み出しできるものでなければならない。CCD、CMOSの様なピクセルアレイ、又はその他先進検出装置が利用され得る。
【0072】
サンプル冷却も考慮し、幾つかの実験では必要であろう。ビームがサンプル健全性に関し過剰出力であるいかなる場合でも、輝度を得るような方法で出力が下げられる。従って、アッテネーターフィルターに代わりビームの中心部を選択する装置及び微小なバンドパスを持つモノクロメーターを利用すべきである。
【0073】
次に、成分9がデータベース1aからの他情報と共に精製されたモデルを引き受け、他のファミリーメンバーの配列情報及び他の既知3D構造に関する情報を利用しながら、引き受けたモデルを分析する。また、分析装置9は、活性部位及び高分子接触部位を特定することを目的として静電位、疎水性、曲率、変動性といった表面特性について、GRASPの様なプログラムを用い精製モデルを分析する。関連構造体に関し、成分9は活性部位の特性に関する情報を利用して、結合能を有すると推測される化合物の分類を規定する。分類規定はデータベース1aに送られ、保存される。
【0074】
相同モデル構築用のコンピューターツール10は相同性に関するモデル開発に利用される。1ファミリメンバーの原子モデルがデータベース1aから引き出され、他の有用なファミリーメンバーのモデルの予測に利用される。配列類似性が十分に高い場合(例えば同一率50%)、相同モデル化法により優れたモデルが構築できる。例えば、ポリペプチド折り畳みの一般的特性は、類似性が中程度(同一率約30%)の場合でもモデル化できる。
【0075】
この様な原子モデルは、例えば医薬品、農業、及びバイオテクノロジーに有用である。相同モデルはヒト相同体の実験的分析により好適である構築体を設計するのにも利用され得る。従って、例えばヒトのコレステロール合成に関わる酵素は、適当な原子モデルが利用可能であることを条件として、心臓血管治療薬の構造ベースの設計の対象になるだろう。例え細菌由来の関連分子の構造さえ、初期作業の指標としては有用であろう。構造データベースの利点を利用し構築されたモデルは、二次構造予測といったモデル化技術の基礎として利用できるだろう。他の構成要素と同様に、相同モデル構築ツールも典型的にはシステム内の他機能に関し利用できる、あるいは利用できないパーソナルコンピューター、又はワークステーション上で利用できるソフトウェアを含む。
【0076】
最終目標は全ての主要な発現ファミリーを表す蛋白質及びRNA分子に関する3D原子モデルを得ることである。代表的なサブファミリーの構造、特定の医薬品標的、及び重要な相同モデルも含まれ得る。初期段階として、バイオインフォマティクスを利用し結晶化の対象を選択し、そして既知3D構造に由来するパイロットデータベースの構築を支援することができるだろう。しかし、データベースは常に変更を行い、新規データおよび新規方法が利用可能になる度に更新されるだろう。バイオインフォマティクスの構成要素は発現及び結晶化の標的を選択し、結果をデータベースに組み立てる。シンクロトロン施設は、結晶化に関する蛋白質の発現と回折結果の分析に関する並列的作業をシンクロトロンに協調させながら利用される。
【0077】
以下の段階を含む本発明の好適工程では、図2に示す様に段階は連続的に繰り返され総合的な構造ゲノミクスデータベースを構築する。段階101では、蛋白質配列はファミリーとサブファミリーに組織化されるが、これは結晶化の標的の優先付けを行うために最初に必要とされる。次に、段階102では、各配列ファミリーは構造の観点より特徴付けられる。段階103では、相同モデルが構築される。段階104では、蛋白質表面、活性部位、機能領域等が詳細に特徴付けられる。段階105では、折り畳み認識及びその他配列分析法の開発と検証が続けられる。段階106では、生物学的経路、機能的注釈及び小数の分子を含む他データベースへのリンクが作られる。
【0078】
工程の全ての段階に於いて、ロボット及びその他自動化を含む並列的技術が利用され得る。主題材料はモニターされ、各段階で記帳され、そしてこの種の工程管理データを用い操作は最適化され得る。進行しない主題に関し維持された記録は、次の作業が実行される様な実験の再開に利用され得る。
【0079】
データベースは、例えばバイオテクノロジー、農業、医薬品産業に関し大きな商業的価値を持っている。構造情報は様々に利用されるだろう。構造体又は関連ファミリーメンバーの幾つかは薬剤の標的にされやすく、その目的に直接利用され得る。構造体はまた、例えばキナーゼやヘリカルサイトカインの様な医薬品として大きな利点を持つ蛋白質に対する初期段階での絞り込みを行いながら、遺伝子ファミリー内の詳細な構造範囲を並列的に提供する一方で可能な限り多くの遺伝子ファミリーの特徴を持つ構造体の提供に利用され得る。より広範なファミリー内の範囲により、より正確な相同モデルの構築が可能になる。別の重要な蛋白質ファミリーはG蛋白質結合受容体のファミリーである。これら膜蛋白質はまだ結晶化されていないが、世界中の研究室でこの問題に関し多大な努力が払われており、この数年以内に新たな進展が報告されると予想されている。もしそうなった場合には、本発明は重要な医薬品標的である、多数のこれら蛋白質の構造を直ちに解明するためのツールを提供するだろう。
【0080】
組織化された情報システムは、新規薬物標的とそれらの基本的注釈に関するデータベースの効率的検索を可能にする。図3に示す様に、実施態様の一つでは、使用者は分子名、遺伝子ファミリー名、蛋白質ファミリー又は蛋白質名、代謝経路名、又は特定配列といった検索子を入力することで、データベースにアクセスし検索することができる。好適なアクセスルートは部分的な及び完全長の配列であろう。医薬品企業の典型的科学者は、例えば外部ソースから得た問題の配列リスト上にある、あらゆる利用可能な情報に迅速かつ簡単にアクセスできるだろう。データベースは、この様な解析の最新のタイプの結果を含むことから、配列決定に関する自前の専門家に関する必要性を軽減する。より重要なことは、データベースが、多数の3D構造体、幾つかの未公表3D構造体を含み、そして探索するということであり、これは利用者に標的同定工程に関し大きな競争力を提供するだろう。
【0081】
第2の応用は構造ベースの薬物設計である。3次元構造情報は関心を持つ標的に結合する、又はそれを模擬するペプチド及び小分子の特性を規定するのに利用し得る。この様な記述子を次に利用して小分子データベースを検索し、コンビナトリアルライブラリーでの利用に適した制限を確定し得る。標的同定の場合同様、構造情報は実験的試験を含むフィードバックループに利用され得る。
【0082】
データベースと医薬品及びバイオテクノロジー企業で利用可能なスクリーニングデータ及び小分子データとの結合により、遺伝子配列(即ちチップ技術に由来する)、蛋白質構造及び化学ライブラリーを特定する実験を持続的に相互作用させることができる。薬物発見工程へのインパクトは多大なものであろう。
【0083】
発明の実施態様を詳細に記述したが、発明は実施態様に正確であるものに限定されるものではなく、添付のクレームに引用された発明の概念の精神又は範囲から逸脱することなく、その各種変更及び改良が当業者により実施可能であるものと理解すべきである。例えば、単純化を目的とし上記は蛋白質についてのみ記述されているが、本原理がRNAにも応用可能であることは当業者にとって明らかであり、そして当業者は過度の実験なしに実施態様に対する変更及び改良を行い、RNAに関する本発明を実施することができる。
【0084】
以下の公開物の開示はその全体は、本発明が属する分野の状態をより完全に記述するために参照され本明細書に取り込まれている。
【0085】
W.A.Hendrickson、J.R.Horton及びD.M.LeMasterによる“Selenomethionyl Proteins Produced for Analysis by Multicavelength Anomalous Diffraction (MAD): A vehicle for Direct Determination of Three−Dimensional Structure,”EMBO J., 9:1665−1672(1990)
W.Yang、W.A.Hendrickson、R.J.Crouch及びY.Satowによる“Structure of Ribonuclease H Phased at 2 Å Resolution by MAD Analysys of the selenomethionyl Protein,”Science, 249:1398−1405(1990)
W.A.Hendricksonによる“Determination of Macromoleculer
Structures from Anomalous Diffraction of Synchrotron Radiation,”Science, 254:51−58(1991)
K.C.Smith、B.Honigによる“Evaluation of the Conformational
Free Energies of Loop in Proteins,”Proteins, 18:119−32(1994)
B.Honig、A.Nichollsによる“Classical Electrostatics in Biology and Chemistry”Science, 268:1144−49(1995)
L.Shapiro、A.M.Fannon、P.D.Kwong、A.Thompson、M.S.Lehmann、G.Grubel、J.F.Legrand、J.Als−Nielsen、D.R.Colman、W.A.Hendricksonによる“Structural Basis of Cell−Cell Adhesion by Cadherins”Nature, 374:327−37(1995)
N.Ben−Tal、A.Ben−Shaul、A.Nicholls、B.Honigによる“Free−energy Determinants of Alpha−helix Insertion into Lipid Bilayers,”Biophys J, 70:1803−12(1996)
N.Froloff、A.Windemuth、B.Honigによる“On the Calculation of Binding Free Energies Using Continum Methods: Application to Mhc Class I Protein−peptide Interactions,”Proteins Sci, 6:1293−301(1997)
W.A.Hendrickson及びC.M.Hendricksonによる“Phase Determination by the Method of Multiwavelength Anomalous Diffraction (MAD),”Methods in Enzymology, 276:494−523(1997)
B.Honigによる“New Challenges in Computational Biochemistry,”Pac Symp Biocomput, 21−24(1997)
C.D.Lima、K.L.D’Amico、I.Naday、G.Rosenbaum、E.M.Westbrook、W.A.Hendricksonによる“MAD Analysis of FHIT, a Putative Human Tumor Suppressor from the HIT Protein Family,”Structure, 5:763−74(1997)
L.Shapiro及びC.D.Limaによる“The Argonne Structural Gemonics Workshop: Lamaze Class for the Birth of a New Science,”Structure, 6:265−67(1998)
W.A.Hendrickson、H.Wu、J.L.Smith、W.I.Weisなどによる“MADSYS, a Computer Systems for Phase Evaluation from Measurements of Multiwavelength Anomalous Diffraction,”
以下に示すコンピュータプログラムは、本発明に関連する技術の状態をより詳細に説明するためにこの出願に参考のためにここに組み込まれる。
【0086】
前述のGRASPプログラムに関する情報は、以下のWEBアドレスで得られる“http://honiglab.cpmc.Columbia.edu/grasp/”。このGRASPプログラムはコロンビア大学からライセンスされ得る。コロンビア大学からのGRASPのライセンスに関する情報は以下のWEBアドレスから得られる“http://honiglab.cpmc.Columbia.edu/grasp/G_academic.html”。
【0087】
MADSYSソフトウェアに関する情報は及びMADSYSのコピーを得る方法に関する情報は、以下のWEBアドレスで得られる“http://convex.hhmi.Columbia.edu/hendw/madsys/madsys.html”。
【図面の簡単な説明】
【図1】
図1は本発明のシステムの1実施態様のブロック図。
【図2】
図2は本発明の工程を示す図。
【図3】
図3は構造ゲノミクスデータベースの利用を例示する図。
【従来の技術】
(発明の背景)
遺伝子分析及びゲノム配列決定プロジェクトの最近の進歩は、全ての生命体の基本的普遍性に関する揺るがぬ証拠を提供している。例えば、大部分の人間の遺伝子は例えばマウス、虫や時に微生物さえにも相同性を有することが示されている。更に、個々の生物体の多くの蛋白質が互いに関連している。C.elegans中には100,000以上のヒト遺伝子と19,000以上の蛋白質をコードしている遺伝子が存在しているが、地球上の全生命体中に存在する別種蛋白質は10,000の位であると信じられている。実際の数は類似性の粒度のレベルに依存する。
【0002】
現在多くの微生物、及び1種類の多細胞生物、線虫であるC.elegansについて全遺伝子配列が知られている。更に、ヒトゲノム配列決定プロジェクトもかなり進行している。幾つかのベンチャー企業がほぼ全てのヒト遺伝子のコード領域の配列を決定した。機能的ゲノミクスに関わる学究的施設及びベンチャー企業は、遺伝子生成物の機能を解き明かすことを目的に遺伝子発現のパターンのマッピングを進行中である。
【0003】
数年前まで科学者は全ゲノムの配列決定について論争していた。しかし非寄生性生物の全ゲノムが初めて4年間で配列決定されて以来、ゲノミクス、即ち全ゲノムの配列決定に基づく学問は、基礎生物学及び医学に於ける多くの最も重要な疑問に対するアプローチを大きく変えた。配列決定に基づくゲノミクスは、ゲノムを越え、及び種を越えて膨大な蛋白質の組合せを分類することを可能にした。ゲノムレベルのDNA配列研究にて進行中の配列決定は、生物学に対する価値ある洞察と大きな商業化の機会を提供する。しかし、新規蛋白質分子が実際に生物学的作用に影響する存在であって初めてより大きな洞察、及び商業化の機会が遺伝子生成物より得ることができるのである。原子レベルでの構造決定は遙かに遅れているが、しかし蓄積された結果により折り畳みのパターンに反復性があること、そして多くの蛋白質がモジュラー構造体を持つことが明らかにされた。蛋白質は構造及び機能のファミリーに分類される。推測は極めて広範囲であるが、特有の折り畳みの数は恐らく数千に過ぎないだろう。現在、これらの内僅か数百のものしか知られていない。未知構造体を分析するための体系的且つ迅速な方法が商業化されており、科学的な価値を持っている。
【0004】
ゲノム配列情報は確かに有益であるが、それは1次元のものに過ぎず、従って限界を持っている。直線状の配列データに基づくゲノミクスの持つ、生物学的分子が持つ3次元の普遍性を理解する上での価値は限定的である。直線配列は、それらに対応する3次元(3D)構造に降り畳まれときにのみ生物学的に活性であり、医薬品、除草剤またはその他バイオテクノロジー製品の対象物になる。現在構造情報とゲノム情報との統合は殆どない。従って、一般にはゲノムに起因する標的同定には構造は影響しない。
【0005】
生化学的及び細胞学的プロセスを理解することは、蛋白質及びその他生物高分子の3次元分子構造の知識によって大きく進歩する。3次元構造情報は、例えばゲノム情報が標的同定に利用され、そしてコンビナトリアル化学がその発見に影響する薬物設計にとって重要な構成要素である。薬物研究者は、結合阻害剤が利用できる場合には標的の構造を経験的に決定し、構造情報を利用して新規化合物を合成してきた。代替的には、薬物研究者は既知阻害剤の構造特性、又はそれ自体の結合部位の構造特性を利用して、結合をもたらす所定の大きさ、形状及び化学的ならびに物理的特性を持つ新規薬物の候補に関して、化学データベースを検索する。
【0006】
現在に至るまで、標的同定及び発見につながるコンビナトリアル化学へのゲノミクスの利用が構造による影響を本式に受けることはなかった。しかし、特定の場合に、構造に関する知識が標的認識及び推測、薬物アッセイ及びスクリーニング、先行化合物の選択、及びコンビナトリアルライブラリーの設計に利用できることは既知であるため、これらを利用することをゲノミクスと統合する構造情報の総合的なデータベースが利用可能であれば構造志向型のアプローチの役割が増すと考えられている。通常技術を使用した構造決定は、それ自体有益であるが配列決定に比べよりコストがかかるという欠点を持っている。
【0007】
配列決定ベースのゲノミクス及び通常構造決定技術の持つこれら制限は、構造ゲノミクスの新規科学によって取り除かれるだろう。構造ゲノミクスは、配列ゲノミクスがゲノムの直線情報内容に付加するパノラマ的理解同種の構造生物学の科学も提供する。構造ゲノミクスはヒトゲノムによりコードされると考えられている約100,000種類の発現蛋白質(’プロテオーム’と呼ばれる)を含む総合的な構造データベースを必要とすることが示唆されている。これら構造の全てを解明することは超人的な作業であるが、作業の達成により我々は例えばバクテリア、酵母、古生物や植物の蛋白質についてより多く知ることができるであろう。配列ゲノミクスにより詳細に示されているように、構造体の総合データベースには多くの利用がある。
【0008】
構造ゲノミクスより獲得される情報は、従来の構造生物学により提供される情報と根本的に異なる特性を有しており、予想外の生物学的関連性への本質的な洞察、及び特定の生物学的問題の対象となる蛋白質モチーフまたは折り畳みに関する理解を提供し、これにより我々は伝統的な詳細な構造研究を実行する能力を更に高めることができる。
【0009】
構造生物学者は伝統的に、分子作用体の構造的理解により最も良く解答できると思われる生物学的機能上重要な問題を表す問題に目を向けている。このことは単に構造決定だけでなく特定の機能問題についても詳細な解析を必要とする。構造ゲノミクスはこの様な活動にとって重要なツールとなるだろう。コンピューターによる構造予測の正確性は総合的分類データベースの実現により改善され、これらアプローチが実行的であること、そして実際に実験的構造決定にとって代わることが示唆されている。
【0010】
ゲノム配列決定の進歩に加え、結晶学の様な構造決定に関する技術、バイオインフォマティクスの様な配列及び構造分析に関する技術も進歩している。この様な進歩を急激に進んでいる遺伝子配列情報と組み合わせることで、薬物発見の様な商業応用を含む生物学に関する構造的な基礎の総合的研究に適したツールがもたらされる。
【0011】
バイオインフォマティクスとは、実験、モデル化、データベース検索及び機器研究により得た生物学情報及びデータを解析することを目的に、コンピューターシステムとコンピューター応用解決技術を利用する学問である。バイオインフォマティクスは、ゲノムデータ及び構造データの体系的分析を目的とした新規のコンピューター利用法の使用を含む。BLASTの様な広く使用されている配列分析プログラムに加え、最近は新世代の“先進”ツールも利用され初めている。これらツールの利用によって、かすかな別種相同体の特定に大きな進歩がもたらされた。しかし、配列分析法は、同様の機能を持つ多くの蛋白質に明瞭な配列同一性がないという基本的な制約を受ける。
【0012】
3次元構造情報はこの問題に対する最終解決を提供する。類似アミノ酸配列を持つ蛋白質は必ず類似の3D構造と関連する生物学的機能を持つ。更に、通常の比較方法でそれら配列が無関係な場合でさえ、蛋白質構造はしばしば似ている。「畳み込み認識」法は構造情報を用いて、蛋白質と異なる配列との相関性を同定する。これら方法は、構造パラダイムのデータベースが散在的に構成されているため、一部で成功しているに過ぎない。
【0013】
各ファミリー及び全てのファミリーの代表メンバーの構造決定は、幾つかのレベルで全発現蛋白質の包括的概観を提供し得る。蛋白質ファミリーは独立モジュールに対応する、あるいは対応しないであろう全ての蛋白質、ドメイン又は配列モチーフを含み得る。利用可能な全ての蛋白質ファミリーを用いることで、例えば必須膜蛋白質を最終的に大規模構造決定し得る。ファミリーベースの構造データベースは、蛋白質の作用を決定するためのデータを提供し、それにより、もちろん構造決定をもたらさない例外的ファミリーもあるが、自然状態に於ける蛋白質の折り畳みに対する理解を改善するための貴重な資源を提供する。データベースはまた構造解析を通し新しい機能上の洞察に光を当てるための情報も提供する。
【0014】
配列ゲノミクスに於ける特徴的配列モチーフの認識による蛋白質キナーゼ同定と同様にして、構造ゲノミクスは配列ベースの方法に比べ強力である3次元構造中の相同性検証により同目的を達成し得る。従って、構造ゲノミクスの有望な産物は、配列単独をベースでは同定不可能な「予想外」の構造的相同性、そしてある場合には機能的相同性を特定することであろう。構造ゲノミクスのこの機能は従来の仮説誘導的方法を使った場合には決定することができなかった、あるいは少なくとも極めて難しかった生物学的経路内での予想外の繋がりを推測し得る。
【0015】
ファミリー代表の既知構造に基づく相同モデル化により、恐らく大部分を構成するであろう各ファミリー中の未解決メンバーが視覚化され得る。相同モデル化により、1ファミリーメンバーに由来する3D構造を利用することで、その他ファミリーメンバーに関する有用なモデルを推測することができる。比較的大きな構造データベースの支援を受け構築されたこれらモデルは、通常の技術を利用して達成されたものに比べ良好であり、そして二次構造予測の様なモデル化技術にとっての基礎を提供する。
【0016】
X−線結晶学は蛋白質の様な生物学的高分子の分子レベルの3D構造を作るための技術である。結晶により回折されるX線の強度は正確に測定することができ、そして回折強度の3Dパターンは3D分子像に変換される。3Åおよびそれ以上の解析に対応するパターンについては、原子の位置はÅの数十分の一の正確さをもって結合長の分画内に規定される。ウイルスまたはリボソームの様な巨大高分子集合体の結晶のX線回折パターンでさえ同様にして分析できる。核磁気共鳴分光法や電子顕微鏡の様な他技術も代替的に構造決定に利用できるだろう。しかし、これらその他方法はX線結晶学にて利用可能な大きな潜在能力は示していない。
【0017】
X線法は一般に配列決定法に比べ時間がかかる。3D構造決定はゲノム配列決定に比べ遙かに遅れている。しかし、X線結晶学の装置及び方法の最近の進歩は構造決定の速度を劇的に促進する機会を提供している。過去数年間に成熟し、シンクロトロン放射源に最も大きなインパクトを求め、得ている新規の発展には、(1)アンジュレータ挿入装置、(2)電荷結合素子(CCD)検出器、(3)結晶の凍結保護法、(4)多波長型異常回折(MAD)位相法、そして(5)セレノメチオニル蛋白質がある。これら最近の技術進歩は大規模な構造決定作業に適した結晶学装置を進歩させる。
【0018】
アンジュレータは驚異的な輝度を持つ、X線のレーザー様光線を生ずる第3世代型シンクロトロン内の磁気列である。新世代シンクロトロン放射源は迅速な結晶学構造決定を可能にする。アルゴンナショナルラボラトリー(Argone National Laboratory)のアドバンスフォトンソース(APS)の有焦点アンジュレータビームラインはそれ自体のベンディングマグネットビームライン又はブルックヘブンにある国立シンクロトロンライトソース(NSLS)の様な第2世代光源のそれに比べ、100倍以上のフラックスを有している。使用される電子検出器はこのフラックスに適合できるものでなければならない。適当な大きさを持つ適当なCCD検出器が昨年利用できるようになった。例えば2K×2KのCCDアレイが多くの販社より入手できる様になった。
【0019】
フラッシュ凍結法による凍結保護は放射による損傷から結晶を保護する。凍結溶媒への移動に関する方法、この数年でようやく完成されたに過ぎない。アンジュレータを利用する微小結晶(10−50ミクロン断面)には凍結保護が必須である。結晶凍結はX線実験の応用性の拡大、大量のデータコピー量を必要とするMADについて、その拡大にインパクトを与えた。最高の毛細管はりつけ結晶についてのみしか有効なデータを得られなかった様な非常に不良な結晶でも、現在では実験の適用範囲内にある。
【0020】
構造決定を大きく簡素化するMAD法による位相評価は1994年に実現された。MADはシンクロトロン放射を必要とし、アンジュレータの優れたエネルギー分解能を必要とする。セレノメチオニンを組換え体蛋白質内に体系的に取り込ませる方法が日常化したことで、結晶構造の解析方法が変化した。セレノメチノニル蛋白質のMAD位相法は、今後構造ゲノミクスの構造決定法の主流になることだろう。セレノメチオニル蛋白質は大部分の組換え体発現システムにて容易に発現でき、同型誘導体に関ししばしば困難である研究ステージを不要にする。
【0021】
アンジュレータビームラインはMAD実験に適したネルギー解像度を持つ非常に明るいX線を提供する。最新世代のCCD検出器と組合せることで、構造解析に必要な全データを提供する単独MAD実験をこれまで通常であった数日間ではなく、数時間、あるいは1時間の分画からさえ得ることができるだろう。
【0022】
ごく最近のその他進歩は、構造ゲノミクスを更に現実的なものにしている。その第1は、上記の如く配列ベースゲノミクスである。これは蛋白質の配列のゲノム内又はゲノム間の知的分類を提供し、それにより目標候補のリストを作る手段を提供している。
【0023】
これら蛋白質を発現させるためには、容易にできるものをまず実施すべきであるとされている。例えば、細菌内での発現に注目した細菌ファミリーメンバーが存在する場合で且つ例えば好熱性の蛋白質が大腸菌に発現できる場合には、通常組換え体細胞抽出物を煮沸することで実質的精製は達成できる。同定可能な細菌相同体がない蛋白質分類は細菌発現システムを試すこともできるが、最終的には真核細胞システムが必要であろう。この「簡単にできることを最初に」という方法では、その配列から解析可能と思われる比較的小さな蛋白質にまず応用されるだろう。多ドメイン型蛋白質や単一膜貫通型蛋白質の場合には、分析的な配列ベース法を適用し、続いて発現試験、限定蛋白質溶解及びマススペクトロメトリー試験を適用してドメインを規定すべきであるという新しい意見がある。統合膜蛋白質については、結晶化に関するより良い方法、又はNMR分光分析法による構造決定が可能とする進歩を待つことになるだろう。
【0024】
ファミリーをベースとした方法は、古典的な方法に対し、蛋白質が困難な対象であることが証明されれば、我々はより証明が簡単である同じファミリーの別のメンバーに交換することができるという大きな利点を提供する。複数のファミリーメンバーについて、少なくとも発現及び結晶化段階を通し同時並行して研究を進め、次に容易に作業できるものに限り続けることも提案されている。並列的な研究は、構造決定法の持続的な技術的進歩と合わせ研究時間の大幅な短縮に関し楽観するに足る根拠を提供している。
【0025】
多くの部分に関し、構造ゲノミクスはまだ計画段階にある。一部構造ゲノミクスから学び取れるものが不明であり、そして3次元構造が配列ベースの知識以上に大きな進歩をもたらすかについて不明であるという意見もある。その他、総合的構造データベースが他のツールと統合され、新しい洞察をどの様に提供できるのかについても未知である。
【0026】
【課題を解決するための手段】
本発明の目的は、全生命体を代表する構造の総合的分析のためのシステム及び工程を提供することである。
【0027】
本発明の別の目的は、全生命体の全ての主要蛋白質ファミリーを表す原子レベルの構造パラダイムを高効率に生成するためのシステム及び工程を提供することである。
【0028】
本発明の別の目的は、コンビナトリアル法の応用性を拡大するためのゲノミクスにより構造の利用を統合する構造情報の総合的データベースを生成するためのシステム及び工程を提供することである。
【0029】
本発明の更に別の目的は、各ファミリー内の詳細な構造情報を提供しながら、可能な限り多くの遺伝子ファミリーを広範にカバーするゲノミクスを利用した構造体の利用を統合する構造情報の総合的データベースを生成するためのシステム及び工程を提供することである。データベースは詳細な表面特性、保存パターン及び活性部位を利用した機能的洞察も提供する。分子名、遺伝子ファミリー名、蛋白質ファミリー又は蛋白質名、代謝経路又は特定の配列を指定することで情報にアクセスしてもよい。3D構造、全ての関連蛋白質及び他データベースとのリンクを含む所望分子に関連した全ての情報がこのデータベースから得られてもよい。この蓄積情報は、標的同定及び評価、発見の指針、薬物アッセイの設計、スクリーニング及びコンビナトリアルライブラリーを含む多くの方法で利用され得る。
【0030】
本発明は、それぞれが対応する蛋白質に関連している複数の3次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも1つのバイオインフォーマティクスツールと、
少なくとも1つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するX−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも1分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも1つのバイオインフォーマティクスツールを用いて更新されるシステムを提供する。
【0031】
また、本発明は、以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の3次元原子構造体を実験的に決定する方法であって、
(a)複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
(b)少なくとも1つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
(c)複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階(b)で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
(d)段階(c)にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
(e)複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階(d)にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
(f)段階(e)にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記1つの標的蛋白質について複数の標本結晶から好適体を決定し、
(g)段階(f)にて決定された前記1つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記1つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記1つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
(h)前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の3次元構造体に対応した情報を利用し、段階(g)にてデータベース内に蓄積された前記1つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記1つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記1つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも1分類を決定し、
(i)相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記1つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも1つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
(j)他標的蛋白質のそれぞれについて段階(f)から(i)を実行する
段階を含む方法を提供する。
【0032】
また、本発明は、以下の段階を含む、本発明による3次元高分子原子構造体の汎ゲノム決定に関する工程も提供する。
【0033】
(1)本工程により決定された独占構造及びその他既知構造を含む全ての既知構造情報を体系的にユーザーに親しみやすいデータベースに組織化すること、及び情報が必要とされる時に追加構造、配列及び/又は機能情報を追加しデータベースを更新する段階、
(2)全既知遺伝子生成物を相同配列のファミリーに分類するバイオインフォマティクスの先進ツールを利用する段階、
(3)その様なファミリーのそれぞれについて並列的に、適当な代表的種からの幾つかのcDNAsを幾つかの発現システムに適した発現ベクター内に同時にクローニングする段階、
(4)発現に適した構築体をスクリーニングし、調製段階に進めるのに適したものをスクリーニングする段階、
(5)発現された蛋白質を調製し、精製し、そして特徴付けする段階、
(6)結晶化スクリーニングと並列的に精製蛋白質を結晶化する段階、
(7)好適な回折特性について成長した結晶を試験する段階、
(8)好適な結晶を凍結する段階、及びアンジュレータその他ビームラインを利用した高処理型の結晶学用に特に設計されたシンクロトロンストレージリングに多波長型異常回折法を用い回折データを測定する段階、
(9)多波長型異常回折位相法又はその他技術により回折データを分析し、原子モデルを構築し、そして回折データに対しモデルを精製する段階、
(10)他ファミリーメンバーからの配列情報内、及びその他既知3D構造体の内部にある精製モデルを分析し、活性部位及び高分子接触部位を特定することを目的として、機能的モチーフ(即ち空間的な、機能的に重要な残基の幾何学的配置)及び表面特性について分析する段階、
(11)関連構造体に関し、例えばGRASPプログラムの様な活性部位特性情報を用いて、結合能を持つと予測される化合物のクラスを特定する段階、
(12)相同モデル構築に適したコンピューターツールを利用し、相同体に関するモデルを構築する段階、
(13)標的選択、薬物設計、及び/又は実験的分析により適当な構築体の設計に関し相同モデルを用いる段階、
(14)バイオインフォマティクスツールの有効性を更に高めるために全既知構築体の集合を利用する段階。
【0034】
【発明の実施の形態】
本出願は、その内容が参照されここに取り込まれている1999年1月22日出願の米国連続番号09/235,986号の優先権を主張している。
【0035】
本発明は、それぞれが対応する蛋白質に関連している複数の3次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも1つのバイオインフォーマティクスツールと、
少なくとも1つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するX−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも1分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも1つのバイオインフォーマティクスツールを用いて更新されるシステムを提供する。
【0036】
また、本発明は結晶化手段によって好適であることが決定された標的蛋白質の複数の標本結晶の好適体を凍結するクリオ保護手段を備え、結晶化手段によって好適であると決定された標本結晶は、回折測定手段によって回折データが測定される前にクリオ保護手段により凍結されてもよい。
【0037】
蛋白質合成手段は、少なくとも一つのインフォマティクスツールにより決定された各ファミリーに対して並列的に、適切な代表ファミリーメンバーに対応するcDNAを、複数の発現システムに対する発現ベクターにクローニングするクローニング手段を有し、スクリーニング手段は、クローニング手段により得られた発現構造をスクリーニングして蛋白質として有効であるものを決定し、蛋白質処理手段はスクリーニング手段により有効であることが決定された発現蛋白質を処理してもよい。
【0038】
X線結晶学分析手段は、多波長異常回折法による高速処理型結晶学分析法に適した波状光線を有するシンクロトロンストレージリングを備えてもよく、分析手段は、多波長異常回折位相法により回折データを分析してもよい。
【0039】
蛋白質合成手段により合成された標的蛋白質内にセレノメチオニンが取り込まれていてもよく、多波長異常回折位相法を用いた分析手段はセレノメチオニル蛋白質に対応した回折データを分析してもよい。
【0040】
相同モデル構築ツールにより構築された相同モデルは、標的選択、薬剤設計および実験的分析により適した構築体の設計の少なくとも1つに使用されてもよい。
【0041】
また、本発明は、以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の3次元原子構造体を実験的に決定する方法であって、
(a)複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
(b)少なくとも1つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
(c)複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階(b)で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
(d)段階(c)にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
(e)複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階(d)にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
(f)段階(e)にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記1つの標的蛋白質について複数の標本結晶から好適体を決定し、
(g)段階(f)にて決定された前記1つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記1つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記1つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
(h)前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の3次元構造体に対応した情報を利用し、段階(g)にてデータベース内に蓄積された前記1つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記1つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記1つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも1分類を決定し、
(i)相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記1つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも1つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
(j)他標的蛋白質のそれぞれについて段階(f)から(i)を実行する
段階を含む方法を提供する。
【0042】
段階(f)にて好適であることが決定された一つの標的蛋白質の複数の標本結晶の好適な一つを凍結する工程を有し、好適であると決定された複数の標本結晶は、段階(g)で回折データが測定される前に凍結されてもよい。
【0043】
また、段階(c)は、段階(b)にて決定された各ファミリーについて、適当な代表的ファミリーメンバーに対応するcDNAを並列的に複数の発現システムに適した複数の発現ベクターにクローニングする工程を有ししてもよく、クローニングにより得られた構造は、蛋白質として有効である一つを決定するために発現がスクリーニングされ、有効であると決定された発現蛋白質は段階(d)で処理されてもよい。
【0044】
階(g)に於ける高処理結晶学分析は、多波長異常位相法とともに波状光線を有するシンクロトロンストレージリングを用いて実行されてもよく、段階(g)で測定された前記回折データは多波長異常回折位相法により分析されてもよい。
【0045】
段階(c)にて合成された複数の標的蛋白質内にセレノメチオニンが取り込まれてもよく、多波長異常回折位相法はセレノメチオニル蛋白質について測定された回折データを分析するのに用いられてもよい。
【0046】
実験分析に関する標的選択、薬物設計及びより適当な構築体の設計の少なくとも1つに段階(i)にて構築された相同モデルを利用する段階を更に備えてもよい。
【0047】
本発明は蛋白質機能を演繹するために構造情報を直接探索するためのツールを提供する。実験的に決定された構築体とホモロジーモデル化された構築体の両方の表面特性に関する詳細記述を含む総合的データベースが開発される。また、この情報は新規配列/構造/機能関連性を同定するのに利用される。蛋白質の3次元構造は、その正常機能がいかなるものであり、それがどの様にしてその生化学的作用を発揮し、そしてどの様な生物学的経路がそれに関連しているかについての洞察を得るために研究される。また、構造証明の蓄積は、機能に関する洞察をもたらす蛋白質表面上の特徴的パターン(静電性、曲率等)の示唆のために研究される。
【0048】
本発明の実施態様は、図1を参照しながら以下に説明される。
【0049】
本発明の第1部分は構造的ゲノミクスデータベースの開発である。データベース1aは既知の構造情報、配列情報及び機能情報を用いて構築される。データベース1aは利用者に分かり易い様式に体系的に組織化され、コンピューター使用初心者でさえ容易に利用できる様にするためのインターフェースを含む。
【0050】
3D構造が本発明の中心を構成するが、データベース自体はデータベースを通し利用可能な構造情報によってのみ可能となる方法で組織化され、そして分析される大量のデータを有する膨大な情報を含む。データベースはリンクしたデータベースと先進の分析ツールから成る完全型ゲノミクスデータベースシステムを構成する。データベース構造の一例では、利用可能な形で提供される構造情報を含む遺伝子及び生化学経路を関連づけるポインターにより、各遺伝子は1またはそれ以上のファミリーに関連付けされている。各遺伝子ファミリーに関し、情報は種を越えたファミリーメンバーのリスト、複数の配列及び構造アラインメント、進化樹、保存パターン及び活性部位残基、生化学経路との結び付き、及び利用可能な薬剤に関する医薬品アッセイ情報(結合データの様な)を有してもよい。注釈は、静電的特性、表面及びその他機能的に重要な領域の物理−化学的特性、ドメイン規定、進化パターン、機能的エピトープ、派生する医薬品体、及び最終的にスクリーニングされた小分子化合物の「仮想」ライブラリーを有していてもよい。データベースは情報項目及び項目間の関連性について持続的に更新されて動的特性を残す様に構築されてもよい。
【0051】
システム構成要素1はデータベース1a及びデータベース1aの更新を管理するコントローラ1bを含む。コントローラ1bはシステム内の他要素に管理情報も提供する。データベース1aは、その他ソースより得た情報と同様に本発明の工程及びシステムにより決定された専有構造を含む新たに獲得された構造、配列、機能情報を受け付けた時に更新される。
【0052】
三次元構造情報はアミノ酸配列分析に於ける最近の進歩と結びつけて活用され、データベースが構築されてもよい。先進のバイオインフォマティクスツール2は全ての既知遺伝子生成物を相同配列のファミリーにクラスター分けするのに使用される。クラスター化された遺伝子生成物は典型的には約30%の同一性で類似しており、誤差確率は<0.001である。代表メンバーの構造が各ファミリー及びそれぞれのファミリーについて決定される。蛋白質分類は独立したモジュールに対応する、又はしない全蛋白質、ドメイン又は配列を含むだろう。各ファミリーの、おそらく大部分を構成する未確定メンバーは以下示す様に、ファミリー代表の既知構造をベースとした相同モデル化により確認できるだろう。
【0053】
BLSAT及びその他ツールの様な配列分析プログラムが利用され得る。その他ツールは、(1)配列探索とファミリー同定の対話式サイクル、(2)ファミリー分析に基づくプロファイル検索、及び(3)ドメイン同定の様な方策を実装してもよい。これら他ツールは、遠い配列相同体の同定の促進に利用され得る。幾つかのバイオインフォマティクスツールは、構造情報を利用し大きく異なる配列を持つ蛋白質間の関連性を同定する折り畳み認識法を実行する。
【0054】
バイオインフォマティクスツール2は、実験、モデル化、データベース検索及び機器分析により得たゲノムや構造、そしてその他生物学に関するデータ及び情報的を分析するためのコンピューター処理技術を含むソフトウェアを作動させる1またはそれ以上のコンピューターシステムを有していてもよい。
【0055】
一度遺伝子生成物がファミリーに組織化されれば、結晶は(1)選択された標的の分子クローニング、(2)蛋白質発現、(3)生化学的精製、及び(4)結晶化を含む一連の段階を利用し、生産される。
【0056】
構成要素3は適当な代表種の情報を利用し、そのようなそれぞれのファミリーについて並列的に要素蛋白質を同時合成するのに利用される。例えば、蛋白質合成ユニット3は代表種由来の幾つかのcDNAsを、幾つかの発現システムにクローニングするのに利用し得る。3ないし6種類のcDNAsがクローニング目的に選択され、1ないし4種類の発現システムが利用され得る。大腸菌、バキュロウイルス感染昆虫細胞、ショウジョウバエ、ビチア酵母、及びチャイニーズハムスター卵巣細胞を含む各種発現システムが確立されている。細胞質及び分泌システムの両方が、アフィニティータグを用いてあるいは用いられずに適当に利用され得る。その速度及び経済性より、大腸菌での発現が強調されており、それは封入体からの尿素抽出及び巻き戻しを含む。また、大腸菌発現は、セレノメチオニン取り込みの容易さに関して遊離であり、それは生成物発現の開始に当たって日常的に利用され得る。クローニング及び発現段階を含む自動化は、可能な限りにおいて導入され得る。
【0057】
代替的には、蛋白質合成ユニット3は、あるいはポリペプチドの化学合成とそれに続く原蛋白質への巻き戻しを実施してもよい。別の想定しうる代替法は、インビトロ翻訳又は蛋白質が合成できるその他方法による合成であろう。
【0058】
次にシステム構成要素4はクローニングの結果得た構築体について、発現に関しスクリーニングするのに利用できる。構成要素4は、調製段階に進むことができる構築体を決定する。可能であれば、結晶は自家用装置でスクリーニングされる。
【0059】
構成要素4により同定された発現蛋白質は装置5を用いて調製され、精製され、そして特徴付けられる。しばしば、多波長型異常回折(MAD)位相法による構造決定に用いられたセレノメチオニル類似体を出発材料として調製発現が準備される。各蛋白質は類縁タグにより精製でき、大きさ、配列確実性、可溶性、均一性及び単分散性について特徴付けられる。精製機能は、1段階又は多段階により達成されるだろう。例えば、従来技術によるクロマトグラフィー及び電気泳動精製が用いられる。特徴付け作業は、超遠心分離、核磁気共鳴分光法、マススペクトロスコピー、及び動的光散乱法を含む数多くの既知技術の何れかを利用して実施されるだろう。
【0060】
装置5は、それぞれが1またはそれ以上の調製、精製、及び特徴付け作業を実行する1又はそれ以上の物理的ユニットを具備している。調製、精製及び特徴付け段階でのデータはコントローラ1bに送られ、コントローラ1bは装置5にコントロール情報を供給する。
【0061】
装置5により処理された精製蛋白質は結晶化装置6に供給される。精製蛋白質は、結晶化装置6で結晶体がスクリーニングするのに対して並列的に結晶化するように設定される。次に、成長した結晶は所定の回折特性について試験され、結晶が回折測定に関し好適であるかが決定される。結晶化はロボット化により作られる蒸気拡散装置内の要因配置実験を利用してもよい。
【0062】
結晶化装置6により好適であると決定された結晶は、凍結保護装置7に供給され、凍結される。装置7は典型的にはフラッシュ凍結を利用する。しかしながら、他のクリオ保護技術も利用できるだろう。
【0063】
凍結結晶は凍結保護装置7から取り出され、X線結晶学装置8に供給される。装置8は高処理型結晶学に合わせ特に設計されたアンジュレータビームラインを利用するシンクロトロンストレージリングを含む。適当な大きさの適当な電子検出器が使用される。検出器は2k×2k型電荷結合素子(CCD)アレイでよい。CMOSのようなピクセルアレー、又はその他先進の検出器も代替器として利用できるだろう。
【0064】
結晶構造体の分析は(1)結晶特徴付け、(2)回折測定、(3)位相決定、(4)密度マップの解釈、及び(5)構造の精製を含む、一連の段階を有する。分析の進め方は、発現及びシンクロトロンの部分と密接に一体化しており、標準物質としてのセレノメチオニンの取り込み、及び小凍結結晶に対するMAD位相合わせを含む。大部分のデータはシンクロトロン装置にて測定されるが、実行可能であれば(分子置換構造体の場合の様に)、自家用装置も利用できるだろう。標準的及び特別に開発されたコンピュータープログラムをPCのシステム及びワークステーションコンピュータに利用することができ、好ましくは情報をグラフィカルに表示する。
【0065】
結晶に関する回折データは、MAD法により装置8を利用し測定される。典型的には、この場合セレノメチオニル蛋白質からのSeの特性が探索されるが、複数のその他重原子についても利用できる。代替的に又はMAD実験と組合せ、分析は多異種同体置換(MIR)法を含んでもよい。次に装置8を用い、回折データはMAD位相化法又はその他技術により分析され、原子モデルが構築され、さらにモデルは回折データに対し精製される。精密化したモデルはデータベース1a内に記憶される。
【0066】
装置8は高処理型高分子結晶学に最適化された装置である。装置は2つのアンジュレータビームラインと1つのベンディングマグネットビームラインをAPSの1セクターにて実行可能な様に含んでもよく、当業者の能力範囲内の適当な設計に該当する。典型的にはビームラインは、シンクロトロンに関する構築費用の一部を回収することを目的として、ビームラインの一部が別の研究者に供給される様な条件で作動する。典型的な実験は、第2世代ソースでは3日間を要するが、APSの様な第3世代ソースでは数時間のみである。ブルックヘブンにあるNSLSの様な施設に比べて10倍程度高い処理能力でありながら、装置8を利用し年間当たり400以上の新規の専有構造体が生成され、この数は現在の全世界に於ける産生速度に匹敵するものであり、真の新たな結果の生成の2倍以上である。
【0067】
APSの能力の持つ4つの観点が、それを施設としての有用なモデルにしている。第1に、高処理であることが優先されるため、現在典型的な蛋白質結晶の場合にも、通常のベンディングマグネットに比べAPSアンジュレータからのフラックス自体が大きく強化されていることが重要である。更に、アンジュレータ放射が明るいことは、その他方法では扱い難いサンプルから構造を解明する上で必須である。輝度はエネルギー分解能、空間分解能及び角度分解能をもたらす。MAD位相化に関するシグナルは、その最適化に関して高エネルギー分解能(2eV未満)を必要とする極めて短い寿命を持つことが多い電子項遷移に依存している。現状ではこれが達成されることは稀であるが、APSアンジュレータからの偏差が本質的に小さいことは狭バンド幅モノクロメーターに良好に適合する。全アンジュレータ出力を極めて小さい点、例えば50から100ミクロンの点に集める能力により、微小結晶(20ミクロン以下)からの回折を実行可能にする。より大きなサイズまで成長させるより小さな結晶を得ることの方がより容易であることが多く、そしてより小さい結晶はより完全且つ容易に凍結することができる。幾つかの分子は、500Å以上のセルエッジを持つ様な大型ユニットセルに結晶化される。この場合も、ビームの開きが小さいことは大きな利点であり、一般に検出器表面での空間解像度を改善し、ほぼあらゆる問題に関しデータの正確性を高める。
【0068】
挿入装置(ID)及び1APSセクターのベンディングマグネット(BM)ビームラインが利用され得る。BMビームラインは結晶を特性付けと、強い回折を示す結晶に関するデータ収集を行うための単一ステーションを有してもよい。IDビームラインは、前後に配置され、独立に回転可能なアンジュレータを装備した2カ所の実験ステーションを有してもよい。末端のステーションはAPSのセクター19に、構造生物学センター共同アクセスチームビームラインのものと同様の光学装置を持ち、サイドステーションは欧州シンクロトロン放射線施設にあるTROIKA及びQUADRIGAビームラインに設置されている様なダイヤモンド結晶技術を利用し得る。
【0069】
MAD実験は約3.5から35keVの範囲のX線受容範囲にある広範な吸収遷移状態について実施され得る。これはカルシウムからキセノン(Z=20−54)に至るKエッジ、カドミウムからウラニウムまで(Z=48−92)のLエッジ、そして例外的に強力なウラニウムのMエッジまでを含んでいる。ID及びステーション、そしてBMビームラインがこの完全な実験範囲を可能にしなければならない。完全範囲の端部にある実験はより困難であるが、しかし今日までに鉄(7.1keV)KエッジからウラニウムLIII−エッジ(16.7keV)までの範囲でほとんど全てのMAD応用が成功している。他の仕様に束縛される中で、ビームライン光学はこの様な実験について最適化され得る。
【0070】
ダイヤモンド結晶サイドステーションの幾何学により、受容可能なエネルギースパンを必然的に拘束する。しかしながら10ないし14keVの拘束範囲は、重要なSe及びBrのK−エッジ、そして原子番号74から83(W、Re、Os、Ir、Pt、Au、Hg、Tl、Pb、Bi)の重金属に関するLIII−エッジを含む中心的な応用に適用している。このスパンに関する放射を最適化するために、3.3cm周期装置のそれよりもこの範囲を通してより高い第1調和強度を生成するより短い周期のアンジュレータ装置が用いられるべきである。MAD実験はアンジュレータギャップの調製を必要とし、ダイヤモンドモノクロメーターは下流スペクトラムからの選択的放射を除くため、同一吸収エッジでの同時実験に対してスケジューリング拘束が組み込まれるだろう。もちろんベンディングマグネットラインは常に独立して運転できる。
【0071】
ビームライン光学及び実験用装置は、小型結晶に関するMAD位相合わせのサポートに於ける迅速且つ正確な回折実験について最適化されていなければならない。従って、ビームは典型的には100ミクロン以下の範囲の錯乱状態に焦点合わせされる。アンジュレータからのビーム分散は本質的には小さい。モノクロメーター結晶は、高エネルギー解像度をもたらす様に選択すべきである。検出器は迅速に読み出しできるものでなければならない。CCD、CMOSの様なピクセルアレイ、又はその他先進検出装置が利用され得る。
【0072】
サンプル冷却も考慮し、幾つかの実験では必要であろう。ビームがサンプル健全性に関し過剰出力であるいかなる場合でも、輝度を得るような方法で出力が下げられる。従って、アッテネーターフィルターに代わりビームの中心部を選択する装置及び微小なバンドパスを持つモノクロメーターを利用すべきである。
【0073】
次に、成分9がデータベース1aからの他情報と共に精製されたモデルを引き受け、他のファミリーメンバーの配列情報及び他の既知3D構造に関する情報を利用しながら、引き受けたモデルを分析する。また、分析装置9は、活性部位及び高分子接触部位を特定することを目的として静電位、疎水性、曲率、変動性といった表面特性について、GRASPの様なプログラムを用い精製モデルを分析する。関連構造体に関し、成分9は活性部位の特性に関する情報を利用して、結合能を有すると推測される化合物の分類を規定する。分類規定はデータベース1aに送られ、保存される。
【0074】
相同モデル構築用のコンピューターツール10は相同性に関するモデル開発に利用される。1ファミリメンバーの原子モデルがデータベース1aから引き出され、他の有用なファミリーメンバーのモデルの予測に利用される。配列類似性が十分に高い場合(例えば同一率50%)、相同モデル化法により優れたモデルが構築できる。例えば、ポリペプチド折り畳みの一般的特性は、類似性が中程度(同一率約30%)の場合でもモデル化できる。
【0075】
この様な原子モデルは、例えば医薬品、農業、及びバイオテクノロジーに有用である。相同モデルはヒト相同体の実験的分析により好適である構築体を設計するのにも利用され得る。従って、例えばヒトのコレステロール合成に関わる酵素は、適当な原子モデルが利用可能であることを条件として、心臓血管治療薬の構造ベースの設計の対象になるだろう。例え細菌由来の関連分子の構造さえ、初期作業の指標としては有用であろう。構造データベースの利点を利用し構築されたモデルは、二次構造予測といったモデル化技術の基礎として利用できるだろう。他の構成要素と同様に、相同モデル構築ツールも典型的にはシステム内の他機能に関し利用できる、あるいは利用できないパーソナルコンピューター、又はワークステーション上で利用できるソフトウェアを含む。
【0076】
最終目標は全ての主要な発現ファミリーを表す蛋白質及びRNA分子に関する3D原子モデルを得ることである。代表的なサブファミリーの構造、特定の医薬品標的、及び重要な相同モデルも含まれ得る。初期段階として、バイオインフォマティクスを利用し結晶化の対象を選択し、そして既知3D構造に由来するパイロットデータベースの構築を支援することができるだろう。しかし、データベースは常に変更を行い、新規データおよび新規方法が利用可能になる度に更新されるだろう。バイオインフォマティクスの構成要素は発現及び結晶化の標的を選択し、結果をデータベースに組み立てる。シンクロトロン施設は、結晶化に関する蛋白質の発現と回折結果の分析に関する並列的作業をシンクロトロンに協調させながら利用される。
【0077】
以下の段階を含む本発明の好適工程では、図2に示す様に段階は連続的に繰り返され総合的な構造ゲノミクスデータベースを構築する。段階101では、蛋白質配列はファミリーとサブファミリーに組織化されるが、これは結晶化の標的の優先付けを行うために最初に必要とされる。次に、段階102では、各配列ファミリーは構造の観点より特徴付けられる。段階103では、相同モデルが構築される。段階104では、蛋白質表面、活性部位、機能領域等が詳細に特徴付けられる。段階105では、折り畳み認識及びその他配列分析法の開発と検証が続けられる。段階106では、生物学的経路、機能的注釈及び小数の分子を含む他データベースへのリンクが作られる。
【0078】
工程の全ての段階に於いて、ロボット及びその他自動化を含む並列的技術が利用され得る。主題材料はモニターされ、各段階で記帳され、そしてこの種の工程管理データを用い操作は最適化され得る。進行しない主題に関し維持された記録は、次の作業が実行される様な実験の再開に利用され得る。
【0079】
データベースは、例えばバイオテクノロジー、農業、医薬品産業に関し大きな商業的価値を持っている。構造情報は様々に利用されるだろう。構造体又は関連ファミリーメンバーの幾つかは薬剤の標的にされやすく、その目的に直接利用され得る。構造体はまた、例えばキナーゼやヘリカルサイトカインの様な医薬品として大きな利点を持つ蛋白質に対する初期段階での絞り込みを行いながら、遺伝子ファミリー内の詳細な構造範囲を並列的に提供する一方で可能な限り多くの遺伝子ファミリーの特徴を持つ構造体の提供に利用され得る。より広範なファミリー内の範囲により、より正確な相同モデルの構築が可能になる。別の重要な蛋白質ファミリーはG蛋白質結合受容体のファミリーである。これら膜蛋白質はまだ結晶化されていないが、世界中の研究室でこの問題に関し多大な努力が払われており、この数年以内に新たな進展が報告されると予想されている。もしそうなった場合には、本発明は重要な医薬品標的である、多数のこれら蛋白質の構造を直ちに解明するためのツールを提供するだろう。
【0080】
組織化された情報システムは、新規薬物標的とそれらの基本的注釈に関するデータベースの効率的検索を可能にする。図3に示す様に、実施態様の一つでは、使用者は分子名、遺伝子ファミリー名、蛋白質ファミリー又は蛋白質名、代謝経路名、又は特定配列といった検索子を入力することで、データベースにアクセスし検索することができる。好適なアクセスルートは部分的な及び完全長の配列であろう。医薬品企業の典型的科学者は、例えば外部ソースから得た問題の配列リスト上にある、あらゆる利用可能な情報に迅速かつ簡単にアクセスできるだろう。データベースは、この様な解析の最新のタイプの結果を含むことから、配列決定に関する自前の専門家に関する必要性を軽減する。より重要なことは、データベースが、多数の3D構造体、幾つかの未公表3D構造体を含み、そして探索するということであり、これは利用者に標的同定工程に関し大きな競争力を提供するだろう。
【0081】
第2の応用は構造ベースの薬物設計である。3次元構造情報は関心を持つ標的に結合する、又はそれを模擬するペプチド及び小分子の特性を規定するのに利用し得る。この様な記述子を次に利用して小分子データベースを検索し、コンビナトリアルライブラリーでの利用に適した制限を確定し得る。標的同定の場合同様、構造情報は実験的試験を含むフィードバックループに利用され得る。
【0082】
データベースと医薬品及びバイオテクノロジー企業で利用可能なスクリーニングデータ及び小分子データとの結合により、遺伝子配列(即ちチップ技術に由来する)、蛋白質構造及び化学ライブラリーを特定する実験を持続的に相互作用させることができる。薬物発見工程へのインパクトは多大なものであろう。
【0083】
発明の実施態様を詳細に記述したが、発明は実施態様に正確であるものに限定されるものではなく、添付のクレームに引用された発明の概念の精神又は範囲から逸脱することなく、その各種変更及び改良が当業者により実施可能であるものと理解すべきである。例えば、単純化を目的とし上記は蛋白質についてのみ記述されているが、本原理がRNAにも応用可能であることは当業者にとって明らかであり、そして当業者は過度の実験なしに実施態様に対する変更及び改良を行い、RNAに関する本発明を実施することができる。
【0084】
以下の公開物の開示はその全体は、本発明が属する分野の状態をより完全に記述するために参照され本明細書に取り込まれている。
【0085】
W.A.Hendrickson、J.R.Horton及びD.M.LeMasterによる“Selenomethionyl Proteins Produced for Analysis by Multicavelength Anomalous Diffraction (MAD): A vehicle for Direct Determination of Three−Dimensional Structure,”EMBO J., 9:1665−1672(1990)
W.Yang、W.A.Hendrickson、R.J.Crouch及びY.Satowによる“Structure of Ribonuclease H Phased at 2 Å Resolution by MAD Analysys of the selenomethionyl Protein,”Science, 249:1398−1405(1990)
W.A.Hendricksonによる“Determination of Macromoleculer
Structures from Anomalous Diffraction of Synchrotron Radiation,”Science, 254:51−58(1991)
K.C.Smith、B.Honigによる“Evaluation of the Conformational
Free Energies of Loop in Proteins,”Proteins, 18:119−32(1994)
B.Honig、A.Nichollsによる“Classical Electrostatics in Biology and Chemistry”Science, 268:1144−49(1995)
L.Shapiro、A.M.Fannon、P.D.Kwong、A.Thompson、M.S.Lehmann、G.Grubel、J.F.Legrand、J.Als−Nielsen、D.R.Colman、W.A.Hendricksonによる“Structural Basis of Cell−Cell Adhesion by Cadherins”Nature, 374:327−37(1995)
N.Ben−Tal、A.Ben−Shaul、A.Nicholls、B.Honigによる“Free−energy Determinants of Alpha−helix Insertion into Lipid Bilayers,”Biophys J, 70:1803−12(1996)
N.Froloff、A.Windemuth、B.Honigによる“On the Calculation of Binding Free Energies Using Continum Methods: Application to Mhc Class I Protein−peptide Interactions,”Proteins Sci, 6:1293−301(1997)
W.A.Hendrickson及びC.M.Hendricksonによる“Phase Determination by the Method of Multiwavelength Anomalous Diffraction (MAD),”Methods in Enzymology, 276:494−523(1997)
B.Honigによる“New Challenges in Computational Biochemistry,”Pac Symp Biocomput, 21−24(1997)
C.D.Lima、K.L.D’Amico、I.Naday、G.Rosenbaum、E.M.Westbrook、W.A.Hendricksonによる“MAD Analysis of FHIT, a Putative Human Tumor Suppressor from the HIT Protein Family,”Structure, 5:763−74(1997)
L.Shapiro及びC.D.Limaによる“The Argonne Structural Gemonics Workshop: Lamaze Class for the Birth of a New Science,”Structure, 6:265−67(1998)
W.A.Hendrickson、H.Wu、J.L.Smith、W.I.Weisなどによる“MADSYS, a Computer Systems for Phase Evaluation from Measurements of Multiwavelength Anomalous Diffraction,”
以下に示すコンピュータプログラムは、本発明に関連する技術の状態をより詳細に説明するためにこの出願に参考のためにここに組み込まれる。
【0086】
前述のGRASPプログラムに関する情報は、以下のWEBアドレスで得られる“http://honiglab.cpmc.Columbia.edu/grasp/”。このGRASPプログラムはコロンビア大学からライセンスされ得る。コロンビア大学からのGRASPのライセンスに関する情報は以下のWEBアドレスから得られる“http://honiglab.cpmc.Columbia.edu/grasp/G_academic.html”。
【0087】
MADSYSソフトウェアに関する情報は及びMADSYSのコピーを得る方法に関する情報は、以下のWEBアドレスで得られる“http://convex.hhmi.Columbia.edu/hendw/madsys/madsys.html”。
【図面の簡単な説明】
【図1】
図1は本発明のシステムの1実施態様のブロック図。
【図2】
図2は本発明の工程を示す図。
【図3】
図3は構造ゲノミクスデータベースの利用を例示する図。
Claims (12)
- それぞれが対応する蛋白質に関連している複数の3次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも1つのバイオインフォーマティクスツールと、
少なくとも1つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するX−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも1分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも1つのバイオインフォーマティクスツールを用いて更新される。 - 前記請求項1はさらに、
前記結晶化手段によって好適であることが決定された前記標的蛋白質の複数の標本結晶の好適体を凍結するクリオ保護手段を備え、
前記結晶化手段によって好適であると決定された前記標本結晶は、前記回折測定手段によって前記回折データが測定される前に前記クリオ保護手段により凍結されることを特徴とするシステム。 - 前記蛋白質合成手段は、前記少なくとも一つのインフォマティクスツールにより決定された各ファミリーに対して並列的に、前記適切な代表ファミリーメンバーに対応するcDNAを、複数の発現システムに対する発現ベクターにクローニングするクローニング手段を有し、
前記スクリーニング手段は、前記クローニング手段により得られた発現構造をスクリーニングして蛋白質として有効であるものを決定し、
前記蛋白質処理手段は前記スクリーニング手段により有効であることが決定された発現蛋白質を処理する、請求項1に記載のシステム。 - 前記X線結晶学分析手段は、多波長異常回折法による高速処理型結晶学分析法に適した波状光線を有するシンクロトロンストレージリングを備え、
前記分析手段は、多波長異常回折位相法により前記回折データを分析することを特徴とする請求項1によるシステム。 - 前記蛋白質合成手段により合成された標的蛋白質内にセレノメチオニンが取り込まれており、前記多波長異常回折位相法を用いた前記分析手段はセレノメチオニル蛋白質に対応した回折データを分析する、請求項4によるシステム。
- 前記相同モデル構築ツールにより構築された前記相同モデルは、標的選択、薬剤設計および実験的分析により適した構築体の設計の少なくとも1つに使用される、請求項1によるシステム。
- 以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の3次元原子構造体を実験的に決定する方法であって、
(a)複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
(b)少なくとも1つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
(c)複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階(b)で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
(d)段階(c)にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
(e)複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階(d)にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
(f)段階(e)にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記1つの標的蛋白質について複数の標本結晶から好適体を決定し、
(g)段階(f)にて決定された前記1つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記1つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記1つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
(h)前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の3次元構造体に対応した情報を利用し、段階(g)にてデータベース内に蓄積された前記1つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記1つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記1つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも1分類を決定し、
(i)相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記1つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも1つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
(j)他標的蛋白質のそれぞれについて段階(f)から(i)を実行する
方法。 - 前記請求項7はさらに、
段階(f)にて好適であることが決定された前記一つの標的蛋白質の前記複数の標本結晶の好適な一つを凍結する工程を有し、
好適であると決定された前記複数の標本結晶は、段階(g)で回折データが測定される前に凍結されることを特徴とする方法。 - 前記段階(c)は、
段階(b)にて決定された各ファミリーについて、適当な代表的ファミリーメンバーに対応するcDNAを並列的に複数の発現システムに適した複数の発現ベクターにクローニングする工程を有し、
前記クローニングにより得られた構造は、蛋白質として有効である一つを決定するために発現がスクリーニングされ、
有効であると決定された前記発現蛋白質は段階(d)で処理されることを特徴とする請求項7に記載の方法。 - 段階(g)に於ける高処理結晶学分析は、多波長異常位相法とともに波状光線を有するシンクロトロンストレージリングを用いて実行され、そして
段階(g)で測定された前記回折データは多波長異常回折位相法により分析されることを特徴とする請求項7に記載の方法。 - 段階(c)にて合成された複数の標的蛋白質内にセレノメチオニンが取り込まれ、前記多波長異常回折位相法はセレノメチオニル蛋白質について測定された回折データを分析するのに用いられることを特徴とする請求項10に記載の方法。
- 実験分析に関する標的選択、薬物設計及びより適当な構築体の設計の少なくとも1つに段階(i)にて構築された相同モデルを利用する段階を更に備えることを特徴とする請求項7に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/235,986 US20020107643A1 (en) | 1999-01-22 | 1999-01-22 | Process for pan-genomic determination of macromolecular atomic structures |
PCT/US2000/001600 WO2000043776A1 (en) | 1999-01-22 | 2000-01-21 | Process for pan-genomic determination of macromolecular atomic structures |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004500544A true JP2004500544A (ja) | 2004-01-08 |
Family
ID=22887670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000595146A Withdrawn JP2004500544A (ja) | 1999-01-22 | 2000-01-21 | 高分子原子構造の汎ゲノム決定方法 |
Country Status (8)
Country | Link |
---|---|
US (2) | US20020107643A1 (ja) |
EP (1) | EP1149288A4 (ja) |
JP (1) | JP2004500544A (ja) |
KR (1) | KR20010108116A (ja) |
AU (1) | AU777520B2 (ja) |
BR (1) | BR0007638A (ja) |
CA (1) | CA2359261A1 (ja) |
WO (1) | WO2000043776A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7214540B2 (en) * | 1999-04-06 | 2007-05-08 | Uab Research Foundation | Method for screening crystallization conditions in solution crystal growth |
ATE357656T1 (de) * | 1999-04-06 | 2007-04-15 | Univ Alabama Res Found | Vorrichtung zum screening von kristallisierungsbedingungen in lösungen zur kristallzüchtung |
US20030022383A1 (en) * | 1999-04-06 | 2003-01-30 | Uab Research Foundation | Method for screening crystallization conditions in solution crystal growth |
US7244396B2 (en) * | 1999-04-06 | 2007-07-17 | Uab Research Foundation | Method for preparation of microarrays for screening of crystal growth conditions |
US7247490B2 (en) * | 1999-04-06 | 2007-07-24 | Uab Research Foundation | Method for screening crystallization conditions in solution crystal growth |
US7250305B2 (en) * | 2001-07-30 | 2007-07-31 | Uab Research Foundation | Use of dye to distinguish salt and protein crystals under microcrystallization conditions |
US6630006B2 (en) * | 1999-06-18 | 2003-10-07 | The Regents Of The University Of California | Method for screening microcrystallizations for crystal formation |
US7670429B2 (en) * | 2001-04-05 | 2010-03-02 | The California Institute Of Technology | High throughput screening of crystallization of materials |
KR20030019681A (ko) * | 2001-08-29 | 2003-03-07 | 바이오인포메틱스 주식회사 | 웹 기반 프로테옴 분석 및 관리 시스템 및 그 방법 |
KR20030038911A (ko) * | 2001-11-07 | 2003-05-17 | (주)엔솔테크 | 디옥시리보핵산 염기서열정보의 통합 및 자동화 처리방법 |
KR100458609B1 (ko) * | 2001-12-13 | 2004-12-03 | 주식회사 엘지생명과학 | 단백질간 상호작용 예측 시스템 및 그 방법 |
US20070026528A1 (en) * | 2002-05-30 | 2007-02-01 | Delucas Lawrence J | Method for screening crystallization conditions in solution crystal growth |
WO2004005898A1 (en) * | 2002-07-10 | 2004-01-15 | Uab Research Foundation | Method for distinguishing between biomolecule and non-biomolecule crystals |
KR100470977B1 (ko) * | 2002-09-23 | 2005-03-10 | 학교법인 인하학원 | 대규모 단백질 상호작용 데이터의 효율적 시각화 기법 |
US20040210396A1 (en) * | 2003-03-28 | 2004-10-21 | Solutia Inc. | Methods and structure for automated active pharmaceuticals development |
KR100551954B1 (ko) * | 2003-12-04 | 2006-02-20 | 한국전자통신연구원 | 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2408292A (en) * | 1991-07-11 | 1993-02-11 | Regents Of The University Of California, The | A method to identify protein sequences that fold into a known three-dimensional structure |
US5873373A (en) * | 1996-12-13 | 1999-02-23 | Sc Direct, Inc. | Integrated wig having a wefting construction |
-
1999
- 1999-01-22 US US09/235,986 patent/US20020107643A1/en not_active Abandoned
-
2000
- 2000-01-21 WO PCT/US2000/001600 patent/WO2000043776A1/en active IP Right Grant
- 2000-01-21 KR KR1020017009184A patent/KR20010108116A/ko active IP Right Grant
- 2000-01-21 CA CA002359261A patent/CA2359261A1/en not_active Abandoned
- 2000-01-21 JP JP2000595146A patent/JP2004500544A/ja not_active Withdrawn
- 2000-01-21 AU AU33484/00A patent/AU777520B2/en not_active Ceased
- 2000-01-21 BR BR0007638-4A patent/BR0007638A/pt not_active IP Right Cessation
- 2000-01-21 EP EP00911615A patent/EP1149288A4/en not_active Withdrawn
-
2001
- 2001-07-20 US US09/911,100 patent/US20020022250A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20020107643A1 (en) | 2002-08-08 |
AU3348400A (en) | 2000-08-07 |
EP1149288A4 (en) | 2005-01-19 |
US20020022250A1 (en) | 2002-02-21 |
AU777520B2 (en) | 2004-10-21 |
WO2000043776A1 (en) | 2000-07-27 |
EP1149288A1 (en) | 2001-10-31 |
CA2359261A1 (en) | 2000-07-27 |
BR0007638A (pt) | 2002-04-09 |
KR20010108116A (ko) | 2001-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Morris et al. | Using autodock for ligand‐receptor docking | |
Christendat et al. | Structural proteomics: prospects for high throughput sample preparation | |
JP2004500544A (ja) | 高分子原子構造の汎ゲノム決定方法 | |
Sali et al. | From words to literature in structural proteomics | |
Brenner | A tour of structural genomics | |
Heinemann et al. | An integrated approach to structural genomics | |
JP2003529843A (ja) | 化学資源データベース | |
Lan et al. | Ontologies for proteomics: towards a systematic definition of structure and function that scales to the genome level | |
Linial et al. | Methodologies for target selection in structural genomics | |
Turcotte et al. | The effect of relational background knowledge on learning of protein three-dimensional fold signatures | |
Morozov et al. | Protein-protein docking using a tensor train black-box optimization method | |
Rahman et al. | An overview of protein-folding techniques: issues and perspectives | |
Carter | Inferring network interactions within a cell | |
Čechová et al. | Comparison of three nature inspired molecular docking algorithms | |
Reddy et al. | Homology modeling studies of human genome receptor using modeller, Swiss-model server and esypred-3D tools | |
KR100456627B1 (ko) | 3차원 구조기반의 거대분자의 기능 예측 시스템 및 그 방법 | |
US20030023392A1 (en) | Process for pan-genomic determination of macromolecular atomic structures | |
Roche et al. | Predicting protein structures and structural annotation of proteomes | |
Launay et al. | Modeling protein complexes and molecular assemblies using computational methods | |
Chakraborti et al. | SBDD and Its Challenges | |
Yan et al. | Prediction of side chain Orientations in proteins by statistical machine learning methods | |
Melendez et al. | Polarizable AMOEBA model for simulating Mg2+· protein· nucleotide complexes | |
Mulligan | Computational methods for peptide macrocycle drug design | |
Ewing et al. | Structural Proteomics: Large-Scale Studies | |
Wrabl et al. | Experimental Characterization of “Metamorphic” Proteins Predicted from an Ensemble-Based Thermodynamic Description |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070403 |