JP4174775B2 - 生命情報解析装置、生命情報解析方法および生命情報解析プログラム - Google Patents
生命情報解析装置、生命情報解析方法および生命情報解析プログラム Download PDFInfo
- Publication number
- JP4174775B2 JP4174775B2 JP2005103001A JP2005103001A JP4174775B2 JP 4174775 B2 JP4174775 B2 JP 4174775B2 JP 2005103001 A JP2005103001 A JP 2005103001A JP 2005103001 A JP2005103001 A JP 2005103001A JP 4174775 B2 JP4174775 B2 JP 4174775B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- gene
- gene expression
- sequence
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims description 123
- 230000014509 gene expression Effects 0.000 claims description 566
- 230000001105 regulatory effect Effects 0.000 claims description 464
- 108090000623 proteins and genes Proteins 0.000 claims description 336
- 238000013518 transcription Methods 0.000 claims description 128
- 230000035897 transcription Effects 0.000 claims description 127
- 239000011159 matrix material Substances 0.000 claims description 111
- 238000002493 microarray Methods 0.000 claims description 25
- 238000011144 upstream manufacturing Methods 0.000 claims description 17
- 239000002299 complementary DNA Substances 0.000 claims description 16
- 201000010099 disease Diseases 0.000 claims description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 9
- 108020004999 messenger RNA Proteins 0.000 claims description 6
- 230000008520 organization Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 description 100
- 241000894007 species Species 0.000 description 72
- 238000013500 data storage Methods 0.000 description 70
- 238000003860 storage Methods 0.000 description 56
- 238000010586 diagram Methods 0.000 description 39
- 238000000034 method Methods 0.000 description 38
- 238000004364 calculation method Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 22
- 239000000523 sample Substances 0.000 description 18
- 230000008569 process Effects 0.000 description 17
- 238000000018 DNA microarray Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 108091036078 conserved sequence Proteins 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 14
- 241000206602 Eukaryota Species 0.000 description 12
- 230000033228 biological regulation Effects 0.000 description 12
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 10
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 10
- 206010028980 Neoplasm Diseases 0.000 description 9
- 108700009124 Transcription Initiation Site Proteins 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 201000011510 cancer Diseases 0.000 description 9
- 238000000605 extraction Methods 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 108700020796 Oncogene Proteins 0.000 description 8
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 239000012472 biological sample Substances 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000002103 transcriptional effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 229940050561 matrix product Drugs 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 108020003215 DNA Probes Proteins 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 229940126585 therapeutic drug Drugs 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101150019315 101 gene Proteins 0.000 description 1
- 101150055273 134 gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000000221 suprachiasmatic nucleus Anatomy 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Description
Brazma, A., Jonassen, I., Vilo, J. and Ukkonen, E., Predicting gene regulatory elements in silico on a genomic scale. Genome Res., 1998, 8, 1202−1215. Hughes, JD., Estep, PW., Tavazoie S., & Church, GM., Computational identification of cis-regulatory elements associated with groups of functionally related genes in Saccharomyces cerevisiae. Journal of Molecular Biology, 2000, 296, 1205-14. Liu, X., Brutlag, D. and Liu, J., Bioprospector: discovering conserved DNA motifs in upstream regulatory regions of coexpressed genes. Pac. Symp. Biocomput., 2001, 127−138. Bussemaker,H., Li,H. and Siggia,E., Regulatory element detection using correlation with expression. Nat. Genet., 2001, 27, 167−171. Segal, E., Yelensky, R. and Koller, D., Genome-wide discovery of transcriptional modules from DNA sequence and gene expression. Bioinformatics, 2003, 19, i273-i282
1.遺伝子発現調節配列・生命現象データの生成
2.遺伝子発現調節配列データの生成
3.遺伝子・生命現象データの生成
4.優位性の判定
ここで、「1.」は、図1の生命情報解析装置100における遺伝子発現調節配列・生命現象データ生成機能101の説明である。
「2.」「3.」は、上記「1.」の基礎になるデータ(生命情報解析装置100に入力されるべきデータ)の生成についての説明である。
「3.」は、図1の優位性判定機能103についての説明である。
図2は、実施の形態に係る生命情報解析装置100における遺伝子発現調節配列・生命現象データ生成機能101に関する構成を示している。生命情報解析装置100において、遺伝子発現調節配列データ取得部134は、第一のデータ取得部に相当しており、第一のデータとして、複数の遺伝子発現調節配列と複数の遺伝子との各組合せの寄与度のデータ(遺伝子発現調節配列データ)を取得する。また、取得されたデータは、遺伝子・遺伝子発現調節データ記憶部138に格納される。
次に、上述の生命情報解析装置100に遺伝子発現調節配列・生命現象データの生成の基礎データとして入力されるべき遺伝子発現調節配列データを生成するための構成を説明する。
ステップ2:生物種間の相同遺伝子を決定する。
ステップ3:生物種間のゲノム相同領域を決定する。すなわち、異なる生物種間でゲノムを対応付けする。
ステップ4:生物種間でのゲノム配列保存領域を決定する。すなわち、ゲノム比較する。なぜなら、遺伝子発現調節配列といった、生物の機能に重要な塩基配列は、生物種間で保存されている傾向が強いためである。
ステップ5:生物種間で保存されている遺伝子発現調節配列候補をゲノム全体で探索する。このとき、遺伝子発現調節配列候補は、既知の配列でも新規の配列でも可能である。
ステップ6:遺伝子発現調節配列候補を遺伝子および転写開始点と関連付けてデータベース化する。
次に、遺伝子・生命現象データの生成のための構成について説明する。遺伝子・生命現象データは、上述の遺伝子発現調節配列データと同様、生命情報解析装置100に入力されて、生命情報解析装置100での解析の基礎データになる。
次に、図1の生命情報解析装置における有意性判定機能103に関する構成を説明する。有意性判定としては、下記の3つについて説明する。
(A)体内時計依存的な遺伝遺伝子発現調節配列の予測
(B)癌遺伝子の制御機構解明
(C)組織ごとの遺伝子制御の違いの解明
図20は、図1に示した生命情報解析装置100における有意性判定機能103に関する構成を示している。有意性判定機能103は、有意性判定部148を備える。有意性判定部148は、図2に示した遺伝子発現調節配列・生命現象データ記憶部144から遺伝子発現調節配列・生命現象データを取得する。有意性判定部148は、取得した遺伝子発現調節配列・生命現象データに含まれる遺伝子発現調節配列および生命現象の各々の組合せの間に有意の関連性があるか判定して、有意性判定結果を生成する。
上述の基本的なデータ処理の流れとしては、まず、遺伝子発現調節配列に関連付ける遺伝子数の決定方法に工夫した。さらに、有意性が最も高くなる遺伝子数の決定データのスコア付けをする際に、どのような生命現象かによってスコア付け方法は異なるようにしている。このとき、複数のデータ、複数のスコア付けが存在する場合の合成方法として、データが複数ある場合、複数のデータを合成することで予測結果の信頼性を高めることを可能する。また、有意性の評価の際には、ランダムデータを用いた有意性の評価を行う。
以下、上述の説明では簡略化して説明した正規化処理について詳しく説明する。
図26は、図2(b)の正規化部211の内部構成を詳細に示した機能ブロック図である。なお、ここでは、説明の便宜上、正規化部211の場合について説明する。他の正規化部406、915(図20、図17)についても、構成、動作、作用効果などはいずれも正規化部211の場合と同様である。
次に、もう一つの有意性判定の例として、癌遺伝子の制御機構の解析方法について説明する。なお、本実施の形態でも、体内時計依存的な遺伝子発現調節配列の予測の際に用いる生命情報解析システム1000と同様のシステムを好適に用いうる。このとき、正規化を行う必要がある場合には、上述の体内時計の実施形態とは異なる正規化を行う。
次に、さらにもう一つの有意性判定の例として、組織ごとの遺伝子制御の違いの解析方法について説明する。なお、本実施の形態でも、体内時計依存的な遺伝遺伝子発現調節配列の予測の際に用いる生命情報解析システム1000と同様のシステムを好適に用いうる。このとき、正規化を行う必要がある場合には、上述の体内時計の実施形態とは異なる正規化を行う。
本実施の形態は、上述のようにゲノムワイドな遺伝子発現調節配列候補のデータベース(転写開始点と遺伝子発現調節配列候補の対応データ)と、ゲノムワイドな遺伝子発現データ(遺伝子の発現と時間・空間・生命現象の対応データ)と、の二種類のデータを組み合わせることで、遺伝子発現調節配列と時間・空間の対応データ(遺伝子発現調節配列・生命現象の対応データ)を生成し、時間・空間特異的な遺伝子発現調節配列を予測することができる。
101 遺伝子発現調節配列・生命現象データ生成機能
103 有意性判定機能
106 遺伝子発現調節配列データ生成装置
108 CD−ROMドライブ
110 外部ネットワーク
112 マイクロアレイ分析装置
114 スキャナ
134 遺伝子発現調節配列データ取得部
136 遺伝子・生命現象データ取得部
138 遺伝子発現調節配列データ記憶部
140 遺伝子・生命現象データ記憶部
142 遺伝子発現調節配列・生命現象データ生成部
144 遺伝子発現調節配列・生命現象データ記憶部
145 出力部
146 有意性判定結果記憶部
148 有意性判定部
150 出力部
202 受付部
204 第一の行列データ生成部
206 出力部
208 受付部
210 第二の行列データ生成部
211 正規化部
212 出力部
214 第一の行列データ受付部
216 第二の行列データ受付部
218 第三の行列データ生成部
219 出力部
220 行列の積計算部
402 遺伝子発現調節配列・生命現象データ受付部
406 正規化部
408 正規化データ記憶部
410 コサイン・フィッティングスコア計算部
412 コサイン・フィッティングスコア記憶部
414 ランダムデータ生成部
416 ランダムデータ記憶部
418 ランダムデータスコア計算部
420 ランダムデータスコア記憶部
422 比較・判定部
424 出力部
502 時系列データ受付部
504 平均値正規化部
506 平均値・標準偏差正規化部
508 時系列データ受付部
510 平均値正規化部
512 平均値・標準偏差正規化部
514 重み付け調整・合成部
516 平均値・標準偏差正規化部
518 出力部
602 遺伝子発現調節配列候補データ生成装置
604 転写開始点・遺伝子候補配列データ生成装置
606 遺伝子発現調節配列候補データ取得部
608 遺伝子発現調節配列候補データ記憶部
610 転写開始点・遺伝子候補配列データ取得部
612 転写開始点・遺伝子候補配列データ記憶部
614 遺伝子発現調節配列候補・転写開始点関連付部
616 遺伝子発現調節配列データ生成部
618 遺伝子発現調節配列データ記憶部
620 出力部
702 CD−ROMドライブ
704 外部ネットワーク
706 ゲノム配列情報取得部
708 ゲノム配列情報記憶部
710 ゲノム配列情報取得部
712 ゲノム配列情報記憶部
714 ゲノム比較部
716 保存配列抽出部
718 生物種間保存配列データ生成部
720 生物種間保存配列データ記憶部
722 既知・新規遺伝子発現調節配列候補データ取得部
724 既知・新規遺伝子発現調節配列候補データ記憶部
726 遺伝子発現調節配列候補データ生成部
728 遺伝子発現調節配列候補データ記憶部
730 出力部
802 外部ネットワーク
804 CD−ROMドライブ
806 ゲノム配列情報取得部
808 ゲノム配列情報記憶部
810 5’末端配列情報取得部
812 5’末端配列情報記憶部
814 転写開始点同定部
816 転写開始点・遺伝子候補配列データ生成部
818 転写開始点・遺伝子候補配列データ記憶部
820 出力部
902 スライドアレイ設置部
904 標識プローブアプライ部
906 ハイブリダイゼーション部
908 蛍光発光処理部
910 蛍光スキャン部
912 スキャンデータ解析部
914 遺伝子・生命現象データ生成部
915 正規化部
1000 生命情報解析システム
1002 スキャンデータ記憶部
1004 出力部
1006 スキャンデータ受付部
1008 スキャンデータ記憶部
1010 スキャンデータ解析部
1012 遺伝子・生命現象データ生成部
1014 遺伝子・生命現象データ記憶部
1016 出力部
Claims (18)
- 解析対象の遺伝子発現調節配列候補と複数の遺伝子候補配列の各々との組合せの寄与度である調節側寄与度を含む第一のデータを取得する第一のデータ取得部と、
前記複数の遺伝子候補配列の各々と解析対象の生命現象との組合せの寄与度である現象側寄与度を含む第二のデータを取得する第二のデータ取得部と、
前記第一のデータおよび前記第二のデータに基づいて、それぞれの遺伝子候補配列に対応した前記第一のデータの前記調節側寄与度と前記第二のデータの前記現象側寄与度との積を、それぞれの遺伝子候補配列を介した前記遺伝子発現調節配列候補と前記生命現象との組合せの個別寄与度として、前記複数の遺伝子候補配列に対応する複数の前記個別寄与度を合計した値である、前記複数の遺伝子候補配列を介した前記遺伝子発現調節配列候補と前記生命現象との組合せのトータル寄与度を含む第三のデータを生成する第三のデータ生成部と、
前記第三のデータを出力する出力部と、
を備える生命情報解析装置。 - 複数の遺伝子発現調節配列候補の各々と複数の遺伝子候補配列の各々との組合せの寄与度を行列要素とする第一の行列で構成される第一のデータを取得する第一のデータ取得部と、
前記複数の遺伝子候補配列の各々と複数の生命現象の各々との組合せの寄与度を行列要素とする第二の行列で構成される第二のデータを取得する第二のデータ取得部と、
前記第一のデータおよび前記第二のデータに基づいて、前記第一の行列および前記第二の行列を用いた計算をすることにより、前記複数の遺伝子発現調節配列候補の各々と前記複数の生命現象の各々との組合せの寄与度を行列要素とする第三の行列で構成される第三のデータを生成する第三のデータ生成部と、
前記第三のデータを出力する出力部と、
を備える生命情報解析装置。 - 請求項1または2記載の生命情報解析装置において、
前記第三のデータに含まれる前記遺伝子発現調節配列候補および前記生命現象の各々の組合せの間に有意の関連性があるか判定する判定部をさらに備え、
前記出力部は、前記判定部の判定結果に基づく前記解析結果を出力する生命情報解析装置。 - 請求項1乃至3いずれかに記載の生命情報解析装置において、
前記第一のデータは、
所定の生物種のゲノム配列情報内における前記複数の遺伝子候補配列と、
前記ゲノム配列情報内における前記遺伝子発現調節配列候補と、
前記ゲノム配列情報内における前記複数の遺伝子候補配列にそれぞれ関連づけられている複数の転写開始点と、
に基づいて得られ、
前記第一のデータは、前記ゲノム配列情報内において、それぞれの前記遺伝子候補配列に関連づけられている前記転写開始点の上流のうち前記転写開始点から所定の距離内に位置する前記遺伝子発現調節配列候補と、前記遺伝子候補配列とを関連づける寄与度のデータを含むことを特徴とする生命情報解析装置。 - 請求項4記載の生命情報解析装置において、
前記遺伝子発現調節配列候補は、前記遺伝子候補配列に対して、前記転写開始点および前記遺伝子発現調節配列候補の間の距離に応じた寄与度により関連づけられている
生命情報解析装置。 - 請求項4または5記載の生命情報解析装置において、
前記遺伝子発現調節配列候補は、複数の生物種のゲノム配列情報の間における保存性が所定の水準以上である配列を含む
生命情報解析装置。 - 請求項4乃至6いずれか記載の生命情報解析装置において、
前記遺伝子発現調節配列候補は、既知の遺伝子発現調節配列候補または任意に作成した配列からなる遺伝子発現調節配列候補を含む
生命情報解析装置。 - 請求項4乃至7いずれか記載の生命情報解析装置において、
前記複数の転写開始点は、
前記ゲノム配列情報内における前記複数の遺伝子候補配列と、
前記ゲノム配列情報内における複数のcDNA配列の5’末端配列と、
に基づいて得られ、
前記複数の5’末端配列に対応する前記複数の転写開始点の各々は、前記複数のcDNA配列の各々において、前記5’末端配列の下流に位置する前記遺伝子候補配列に関連づけられている生命情報解析装置。 - 請求項1乃至8いずれか記載の生命情報解析装置において、
前記遺伝子候補配列と前記生命現象との組合せの寄与度は、前記遺伝子候補配列の発現強度から生成される値である
生命情報解析装置。 - 請求項1乃至9いずれか記載の生命情報解析装置において、
前記遺伝子候補配列と前記生命現象との組合せの寄与度は、前記遺伝子候補配列のmRNA発現量から生成される値である
生命情報解析装置。 - 請求項1乃至10いずれかに記載の生命情報解析装置において、
前記第二のデータは、マイクロアレイを検出して得られるデータである
生命情報解析装置。 - 請求項1乃至11いずれか記載の生命情報解析装置において、
前記生命現象は、時系列に関する生命現象である
生命情報解析装置。 - 請求項1乃至11いずれか記載の生命情報解析装置において、
前記生命現象は、疾患に関する生命現象である
生命情報解析装置。 - 請求項1乃至11いずれか記載の生命情報解析装置において、
前記生命現象は、組織に関する生命現象である
生命情報解析装置。 - 解析対象の遺伝子発現調節配列候補と複数の遺伝子候補配列の各々との組合せの寄与度である調節側寄与度を含む第一のデータを取得するステップと、
前記複数の遺伝子候補配列の各々と解析対象の生命現象との組合せの寄与度である現象側寄与度を含む第二のデータを取得するステップと、
前記第一のデータおよび前記第二のデータに基づいて、それぞれの遺伝子候補配列に対応した前記第一のデータの前記調節側寄与度と前記第二のデータの前記現象側寄与度との積を、それぞれの遺伝子候補配列を介した前記遺伝子発現調節配列候補と前記生命現象との組合せの個別寄与度として、前記複数の遺伝子候補配列に対応する複数の前記個別寄与度を合計した値である、前記複数の遺伝子候補配列を介した前記遺伝子発現調節配列候補と前記生命現象との組合せのトータル寄与度を含む第三のデータを生成するステップと、
前記第三のデータを出力するステップと、
を含む生命情報解析方法。 - 複数の遺伝子発現調節配列候補の各々と複数の遺伝子候補配列の各々との組合せの寄与度を行列要素とする第一の行列で構成される第一のデータを取得するステップと、
前記複数の遺伝子候補配列の各々と複数の生命現象の各々との組合せの寄与度を行列要素とする第二の行列で構成される第二のデータを取得するステップと、
前記第一のデータおよび前記第二のデータに基づいて、前記第一の行列および前記第二の行列を用いた計算をすることにより、前記複数の遺伝子発現調節配列候補の各々と前記複数の生命現象の各々との組合せの寄与度を行列要素とする第三の行列で構成される第三のデータを生成するステップと、
前記第三のデータを出力するステップと、
を含む生命情報解析方法。 - 解析対象の遺伝子発現調節配列候補と複数の遺伝子候補配列の各々との組合せの寄与度である調節側寄与度を含む第一のデータを取得するステップと、
前記複数の遺伝子候補配列の各々と解析対象の生命現象との組合せの寄与度である現象側寄与度を含む第二のデータを取得するステップと、
前記第一のデータおよび前記第二のデータに基づいて、それぞれの遺伝子候補配列に対応した前記第一のデータの前記調節側寄与度と前記第二のデータの前記現象側寄与度との積を、それぞれの遺伝子候補配列を介した前記遺伝子発現調節配列候補と前記生命現象との組合せの個別寄与度として、前記複数の遺伝子候補配列に対応する複数の前記個別寄与度を合計した値である、前記複数の遺伝子候補配列を介した前記遺伝子発現調節配列候補と前記生命現象との組合せのトータル寄与度を含む第三のデータを生成するステップと、
前記第三のデータに基づく解析結果を出力するステップと、
をコンピュータに実行させる生命情報解析プログラム。 - 複数の遺伝子発現調節配列候補の各々と複数の遺伝子候補配列の各々との組合せの寄与度を行列要素とする第一の行列で構成される第一のデータを取得するステップと、
前記複数の遺伝子候補配列の各々と複数の生命現象の各々との組合せの寄与度を行列要素とする第二の行列で構成される第二のデータを取得するステップと、
前記第一のデータおよび前記第二のデータに基づいて、前記第一の行列および前記第二の行列を用いた計算をすることにより、前記複数の遺伝子発現調節配列候補の各々と前記複数の生命現象の各々との組合せの寄与度を行列要素とする第三の行列で構成される第三のデータを生成するステップと、
前記第三のデータに基づく解析結果を出力するステップと、
をコンピュータに実行させる生命情報解析プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005103001A JP4174775B2 (ja) | 2005-03-31 | 2005-03-31 | 生命情報解析装置、生命情報解析方法および生命情報解析プログラム |
US11/396,508 US20060265135A1 (en) | 2005-03-31 | 2006-04-04 | Bio-information analyzer, bio-information analysis method and bio-information analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005103001A JP4174775B2 (ja) | 2005-03-31 | 2005-03-31 | 生命情報解析装置、生命情報解析方法および生命情報解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006285517A JP2006285517A (ja) | 2006-10-19 |
JP4174775B2 true JP4174775B2 (ja) | 2008-11-05 |
Family
ID=37407396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005103001A Expired - Fee Related JP4174775B2 (ja) | 2005-03-31 | 2005-03-31 | 生命情報解析装置、生命情報解析方法および生命情報解析プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060265135A1 (ja) |
JP (1) | JP4174775B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5247089B2 (ja) * | 2007-08-22 | 2013-07-24 | 三菱スペース・ソフトウエア株式会社 | 遺伝子プロファイル処理装置、遺伝子プロファイル処理プログラムおよび遺伝子プロファイル処理方法 |
CN102177434B (zh) * | 2008-08-08 | 2014-04-02 | 乔治亚大学研究基金公司 | 用于预测能够分泌至体液中的蛋白质的方法及系统 |
US20130151270A1 (en) * | 2011-12-12 | 2013-06-13 | Pathway Genomics | Genetic Based Health Management Systems for Weight and Nutrition Control |
EP3799057A1 (en) * | 2019-09-25 | 2021-03-31 | Koninklijke Philips N.V. | Prediction tool for patient immune response to a therapy |
CN113506593B (zh) * | 2021-07-06 | 2024-04-12 | 大连海事大学 | 一种面向大规模基因调控网络的智能推断方法 |
CN114296487B (zh) * | 2022-03-07 | 2022-05-17 | 广东省农业科学院动物科学研究所 | 一种养殖池盐度参数智能调控方法及系统 |
-
2005
- 2005-03-31 JP JP2005103001A patent/JP4174775B2/ja not_active Expired - Fee Related
-
2006
- 2006-04-04 US US11/396,508 patent/US20060265135A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20060265135A1 (en) | 2006-11-23 |
JP2006285517A (ja) | 2006-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Longo et al. | Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics | |
Sedlazeck et al. | Piercing the dark matter: bioinformatics of long-range sequencing and mapping | |
CN106068330B (zh) | 将已知等位基因用于读数映射中的系统和方法 | |
Annala et al. | A linear model for transcription factor binding affinity prediction in protein binding microarrays | |
US20050159896A1 (en) | Apparatus and method for analyzing data | |
JP2020524350A (ja) | 統合算出および実験的深層変異学習フレームワークを介した遺伝子およびゲノム変異体の解釈 | |
JP4174775B2 (ja) | 生命情報解析装置、生命情報解析方法および生命情報解析プログラム | |
JP2003021630A (ja) | 臨床診断サービスを提供するための方法 | |
Kiełbasa et al. | Combining frequency and positional information to predict transcription factor binding sites | |
Karagoz et al. | Integration of multiple biological features yields high confidence human protein interactome | |
Detours et al. | Integration and cross-validation of high-throughput gene expression data: comparing heterogeneous data sets | |
KR101961438B1 (ko) | 질병 기전 연구를 위한 생물학적 데이터를 제공하는 데이터 제공 장치, 및 방법 | |
WO2008007630A1 (fr) | Méthode et appareil de recherche de protéine | |
IL297949A (en) | Predicting the biological role of tissue receptors | |
Grewal et al. | Analysis of expression data: an overview | |
Hendrickson et al. | Tools for interpreting large-scale protein profiling in microbiology | |
KR20230068361A (ko) | 개인 맞춤 의료를 위한 커스텀 데이터 파일 | |
WO2022084696A1 (en) | Drug optimisation by active learning | |
Feng et al. | Recognition of the long range enhancer-promoter interactions by further adding DNA structure properties and transcription factor binding motifs in human cell lines | |
Barba et al. | Genome Informatics Pipelines and Genome Browsers | |
Alagarswamy et al. | Can AI-Powered Whole Genome Sequencing Be Used Routinely for Personalized Decision Support in Surgical Oncology?–A Scoping Review | |
Shu et al. | Mergeomics: integration of diverse genomics resources to identify pathogenic perturbations to biological systems | |
Mitra et al. | Statistical analyses of next generation sequencing data: an overview | |
Bais et al. | Simultaneous alignment and annotation of cis-regulatory regions | |
CN117672343B (zh) | 测序饱和度评估方法及装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080807 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R154 | Certificate of patent or utility model (reissue) |
Free format text: JAPANESE INTERMEDIATE CODE: R154 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140829 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |