JP2001178463A - 類似発現パターン抽出方法及び関連生体高分子抽出方法 - Google Patents

類似発現パターン抽出方法及び関連生体高分子抽出方法

Info

Publication number
JP2001178463A
JP2001178463A JP37143499A JP37143499A JP2001178463A JP 2001178463 A JP2001178463 A JP 2001178463A JP 37143499 A JP37143499 A JP 37143499A JP 37143499 A JP37143499 A JP 37143499A JP 2001178463 A JP2001178463 A JP 2001178463A
Authority
JP
Japan
Prior art keywords
pattern
expression
gene
extracting
biopolymer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP37143499A
Other languages
English (en)
Other versions
JP4298101B2 (ja
Inventor
Tsunehiko Watanabe
恒彦 渡辺
Yasuyuki Nozaki
康行 野崎
Akira Nakashige
亮 中重
Takuro Tamura
卓郎 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP37143499A priority Critical patent/JP4298101B2/ja
Priority to EP00125806A priority patent/EP1113078A1/en
Priority to US09/739,525 priority patent/US7277798B2/en
Publication of JP2001178463A publication Critical patent/JP2001178463A/ja
Application granted granted Critical
Publication of JP4298101B2 publication Critical patent/JP4298101B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

(57)【要約】 【課題】 遺伝子等の発現データ特有の性質を考慮した
類似発現パターン抽出方法及び関連生体高分子抽出方法
を提供する。 【解決手段】 検索する遺伝子等の発現パターンのうち
興味ある発現を示す実験ケース区間を検索の範囲として
部分的に選択し、選択された発現パターンの一部分を検
索対象遺伝子等の発現パターンと比べることにより、少
なくとも一部分が類似した発現パターンを持つ遺伝子等
を検索対象遺伝子群等の中から検索する。部分的に取り
出した曲線(発現パターンの一部)を任意に縦軸方向又
は横軸方向に平行移動し、移動後の曲線と検索対象遺伝
子等の発現パターン曲線とを重ねあわせることにより、
類似したパターン形状を有する発現パターンを検索す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、遺伝子等の生体高
分子と発現に関して関連を有する生体高分子を大量の生
体高分子群の中から抽出する方法に関する。
【0002】
【従来の技術】さまざまな種においてゲノム配列が決定
されるのに伴い、進化に対応するとみられる遺伝子を見
つけ出し、どの生物も共通に持っていると考えられる遺
伝子の集合を探したり、それから逆に種毎に個別な特徴
を推測するなど、種間の遺伝子の違いから何かを見出そ
うとする、いわゆるゲノム比較法が盛んに行われてき
た。
【0003】しかし近年、DNAチップやDNAマイク
ロアレイなどのインフラストラクチャの発達によって、
分子生物学の興味は、種間の情報から種内の情報へ、す
なわち同時発生解析へと移りつつあり、これまでの種間
の比較と合わせて、情報の抽出から関連付けの場が大き
く広がりを持ち始めている。例えば、既知の遺伝子と同
一の発現パターンを示す未知の遺伝子が見つかれば、そ
の遺伝子には既知の遺伝子と同様の機能があると類推で
きる。これら遺伝子や蛋白質そのものの機能的な意味付
けは、機能ユニットや機能グループといった形で研究さ
れている。また、それらの間の相互作用も、既知の酵素
反応データや物質代謝データとの対応付けによって、あ
るいはより直接的に、ある遺伝子を破壊あるいは過剰反
応させ、その遺伝子の発現をなくすか、あるいは多量に
発現させ、その遺伝子の直接的及び間接的影響を、全遺
伝子の発現パターンを調べることによって解析してい
る。
【0004】ここで、ある遺伝子の発現パターンとは、
横軸に実験ケース、縦軸に発現量をとり、その遺伝子に
対して一連の実験ケースで得られた発現量の値をつなげ
て曲線(あるいは折れ線)グラフとして表したものであ
る。なお、遺伝子だけでなくDNA、cDNA、RN
A、DNA断片又はタンパク質などの生体高分子につい
ても同様の発現パターンを考えることができるが、ここ
では遺伝子の発現パターンを例にとって説明する。横軸
にとる実験ケースの具体例としては、時系列、生物の体
の部位、生物種、塩基配列の一部、遺伝子などがある。
【0005】実験ケースにおいて時系列とした発現パタ
ーンを解析した例としては、例えばスタンフォード大学
のP. Brownらのグループによるイースト菌の発現解析が
挙げられる(Michel B. Eisen et. al.: Cluster analy
sis and display of genome-wide expression pattern
s: Proc. Natl. Acad. Sci. 1998 Dec 8, 95(25), 1486
3-8)。彼らは、cd6変異株と呼ばれる遺伝子を用
い、遠心分離法を適用したときの発現過程、出芽時期に
おける発現過程、高熱ショックを与えたときの発現過
程、低熱ショックを与えたときの発現過程、ジーオーキ
ーシーシフト法を適用したときの発現過程などの各実験
における時系列の遺伝子の発現データを組み合わせ、発
現パターン同士をクラスタリングすることにより、遺伝
子の機能を特定するのに成功したことが知られている。
【0006】遺伝子の発現解析法のひとつとして、図2
4(a)に示すような大量の遺伝子(検索対象遺伝子)
群の発現パターンの中から、図24(b)に示すように
任意に選択した遺伝子(検索遺伝子)の発現パターンに
よく類似したパターンを有する遺伝子を抽出する方法が
ある。抽出された遺伝子は、検索遺伝子の属する機能グ
ループや機能ユニットの候補とすることができる。
【0007】この従来の方法は、検索の様子を図24
(c)に模式的に示し、検索結果を図24(d)に示す
ように、検索遺伝子の発現パターンとそのパターン全体
において類似した発現パターンをもつ遺伝子を抽出する
方法である。具体的には一つの遺伝子の発現過程を一つ
のベクトル(実験ケースと同じ数だけ独立した軸を有す
る多次元空間において、各実験ケースにおける発現量を
その実験ケースに相当する軸方向の成分として持つベク
トル)に対応させ、遺伝子間の類似性をベクトル間の
(非)類似度によって比べている。また、実際の遺伝子
データではなくユーザが任意に曲線データ(発現パター
ンデータ)を用意し、これを基準として遺伝子を抽出す
る方法もある。 これらの縦軸の発現量は遺伝子の数量
に関する増幅割合を表すものであり、具体的な測定値は
実験方法に依存するが、例えばDNAチップ上でハイブ
リダイズした遺伝子を標識している標識蛍光物質から発
せられる蛍光の強度、標識化学発光物質から発せられる
化学発光の強度、DNAチップ上に付着した遺伝子に発
生する化学反応起因の電気的シグナルを電極により検出
した値、ハイブリダイズした遺伝子をガス化しその飛行
時間を計測することによって得た質量分析の値などを発
現量の指標とすることができる。などを発現量の指標と
することができる。
【0008】
【発明が解決しようとする課題】ところが、前述の従来
の方法では、任意に選択した検索遺伝子の発現パターン
と検索対象遺伝子の発現パターンとが、そのパターンの
全ての部分(全ての実験ケース)において類似している
遺伝子しか抽出できなかった。例えば図22(a)に示
すように、検索対象遺伝子の発現パターンデータに実験
環境の違いによる測定誤差が含まれていた場合、従来の
方法ではこれを検索遺伝子と類似した発現パターンであ
ると認識できなかった。また、例えば図22(b)に示
すように、時系列のある区間(ある連続する実験ケース
の区間)に限り複数の遺伝子が同じ機能のために協調し
て発現し、その他の区間では異なる機能のために別々に
発現している場合、ある区間では同じ形状の曲線が集ま
っているように見える。このとき、従来の方法では、こ
のようにある区間で同じ形状となっている曲線群を抽出
できなかった。
【0009】また、遺伝子の発現調節現象は、ある遺伝
子の発現が別の遺伝子の発現を誘導したり、あるいは発
現を阻害するなど、一連のカスケードで構成されてい
る。ここでカスケードとは、図23に模式的に示すよう
に、遺伝子1は遺伝子2の発現を誘導し、さらに、遺伝
子2は遺伝子3、遺伝子3は遺伝子4を誘導するという
ように複数の遺伝子が連鎖的に発現する現象のことであ
る。そしてさらに、これらカスケードが複合することに
より複雑なネットワークが形成される。このような遺伝
子のカスケードでは、時間の経過と共に複数の遺伝子発
現のピークが連なってみられ、それらの発現パターンは
非常に類似した形状をもつことがある。図22(d)
も、このカスケードの一部分を表した図である。従来の
方法では、このような遺伝子のカスケードを検出するこ
とができなかった。
【0010】これに加え、図22(e)に示すような、
遺伝子の発現を抑制するように働く遺伝子発現パターン
や、図22(c)に示すように協調して働くが発現量の
度合いに一定量の大きな差がみられる遺伝子発現パター
ン、また、図22(f)に示すように常に一定の倍率を
もって発現がみられる遺伝子発現パターン等を検出する
ことができなかった。
【0011】本発明は、このような従来技術の問題点に
鑑み、遺伝子等の発現データ特有の性質を考慮した類似
発現パターン抽出方法及び関連生体高分子抽出方法を提
供することを目的とする。特に、検索対象となる発現パ
ターンが測定誤差を含む場合の解析、時系列のある区間
に限り複数の生体高分子(例えば遺伝子)が同じ機能の
ために協調して発現し、その他の区間では異なる機能の
ために別々に発現している場合の解析、あるいは遺伝子
のカスケードの解析などを支援することのできる類似発
現パターン抽出方法及び関連生体高分子抽出方法を提供
することを目的とする。
【0012】
【課題を解決するための手段】本発明ではまず、検索す
る遺伝子等の発現パターンのうち利用者が興味ある発現
を示す実験ケース区間を図2(a),(b)のように検
索の範囲として部分的に選択する。そして、図2(c)
に示すように、この選択された発現パターンの一部分を
検索対象遺伝子等の発現パターンと比べることにより、
少なくとも一部分が類似した発現パターンを持つ遺伝子
等を検索対象遺伝子群等の中から検索する。この方法を
適用することで、例えば図22(a)の場合には誤差の
範囲を検索対象外とすることで類似遺伝子等を抽出する
ことができ、図22(b)の場合においても、同様な発
現過程を示す範囲のみを検索対象とすることで、同じ発
現過程を示す部分を抽出することができる。
【0013】また、図2(d)に示すように、この部分
的に取り出した曲線(発現パターンの一部)を任意に縦
軸(発現量軸)方向又は横軸(実験ケース軸)方向に平
行移動し、移動後の曲線(発現パターンの一部)と検索
対象遺伝子等の発現パターン曲線とを重ねあわせること
により、図2(e)に示すように、類似したパターン形
状を有する発現パターンを検索できる。さらに、部分的
に取り出した曲線(発現パターン)を任意に加工し、例
えば抑制遺伝子ならば曲線を上下反転する、常に一定の
倍率をもって発現がみられる遺伝子ならば曲線を縦軸方
向に拡大・縮小するなどし、この加工した曲線(発現パ
ターン)を用いることにより、より広い意味での類似パ
ターンを持つ遺伝子曲線を検索できる。
【0014】検索遺伝子等の発現パターンの選択部分と
これに対応する検索対象遺伝子等の発現パターンのパタ
ーン形状を比較する手段としては、検索遺伝子等の発現
パターン曲線の選択部分の発現量の値に任意の幅をもた
せた帯を作り、検索対象遺伝子群等の発現パターンから
この帯に含まれる発現パターンを有する遺伝子等を取り
出す方法、検索遺伝子等と検索対象遺伝子等との類似度
を算出する方法、また、これらを組み合わせ、帯に含ま
れる遺伝子等の類似度を算出する方法を適用することが
できる。
【0015】すなわち、本発明による類似発現パターン
抽出方法は、生体高分子に対する複数の実験ケースと発
現量との関係を表す検索対象発現パターンの集合の中か
ら検索発現パターンに類似するものを抽出する類似発現
パターン抽出方法において、検索発現パターンの一部分
を取り出し、取り出したパターン部分のパターン形状と
類似するパターン形状を含む検索対象発現パターンを抽
出することを特徴とする。
【0016】取り出したパターン部分に加工処理を施
し、加工されたパターン部分のパターン形状と類似する
パターン形状を含む検索対象発現パターンを抽出するこ
ともできる。加工処理としては、取り出したパターン部
分を縦軸(発現量軸)に対して上下反転する処理、ある
いは取り出したパターン部分の縦軸(発現量軸)方向あ
るいは横軸(実験ケース軸)方向の倍率を変化させる処
理などが有効である。
【0017】類似するパターン形状の判定に当たって
は、検索発現パターンの一部分を取り出したパターン部
分あるいはそれを加工したパターン部分に対し実験ケー
ス毎に所定量の発現量を加減(加算・減算)することに
よって縦軸(発現量軸)方向に一定の幅を持った帯状の
パターンを発生し、パターンの一部が当該帯状のパター
ンの中に全て入る検索対象発現パターンを抽出するよう
にする。また、帯状のパターンを縦軸方向あるいは横軸
方向に平行移動しながら、パターン部分が当該帯状のパ
ターンの中に全て入る検索対象発現パターンを抽出す
る。この類似発現パターン抽出方法を適用する生体高分
子は遺伝子、DNA、cDNA、RNA、DNA断片又
はタンパク質とすることができる。また、実験ケースは
時系列に沿った実験、個体の種別、個体の部位、人工的
な条件の印加と無印加、あるいはこれらのうちの複数を
複合したものとすることができる。
【0018】本発明による関連生体高分子抽出方法は、
生体高分子に対する複数の実験ケースと発現量との関係
を表す発現パターンどうしを比較して、検索対象生体高
分子の中から検索生体高分子と発現において関連を有す
る生体高分子を抽出する関連生体高分子抽出方法におい
て、検索生体高分子の発現パターンの一部分を取り出
し、取り出したパターン部分のパターン形状と類似する
パターン形状を含む発現パターンを有する検索対象生体
高分子を抽出することを特徴とする。
【0019】取り出したパターン部分に加工処理を施
し、加工されたパターン部分のパターン形状と類似する
パターン形状を含む発現パターンを有する検索対象生体
高分子抽出することもできる。加工処理としては、パタ
ーン部分を縦軸(発現量軸)方向に対して上下反転する
処理、あるいはパターン部分の縦軸(発現量軸)方向あ
るいは横軸(実験ケース軸)方向の倍率を変化させる処
理などが有効である。
【0020】類似するパターン形状の判定に当たって
は、検索生体高分子の発現パターンの一部分を取り出し
たパターン部分あるいはそれを加工したパターン部分に
対し実験ケース毎に所定量の発現量を加減することによ
って縦軸(発現量軸)方向に一定の幅を持った帯状のパ
ターンを発生し、パターンの一部が当該帯状のパターン
の中に全て入る発現パターンを有する検索対象生体高分
子を抽出する。また、帯状のパターンを縦軸方向あるい
は横軸方向に平行移動しながら、パターンの一部が当該
帯状のパターンの中に全て入る検索対象発現パターンを
有する検索対象生体高分子を抽出する。この関連生体高
分子抽出方法を適用する生体高分子は遺伝子、DNA、
cDNA、RNA、DNA断片又はタンパク質とするこ
とができる。また、実験ケースは時系列に沿った実験、
個体の種別、個体の部位、人工的な条件の印加と無印
加、あるいはこれらのうちの複数を複合したものとする
ことができる。
【0021】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。理解を容易にするために、以下で
は具体例として横軸を時系列の実験ケースとし、縦軸を
遺伝子の発現量とした発現パターンのグラフを用いて説
明する。しかし、本発明の適用は遺伝子の発現パター
ン、あるいは横軸を時系列の実験ケースとした発現パタ
ーンに限られるものではない。
【0022】例えば、カエルの発生時に働くある遺伝子
に注目しその発現及び発現量を調べる場合、まず、大量
のカエルの卵を同時に受精させ、ある一定の時間経過ご
とにその遺伝子のコピーの有無と数量を計測する方法が
ある。本発明においては、このような実験において、一
定の時間経過後における卵の状態を時系列的に観察し、
それぞれの時間において受精された卵の遺伝子の発現及
び発現量を測定することを一つの実験ケース(時系列の
実験ケース)と捉える。また、実験ケースは、高熱によ
る刺激の有無や投薬の前後で調べるなど実験環境の違い
で比較を行う場合や、細胞分裂の時点や栄養素を与えた
時点など細胞活動の時期の違いで比較を行う場合、さら
に生物のそれぞれの部位同士で比較を行う場合、異なる
生物種の間で比較を行う場合なども一つの実験ケースで
ある。
【0023】例えば、時系列の実験ケース以外の例とし
て、横軸を体の部位とするものがある。具体的には横軸
に脳、心臓、腎臓などの体の部位を取り、それぞれの部
位における遺伝子、DNA、cDNA、RNA、DNA
断片、たんぱく質等の発現量を結んで発現パターンを得
ることができるが、本発明はこのような発現パターンに
対しても適用可能である。あるいは、本発明は、個体の
種別による違いを見るために、横軸を、例えばヒト、マ
ウスなどの哺乳類や爬虫類、両生類などの個体種別とし
て得た遺伝子、DNA、cDNA、RNA、DNA断
片、たんぱく質等の発現パターンに対しても適用可能で
ある。更には、横軸を、ある実験環境において個体の種
別や体の部位に対して注射、ヒートショック、栄養素の
付加などの外部からの影響が起きるだろうと思われる要
因を加えたものと、加えないものとした場合、あるいは
横軸を生物の体の部位、生物種又は時系列を含めこれら
を選択し複合した場合の発現パターン一般に対しても適
用できるものである。
【0024】酵母やヒトなどの生物において、細胞の分
裂、エネルギーの生成などのような細胞内活動が生じる
とき、細胞の核内のいくつかの遺伝子はコピーされ、そ
の結果タンパク質が生成される。つまり、遺伝子が機能
し始める。これを遺伝子の発現とよび、遺伝子がコピー
される量を遺伝子の発現量とよぶ。実験ケースごとに遺
伝子の発現量を調べると、遺伝子の働きに応じて発現量
の増減の変化が現れる。これを本発明では発現パターン
という。遺伝子以外にもDNA、cDNA、RNA、D
NA断片又はタンパク質などの量も計測することがあ
る。
【0025】図1は、本発明の方法に用いるシステムの
一例の概略構成図である。このシステムは、一連の細胞
のプロセスにおいて遺伝子の発現の度合いを数値化した
ものを格納している遺伝子発現パターンデータ14、そ
の発現パターンデータより必要な情報を取り出し解析を
行うデータ解析部16、その結果を視覚化して表示する
ための処理を行う表示処理部15、また実際に表示する
表示装置11、本システムへの値の入力や選択の操作を
行うためのキーボード12及びマウス13等のポインテ
ィングデバイス、これらの処理をデータ解析部16に伝
える入力処理部17を備える。ここで、表示処理部1
5、データ解析部16、入力処理部17は中央処理装置
10上にある。この中央処理装置10は、コンピュータ
とそのプログラムによって具体化される。
【0026】図3は、遺伝子発現パターンデータ14に
格納された検索対象遺伝子発現パターンデータの具体的
な構造を例示したものである。検索対象となる遺伝子群
の発現データを二次元配列Exp[][]で表す。すなわち、
遺伝子ID(id)に対応する遺伝子が実験ケース(no)に
おける発現の度合いを数値化したデータをExp[id][no]
に格納している。
【0027】図4は、ある遺伝子の発現パターンデータ
と、そのデータに基づいて描かれる発現パターンの対応
例を説明する模式図である。実験ケースは時系列になっ
ているとする。例えば、一定時間おきに採取したサンプ
ルに対し、同種のDNAチップを用いハイブリダイゼー
ション反応を行って得られた発現パターンデータであ
る。
【0028】図4(a)は、遺伝子1の発現パターンデ
ータ例を表し、図4(b)は遺伝子1の発現パターンを
グラフ化して表したものである。このグラフの横軸は時
系列の時間(分)であり、縦軸は発現量(単位なし)で
ある。図4(b)の曲線(折れ線グラフ)と、図4
(a)の配列Exp[][]とは対応している。この曲線を二
次元配列Exp[][]で表現する場合、遺伝子1のIDである
1が最初の添字に入り、次の添字には実験ケースの順番
が入る。そして、この配列がもつ値は発現量となる。図
示した例の場合、遺伝子1のi分後の発現量のデータは
Exp[1][i+1]のように表すことができ、例えば2分後に
おける発現量5のデータは実験ケース順では3番目なの
で、配列Exp[1][3]で表せ、この中身はExp[1][3]=5とな
る。
【0029】図5は、図1に示したシステムにおける表
示装置11の表示画面の一例を示す説明図である。この
表示画面は、検索対象遺伝子データが入力され検索対象
となる遺伝子の属性を表示する検索対象遺伝子表示ボッ
クス22、検索対象遺伝子表示ボックス22に入力され
た複数の遺伝子の遺伝子発現パターンが重ねて同時に表
示される検索対象遺伝子用グラフ表示領域25、検索の
元となる遺伝子データが入力され検索する遺伝子の属性
を表示する検索遺伝子表示ボックス23、検索遺伝子表
示ボックス23に入力された遺伝子の遺伝子発現パター
ンが表示される検索遺伝子用グラフ表示領域29を有す
る。
【0030】また、検索遺伝子用グラフ表示領域29に
表示されている遺伝子発現パターンから検索候補となる
任意の区間を選択するための選択区間設定枠30、選択
区間設定枠30で選択された区間の発現パターンに加え
る変形方法を表示した変形オプションボックス24、変
形オプションボックス24にて選択された変形方式で変
形したパターンを表示する変形オプション表示領域28
が用意されている。この変形オプションを用いることに
より、例えばある遺伝子の発現が他の遺伝子の発現を阻
害する関係にあるものなどを効率よく発見することがで
きる。選択区間設定枠30は、例えばマウスポインタで
枠をドラッグする等の方法で、横軸方向の位置、幅を任
意に調整することができるようになっている。検索対象
遺伝子用グラフ表示領域25には、例えばマウスポイン
タでドラッグする等の方法で、ユーザが左右に移動して
検索開始点を自由に設定することのできる検索区間設定
枠26が設けられている。
【0031】選択区間設定枠30に表示された部分パタ
ーンと類似した発現パターンを有する遺伝子の検索は検
索ボタン32をクリックすることにより開始され、検索
結果は類似表31に類似順に表示される。図示の例で
は、類似表31には類似度、遺伝子名、検索区間が表示
されるようになっている。類似表31の上部に置かれた
詳細表示ボタン33をクリックすると、類似表31に表
示された個々の遺伝子の詳しい属性が別ウィンドウに表
示されるようになっている。
【0032】表示画面上の詳細設定ボタン21をクリッ
クすると、図6(a)に略示するような詳細設定ウイン
ドウ41が表示される。詳細設定ウインドウ41には、
帯のオプションを設定するための図6(a)に示す帯オ
プション設定タグ42、帯の使用・不使用を設定するた
めの図6(b)に示す帯使用タグ43、類似パターン検
索に用いる帯の幅を設定するための図6(c)に示す帯
の幅設定タグ44、(非)類似度の算出方法を選択する
ための図6(d)に示す(非)類似度タグ45、検索す
る遺伝子と検索対象となる遺伝子に対し正規化処理の適
用・不適用を設定するための図6(e)に示す正規化タ
グ46が含まれる。ここで帯とは、後述するように、発
現パターンの発現量の値に任意の値を加減してできた、
その発現パターンを中心として縦軸方向に幅を持った領
域をいう。
【0033】ユーザは、図5に示した表示画面におい
て、検索遺伝子用グラフ表示領域29に表示されている
遺伝子発現パターンの中で検索候補となる任意の区間を
選択区間設定枠30によって選択する。この選択区間設
定枠30によって切り取られた曲線(パターン形状)を
もとに、検索対象遺伝子用グラフ表示領域25に表示さ
れている検索対象遺伝子の遺伝子発現パターンの中から
類似する曲線を抽出する。すなわち、選択区間設定枠3
0によって切り取られたパターン形状に類似する曲線を
部分的に含むパターンを検索対象遺伝子用グラフ表示領
域25に表示されている遺伝子発現パターンの中から抽
出する。
【0034】ユーザは検索区間設定枠26を左右に動か
し、検索対象遺伝子用グラフ表示領域25における検索
開始点を決定する。例えば、検索区間設定枠26内にお
ける遺伝子のカスケードの状況を観測するとき、ユーザ
が適宜、区間設定枠を移動し、類似している遺伝子を調
べればよい。検索開始点は自動的に設定することも可能
である。また、複数の検索開始点を自動設定し、検索開
始点を順次移動しながら自動検索することも可能であ
る。
【0035】図7は、本発明による類似遺伝子発現パタ
ーン抽出方法の概略フローを示した図である。まず、図
1に示した遺伝子発現パターンデータ14からデータ解
析部16へデータを読み込む(ステップ11)。個々の
遺伝子発現パターンデータの具体的な形は、先に図3に
て説明したようなものである。次に、ユーザは、図1の
データ解析部16に読み込んだ遺伝子発現パターンデー
タのうち、検索対象となる遺伝子の発現パターンを取り
出す(ステップ12)。さらに、検索したい遺伝子の発
現パターンを取り出す(ステップ13)。ここでは、後
述するように、ユーザ自身が任意に作成したデータを検
索する遺伝子発現パターンデータとして入力するなどの
方法も可能である。次にユーザは、検索遺伝子発現パタ
ーンデータの詳細設定と類似度(非類似度)の距離計算
方式を決定する(ステップ14)。
【0036】次に、検索対象遺伝子発現データにおける
検索遺伝子の検索開始点を決める(ステップ15)。こ
こでは、ユーザが図5の表示画面上で検索区間設定枠2
6を左右に動かすことにより検索対象遺伝子発現パター
ンデータにおける検索開始点の値を決定し、これを変数
Tsに保持する。次に、検索対象遺伝子群から任意の検
索遺伝子に類似した遺伝子を抽出する(ステップ1
6)。最後に、抽出された検索対象遺伝子を、類似表3
1に類似している順に並べて表示する(ステップ1
7)。
【0037】図8は、図7のステップ11における検索
対象遺伝子発現パターンデータの登録に関する処理の詳
細フローである。まず、図9に示すように、本システム
に蓄積された遺伝子発現パターンデータ14を別ウィン
ドウのローカル遺伝子データベース表示ボックス51に
表示する。ローカル遺伝子データベース表示ボックス5
1には格納された遺伝子の遺伝子IDと遺伝子名が表示さ
れるので、検索対象とする任意の遺伝子データを例えば
ポインティングデバイスで検索対象遺伝子表示ボックス
52にドラッグアンドドロップすることにより選択し格
納する。検索対象遺伝子表示ボックス52のデータは、
図5に示した検索対象遺伝子表示ボックス22に入力さ
れる。検索対象遺伝子表示ボックス22に検索対象遺伝
子が入力されると、検索対象遺伝子用グラフ表示領域2
5に発現度に応じた検索対象遺伝子の遺伝子発現パター
ンが表示される。同時に、図3にて説明したようにし
て、id番目の遺伝子のno個目の実験ケースにおける各遺
伝子の発現量を二次元配列Exp[id][no]に登録する(ス
テップ21)。次に、変数gene#numに登録する遺伝子の
総数を保持し、変数case#numに登録する遺伝子の実験ケ
ースの総数を保持する(ステップ22)。
【0038】図10は、図7のステップ12に示した検
索遺伝子発現パターンデータの入力に関する処理の詳細
フローである。ローカル遺伝子データベースより検索遺
伝子を選択するときは、図9のローカル遺伝子データベ
ース表示ボックス51より検索する任意の遺伝子発現パ
ターンデータをポインティングデバイスで検索遺伝子表
示ボックス53にドラッグアンドドロップすることによ
り選択する(ステップ31)。検索遺伝子表示ボックス
53のデータは、図5に図示した検索遺伝子表示ボック
ス23に入力される。検索遺伝子表示ボックス23に検
索遺伝子が入力されると、検索遺伝子用グラフ表示領域
29に検索遺伝子の遺伝子発現パターンが表示される。
【0039】次に、検索遺伝子発現パターンを配列Targ
et[]にコピーする(ステップ33)。ローカル遺伝子デ
ータベースより検索遺伝子を選択しないとき、ユーザは
任意に遺伝子発現パターンを作成し、この作成した遺伝
子発現パターンを配列Target[]にコピーする(ステップ
32)。
【0040】図11は、図7のステップ13に示した検
索遺伝子発現パターンデータの設定に関する詳細フロー
である。まず、図5の検索遺伝子用グラフ表示領域29
に表示された全区間の検索遺伝子発現パターンの中か
ら、利用者が着目したい区間を選択区間設定枠30を用
いて選択する。選択した区間の開始点の値、終了点の値
を保持しておく(ステップ41)。
【0041】図12は、図5の選択区間設定枠30の検
索範囲に対応する遺伝子発現パターンデータの具体的な
構造を示した説明図である。検索する遺伝子の発現パタ
ーンデータを一次元配列Target[]で表す。すなわち、遺
伝子ID(id)の実験ケースs,s+1,…,s+case#num-
1におけるデータを検索遺伝子の発現データとすると
き、Target[]はTarget[1]=Exp[id][s],…,Target[ca
se#num]=Exp[id][s+case#num-1]となる。変数case#num
はTarget[]に格納する実験ケースの総数である。
【0042】次に、検索遺伝子に対して、どのような相
互関係を持つ遺伝子を検索対象遺伝子群から抽出したい
かにより、選択した区間の検索遺伝子発現パターンを変
形する(ステップ42)。この発現パターンの変形は、
変形オプションボックス24を用いて行われる。変形オ
プションボックス24の中にチェックが付されている変
形方式が選択された変形方式であり、選択区間設定枠3
0によって囲まれた遺伝子発現パターンの一部は、変形
オプション表示領域28上の変形表示ウインドウに、変
形を施さないそのままの形状の曲線とともに、それぞれ
選択した変形方式に従って変形されて表示される。変形
オプション表示領域28より任意の変形方法を1つ選
び、ポインティングデバイスによりスライドケース27
にドラッグアンドドロップすると、検索対象遺伝子用グ
ラフ表示領域25に検索区間設定枠26が設定される。
スライドケース27内で検索区間設定枠26を左右に動
かすことにより検索開始点を自由に設定することができ
る。
【0043】変形オプションとしては、曲線の上下を反
転する「抑制型」、発現量の倍率を変え曲線を縦軸方向
に拡大又は縮小する、あるいは曲線を横軸方向に拡大あ
るいは縮小する「倍率変化型」、さらに、ユーザが選択
した検索遺伝子発現パターンに対して、変形オプション
表示領域上でポインティングデバイス等を用いて任意の
変化を加える「ユーザ指定型」などがある。抑制型で変
形したパターンを用いて類似検索をすると、検索遺伝子
に対する抑制遺伝子を検索することができ、倍率変化型
で変形したパターンを用いて類似検索をすると、発現量
を増幅する遺伝子などを検索することができる。また、
ユーザ指定型の変形パターンを用いると、ユーザの考え
を反映したり、実験による誤差を修正して遺伝子検索を
行うことができる。変形オプションの種類は、ここに例
示したものに限られず、適宜のものを追加することが可
能である。
【0044】次に、類似度(非類似度)の距離計算方式
を決定する(ステップ43)。類似度あるいは非類似度
とは、2つの発現パターンの類似の程度を表す指標であ
る。この指標には、距離のように値の小さい方が類似性
が高いことを表す場合と、相関係数のように値の大きい
方が類似性が高いことを表す場合とがある。前者の指標
を非類似度、後者の指標を類似度という。類似度(非類
似度)の距離計算方式は、図6(d)に示した(非)類
似度タグ45によって任意の方法を選択する。図示した
例では、類似度としてピアソンの相関係数を選択でき、
また、非類似度としてユークリッド平方距離、標準化ユ
ークリッド平方距離、マハラノビスの(汎)距離、ミン
コフスキー距離等を選択することができる。ピアソンの
相関係数は、図22(f)に示したような常に一定の倍
率を持って発現が見られる遺伝子発現パターンを検索す
るときに有効であることが知られているので、類似度と
してピアソンの相関係数を選択する時は後述する帯を自
動的に不使用にするようにしてもよい。
【0045】次に、ユーザが図6(c)に示す帯の幅タ
グ設定44に所望の値を代入することにより帯の幅を決
定する。この値をWとする。(ステップ44)。帯の幅
について、図13を用いて説明する。帯とは、例えば図
13(a)に示すような発現パターンがあったとき、図
13(b)に示すように、任意の値(ここでは1)を発
現量の値に加減してできた、その発現パターンを中心と
した縦軸方向に幅を持った領域をいう。帯の幅を小さく
すれば、選択区間設定枠30によって囲まれた検索遺伝
子発現パターンの一部と類似度の高い発現パターンを有
する遺伝子のみが検索され、逆に帯の幅を大きくすれ
ば、類似度の比較的低い発現パターンを有する遺伝子も
検索されることになる。
【0046】また、ある遺伝子に着目し、その遺伝子発
現パターンを異なる体の部位の間で比べる時や、投薬
前、投薬後で比べる時などでは、個々の実験で温度やチ
ップ上のスポッティングの量などの実験環境の違いか
ら、測定された遺伝子発現データが均一でないときがあ
る。すなわち実験によって、遺伝子全体でみた時、発現
量の平均値や分散値に違いがあることがある。この時、
正規化処理を行うとこれらの違いを補正することができ
る。本システムでは正規化処理を適用するか否かを選択
できるようにしている(ステップ45)。正規化処理の
使用に関しては、図6(e)に示した正規化タグ46の
選択により決定する。正規化を選択した場合、検索遺伝
子、検索対象遺伝子ともに発現パターンデータに対し正
規化処理を行い、その値をもとに図5に示した表示画面
の検索対象遺伝子用グラフ表示領域25及び検索遺伝子
用グラフ表示領域29に表示する。
【0047】図14は、図7に示したステップ16の類
似パターン抽出処理の詳細フローである。まず、帯を用
いて発現パターンが全区間内において帯の幅の中に収ま
っている類似パターンを検索する。このとき、横軸上の
開始点をTsとする(ステップ51)。検索の途中で帯
内に入り類似パターンと認められた曲線はその時点でメ
モリに保存してもよいし、検索がすべて終了した後でメ
モリに保存してもかまわない。
【0048】図15は、帯を用いたことによって類似パ
ターンとして認められるパターンと、類似パターンとは
認められないパターンの例を示す説明図である。類似パ
ターンと認められるのは、発現パターンが選択された全
区間内において帯の幅の中に収まっているパターンであ
り、これには図15(a)に示すように遺伝子発現パタ
ーンが帯の変化とほぼ同じである場合、図15(b)に
示すように遺伝子発現パターンは帯の中央を通らないが
全ての値は帯と重なっている場合、図15(c)に示す
ように遺伝子発現パターンは帯の中央を通らないが全て
の値は帯と重なっている場合などがある。
【0049】これらの場合は具体的には、遺伝子IDがi
の遺伝子に対する発現データExp[i][Ts],Exp[i][Ts+
1],…,Exp[i][Ts+case#num-1]と検索する遺伝子の発
現パターンデータTarget[1],Target[2],…,Target[c
ase#num]との間に、次の〔数1〕の関係が全て成り立つ
場合であり、〔数1〕の関係を満たす遺伝子iは検索遺
伝子と類似の発現パターンを有するとみなす。
【0050】
【数1】 Target[1]-W≦Exp[i][Ts]≦Target[1]+W, Target[2]-W≦Exp[i][Ts+1]≦Target[2]+W, ……, Target[case#num]-W≦Exp[i][Ts+case#num-1]≦Target
[case#num]+W
【0051】一方、類似パターンと認められないのは、
図15(d)に示すように遺伝子発現パターンのうち初
期値から中ほどの値にかけて帯と重なるが最後ははみ出
てしまう場合、図15(e)に示すように初期の値が帯
からはみ出てしまう場合、図15(f)に示すように初
期の値と最後の値は帯と重なるが途中ではみ出てしまう
場合などである。
【0052】本発明では、図16に略示するように、横
軸区間は固定したまま、(a)〜(d)のように帯を縦
軸に関して上下にスライドさせながら、帯の範囲に含ま
れる遺伝子発現パターンを抽出する。ここで、検索遺伝
子の発現パターンと類似パターンと認められるのは、図
15(a)のように遺伝子発現パターンが帯の変化とほ
ぼ同じ場合、図15(b),(c)のように遺伝子発現
パターンは帯の中央を通らないが全ての値は帯と重なっ
ている場合である。
【0053】しかし、上記の方法によって発現パターン
が類似しているとは認められない遺伝子の中にも相互の
発現が関連性を有するものが含まれていることがある。
そこで、検索区間の前後の値が帯からはみ出ていても、
ある一定の割合で中央の値が重なっていれば類似パター
ンと認めるオプションを設ける。このオプションの設定
は図6(a)に示した帯オプション設定タグ42で行
う。帯オプションを例えば80%に指定するということ
は、選択区間設定枠30の横軸方向の幅をその中央値を
中心として80%の範囲に縮小したのと同じ効果を有す
る。したがって、図示の例の場合、図17に示すよう
に、帯オプション無しの検索では類似パターンとは認め
られなかった図15(d)や図15(e)のようなパタ
ーンも類似パターンとして認められることになる。ただ
し、図15(f)のように中央の値が帯からはみ出てい
る場合は、帯オプションを設定したとしても類似パター
ンとは認められない。図16(d)に示すように、帯が
区間設定枠の上部に達した場合、帯による検索は終了す
る。
【0054】図14に戻って、次にメモリに保存した帯
内に入る曲線に対し(非)類似度を算出する。すなわ
ち、図11のステップ43で設定した距離計算法に基づ
いて、検索遺伝子の発現パターンTarget[1],Target
[2],…,Target[case#num]と検索対象遺伝子の発現パ
ターンExp[i][Ts],Exp[i][Ts+1],…,Exp[i][Ts+case
#num-1]との間の(非)類似度を求める(ステップ5
2)(iは、帯に入る遺伝子発現パターンの遺伝子I
D)。次に、類似性の高い順((非)類似度の高い順)
に並べ替え(ステップ53)、表示画面の類似表31に
表示する。
【0055】図18は、詳細表示ボタン33をクリック
したとき表示される類似度の降順による遺伝子データの
表示例である。「類似度」の欄62には、(非)類似度
タグ45で選択した類似度あるいは非類似度の評価方法
によって評価された類似度あるいは非類似度の数値が表
示される。「検索区間」の欄63には、検索区間におけ
る検索対象データ60と検索データ61の曲線データが
表示される。また、「遺伝子に関する詳細表示」の欄6
4には、遺伝子が発現している生物体の部位、遺伝子の
塩基配列等、その遺伝子に関連する情報が表示される。
ユーザーは図5に示した表示画面上で検索区間設定枠2
6を横軸方向(左右)に動かすことにより検索開始点の
設定を行い検索を行うが、ユーザの検索したい区間にお
いて、検索開始点を自動的に移動しながら検索を行うよ
うにすることも可能である。
【0056】図19は、検索開始点を自動的に移動しな
がら検索を行う場合の説明図である。この場合には、ま
ず図19(a)に示すように、検索対象遺伝子用グラフ
表示領域25上の検索区間設定枠71をユーザの検索し
たい区間をカバーするように左右方向に広げる。次に、
検索開始点のステップ移動の距離を決める。これらの設
定をしておくことにより、図19(b)に略示するよう
に、検索区間設定枠71内で検索開始点が横軸方向に
,,…のように一定の間隔で自動的に設定される。
そして、各検索開始点において上方向に移動する帯が検
索区間設定枠71の上部に達すると、設定された移動距
離だけ帯を横軸方向にずらして再び帯を上方向に移動し
ながら検索を反復することで、検索区間設定枠71内の
全域に亘って自動的に検索を行なうことができる。
【0057】更に、帯または曲線を横にスライドしなが
ら検索することも可能である。図20は、帯又は曲線の
スライド方向を説明する図である。図20(a)は検索
区間設定枠73を縦軸方向に長く設定した場合の説明図
であり、前述のように、検索遺伝子の発現パターンの一
部あるいはそれを元に形成された帯を検索区間設定枠7
3内を上下に移動して類似パターンの検索を行う。この
とき、図中に白抜き矢印で示すように、検索区間設定枠
73は横軸方向に自由に移動することが可能である。
【0058】これに対して図20(b)は、検索区間設
定枠74を横軸方向に長く設定した場合の説明図であ
り、検索遺伝子の発現パターンの一部あるいはそれを元
に形成された帯を横軸方向にスライドさせながら検索を
行う。図21は発現パターンの一部あるいはそれを元に
作成された帯を横軸方向にスライドさせながら検索を行
う様子を模式的に示したものであり、図21(a)〜
(d)に示すように、発現量区間を固定したまま、帯を
横軸に関して左から右へスライドさせ、帯の範囲に含ま
れる遺伝子曲線を抽出する。この方法は遺伝子のカスケ
ードの検出に有効である。この場合にも、図中に白抜き
矢印で示すように、検索区間設定枠74を縦軸方向に自
由に移動することが可能である。
【0059】以上、代表的な例を用いて本発明を具体的
に説明したが、遺伝子発現データベースはローカルなも
のだけではなく、ネットワーク上のものも利用できる。
また、 一つの検索遺伝子について、複数の変形オプシ
ョンを同時に選択し、これらを用い並行処理により同時
に検索することも可能である。更に、上記説明では検索
する遺伝子は一度に1つしか選択しなかったが、複数選
択して並行処理により各遺伝子の発現パターンにそれぞ
れ類似する曲線を同時に検索することも可能である。
【0060】
【発明の効果】以上説明したように、本発明によれば、
遺伝子等の大量の未知の生体高分子群から既知の生体高
分子の発現情報をもとに関連ある生体高分子を抽出し、
その生体高分子の生物学的機能を効率よく推測すること
ができる。
【図面の簡単な説明】
【図1】本発明の方法に用いるシステムの一例の概略構
成図。
【図2】本発明による類似パターン検索の例を示す図。
【図3】検索対象遺伝子発現パターンデータの例を示す
図。
【図4】グラフ上の遺伝子発現パターンデータと二次元
配列における遺伝子発現パターンデータの対応例を示す
図。
【図5】表示装置の表示画面の一例を示す説明図。
【図6】詳細設定ウインドウの説明図。
【図7】本発明による類似遺伝子発現パターン抽出処理
の概要を示すフローチャート。
【図8】検索対象遺伝子発現パターンデータの登録処理
に関するフローチャート。
【図9】遺伝子データから検索対象遺伝子と検索遺伝子
を選択する例を示す説明図。
【図10】検索遺伝子発現パターンデータの入力処理に
関するフローチャート。
【図11】検索遺伝子発現パターンの詳細設定及び距離
計算法に関するフローチャート。
【図12】検索遺伝子発現パターンデータの例を示す
図。
【図13】帯の幅に関する説明図。
【図14】類似パターン抽出処理の詳細設定に関するフ
ローチャート。
【図15】類似パターン抽出処理において、類似パター
ンと認められる場合と認められない場合の例を示す図。
【図16】区間設定枠内の帯の縦軸方向のスライドを説
明する図。
【図17】帯オプション設定例を示す図。
【図18】類似性の高い順による遺伝子データの表示例
を示す図。
【図19】検索区間を指定し自動的に検索する例を示す
図。
【図20】検索区間設定の説明図。
【図21】区間設定枠内の帯の横軸方向のスライドに関
する例を示す図。
【図22】従来の方法で検索できなかった遺伝子発現パ
ターンの例を示す図。
【図23】遺伝子のカスケードの例を示す図。
【図24】従来の類似パターン抽出処理法の説明図。
【符号の説明】
10…中央処理装置、11…表示装置、12…キーボー
ド、13…マウス、14…遺伝子発現パターンデータ、
15…表示処理部、16…データ解析部、17…入力処
理部、21…詳細設定ボタン、22…検索対象遺伝子表
示ボックス、23…検索遺伝子表示ボックス、24…変
形オプションボックス、25…検索対象遺伝子用グラフ
表示領域、26…検索区間設定枠、27…スライドケー
ス、28…変形オプション表示領域、29…検索遺伝子
用グラフ表示領域、30…選択区間設定枠、31…類似
表、32…検索ボタン、33…詳細表示ボタン、41…
詳細設定ウインドウ、42…帯オプション設定タグ、4
3…帯使用タグ、44…帯の幅設定タグ、45…(非)
類似度タグ、46…正規化タグ、51…ローカル遺伝子
データベース表示ボックス、52…検索対象遺伝子表示
ボックス、53…検索遺伝子表示ボックス、60…検索
対象データ、61…検索データ、71…検索区間設定
枠、73…検索区間設定枠、74…検索区間設定枠
───────────────────────────────────────────────────── フロントページの続き (72)発明者 野崎 康行 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 (72)発明者 中重 亮 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 (72)発明者 田村 卓郎 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 Fターム(参考) 4B024 AA20 HA20 5B075 ND08 ND20 NK37 PR06 QM02 QM08 UU26

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 生体高分子に対する複数の実験ケースと
    発現量との関係を表す検索対象発現パターンの集合の中
    から検索発現パターンに類似するものを抽出する類似発
    現パターン抽出方法において、 前記検索発現パターンの一部分を取り出し、取り出した
    パターン部分のパターン形状と類似するパターン形状を
    含む検索対象発現パターンを抽出することを特徴とする
    類似発現パターン抽出方法。
  2. 【請求項2】 請求項1記載の類似発現パターン抽出方
    法において、前記取り出したパターン部分に加工処理を
    施し、加工されたパターン部分のパターン形状と類似す
    るパターン形状を含む検索対象発現パターンを抽出する
    ことを特徴とする類似発現パターン抽出方法。
  3. 【請求項3】 請求項2記載の類似発現パターン抽出方
    法において、前記加工処理は取り出したパターン部分を
    縦軸(発現量軸)に対して上下反転する処理であること
    を特徴とする類似発現パターン抽出方法。
  4. 【請求項4】 請求項2記載の類似発現パターン抽出方
    法において、前記加工処理は取り出さしたパターン部分
    の縦軸(発現量軸)方向あるいは横軸(実験ケース軸)
    方向の倍率を変化させる処理であることを特徴とする類
    似発現パターン抽出方法。
  5. 【請求項5】 請求項1〜4のいずれか1項記載の類似
    発現パターン抽出方法において、前記パターン部分に対
    し実験ケース毎に所定量の発現量を加減することによっ
    て縦軸(発現量軸)方向に一定の幅を持った帯状のパタ
    ーンを発生し、パターンの一部が当該帯状のパターンの
    中に全て入る検索対象発現パターンを抽出することを特
    徴とする類似発現パターン抽出方法。
  6. 【請求項6】 請求項5記載の類似発現パターン抽出方
    法において、前記帯状のパターンを縦軸方向あるいは横
    軸方向に平行移動しながら、前記パターン部分が当該帯
    状のパターンの中に全て入る検索対象発現パターンを抽
    出することを特徴とする類似発現パターン抽出方法。
  7. 【請求項7】 請求項1〜6のいずれか1項記載の類似
    発現パターン抽出方法において、前記生体高分子は遺伝
    子、DNA、cDNA、RNA、DNA断片又はタンパ
    ク質であることを特徴とする類似発現パターン抽出方
    法。
  8. 【請求項8】 請求項1〜7のいずれか1項記載の類似
    発現パターン抽出方法において、前記実験ケースは時系
    列に沿った実験であることを特徴とする類似発現パター
    ン抽出方法。
  9. 【請求項9】 請求項1〜7のいずれか1項記載の類似
    発現パターン抽出方法において、前記実験ケースは個体
    の種別であることを特徴とする類似発現パターン抽出方
    法。
  10. 【請求項10】 請求項1〜7のいずれか1項記載の類
    似発現パターン抽出方法において、前記実験ケースは個
    体の部位であることを特徴とする類似発現パターン抽出
    方法。
  11. 【請求項11】 請求項1〜7のいずれか1項記載の類
    似発現パターン抽出方法において、前記実験ケースは人
    工的な条件の印加と無印加であることを特徴とする類似
    発現パターン抽出方法。
  12. 【請求項12】 請求項1〜7のいずれか1項記載の類
    似発現パターン抽出方法において、前記実験ケースは時
    系列に沿った実験、異なる種、個体の部位、及び人工的
    な条件の印加と無印加のうちの複数を複合したものであ
    ることを特徴とする類似発現パターン抽出方法。
  13. 【請求項13】 生体高分子に対する複数の実験ケース
    と発現量との関係を表す発現パターンどうしを比較し
    て、検索対象生体高分子の中から検索生体高分子と発現
    において関連を有する生体高分子を抽出する関連生体高
    分子抽出方法において、 検索生体高分子の発現パターンの一部分を取り出し、取
    り出したパターン部分のパターン形状と類似するパター
    ン形状を含む発現パターンを有する検索対象生体高分子
    を抽出することを特徴とする関連生体高分子抽出方法。
  14. 【請求項14】 請求項13記載の関連生体高分子抽出
    方法において、前記取り出したパターン部分に加工処理
    を施し、加工されたパターン部分のパターン形状と類似
    するパターン形状を含む発現パターンを有する検索対象
    生体高分子抽出することを特徴とする関連生体高分子抽
    出方法。
  15. 【請求項15】 請求項14記載の関連生体高分子抽出
    方法において、前記加工処理は前記パターン部分を縦軸
    (発現量軸)方向に対して上下反転する処理であること
    を特徴とする関連生体高分子抽出方法。
  16. 【請求項16】 請求項14記載の関連生体高分子抽出
    方法において、前記加工処理は前記パターン部分の縦軸
    (発現量軸)方向あるいは横軸(実験ケース軸)方向の
    倍率を変化させる処理であることを特徴とする関連生体
    高分子抽出方法。
  17. 【請求項17】 請求項13〜16のいずれか1項記載
    の関連生体高分子抽出方法において、前記取り出したパ
    ターン部分に対し実験ケース毎に所定量の発現量を加減
    することによって縦軸(発現量軸)方向に一定の幅を持
    った帯状のパターンを発生し、パターンの一部が当該帯
    状のパターンの中に全て入る発現パターンを有する検索
    対象生体高分子を抽出することを特徴とする関連生体高
    分子抽出方法。
  18. 【請求項18】 請求項17記載の関連生体高分子抽出
    方法において、前記帯状のパターンを縦軸方向あるいは
    横軸方向に平行移動しながら、パターンの一部が当該帯
    状のパターンの中に全て入る検索対象発現パターンを有
    する検索対象生体高分子を抽出することを特徴とする関
    連生体高分子抽出方法。
  19. 【請求項19】 請求項13〜18のいずれか1項記載
    の関連生体高分子抽出方法において、前記生体高分子は
    遺伝子、DNA、cDNA、RNA、DNA断片又はタ
    ンパク質であることを特徴とする関連生体高分子抽出方
    法。
  20. 【請求項20】 請求項13〜19のいずれか1項記載
    の関連生体高分子抽出方法において、前記実験ケースは
    時系列に沿った実験であることを特徴とする関連生体高
    分子抽出方法。
  21. 【請求項21】 請求項13〜19のいずれか1項記載
    の関連生体高分子抽出方法において、前記実験ケースは
    個体の種別であることを特徴とする関連生体高分子抽出
    方法。
  22. 【請求項22】 請求項13〜19のいずれか1項記載
    の関連生体高分子抽出方法において、前記実験ケースは
    個体の部位であることを特徴とする関連生体高分子抽出
    方法。
  23. 【請求項23】 請求項13〜19のいずれか1項記載
    の関連生体高分子抽出方法において、前記実験ケースは
    人工的な条件の印加と無印加であることを特徴とする関
    連生体高分子抽出方法。
  24. 【請求項24】 請求項13〜19のいずれか1項記載
    の関連生体高分子抽出方法において、前記実験ケースは
    時系列に沿った実験、異なる種、個体の部位、及び人工
    的な条件の印加と無印加のうちの複数を複合したもので
    あることを特徴とする関連生体高分子抽出方法。
JP37143499A 1999-12-27 1999-12-27 類似発現パターン抽出方法及び関連生体高分子抽出方法 Expired - Fee Related JP4298101B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP37143499A JP4298101B2 (ja) 1999-12-27 1999-12-27 類似発現パターン抽出方法及び関連生体高分子抽出方法
EP00125806A EP1113078A1 (en) 1999-12-27 2000-11-24 Methods for extracting similar expression patterns and related biopolymers
US09/739,525 US7277798B2 (en) 1999-12-27 2000-12-14 Methods for extracting similar expression patterns and related biopolymers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP37143499A JP4298101B2 (ja) 1999-12-27 1999-12-27 類似発現パターン抽出方法及び関連生体高分子抽出方法

Publications (2)

Publication Number Publication Date
JP2001178463A true JP2001178463A (ja) 2001-07-03
JP4298101B2 JP4298101B2 (ja) 2009-07-15

Family

ID=18498715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP37143499A Expired - Fee Related JP4298101B2 (ja) 1999-12-27 1999-12-27 類似発現パターン抽出方法及び関連生体高分子抽出方法

Country Status (3)

Country Link
US (1) US7277798B2 (ja)
EP (1) EP1113078A1 (ja)
JP (1) JP4298101B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010164484A (ja) * 2009-01-16 2010-07-29 Toshiba Corp 自動分析装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040265830A1 (en) * 2001-10-17 2004-12-30 Aniko Szabo Methods for identifying differentially expressed genes by multivariate analysis of microaaray data
US7221605B2 (en) * 2004-08-31 2007-05-22 Micron Technology, Inc. Switched capacitor DRAM sense amplifier with immunity to mismatch and offsets
US7176719B2 (en) * 2004-08-31 2007-02-13 Micron Technology, Inc. Capacitively-coupled level restore circuits for low voltage swing logic circuits
DE102005037921B3 (de) * 2005-08-11 2006-06-14 Dräger Medical AG & Co. KG Temperaturmessvorrichtung mit Funktionsindikator

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4852183A (en) * 1986-05-23 1989-07-25 Mitsubishi Denki Kabushiki Kaisha Pattern recognition system
JP3180655B2 (ja) 1995-06-19 2001-06-25 日本電信電話株式会社 パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JP3551667B2 (ja) 1996-12-04 2004-08-11 株式会社日立製作所 はんだバンプの高さ測定方法
US6950752B1 (en) * 1998-10-27 2005-09-27 Rosetta Inpharmatics Llc Methods for removing artifact from biological profiles
US20020115070A1 (en) * 1999-03-15 2002-08-22 Pablo Tamayo Methods and apparatus for analyzing gene expression data
US6692916B2 (en) * 1999-06-28 2004-02-17 Source Precision Medicine, Inc. Systems and methods for characterizing a biological condition or agent using precision gene expression profiles

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010164484A (ja) * 2009-01-16 2010-07-29 Toshiba Corp 自動分析装置

Also Published As

Publication number Publication date
JP4298101B2 (ja) 2009-07-15
US20010016318A1 (en) 2001-08-23
US7277798B2 (en) 2007-10-02
EP1113078A1 (en) 2001-07-04

Similar Documents

Publication Publication Date Title
Barrett et al. Mining microarray data at NCBI’s Gene Expression Omnibus (GEO)
Singh et al. Feature selection of gene expression data for cancer classification: a review
US10275711B2 (en) System and method for scientific information knowledge management
JP5464503B2 (ja) 医療分析システム
US7243112B2 (en) Multidimensional biodata integration and relationship inference
US20060020398A1 (en) Integration of gene expression data and non-gene data
US8364665B2 (en) Directional expression-based scientific information knowledge management
US20210381056A1 (en) Systems and methods for joint interactive visualization of gene expression and dna chromatin accessibility
Pagnuco et al. Analysis of genetic association using hierarchical clustering and cluster validation indices
Torkkola et al. Self-organizing maps in mining gene expression data
JP4298101B2 (ja) 類似発現パターン抽出方法及び関連生体高分子抽出方法
Vilo et al. Regulatory sequence analysis: application to the interpretation of gene expression
WO2002093454A1 (en) System, method and computer readable medium for analysis of clusters of gene expression data
US20020178150A1 (en) Analysis mechanism for genetic data
JP3563315B2 (ja) 樹状図表示方法及び樹状図表示システム
US6994965B2 (en) Method for displaying results of hybridization experiment
Saviozzi et al. Microarray data analysis and mining
Booma et al. CLASSIFICATION OF GENES FOR DISEASE IDENTIFICATION USING DATA MINING TECHNIQUES.
JP2002183153A (ja) 生理現象関連遺伝子情報の提供装置、その提供方法及びその提供を行うためのプログラムを格納した記録媒体
KR100882899B1 (ko) 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체
EP4022646A1 (en) A prioritization and scoring method
Şener et al. Inferring similarity between time-series microarrays: A content-based approach
Abbas et al. DNA Microarray Data Management and Analysis: A General Framework
Selvanayaki et al. Finding microarray genes using GO ontology
THIAGARAJAN By ALEXANDER I. SAEED, NIRMAL K. BHAGABATI, JOHN C. BRAISTED, WEI LIANG, VASILY SHAROV, ELEANOR A. HOWE, JIANWEI LI, MATHANGI THIAGARAJAN, JOSEPH A. WHITE, and JOHN QUACKENBUSH

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040519

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040927

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041101

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090316

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090415

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150424

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees