JP2010086142A - 遺伝子クラスタリング装置およびプログラム - Google Patents
遺伝子クラスタリング装置およびプログラム Download PDFInfo
- Publication number
- JP2010086142A JP2010086142A JP2008252353A JP2008252353A JP2010086142A JP 2010086142 A JP2010086142 A JP 2010086142A JP 2008252353 A JP2008252353 A JP 2008252353A JP 2008252353 A JP2008252353 A JP 2008252353A JP 2010086142 A JP2010086142 A JP 2010086142A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- clustering
- motif
- genes
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】複数の遺伝子を配列の類似性に基づいてクラスタリングする遺伝子クラスタリング装置10であって、遺伝子配列に含まれるモチーフ配列を検索するモチーフ検索部17と、各々の遺伝子配列に含まれるモチーフ配列を比較することにより、任意の2つの遺伝子の類似度スコアを計算するモチーフスコア計算部19と、類似度スコアを用いて、任意の2つの遺伝子の遺伝子間距離を計算する遺伝子間距離計算部20と、遺伝子間距離に基づいて、複数の遺伝子のクラスタリングを行うクラスタリング処理部21と、遺伝子発現データを比較する発現データ取得部22とを備える。
【選択図】図1
Description
従来、遺伝子のクラスタリングには最大節約法、最尤法、近隣結合法などが用いられている。これらの方法は、クラスタリング対象となる遺伝子の配列を直接比較しながら、系統樹を作成する点が共通である。このようなクラスタリングを利用した例として、非特許文献1に開示されたクラスタリングとアラインメントのためのプログラムなどがあげられる。
本発明では、遺伝子配列に含まれるモチーフを指標として遺伝子の類似度を解析したクラスタと遺伝子発現データの関係を比較するようにした。進化的には離れていても類似した機能を持つ遺伝子は同様のモチーフを持っていることが多いため、本発明は、広い生物種間での機能類似遺伝子の発見や、未知の遺伝子の機能推定等に大変有効である。また、モチーフレベルで類似で同様な機能が期待されながら遺伝子発現の時期などの相違があるものを見出すことで、さらにターゲットとなるタンパク質などの相違などを推定するのに大変有効である。
本発明では、遺伝子配列に含まれるモチーフを指標として遺伝子の類似度を解析したクラスタと遺伝子発現データの関係を比較するようにした。進化的には離れていても類似した機能を持つ遺伝子は同様のモチーフを持っていることが多いため、本発明は、広い生物種間での機能類似遺伝子の発見や、未知の遺伝子の機能推定等に大変有効である。また、モチーフレベルで類似で同様な機能が期待されながら遺伝子発現の時期などの相違があるものを見出すことで、さらにターゲットとなるタンパク質などの相違などを推定するのに大変有効である。
本発明によれば、それぞれの遺伝子に関する異なるデータに基づいて作成された2つ以上のデンドログラムが、どの程度類似しているかを容易に比較、把握できる。特にモチーフを基にしたデンドログラムから構造的に類似であることが分かっている遺伝子群に対して、発現時期や発現部位などによって発現パターンが異なっていることが容易に把握できる。これらの情報を利用することにより、遺伝子としての機能の違い、つまり、生成されたタンパク質の相互作用する相手が異なっている可能性や、作用するネットワークに相違があることなど、重要な情報を得ることができる。
実施の形態1.
図1は、本発明の実施の形態1による、遺伝子クラスタリング装置10の機能構成を示すブロック図である。図に示すように、遺伝子クラスタリング装置10は、入力装置11、ユーザインターフェイス部12、データアクセス部13、遺伝子配列記憶部14、スコア記憶部15、モチーフ記憶部16、遺伝子発現データ記憶部17、モチーフ検索部18、モチーフスコア計算部19、遺伝子間距離計算部20、クラスタリング処理部21、発現データ取得部22、出力装置23、発現データ表示部24を備えている。
入力装置11は、例えばキーボード、マウス、タッチパネル等の入力手段であり、ユーザが遺伝子クラスタリング装置10に処理の指示を与えたり、データやパラメータを入力するために用いられる。また、USB(Universal Serial Bus)インターフェイスを介して、メモリ媒体などからデータを読み込むことも可能である。ユーザによる入力装置11を介した操作はユーザインターフェイス部12によって制御される。
出力装置23は、表示装置やプリンタ等である。
イネ: http://rapdb.lab.nig.ac.jp/(RAP1)
シロイヌナズナ: http://mips.gsf.de/proj/thal/db/(MIPS)
紅藻:http://merolae.biol.s.u-tokyo.ac.jp/
なお、遺伝子群の選び方は上記の方法に限られず、他の配列解析手法を用いてもよい。
なお、本実施形態では、モチーフ以外の領域についてはスコア算出を行っていない。これはモチーフ以外の部分をスコア0とみなしていることを意味する。モチーフという配列が保存された部分に絞り、スコアを算出することで高速にクラスタリングを実施している。もし、さらに必要があれば、単に保存された配列モチーフだけでなく、二次構造予測などの機能を加え、αヘリックスやβシートなどを決めている構造部分を抽出し、それらをモチーフとしてスコアを与えることで、機能だけでなく構造類似のクラスタリングを行わせることも可能である。
例えば、遺伝子1に含まれるモチーフ1と、遺伝子2に含まれるモチーフ2の配列が下記のとおりとする。
モチーフ1:WKCEKCAK
モチーフ2:WKCDKCN
スコア=13+6+9+3+6+9+(−3)=43
このようにして、遺伝子1および遺伝子2に含まれているすべてのモチーフ同士について総当りでスコアを求める。さらに、すべてのモチーフ同士のスコアの和を求め、遺伝子1と遺伝子2の類似度スコアとする。ここで、モチーフ相互に比較するに当たって、アミノ酸残基の欠失や挿入を考慮して最適なスコアを算出する場合は、部分最適並置を求める動的計画法を用いたアルゴリズムSmith-Waterman法(Smith TF, Waterman MS (1981). "Identification of Common Molecular Subsequences". Journal of Molecular Biology 147: 195-197.)を利用している。
実施の形態2では、遺伝子のモチーフ情報を用いたクラスタリングに加え、さらに遺伝子の発現データを用いたクラスタリングを行い、両者の結果を比較できるように表示する。
複数のクラスタリング結果を比較する方法について図11を用いて説明する。図11は、クラスタリング処理部21が遺伝子のモチーフ情報を用いて算出したデンドログラムを上部に、遺伝子の発現データを用いてクラスタリングした結果を下部に対向して表示した例である。また、中間位置には、後述するような各クラスタの比較を行うためのヒートマップ領域115a、116a、115b、116bが示されている。
Claims (4)
- 複数の遺伝子を配列の類似性に基づいてクラスタリングする遺伝子クラスタリング装置であって、
遺伝子配列に含まれるモチーフ配列を検索するモチーフ検索部と、
各々の遺伝子配列に含まれるモチーフ配列を比較することにより、任意の2つの遺伝子の類似度スコアを計算するモチーフスコア計算部と、
前記類似度スコアを用いて、任意の2つの遺伝子の遺伝子間距離を計算する遺伝子間距離計算部と、
前記遺伝子間距離に基づいて、前記複数の遺伝子のクラスタリングを行うクラスタリング処理部と、
各々の遺伝子の発現データを遺伝子発現データ記憶部から取得する発現データ取得部と、
取得した前記各々の遺伝子の発現データを、各々の遺伝子に対応した位置に表示する発現データ表示部とを備えたことを特徴とする遺伝子クラスタリング装置。 - 複数の遺伝子を2つ以上の特徴ベクトル量を用いてそれぞれクラスタリングを行った結果を比較する遺伝子クラスタリング装置であって、
それぞれの前記特徴ベクトル量を用いてクラスタリングを実行するクラスタリング処理部と、
前記クラスタリングの結果に基づいて、それぞれのサブクラスタの距離情報を一次元の階調数列に変換する階調変換部と、
それぞれの前記特徴ベクトル量を用いたクラスタリング結果について、前記一次元の階調数列に変換した結果を並列に表示する並列表示部とを備えたことを特徴とする遺伝子クラスタリング装置。 - コンピュータを、
複数の遺伝子を配列の類似性に基づいてクラスタリングする遺伝子クラスタリング装置として機能させるプログラムであって、
遺伝子配列に含まれるモチーフ配列を検索するモチーフ検索部と、
各々の遺伝子配列に含まれるモチーフ配列を比較することにより、任意の2つの遺伝子の類似度スコアを計算するモチーフスコア計算部と、
前記類似度スコアを用いて、任意の2つの遺伝子の遺伝子間距離を計算する遺伝子間距離計算部と、
前記遺伝子間距離に基づいて、前記複数の遺伝子のクラスタリングを行うクラスタリング処理部と、
各々の遺伝子の発現データを遺伝子発現データ記憶部から取得する発現データ取得部と、
取得した前記各々の遺伝子の発現データを、各々の遺伝子に対応した位置に表示する発現データ表示部として機能させることを特徴とするプログラム。 - コンピュータを、
複数の遺伝子を2つ以上の特徴ベクトル量を用いてそれぞれクラスタリングを行った結果を比較する遺伝子クラスタリング装置として機能させるプログラムであって、
それぞれの前記特徴ベクトル量を用いてクラスタリングを実行するクラスタリング処理部と、
前記クラスタリングの結果に基づいて、それぞれのサブクラスタの距離情報を一次元の階調数列に変換する階調変換部と、
それぞれの前記特徴ベクトル量を用いたクラスタリング結果について、前記一次元の階調数列に変換した結果を並列に表示する並列表示部として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008252353A JP5453613B2 (ja) | 2008-09-30 | 2008-09-30 | 遺伝子クラスタリング装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008252353A JP5453613B2 (ja) | 2008-09-30 | 2008-09-30 | 遺伝子クラスタリング装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010086142A true JP2010086142A (ja) | 2010-04-15 |
JP5453613B2 JP5453613B2 (ja) | 2014-03-26 |
Family
ID=42250065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008252353A Expired - Fee Related JP5453613B2 (ja) | 2008-09-30 | 2008-09-30 | 遺伝子クラスタリング装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5453613B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014146318A (ja) * | 2013-01-28 | 2014-08-14 | Hasso Plattner Institute Fur Softwaresystemtechnik Gmbh | インメモリデータベースシステム及びリアルタイム解析を用いるゲノムデータ処理のシステム及び方法 |
WO2016068245A1 (ja) * | 2014-10-30 | 2016-05-06 | 株式会社 東芝 | 遺伝子型推定装置、方法、及びプログラム |
JP2018510438A (ja) * | 2015-02-06 | 2018-04-12 | センス エデュケーション イスラエル リミテッド | 応答の査定のための半自動システム及び方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002366594A (ja) * | 2001-06-07 | 2002-12-20 | Hitachi Software Eng Co Ltd | 樹状図表示方法 |
JP2004078371A (ja) * | 2002-08-13 | 2004-03-11 | Ntt Data Corp | データ処理装置、方法及びコンピュータプログラム |
JP2004512494A (ja) * | 2000-02-04 | 2004-04-22 | イーオミカ・インコーポレイテッド | ゲノム配列から導き出された機能情報を推定、確認および表示する方法および装置 |
JP2007207113A (ja) * | 2006-02-03 | 2007-08-16 | Hitachi Software Eng Co Ltd | 系統樹表示システム |
JP2007209305A (ja) * | 2006-02-13 | 2007-08-23 | Hitachi Software Eng Co Ltd | 進化過程を考慮した保存領域検出システム |
WO2008042754A2 (en) * | 2006-10-02 | 2008-04-10 | Sea Lane Biotechnologies, Llc | Design and construction of diverse synthetic peptide and polypeptide libraries |
WO2008043765A1 (en) * | 2006-10-09 | 2008-04-17 | Qiagen Gmbh | Thermus eggertssonii dna polymerases |
-
2008
- 2008-09-30 JP JP2008252353A patent/JP5453613B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004512494A (ja) * | 2000-02-04 | 2004-04-22 | イーオミカ・インコーポレイテッド | ゲノム配列から導き出された機能情報を推定、確認および表示する方法および装置 |
JP2002366594A (ja) * | 2001-06-07 | 2002-12-20 | Hitachi Software Eng Co Ltd | 樹状図表示方法 |
JP2004078371A (ja) * | 2002-08-13 | 2004-03-11 | Ntt Data Corp | データ処理装置、方法及びコンピュータプログラム |
JP2007207113A (ja) * | 2006-02-03 | 2007-08-16 | Hitachi Software Eng Co Ltd | 系統樹表示システム |
JP2007209305A (ja) * | 2006-02-13 | 2007-08-23 | Hitachi Software Eng Co Ltd | 進化過程を考慮した保存領域検出システム |
WO2008042754A2 (en) * | 2006-10-02 | 2008-04-10 | Sea Lane Biotechnologies, Llc | Design and construction of diverse synthetic peptide and polypeptide libraries |
WO2008043765A1 (en) * | 2006-10-09 | 2008-04-17 | Qiagen Gmbh | Thermus eggertssonii dna polymerases |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014146318A (ja) * | 2013-01-28 | 2014-08-14 | Hasso Plattner Institute Fur Softwaresystemtechnik Gmbh | インメモリデータベースシステム及びリアルタイム解析を用いるゲノムデータ処理のシステム及び方法 |
WO2016068245A1 (ja) * | 2014-10-30 | 2016-05-06 | 株式会社 東芝 | 遺伝子型推定装置、方法、及びプログラム |
JPWO2016068245A1 (ja) * | 2014-10-30 | 2017-06-08 | 株式会社東芝 | 遺伝子型推定装置、方法、及びプログラム |
US11355219B2 (en) | 2014-10-30 | 2022-06-07 | Kabushiki Kaisha Toshiba | Genotype estimation device, method, and program |
JP2018510438A (ja) * | 2015-02-06 | 2018-04-12 | センス エデュケーション イスラエル リミテッド | 応答の査定のための半自動システム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5453613B2 (ja) | 2014-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Movahedi et al. | Comparative co‐expression analysis in plant biology | |
Wang et al. | Seventy million years of concerted evolution of a homoeologous chromosome pair, in parallel, in major Poaceae lineages | |
Wu et al. | Prediction of deleterious nonsynonymous single-nucleotide polymorphism for human diseases | |
Mochida et al. | Large-scale collection and analysis of full-length cDNAs from Brachypodium distachyon and integration with Pooideae sequence resources | |
Chen et al. | Gene ontology based housekeeping gene selection for RNA-seq normalization | |
Heinrich et al. | Identification of regulatory SNPs associated with vicine and convicine content of Vicia faba based on genotyping by sequencing data using deep learning | |
Julca et al. | Toward kingdom-wide analyses of gene expression | |
JP5453613B2 (ja) | 遺伝子クラスタリング装置およびプログラム | |
Penev et al. | TwinCons: Conservation score for uncovering deep sequence similarity and divergence | |
Bokros et al. | Multispecies genome-wide analysis defines the MAP3K gene family in Gossypium hirsutum and reveals conserved family expansions | |
Wang et al. | MetaProm: a neural network based meta-predictor for alternative human promoter prediction | |
CN106446601B (zh) | 一种大规模标注lncRNA功能的方法 | |
Cui et al. | A combined $ p $-value approach to infer pathway regulations in eQTL mapping | |
Bouyioukos et al. | Characterisation and analysis of the Aegilops sharonensis transcriptome, a wild relative of wheat in the Sitopsis section | |
Wisecaver et al. | The impact of automated filtering of BLAST-determined homologs in the phylogenetic detection of horizontal gene transfer from a transcriptome assembly | |
JP5007803B2 (ja) | 遺伝子クラスタリング装置、遺伝子クラスタリング方法およびプログラム | |
Qu et al. | Deep learning approach to biogeographical ancestry inference | |
Daware et al. | Integrated genomic strategies for cereal genetic enhancement: combining QTL and association mapping | |
Qu et al. | Biogeographical Ancestry Inference from Genotype: A Comparison of Ancestral Informative SNPs and Genome-wide SNPs | |
Gruszka et al. | The barley EST DNA Replication and Repair Database (bEST-DRRD) as a tool for the identification of the genes involved in DNA replication and repair | |
Karam et al. | Transcriptome data mining towards characterization of single nucleotide polymorphisms (SNPs) controlling salinity tolerance in bread wheat | |
Kielbasa et al. | Prediction of cis-regulatory elements of coregulated genes | |
Abid et al. | Discriminant analysis for the eigenvalues of variance covariance matrix of FFT scaling of DNA sequences: an empirical study of some organisms | |
Brown et al. | Data on the first functionally-annotated de novo transcriptome assembly for North American flying squirrels (genus Glaucomys) | |
Pratheek et al. | Functional annotation of hypothetical proteins involved in multiple stress response in Oryza sativa |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100812 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130416 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131212 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |