JP2005216190A - 立体マトリックス形式を用いたオントロジーの表示方法、表示用プログラム、およびその利用システム - Google Patents
立体マトリックス形式を用いたオントロジーの表示方法、表示用プログラム、およびその利用システム Download PDFInfo
- Publication number
- JP2005216190A JP2005216190A JP2004024895A JP2004024895A JP2005216190A JP 2005216190 A JP2005216190 A JP 2005216190A JP 2004024895 A JP2004024895 A JP 2004024895A JP 2004024895 A JP2004024895 A JP 2004024895A JP 2005216190 A JP2005216190 A JP 2005216190A
- Authority
- JP
- Japan
- Prior art keywords
- ontology
- data
- displayed
- dimensional matrix
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 ユーザにとってより利用しやすいオントロジーの利用システム、オントロジーの表示方法および表示用プログラムを提供すること。
【解決手段】 植物の形質・器官・発生に関するオントロジー全体が、表示領域1400に立体マトリックス形式で表示される。登録された各データには、この立体マトリックス上の位置と関連付けられた識別記号が付与されている。スライダー1401によって選択された平面は表示領域1402に表示され、さらに、この平面上の位置に関連付けられたデータが複数の点として表示される。これら複数の点の中から任意の点1404が選択されると、その点1404に関する詳細情報がデータベースを参照して取り出され、一括して表示領域1406・1407・1408に表示される。
【選択図】図14
【解決手段】 植物の形質・器官・発生に関するオントロジー全体が、表示領域1400に立体マトリックス形式で表示される。登録された各データには、この立体マトリックス上の位置と関連付けられた識別記号が付与されている。スライダー1401によって選択された平面は表示領域1402に表示され、さらに、この平面上の位置に関連付けられたデータが複数の点として表示される。これら複数の点の中から任意の点1404が選択されると、その点1404に関する詳細情報がデータベースを参照して取り出され、一括して表示領域1406・1407・1408に表示される。
【選択図】図14
Description
本発明は、立体マトリックス形式を用いたオントロジー(ontology)の表示方法、表示用プログラム、およびその利用システムに関し、好適には、植物又は動物の形質・器官・発生に関するオントロジーの表示方法等に関するものである。
近年のゲノム解析の進展によって、各種モデル生物のDNA配列が明らかになってきた。これにより、DNA配列から、遺伝子の機能・相互作用の解析、タンパク質の立体構造・相互作用・生体内での高次機能などの解析が行われている。さらに、単独の生物種だけでなく、複数の生物種間での解析も重要性を増してきており、これらを実現する概念としてオントロジー(ontology)が注目されている。
ここでいうオントロジーは、単独または複数の生物種において生物に関する様々な情報を共有するための概念であり、換言すれば、一定の目的で生物に関する一定の情報を統合したデータの統合体ということができる。従来のオントロジーは、構成要素として複数のターム(Term)を持っている。タームは、生物に関する情報を表す。ターム同士は、そのタームの持つ情報の意味により互いに関連付けられ、ネットワーク状の構造を形成している。オントロジーには様々な種類が存在しており、生物の遺伝子に関する情報を表現したGene Ontology(以下、「GO」という。)、植物の器官と発生に関する情報を表現したPlant Ontology(以下、「PO」という。)、形質に関する情報を表現したTrait Ontology(以下、「TO」という。)等がある。これらはすべて、構成要素としてのタームがネットワーク状の構造を形成している。
各タームには識別記号(以下、「ID」という。)が割り当てられている。このIDは従来7桁の数値で表記されている。この7桁の数値は、単純に新規に作成されたタームから順に与えられているため、タームの持つ意味を表現するものではない。コンピュータによる処理が行われる際、主にこれらのIDが用いられている。
従来のオントロジーにおいて、タームの集合と、ターム同士の相互関係はデータとして扱われ、データベース内に格納されている。また、各タームは、上記IDを用いてデータベース内で管理されている。ユーザは、コンピュータを用いてデータベースに対して閲覧あるいは検索を行い、目的の情報を得ることができる。
図17を参照して、一般的なオントロジーの利用法について説明する。同図は、コンピュータを用いた情報検索処理を模式的に示したものである。同図に示される例は、Trait Ontology(TO)を利用したものであって、検索キーワードを「embryo」としてデータベースに対して検索を行い、関連するタームと遺伝子に関する情報をユーザが得るまでの流れである。この例では「embryo」に関連するタームは3つあり、関連遺伝子は各タームに1つずつ存在している。また、「embryo related trait」は「seed related trait」を上位タームとして持ち、「embryo shape」と「embryoless」の2つのタームを下位タームとして持つことがツリー状の表示方法により示されている。
このように、オントロジーの利用結果をコンピュータのディスプレイ上に表現し、ユーザに情報を提供する際、データの表示方法としては一般的にツリー状の表示方法が用いられている(下記の非特許文献1参照)。
このように、オントロジーの利用結果をコンピュータのディスプレイ上に表現し、ユーザに情報を提供する際、データの表示方法としては一般的にツリー状の表示方法が用いられている(下記の非特許文献1参照)。
しかしながら、上記従来のデータ表示方法、オントロジーの利用システムには以下のような問題がある。
第1に、上記Plant Ontology(PO)とTrait Ontology(TO)とに関連する問題であるが、POとTOは互いに独立したカテゴリではなく、互いに密接に関連したカテゴリであり、両者を独立したデータとして扱い表現すると、内容的に無理が生じる点である。以下に、イネのTOでの例を挙げ説明する。イネのTOには、葉の分化・形成・伸長等に関するタームである「leaf related trait」と、種子の形状・品質・着色性等に関するタームである「seed related trait」が存在する。「leaf related trait」が関連する発生段階は主にイネの茎が伸長する段階であり、「seed related trait」が関連する発生段階は主に受粉後種子が発達する段階である。このように異なる発生段階に関連するタームが同一のデータ上に区別なく存在してしまう矛盾が生じている。
第1に、上記Plant Ontology(PO)とTrait Ontology(TO)とに関連する問題であるが、POとTOは互いに独立したカテゴリではなく、互いに密接に関連したカテゴリであり、両者を独立したデータとして扱い表現すると、内容的に無理が生じる点である。以下に、イネのTOでの例を挙げ説明する。イネのTOには、葉の分化・形成・伸長等に関するタームである「leaf related trait」と、種子の形状・品質・着色性等に関するタームである「seed related trait」が存在する。「leaf related trait」が関連する発生段階は主にイネの茎が伸長する段階であり、「seed related trait」が関連する発生段階は主に受粉後種子が発達する段階である。このように異なる発生段階に関連するタームが同一のデータ上に区別なく存在してしまう矛盾が生じている。
第2に、POとTOが独立していることによる使い難さ、つまり、POとTOが独立していることにより、ユーザが情報を一括して得にくい点である。例えば、ユーザがある形質についての情報を得たいとき、その形質が現れる発生段階についての情報はPOから、形質についての情報はTOから得る必要があり、同時に得ることは困難である。
第3に、現在一般的に用いられているツリー状のデータ表示方法では、コンピュータ上で結果を表示する際、ユーザがネットワーク状のデータ構造を直感的に理解することが難しいという欠点がある。例として、TOにおけるターム名「hybrid incompatibility」に関連する複数のタームがネットワーク状の構造を呈していることを図18および図19に示す。図18と図19は同一の内容を示すものであり、図18はツリー状の表現方法、図19はネットワーク状の表現方法でデータを表記したものである。この例では、「hybrid incompatibility」は「incompatibility trait」と「hybrid evaluation」の2つの上位タームを持ち、「f1-hybrid inconpatibility」と「f2-hybrid inconpatibility」の2つの下位タームを持つ。さらに、「hybrid incompatibility」の上流に位置する「fertility or sterility trait」は「flower related trait」と「whole plant trait」の2つの上位タームを持ち、「incompatibility trait」のみを下位タームに持つ関係になっている。しかし、図18のツリー状の表現方法から図19のネットワーク状の構造を理解することは一般に困難であろう。
第4に、各タームに割り当てられているIDに対し、タームの持つ意味を表すための意味付けがなされていない点である。IDは通常単純な7桁の数値であり、桁による意味の区別や、数値の大小によるタームの上下関係が表現されているわけではない。そのため、ユーザがIDからタームを推測することは困難であり、さらにコンピュータによる処理に適していない。
第5に、タームの増加に対する拡張性が乏しい点である。従来の方法では、タームは1対1又は1対多の関係で互いに関連のあるもの同士が結び付けられている。しかし、この方法ではタームが増加するにしたがって、ターム間の結びつきも増加し、データ全体としての構造が過度に複雑化してしまう。
"Gene Ontology : tool for the unification of biology", nature genetics, volume25, p25-29, may 2000
生命現象全般にわたる研究が今後も世界的規模で進行し、知見・情報がさらに蓄積され膨大になるほど、情報を統合する必要性とそこから目的のデータを効率よく抽出する必要性は高くなる。その意味で、生物に関するオントロジーの利用は今後益々重要なものとなり、生物に関するオントロジーが、生命工学、分子生物学、生化学、農学、薬学、医学など生命科学諸分野の研究に不可欠な研究用ツールとして利用されることが期待される。そのためには、ユーザにとってより利用しやすいシステムを構築する必要があり、上述したような従来のシステムの問題点を解消すること、例えばユーザにとってデータ相互の関係の直感的理解を可能にする表示方法を提供することなどが重要になる。
本発明は、上記の問題点に鑑みなされたものであり、その目的は、ユーザにとってより利用しやすいオントロジーの利用システムを提供すること、そのためのオントロジーの表示方法および表示用プログラムを提供することにある。
本発明のオントロジーの表示方法
本発明のオントロジーの表示方法は、上記の課題を解決するため、生物に関するオントロジーの表示方法であって、オントロジー全体を立体マトリックス形式で表示部に表示することを特徴としている。
本発明のオントロジーの表示方法は、上記の課題を解決するため、生物に関するオントロジーの表示方法であって、オントロジー全体を立体マトリックス形式で表示部に表示することを特徴としている。
上記表示方法によれば、オントロジー全体が立体マトリックス形式で表示されるので、ユーザはオントロジー全体を3次元構造として把握することができ、オントロジーに含まれる個々のデータに対しても、その3次元構造全体の中に位置づけて認識することができるので、データ相互の関係もより理解しやすいものとなる。このように本発明の表示方法によれば、オントロジー全体およびデータ相互の関係が直感的に理解しやすいように表示される結果、ユーザにとってより利用しやすいオントロジーを提供できる。
ここで、データとは、例えば後述の立体マトリックスデータ(図10参照)のように立体マトリックス上の位置と関連付けられたデータをいうが、データ形式等は何ら限定されるものではない。
本発明の表示方法は、さらに下記(1)(2)の特徴を有するものであってもよい。
(1)オントロジーに含まれる個々のデータに対して、前記立体マトリックス上の位置と関連付けられた識別記号が付与されている。
(2)植物又は動物に関するオントロジーであり、前記立体マトリックスの3つの座標軸にはそれぞれ、植物又は動物の形質、器官、発生に関する項目が割り当てられている。
(1)オントロジーに含まれる個々のデータに対して、前記立体マトリックス上の位置と関連付けられた識別記号が付与されている。
(2)植物又は動物に関するオントロジーであり、前記立体マトリックスの3つの座標軸にはそれぞれ、植物又は動物の形質、器官、発生に関する項目が割り当てられている。
本発明のオントロジーの表示用プログラム
本発明のオントロジーの表示用プログラムは、上記の課題を解決するため、生物に関するオントロジーの表示用プログラムであって、オントロジー全体を立体マトリックス形式で表示部に表示する処理をコンピュータに実行させることを特徴としている。
本発明のオントロジーの表示用プログラムは、上記の課題を解決するため、生物に関するオントロジーの表示用プログラムであって、オントロジー全体を立体マトリックス形式で表示部に表示する処理をコンピュータに実行させることを特徴としている。
本発明の表示用プログラムは、本発明の上記表示方法と同様に、オントロジー全体を立体マトリックス形式で表示部に表示させるので、ユーザはオントロジー全体およびオントロジーに含まれるデータ相互の関係を直感的に理解しやすくなり、その結果、ユーザにとってより利用しやすいオントロジーを提供できる。
本発明の表示用プログラムとしては、具体的にはビューアなどの表示用ソフトウェアを挙げることができる。
本発明の表示用プログラムは、さらに、(1)表示部に表示された立体マトリックスの3つの座標軸のうち、いずれか1つの座標軸上の任意の座標位置が指定されると、指定された座標位置における平面マトリックスを表示する処理と、指定された座標位置と関連付けられた識別記号を有する各データの平面マトリックス上の位置を点表示する処理とをコンピュータに実行させるものであってもよいし、(2)平面マトリックス上に各位置が点表示されたデータのうち、任意のデータが選択されると、選択されたデータに関する情報であって、当該データの識別記号をもとにデータベースを参照して得られた情報を表示する処理をコンピュータに実行させるものであってもよい。このようなプログラムとすることで、ユーザにとってさらに利用しやすいオントロジーを提供できる。
また、本発明の表示用プログラムを記録した、コンピュータで読み取り可能な記録媒体も本発明に含まれる。即ち、本発明の記録媒体は、本発明の表示用プログラムを記録したものであって、コンピュータによってアクセスされ、読み取られうる任意の記録媒体をいう。このような記録媒体としては、フレキシブルディスク、ハードディスク、磁気テープ等の磁気記憶媒体、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW等の光学記憶媒体、RAMやROM等の電気記憶媒体、およびMO等の磁気/光学記憶媒体を例示することができるが、これらに限定されるものではない。
本発明のオントロジーの利用システム
本発明のオントロジーの利用システムは、上記の課題を解決するため、生物に関するオントロジーの利用システムであって、
オントロジー全体を立体マトリックス形式で表示する表示部と、
前記立体マトリックス上の位置と関連付けられた識別記号が付与された各データを格納する格納部と、
前記立体マトリックスにおいてデータの存在する任意の位置が1回の操作または複数回の操作により指定されたときに、指定された位置に対応するデータに関する情報を当該データの識別記号をもとにデータベースを参照して取り出し、表示部に表示させる処理を実行する処理部と、
を備えることを特徴としている。
本発明のオントロジーの利用システムは、上記の課題を解決するため、生物に関するオントロジーの利用システムであって、
オントロジー全体を立体マトリックス形式で表示する表示部と、
前記立体マトリックス上の位置と関連付けられた識別記号が付与された各データを格納する格納部と、
前記立体マトリックスにおいてデータの存在する任意の位置が1回の操作または複数回の操作により指定されたときに、指定された位置に対応するデータに関する情報を当該データの識別記号をもとにデータベースを参照して取り出し、表示部に表示させる処理を実行する処理部と、
を備えることを特徴としている。
本発明の利用システムにおいては、本発明の上記表示方法と同様に、オントロジー全体が立体マトリックス形式で表示部に表示されるので、ユーザはオントロジー全体およびオントロジーに含まれるデータ相互の関係を直感的に理解しやすくなり、その結果、ユーザにとってより利用しやすいオントロジーを提供できる。その上、表示中の立体マトリックスにおいてデータの存在する任意の位置をユーザが指定すると、処理部が、そのデータに関する情報をデータベースから取り出し、表示部に表示させるようになっているので、ユーザは簡便な操作で容易に目的の情報を入手することができる。
本発明の利用システムは、さらに下記(1)〜(5)の特徴を有するものであってもよい。
(1)前記表示部に表示された立体マトリックスの3つの座標軸のうち、いずれか1つの座標軸を選択するための選択手段、および、選択された座標軸上の任意の座標位置を指定するための指定手段を備え、当該指定手段によって座標位置が指定されると、前記表示部は、指定された座標位置における平面マトリックスを表示すると共に、指定された座標位置と関連付けられた識別記号を有する各データの平面マトリックス上の位置を点表示する。
(2)各データに付与される識別記号は、立体マトリックスの3つの座標軸に対応して3つの部分から構成され、3つの座標軸に割り当てられる各項目の内容を表す記号によって表現される。
(3)立体マトリックスの3つの座標軸のうち、少なくとも1つの座標軸に割り当てられる項目が階層構造をなしている場合に、識別記号中その座標軸に対応する部分は、各階層を表す記号の組み合わせによって表現される。
(4)識別記号が付された新たなデータをオントロジーに追加するためのデータ登録手段をさらに備える。
(5)立体マトリックスの3つの座標軸にはそれぞれ、植物又は動物の形質、器官、発生に関する項目が割り当てられている。
(1)前記表示部に表示された立体マトリックスの3つの座標軸のうち、いずれか1つの座標軸を選択するための選択手段、および、選択された座標軸上の任意の座標位置を指定するための指定手段を備え、当該指定手段によって座標位置が指定されると、前記表示部は、指定された座標位置における平面マトリックスを表示すると共に、指定された座標位置と関連付けられた識別記号を有する各データの平面マトリックス上の位置を点表示する。
(2)各データに付与される識別記号は、立体マトリックスの3つの座標軸に対応して3つの部分から構成され、3つの座標軸に割り当てられる各項目の内容を表す記号によって表現される。
(3)立体マトリックスの3つの座標軸のうち、少なくとも1つの座標軸に割り当てられる項目が階層構造をなしている場合に、識別記号中その座標軸に対応する部分は、各階層を表す記号の組み合わせによって表現される。
(4)識別記号が付された新たなデータをオントロジーに追加するためのデータ登録手段をさらに備える。
(5)立体マトリックスの3つの座標軸にはそれぞれ、植物又は動物の形質、器官、発生に関する項目が割り当てられている。
以上のように、本発明は、ユーザにとってより利用しやすいオントロジーを提供できるという効果を奏する。より詳細には、例えば後述のオントロジーの場合、植物の形質、器官、発生に関する項目(要素)をそれぞれ3つの座標軸に割り当てて立体マトリックス形式でオントロジー全体を表現することにより、(1)POとTOが統合され内容的に無理がなく、(2)ユーザが一括して情報を得ることができ、(3)データ構造の直感的理解が可能になり、(4)コンピュータ処理に有利、かつユーザが理解可能なIDを付与でき、(5)拡張性に富んだデータ構造を実現できる。
以下、本発明の実施の一形態について、図面に基づき説明する。
〔1〕本発明の実施形態の概要
本実施形態は、植物の形質・器官・発生段階の3つを各軸(座標軸)に持つ立体マトリックス状のデータ構造を表示するものになっている。
図1は、上記データ構造を模式的に示した図である。同図に示すように、直方体中の軸I(101)には器官(PO)に関する情報が、軸II(102)には発生段階(PO)に関する情報が、軸III(103)には形質(TO)に関する情報がそれぞれ割当てられている。
本実施形態は、植物の形質・器官・発生段階の3つを各軸(座標軸)に持つ立体マトリックス状のデータ構造を表示するものになっている。
図1は、上記データ構造を模式的に示した図である。同図に示すように、直方体中の軸I(101)には器官(PO)に関する情報が、軸II(102)には発生段階(PO)に関する情報が、軸III(103)には形質(TO)に関する情報がそれぞれ割当てられている。
軸I・軸II・軸IIIの各軸は、軸を形成する要素(項目)により細分化されている。図2および図3は、要素による軸の細分化をイネを例として示した図であり、軸Iの器官に関する項目の例が201に、軸IIの発生段階に関する項目の例が202に、軸IIIの形質に関する項目の例が203に示される。軸の要素は、201・203に示すように、カテゴリ別に階層化されていてもよい。
このようにPOとTOを一つの直方体中に統合することにより、POとTOのデータを一括して扱うことが可能となる。そのため、データを矛盾なく格納することが可能となるばかりでなく、タームの増加に対して該当する軸の要素を追加するだけで対応することができ、データの構造が過度に複雑化しない。
このようにPOとTOを一つの直方体中に統合することにより、POとTOのデータを一括して扱うことが可能となる。そのため、データを矛盾なく格納することが可能となるばかりでなく、タームの増加に対して該当する軸の要素を追加するだけで対応することができ、データの構造が過度に複雑化しない。
本実施形態において、立体マトリックス中、つまり直方体中には各軸の要素の組み合わせにより多数の点が存在する。図4は、多数の点が直方体中に格子点として存在することを示した図である。各点はそれぞれ、ある器官の特定の発生段階における形質を表している。これらの点は、各軸の該当する要素の組み合わせにより定まっているため、直方体中で唯一の点である。これは換言すれば、直方体中の1点を定めることにより、ユーザは、器官・発生段階・形質に関する情報を一括して得ることができることを意味する。
図5は、例としてイネの葉の成苗期における着色性に関する点の位置を示した図である。図中の点501は、軸Iの要素の葉(502)・軸IIの要素の成苗期(503)・軸IIIの要素の着色(504)の交点である。
このように本実施形態においては、軸の項目ないし要素の組み合わせにより多数の点が形成されるデータ構造になっており、そのうち1点を特定することにより、ユーザは目的のデータを一括して得ることができる。
また、ユーザの利用方法として、図6の視点A(601)・視点B(602)・視点C(603)のように、直方体の一面を対象とすることも可能である。視点A(601)を選択した場合は面A(604)を、視点B(602)を選択した場合は面B(605)を、視点C(603)を選択した場合は面C(606)を調査対象としている。これらの場合、視点A(601)からは特定の発生段階における器官と形質の関係を知ることが可能であり、視点B(602)からは特定の器官が発生段階に応じてどのような形質を持つのかを知ることが可能であり、視点C(603)からは特定の形質がどの発生段階でどこの器官に生じるのかを知ることが可能である。
上記利用の場合に、ユーザがデータ構造を直感的に理解可能な形式でディスプレイ上に表示する方法の一例について説明する。出力装置であるディスプレイと入力装置であるマウスは、縦軸と横軸の2つの軸のみを基盤として動作する装置であり、奥行きに相当する軸を表示又は操作できない。上記データ構造は立体構造をとっているため、立体構造を平面上で表現し、なおかつ奥行きに相当する軸を表示または操作する必要がある。
そこで、図6に示すようにデータ構造を平面上に表示しつつ、さらにユーザが選択した面A(604)、面B(605)、面C(606)のいずれか1面のうち、直方体の奥行きに相当する軸上の一点をスライダー(指定手段)701により指定し、指定された軸上の位置(座標位置)、換言すれば指定された要素における面(平面マトリックス)をディスプレイに表示する。図7は、この表示方法を模式的に説明する図である。この例では、面A(604)が選択され、ディスプレイ上に平面として表示されており、さらに、奥行きに相当する軸II上をスライダー701がPQ方向に移動可能なように表示されている。この場合、ユーザはスライダー701を操作することにより、軸IIの要素である発芽期・成苗期・受精期・成熟期のいずれかが選択可能となっている。ユーザにより選択された軸IIの要素における面A(604)は、軸Iと軸IIIを二辺に持つ平面として表示される。他の面においても同様の表示方法を用いることができる。
次に、本実施形態のオントロジーにおいて使用される識別記号(ID)について説明する。本実施形態においては、コンピュータによる効率的な処理のため、各軸を構成する要素および要素の組み合わせにより直方体中に存在する点は、IDにて表現できるようになっている。例えば、図8に示す項目801は、図3に示す項目203の一部を抜粋したものであるが、各要素がカテゴリごとに分類され、階層化されていることを示している。さらに、項目801の各要素は単語により表記されている。
項目802は、項目801の表記をID化のために簡略化したものである。簡略化する際は以下の法則性に基づいている。即ち、表記は要素を表す単語の一文字目を使用する。ただし、同一階層内で表記の重複が生じる場合は一文字目の後に、2文字目以降で両表記に違いが生じる文字を付加する。要素の「その他」は他の表記と重複しない文字を用いて表現する。項目802では、仮に数字の「99」を「その他」の表記として用いている。上位の階層を要素として継承する場合は、他の表記と重複しない文字を用いて表現する。項目802では、仮に数字の「00」を上位の階層を継承する表記として用いている。項目803にID化された各要素を示す。階層の深さは「.」(ドット記号)を用いて表記を区切ることにより表現しているため、IDのみから各要素が所属するカテゴリを容易に判別することが可能である。これにより、ユーザが理解可能なIDを付与することが可能となる。
他の軸に関しても同様に要素をカテゴリによって分類し、簡略化した表記によって各軸の要素をID化する。直方体中の点は各軸の要素の組み合わせで定まるので、各軸の要素を表すIDを「-」(ハイフン記号)を用いて連結することにより、識別記号804のように表現する。
〔2〕本発明の実施形態の利用システムと表示用プログラム
次に、本実施形態の利用システムについて説明する。図9は、本利用システムの概略構成を示すブロック図である。本利用システムは、同図に示すように、データの入出力処理および解析等の処理を行う中央処理装置(処理部)900と、キャラクタおよびグラフィック画像を表示する表示装置(表示部)901と、数値・記号等の入力や選択の操作を行うための入力手段(および選択手段・指定手段)であるキーボード902およびマウス903と、遺伝子情報が格納されている遺伝子データベース(DB)904と、変異体の情報が格納されている変異体データベース(DB)905と、発生段階の情報が格納されている発生データベース(DB)906と、立体マトリックスデータが格納されているデータ格納装置(格納部)907と、を備えて構成される。
次に、本実施形態の利用システムについて説明する。図9は、本利用システムの概略構成を示すブロック図である。本利用システムは、同図に示すように、データの入出力処理および解析等の処理を行う中央処理装置(処理部)900と、キャラクタおよびグラフィック画像を表示する表示装置(表示部)901と、数値・記号等の入力や選択の操作を行うための入力手段(および選択手段・指定手段)であるキーボード902およびマウス903と、遺伝子情報が格納されている遺伝子データベース(DB)904と、変異体の情報が格納されている変異体データベース(DB)905と、発生段階の情報が格納されている発生データベース(DB)906と、立体マトリックスデータが格納されているデータ格納装置(格納部)907と、を備えて構成される。
ここで、上記データベース904・905・906は、ローカルなデータベースであってもよいし、ネットワーク等を介して遠隔地に設置されたサーバコンピュータが管理しているデータベースであってもよい。また、中央処理装置900は、コンピュータとそのプログラムによって具体化されるものである。
図10は、本実施形態の利用システムが管理する立体マトリックスデータを示したものである。データ全体の配列情報は、3D[i](i = 1,2,…,pNum)という長さpNum個の構造体の配列に格納される。ただし、pNumは立体マトリックス中に存在する点の個数である。配列3D[]すなわち各点に関する情報は、例えば、識別記号としての3D_ID(1000)、関連TOID(1001)、および関連タームとしての関連TOTerm名(1002)からなる。配列3D[]には、さらに他の属性を加えてもよい。
図11は、本実施形態の利用システムが管理する遺伝子データを示したものである。同データは、gene[i](i = 1,2,…,gNum)という長さgNum個の構造体の配列に格納されている。ここでgNumは遺伝子の総数である。配列gene[]すなわち各遺伝子に関する情報は、遺伝子名(1100)、遺伝子の塩基配列を表す塩基配列(1101)、塩基配列の長さを表す配列長(1102)、この遺伝子が関連している3D_IDを表す関連3D_ID(1103)からなる。また、これらの属性に加えて、外部の遺伝子データベースでのアクセッション番号、関連タンパク質の立体構造、代謝経路内での役割、に関する情報などを配列gene[]の属性として加えてもよい。関連3D_IDには、前述の配列3D[]の3D_IDを識別子として入力する。
図12は、本実施形態の利用システムが管理する変異体データを示したものである。同データは、mut[i](i = 1,2,…,mNum)という長さmNum個の構造体の配列に格納されている。ここでmNumは変異体の総数である。配列mut[]すなわち各変異体に関する情報は、系統名(1200)、この変異体の生物種名を表す生物種名(1201)、この変異体が関連している3D_IDを表す関連3D_ID(1202)からなる。関連3D_IDには、前述の配列3D[]の3D_IDを識別子として入力する。また、これらの属性に加えて、交配親、維持方法、系統保存場所、に関する情報などを配列mut[]の属性として加えてもよい。
図13は、本実施形態の利用システムが管理する発生画像データを示したものである。同データは、dev[i](i = 1,2,…,dNum)という長さdNum個の構造体の配列に格納されている。ここでdNumはすべての発生段階のデータの総数である。配列dev[]すなわち各発生段階のデータは、画像ファイル名(1300)、この画像ファイルが関連している3D_IDを表す関連3D_ID(1301)からなる。関連3D_IDには、前述の配列3D[]の3D_IDを識別子として入力する。また、これらの属性に加えて、作成日、作成者名、作成方法、に関する情報などを配列dev[]の属性として加えてもよい。
本実施形態の利用システムは、以上のようなデータを利用できるシステムになっており、ユーザは、表示用プログラムによって表示装置901に表示された表示画面を介して、データの閲覧、検索、解析などを行うことができる。そこで以下では、ユーザによる本システムの具体的な利用方法について説明する。
図14は、ビューア等の表示用プログラムによって表示された表示画面の例を示す図である。この例では、ナビゲータ領域である表示領域1400に、植物の形質・器官・発生に関するオントロジー全体が、図1と同様に立体マトリックス形式で表示されている。また、表示領域1400には、立体マトリックスの座標軸上の任意の位置(換言すれば、軸上の任意の要素ないし項目)を指定するためのスライダー1401が表示されている。スライダー1401は、マウス903の動きと連動する表示カーソル1403を用いて操作することができる。ユーザは、スライダー1401の位置を定めることによって軸の要素を選択することができる。このほか、軸の要素の選択は、キーボード902から数値等を入力することにより行ってもよい。
また、軸の要素を選択する以前にまず軸を選択する操作を行うことになるが、この操作は、表示領域1400に表示された立体マトリックス上の3つの座標軸のうち、目的の座標軸上の任意の位置を表示カーソル1403で選択することにより行う。あるいは、キーボード902から3つの座標軸にそれぞれ割り当てられた数値等を入力することにより行ってもよい。
ユーザが目的の軸を選択し、さらにその軸上の任意の要素を選択すると、前記立体マトリックスデータの3D[]から選択された軸の要素に対応する複数の点が選出される。この処理については後に詳しく述べる(図15のステップ1503参照)。選出された点は、面表示欄である表示領域1402に表示された面(平面マトリックス)上に表示される。この面の表示は、スライダー1401を移動させて軸上の異なる要素を選択すると、それに伴って変化するので、スライダー1401を順次移動させることにより、この面の表示がどのように変遷するかを観察することも可能である。
表示領域1402の平面上に複数の点が表示された後、ユーザがこれら複数の点の中から任意の点1404を表示カーソル1403によって選択すると、さらにその点1404に関する詳細な情報を得ることができる。この処理については後に詳しく述べるが、点1404が選択されると、その点1404に関連する情報がgene[]、mut[]、dev[]から選出される(図16のステップ1601〜1603参照)。
上記処理により選出された情報は、表示領域1405〜1408にそれぞれ表示される。より詳細には、表示領域1405には、選択された点1404に関する詳細情報が表示される。表示領域1406には、選択された点1404に関する変異体の詳細情報が表示される。表示領域1407には、選択された点1404に関する遺伝子の詳細情報が表示される。表示領域1408には、選択された点1404に関する発生段階の詳細情報が表示される。また、これらの詳細情報はリンク付けられた情報を含むものであってもよく、これらの詳細情報から外部のデータベース等に対してリンクし、さらに多くの情報を得られるようにしてもよい。
次に、上述の処理動作のうち、選択された軸の要素に対応する複数の点が平面マトリックス上に表示されるまでの処理について説明する。図15は、この処理手順を説明するフローチャートである。まず、識別記号3D_IDがそれぞれ付与された立体マトリックスデータが3D[]に登録されていることが前提になる(ステップ1500)。この登録は、データ登録手段であるキーボード902を介して行うことができる。
次に、処理部である中央処理装置900は、スライダー1401自身に割り当てられている軸の値を受け取り(ステップ1501)、さらに、スライダー1401により選ばれた軸の要素の値を受け取る(ステップ1502)。ステップ1501で受け取る値は、軸I・軸II・軸IIIのいずれかについての値もしくは番号である。ステップ1502で受け取る値は、ステップ1501で選択された軸の要素をID化した形式の値であり、具体的には、図8の項目803に示されるような形式の値である。
中央処理装置900は、上記ステップ1501・1502で受けた値をもとに、該当する識別記号3D_IDを3D[]から選出する(ステップ1503)。このステップで選出される3D_IDは、スライダー1401に割り当てられていない軸を二辺とする平面上に存在するIDである。最後に、ステップ1503において選出された3D_IDが表示領域1402の平面上に表示される。このとき、選出された3D_IDは複数の点として平面上に表示される。
次に、平面上に表示された複数の点の中から1点を選択することにより、その点に関連する詳細情報が取り出され表示されるまでの処理動作について説明する。図16は、この処理手順を説明するフローチャートである。まず、表示カーソル1403を用いて複数の点の中から選択された1点1404を表す識別記号3D_IDを得る(ステップ1600)。次に、ステップ1600で得た3D_IDをもとに、gene[]から該当する3D_IDを含む配列を選出する(ステップ1601)。同様に、mut[]、dev[]からも該当する3D_IDを含む配列をそれぞれ選出する(ステップ1602・1603)。そして、ステップ1601・1602・1603において選出された配列を表示画面内のそれぞれ決められた表示領域に表示する(ステップ1604)。より詳細には、ステップ1601にて選出された情報は表示領域1407に、ステップ1602にて選出された情報は表示領域1406に、ステップ1603にて選出された情報は表示領域1408にそれぞれ表示される。
以上の処理によって、ユーザは、POとTOが統合されたオントロジー全体およびデータ相互の関係を直感的に理解しつつ、選択した点に関連する情報(遺伝子情報・変異体情報・発生画像情報等)を一括して得ることが可能となる。
このように、本実施形態においては、POとTOが統合され、植物の形質・器官・発生に関する要素ないし項目が立体マトリックスの各軸に割り当てられ、オントロジー全体が立体マトリックス形式で表現される。各軸は要素により細分化され、さらに要素を表す単語の一部を用いてID化されており、ユーザが理解可能な表現となっている。各軸の要素を表すIDを組み合わせることにより、立体マトリックス中の1点は3D_IDにて表現される。これにより、POとTOのデータを無理なく表現し、データの増加・減少にも軸の要素の増減により柔軟に対応でき、拡張性に富んだデータ構造とすることができる。また、3D_IDを用いることによりコンピュータによる処理が容易となり、ユーザが立体マトリックス中の1点を選択すると、3D_IDをもとにその点に関する情報を一括して得ることが可能となる。
尚、発明を実施するための最良の形態の項においてなした具体的な実施態様または実施例は、あくまでも本発明の技術内容を明らかにするものであって、本発明は、そのような具体例にのみ限定して狭義に解釈されるべきものではなく、特許請求の範囲内で、様々に変更して実施することができる。
以上のように、本発明は、ユーザにとってより利用しやすいオントロジーを提供することができ、生命工学、分子生物学、生化学、農学、薬学、医学など生命科学諸分野の研究において非常に有用な研究用ツールとして利用可能である。
900 中央処理装置(処理部)
901 表示装置(表示部)
902 キーボード(選択手段・指定手段・データ登録手段)
903 マウス(選択手段・指定手段)
907 データ格納装置(格納部)
901 表示装置(表示部)
902 キーボード(選択手段・指定手段・データ登録手段)
903 マウス(選択手段・指定手段)
907 データ格納装置(格納部)
Claims (13)
- 生物に関するオントロジーの表示方法であって、オントロジー全体を立体マトリックス形式で表示部に表示することを特徴とする、オントロジーの表示方法。
- オントロジーに含まれる個々のデータに対して、前記立体マトリックス上の位置と関連付けられた識別記号が付与されていることを特徴とする、請求項1記載のオントロジーの表示方法。
- 植物又は動物に関するオントロジーであり、前記立体マトリックスの3つの座標軸にはそれぞれ、植物又は動物の形質、器官、発生に関する項目が割り当てられていることを特徴とする、請求項1または2記載のオントロジーの表示方法。
- 生物に関するオントロジーの表示用プログラムであって、オントロジー全体を立体マトリックス形式で表示部に表示する処理をコンピュータに実行させる、オントロジーの表示用プログラム。
- 表示部に表示された立体マトリックスの3つの座標軸のうち、いずれか1つの座標軸上の任意の座標位置が指定されると、指定された座標位置における平面マトリックスを表示する処理と、指定された座標位置と関連付けられた識別記号を有する各データの平面マトリックス上の位置を点表示する処理とをコンピュータに実行させる、請求項4記載のオントロジーの表示用プログラム。
- 平面マトリックス上に各位置が点表示されたデータのうち、任意のデータが選択されると、選択されたデータに関する情報であって、当該データの識別記号をもとにデータベースを参照して得られた情報を表示する処理をコンピュータに実行させる、請求項5記載のオントロジーの表示用プログラム。
- 請求項4〜6のいずれか1項に記載のプログラムを記録した、コンピュータで読み取り可能な記録媒体。
- 生物に関するオントロジーの利用システムであって、
オントロジー全体を立体マトリックス形式で表示する表示部と、
前記立体マトリックス上の位置と関連付けられた識別記号が付与された各データを格納する格納部と、
前記立体マトリックスにおいてデータの存在する任意の位置が1回の操作または複数回の操作により指定されたときに、指定された位置に対応するデータに関する情報を当該データの識別記号をもとにデータベースを参照して取り出し、表示部に表示させる処理を実行する処理部と、
を備えることを特徴とする、オントロジーの利用システム。 - 前記表示部に表示された立体マトリックスの3つの座標軸のうち、いずれか1つの座標軸を選択するための選択手段、および、選択された座標軸上の任意の座標位置を指定するための指定手段を備え、当該指定手段によって座標位置が指定されると、前記表示部は、指定された座標位置における平面マトリックスを表示すると共に、指定された座標位置と関連付けられた識別記号を有する各データの平面マトリックス上の位置を点表示することを特徴とする、請求項8記載のオントロジーの利用システム。
- 各データに付与される識別記号は、立体マトリックスの3つの座標軸に対応して3つの部分から構成され、3つの座標軸に割り当てられる各項目の内容を表す記号によって表現されることを特徴とする、請求項8または9記載のオントロジーの利用システム。
- 立体マトリックスの3つの座標軸のうち、少なくとも1つの座標軸に割り当てられる項目が階層構造をなしている場合に、識別記号中その座標軸に対応する部分は、各階層を表す記号の組み合わせによって表現されることを特徴とする、請求項10記載のオントロジーの利用システム。
- 識別記号が付された新たなデータをオントロジーに追加するためのデータ登録手段をさらに備えることを特徴とする、請求項8〜11のいずれか1項に記載のオントロジーの利用システム。
- 立体マトリックスの3つの座標軸にはそれぞれ、植物又は動物の形質、器官、発生に関する項目が割り当てられていることを特徴とする、請求項8〜12のいずれか1項に記載のオントロジーの利用システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004024895A JP2005216190A (ja) | 2004-01-30 | 2004-01-30 | 立体マトリックス形式を用いたオントロジーの表示方法、表示用プログラム、およびその利用システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004024895A JP2005216190A (ja) | 2004-01-30 | 2004-01-30 | 立体マトリックス形式を用いたオントロジーの表示方法、表示用プログラム、およびその利用システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005216190A true JP2005216190A (ja) | 2005-08-11 |
Family
ID=34907435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004024895A Pending JP2005216190A (ja) | 2004-01-30 | 2004-01-30 | 立体マトリックス形式を用いたオントロジーの表示方法、表示用プログラム、およびその利用システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005216190A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009098870A (ja) * | 2007-10-16 | 2009-05-07 | Canon It Solutions Inc | 情報処理装置、データ分析システム、データ分析方法、プログラム、及び、記録媒体 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274387A (ja) * | 1993-03-23 | 1994-09-30 | Nri & Ncc Co Ltd | データベースからのデータ抽出方法 |
JPH11194864A (ja) * | 1997-12-26 | 1999-07-21 | Nec Corp | 情報提示装置及び情報提示プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2000112976A (ja) * | 1998-10-05 | 2000-04-21 | Hitachi Ltd | マルチメディア情報機器の情報表示方法、情報処理方法、及び、情報処理装置 |
JP2000200314A (ja) * | 1998-12-29 | 2000-07-18 | Japan Medical Eido:Kk | デ―タ処理方法、医療デ―タ管理方法及びシステム、記録媒体 |
JP2001175380A (ja) * | 1999-12-20 | 2001-06-29 | Wellstone Inc | 情報インデックス表示方法とその装置 |
-
2004
- 2004-01-30 JP JP2004024895A patent/JP2005216190A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274387A (ja) * | 1993-03-23 | 1994-09-30 | Nri & Ncc Co Ltd | データベースからのデータ抽出方法 |
JPH11194864A (ja) * | 1997-12-26 | 1999-07-21 | Nec Corp | 情報提示装置及び情報提示プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2000112976A (ja) * | 1998-10-05 | 2000-04-21 | Hitachi Ltd | マルチメディア情報機器の情報表示方法、情報処理方法、及び、情報処理装置 |
JP2000200314A (ja) * | 1998-12-29 | 2000-07-18 | Japan Medical Eido:Kk | デ―タ処理方法、医療デ―タ管理方法及びシステム、記録媒体 |
JP2001175380A (ja) * | 1999-12-20 | 2001-06-29 | Wellstone Inc | 情報インデックス表示方法とその装置 |
Non-Patent Citations (2)
Title |
---|
ASHBURNER M.: "Gene ontology: tool for the unification of biology. The Gene Ontology Consortium", NATURE GENETICS, vol. 25, no. 1, JPNX007002140, 2000, pages 25 - 29, ISSN: 0000810792 * |
ASHBURNER M.: "Gene ontology: tool for the unification of biology. The Gene Ontology Consortium", NATURE GENETICS, vol. 25, no. 1, JPNX007039974, 2000, pages 25 - 29, ISSN: 0000877805 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009098870A (ja) * | 2007-10-16 | 2009-05-07 | Canon It Solutions Inc | 情報処理装置、データ分析システム、データ分析方法、プログラム、及び、記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Suderman et al. | Tools for visually exploring biological networks | |
Barrett et al. | Mining microarray data at NCBI’s Gene Expression Omnibus (GEO) | |
US20080162541A1 (en) | Visualization Technique for Biological Information | |
CN104361137A (zh) | 报表取数条件生成装置和方法 | |
JP2004265179A (ja) | 情報関連性表示方法、プログラム、記憶媒体及び装置 | |
Rohn et al. | Creating views on integrated multidomain data | |
Larmande et al. | AgroLD: A knowledge graph for the plant sciences | |
EP1321858A1 (en) | Gene data displaying method and recording medium | |
JP4886266B2 (ja) | 文献調査方法、文献調査システムおよび文献調査プログラム | |
JP2005216190A (ja) | 立体マトリックス形式を用いたオントロジーの表示方法、表示用プログラム、およびその利用システム | |
CN113010163B (zh) | 材料测试表征和制备工艺数据库低代码构建方法和系统 | |
Kohlbacher et al. | Multivariate networks in the life sciences | |
Robbins | Biological databases: A new scientific literature | |
Gilbert et al. | The Allen Brain Atlas: toward understanding brain behavior and function through data acquisition, visualization, analysis, and integration | |
Belmamoune et al. | Data integration for spatio-temporal patterns of gene expression of zebrafish development: the GEMS database | |
Angelopoulos et al. | Advances in big data bio analytics | |
Lowe et al. | Across and within networks: Thickening the history of genomics | |
Brown et al. | Golgi: Interactive online brain mapping | |
McGee et al. | Layer definition and discovery in multilayer network datasets | |
WO2024090367A1 (ja) | 情報処理方法、コンピュータプログラム及び情報処理装置 | |
Roberts | Linked Open Statistical Data for the Scottish Government. | |
Zhang | Visualizing Spatial Bulk and Single Cell Assays in Anatomical Images | |
Laforest et al. | SITRANS: a web information system for microarray experiments | |
Burgess et al. | Use of databases for research and conservation of the Eastern Arc Mountains | |
Campbell et al. | A Phylogenetic Approach to Bibliographic Families and Relationships |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20061106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070117 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070724 |