JP4543563B2 - 統合データベースシステムにおける問合せ最適化方法 - Google Patents

統合データベースシステムにおける問合せ最適化方法 Download PDF

Info

Publication number
JP4543563B2
JP4543563B2 JP2001053474A JP2001053474A JP4543563B2 JP 4543563 B2 JP4543563 B2 JP 4543563B2 JP 2001053474 A JP2001053474 A JP 2001053474A JP 2001053474 A JP2001053474 A JP 2001053474A JP 4543563 B2 JP4543563 B2 JP 4543563B2
Authority
JP
Japan
Prior art keywords
query
protein
approximate
predicate
database system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001053474A
Other languages
English (en)
Other versions
JP2002259425A (ja
Inventor
一智 牛嶋
格 西澤
隆彦 新谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001053474A priority Critical patent/JP4543563B2/ja
Priority to US09/932,114 priority patent/US6898594B2/en
Publication of JP2002259425A publication Critical patent/JP2002259425A/ja
Application granted granted Critical
Publication of JP4543563B2 publication Critical patent/JP4543563B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24547Optimisations to support specific applications; Extensibility of optimisers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/20Heterogeneous data integration
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioethics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はデータベース、Webサーバ等のネットワークで接続された任意のデータソースを複数組合せて問合せ処理を行う統合データベースシステムに係わり、特に統合データベースに対して発行された問合せの最適化を行うシステムに関する。
【0002】
【従来の技術】
ヒトの全DNA配列データを読み取ることを目標として1990年から15年を目処に開始されたヒトゲノム計画は、配列読み取り技術の大幅な進展並びに並列計算機を用いた大規模再配置手法の適用によりその読み取り速度が急速に加速され、2000年6月には全ゲノムの約85%に当たる部分について、そのドラフト配列の公表が行われるまでに至った。さらにヒトゲノム計画と並行して、ヒト以外の様々な生物種のDNA配列データについても解読が行われ、生体内のタンパク質のアミノ酸配列・立体構造データ、さらには代謝経路に関するデータなどについても解読結果がそれぞれの個別のデータベース(バイオ情報データベース)に整理・蓄積されている。これらのデータベースは、多くの場合何らかの公共機関によって管理運営され、インターネットを通じて参照することが可能となっている。
【0003】
また、大量のDNA配列データの中から遺伝子をコードしている領域を予測したり、タンパク質の立体構造を予測するなど配列データから派生して得られる情報を抽出する様々な解析ツールが次々と提案され、これらのツールの一部はインターネットを通じて公開されている。
【0004】
一方、実験室における実験データ取得方法も大きく変革され、細胞内の多数の遺伝子の発現量を横断的に計測できるDNAマイクロアレイ法など、高スループットで大量のデータを取得可能な手法が考案され、大量の実験結果が実験室内にも蓄積されるようになりつつある。
【0005】
今後は、これらデータベースやツールを組合せ、配列データにコードされている遺伝子やタンパク質が生体内においてどのような機能を担っており、どのように関連し合っているかを明らかにし、製薬・医療・食品等の各分野における応用を図っていく事が重要とされている。生体現象の複雑な解析を行うためにはこれらのデータベースやツールを組合せた問合せ処理を行うことが不可欠であるが、その実現に際しては以下のような困難が伴う。
1. 収められたデータのデータ形式や問合せ形式が統一されておらず、複数のデータベースを組合せて利用する問合せを発行する事が困難である。
2. 収録されたデータの範囲や現象記述レベル等に関して、各データベースの問合せ能力がバラバラであるため、どのデータベースを関連させて問合せることが適当であるかを決定することが難しい。
3. 技術の進展に伴い、新たなデータベースやツールが次々と追加され、それぞれが個別に管理されているため、それらを既存のデータベース群と統合して利用するための手間が大きい。
【0006】
今後、効率の良いバイオ情報解析を行うためには、これら複数のデータベースやツールを組合せた問合せを簡便に発行することが可能で、またこのような問合せを効率良く実行できるような統合データベースシステムを構築することが重要である。複数のデータベースを組合せる統合データベースシステムにおいて効率の良い問合せ処理を行うためには、データ形式が異なる複数の外部データベースに対して、これらを関連付けた統合インターフェースを提供し、投入された問合せを効率良い問合せプランに変換して実行する問合せ最適化機構が重要である。
【0007】
従来の統合データベースシステムにおける問合せ最適化方式としては、第1の方式として、文献“ACM SIGMOD International Conference on Management of Data(SIGMOD'98)”(ACM Press発行)のP.564-566記載の論文 “Capability Based Mediation in TSIMMIS”及び米国特許第5588150号公報に開示されているラッパー・メディエータシステムにおけるアプローチ、第2の方式として、文献“Foundation of Intelligent Knowledge-Based Systems”(Academic Press発行)の12章“Multiagent systems”及び日本国公開特許平11-85522号に開示されているマルチエージェントシステムにおけるアプローチをあげることができる。
【0008】
まず第1の従来方式であるラッパー・メディエータ型統合データベースシステムでは、個々の外部データベースに対してラッパーと呼ばれる問合せやデータ形式を変換するプログラムが用意され、メディエータは適切なラッパ−を組合せることによって、複数のデータベースを単一のインターフェースを通じてアクセスすることを可能とする。このときそれぞれのラッパーは各自が受付可能な問合せのクラスを宣言しメディエータに登録する。投入された問合せの一部または全部がラッパーで宣言された問合せのクラスに含まれる場合は、その部分の処理をラッパー側に委託することが可能となる。メディエータは、ラッパー側の問合せ処理の見積りコスト等に基づき、その処理を委託するかどうかを決定する。
【0009】
一般に、統合データベースシステムに対して投入された問合せを外部データベースを利用して処理する問合せプランは、利用する外部データベースの組合せおよび問合せ順序に関して何通りも考えることが出来き、これらの問合せプランは実行コスト及び問合せの結果得られるデータ内容に関してそれぞれ異なる性質を有する。しかし、第1の従来方式では、投入された問合せを外部データベースを利用して処理するいくつかの問合せプランの中から一つを選択して実行するため、得られる問合せ結果が本来外部データベースを利用して得られる問合せ結果より少なくなってしまう。例えば、現在一般公開されているデータベースを用いてヒトゲノムに含まれる全ての遺伝子の集合を得ようとした場合、「遺伝子データベースに登録された遺伝子データからヒトのものであることが明示されているものを選ぶ」「配列データベースに登録されたヒトゲノムデータに対して遺伝子予測ツールを適用して抽出する」「文献データベースに登録された文献から該当記述箇所を見つけ出し、そこで言及されている遺伝子名から決定する」など様々な問合せ方法を考えることが出来、それぞれの問合せ結果が持つ性質も大きく異なると予想される。そのため、第一の従来方式での問合せ最適化方式は、それぞれに格納されるデータや問合せ能力が互いに重なり合うようなデータベースが多数乱立しており、その組合せ方が幾通りもあるようなバイオ情報分野での統合データベース問合せ最適化方式としては適当でない。
【0010】
次に第2の従来方式であるマルチエージェント型統合データベースシステムは、個々のデータソース及びデータソースに対する問合せ能力をカプセル化した外部エージェントと、投入された問合せを受け付け前記複数の外部エージェントにフォワードするコーディネートエージェントから成る。各外部エージェントはそれぞれが処理可能な問合せのクラスについて、予めコーディネートエージェントに対して登録しておき、ユーザから投入された問合せはコーディネートエージェントが各外部エージェントの登録内容に従って、問合せを処理可能な適当な外部エージェントに対して処理を委託する。このとき必要に応じてコーディネートエージェントは各外部エージェントで処理が可能なように問合せやデータ形式の変換を行う場合がある。
【0011】
このように第2の従来方式では、ユーザに対して単一のインターフェースが提供されることはないが、個々のデータソースのデータ形式の違いや問合せ能力の違いをコーディネートエージェントが隠蔽することで、比較的簡便に問合せを発行することが出来る。しかし第2の従来方式においても、エージェントの問合せ処理能力の包含関係に従って、投入された問合せの転送先のエージェントの組合せを一通りに決定して実行するため、第一の従来方式と同じく、得られる問合せ結果が本来外部データベースを利用して得られる問合せ結果より少なくなってしまう。そのため、バイオ情報分野での統合データベース問合せ最適化方式としては適当でない。
【0012】
【発明が解決しようとする課題】
上述の従来方式では、投入された問合せを外部データベースでの問合せ処理を組み合わせて実行する幾通りの問合せプランの中から一つを選んで実行するため、この問合せプランを実行して得られる問合せ結果が本来外部データベースを利用して得られる問合せ結果より少なくなってしまう可能性が有る。
【0013】
本発明の目的は、統合データベースシステムにおいて、ユーザが投入した問合せに対して外部データベースを組合せて利用する問合せプランを生成する際に、問合せ結果に求められる精度や問合せ処理のコストに対する要求を踏まえた上で、統合データベースにおける問合せ処理を効率良く行えるような問合せプランを生成する問合せ最適化方式を提供することである。
【0014】
【課題を解決するための手段】
本発明の代表的な態様に従うシステムは、複数の外部データベースを組合せて問合せ処理を行う統合データベースシステムであって、問合せで用いられる述語間の関連を表す重み付きオントロジ、及び前記外部データベースの問合せ処理能力に関する仕様記述を備え、前記オントロジを参照して、前記統合データベースシステムに対して投入された問合せを一つまたは複数の問合せ集合に変換する問合せ展開手段、前記仕様記述を参照して前記変換された問合せ集合の中から前記外部データベースを利用して実行可能な問合せを抽出する問い合わせ抽出手段、前記オントロジに設定された重みを参照して、前記抽出された問合せ集合の中から適当な組合せの問合せを選択する問合せ選択手段、前記選択された問合せ集合のそれぞれの問合せを併合した問合せプランを生成する問合せプラン併合手段とを含む。
【0015】
すなわち、投入された問合せに対して外部データベースを組合せて処理する問合せプランを複数生成し、生成された問合せプランの集合から投入された問合せに対してどれほど確からしい問合せ結果を返すことが出来るかを表す尺度としての近似度を参照して適切な問合せプランの部分集合を選択し、これに対して共通処理部分の括り出しなどの問合せ最適化を行いながら問合せプランを併合することで、問合せ処理コストを抑えつつ、投入された問合せに対してなるべく多くの問合せ結果を得ることの出来るような問合せプランを生成するようにする。
【0016】
本発明の他の態様、およびこれらを実現するためより具体的なシステム構成については、実施例の説明において明らかにされる。
【0017】
【発明の実施の形態】
図1に本発明における問合せ最適化方式を備える統合データベースシステムの実施形態の一例を示す
【0018】
本実施例における統合データベースシステム1は、ユーザまたはプログラムから発行された問合せを受け付け、問合せ投入時あるいは投入前に指定された問合せ結果の精度や問合せコストに関する指定を参照しながら、この問合せに対して予め指定された外部データベース群2を組合せる事で処理内容を近似するような近似問合せを複数生成し、これら近似問合せの問合せプランを併合することで、投入された問合せに対してより効率的な近似を行う問合せプランを生成する。統合データベースシステムは、この問合せプランの実行結果を最初に投入された問合せの近似された問合せ結果として返す。
【0019】
図1において、オントロジモジュール3は前記統合データベースシステム1が統合を行う前記外部データベース2との間の関係を表すオントロジを保持する。ディクショナリモジュール4は前記外部データベース2に関する仕様記述を保持する。問合せ受付モジュール5はユーザまたはプログラムから発行された問合せを受け付け、統合データベースシステムでの内部表現への変換を行う。問合せ最適化モジュール6は、前記問合せ受付モジュール5が生成した問合せの内部表現及び前記オントロジを参照して、問合せの内部表現を変換しながら前記外部データベースを組合せて利用する近似問合せの集合を生成する。問合せプラン生成モジュール7は、前記問合せ最適化モジュールが生成した近似問合せ集合のそれぞれの近似問合せに対して問合せプランを生成し、これらを併合することで最終的な問合せプランを生成する。
【0020】
以下に、上記各構成要素の詳細構造について述べる。
【0021】
「オントロジモジュール」
本実施例においてオントロジモジュール3が保持するオントロジ14は、図2に示すような有向グラフで表される。オントロジは統合データベースシステムに対する問合せで利用される述語や外部データベースを整理分類するグラフ構造として利用される。オントロジのノード21及び有向エッジ22はそれぞれ問合せの内部表現として利用される述語及び述語の間の対応関係を表す。また統合データベースに対して発行された問合せは、問合せ受付モジュール5においてオントロジ上の述語を用いた内部表現に変換される。
本実施例におけるオントロジでは、ノードNに対応する述語が他のノード群Niに対応する述語の組合せで近似可能な場合、ノードNからノード群Niに対してエッジが張られる。このときエッジに対しては、ノードNに対応する述語をノード群Niに対応する述語で置き換える場合の対応関係を表す“近似ルール”と近似ルールで対応付けられた述語間の関連の度合いを表す“近似度”が設定される。
【0022】
「外部データベース群」
本実施例における外部データベース2は、問合せ対象となるデータソース18及び前記データソースに対して一定の問合せ処理を行なう検索ツール17の組合せから成る。それぞれの外部データベースのデータソース18にどのようなデータが蓄積されており、また外部データソースの検索ツール17がどのような問合せ処理を行えることができるかに関する外部データベース仕様記述15は、前記ディクショナリモジュール4に格納される。
【0023】
「ディクショナリモジュール」
本実施例におけるディクショナリモジュール4は、前記外部データベース2に関する外部データベース仕様記述15に加え、統合データベースシステムが変換することのできるデータ型や問合せのクラスの間の対応付けに関するデータ・問合せ変換仕様記述16を保持する。
【0024】
「問合せ受付モジュール」
本実施例における問合せ受付モジュール5は、統合データベースシステム1に対して投入された問合せを前記オントロジ14上の述語を用いた内部表現に変換する問合せ変換手段8を保持する。統合データベースシステム1に対して発行される問合せに対しては、問合せ投入時あるいは投入前に近似問合せを生成する際の近似度の下限及び実行コストの上限を指定することができる。
【0025】
「問合せ最適化モジュール」
本実施例における問合せ最適化モジュール6は、投入された問合せを近似問合せ候補の集合に展開する問合せ展開手段9、展開された近似問合せ候補の集合から、ディクショナリモジュールに登録された外部データベース等の仕様記述を参照して、実行可能な問合せを抽出する実行可能問合せ抽出手段10、抽出された実行可能な近似問合せの集合から、指定された近似度の下限と実行コストの上限に照らして最適な近似問合せ候補の集合を選択する最適近似問合せ選択手段11から成る。
【0026】
「問合せプラン生成モジュール」
本実施例における問合せプラン生成モジュール7は、前記問合せ最適モジュールで選択された最適近似問合せ集合のそれぞれの近似問合せに対して問合せプランを生成する問合せプラン生成手段12、生成された問合せプランの集合から投入された問合せに対して近似度の大きさなど適当な順番でプランの併合を行い、近似度と実行コストに関して最適な問合せプランの組合せを生成する問合せプラン併合手段13から成る。
【0027】
「全体のフローチャートとその説明」
次に図3において本実施例における処理全体の処理フローの様子を示す。
まず、ユーザまたはプログラムによって統合データベースシステム1に対して発行された問合せは、前記問合せ受付モジュール5の問合せ変換手段8によって前記オントロジ14上の述語を用いた内部表現に変換される(ステップ31)。このとき、投入された問合せを近似問合せに展開する際の近似度の下限と問合せプランを作成する際の実行コストの上限を予め指定しておくか、問合せ投入時に指定することができる(ステップ30)。
続いて内部表現に変換された問合せは、前記問合せ最適化モジュール6の近似問合せ展開手段9によって、オントロジ14上のノードに設定された近似ルールに従って、指定された近似度の下限を下回らない範囲で近似問合せの集合へ展開される(ステップ32)。
【0028】
ついで前記問合せ最適化モジュール6の実行可能問合せ抽出手段10によって、近似問合せ集合のうち実行可能な問合せプランが生成できる近似問合せのみが抽出され近似問合せ集合に残される。さらに前記問合せ最適化モジュール6の最適近似問合せ選択手段11によって、近似問合せ集合内の近似問合せの内、投入された問合せを一定の基準において最も良く近似すると思われる組合せが選択され、これが近似問合せ集合へ残される(ステップ33)。近似問合せ集合内の近似問合せは全てその近似値の降順に関して整列される(ステップ34)。
【0029】
その後、前記問合せプラン生成モジュール7の問合せプラン生成手段12にて問合せプランに変更されながら、指定された実行コストを超えないように順に併合され(ステップ35)、最終問合せプランが得られた時点でこれが実行される(ステップ36)。
【0030】
「各モジュールの手段毎のフローチャートとその説明」
以下では、各モジュールを構成する手段毎の詳細処理フローの様子を示す。
【0031】
一般に本実施例における近似問合せは、{(n1,..,ni), a0}と表現される。ここでniはオントロジ上の述語、aは近似度を表し、最初に投入された問合せの場合は必ずa=1.0である。このとき、この一般形で表される近似問合せでは、統合データベースシステムに対して述語n1,..,述語niによって指定される条件を満たすようなデータの集合を問合せ結果として返すように指示しており、近似度a0はその場合の問合せ結果が、元の問合せの問合せ結果とおおよそa0の割合で一致すると予想されることを示している。
【0031】
図4及び図5に、前記問合せ最適化モジュール6の近似問合せ展開手段9の処理
フローを示す。
【0032】
本実施例における近似問合せ展開においては、まず前記問合せ受付モジュール5によってオントロジ上の述語を利用して変換された内部表現{(n1,..,ni), 1.0}が、近似問合せ集合SQの最初の要素として設定される(ステップ40)。続いて、近似問合せ集合SQ内のそれぞれの近似問合せsq={(n1,..,ni), a0}について、述語niに対応するオントロジ上のノードNiに対して、以下のような問合せ近似ルール及び近似度が設定されている場合、
{ni→(m1,..., mm), a1}
元の近似問合せsqの述語niをm1,...,mmで置き換え、次式の近似問い合わせ、つまり近似度をa0*a1とした新しい近似問合せnsqを生成し(図5のステップ51)、
nsq={(n1,...,ni-1, m1,...,mm,ni+1,...,nn), a0*a1 }
これを近似問合せ集合SQに加える(図4のステップ42)。
【0033】
この操作は、近似問合せ集合SQにオントロジ上の近似ルールによって書き換え可能な近似問合せが存在するまで繰り返される(43)。ただし、展開された結果の近似問合せの近似度が指定された下限値を下回る場合は、その近似問合せを近似問合せ集合SQから削除してしまっても良い。
【0034】
図6は、前記問合せ最適化モジュールにおける実行可能問合せ抽出手段10と最適近似問合せ選択手段11の処理フローを示す。まず実行可能問合せ抽出手段10では、近似問合せ集合SQ内の全ての近似問合せsq={(n1,...,ni,...,nn), a0}について、近似問合せの問合せ部に出現する全ての述語niについてディクショナリモジュールを参照し、述語niに対応するノードNiに利用可能な要素データベースが存在し、かつ実行可能な問合せプランを構成可能なものだけを抽出し、近似問合せ集合SQに残す(ステップ60)。
【0035】
ついで、最適近似問合せ選択手段11では、近似問合せ集合SQ内に残された問合せsq={(n1,...,ni,...,nn), a0}の中から元の問合せの問合せ結果を効率良く近似するような適当な近似問合せの組合せを選択し、これらを近似問合せ集合SQに残す(ステップ61)。近似問合せの組合せの選択方法は、ここでは特に規定しない。
【0036】
図7は、前記問合せプラン生成モジュールにおける問合せプラン生成手段12と
問合せプラン併合手段13の処理フローを示す。
【0037】
まずはじめに、問合せプラン生成手段によって前記近似問合せ集合内の近似問合せを問合せプランに変換し(ステップ70)、ついで変換された問合せプランを近似度の大きい順に取り出しながら共通処理部分の括り出しを行うなどして併合する(ステップ72)。これを指定された問合せコストの上限を超えないように繰返し(ステップ73)、最終的に得られた問合せプランを最終プランとし、これを実行する(ステップ75)。但し、上記で示した最適化方法は実施形態の一例であり、本発明はこれに限定されるものではない。
【0038】
「具体的な処理に対する適用例の説明」
以下では、本実施例における問合せ最適化処理を具体的な問合せ例に適用した場合について説明する。
【0039】
まず、統合データベースシステムで利用される外部データベースとして図8に示すような4つの外部データベース群を想定する。すなわち、DB1は、これまでに解読されたタンパク質のアミノ酸配列・立体構造や機能についての情報などを蓄積するタンパク質DBである。DB2は、これまでに知られている様々な酵素反応の反応式を蓄積する酵素反応DBである。DB3は、これまで知られている遺伝子の転写調節因子に関する情報を蓄積する転写調節因子DBである。DB4は様々な生物種のゲノム配列情報を蓄積するゲノム配列DBである。
【0040】
また、このとき統合データベースシステムで利用されるオントロジとして、図8に示す有向グラフ構造を利用する。このオントロジは、7種類の述語を含み、それらの述語間の近似変換ルールとして8種類のルールが設定されている。すなわち述語は7種類であり、列挙すると以下の通りである。
発現抑制(遺伝子:gX, 遺伝子:gY):遺伝子gXが遺伝子gYの発現量を抑制する関係にあることを示す。
機能障害(タンパク質:pX, タンパク質:pY):タンパク質pXがタンパク質pYに作用してタンパク質pYの機能を障害する関係にあることを示す。
機能促進(タンパク質:pX, タンパク質:pY):タンパク質pXがタンパク質pYに作用してタンパク質pYの機能を促進する関係にあることを示す。
タンパク質機能(種別:X, タンパク質:pX, タンパク質:pY):タンパク質pXがタンパク質pYに対して種別X(=機能失活等)の機能を有することを示す。
酵素反応(タンパク質:pE, タンパク質:pX, タンパク質:pY):タンパク質pEがタンパク質pXからタンパク質pYへの反応を触媒する酵素であることを示す。
転写調節因子(種別:X, タンパク質:pX, 遺伝子:gY):タンパク質pXは遺伝子gYの種別X(=エンハンサ、リプレッサ等)の転写調節因子であることを示す。
配列(種別:X, 遺伝子:gX, タンパク質:pX):遺伝子gXがタンパク質pXに対して種別X(=エンコード等)の関係にあることを示す。
【0041】
近似ルールは、以下の8種類が設定されているとする。
R1:エンハンサ機能阻害={発現抑制(遺伝子:gX, 遺伝子:gY)→(配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),機能阻害(タンパク質:pX, タンパク質:enY),転写調節因子(種別:エンハンサ, タンパク質:enY, 遺伝子:gY)), 0.5}
R2:リプレッサ機能促進={発現抑制(遺伝子:gX, 遺伝子:gY)→(配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),機能促進(タンパク質:pX, タンパク質:reY),転写調節因子(種別:リプレッサ, タンパク質:reY, 遺伝子:gY)), 0.5}
R3:機能失活={機能阻害(タンパク質:pX, タンパク質:pY)→(タンパク質機能(種別:失活, タンパク質:pX, タンパク質:pY)), 0.7}
R4:生成酵素失活={機能阻害(タンパク質:pX, タンパク質:pY)→(タンパク質機能(種別:失活, タンパク質:pX, タンパク質:pE), 酵素反応(タンパク質:pE, タンパク質:pre-pY, タンパク質:pY), 0.2}
R5:転写因子抑制={機能阻害(タンパク質:pX, タンパク質:pY)→(転写調節因子(種別:リプレッサ, タンパク質:pX, 遺伝子:g-enY), 配列(種別:エンコード, 遺伝子:g-enY, タンパク質:enY)), 0.1}
R6:前駆体={機能促進(タンパク質:pX, タンパク質:pY)→(酵素反応(タンパク質:pE, タンパク質:pX, タンパク質:pY)), 0.3}
R7:生成酵素={機能促進(タンパク質:pX, タンパク質:pY)→(酵素反応(タンパク質:pX, タンパク質:pre-pY, タンパク質:pY)), 0.5}
R8:転写因子促進={機能促進(タンパク質:pX, タンパク質:pY)→(転写調節因子(種別:エンハンサ, タンパク質:pX, 遺伝子:g-pY), 配列(種別:エンコード, 遺伝子:g-pY, タンパク質:pY)), 0.2}
ここで図9は、それぞれ近似ルールR3からR8における各因子の関連を模式的に示す。
【0042】
前述の4つのDBはそれぞれ、オントロジ上のいくつかの述語に関する問合せを処理する能力を有し、それぞれの述語に対応するオントロジ上のノードと対応付けられている。すなわちタンパク質DBは、述語“タンパク質機能”に関する問合せを受け付けることが可能、酵素反応DBは、述語“酵素反応”に関する問合せを受け付けることが可能、転写調節因子DBは、述語“転写調節因子”に関する問合せを受け付けることが可能、ゲノム配列DBは、述語“配列”に関する問合せを受け付けることが可能とする。
【0043】
このとき例えば、ある生物の細胞への新規遺伝子gXの導入実験に先立って、統合データベースに対して遺伝子gXの導入によって発現量が減少することが予測される遺伝子gYを求める、Q=発現抑制(遺伝子:gX, 遺伝子:gY)という問合せが、近似度の下限MinApprox=0.1、及び実行コストの上限MaxExecCost=1000という指定と共に発行されたとする。前記問合せを受け付けた問合せ受付モジュールは、投入された問合せを対応する述語を表すノードN0に対応付け、
S=[P0={N0:発現抑制(遺伝子:gX, 遺伝子:gY), 1.0}]
なる内部表現に変換する。
【0044】
続いて問合せ最適化モジュールはノードN0に接続しているエッジE1,E2を参照し、そこに対応付けられている近似ルールR1,R2をそれぞれ用いて投入された問合せを変形し、新たな近似問合せP1、P2を近似問合せ集合Sに追加する。
第一回目適用:
S=[
P0={N0:発現抑制(遺伝子:gX, 遺伝子:gY), 1.0},
P1={N6:配列(しゅべつ:エンコード, 遺伝子:gX, タンパク質:pX),
N1:機能障害(タンパク質:pX, タンパク質:enY),
N5:転写調節因子(種別:エンハンサ, タンパク質:enY, 遺伝子:gY), 0.5},
P2={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N2:機能促進(タンパク質:pX, タンパク質:pre-reY, タンパク質:reY),
N5:転写調節因子(種別:リプレッサ, タンパク質:reY, 遺伝子:gY), 0.5 }]
【0045】
問合せ最適化モジュールは、この操作を新たに問合せが対応付けられたノードについて繰返し適用してゆくことで、投入された問合せを近似問合せの集合へ展開する。このときノードに適用される問合せの近似度が近似度の下限MinApproxを下回った場合は、その問合せは近似問合せの集合から削除され、以後考慮の対象外となる。また、問合せに出現する述語に対して適用可能な近似ルールがなくなった時点で、投入された問合せの近似問合せの集合への展開処理は終了する。
第二回目適用:
S=[
P0={N0:発現抑制(遺伝子:gX, 遺伝子:gY), 1.0},
P1={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N1:機能障害(タンパク質:pX, タンパク質:enY),
N5:転写調節因子(種別:エンハンサ, タンパク質:enY, 遺伝子:gY), 0.5},
P2={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N2:機能促進(タンパク質:pX, タンパク質:pre-reY, タンパク質:reY),
N5:転写調節因子(種別:リプレッサ, タンパク質:reY, 遺伝子:gY), 0.5 },
P3={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N3:タンパク質機能(関係:失活, タンパク質:pX, タンパク質:enY),
N5:転写調節因子(種別:エンハンサ, タンパク質:enY, 遺伝子:gY), 0.15},
P4={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N3:タンパク質機能(関係:失活,タンパク質:pX, タンパク質:pE),
N4:酵素反応(タンパク質:pE, タンパク質:pre-enY, タンパク質:enY),
N5:転写調節因子(種別:エンハンサ, タンパク質:enY, 遺伝子:gY), 0.05},
P5={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N5:転写調節因子(種別:リプレッサ, タンパク質:pX, タンパク質:g-enY),
N6:配列(種別:エンコード, 遺伝子:g-enY, タンパク質:enY),
N5:転写調節因子(種別:エンハンサ, タンパク質:enY, 遺伝子:gY), 0.05},
P6={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N4:酵素反応(タンパク質:pE, タンパク質:pX, タンパク質:reY),
N5:転写調節因子(種別:リプレッサ, タンパク質:reY, 遺伝子:gY), 0.15 },
P7={N6:配列(種別:エンコード, 遺伝子:gX, タンパク質:pX),
N4:酵素反応(タンパク質:pX, タンパク質:pre-reY, タンパク質:reY),
N5:転写調節因子(種別:リプレッサ, タンパク質:reY, 遺伝子:gY), 0.25 },
P8={N6:配列(種別:エンコード(遺伝子:gX, タンパク質:pX),
N5:転写調節因子(種別:エンハンサ, タンパク質:pX, 遺伝子:g-reY),
N6:配列(種別:エンコード, 遺伝子:g-reY, タンパク質:reY),
N5:転写調節因子(種別;リプレッサ, タンパク質:reY, 遺伝子:gY), 0.1 }]
このとき、近似度の下限が0.01であれば、上記の全ての近似問合せが近似問合せの集合Sに残されるが、この例で指定された近似度の下限は0.1であるので、上記のうち6番目の近似問合せP5は利用されない。また問合せプラン生成モジュールでは、前記問合せ最適化モジュールで決定された近似問合せの集合の中から実行可能な近似問合せの抽出を行う。すなわちある近似問合せが実行可能であるためには、以下の二点が必要である。
1.近似問合せを構成するそれぞれの述語に対して利用可能な外部データベースが存在すること。
2.外部データベースや検索ツールに対して適用される問合せが実行可能となるような問合せプランを生成でること。
すなわち例えば、上述の例において外部データベースのタンパク質DB(DB1)が利用可能でない場合は、ノードN3で利用可能な外部データベースが存在しないため、上記の近似問合せのうちP0からP4は実行可能ではない。従って上記近似問合せの内、実行可能なものはP6〜P8である。
【0046】
続いて問合せプラン生成モジュールは、実行可能なP6からP8の近似問合せに対して、各外部データベースが受理可能な問合せプランを生成する。例えば近似問合せP6の場合、遺伝子gXを指定してゲノム配列DBに問合せ、その結果得られたタンパク質pXの値で酵素反応DBを問合せ、さらにその結果得られたタンパク質reYの値で転写調節因子DBを問合せる図10に示すような問合せプランを考えることが出来る。
【0047】
続いて問合せプラン生成モジュールは、生成された問合せプランを近似度の大きい順に併合することを試みる。この例の場合ゲノム配列DBに対する問合せ{N6:エンコード(遺伝子:gX, タンパク質:pX)}と転写調節因子DBに対する問合せ{N5:リプレッサ(タンパク質:reY, 遺伝子:gY)}は共通であるのでこれを併合することで、図11に示すような問合せプランが生成される。この問合せプランでは、遺伝子gXを指定してゲノム配列DBに問合せ、その結果得られたタンパク質pXの値で酵素反応DBおよび転写調節因子DBを問合せ、転写調節因子DBを問合せた結果得られた遺伝子g-reYの値で再びゲノム配列DBを問合せ、最後に酵素反応DBを問合せた結果と最後にゲノム配列DBを問合せた結果得られたタンパク質reYの値で転写調節因子DBを問合せている。ただし、このとき併合後の問合せプランのコストは指定された問合せコストの上限を超えなかったものとする。
【0048】
【発明の効果】
本発明による問合せ最適化では、投入された問合せを構成する述語を、述語間の関連度に関する重みが設定されたオントロジを利用して書き換えることで、当該問合せを複数の近似問合せに展開し、これらのいくつかを纏めて実行することにより、より多くの問合せ結果を効率的に取得することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施例の統合データベースシステムを示すブロック図である。
【図2】上記実施例のオントロジの模式図である。
【図3】上記実施例の問合せ最適化のフローチャートである。
【図4】上記実施例の近似問合せ展開手段のフローチャートである。
【図5】近似問合せ展開手段のフローチャートである。
【図6】実行可能問合せ抽出手段及び最適近似問合せ選択手段のフローチャートである。
【図7】問合せプラン生成手段及び問合せプラン併合手段のフローチャートである。
【図8】実施例におけるオントロジの一例である。
【図9】実施例における近似ルールに対応する生体分子の関連模式図である。
【図10】実施例における問合せプランの一例である。
【図11】実施例における併合された問合せプランの一例である。
【符号の説明】
1:統合データベースシステム
2:外部データベース群
3:オントロジモジュール
4:ディクショナリモジュール
5:問合せ受付モジュール
6:問合せ最適化モジュール
7:問合せプラン生成モジュール
8:問合せ変換手段
9:近似問合せ展開手段
10:実行可能問合せ抽出手段
11:最適近似問合せ選択手段
12:問合せプラン生成手段
13:問合せプラン併合手段
14:オントロジ
15:外部データベース仕様記述
16:データ・問合せ変換仕様記述
17:検索ツール
18:データソース
20:問合せ述語
21:ノード
22:エッジ。

Claims (5)

  1. 投入された問合せから複数の外部データベースへの問合せプランを生成し、前記複数の外部データベースを組合せて問合せ処理を行う統合データベースシステムにおいて、前記問合せで用いられる述語間の対応関係及び当該対応関係により関連付けられた述語による問合せ結果の一致の度合いである近似度に関する情報を含む述語辞書、及び前記複数の外部データベース各々で処理可能な述語を示す仕様記述を保持したディクショナリを備え、前記統合データベースシステムに対して投入された問合せを当該投入された問合せ及び前記述語辞書により前記投入された問合せに用いられた述語と関連付けられた述語を要素として含む近似問合せを含む問合せ集合に変換する問合せ展開手段と、前記ディクショナリが保持する前記仕様記述を参照して前記複数の外部データベースの各々で処理可能な述語と前記問合せ集合に含まれる問合せに要素として含まれる前記述語との間の対応関係に基づき前記問合せ集合に含まれる問合せから前記複数の外部データベースで実行可能な問合せを抽出し、抽出された前記実行可能な問合せからなる問合せ集合を構成する問合せ抽出手段と、前記実行可能な問合せからなる問合せ集合に含まれる問合せを変換し、前記複数の外部データベースへの問合せプランを生成する問合せプラン生成手段とを含むことを特徴とする統合データベースシステム。
  2. 請求項1記載の統合データベースシステ0ムにおいて、前記問合せ展開手段は、前記問合せ集合中の問合せに用いられる述語について問合せの変換を行うことが可能な述語間の対応関係が前記述語辞書に存在する場合に、前記述語辞書を参照した問合せの変換を、繰返し適用することを特徴とする統合データベースシステム。
  3. 請求項1記載の統合データベースシステムにおいて、前記問合せ展開手段は、前記述語辞書に設定された近似度を参照して前記投入された問合せに対する前記近似問合せの近似度を求め、予め指定された近似度の基準を満たす前記近似問合せを選択して前記問合せ集合とすることを特徴とする統合データベースシステム。
  4. 請求項1記載の統合データベースシステムにおいて、さらに、前記問合せプラン生成手段が生成した問合せプランの各々に対応する近似問合せの近似度を参照して当該近似度の大きさに従って生成された問合せプランを取り出し、取り出した問合せプランの共通処理部分を括り出して併合する問合せプラン併合手段を含むことを特徴とする統合データベースシステム。
  5. 計算機を、投入された問合せから複数の外部データベースへの問合せプランを生成し、前記複数の外部データベースを組合せて問合せ処理を行う統合データベースシステムとして機能させるためのプログラムであって、当該計算機を
    予め当該計算機の記憶装置に保持され、前記問合せで用いられる述語間の対応関係及び当該対応関係により関連付けられた述語による問合せ結果の一致の度合いである近似度に関する情報を含む述語辞書を参照して、前記投入された問合せを当該投入された問合せ及び前記述語辞書により前記投入された問合せに用いられた述語と関連付けられた述語を要素として含む近似問合せを含む問合せ集合に変換する問合せ展開手段と、
    予め当該計算機の記憶装置に保持され、前記複数の外部データベース各々で処理可能な述語を示す仕様記述を保持したディクショナリを参照して、前記複数の外部データベースの各々で処理可能な述語と前記問合せ集合に含まれる問合せに要素として含まれる述語との間での対応関係に基づき、前記展開手段により変換された前記問合せ集合から前記複数の外部データベースで実行可能な問合せを抽出し、抽出された前記実行可能な問合せからなる問合せ集合を構成する問合せ抽出手段と、
    前記実行可能な問合せからなる問合せ集合に含まれる問合せを変換し、前記複数の外部データベースへの問合せプランを生成する問合せプラン生成手段として機能させるためのプログラムを格納したプログラム記録媒体。
JP2001053474A 2001-02-28 2001-02-28 統合データベースシステムにおける問合せ最適化方法 Expired - Fee Related JP4543563B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001053474A JP4543563B2 (ja) 2001-02-28 2001-02-28 統合データベースシステムにおける問合せ最適化方法
US09/932,114 US6898594B2 (en) 2001-02-28 2001-08-20 Integrated database system and program storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001053474A JP4543563B2 (ja) 2001-02-28 2001-02-28 統合データベースシステムにおける問合せ最適化方法

Publications (2)

Publication Number Publication Date
JP2002259425A JP2002259425A (ja) 2002-09-13
JP4543563B2 true JP4543563B2 (ja) 2010-09-15

Family

ID=18913936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001053474A Expired - Fee Related JP4543563B2 (ja) 2001-02-28 2001-02-28 統合データベースシステムにおける問合せ最適化方法

Country Status (2)

Country Link
US (1) US6898594B2 (ja)
JP (1) JP4543563B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7650327B2 (en) 2002-03-01 2010-01-19 Marine Biological Laboratory Managing taxonomic information
US20030187689A1 (en) * 2002-03-28 2003-10-02 Barnes Robert D. Method and apparatus for a single database engine driven, configurable RIS-PACS functionality
CN1856790A (zh) * 2003-07-22 2006-11-01 基诺技术公司 使用本体的信息访问
US7337170B2 (en) * 2005-01-18 2008-02-26 International Business Machines Corporation System and method for planning and generating queries for multi-dimensional analysis using domain models and data federation
US20080172360A1 (en) * 2007-01-17 2008-07-17 Lipyeow Lim Querying data and an associated ontology in a database management system
US7730098B2 (en) 2007-03-02 2010-06-01 International Business Machines Corporation Method for supporting ontology-related semantic queries in DBMSs with XML support
US7865488B2 (en) * 2007-11-28 2011-01-04 International Business Machines Corporation Method for discovering design documents
JP5281354B2 (ja) * 2008-10-02 2013-09-04 アグラ株式会社 検索システム
US9665620B2 (en) * 2010-01-15 2017-05-30 Ab Initio Technology Llc Managing data queries
US9122720B2 (en) 2011-06-14 2015-09-01 Microsoft Technology Licensing, Llc Enriching database query responses using data from external data sources
US9147195B2 (en) 2011-06-14 2015-09-29 Microsoft Technology Licensing, Llc Data custodian and curation system
US9244956B2 (en) 2011-06-14 2016-01-26 Microsoft Technology Licensing, Llc Recommending data enrichments
US9189531B2 (en) 2012-11-30 2015-11-17 Orbis Technologies, Inc. Ontology harmonization and mediation systems and methods
US9244971B1 (en) * 2013-03-07 2016-01-26 Amazon Technologies, Inc. Data retrieval from heterogeneous storage systems
US9189515B1 (en) 2013-03-08 2015-11-17 Amazon Technologies, Inc. Data retrieval from heterogeneous storage systems
EP2973059A4 (en) * 2013-03-14 2016-10-12 Ontomics Inc TOOLS AND METHOD FOR PERSONALIZED CLINICAL DECISION SUPPORT
CN103955144B (zh) * 2014-05-13 2016-08-17 安徽理工大学 基于多Agent的虚拟煤矿应急疏散仿真系统
CN105183735B (zh) * 2014-06-18 2019-02-19 阿里巴巴集团控股有限公司 数据的查询方法及查询装置
US10417281B2 (en) 2015-02-18 2019-09-17 Ab Initio Technology Llc Querying a data source on a network
US11093223B2 (en) 2019-07-18 2021-08-17 Ab Initio Technology Llc Automatically converting a program written in a procedural programming language into a dataflow graph and related systems and methods

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10198697A (ja) * 1997-01-14 1998-07-31 Fuji Xerox Co Ltd 構造化文書検索装置
JP2000503144A (ja) * 1996-01-02 2000-03-14 ヴェリティー インコーポレイテッド 多数の及び/又は複雑な問合せを用いたデータセットの内容の評価
JP2000112968A (ja) * 1998-10-02 2000-04-21 Fujitsu Ltd 情報検索支援装置および情報検索支援プログラム記憶媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590319A (en) * 1993-12-15 1996-12-31 Information Builders, Inc. Query processor for parallel processing in homogenous and heterogenous databases
US5588150A (en) 1994-09-29 1996-12-24 International Business Machines Corporation Push down optimization in a distributed, multi-database system
US5930786A (en) * 1995-10-20 1999-07-27 Ncr Corporation Method and apparatus for providing shared data to a requesting client
US6477527B2 (en) * 1997-05-09 2002-11-05 International Business Machines Corporation System, method, and program for object building in queries over object views
US6092062A (en) * 1997-06-30 2000-07-18 International Business Machines Corporation Relational database query optimization to perform query evaluation plan, pruning based on the partition properties
US6353818B1 (en) * 1998-08-19 2002-03-05 Ncr Corporation Plan-per-tuple optimizing of database queries with user-defined functions
US6546381B1 (en) * 1998-11-02 2003-04-08 International Business Machines Corporation Query optimization system and method
US6279030B1 (en) * 1998-11-12 2001-08-21 International Business Machines Corporation Dynamic JAVA™ class selection and download based on changeable attributes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000503144A (ja) * 1996-01-02 2000-03-14 ヴェリティー インコーポレイテッド 多数の及び/又は複雑な問合せを用いたデータセットの内容の評価
JPH10198697A (ja) * 1997-01-14 1998-07-31 Fuji Xerox Co Ltd 構造化文書検索装置
JP2000112968A (ja) * 1998-10-02 2000-04-21 Fujitsu Ltd 情報検索支援装置および情報検索支援プログラム記憶媒体

Also Published As

Publication number Publication date
JP2002259425A (ja) 2002-09-13
US6898594B2 (en) 2005-05-24
US20020120618A1 (en) 2002-08-29

Similar Documents

Publication Publication Date Title
JP4543563B2 (ja) 統合データベースシステムにおける問合せ最適化方法
Holley et al. Bifrost: highly parallel construction and indexing of colored and compacted de Bruijn graphs
Stevens et al. Ontology-based knowledge representation for bioinformatics
US20170228426A1 (en) Managing data queries
US20220261384A1 (en) Biological graph or sequence serialization
US20020194201A1 (en) Systems, methods and computer program products for integrating biological/chemical databases to create an ontology network
US20020194154A1 (en) Systems, methods and computer program products for integrating biological/chemical databases using aliases
US20080162541A1 (en) Visualization Technique for Biological Information
Janssen et al. Lost in folding space? Comparing four variants of the thermodynamic model for RNA secondary structure prediction
Winkler et al. The LASER database: Formalizing design rules for metabolic engineering
JPH0950372A (ja) 宣言的言語の仕様を自動変換する方法およびシステム
Torkamanian-Afshar et al. RPINBASE: An online toolbox to extract features for predicting RNA-protein interactions
Rocha et al. Bioinformatics algorithms: design and Implementation in Python
Bailey et al. GAIA: framework annotation of genomic sequence
EP3404567A1 (en) A system and a method for discovery of predicted site-specific protein phosphorylation candidates
Newman et al. A scale-out RDF molecule store for distributed processing of biomedical data
Garrison Graphical pangenomics
Nazipova et al. Big Data in bioinformatics
Liu et al. Jointly integrating VCF-based variants and OWL-based biomedical ontologies in MongoDB
Kirk et al. Classification of long noncoding RNAs by k-mer content
Chikhi A tale of optimizing the space taken by de Bruijn graphs
Angelopoulos et al. Advances in big data bio analytics
Prasanna et al. Scalable Knowledge Graph Construction and Inference on Human Genome Variants
Yokoyama¹ et al. Semantic Variation Graphs: Ontologies for Pangenome Graphs
Welcher Streaming Methods for Assembly Graph Analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060313

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100621

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091027

LAPS Cancellation because of no payment of annual fees