JP2015099497A - Knowledge information processing device, knowledge information processing method, and program - Google Patents

Knowledge information processing device, knowledge information processing method, and program Download PDF

Info

Publication number
JP2015099497A
JP2015099497A JP2013239127A JP2013239127A JP2015099497A JP 2015099497 A JP2015099497 A JP 2015099497A JP 2013239127 A JP2013239127 A JP 2013239127A JP 2013239127 A JP2013239127 A JP 2013239127A JP 2015099497 A JP2015099497 A JP 2015099497A
Authority
JP
Japan
Prior art keywords
knowledge
information
node
processing apparatus
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013239127A
Other languages
Japanese (ja)
Other versions
JP6026389B2 (en
Inventor
北野 宏明
Hiroaki Kitano
宏明 北野
ゴーシュ サミック
Ghosh Samik
ゴーシュ サミック
由希子 松岡
Yukiko Matsuoka
由希子 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SBX Inc
Original Assignee
SBX Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SBX Inc filed Critical SBX Inc
Priority to JP2013239127A priority Critical patent/JP6026389B2/en
Publication of JP2015099497A publication Critical patent/JP2015099497A/en
Application granted granted Critical
Publication of JP6026389B2 publication Critical patent/JP6026389B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a knowledge information processing device, a knowledge information processing method, and a program for allowing a user, such as a research worker to navigate, analyze and discover a knowledge space by treating sentences described in a natural language, such as a thesis equivalently with other large scale data and exceeding simple dictionary consultation.SOLUTION: This invention specifies nodes constituting a knowledge object network corresponding to an arbitrary word, acquires specific information including node information and/or arc information about the nodes, and outputs the specific information through an output part.

Description

本発明は、知識情報処理装置、知識情報処理方法、および、プログラムに関する。   The present invention relates to a knowledge information processing apparatus, a knowledge information processing method, and a program.

従来から、論文や新聞など自然言語で記述されている素材から知識を抽出するテキストマイニングという技術が開示されている。また、知識表現として概念の階層性や関係性を表現する方式の技術が開示されている。   Conventionally, a technique called text mining that extracts knowledge from materials described in natural languages such as papers and newspapers has been disclosed. Further, a technique of a method for expressing the hierarchy and relationship of concepts as knowledge expression is disclosed.

非特許文献1に記載のIPA(Ingenuity Pathway Analysis)データベースにおいては、論文などに表現している知識をそれらの解析に連動させる事を人間が解釈し知識ベースとして構築する技術が開示されている。   In the IPA (Ingenuity Pathway Analysis) database described in Non-Patent Document 1, a technique is disclosed in which a human being interprets and constructs as a knowledge base that knowledge expressed in a paper or the like is linked to the analysis thereof.

Ingenuity Systems Inc. (http://www.ingenuity.com)Ingenuity Systems Inc. (Http://www.ingenuity.com)

しかしながら、従来の一般的手法では、データとその解析を行うソフトウェア間の連携を行う事は可能であるものの、論文などに表現している知識をそれらの解析に連動させる事は出来なかった。なお、非特許文献1に記載の従来のデータベースにおいては、これを人間が解釈し知識ベースとして構築しているが、その表現は、従来の知識表現の手法並びに対象分子や遺伝子の構成するネットワーク構造を反映したものであるという問題点を有していた。   However, with conventional general methods, it is possible to link data and the software that analyzes the data, but it is not possible to link the knowledge expressed in papers to the analysis. In addition, in the conventional database described in Non-Patent Document 1, this is constructed as a knowledge base by human interpretation, but the representation is based on the conventional knowledge representation technique and the network structure composed of target molecules and genes. It had the problem of reflecting.

また、論文や新聞など自然言語で記述されている素材は、多くの非構造化された知識が表現されており、それらの知識を、膨大なデータなどと連動して解析を可能とする事で、飛躍的な知識の集約と新たな知識の発見が期待できるものであるが、非特許文献1に記載の従来のデータベース(知識ベース)などでは、論文や新聞などの内容を人が読んで解釈した結果を蓄積したものとなっており、読み手の解釈の恣意性の介入、および、知識ベース構築のコストなどが大きな課題となっていた。   In addition, materials written in natural language such as papers and newspapers express a lot of unstructured knowledge, and this knowledge can be analyzed in conjunction with huge amounts of data. It can be expected to dramatically increase the knowledge and discover new knowledge, but in the conventional database (knowledge base) described in Non-Patent Document 1, people read and interpret the contents of articles and newspapers. As a result, the intervention of the arbitraryness of the reader's interpretation and the cost of constructing the knowledge base were major issues.

また、いわゆるテキストマイニングは、構文解析を中心として各々の文章の統語構造の解析や意味の抽出を行おうとするものであるが、知識ベースの自動構築という目的に最適化されておらず、有効な知識抽出が出来ていないという問題を有していた。それにより、現状において、膨大な蓄積があり、さらに毎日大量に出版される生命科学の論文に内包する知識を体系的、且つ、高精度に抽出し、構造化された知識として体系化し、多様な利用を可能とするシステムの開発が待たれている。   In addition, so-called text mining is intended to analyze the syntactic structure of each sentence and extract meanings, focusing on syntactic analysis, but it is not optimized for the purpose of automatic knowledge base construction, and is effective. There was a problem that knowledge could not be extracted. As a result, there is an enormous accumulation, and knowledge contained in life science papers that are published in large quantities every day is extracted systematically and with high precision, and systematized as structured knowledge. Development of a system that can be used is awaited.

また、論文などの利用形態に目を向けると、一般に研究者は、論文を読みながらいろいろな事実を確認したり仮説を構築したりすることが多い。特に、知識集約的な学問である生命科学の分野では、この傾向が顕著である。しかしながら、現状においては、論文は印刷物として読まれる場合、または、PDFファイルなどの形式で読まれる事がほとんどであり、論文の内容に対して研究者の研究をサポートするような情報処理が行われる事は極めてまれであるという問題を有していた。また、PDFファイルまたはWEBページの論文等の表示に対して、遺伝子名またはタンパク質名等を同定し、データベースまたは検索内容を表示するソフトウェアは存在するが、これらは、単に同定された単語に対して辞書を連動させているにとどまっていた。   In addition, when looking at the usage of papers, researchers generally check various facts and build hypotheses while reading papers. This tendency is particularly remarkable in the field of life science, which is a knowledge-intensive study. However, at present, most of the papers are read as printed materials or in the form of PDF files, etc., and information processing that supports the research of researchers is performed on the content of the papers. The problem was that things were extremely rare. In addition, there are softwares that identify gene names or protein names and display databases or search contents for the display of PDF files or WEB page papers, etc., but these are only for identified words I just stayed linked to the dictionary.

本発明は、上記問題点に鑑みてなされたもので、論文等の自然言語により記述された文章を他の大規模データと同列に扱い、単なる辞書引きを超えて、研究者等のユーザが、知識空間をナビゲートし、解析し、発見する事が出来る知識情報処理装置、知識情報処理方法、および、プログラムを提供することを目的とする。   The present invention has been made in view of the above problems, and treats sentences described in a natural language such as papers in the same line as other large-scale data, and beyond mere dictionary lookup, users such as researchers, An object is to provide a knowledge information processing apparatus, a knowledge information processing method, and a program capable of navigating, analyzing, and discovering a knowledge space.

このような目的を達成するため、本発明の知識情報処理装置は、出力部と制御部と記憶部とを少なくとも備えた知識情報処理装置であって、上記記憶部は、自然言語により記述される単語、句、文または文の一群に対する固有の識別情報を対応付けた、上記単語、上記句、上記文または上記文の一群に表現された知識を示すノードに関するノード情報と、上記ノードの性質および/または上記ノード間の関連性を示すアークに関するアーク情報と、を含む、上記単語、上記句、上記文または上記文の一群と上記知識とが明確な対応関係をもって表現された、知識オブジェクトネットワークに関する知識オブジェクトネットワーク情報を記憶する知識ベース、を備え、上記制御部は、任意の上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む特定情報を取得する特定情報取得手段と、上記特定情報を上記出力部を介して出力させる特定情報出力手段と、を備えたことを特徴とする。   In order to achieve such an object, a knowledge information processing apparatus of the present invention is a knowledge information processing apparatus including at least an output unit, a control unit, and a storage unit, and the storage unit is described in a natural language. Node information relating to a node representing knowledge expressed in the word, the phrase, the sentence, or the group of sentences, associated with unique identification information for the word, phrase, sentence, or group of sentences; And / or a knowledge object network in which the word, the phrase, the sentence, or the group of sentences and the knowledge are expressed with a clear correspondence, including arc information indicating an arc indicating the relationship between the nodes. A knowledge base for storing knowledge object network information, wherein the control unit corresponds to any of the words. Specific information acquisition means for specifying the node constituting the network, acquiring the specific information including the node information and / or the arc information related to the node, and the specific information output for outputting the specific information via the output unit Means.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記記憶部は、上記ノードの関連情報を記憶する関連情報記憶手段、を更に備え、上記特定情報取得手段は、更に、上記任意の単語に対応する上記ノードの上記関連情報を上記関連情報記憶手段から検索し、当該検索された上記関連情報を取得し、上記特定情報出力手段は、更に、上記関連情報を上記出力部を介して出力させることを特徴とする。   In the knowledge information processing apparatus according to the present invention, in the knowledge information processing apparatus described above, the storage unit further includes related information storage means for storing related information of the node, and the specific information acquisition means further includes The related information of the node corresponding to the arbitrary word is searched from the related information storage means, the searched related information is acquired, and the specific information output means further outputs the related information to the output It is characterized by outputting via a part.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記関連情報記憶手段は、タンパク質情報を記憶するタンパク質情報記憶手段、遺伝子情報を記憶する遺伝子情報記憶手段、生体分子の分子間相互作用に関する分子間相互作用情報を記憶する分子間相互作用情報記憶手段、生体分子のパスウェイに関するパスウェイ情報を記憶するパスウェイ情報記憶手段、文献に関する文献情報を記憶する文献情報記憶手段、および/または、ニュース配信サービスが提供するニュースを記憶するニュース記憶手段、を備えたことを特徴とする。   The knowledge information processing apparatus of the present invention is the knowledge information processing apparatus described above, wherein the related information storage means is a protein information storage means for storing protein information, a gene information storage means for storing gene information, Intermolecular interaction information storage means for storing intermolecular interaction information relating to intermolecular interaction, pathway information storage means for storing pathway information relating to biomolecule pathways, literature information storage means for storing literature information relating to literature, and / or Alternatively, news storage means for storing news provided by the news distribution service is provided.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記制御部は、上記任意の単語に対応する上記ノードが上記知識オブジェクトネットワークに含まれていない場合、上記任意の単語に表現された上記知識を示す上記ノードに関する上記ノード情報を上記知識ベースに格納し、当該ノードとの間に相互背反を締める上記アークを設定し、上記アークに関する上記アーク情報を上記知識ベースに格納し、上記任意の単語に対応する上記ノードが上記知識オブジェクトネットワークに含まれている場合、上記任意の単語に対する上記識別情報を当該ノードに関する上記ノード情報に対応付けて上記知識ベースに格納する格納手段、を更に備えたことを特徴とする。   In the knowledge information processing apparatus according to the present invention, in the knowledge information processing apparatus described above, when the node corresponding to the arbitrary word is not included in the knowledge object network, the control unit performs the arbitrary word processing. The node information related to the node representing the knowledge expressed in (2) is stored in the knowledge base, the arc for tightening a contradiction with the node is set, and the arc information regarding the arc is stored in the knowledge base. And storage means for storing the identification information for the arbitrary word in the knowledge base in association with the node information for the node when the node corresponding to the arbitrary word is included in the knowledge object network. Are further provided.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記知識情報処理装置は、入力部、を更に備え、上記格納手段は、更に、上記格納された上記ノードとの間に上記相互背反を締める上記アークが設定された場合、当該相互背反であるか否かの評価を要求する当該上記アークに関する上記アーク情報を上記出力部を介して出力させ、上記入力部を介して上記相互背反であるとの評価が入力された場合、当該アーク情報を上記知識ベースに格納することを特徴とする。   The knowledge information processing apparatus according to the present invention is the knowledge information processing apparatus described above, wherein the knowledge information processing apparatus further includes an input unit, and the storage means further includes the node stored between the nodes. When the arc that tightens the mutual contradiction is set, the arc information related to the arc that requests the evaluation of whether or not it is the mutual contradiction is output via the output unit, and via the input unit The arc information is stored in the knowledge base when the evaluation that the two are contradictory is input.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記制御部は、上記文で構成される任意の文章に対する構造解析を行い、当該文章を構成する上記単語、上記句、上記文または上記文の一群を抽出する構造解析手段と、上記構造解析手段により抽出された上記単語、上記句、上記文または上記文の一群に対応する上記ノードが上記知識オブジェクトネットワークに含まれていない場合、上記単語、上記句、上記文または上記文の一群に表現された上記知識を示す上記ノードに関する上記ノード情報を上記知識ベースに格納し、上記ノードとの間に相互背反を締める上記アークを設定し、上記アークに関する上記アーク情報を上記知識ベースに格納し、上記単語、上記句、上記文または上記文の一群に対応する上記ノードが上記知識オブジェクトネットワークに含まれている場合、上記単語、上記句、上記文または上記文の一群に対する上記識別情報を当該ノードに関する上記ノード情報に対応付けて上記知識ベースに格納する格納手段と、を更に備えたことを特徴とする。   In the knowledge information processing apparatus according to the present invention, in the knowledge information processing apparatus described above, the control unit performs a structural analysis on an arbitrary sentence composed of the sentence, and the word and the phrase constituting the sentence. The knowledge object network includes a structure analysis unit that extracts the sentence or the group of sentences, and the node corresponding to the word, the phrase, the sentence, or the group of sentences extracted by the structure analysis unit. If not, the node information related to the node indicating the knowledge expressed in the word, the phrase, the sentence, or the group of sentences is stored in the knowledge base, and the mutual contradiction with the node is tightened. Set an arc, store the arc information about the arc in the knowledge base, and correspond to the word, the phrase, the sentence or the group of sentences Storage means for storing the identification information for the word, the phrase, the sentence, or the group of sentences in the knowledge base in association with the node information related to the node when the knowledge object network is included in the knowledge object network And further comprising.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記文章は、生命科学の学術論文であることを特徴とする。   The knowledge information processing apparatus of the present invention is characterized in that in the knowledge information processing apparatus described above, the sentence is a life science academic paper.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記制御部は、上記単語、上記句、上記文または上記文の一群と句構造テンプレートとのマッチングを行うことにより上記知識を抽出する知識抽出手段、を更に備え、上記格納手段は、上記知識抽出手段により抽出された上記知識に関する知識情報を含む、上記マッチングされた上記単語、上記句、上記文または上記文の一群に対応する上記ノード情報を上記知識ベースに格納することを特徴とする。   The knowledge information processing apparatus according to the present invention is the knowledge information processing apparatus described above, wherein the control unit matches the word, the phrase, the sentence, or the group of sentences with a phrase structure template. Knowledge extracting means for extracting knowledge, wherein the storage means includes knowledge information relating to the knowledge extracted by the knowledge extracting means, the matched word, the phrase, the sentence, or a group of the sentences The node information corresponding to is stored in the knowledge base.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記知識抽出手段は、上記単語、上記句、上記文または上記文の一群に対してプリプロセッシングを行い、明らかに除外できる挿入句などを取り除いた後、上記単語、上記句、上記文または上記文の一群と上記句構造テンプレートとのマッチングを行うことにより上記知識を抽出することを特徴とする。   Further, the knowledge information processing apparatus of the present invention is the knowledge information processing apparatus described above, wherein the knowledge extracting means preprocesses the word, the phrase, the sentence, or the group of sentences and clearly excludes them. After removing a possible insertion phrase, the knowledge is extracted by matching the word, the phrase, the sentence, or a group of sentences with the phrase structure template.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記制御部は、上記単語、上記句、上記文または上記文の一群に対して構文解析を利用してマッチングを行うことにより上記知識を抽出する知識抽出手段、を更に備え、上記格納手段は、上記知識抽出手段により抽出された上記知識に関する知識情報を含む、上記マッチングされた上記単語、上記句、上記文または上記文の一群に対応する上記ノード情報を上記知識ベースに格納することを特徴とする。   In the knowledge information processing apparatus according to the present invention, in the knowledge information processing apparatus described above, the control unit matches the word, the phrase, the sentence, or the group of sentences by using syntax analysis. Knowledge extracting means for extracting the knowledge by means of the above, the storage means including the knowledge information about the knowledge extracted by the knowledge extracting means, the matched word, phrase, sentence or sentence The node information corresponding to a group of sentences is stored in the knowledge base.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記知識情報処理装置は、入力部、を更に備え、上記特定情報取得手段は、上記入力部を介して上記任意の単語が指定された場合、上記任意の単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む上記特定情報を取得することを特徴とする。   Further, the knowledge information processing apparatus of the present invention is the knowledge information processing apparatus described above, wherein the knowledge information processing apparatus further includes an input unit, and the specific information acquisition unit is configured to input the arbitrary information via the input unit. When a word is specified, the node constituting the knowledge object network corresponding to the arbitrary word is specified, and the node information and / or the arc information related to the node is acquired. Features.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記知識情報処理装置は、入力部、を更に備え、上記特定情報出力手段は、上記特定情報および/または上記関連情報に基づく項目を上記出力部を介してリスト形式で選択可能に出力させ、上記入力部を介して上記項目が選択された場合、当該選択された上記項目に関する上記特定情報および/または上記関連情報を上記出力部を介して出力させることを特徴とする。   The knowledge information processing apparatus of the present invention is the knowledge information processing apparatus described above, wherein the knowledge information processing apparatus further includes an input unit, and the specific information output means includes the specific information and / or the related information. If the item is selected via the output unit and is selected via the input unit, the specific information and / or the related information regarding the selected item is displayed. It outputs through the said output part, It is characterized by the above-mentioned.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記知識情報処理装置は、入力部、を更に備え、上記特定情報出力手段は、上記特定情報および/または上記関連情報に基づく項目を上記出力部を介してネットワーク形式で選択可能に出力させ、上記入力部を介して上記項目が選択された場合、当該選択された上記項目に関する上記特定情報および/または上記関連情報を上記出力部を介して出力させることを特徴とする。   The knowledge information processing apparatus of the present invention is the knowledge information processing apparatus described above, wherein the knowledge information processing apparatus further includes an input unit, and the specific information output means includes the specific information and / or the related information. When the item is selected via the output unit and is selectable via the input unit, and the item is selected via the input unit, the specific information and / or the related information regarding the selected item is displayed. It outputs through the said output part, It is characterized by the above-mentioned.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記特定情報取得手段は、任意の図に含まれる上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む上記特定情報を取得し、上記ノードの上記関連情報を上記関連情報記憶手段から検索し、当該検索された上記関連情報を取得することを特徴とする。   Further, the knowledge information processing apparatus of the present invention is the knowledge information processing apparatus described above, wherein the specific information acquisition means specifies the node constituting the knowledge object network corresponding to the word included in an arbitrary figure. And acquiring the node information and / or the specific information including the arc information related to the node, searching the related information of the node from the related information storage unit, and acquiring the searched related information. It is characterized by.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記知識オブジェクトネットワークを構成する上記ノードは、各ステートメントオブジェクトネットワークにおいて一様の抽象度レベルに対応する上記ノードを投射したもの、または、上記ステートメントオブジェクトネットワークの個別領域において各々設定された上記抽象度レベルに対応する上記ノードを投射したものであることを特徴とする。   In the knowledge information processing apparatus according to the present invention, in the knowledge information processing apparatus described above, the nodes constituting the knowledge object network project the nodes corresponding to a uniform level of abstraction in each statement object network. Or the node corresponding to the abstraction level set in the individual area of the statement object network.

また、本発明の知識情報処理装置は、上記記載の知識情報処理装置において、上記知識オブジェクトネットワーク情報を構成する上記ノード情報は、実験データの解析結果または推定結果であることを特徴とする。   The knowledge information processing apparatus of the present invention is characterized in that, in the knowledge information processing apparatus described above, the node information constituting the knowledge object network information is an analysis result or an estimation result of experimental data.

また、本発明の知識情報処理方法は、出力部と制御部と記憶部とを少なくとも備えた知識情報処理装置において実行される知識情報処理方法であって、上記記憶部は、自然言語により記述される単語、句、文または文の一群に対する固有の識別情報を対応付けた、上記単語、上記句、上記文または上記文の一群に表現された知識を示すノードに関するノード情報と、上記ノードの性質および/または上記ノード間の関連性を示すアークに関するアーク情報と、を含む、上記単語、上記句、上記文または上記文の一群と上記知識とが明確な対応関係をもって表現された、知識オブジェクトネットワークに関する知識オブジェクトネットワーク情報を記憶する知識ベース、を備え、上記制御部において実行される、任意の上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む特定情報を取得する特定情報取得ステップと、上記特定情報を上記出力部を介して出力させる特定情報出力ステップと、を含むことを特徴とする。   The knowledge information processing method of the present invention is a knowledge information processing method executed in a knowledge information processing apparatus including at least an output unit, a control unit, and a storage unit, and the storage unit is described in a natural language. Node information regarding nodes representing knowledge expressed in the word, the phrase, the sentence, or the group of sentences and the unique identification information associated with the word, phrase, sentence, or group of sentences, and the nature of the node And / or arc information relating to arcs indicating the relationship between the nodes, and the knowledge object network in which the word, the phrase, the sentence, or the sentence group and the knowledge are expressed with a clear correspondence A knowledge base for storing knowledge object network information relating to any of the words executed in the control unit, A specific information acquisition step of specifying the node constituting the knowledge object network, acquiring specific information including the node information and / or the arc information related to the node, and specifying to output the specific information via the output unit An information output step.

また、本発明のプログラムは、出力部と制御部と記憶部とを少なくとも備えた知識情報処理装置に実行させるためのプログラムであって、上記記憶部は、自然言語により記述される単語、句、文または文の一群に対する固有の識別情報を対応付けた、上記単語、上記句、上記文または上記文の一群に表現された知識を示すノードに関するノード情報と、上記ノードの性質および/または上記ノード間の関連性を示すアークに関するアーク情報と、を含む、上記単語、上記句、上記文または上記文の一群と上記知識とが明確な対応関係をもって表現された、知識オブジェクトネットワークに関する知識オブジェクトネットワーク情報を記憶する知識ベース、を備え、上記制御部において、任意の上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む特定情報を取得する特定情報取得ステップと、上記特定情報を上記出力部を介して出力させる特定情報出力ステップと、を実行させることを特徴とする。   The program of the present invention is a program for causing a knowledge information processing apparatus including at least an output unit, a control unit, and a storage unit to execute the program, and the storage unit includes words, phrases, Node information related to a node indicating knowledge expressed in the word, the phrase, the sentence, or the sentence group, and unique identification information for a sentence or a group of sentences, and the nature of the node and / or the node Knowledge object network information related to a knowledge object network in which the word, the phrase, the sentence, the sentence or a group of sentences and the knowledge are expressed with a clear correspondence A knowledge base for storing the knowledge object network corresponding to an arbitrary word in the control unit. A specific information acquisition step of specifying the node constituting the work, acquiring specific information including the node information and / or the arc information relating to the node, and outputting the specific information via the output unit And executing the step.

この発明によれば、任意の単語に対応する、知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得し、特定情報を出力させるので、論文などの自然言語により記述された知識を明示的に抽出し、それに情報処理を行うことで、対象分野に関する一連の知識を可視化することができるという効果を奏する。   According to this invention, a node constituting a knowledge object network corresponding to an arbitrary word is specified, specific information including node information and / or arc information related to the node is acquired, and specific information is output. By explicitly extracting knowledge described in a natural language such as and performing information processing on the knowledge, a series of knowledge about the target field can be visualized.

この発明によれば、更に、任意の単語に対応するノードの関連情報を検索し、当該検索された関連情報を取得し、更に、関連情報を出力させるので、ユーザが所望する単語の知識の周辺知識も取得することができるという効果を奏する。   According to this invention, the related information of the node corresponding to the arbitrary word is searched, the searched related information is acquired, and the related information is further output. There is an effect that knowledge can also be acquired.

この発明によれば、タンパク質情報、遺伝子情報、生体分子の分子間相互作用に関する分子間相互作用情報、生体分子のパスウェイに関するパスウェイ情報、文献に関する文献情報、および/または、ニュース配信サービスが提供するニュースを記憶するので、生命科学の単語の知識の周辺知識を取得することができるという効果を奏する。   According to the present invention, protein information, gene information, intermolecular interaction information related to intermolecular interactions of biomolecules, pathway information related to biomolecule pathways, literature information related to literature, and / or news provided by a news distribution service Is stored, so that it is possible to obtain peripheral knowledge of knowledge of life science words.

この発明によれば、任意の単語に対応するノードが知識オブジェクトネットワークに含まれていない場合、任意の単語に表現された知識を示すノードに関するノード情報を知識ベースに格納し、当該ノードとの間に相互背反を締めるアークを設定し、アークに関するアーク情報を知識ベースに格納し、任意の単語に対応するノードが知識オブジェクトネットワークに含まれている場合、任意の単語に対する識別情報を当該ノードに関するノード情報に対応付けて知識ベースに格納するので、重複したネットワークが生じないようにでき、更に、研究者やシステムの開発者などがこのシステムを利用する事により知識ベースが成長し、精度を高めることができるという効果を奏する。   According to the present invention, when a node corresponding to an arbitrary word is not included in the knowledge object network, the node information related to the node indicating the knowledge expressed in the arbitrary word is stored in the knowledge base, and If the arc that closes the contradiction is set, arc information related to the arc is stored in the knowledge base, and the node corresponding to the arbitrary word is included in the knowledge object network, the identification information for the arbitrary word is stored in the node related to the node. Since it is stored in the knowledge base in association with information, it is possible to avoid duplicating networks, and the knowledge base grows and improves accuracy by using this system by researchers and system developers. There is an effect that can be.

この発明によれば、更に、格納されたノードとの間に相互背反を締めるアークが設定された場合、当該相互背反であるか否かの評価を要求する当該アークに関するアーク情報を出力させ、相互背反であるとの評価が入力された場合、当該アーク情報を知識ベースに格納するので、外部利用者の応答も取り入れることができ、知識ベースの精度をより高めることができるという効果を奏する。   According to the present invention, when an arc for tightening a contradiction with a stored node is set, arc information related to the arc for requesting an evaluation as to whether or not it is a mutual contradiction is output. When an evaluation of being a contradiction is input, since the arc information is stored in the knowledge base, the response of the external user can be taken in, and the accuracy of the knowledge base can be further improved.

この発明によれば、文で構成される任意の文章に対する構造解析を行い、当該文章を構成する単語、句、文または文の一群を抽出し、抽出された単語、句、文または文の一群に対応するノードが知識オブジェクトネットワークに含まれていない場合、単語、句、文または文の一群に表現された知識を示すノードに関するノード情報を知識ベースに格納し、ノードとの間に相互背反を締めるアークを設定し、アークに関するアーク情報を知識ベースに格納し、単語、句、文または文の一群に対応するノードが知識オブジェクトネットワークに含まれている場合、単語、句、文または文の一群に対する識別情報を当該ノードに関するノード情報に対応付けて知識ベースに格納するので、論文等の全体に含まれる知識情報を知識ベースに格納することができるという効果を奏する。   According to the present invention, a structure analysis is performed on an arbitrary sentence composed of sentences, a group of words, phrases, sentences, or sentences constituting the sentence is extracted, and a group of extracted words, phrases, sentences, or sentences is extracted. If the node corresponding to is not included in the knowledge object network, node information related to the node representing knowledge expressed in words, phrases, sentences, or a group of sentences is stored in the knowledge base, and mutual conflict is established between the nodes. A group of words, phrases, sentences, or sentences if the arc to be closed is set, arc information about the arc is stored in the knowledge base, and the knowledge object network contains nodes that correspond to groups of words, phrases, sentences, or sentences Is stored in the knowledge base in association with the node information related to the node, so that the knowledge information contained in the entire article etc. can be stored in the knowledge base. There is an effect that it is.

生命科学および生物学の分野では、そもそも対象となる現象の詳細な知識が知られていない場合も多いため、詳細な知識の表現を要求する方式では、これらの曖昧さの残る知識の記述が出来ない、または、記述が非常に煩雑になる場合があったが、この発明によれば、文章は、生命科学の学術論文であるので、曖昧さを残したまま記述が可能となり、知識の蓄積を加速させることができるという効果を奏する。   In the fields of life science and biology, detailed knowledge of the target phenomenon is often not known in the first place. Therefore, a method that requires the expression of detailed knowledge can describe these remaining ambiguities. However, according to the present invention, since the text is an academic paper of life science, it is possible to describe it with ambiguity and to accumulate knowledge. There is an effect that it can be accelerated.

この発明によれば、単語、句、文または文の一群と句構造テンプレートとのマッチングを行うことにより知識を抽出し、抽出された知識に関する知識情報を含む、マッチングされた単語、句、文または文の一群に対応するノード情報を知識ベースに格納するので、自然言語による記述によって情報処理の方法を定義し、効率的に知識を抽出することができるという効果を奏する。   According to the present invention, knowledge is extracted by matching a word, phrase, sentence, or a group of sentences with a phrase structure template, and includes a matched word, phrase, sentence, or knowledge information related to the extracted knowledge. Since node information corresponding to a group of sentences is stored in a knowledge base, an information processing method is defined by a description in a natural language, and knowledge can be efficiently extracted.

この発明によれば、単語、句、文または文の一群に対してプリプロセッシングを行い、明らかに除外できる挿入句などを取り除いた後、単語、句、文または文の一群と句構造テンプレートとのマッチングを行うので、原文からの知識抽出よりも効率的に知識を抽出することができるという効果を奏する。   According to the present invention, after preprocessing is performed on a group of words, phrases, sentences, or sentences, and an inserted phrase that can be clearly excluded is removed, a group of words, phrases, sentences, or sentences and a phrase structure template Since matching is performed, it is possible to extract knowledge more efficiently than knowledge extraction from the original text.

この発明によれば、単語、句、文または文の一群に対して構文解析を利用してマッチングを行うことにより知識を抽出し、抽出された知識に関する知識情報を含む、マッチングされた単語、句、文または文の一群に対応するノード情報を知識ベースに格納するので、解析木をテンプレートの代わりに蓄積、使用することができるという効果を奏する。   According to the present invention, a word, a phrase, a sentence, or a group of sentences is extracted by performing matching using syntax analysis, and the matched word, phrase including knowledge information about the extracted knowledge is included. Since node information corresponding to a sentence or a group of sentences is stored in the knowledge base, an analysis tree can be accumulated and used instead of a template.

この発明によれば、任意の単語が指定された場合、任意の単語に対応する、知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得するので、ユーザ所望の情報だけ出力させることができるという効果を奏する。   According to the present invention, when an arbitrary word is designated, a node constituting the knowledge object network corresponding to the arbitrary word is specified, and specific information including node information and / or arc information related to the node is acquired. As a result, only the information desired by the user can be output.

この発明によれば、特定情報および/または関連情報に基づく項目をリスト形式で選択可能に出力させ、項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を出力させるので、ユーザ所望の情報だけ出力させることができるという効果を奏する。   According to the present invention, items based on specific information and / or related information are output in a selectable manner in a list format, and when an item is selected, specific information and / or related information regarding the selected item is output. As a result, only the information desired by the user can be output.

この発明によれば、特定情報および/または関連情報に基づく項目をネットワーク形式で選択可能に出力させ、項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を出力させるので、ユーザ所望の情報だけ出力させることができるという効果を奏する。   According to the present invention, the items based on the specific information and / or the related information are output so as to be selectable in the network format, and when the item is selected, the specific information and / or the related information regarding the selected item is output. As a result, only the information desired by the user can be output.

この発明によれば、任意の図に含まれる単語に対応する、知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得し、ノードの関連情報を検索し、当該検索された関連情報を取得するので、図を一つの検索キーとして利用して、その関連部分の全体の情報を一早く入手することができるという効果を奏する。   According to the present invention, a node constituting a knowledge object network corresponding to a word included in an arbitrary figure is identified, identification information including node information and / or arc information related to the node is obtained, and node related information And the related information searched for is obtained, so that the entire information of the related portion can be obtained quickly by using the figure as one search key.

この発明によれば、知識オブジェクトネットワークを構成するノードは、各ステートメントオブジェクトネットワークにおいて一様の抽象度レベルに対応するノードを投射したもの、または、上記各ステートメントオブジェクトネットワークの個別領域において各々設定された上記抽象度レベルに対応する上記ノードを投射したものであるので、最も蓋然性が高いと推定された仮説の集合体である知識を抽出することができるという効果を奏する。   According to the present invention, the nodes constituting the knowledge object network are obtained by projecting nodes corresponding to a uniform level of abstraction in each statement object network, or set in individual areas of each statement object network. Since the node corresponding to the level of abstraction is projected, it is possible to extract knowledge that is a collection of hypotheses estimated to have the highest probability.

この発明によれば、知識オブジェクトネットワーク情報を構成するノード情報は、実験データの解析結果または推定結果であるので、大規模な実験データの解析、および、そこからの推定による仮説生成も含みながら、対象分野に関する一連の知識を漸増的に蓄積、統合、詳細化、可視化することができるという効果を奏する。   According to the present invention, since the node information constituting the knowledge object network information is the analysis result or estimation result of the experimental data, including analysis of large-scale experimental data and hypothesis generation based on the estimation therefrom, There is an effect that a series of knowledge about the target field can be gradually accumulated, integrated, refined, and visualized.

図1は、本実施の形態の基本原理を示すフローチャートである。FIG. 1 is a flowchart showing the basic principle of the present embodiment. 図2は、本実施の形態における知識情報処理装置の構成の一例を示すブロック図である。FIG. 2 is a block diagram showing an example of the configuration of the knowledge information processing apparatus in the present embodiment. 図3は、本実施の形態の知識情報処理装置の処理の一例を示すフローチャートである。FIG. 3 is a flowchart showing an example of processing of the knowledge information processing apparatus of the present embodiment. 図4は、本実施の形態における知識情報取得処理の一例を示す図である。FIG. 4 is a diagram showing an example of knowledge information acquisition processing in the present embodiment. 図5は、本実施の形態におけるSONの一例を示す図である。FIG. 5 is a diagram illustrating an example of the SON in the present embodiment. 図6は、本実施の形態における投射方法の一例を示す図である。FIG. 6 is a diagram showing an example of a projection method in the present embodiment. 図7は、本実施の形態における投射方法の一例を示す図である。FIG. 7 is a diagram illustrating an example of a projection method according to the present embodiment. 図8は、本実施の形態における投射方法の一例を示す図である。FIG. 8 is a diagram showing an example of a projection method in the present embodiment. 図9は、本実施の形態における知識オブジェクト化の一例を示す図である。FIG. 9 is a diagram illustrating an example of knowledge objectification according to the present embodiment. 図10は、本実施の形態における知識オブジェクト化の一例を示す図である。FIG. 10 is a diagram showing an example of knowledge objectification in the present embodiment. 図11は、本実施の形態における段落分類処理の一例を示す図である。FIG. 11 is a diagram showing an example of the paragraph classification process in the present embodiment. 図12は、本実施の形態における段落の文構成の一例を示す図である。FIG. 12 is a diagram illustrating an example of a sentence structure of a paragraph in the present embodiment. 図13は、本実施の形態における文6および文8の構成の一例を示す図である。FIG. 13 is a diagram showing an example of the configuration of sentence 6 and sentence 8 in the present embodiment. 図14は、本実施の形態における文6および文8の構成の一例を示す図である。FIG. 14 is a diagram showing an example of the configuration of sentence 6 and sentence 8 in the present embodiment. 図15は、本実施の形態における知識抽出処理の一例を示す図である。FIG. 15 is a diagram illustrating an example of knowledge extraction processing in the present embodiment. 図16は、本実施の形態における知識抽出処理の一例を示す図である。FIG. 16 is a diagram illustrating an example of knowledge extraction processing according to the present embodiment. 図17は、本実施の形態におけるテンプレートの一例を示す図である。FIG. 17 is a diagram showing an example of a template in the present embodiment. 図18は、本実施の形態における知識抽出処理の一例を示す図である。FIG. 18 is a diagram illustrating an example of knowledge extraction processing in the present embodiment. 図19は、本実施の形態における知識情報処理方法の一例を示す図である。FIG. 19 is a diagram illustrating an example of the knowledge information processing method in the present embodiment. 図20は、本実施の形態におけるS−SNSの一例を示す図である。FIG. 20 is a diagram illustrating an example of the S-SNS in the present embodiment. 図21は、本実施の形態におけるS−SNSの一例を示す図である。FIG. 21 is a diagram illustrating an example of the S-SNS in the present embodiment. 図22は、本実施の形態におけるS−SNSの一例を示す図である。FIG. 22 is a diagram illustrating an example of the S-SNS in the present embodiment. 図23は、本実施の形態における情報提示の一例を示す図である。FIG. 23 is a diagram illustrating an example of information presentation in the present embodiment. 図24は、本実施の形態における情報提示の一例を示す図である。FIG. 24 is a diagram illustrating an example of information presentation in the present embodiment. 図25は、本実施の形態における知識情報処理方法の一例を示す図である。FIG. 25 is a diagram illustrating an example of the knowledge information processing method according to the present embodiment. 図26は、本実施の形態における知識情報処理方法の一例を示す図である。FIG. 26 is a diagram illustrating an example of the knowledge information processing method according to the present embodiment. 図27は、本実施の形態における知識情報処理方法の一例を示す図である。FIG. 27 is a diagram illustrating an example of the knowledge information processing method according to the present embodiment. 図28は、本実施の形態における知識情報処理方法の一例を示す図である。FIG. 28 is a diagram showing an example of the knowledge information processing method in the present embodiment.

以下に、本発明にかかる知識情報処理装置、知識情報処理方法、および、プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。   Embodiments of a knowledge information processing apparatus, a knowledge information processing method, and a program according to the present invention will be described below in detail with reference to the drawings. Note that the present invention is not limited to the embodiments.

[本発明の実施の形態の概要]
以下、本発明の実施の形態の概要について図1を参照して説明し、その後、本実施の形態の構成および処理等について詳細に説明する。図1は、本実施の形態の基本原理を示すフローチャートである。本実施の形態は、概略的に、以下の基本的特徴を有する。
[Outline of Embodiment of the Present Invention]
The outline of the embodiment of the present invention will be described below with reference to FIG. 1, and then the configuration, processing, and the like of the present embodiment will be described in detail. FIG. 1 is a flowchart showing the basic principle of the present embodiment. The present embodiment schematically has the following basic features.

すなわち、本実施の形態の知識情報処理装置の制御部は、図1に示すように、任意の単語に対応する、知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得する(ステップSA−1)。ここで、制御部は、更に、任意の単語に対応するノードの関連情報を検索し、当該検索された関連情報を取得してもよい。また、制御部は、入力部を介して任意の単語が指定された場合、任意の単語に対応する、知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得してもよい。また、制御部は、入力部を介して複数の単語を含む図が入力された場合、図に含まれる単語に対応する、知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得し、ノードの関連情報を検索し、当該検索された関連情報を取得してもよい。   That is, as shown in FIG. 1, the control unit of the knowledge information processing apparatus according to the present embodiment identifies a node constituting a knowledge object network corresponding to an arbitrary word, and node information and / or arc related to the node. Specific information including information is acquired (step SA-1). Here, the control unit may further search related information of a node corresponding to an arbitrary word and acquire the searched related information. In addition, when an arbitrary word is designated via the input unit, the control unit identifies a node constituting the knowledge object network corresponding to the arbitrary word, and includes node information and / or arc information related to the node. Specific information may be acquired. In addition, when a diagram including a plurality of words is input via the input unit, the control unit identifies a node constituting the knowledge object network corresponding to the word included in the diagram, and includes node information and / or Alternatively, specific information including arc information may be acquired, related information of a node may be searched, and the searched related information may be acquired.

そして、知識情報処理装置の制御部は、特定情報を出力部を介して出力させ(ステップSA−2)、処理を終了する。ここで、制御部は、更に、関連情報を出力部を介して出力させてもよい。また、制御部は、特定情報および/または関連情報に基づく項目を出力部を介してリスト形式で選択可能に出力させ、入力部を介して項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を出力部を介して出力させてもよい。また、制御部は、特定情報および/または関連情報に基づく項目を出力部を介してネットワーク形式で選択可能に出力させ、入力部を介して項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を出力部を介して出力させてもよい。   And the control part of a knowledge information processing apparatus outputs specific information via an output part (step SA-2), and complete | finishes a process. Here, the control unit may further output the related information via the output unit. In addition, the control unit outputs the items based on the specific information and / or the related information so that the items can be selected in a list format via the output unit, and when the item is selected via the input unit, the control unit specifies the selected item. Information and / or related information may be output via the output unit. In addition, the control unit outputs an item based on the specific information and / or related information in a selectable manner in a network format via the output unit, and when the item is selected via the input unit, the control unit specifies the selected item. Information and / or related information may be output via the output unit.

以上で、本実施の形態の概要の説明を終える。   This is the end of the description of the outline of the present embodiment.

[知識情報処理装置100の構成]
次に、本実施の形態における知識情報処理装置100の構成の詳細について、図2を参照して以下に説明する。図2は、本実施の形態における知識情報処理装置100の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。ここで、本実施の形態における知識情報処理装置100においては、各構成が一筐体内に全て備えられ、単独で処理を行うもの(スタンドアローン型)を、知識情報処理装置100として説明するが、当該実施例に限らず、各構成が分離した筐体内に備えられ、ネットワーク等を介して接続されて一つの概念としての装置を構成するもの(例えば、クラウドコンピューティング等)であってもよい。すなわち、本実施の形態における知識情報処理装置100の各構成は、ネットワーク等を介して接続された複数または単数の端末装置、ならびに、外部サーバまたは外部データベース等の外部システムに搭載されたものであってもよい。
[Configuration of Knowledge Information Processing Device 100]
Next, details of the configuration of the knowledge information processing apparatus 100 according to the present embodiment will be described below with reference to FIG. FIG. 2 is a block diagram showing an example of the configuration of the knowledge information processing apparatus 100 according to the present embodiment, and conceptually shows only the portion related to the present invention. Here, in the knowledge information processing apparatus 100 according to the present embodiment, a configuration in which each component is all provided in one housing and performs processing independently (stand-alone type) will be described as the knowledge information processing apparatus 100. The present invention is not limited to this embodiment, and each component may be provided in a separate housing and connected via a network or the like to constitute a single conceptual device (for example, cloud computing). That is, each configuration of knowledge information processing apparatus 100 in the present embodiment is mounted on a plurality of or a single terminal device connected via a network or the like, and an external system such as an external server or an external database. May be.

ここで、端末装置は、例えば、一般に市販されるデスクトップ型またはノート型のパーソナルコンピュータ等の情報処理装置、携帯電話、スマートフォン、PHS、または、PDA等の携帯端末装置等であってもよい。また、外部システムは、WEBサーバまたはASPサーバ等として構成していてもよい。また、外部システムのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の知識情報処理装置およびその付属装置により構成していてもよい。また、外部システムの各機能は、外部システムのハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現されてもよい。また、ネットワークは、知識情報処理装置100と外部システムとを相互に接続する機能を有し、例えば、インターネット等である。   Here, the terminal device may be, for example, a commercially available information processing device such as a desktop or notebook personal computer, a mobile terminal device such as a mobile phone, a smartphone, a PHS, or a PDA. The external system may be configured as a WEB server or an ASP server. Further, the hardware configuration of the external system may be configured by a knowledge information processing apparatus such as a commercially available workstation or a personal computer and its attached devices. Each function of the external system may be realized by a CPU, a disk device, a memory device, an input device, an output device, a communication control device, and the like in the hardware configuration of the external system, a program for controlling them, and the like. The network has a function of connecting the knowledge information processing apparatus 100 and an external system to each other, such as the Internet.

また、知識情報処理装置100は、概略的に、制御部102と入出力制御インターフェース部108と記憶部106を備える。ここで、制御部102は、知識情報処理装置100の全体を統括的に制御するCPU等である。また、通信回線等に接続されるルータ等の通信装置(図示せず)に接続されるインターフェースであり、入出力制御インターフェース部108は、出力部(入力部112、表示部114、および、音声出力部116)に接続されるインターフェースである。また、記憶部106は、各種のデータベースやテーブルなどを格納する装置である。これら知識情報処理装置100の各部は任意の通信路を介して通信可能に接続されている。更に、知識情報処理装置100は、知識情報処理装置100とネットワーク(またはルータ等の通信装置)との間における通信制御を行う通信制御インターフェース部を備えていてもよく、当該通信制御インターフェース部は、外部システム、および、他の端末等と通信回線を介してデータを通信する機能を有していてもよい。また、知識情報処理装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワークに通信可能に接続されていてもよい。   The knowledge information processing apparatus 100 generally includes a control unit 102, an input / output control interface unit 108, and a storage unit 106. Here, the control unit 102 is a CPU or the like that comprehensively controls the entire knowledge information processing apparatus 100. Further, the interface is connected to a communication device (not shown) such as a router connected to a communication line or the like, and the input / output control interface unit 108 includes an output unit (an input unit 112, a display unit 114, and an audio output). Unit 116). The storage unit 106 is a device that stores various databases and tables. Each unit of the knowledge information processing apparatus 100 is connected to be communicable via an arbitrary communication path. Furthermore, the knowledge information processing apparatus 100 may include a communication control interface unit that performs communication control between the knowledge information processing apparatus 100 and a network (or a communication device such as a router). You may have a function which communicates data with an external system, another terminal, etc. via a communication line. The knowledge information processing apparatus 100 may be communicably connected to a network via a communication device such as a router and a wired or wireless communication line such as a dedicated line.

記憶部106に格納される各種のデータベースやテーブル(知識ベース106a、および、関連情報データベース106b)は、固定ディスク装置等のストレージ手段である。例えば、記憶部106は、各種処理に用いる各種のプログラム、テーブル、ファイル、データベース、および、ウェブページ等を格納する。   Various databases and tables (knowledge base 106a and related information database 106b) stored in the storage unit 106 are storage means such as a fixed disk device. For example, the storage unit 106 stores various programs, tables, files, databases, web pages, and the like used for various processes.

これら記憶部106の各構成要素のうち、知識ベース106aは、自然言語により記述される単語、句、文または文の一群に対する固有の識別情報を対応付けた、単語、句、文または文の一群に表現された知識を示すノードに関するノード情報と、ノードの性質および/またはノード間の関連性を示すアークに関するアーク情報と、を含む、単語、句、文または文の一群と知識とが明確な対応関係をもって表現された、知識オブジェクトネットワークに関する知識オブジェクトネットワーク情報を記憶する知識記憶手段である。ここで、知識オブジェクトネットワークを構成するノードは、各ステートメントオブジェクトネットワークにおいて一様の抽象度レベルに対応するノードを投射したもの、または、上記各ステートメントオブジェクトネットワークの個別領域において各々設定された上記抽象度レベルに対応する上記ノードを投射したものであってもよい。また、知識オブジェクトネットワーク情報を構成するノード情報は、実験データの解析結果または推定結果であってもよい。また、識別情報は、単語、句、文または文の一群が掲載された文章(例えば、学術論文等)を特定する情報であってもよい。また、ノード情報、および/または、アーク情報は、データ(知識)の参照元情報(例えば、URL、および/または、Webページ名等)を含んでいてもよい。   Among these components of the storage unit 106, the knowledge base 106a is a group of words, phrases, sentences, or sentences in which unique identification information is associated with a group of words, phrases, sentences, or sentences described in a natural language. A group of words, phrases, sentences, or sentences and knowledge including node information regarding nodes representing knowledge expressed in arcs and arc information regarding arcs indicating node properties and / or relationships between nodes Knowledge storage means for storing knowledge object network information related to the knowledge object network expressed in a correspondence relationship. Here, the nodes constituting the knowledge object network are obtained by projecting nodes corresponding to a uniform level of abstraction in each statement object network, or the abstraction levels set in the individual areas of each statement object network. The node corresponding to the level may be projected. The node information constituting the knowledge object network information may be an analysis result or an estimation result of experimental data. Further, the identification information may be information for specifying a sentence (for example, academic paper) in which a word, a phrase, a sentence, or a group of sentences is posted. The node information and / or arc information may include data (knowledge) reference source information (for example, URL and / or Web page name).

また、関連情報データベース106bは、ノードの関連情報を記憶する関連情報記憶手段である。ここで、関連情報データベース106bは、図に示すように、タンパク質情報データベース106c、遺伝子情報データベース106d、分子間相互作用情報データベース106e、パスウェイ情報データベース106f、文献情報データベース106g、および、ニュースデータベース106hを少なくとも備えて構成されている。   The related information database 106b is related information storage means for storing related information of nodes. Here, as shown in the figure, the related information database 106b includes at least a protein information database 106c, a gene information database 106d, an intermolecular interaction information database 106e, a pathway information database 106f, a literature information database 106g, and a news database 106h. It is prepared for.

ここで、タンパク質情報データベース106cは、タンパク質に関するタンパク質情報を記憶するタンパク質情報記憶手段である。ここで、タンパク質情報は、タンパク質の構造情報を含んでいてもよい。また、タンパク質情報データベース106cは、細胞内または生体内のネットワーク(例えば、分子間相互作用ネットワーク、シグナル伝達ネットワーク、代謝ネットワーク、または、遺伝子制御ネットワーク等)上におけるタンパク質の位置に関する位置情報を含む、当該ネットワークに関するネットワーク情報に対応付けて、当該タンパク質の構造に関するタンパク質構造情報を記憶してもよい。これらタンパク質情報は、タンパク質情報データベース106cに予め記憶されており、知識情報処理装置100の制御部102は、定期的に、および/または、制御部102による処理に応じて(例えば、制御部102においてデータが必要となる契機等に)ネットワークを介して最新のデータを外部システム等からダウンロードしてタンパク質情報データベース106cに記憶されたタンパク質情報をアップデートしてもよい。   Here, the protein information database 106c is protein information storage means for storing protein information related to proteins. Here, the protein information may include protein structure information. In addition, the protein information database 106c includes position information regarding the position of the protein on a network in a cell or a living body (for example, an intermolecular interaction network, a signal transduction network, a metabolic network, or a gene regulatory network). Protein structure information relating to the structure of the protein may be stored in association with network information relating to the network. The protein information is stored in advance in the protein information database 106c, and the control unit 102 of the knowledge information processing apparatus 100 periodically and / or according to processing by the control unit 102 (for example, in the control unit 102) The protein information stored in the protein information database 106c may be updated by downloading the latest data from an external system or the like via a network (when data is required).

また、遺伝子情報データベース106dは、遺伝子に関する遺伝子情報を記憶する遺伝子情報記憶手段である。ここで、遺伝子情報は、塩基配列、遺伝子型、ゲノタイプ、フェノタイプ、および/または、アノテーション等に関する情報を含んでいてもよい。これら遺伝子情報は、遺伝子情報データベース106dに予め記憶されており、知識情報処理装置100の制御部102は、定期的に、および/または、制御部102による処理に応じてネットワークを介して最新のデータを外部システム等からダウンロードして遺伝子情報データベース106dに記憶された遺伝子情報をアップデートしてもよい。   The gene information database 106d is gene information storage means for storing gene information related to genes. Here, the gene information may include information on the base sequence, genotype, genotype, phenotype, and / or annotation. The genetic information is stored in advance in the genetic information database 106d, and the control unit 102 of the knowledge information processing apparatus 100 periodically and / or updates the latest data via the network according to processing by the control unit 102. May be downloaded from an external system or the like to update the gene information stored in the gene information database 106d.

また、分子間相互作用情報データベース106eは、生体分子の分子間相互作用に関する分子間相互作用情報を記憶する分子間相互作用情報記憶手段である。ここで、分子間相互作用情報は、細胞内または生体内の分子間相互作用に関する相互作用情報であってもよい。これら分子間相互作用情報は、分子間相互作用情報データベース106eに予め記憶されており、知識情報処理装置100の制御部102は、定期的に、および/または、制御部102による処理に応じてネットワークを介して最新のデータを外部システム等からダウンロードして分子間相互作用情報データベース106eに記憶された分子間相互作用情報をアップデートしてもよい。   The intermolecular interaction information database 106e is an intermolecular interaction information storage unit that stores intermolecular interaction information regarding intermolecular interactions of biomolecules. Here, the intermolecular interaction information may be interaction information related to intermolecular interactions in cells or in vivo. The intermolecular interaction information is stored in advance in the intermolecular interaction information database 106e, and the control unit 102 of the knowledge information processing apparatus 100 performs a network periodically and / or according to processing by the control unit 102. The latest data may be downloaded from an external system or the like, and the intermolecular interaction information stored in the intermolecular interaction information database 106e may be updated.

また、パスウェイ情報データベース106fは、生体分子のパスウェイに関するパスウェイ情報を記憶するパスウェイ情報記憶手段である。ここで、パスウェイとは、生体内の代謝経路または信号伝達経路等であってもよい。これらパスウェイ情報は、パスウェイ情報データベース106fに予め記憶されており、知識情報処理装置100の制御部102は、定期的に、および/または、制御部102による処理に応じてネットワークを介して最新のデータを外部システム等からダウンロードしてパスウェイ情報データベース106fに記憶されたパスウェイ情報をアップデートしてもよい。   The pathway information database 106f is pathway information storage means for storing pathway information related to biomolecule pathways. Here, the pathway may be a metabolic pathway or a signal transmission pathway in a living body. The pathway information is stored in advance in the pathway information database 106f, and the control unit 102 of the knowledge information processing apparatus 100 periodically and / or responds to the processing by the control unit 102 with the latest data via the network. May be downloaded from an external system or the like, and the pathway information stored in the pathway information database 106f may be updated.

また、文献情報データベース106gは、学術論文を含む文献に関する文献情報を記憶する文献情報記憶手段である。ここで、文献情報データベース106gは、出版社などの保有する文献情報(文献関連データ)を記憶してもよい。これら文献情報は、文献情報データベース106gに予め記憶されており、知識情報処理装置100の制御部102は、定期的にネットワークを介して世界中で逐次発表される最新のデータを外部システム(例えば、出版社および国家機関等の文献情報を提供する文献情報提供サービスなど)等からダウンロードして文献情報データベース106gに記憶された文献情報をアップデートしてもよい。   The document information database 106g is document information storage means for storing document information relating to documents including academic papers. Here, the document information database 106g may store document information (document related data) held by a publisher or the like. These pieces of document information are stored in advance in the document information database 106g, and the control unit 102 of the knowledge information processing apparatus 100 periodically transmits the latest data that is sequentially announced throughout the world via an external system (for example, Document information downloaded from a publisher, a national institution, etc. that provides document information, etc.) and stored in the document information database 106g may be updated.

また、ニュースデータベース106hは、ニュース配信サービスが提供するニュースを記憶するニュース記憶手段である。ここで、ニュース配信サービスとは、新聞社、出版社、ポータルサイト、または、通信社等が提供する配信サービスであってもよい。   The news database 106h is news storage means for storing news provided by the news distribution service. Here, the news distribution service may be a distribution service provided by a newspaper company, a publisher, a portal site, or a communication company.

また、図2において、入出力制御インターフェース部108は、入力部112、表示部114、および、音声出力部116の制御を行う。   In FIG. 2, the input / output control interface unit 108 controls the input unit 112, the display unit 114, and the audio output unit 116.

ここで、入力部112は、例えば、キー入力部、タッチパネル、コントロールパッド(例えば、タッチパッド、および、ゲームパッド等)、マウス、キーボード、および、マイク等であってもよい。また、表示部114は、アプリケーション等の表示画面を表示する表示手段(例えば、液晶または有機EL等から構成されるディスプレイ、モニタ、および、タッチパネル等)であってもよい。また、音声出力部116は、音声情報を音声として出力する音声出力手段(例えば、スピーカ等)であってもよい。   Here, the input unit 112 may be, for example, a key input unit, a touch panel, a control pad (for example, a touch pad and a game pad), a mouse, a keyboard, and a microphone. The display unit 114 may be a display unit that displays a display screen of an application or the like (for example, a display including a liquid crystal or an organic EL, a monitor, and a touch panel). The audio output unit 116 may be an audio output unit (for example, a speaker) that outputs audio information as audio.

また、図2において、制御部102は、OS(Operating System)等の制御プログラムや、各種の処理手順等を規定したプログラム、および、所要データを格納するための内部メモリを有する。そして、制御部102は、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、構造解析部102a、知識抽出部102b、格納部102c、特定情報取得部102d、および、特定情報出力部102eを備える。   In FIG. 2, the control unit 102 has an internal memory for storing a control program such as an OS (Operating System), a program defining various processing procedures, and necessary data. And the control part 102 performs the information processing for performing various processes by these programs. In terms of functional concept, the control unit 102 includes a structure analysis unit 102a, a knowledge extraction unit 102b, a storage unit 102c, a specific information acquisition unit 102d, and a specific information output unit 102e.

このうち、構造解析部102aは、文で構成される任意の文章に対する構造解析を行い、当該文章を構成する単語、句、文または文の一群を抽出する構造解析手段である。ここで、文章は、生命科学の学術論文であってもよい。また、文章は、新聞、雑誌、または、ウェブページ等であってもよい。   Among these, the structure analysis unit 102a is a structure analysis unit that performs a structure analysis on an arbitrary sentence composed of sentences and extracts a group of words, phrases, sentences, or sentences constituting the sentence. Here, the text may be a life science academic paper. The sentence may be a newspaper, a magazine, a web page, or the like.

また、知識抽出部102bは、単語、句、文または文の一群と句構造テンプレートとのマッチングを行うことにより知識を抽出する知識抽出手段である。ここで、知識抽出部102bは、単語、句、文または文の一群に対してプリプロセッシングを行い、明らかに除外できる挿入句などを取り除いた後、単語、句、文または文の一群と句構造テンプレートとのマッチングを行うことにより知識を抽出してもよい。また、知識抽出部102bは、単語、句、文または文の一群に対して構文解析を利用してマッチングを行うことにより知識を抽出してもよい。また、知識抽出部102bは、テンプレートマッチング以外のテキストマイニング手法を用いることにより知識を抽出してもよい。   The knowledge extracting unit 102b is a knowledge extracting unit that extracts knowledge by matching a word, phrase, sentence, or a group of sentences with a phrase structure template. Here, the knowledge extraction unit 102b performs preprocessing on a group of words, phrases, sentences, or sentences, removes an insertion phrase that can be clearly excluded, and then a group of words, phrases, sentences, or sentences and a phrase structure. Knowledge may be extracted by matching with a template. In addition, the knowledge extraction unit 102b may extract knowledge by matching a word, a phrase, a sentence, or a group of sentences using syntax analysis. The knowledge extraction unit 102b may extract knowledge by using a text mining technique other than template matching.

また、格納部102cは、任意の単語に対応するノードが知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークに含まれていない場合、任意の単語に表現された知識を示すノードに関するノード情報を知識ベース106aに格納し、当該ノードとの間に相互背反を締めるアークを設定し、アークに関するアーク情報を知識ベース106aに格納し、任意の単語に対応するノードが知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークに含まれている場合、任意の単語に対する識別情報を当該ノードに関するノード情報に対応付けて知識ベース106aに格納する格納手段である。ここで、格納部102cは、更に、格納されたノードとの間に相互背反を締めるアークが設定された場合、当該相互背反であるか否かの評価を要求する当該アークに関するアーク情報を出力部を介して出力させ、入力部112を介して相互背反であるとの評価が入力された場合、当該アーク情報を知識ベース106aに格納してもよい。また、格納部102cは、構造解析部102aにより抽出された単語、句、文または文の一群に対応するノードが知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークに含まれていない場合、単語、句、文または文の一群に表現された知識を示すノードに関するノード情報を知識ベース106aに格納し、ノードとの間に相互背反を締めるアークを設定し、アークに関するアーク情報を知識ベース106aに格納し、単語、句、文または文の一群に対応するノードが知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークに含まれている場合、単語、句、文または文の一群に対する識別情報を当該ノードに関するノード情報に対応付けて知識ベース106aに格納してもよい。また、格納部102cは、知識抽出部102bにより抽出された知識に関する知識情報を含む、マッチングされた単語、句、文または文の一群に対応するノード情報を知識ベース106aに格納してもよい。   Further, the storage unit 102c relates to a node indicating knowledge expressed in an arbitrary word when the node corresponding to the arbitrary word is not included in the knowledge object network based on the knowledge object network information stored in the knowledge base 106a. The node information is stored in the knowledge base 106a, an arc for tightening the contradiction with the node is set, the arc information regarding the arc is stored in the knowledge base 106a, and the node corresponding to an arbitrary word is stored in the knowledge base 106a. When it is included in the knowledge object network based on the knowledge object network information, the storage means stores the identification information for an arbitrary word in the knowledge base 106a in association with the node information related to the node. Here, the storage unit 102c further outputs arc information related to the arc for requesting an evaluation as to whether or not it is the mutual contradiction when an arc for tightening the mutual contradiction is set with the stored node. And the arc information may be stored in the knowledge base 106a when an evaluation indicating that they are mutually contradictory is input via the input unit 112. The storage unit 102c does not include a node corresponding to the word, phrase, sentence, or group of sentences extracted by the structure analysis unit 102a in the knowledge object network based on the knowledge object network information stored in the knowledge base 106a. In this case, node information related to a node representing knowledge expressed in a word, phrase, sentence, or group of sentences is stored in the knowledge base 106a, an arc is set between the node and a mutual contradiction, and the arc information related to the arc is knowledged. When a node stored in the base 106a and corresponding to a group of words, phrases, sentences or sentences is included in the knowledge object network based on the knowledge object network information stored in the knowledge base 106a, the words, phrases, sentences or sentences Corresponding identification information for a group of nodes to node information about the node It may be stored in the knowledge base 106a Te. Further, the storage unit 102c may store, in the knowledge base 106a, node information corresponding to a group of matched words, phrases, sentences, or sentences including knowledge information related to the knowledge extracted by the knowledge extracting unit 102b.

また、特定情報取得部102dは、任意の単語に対応する、知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得する特定情報取得手段である。ここで、特定情報取得部102dは、更に、任意の単語に対応するノードの関連情報を関連情報データベース106bから検索し、当該検索された関連情報を取得してもよい。また、特定情報取得部102dは、入力部112を介して任意の単語が指定された場合、任意の単語に対応する、知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得してもよい。また、特定情報取得部102dは、任意の図に含まれる単語に対応する、知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークを構成するノードを特定し、当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得し、ノードの関連情報を関連情報データベース106bから検索し、当該検索された関連情報を取得してもよい。ここで、特定情報(ノード情報、および/または、アーク情報)、および/または、関連情報は、データの参照元情報(例えば、URL、および/または、Webページ名等)を含んでいてもよい。   Further, the specific information acquisition unit 102d specifies a node constituting the knowledge object network corresponding to an arbitrary word based on the knowledge object network information stored in the knowledge base 106a, and node information and / or arc information regarding the node. Specific information acquisition means for acquiring specific information including. Here, the specific information acquisition unit 102d may further search related information of a node corresponding to an arbitrary word from the related information database 106b and acquire the searched related information. Further, when an arbitrary word is designated via the input unit 112, the specific information acquisition unit 102d configures a knowledge object network based on the knowledge object network information stored in the knowledge base 106a corresponding to the arbitrary word. A node may be specified, and specific information including node information and / or arc information regarding the node may be acquired. Further, the specific information acquisition unit 102d specifies a node constituting the knowledge object network based on the knowledge object network information stored in the knowledge base 106a corresponding to a word included in an arbitrary figure, and includes node information regarding the node and Alternatively, specific information including arc information may be acquired, related information of the node may be searched from the related information database 106b, and the searched related information may be acquired. Here, the specific information (node information and / or arc information) and / or related information may include data reference source information (for example, URL and / or Web page name). .

また、特定情報出力部102eは、特定情報を出力部を介して出力させる特定情報出力手段である。ここで、特定情報出力部102eは、更に、関連情報を出力部を介して出力させてもよい。また、特定情報出力部102eは、特定情報および/または関連情報に基づく項目を出力部を介してリスト形式で選択可能に出力させ、入力部112を介して項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を出力部を介して出力させてもよい。また、特定情報出力部102eは、特定情報および/または関連情報に基づく項目を出力部を介してネットワーク形式で選択可能に出力させ、入力部112を介して項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を出力部を介して出力させてもよい。   The specific information output unit 102e is specific information output means for outputting specific information via the output unit. Here, the specific information output unit 102e may further output related information via the output unit. Further, the specific information output unit 102e outputs an item based on the specific information and / or related information so as to be selectable in a list format via the output unit, and when the item is selected via the input unit 112, the specific information output unit 102e is selected. Specific information and / or related information regarding the item may be output via the output unit. Further, the specific information output unit 102e outputs an item based on the specific information and / or related information so that the item can be selected in a network format via the output unit, and if the item is selected via the input unit 112, the specific information output unit 102e is selected. Specific information and / or related information regarding the item may be output via the output unit.

以上で、本実施の形態における知識情報処理装置100の構成の一例の説明を終える。   Above, description of an example of the structure of the knowledge information processing apparatus 100 in this Embodiment is finished.

[知識情報処理装置100の処理]
次に、このように構成された本実施の形態における知識情報処理装置100の処理の詳細について、以下に図3乃至図28を参照して詳細に説明する。ここでは、知識情報処理装置100を利用してユーザが論文を起点に知識ベース106aおよび関連情報データベース106bに連続的にアクセスし、解析や参照を行う一例を説明する。図3は、本実施の形態における知識情報処理装置100の処理の一例を示すフローチャートである。
[Process of Knowledge Information Processing Device 100]
Next, details of the processing of the knowledge information processing apparatus 100 configured as described above according to the present embodiment will be described in detail with reference to FIGS. Here, an example will be described in which a user uses the knowledge information processing apparatus 100 to continuously access the knowledge base 106a and the related information database 106b starting from a paper, and perform analysis and reference. FIG. 3 is a flowchart showing an example of processing of the knowledge information processing apparatus 100 in the present embodiment.

図3に示すように、構造解析部102aは、ユーザにより入力部112を介して文で構成される文章である生命科学の学術論文が指定され、当該学術論文が未だ構造解析されていない場合、当該学術論文に対する構造解析を行い、当該学術論文を構成する単語、句、文または文の一群(段落)を抽出する(ステップSB−1)。ここで、文章は、新聞、雑誌、または、ウェブページ等であってもよい。このように、構造解析部102aは、ユーザによりある論文が指定され、これが新規の論文の場合、直ちに文章解析が行われる。   As shown in FIG. 3, when the structural analysis unit 102 a designates a life science academic paper that is a sentence composed of sentences via the input unit 112 by the user and the academic paper has not yet been structurally analyzed, A structural analysis is performed on the academic paper, and a group (paragraph) of words, phrases, sentences, or sentences constituting the academic paper is extracted (step SB-1). Here, the sentence may be a newspaper, a magazine, a web page, or the like. In this way, in the structure analysis unit 102a, when a certain paper is designated by the user and this is a new paper, the sentence analysis is immediately performed.

そして、知識抽出部102bは、構造解析部102aにより抽出された単語、句、文または段落と句構造テンプレートとのマッチングを行うことにより知識を抽出する(ステップSB−2)。ここで、知識抽出部102bは、構造解析部102aにより抽出された単語、句、文または段落に対してプリプロセッシングを行い、明らかに除外できる挿入句などを取り除いた後、単語、句、文または段落と句構造テンプレートとのマッチングを行うことにより知識を抽出してもよい。また、知識抽出部102bは、構造解析部102aにより抽出された単語、句、文または段落に対して構文解析を利用してマッチングを行うことにより知識を抽出してもよい。また、知識抽出部102bは、構造解析部102aにより抽出された単語、句、文または段落に対して、テンプレートマッチング以外のテキストマイニング手法を用いることにより知識を抽出してもよい。   Then, the knowledge extraction unit 102b extracts knowledge by matching the word, phrase, sentence, or paragraph extracted by the structure analysis unit 102a with the phrase structure template (step SB-2). Here, the knowledge extraction unit 102b performs preprocessing on the word, phrase, sentence, or paragraph extracted by the structure analysis unit 102a, removes an insertion phrase that can be clearly excluded, and then removes the word, phrase, sentence, or paragraph. Knowledge may be extracted by matching a paragraph with a phrase structure template. The knowledge extraction unit 102b may extract knowledge by matching the words, phrases, sentences, or paragraphs extracted by the structure analysis unit 102a using syntax analysis. The knowledge extraction unit 102b may extract knowledge by using a text mining technique other than template matching for the words, phrases, sentences, or paragraphs extracted by the structure analysis unit 102a.

そして、特定情報取得部102dは、ユーザにより入力部112を介して指定された学術論文中の単語が指定された場合、当該単語に対応する、知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークを構成するノードを特定し、知識ベース106aに記憶された当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得し、ノードの関連情報を関連情報データベース106bから検索し、当該検索された関連情報を取得する(ステップSB−3)。ここで、特定情報取得部102dは、ユーザにより入力部112を介して複数の単語を含む図が入力された場合、図に含まれる単語に対応する、知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークを構成するノードを特定し、知識ベース106aに記憶された当該ノードに関するノード情報および/またはアーク情報を含む特定情報を取得し、ノードの関連情報を関連情報データベース106bから検索し、当該検索された関連情報を取得してもよい。   When the word in the academic paper designated by the user via the input unit 112 is designated by the user, the specific information acquisition unit 102d is based on the knowledge object network information stored in the knowledge base 106a corresponding to the word. Identifying a node constituting the knowledge object network, acquiring node information and / or arc information related to the node stored in the knowledge base 106a, retrieving the node related information from the related information database 106b, The retrieved related information is acquired (step SB-3). Here, when the user includes a diagram including a plurality of words via the input unit 112, the specific information acquisition unit 102d stores knowledge object network information stored in the knowledge base 106a corresponding to the words included in the diagram. The node constituting the knowledge object network based on the node is identified, the node information and / or arc information relating to the node stored in the knowledge base 106a is acquired, and the node related information is searched from the related information database 106b. The retrieved related information may be acquired.

ここで、図4を参照して、本実施の形態における知識情報取得処理の一例について説明する。図4は、本実施の形態における知識情報取得処理の一例を示す図である。   Here, with reference to FIG. 4, an example of knowledge information acquisition processing in the present embodiment will be described. FIG. 4 is a diagram showing an example of knowledge information acquisition processing in the present embodiment.

図4に示すような相互作業図が、ユーザにより論文などから特定され、それが入力された場合、制御部102は、図4に記載されたネットワークに関して、その要素の組み合わせなどから、この部分、または、この部分を含む相互作用ネットワークを知識ベース106aから抽出し、可視化して提示することができる。すなわち、この場合、ユーザは、図を一つの検索キーとして利用して、その関連部分の全体の情報を一早く入手することができる。例えば、ユーザにより「哺乳動物細胞が、刺激物質Xによって刺激されている時に、タンパク質Aがリン酸化されている事例」が入力された場合、制御部102は、当該事例を検索し、これに対応する知識オブジェクトネットワークを知識ベース106aから同定し、そこにリンクされている実験結果などからこの条件を満たす実験事例を表示することができる。   When an interactive work diagram as shown in FIG. 4 is specified from a paper or the like by a user and is input, the control unit 102 determines this part from the combination of elements, etc. with respect to the network described in FIG. Alternatively, an interaction network including this part can be extracted from the knowledge base 106a, visualized, and presented. That is, in this case, the user can quickly obtain the entire information of the related portion by using the figure as one search key. For example, when the user inputs “an example in which protein A is phosphorylated when a mammalian cell is stimulated by a stimulating substance X”, the control unit 102 searches the case and responds to this case. The knowledge object network to be identified is identified from the knowledge base 106a, and an experiment case satisfying this condition can be displayed from the experiment result linked to the knowledge object network 106a.

また、図5乃至図8を参照して、本実施の形態における知識オブジェクトネットワークの一例について説明する。   An example of the knowledge object network in the present embodiment will be described with reference to FIGS.

本実施の形態における知識ベース106aに記憶される情報の中核は、知識オブジェクトネットワーク(KON)であり、対象分野の知識がここに表現される。KONは、対象となる実体および関係などをノードとアークとを利用して表現される。例えば、タンパク質は、実体でありノードで表現される。さらに、そのタンパク質の性質、または、他のタンパク質との関連などは、関係でありアークを利用して表現される。   The core of the information stored in the knowledge base 106a in the present embodiment is a knowledge object network (KON), and knowledge of the subject field is expressed here. KON represents a target entity and relationship using nodes and arcs. For example, a protein is an entity and is represented by a node. Furthermore, the nature of the protein or the relationship with other proteins is a relationship and is expressed using an arc.

本実施の形態において、KONは、SON(Statement Object Network)、および、DON(Data Object Network)より確率的に導出されてもよい。ここで、SONは、自然言語で表現された記述のネットワークであることの対称としてのデータを基盤とした仮説のネットワークであってもよい。また、DONは、遺伝子発現データ、代謝プロファイルデータもしくはゲノム配列データなどから、各種解析手法を用いて推定される生物学的オブジェクト、または、生物学的関係性に関する仮説から構成されるネットワークであってもよい。   In the present embodiment, KON may be probabilistically derived from SON (Statement Object Network) and DON (Data Object Network). Here, the SON may be a hypothetical network based on data as a symmetry of a description network expressed in a natural language. DON is a network composed of hypotheses about biological objects or biological relationships that are estimated from gene expression data, metabolic profile data, or genomic sequence data using various analysis methods. Also good.

すなわち、KONは、知識の表現としての言明から再構造化されたSON、さらにDONから、最も蓋然性が高いと推定された仮説の集合体であってもよい。ここで、知識は、あくまで仮説の集合体であるという考えをとってもよく、新たなデータおよび推論により、従来の知識が反証されることがあってもよい。したがって、知識は、確定し変更不可能な公理ではなく、あくまで仮説の集合体であってもよい。また、一般に「仮説」とは、確度が低い、または、他の知識と矛盾が生じる可能性が高いものであるが、広く受け入れられている知識は、確度が高い仮説であってもよい。このような仮説の確度が高まる場合には、それと矛盾する仮説群の確度の変更、および、前提条件の変更が必要となる。   That is, KON may be a restructured SON from a statement as a representation of knowledge, and further a hypothesis aggregate estimated to be most likely from DON. Here, the idea that knowledge is an aggregate of hypotheses may be taken, and conventional knowledge may be disproved by new data and inference. Therefore, knowledge is not an axiom that is fixed and cannot be changed, but may be a collection of hypotheses. In general, a “hypothesis” has low accuracy or is likely to be inconsistent with other knowledge, but widely accepted knowledge may be a hypothesis with high accuracy. When the accuracy of such a hypothesis increases, it is necessary to change the accuracy of the hypothesis group that contradicts it and to change the preconditions.

ここで、図5を参照して、本実施の形態におけるSONの一例について説明する。図5は、本実施の形態におけるSONの一例を示す図である。   Here, an example of the SON in the present embodiment will be described with reference to FIG. FIG. 5 is a diagram illustrating an example of the SON in the present embodiment.

図5に示すように、本実施の形態におけるSONは、同じ対象や関係性に対して、多様な抽象度をもった言明を反映した構造化された知識表現であるStatement Objectの階層構造(一般には、木構造で表される)と、Statement Object間の関連を示すアーク(ノード)と、によって構成されるネットワークである。本実施の形態におけるSONでは、木構造を構成するStatement Objectが、別の木構造の一部となることがあってもよい。すなわち、図5に示すSONにおいては、図中の最上部(文001001:AはBを活性化する)の抽象度が最も高く、中間部(文001002:Aはリン酸化によりBを活性化する)の抽象度がその次に高く、最下部(文002001:Aはチロシン残基245のリン酸化によりBを活性化する、文003001:Aはチロシン残基382のリン酸化によりBを活性化する)の抽象度が低くなっており、下にいくほど抽象度が低く(詳細な言明)となっている。   As shown in FIG. 5, the SON in this embodiment is a hierarchical structure of Statement Objects (generally, a structured knowledge expression reflecting statements with various abstractions for the same object or relationship (generally, Is represented by a tree structure) and an arc (node) indicating a relationship between the State Objects. In the SON according to the present embodiment, a Statement Object constituting a tree structure may be a part of another tree structure. That is, in the SON shown in FIG. 5, the abstraction at the top (sentence 000001: A activates B) in the figure is the highest, and the intermediate part (sentence 00002: A activates B by phosphorylation). ) Is the next highest degree of abstraction, and the bottom (sentence 000001: A activates B by phosphorylation of tyrosine residue 245, sentence 003001: A activates B by phosphorylation of tyrosine residue 382 ) Is lower in abstraction level, and the lower the level, the lower the abstraction level (detailed statement).

また、図6乃至図8を参照して、本実施の形態における投射方法の一例について説明する。図6乃至図8は、本実施の形態における投射方法の一例を示す図である。   An example of the projection method in the present embodiment will be described with reference to FIGS. 6 to 8 are diagrams illustrating an example of a projection method according to the present embodiment.

ここで、図6に示すように、本実施の形態におけるSONからKONの導出方法、すなわち、階層表現SONから知識オブジェクトネットワーク(KON)への投射方法としては、SONにおける各々の階層構造を構成する木構造では、上位階層はより抽象的な知識が記述されており、この木構造の最下層はその項目に対して知られている最も詳細な知識が記述されているため、原則として、SONの階層の最も下層のノードに記述されている知識の内容を、KONへと投射してもよい。すなわち、KONは、SONの最下層のノードを射影したものであってもよい。すなわち、SONからKONへの導出は、SONでの抽象度レベルが一様となるノードを射影したものであってもよい。   Here, as shown in FIG. 6, as a method for deriving KON from SON in this embodiment, that is, a method for projecting from hierarchical representation SON to knowledge object network (KON), each hierarchical structure in SON is configured. In the tree structure, more abstract knowledge is described in the upper hierarchy, and the most detailed knowledge known for the item is described in the lowermost layer of this tree structure. The content of knowledge described in the lowest node in the hierarchy may be projected to KON. That is, KON may be a projection of the lowest layer node of SON. That is, the derivation from the SON to the KON may be a projection of a node having a uniform abstraction level in the SON.

また、図7に示すように、本実施の形態における階層表現SONから知識オブジェクトネットワーク(KON)への投射方法としては、SONの一定レベルの階層に関する知識をKONへ射影したものであってもよい。すなわち、SONからKONへの導出は、各々のSONの個別領域において各々設定された抽象度(抽象化)レベルに対応した射影を行うものであってもよい。ここで、本実施の形態において、射影によって生成されたKONは、SONに新たなノードが追加された際には、自動的に再計算され更新されてもよい。さらに、本実施の形態においては、生成されたKONの一貫性の検証に、部分ユニフィケーション、または、Truth Maintenance System(TMS)などの人工知能手法を利用してもよい。   Further, as shown in FIG. 7, as a method of projecting the hierarchical representation SON to the knowledge object network (KON) in the present embodiment, knowledge regarding a certain level of SON hierarchy may be projected onto the KON. . That is, the derivation from the SON to the KON may be a projection corresponding to the abstraction level (abstraction) set in each individual area of the SON. Here, in the present embodiment, the KON generated by the projection may be automatically recalculated and updated when a new node is added to the SON. Furthermore, in the present embodiment, partial unification or an artificial intelligence method such as Truth Maintenance System (TMS) may be used to verify the consistency of the generated KON.

例えば、本実施の形態においては、SON全域において、KONに投射するノードの抽象化レベルを「分子間の活性化・抑制化の相互作用関係」という抽象度(詳細度)レベルに設定した場合、それより詳細な記述がある場合であっても、設定された詳細度に従って、射影が行われ、分子間の活性・抑制関係という抽象度レベルを反映したKONが生成される。更に、KONに投射するノードの抽象化レベルをより詳細なレベル、例えば、相互作用のプロセスを、リン酸化、アセチル化、メチル化、および、ユビキチン化などの修飾までも含めるレベルに設定した場合、これらの内容を含むネットワーク表現に基づくKON(分子間のリン酸化、アセチル化、メチル化、または、ユビキチン化などによる活性・抑制関係という抽象度レベルを反映したKON)が生成される。このように、本実施の形態においては、詳細度レベルの設定により、注目する相互作用または生物学的プロセス等に関するノードをより詳細なレベルでKONに射影し、それ以外の(例えば、ユーザの興味対象外の知識に関する)ノードをより抽象的なレベルでKONに射影する設定をすることができる。   For example, in the present embodiment, in the entire SON, when the abstraction level of the nodes projected to the KON is set to an abstraction level (detail level) called “interaction relation of activation / inhibition between molecules” Even if there is a more detailed description, projection is performed according to the set detail level, and a KON reflecting the abstract level of activity / inhibition relationship between molecules is generated. Furthermore, if the level of abstraction of the nodes that project to KON is set to a more detailed level, for example, the level of the process of interaction includes modifications such as phosphorylation, acetylation, methylation, and ubiquitination, A KON based on a network expression including these contents (KON reflecting an abstraction level of activity / inhibition relationship by intermolecular phosphorylation, acetylation, methylation, or ubiquitination) is generated. Thus, in the present embodiment, by setting the level of detail level, nodes related to the interaction or biological process to be focused on are projected onto KON at a more detailed level, and other (for example, user interests). A setting can be made to project nodes (related to non-target knowledge) to KON at a more abstract level.

また、図8に示すように、本実施の形態における階層表現SONから知識オブジェクトネットワーク(KON)への投射方法としては、SONを構成するノードに記述されている知識を、KONへと投射することにより、KON上のノードとアーク(有向グラフ)とで表現されるようにしてもよい。   Further, as shown in FIG. 8, as a method of projecting from the hierarchical representation SON to the knowledge object network (KON) in the present embodiment, the knowledge described in the nodes constituting the SON is projected to the KON. Thus, it may be expressed by nodes and arcs (directed graph) on KON.

図3に戻り、特定情報出力部102eは、特定情報取得部102dにより取得された特定情報および関連情報を表示部114に表示させる(ステップSB−4)。ここで、特定情報出力部102eは、特定情報および/または関連情報に基づく項目を表示部114にリスト形式で選択可能に表示させ、ユーザにより入力部112を介してリスト中の項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を表示部114に表示させてもよい。また、特定情報出力部102eは、特定情報および/または関連情報に基づく項目を表示部114にネットワーク形式で選択可能に表示させ、ユーザにより入力部112を介してネットワーク中の項目が選択された場合、当該選択された項目に関する特定情報および/または関連情報を表示部114に表示させてもよい。このように、特定情報出力部102eは、ユーザにより単語が指定された場合に、可能な処理のアクションが提示可能となる。このような機能の提示は、指定された単語が実際に何を意味していて、知識ベース106aにどのような記述があり、どのようなデータベースに関連情報が存在するかが同定されない限り不可能であるが、本実施の形態においては、このような参照関係を直ちに作り上げるので、新たな論文に関してこのような処理が可能となる。   Returning to FIG. 3, the specific information output unit 102e causes the display unit 114 to display the specific information and related information acquired by the specific information acquisition unit 102d (step SB-4). Here, the specific information output unit 102e displays items based on the specific information and / or related information on the display unit 114 so as to be selectable in a list format, and an item in the list is selected by the user via the input unit 112. In this case, specific information and / or related information related to the selected item may be displayed on the display unit 114. In addition, the specific information output unit 102e displays items based on the specific information and / or related information on the display unit 114 so as to be selectable in a network format, and an item in the network is selected by the user via the input unit 112 Specific information and / or related information regarding the selected item may be displayed on the display unit 114. In this way, the specific information output unit 102e can present possible processing actions when a word is designated by the user. Presentation of such a function is not possible unless it is identified what the specified word actually means, what kind of description is in the knowledge base 106a, and in what database the related information exists. However, in the present embodiment, such a reference relationship is immediately created, and thus such processing is possible for a new paper.

そして、格納部102cは、構造解析部102aにより抽出された単語、句、文または段落に対応するノードが知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークに含まれていない場合、単語、句、文または段落に表現された知識を示すノードに関するノード情報を知識ベース106aに格納し、ノードとの間に相互背反を締めるアークを設定し、アークに関するアーク情報を知識ベース106aに格納し、単語、句、文または段落に対応するノードが知識ベース106aに記憶された知識オブジェクトネットワーク情報に基づく知識オブジェクトネットワークに含まれている場合、単語、句、文または段落に対する識別情報を当該ノードに関するノード情報に対応付けて知識ベース106aに格納し(ステップSB−5)、処理を終了する。ここで、格納部102cは、更に、格納されたノードとの間に相互背反を締めるアークが設定された場合、当該相互背反であるか否かの評価を要求する当該アークに関するアーク情報を出力部を介して出力させ、入力部112を介して相互背反であるとの評価が入力された場合、当該アーク情報を知識ベース106aに格納してもよい。また、格納部102cは、知識抽出部102bにより抽出された知識に関する知識情報を含む、マッチングされた単語、句、文または段落に対応するノード情報を知識ベース106aに格納してもよい。   When the node corresponding to the word, phrase, sentence, or paragraph extracted by the structure analysis unit 102a is not included in the knowledge object network based on the knowledge object network information stored in the knowledge base 106a, the storage unit 102c Node information related to nodes representing knowledge expressed in words, phrases, sentences, or paragraphs is stored in the knowledge base 106a, an arc is set between the nodes, and the arc information related to the arc is stored in the knowledge base 106a. When the node corresponding to the word, phrase, sentence or paragraph is included in the knowledge object network based on the knowledge object network information stored in the knowledge base 106a, the identification information for the word, phrase, sentence or paragraph is included in the node. Knowledge base associated with node information about Stored in 06a (Step SB-5), the process ends. Here, the storage unit 102c further outputs arc information related to the arc for requesting an evaluation as to whether or not it is the mutual contradiction when an arc for tightening the mutual contradiction is set with the stored node. And the arc information may be stored in the knowledge base 106a when an evaluation indicating that they are mutually contradictory is input via the input unit 112. Further, the storage unit 102c may store node information corresponding to the matched word, phrase, sentence, or paragraph including the knowledge information related to the knowledge extracted by the knowledge extracting unit 102b in the knowledge base 106a.

なお、本実施の形態においては、ユーザにより論文のファイルが指定された段階で、自動的に全文を解析し、その中にある知識を抽出し、それに対応する単語や文に対してリンクなどを付与することで、論文の知識オブジェクト化をしてもよい。   In this embodiment, when the paper file is specified by the user, the whole sentence is automatically analyzed, knowledge in it is extracted, and the corresponding word or sentence is linked. By giving it, you may make the knowledge object of the paper.

ここで、図9乃至図18を参照して、本実施の形態における知識蓄積(格納)処理の一例について説明する。図9および図10は、本実施の形態における知識オブジェクト化の一例を示す図である。図11は、本実施の形態における段落分類処理の一例を示す図である。図12は、本実施の形態における段落の文構成の一例を示す図である。図13および図14は、本実施の形態における文6および文8の構成の一例を示す図である。図15、図16および図18は、本実施の形態における知識抽出処理の一例を示す図である。図17は、本実施の形態におけるテンプレートの一例を示す図である。   Here, an example of knowledge accumulation (storage) processing according to the present embodiment will be described with reference to FIGS. 9 and 10 are diagrams showing an example of knowledge objectification in the present embodiment. FIG. 11 is a diagram showing an example of the paragraph classification process in the present embodiment. FIG. 12 is a diagram illustrating an example of a sentence structure of a paragraph in the present embodiment. 13 and 14 are diagrams showing an example of the configuration of sentence 6 and sentence 8 in the present embodiment. FIGS. 15, 16, and 18 are diagrams illustrating an example of knowledge extraction processing according to the present embodiment. FIG. 17 is a diagram showing an example of a template in the present embodiment.

まず、制御部102は、ユーザにより指定された論文に対して、その文章構造を解析し、図9に示すように、それを構成する段落、各々の段落を構成する文、および、文を構成する単語のネットワークを生成してもよい。そして、図10に示すように、各々の論文における段落および文に関しては、木構造となるが、単語に関しては、複数の文に対して参照リンクが生成されることがあってもよい。このように、複数の論文に対してこの処理が繰り返されることで、複数の論文に出現する同じ単語からの参照リンクが、複数の論文に含まれる複数の文に対して生成される事となる。   First, the control unit 102 analyzes the sentence structure of the paper specified by the user, and configures the paragraphs constituting the article, the sentences constituting each paragraph, and the sentences as shown in FIG. A network of words may be generated. As shown in FIG. 10, the paragraphs and sentences in each paper have a tree structure. However, for words, reference links may be generated for a plurality of sentences. In this way, by repeating this process for multiple papers, reference links from the same word appearing in multiple papers will be generated for multiple sentences included in multiple papers. .

このプロセスにおいて、図11に示すように、制御部102は、段落構造を保持して抽出する場合、タイトル、概要、または、本文中の段落などに分類して段落を抽出してもよい。また、このプロセスにおいて、制御部102は、段落構造を抽出せずに、論文の下部構造を直接「文」として抽出してもよい。   In this process, as shown in FIG. 11, when the paragraph 102 retains and extracts the paragraph structure, the control unit 102 may extract the paragraphs by classifying them into titles, outlines, paragraphs in the text, or the like. In this process, the control unit 102 may directly extract the substructure of the paper as a “sentence” without extracting the paragraph structure.

次に、図12に示すように、制御部102は、各々の文に対して、ユニークなID(文1−文10等)をアサインしてもよい。当該IDは、単に論文中でのユニークIDではなく、グローバルユニークIDであり、全ての論文群から、ユニークIDで、文章が特定できるようにしてもよい。例えば、このシステムを生命科学分野に対して運用する場合、このIDは、生命科学分野で今まで「文」として表現された知識の全てに対してユニークにアサインされるものであってもよい。さらに、このIDは、生命科学関連データベースの各々のデータオブジェクトに拡張することを可能としてもよい。それにより、そのIDの集合体は、最終的には生命科学に関する全ての知識の集合体となる。例えば、図13に示すように、各々の文(文6、および、文8)に対して、文中に含まれる遺伝子名またはタンパク質名などの生物領域に関係する単語または句は、固有の参照関係を有する知識オブジェクトネットワークを構成する。また、図14に示すように、複数の言語表現(表記)が存在する対象物に対しては、点線で囲まれた部分のように表してもよい。例えば、Far1というタンパク質の表現は、「Far1」と表記する場合と、「Far1p」と表記する場合と、複数存在するが、これらは全て同じ実体に対応するため、この構造(点線で囲まれた部分)を組み込む事で、Far1と記述している文と、Far1pと記述している文と、の間の関係性を保持する事が可能となる。これは、固有名詞だけではなく、何らかの関係性を表現する句(Phrase)に対しても適応されてもよい。例えば、”A activates B”と”B is activated by A”とは、同じ現象の二つの違った言語表現であり、双方ともにその現象を表す同じ実体に関連付けられてもよい。   Next, as illustrated in FIG. 12, the control unit 102 may assign a unique ID (sentence 1 to sentence 10 or the like) to each sentence. The ID is not simply a unique ID in a paper but a global unique ID, and a sentence may be specified by a unique ID from all paper groups. For example, when this system is operated for the life science field, this ID may be uniquely assigned to all the knowledge that has been expressed as “sentences” in the life science field. Furthermore, this ID may be able to be extended to each data object of the life science related database. As a result, the collection of IDs eventually becomes a collection of all knowledge related to life science. For example, as shown in FIG. 13, for each sentence (sentence 6 and sentence 8), a word or phrase related to a biological region such as a gene name or a protein name included in the sentence has a unique reference relationship. To construct a knowledge object network. Further, as shown in FIG. 14, an object having a plurality of language expressions (notations) may be represented as a portion surrounded by a dotted line. For example, a protein called Far1 has a plurality of expressions, “Far1” and “Far1p”. Since these all correspond to the same entity, this structure (enclosed by a dotted line) By incorporating (part), it is possible to maintain the relationship between the sentence described as Far1 and the sentence described as Far1p. This may be applied not only to proper nouns but also to phrases that express some relationship (Phrase). For example, “A activateds B” and “B is activated by A” are two different language representations of the same phenomenon, both of which may be associated with the same entity representing the phenomenon.

ここで、図15のように、文(文6)から、構造化された知識(中間言語表現1、および、相互作用図1)を取り出す処理について説明する。図16に示すように、文6の原文からこれらのTEMPLATEに対応させる際に、プリプロセッシングという事前処理を行い、明らかに除外できる挿入句などを取り除くことで”Far1−Cdc24 complex is exported from the nucleus by Msn5”とし、その後、事前処理後の文6とTEMPLATEとのマッチングを行うことで、相互作用図1のような知識を抽出してもよい。すなわち、入力された文が、蓄積されているTEMPLATEのいずれかと完全にマッチングできた場合には、そのTEMPLATEに対応する論理式表現およびグラフィック表現などを知識ベースに追加してもよい。但し、入力された文が、TEMPLATEのいずれかと完全なマッチングがとれない場合には、別に定義された評価式等にしたがって最も類似している(距離が近い)と思われるTEMPLATEを一つまたは複数選択し、その論理式およびグラフ表現を、一定の信頼度係数を加えた上で知識ベースに追加してもよい。さらに、この処理の際、または、別に定義されたタイミングで、抽出された知識をユーザに提示し、その正確性の確認を行い、その文に完全に対応するTEMPLATEを生成してもよい。ここで、新たなTEMPLATEが生成された場合、そのTEMPLATEに完全に合致する文が存在するか否かを再探索し、合致した文は、その知識情報の更新を行ってもよい。また、より広範な表現に効率的に対応する為に、TEMPLATEは、階層的に定義されてもよい。また、TEMPLATEの代わりに、構文解析を利用してマッチングを進めてもよい。その場合は、解析木をTEMPLATEの代わりに蓄積してもよい。さらに、TEMPLATEおよび構文解析を利用する方式を混合して、マッチングを進めてもよい。   Here, as shown in FIG. 15, a process of extracting structured knowledge (intermediate language expression 1 and interaction diagram 1) from a sentence (sentence 6) will be described. As shown in FIG. 16, when corresponding to these TEMPLATEs from the original sentence of sentence 6, preprocessing called preprocessing is performed, and an insertion phrase that can be clearly excluded is removed to obtain “Far1-Cdc24 complex is exported from the nucleus”. The knowledge shown in FIG. 1 may be extracted by setting by Msn5 ″ and then matching the sentence 6 after the pre-processing with TEMPLATE. That is, when the inputted sentence can be completely matched with any of the stored TEMPLATEs, a logical expression expression and a graphic expression corresponding to the TEMPLATE may be added to the knowledge base. However, if the input sentence cannot be perfectly matched with any of TEMPLATE, one or more TEMPLATEs that are considered to be the most similar (distance is close) according to a separately defined evaluation formula etc. The logic formula and the graph representation may be selected and added to the knowledge base after adding a certain reliability coefficient. Furthermore, the extracted knowledge may be presented to the user at the time of this process or at a timing defined separately, the accuracy of the knowledge may be confirmed, and a TEMPLATE completely corresponding to the sentence may be generated. Here, when a new TEMPLATE is generated, it may be searched again whether there is a sentence that completely matches the TEMPLATE, and the knowledge information of the matched sentence may be updated. Also, TEMPLATE may be defined hierarchically in order to efficiently accommodate a wider range of expressions. Further, instead of TEMPLATE, matching may be advanced using syntax analysis. In that case, the analysis tree may be accumulated instead of TEMPLATE. Furthermore, matching may be advanced by mixing TEMPLATE and a method using syntax analysis.

また、図17に示すように、本実施の形態においては、同じ事象を表現する二つの文(文1、および、文2)がある場合、TEMPLATE1を用いて文1からの知識抽出を行い、TEMPLATE2を用いて文2から同様の知識抽出を行ってもよい。ここで、TEMPLATEの種類は、自然言語の表現に対応する非常に大きな数に上るが、限定領域においては、非常に膨大ではあるが、無限ではなく、おおよそ有限であると考えられる。   As shown in FIG. 17, in this embodiment, when there are two sentences (sentence 1 and sentence 2) expressing the same event, knowledge extraction from sentence 1 is performed using TEMPLATE1, Similar knowledge extraction from sentence 2 may be performed using TEMPLATE2. Here, the number of types of TEMPLATE is very large corresponding to the expression of natural language, but in a limited area, it is very large but is not infinite and is considered to be almost finite.

そして、これらの手法で構造化され変換された知識(階層的知識表現)は、階層的抽象度を有する知識ベース106aとして統合されてもよい。本実施の形態においては、階層的抽象度を有し、論文などの記載と構造化された知識との対応を保持し、同等、競合、または、包括などの関係を維持および管理する事が出来る知識表現形式を利用している。   Then, the knowledge (hierarchical knowledge representation) structured and converted by these methods may be integrated as a knowledge base 106a having a hierarchical abstraction level. In this embodiment, it has a hierarchical abstraction level, maintains correspondence between descriptions of papers and structured knowledge, and can maintain and manage relationships such as equality, competition, or inclusion. A knowledge representation format is used.

従来の知識ベースまたはデータベースでは、論文または論文内の言明と構造化された知識との対応関係は失われていた。このため、従来の知識ベース等に記述されている知識の起源をたどる事が直接は不可能であった。しかし、本発明においては、各々の言明に対応する知識表現を知識ベース106aの一部として表現しているために、直接的に知識の起源となる言明を同定する事が可能となる。   In a conventional knowledge base or database, the correspondence between a paper or a statement in the paper and structured knowledge has been lost. For this reason, it is impossible to trace the origin of knowledge described in the conventional knowledge base. However, in the present invention, since the knowledge expression corresponding to each statement is expressed as a part of the knowledge base 106a, it is possible to directly identify the statement that is the origin of knowledge.

また、従来の知識ベース生成手法では、人間が複数の文献などから得た情報を基に、一定の解釈を行い、それを構造化した形で記述を行い、知識ベースに追加していた。しかし、この方法では、人間の解釈の恣意性が介在する可能性が高い。本実施の形態における手法では、文または複数の文による言明毎に構造化した知識として蓄積し、一義的に自動化されるので、人による恣意的解釈の入る余地を大幅に減らす事が可能となった。   Further, in the conventional knowledge base generation method, a certain interpretation is performed on the basis of information obtained from a plurality of documents by human beings, and the description is structured and added to the knowledge base. However, in this method, there is a high possibility that the arbitrary nature of human interpretation is involved. In the method according to the present embodiment, knowledge that is structured for each statement of a sentence or a plurality of sentences is accumulated and uniquely automated, so that it is possible to greatly reduce the room for arbitrary interpretation by a person. It was.

また、本実施の形態における知識表現は、論文などに表現されている知識を表現する為に、階層的詳細化を可能とする知識表現を用いる。ここで、対象の事象に関して知られているある一定の事項(「知識」)が表現されている自然言語の文または文の一群を「言明」(Statement)と呼ぶ。言明は、必ずしもその対象物に関する全ての事項が表現されている訳ではなく、その一部を表現していることがほとんどである。   The knowledge representation in the present embodiment uses a knowledge representation that enables hierarchical refinement in order to represent knowledge represented in a paper or the like. Here, a natural language sentence or a group of sentences in which a certain item (“knowledge”) known about the target event is expressed is referred to as a “statement”. The statement does not necessarily represent all the matters related to the object, but mostly expresses a part thereof.

これに対して、従来の知識表現手法を利用する場合では、全ての項目の中から表現されている部分を記述し、その他の部分は記述しないという手法を用いていた。ここで、他の言明からの知識は、その知識表現が記述されていない部分に新たに記述し、既に記述されている部分はそのままにすることで、一連の言明に記述されている知識を重ねて行く方式であった。それにより、この従来の知識表現方法では、どの言明がどの知識を表現していたのかを明示的に表現する事が出来なかった。また、ある言明が抽象的であり、別の言明がより詳細な知識を内蔵していた場合、二つの言明の関係性などを表現する事が出来なかった。ところが、一般の論文などでは、各々の言明は、別々の抽象度と部分的な知識とを表現している。このため従来の知識表現方法では、各々の言明とそこで表現されている知識との対応関係を明確に維持しながら知識ベースとして蓄積、精密化する事が出来なかった。   On the other hand, in the case of using the conventional knowledge expression method, a method is described in which a portion expressed from all items is described and other portions are not described. Here, knowledge from other statements is newly described in the part where the knowledge representation is not described, and the part already described is left as it is, so that the knowledge described in the series of statements is overlaid. It was a method to go. As a result, in this conventional knowledge representation method, it was not possible to express explicitly which statement represented which knowledge. Also, if one statement was abstract and another statement contained more detailed knowledge, the relationship between the two statements could not be expressed. However, in general papers, each statement expresses a different level of abstraction and partial knowledge. For this reason, the conventional knowledge expression method cannot be accumulated and refined as a knowledge base while maintaining the correspondence between each statement and the knowledge expressed there.

一方、本実施の形態においては、これらの問題点を解決し、各々の抽象度、および、言明に表現された部分的知識を明確な対応関係をもって表現する事で、論文などからの知識の集積を可能としている。   On the other hand, in the present embodiment, knowledge is gathered from papers, etc. by solving these problems and expressing each of the abstraction levels and partial knowledge expressed in the statement with a clear correspondence. Is possible.

例えば、図18に示すように、ある論文の一部に含まれる文に、Far1−Cdc24複合体のMsn5との相互作用に関する記述があり、この文には、Far1−Cdc24の複合体が、Msn5によって核内から核外に移送されるということが一つの知識として記述されている(言明1)。しかし、この言明自体からは、移送された複合体は、どこにたどり着くのか、どのようなFar1−Cdc24複合体でも移送されるのか、どのようなMsn5が移送に介在するのかなど、より詳細な情報は記述されていない。ここで、別の論文に、移送されたFar1−Cdc24が、細胞膜近傍に到達し、GPCR結合タンパク質と相互作用するという言明(言明2)が記述されていたとすれば、その言明2に表現されている知識を同時に知識ベース106aに蓄積する事で、最初の論文では不明確であった部分の詳細が補完されることになる。そして、ユーザが統合された知識表現を蓄積した知識ベース106aを検索して、Far1−Cdc24が、細胞膜付近に到達するという情報を取得し、その根拠となる論文を探した場合、本実施の形態における知識ベース106aにおいては、各々の知識に対してその根源となる言明を明示的に関連付けているため、言明2および言明2が記載された論文が、その知識の根拠としてユーザに提示される。すなわち、本発明をユーザが利用することにより、言明1ではなく、適切な言明である言明2に関する情報が提示されることになる。   For example, as shown in FIG. 18, a sentence included in a part of a certain paper has a description regarding the interaction of the Far1-Cdc24 complex with Msn5. In this sentence, the complex of Far1-Cdc24 is represented by Msn5. It is described as one knowledge that it is transferred from inside the nucleus to outside the nucleus (Statement 1). However, from this statement itself, more detailed information such as where the transported complex arrives, what Far1-Cdc24 complex is transported, what Msn5 mediates in transport, etc. It is not described. Here, if another statement states that the transferred Far1-Cdc24 reaches the vicinity of the cell membrane and interacts with the GPCR binding protein (statement 2), it is expressed in the statement 2. By accumulating the existing knowledge in the knowledge base 106a at the same time, the details of the unclear part in the first paper are complemented. Then, when the user searches the knowledge base 106a storing the integrated knowledge representation, acquires information that the Far1-Cdc24 reaches the vicinity of the cell membrane, and searches for a paper as the basis thereof, this embodiment In the knowledge base 106a in FIG. 6, the statement that is the source of the knowledge is explicitly associated with each knowledge, so the statement 2 and the paper describing the statement 2 are presented to the user as the basis of the knowledge. That is, when the user uses the present invention, not the statement 1 but the information related to the statement 2 which is an appropriate statement is presented.

さらに、本実施の形態においては、論文などから導出された知識体系であるSONに基づく知識オブジェクトネットワークを構築するだけでなく、実験データ等のデータからの推論で構成される仮説群に基づく知識オブジェクトネットワーク(データ駆動型知識オブジェクトネットワーク)を構築してもよい。ここで、各々のデータ駆動型仮説生成機構は、その目的毎にモジュール化されていてもよく、例えば、遺伝子制御関係をデータから推定する場合、複数の制御関係推定ソフトウェアを実装し、これらの結果を各々算出、または、一定の規則で決められた計算に基づき算出してもよい。この際に、所与のデータから推定される遺伝子制御ネットワークを、ユーザに提示してもよく、特定の相互作用に対して、一連のデータからどのようにその知識を指示、または、却下するかなどに関連するデータからの推論をユーザに提示してもよい。   Furthermore, in this embodiment, not only a knowledge object network based on SON, which is a knowledge system derived from a paper etc., but also a knowledge object based on a hypothesis group composed of inferences from data such as experimental data A network (data driven knowledge object network) may be constructed. Here, each data-driven hypothesis generation mechanism may be modularized for each purpose. For example, when estimating a gene control relationship from data, a plurality of control relationship estimation software is installed, and these results are obtained. May be calculated based on each calculation or based on a calculation determined by a certain rule. At this time, a gene regulatory network inferred from given data may be presented to the user, and how to direct or reject that knowledge from a set of data for a particular interaction. Inferences from data related to the user may be presented to the user.

また、新たな知識の発見は、類推、帰納、および、演繹などを組み合わせた仮説生成からもたらされるため、知識ベース106aの構造から、類似の構造であるが、その一部が欠落しているものなどをユーザに提示する事で、ユーザに新たな発見のヒントを与える、すなわち、発見サポートをすることができる。さらに、本実施の形態においては、いわゆる発見科学において利用される自動法則発見アルゴリズム群を実効し、自動的に新たな科学的仮説を形成してもよい。また、従来知られていない組み合わせにより新たな仮説の生成を行い、その仮説をユーザに提示し、その妥当性を記録してもよい。   In addition, since the discovery of new knowledge comes from hypothesis generation that combines analogy, induction, deduction, etc., it is a similar structure from the structure of the knowledge base 106a, but part of it is missing Etc. can be provided to the user to give a new discovery hint to the user, that is, discovery support can be provided. Further, in this embodiment, a new scientific hypothesis may be automatically formed by executing an automatic law discovery algorithm group used in so-called discovery science. Further, a new hypothesis may be generated by a combination that has not been known so far, and the hypothesis may be presented to the user and the validity thereof may be recorded.

また、一般に、生物モデルの動的シミュレーション(データ駆動型動的シミュレーション)は、モデルにパラメータと数式を付与して、数値計算を行う事で実行することがおおい。しかし、実際には、多くの実験データがあり、これらを構造化し蓄積する事で、生物モデルがある条件でどのように挙動するかを実際の実験データを検索し、外挿および内挿する形で解を導く事も可能である。これは、単にモデルの動的挙動が得られるという事のみならず、既知の実験データから導かれる近似解であり、従来の数値解析とは別の重要性を持つものと考えられる。そこで、本実施の形態においては、これを実現する為に、各々の実験データは、細胞の種類、その条件、刺激、各タンパク質の活性度、各タンパク質の総量、および/または、遺伝子の発現レベルなどの数値を構造化してもよい。本実施の形態においては、ある細胞に対して、特定の条件で、特定の刺激が行われ、ある遺伝子の発現の変動を見ようとする場合、当該条件に出来るだけ合致する実験データを検索し、そのデータ群から遺伝子の発現変動データを得てもよい。また、本実施の形態においては、同一条件の実験データがある場合、その実験の結果を最もあり得る解として提示してもよい。また、本実施の形態においては、同一条件の実験データが複数ある場合、各々の結果を提示されるとともに、結果のばらつき、および/または、平均値などの統計データも付加した形で提示してもよい。また、本実施の形態においては、同一条件の実験データが無い場合、別途指定される緩和規則に従って、最も近いと計算される実験とその結果とを提示してもよい。ここで、複数の実験が最も近いと計算される実験となりうる場合には、その場合は、各々の結果と各々の統計データとを提示してもよい。   In general, a dynamic simulation of a biological model (data-driven dynamic simulation) is performed by assigning parameters and mathematical formulas to the model and performing numerical calculations. However, there is actually a lot of experimental data, and by structuring and accumulating these data, the actual experimental data is searched for how the biological model behaves under certain conditions, and extrapolated and interpolated. It is also possible to derive a solution with. This is not only that the dynamic behavior of the model can be obtained, but also an approximate solution derived from known experimental data, and is considered to have a different importance from the conventional numerical analysis. Therefore, in the present embodiment, in order to achieve this, each experimental data includes cell types, conditions, stimulation, activity of each protein, total amount of each protein, and / or gene expression level. You may structure numerical values such as. In the present embodiment, when a specific stimulus is performed on a certain cell under a specific condition and a change in expression of a gene is to be observed, experimental data that matches the condition as much as possible is searched, Gene expression variation data may be obtained from the data group. In this embodiment, when there is experimental data under the same conditions, the result of the experiment may be presented as the most likely solution. In the present embodiment, when there are a plurality of experimental data under the same conditions, each result is presented, and the result variation and / or statistical data such as an average value is also presented. Also good. In the present embodiment, when there is no experimental data under the same condition, an experiment calculated to be closest and a result thereof may be presented according to a relaxation rule specified separately. Here, in a case where an experiment can be calculated that the plurality of experiments are closest, in that case, each result and each statistical data may be presented.

ここで、図19乃至図28を参照して、本実施の形態における知識情報処理方法の一例について説明する。図19、および、図25乃至図28は、本実施の形態における知識情報処理方法の一例を示す図である。   Here, an example of the knowledge information processing method in the present embodiment will be described with reference to FIGS. 19 and FIGS. 25 to 28 are diagrams illustrating an example of the knowledge information processing method according to the present embodiment.

まず、ユーザは、ある論文を指定すると、これが新規の論文の場合、構造解析部102aにより直ちに文章解析が行われる。そして、ユーザにより単語(例えば、Cdc24)が指定された場合、知識抽出部102bによる解析の結果、既に、これが出芽酵母のタンパク質であることが知識ベース106aとの照合で同定され、さらに知識ベース106a内のCdc24タンパクのオブジェクトと参照が成立しているため、特定情報取得部102dは、特定情報および関連情報を素早く取得する。そして、図19に示すように、特定情報出力部102eは、Cdc24という単語が指定された場合、可能な処理(アクション)を提示することができる。   First, when a user designates a certain paper, if this is a new paper, the structure analysis unit 102a immediately analyzes the text. When a word (for example, Cdc24) is designated by the user, as a result of analysis by the knowledge extraction unit 102b, it is already identified by collation with the knowledge base 106a that this is a protein of budding yeast, and further the knowledge base 106a Since the Cdc24 protein object and the reference are established, the specific information acquisition unit 102d quickly acquires specific information and related information. As illustrated in FIG. 19, the specific information output unit 102 e can present a possible process (action) when the word Cdc24 is designated.

ここで、図20乃至図24を参照して、本実施の形態における情報出力の一例について説明する。図20乃至図22は、本実施の形態におけるS−SNSの一例を示す図である。図23および図24は、本実施の形態における情報提示の一例を示す図である。   Here, an example of information output in the present embodiment will be described with reference to FIGS. 20 to 22 are diagrams illustrating an example of the S-SNS in the present embodiment. 23 and 24 are diagrams showing an example of information presentation in the present embodiment.

ここで、特定情報出力部102eは、指定された項目に対する可能な処理を提示する場合、指定された単語、アイコン、リンクなど自体、または、そのリンク先の属性に対して、その属性となるデータに対する処理が可能なソフトウェアまたはウェッブサービスをソフトウェア・ソシアルネットワーク(S−SNS)から検索し、その候補を提示してもよい。ここで、指定された単語、または、リンク先の属性(データ型とも呼ぶ)としては、遺伝子名、タンパク質名、酵素名、遺伝子発現データ、ゲノム配列データ、質量分析データ、または、タンパク質構造データなどが含まれるが、これらに限らず当該作業に関連するものを含んでいてもよい。   Here, when the specific information output unit 102e presents a possible process for the specified item, the specified word, icon, link, etc. itself, or data that becomes the attribute for the link destination attribute The software or web service that can be processed with respect to is searched from the software social network (S-SNS), and the candidate may be presented. Here, the specified word or linked attribute (also called data type) includes gene name, protein name, enzyme name, gene expression data, genome sequence data, mass spectrometry data, protein structure data, etc. However, the present invention is not limited thereto, and may include those related to the work.

ここで、図20に示すように、本実施の形態におけるS−SNSは、上記データ型を出力するソフトウェアと、それらのデータ型の出力を入力として処理することが可能なソフトウェアと、の関係性を記述したネットワークであってもよい。このネットワークは、新たなデータ型の導入、または、ソフトウェアもしくはウェッブサービスの導入の際に、更新されてもよい。なお、従来では、あるデータ型に対してどのソフトウェアを利用することで、その解析処理が行えるかが明示的ではなく、あるソフトウェアの出力、または、選択されたデータが、他のどのソフトウェアでどのように処理されるかを知ることは困難であった。しかし、本実施の形態におけるS−SNSを用いることにより、これらの処理等の関係をユーザに明示することができ、ユーザは、連続的にデータ解析を行う事が可能となる。   Here, as shown in FIG. 20, the S-SNS in the present embodiment has a relationship between software that outputs the above data types and software that can process the output of those data types as input. May be a network in which is described. This network may be updated upon the introduction of new data types or the introduction of software or web services. Conventionally, it is not clear which software can be used to analyze data for a certain data type, and what software output or selected data is used by which other software. It was difficult to know how to be processed. However, by using the S-SNS in the present embodiment, the relationship of these processes and the like can be clearly shown to the user, and the user can continuously perform data analysis.

また、図20に示すように、本実施の形態におけるS−SNSは、相互に関係するデータ等を、相互関係が分かるようにネットワークの形式で可視化してもよく、図21に示すように、マトリックス形式で表示してもよい。さらに、図22に示すように、本実施の形態におけるS−SNSは、あるソフトウェアに対して、どのようなデータ型が関係づけられるか、および、当該データ型に対応する(当該データ型を処理可能な)ソフトウェアが関係づけられるかを表示してもよい。また、図23に示すように、分子間相互作用ネットワークの表示から項目を選択し、関連した処理を継続することも同様の機構で可能である。また、図24に示すように、選択された項目に関連した諸般の情報を統一的に表示するソフトウェアと連携し、その画面を表示してもよい。図24においては、選択された項目に関連するニュース、論文、データベースの項目、および、選択された項目がインターネット上でどのくらい検索されているかトレンド解析などが表示してもよい。   In addition, as shown in FIG. 20, the S-SNS in the present embodiment may visualize data related to each other in the form of a network so that the mutual relation can be understood. As shown in FIG. It may be displayed in a matrix format. Furthermore, as shown in FIG. 22, the S-SNS in the present embodiment corresponds to what data type is associated with a certain software and the data type (the data type is processed). It may also indicate whether (possible) software is related. Further, as shown in FIG. 23, it is possible to select an item from the display of the intermolecular interaction network and continue the related processing by the same mechanism. Also, as shown in FIG. 24, the screen may be displayed in cooperation with software that uniformly displays various information related to the selected item. In FIG. 24, news, papers, database items related to the selected item, and how much the selected item is searched on the Internet may be displayed.

そして、図25に示すように、特定情報取得部102dは、Cdc24がタンパク質なので、それをコーディングしている遺伝子CDC24を利用したジーンエンリッチメントの遺伝子情報データベース106dに対する検索、タンパク質情報データベース106c(例えば、スイス・プロット等)に対するタンパク質情報の検索、タンパク質相互作用(PPI)情報の分子間相互作用情報データベース106eに対する検索を行うことができる。すなわち、図25に示すように、特定情報取得部102dは、Cdc24がタンパク質であるという付加情報を利用して、より正確なCdc24に関する情報を検索することもできる。さらに、図26に示すように、特定情報出力部102eは、Cdc24が要素として含まれているパスウェイをパスウェイ情報データベース106fより提示することもできる。また、特定情報出力部102eは、知識ベース106aまたは関連情報データベース106bに記憶される知識情報の断片をユーザに提示してもよく、例えば、相互作用ネットワークの部分を特にハイライト表示して、ネットワークを可視化してもよい。   Then, as shown in FIG. 25, since Cdc24 is a protein, the specific information acquisition unit 102d searches the gene information database 106d for gene enrichment using the gene CDC24 coding for it, a protein information database 106c (for example, It is possible to search protein information for Swiss plots and the like, and search for intermolecular interaction information database 106e for protein interaction (PPI) information. That is, as shown in FIG. 25, the specific information acquisition unit 102d can search for more accurate information on Cdc24 using additional information that Cdc24 is a protein. Furthermore, as shown in FIG. 26, the specific information output unit 102e can also present a pathway including Cdc24 as an element from the pathway information database 106f. In addition, the specific information output unit 102e may present a piece of knowledge information stored in the knowledge base 106a or the related information database 106b to the user. May be visualized.

そして、図27に示すように、ユーザがこの提示されたパスウェイを見ながら、Cdc24と相互作用しているCdc28を指定した場合、Cdc28に関する項目は知識ベース106aに存在し、パスウェイ情報データベース106fに対する参照関係を確立しているので、特定情報出力部102eは、直ちに、Cdc24を起点とした一連の解析などのオプション情報を提示することができる。さらに、図28に示すように、特定情報取得部102dは、Cdc28に関する論文やニュースを、知識ベース106a、文献情報データベース106g、または、ニュースデータベース106h等からCdc28に関連する要素を同定し、特定情報出力部102eは、それに関する論文などを表示することができる。   Then, as shown in FIG. 27, when the user specifies Cdc 28 interacting with Cdc 24 while viewing the presented pathway, items relating to Cdc 28 exist in knowledge base 106a, and reference is made to pathway information database 106f. Since the relationship is established, the specific information output unit 102e can immediately present optional information such as a series of analyzes starting from the Cdc24. Further, as shown in FIG. 28, the specific information acquisition unit 102d identifies articles related to Cdc28 from the knowledge base 106a, the literature information database 106g, the news database 106h, etc. The output unit 102e can display a paper related to the output unit 102e.

また、本実施の形態においては、ユーザによりその内容を検証しようとする論文群が設定され、それを本システムに入力された場合、それらの論文から知識が抽出され、当該知識に関する情報が知識ベース106aに格納されることによって、知識ベースを生成、または、成長させてもよい。   Also, in this embodiment, when a group of papers whose contents are to be verified is set by the user and input to the system, knowledge is extracted from those papers, and information about the knowledge is stored in the knowledge base. A knowledge base may be generated or grown by being stored in 106a.

以上で、本実施の形態における知識情報処理装置100の処理の一例の説明を終える。   Above, description of an example of the process of the knowledge information processing apparatus 100 in this Embodiment is finished.

[本実施の形態のまとめ]
ユーザが一つの生命科学の論文を読む状況を考えた場合、この論文の中に、遺伝子名、タンパク質名、生物学的プロセス、実験手法、実験機材、および、薬品名などが多数存在する。従来から、論文中の単語(例えば、mTOR)に対して、ソフトウェアを使ってタンパク質データベースを検索するなどの処理が行われていた。
[Summary of this embodiment]
Considering the situation where a user reads one life science paper, there are many gene names, protein names, biological processes, experimental methods, experimental equipment, drug names, etc. in this paper. Conventionally, processing such as searching a protein database using software has been performed on a word (for example, mTOR) in a paper.

そこで、本実施の形態においては、単なる検索にとどまらず、大規模遺伝子発現データベース(遺伝子情報データベース106d)と直ちに連動し、mTORをエンコードしている遺伝子を同定し、その遺伝子の発現解析プログラムを立ち上げ、ユーザが指定する条件において、データ解析を実行することを可能としている。また、本実施の形態においては、ユーザにより複数のタンパク質が指定された場合、それらの相互作用の有無、および、二つのタンパク質に相互作用するタンパク質の表示、構造的類似性の検証など一連の解析を直ちに行う事も可能としている。   Therefore, in the present embodiment, the search is not limited to simple search, but immediately linked to a large-scale gene expression database (gene information database 106d), a gene encoding mTOR is identified, and an expression analysis program for the gene is established. The data analysis can be executed under the conditions specified by the user. In this embodiment, when a plurality of proteins are specified by the user, a series of analyzes such as the presence / absence of the interaction, display of the protein interacting with the two proteins, verification of structural similarity, etc. Can also be performed immediately.

例えば、ユーザが論文中にあるmTORという単語を指定した場合、本実施の形態(本システム)においては、これをタンパク質の名称であるとタンパク質情報データベース106cなどを利用して同定し、そこで可能な検索や解析処理のリストをユーザに提示し、ユーザによりその一つまたは複数が指定された場合、mTORにまつわる情報にアクセス出来るようにしてもよい。また、例えば、本システムにおいては、mTORと相互作用する他のタンパク質などをタンパク質相互作用ネットワーク、または、パスウェイネットワークなどの形態で表示し、ユーザによりこのように表示されたネットワークにおいてmTORと相互作用するタンパク質が指定された場合、そのタンパク質について記述される論文またはタンパク質の立体構造などを検索してもよい。さらに、本システムにおいては、mTORの活性伝搬の観点から、下流にあるタンパク質のリストを得てもよい。これらの処理は、単にmTORなどの言葉の検索では正確かつ効率的に実施する事は困難であるが、mTORなどの生物学的事項に関する正確で、広範な知識ベース106aの構築で、最新のデータおよび知見を蓄積する機構が存在する本システムを適用することにより、このような動作を可能とすることができる。   For example, when the user designates the word mTOR in the paper, in the present embodiment (this system), this is identified by using the protein information database 106c or the like as the name of the protein, and is possible there. A list of search and analysis processes may be presented to the user, and when one or more of them are designated by the user, information related to mTOR may be accessed. For example, in this system, other proteins that interact with mTOR are displayed in the form of a protein interaction network or pathway network, and interact with mTOR in the network displayed in this way by the user. When a protein is designated, a paper describing the protein or a three-dimensional structure of the protein may be searched. Furthermore, in the present system, a list of downstream proteins may be obtained from the viewpoint of propagation of mTOR activity. These processes are difficult to carry out accurately and efficiently simply by searching for words such as mTOR, but with the construction of accurate and extensive knowledge base 106a regarding biological matters such as mTOR, the latest data Such an operation can be made possible by applying the present system having a mechanism for accumulating knowledge.

さらに、本システムにおいては、“A activates B”などの文が指定された場合、この文に表現されている知識が、本システムの知識ベース106aにおいて既知である(記憶されている)か、その知識の信頼度および根拠などを提示してもよい。また、本システムにおいては、このような文が指定された場合、その文に表現されている知識を構造化された形に変換し、知識ベース106aに照合する手続きを起動する。そして、この知識が、すでに知識ベース106aに存在する場合、その一貫性の検証と、新規論文および関連情報データベース106bのアップデートなどを確認し、関連情報の更新と、を行ってもよい。この段階で、本システムにおいては、既知の知識と矛盾する知識が確認された場合、その知識を知識ベース106aに蓄積(格納)すると同時に、既知の知識と新たな知識との間に相互背反を締めるアークを設定してもよい。さらに、本システムにおいては、これらの事実をユーザに提示し、相互背反の評価を要求する設定をしてもよい。さらに、本システムにおいては、新たな仮説などをユーザに提示してもよい。   Further, in this system, when a sentence such as “A activates B” is designated, the knowledge expressed in this sentence is known (stored) in the knowledge base 106a of the system, or Knowledge reliability and grounds may be presented. In the present system, when such a sentence is designated, the knowledge expressed in the sentence is converted into a structured form, and a procedure for collating with the knowledge base 106a is started. If this knowledge already exists in the knowledge base 106a, the consistency may be verified, the new paper and the related information database 106b may be updated, and the related information may be updated. At this stage, in the present system, when knowledge that contradicts the known knowledge is confirmed, the knowledge is accumulated (stored) in the knowledge base 106a, and at the same time, there is a contradiction between the known knowledge and the new knowledge. An arc to be tightened may be set. Further, in the present system, these facts may be presented to the user and a setting may be made that requires a reciprocal evaluation. Further, in this system, a new hypothesis or the like may be presented to the user.

[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
[Other embodiments]
Although the embodiments of the present invention have been described so far, the present invention is not limited to the above-described embodiments, but can be applied to various different embodiments within the scope of the technical idea described in the claims. It may be implemented.

例えば、知識情報処理装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、知識情報処理装置100は、クライアント端末(知識情報処理装置100とは別筐体である)からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。   For example, although the case where the knowledge information processing apparatus 100 performs processing in a stand-alone form has been described as an example, the knowledge information processing apparatus 100 is requested by a client terminal (which is a separate casing from the knowledge information processing apparatus 100). Depending on the process, the processing result may be returned to the client terminal.

また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。   In addition, among the processes described in the embodiment, all or part of the processes described as being automatically performed can be performed manually, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method.

このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。   In addition, unless otherwise specified, the processing procedures, control procedures, specific names, information including registration data for each processing, parameters such as search conditions, screen examples, and database configurations shown in the above documents and drawings Can be changed arbitrarily.

また、知識情報処理装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。   Further, regarding the knowledge information processing apparatus 100, each illustrated component is functionally conceptual and does not necessarily need to be physically configured as illustrated.

例えば、知識情報処理装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて知識情報処理装置100に機械的に読み取られる。すなわち、ROMまたはHDD(Hard Disk Drive)などの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。   For example, the processing functions provided in each device of the knowledge information processing device 100, in particular, the processing functions performed by the control unit 102, all or any part thereof are interpreted by a CPU (Central Processing Unit) and the CPU. It may be realized by a program to be executed, or may be realized as hardware by wired logic. The program is recorded on a non-transitory computer-readable recording medium including programmed instructions for causing a computer to execute the method according to the present invention, which will be described later, and knowledge information processing is performed as necessary. It is mechanically read by the device 100. That is, in the storage unit 106 such as a ROM or an HDD (Hard Disk Drive), a computer program for giving instructions to the CPU and performing various processes in cooperation with the OS (Operating System) is recorded. This computer program is executed by being loaded into the RAM, and constitutes a control unit in cooperation with the CPU.

また、このコンピュータプログラムは、知識情報処理装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。   The computer program may be stored in an application program server connected to the knowledge information processing apparatus 100 via an arbitrary network, and may be downloaded in whole or in part as necessary. It is.

また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD、および、Blu−ray(登録商標) Disc等の任意の「可搬用の物理媒体」を含むものとする。   In addition, the program according to the present invention may be stored in a computer-readable recording medium, and may be configured as a program product. Here, the “recording medium” means a memory card, USB memory, SD card, flexible disk, magneto-optical disk, ROM, EPROM, EEPROM, CD-ROM, MO, DVD, and Blu-ray (registered trademark). It is assumed to include any “portable physical medium” such as Disc.

また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。   The “program” is a data processing method described in an arbitrary language or description method, and may be in any format such as source code or binary code. The “program” is not necessarily limited to a single configuration, but is distributed in the form of a plurality of modules and libraries, or in cooperation with a separate program represented by an OS (Operating System). Including those that achieve the function. Note that a well-known configuration and procedure can be used for a specific configuration for reading a recording medium, a reading procedure, an installation procedure after reading, and the like in each device described in the embodiment.

記憶部106に格納される各種のデータベース等(知識ベース106a、関連情報データベース106b、タンパク質情報データベース106c、遺伝子情報データベース106d、分子間相互作用情報データベース106e、パスウェイ情報データベース106f、文献情報データベース106g、および、ニュースデータベース106h)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。   Various databases and the like stored in the storage unit 106 (knowledge base 106a, related information database 106b, protein information database 106c, gene information database 106d, intermolecular interaction information database 106e, pathway information database 106f, literature information database 106g, and The news database 106h) is a storage means such as a memory device such as a RAM and a ROM, a fixed disk device such as a hard disk, a flexible disk, and an optical disk, and various programs, tables, and databases used for various processing and website provision. , And web page files are stored.

また、知識情報処理装置100は、既知のデスクトップ型またはノート型のパーソナルコンピュータ、携帯電話、スマートフォン、PHS、およびPDA等の携帯端末装置、ならびに、ワークステーション等の知識情報処理装置として構成してもよく、また、該知識情報処理装置に任意の周辺装置を接続して構成してもよい。また、知識情報処理装置100は、該知識情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。   The knowledge information processing apparatus 100 may be configured as a known desktop type or notebook type personal computer, a portable terminal device such as a mobile phone, a smartphone, a PHS, and a PDA, and a knowledge information processing apparatus such as a workstation. Alternatively, an arbitrary peripheral device may be connected to the knowledge information processing apparatus. The knowledge information processing apparatus 100 may be realized by installing software (including programs, data, and the like) that causes the knowledge information processing apparatus to realize the method of the present invention.

更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施の形態を任意に組み合わせて実施してもよく、実施の形態を選択的に実施してもよい。   Furthermore, the specific form of distribution / integration of the devices is not limited to that shown in the figure, and all or a part of them may be functional or physical in arbitrary units according to various additions or according to functional loads. Can be distributed and integrated. In other words, the above-described embodiments may be arbitrarily combined and may be selectively implemented.

以上詳述に説明したように、本発明によれば、論文等の自然言語により記述された文章を他の大規模データと同列に扱い、単なる辞書引きを超えて、研究者等のユーザが、知識空間をナビゲートし、解析し、発見する事が出来る知識情報処理装置、知識情報処理方法、および、プログラムを提供することができるので、自然言語で記載された文章を扱う情報処理、および、出版等の様々な分野において有用であり、特に医療、製薬、創薬、および、生物学研究等の様々な分野において極めて有用である。   As explained in detail above, according to the present invention, sentences described in a natural language such as papers are handled in the same line as other large-scale data, and beyond mere dictionary lookup, users such as researchers, A knowledge information processing device, a knowledge information processing method, and a program capable of navigating, analyzing, and discovering a knowledge space can be provided, so that information processing that handles sentences written in natural language, and It is useful in various fields such as publishing, and is extremely useful particularly in various fields such as medicine, pharmaceuticals, drug discovery, and biological research.

100 知識情報処理装置
102 制御部
102a 構造解析部
102b 知識抽出部
102c 格納部
102d 特定情報取得部
102e 特定情報出力部
106 記憶部
106a 知識ベース
106b 関連情報データベース
106c タンパク質情報データベース
106d 遺伝子情報データベース
106e 分子間相互作用情報データベース
106f パスウェイ情報データベース
106g 文献情報データベース
106h ニュースデータベース
108 入出力制御インターフェース部
112 入力部
114 表示部
116 音声出力部
100 knowledge information processing apparatus 102 control unit
102a Structural analysis unit
102b Knowledge extraction unit
102c storage unit
102d specific information acquisition unit
102e Specific information output unit 106 Storage unit
106a Knowledge Base
106b Related Information Database
106c Protein Information Database
106d gene information database
106e Intermolecular interaction information database
106f pathway information database
106g Literature Information Database
106h News database 108 Input / output control interface unit 112 Input unit 114 Display unit 116 Audio output unit

Claims (18)

出力部と制御部と記憶部とを少なくとも備えた知識情報処理装置であって、
上記記憶部は、
自然言語により記述される単語、句、文または文の一群に対する固有の識別情報を対応付けた、上記単語、上記句、上記文または上記文の一群に表現された知識を示すノードに関するノード情報と、上記ノードの性質および/または上記ノード間の関連性を示すアークに関するアーク情報と、を含む、上記単語、上記句、上記文または上記文の一群と上記知識とが明確な対応関係をもって表現された、知識オブジェクトネットワークに関する知識オブジェクトネットワーク情報を記憶する知識ベース、
を備え、
上記制御部は、
任意の上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む特定情報を取得する特定情報取得手段と、
上記特定情報を上記出力部を介して出力させる特定情報出力手段と、
を備えたことを特徴とする知識情報処理装置。
A knowledge information processing apparatus including at least an output unit, a control unit, and a storage unit,
The storage unit
Node information relating to a node representing knowledge expressed in the word, the phrase, the sentence, or the group of sentences, and associated with unique identification information for the word, phrase, sentence, or group of sentences described in a natural language; The word, the phrase, the sentence, or the group of sentences and the knowledge are expressed with a clear correspondence relationship, including arc information about arcs indicating the nature of the nodes and / or the relationships between the nodes. A knowledge base for storing knowledge object network information related to the knowledge object network,
With
The control unit
Specific information acquisition means for specifying the node constituting the knowledge object network corresponding to an arbitrary word and acquiring specific information including the node information and / or the arc information related to the node;
Specific information output means for outputting the specific information via the output unit;
A knowledge information processing apparatus characterized by comprising:
請求項1に記載の知識情報処理装置において、
上記記憶部は、
上記ノードの関連情報を記憶する関連情報記憶手段、
を更に備え、
上記特定情報取得手段は、
更に、上記任意の単語に対応する上記ノードの上記関連情報を上記関連情報記憶手段から検索し、当該検索された上記関連情報を取得し、
上記特定情報出力手段は、
更に、上記関連情報を上記出力部を介して出力させることを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 1,
The storage unit
Related information storage means for storing related information of the node;
Further comprising
The specific information acquisition means includes
Further, the related information of the node corresponding to the arbitrary word is searched from the related information storage means, and the searched related information is acquired.
The specific information output means includes
Furthermore, the knowledge information processing apparatus, wherein the related information is output via the output unit.
請求項2に記載の知識情報処理装置において、
上記関連情報記憶手段は、
タンパク質情報を記憶するタンパク質情報記憶手段、
遺伝子情報を記憶する遺伝子情報記憶手段、
生体分子の分子間相互作用に関する分子間相互作用情報を記憶する分子間相互作用情報記憶手段、
生体分子のパスウェイに関するパスウェイ情報を記憶するパスウェイ情報記憶手段、
文献に関する文献情報を記憶する文献情報記憶手段、および/または、
ニュース配信サービスが提供するニュースを記憶するニュース記憶手段、
を備えたことを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 2,
The related information storage means is
Protein information storage means for storing protein information;
Genetic information storage means for storing genetic information;
Intermolecular interaction information storage means for storing intermolecular interaction information relating to intermolecular interactions of biomolecules,
Pathway information storage means for storing pathway information on pathways of biomolecules;
Document information storage means for storing document information related to documents, and / or
News storage means for storing news provided by the news distribution service;
A knowledge information processing apparatus characterized by comprising:
請求項1乃至3のいずれか一つに記載の知識情報処理装置において、
上記制御部は、
上記任意の単語に対応する上記ノードが上記知識オブジェクトネットワークに含まれていない場合、上記任意の単語に表現された上記知識を示す上記ノードに関する上記ノード情報を上記知識ベースに格納し、当該ノードとの間に相互背反を締める上記アークを設定し、上記アークに関する上記アーク情報を上記知識ベースに格納し、上記任意の単語に対応する上記ノードが上記知識オブジェクトネットワークに含まれている場合、上記任意の単語に対する上記識別情報を当該ノードに関する上記ノード情報に対応付けて上記知識ベースに格納する格納手段、
を更に備えたことを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to any one of claims 1 to 3,
The control unit
When the node corresponding to the arbitrary word is not included in the knowledge object network, the node information related to the node indicating the knowledge expressed in the arbitrary word is stored in the knowledge base, and If the arc that closes each other is set, the arc information about the arc is stored in the knowledge base, and the node corresponding to the arbitrary word is included in the knowledge object network, the arbitrary Storage means for storing the identification information for the word in the knowledge base in association with the node information related to the node;
A knowledge information processing apparatus characterized by further comprising:
請求項4に記載の知識情報処理装置において、
上記知識情報処理装置は、
入力部、
を更に備え、
上記格納手段は、
更に、上記格納された上記ノードとの間に上記相互背反を締める上記アークが設定された場合、当該相互背反であるか否かの評価を要求する当該上記アークに関する上記アーク情報を上記出力部を介して出力させ、上記入力部を介して上記相互背反であるとの評価が入力された場合、当該アーク情報を上記知識ベースに格納することを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 4,
The knowledge information processing apparatus
Input section,
Further comprising
The storage means is
Furthermore, when the arc that tightens the mutual contradiction between the stored node and the stored node is set, the output unit displays the arc information related to the arc that requests an evaluation as to whether or not it is the mutual contradiction. The information processing apparatus stores the arc information in the knowledge base when the evaluation of being mutually contradictory is input via the input unit.
請求項1乃至3のいずれか一つに記載の知識情報処理装置において、
上記制御部は、
上記文で構成される任意の文章に対する構造解析を行い、当該文章を構成する上記単語、上記句、上記文または上記文の一群を抽出する構造解析手段と、
上記構造解析手段により抽出された上記単語、上記句、上記文または上記文の一群に対応する上記ノードが上記知識オブジェクトネットワークに含まれていない場合、上記単語、上記句、上記文または上記文の一群に表現された上記知識を示す上記ノードに関する上記ノード情報を上記知識ベースに格納し、上記ノードとの間に相互背反を締める上記アークを設定し、上記アークに関する上記アーク情報を上記知識ベースに格納し、上記単語、上記句、上記文または上記文の一群に対応する上記ノードが上記知識オブジェクトネットワークに含まれている場合、上記単語、上記句、上記文または上記文の一群に対する上記識別情報を当該ノードに関する上記ノード情報に対応付けて上記知識ベースに格納する格納手段と、
を更に備えたことを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to any one of claims 1 to 3,
The control unit
A structural analysis unit that performs structural analysis on an arbitrary sentence composed of the sentence, and extracts the word, the phrase, the sentence, or the group of sentences that constitute the sentence;
If the knowledge object network does not include the node corresponding to the word, the phrase, the sentence, or the group of sentences extracted by the structural analysis means, the word, the phrase, the sentence, or the sentence The node information related to the node representing the knowledge expressed in a group is stored in the knowledge base, the arc for tightening a contradiction with the node is set, and the arc information related to the arc is stored in the knowledge base. The identification information for the word, the phrase, the sentence, or the group of sentences if the knowledge object network stores and the node corresponding to the word, the phrase, the sentence, or the group of sentences is included in the knowledge object network. Storing means in the knowledge base in association with the node information related to the node;
A knowledge information processing apparatus characterized by further comprising:
請求項6に記載の知識情報処理装置において、
上記文章は、
生命科学の学術論文であることを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 6,
The above sentence
Knowledge information processing device characterized by being an academic paper of life science.
請求項4乃至7のいずれか一つに記載の知識情報処理装置において、
上記制御部は、
上記単語、上記句、上記文または上記文の一群と句構造テンプレートとのマッチングを行うことにより上記知識を抽出する知識抽出手段、
を更に備え、
上記格納手段は、
上記知識抽出手段により抽出された上記知識に関する知識情報を含む、上記マッチングされた上記単語、上記句、上記文または上記文の一群に対応する上記ノード情報を上記知識ベースに格納することを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to any one of claims 4 to 7,
The control unit
Knowledge extracting means for extracting the knowledge by matching the word, the phrase, the sentence or a group of the sentence with a phrase structure template;
Further comprising
The storage means is
Storing the node information corresponding to the matched word, the phrase, the sentence, or the group of sentences, including knowledge information related to the knowledge extracted by the knowledge extracting means, in the knowledge base. Knowledge information processing device.
請求項8に記載の知識情報処理装置において、
上記知識抽出手段は、
上記単語、上記句、上記文または上記文の一群に対してプリプロセッシングを行い、明らかに除外できる挿入句などを取り除いた後、上記単語、上記句、上記文または上記文の一群と上記句構造テンプレートとのマッチングを行うことにより上記知識を抽出することを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 8,
The knowledge extraction means is:
Preprocessing the word, the phrase, the sentence, or the group of sentences, and removing the inserted phrase that can be clearly excluded, then the word, the phrase, the sentence, or the group of sentences and the phrase structure A knowledge information processing apparatus characterized by extracting the knowledge by matching with a template.
請求項4乃至7のいずれか一つに記載の知識情報処理装置において、
上記制御部は、
上記単語、上記句、上記文または上記文の一群に対して構文解析を利用してマッチングを行うことにより上記知識を抽出する知識抽出手段、
を更に備え、
上記格納手段は、
上記知識抽出手段により抽出された上記知識に関する知識情報を含む、上記マッチングされた上記単語、上記句、上記文または上記文の一群に対応する上記ノード情報を上記知識ベースに格納することを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to any one of claims 4 to 7,
The control unit
Knowledge extracting means for extracting the knowledge by performing syntactic analysis on the word, the phrase, the sentence, or the group of sentences,
Further comprising
The storage means is
Storing the node information corresponding to the matched word, the phrase, the sentence, or the group of sentences, including knowledge information related to the knowledge extracted by the knowledge extracting means, in the knowledge base. Knowledge information processing device.
請求項1乃至4のいずれか一つに記載の知識情報処理装置において、
上記知識情報処理装置は、
入力部、
を更に備え、
上記特定情報取得手段は、
上記入力部を介して上記任意の単語が指定された場合、上記任意の単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む上記特定情報を取得することを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to any one of claims 1 to 4,
The knowledge information processing apparatus
Input section,
Further comprising
The specific information acquisition means includes
When the arbitrary word is designated via the input unit, the node constituting the knowledge object network corresponding to the arbitrary word is specified, and the node information and / or the arc information regarding the node is determined. A knowledge information processing apparatus characterized in that the specific information is acquired.
請求項2または3に記載の知識情報処理装置において、
上記知識情報処理装置は、
入力部、
を更に備え、
上記特定情報出力手段は、
上記特定情報および/または上記関連情報に基づく項目を上記出力部を介してリスト形式で選択可能に出力させ、上記入力部を介して上記項目が選択された場合、当該選択された上記項目に関する上記特定情報および/または上記関連情報を上記出力部を介して出力させることを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 2 or 3,
The knowledge information processing apparatus
Input section,
Further comprising
The specific information output means includes
When the item based on the specific information and / or the related information is output to be selectable in a list format via the output unit, and the item is selected via the input unit, the item related to the selected item is selected. A knowledge information processing apparatus that outputs specific information and / or the related information via the output unit.
請求項2または3に記載の知識情報処理装置において、
上記知識情報処理装置は、
入力部、
を更に備え、
上記特定情報出力手段は、
上記特定情報および/または上記関連情報に基づく項目を上記出力部を介してネットワーク形式で選択可能に出力させ、上記入力部を介して上記項目が選択された場合、当該選択された上記項目に関する上記特定情報および/または上記関連情報を上記出力部を介して出力させることを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 2 or 3,
The knowledge information processing apparatus
Input section,
Further comprising
The specific information output means includes
When the item based on the specific information and / or the related information is output to be selectable in a network format via the output unit, and the item is selected via the input unit, the item related to the selected item is selected. A knowledge information processing apparatus that outputs specific information and / or the related information via the output unit.
請求項2または3に記載の知識情報処理装置において、
上記特定情報取得手段は、
任意の図に含まれる上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む上記特定情報を取得し、上記ノードの上記関連情報を上記関連情報記憶手段から検索し、当該検索された上記関連情報を取得することを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to claim 2 or 3,
The specific information acquisition means includes
The node constituting the knowledge object network corresponding to the word included in an arbitrary figure is identified, the node information related to the node and / or the arc information is acquired, and the identification information including the node information is acquired. A knowledge information processing apparatus, wherein related information is searched from the related information storage means and the searched related information is acquired.
請求項1乃至14のいずれか一つに記載の知識情報処理装置において、
上記知識オブジェクトネットワークを構成する上記ノードは、
各ステートメントオブジェクトネットワークにおいて一様の抽象度レベルに対応する上記ノードを投射したもの、または、上記各ステートメントオブジェクトネットワークの個別領域において各々設定された上記抽象度レベルに対応する上記ノードを投射したものであることを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to any one of claims 1 to 14,
The nodes constituting the knowledge object network are:
Projecting the node corresponding to a uniform abstraction level in each statement object network, or projecting the node corresponding to the abstraction level set in each individual area of each statement object network A knowledge information processing apparatus characterized by being.
請求項1乃至15のいずれか一つに記載の知識情報処理装置において、
上記知識オブジェクトネットワーク情報を構成する上記ノード情報は、
実験データの解析結果または推定結果であることを特徴とする知識情報処理装置。
The knowledge information processing apparatus according to any one of claims 1 to 15,
The node information constituting the knowledge object network information is:
A knowledge information processing apparatus characterized by being an analysis result or an estimation result of experimental data.
出力部と制御部と記憶部とを少なくとも備えた知識情報処理装置において実行される知識情報処理方法であって、
上記記憶部は、
自然言語により記述される単語、句、文または文の一群に対する固有の識別情報を対応付けた、上記単語、上記句、上記文または上記文の一群に表現された知識を示すノードに関するノード情報と、上記ノードの性質および/または上記ノード間の関連性を示すアークに関するアーク情報と、を含む、上記単語、上記句、上記文または上記文の一群と上記知識とが明確な対応関係をもって表現された、知識オブジェクトネットワークに関する知識オブジェクトネットワーク情報を記憶する知識ベース、
を備え、
上記制御部において実行される、
任意の上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む特定情報を取得する特定情報取得ステップと、
上記特定情報を上記出力部を介して出力させる特定情報出力ステップと、
を含むことを特徴とする知識情報処理方法。
A knowledge information processing method executed in a knowledge information processing apparatus including at least an output unit, a control unit, and a storage unit,
The storage unit
Node information relating to a node representing knowledge expressed in the word, the phrase, the sentence, or the group of sentences, and associated with unique identification information for the word, phrase, sentence, or group of sentences described in a natural language; The word, the phrase, the sentence, or the group of sentences and the knowledge are expressed with a clear correspondence relationship, including arc information about arcs indicating the nature of the nodes and / or the relationships between the nodes. A knowledge base for storing knowledge object network information related to the knowledge object network,
With
Executed in the control unit,
A specific information acquisition step of specifying the node constituting the knowledge object network corresponding to an arbitrary word and acquiring specific information including the node information and / or the arc information related to the node;
A specific information output step for outputting the specific information via the output unit;
A knowledge information processing method comprising:
出力部と制御部と記憶部とを少なくとも備えた知識情報処理装置に実行させるためのプログラムであって、
上記記憶部は、
自然言語により記述される単語、句、文または文の一群に対する固有の識別情報を対応付けた、上記単語、上記句、上記文または上記文の一群に表現された知識を示すノードに関するノード情報と、上記ノードの性質および/または上記ノード間の関連性を示すアークに関するアーク情報と、を含む、上記単語、上記句、上記文または上記文の一群と上記知識とが明確な対応関係をもって表現された、知識オブジェクトネットワークに関する知識オブジェクトネットワーク情報を記憶する知識ベース、
を備え、
上記制御部において、
任意の上記単語に対応する、上記知識オブジェクトネットワークを構成する上記ノードを特定し、当該ノードに関する上記ノード情報および/または上記アーク情報を含む特定情報を取得する特定情報取得ステップと、
上記特定情報を上記出力部を介して出力させる特定情報出力ステップと、
を実行させるためのプログラム。
A program for causing a knowledge information processing apparatus including at least an output unit, a control unit, and a storage unit to execute,
The storage unit
Node information relating to a node representing knowledge expressed in the word, the phrase, the sentence, or the group of sentences, and associated with unique identification information for the word, phrase, sentence, or group of sentences described in a natural language; The word, the phrase, the sentence, or the group of sentences and the knowledge are expressed with a clear correspondence relationship, including arc information about arcs indicating the nature of the nodes and / or the relationships between the nodes. A knowledge base for storing knowledge object network information related to the knowledge object network,
With
In the control unit,
A specific information acquisition step of specifying the node constituting the knowledge object network corresponding to an arbitrary word and acquiring specific information including the node information and / or the arc information related to the node;
A specific information output step for outputting the specific information via the output unit;
A program for running
JP2013239127A 2013-11-19 2013-11-19 Knowledge information processing apparatus, knowledge information processing method, and program Active JP6026389B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013239127A JP6026389B2 (en) 2013-11-19 2013-11-19 Knowledge information processing apparatus, knowledge information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013239127A JP6026389B2 (en) 2013-11-19 2013-11-19 Knowledge information processing apparatus, knowledge information processing method, and program

Publications (2)

Publication Number Publication Date
JP2015099497A true JP2015099497A (en) 2015-05-28
JP6026389B2 JP6026389B2 (en) 2016-11-16

Family

ID=53376070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013239127A Active JP6026389B2 (en) 2013-11-19 2013-11-19 Knowledge information processing apparatus, knowledge information processing method, and program

Country Status (1)

Country Link
JP (1) JP6026389B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019109788A (en) * 2017-12-19 2019-07-04 ヤフー株式会社 Provision device, provision method, and provision program
JP2020035172A (en) * 2018-08-30 2020-03-05 富士通株式会社 Generation method, generation program, and generation device
JP2020187647A (en) * 2019-05-16 2020-11-19 富士通株式会社 Search method, search program, and information processing system
WO2023022127A1 (en) * 2021-08-18 2023-02-23 国立大学法人 東京大学 Information processing system, information processing method, and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221430A (en) * 1995-02-09 1996-08-30 Nec Corp Related information retrieving device
JP2003228580A (en) * 2002-02-04 2003-08-15 Celestar Lexico-Sciences Inc Controller and method for controlling document knowledge, program, and recording medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221430A (en) * 1995-02-09 1996-08-30 Nec Corp Related information retrieving device
JP2003228580A (en) * 2002-02-04 2003-08-15 Celestar Lexico-Sciences Inc Controller and method for controlling document knowledge, program, and recording medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019109788A (en) * 2017-12-19 2019-07-04 ヤフー株式会社 Provision device, provision method, and provision program
JP2020035172A (en) * 2018-08-30 2020-03-05 富士通株式会社 Generation method, generation program, and generation device
JP7081396B2 (en) 2018-08-30 2022-06-07 富士通株式会社 Generation method, generation program, and generation device
JP2020187647A (en) * 2019-05-16 2020-11-19 富士通株式会社 Search method, search program, and information processing system
JP7322500B2 (en) 2019-05-16 2023-08-08 富士通株式会社 SEARCH METHOD, SEARCH PROGRAM, AND INFORMATION PROCESSING DEVICE
WO2023022127A1 (en) * 2021-08-18 2023-02-23 国立大学法人 東京大学 Information processing system, information processing method, and program

Also Published As

Publication number Publication date
JP6026389B2 (en) 2016-11-16

Similar Documents

Publication Publication Date Title
Clarke et al. Appyters: Turning Jupyter Notebooks into data-driven web apps
Rohn et al. VANTED v2: a framework for systems biology applications
US20200192727A1 (en) Intent-Based Organisation Of APIs
Maier et al. Knowledge management for systems biology a general and visually driven framework applied to translational medicine
Qiao et al. CoCiter: an efficient tool to infer gene function by assessing the significance of literature co-citation
CN116244418B (en) Question answering method, device, electronic equipment and computer readable storage medium
Baroukh et al. Genes2WordCloud: a quick way to identify biological themes from gene lists and free text
JP6026389B2 (en) Knowledge information processing apparatus, knowledge information processing method, and program
Calderone et al. Using the MINT database to search protein interactions
Lo Surdo et al. SIGNOR: a database of causal relationships between biological entities—a short guide to searching and browsing
Castillo-Lara et al. PlanNET: homology-based predicted interactome for multiple planarian transcriptomes
Musa et al. L1000 viewer: a search engine and web interface for the LINCS data repository
McDougal et al. ModelView for ModelDB: online presentation of model structure
Pérez-Rodríguez et al. Online visibility of software-related web sites: the case of biomedical text mining tools
Anguita et al. NCBI2RDF: enabling full RDF-based access to NCBI databases
Mazandu et al. IHP-PING—generating integrated human protein–protein interaction networks on-the-fly
Woźniak et al. MODEVO: exploring modularity and evolution of protein interaction networks
Perlasca et al. UNIPred-Web: a web tool for the integration and visualization of biomolecular networks for protein function prediction
Reder et al. Supervised topic modeling for predicting molecular substructure from mass spectrometry
Hahn et al. What’s hot and what’s not?-exploring trends in bioinformatics literature using topic modeling and keyword analysis
Feng et al. E-TSN: an interactive visual exploration platform for target–disease knowledge mapping from literature
Roy et al. Navigating the functional landscape of transcription factors via non-negative tensor factorization analysis of MeDline abstracts
Diaz-Montana et al. Development and use of the Cytoscape app GFD-Net for measuring semantic dissimilarity of gene networks
Cai et al. SynBioTools: a one-stop facility for searching and selecting synthetic biology tools
Sun et al. MPTM: a tool for mining protein post-translational modifications from literature

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150820

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161012

R150 Certificate of patent or registration of utility model

Ref document number: 6026389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250