JP2007140861A - Information processing system, information processing method, and program - Google Patents
Information processing system, information processing method, and program Download PDFInfo
- Publication number
- JP2007140861A JP2007140861A JP2005333193A JP2005333193A JP2007140861A JP 2007140861 A JP2007140861 A JP 2007140861A JP 2005333193 A JP2005333193 A JP 2005333193A JP 2005333193 A JP2005333193 A JP 2005333193A JP 2007140861 A JP2007140861 A JP 2007140861A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- information processing
- group
- processing system
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Description
本発明は、情報処理技術に関する。 The present invention relates to information processing technology.
文章から形態素分析によって単語を抽出し、単語を分類する技術が知られている。このような技術としては、例えば、医療関係の情報について、過去に作成された所見文を解析して部位に相当する語を抽出する技術が提案されている(例えば、特許文献1)。 A technique for extracting words from sentences by morphological analysis and classifying the words is known. As such a technique, for example, with respect to medical information, a technique for analyzing a finding sentence created in the past and extracting a word corresponding to a part has been proposed (for example, Patent Document 1).
しかしながら、上記特許文献1の技術では、所定のカテゴリーに属する用語を抽出するのに、当該用語が所定のカテゴリーに属するか否かを1回の判定で決定するため、異なる意味を複数有する用語については、判定に誤りが生じてしまう。
However, in the technique of the above-mentioned
例えば、「右側頭葉の橋に腫瘍が見られる」という文において、部位に関する部分は「右側頭葉の橋」であり、更に細分化すると、「側頭葉」は部位を示す大分類、「右」は大分類の接頭辞、「橋」は部位を示す小分類に属する。そして、このような文から直接「橋」という語を抽出しようとすると、単純にリストを参照するだけでは、一般的な意味での「橋」も抽出してしまうといった誤りが生じる。 For example, in the sentence “A tumor is found in the right temporal lobe bridge”, the part related to the region is “the right temporal lobe bridge”, and further subdivided, the “temporal lobe” is a large classification indicating the region, “ “Right” is a major classification prefix, and “Bridge” is a minor classification indicating a site. Then, when trying to extract the word “bridge” directly from such a sentence, simply referring to the list causes an error that “bridge” in a general sense is also extracted.
本発明は、上記課題に鑑みてなされたものであり、所定のカテゴリーに属する要素を的確に抽出することができる技術を提供することを目的とする。 The present invention has been made in view of the above problems, and an object thereof is to provide a technique capable of accurately extracting elements belonging to a predetermined category.
上記の課題を解決するために、請求項1の発明は、情報処理システムであって、所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを記憶する分類用情報記憶手段と、文章情報の入力を受け付ける受付手段と、前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するフレーズ抽出手段と、前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出する要素抽出手段とを備えることを特徴とする。
In order to solve the above-mentioned problem, the invention of
また、請求項2の発明は、請求項1に記載の情報処理システムであって、前記フレーズ情報が、学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする。
The invention according to
また、請求項3の発明は、請求項2に記載の情報処理システムであって、前記複数種類の分類項目が、相対的に広い概念を示す用語が属する大分類と、相対的に狭い概念を示す用語が属する小分類と、接頭辞と、接尾辞と、を含むことを特徴とする。
The invention according to claim 3 is the information processing system according to
また、請求項4の発明は、請求項3に記載の情報処理システムであって、前記要素抽出手段が、前記接頭辞及び接尾辞に属するフレーズ構成要素については、前記文章中フレーズにおける前記大分類及び前記小分類に属する用語との位置関係に従って、前記大分類に属する用語に付された接頭辞であるのか、前記大分類に属する用語に付された接尾辞であるのか、前記小分類に属する用語に付された接頭辞であるのか、前記小分類に属する用語に付された接尾辞であるのかを分類しつつ抽出することを特徴とする。
The invention according to
また、請求項5の発明は、請求項3または請求項4に記載の情報処理システムであって、前記要素分類情報が、前記接頭辞及び接尾辞にそれぞれ属するフレーズ構成要素をリスト形式で示した情報を含むことを特徴とする。
The invention according to
また、請求項6の発明は、請求項1から請求項5のいずれかに記載の情報処理システムであって、前記要素分類情報が、学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする。
The invention according to
また、請求項7の発明は、請求項2から請求項5のいずれかに記載の情報処理システムであって、前記要素分類情報が、前記学習用例コーパスを用いた機械学習で得られた特定フレーズを示す情報を、更に学習用例コーパスとして用いた機械学習によって得られた情報を含むことを特徴とする。
The invention according to claim 7 is the information processing system according to any one of
また、請求項8の発明は、請求項1から請求項7のいずれかに記載の情報処理システムであって、前記要素抽出手段によって前記文章中フレーズから抽出された複数のフレーズ構成要素からなるフレーズ構成要素群について、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて所定のデータベースに記憶する記憶制御手段を更に備えることを特徴とする。
The invention according to
また、請求項9の発明は、請求項8に記載の情報処理システムであって、同義語群に対して代表語を関連付けた同義語データ、および類義語群に対して代表語を関連付けた類義語データのうちの少なくとも一方を含む辞書データを記憶する辞書データ記憶手段と、前記フレーズ構成要素群から前記同義語群および前記類義語群のうちの少なくとも一方に属する語群所属語を検出する所属語検出手段と、前記辞書データに基づいて、前記フレーズ構成要素群のうちの前記語群所属語を、当該語群所属語に対応する代表語に置換して置換後フレーズ構成要素群を生成する置換生成手段とを更に備え、前記記憶制御手段が、前記フレーズ構成要素群の代わりに前記置換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする。
The invention according to
また、請求項10の発明は、請求項9に記載の情報処理システムであって、ユーザーによる操作に応答して、前記同義語群に対する代表語を当該同義語群に含まれる複数語から指定する第1の代表語指定、および前記類義語群に対する代表語を当該類義語群に含まれる複数語から指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段を更に備えることを特徴とする。
The invention according to claim 10 is the information processing system according to
また、請求項11の発明は、請求項9に記載の情報処理システムであって、前記受付手段によって受け付けられる複数の文章情報を対象として、前記辞書データに属する各語群所属語の出現回数を計算する出現回数算出手段と、前記出現回数算出手段によって計算された出現回数に基づいて、前記同義語群に含まれる複数語のうち最も出現回数が多い語を当該同義語群に対する代表語として指定する第1の代表語指定、および前記類義語群に含まれる複数語のうち最も出現回数が多い語を当該類義語群に対する代表語として指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段とを更に備えることを特徴とする。
The invention according to
また、請求項12の発明は、請求項8から請求項11のいずれかに記載の情報処理システムであって、類似語群を示す類似語用例データを記憶する類似語記憶手段と、前記類似語用例データに基づいて、前記フレーズ構成要素群から前記類似語群を構成する類似語群構成語を検出する構成語検出手段と、前記フレーズ構成要素群のうちの前記類似語群構成語を、前記類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換して変換後フレーズ構成要素群を生成する変換生成手段とを更に備え、前記記憶制御手段が、前記フレーズ構成要素群とは別に前記変換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする。
The invention according to
また、請求項13の発明は、請求項8から請求項12のいずれかに記載の情報処理システムであって、前記所定のデータベースに基づいて、前記所定のデータベースに含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて当該各フレーズ構成要素どうしを連結して表示する表示手段を更に備えることを特徴とする。
The invention according to
また、請求項14の発明は、請求項13に記載の情報処理システムであって、前記所定のデータベースにおける各フレーズ構成要素間の関連付けの頻度を計算する関連頻度算出手段と、前記関連付けの頻度に基づいて、前記可視的な連結要素の態様を変更する要素変更手段とを更に備えることを特徴とする。
The invention according to
また、請求項15の発明は、請求項14に記載の情報処理システムであって、前記関連頻度算出手段が、前記要素抽出手段によって抽出された前記フレーズ構成要素群に従って、前記関連付けの頻度を計算することを特徴とする。
The invention according to
また、請求項16の発明は、請求項13から請求項15のいずれかに記載の情報処理システムであって、新規フレーズを入力する際に、前記所定のデータベースに基づき前記表示手段に複数要素が表示された画面上で、ユーザーの操作に応答して前記複数種類の分類項目のうちの少なくとも1つの項目に属する要素を前記新規フレーズを構成する要素として指示する要素指示手段を更に備えることを特徴とする。
The invention according to
また、請求項17の発明は、請求項8から請求項16のいずれかに記載の情報処理システムであって、ユーザーによる操作に応答して、新規なフレーズ構成要素群を示す手動追加データを入力する入力手段を更に備え、前記記憶制御手段が、前記手動追加データによって示されるフレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて所定のデータベースに記憶することを特徴とする。
The invention according to
また、請求項18の発明は、情報処理システムに含まれるコンピュータによって実行されることにより、前記情報処理システムを、請求項1から請求項17のいずれかに記載の情報処理システムとして機能させるプログラムである。
The invention according to claim 18 is a program for causing the information processing system to function as the information processing system according to any one of
また、請求項19の発明は、情報処理方法であって、(a)所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを準備するステップと、(b)文章情報の入力を受け付けるステップと、(c)前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するステップと、(d)前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出するステップとを備えることを特徴とする。 The invention according to claim 19 is an information processing method, comprising: (a) phrase information indicating a specific phrase including a plurality of language elements including one or more language elements belonging to a predetermined category, and a plurality of languages Preparing element classification information in which elements are classified into a plurality of types of classification items; (b) accepting input of sentence information; and (c) based on the phrase information, from the sentence information to the specific phrase. Extracting a corresponding phrase in the sentence; and (d) extracting each phrase component included in the phrase in the sentence while classifying it into the plurality of types of classification items based on the element classification information. It is characterized by that.
請求項1に記載の発明によれば、入力される文章から所定のカテゴリーに属する特定フレーズに対応するフレーズを抽出して、当該フレーズに含まれる各フレーズ構成要素を複数種類の分類項目に分類しつつ抽出するような構成を採用することで、2段階の抽出によって、的確に所定のカテゴリーに属する要素を抽出することができる。 According to the first aspect of the present invention, a phrase corresponding to a specific phrase belonging to a predetermined category is extracted from an input sentence, and each phrase component included in the phrase is classified into a plurality of types of classification items. By adopting a configuration in which extraction is performed, elements belonging to a predetermined category can be accurately extracted by two-stage extraction.
請求項2に記載の発明によれば、特定フレーズを学習用例コーパスを用いた機械学習で得るため、入力される文章から抽出するフレーズの種類を適正かつ効率的に増やすことができる。
According to the invention described in
請求項3に記載の発明によれば、各フレーズ構成要素を、相対的に広い概念を示す用語が属する大分類と、相対的に狭い概念を示す用語が属する小分類と、接頭辞と、接尾辞とを含む複数種類の分類項目に分類しつつ抽出するため、各要素を細かく分類して抽出することができる。 According to the invention of claim 3, each phrase component is divided into a major classification to which a term indicating a relatively broad concept belongs, a minor classification to which a term representing a relatively narrow concept belongs, a prefix, and a suffix. Since extraction is performed while classifying into a plurality of types of classification items including words, each element can be classified and extracted finely.
請求項4に記載の発明によれば、接頭辞及び接尾辞に属するフレーズ構成要素については、フレーズにおける大分類及び小分類に属する用語との位置関係によって、大分類及び小分類の何れに属する用語に付された接頭辞又は接尾辞であるのかを分類しつつ抽出するため、各フレーズ構成要素をフレーズの構成に従って分類して抽出することができる。
According to invention of
請求項5に記載の発明によれば、接頭辞及び接尾辞に属する語を示したリストに従って、フレーズに含まれる接頭辞及び接尾辞にそれぞれ属するフレーズ構成要素を抽出するため、的確な接頭辞及び接尾辞の抽出を容易に実施することができる。
According to the invention described in
請求項6に記載の発明によれば、学習用例コーパスを用いた機械学習により、フレーズに属する各フレーズ構成要素を分類するためのデータを取得するような構成により、フレーズから抽出する要素の種類を適正かつ効率的に増やすことができる。
According to the invention described in
請求項7に記載の発明によれば、学習用例コーパスを用いた機械学習で特定フレーズを示すデータを取得するとともに、当該特定フレーズを学習用例コーパスとして用いた機械学習により各フレーズ構成要素を分類するためのデータを取得するため、フレーズから抽出する要素の種類を的確に増やすことができる。 According to the seventh aspect of the present invention, data indicating a specific phrase is acquired by machine learning using the learning example corpus, and each phrase component is classified by machine learning using the specific phrase as the learning example corpus. In order to acquire the data for this, the kind of element extracted from a phrase can be increased exactly.
請求項8に記載の発明によれば、フレーズから抽出されたフレーズ構成要素群について、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けてデータベースに記憶するため、所定のカテゴリーに属する要素に関するフレーズの構成を示した情報をデータベース化することができる。
According to the invention described in
請求項9に記載の発明によれば、同義語群に対して代表語を関連付けた同義語データ、および類義語群に対して代表語を関連付けた類義語データのうちの少なくとも一方を含む辞書データを準備しておき、当該辞書データを参照することでフレーズ構成要素群のうち辞書データに含まれる語群所属語が抽出された場合、当該語群素属語を対応する代表語に置き換えたフレーズ構成要素群に係る関連付け情報をデータベースに記憶するため、所定のカテゴリーに属する要素に関するフレーズの構成を示した情報を表現が統一された状態でデータベース化することができる。 According to the ninth aspect of the present invention, dictionary data including at least one of synonym data in which a representative word is associated with a synonym group and synonym data in which a representative word is associated with a synonym group is prepared. When a word group belonging word included in the dictionary data is extracted from the phrase component group by referring to the dictionary data, the phrase component element in which the word group elementary word is replaced with the corresponding representative word Since the association information related to the group is stored in the database, the information indicating the configuration of the phrase relating to the element belonging to the predetermined category can be made into a database in a state where the expressions are unified.
請求項10に記載の発明によれば、ユーザーが、同義語群や類義語群に対する代表語を、当該同義語群や類義語群自体にそれぞれ属する複数語から指定することができるため、ユーザーの癖等を反映したカスタマイズが可能となる。 According to the invention described in claim 10, since the user can specify a representative word for the synonym group or the synonym group from a plurality of words belonging to the synonym group or the synonym group itself, Customization that reflects can be made possible.
請求項11に記載の発明によれば、同義語群や類義語群に対する代表語を、当該同義語群や類義語群自体にそれぞれ属する複数語のうちの出現回数の最も多い語とするため、使用実態に沿って各要素を細かく分類することができる。
According to the invention described in
請求項12に記載の発明によれば、類似語群を示す類似語用例データを準備しておき、当該類似語用例データに基づいて、フレーズ構成要素群から類似語群を構成する類似語群構成語を検出した場合には、フレーズ構成要素群のうちの類似語群構成語を、類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換して変換後フレーズ構成要素群を生成し、当該変換後フレーズ構成要素群に係る関連付け情報をデータベースに記憶するため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をより充実化させることができる。 According to the twelfth aspect of the present invention, the similar word group configuration that prepares the similar word example data indicating the similar word group and configures the similar word group from the phrase component group based on the similar word example data. When a word is detected, the similar word group constituent word in the phrase constituent group is converted into another similar word group constituent word different from the similar word group constituent word constituting the similar word group, and then converted. Since the phrase component group is generated and the association information related to the converted phrase component group is stored in the database, the information indicating the phrase configuration related to the element belonging to the predetermined category can be further enriched.
請求項13に記載の発明によれば、所定のデータベースに基づいて、所定のデータベースに含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて表示するような構成とすることで、所定のカテゴリーに属する要素に関するフレーズの構成を一目で把握することができる。
According to the invention of
請求項14に記載の発明によれば、所定のデータベースにおける関連付けの頻度を計算しておき、当該関連付けの頻度に基づいて、各フレーズ構成要素を連結する可視的な連結要素の態様を変更するような構成により、関連付けが強いものについては、一目で他の関連付けとは区別して把握することができる。 According to the fourteenth aspect of the present invention, the association frequency in the predetermined database is calculated, and based on the association frequency, the aspect of the visual coupling element that links the phrase components is changed. With a simple configuration, a strong association can be grasped at a glance from other associations.
請求項15に記載の発明によれば、文章中のフレーズから抽出されたフレーズ構成要素群に従って、関連付けの頻度を計算するような構成により、使用実態を正確に反映した表示態様となるため、実際に頻繁に使用されるフレーズの構成を把握し易くなる。
According to the invention described in
請求項16に記載の発明によれば、新規フレーズを入力する際に、所定のデータベースに基づいて表示される画面上で、ユーザーの操作に応答して複数種類の分類項目のうちの少なくとも1つの項目に属するフレーズ構成要素を新規フレーズを構成するフレーズ構成要素として指示することができるような構成とすることで、過去の知識を利用することで新規フレーズの入力操作を簡略化することができる。
According to the invention described in
請求項17に記載の発明によれば、ユーザーが新規なフレーズ構成要素群を示す追加データを入力すると、当該追加データによって示されるフレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けてデータベースに記憶するため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をユーザーが適宜充実化させることができる。
According to the invention described in
請求項18に記載の発明によれば、請求項1から請求項17のいずれかに記載の発明と同様な効果を奏する。
According to the invention of claim 18, the same effect as that of any of
請求項19に記載の発明によれば、請求項1に記載の発明と同様な効果を奏する。 According to the nineteenth aspect, the same effect as the first aspect can be obtained.
以下、本発明の実施形態を図面に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
<情報処理システムの構成>
図1は、本発明の実施形態に係る情報処理システム1の外観構成を例示する図である。情報処理システム1は、パーソナルコンピュータ(パソコン)において所定のプログラムが実行されることで実現される。図2は、情報処理システム1の機能構成を示すブロック図を示している。なお、本実施形態では、一例として、情報処理システム1が、病院において読影レポートの所見文を対象とした情報処理を行うものとして説明する。
<Configuration of information processing system>
FIG. 1 is a diagram illustrating an external configuration of an
図1に示すように、情報処理システム1は、箱状の形状を有する処理部11と、操作部12と、表示部13とを有している。
As illustrated in FIG. 1, the
処理部11の前面には、光ディスク91を挿入するドライブ101と、メモリカード92を挿入するドライブ102とが設けられている。
A
また、操作部12は、マウス121とキーボード122とを有しており、ユーザーから処理部11に対する入力操作を受付ける。
The
表示部13は、例えばCRTで構成され、表示手段として機能する。
The
また、図2に示すように、情報処理システム1の処理部11は、上記の操作部12および表示部13に接続する入出力I/F14と、入出力I/F14に電気的に接続する制御部15とを備えている。また、処理部11は、制御部15に電気的に接続する記憶部16と、入出力I/F17とを備えている。
As shown in FIG. 2, the
入出力I/F14は、操作部12および表示部13と制御部15との間でデータの送受信をコントロールするためのインターフェースである。
The input / output I /
記憶部16は、例えばハードディスクなどを備えて構成されており、プログラム161、分類用情報162、辞書データベース(辞書DB)163、使用頻度データ164、及び関連付けデータベース(関連付けDB)165を記憶している。
The
プログラム161は、後述する言語処理等を含む情報処理を実行するためのプログラム(情報処理用プログラム)である。
The
分類用情報162は、例えば、医療分野の所見文に含まれる特定部位を示すフレーズ(以下「特定部位フレーズ」とも称する)に係る情報(特定部位フレーズ情報)と、当該特定部位フレーズを構成する構成要素(ここでは、多数の構成語)について複数種類の分類項目にそれぞれ属する要素(ここでは、語)を示す情報(以下「要素分類情報」とも称する)とを含む。
The
ここで、特定部位フレーズは、所定のカテゴリー(ここでは、解剖学的知識)に属する1以上の要素(ここでは、用語)を含む複数語を構成要素とするものであり、特定部位フレーズ情報は、文章データから特定部位フレーズに対応するフレーズを抽出するモデルである。なお、本明細書では、「特定部位フレーズ」は、所定のカテゴリーに属する特定要素を含むフレーズであり、適宜「特定フレーズ」とも称する。 Here, the specific part phrase is composed of a plurality of words including one or more elements (here, terms) belonging to a predetermined category (here, anatomical knowledge), and the specific part phrase information is This is a model for extracting a phrase corresponding to a specific part phrase from sentence data. In the present specification, the “specific part phrase” is a phrase including a specific element belonging to a predetermined category, and is also referred to as a “specific phrase” as appropriate.
また、要素分類情報は、抽出されたフレーズから複数要素(ここでは、複数語)を認識して複数種類の分類項目に分類するモデルである。複数種類の分類項目としては、部位を示す比較的広い概念を示す用語が属する「大分類」、部位を示す比較的狭い概念を示す用語が属する「小分類」、及び用語に付される「接頭辞(接頭語)」や「接尾辞(接尾語)」等が挙げられる。 The element classification information is a model that recognizes a plurality of elements (here, a plurality of words) from the extracted phrases and classifies them into a plurality of types of classification items. As multiple types of classification items, there are “major classification” to which a term indicating a relatively broad concept indicating a part belongs, “small classification” to which a term indicating a relatively narrow concept indicating a part belongs, and “prefix” attached to the term "Suffix (prefix)" and "suffix (suffix)".
辞書DB163は、同義語や類義語や類似語に関する情報を格納するデータベースである。
The
図3は、辞書DB163に格納される同義語及び類義語に関する情報(同類義語情報)を示す図である。図3に示すように、同類義語情報は、複数の同義語によって構成される集合(同義語群)や複数の類似語によって構成される集合(類義語群)に対して、それぞれ代表語が関連付けられた情報である。そして、図3に示す同類義語情報では、同義語又は類義語の集合(例えば、「側頭葉・側頭部・側脳室」「後頭葉・後頭部」「白質・white matter」)が右方に、そして、各集合の左方にそれぞれ対応する代表語(「側頭葉」「後頭葉」「白質」)が記述されたリスト形式の情報となっている。
FIG. 3 is a diagram illustrating information on synonyms and synonyms (synonym information) stored in the
図4は、辞書DB163に格納される類似語に関する情報(類似語情報)を示す図である。図4に示すように、類似語情報は、複数の類似語によって構成される集合(類似語群)を示す用例データ(類似語用例データ)が複数個格納された情報である。
FIG. 4 is a diagram illustrating information related to similar words (similar word information) stored in the
また、使用頻度データ164は、辞書DB163に含まれる同義語群や類義語群に属する各語について、複数の所見文中で出現した回数を示すデータである。この使用頻度データ164は、後述する所見文の構成要素分類抽出動作において生成及び利用される。この使用頻度データ164の生成および利用については、所見文の構成要素分類抽出動作を説明する際に併せて述べる。
Further, the
更に、関連付けDB165は、後述する所見文の構成要素分類抽出動作の結果得られるデータが蓄積されたデータベースである。また、この関連付けDB165は、後述する読影レポート作成動作において利用される。よって、この関連付けDB165の生成および利用については、所見文の構成要素分類抽出動作及び読影レポート作成動作を説明する際に併せて述べる。
Further, the
制御部15は、CPU15aおよびメモリ15bを有しており、パソコン、すなわち情報処理システム1の動作を統括制御し、ユーザーの操作やプログラム161などに基づいて情報処理全般を制御する部位である。ここでは、ユーザーによる操作部12の種々の操作に基づき、制御部15が、記憶部16に格納されているプログラム161を読み込んで実行することにより、各種情報処理が実現される。なお、制御部15は、光ディスク91やメモリカード92に記録されている各種データやプログラムを入出力I/F17を介して読み込んで、各種制御を実行することもできる。また、制御部15において一時的に生成されるデータは、メモリ15b等に適宜一時記憶される。
The
図5は、情報処理システム1の機能構成のうち、分類用情報162の取得動作、所見文の構成要素分類抽出動作、及び読影レポート作成動作時において、制御部15において実現される機能を併せて示している。なお、図5に示す機能は、制御部15にプログラム161が読み込まれて実行されることで実現される。
FIG. 5 shows the functions realized in the
以下、図5を適宜参照しながら、分類用情報162の取得動作、所見文の構成要素分類抽出動作、及び読影レポート作成動作について、順次説明する。
Hereinafter, with reference to FIG. 5 as appropriate, the operation of obtaining the
<分類用情報の取得動作>
図5で示すように、分類用情報の取得動作が実行される際には、制御部15は、機能として、機械学習部151、及び分類データ生成部152を備えて構成される。
<Acquisition operation of classification information>
As shown in FIG. 5, when the classification information acquisition operation is executed, the
機械学習部151は、例えば、光ディスク91やメモリカード92等から適宜学習用例コーパスや教師データが与えられると、特定部位フレーズ情報と要素分類情報とを構成する情報を得ることができ、分類データ生成部152によって分類用情報162が生成されて記憶部16に記憶される。以下、分類用情報の取得動作について具体例を示しつつ説明する。
The
まず、特定部位フレーズ情報を取得する動作について説明する。 First, the operation | movement which acquires specific site | part phrase information is demonstrated.
ここでは、特定部位フレーズ用の学習用例コーパスは、解剖学的知識に基づく文章を示すテキストデータであり、特定部位フレーズ用の教師データは、解剖学的知識に属する1以上の言語の要素(以下「言語要素」とも称し、ここでは、用語)を含む複数言語要素を構成要素とするフレーズ(学習用フレーズ)を示すデータである。 Here, the learning example corpus for the specific part phrase is text data indicating a sentence based on anatomical knowledge, and the teacher data for the specific part phrase is one or more language elements (hereinafter referred to as anatomical knowledge). It is also referred to as “language element”, and here is data indicating a phrase (learning phrase) having a plurality of language elements including terms) as constituent elements.
例えば、特定部位フレーズ用の学習用例コーパスに、学習用フレーズに一致するフレーズがあれば、特定部位フレーズとして認識し、当該特定部位フレーズの蓄積により特定部位フレーズ情報が構築される。ここでは、学習用例コーパスを形態素解析によって形態素に分解し、形態素毎に形態素そのもの、形態素の品詞、形態素の活用形、前後の形態素の情報等を用いて、その形態素が特定部位フレーズに含まれるか否かを推定することで、特定部位フレーズを認識することができる。 For example, if there is a phrase that matches the learning phrase in the learning example corpus for the specific part phrase, it is recognized as the specific part phrase, and the specific part phrase information is constructed by accumulating the specific part phrase. Here, the learning example corpus is decomposed into morphemes by morpheme analysis, and whether each morpheme is included in the specific part phrase using the morpheme itself, the morpheme part of speech, the morpheme utilization form, the information on the morpheme before and after, etc. By estimating whether or not, the specific part phrase can be recognized.
更に具体例を挙げて説明する。 Furthermore, a specific example is given and demonstrated.
例えば、学習用例コーパスに「側頭葉の白質に異常が見られる」という文があり、学習用フレーズ「側頭葉の白質(側頭葉/の/白質)」が与えられている場合には、フレーズ「側頭葉の白質」が特定部位フレーズとして認識される。 For example, if there is a sentence in the learning example corpus that “abnormalities in white matter of temporal lobe” are found and the learning phrase “temporal lobe white matter (temporal lobe / no / white matter)” is given The phrase “temporal lobe white matter” is recognized as the specific part phrase.
また、例えば、学習用例コーパスに「**に沿って炎症が広がる」(「**」部には種々の語が入る)といった形の文が頻出する場合には、「**に沿って」が部位を示すフレーズであると想定される為、フレーズ「**に沿って(**/に/沿って)」が特定部位フレーズと認識される。このような特定部位フレーズの認識を行うと、例えば、学習用例コーパスに「下垂体」という用語がなくても、他の文章データを対象として、語の前後関係からフレーズ「下垂体/に/沿って」を特定部位フレーズに対応するフレーズとして抽出することができる。 In addition, for example, when a sentence in the form of “inflammation spreads along **” (various words are entered in the “**” part) frequently appears in the learning example corpus, “following **” Is assumed to be a phrase indicating a part, the phrase “along ** (** / along)” is recognized as a specific part phrase. When such a specific part phrase is recognized, for example, even if the term “pituitary gland” does not exist in the learning example corpus, the phrase “pituitary gland / along / Can be extracted as a phrase corresponding to the specific part phrase.
なお、上記機械学習は、奈良先端科学技術大学院大学で開発されたプログラム「Yamcha」等を用いることで高精度に行うことができる。このプログラム「Yamcha」は、いわゆるSVM(Support Vector Machine)を利用したものである。 The machine learning can be performed with high accuracy by using a program “Yamcha” developed at Nara Institute of Science and Technology. This program “Yamcha” uses a so-called SVM (Support Vector Machine).
このように、特定部位フレーズを学習用例コーパスを用いた機械学習で得ることで、入力される文章から抽出するフレーズの種類を適正かつ効率的に増やすことができる。 Thus, by obtaining the specific part phrase by machine learning using the learning example corpus, the types of phrases extracted from the input sentence can be increased appropriately and efficiently.
次に、要素分類情報を取得する動作について説明する。この要素分類情報については、4種類の分類項目「大分類」「小分類」「接頭辞」「接尾辞」にそれぞれ属する要素(ここでは、語)の情報を教師データとして与え、学習用例コーパスを用いた機械学習によって得ることができる。例えば、学習用例コーパスに教師データで与えられた語が存在する場合には、当該語を対応する分類項目と関連付ける動作を繰り返すことで、要素分類情報が取得される。このような構成により、文章中フレーズから抽出する要素の種類を適正かつ効率的に増やすことができる。 Next, an operation for acquiring element classification information will be described. For this element classification information, information of elements (here, words) belonging to four types of classification items “major classification”, “minor classification”, “prefix”, and “suffix” are given as teacher data, and an example corpus for learning is given. It can be obtained by the machine learning used. For example, when the word given by the teacher data exists in the learning example corpus, the element classification information is acquired by repeating the operation of associating the word with the corresponding classification item. With such a configuration, the types of elements extracted from the phrase in the sentence can be increased appropriately and efficiently.
なお、要素分類情報を取得する際の学習用例コーパスとしては、上記特定部位フレーズ情報に含まれる特定部位フレーズを用いると良い。これは、要素分類情報が、特定部位フレーズに対応するフレーズに含まれる複数要素(複数のフレーズ構成要素)を複数種類の分類項目に分類しつつ抽出するためのものであるからであり、フレーズから抽出する要素の種類を的確に増やすことができる。 In addition, as an example corpus for learning when acquiring element classification information, it is good to use the specific part phrase contained in the said specific part phrase information. This is because the element classification information is for extracting a plurality of elements (a plurality of phrase constituent elements) included in the phrase corresponding to the specific part phrase while classifying them into a plurality of types of classification items. The types of elements to be extracted can be accurately increased.
<所見文の構成要素分類抽出動作>
図5で示すように、構成要素分類抽出動作が実行される際には、制御部15は、機能として、文章データ受付部153、形態素解析部154、フレーズ抽出部155、分類抽出部156、同義・類義・類似語検出部157、置換データ生成部158、記憶制御部159、関連頻度算出部160を備えて構成される。
<Extraction sentence component extraction operation>
As illustrated in FIG. 5, when the component classification extraction operation is executed, the
図6は、構成要素分類抽出動作の動作フローを示すフローチャートである。本動作フローは、制御部15においてプログラム161が実行されることで実現される。
FIG. 6 is a flowchart showing the operation flow of the component classification extraction operation. This operation flow is realized by executing the
以下、図5を参照しつつ、図6に示す構成要素分類抽出の動作フローについて説明する。まず、例えば、読影レポートの所見文の入力が可能な状態となると、図6のステップS1に進む。 Hereinafter, the operation flow of the component element classification extraction shown in FIG. 6 will be described with reference to FIG. First, for example, when it becomes possible to input a finding sentence of an interpretation report, the process proceeds to step S1 in FIG.
ステップS1では、文章データ受付部153が所見文を示すデータを受け付け、ステップS2に進む。ここでは、ユーザーが操作部12を種々操作することで所見文を示すデータが入力されて、受け付けられる。
In step S1, the text
ステップS2では、形態素解析部154により、ステップS1で受け付けた所見文を対象とした形態素解析が行われ、ステップS3に進む。ここでは、例えば、「右側頭葉の橋に腫瘍が見られる」という所見文が入力されたと仮定すると、形態素解析によって「右/側頭葉/の/橋/に/腫瘍/が/見/られる」と分解される。
In step S2, the
ステップS3では、フレーズ抽出部155により、分類用情報162内の特定部位フレーズ情報を参照することで、ステップS2で形態素解析が行われた所見文から特定部位フレーズに対応するフレーズ(以下「文章中フレーズ」とも称する)を抽出し、ステップS4に進む。ここでは、例えば、「右/側頭葉/の/橋/に/腫瘍/が/見/られる」という形態素解析後の所見文から文章中フレーズ「右/側頭葉/の/橋」が抽出される。
In step S3, the
ステップS4では、分類抽出部156により、分類用情報162内の要素分類情報を参照することで、ステップS3で抽出された文章中フレーズを構成する複数のフレーズ構成要素を、複数種類の分類項目「大分類」「小分類」「接頭辞」「接尾辞」等に分類しつつ抽出し、ステップS5に進む。ここでは、例えば、「右側頭葉の橋」という文章中フレーズから、「側頭葉」を「大分類」として、「右」を「接頭辞」として、「橋」を「小分類」として抽出する。このような分類手法を採用することで各フレーズ構成要素を細かく分類して抽出することができる。
In step S4, by referring to the element classification information in the
また、分類項目「接頭辞」及び「接尾辞」については、単に属する要素を分類項目「接頭辞」及び「接尾辞」に分類して抽出するだけでなく、ここでは、更に、文章中フレーズにおける「大分類」及び「小分類」に属する用語との位置関係から、「大分類に属する用語に付された接頭辞(大分類接頭辞)」「大分類に属する用語に付された接尾辞(大分類接尾辞)」「小分類に属する用語に付された接頭辞(小分類接頭辞)」及び「小分類に属する用語に付された接尾辞(小分類接尾辞)」に分類しつつ抽出する。よって、例えば、上記「右側頭葉の橋」という文章中フレーズから、「右」が分類項目「大分類接頭辞」に属する要素として分類されつつ抽出される。このような構成により各フレーズ構成要素をフレーズの構成に従って分類して抽出することができる。なお、以下、1つの文章中フレーズから抽出される複数のフレーズ構成要素のことを、適宜「フレーズ構成要素群」とも称する。 In addition, for the classification items “prefix” and “suffix”, the elements to which they belong are not only classified and extracted into the classification items “prefix” and “suffix”. From the positional relationship with the terms belonging to “major category” and “minor category”, “the prefix attached to the term belonging to the major category (major category prefix)” and “the suffix attached to the term belonging to the major category ( Major classification suffix) "" Prefix attached to the term belonging to the minor category (subcategory prefix) "and" Suffix attached to the term belonging to the minor category (subcategory suffix) " To do. Therefore, for example, “right” is extracted while being classified as an element belonging to the classification item “major classification prefix” from the phrase “bridge on the right temporal lobe”. With such a configuration, each phrase component can be classified and extracted according to the phrase configuration. Hereinafter, a plurality of phrase components extracted from one phrase in a sentence are also referred to as a “phrase component group” as appropriate.
ステップS5では、同義・類義・類似語検出部157により、辞書DB163内の同類義語情報を参照することで、ステップS4で抽出されたフレーズ構成要素群から、同類義語情報に含まれる同義語群及び類義語群に属する語(同類義語群所属語)を検出した場合には、ステップS6に進み、検出しなかった場合には、ステップS7に進む。
In step S5, the synonym group included in the synonym information is extracted from the phrase component group extracted in step S4 by referring to the synonym information in the
ステップS6では、置換データ生成部158により、辞書DB163内の同類義語情報を参照することで、ステップS4からステップS5にかけて検出された同類義語群所属語を対応する代表語に置換したフレーズ構成要素群(置換後フレーズ構成要素群)を生成し、ステップS7に進む。ここで、同義語や類義語を1つの代表語に置換するのは、同じような意味の言葉を一つの表現に統一することで、データベース中で纏め易く、またデータベースの参照も容易になるからである。なお、例えば、「側脳室」「側頭葉」という用語は、ほぼ同じ部分を意味するため、どちらか一方に纏めることができる。なお、どのような用語を置換するのかは、辞書DB163内の同類義語情報の充実度合いによって適宜設定することが可能である。
In step S6, the replacement
ステップS7では、記憶制御部159の機能により、ステップS5から進んで来た場合には、ステップS4で抽出されたフレーズ構成要素群を対象として、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて記憶部16の関連付けデータベース(関連付けDB)165に記憶する。一方、ステップS6から進んで来た場合には、ステップS6で生成された置換後フレーズ構成要素群を対象として、当該置換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて関連付けDB165に記憶する。
In step S7, when the process proceeds from step S5 by the function of the
この関連付けDB165では、1つのフレーズ構成要素群の構成要素(フレーズ構成要素)間、詳しくは、「大分類」に属するフレーズ構成要素と「小分類」に属するフレーズ構成要素、「大分類」に属するフレーズ構成要素と「大分類接頭辞」又は「大分類接尾辞」に属するフレーズ構成要素、「小分類」に属するフレーズ構成要素と「小分類接頭辞」又は「小分類接尾辞」に属するフレーズ構成要素とが関連付けられて記憶されている。
In this
図7は、1つのフレーズ構成要素群に係る情報の関連付けDB165内における記憶形態を例示する模式図である。図7及びそれ以降の記憶形態を示す模式図では、四角内に記載される語がフレーズ構成要素を示し、各四角間を結ぶ線がフレーズ構成要素間の関連付けを示している。
FIG. 7 is a schematic view illustrating a storage form in the
例えば、フレーズ構成要素群「右」−「側頭葉」−「橋」は、図7に示すように、大分類に属するフレーズ構成要素「側頭葉」に対して小分類に属するフレーズ「橋」が関連付けられ、更に大分類に属するフレーズ構成要素「側頭葉」に対して接頭辞「右」が関連付けられて記憶される。なお、このようなフレーズ構成要素どうしを関連付けたデータとしては、例えばRDF等で記述される。 For example, the phrase component group “right” − “temporal lobe” − “bridge” has a phrase “bridge” belonging to the minor category with respect to the phrase component “temporal lobe” belonging to the major category, as shown in FIG. ”And the prefix“ right ”is stored in association with the phrase component“ temporal lobe ”belonging to the broad category. Note that the data associating such phrase constituent elements is described in, for example, RDF.
また、関連付けDB165内に既に記憶されているフレーズ構成要素と同じフレーズ構成要素を含むフレーズ構成要素群を更に記憶する場合には、共通するフレーズ構成要素が共用される。そして、当該共用したフレーズ構成要素に対してその他のフレーズ構成要素が関連付けられる。
Further, when further storing a phrase component group including the same phrase component as the phrase component already stored in the
例えば、図7に示すような情報が関連付けDB165内に記憶されており、文章中フレーズ「左側頭葉の白質内部」に係るフレーズ構成要素群「左」−「側頭葉」−「白質」−「内部」を記憶する場合を想定する。すると、図8に示すように、共通する大分類のフレーズ構成要素「側頭葉」を共用しつつ、大分類のフレーズ構成要素「側頭葉」に対して小分類に属するフレーズ構成要素「白質」が関連付けられ、大分類に属するフレーズ構成要素「側頭葉」に対して大分類接頭辞「左」が関連付けられ、更に小分類のフレーズ構成要素「白質」に対して小分類接尾語に属するフレーズ「内部」が関連付けられる。
For example, information as shown in FIG. 7 is stored in the
更に、文章中フレーズ「大脳の白質周囲」に係るフレーズ構成要素群「大脳」−「白質」−「周囲」を記憶する場合を想定する。すると、図9に示すように、共通する小分類のフレーズ構成要素「白質」を共用しつつ、小分類のフレーズ構成要素「白質」に対して大分類に属するフレーズ構成要素「大脳」が関連付けられ、小分類に属するフレーズ構成要素「白質」に対して小分類接尾辞「周囲」が関連付けられる。 Furthermore, it is assumed that the phrase component group “cerebrum” − “white matter” − “around” related to the phrase “around the white matter of the cerebrum” in the sentence is stored. Then, as shown in FIG. 9, the phrase component “cerebrum” belonging to the major category is associated with the minor category phrase component “white matter” while sharing the common minor category phrase component “white matter”. , The minor classification suffix “surrounding” is associated with the phrase component “white matter” belonging to the minor classification.
また、このような態様で複数のフレーズ構成要素群を記憶していく際、関連付けDB165の記憶内容を後述する新規所見文の入力動作に利用する為に、特定のフレーズ構成要素間における関連付けの頻度をモニターすべきである。そこで、ステップS7では、関連頻度算出部160により、関連付けDB165における関連付けの頻度を計算し、当該頻度を示す情報(関連付け頻度情報)も関連付けDB165に記憶する。
Also, when storing a plurality of phrase component groups in such a manner, the frequency of association between specific phrase components in order to use the stored content of the
ステップS8では、同義・類義・類似語検出部157により、辞書DB163内の類似語用例データを参照することで、ステップS4で抽出されたフレーズ構成要素群、又はステップS6で生成されたフレーズ構成要素群から、類似語用例データによって示される類似語群を構成する類似語を検出した場合には、ステップS9に進み、検出されなかった場合には、本動作フローを終了する。
In step S8, the synonym / synonym / similar
ステップS9では、置換データ生成部158及び記憶制御部159により、辞書DB163内の類似語用例データを参照することで、ステップS7からステップS8にかけて検出された類似語群構成語を、類似語用例データによって示される類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換しつつ、変換後のフレーズ構成要素群(変換後フレーズ構成要素群)を関連付けDB165に記憶する。
In step S9, the replacement
ここでは、フレーズ構成要素群からある類似語群を構成する類似語群構成語が検出されると、同じ類似語群を構成する他の類似語群構成語に変換したフレーズ構成要素群も一般に存在すると容易に推定出来る。そこで、類似語群構成語が検出された場合には、当該類似語群構成語を、当該類似語群構成語と同じ類似語群に属する他の類似語構成語に変換したフレーズ構成要素群(変換後フレーズ構成要素群)を順次生成しつつ、関連付けDB165に記憶する。各変換後フレーズ構成要素群を関連付けDB165に記憶する際には、各変換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしがフレーズの所定の構成ルールに従って関連付けられて関連付けDB165に記憶される。
Here, when a similar word group constituent word constituting a similar word group is detected from the phrase constituent group, there is generally also a phrase constituent group converted to another similar word group constituent word constituting the same similar word group Then it can be estimated easily. Therefore, when a similar word group component word is detected, a phrase component group (in which the similar word group component word is converted into another similar word component word that belongs to the same similar word group as the similar word group component word ( The converted phrase component group) is sequentially generated and stored in the
類似語の置換・記憶について以下具体例を挙げて説明する。「右側頭葉の橋」という文章中フレーズが抽出されている場合には、大分類の接頭辞「右」−大分類「側頭葉」−小分類「橋」といったフレーズ構成要素群が抽出される。このとき、大分類の接頭辞「右」と同じような使われ方をする類似語「左」が存在するため、大分類の接頭辞「左」−大分類「側頭葉」−小分類「橋」といった組合せも存在することが容易に推測できる。そこで、類似語構成語「右」を同じ類似群を構成する他の異なる類似語構成語「左」に変換したフレーズ構成要素群も関連付けDB165に記憶する。
The substitution and storage of similar words will be described below with specific examples. When the phrase “Bridge on the right temporal lobe” is extracted, the phrase component group such as the prefix “Right” of the major classification “Right temporal lobe” —the minor classification “Bridge” is extracted. The At this time, since there is a similar term “left” that is used in the same way as the prefix “right” of the major classification, the prefix “left” of the major classification—the “temporal lobe” —the minor classification “ It can be easily guessed that combinations such as “bridge” exist. Therefore, the phrase component group obtained by converting the similar word constituent word “right” into another different similar word constituent word “left” constituting the same similar group is also stored in the
例えば、大分類の接頭辞「右」−大分類「側頭葉」−小分類「橋」といったフレーズ構成要素群が関連付けDB165に記憶される際に、大分類の接頭辞「左」−大分類「側頭葉」−小分類「橋」といった変換後フレーズ構成要素群も併せて記憶される。つまり、変換前のフレーズ構成要素群が図7に示すような態様で記憶され、更に、大分類「側頭葉」に対して大分類の接頭辞「左」が関連付けられる。
For example, when a phrase component group such as the prefix “right” of the large classification “large classification“ temporal lobe ”—the small classification“ bridge ”is stored in the
なお、ステップS9の処理が完了すると、本動作フローが終了する。 In addition, when the process of step S9 is completed, this operation | movement flow will be complete | finished.
そして、このような図6に示すような動作フローを繰り返すことで、関連付けDB165の記憶内容を充実化させることができる。
Then, by repeating the operation flow as shown in FIG. 6, the stored contents of the
<新規所見文の入力動作>
図5で示すように、新規所見文の入力動作が実行される際には、制御部15は、機能として、表示用データ生成部251、データ出力部252、フレーズ構成要素指示部253、及び新規フレーズ生成部254を備えて構成される。
<Input operation of new findings>
As shown in FIG. 5, when the input operation of a new finding sentence is executed, the
以下、図5を参照しつつ、新規所見文の入力を行う際に表示部13に可視的に出力される画面(読影レポート入力画面)やその要素を図10から図13に示すことで、新規所見文の入力動作を説明する。なお、読影レポート入力画面G1に係るデータは、表示用データ生成部251(図5)によって、記憶部16に記憶される使用頻度データ164、及び関連付けDB165等の各種情報に基づき生成され、データ出力部252によって表示部13に向けて出力されることで、表示部13における画面表示が実現される。
Hereinafter, referring to FIG. 5, the screen (interpretation report input screen) visibly output to the
図10は、読影レポート入力画面G1を例示する図である。図10に示すように、読影レポート入力画面G1は、主に、依頼内容の表示領域A1、検査リストの表示領域A2、検査情報表示領域A3、読影レポートの入力及び作成を行う領域A4、所見文の表示領域A5、メモの記述領域A6、画像の添付領域A7、コマンドに係る入力アイコンが列挙される領域A8によって構成されている。 FIG. 10 is a diagram illustrating an interpretation report input screen G1. As shown in FIG. 10, the interpretation report input screen G1 mainly includes a request content display area A1, an examination list display area A2, an examination information display area A3, an interpretation report input area A4, and an observation sentence A4. Display area A5, memo description area A6, image attachment area A7, and area A8 in which input icons related to commands are listed.
このような読影レポート入力画面G1で読影レポートの所見文を入力する際には、上記関連付けDB165の記憶内容が、所見文において部位名を入力する際に利用される。以下、読影レポート入力画面G1の領域A4の一部領域A41に部位名に係る情報が提示されるものとして説明を行う。
When inputting the finding sentence of the interpretation report on such an interpretation report input screen G1, the stored content of the
図示を省略するが、まず、表示部13に読影レポート入力画面G1が表示された際には、領域A41には、部位を示す「大分類」に属する複数の用語が列挙される。そして、当該複数の用語のうちの1つの用語をマウスポインタ等を用いて指定することで、関連付けDB165に格納される情報のうち、当該指定された用語に係る情報が表示される。
Although illustration is omitted, first, when the interpretation report input screen G1 is displayed on the
例えば、部位を示す分類項目「大分類」に属する用語「側頭葉」が指定された場合には、関連付けDB165内に格納される図9に示すような情報に基づいて、図11に示すような部位名の入力を支援するための図(部位名入力支援図)が領域A41に表示される。この部位名入力支援図では、関連付けDB165内のフレーズ構成要素「側頭葉」に係る情報に基づき、複数の四角内に「側頭葉」に係るフレーズ構成要素がそれぞれ記述された表示要素と、当該表示要素間が各フレーズ構成要素どうしの関連付けに応じて連結された可視的な連結要素(ここでは、線分)とが表示される。このように、各フレーズ構成要素どうしの関連付けが可視的に表示されると、ユーザーは所定のカテゴリーに属する要素に関するフレーズの構成を一目で把握することができ、新規なフレーズの入力の参考となる。
For example, when the term “temporal lobe” belonging to the classification item “major classification” indicating the part is designated, as shown in FIG. 11 based on the information shown in FIG. 9 stored in the
また、部位名入力支援図が領域A41に表示される際には、表示用データ生成部251が関連付けDB165内の関連付け頻度情報を参照することで、連結要素である線分の表示態様を変更する。例えば、関連付けの回数が所定回数(例えば、10回)以上のものを頻繁に同時に使用されるフレーズ構成要素として認識して、図12に示すように線分を太くするなど他の連結要素よりも強調されるように変更される。
Further, when the part name input support diagram is displayed in the area A41, the display
図12では、「側頭葉」と「白質」とが1つのフレーズを構成するフレーズ構成要素として同時に使用される頻度が高いことが一目で把握可能に表示される。なお、ここでは、線分の太さを変更したが、カラー表示をする場合には、線分の色を変更するなど、連結要素の表示態様を他の連結要素とは異なる態様に変更するようにしても良い。 In FIG. 12, it is displayed so that it is possible to grasp at a glance that “temporal lobe” and “white matter” are frequently used simultaneously as phrase constituent elements constituting one phrase. Here, the thickness of the line segment is changed. However, when displaying in color, the display mode of the connected element is changed to a mode different from other connected elements, such as changing the color of the line segment. Anyway.
そして、図11及び図12に示したような部位名入力支援図が表示部13に表示された状態で、部位名入力支援図に列挙された複数のフレーズ構成要素のうち、ユーザーによる操作部12の操作に応じてマウスポインタMP等を利用して所望のフレーズ構成要素を指定することができる。ここでは、各分類項目についてそれぞれ1つまでフレーズ構成要素を指定することができ、当該指定されたフレーズ構成要素は、フレーズ構成要素指示部253によって新規なフレーズを構成する要素として指示される。なお、当該指示された要素は、部位を示す新規フレーズを構成する要素として、読影レポート入力画面G1の領域A4における最下段の領域A42に列挙される。
Then, in a state where the part name input support diagram as shown in FIGS. 11 and 12 is displayed on the
新規フレーズ生成部254は、指示された要素を利用して、特定部位フレーズの所定の構成ルールに従って、新規なフレーズを生成する。当該生成された新規なフレーズは、表示用データ生成部251及びデータ出力部252の機能により領域A4に可視的に表示される。このとき、図示を省略するが、所見文の構成に必要な他の語句を領域A4において指定することで、所見文を入力することができる。なお、所見文の入力は、領域A4の表示内容を参照しつつ、所見文の表示領域A5にカーソルを発生させて、キーボード122等から直接入力することもできる。また、新規な所見文が入力される度に、上記所見文の構成要素分類抽出の動作フローが実行され、過去の知識である関連付けDB165が更に充実化していくことになる。
The new
以上のように、本発明の実施形態に係る情報処理システム1では、まず、入力される文章から読影レポートの所見文に属する特定部位フレーズに対応する文章中フレーズを抽出する。次に、当該文章中フレーズに含まれる各要素を複数種類の分類項目に分類しつつ抽出する。このような2段階の抽出によって、的確に所定のカテゴリーに属する要素を抽出することができる。
As described above, in the
また、フレーズ構成要素群から同義語や類義語が抽出された場合、対応する代表語に置換して関連付けDB165に記憶する構成を採用する。このため、所定のカテゴリーに属する要素に関するフレーズの構成を示した情報を、表現が統一された状態でデータベース化することができる。 Moreover, when a synonym and a synonym are extracted from a phrase component group, the structure which substitutes to a corresponding representative word and memorize | stores in association DB165 is employ | adopted. For this reason, the information indicating the configuration of the phrase related to the elements belonging to the predetermined category can be made into a database in a state where the expressions are unified.
また、フレーズ構成要素群からある類似語群を構成する類似語群構成語が検出された場合、フレーズ構成要素群のうちの類似語群構成語を、同じ類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に時間順次に変換して変換後フレーズ構成要素群を生成する。そして、各変換後フレーズ構成要素群に係る関連付け情報を関連付けDB165に記憶するため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をより充実化させることができる。 Further, when a similar word group constituent word that constitutes a similar word group from the phrase constituent element group is detected, the similar word group constituent word of the phrase constituent element group is related to the similar word group constituting the same similar word group A phrase component group after conversion is generated by time-sequentially converting into another similar word group constituent word different from the constituent word. And since the correlation information which concerns on each post-conversion phrase component group is memorize | stored in correlation DB165, the information which showed the phrase structure which concerns on the element which belongs to a predetermined category can be enriched more.
また、関連付けDB165に基づいて、関連付けDB165に含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて表示するとともに、関連付けの頻度に基づいて連結要素の態様を変更する。このような構成により、所定のカテゴリーに属する要素に関するフレーズの構成を一目で把握することができるとともに、関連付けが強いものについては、一目で他の関連付けとは区別して把握することができる。
Further, based on the
また、文章中のフレーズから直接抽出されたフレーズ構成要素群に従って関連付けの頻度を計算することで、関連付けの表示態様が使用実態を正確に反映した表示態様となるため、実際に頻繁に使用されるフレーズの構成が把握し易くなる。 In addition, by calculating the association frequency according to the phrase component group directly extracted from the phrase in the sentence, the display mode of the association becomes a display mode that accurately reflects the actual usage, so it is frequently used in practice. This makes it easier to understand the composition of phrases.
更に、新規フレーズを入力する際に、関連付けDB165に基づいて表示される画面上で、ユーザーの操作に応答して複数種類の分類項目のうちの少なくとも1つの項目に属するフレーズ構成要素を新規フレーズを構成するフレーズ構成要素として指示することができる。このような構成とすることで、過去の知識を利用することで新規フレーズの入力操作を簡略化することができる。
Furthermore, when inputting a new phrase, a phrase component belonging to at least one of a plurality of types of classification items is added to the new phrase in response to a user operation on the screen displayed based on the
<変形例>
以上、この発明の実施形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。
<Modification>
As mentioned above, although embodiment of this invention was described, this invention is not limited to the thing of the content demonstrated above.
◎例えば、上記実施形態では、辞書DB163が、同義語に係るデータ(同義語データ)および類義語に係るデータ(類義語データ)の双方を含んでいたが、これに限られず、同義語データ及び類義語データのうちの少なくとも一方を含むようにしても良い。このような構成にしても、上述した実施形態と同様な効果を得ることができる。
For example, in the above embodiment, the
◎また、上記実施形態では、機械学習によって得た要素分類情報を参照して分類項目「接頭辞」及び「接尾辞」にそれぞれ属する語を分類・抽出したが、これに限られない。分類項目「接頭辞」及び「接尾辞」として使用される語の種類は比較的少ないため、要素分類情報のうち分類項目「接頭辞」及び「接尾辞」に関する情報については、機械学習を用いずに、例えば、分類項目「接頭辞」及び「接尾辞」の少なくとも一方については、各分類項目に対応する語のリストを予め作成しておき、このリストを参照しつつ「文章中フレーズ」から分類項目「接頭辞」及び「接尾辞」にそれぞれ属する語を分類・抽出するようにしても良い。このような構成により、的確な接頭辞及び接尾辞の抽出を機械学習を利用しなくとも容易に実施することができる。 In the above embodiment, the words belonging to the classification items “prefix” and “suffix” are classified and extracted by referring to the element classification information obtained by machine learning. However, the present invention is not limited to this. Since the types of words used as classification items “prefix” and “suffix” are relatively few, machine learning is not used for information related to classification items “prefix” and “suffix” in the element classification information. In addition, for example, for at least one of the classification items “prefix” and “suffix”, a list of words corresponding to each classification item is created in advance, and classification is made from “phrase in text” while referring to this list. The words belonging to the items “prefix” and “suffix” may be classified and extracted. With such a configuration, accurate prefix and suffix extraction can be easily performed without using machine learning.
◎また、上記実施形態では、辞書DB163内の同類義語情報を参照することで、複数語から、同類義語情報に含まれる同義語群及び類義語群の双方について語群所属語を検出して置換したが、これに限られず、同義語及び類義語の少なくとも一方について語群所属語を検出して置換するようにしても良い。
In the above embodiment, by referring to the synonym information in the
◎また、上記実施形態では、辞書DB163内の同類義語情報に代表語が記憶されていたが、同義語群に含まれる複数語を表示部13に表示させ、ユーザーによる操作部12からの入力操作に応答して当該複数語から代表語を指定したり、類義語群に含まれる複数語を表示部13に表示させ、ユーザーによる操作部12からの入力操作に応答して当該複数語から代表語を指定したりする代表語の指定動作を実行させる機能を制御部15が実現するようにしても良い。このような構成とすると、ユーザーの癖等を反映したカスタマイズが可能となる。
In the above embodiment, the representative words are stored in the synonym information in the
また、複数の文章データを対象として辞書DB163に属する各語群所属語の出現回数を計算し、同義語群に含まれる複数語のうち最も出現回数が多い語を当該同義語群に対する代表語として指定したり、類義語群に含まれる複数語のうち最も出現回数が多い語を当該類義語群に対する代表語として指定する代表語の指定動作を実行させる機能を制御部15が実現するようにしても良い。このような構成を採用することで、用語等の使用実態に沿って各フレーズ構成要素を細かく分類することができる。
In addition, the number of appearances of each word group belonging word belonging to the
◎また、上記実施形態では、「大分類」に属するフレーズ構成要素と「小分類」に属するフレーズ構成要素との区別は、要素分類情報に基づいて行ったが、これに限られず、例えば、文章中フレーズが「・・・の・・・」という表現を含んでいれば、「の」の直前を「大分類」に属するフレーズ構成要素を含む用語、「の」の直後を「小分類」に属するフレーズ構成要素を含む用語であるとして判断するようにしても良い。なお、このような判断材料も機械学習によって得るようにしても良い。 In the above embodiment, the phrase component belonging to the “major classification” and the phrase component belonging to the “minor classification” are distinguished based on the element classification information. If the middle phrase contains the expression "... no ...", the term immediately before "no" includes a phrase component that belongs to "major category", and the term immediately after "no" becomes "minor category" You may make it judge that it is a term containing the phrase component to which it belongs. Such a determination material may be obtained by machine learning.
◎また、上記実施形態では、入力された所見文を解析することで、関連付けDB165を生成及び充実化したが、これに限られず、例えば、図13に示すような画面を表示部13に表示させて、当該画面上で各分類項目に属するフレーズ構成要素をユーザーによる操作部12からの操作入力に応答して追加入力するようにしても良い。
In the above embodiment, the
例えば、図13に示す画面では、6つの分類項目「大分類」「小分類」「大分類接頭辞」「大分類接尾辞」「小分類接頭辞」及び「小分類接尾辞」にそれぞれ属するフレーム構成要素(語)を対応する四角内に入力することができる。 For example, in the screen shown in FIG. 13, frames belonging to six classification items “major classification”, “minor classification”, “major classification prefix”, “major classification suffix”, “minor classification prefix”, and “minor classification suffix”, respectively. A component (word) can be entered in the corresponding square.
このように、ユーザーの操作入力により、新規なフレーズ構成要素群を示す追加データが入力されると、当該新規なフレーズ構成要素群に含まれる各フレーズ構成要素どうしが、フレーズの所定の構成ルールに従って関連付けられて関連付けDB165に記憶されるため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をユーザーが適宜充実化させることができる。
As described above, when additional data indicating a new phrase component group is input by a user operation input, each phrase component included in the new phrase component group is determined according to a predetermined phrase configuration rule. Since they are associated with each other and stored in the
◎また、上記実施形態では、読影レポートを情報処理を対象としたが、これに限られず、例えば、インシデントレポート等といった他の種々の医療情報を対象としても良く、更には、営業レポート等といった種々の文章を対象としても良い。 In the above embodiment, the interpretation report is targeted for information processing. However, the present invention is not limited to this, and for example, other various medical information such as an incident report may be targeted. It is also possible to target this sentence.
ここで、他の文章を情報処理の対象とした一例としてインシデントレポートを情報処理の対象とした場合について説明する。 Here, a case where an incident report is an information processing target will be described as an example in which another sentence is an information processing target.
インシデントレポートは、一般に、(i)インシデントそのものの内容についての記述である「主文」、(ii)インシデントが発生した背景・原因についての記述である「原因」、(iii)インシデントの結果として起こったこと(患者の症状悪化等)についての記述である「影響」、(iv)インシデントの後の対応についての記述である「対処」、(v)インシデントの後の対応によって起こったことについての記述である「対処結果」とった5つの部分と、それ以外のインシデントとは関係ない部分とによって構成される。 Incident reports generally occur as a result of an incident (i) "main text" that describes the content of the incident itself, (ii) a description of the background and cause of the incident, and (iii) an incident "Impact" which is a description of the incident (aggravation of patient's symptoms, etc.), (iv) "Action" which is a description of the response after the incident, and (v) A description of what happened due to the response after the incident It is composed of five parts that have a certain “handling result” and parts that are not related to other incidents.
例えば、インシデントレポートに、「薬剤Aの箱の中に薬剤Bが混入したため、薬剤Aのつもりで誤って薬剤Bを注射したところ、血圧が200まで急上昇した。そこで薬剤Cを注射したところ、血圧は正常値に戻った。」という文があった場合、「主文」が「薬剤Aのつもりで誤って薬剤Bを注射したところ、」、「原因」が「薬剤Aの箱の中に薬剤Bが混入したため、」、「影響」が「血圧が200まで急上昇した。」、「対処」が「そこで薬剤Cを注射したところ、」、「対処結果」が「血圧は正常値に戻った。」となる。 For example, in the incident report, “Drug B was mixed in the box of Drug A, so that when the drug B was accidentally injected with the intention of the drug A, the blood pressure rose rapidly to 200. Was returned to the normal value ”, the“ main sentence ”was“ when drug B was accidentally injected with the intention of drug A ”and“ cause ”was“ drug B in drug A's box. ”,“ Effect ”is“ blood pressure has rapidly increased to 200 ”,“ coping ”is“ when drug C was injected there ”, and“ coping result ”is“ blood pressure has returned to a normal value ”. It becomes.
このように、インシデントレポートが「主文」「原因」「影響」「対処」「対処結果」といった5種類のフレーズを含んでいることを利用して、まず、インシデントレポートから5種類のフレーズを抽出する。そして、文章は大きく分けて、(1)「なぜ」−「いつ」−「どこで」−「誰が」−「誰に」−「何を」−「どこに(部位)」−「どれだけ」−「どのように」−「どうした」、(2)「なぜ」−「いつ」−「どこで」−「誰の」−「何が」−「どこに(部位)」or「どこに(場所)」−「どれだけ」−「どのように」−「どうした」といった2つのパターンに大別される。そこで、抽出されたフレーズから2つのパターンを構成する「誰が」「誰に」「誰の」「何が」「何を」「いつ」「どこに(部位)」「どこに(場所)」「どこで(場所)」「どれだけ」「なぜ」「どのように」「どうした」等の要素に対応する語を抽出することで、インシデントレポートから的確に所定のカテゴリーに属する要素を抽出する。 Thus, using the fact that the incident report includes five kinds of phrases such as “main sentence”, “cause”, “effect”, “handling”, and “handling result”, first, five kinds of phrases are extracted from the incident report. . The text is roughly divided into (1) "Why"-"When"-"Where"-"Who"-"Who"-"What"-"Where (part)"-"How much"-" "How"-"What", (2) "Why"-"When"-"Where"-"Who"-"What"-"Where (part)" or "Where (place)"-" It is roughly divided into two patterns: "How much"-"How"-"What". Therefore, “Who”, “Who”, “Who”, “Who”, “What”, “What”, “When”, “Where (part)”, “Where (location)”, “Where” (where) By extracting words corresponding to elements such as “location)”, “how much”, “why”, “how”, “what”, and the like, elements belonging to a predetermined category are accurately extracted from the incident report.
以下、このような2段階の抽出方法について更に説明する。 Hereinafter, such a two-stage extraction method will be further described.
2段階の抽出には、1段目のフレーズを抽出するためのフレーズ情報と、2段目のフレーズ構成要素を分類抽出するための要素分類情報が必要となる。 The two-stage extraction requires phrase information for extracting the first-stage phrase and element classification information for classifying and extracting the second-stage phrase components.
フレーズ情報は、コーパスを用いた機械学習によって得る。例えば、コーパス内の文章を形態素解析して、「主文」「原因」「影響」「対処」「対処結果」を表すタグを与え、これを使って、5種類のフレーズにそれぞれ対応するコーパスの一部分(部分コーパス)を集めてフレーズ情報として得ることができる。 Phrase information is obtained by machine learning using a corpus. For example, morphological analysis of sentences in a corpus gives tags representing “main sentence”, “cause”, “influence”, “handling”, and “handling result”. Using this, a part of the corpus corresponding to each of five phrases (Partial corpus) can be collected and obtained as phrase information.
要素分類情報は、フレーズ情報に含まれるそれぞれの部分コーパスについて、分類項目「誰が」「誰に」「誰の」「何が」「何を」「いつ」「どこに(部位)」「どこに(場所)」「どこで(場所)」「どれだけ」「なぜ」「どのように」「どうした」等に対応する要素を表す部分にタグを与え、これを使って、多数種類の分類項目にそれぞれ対応する要素を示す要素分類情報を得ることができる。 For each partial corpus included in the phrase information, the element classification information is classified into “Who”, “Who”, “Who”, “What”, “What”, “When”, “Where (part)”, “Where (location) ) "" Where (location) "" How much "" Why "" How "" How did "etc. Tags are given to the parts that represent elements, and this is used to correspond to many types of classification items. It is possible to obtain element classification information indicating elements to be performed.
ここで抽出対象となる要素となる語・文の例を以下に列挙する。 Examples of words / sentences that are elements to be extracted are listed below.
分類項目「誰が」「誰に」「誰の」に対しては要素「患者」「研修医」「**さん」等が、分類項目「何が」「何を」に対しては要素「薬剤名(「ワスゴチグミン」等)」「指標(「血圧」等)」「器具名(「三方活栓」等)」等が、分類項目「いつ」に対しては要素「日時(「4月20日」「10時」等)」「期間(「1時間」「3日間」等)」「**中」「**の際」等が、「どこに(部位)」に対しては要素「筋肉」「右腕」「頭部」等が、分類項目「どこに(部位)」に対しては要素「シーツの上」「シリンジの中」等が、分類項目「どこで(場所)」に対しては要素「病棟」「手術室」等が、分類項目「どれだけ」に対しては要素「数値(「100ml」「3倍」等)」「程度(「やや」「大量に」等)」等が、分類項目「なぜ」に対しては要素「**したので」「**のため」等が、分類項目「どのように」に対しては要素「誤って」「正しく」「二重に」等が、分類項目「どうした」に対しては要素「行為(「投与」「点滴」「入れる」等)」「状態(「上昇」「悪化」「抜ける」「なくなる」等)」等がある。 The elements "patient", "resident", "Mr. **" etc. for the classification items "Who", "Who" and "Who", and the element "Drug" for the classification items "What" and "What" Name ("Wasgochigumin", etc.), "Indicator (" Blood pressure ", etc.)", "Equipment name (" Three-way stopcock ", etc.)", etc. “10:00” etc.) “Period (“ 1 hour ”“ 3 days ”etc.)” “** Medium” “At the time of **” etc. “Right arm”, “Head”, etc. for the classification item “Where (part)”, “Elements on the sheet”, “In the syringe”, etc., for the classification item “Where (location)”, the element “Ward” "" Operating room "etc., for the classification item" how much ", the elements" numerical value ("100ml" "3 times" etc.) "" degree ("somewhat" "large amount" etc.) " Against "why" Elements “** because” and “because of **”, etc. for the classification item “how”, elements “incorrect”, “correctly”, “double”, etc. On the other hand, there are the elements “action (“ administration ”,“ instillation ”,“ insertion ”, etc.),“ state ”(“ rising ”,“ deterioration ”,“ missing ”,“ disappearing ”, etc.).
上記のようにして準備したフレーズ情報及び要素分類情報とを用いた要素抽出の一例を以下に示す。 An example of element extraction using the phrase information and element classification information prepared as described above is shown below.
「薬剤Aの箱の中に薬剤Bが混入したため、薬剤Aのつもりで誤って薬剤Bを注射したところ、血圧が200まで急上昇した。そこで薬剤Cを注射したところ、血圧は正常値に戻った。」という文が入力された場合には、フレーズ情報を参照することで、まず、「主文」フレーズが「薬剤Aのつもりで誤って薬剤Bを注射したところ、」、「原因」フレーズが「薬剤Aの箱の中に薬剤Bが混入したため、」、「影響」フレーズが「血圧が200まで急上昇した。」、「対処」フレーズが「そこで薬剤Cを注射したところ、」、「対処結果」フレーズが「血圧は正常値に戻った。」と1段目の抽出、すなわちフレーズの抽出が行われる。 “Because drug B was mixed in the drug A box, drug A was accidentally injected as drug A, and blood pressure rose rapidly to 200. When drug C was injected, blood pressure returned to normal. When the sentence “.” Is entered, by referring to the phrase information, first, the “main sentence” phrase is “when drug A was accidentally injected with the intention of drug A,” and the “cause” phrase is “ “Because drug B is mixed in the box of drug A”, the “influence” phrases are “blood pressure has suddenly increased to 200”, and the “handling” phrases are “when drug C is injected there”, “handling results” The phrase “blood pressure has returned to a normal value” is extracted as the first stage, that is, the phrase is extracted.
次に、要素分類情報を参照することで、「主文」フレーズから、分類項目「何を」に対して要素「薬剤A→薬剤B(ここでは、本来は「薬剤A」でないといけないが「薬剤B」にしてしまった、ということを表している)」が、分類項目「どのように」に対して要素「誤って」が、分類項目「どうした」に対して要素「注射」が、分類抽出される。 Next, by referring to the element classification information, from the “main sentence” phrase, the element “drug A → drug B” (here “drug A” should be originally “ "B" means that the element "incorrect" for the classification item "how" and the element "injection" for the classification item "how" Extracted.
また、「原因」フレーズから、分類項目「何が」に対して要素「薬剤B」が、分類項目「どこに(場所)」に対して要素「薬剤Aの箱の中」が、分類項目「どうした」に対して要素「混入していた」が、分類抽出される。 Further, from the “cause” phrase, the element “drug B” for the classification item “what” and the element “in the box of the drug A” for the classification item “where (location)” The element “mixed” is classified and extracted with respect to “done”.
また、「影響」フレーズから、分類項目「何が」に対して要素「血圧」が、分類項目「どれだけ」に対して要素「200まで」が、分類項目「どうした」に対して要素「急上昇した」が、分類抽出される。 Further, from the “influence” phrase, the element “blood pressure” for the classification item “what”, the element “up to 200” for the classification item “how much”, and the element “ “Raised” is extracted.
また、「対処」フレーズから、分類項目「何を」に対して要素「薬剤C」が、分類項目「どうした」に対して要素「注射した」が、分類抽出される。 Further, from the “coping” phrase, the element “drug C” is extracted for the classification item “what” and the element “injected” is extracted for the classification item “how”.
更に、「対処結果」フレーズから、分類項目「何が」に対して要素「血圧」が、分類項目「どれだけ」に対して要素「正常値に」が、分類項目「どうした」に対して要素「戻った」が、分類抽出される。 Furthermore, from the “handling result” phrase, the element “blood pressure” for the classification item “what”, the element “normal value” for the classification item “how much”, and the element “normal” The element “returned” is classified and extracted.
このようにして分類抽出された要素を、5つのフレーズ毎に、フレーズの所定の構成ルールに従って関連付けて所定のデータベースに記憶することで、上述した実施形態と同様に、既存のインシデントレポートを過去の知識として利用することができるようになる。 The elements classified and extracted in this way are stored in a predetermined database in association with a predetermined configuration rule for each of the five phrases, so that an existing incident report can be stored in the past as in the above-described embodiment. It can be used as knowledge.
◎また、上記実施形態では、情報処理システム1が1台のパソコンで構成されたが、これに限られず、例えば、図14に示すように、サーバSBと、当該サーバSBとネットワーク回線NTを介してデータ交信可能に接続された複数の端末(パソコン)T1〜T4とに、情報処理システム1の機能を適宜分散させて、複数の端末T1〜T4において、関連付けDB165に基づく画面を表示して文章の入力を簡略化することができるような情報処理システム1Aとしても良い。
In the above embodiment, the
1,1A 情報処理システム
12 操作部
13 表示部
15 制御部
16 記憶部
151 機械学習部
152 分類データ生成部
153 文章データ受付部
154 形態素解析部
155 フレーズ抽出部
156 分類抽出部
157 同義・類義・類似語検出部
158 置換データ生成部
159 記憶制御部
160 関連頻度算出部
161 プログラム
162 分類用情報
163 辞書データベース
164 使用頻度データ
165 関連付けデータベース
251 表示用データ生成部
252 データ出力部
253 フレーズ構成要素指示部
254 新規フレーズ生成部
DESCRIPTION OF
Claims (19)
所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを記憶する分類用情報記憶手段と、
文章情報の入力を受け付ける受付手段と、
前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するフレーズ抽出手段と、
前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出する要素抽出手段と、
を備えることを特徴とする情報処理システム。 An information processing system,
For classification that stores phrase information indicating a specific phrase including a plurality of language elements including one or more language elements belonging to a predetermined category, and element classification information obtained by classifying a number of language elements into a plurality of types of classification items Information storage means;
A receiving means for receiving input of sentence information;
Phrase extracting means for extracting a phrase in the sentence corresponding to the specific phrase from the sentence information based on the phrase information;
Based on the element classification information, element extraction means for extracting each phrase component included in the phrase in the sentence while classifying it into the plurality of types of classification items;
An information processing system comprising:
前記フレーズ情報が、
学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする情報処理システム。 The information processing system according to claim 1,
The phrase information is
An information processing system including information obtained by machine learning using a learning example corpus.
前記複数種類の分類項目が、
相対的に広い概念を示す用語が属する大分類と、相対的に狭い概念を示す用語が属する小分類と、接頭辞と、接尾辞と、を含むことを特徴とする情報処理システム。 The information processing system according to claim 2,
The plurality of types of classification items are
An information processing system comprising: a major classification to which terms representing relatively broad concepts belong; a minor classification to which terms representing relatively narrow concepts belong; a prefix; and a suffix.
前記要素抽出手段が、
前記接頭辞及び接尾辞に属するフレーズ構成要素については、前記文章中フレーズにおける前記大分類及び前記小分類に属する用語との位置関係に従って、前記大分類に属する用語に付された接頭辞であるのか、前記大分類に属する用語に付された接尾辞であるのか、前記小分類に属する用語に付された接頭辞であるのか、前記小分類に属する用語に付された接尾辞であるのかを分類しつつ抽出することを特徴とする情報処理システム。 The information processing system according to claim 3,
The element extraction means is
Whether the phrase component belonging to the prefix and suffix is a prefix attached to the term belonging to the major category according to the positional relationship with the term belonging to the major category and the minor category in the phrase in the sentence Categorizing whether it is a suffix attached to a term belonging to the major category, a prefix attached to a term belonging to the minor category, or a suffix attached to a term belonging to the minor category An information processing system characterized by performing extraction.
前記要素分類情報が、
前記接頭辞及び接尾辞にそれぞれ属するフレーズ構成要素をリスト形式で示した情報を含むことを特徴とする情報処理システム。 An information processing system according to claim 3 or claim 4, wherein
The element classification information is
An information processing system comprising information indicating in a list form phrase constituent elements respectively belonging to the prefix and suffix.
前記要素分類情報が、
学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする情報処理システム。 An information processing system according to any one of claims 1 to 5,
The element classification information is
An information processing system including information obtained by machine learning using a learning example corpus.
前記要素分類情報が、
前記学習用例コーパスを用いた機械学習で得られた特定フレーズを示す情報を、更に学習用例コーパスとして用いた機械学習によって得られた情報を含むことを特徴とする情報処理システム。 An information processing system according to any one of claims 2 to 5,
The element classification information is
An information processing system characterized in that information indicating a specific phrase obtained by machine learning using the learning example corpus further includes information obtained by machine learning used as a learning example corpus.
前記要素抽出手段によって前記文章中フレーズから抽出された複数のフレーズ構成要素からなるフレーズ構成要素群について、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて所定のデータベースに記憶する記憶制御手段、
を更に備えることを特徴とする情報処理システム。 An information processing system according to any one of claims 1 to 7,
Predetermined by associating each phrase component included in the phrase component group with each other according to a predetermined configuration rule of the phrase with respect to a phrase component group composed of a plurality of phrase components extracted from the phrase in the sentence by the element extraction means Storage control means for storing in the database of
An information processing system further comprising:
同義語群に対して代表語を関連付けた同義語データ、および類義語群に対して代表語を関連付けた類義語データのうちの少なくとも一方を含む辞書データを記憶する辞書データ記憶手段と、
前記フレーズ構成要素群から前記同義語群および前記類義語群のうちの少なくとも一方に属する語群所属語を検出する所属語検出手段と、
前記辞書データに基づいて、前記フレーズ構成要素群のうちの前記語群所属語を、当該語群所属語に対応する代表語に置換して置換後フレーズ構成要素群を生成する置換生成手段と、
を更に備え、
前記記憶制御手段が、
前記フレーズ構成要素群の代わりに前記置換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする情報処理システム。 The information processing system according to claim 8,
Dictionary data storage means for storing dictionary data including at least one of synonym data in which a representative word is associated with a synonym group, and synonym data in which a representative word is associated with a synonym group;
An affiliated word detection means for detecting a word group belonging word belonging to at least one of the synonym group and the synonym group from the phrase component group;
Based on the dictionary data, a replacement generating means for generating the replaced phrase component group by replacing the word group belonging word in the phrase component group with a representative word corresponding to the word group belonging word;
Further comprising
The storage control means is
An information processing system characterized in that instead of the phrase component group, each phrase component included in the post-substitution phrase component group is associated according to the predetermined configuration rule and stored in the predetermined database.
ユーザーによる操作に応答して、前記同義語群に対する代表語を当該同義語群に含まれる複数語から指定する第1の代表語指定、および前記類義語群に対する代表語を当該類義語群に含まれる複数語から指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段、
を更に備えることを特徴とする情報処理システム。 The information processing system according to claim 9,
In response to an operation by the user, a first representative word designating a representative word for the synonym group from a plurality of words included in the synonym group, and a plurality of representative words for the synonym group included in the synonym group Designation execution means for executing at least one of second representative word designations designated from words;
An information processing system further comprising:
前記受付手段によって受け付けられる複数の文章情報を対象として、前記辞書データに属する各語群所属語の出現回数を計算する出現回数算出手段と、
前記出現回数算出手段によって計算された出現回数に基づいて、前記同義語群に含まれる複数語のうち最も出現回数が多い語を当該同義語群に対する代表語として指定する第1の代表語指定、および前記類義語群に含まれる複数語のうち最も出現回数が多い語を当該類義語群に対する代表語として指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段と、
を更に備えることを特徴とする情報処理システム。 The information processing system according to claim 9,
Appearance frequency calculating means for calculating the appearance frequency of each word group belonging word belonging to the dictionary data for a plurality of text information received by the receiving means;
Based on the number of appearances calculated by the appearance number calculating means, a first representative word designation that designates a word having the highest number of appearances among a plurality of words included in the synonym group as a representative word for the synonym group, And designation execution means for executing at least one of the second representative word designation that designates a word that appears most frequently as a representative word for the synonym group among a plurality of words included in the synonym group;
An information processing system further comprising:
類似語群を示す類似語用例データを記憶する類似語記憶手段と、
前記類似語用例データに基づいて、前記フレーズ構成要素群から前記類似語群を構成する類似語群構成語を検出する構成語検出手段と、
前記フレーズ構成要素群のうちの前記類似語群構成語を、前記類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換して変換後フレーズ構成要素群を生成する変換生成手段と、
を更に備え、
前記記憶制御手段が、
前記フレーズ構成要素群とは別に前記変換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする情報処理システム。 An information processing system according to any one of claims 8 to 11,
Similar word storage means for storing similar word example data indicating a similar word group;
Based on the similar word example data, constituent word detecting means for detecting a similar word group constituent word constituting the similar word group from the phrase constituent element group;
The phrase component group after conversion by converting the similar word group component word in the phrase component group into another similar word group component word different from the similar word group component word constituting the similar word group. Conversion generating means for generating;
Further comprising
The storage control means is
In addition to the phrase component group, each phrase component included in the post-conversion phrase component group is associated according to the predetermined configuration rule and stored in the predetermined database.
前記所定のデータベースに基づいて、前記所定のデータベースに含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて当該各フレーズ構成要素どうしを連結して表示する表示手段、
を更に備えることを特徴とする情報処理システム。 An information processing system according to any one of claims 8 to 12,
Based on the predetermined database, display means for displaying the association between the phrase components included in the predetermined database by connecting the phrase components using a visible connection element;
An information processing system further comprising:
前記所定のデータベースにおける各フレーズ構成要素間の関連付けの頻度を計算する関連頻度算出手段と、
前記関連付けの頻度に基づいて、前記可視的な連結要素の態様を変更する要素変更手段と、
を更に備えることを特徴とする情報処理システム。 The information processing system according to claim 13,
Association frequency calculating means for calculating the frequency of association between each phrase component in the predetermined database;
Element changing means for changing the aspect of the visible connection element based on the association frequency;
An information processing system further comprising:
前記関連頻度算出手段が、
前記要素抽出手段によって抽出された前記フレーズ構成要素群に従って、前記関連付けの頻度を計算することを特徴とする情報処理システム。 The information processing system according to claim 14,
The related frequency calculating means is
An information processing system characterized in that the association frequency is calculated according to the phrase component group extracted by the element extraction means.
新規フレーズを入力する際に、前記所定のデータベースに基づき前記表示手段に複数要素が表示された画面上で、ユーザーの操作に応答して前記複数種類の分類項目のうちの少なくとも1つの項目に属する要素を前記新規フレーズを構成する要素として指示する要素指示手段、
を更に備えることを特徴とする情報処理システム。 An information processing system according to any one of claims 13 to 15,
When inputting a new phrase, it belongs to at least one of the plurality of types of classification items in response to a user operation on a screen on which a plurality of elements are displayed on the display unit based on the predetermined database Element indicating means for indicating an element as an element constituting the new phrase;
An information processing system further comprising:
ユーザーによる操作に応答して、新規なフレーズ構成要素群を示す手動追加データを入力する入力手段、
を更に備え、
前記記憶制御手段が、
前記手動追加データによって示されるフレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて所定のデータベースに記憶することを特徴とする情報処理システム。 The information processing system according to any one of claims 8 to 16,
An input means for inputting manually added data indicating a new phrase component group in response to a user operation,
Further comprising
The storage control means is
An information processing system, wherein each phrase component included in a phrase component group indicated by the manually added data is associated with each other according to the predetermined configuration rule and stored in a predetermined database.
(a)所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを準備するステップと、
(b)文章情報の入力を受け付けるステップと、
(c)前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するステップと、
(d)前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出するステップと、
を備えることを特徴とする情報処理方法。
An information processing method,
(a) Prepare phrase information indicating a specific phrase including multiple language elements including one or more language elements belonging to a predetermined category, and element classification information in which a large number of language elements are classified into a plurality of types of classification items. And steps to
(b) receiving text information input;
(c) based on the phrase information, extracting a phrase in the sentence corresponding to the specific phrase from the sentence information;
(d) extracting each phrase component included in the phrase in the sentence based on the element classification information while classifying it into the plurality of types of classification items;
An information processing method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005333193A JP2007140861A (en) | 2005-11-17 | 2005-11-17 | Information processing system, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005333193A JP2007140861A (en) | 2005-11-17 | 2005-11-17 | Information processing system, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007140861A true JP2007140861A (en) | 2007-06-07 |
Family
ID=38203643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005333193A Pending JP2007140861A (en) | 2005-11-17 | 2005-11-17 | Information processing system, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007140861A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009041586A1 (en) * | 2007-09-28 | 2009-04-02 | Canon Kabushiki Kaisha | Diagnosis support device and control method thereof |
WO2009054215A1 (en) * | 2007-10-23 | 2009-04-30 | Konica Minolta Medical & Graphic, Inc. | Information processing system and program |
WO2009079875A1 (en) * | 2007-12-14 | 2009-07-02 | Shanghai Hewlett-Packard Co., Ltd | Systems and methods for extracting phrases from text |
JP2010055471A (en) * | 2008-08-29 | 2010-03-11 | Fujitsu Ltd | Information processing program, information processing method and information processor |
JPWO2009025022A1 (en) * | 2007-08-20 | 2010-11-18 | コニカミノルタエムジー株式会社 | Information processing system and program |
JP2011100254A (en) * | 2009-11-05 | 2011-05-19 | Hitachi Medical Corp | Medical diagnostic report system, program for causing computer to function as the system, and method of supporting formation of medical diagnostic report |
JP2012200546A (en) * | 2011-03-28 | 2012-10-22 | Fujitsu Ltd | Medical examination information input device, program and medical examination information input method |
WO2018220688A1 (en) * | 2017-05-29 | 2018-12-06 | 株式会社Pfu | Dictionary generator, dictionary generation method, and program |
KR20220135841A (en) * | 2021-03-31 | 2022-10-07 | 한양대학교 산학협력단 | Art learning evaluation method and apparatus |
-
2005
- 2005-11-17 JP JP2005333193A patent/JP2007140861A/en active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2009025022A1 (en) * | 2007-08-20 | 2010-11-18 | コニカミノルタエムジー株式会社 | Information processing system and program |
JP2009082443A (en) * | 2007-09-28 | 2009-04-23 | Canon Inc | Diagnosis support device and control method thereof |
WO2009041586A1 (en) * | 2007-09-28 | 2009-04-02 | Canon Kabushiki Kaisha | Diagnosis support device and control method thereof |
US7894676B2 (en) | 2007-09-28 | 2011-02-22 | Canon Kabushiki Kaisha | Diagnosis support apparatus and control method therefor |
WO2009054215A1 (en) * | 2007-10-23 | 2009-04-30 | Konica Minolta Medical & Graphic, Inc. | Information processing system and program |
WO2009079875A1 (en) * | 2007-12-14 | 2009-07-02 | Shanghai Hewlett-Packard Co., Ltd | Systems and methods for extracting phrases from text |
US8812508B2 (en) | 2007-12-14 | 2014-08-19 | Hewlett-Packard Development Company, L.P. | Systems and methods for extracting phases from text |
JP2010055471A (en) * | 2008-08-29 | 2010-03-11 | Fujitsu Ltd | Information processing program, information processing method and information processor |
JP2011100254A (en) * | 2009-11-05 | 2011-05-19 | Hitachi Medical Corp | Medical diagnostic report system, program for causing computer to function as the system, and method of supporting formation of medical diagnostic report |
JP2012200546A (en) * | 2011-03-28 | 2012-10-22 | Fujitsu Ltd | Medical examination information input device, program and medical examination information input method |
WO2018220688A1 (en) * | 2017-05-29 | 2018-12-06 | 株式会社Pfu | Dictionary generator, dictionary generation method, and program |
KR20220135841A (en) * | 2021-03-31 | 2022-10-07 | 한양대학교 산학협력단 | Art learning evaluation method and apparatus |
KR102618313B1 (en) * | 2021-03-31 | 2023-12-27 | 한양대학교 산학협력단 | Art learning evaluation method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10529045B2 (en) | Information processing apparatus and information processing method | |
JP2007140861A (en) | Information processing system, information processing method, and program | |
US9971848B2 (en) | Rich formatting of annotated clinical documentation, and related methods and apparatus | |
JP5517524B2 (en) | Medical diagnosis support apparatus, control method and program for medical diagnosis support apparatus | |
JP4402033B2 (en) | Information processing system | |
US20060136824A1 (en) | Process official and business documents in several languages for different national institutions | |
CN102902872A (en) | Report check apparatus and computer program product | |
JP5837745B2 (en) | Medical report creation support device | |
US20130031456A1 (en) | Generating a structured document guiding view | |
US20190310981A1 (en) | Automated identification of salient finding codes in structured and narrative reports | |
US20130060793A1 (en) | Extracting information from medical documents | |
Artis et al. | Data omission by physician trainees on ICU rounds | |
Starren et al. | An object-oriented taxonomy of medical data presentations | |
US20100010806A1 (en) | Storage system for symptom information of Traditional Chinese Medicine (TCM) and method for storing TCM symptom information | |
Venturi et al. | NLP–based readability assessment of health–related texts: a case study on Italian informed consent forms | |
US8996357B2 (en) | Method for generating diagrams, and information processing apparatus for same | |
JP5251064B2 (en) | Interpretation report creation support device | |
Gashteovski et al. | BenchIE: A framework for multi-faceted fact-based open information extraction evaluation | |
CN116030932A (en) | Medicine recommendation system for hypertension | |
JP5151412B2 (en) | Notation fluctuation analyzer | |
US20130011027A1 (en) | System and method for composing a medical image analysis | |
US20110131234A1 (en) | Information process system, and program | |
Park et al. | Criteria2Query 3.0: Leveraging generative large language models for clinical trial eligibility query generation | |
CN112699669A (en) | Natural language processing, device and storage medium for fluid pathology survey report | |
JP5816321B2 (en) | Information processing apparatus, information processing system, information processing method, and program |