JP2007140861A - Information processing system, information processing method, and program - Google Patents

Information processing system, information processing method, and program Download PDF

Info

Publication number
JP2007140861A
JP2007140861A JP2005333193A JP2005333193A JP2007140861A JP 2007140861 A JP2007140861 A JP 2007140861A JP 2005333193 A JP2005333193 A JP 2005333193A JP 2005333193 A JP2005333193 A JP 2005333193A JP 2007140861 A JP2007140861 A JP 2007140861A
Authority
JP
Japan
Prior art keywords
phrase
information processing
group
processing system
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005333193A
Other languages
Japanese (ja)
Inventor
Susumu Yasunaga
晋 安永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Medical and Graphic Inc
Original Assignee
Konica Minolta Medical and Graphic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Medical and Graphic Inc filed Critical Konica Minolta Medical and Graphic Inc
Priority to JP2005333193A priority Critical patent/JP2007140861A/en
Publication of JP2007140861A publication Critical patent/JP2007140861A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technology capable of extracting elements belonging to a specified category appropriately. <P>SOLUTION: In a control unit 15, first by referring to specific part phrase information to be stored in a storage part 16, intrasentential phrase corresponding to a specific part phrase belonging to a comment sentence of an image reading report is extracted from sentence data to be inputted. Next, by referring to element sort information to be stored in the storage part 16, each element included in the extracted intrasentential phrase is extracted while being classified into many kinds of sort items. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、情報処理技術に関する。   The present invention relates to information processing technology.

文章から形態素分析によって単語を抽出し、単語を分類する技術が知られている。このような技術としては、例えば、医療関係の情報について、過去に作成された所見文を解析して部位に相当する語を抽出する技術が提案されている(例えば、特許文献1)。   A technique for extracting words from sentences by morphological analysis and classifying the words is known. As such a technique, for example, with respect to medical information, a technique for analyzing a finding sentence created in the past and extracting a word corresponding to a part has been proposed (for example, Patent Document 1).

特開2003−50863号公報JP 2003-50863 A

しかしながら、上記特許文献1の技術では、所定のカテゴリーに属する用語を抽出するのに、当該用語が所定のカテゴリーに属するか否かを1回の判定で決定するため、異なる意味を複数有する用語については、判定に誤りが生じてしまう。   However, in the technique of the above-mentioned Patent Document 1, in order to extract a term belonging to a predetermined category, whether or not the term belongs to a predetermined category is determined by one determination. Makes an error in the determination.

例えば、「右側頭葉の橋に腫瘍が見られる」という文において、部位に関する部分は「右側頭葉の橋」であり、更に細分化すると、「側頭葉」は部位を示す大分類、「右」は大分類の接頭辞、「橋」は部位を示す小分類に属する。そして、このような文から直接「橋」という語を抽出しようとすると、単純にリストを参照するだけでは、一般的な意味での「橋」も抽出してしまうといった誤りが生じる。   For example, in the sentence “A tumor is found in the right temporal lobe bridge”, the part related to the region is “the right temporal lobe bridge”, and further subdivided, the “temporal lobe” is a large classification indicating the region, “ “Right” is a major classification prefix, and “Bridge” is a minor classification indicating a site. Then, when trying to extract the word “bridge” directly from such a sentence, simply referring to the list causes an error that “bridge” in a general sense is also extracted.

本発明は、上記課題に鑑みてなされたものであり、所定のカテゴリーに属する要素を的確に抽出することができる技術を提供することを目的とする。   The present invention has been made in view of the above problems, and an object thereof is to provide a technique capable of accurately extracting elements belonging to a predetermined category.

上記の課題を解決するために、請求項1の発明は、情報処理システムであって、所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを記憶する分類用情報記憶手段と、文章情報の入力を受け付ける受付手段と、前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するフレーズ抽出手段と、前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出する要素抽出手段とを備えることを特徴とする。   In order to solve the above-mentioned problem, the invention of claim 1 is an information processing system, which is phrase information indicating a specific phrase including a plurality of language elements including one or more language elements belonging to a predetermined category, Classification information storage means for storing element classification information obtained by classifying a large number of language elements into a plurality of types of classification items, acceptance means for receiving input of sentence information, and the sentence information based on the phrase information Phrase extraction means for extracting a phrase in a sentence corresponding to a specific phrase, and element extraction for extracting each phrase component included in the phrase in the sentence while classifying it into the plurality of types of classification items based on the element classification information Means.

また、請求項2の発明は、請求項1に記載の情報処理システムであって、前記フレーズ情報が、学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする。   The invention according to claim 2 is the information processing system according to claim 1, wherein the phrase information includes information obtained by machine learning using an example corpus for learning.

また、請求項3の発明は、請求項2に記載の情報処理システムであって、前記複数種類の分類項目が、相対的に広い概念を示す用語が属する大分類と、相対的に狭い概念を示す用語が属する小分類と、接頭辞と、接尾辞と、を含むことを特徴とする。   The invention according to claim 3 is the information processing system according to claim 2, wherein the plurality of types of classification items include a large classification to which a term indicating a relatively broad concept belongs and a relatively narrow concept. It is characterized by including a small classification to which the term to show belongs, a prefix, and a suffix.

また、請求項4の発明は、請求項3に記載の情報処理システムであって、前記要素抽出手段が、前記接頭辞及び接尾辞に属するフレーズ構成要素については、前記文章中フレーズにおける前記大分類及び前記小分類に属する用語との位置関係に従って、前記大分類に属する用語に付された接頭辞であるのか、前記大分類に属する用語に付された接尾辞であるのか、前記小分類に属する用語に付された接頭辞であるのか、前記小分類に属する用語に付された接尾辞であるのかを分類しつつ抽出することを特徴とする。   The invention according to claim 4 is the information processing system according to claim 3, wherein the element extraction unit includes the major classification in the phrase in the sentence for phrase components belonging to the prefix and suffix. And a prefix attached to a term belonging to the major classification, a suffix attached to a term belonging to the major classification, or belonging to the minor classification according to a positional relationship with a term belonging to the minor classification It is extracted while classifying whether it is a prefix attached to a term or a suffix attached to a term belonging to the subclass.

また、請求項5の発明は、請求項3または請求項4に記載の情報処理システムであって、前記要素分類情報が、前記接頭辞及び接尾辞にそれぞれ属するフレーズ構成要素をリスト形式で示した情報を含むことを特徴とする。   The invention according to claim 5 is the information processing system according to claim 3 or claim 4, wherein the element classification information indicates phrase components respectively belonging to the prefix and suffix in a list format It is characterized by including information.

また、請求項6の発明は、請求項1から請求項5のいずれかに記載の情報処理システムであって、前記要素分類情報が、学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする。   The invention according to claim 6 is the information processing system according to any one of claims 1 to 5, wherein the element classification information includes information obtained by machine learning using a learning example corpus. It is characterized by that.

また、請求項7の発明は、請求項2から請求項5のいずれかに記載の情報処理システムであって、前記要素分類情報が、前記学習用例コーパスを用いた機械学習で得られた特定フレーズを示す情報を、更に学習用例コーパスとして用いた機械学習によって得られた情報を含むことを特徴とする。   The invention according to claim 7 is the information processing system according to any one of claims 2 to 5, wherein the element classification information is a specific phrase obtained by machine learning using the example corpus for learning. Is further included, including information obtained by machine learning using as an example corpus for learning.

また、請求項8の発明は、請求項1から請求項7のいずれかに記載の情報処理システムであって、前記要素抽出手段によって前記文章中フレーズから抽出された複数のフレーズ構成要素からなるフレーズ構成要素群について、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて所定のデータベースに記憶する記憶制御手段を更に備えることを特徴とする。   The invention according to claim 8 is the information processing system according to any one of claims 1 to 7, wherein the phrase includes a plurality of phrase components extracted from the phrase in the sentence by the element extraction unit. The constituent element group further includes storage control means for associating each phrase constituent element included in the phrase constituent element group with each other according to a predetermined constituent rule of the phrase and storing it in a predetermined database.

また、請求項9の発明は、請求項8に記載の情報処理システムであって、同義語群に対して代表語を関連付けた同義語データ、および類義語群に対して代表語を関連付けた類義語データのうちの少なくとも一方を含む辞書データを記憶する辞書データ記憶手段と、前記フレーズ構成要素群から前記同義語群および前記類義語群のうちの少なくとも一方に属する語群所属語を検出する所属語検出手段と、前記辞書データに基づいて、前記フレーズ構成要素群のうちの前記語群所属語を、当該語群所属語に対応する代表語に置換して置換後フレーズ構成要素群を生成する置換生成手段とを更に備え、前記記憶制御手段が、前記フレーズ構成要素群の代わりに前記置換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする。   The invention according to claim 9 is the information processing system according to claim 8, wherein the synonym data in which the representative word is associated with the synonym group, and the synonym data in which the representative word is associated with the synonym group. Dictionary data storage means for storing dictionary data including at least one of the above, and belonging word detection means for detecting a word group belonging word belonging to at least one of the synonym group and the synonym group from the phrase component group And a replacement generating means for generating a post-substitution phrase component group by replacing the word group belonging word in the phrase component group with a representative word corresponding to the word group belonging word based on the dictionary data And the storage control means replaces each of the phrase constituent elements included in the post-replacement phrase constituent element group with the predetermined constituent element instead of the phrase constituent element group. Associating accordance le and to store the predetermined database.

また、請求項10の発明は、請求項9に記載の情報処理システムであって、ユーザーによる操作に応答して、前記同義語群に対する代表語を当該同義語群に含まれる複数語から指定する第1の代表語指定、および前記類義語群に対する代表語を当該類義語群に含まれる複数語から指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段を更に備えることを特徴とする。   The invention according to claim 10 is the information processing system according to claim 9, wherein a representative word for the synonym group is designated from a plurality of words included in the synonym group in response to an operation by a user. It further comprises designation execution means for executing at least one of a first representative word designation and a second representative word designation that designates a representative word for the synonym group from a plurality of words included in the synonym group. To do.

また、請求項11の発明は、請求項9に記載の情報処理システムであって、前記受付手段によって受け付けられる複数の文章情報を対象として、前記辞書データに属する各語群所属語の出現回数を計算する出現回数算出手段と、前記出現回数算出手段によって計算された出現回数に基づいて、前記同義語群に含まれる複数語のうち最も出現回数が多い語を当該同義語群に対する代表語として指定する第1の代表語指定、および前記類義語群に含まれる複数語のうち最も出現回数が多い語を当該類義語群に対する代表語として指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段とを更に備えることを特徴とする。   The invention according to claim 11 is the information processing system according to claim 9, wherein the number of occurrences of each word group belonging word belonging to the dictionary data is determined for a plurality of text information received by the receiving means. Based on the number of occurrences to be calculated and the number of appearances calculated by the number of occurrences calculation means, the word having the highest number of appearances is designated as a representative word for the synonym group among a plurality of words included in the synonym group. A designation to execute at least one of a first representative word designation and a second representative word designation that designates a word that appears most frequently as a representative word for the synonym group among a plurality of words included in the synonym group And an execution means.

また、請求項12の発明は、請求項8から請求項11のいずれかに記載の情報処理システムであって、類似語群を示す類似語用例データを記憶する類似語記憶手段と、前記類似語用例データに基づいて、前記フレーズ構成要素群から前記類似語群を構成する類似語群構成語を検出する構成語検出手段と、前記フレーズ構成要素群のうちの前記類似語群構成語を、前記類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換して変換後フレーズ構成要素群を生成する変換生成手段とを更に備え、前記記憶制御手段が、前記フレーズ構成要素群とは別に前記変換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする。   The invention according to claim 12 is the information processing system according to any one of claims 8 to 11, wherein the similar word storage means stores similar word example data indicating a similar word group, and the similar word Based on example data, component word detecting means for detecting a similar word group component word constituting the similar word group from the phrase component group, and the similar word group component word in the phrase component group, Conversion generation means for generating a converted phrase component group by converting to another similar word group constituent word different from the similar word group constituent word constituting the similar word group, and the storage control means, Separately from the phrase component group, each phrase component included in the converted phrase component group is associated according to the predetermined configuration rule and stored in the predetermined database.

また、請求項13の発明は、請求項8から請求項12のいずれかに記載の情報処理システムであって、前記所定のデータベースに基づいて、前記所定のデータベースに含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて当該各フレーズ構成要素どうしを連結して表示する表示手段を更に備えることを特徴とする。   The invention according to claim 13 is the information processing system according to any one of claims 8 to 12, wherein each phrase component included in the predetermined database is based on the predetermined database. It further comprises display means for connecting and displaying the respective phrase constituent elements using a visible connection element.

また、請求項14の発明は、請求項13に記載の情報処理システムであって、前記所定のデータベースにおける各フレーズ構成要素間の関連付けの頻度を計算する関連頻度算出手段と、前記関連付けの頻度に基づいて、前記可視的な連結要素の態様を変更する要素変更手段とを更に備えることを特徴とする。   The invention according to claim 14 is the information processing system according to claim 13, wherein the association frequency calculating means for calculating the association frequency between each phrase component in the predetermined database, and the association frequency And an element changing means for changing the aspect of the visible connecting element.

また、請求項15の発明は、請求項14に記載の情報処理システムであって、前記関連頻度算出手段が、前記要素抽出手段によって抽出された前記フレーズ構成要素群に従って、前記関連付けの頻度を計算することを特徴とする。   The invention according to claim 15 is the information processing system according to claim 14, wherein the association frequency calculation means calculates the association frequency according to the phrase component group extracted by the element extraction means. It is characterized by doing.

また、請求項16の発明は、請求項13から請求項15のいずれかに記載の情報処理システムであって、新規フレーズを入力する際に、前記所定のデータベースに基づき前記表示手段に複数要素が表示された画面上で、ユーザーの操作に応答して前記複数種類の分類項目のうちの少なくとも1つの項目に属する要素を前記新規フレーズを構成する要素として指示する要素指示手段を更に備えることを特徴とする。   The invention according to claim 16 is the information processing system according to any one of claims 13 to 15, wherein when the new phrase is input, the display means includes a plurality of elements based on the predetermined database. The apparatus further comprises an element instruction means for instructing an element belonging to at least one of the plurality of types of classification items as an element constituting the new phrase in response to a user operation on the displayed screen. And

また、請求項17の発明は、請求項8から請求項16のいずれかに記載の情報処理システムであって、ユーザーによる操作に応答して、新規なフレーズ構成要素群を示す手動追加データを入力する入力手段を更に備え、前記記憶制御手段が、前記手動追加データによって示されるフレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて所定のデータベースに記憶することを特徴とする。   The invention according to claim 17 is the information processing system according to any one of claims 8 to 16, wherein manual additional data indicating a new phrase component group is input in response to an operation by a user. Input means, and the storage control means associates each phrase component included in the phrase component group indicated by the manually added data with each other according to the predetermined configuration rule and stores it in a predetermined database. And

また、請求項18の発明は、情報処理システムに含まれるコンピュータによって実行されることにより、前記情報処理システムを、請求項1から請求項17のいずれかに記載の情報処理システムとして機能させるプログラムである。   The invention according to claim 18 is a program for causing the information processing system to function as the information processing system according to any one of claims 1 to 17 by being executed by a computer included in the information processing system. is there.

また、請求項19の発明は、情報処理方法であって、(a)所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを準備するステップと、(b)文章情報の入力を受け付けるステップと、(c)前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するステップと、(d)前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出するステップとを備えることを特徴とする。   The invention according to claim 19 is an information processing method, comprising: (a) phrase information indicating a specific phrase including a plurality of language elements including one or more language elements belonging to a predetermined category, and a plurality of languages Preparing element classification information in which elements are classified into a plurality of types of classification items; (b) accepting input of sentence information; and (c) based on the phrase information, from the sentence information to the specific phrase. Extracting a corresponding phrase in the sentence; and (d) extracting each phrase component included in the phrase in the sentence while classifying it into the plurality of types of classification items based on the element classification information. It is characterized by that.

請求項1に記載の発明によれば、入力される文章から所定のカテゴリーに属する特定フレーズに対応するフレーズを抽出して、当該フレーズに含まれる各フレーズ構成要素を複数種類の分類項目に分類しつつ抽出するような構成を採用することで、2段階の抽出によって、的確に所定のカテゴリーに属する要素を抽出することができる。   According to the first aspect of the present invention, a phrase corresponding to a specific phrase belonging to a predetermined category is extracted from an input sentence, and each phrase component included in the phrase is classified into a plurality of types of classification items. By adopting a configuration in which extraction is performed, elements belonging to a predetermined category can be accurately extracted by two-stage extraction.

請求項2に記載の発明によれば、特定フレーズを学習用例コーパスを用いた機械学習で得るため、入力される文章から抽出するフレーズの種類を適正かつ効率的に増やすことができる。   According to the invention described in claim 2, since the specific phrase is obtained by machine learning using the learning example corpus, the types of phrases extracted from the inputted sentence can be increased appropriately and efficiently.

請求項3に記載の発明によれば、各フレーズ構成要素を、相対的に広い概念を示す用語が属する大分類と、相対的に狭い概念を示す用語が属する小分類と、接頭辞と、接尾辞とを含む複数種類の分類項目に分類しつつ抽出するため、各要素を細かく分類して抽出することができる。   According to the invention of claim 3, each phrase component is divided into a major classification to which a term indicating a relatively broad concept belongs, a minor classification to which a term representing a relatively narrow concept belongs, a prefix, and a suffix. Since extraction is performed while classifying into a plurality of types of classification items including words, each element can be classified and extracted finely.

請求項4に記載の発明によれば、接頭辞及び接尾辞に属するフレーズ構成要素については、フレーズにおける大分類及び小分類に属する用語との位置関係によって、大分類及び小分類の何れに属する用語に付された接頭辞又は接尾辞であるのかを分類しつつ抽出するため、各フレーズ構成要素をフレーズの構成に従って分類して抽出することができる。   According to invention of Claim 4, about the phrase component which belongs to a prefix and a suffix, the term which belongs to either a major classification or a minor classification by the positional relationship with the term which belongs to a major classification and a minor classification in a phrase. Therefore, each phrase component can be classified and extracted according to the phrase configuration.

請求項5に記載の発明によれば、接頭辞及び接尾辞に属する語を示したリストに従って、フレーズに含まれる接頭辞及び接尾辞にそれぞれ属するフレーズ構成要素を抽出するため、的確な接頭辞及び接尾辞の抽出を容易に実施することができる。   According to the invention described in claim 5, in order to extract the phrase components belonging to the prefix and the suffix included in the phrase according to the list indicating the words belonging to the prefix and the suffix, Suffix extraction can be performed easily.

請求項6に記載の発明によれば、学習用例コーパスを用いた機械学習により、フレーズに属する各フレーズ構成要素を分類するためのデータを取得するような構成により、フレーズから抽出する要素の種類を適正かつ効率的に増やすことができる。   According to the invention described in claim 6, the type of element extracted from the phrase is determined by a configuration in which data for classifying each phrase component belonging to the phrase is acquired by machine learning using the learning example corpus. It can be increased appropriately and efficiently.

請求項7に記載の発明によれば、学習用例コーパスを用いた機械学習で特定フレーズを示すデータを取得するとともに、当該特定フレーズを学習用例コーパスとして用いた機械学習により各フレーズ構成要素を分類するためのデータを取得するため、フレーズから抽出する要素の種類を的確に増やすことができる。   According to the seventh aspect of the present invention, data indicating a specific phrase is acquired by machine learning using the learning example corpus, and each phrase component is classified by machine learning using the specific phrase as the learning example corpus. In order to acquire the data for this, the kind of element extracted from a phrase can be increased exactly.

請求項8に記載の発明によれば、フレーズから抽出されたフレーズ構成要素群について、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けてデータベースに記憶するため、所定のカテゴリーに属する要素に関するフレーズの構成を示した情報をデータベース化することができる。   According to the invention described in claim 8, for the phrase component group extracted from the phrase, the phrase component elements included in the phrase component group are associated with each other according to a predetermined configuration rule of the phrase and stored in the database. Information indicating the composition of phrases related to elements belonging to a predetermined category can be stored in a database.

請求項9に記載の発明によれば、同義語群に対して代表語を関連付けた同義語データ、および類義語群に対して代表語を関連付けた類義語データのうちの少なくとも一方を含む辞書データを準備しておき、当該辞書データを参照することでフレーズ構成要素群のうち辞書データに含まれる語群所属語が抽出された場合、当該語群素属語を対応する代表語に置き換えたフレーズ構成要素群に係る関連付け情報をデータベースに記憶するため、所定のカテゴリーに属する要素に関するフレーズの構成を示した情報を表現が統一された状態でデータベース化することができる。   According to the ninth aspect of the present invention, dictionary data including at least one of synonym data in which a representative word is associated with a synonym group and synonym data in which a representative word is associated with a synonym group is prepared. When a word group belonging word included in the dictionary data is extracted from the phrase component group by referring to the dictionary data, the phrase component element in which the word group elementary word is replaced with the corresponding representative word Since the association information related to the group is stored in the database, the information indicating the configuration of the phrase relating to the element belonging to the predetermined category can be made into a database in a state where the expressions are unified.

請求項10に記載の発明によれば、ユーザーが、同義語群や類義語群に対する代表語を、当該同義語群や類義語群自体にそれぞれ属する複数語から指定することができるため、ユーザーの癖等を反映したカスタマイズが可能となる。   According to the invention described in claim 10, since the user can specify a representative word for the synonym group or the synonym group from a plurality of words belonging to the synonym group or the synonym group itself, Customization that reflects can be made possible.

請求項11に記載の発明によれば、同義語群や類義語群に対する代表語を、当該同義語群や類義語群自体にそれぞれ属する複数語のうちの出現回数の最も多い語とするため、使用実態に沿って各要素を細かく分類することができる。   According to the invention described in claim 11, since the representative word for the synonym group or the synonym group is the word having the highest number of appearances among the plurality of words belonging to the synonym group or the synonym group itself, Each element can be finely classified along

請求項12に記載の発明によれば、類似語群を示す類似語用例データを準備しておき、当該類似語用例データに基づいて、フレーズ構成要素群から類似語群を構成する類似語群構成語を検出した場合には、フレーズ構成要素群のうちの類似語群構成語を、類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換して変換後フレーズ構成要素群を生成し、当該変換後フレーズ構成要素群に係る関連付け情報をデータベースに記憶するため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をより充実化させることができる。   According to the twelfth aspect of the present invention, the similar word group configuration that prepares the similar word example data indicating the similar word group and configures the similar word group from the phrase component group based on the similar word example data. When a word is detected, the similar word group constituent word in the phrase constituent group is converted into another similar word group constituent word different from the similar word group constituent word constituting the similar word group, and then converted. Since the phrase component group is generated and the association information related to the converted phrase component group is stored in the database, the information indicating the phrase configuration related to the element belonging to the predetermined category can be further enriched.

請求項13に記載の発明によれば、所定のデータベースに基づいて、所定のデータベースに含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて表示するような構成とすることで、所定のカテゴリーに属する要素に関するフレーズの構成を一目で把握することができる。   According to the invention of claim 13, based on a predetermined database, it is configured to display an association between each phrase component included in the predetermined database using a visible connection element. The composition of phrases related to elements belonging to a predetermined category can be grasped at a glance.

請求項14に記載の発明によれば、所定のデータベースにおける関連付けの頻度を計算しておき、当該関連付けの頻度に基づいて、各フレーズ構成要素を連結する可視的な連結要素の態様を変更するような構成により、関連付けが強いものについては、一目で他の関連付けとは区別して把握することができる。   According to the fourteenth aspect of the present invention, the association frequency in the predetermined database is calculated, and based on the association frequency, the aspect of the visual coupling element that links the phrase components is changed. With a simple configuration, a strong association can be grasped at a glance from other associations.

請求項15に記載の発明によれば、文章中のフレーズから抽出されたフレーズ構成要素群に従って、関連付けの頻度を計算するような構成により、使用実態を正確に反映した表示態様となるため、実際に頻繁に使用されるフレーズの構成を把握し易くなる。   According to the invention described in claim 15, the display mode that accurately reflects the actual usage is obtained by the configuration in which the association frequency is calculated according to the phrase component group extracted from the phrase in the sentence. This makes it easier to understand the composition of phrases that are frequently used.

請求項16に記載の発明によれば、新規フレーズを入力する際に、所定のデータベースに基づいて表示される画面上で、ユーザーの操作に応答して複数種類の分類項目のうちの少なくとも1つの項目に属するフレーズ構成要素を新規フレーズを構成するフレーズ構成要素として指示することができるような構成とすることで、過去の知識を利用することで新規フレーズの入力操作を簡略化することができる。   According to the invention described in claim 16, when inputting a new phrase, on a screen displayed based on a predetermined database, at least one of a plurality of types of classification items in response to a user operation. By adopting a configuration in which a phrase component belonging to an item can be designated as a phrase component constituting a new phrase, a new phrase input operation can be simplified by using past knowledge.

請求項17に記載の発明によれば、ユーザーが新規なフレーズ構成要素群を示す追加データを入力すると、当該追加データによって示されるフレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けてデータベースに記憶するため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をユーザーが適宜充実化させることができる。   According to the invention described in claim 17, when the user inputs additional data indicating a new phrase component group, each phrase component included in the phrase component group indicated by the additional data is replaced with a predetermined phrase. Since the information is associated and stored in the database according to the configuration rule, the user can appropriately enrich the information indicating the phrase configuration related to the elements belonging to the predetermined category.

請求項18に記載の発明によれば、請求項1から請求項17のいずれかに記載の発明と同様な効果を奏する。   According to the invention of claim 18, the same effect as that of any of claims 1 to 17 can be obtained.

請求項19に記載の発明によれば、請求項1に記載の発明と同様な効果を奏する。   According to the nineteenth aspect, the same effect as the first aspect can be obtained.

以下、本発明の実施形態を図面に基づいて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

<情報処理システムの構成>
図1は、本発明の実施形態に係る情報処理システム1の外観構成を例示する図である。情報処理システム1は、パーソナルコンピュータ(パソコン)において所定のプログラムが実行されることで実現される。図2は、情報処理システム1の機能構成を示すブロック図を示している。なお、本実施形態では、一例として、情報処理システム1が、病院において読影レポートの所見文を対象とした情報処理を行うものとして説明する。
<Configuration of information processing system>
FIG. 1 is a diagram illustrating an external configuration of an information processing system 1 according to an embodiment of the present invention. The information processing system 1 is realized by executing a predetermined program in a personal computer (personal computer). FIG. 2 is a block diagram illustrating a functional configuration of the information processing system 1. In the present embodiment, as an example, the information processing system 1 will be described as performing information processing on the findings of an interpretation report in a hospital.

図1に示すように、情報処理システム1は、箱状の形状を有する処理部11と、操作部12と、表示部13とを有している。   As illustrated in FIG. 1, the information processing system 1 includes a processing unit 11 having a box shape, an operation unit 12, and a display unit 13.

処理部11の前面には、光ディスク91を挿入するドライブ101と、メモリカード92を挿入するドライブ102とが設けられている。   A drive 101 for inserting the optical disk 91 and a drive 102 for inserting the memory card 92 are provided on the front surface of the processing unit 11.

また、操作部12は、マウス121とキーボード122とを有しており、ユーザーから処理部11に対する入力操作を受付ける。   The operation unit 12 includes a mouse 121 and a keyboard 122, and receives an input operation on the processing unit 11 from a user.

表示部13は、例えばCRTで構成され、表示手段として機能する。   The display unit 13 is composed of, for example, a CRT and functions as a display unit.

また、図2に示すように、情報処理システム1の処理部11は、上記の操作部12および表示部13に接続する入出力I/F14と、入出力I/F14に電気的に接続する制御部15とを備えている。また、処理部11は、制御部15に電気的に接続する記憶部16と、入出力I/F17とを備えている。   As shown in FIG. 2, the processing unit 11 of the information processing system 1 includes an input / output I / F 14 connected to the operation unit 12 and the display unit 13 and a control electrically connected to the input / output I / F 14. Part 15. The processing unit 11 includes a storage unit 16 that is electrically connected to the control unit 15 and an input / output I / F 17.

入出力I/F14は、操作部12および表示部13と制御部15との間でデータの送受信をコントロールするためのインターフェースである。   The input / output I / F 14 is an interface for controlling transmission / reception of data between the operation unit 12, the display unit 13, and the control unit 15.

記憶部16は、例えばハードディスクなどを備えて構成されており、プログラム161、分類用情報162、辞書データベース(辞書DB)163、使用頻度データ164、及び関連付けデータベース(関連付けDB)165を記憶している。   The storage unit 16 includes, for example, a hard disk, and stores a program 161, classification information 162, a dictionary database (dictionary DB) 163, usage frequency data 164, and an association database (association DB) 165. .

プログラム161は、後述する言語処理等を含む情報処理を実行するためのプログラム(情報処理用プログラム)である。   The program 161 is a program (information processing program) for executing information processing including language processing described later.

分類用情報162は、例えば、医療分野の所見文に含まれる特定部位を示すフレーズ(以下「特定部位フレーズ」とも称する)に係る情報(特定部位フレーズ情報)と、当該特定部位フレーズを構成する構成要素(ここでは、多数の構成語)について複数種類の分類項目にそれぞれ属する要素(ここでは、語)を示す情報(以下「要素分類情報」とも称する)とを含む。   The classification information 162 includes, for example, information (specific part phrase information) related to a phrase indicating a specific part (hereinafter, also referred to as “specific part phrase”) included in a finding sentence in the medical field, and the specific part phrase. It includes information (hereinafter, also referred to as “element classification information”) indicating elements (here, words) belonging to a plurality of types of classification items for the elements (here, a large number of constituent words).

ここで、特定部位フレーズは、所定のカテゴリー(ここでは、解剖学的知識)に属する1以上の要素(ここでは、用語)を含む複数語を構成要素とするものであり、特定部位フレーズ情報は、文章データから特定部位フレーズに対応するフレーズを抽出するモデルである。なお、本明細書では、「特定部位フレーズ」は、所定のカテゴリーに属する特定要素を含むフレーズであり、適宜「特定フレーズ」とも称する。   Here, the specific part phrase is composed of a plurality of words including one or more elements (here, terms) belonging to a predetermined category (here, anatomical knowledge), and the specific part phrase information is This is a model for extracting a phrase corresponding to a specific part phrase from sentence data. In the present specification, the “specific part phrase” is a phrase including a specific element belonging to a predetermined category, and is also referred to as a “specific phrase” as appropriate.

また、要素分類情報は、抽出されたフレーズから複数要素(ここでは、複数語)を認識して複数種類の分類項目に分類するモデルである。複数種類の分類項目としては、部位を示す比較的広い概念を示す用語が属する「大分類」、部位を示す比較的狭い概念を示す用語が属する「小分類」、及び用語に付される「接頭辞(接頭語)」や「接尾辞(接尾語)」等が挙げられる。   The element classification information is a model that recognizes a plurality of elements (here, a plurality of words) from the extracted phrases and classifies them into a plurality of types of classification items. As multiple types of classification items, there are “major classification” to which a term indicating a relatively broad concept indicating a part belongs, “small classification” to which a term indicating a relatively narrow concept indicating a part belongs, and “prefix” attached to the term "Suffix (prefix)" and "suffix (suffix)".

辞書DB163は、同義語や類義語や類似語に関する情報を格納するデータベースである。   The dictionary DB 163 is a database that stores information on synonyms, synonyms, and similar words.

図3は、辞書DB163に格納される同義語及び類義語に関する情報(同類義語情報)を示す図である。図3に示すように、同類義語情報は、複数の同義語によって構成される集合(同義語群)や複数の類似語によって構成される集合(類義語群)に対して、それぞれ代表語が関連付けられた情報である。そして、図3に示す同類義語情報では、同義語又は類義語の集合(例えば、「側頭葉・側頭部・側脳室」「後頭葉・後頭部」「白質・white matter」)が右方に、そして、各集合の左方にそれぞれ対応する代表語(「側頭葉」「後頭葉」「白質」)が記述されたリスト形式の情報となっている。   FIG. 3 is a diagram illustrating information on synonyms and synonyms (synonym information) stored in the dictionary DB 163. As shown in FIG. 3, the synonym information is associated with a representative word for a set (synonym group) composed of a plurality of synonyms and a set (synonym group) composed of a plurality of similar words. Information. In the synonym information shown in FIG. 3, a synonym or a set of synonyms (for example, “temporal lobe / temporal / lateral ventricle”, “occipital lobe / occipital”, “white matter / white matter”) is to the right. In addition, the information is in a list format in which representative words (“temporal lobe”, “occipital lobe”, “white matter”) corresponding to the left side of each set are described.

図4は、辞書DB163に格納される類似語に関する情報(類似語情報)を示す図である。図4に示すように、類似語情報は、複数の類似語によって構成される集合(類似語群)を示す用例データ(類似語用例データ)が複数個格納された情報である。   FIG. 4 is a diagram illustrating information related to similar words (similar word information) stored in the dictionary DB 163. As illustrated in FIG. 4, the similar word information is information in which a plurality of example data (similar word example data) indicating a set (similar word group) composed of a plurality of similar words is stored.

また、使用頻度データ164は、辞書DB163に含まれる同義語群や類義語群に属する各語について、複数の所見文中で出現した回数を示すデータである。この使用頻度データ164は、後述する所見文の構成要素分類抽出動作において生成及び利用される。この使用頻度データ164の生成および利用については、所見文の構成要素分類抽出動作を説明する際に併せて述べる。   Further, the usage frequency data 164 is data indicating the number of times each word belonging to the synonym group and the synonym group included in the dictionary DB 163 appears in a plurality of finding sentences. This usage frequency data 164 is generated and used in a component sentence classification extraction operation of a finding sentence to be described later. The generation and use of the usage frequency data 164 will be described together with the explanation of the component sentence classification extraction operation of the finding sentence.

更に、関連付けDB165は、後述する所見文の構成要素分類抽出動作の結果得られるデータが蓄積されたデータベースである。また、この関連付けDB165は、後述する読影レポート作成動作において利用される。よって、この関連付けDB165の生成および利用については、所見文の構成要素分類抽出動作及び読影レポート作成動作を説明する際に併せて述べる。   Further, the association DB 165 is a database in which data obtained as a result of a component sentence classification extraction operation of a finding sentence to be described later is accumulated. The association DB 165 is used in an interpretation report creation operation described later. Therefore, the generation and use of this association DB 165 will be described together with the explanation of the component sentence classification extraction operation and the interpretation report creation operation of the finding sentence.

制御部15は、CPU15aおよびメモリ15bを有しており、パソコン、すなわち情報処理システム1の動作を統括制御し、ユーザーの操作やプログラム161などに基づいて情報処理全般を制御する部位である。ここでは、ユーザーによる操作部12の種々の操作に基づき、制御部15が、記憶部16に格納されているプログラム161を読み込んで実行することにより、各種情報処理が実現される。なお、制御部15は、光ディスク91やメモリカード92に記録されている各種データやプログラムを入出力I/F17を介して読み込んで、各種制御を実行することもできる。また、制御部15において一時的に生成されるデータは、メモリ15b等に適宜一時記憶される。   The control unit 15 includes a CPU 15a and a memory 15b, and is a part that performs overall control of the operation of the personal computer, that is, the information processing system 1, and controls overall information processing based on user operations, programs 161, and the like. Here, based on various operations of the operation unit 12 by the user, the control unit 15 reads and executes the program 161 stored in the storage unit 16, thereby realizing various information processing. The control unit 15 can also read various data and programs recorded on the optical disc 91 and the memory card 92 via the input / output I / F 17 and execute various controls. Further, data temporarily generated in the control unit 15 is temporarily stored in the memory 15b or the like as appropriate.

図5は、情報処理システム1の機能構成のうち、分類用情報162の取得動作、所見文の構成要素分類抽出動作、及び読影レポート作成動作時において、制御部15において実現される機能を併せて示している。なお、図5に示す機能は、制御部15にプログラム161が読み込まれて実行されることで実現される。   FIG. 5 shows the functions realized in the control unit 15 during the operation of acquiring the classification information 162, the operation of extracting the constituent elements of the observation sentence, and the operation of creating the interpretation report among the functional configurations of the information processing system 1. Show. Note that the functions shown in FIG. 5 are realized by the program 161 being read and executed by the control unit 15.

以下、図5を適宜参照しながら、分類用情報162の取得動作、所見文の構成要素分類抽出動作、及び読影レポート作成動作について、順次説明する。   Hereinafter, with reference to FIG. 5 as appropriate, the operation of obtaining the classification information 162, the component sentence classification extraction operation of the finding sentence, and the interpretation report creation operation will be described in order.

<分類用情報の取得動作>
図5で示すように、分類用情報の取得動作が実行される際には、制御部15は、機能として、機械学習部151、及び分類データ生成部152を備えて構成される。
<Acquisition operation of classification information>
As shown in FIG. 5, when the classification information acquisition operation is executed, the control unit 15 includes a machine learning unit 151 and a classification data generation unit 152 as functions.

機械学習部151は、例えば、光ディスク91やメモリカード92等から適宜学習用例コーパスや教師データが与えられると、特定部位フレーズ情報と要素分類情報とを構成する情報を得ることができ、分類データ生成部152によって分類用情報162が生成されて記憶部16に記憶される。以下、分類用情報の取得動作について具体例を示しつつ説明する。   The machine learning unit 151 can obtain information constituting the specific part phrase information and the element classification information when the learning example corpus or the teacher data is appropriately given from the optical disc 91 or the memory card 92, for example, and generates classification data. The classification information 162 is generated by the unit 152 and stored in the storage unit 16. The classification information acquisition operation will be described below with a specific example.

まず、特定部位フレーズ情報を取得する動作について説明する。   First, the operation | movement which acquires specific site | part phrase information is demonstrated.

ここでは、特定部位フレーズ用の学習用例コーパスは、解剖学的知識に基づく文章を示すテキストデータであり、特定部位フレーズ用の教師データは、解剖学的知識に属する1以上の言語の要素(以下「言語要素」とも称し、ここでは、用語)を含む複数言語要素を構成要素とするフレーズ(学習用フレーズ)を示すデータである。   Here, the learning example corpus for the specific part phrase is text data indicating a sentence based on anatomical knowledge, and the teacher data for the specific part phrase is one or more language elements (hereinafter referred to as anatomical knowledge). It is also referred to as “language element”, and here is data indicating a phrase (learning phrase) having a plurality of language elements including terms) as constituent elements.

例えば、特定部位フレーズ用の学習用例コーパスに、学習用フレーズに一致するフレーズがあれば、特定部位フレーズとして認識し、当該特定部位フレーズの蓄積により特定部位フレーズ情報が構築される。ここでは、学習用例コーパスを形態素解析によって形態素に分解し、形態素毎に形態素そのもの、形態素の品詞、形態素の活用形、前後の形態素の情報等を用いて、その形態素が特定部位フレーズに含まれるか否かを推定することで、特定部位フレーズを認識することができる。   For example, if there is a phrase that matches the learning phrase in the learning example corpus for the specific part phrase, it is recognized as the specific part phrase, and the specific part phrase information is constructed by accumulating the specific part phrase. Here, the learning example corpus is decomposed into morphemes by morpheme analysis, and whether each morpheme is included in the specific part phrase using the morpheme itself, the morpheme part of speech, the morpheme utilization form, the information on the morpheme before and after, etc. By estimating whether or not, the specific part phrase can be recognized.

更に具体例を挙げて説明する。   Furthermore, a specific example is given and demonstrated.

例えば、学習用例コーパスに「側頭葉の白質に異常が見られる」という文があり、学習用フレーズ「側頭葉の白質(側頭葉/の/白質)」が与えられている場合には、フレーズ「側頭葉の白質」が特定部位フレーズとして認識される。   For example, if there is a sentence in the learning example corpus that “abnormalities in white matter of temporal lobe” are found and the learning phrase “temporal lobe white matter (temporal lobe / no / white matter)” is given The phrase “temporal lobe white matter” is recognized as the specific part phrase.

また、例えば、学習用例コーパスに「**に沿って炎症が広がる」(「**」部には種々の語が入る)といった形の文が頻出する場合には、「**に沿って」が部位を示すフレーズであると想定される為、フレーズ「**に沿って(**/に/沿って)」が特定部位フレーズと認識される。このような特定部位フレーズの認識を行うと、例えば、学習用例コーパスに「下垂体」という用語がなくても、他の文章データを対象として、語の前後関係からフレーズ「下垂体/に/沿って」を特定部位フレーズに対応するフレーズとして抽出することができる。   In addition, for example, when a sentence in the form of “inflammation spreads along **” (various words are entered in the “**” part) frequently appears in the learning example corpus, “following **” Is assumed to be a phrase indicating a part, the phrase “along ** (** / along)” is recognized as a specific part phrase. When such a specific part phrase is recognized, for example, even if the term “pituitary gland” does not exist in the learning example corpus, the phrase “pituitary gland / along / Can be extracted as a phrase corresponding to the specific part phrase.

なお、上記機械学習は、奈良先端科学技術大学院大学で開発されたプログラム「Yamcha」等を用いることで高精度に行うことができる。このプログラム「Yamcha」は、いわゆるSVM(Support Vector Machine)を利用したものである。   The machine learning can be performed with high accuracy by using a program “Yamcha” developed at Nara Institute of Science and Technology. This program “Yamcha” uses a so-called SVM (Support Vector Machine).

このように、特定部位フレーズを学習用例コーパスを用いた機械学習で得ることで、入力される文章から抽出するフレーズの種類を適正かつ効率的に増やすことができる。   Thus, by obtaining the specific part phrase by machine learning using the learning example corpus, the types of phrases extracted from the input sentence can be increased appropriately and efficiently.

次に、要素分類情報を取得する動作について説明する。この要素分類情報については、4種類の分類項目「大分類」「小分類」「接頭辞」「接尾辞」にそれぞれ属する要素(ここでは、語)の情報を教師データとして与え、学習用例コーパスを用いた機械学習によって得ることができる。例えば、学習用例コーパスに教師データで与えられた語が存在する場合には、当該語を対応する分類項目と関連付ける動作を繰り返すことで、要素分類情報が取得される。このような構成により、文章中フレーズから抽出する要素の種類を適正かつ効率的に増やすことができる。   Next, an operation for acquiring element classification information will be described. For this element classification information, information of elements (here, words) belonging to four types of classification items “major classification”, “minor classification”, “prefix”, and “suffix” are given as teacher data, and an example corpus for learning is given. It can be obtained by the machine learning used. For example, when the word given by the teacher data exists in the learning example corpus, the element classification information is acquired by repeating the operation of associating the word with the corresponding classification item. With such a configuration, the types of elements extracted from the phrase in the sentence can be increased appropriately and efficiently.

なお、要素分類情報を取得する際の学習用例コーパスとしては、上記特定部位フレーズ情報に含まれる特定部位フレーズを用いると良い。これは、要素分類情報が、特定部位フレーズに対応するフレーズに含まれる複数要素(複数のフレーズ構成要素)を複数種類の分類項目に分類しつつ抽出するためのものであるからであり、フレーズから抽出する要素の種類を的確に増やすことができる。   In addition, as an example corpus for learning when acquiring element classification information, it is good to use the specific part phrase contained in the said specific part phrase information. This is because the element classification information is for extracting a plurality of elements (a plurality of phrase constituent elements) included in the phrase corresponding to the specific part phrase while classifying them into a plurality of types of classification items. The types of elements to be extracted can be accurately increased.

<所見文の構成要素分類抽出動作>
図5で示すように、構成要素分類抽出動作が実行される際には、制御部15は、機能として、文章データ受付部153、形態素解析部154、フレーズ抽出部155、分類抽出部156、同義・類義・類似語検出部157、置換データ生成部158、記憶制御部159、関連頻度算出部160を備えて構成される。
<Extraction sentence component extraction operation>
As illustrated in FIG. 5, when the component classification extraction operation is executed, the control unit 15 functions as a sentence data reception unit 153, a morpheme analysis unit 154, a phrase extraction unit 155, a classification extraction unit 156, and is synonymous. A synonym / similarity detection unit 157, a replacement data generation unit 158, a storage control unit 159, and a related frequency calculation unit 160 are configured.

図6は、構成要素分類抽出動作の動作フローを示すフローチャートである。本動作フローは、制御部15においてプログラム161が実行されることで実現される。   FIG. 6 is a flowchart showing the operation flow of the component classification extraction operation. This operation flow is realized by executing the program 161 in the control unit 15.

以下、図5を参照しつつ、図6に示す構成要素分類抽出の動作フローについて説明する。まず、例えば、読影レポートの所見文の入力が可能な状態となると、図6のステップS1に進む。   Hereinafter, the operation flow of the component element classification extraction shown in FIG. 6 will be described with reference to FIG. First, for example, when it becomes possible to input a finding sentence of an interpretation report, the process proceeds to step S1 in FIG.

ステップS1では、文章データ受付部153が所見文を示すデータを受け付け、ステップS2に進む。ここでは、ユーザーが操作部12を種々操作することで所見文を示すデータが入力されて、受け付けられる。   In step S1, the text data receiving unit 153 receives data indicating a finding sentence, and the process proceeds to step S2. Here, data indicating a finding sentence is input and accepted by various operations of the operation unit 12 by the user.

ステップS2では、形態素解析部154により、ステップS1で受け付けた所見文を対象とした形態素解析が行われ、ステップS3に進む。ここでは、例えば、「右側頭葉の橋に腫瘍が見られる」という所見文が入力されたと仮定すると、形態素解析によって「右/側頭葉/の/橋/に/腫瘍/が/見/られる」と分解される。   In step S2, the morpheme analysis unit 154 performs morpheme analysis on the finding sentence received in step S1, and the process proceeds to step S3. Here, for example, assuming that a finding sentence that “a tumor is found in the right temporal lobe bridge” is input, “right / temporal lobe / no / bridge / in / tumor / is / is seen / is seen by morphological analysis. Is broken down.

ステップS3では、フレーズ抽出部155により、分類用情報162内の特定部位フレーズ情報を参照することで、ステップS2で形態素解析が行われた所見文から特定部位フレーズに対応するフレーズ(以下「文章中フレーズ」とも称する)を抽出し、ステップS4に進む。ここでは、例えば、「右/側頭葉/の/橋/に/腫瘍/が/見/られる」という形態素解析後の所見文から文章中フレーズ「右/側頭葉/の/橋」が抽出される。   In step S3, the phrase extraction unit 155 refers to the specific part phrase information in the classification information 162, so that the phrase corresponding to the specific part phrase (hereinafter referred to as “in the sentence” from the finding sentence in which the morphological analysis was performed in step S2). (Also referred to as “phrase”), and the process proceeds to step S4. Here, for example, the phrase “right / temporal lobe / no / bridge” in the sentence is extracted from the observation sentence after the morphological analysis of “right / temporal lobe / no / bridge / ni / tumor / gae / see / is”. Is done.

ステップS4では、分類抽出部156により、分類用情報162内の要素分類情報を参照することで、ステップS3で抽出された文章中フレーズを構成する複数のフレーズ構成要素を、複数種類の分類項目「大分類」「小分類」「接頭辞」「接尾辞」等に分類しつつ抽出し、ステップS5に進む。ここでは、例えば、「右側頭葉の橋」という文章中フレーズから、「側頭葉」を「大分類」として、「右」を「接頭辞」として、「橋」を「小分類」として抽出する。このような分類手法を採用することで各フレーズ構成要素を細かく分類して抽出することができる。   In step S4, by referring to the element classification information in the classification information 162 by the classification extraction unit 156, a plurality of phrase constituent elements constituting the phrase in the sentence extracted in step S3 are converted into a plurality of types of classification items “ Extraction is performed while classifying into “major category”, “minor category”, “prefix”, “suffix”, etc., and the process proceeds to step S5. Here, for example, from the phrase “bridge on the right temporal lobe”, “temporal lobe” is extracted as “major classification”, “right” as “prefix”, and “bridge” as “minor classification”. To do. By adopting such a classification method, each phrase component can be classified and extracted finely.

また、分類項目「接頭辞」及び「接尾辞」については、単に属する要素を分類項目「接頭辞」及び「接尾辞」に分類して抽出するだけでなく、ここでは、更に、文章中フレーズにおける「大分類」及び「小分類」に属する用語との位置関係から、「大分類に属する用語に付された接頭辞(大分類接頭辞)」「大分類に属する用語に付された接尾辞(大分類接尾辞)」「小分類に属する用語に付された接頭辞(小分類接頭辞)」及び「小分類に属する用語に付された接尾辞(小分類接尾辞)」に分類しつつ抽出する。よって、例えば、上記「右側頭葉の橋」という文章中フレーズから、「右」が分類項目「大分類接頭辞」に属する要素として分類されつつ抽出される。このような構成により各フレーズ構成要素をフレーズの構成に従って分類して抽出することができる。なお、以下、1つの文章中フレーズから抽出される複数のフレーズ構成要素のことを、適宜「フレーズ構成要素群」とも称する。   In addition, for the classification items “prefix” and “suffix”, the elements to which they belong are not only classified and extracted into the classification items “prefix” and “suffix”. From the positional relationship with the terms belonging to “major category” and “minor category”, “the prefix attached to the term belonging to the major category (major category prefix)” and “the suffix attached to the term belonging to the major category ( Major classification suffix) "" Prefix attached to the term belonging to the minor category (subcategory prefix) "and" Suffix attached to the term belonging to the minor category (subcategory suffix) " To do. Therefore, for example, “right” is extracted while being classified as an element belonging to the classification item “major classification prefix” from the phrase “bridge on the right temporal lobe”. With such a configuration, each phrase component can be classified and extracted according to the phrase configuration. Hereinafter, a plurality of phrase components extracted from one phrase in a sentence are also referred to as a “phrase component group” as appropriate.

ステップS5では、同義・類義・類似語検出部157により、辞書DB163内の同類義語情報を参照することで、ステップS4で抽出されたフレーズ構成要素群から、同類義語情報に含まれる同義語群及び類義語群に属する語(同類義語群所属語)を検出した場合には、ステップS6に進み、検出しなかった場合には、ステップS7に進む。   In step S5, the synonym group included in the synonym information is extracted from the phrase component group extracted in step S4 by referring to the synonym information in the dictionary DB 163 by the synonym / synonym / similar word detection unit 157. If a word belonging to the synonym group (synonym group belonging word) is detected, the process proceeds to step S6. If not detected, the process proceeds to step S7.

ステップS6では、置換データ生成部158により、辞書DB163内の同類義語情報を参照することで、ステップS4からステップS5にかけて検出された同類義語群所属語を対応する代表語に置換したフレーズ構成要素群(置換後フレーズ構成要素群)を生成し、ステップS7に進む。ここで、同義語や類義語を1つの代表語に置換するのは、同じような意味の言葉を一つの表現に統一することで、データベース中で纏め易く、またデータベースの参照も容易になるからである。なお、例えば、「側脳室」「側頭葉」という用語は、ほぼ同じ部分を意味するため、どちらか一方に纏めることができる。なお、どのような用語を置換するのかは、辞書DB163内の同類義語情報の充実度合いによって適宜設定することが可能である。   In step S6, the replacement data generation unit 158 refers to the synonym information in the dictionary DB 163, thereby replacing the synonym group belonging words detected from step S4 to step S5 with the corresponding representative words. (Substituted phrase component group) is generated, and the process proceeds to step S7. Here, synonyms and synonyms are replaced with a single representative word, because it is easy to combine the words with the same meaning into one expression, and it is easy to refer to the database. is there. Note that, for example, the terms “lateral ventricle” and “temporal lobe” mean almost the same part, and can be combined into either one. Note that what terms are to be replaced can be appropriately set depending on the degree of enhancement of the synonym information in the dictionary DB 163.

ステップS7では、記憶制御部159の機能により、ステップS5から進んで来た場合には、ステップS4で抽出されたフレーズ構成要素群を対象として、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて記憶部16の関連付けデータベース(関連付けDB)165に記憶する。一方、ステップS6から進んで来た場合には、ステップS6で生成された置換後フレーズ構成要素群を対象として、当該置換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて関連付けDB165に記憶する。   In step S7, when the process proceeds from step S5 by the function of the storage control unit 159, each phrase component included in the phrase component group is targeted for the phrase component group extracted in step S4. Are stored in the association database (association DB) 165 of the storage unit 16 in accordance with a predetermined composition rule of the phrase. On the other hand, when the process proceeds from step S6, the phrase constituent elements included in the post-replacement phrase constituent element group are set to a predetermined phrase structure for the post-substitution phrase constituent element group generated in step S6. The association is stored in the association DB 165 according to the rules.

この関連付けDB165では、1つのフレーズ構成要素群の構成要素(フレーズ構成要素)間、詳しくは、「大分類」に属するフレーズ構成要素と「小分類」に属するフレーズ構成要素、「大分類」に属するフレーズ構成要素と「大分類接頭辞」又は「大分類接尾辞」に属するフレーズ構成要素、「小分類」に属するフレーズ構成要素と「小分類接頭辞」又は「小分類接尾辞」に属するフレーズ構成要素とが関連付けられて記憶されている。   In this association DB 165, between the constituent elements (phrase constituent elements) of one phrase constituent group, specifically, the phrase constituent elements belonging to “major classification”, the phrase constituent elements belonging to “minor classification”, and the “major classification” Phrase component and phrase component belonging to “major prefix” or “major suffix”, phrase component belonging to “minor category” and phrase component belonging to “minor prefix” or “minor suffix” It is stored in association with the element.

図7は、1つのフレーズ構成要素群に係る情報の関連付けDB165内における記憶形態を例示する模式図である。図7及びそれ以降の記憶形態を示す模式図では、四角内に記載される語がフレーズ構成要素を示し、各四角間を結ぶ線がフレーズ構成要素間の関連付けを示している。   FIG. 7 is a schematic view illustrating a storage form in the information association DB 165 related to one phrase component group. In the schematic diagrams showing the storage forms shown in FIG. 7 and the subsequent drawings, the words described in the squares indicate phrase components, and the lines connecting the squares indicate the associations between the phrase components.

例えば、フレーズ構成要素群「右」−「側頭葉」−「橋」は、図7に示すように、大分類に属するフレーズ構成要素「側頭葉」に対して小分類に属するフレーズ「橋」が関連付けられ、更に大分類に属するフレーズ構成要素「側頭葉」に対して接頭辞「右」が関連付けられて記憶される。なお、このようなフレーズ構成要素どうしを関連付けたデータとしては、例えばRDF等で記述される。   For example, the phrase component group “right” − “temporal lobe” − “bridge” has a phrase “bridge” belonging to the minor category with respect to the phrase component “temporal lobe” belonging to the major category, as shown in FIG. ”And the prefix“ right ”is stored in association with the phrase component“ temporal lobe ”belonging to the broad category. Note that the data associating such phrase constituent elements is described in, for example, RDF.

また、関連付けDB165内に既に記憶されているフレーズ構成要素と同じフレーズ構成要素を含むフレーズ構成要素群を更に記憶する場合には、共通するフレーズ構成要素が共用される。そして、当該共用したフレーズ構成要素に対してその他のフレーズ構成要素が関連付けられる。   Further, when further storing a phrase component group including the same phrase component as the phrase component already stored in the association DB 165, the common phrase component is shared. Then, other phrase components are associated with the shared phrase component.

例えば、図7に示すような情報が関連付けDB165内に記憶されており、文章中フレーズ「左側頭葉の白質内部」に係るフレーズ構成要素群「左」−「側頭葉」−「白質」−「内部」を記憶する場合を想定する。すると、図8に示すように、共通する大分類のフレーズ構成要素「側頭葉」を共用しつつ、大分類のフレーズ構成要素「側頭葉」に対して小分類に属するフレーズ構成要素「白質」が関連付けられ、大分類に属するフレーズ構成要素「側頭葉」に対して大分類接頭辞「左」が関連付けられ、更に小分類のフレーズ構成要素「白質」に対して小分類接尾語に属するフレーズ「内部」が関連付けられる。   For example, information as shown in FIG. 7 is stored in the association DB 165, and the phrase component group “left” − “temporal lobe” − “white matter” − related to the phrase “inside the white matter in the left temporal lobe” in the sentence. Assume that “internal” is stored. Then, as shown in FIG. 8, while sharing the common large category phrase component “temporal lobe”, the phrase component “white matter” belonging to the small category with respect to the large category phrase component “temporal lobe” is used. ”Is associated, the major component prefix“ left ”is associated with the phrase component“ temporal lobe ”belonging to the major category, and further the minor component suffix is associated with the phrase component“ white matter ”of the minor category The phrase “internal” is associated.

更に、文章中フレーズ「大脳の白質周囲」に係るフレーズ構成要素群「大脳」−「白質」−「周囲」を記憶する場合を想定する。すると、図9に示すように、共通する小分類のフレーズ構成要素「白質」を共用しつつ、小分類のフレーズ構成要素「白質」に対して大分類に属するフレーズ構成要素「大脳」が関連付けられ、小分類に属するフレーズ構成要素「白質」に対して小分類接尾辞「周囲」が関連付けられる。   Furthermore, it is assumed that the phrase component group “cerebrum” − “white matter” − “around” related to the phrase “around the white matter of the cerebrum” in the sentence is stored. Then, as shown in FIG. 9, the phrase component “cerebrum” belonging to the major category is associated with the minor category phrase component “white matter” while sharing the common minor category phrase component “white matter”. , The minor classification suffix “surrounding” is associated with the phrase component “white matter” belonging to the minor classification.

また、このような態様で複数のフレーズ構成要素群を記憶していく際、関連付けDB165の記憶内容を後述する新規所見文の入力動作に利用する為に、特定のフレーズ構成要素間における関連付けの頻度をモニターすべきである。そこで、ステップS7では、関連頻度算出部160により、関連付けDB165における関連付けの頻度を計算し、当該頻度を示す情報(関連付け頻度情報)も関連付けDB165に記憶する。   Also, when storing a plurality of phrase component groups in such a manner, the frequency of association between specific phrase components in order to use the stored content of the association DB 165 for the input operation of a new finding sentence to be described later. Should be monitored. Therefore, in step S7, the association frequency calculation unit 160 calculates the association frequency in the association DB 165, and also stores information indicating the frequency (association frequency information) in the association DB 165.

ステップS8では、同義・類義・類似語検出部157により、辞書DB163内の類似語用例データを参照することで、ステップS4で抽出されたフレーズ構成要素群、又はステップS6で生成されたフレーズ構成要素群から、類似語用例データによって示される類似語群を構成する類似語を検出した場合には、ステップS9に進み、検出されなかった場合には、本動作フローを終了する。   In step S8, the synonym / synonym / similar word detection unit 157 refers to the similar word example data in the dictionary DB 163, or the phrase component group extracted in step S4 or the phrase configuration generated in step S6. If a similar word constituting the similar word group indicated by the similar word example data is detected from the element group, the process proceeds to step S9. If not detected, the operation flow ends.

ステップS9では、置換データ生成部158及び記憶制御部159により、辞書DB163内の類似語用例データを参照することで、ステップS7からステップS8にかけて検出された類似語群構成語を、類似語用例データによって示される類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換しつつ、変換後のフレーズ構成要素群(変換後フレーズ構成要素群)を関連付けDB165に記憶する。   In step S9, the replacement word generation unit 158 and the storage control unit 159 refer to the similar word example data in the dictionary DB 163, so that the similar word group constituent words detected from step S7 to step S8 are converted to the similar word example data. The phrase component group after conversion (post-conversion phrase component group) is stored in the association DB 165 while converting to another similar word group component word that is different from the similar word group component word constituting the similar word group indicated by To do.

ここでは、フレーズ構成要素群からある類似語群を構成する類似語群構成語が検出されると、同じ類似語群を構成する他の類似語群構成語に変換したフレーズ構成要素群も一般に存在すると容易に推定出来る。そこで、類似語群構成語が検出された場合には、当該類似語群構成語を、当該類似語群構成語と同じ類似語群に属する他の類似語構成語に変換したフレーズ構成要素群(変換後フレーズ構成要素群)を順次生成しつつ、関連付けDB165に記憶する。各変換後フレーズ構成要素群を関連付けDB165に記憶する際には、各変換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしがフレーズの所定の構成ルールに従って関連付けられて関連付けDB165に記憶される。   Here, when a similar word group constituent word constituting a similar word group is detected from the phrase constituent group, there is generally also a phrase constituent group converted to another similar word group constituent word constituting the same similar word group Then it can be estimated easily. Therefore, when a similar word group component word is detected, a phrase component group (in which the similar word group component word is converted into another similar word component word that belongs to the same similar word group as the similar word group component word ( The converted phrase component group) is sequentially generated and stored in the association DB 165. When each post-conversion phrase component group is stored in the association DB 165, each phrase component included in each post-conversion phrase component group is associated according to a predetermined phrase configuration rule and stored in the association DB 165.

類似語の置換・記憶について以下具体例を挙げて説明する。「右側頭葉の橋」という文章中フレーズが抽出されている場合には、大分類の接頭辞「右」−大分類「側頭葉」−小分類「橋」といったフレーズ構成要素群が抽出される。このとき、大分類の接頭辞「右」と同じような使われ方をする類似語「左」が存在するため、大分類の接頭辞「左」−大分類「側頭葉」−小分類「橋」といった組合せも存在することが容易に推測できる。そこで、類似語構成語「右」を同じ類似群を構成する他の異なる類似語構成語「左」に変換したフレーズ構成要素群も関連付けDB165に記憶する。   The substitution and storage of similar words will be described below with specific examples. When the phrase “Bridge on the right temporal lobe” is extracted, the phrase component group such as the prefix “Right” of the major classification “Right temporal lobe” —the minor classification “Bridge” is extracted. The At this time, since there is a similar term “left” that is used in the same way as the prefix “right” of the major classification, the prefix “left” of the major classification—the “temporal lobe” —the minor classification “ It can be easily guessed that combinations such as “bridge” exist. Therefore, the phrase component group obtained by converting the similar word constituent word “right” into another different similar word constituent word “left” constituting the same similar group is also stored in the association DB 165.

例えば、大分類の接頭辞「右」−大分類「側頭葉」−小分類「橋」といったフレーズ構成要素群が関連付けDB165に記憶される際に、大分類の接頭辞「左」−大分類「側頭葉」−小分類「橋」といった変換後フレーズ構成要素群も併せて記憶される。つまり、変換前のフレーズ構成要素群が図7に示すような態様で記憶され、更に、大分類「側頭葉」に対して大分類の接頭辞「左」が関連付けられる。   For example, when a phrase component group such as the prefix “right” of the large classification “large classification“ temporal lobe ”—the small classification“ bridge ”is stored in the association DB 165, the prefix“ left ”of the large classification—the large classification A post-conversion phrase component group such as “temporal lobe” -small classification “bridge” is also stored. In other words, the phrase component group before conversion is stored in a manner as shown in FIG. 7, and the large classification prefix “left” is associated with the large classification “temporal lobe”.

なお、ステップS9の処理が完了すると、本動作フローが終了する。   In addition, when the process of step S9 is completed, this operation | movement flow will be complete | finished.

そして、このような図6に示すような動作フローを繰り返すことで、関連付けDB165の記憶内容を充実化させることができる。   Then, by repeating the operation flow as shown in FIG. 6, the stored contents of the association DB 165 can be enriched.

<新規所見文の入力動作>
図5で示すように、新規所見文の入力動作が実行される際には、制御部15は、機能として、表示用データ生成部251、データ出力部252、フレーズ構成要素指示部253、及び新規フレーズ生成部254を備えて構成される。
<Input operation of new findings>
As shown in FIG. 5, when the input operation of a new finding sentence is executed, the control unit 15 functions as a display data generation unit 251, a data output unit 252, a phrase component element instruction unit 253, and a new A phrase generation unit 254 is provided.

以下、図5を参照しつつ、新規所見文の入力を行う際に表示部13に可視的に出力される画面(読影レポート入力画面)やその要素を図10から図13に示すことで、新規所見文の入力動作を説明する。なお、読影レポート入力画面G1に係るデータは、表示用データ生成部251(図5)によって、記憶部16に記憶される使用頻度データ164、及び関連付けDB165等の各種情報に基づき生成され、データ出力部252によって表示部13に向けて出力されることで、表示部13における画面表示が実現される。   Hereinafter, referring to FIG. 5, the screen (interpretation report input screen) visibly output to the display unit 13 when inputting a new finding sentence and the elements thereof are shown in FIGS. An explanation will be given of the input operation of the finding sentence. The data related to the interpretation report input screen G1 is generated by the display data generation unit 251 (FIG. 5) based on various information such as the usage frequency data 164 and the association DB 165 stored in the storage unit 16, and the data output Output to the display unit 13 by the unit 252 realizes screen display on the display unit 13.

図10は、読影レポート入力画面G1を例示する図である。図10に示すように、読影レポート入力画面G1は、主に、依頼内容の表示領域A1、検査リストの表示領域A2、検査情報表示領域A3、読影レポートの入力及び作成を行う領域A4、所見文の表示領域A5、メモの記述領域A6、画像の添付領域A7、コマンドに係る入力アイコンが列挙される領域A8によって構成されている。   FIG. 10 is a diagram illustrating an interpretation report input screen G1. As shown in FIG. 10, the interpretation report input screen G1 mainly includes a request content display area A1, an examination list display area A2, an examination information display area A3, an interpretation report input area A4, and an observation sentence A4. Display area A5, memo description area A6, image attachment area A7, and area A8 in which input icons related to commands are listed.

このような読影レポート入力画面G1で読影レポートの所見文を入力する際には、上記関連付けDB165の記憶内容が、所見文において部位名を入力する際に利用される。以下、読影レポート入力画面G1の領域A4の一部領域A41に部位名に係る情報が提示されるものとして説明を行う。   When inputting the finding sentence of the interpretation report on such an interpretation report input screen G1, the stored content of the association DB 165 is used when inputting the part name in the finding sentence. Hereinafter, description will be made on the assumption that the information related to the part name is presented in the partial area A41 of the area A4 of the interpretation report input screen G1.

図示を省略するが、まず、表示部13に読影レポート入力画面G1が表示された際には、領域A41には、部位を示す「大分類」に属する複数の用語が列挙される。そして、当該複数の用語のうちの1つの用語をマウスポインタ等を用いて指定することで、関連付けDB165に格納される情報のうち、当該指定された用語に係る情報が表示される。   Although illustration is omitted, first, when the interpretation report input screen G1 is displayed on the display unit 13, a plurality of terms belonging to the “major classification” indicating the part are listed in the area A41. Then, by designating one term out of the plurality of terms using a mouse pointer or the like, information related to the designated term is displayed among the information stored in the association DB 165.

例えば、部位を示す分類項目「大分類」に属する用語「側頭葉」が指定された場合には、関連付けDB165内に格納される図9に示すような情報に基づいて、図11に示すような部位名の入力を支援するための図(部位名入力支援図)が領域A41に表示される。この部位名入力支援図では、関連付けDB165内のフレーズ構成要素「側頭葉」に係る情報に基づき、複数の四角内に「側頭葉」に係るフレーズ構成要素がそれぞれ記述された表示要素と、当該表示要素間が各フレーズ構成要素どうしの関連付けに応じて連結された可視的な連結要素(ここでは、線分)とが表示される。このように、各フレーズ構成要素どうしの関連付けが可視的に表示されると、ユーザーは所定のカテゴリーに属する要素に関するフレーズの構成を一目で把握することができ、新規なフレーズの入力の参考となる。   For example, when the term “temporal lobe” belonging to the classification item “major classification” indicating the part is designated, as shown in FIG. 11 based on the information shown in FIG. 9 stored in the association DB 165. A diagram (part name input support diagram) for supporting the input of a proper part name is displayed in the area A41. In this part name input support diagram, based on information related to the phrase component “temporal lobe” in the association DB 165, a display element in which the phrase component related to “temporal lobe” is described in a plurality of squares, and Visible connected elements (here, line segments) in which the display elements are connected in accordance with the association between the phrase constituent elements are displayed. In this way, when the association between each phrase component is visibly displayed, the user can grasp at a glance the phrase configuration relating to the element belonging to the predetermined category, which is a reference for inputting a new phrase. .

また、部位名入力支援図が領域A41に表示される際には、表示用データ生成部251が関連付けDB165内の関連付け頻度情報を参照することで、連結要素である線分の表示態様を変更する。例えば、関連付けの回数が所定回数(例えば、10回)以上のものを頻繁に同時に使用されるフレーズ構成要素として認識して、図12に示すように線分を太くするなど他の連結要素よりも強調されるように変更される。   Further, when the part name input support diagram is displayed in the area A41, the display data generation unit 251 changes the display mode of the line segment that is the connected element by referring to the association frequency information in the association DB 165. . For example, when the number of times of association is more than a predetermined number (for example, 10 times) is recognized as a phrase component that is frequently used at the same time, as shown in FIG. Changed to be emphasized.

図12では、「側頭葉」と「白質」とが1つのフレーズを構成するフレーズ構成要素として同時に使用される頻度が高いことが一目で把握可能に表示される。なお、ここでは、線分の太さを変更したが、カラー表示をする場合には、線分の色を変更するなど、連結要素の表示態様を他の連結要素とは異なる態様に変更するようにしても良い。   In FIG. 12, it is displayed so that it is possible to grasp at a glance that “temporal lobe” and “white matter” are frequently used simultaneously as phrase constituent elements constituting one phrase. Here, the thickness of the line segment is changed. However, when displaying in color, the display mode of the connected element is changed to a mode different from other connected elements, such as changing the color of the line segment. Anyway.

そして、図11及び図12に示したような部位名入力支援図が表示部13に表示された状態で、部位名入力支援図に列挙された複数のフレーズ構成要素のうち、ユーザーによる操作部12の操作に応じてマウスポインタMP等を利用して所望のフレーズ構成要素を指定することができる。ここでは、各分類項目についてそれぞれ1つまでフレーズ構成要素を指定することができ、当該指定されたフレーズ構成要素は、フレーズ構成要素指示部253によって新規なフレーズを構成する要素として指示される。なお、当該指示された要素は、部位を示す新規フレーズを構成する要素として、読影レポート入力画面G1の領域A4における最下段の領域A42に列挙される。   Then, in a state where the part name input support diagram as shown in FIGS. 11 and 12 is displayed on the display unit 13, the operation unit 12 by the user among the plurality of phrase components listed in the part name input support diagram. A desired phrase component can be designated using the mouse pointer MP or the like in accordance with the operation. Here, up to one phrase component can be designated for each classification item, and the designated phrase component is designated by the phrase component designation unit 253 as an element constituting a new phrase. The instructed element is listed in the lowermost area A42 in the area A4 of the interpretation report input screen G1 as an element constituting a new phrase indicating a part.

新規フレーズ生成部254は、指示された要素を利用して、特定部位フレーズの所定の構成ルールに従って、新規なフレーズを生成する。当該生成された新規なフレーズは、表示用データ生成部251及びデータ出力部252の機能により領域A4に可視的に表示される。このとき、図示を省略するが、所見文の構成に必要な他の語句を領域A4において指定することで、所見文を入力することができる。なお、所見文の入力は、領域A4の表示内容を参照しつつ、所見文の表示領域A5にカーソルを発生させて、キーボード122等から直接入力することもできる。また、新規な所見文が入力される度に、上記所見文の構成要素分類抽出の動作フローが実行され、過去の知識である関連付けDB165が更に充実化していくことになる。   The new phrase generation unit 254 generates a new phrase according to a predetermined configuration rule for the specific part phrase using the instructed element. The generated new phrase is visually displayed in the region A4 by the functions of the display data generation unit 251 and the data output unit 252. At this time, although not shown in the drawing, it is possible to input the finding sentence by designating other words / phrases necessary for the structure of the finding sentence in the area A4. The input of the finding sentence can be directly input from the keyboard 122 or the like by generating a cursor in the finding sentence display area A5 while referring to the display contents of the area A4. Further, each time a new finding sentence is input, the operation flow for extracting the constituent element classification of the finding sentence is executed, and the association DB 165 which is the past knowledge is further enriched.

以上のように、本発明の実施形態に係る情報処理システム1では、まず、入力される文章から読影レポートの所見文に属する特定部位フレーズに対応する文章中フレーズを抽出する。次に、当該文章中フレーズに含まれる各要素を複数種類の分類項目に分類しつつ抽出する。このような2段階の抽出によって、的確に所定のカテゴリーに属する要素を抽出することができる。   As described above, in the information processing system 1 according to the embodiment of the present invention, first, the phrase in the sentence corresponding to the specific part phrase belonging to the finding sentence of the interpretation report is extracted from the inputted sentence. Next, each element included in the phrase in the sentence is extracted while being classified into a plurality of types of classification items. By such two-stage extraction, elements belonging to a predetermined category can be accurately extracted.

また、フレーズ構成要素群から同義語や類義語が抽出された場合、対応する代表語に置換して関連付けDB165に記憶する構成を採用する。このため、所定のカテゴリーに属する要素に関するフレーズの構成を示した情報を、表現が統一された状態でデータベース化することができる。   Moreover, when a synonym and a synonym are extracted from a phrase component group, the structure which substitutes to a corresponding representative word and memorize | stores in association DB165 is employ | adopted. For this reason, the information indicating the configuration of the phrase related to the elements belonging to the predetermined category can be made into a database in a state where the expressions are unified.

また、フレーズ構成要素群からある類似語群を構成する類似語群構成語が検出された場合、フレーズ構成要素群のうちの類似語群構成語を、同じ類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に時間順次に変換して変換後フレーズ構成要素群を生成する。そして、各変換後フレーズ構成要素群に係る関連付け情報を関連付けDB165に記憶するため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をより充実化させることができる。   Further, when a similar word group constituent word that constitutes a similar word group from the phrase constituent element group is detected, the similar word group constituent word of the phrase constituent element group is related to the similar word group constituting the same similar word group A phrase component group after conversion is generated by time-sequentially converting into another similar word group constituent word different from the constituent word. And since the correlation information which concerns on each post-conversion phrase component group is memorize | stored in correlation DB165, the information which showed the phrase structure which concerns on the element which belongs to a predetermined category can be enriched more.

また、関連付けDB165に基づいて、関連付けDB165に含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて表示するとともに、関連付けの頻度に基づいて連結要素の態様を変更する。このような構成により、所定のカテゴリーに属する要素に関するフレーズの構成を一目で把握することができるとともに、関連付けが強いものについては、一目で他の関連付けとは区別して把握することができる。   Further, based on the association DB 165, the association between the phrase constituent elements included in the association DB 165 is displayed using a visible coupling element, and the mode of the coupling element is changed based on the association frequency. With such a configuration, it is possible to grasp at a glance the composition of a phrase related to an element belonging to a predetermined category, and it is possible to grasp a strong association by distinguishing it from other associations at a glance.

また、文章中のフレーズから直接抽出されたフレーズ構成要素群に従って関連付けの頻度を計算することで、関連付けの表示態様が使用実態を正確に反映した表示態様となるため、実際に頻繁に使用されるフレーズの構成が把握し易くなる。   In addition, by calculating the association frequency according to the phrase component group directly extracted from the phrase in the sentence, the display mode of the association becomes a display mode that accurately reflects the actual usage, so it is frequently used in practice. This makes it easier to understand the composition of phrases.

更に、新規フレーズを入力する際に、関連付けDB165に基づいて表示される画面上で、ユーザーの操作に応答して複数種類の分類項目のうちの少なくとも1つの項目に属するフレーズ構成要素を新規フレーズを構成するフレーズ構成要素として指示することができる。このような構成とすることで、過去の知識を利用することで新規フレーズの入力操作を簡略化することができる。   Furthermore, when inputting a new phrase, a phrase component belonging to at least one of a plurality of types of classification items is added to the new phrase in response to a user operation on the screen displayed based on the association DB 165. It can be indicated as a constituent component of the phrase. With such a configuration, a new phrase input operation can be simplified by using past knowledge.

<変形例>
以上、この発明の実施形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。
<Modification>
As mentioned above, although embodiment of this invention was described, this invention is not limited to the thing of the content demonstrated above.

◎例えば、上記実施形態では、辞書DB163が、同義語に係るデータ(同義語データ)および類義語に係るデータ(類義語データ)の双方を含んでいたが、これに限られず、同義語データ及び類義語データのうちの少なくとも一方を含むようにしても良い。このような構成にしても、上述した実施形態と同様な効果を得ることができる。   For example, in the above embodiment, the dictionary DB 163 includes both data related to synonyms (synonym data) and data related to synonyms (synonym data). However, the present invention is not limited to this, and synonym data and synonym data. You may make it include at least one of these. Even if it is such a structure, the effect similar to embodiment mentioned above can be acquired.

◎また、上記実施形態では、機械学習によって得た要素分類情報を参照して分類項目「接頭辞」及び「接尾辞」にそれぞれ属する語を分類・抽出したが、これに限られない。分類項目「接頭辞」及び「接尾辞」として使用される語の種類は比較的少ないため、要素分類情報のうち分類項目「接頭辞」及び「接尾辞」に関する情報については、機械学習を用いずに、例えば、分類項目「接頭辞」及び「接尾辞」の少なくとも一方については、各分類項目に対応する語のリストを予め作成しておき、このリストを参照しつつ「文章中フレーズ」から分類項目「接頭辞」及び「接尾辞」にそれぞれ属する語を分類・抽出するようにしても良い。このような構成により、的確な接頭辞及び接尾辞の抽出を機械学習を利用しなくとも容易に実施することができる。   In the above embodiment, the words belonging to the classification items “prefix” and “suffix” are classified and extracted by referring to the element classification information obtained by machine learning. However, the present invention is not limited to this. Since the types of words used as classification items “prefix” and “suffix” are relatively few, machine learning is not used for information related to classification items “prefix” and “suffix” in the element classification information. In addition, for example, for at least one of the classification items “prefix” and “suffix”, a list of words corresponding to each classification item is created in advance, and classification is made from “phrase in text” while referring to this list. The words belonging to the items “prefix” and “suffix” may be classified and extracted. With such a configuration, accurate prefix and suffix extraction can be easily performed without using machine learning.

◎また、上記実施形態では、辞書DB163内の同類義語情報を参照することで、複数語から、同類義語情報に含まれる同義語群及び類義語群の双方について語群所属語を検出して置換したが、これに限られず、同義語及び類義語の少なくとも一方について語群所属語を検出して置換するようにしても良い。   In the above embodiment, by referring to the synonym information in the dictionary DB 163, the word group belonging words are detected and replaced for both the synonym group and the synonym group included in the synonym information from a plurality of words. However, the present invention is not limited to this, and word group belonging words may be detected and replaced for at least one of synonyms and synonyms.

◎また、上記実施形態では、辞書DB163内の同類義語情報に代表語が記憶されていたが、同義語群に含まれる複数語を表示部13に表示させ、ユーザーによる操作部12からの入力操作に応答して当該複数語から代表語を指定したり、類義語群に含まれる複数語を表示部13に表示させ、ユーザーによる操作部12からの入力操作に応答して当該複数語から代表語を指定したりする代表語の指定動作を実行させる機能を制御部15が実現するようにしても良い。このような構成とすると、ユーザーの癖等を反映したカスタマイズが可能となる。   In the above embodiment, the representative words are stored in the synonym information in the dictionary DB 163. However, a plurality of words included in the synonym group are displayed on the display unit 13, and an input operation from the operation unit 12 by the user is performed. In response to the user, a representative word is designated from the plurality of words, or a plurality of words included in the synonym group are displayed on the display unit 13, and the representative word is selected from the plurality of words in response to an input operation from the operation unit 12 by the user. The control unit 15 may realize a function of executing a designation operation of a representative word to be designated. With such a configuration, customization reflecting the user's habits and the like becomes possible.

また、複数の文章データを対象として辞書DB163に属する各語群所属語の出現回数を計算し、同義語群に含まれる複数語のうち最も出現回数が多い語を当該同義語群に対する代表語として指定したり、類義語群に含まれる複数語のうち最も出現回数が多い語を当該類義語群に対する代表語として指定する代表語の指定動作を実行させる機能を制御部15が実現するようにしても良い。このような構成を採用することで、用語等の使用実態に沿って各フレーズ構成要素を細かく分類することができる。   In addition, the number of appearances of each word group belonging word belonging to the dictionary DB 163 is calculated for a plurality of sentence data, and the word having the highest number of appearances among the plurality of words included in the synonym group is used as a representative word for the synonym group. The control unit 15 may realize a function of designating or executing a representative word designating operation of designating a word having the highest number of appearances as a representative word for the synonym group among a plurality of words included in the synonym group. . By adopting such a configuration, it is possible to finely classify each phrase component along the actual usage of terms and the like.

◎また、上記実施形態では、「大分類」に属するフレーズ構成要素と「小分類」に属するフレーズ構成要素との区別は、要素分類情報に基づいて行ったが、これに限られず、例えば、文章中フレーズが「・・・の・・・」という表現を含んでいれば、「の」の直前を「大分類」に属するフレーズ構成要素を含む用語、「の」の直後を「小分類」に属するフレーズ構成要素を含む用語であるとして判断するようにしても良い。なお、このような判断材料も機械学習によって得るようにしても良い。   In the above embodiment, the phrase component belonging to the “major classification” and the phrase component belonging to the “minor classification” are distinguished based on the element classification information. If the middle phrase contains the expression "... no ...", the term immediately before "no" includes a phrase component that belongs to "major category", and the term immediately after "no" becomes "minor category" You may make it judge that it is a term containing the phrase component to which it belongs. Such a determination material may be obtained by machine learning.

◎また、上記実施形態では、入力された所見文を解析することで、関連付けDB165を生成及び充実化したが、これに限られず、例えば、図13に示すような画面を表示部13に表示させて、当該画面上で各分類項目に属するフレーズ構成要素をユーザーによる操作部12からの操作入力に応答して追加入力するようにしても良い。   In the above embodiment, the association DB 165 is generated and enriched by analyzing the input finding sentence. However, the present invention is not limited to this. For example, a screen as shown in FIG. In addition, phrase constituent elements belonging to each classification item may be additionally input in response to an operation input from the operation unit 12 by the user on the screen.

例えば、図13に示す画面では、6つの分類項目「大分類」「小分類」「大分類接頭辞」「大分類接尾辞」「小分類接頭辞」及び「小分類接尾辞」にそれぞれ属するフレーム構成要素(語)を対応する四角内に入力することができる。   For example, in the screen shown in FIG. 13, frames belonging to six classification items “major classification”, “minor classification”, “major classification prefix”, “major classification suffix”, “minor classification prefix”, and “minor classification suffix”, respectively. A component (word) can be entered in the corresponding square.

このように、ユーザーの操作入力により、新規なフレーズ構成要素群を示す追加データが入力されると、当該新規なフレーズ構成要素群に含まれる各フレーズ構成要素どうしが、フレーズの所定の構成ルールに従って関連付けられて関連付けDB165に記憶されるため、所定のカテゴリーに属する要素に係るフレーズ構成を示した情報をユーザーが適宜充実化させることができる。   As described above, when additional data indicating a new phrase component group is input by a user operation input, each phrase component included in the new phrase component group is determined according to a predetermined phrase configuration rule. Since they are associated with each other and stored in the association DB 165, the user can appropriately enrich information indicating the phrase configuration related to elements belonging to a predetermined category.

◎また、上記実施形態では、読影レポートを情報処理を対象としたが、これに限られず、例えば、インシデントレポート等といった他の種々の医療情報を対象としても良く、更には、営業レポート等といった種々の文章を対象としても良い。   In the above embodiment, the interpretation report is targeted for information processing. However, the present invention is not limited to this, and for example, other various medical information such as an incident report may be targeted. It is also possible to target this sentence.

ここで、他の文章を情報処理の対象とした一例としてインシデントレポートを情報処理の対象とした場合について説明する。   Here, a case where an incident report is an information processing target will be described as an example in which another sentence is an information processing target.

インシデントレポートは、一般に、(i)インシデントそのものの内容についての記述である「主文」、(ii)インシデントが発生した背景・原因についての記述である「原因」、(iii)インシデントの結果として起こったこと(患者の症状悪化等)についての記述である「影響」、(iv)インシデントの後の対応についての記述である「対処」、(v)インシデントの後の対応によって起こったことについての記述である「対処結果」とった5つの部分と、それ以外のインシデントとは関係ない部分とによって構成される。   Incident reports generally occur as a result of an incident (i) "main text" that describes the content of the incident itself, (ii) a description of the background and cause of the incident, and (iii) an incident "Impact" which is a description of the incident (aggravation of patient's symptoms, etc.), (iv) "Action" which is a description of the response after the incident, and (v) A description of what happened due to the response after the incident It is composed of five parts that have a certain “handling result” and parts that are not related to other incidents.

例えば、インシデントレポートに、「薬剤Aの箱の中に薬剤Bが混入したため、薬剤Aのつもりで誤って薬剤Bを注射したところ、血圧が200まで急上昇した。そこで薬剤Cを注射したところ、血圧は正常値に戻った。」という文があった場合、「主文」が「薬剤Aのつもりで誤って薬剤Bを注射したところ、」、「原因」が「薬剤Aの箱の中に薬剤Bが混入したため、」、「影響」が「血圧が200まで急上昇した。」、「対処」が「そこで薬剤Cを注射したところ、」、「対処結果」が「血圧は正常値に戻った。」となる。   For example, in the incident report, “Drug B was mixed in the box of Drug A, so that when the drug B was accidentally injected with the intention of the drug A, the blood pressure rose rapidly to 200. Was returned to the normal value ”, the“ main sentence ”was“ when drug B was accidentally injected with the intention of drug A ”and“ cause ”was“ drug B in drug A's box. ”,“ Effect ”is“ blood pressure has rapidly increased to 200 ”,“ coping ”is“ when drug C was injected there ”, and“ coping result ”is“ blood pressure has returned to a normal value ”. It becomes.

このように、インシデントレポートが「主文」「原因」「影響」「対処」「対処結果」といった5種類のフレーズを含んでいることを利用して、まず、インシデントレポートから5種類のフレーズを抽出する。そして、文章は大きく分けて、(1)「なぜ」−「いつ」−「どこで」−「誰が」−「誰に」−「何を」−「どこに(部位)」−「どれだけ」−「どのように」−「どうした」、(2)「なぜ」−「いつ」−「どこで」−「誰の」−「何が」−「どこに(部位)」or「どこに(場所)」−「どれだけ」−「どのように」−「どうした」といった2つのパターンに大別される。そこで、抽出されたフレーズから2つのパターンを構成する「誰が」「誰に」「誰の」「何が」「何を」「いつ」「どこに(部位)」「どこに(場所)」「どこで(場所)」「どれだけ」「なぜ」「どのように」「どうした」等の要素に対応する語を抽出することで、インシデントレポートから的確に所定のカテゴリーに属する要素を抽出する。   Thus, using the fact that the incident report includes five kinds of phrases such as “main sentence”, “cause”, “effect”, “handling”, and “handling result”, first, five kinds of phrases are extracted from the incident report. . The text is roughly divided into (1) "Why"-"When"-"Where"-"Who"-"Who"-"What"-"Where (part)"-"How much"-" "How"-"What", (2) "Why"-"When"-"Where"-"Who"-"What"-"Where (part)" or "Where (place)"-" It is roughly divided into two patterns: "How much"-"How"-"What". Therefore, “Who”, “Who”, “Who”, “Who”, “What”, “What”, “When”, “Where (part)”, “Where (location)”, “Where” (where) By extracting words corresponding to elements such as “location)”, “how much”, “why”, “how”, “what”, and the like, elements belonging to a predetermined category are accurately extracted from the incident report.

以下、このような2段階の抽出方法について更に説明する。   Hereinafter, such a two-stage extraction method will be further described.

2段階の抽出には、1段目のフレーズを抽出するためのフレーズ情報と、2段目のフレーズ構成要素を分類抽出するための要素分類情報が必要となる。   The two-stage extraction requires phrase information for extracting the first-stage phrase and element classification information for classifying and extracting the second-stage phrase components.

フレーズ情報は、コーパスを用いた機械学習によって得る。例えば、コーパス内の文章を形態素解析して、「主文」「原因」「影響」「対処」「対処結果」を表すタグを与え、これを使って、5種類のフレーズにそれぞれ対応するコーパスの一部分(部分コーパス)を集めてフレーズ情報として得ることができる。   Phrase information is obtained by machine learning using a corpus. For example, morphological analysis of sentences in a corpus gives tags representing “main sentence”, “cause”, “influence”, “handling”, and “handling result”. Using this, a part of the corpus corresponding to each of five phrases (Partial corpus) can be collected and obtained as phrase information.

要素分類情報は、フレーズ情報に含まれるそれぞれの部分コーパスについて、分類項目「誰が」「誰に」「誰の」「何が」「何を」「いつ」「どこに(部位)」「どこに(場所)」「どこで(場所)」「どれだけ」「なぜ」「どのように」「どうした」等に対応する要素を表す部分にタグを与え、これを使って、多数種類の分類項目にそれぞれ対応する要素を示す要素分類情報を得ることができる。   For each partial corpus included in the phrase information, the element classification information is classified into “Who”, “Who”, “Who”, “What”, “What”, “When”, “Where (part)”, “Where (location) ) "" Where (location) "" How much "" Why "" How "" How did "etc. Tags are given to the parts that represent elements, and this is used to correspond to many types of classification items. It is possible to obtain element classification information indicating elements to be performed.

ここで抽出対象となる要素となる語・文の例を以下に列挙する。   Examples of words / sentences that are elements to be extracted are listed below.

分類項目「誰が」「誰に」「誰の」に対しては要素「患者」「研修医」「**さん」等が、分類項目「何が」「何を」に対しては要素「薬剤名(「ワスゴチグミン」等)」「指標(「血圧」等)」「器具名(「三方活栓」等)」等が、分類項目「いつ」に対しては要素「日時(「4月20日」「10時」等)」「期間(「1時間」「3日間」等)」「**中」「**の際」等が、「どこに(部位)」に対しては要素「筋肉」「右腕」「頭部」等が、分類項目「どこに(部位)」に対しては要素「シーツの上」「シリンジの中」等が、分類項目「どこで(場所)」に対しては要素「病棟」「手術室」等が、分類項目「どれだけ」に対しては要素「数値(「100ml」「3倍」等)」「程度(「やや」「大量に」等)」等が、分類項目「なぜ」に対しては要素「**したので」「**のため」等が、分類項目「どのように」に対しては要素「誤って」「正しく」「二重に」等が、分類項目「どうした」に対しては要素「行為(「投与」「点滴」「入れる」等)」「状態(「上昇」「悪化」「抜ける」「なくなる」等)」等がある。   The elements "patient", "resident", "Mr. **" etc. for the classification items "Who", "Who" and "Who", and the element "Drug" for the classification items "What" and "What" Name ("Wasgochigumin", etc.), "Indicator (" Blood pressure ", etc.)", "Equipment name (" Three-way stopcock ", etc.)", etc. “10:00” etc.) “Period (“ 1 hour ”“ 3 days ”etc.)” “** Medium” “At the time of **” etc. “Right arm”, “Head”, etc. for the classification item “Where (part)”, “Elements on the sheet”, “In the syringe”, etc., for the classification item “Where (location)”, the element “Ward” "" Operating room "etc., for the classification item" how much ", the elements" numerical value ("100ml" "3 times" etc.) "" degree ("somewhat" "large amount" etc.) " Against "why" Elements “** because” and “because of **”, etc. for the classification item “how”, elements “incorrect”, “correctly”, “double”, etc. On the other hand, there are the elements “action (“ administration ”,“ instillation ”,“ insertion ”, etc.),“ state ”(“ rising ”,“ deterioration ”,“ missing ”,“ disappearing ”, etc.).

上記のようにして準備したフレーズ情報及び要素分類情報とを用いた要素抽出の一例を以下に示す。   An example of element extraction using the phrase information and element classification information prepared as described above is shown below.

「薬剤Aの箱の中に薬剤Bが混入したため、薬剤Aのつもりで誤って薬剤Bを注射したところ、血圧が200まで急上昇した。そこで薬剤Cを注射したところ、血圧は正常値に戻った。」という文が入力された場合には、フレーズ情報を参照することで、まず、「主文」フレーズが「薬剤Aのつもりで誤って薬剤Bを注射したところ、」、「原因」フレーズが「薬剤Aの箱の中に薬剤Bが混入したため、」、「影響」フレーズが「血圧が200まで急上昇した。」、「対処」フレーズが「そこで薬剤Cを注射したところ、」、「対処結果」フレーズが「血圧は正常値に戻った。」と1段目の抽出、すなわちフレーズの抽出が行われる。   “Because drug B was mixed in the drug A box, drug A was accidentally injected as drug A, and blood pressure rose rapidly to 200. When drug C was injected, blood pressure returned to normal. When the sentence “.” Is entered, by referring to the phrase information, first, the “main sentence” phrase is “when drug A was accidentally injected with the intention of drug A,” and the “cause” phrase is “ “Because drug B is mixed in the box of drug A”, the “influence” phrases are “blood pressure has suddenly increased to 200”, and the “handling” phrases are “when drug C is injected there”, “handling results” The phrase “blood pressure has returned to a normal value” is extracted as the first stage, that is, the phrase is extracted.

次に、要素分類情報を参照することで、「主文」フレーズから、分類項目「何を」に対して要素「薬剤A→薬剤B(ここでは、本来は「薬剤A」でないといけないが「薬剤B」にしてしまった、ということを表している)」が、分類項目「どのように」に対して要素「誤って」が、分類項目「どうした」に対して要素「注射」が、分類抽出される。   Next, by referring to the element classification information, from the “main sentence” phrase, the element “drug A → drug B” (here “drug A” should be originally “ "B" means that the element "incorrect" for the classification item "how" and the element "injection" for the classification item "how" Extracted.

また、「原因」フレーズから、分類項目「何が」に対して要素「薬剤B」が、分類項目「どこに(場所)」に対して要素「薬剤Aの箱の中」が、分類項目「どうした」に対して要素「混入していた」が、分類抽出される。   Further, from the “cause” phrase, the element “drug B” for the classification item “what” and the element “in the box of the drug A” for the classification item “where (location)” The element “mixed” is classified and extracted with respect to “done”.

また、「影響」フレーズから、分類項目「何が」に対して要素「血圧」が、分類項目「どれだけ」に対して要素「200まで」が、分類項目「どうした」に対して要素「急上昇した」が、分類抽出される。   Further, from the “influence” phrase, the element “blood pressure” for the classification item “what”, the element “up to 200” for the classification item “how much”, and the element “ “Raised” is extracted.

また、「対処」フレーズから、分類項目「何を」に対して要素「薬剤C」が、分類項目「どうした」に対して要素「注射した」が、分類抽出される。   Further, from the “coping” phrase, the element “drug C” is extracted for the classification item “what” and the element “injected” is extracted for the classification item “how”.

更に、「対処結果」フレーズから、分類項目「何が」に対して要素「血圧」が、分類項目「どれだけ」に対して要素「正常値に」が、分類項目「どうした」に対して要素「戻った」が、分類抽出される。   Furthermore, from the “handling result” phrase, the element “blood pressure” for the classification item “what”, the element “normal value” for the classification item “how much”, and the element “normal” The element “returned” is classified and extracted.

このようにして分類抽出された要素を、5つのフレーズ毎に、フレーズの所定の構成ルールに従って関連付けて所定のデータベースに記憶することで、上述した実施形態と同様に、既存のインシデントレポートを過去の知識として利用することができるようになる。   The elements classified and extracted in this way are stored in a predetermined database in association with a predetermined configuration rule for each of the five phrases, so that an existing incident report can be stored in the past as in the above-described embodiment. It can be used as knowledge.

◎また、上記実施形態では、情報処理システム1が1台のパソコンで構成されたが、これに限られず、例えば、図14に示すように、サーバSBと、当該サーバSBとネットワーク回線NTを介してデータ交信可能に接続された複数の端末(パソコン)T1〜T4とに、情報処理システム1の機能を適宜分散させて、複数の端末T1〜T4において、関連付けDB165に基づく画面を表示して文章の入力を簡略化することができるような情報処理システム1Aとしても良い。   In the above embodiment, the information processing system 1 is composed of a single personal computer. However, the present invention is not limited to this. For example, as shown in FIG. 14, a server SB is connected via the server SB and the network line NT. The functions of the information processing system 1 are appropriately distributed to a plurality of terminals (personal computers) T1 to T4 that are connected so as to be capable of data communication, and the screens based on the association DB 165 are displayed on the plurality of terminals T1 to T4. The information processing system 1A may be able to simplify the input.

情報処理システムの外観構成を示す図である。It is a figure which shows the external appearance structure of an information processing system. 情報処理システムの機能構成を示すブロック図である。It is a block diagram which shows the function structure of an information processing system. 辞書データベースの記憶内容を例示する図である。It is a figure which illustrates the memory content of a dictionary database. 辞書データベースの記憶内容を例示する図である。It is a figure which illustrates the memory content of a dictionary database. 情報処理システムの機能構成を示すブロック図である。It is a block diagram which shows the function structure of an information processing system. 所見文の構成要素の分類抽出動作フローを示すフローチャートである。It is a flowchart which shows the classification | category extraction operation | movement flow of the component of a finding sentence. 関連付けデータベースの記憶内容を例示する図である。It is a figure which illustrates the memory content of an association database. 関連付けデータベースの記憶内容を例示する図である。It is a figure which illustrates the memory content of an association database. 関連付けデータベースの記憶内容を例示する図である。It is a figure which illustrates the memory content of an association database. 読影レポート作成画面を例示する図である。It is a figure which illustrates an interpretation report creation screen. 部位入力領域に表示される表示要素を例示する図である。It is a figure which illustrates the display element displayed on a site | part input area. 部位入力領域に表示される表示要素を例示する図である。It is a figure which illustrates the display element displayed on a site | part input area. 分類用情報を充実化する為のオフライン入力画面を例示する図である。It is a figure which illustrates the offline input screen for enriching the information for classification. 変形例に係る情報処理システムの外観構成を示す模式図である。It is a schematic diagram which shows the external appearance structure of the information processing system which concerns on a modification.

符号の説明Explanation of symbols

1,1A 情報処理システム
12 操作部
13 表示部
15 制御部
16 記憶部
151 機械学習部
152 分類データ生成部
153 文章データ受付部
154 形態素解析部
155 フレーズ抽出部
156 分類抽出部
157 同義・類義・類似語検出部
158 置換データ生成部
159 記憶制御部
160 関連頻度算出部
161 プログラム
162 分類用情報
163 辞書データベース
164 使用頻度データ
165 関連付けデータベース
251 表示用データ生成部
252 データ出力部
253 フレーズ構成要素指示部
254 新規フレーズ生成部
DESCRIPTION OF SYMBOLS 1,1A Information processing system 12 Operation part 13 Display part 15 Control part 16 Storage part 151 Machine learning part 152 Classification data generation part 153 Text data reception part 154 Morphological analysis part 155 Phrase extraction part 156 Classification extraction part 157 Similar word detection unit 158 Replacement data generation unit 159 Storage control unit 160 Related frequency calculation unit 161 Program 162 Information for classification 163 Dictionary database 164 Usage frequency data 165 Association database 251 Display data generation unit 252 Data output unit 253 Phrase component instruction unit 254 New phrase generator

Claims (19)

情報処理システムであって、
所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを記憶する分類用情報記憶手段と、
文章情報の入力を受け付ける受付手段と、
前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するフレーズ抽出手段と、
前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出する要素抽出手段と、
を備えることを特徴とする情報処理システム。
An information processing system,
For classification that stores phrase information indicating a specific phrase including a plurality of language elements including one or more language elements belonging to a predetermined category, and element classification information obtained by classifying a number of language elements into a plurality of types of classification items Information storage means;
A receiving means for receiving input of sentence information;
Phrase extracting means for extracting a phrase in the sentence corresponding to the specific phrase from the sentence information based on the phrase information;
Based on the element classification information, element extraction means for extracting each phrase component included in the phrase in the sentence while classifying it into the plurality of types of classification items;
An information processing system comprising:
請求項1に記載の情報処理システムであって、
前記フレーズ情報が、
学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする情報処理システム。
The information processing system according to claim 1,
The phrase information is
An information processing system including information obtained by machine learning using a learning example corpus.
請求項2に記載の情報処理システムであって、
前記複数種類の分類項目が、
相対的に広い概念を示す用語が属する大分類と、相対的に狭い概念を示す用語が属する小分類と、接頭辞と、接尾辞と、を含むことを特徴とする情報処理システム。
The information processing system according to claim 2,
The plurality of types of classification items are
An information processing system comprising: a major classification to which terms representing relatively broad concepts belong; a minor classification to which terms representing relatively narrow concepts belong; a prefix; and a suffix.
請求項3に記載の情報処理システムであって、
前記要素抽出手段が、
前記接頭辞及び接尾辞に属するフレーズ構成要素については、前記文章中フレーズにおける前記大分類及び前記小分類に属する用語との位置関係に従って、前記大分類に属する用語に付された接頭辞であるのか、前記大分類に属する用語に付された接尾辞であるのか、前記小分類に属する用語に付された接頭辞であるのか、前記小分類に属する用語に付された接尾辞であるのかを分類しつつ抽出することを特徴とする情報処理システム。
The information processing system according to claim 3,
The element extraction means is
Whether the phrase component belonging to the prefix and suffix is a prefix attached to the term belonging to the major category according to the positional relationship with the term belonging to the major category and the minor category in the phrase in the sentence Categorizing whether it is a suffix attached to a term belonging to the major category, a prefix attached to a term belonging to the minor category, or a suffix attached to a term belonging to the minor category An information processing system characterized by performing extraction.
請求項3または請求項4に記載の情報処理システムであって、
前記要素分類情報が、
前記接頭辞及び接尾辞にそれぞれ属するフレーズ構成要素をリスト形式で示した情報を含むことを特徴とする情報処理システム。
An information processing system according to claim 3 or claim 4, wherein
The element classification information is
An information processing system comprising information indicating in a list form phrase constituent elements respectively belonging to the prefix and suffix.
請求項1から請求項5のいずれかに記載の情報処理システムであって、
前記要素分類情報が、
学習用例コーパスを用いた機械学習で得られた情報を含むことを特徴とする情報処理システム。
An information processing system according to any one of claims 1 to 5,
The element classification information is
An information processing system including information obtained by machine learning using a learning example corpus.
請求項2から請求項5のいずれかに記載の情報処理システムであって、
前記要素分類情報が、
前記学習用例コーパスを用いた機械学習で得られた特定フレーズを示す情報を、更に学習用例コーパスとして用いた機械学習によって得られた情報を含むことを特徴とする情報処理システム。
An information processing system according to any one of claims 2 to 5,
The element classification information is
An information processing system characterized in that information indicating a specific phrase obtained by machine learning using the learning example corpus further includes information obtained by machine learning used as a learning example corpus.
請求項1から請求項7のいずれかに記載の情報処理システムであって、
前記要素抽出手段によって前記文章中フレーズから抽出された複数のフレーズ構成要素からなるフレーズ構成要素群について、当該フレーズ構成要素群に含まれる各フレーズ構成要素どうしをフレーズの所定の構成ルールに従って関連付けて所定のデータベースに記憶する記憶制御手段、
を更に備えることを特徴とする情報処理システム。
An information processing system according to any one of claims 1 to 7,
Predetermined by associating each phrase component included in the phrase component group with each other according to a predetermined configuration rule of the phrase with respect to a phrase component group composed of a plurality of phrase components extracted from the phrase in the sentence by the element extraction means Storage control means for storing in the database of
An information processing system further comprising:
請求項8に記載の情報処理システムであって、
同義語群に対して代表語を関連付けた同義語データ、および類義語群に対して代表語を関連付けた類義語データのうちの少なくとも一方を含む辞書データを記憶する辞書データ記憶手段と、
前記フレーズ構成要素群から前記同義語群および前記類義語群のうちの少なくとも一方に属する語群所属語を検出する所属語検出手段と、
前記辞書データに基づいて、前記フレーズ構成要素群のうちの前記語群所属語を、当該語群所属語に対応する代表語に置換して置換後フレーズ構成要素群を生成する置換生成手段と、
を更に備え、
前記記憶制御手段が、
前記フレーズ構成要素群の代わりに前記置換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする情報処理システム。
The information processing system according to claim 8,
Dictionary data storage means for storing dictionary data including at least one of synonym data in which a representative word is associated with a synonym group, and synonym data in which a representative word is associated with a synonym group;
An affiliated word detection means for detecting a word group belonging word belonging to at least one of the synonym group and the synonym group from the phrase component group;
Based on the dictionary data, a replacement generating means for generating the replaced phrase component group by replacing the word group belonging word in the phrase component group with a representative word corresponding to the word group belonging word;
Further comprising
The storage control means is
An information processing system characterized in that instead of the phrase component group, each phrase component included in the post-substitution phrase component group is associated according to the predetermined configuration rule and stored in the predetermined database.
請求項9に記載の情報処理システムであって、
ユーザーによる操作に応答して、前記同義語群に対する代表語を当該同義語群に含まれる複数語から指定する第1の代表語指定、および前記類義語群に対する代表語を当該類義語群に含まれる複数語から指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段、
を更に備えることを特徴とする情報処理システム。
The information processing system according to claim 9,
In response to an operation by the user, a first representative word designating a representative word for the synonym group from a plurality of words included in the synonym group, and a plurality of representative words for the synonym group included in the synonym group Designation execution means for executing at least one of second representative word designations designated from words;
An information processing system further comprising:
請求項9に記載の情報処理システムであって、
前記受付手段によって受け付けられる複数の文章情報を対象として、前記辞書データに属する各語群所属語の出現回数を計算する出現回数算出手段と、
前記出現回数算出手段によって計算された出現回数に基づいて、前記同義語群に含まれる複数語のうち最も出現回数が多い語を当該同義語群に対する代表語として指定する第1の代表語指定、および前記類義語群に含まれる複数語のうち最も出現回数が多い語を当該類義語群に対する代表語として指定する第2の代表語指定のうちの少なくとも一方を実行する指定実行手段と、
を更に備えることを特徴とする情報処理システム。
The information processing system according to claim 9,
Appearance frequency calculating means for calculating the appearance frequency of each word group belonging word belonging to the dictionary data for a plurality of text information received by the receiving means;
Based on the number of appearances calculated by the appearance number calculating means, a first representative word designation that designates a word having the highest number of appearances among a plurality of words included in the synonym group as a representative word for the synonym group, And designation execution means for executing at least one of the second representative word designation that designates a word that appears most frequently as a representative word for the synonym group among a plurality of words included in the synonym group;
An information processing system further comprising:
請求項8から請求項11のいずれかに記載の情報処理システムであって、
類似語群を示す類似語用例データを記憶する類似語記憶手段と、
前記類似語用例データに基づいて、前記フレーズ構成要素群から前記類似語群を構成する類似語群構成語を検出する構成語検出手段と、
前記フレーズ構成要素群のうちの前記類似語群構成語を、前記類似語群を構成する当該類似語群構成語とは異なる他の類似語群構成語に変換して変換後フレーズ構成要素群を生成する変換生成手段と、
を更に備え、
前記記憶制御手段が、
前記フレーズ構成要素群とは別に前記変換後フレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて前記所定のデータベースに記憶することを特徴とする情報処理システム。
An information processing system according to any one of claims 8 to 11,
Similar word storage means for storing similar word example data indicating a similar word group;
Based on the similar word example data, constituent word detecting means for detecting a similar word group constituent word constituting the similar word group from the phrase constituent element group;
The phrase component group after conversion by converting the similar word group component word in the phrase component group into another similar word group component word different from the similar word group component word constituting the similar word group. Conversion generating means for generating;
Further comprising
The storage control means is
In addition to the phrase component group, each phrase component included in the post-conversion phrase component group is associated according to the predetermined configuration rule and stored in the predetermined database.
請求項8から請求項12のいずれかに記載の情報処理システムであって、
前記所定のデータベースに基づいて、前記所定のデータベースに含まれる各フレーズ構成要素どうしの関連付けを可視的な連結要素を用いて当該各フレーズ構成要素どうしを連結して表示する表示手段、
を更に備えることを特徴とする情報処理システム。
An information processing system according to any one of claims 8 to 12,
Based on the predetermined database, display means for displaying the association between the phrase components included in the predetermined database by connecting the phrase components using a visible connection element;
An information processing system further comprising:
請求項13に記載の情報処理システムであって、
前記所定のデータベースにおける各フレーズ構成要素間の関連付けの頻度を計算する関連頻度算出手段と、
前記関連付けの頻度に基づいて、前記可視的な連結要素の態様を変更する要素変更手段と、
を更に備えることを特徴とする情報処理システム。
The information processing system according to claim 13,
Association frequency calculating means for calculating the frequency of association between each phrase component in the predetermined database;
Element changing means for changing the aspect of the visible connection element based on the association frequency;
An information processing system further comprising:
請求項14に記載の情報処理システムであって、
前記関連頻度算出手段が、
前記要素抽出手段によって抽出された前記フレーズ構成要素群に従って、前記関連付けの頻度を計算することを特徴とする情報処理システム。
The information processing system according to claim 14,
The related frequency calculating means is
An information processing system characterized in that the association frequency is calculated according to the phrase component group extracted by the element extraction means.
請求項13から請求項15のいずれかに記載の情報処理システムであって、
新規フレーズを入力する際に、前記所定のデータベースに基づき前記表示手段に複数要素が表示された画面上で、ユーザーの操作に応答して前記複数種類の分類項目のうちの少なくとも1つの項目に属する要素を前記新規フレーズを構成する要素として指示する要素指示手段、
を更に備えることを特徴とする情報処理システム。
An information processing system according to any one of claims 13 to 15,
When inputting a new phrase, it belongs to at least one of the plurality of types of classification items in response to a user operation on a screen on which a plurality of elements are displayed on the display unit based on the predetermined database Element indicating means for indicating an element as an element constituting the new phrase;
An information processing system further comprising:
請求項8から請求項16のいずれかに記載の情報処理システムであって、
ユーザーによる操作に応答して、新規なフレーズ構成要素群を示す手動追加データを入力する入力手段、
を更に備え、
前記記憶制御手段が、
前記手動追加データによって示されるフレーズ構成要素群に含まれる各フレーズ構成要素どうしを前記所定の構成ルールに従って関連付けて所定のデータベースに記憶することを特徴とする情報処理システム。
The information processing system according to any one of claims 8 to 16,
An input means for inputting manually added data indicating a new phrase component group in response to a user operation,
Further comprising
The storage control means is
An information processing system, wherein each phrase component included in a phrase component group indicated by the manually added data is associated with each other according to the predetermined configuration rule and stored in a predetermined database.
情報処理システムに含まれるコンピュータによって実行されることにより、前記情報処理システムを、請求項1から請求項17のいずれかに記載の情報処理システムとして機能させるプログラム。   A program that causes the information processing system to function as the information processing system according to any one of claims 1 to 17 by being executed by a computer included in the information processing system. 情報処理方法であって、
(a)所定のカテゴリーに属する1以上の言語要素を含む複数言語要素を構成要素とする特定フレーズを示すフレーズ情報、および多数の言語要素を複数種類の分類項目に分類した要素分類情報とを準備するステップと、
(b)文章情報の入力を受け付けるステップと、
(c)前記フレーズ情報に基づいて、前記文章情報から前記特定フレーズに対応する文章中フレーズを抽出するステップと、
(d)前記要素分類情報に基づいて、前記文章中フレーズに含まれる各フレーズ構成要素を前記複数種類の分類項目に分類しつつ抽出するステップと、
を備えることを特徴とする情報処理方法。
An information processing method,
(a) Prepare phrase information indicating a specific phrase including multiple language elements including one or more language elements belonging to a predetermined category, and element classification information in which a large number of language elements are classified into a plurality of types of classification items. And steps to
(b) receiving text information input;
(c) based on the phrase information, extracting a phrase in the sentence corresponding to the specific phrase from the sentence information;
(d) extracting each phrase component included in the phrase in the sentence based on the element classification information while classifying it into the plurality of types of classification items;
An information processing method comprising:
JP2005333193A 2005-11-17 2005-11-17 Information processing system, information processing method, and program Pending JP2007140861A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005333193A JP2007140861A (en) 2005-11-17 2005-11-17 Information processing system, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005333193A JP2007140861A (en) 2005-11-17 2005-11-17 Information processing system, information processing method, and program

Publications (1)

Publication Number Publication Date
JP2007140861A true JP2007140861A (en) 2007-06-07

Family

ID=38203643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005333193A Pending JP2007140861A (en) 2005-11-17 2005-11-17 Information processing system, information processing method, and program

Country Status (1)

Country Link
JP (1) JP2007140861A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009041586A1 (en) * 2007-09-28 2009-04-02 Canon Kabushiki Kaisha Diagnosis support device and control method thereof
WO2009054215A1 (en) * 2007-10-23 2009-04-30 Konica Minolta Medical & Graphic, Inc. Information processing system and program
WO2009079875A1 (en) * 2007-12-14 2009-07-02 Shanghai Hewlett-Packard Co., Ltd Systems and methods for extracting phrases from text
JP2010055471A (en) * 2008-08-29 2010-03-11 Fujitsu Ltd Information processing program, information processing method and information processor
JPWO2009025022A1 (en) * 2007-08-20 2010-11-18 コニカミノルタエムジー株式会社 Information processing system and program
JP2011100254A (en) * 2009-11-05 2011-05-19 Hitachi Medical Corp Medical diagnostic report system, program for causing computer to function as the system, and method of supporting formation of medical diagnostic report
JP2012200546A (en) * 2011-03-28 2012-10-22 Fujitsu Ltd Medical examination information input device, program and medical examination information input method
WO2018220688A1 (en) * 2017-05-29 2018-12-06 株式会社Pfu Dictionary generator, dictionary generation method, and program
KR20220135841A (en) * 2021-03-31 2022-10-07 한양대학교 산학협력단 Art learning evaluation method and apparatus

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2009025022A1 (en) * 2007-08-20 2010-11-18 コニカミノルタエムジー株式会社 Information processing system and program
JP2009082443A (en) * 2007-09-28 2009-04-23 Canon Inc Diagnosis support device and control method thereof
WO2009041586A1 (en) * 2007-09-28 2009-04-02 Canon Kabushiki Kaisha Diagnosis support device and control method thereof
US7894676B2 (en) 2007-09-28 2011-02-22 Canon Kabushiki Kaisha Diagnosis support apparatus and control method therefor
WO2009054215A1 (en) * 2007-10-23 2009-04-30 Konica Minolta Medical & Graphic, Inc. Information processing system and program
WO2009079875A1 (en) * 2007-12-14 2009-07-02 Shanghai Hewlett-Packard Co., Ltd Systems and methods for extracting phrases from text
US8812508B2 (en) 2007-12-14 2014-08-19 Hewlett-Packard Development Company, L.P. Systems and methods for extracting phases from text
JP2010055471A (en) * 2008-08-29 2010-03-11 Fujitsu Ltd Information processing program, information processing method and information processor
JP2011100254A (en) * 2009-11-05 2011-05-19 Hitachi Medical Corp Medical diagnostic report system, program for causing computer to function as the system, and method of supporting formation of medical diagnostic report
JP2012200546A (en) * 2011-03-28 2012-10-22 Fujitsu Ltd Medical examination information input device, program and medical examination information input method
WO2018220688A1 (en) * 2017-05-29 2018-12-06 株式会社Pfu Dictionary generator, dictionary generation method, and program
KR20220135841A (en) * 2021-03-31 2022-10-07 한양대학교 산학협력단 Art learning evaluation method and apparatus
KR102618313B1 (en) * 2021-03-31 2023-12-27 한양대학교 산학협력단 Art learning evaluation method and apparatus

Similar Documents

Publication Publication Date Title
US10529045B2 (en) Information processing apparatus and information processing method
JP2007140861A (en) Information processing system, information processing method, and program
US9971848B2 (en) Rich formatting of annotated clinical documentation, and related methods and apparatus
JP5517524B2 (en) Medical diagnosis support apparatus, control method and program for medical diagnosis support apparatus
JP4402033B2 (en) Information processing system
US20060136824A1 (en) Process official and business documents in several languages for different national institutions
CN102902872A (en) Report check apparatus and computer program product
JP5837745B2 (en) Medical report creation support device
US20130031456A1 (en) Generating a structured document guiding view
US20190310981A1 (en) Automated identification of salient finding codes in structured and narrative reports
US20130060793A1 (en) Extracting information from medical documents
Artis et al. Data omission by physician trainees on ICU rounds
Starren et al. An object-oriented taxonomy of medical data presentations
US20100010806A1 (en) Storage system for symptom information of Traditional Chinese Medicine (TCM) and method for storing TCM symptom information
Venturi et al. NLP–based readability assessment of health–related texts: a case study on Italian informed consent forms
US8996357B2 (en) Method for generating diagrams, and information processing apparatus for same
JP5251064B2 (en) Interpretation report creation support device
Gashteovski et al. BenchIE: A framework for multi-faceted fact-based open information extraction evaluation
CN116030932A (en) Medicine recommendation system for hypertension
JP5151412B2 (en) Notation fluctuation analyzer
US20130011027A1 (en) System and method for composing a medical image analysis
US20110131234A1 (en) Information process system, and program
Park et al. Criteria2Query 3.0: Leveraging generative large language models for clinical trial eligibility query generation
CN112699669A (en) Natural language processing, device and storage medium for fluid pathology survey report
JP5816321B2 (en) Information processing apparatus, information processing system, information processing method, and program