JP2009258870A - Information extraction device and program, and information extraction rule generation device and program - Google Patents
Information extraction device and program, and information extraction rule generation device and program Download PDFInfo
- Publication number
- JP2009258870A JP2009258870A JP2008105275A JP2008105275A JP2009258870A JP 2009258870 A JP2009258870 A JP 2009258870A JP 2008105275 A JP2008105275 A JP 2008105275A JP 2008105275 A JP2008105275 A JP 2008105275A JP 2009258870 A JP2009258870 A JP 2009258870A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- vocabulary
- medical
- relationship
- information extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 88
- 239000000284 extract Substances 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 description 23
- 201000010099 disease Diseases 0.000 description 22
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 22
- 210000003484 anatomy Anatomy 0.000 description 17
- 230000008859 change Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 9
- 210000002751 lymph Anatomy 0.000 description 8
- 210000001165 lymph node Anatomy 0.000 description 8
- 230000001394 metastastic effect Effects 0.000 description 6
- 206010061289 metastatic neoplasm Diseases 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 206010027476 Metastases Diseases 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 230000009401 metastasis Effects 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 208000008771 Lymphadenopathy Diseases 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 210000004885 white matter Anatomy 0.000 description 1
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
この発明は、特定分野のドキュメント、例えば医療分野の電子カルテや読影レポートから言語的な知見を抽出する情報抽出技術、および情報抽出ルール生成技術に関する。 The present invention relates to an information extraction technique for extracting linguistic knowledge from a document in a specific field, such as an electronic medical record or an interpretation report in the medical field, and an information extraction rule generation technique.
医療情報分野では、電子カルテや読影レポートの自動作成支援などをシステム開発に役立てるため、オントロジーなどの言語的な知見をカルテや読影レポートなどから自動的に抽出する手法が盛んに研究されている。ある特定のドメイン(以下では個別分野または特定分野ともいう)における情報の抽出は、そのドメイン特有の工夫が必要となる。医療分野における情報抽出技術は、計算機上で医療ドキュメントが電子的に蓄積されるようになった現在、盛んに研究が行われている。情報抽出の目的は、医療ドキュメント中から上位語下位語のペアを抽出し、オントロジーの構築に役立てようとするもの、医療ドキュメント中から疾患部分と所見部分を抜き出し、疾患から所見へと至る推論知識を得ようとするものなどがある。非特許文献1は医療分野におけるドメインスペシフィックな状況における情報抽出を提案している。また、医療分野以外でも商品に対するユーザからの意見抽出を目的とし、抽出個所に対応した複数ルールを用いて情報の抽出を行うことが提案されている(特許文献1など)。特許文献1の提案では、意見を述べている文について4つのスロットを考慮し、そのうちの抽出個所に対応するキーワードがない場合には、他の抽出キーワードから省略されている抽出対象を推測するようなルールを具備する工夫がなされている。 In the medical information field, methods for automatically extracting linguistic knowledge such as ontology from medical records and interpretation reports are being actively researched in order to make use of electronic medical records and automatic interpretation report support for system development. Extraction of information in a specific domain (hereinafter also referred to as an individual field or a specific field) requires a device specific to the domain. Information extraction technology in the medical field is being actively researched now that medical documents are electronically stored on computers. The purpose of information extraction is to extract broader terms and lower-word pairs from medical documents to help build ontologies, extract the disease and findings from medical documents, and make inference knowledge from disease to findings There are things that try to get. Non-Patent Document 1 proposes information extraction in a domain specific situation in the medical field. Further, it has been proposed to extract information by using a plurality of rules corresponding to the extraction location for the purpose of extracting opinions from users regarding products outside the medical field (Patent Document 1, etc.). In the proposal of Patent Document 1, four slots are considered for a sentence expressing an opinion, and if there is no keyword corresponding to the extracted part, an extraction target omitted from other extracted keywords is estimated. The device is equipped with various rules.
読影レポートなど実際の医療ドキュメントから、パターンを用いた方法で上位語下位語を抽出する手法や、疾患と所見部分のペアを構文解析結果から取得するなどの情報抽出手法では、複数文に渡る医療ドキュメントの記述に抽出パターンや手法が対応できないと言う問題があった。 In the method of extracting broader terms and narrower terms from the actual medical document such as interpretation report, and the information extraction method such as obtaining the pair of disease and finding part from the parsing result, the medical treatment spans multiple sentences. There was a problem that extraction patterns and methods could not be applied to document descriptions.
読影レポートなどの医療ドキュメントでは、患部の特徴を述べる部分と医師の判断を述べる部分が複数の文に分かれる場合がある。あるいは、1文で述べられていても文構造が複雑な場合がある。以下のような読影レポート中の文章から、医師が何かしらの判断をした病名の名詞とその所見に関する記述の関係を抽出したいような場合には、既存のパターンや構文解析結果を用いた手法では対応できない。 In a medical document such as an interpretation report, there are cases where a part describing the characteristics of an affected part and a part describing a doctor's judgment are divided into a plurality of sentences. Or, even if it is described in one sentence, the sentence structure may be complicated. If you want to extract the relationship between the noun of the disease name that the doctor made a decision and the description about the findings from the sentences in the interpretation report such as the following, the method using existing patterns and syntax analysis results is supported Can not.
[文章A]
−−−左肺門部にはリンパ節様結節が見られます。以前のCTでは見られない変化です。転移リンパ節の可能性が高いと思われます。−−−
[Sentence A]
--- Lymph node-like nodules are seen in the left hilar region. This change is not seen in previous CT. The possibility of metastatic lymph nodes is high. ----
既存のシステムでは、テキスト中の各文に対して、医療語彙についての注釈作業(アノテート)を行った後にパターンまたは構文解析結果を用いて疾患と所見の組を抽出する。非特許文献1による手法では、所見部分を表す医師の主張を表す動詞を検出し、その動詞に係る医療名詞部分の連なりの部分木から、医療知識を検出し、別の方法で取得した疾患名と関連付ける。しかし、これら既存の抽出方法では、文をまたいだような記述から知識を抽出できない。ゆえに、上記文章において述べられているような、「リンパ節様結節は転移リンパ節と思う」といった関係の抽出には対処できない。また、仮に文章Aが以下のような形態に変換したとする。 In the existing system, after annotating (annotating) a medical vocabulary with respect to each sentence in the text, a set of a disease and a finding is extracted using a pattern or a parsing result. In the technique according to Non-Patent Document 1, a verb representing a doctor's claim representing a finding part is detected, medical knowledge is detected from a subtree of a series of medical noun parts related to the verb, and a disease name obtained by another method Associate with. However, with these existing extraction methods, knowledge cannot be extracted from descriptions that straddle sentences. Therefore, it cannot cope with the extraction of the relationship such as “I think lymph node-like nodules are metastatic lymph nodes” as described in the above text. Further, it is assumed that the sentence A is converted into the following form.
[文章B]
−−−左肺門部にはリンパ節様結節が見られ、以前のCTでは見られない変化であり、転移リンパ節の可能性が高いと思われます。−−−
[Sentence B]
---- Lymph node-like nodules are seen in the left hilar region, a change not seen in previous CT, and the possibility of metastatic lymph nodes seems high. ----
しかし、上記の場合では、1文中に複数の動詞が存在し構文構造が複雑となり、パターンによる知識の抽出は困難である。「可能性が高いと思われる」を医師の主張する部分だとした場合、その部分と「リンパ節様結節が見られ」が並置構造となり、論旨の流れを抽出する処理には別のパターンを数多く記述する必要となる。医師によって様々な文章で記述された医療ドキュメントから情報抽出を行うには、何らかの医療ドキュメント特有の工夫が必要であると考えられる。 However, in the above case, a plurality of verbs exist in one sentence, the syntax structure becomes complicated, and it is difficult to extract knowledge by pattern. If the doctor insists that "probably likely" is the part that the doctor claims, that part and "the lymph node-like nodule is seen" will be a juxtaposed structure, and a different pattern will be used for the process of extracting the flow of arguments It is necessary to describe many. In order to extract information from a medical document described in various sentences by a doctor, it is considered that some device specific to the medical document is necessary.
例えば、複数の文にまたがって存在するような複雑な構造から医療知識を抽出する手法が望まれている。 For example, a technique for extracting medical knowledge from a complicated structure that exists across a plurality of sentences is desired.
なお、上述の従来技術やその問題点は、この発明の背景の一部を説明するためにのみ説明している。この発明は上述の従来技術や問題点に限定されるものではない点に留意されたい。
この発明は、個別分野のドキュメント、例えば、読影レポートなどの医療ドキュメントから高精度な情報抽出を行うことを目的とする。 An object of the present invention is to perform highly accurate information extraction from a document in an individual field, for example, a medical document such as an interpretation report.
この発明によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。 According to this invention, in order to achieve the above-mentioned object, the configuration as described in the claims is adopted. Here, prior to describing the invention in detail, supplementary explanations of the claims will be given.
すなわち、請求項1の発明によれば、上述の目的を達成するために、情報抽出装置に:個別分野のドキュメントから個別分野で用いられる語彙を特定する個別分野語彙特定手段と;1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段と;上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段と;上記第1のルールおよび上記第2のルールを併用して上記個別分野のドキュメントから語彙の関係を抽出する情報抽出手段とを設けている。 That is, according to the first aspect of the present invention, in order to achieve the above-mentioned object, the information extracting device includes: an individual field vocabulary specifying means for specifying a vocabulary used in an individual field from a document in the individual field; Rule applying means for applying the first rule to the vocabulary used in the individual field specified in the individual field document and extracting the relationship between the vocabularies; and the rule applying means for each first rule From the vocabulary forming a predetermined term or the set of categories of the vocabulary included in each of the plurality of relationships extracted in step 1, the extraction of the first rule is applied as an activation condition to extract a new relationship between the vocabularies. Rule creating means for creating a second rule; information for extracting a vocabulary relationship from a document in the individual field by using the first rule and the second rule together Out it is provided and means.
また、請求項2の発明によれば、請求項1の発明において、上記第1のルールおよび上記第2のルールは2つの語彙の間の関係を抽出するものである。 According to the invention of claim 2, in the invention of claim 1, the first rule and the second rule extract a relationship between two vocabularies.
また、請求項3の発明によれば、請求項2の発明において、上記第1のルールは第1の部分と第2の部分を含み、上記第1の部分を満たす第1の文章要素の直前に上記第2の部分を満たす第2の文章要素が出現するときに上記第1のルールが満たされ、上記第1の文章要素中の上記1項をなす語彙と上記第2の文章要素中の上記1項をなす語彙との間の関係を抽出し、上記第2のルールは、対応する第1のルールの上記第1の部分であって、上記1項をなす語彙または当該語彙のカテゴリの1つを含むものを第1の部分として含み、対応する第1のルールの上記第1の部分であって、上記1項をなす語彙または当該語彙のカテゴリの他の1つを含むものを第2の部分として含み、上記対応する第1のルールが満たされたときに発動され、上記第2の文章要素が当該第2のルールの第1の部分を満たし、当該第1の文章要素の直前に当該第2のルールの第2の部分を満たす第3の文章要素が出現するときに、上記第2の文章要素中の上記1項をなす語彙と上記第3の文章要素中の所定の1項をなす語彙との間の関係を抽出するようになっている。 According to the invention of claim 3, in the invention of claim 2, the first rule includes a first part and a second part, immediately before the first sentence element satisfying the first part. The first rule is satisfied when a second sentence element that satisfies the second part appears in the first sentence element, and the vocabulary forming the first term in the first sentence element and the second sentence element in the second sentence element The relationship between the vocabulary that constitutes the first term is extracted, and the second rule is the first part of the corresponding first rule, and the vocabulary that constitutes the first term or the category of the vocabulary. The first part of the corresponding first rule, including the one containing the one, the first part of the corresponding vocabulary or the other category of the vocabulary. 2 part and triggered when the corresponding first rule is satisfied, When the second sentence element satisfies the first part of the second rule, and the third sentence element that satisfies the second part of the second rule appears immediately before the first sentence element, The relationship between the vocabulary forming the one term in the second sentence element and the vocabulary forming the predetermined one term in the third sentence element is extracted.
また、請求項4の発明によれば、請求項1、2または3の発明において、上記個別分野は医療分野であり、上記第1のルールは、病状と判断することを表す語彙とその判断の根拠をなす語彙との間の関係を抽出するルールを含み、上記第2のルールは、上記病状と判断することを表す語彙とその判断の根拠をなす語彙との間の関係を抽出するルールから抽出された複数の関係の上記判断の根拠をなす語彙または当該語彙の語彙カテゴリの組から作成されるようにしている。 According to a fourth aspect of the present invention, in the first, second or third aspect of the invention, the individual field is a medical field, and the first rule is a vocabulary indicating that a medical condition is determined and the determination Including a rule for extracting a relationship between a vocabulary that forms a basis, and the second rule is based on a rule for extracting a relationship between a vocabulary representing that the medical condition is determined and a vocabulary that forms the basis of the determination. It is created from a vocabulary that forms the basis for the above-described determination of a plurality of extracted relationships or a set of vocabulary categories of the vocabulary.
また、請求項5の発明によれば、請求項1、2、3または4の発明において、上記第1のルールごとに、上記第2のルールを作成するのに用いる上記語彙または当該語彙のカテゴリは、当該第1のルールが適用されて抽出される頻度が所定の閾値を超えた語彙または当該語彙のカテゴリに限定するようにしている。 Further, according to the invention of claim 5, in the invention of claim 1, 2, 3 or 4, the vocabulary or category of the vocabulary used to create the second rule for each of the first rules. Is limited to a vocabulary or a category of the vocabulary whose frequency extracted by applying the first rule exceeds a predetermined threshold.
また、請求項6の発明によれば、コンピュータを:個別分野のドキュメントから個別分野で用いられる語彙を特定する個別分野語彙特定手段;1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段;上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段;上記第1のルールおよび上記第2のルールを併用して上記個別分野のドキュメントから語彙の関係を抽出する情報抽出手段として機能させるための情報抽出用プログラムを実現する。 According to a sixth aspect of the present invention, there is provided a computer: an individual field vocabulary specifying means for specifying a vocabulary used in an individual field from an individual field document; one or more first rules in the individual field document Rule applying means for extracting a relationship between vocabularies by applying to the specified vocabulary used in the individual field; a predetermined number included in each of the plurality of relationships extracted by the rule applying means for each of the first rules Rule creating means for creating a second rule for extracting a new relationship between words by applying the extraction of the first rule as a trigger condition from a vocabulary forming one term or a set of categories of the vocabulary; Information extraction for functioning as information extraction means for extracting vocabulary relationships from documents in the individual fields by using both the first rule and the second rule To implement the program.
また、請求項7の発明によれば、情報抽出ルール生成装置に:個別分野のドキュメントから個別分野で用いられる語彙を特定する個別分野語彙特定手段と;1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段と;上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段とを設けるようにしている。 According to the invention of claim 7, the information extraction rule generation device includes: individual field vocabulary specifying means for specifying a vocabulary used in an individual field from an individual field document; and one or more first rules as the individual rule A rule applying means for extracting a relationship between the vocabularies by applying to the vocabulary used in the individual field specified in the document of the field; a plurality of relationships extracted by the rule applying means for each of the first rules; A second rule for extracting a new relationship between vocabularies is created by applying the extraction of the first rule as a triggering condition from a vocabulary forming a predetermined term included in each or a set of categories of the vocabulary. Rule creation means is provided.
また、請求項8の発明によれば、コンピュータを:個別分野のドキュメントから個別分野で用いられる語彙を特定する個別分野語彙特定手段;1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段;上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段として機能させるための情報抽出ルール生成用プログラムを実現する。 According to the invention of claim 8, a computer: an individual field vocabulary specifying means for specifying a vocabulary used in an individual field from an individual field document; one or more first rules in the individual field document Rule applying means for extracting a relationship between vocabularies by applying to the specified vocabulary used in the individual field; a predetermined number included in each of the plurality of relationships extracted by the rule applying means for each of the first rules From the vocabulary constituting one term or the set of categories of the vocabulary, the extraction of the first rule is applied as an activation condition to function as rule creation means for creating a second rule for extracting a new relationship between the vocabularies. An information extraction rule generation program is realized.
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。 These and other aspects of the invention are set forth in the appended claims and will be described in detail below with reference to examples.
請求項1および請求項6の発明によれば、第1のルールを個別分野のドキュメントに提供して抽出した関係から第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成して、当該個別分野のドキュメントからの高精度な情報抽出を可能にする。なお、第2のルールの適用により抽出される語彙間の新たな関係とは、第1のルールと異なるルールである第2のルールを適用して新たに抽出された関係を指すものであり、関係そのものが新規であることを指すものではない。 According to the first and sixth aspects of the present invention, the extraction of the first rule is applied as the trigger condition from the relationship extracted by providing the first rule to the document in the individual field, and a new relationship between the vocabularies is established. A second rule to be extracted is created to enable highly accurate information extraction from the individual field document. Note that the new relationship between vocabularies extracted by applying the second rule refers to a relationship newly extracted by applying the second rule, which is a rule different from the first rule. It does not indicate that the relationship itself is new.
請求項2および3の発明によれば、2つの語彙の間の関係という単純な関係から情報を抽出できる。第1のルールを発動条件として適用される第2のルールを単一の個別のルールで構成する場合、第1のルールおよび第2のルールの個数をN1およびN2とすると、N1×N2の個数のルールが必要となるけれども、請求項2の発明ではN1+N2の個数のルールで済み、ルールの個数が抑制される。 According to the inventions of claims 2 and 3, information can be extracted from a simple relationship called a relationship between two vocabularies. In the case where the second rule applied with the first rule as an activation condition is composed of a single individual rule, the number of the first rule and the second rule is N1 and N2, and the number of N1 × N2 However, in the invention of claim 2, the number of rules is N1 + N2, and the number of rules is suppressed.
請求項4の発明によれば、医療分野のドキュメントから症状および判断根拠の間の病状・原因関係が抽出でき、第2のルールによりこれを補充する情報をさらに抽出できる。 According to the invention of claim 4, the medical condition / causal relationship between the symptom and the basis of judgment can be extracted from the document in the medical field, and information for supplementing it can be further extracted by the second rule.
請求項5の発明によれば、実際のドキュメントの統計情報を反映して第2のルールを抽出できる。 According to the invention of claim 5, the second rule can be extracted reflecting the statistical information of the actual document.
請求項7および請求項8の発明によれば、第1のルールを個別分野のドキュメントに提供して抽出した関係から第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成できる。 According to the inventions of claim 7 and claim 8, the extraction of the first rule is applied as a trigger condition from the relationship extracted by providing the first rule to a document in an individual field, and a new relationship between vocabularies is established. A second rule to be extracted can be created.
以下、この発明を医療ドキュメントから情報を抽出する情報抽出システムに適用した実施例について説明する。 Hereinafter, an embodiment in which the present invention is applied to an information extraction system for extracting information from a medical document will be described.
以下では、医療ドキュメントとして、読影レポートを想定するが、この発明はこれに限定されない。読影レポート中のテキストは、基本的に患部のMRIやCTなど撮影上の特徴を記述し所見を述べる文とそれに対する医師の判断を記述する文に分かれている。それぞれの文においては医療用語が存在する。医療ドキュメントにおける情報抽出とは、一般的には、それら医療用語間、あるいは医療用語と動詞などの一般用語との間の関係を抽出することである。 In the following, an interpretation report is assumed as a medical document, but the present invention is not limited to this. The text in the interpretation report is basically divided into a sentence that describes radiographic features such as MRI and CT of the affected area and describes the findings, and a sentence that describes the judgment of the doctor. There is a medical term in each sentence. Information extraction in a medical document is generally to extract a relationship between medical terms or between a medical term and a general term such as a verb.
この実施例では、医療ドメインの辞書と複数の医療語彙抽出ルールを組み合わせて使用することにより既存の医療語彙関係抽出ルールを拡張し、複数の文または複雑な構造の文に存在する医療語彙の関係を抽出することができるようにする。 In this embodiment, a medical domain dictionary and a plurality of medical vocabulary extraction rules are used in combination to expand an existing medical vocabulary relationship extraction rule, and the relationship between medical vocabulary existing in a plurality of sentences or sentences of complex structures. To be able to extract.
この実施例では、医療語彙間の関係を既存の方法によって大量の医療ドキュメントから抽出し、得られた統計情報を元に、元の抽出ルールを拡張することを考える。拡張されたルールは元のルールよりもより複雑な文や複数文からでも医療語彙間の関係を抽出することが可能となる。以下において、実施例を参照にして、この発明の典型的な形態と共に、この発明によるルール拡張の手順例を説明する。 In this embodiment, the relationship between medical vocabularies is extracted from a large amount of medical documents by an existing method, and the original extraction rule is extended based on the obtained statistical information. The expanded rule can extract the relationship between medical vocabulary even from a more complex sentence or multiple sentences than the original rule. In the following, with reference to an embodiment, an exemplary procedure for extending a rule according to the present invention will be described together with a typical form of the present invention.
図1は、この発明の実施例の情報抽出システム100を示している。この情報抽出システム100は、典型的にはコンピュータシステム、例えばパーソナルコンピュータ200により実現される。パーソナルコンピュータ200は、周知のとおり、CPU、主メモリ、外部記憶装置、バス、種々の入出力装置等を具備し、これにプログラム201をインストールすることにより情報抽出システム100が構築される。情報抽出システム100は単一のコンピュータシステムから構築されてもよいし、ネットワークを介して接続された複数のコンピュータシステムから構築されても良い。
FIG. 1 shows an
図1において、情報抽出システム100は、医療用語抽出部11、医療語彙リソース保持部12、初期ルール保持部13、初期ルール適用部14、拡張ルール作成部15、拡張ルール保持部16、情報抽出部17等を含んで構成される。
In FIG. 1, an
医療用語抽出部11は、医療語彙リソース保持部12に格納された医慮語彙およびその抽出ルールを用いて、医療ドキュメント中の医療語彙を抽出する。医療語彙のカテゴリ(種類ともいう)としては、病名(disease)や部位名(anatomy)、病状(semi−disease)、領域(area)、読影レポートで頻繁に使われる名詞(general)、さらには、門(mon)や性(sei)などの医療語彙に特徴的に現われる接辞などが挙げられる。以下が抽出例である。タグの部分に囲まれた個所が医療語彙に該当し、タグの名前によって医療語彙のカテゴリを区別している。タグは「<」および「>」により指示される。以下の例は、例文中でタグにはさまれた語彙が医療語彙として抽出されていることを示す。
The medical
[例文]
<area>左</area><mon>肺門</mon><area>部</area>には<anatomy>リンパ節様</anatomy><anatomy>結節</anatomy>が見られます。以前の検査では見られなかった<general>変化</general>です。<semi−disease>転移</semi−disease><anatomy>リンパ節</anatomy>の<sei>可能性</sei>が高いと思われます。
[Example]
<Area> left </ area><mon> hilar </ mon><area> part </ area> has <anatomy> lymph node-like </ anatomy><anatomy> nodule </ anatomy>. <General> change </ general> not seen in previous tests. <Sem-disase> metastasis </ semi-disase><anatomy> lymph node </ anatomy><sei> possibility </ sei> seems to be high.
医療語彙リソース保持部12は、医療用語抽出部11で用いる医療語彙辞書や抽出ルールを格納する。医療用語抽出部11は、これら辞書やルールを用いて医療ドキュメント中の医療語彙を抽出する。
The medical vocabulary
初期ルール保持部13は、医療用語関係抽出ルール(初期ルールともいう)を格納する。医療用語抽出部11は、これらルールをドキュメントに適用して医療語彙あるいは文章部分の間の関係を抽出する。例えば、以下のようなルールによって「医師が病状だとの判断を表す部分」と「その原因」との関係を抽出する。ルールは「医師の判断を表す個所」を検出する部分と「その原因の個所」を検出する部分の二つの部分から構成される。初期ルール保持部13では、そのようなルールを予め格納しておく。
The initial
病状原因抽出ルールの例は、以下のようなものであり、実際の実装では、以下のラインを初期ルール適用部14に対応するプログラムが読んで解釈し処理を行う。
An example of a disease state cause extraction rule is as follows. In an actual implementation, the program corresponding to the initial
[情報原因抽出ルールの例]
抽出部:{<medical−term>.+?{見られる|ある}|{見られる|ある}<medical−term>}
@TARGET=<medica−term>
条件部:{<Semi−disease>の<general>|<Semi−disease>}.+?{考える|思う}られる}
[Example of information cause extraction rule]
Extraction unit: {<medical-term>. +? {Seen | some} | {seen | some} <medical-term>}
@ TARGET = <medica-term>
Condition part: {<Semi-disease><general> | <Semi-disease>}. +? {Think | think}}
この例では、以下のように処理が実行される。 In this example, processing is executed as follows.
[情報原因抽出ルールの例の説明]
「[<Semi−disease>の<general>]または[Semi−disease]の部分に[[考える|思う]られる]が続き、その直前「[見られる|ある]」に係るか連体修飾節を構成する医療語彙部分をTARGETとして取り出す。TARGETの部分をSemi−diseaseの「原因」として抽出する。この時、TARGETと「[見られる|ある]」を含むルールの部分は、抽出の目的を含むためルールの抽出部とする。医者の判断を含む部分をルールの条件部とする。
[Description of information cause extraction rule example]
"[<Semi-disease><general>]" or [Semi-disease] is followed by [[Thinking | thinking]], or immediately before that "[seen->thinking]" The medical vocabulary part to be extracted is taken out as TARGET. The TARGET part is extracted as a “cause” of Semi-dissease. At this time, the part of the rule including TARGET and “[See | The part including the judgment of the doctor is set as the condition part of the rule.
この初期病状原因抽出ルールは、複雑な文や、複数の文によって「医師の判断とその根拠の関係」が記述されているような場合にはうまく関係を抽出できない。例えば、以下の文章Aにおける、「リンパ節様結節」と「転移リンパ節」との間の関係は、「以前のCTでは見られない変化です。」の文のみでルールの適用が止まってしまうため抽出できない。上記のルールでは、TARGET=「変化」が病状「転移リンパ節」の原因として抽出されるのみである。さらには、多くの既存の情報抽出システムで想定しているように、ルールの適用対象を1文に限定する場合には、ルールの適用すら不可能となる。 This initial pathological cause extraction rule cannot be extracted well when a complicated sentence or a plurality of sentences describe “relationship between doctor's judgment and its grounds”. For example, in the following sentence A, the relationship between “lymph node-like nodules” and “metastatic lymph nodes” stops applying the rule only with the sentence “changes not seen in previous CT”. Therefore, it cannot be extracted. In the above rule, TARGET = “change” is only extracted as the cause of the disease state “metastatic lymph node”. Furthermore, as assumed in many existing information extraction systems, even when applying a rule to a single sentence, even the rule cannot be applied.
[文章A]
−−−左肺門部にはリンパ節様結節が見られます。以前のCTでは見られない変化です。転移リンパ節の可能性が高いと思われます−−−
[Sentence A]
--- Lymph node-like nodules are seen in the left hilar region. This change is not seen in previous CT. There seems to be a high possibility of metastatic lymph nodes ----
また、上記のような場合を含めた全ての状況をカバーするルールを記述することは現実的ではない。そこで、この実施例では初期ルール適用部14に加えて、拡張ルール作成部15、および拡張ルール保持部16を用いてルールを拡張する。
In addition, it is not realistic to describe a rule that covers all situations including the above case. Therefore, in this embodiment, in addition to the initial
初期ルール適用部14は、初期ルール保持部13に格納されている医療用語関係抽出ルールをとりだして、医療ドキュメントに適用し、ルールごとにTARGET部分の語彙を抽出する。この時、抽出個所の医療語彙の種類を同時に取得する。文章Aに上記の病状原因抽出ルールを適用した場合には、TARGETとして「変化」が<general>という医療カテゴリと伴って取得される。このような抽出を医療ドキュメント全体で行い、TARGETとして得られた医療語彙の種類を取得する。この時、ある一定の閾値を越える頻度で出現したものは表層を取得し、閾値を下回るものは医療語彙の種類が取得される。例えば、読影レポート中に頻出する名詞である「変化」は本実施例では<general>という医療語彙のカテゴリに属し、「変化」は表層の文字列を取得する。対して、「前頭部白質」などは医療カテゴリの<situ>として取得する。医療ドキュメントでは様々な形態の接辞を伴った複合語が出現し、同じ意味の言葉でも様々な形態で出現する。そのように表層語彙が揺れる語彙は医療カテゴリ自体として取得する。
The initial
拡張ルール作成部15は、取得した医療カテゴリおよび語彙の中である頻度以上のものの組合せを取得する。さらに、語彙の組合せから以下の手順で拡張ルールを抽出する。
The extended
[手順1]:一定の頻度以上の語彙または医療カテゴリを取得する。
例えば、部位<Anatomy>、特徴、変化、所見、…を取得する。
[手順2]:上記の語彙の組を作る。
例えば、部位<Anatomy>−特徴/部位<Anatomy>−変化/部位<Anatomy>−所見/…を作成する。
[手順3]:二つの語彙が連続して初期ルールの条件部のような状況にマッチするルールを作り、語彙の組の片方がルールの抽出部、もう一方が条件部となるように、語彙の組から新しい病状原因拡張ルールを作成する。例えば、部位<Anatomy>−「変化」の組から、以下のようなルールを作成する。病状原因拡張ルールの作成の動作例については図3を参照して後に説明する。
[Procedure 1]: A vocabulary or medical category with a certain frequency or higher is acquired.
For example, the site <Anatomy>, features, changes, findings,... Are acquired.
[Procedure 2]: Create the above vocabulary set.
For example, a site <Anatomy> -feature / site <Anatomy> -change / site <Anatomy> -finding /... Is created.
[Procedure 3]: Create a rule that matches the situation like the condition part of the initial rule with two vocabularies in succession, so that one of the vocabulary sets is the rule extraction part and the other is the condition part. A new disease cause expansion rule is created from the set. For example, the following rule is created from a set of part <Anatomy>-“change”. An example of the operation for creating the disease cause expansion rule will be described later with reference to FIG.
病状原因拡張ルールの例は以下のようなものであり、実際の実装では以下のラインを情報抽出部17に対応するプログラムが読んで解釈し処理を行う。
Examples of the disease cause expansion rules are as follows. In actual implementation, the program corresponding to the
[病状原因拡張ルールの例]
抽出部:{{見られる|ある}{<Anatomy>}|{<Anatomy>}.+?{見られる|ある}
@TARGET2=<Anatomy>
条件部:{{見られる|ある}{変化}|{変化}.+?{見られる|ある}}
[Example of disease cause expansion rules]
Extraction unit: {{seen | some} {<Anatomy>} | {<Anatomy>}. +? {Seen} |
@ TARGET2 = <Anatomy>
Condition part: {{seen | already} {change} | {change}. +? {Seen} |
[病状原因拡張ルールの例の説明]
「[変化]」が「[見られる|ある]」に係るか連体修飾節を構成する部分の直前に、部位<Anatomy>が「[見られる|ある]」に係るか連体修飾節を構成する部分がある時、「部位<Anatomy>」の部分をTARGET2として取り出す。
[Explanation of examples of disease cause expansion rules]
Immediately before the part that constitutes the [modification] related to “[seen | already]” or the constituent modification clause, the site <Anatomy> is related to “[seen | always]” or constitutes the structural modification clause When there is a part, the part of “part <Anatomy>” is taken out as TARGET2.
上記のような病状原因拡張ルールは、語彙の組が「見られる」または「ある」という述語を伴い連続して出現するような状況にマッチする。この病状原因抽出拡張ルールと病状原因抽出初期ルールを併せて使うことで、病状の原因を表す語彙が複数の個所に連なって出現するような場合に、その病状の原因となる語彙を同時に抽出することができる。上記のような拡張ルールは拡張ルール保持部16に格納される。
The above-mentioned disease state cause expansion rule matches a situation in which a set of vocabulary appears continuously with a predicate of “seen” or “present”. By using the pathological cause extraction extended rule and the pathological cause extraction initial rule in combination, if the vocabulary representing the cause of the medical condition appears in multiple locations, the vocabulary that causes the medical condition is extracted simultaneously. be able to. The extended rules as described above are stored in the extended
情報抽出部17は、初期ルール保持部13に格納されている初期ルールと拡張ルール保持部16に保持されている拡張ルールの組を用いて、情報抽出を行う。拡張ルールは初期ルールにより関係が抽出された場合に適用される。例えば、上記までの過程において文章Aに対して初期ルールおよび拡張ルールを適用した場合、まず初期ルールによって「病状」<semi−disease>として「転移」が得られ、その部分に対する医師の判断を示す語彙として、「変化」が得られる。さらに拡張ルールを用いると「変化」に対応して「リンパ様節結節」が得られるため、「転移」に対する医師の判断部分として「リンパ節結節、変化」の組が得られ、既存の技術では抽出できなかった「リンパ節様結節」の部分まで情報抽出が可能となる。
The
また、この実施例ではルールの数を少なく抑えることができる。例えば、この実施例によって具備されたルールが、「医師が病状だと判断した部分」の抽出のためのルールが1000種類と「部位名−変化」の組が「見られる|ある」という述語と関係して連なるといったシチュエーションの抽出のためのルールが1000種類の場合、既存のルールによって「部位名−変化」の組が「見られる|ある」という述語と関係して連なり、かつ「医師が病状だと判断した部分」が連なるシチュエーションにマッチさせるには、1000の1000倍の数のルールが必要となってしまう。対して、この実施例による情報抽出システムでは、2000種類のルールでマッチ可能である。 In this embodiment, the number of rules can be reduced. For example, the rule provided by this embodiment includes a predicate that there are 1000 types of rules for extracting “parts judged to be medical conditions by a doctor” and a “part name-change” pair is “seen | If there are 1000 types of rules for extracting situations such as being linked together, the existing rule is linked in association with the predicate that “part name-change” is “seen | In order to match a situation where “the part judged to be” is continuous, 1000 times as many rules as 1000 are required. On the other hand, the information extraction system according to this embodiment can match with 2000 types of rules.
図2は上述実施例の全体的な動作例を示し、図3はルール生成の手順に関する動作例を示す。 FIG. 2 shows an example of the overall operation of the above embodiment, and FIG. 3 shows an example of the operation relating to the rule generation procedure.
図2に説明される全体の動作例は以下のとおりである。 The overall operation example illustrated in FIG. 2 is as follows.
[ステップS21]:医療ドキュメント中の医療語彙を検出する。
[ステップS22]:医療ドキュメントに初期ルールを適用しルールごとの医療用語関係を抽出する。
[ステップS23]:初期ルールごと拡張ルールを作成し、初期ルールごとに格納する。
[ステップS24]:初期ルールおよび拡張ルールを用いて情報抽出処理を行う。拡張ルールは対応する初期ルールが満たされたときに適用する。
[Step S21]: A medical vocabulary in a medical document is detected.
[Step S22]: The initial rule is applied to the medical document, and the medical term relationship for each rule is extracted.
[Step S23]: An extended rule is created for each initial rule and stored for each initial rule.
[Step S24]: Information extraction processing is performed using the initial rule and the extended rule. Extended rules are applied when the corresponding initial rules are met.
図3に説明されるルール生成の手順の動作例は以下のとおりである。 An operation example of the rule generation procedure illustrated in FIG. 3 is as follows.
[ステップS31]:すべての初期ルールにおいて処理を終えたかどうか確認し、終えた場合は処理を終了し、終えていない場合にはステップS32以降の処理を繰り返す。
[ステップS32]:未処理に初期ルールを1つとりだす。
[ステップS33]:医療ドキュメントに初期ルールを適用しルールごとに語彙とその医療カテゴリを抽出し、頻度をカウントする。
[ステップS34]:語彙の頻度が閾値以上かどうかを判別し、閾値以上の場合にはステップS36へ進み、そうでない場合にはステップS35へ進む。
[ステップS35]:その医療カテゴリを語彙集合に加える。ステップS37へ進む。
[ステップS36]:語彙を語彙集合に加える。ステップS37へ進む。
[ステップS37]:語彙集合中の語彙および医療カテゴリのペアを作成する。
[ステップS38]:ペアの頻度が閾値以上か判別し、閾値以上であれば、ステップS37へ進み、どうでなければ、ステップS31へ戻り処理を繰り返す。
[ステップS39]:ペアから追加ルールを作成する。その後、ステップS31へ戻り処理を繰り返す。
[Step S31]: It is confirmed whether or not the processing has been completed for all the initial rules. If the processing has been completed, the processing is terminated. If the processing has not been completed, the processing from step S32 is repeated.
[Step S32]: One initial rule is extracted unprocessed.
[Step S33]: The initial rule is applied to the medical document, the vocabulary and its medical category are extracted for each rule, and the frequency is counted.
[Step S34]: It is determined whether or not the vocabulary frequency is equal to or higher than a threshold value. If the vocabulary frequency is equal to or higher than the threshold value, the process proceeds to step S36, and if not, the process proceeds to step S35.
[Step S35]: The medical category is added to the vocabulary set. Proceed to step S37.
[Step S36]: The vocabulary is added to the vocabulary set. Proceed to step S37.
[Step S37]: Create a pair of vocabulary and medical category in the vocabulary set.
[Step S38]: It is determined whether the frequency of the pair is equal to or higher than a threshold value. If the frequency is equal to or higher than the threshold value, the process proceeds to step S37.
[Step S39]: An additional rule is created from the pair. Then, it returns to step S31 and repeats a process.
なお、この発明は特許請求の範囲の記載に基づいて決定されるものであり、実施例の具体的な構成、課題、および効果には限定されない。この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、上述実施例では、医療分野のドメインスペシフィックな情報を抽出したけれども、医療分野の語彙に代えて他の分野のドメインスペシフィックな語彙や、関係を抽出する初期ルールを準備しておけばその分野の情報の抽出にこの発明を適用できる。また、この発明は、ルールを生成する装置またはプログラムとして実現しても良い。ルール生成装置は、例えば、図1の情報抽出部17を除いた部分から構成できる。
In addition, this invention is determined based on description of a claim, and is not limited to the specific structure of the Example, a subject, and an effect. The present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present invention. For example, in the above embodiment, domain specific information in the medical field is extracted. However, if a domain specific vocabulary in another field or an initial rule for extracting a relationship is prepared instead of the vocabulary in the medical field, that field is prepared. The present invention can be applied to the extraction of information. Further, the present invention may be realized as an apparatus or program for generating rules. For example, the rule generation device can be configured from a portion excluding the
11 医療用語抽出部
12 医療語彙リソース保持部
13 初期ルール保持部
14 初期ルール適用部
15 拡張ルール作成部
16 拡張ルール保持部
17 情報抽出部
100 情報抽出システム
200 パーソナルコンピュータ
201 プログラム
DESCRIPTION OF
Claims (8)
1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段と、
上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段と、
上記第1のルールおよび上記第2のルールを併用して上記個別分野のドキュメントから語彙の関係を抽出する情報抽出手段とを有する情報抽出装置。 Individual field vocabulary identifying means for identifying vocabulary used in individual fields from documents in individual fields;
Rule applying means for applying one or more first rules to the vocabulary used in the individual field specified in the individual field document, and extracting a relationship between the vocabularies;
For each of the first rules, the extraction of the first rule is applied as a trigger condition from a vocabulary forming a predetermined term or a set of categories of the vocabulary included in each of a plurality of relations extracted by the rule applying means. A rule creating means for creating a second rule for extracting a new relationship between the vocabulary and
An information extraction apparatus comprising: an information extraction unit that extracts a vocabulary relationship from a document in the individual field by using the first rule and the second rule together.
個別分野のドキュメントから個別分野で用いられる語彙を特定する個別分野語彙特定手段、
1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段、
上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段、
上記第1のルールおよび上記第2のルールを併用して上記個別分野のドキュメントから語彙の関係を抽出する情報抽出手段
として機能させるための情報抽出用プログラム。 Computer
Individual field vocabulary identification means for identifying vocabulary used in individual fields from documents in individual fields,
A rule applying means for applying one or more first rules to the vocabulary used in the individual field specified in the individual field document to extract a relationship between the vocabularies;
For each of the first rules, the extraction of the first rule is applied as a trigger condition from a vocabulary forming a predetermined term or a set of categories of the vocabulary included in each of a plurality of relations extracted by the rule applying means. A rule creating means for creating a second rule for extracting a new relationship between the vocabulary
An information extraction program for functioning as an information extraction unit that extracts a vocabulary relationship from a document in the individual field by using the first rule and the second rule together.
1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段と、
上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段とを有する情報抽出ルール生成装置。 Individual field vocabulary identifying means for identifying vocabulary used in individual fields from documents in individual fields;
Rule applying means for applying one or more first rules to the vocabulary used in the individual field specified in the individual field document, and extracting a relationship between the vocabularies;
For each of the first rules, the extraction of the first rule is applied as a trigger condition from a vocabulary forming a predetermined term or a set of categories of the vocabulary included in each of a plurality of relations extracted by the rule applying means. And an information extraction rule generation device having rule creation means for creating a second rule for extracting a new relationship between the vocabularies.
個別分野のドキュメントから個別分野で用いられる語彙を特定する個別分野語彙特定手段、
1または複数の第1のルールを上記個別分野のドキュメント中において特定された上記個別分野で用いられる語彙に適用して語彙の間の関係を抽出するルール適用手段、
上記第1のルールごとに上記ルール適用手段で抽出した複数の関係の各々に含まれる所定の1項をなす語彙または当該語彙のカテゴリの集合から、当該第1のルールの抽出を発動条件として適用され語彙の間の新たな関係を抽出する第2のルールを作成するルール作成手段として機能させるための情報抽出ルール生成用プログラム。 Computer
Individual field vocabulary identification means for identifying vocabulary used in individual fields from documents in individual fields,
A rule applying means for applying one or more first rules to the vocabulary used in the individual field specified in the individual field document to extract a relationship between the vocabularies;
For each of the first rules, the extraction of the first rule is applied as a trigger condition from a vocabulary forming a predetermined term or a set of categories of the vocabulary included in each of a plurality of relations extracted by the rule applying means. An information extraction rule generation program for functioning as rule creation means for creating a second rule for extracting a new relationship between vocabularies.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008105275A JP5282438B2 (en) | 2008-04-15 | 2008-04-15 | Information extraction device and program, and information extraction rule generation device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008105275A JP5282438B2 (en) | 2008-04-15 | 2008-04-15 | Information extraction device and program, and information extraction rule generation device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009258870A true JP2009258870A (en) | 2009-11-05 |
JP5282438B2 JP5282438B2 (en) | 2013-09-04 |
Family
ID=41386227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008105275A Expired - Fee Related JP5282438B2 (en) | 2008-04-15 | 2008-04-15 | Information extraction device and program, and information extraction rule generation device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5282438B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776606A (en) * | 2015-11-20 | 2017-05-31 | 株式会社日立制作所 | Retrieval device and search method based on electronic health record database |
JP2020518049A (en) * | 2017-04-18 | 2020-06-18 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | Intelligent organization of medical examination timeline by order code |
CN113243033A (en) * | 2018-12-20 | 2021-08-10 | 皇家飞利浦有限公司 | Integrated diagnostic system and method |
CN114783623A (en) * | 2022-06-24 | 2022-07-22 | 北京惠每云科技有限公司 | Medical rule extraction method and device, electronic equipment and readable storage medium |
CN117789907A (en) * | 2024-02-28 | 2024-03-29 | 山东金卫软件技术有限公司 | Intelligent medical data intelligent management method based on multi-source data fusion |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263493A (en) * | 1995-03-23 | 1996-10-11 | Meidensha Corp | Knowledge acquiring method |
JP2007133492A (en) * | 2005-11-08 | 2007-05-31 | Oki Electric Ind Co Ltd | Modification extraction device, method and program |
JP2007193399A (en) * | 2006-01-17 | 2007-08-02 | Konica Minolta Medical & Graphic Inc | Information presenting system and program |
-
2008
- 2008-04-15 JP JP2008105275A patent/JP5282438B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263493A (en) * | 1995-03-23 | 1996-10-11 | Meidensha Corp | Knowledge acquiring method |
JP2007133492A (en) * | 2005-11-08 | 2007-05-31 | Oki Electric Ind Co Ltd | Modification extraction device, method and program |
JP2007193399A (en) * | 2006-01-17 | 2007-08-02 | Konica Minolta Medical & Graphic Inc | Information presenting system and program |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776606A (en) * | 2015-11-20 | 2017-05-31 | 株式会社日立制作所 | Retrieval device and search method based on electronic health record database |
JP2020518049A (en) * | 2017-04-18 | 2020-06-18 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | Intelligent organization of medical examination timeline by order code |
JP7132943B2 (en) | 2017-04-18 | 2022-09-07 | コーニンクレッカ フィリップス エヌ ヴェ | Intelligent organization of medical examination timelines by order code |
CN113243033A (en) * | 2018-12-20 | 2021-08-10 | 皇家飞利浦有限公司 | Integrated diagnostic system and method |
CN113243033B (en) * | 2018-12-20 | 2024-05-17 | 皇家飞利浦有限公司 | Integrated diagnostic system and method |
CN114783623A (en) * | 2022-06-24 | 2022-07-22 | 北京惠每云科技有限公司 | Medical rule extraction method and device, electronic equipment and readable storage medium |
CN114783623B (en) * | 2022-06-24 | 2022-08-26 | 北京惠每云科技有限公司 | Medical rule extraction method and device, electronic equipment and readable storage medium |
CN117789907A (en) * | 2024-02-28 | 2024-03-29 | 山东金卫软件技术有限公司 | Intelligent medical data intelligent management method based on multi-source data fusion |
CN117789907B (en) * | 2024-02-28 | 2024-05-10 | 山东金卫软件技术有限公司 | Intelligent medical data intelligent management method based on multi-source data fusion |
Also Published As
Publication number | Publication date |
---|---|
JP5282438B2 (en) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9740685B2 (en) | Generation of natural language processing model for an information domain | |
Carley et al. | AutoMap User's Guide 2013 | |
US9009590B2 (en) | Semantic processor for recognition of cause-effect relations in natural language documents | |
Chen et al. | Improving automated documentation to code traceability by combining retrieval techniques | |
KR20160018588A (en) | Construction method and device for event repository | |
US10978053B1 (en) | System for determining user intent from text | |
KR20110064833A (en) | Apparatus and method for knowledge graph stabilization | |
US9678941B2 (en) | Domain-specific computational lexicon formation | |
US9588959B2 (en) | Extraction of lexical kernel units from a domain-specific lexicon | |
Kallmeyer et al. | Scope and situation binding in LTAG using semantic unification | |
JP5282438B2 (en) | Information extraction device and program, and information extraction rule generation device and program | |
Kang et al. | Extraction of manufacturing rules from unstructured text using a semantic framework | |
Lüdeling et al. | Linguistic models, acquisition theories, and learner corpora: Morphological productivity in SLA research exemplified by complex verbs in German | |
Pauzi et al. | Applications of natural language processing in software traceability: A systematic mapping study | |
CN114742054B (en) | Open field-oriented hybrid information extraction method and system | |
Kumar et al. | Static UML model generator from analysis of requirements (SUGAR) | |
WO2022123637A1 (en) | Document processing system and document processing method | |
JP2009048455A (en) | Device for estimating interclause relationship and computer program | |
Carroll et al. | Encoding frequency information in lexicalized grammars | |
KR20200069200A (en) | Method and apparatus for representing lexical knowledge graph from natural language text | |
Simov et al. | The role of the WordNet relations in the knowledge-based word sense disambiguation task | |
Rananavare et al. | An overview of text summarization | |
Proisl et al. | Efficient Dependency Graph Matching with the IMS Open Corpus Workbench. | |
JP5151449B2 (en) | Document analysis apparatus, document analysis method, and computer program | |
Stirling | Proof systems for retracts in simply typed lambda calculus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5282438 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |