JP6972029B2 - Equipment for co-reference analysis, information extraction and similar document retrieval, similar document retrieval system and information processing method - Google Patents

Equipment for co-reference analysis, information extraction and similar document retrieval, similar document retrieval system and information processing method Download PDF

Info

Publication number
JP6972029B2
JP6972029B2 JP2018562274A JP2018562274A JP6972029B2 JP 6972029 B2 JP6972029 B2 JP 6972029B2 JP 2018562274 A JP2018562274 A JP 2018562274A JP 2018562274 A JP2018562274 A JP 2018562274A JP 6972029 B2 JP6972029 B2 JP 6972029B2
Authority
JP
Japan
Prior art keywords
medical
medical element
document
diagnostic
diagnostic state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018562274A
Other languages
Japanese (ja)
Other versions
JP2019522274A (en
Inventor
ビーチュアン ヂャン
ヤオハイ ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2019522274A publication Critical patent/JP2019522274A/en
Application granted granted Critical
Publication of JP6972029B2 publication Critical patent/JP6972029B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Description

本発明は、自然言語処理(NLP)に関し、特に、例えば、共参照解析(co-reference resolution)、情報抽出および類似文書検索のための装置、類似文書検索システムおよび情報処理方法に関する。 The present invention relates to natural language processing (NLP) and, in particular, to, for example, devices for co-reference resolution, information extraction and similar document retrieval , similar document retrieval systems and information processing methods.

現在、電子医用文書の使用および管理はますます普及している。電子医用文書の管理に基づいて、同様の医用文書検索、診断支援などの、医師に利益をもたらすであろう多くの用途を開発することができる。上記のアプリケーションは、医用文書に対してテキスト情報抽出技術を実行することによって実現される。テキスト情報抽出技術を介して得られた結果の表現は医用要素(言語要素)と呼ばれる。一般に、1つの医用文書内の医用要素はいくつかの異なる医用対象を示すことがあり、医用対象は、具体的な物理的対象(検査結果から診断される異常等)、または抽象的な医学的概念(例えば、医者によって判断される疾患等)であり得る。例えば、いくつかの医用要素は、検査結果から診断された異常(例えば、腫瘍)を示すことがあり、いくつかの医用要素は、患者の疾患などを示すことがある。すなわち、医用文書内の1つの医用対象(例えば腫瘍)に関して、医師は記録するためにいくつかの異なる表現(すなわち医用要素)を使用することができる。 Today, the use and management of electronic medical documents is becoming more and more widespread. Based on the management of electronic medical documents, many applications that may benefit physicians can be developed, such as similar medical document retrieval, diagnostic support, and so on. The above application is realized by executing a text information extraction technique on a medical document. The expression of the result obtained through the text information extraction technique is called a medical element (language element). In general, a medical element in a medical document may indicate several different medical objects, which may be a specific physical object (such as an abnormality diagnosed from a test result) or an abstract medical object. It can be a concept (eg, a disease as judged by a doctor). For example, some medical elements may indicate an abnormality (eg, a tumor) diagnosed from a test result, and some medical elements may indicate a patient's disease or the like. That is, with respect to one medical object (eg, a tumor) in a medical document, the physician can use several different expressions (ie, medical elements) to record.

したがって、異なる表現(すなわち2つの異なる医用要素)が同一の医用対象を示すか否かを判断することができる技術があることが必要である。また、共参照解析は重要な技術の1つである。特許文献1には、文書中のこれら2つの候補要素間の単語特徴の類似度および2つの候補要素の文脈(コンテキスト)に基づいて、2つの候補要素の類似性測度(similarity measure)を算出する共参照解決方法が開示されている。そして、これら2つの候補要素の類似性測度が所定の閾値以上である場合、これら2つの候補要素は共参照として決定されるだろう。 Therefore, it is necessary to have a technique capable of determining whether different expressions (ie, two different medical elements) indicate the same medical object. In addition, co-reference analysis is one of the important techniques. In Patent Document 1, a similarity measure of two candidate elements is calculated based on the similarity of word features between these two candidate elements in a document and the context of the two candidate elements. A co-reference solution is disclosed. And if the similarity measure of these two candidate elements is greater than or equal to a predetermined threshold, these two candidate elements will be determined as co-references.

しかしながら、医用文書では、表面的に互いに同一または類似しているいくつかの単語特徴は、実際には同一の医用対象を示さないことがある。例えば、医用文書内の単語特徴「腫瘍」は、異なる異常が同じ表現(すなわち単語特徴)を使用することによって記述されることがあるので、異なる異常を示すことがある。加えて、互いに表面的に類似していないいくつかの単語特徴は、実際には同一の医用対象を示すことがある。例えば、医用文書中の単語特徴「腰椎骨折」と「脆弱性骨折」は、同じ異常を示すことがある。なぜなら、1つの異常の異なる側面は、他の読者が混乱しないように、異なる表現(すなわち単語特徴)を用いて記述されるからである。したがって、単語特徴の類似度を使用するのみの共参照解析の精度は低くなる。 However, in medical documents, some word features that are superficially identical or similar to each other may not actually indicate the same medical subject. For example, the word feature "tumor" in a medical document may indicate different anomalies because different anomalies may be described by using the same expression (ie, word features). In addition, some word features that are not superficially similar to each other may actually indicate the same medical object. For example, the word features "lumbar fracture" and "fragile fracture" in medical documents may indicate the same abnormality. This is because different aspects of one anomaly are described using different expressions (ie, word features) so as not to confuse other readers. Therefore, the accuracy of the co-reference analysis that only uses the similarity of word features is low.

米国特許第8457950号明細書U.S. Pat. No. 8,457,950

したがって、関連技術の説明において上記に詳述したことを考慮して、本開示は、上記のような問題を解決することを目的とする。 Accordingly, in view of what has been described in detail above in the description of the related art, this disclosure is intended to solve the above problems.

本発明の一態様によれば、共参照解析のための装置が提供され、当該装置は、入力医用文書から第1の医用要素と第2の医用要素を取得するように構成された取得部と、医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出するように構成された検出部と、検出された診断状態と特性に基づいて、第1の医用要素と第2の医用要素との間の適合性を決定するように構成された適合性決定部と、決定された適合性に基づいて第1の医用要素と第2の医用要素が同一の医用対象を示すか否かを判定するように構成された共参照解析部と、を有する。ここで、診断状態は、医用文書において診断プロセスにおける医用要素の位置を表し、特性は、医用文書における医用要素の診断項目を表し、適合性は、医用要素と別の第2の医用要素が同一の医用対象を示す可能性を表す。 According to one aspect of the invention, an apparatus for co-reference analysis is provided, the apparatus comprising an acquisition unit configured to acquire a first medical element and a second medical element from an input medical document. To detect the diagnostic state of the first medical element, at least one characteristic of the first medical element, the diagnostic state of the second medical element, and at least one characteristic of the second medical element from the medical document. A conformability determination unit configured to determine the compatibility between the first medical element and the second medical element based on the detected diagnostic condition and characteristics. It has a co-reference analysis unit configured to determine whether a first medical element and a second medical element indicate the same medical object based on the compatibility made. Here, the diagnostic state represents the position of the medical element in the diagnostic process in the medical document, the characteristic represents the diagnostic item of the medical element in the medical document, and the suitability represents the same second medical element as the medical element. Represents the possibility of indicating a medical subject.

本発明を利用すると、共参照解析の精度が向上する。 When the present invention is used, the accuracy of the co-reference analysis is improved.

本発明の更なる特徴と利点は、図面を参照した以下の説明から、明らかになるだろう。 Further features and advantages of the present invention will become apparent from the following description with reference to the drawings.

添付の図面は、本明細書に組み込まれ、その一部を構成し、本発明の実施形態を示し、明細書と共に本発明の原理を説明する役割を果たす。
図1は、本発明の実施形態に従う技術を実現することができるハードウェア構成を概略的に示すブロック図である。 図2は、本発明の第1実施形態に従う共参照解析のための装置の構成を示すブロック図である。 図3は、図2における第1実施形態に従う本発明の例示的な入力医用文書を示す図である。 図4は、図2における第1実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図5は、本発明の第2実施形態に従う共参照解析のための装置の構成を示すブロック図である。 図6は、図5における第2実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図7は、本発明の第2の実施形態に従う共参照解析のための装置の構成を示す別のブロック図である。 図8は、図7における第2実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図9は、本発明の第3実施形態に従う情報抽出のための装置の構成を示すブロック図である。 図10は、図9における第3実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図11は、図9における第3実施形態に従う全体処理の手順を概略的に示す別のフローチャートである。 図12は、本発明の第4実施形態に従う類似文書検索のための装置の構成を示すブロック図である。 図13は、図12における第4実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図14は、本発明に従う例示的な類似文書検索システムの構成を示す。
The accompanying drawings are incorporated herein by way of the present invention, are part of the present invention, show embodiments of the present invention, and serve to explain the principles of the present invention together with the present specification.
FIG. 1 is a block diagram schematically showing a hardware configuration capable of realizing a technique according to an embodiment of the present invention. FIG. 2 is a block diagram showing a configuration of an apparatus for co-reference analysis according to the first embodiment of the present invention. FIG. 3 is a diagram showing an exemplary input medical document of the present invention according to the first embodiment of FIG. FIG. 4 is a flowchart schematically showing the procedure of the whole processing according to the first embodiment in FIG. FIG. 5 is a block diagram showing a configuration of an apparatus for co-reference analysis according to the second embodiment of the present invention. FIG. 6 is a flowchart schematically showing the procedure of the whole process according to the second embodiment in FIG. FIG. 7 is another block diagram showing the configuration of an apparatus for co-reference analysis according to the second embodiment of the present invention. FIG. 8 is a flowchart schematically showing the procedure of the whole process according to the second embodiment in FIG. 7. FIG. 9 is a block diagram showing a configuration of an apparatus for extracting information according to a third embodiment of the present invention. FIG. 10 is a flowchart schematically showing a procedure of the whole processing according to the third embodiment in FIG. FIG. 11 is another flowchart schematically showing the procedure of the whole process according to the third embodiment in FIG. FIG. 12 is a block diagram showing a configuration of an apparatus for searching for similar documents according to a fourth embodiment of the present invention. FIG. 13 is a flowchart schematically showing the procedure of the whole processing according to the fourth embodiment in FIG. FIG. 14 shows the configuration of an exemplary similar document retrieval system according to the present invention.

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。以下の説明は、本質的に単なる例示および例示であり、本発明およびその用途または使用を限定することを決して意図していないことに留意されたい。実施の形態に記載されている構成要素や工程の相対的な配置、数式、数値は、特に記載がない限り、発明の範囲を限定するものではない。さらに、当業者に知られている技術、方法および装置は詳細には論じられていないかもしれないが、適切な場合には明細書の一部であることが意図されている。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. It should be noted that the following description is merely exemplary and exemplary in nature and is by no means intended to limit the invention and its uses or uses. The relative arrangements, mathematical formulas, and numerical values of the components and processes described in the embodiments do not limit the scope of the invention unless otherwise specified. Moreover, techniques, methods and devices known to those of skill in the art may not be discussed in detail, but are intended to be part of the specification where appropriate.

同様の参照番号および文字は、図中の類似の項目を参照しているので、項目が1つの図に定義されると、以下の図について議論する必要はない。 Similar reference numbers and letters refer to similar items in the figure, so once an item is defined in one figure, there is no need to discuss the following figure.

医学的診断において、1つの完全な診断プロセスは、いくつかの診断状態を含むことができる。当該診断状態は、検査結果(例えば、コンピュータ断層撮影(CT)、磁気共鳴映像法(MRI)、血液検査などであり得る)から医学的所見(例えば正常所見および異常所見)を識別する発見状態、診察結果の詳細情報を記述する記述状態、医学的知見に基づいて最初の疑いをする疑い状態、現在の状況と前回の調査結果とを比較する比較状態、現状の理由を分析した理由状態、最終判断を行う判断状態、最終判断ができなかったという情報を記録した遅延判断状態、手術や薬のような治療を提案する治療状態、詳細情報を調べるために更に検査を要求する要求状態、およびその他の診断状態といったものである。ここで、診断状態は、診断プロセスにおける医学的所見の位置を表す。NLP技術分野では、上述の医学的発見は、医用要素と見なすこともできる。ここで、医用要素(すなわち医学的発見)は、医用対象に対応する表現または記録である。そして、医用対象は、具体的な物理的対象(検査結果から診断された異常など)、または抽象的な医学的概念(医師が判断した疾患など)である可能性がある。 In medical diagnosis, one complete diagnostic process can include several diagnostic states. The diagnostic state is a discovery state that identifies medical findings (eg, normal and abnormal findings) from test results (eg, computer tomography (CT), magnetic resonance imaging (MRI), blood tests, etc.). A descriptive state that describes detailed information on the results of the examination, a suspicious state that makes the first suspicion based on medical findings, a comparative state that compares the current situation with the results of the previous survey, a reason state that analyzes the current reason, and the final state. Judgment states that make decisions, delayed decision states that record information that a final decision could not be made, treatment states that suggest treatments such as surgery or medicine, request states that require further testing to find out more information, and more. It is the diagnostic status of. Here, the diagnostic state represents the position of medical findings in the diagnostic process. In the field of NLP technology, the medical findings described above can also be regarded as a medical element. Here, a medical element (ie, a medical discovery) is an expression or record corresponding to a medical subject. The medical object may be a specific physical object (such as an abnormality diagnosed from a test result) or an abstract medical concept (such as a disease judged by a doctor).

医用文書を作成する場合、1つの診断プロセスに関して、上記の診断状態の順序は固定されておらず、上記の診断状態の全てが必要というわけではない。更に、1つの医用文書において、検査結果から診断された患者の医学的所見(すなわち医用要素)を記録することができ、その患者に対する医師の考慮事項および/または判断を記録することができる。また、患者に対する他の必要な治療および/または検査を記録することもできる。すなわち、任意の診断状態に対応する内容を一つの医用文書に記録することができる。 When creating a medical document, the order of the above diagnostic states is not fixed for one diagnostic process, and not all of the above diagnostic states are required. In addition, in one medical document, the medical findings (ie, medical elements) of the patient diagnosed from the test results can be recorded, and the physician's considerations and / or judgments for that patient can be recorded. Other necessary treatments and / or tests for the patient can also be recorded. That is, the contents corresponding to any diagnostic state can be recorded in one medical document.

更に、1つの診断状態では、1つの医用対象の詳細な情報(異なる態様など)を記述するために、複数の異なる表現を記録することができる。例えば、発見状態では、1つの腫瘍の詳細情報を記述するために複数の異なる表現を記録することができる。更に、異なる診断状態の間で、1つの医用対象も数回記録される可能性がある。例えば、1つの表現を、発見状態における1つの腫瘍の詳細情報を記述するために記録することができ、1つの異なる表現を、判定状態における腫瘍のレベルを記述するために記録することができ、次に他の1つの別の表現を、更なる診断状態のために腫瘍の検査を続けるための他の要求を記述するために記録することができる。すなわち、1つの医用対象は、1つの診断状態でも異なる診断状態でも、1つの医用文書内でいくつかの異なる表現(すなわち、いくつかの異なる医用要素)を使用することによって記述することができる。 Further, in one diagnostic state, a plurality of different expressions can be recorded to describe detailed information (such as different embodiments) of one medical subject. For example, in the discovery state, a plurality of different expressions can be recorded to describe the detailed information of one tumor. In addition, a single medical subject may be recorded several times between different diagnostic states. For example, one expression can be recorded to describe the detailed information of one tumor in the discovery state, and one different expression can be recorded to describe the level of the tumor in the determination state. Another other expression can then be recorded to describe another requirement to continue testing the tumor for further diagnostic conditions. That is, one medical subject can be described by using several different representations (ie, several different medical elements) in one medical document, whether in one diagnostic state or in different diagnostic states.

上述したように、医用文書の構造は複雑である。一方、本発明者らは、医用文書の記述基準に基づいて医用要素の間に一定の適合性(互換性)が存在し、これらの医用要素が互いに適合性がある場合、医用要素は同一の医用対象を示すべきであることを見出した。1つの例では、異なる診断状態のうち、1つの診断プロセスが完了していない場合、1つの先行する診断状態において既に記載されている1つの医用対象は、他の後続の診断状態において依然として記載され、したがって、異なる診断状態の間で記録されたこれらの記述(すなわち、医用要素)は適合性があり、同一の医用対象を示す。他の例では、1つの診断状態において、1つの医用対象の記述が完了していない場合、この医用対象の他の記述はこの診断状態で記録され続け得る。よって、この診断状態において記録されたこれらの記述は適合性があり、同一の医用対象を示す。当然、1つの医用対象の記述がいくつかの診断状態で記録されるが診断プロセス全体では記録されない場合、および/または、1つの診断状態における記述が完全でない1つの医用対象の他の記述がこの診断状態で記録し続けることができない場合もある。 As mentioned above, the structure of medical documents is complex. On the other hand, the present inventors have the same medical elements when there is a certain compatibility (compatibility) between the medical elements based on the description criteria of the medical document and these medical elements are compatible with each other. It was found that a medical subject should be indicated. In one example, if one of the different diagnostic states has not completed one diagnostic process, one medical subject already described in one preceding diagnostic state is still described in the other subsequent diagnostic states. Therefore, these descriptions (ie, medical elements) recorded between different diagnostic conditions are compatible and indicate the same medical subject. In another example, if the description of one medical subject is not completed in one diagnostic state, the other description of this medical subject may continue to be recorded in this diagnostic state. Thus, these statements recorded in this diagnostic condition are compatible and indicate the same medical subject. Of course, if the description of one medical subject is recorded in several diagnostic states but not throughout the diagnostic process, and / or the description in one diagnostic state is not complete, the other description of one medical subject is this. It may not be possible to continue recording in the diagnostic state.

一方、本発明は、1つの医用文書における全診断プロセスを処理することを目的とするのではなく、入力医用文書における2つの医用要素間の適合性を識別することを目的とする。ここで、入力医用文書は、医用文書の一部または医用文書の全体であり得る。すなわち、本発明において、現在の医用要素の記述が完全ではない場合、または、現在の医用要素の診断状態が最終診断状態ではない場合、他の医用要素は現在の医用要素と適合性がある可能性がある。
[ハードウェア構成]
On the other hand, the present invention is not intended to process the entire diagnostic process in one medical document, but to identify compatibility between two medical elements in an input medical document. Here, the input medical document can be a part of the medical document or the whole medical document. That is, in the present invention, if the description of the current medical element is not complete, or if the diagnostic state of the current medical element is not the final diagnostic state, the other medical elements may be compatible with the current medical element. There is sex.
[Hardware configuration]

まず、図1を参照して、以下に説明する技術を実現することが可能なハードウェア構成について説明する。図1は、本発明の実施形態に従う技術を実現することができるハードウェア構成100を概略的に示すブロック図である。 First, with reference to FIG. 1, a hardware configuration capable of realizing the technique described below will be described. FIG. 1 is a block diagram schematically showing a hardware configuration 100 capable of realizing a technique according to an embodiment of the present invention.

ハードウェア構成100は、例えば、中央処理ユニット(CPU)110、ランダムアクセスメモリ(RAM)120、読み取り専用メモリ(ROM)130、ハードディスク140、入力装置150、出力装置160、ネットワークインタフェース170、およびシステムバス180を含み得る。更に、ハードウェア構成100は、パーソナルデータアシスタント(PDA)、携帯電話、ラップトップ、デスクトップ、タブレットコンピュータ、またはその他の適切な電子装置等により実装され得る。 The hardware configuration 100 includes, for example, a central processing unit (CPU) 110, a random access memory (RAM) 120, a read-only memory (ROM) 130, a hard disk 140, an input device 150, an output device 160, a network interface 170, and a system bus. Can include 180. Further, the hardware configuration 100 may be implemented by a personal data assistant (PDA), mobile phone, laptop, desktop, tablet computer, or other suitable electronic device.

CPU110は、任意の適切なプログラム可能制御装置とすることができ、ROM130またはハードディスク140に格納されているさまざまなアプリケーションプログラムを実行することによって、後述するさまざまな機能を実行することができる。RAM120は、ROM130またはハードディスク140からロードされたプログラムまたはデータを一時的に格納するために使用されるとともに、CPU110が、図2〜図14を参照して以下に詳細に説明する開示技術並びに他の利用可能な機能を実行するといった、各種プログラムを実行するための空間としても使用される。ハードディスク140は、オペレーティングシステム(OS)、様々なアプリケーション、制御プログラム、および製造者またはユーザによって予め記憶または設定されたデータなど、多くの種類の情報を記憶することができる。ここで、データは、例えば以下に記載される、履歴医用文書、閾値(TH)、規則またはモデルであり得る。 The CPU 110 can be any suitable programmable control device, and can execute various functions described later by executing various application programs stored in the ROM 130 or the hard disk 140. The RAM 120 is used to temporarily store programs or data loaded from the ROM 130 or the hard disk 140, as well as disclosure techniques and other disclosure techniques described in detail below by the CPU 110 with reference to FIGS. 2-14. It is also used as a space for executing various programs such as executing available functions. The hard disk 140 can store many types of information, such as an operating system (OS), various applications, control programs, and data pre-stored or set by the manufacturer or user. Here, the data can be a historical medical document, threshold (TH), rule or model, eg, described below.

1つの実施形態では、入力装置150は入力インタフェースとすることができ、例えば画像取得装置から出力される医用文書の画像を受け取ることができる。ここで、画像取得装置は、例えば、カメラ、デジタルカメラまたは他の適切な電子装置とすることができる。また、出力装置160は、出力インタフェースとすることができ、処理結果を後述する、続いて起こるオペレーションに出力することができる。 In one embodiment, the input device 150 can be an input interface, for example, receiving an image of a medical document output from an image acquisition device. Here, the image acquisition device can be, for example, a camera, a digital camera or other suitable electronic device. Further, the output device 160 can be used as an output interface, and the processing result can be output to a subsequent operation described later.

別の実施形態では、入力装置150は、ユーザが入力装置150を介して、医用要素、医用文書、または医用文書の画像を入力することができるなど、ハードウェア構成100を実装する電子装置と相互作用することをユーザに可能にする。また、入力装置150は、ボタン、キーパッド、ダイヤル、クリックホイール、またはタッチスクリーンなどの様々な形態をとることができる。出力装置160は、陰極線管(CRT)または液晶ディスプレイを含むことができ、処理結果をユーザに表示することができる。また、ハードウェア構成100を実施する電子装置が、いわゆる、インテリジェント携帯電話、PDA、タブレットコンピュータ、または他の適切な電子装置などの装置である場合、入力装置150および出力装置160を一体的に組み込むことができる。また、ハードウェア構成100を実施する電子装置が、いわゆる、インテリジェント携帯電話、PDA、タブレットコンピュータ、または他の適切な電子装置などの装置である場合、入力装置150および出力装置160を一体的に組み込むことができる。 In another embodiment, the input device 150 interacts with an electronic device that implements the hardware configuration 100, such as allowing a user to input a medical element, a medical document, or an image of a medical document through the input device 150. Allows the user to act. Further, the input device 150 can take various forms such as a button, a keypad, a dial, a click wheel, or a touch screen. The output device 160 can include a cathode ray tube (CRT) or a liquid crystal display and can display the processing result to the user. Further, when the electronic device that implements the hardware configuration 100 is a device such as a so-called intelligent mobile phone, PDA, tablet computer, or other suitable electronic device, the input device 150 and the output device 160 are integrally incorporated. be able to. Further, when the electronic device that implements the hardware configuration 100 is a device such as a so-called intelligent mobile phone, PDA, tablet computer, or other suitable electronic device, the input device 150 and the output device 160 are integrally incorporated. be able to.

ネットワークインタフェース170は、ハードウェア構成100を実現する電子装置(図14に示す電子装置1410など)をネットワーク(図14に示すネットワーク1420など)に接続するためのインタフェースを提供する。例えば、ハードウェア構成100を実施する電子装置は、ネットワークインタフェース170を介して、ネットワークを介して接続された他の電子装置(図14に示すサーバ1430など)とのデータ通信を実行することができる。あるいは、無線データ通信を実行するためにハードウェア構成100を実施する電子装置に無線インタフェースを提供することができる。システムバス180は、CPU110、RAM120、ROM130、ハードディスク140、入力装置150、出力装置160、およびネットワークインタフェース170等との間で、互いにデータを転送するためのデータ転送経路を提供することができる。バスと呼ばれるが、システムバス180はいかなる特定のデータ転送技術にも限定されない。 The network interface 170 provides an interface for connecting an electronic device (such as the electronic device 1410 shown in FIG. 14) that realizes the hardware configuration 100 to a network (such as the network 1420 shown in FIG. 14). For example, the electronic device that implements the hardware configuration 100 can execute data communication with another electronic device (such as the server 1430 shown in FIG. 14) connected via the network via the network interface 170. .. Alternatively, a wireless interface can be provided to an electronic device that implements the hardware configuration 100 to perform wireless data communication. The system bus 180 can provide a data transfer path for transferring data to and from the CPU 110, RAM 120, ROM 130, hard disk 140, input device 150, output device 160, network interface 170, and the like. Although referred to as a bus, the system bus 180 is not limited to any particular data transfer technique.

上記のハードウェア構成と同じ機能を実現するソフトウェアを代わりに使用することができる。 Software that provides the same functionality as the hardware configuration above can be used instead.

共参照解析といった、本発明の1つの実施形態の例において、図4、図6、図8を参照することによって後述する本実施形態のプログラムは、予めハードディスク140にインストールしておき、CPU110が本実施形態のプログラムを実行する必要がある際にRAM120にロードすることもできる。他の例では、本実施形態のプログラムは、メモリマップの一部としてROM130に記録し、CPU110によって直接実行することができる。また、情報の抽出や類似文書の検索など、図10〜図11、および図13を参照して後述する他の実施形態のプログラムも、同様な手法で格納し実行することができる。 In the example of one embodiment of the present invention such as co-reference analysis, the program of the present embodiment described later by referring to FIGS. 4, 6 and 8 is installed in advance on the hard disk 140, and the CPU 110 is used as a book. It can also be loaded into the RAM 120 when the program of the embodiment needs to be executed. In another example, the program of this embodiment can be recorded in the ROM 130 as part of the memory map and executed directly by the CPU 110. Further, programs of other embodiments described later with reference to FIGS. 10 to 11 and 13 such as extraction of information and retrieval of similar documents can also be stored and executed by the same method.

上述のハードウェア構成100は単なる例示であり、決して本発明、その用途、または使用を限定することを意図するものではない。また、簡単化のために、図1には1つのハードウェア構成しか示されていない。しかしながら、必要に応じて複数のハードウェア構成を使用することも可能である。
[適合性を用いる共参照解析のための装置の構成]
The hardware configuration 100 described above is merely exemplary and is by no means intended to limit the invention, its use, or its use. Also, for simplicity, FIG. 1 shows only one hardware configuration. However, it is possible to use multiple hardware configurations as needed.
[Device configuration for co-reference analysis using suitability]

共参照解析のための構成を図2を参照して次に説明する。図2は、本発明の第1実施形態に従う共参照解析のための装置200の構成を示すブロック図である。 The configuration for co-reference analysis will be described below with reference to FIG. FIG. 2 is a block diagram showing a configuration of an apparatus 200 for co-reference analysis according to the first embodiment of the present invention.

図2に示すブロックは、図1を参照して上述したCPU110として実装され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。 The block shown in FIG. 2 is implemented as the CPU 110 described above with reference to FIG. 1 and is used to execute a program loaded in the RAM 120 and cooperate with each hardware shown in FIG. Some or all of the blocks may be implemented by dedicated hardware.

図2に示すように、本発明の第1実施形態に従う共参照解析のための装置200は、取得部210と、診断特徴検出部220と、適合性決定部230と、共参照解析部240とを備える。 As shown in FIG. 2, the apparatus 200 for co-reference analysis according to the first embodiment of the present invention includes an acquisition unit 210, a diagnostic feature detection unit 220, a compatibility determination unit 230, and a co-reference analysis unit 240. To prepare for.

上述したように、第1に、図1に示す入力装置150は、ユーザ(例えば医師)によって入力される医用文書を受け取るであろう。ここで、医用文書は、医用文書の一部または医用文書全体であり得る。そして更に、入力装置150は、ユーザによって医用文書から選択された第1の医用要素および第2の医用要素を受け取ることになる。第2に、入力装置150は、システムバス180を介して、受信した医用文書、第1の医用要素、および第2の医用要素を、取得部210に転送する。 As mentioned above, firstly, the input device 150 shown in FIG. 1 will receive a medical document input by a user (eg, a doctor). Here, the medical document can be a part of the medical document or the whole medical document. Further, the input device 150 will receive the first medical element and the second medical element selected from the medical document by the user. Second, the input device 150 transfers the received medical document, the first medical element, and the second medical element to the acquisition unit 210 via the system bus 180.

上述のように、第1の医用要素と第2の医用要素はユーザによって選択される。代替の解決策として、既存のテキスト情報抽出技術を使用することによって、CPU110により受信された医用文書からそれらを抽出することもできる。例えば、CPU110により受信された受信した医用文書から複数の医用要素を抽出することができ、その後、任意の2つの医用要素を第1の医用要素および第2の医用要素と見なすことができる。 As mentioned above, the first medical element and the second medical element are selected by the user. As an alternative solution, existing text information extraction techniques can also be used to extract them from the medical documents received by the CPU 110. For example, a plurality of medical elements can be extracted from the received medical document received by the CPU 110, and then any two medical elements can be regarded as the first medical element and the second medical element.

なお、上記医用文書はテキスト形式である。しかしながら、医用文書は画像フォーマットでもあり得る。例えば、入力装置150は、ユーザによって入力された、または画像取得装置から出力された医用文書の画像を受け取ることができる。入力装置150が医用文書の画像を受信した後、入力装置150は受信した医用文書の画像をシステムバス180を介してCPU110に転送する。そして、CPU110は、例えば既存の光学式文字認識(OCR)技術を使用することによって医用文書を画像フォーマットからテキストフォーマットに変換する。そして、第1の医用要素と第2の医用要素は、入力装置150を介してユーザによって変換医用文書から選択されるか、またはテキスト情報抽出技術を使用することによってCPU110によって変換医用文書から抽出されることができる。 The above medical document is in text format. However, medical documents can also be in image format. For example, the input device 150 can receive an image of a medical document input by the user or output from the image acquisition device. After the input device 150 receives the image of the medical document, the input device 150 transfers the received image of the medical document to the CPU 110 via the system bus 180. The CPU 110 then converts the medical document from an image format to a text format, for example by using existing optical character recognition (OCR) technology. Then, the first medical element and the second medical element are selected from the converted medical document by the user via the input device 150, or are extracted from the converted medical document by the CPU 110 by using the text information extraction technique. Can be

本発明をより理解し易くするために、医用文書の一部である例示的な入力医用文書を図3に示す。ここでは医用文書は例えば日本語で記録されている。図3に示されるように、破線の楕円によって示される用語「結節」(すなわち、「結節」310、「結節」320、「結節」330、および「結節」340)は、上述の医用要素であり、これらの「結節」のうちの任意の2つは、上述した第1の医用要素と第2の医用要素と見なすことができる。ここで、「結節」は「noodle」を意味する。 In order to make the present invention easier to understand, an exemplary input medical document that is part of the medical document is shown in FIG. Here, medical documents are recorded, for example, in Japanese. As shown in FIG. 3, the term "nodule" (ie, "nodule" 310, "nodule" 320, "nodule" 330, and "nodule" 340) indicated by the dashed ellipse is the medical element described above. , Any two of these "nodules" can be considered as the first and second medical elements described above. Here, "nodule" means "noodle".

図2に戻ると、第1に、取得部210は、システムバス180を介して入力装置150から第1の医用要素、第2の要素、および医用文書を取得する。 Returning to FIG. 2, first, the acquisition unit 210 acquires the first medical element, the second element, and the medical document from the input device 150 via the system bus 180.

第2に、診断特徴検出部220は、医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出する。ここで、診断状態は、医用文書における診断プロセスにおける医用要素の位置を表し、特性は、医用文書における医用要素の診断項目を表し、診断項目は、診断を行うための医師が関心のある項目を表す。 Second, the diagnostic feature detection unit 220, from the medical document, indicates the diagnostic state of the first medical element, at least one characteristic of the first medical element, the diagnostic state of the second medical element, and the second medical element. Detects at least one characteristic of. Here, the diagnostic state represents the position of the medical element in the diagnostic process in the medical document, the characteristic represents the diagnostic item of the medical element in the medical document, and the diagnostic item represents the item of interest to the doctor for making the diagnosis. show.

上述したように、診断状態は、発見状態、記述状態、疑い状態、比較状態、理由状態、遅延判定状態、処置状態、および要求状態などの上述の診断状態のうちの少なくとも1つを含む。そして、特性は、少なくとも診断項目に対応する特性の種類と診断項目のパラメータに対応する特性の値とを含む。更に、特性の種類は、検査指標(サイズ、形状、位置、レベルおよび数値指標等)、医学用語集(検査、疾患、治療、薬物等)、診断アサーション(極性、原因等)のうちの少なくとも1つを含む。ここで、上記の極性は、例えば、陰性の極または陽性の極であり、上記の原因は、例えば、生活習慣または外傷によって異常が引き起こされることを表す。 As mentioned above, the diagnostic state includes at least one of the above-mentioned diagnostic states such as a discovery state, a description state, a suspicious state, a comparison state, a reason state, a delay determination state, a treatment state, and a request state. Then, the characteristic includes at least the type of the characteristic corresponding to the diagnostic item and the value of the characteristic corresponding to the parameter of the diagnostic item. Furthermore, the type of characteristic is at least one of a test index (size, shape, position, level, numerical index, etc.), a medical terminology (test, disease, treatment, drug, etc.), and a diagnostic assertion (polarity, cause, etc.). Including one. Here, the polarities are, for example, negative or positive poles, and the above causes represent, for example, that an abnormality is caused by lifestyle or trauma.

例えば、第1の医用要素を例にとると、第1の医用要素がどの診断状態に属するかを識別するために、まず、診断特徴検出部220は、医用文書から第1の医用要素に関連する予め定義された内容(コンテンツ)を抽出することができる。予め定義された内容は、例えば実際の用途または経験に従って、あるいは各診断状態の記述基準に従って製造者またはユーザによって予め定義され得る。そして、予め定義された内容は、医用文書における医学的診断を行うことを支援することができる内容である。第2に、診断特徴検出部220は、抽出された内容を分析することにより、第1の医用要素の診断状態を識別することができる。例えば、第1の医用要素の診断状態は、予め生成された規則に従って抽出された内容を分析することによって、または予め生成されたモデルに従って抽出された内容を分類することによって識別され得る。ここで、予め生成された規則および予め生成されたモデルは、各診断状態の複数の発現サンプルに基づいて生成することができる。 For example, taking the first medical element as an example, in order to identify which diagnostic state the first medical element belongs to, first, the diagnostic feature detection unit 220 relates to the first medical element from the medical document. It is possible to extract the predefined contents (contents) to be performed. The predefined content may be predefined by the manufacturer or user, for example according to actual use or experience, or according to the descriptive criteria for each diagnostic condition. The predefined content is content that can support the medical diagnosis in the medical document. Second, the diagnostic feature detection unit 220 can identify the diagnostic state of the first medical element by analyzing the extracted contents. For example, the diagnostic state of the first medical element can be identified by analyzing the extracted content according to a pre-generated rule or by classifying the extracted content according to a pre-generated model. Here, the pre-generated rules and pre-generated models can be generated based on a plurality of expression samples for each diagnostic state.

例えば、図3に示す医用要素「結節」310を例にとると、診断特徴検出部220により抽出される内容は、「末梢」、「直径」、「cm」、「認められる」であり、診断特徴検出部220により識別された医用要素「結節」310の診断状態は発見状態である。ここで、「末梢」は「terminal」を意味し、「直径」は「diameter」を意味し、「cm」は長さの尺度であり、そして「認められる」は「be found」ことを意味する。 For example, taking the medical element "nodule" 310 shown in FIG. 3 as an example, the contents extracted by the diagnostic feature detection unit 220 are "peripheral", "diameter", "cm", and "recognized", and the diagnosis is made. The diagnostic state of the medical element "nodule" 310 identified by the feature detector 220 is the discovery state. Here, "peripheral" means "terminal", "diameter" means "diameter", "cm" is a measure of length, and "recognized" means "be found". ..

そして、第1の医用要素についてどのような情報が記録されているかを識別するために、一例として、診断特徴検出部220は、テンプレートに基づく情報抽出またはトレーニング言語コーパスに基づく情報抽出といった既存のNLP技術に従って、第1の医用要素の特性(特性の種類および/または特性の値など)をさらに抽出することができる。例えば、図3に示す医用要素「結節」310を連続的に取り上げると、診断特徴検出部220により抽出された医用要素「結節」310の特性は、「位置:右肺S4」、「サイズ:2.5cm」、「極性:陽極」である。ここで、抽出された「位置」、「サイズ」および「極性」は、特性の種類であり、抽出された「右肺S4」、「2.5cm」および「陽性」は、特性の値である。 Then, in order to identify what kind of information is recorded about the first medical element, as an example, the diagnostic feature detection unit 220 may use an existing NLP such as template-based information extraction or training language corpus-based information extraction. According to the technique, the characteristics of the first medical element (such as the type of characteristic and / or the value of the characteristic) can be further extracted. For example, when the medical element "nodule" 310 shown in FIG. 3 is continuously taken up, the characteristics of the medical element "nodule" 310 extracted by the diagnostic feature detection unit 220 are "position: right lung S4" and "size: 2". .5 cm ”,“ polarity: anode ”. Here, the extracted "position", "size" and "polarity" are the types of characteristics, and the extracted "right lung S4", "2.5 cm" and "positive" are the values of the characteristics. ..

上述のように、診断状態および医用要素の特性は全て、1つのユニット、すなわち診断特徴検出部220によって検出される。しかしながら、診断状態および医用要素の特性は、異なるユニットによっても検出され得る。図2に示すように、オプションの解決策として、診断状態識別部221によって医用要素の診断状態を識別することができ、特性抽出部222によって医用要素の特性を抽出することができる。 As mentioned above, the diagnostic state and the characteristics of the medical element are all detected by one unit, namely the diagnostic feature detector 220. However, diagnostic status and characteristics of medical elements can also be detected by different units. As shown in FIG. 2, as an optional solution, the diagnostic state identification unit 221 can identify the diagnostic state of the medical element, and the characteristic extraction unit 222 can extract the characteristics of the medical element.

図2に戻り、診断特徴検出部220が第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および第2の医用要素の特性を検出した後、適合性決定部230は、検出された診断状態および特性に基づいて、第1の医用要素と第2の医用要素との間の適合性を決定(判定)する。ここで、適合性は、ある医用要素と別の医用要素が同一の医用対象を示す可能性を表す。そして、好適な解決策として、適合性決定部230は、適合性係数決定部231と、適合性判定部232とを更に有してもよい。 Returning to FIG. 2, after the diagnostic feature detection unit 220 detects the diagnostic state of the first medical element, the characteristic of the first medical element, the diagnostic state of the second medical element, and the characteristic of the second medical element, The compatibility determination unit 230 determines (determines) the compatibility between the first medical element and the second medical element based on the detected diagnostic condition and characteristics. Here, compatibility represents the possibility that one medical element and another medical element indicate the same medical object. Then, as a suitable solution, the compatibility determination unit 230 may further include a compatibility coefficient determination unit 231 and a compatibility determination unit 232.

まず、適合性係数決定部231は、検出された診断状態および特性に基づいて、第1の医用要素と第2の医用要素との間の適合性係数を決定する。ここで、適合性係数は、第1の医用要素と第2の医用要素との間の意味論的競合を表す。一例として、適合性係数は、第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および、第2の医用要素の特性の間の意味論的値の競合を含み、第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および、第2の医用要素の特性の間の意味論的順序(シーケンス)の競合を含む。 First, the suitability coefficient determination unit 231 determines the suitability coefficient between the first medical element and the second medical element based on the detected diagnostic state and characteristics. Here, the suitability factor represents the semantic conflict between the first medical element and the second medical element. As an example, the fitness factor is a semantic value between the diagnostic state of the first medical element, the characteristic of the first medical element, the diagnostic state of the second medical element, and the characteristic of the second medical element. Semantic sequence between the diagnostic state of the first medical element, the characteristic of the first medical element, the diagnostic state of the second medical element, and the characteristic of the second medical element, including the conflict of Includes conflicts.

例えば、第1医用要素の診断状態と第2医用要素の診断状態とが同じ診断状態にある場合、第1医用要素の特性の種類と第2医用要素の特性の種類とが異なり、第1の医用要素と第2の医用要素との間の距離が小さければ、第1の医用要素と第2の医用要素との間の意味論的値は競合しない。あるいは、第1の医用要素の診断状態と第2の医用要素の診断状態とが異なる診断状態にある場合、第1の医用要素の特定の種類の特性と第2の医用要素の特定の種類の要素が同じであって、これらの特性の値が同じであり、また、第1の医用要素と第2の医用要素との間の距離が小さい場合、第1の医用要素と第2の医用要素との間の意味論的値は競合しない。 For example, when the diagnostic state of the first medical element and the diagnostic state of the second medical element are in the same diagnostic state, the type of the characteristic of the first medical element and the type of the characteristic of the second medical element are different, and the first type is different. If the distance between the medical element and the second medical element is small, the semantic values between the first medical element and the second medical element do not conflict. Alternatively, if the diagnostic state of the first medical element and the diagnostic state of the second medical element are in different diagnostic states, then a particular type of characteristic of the first medical element and a particular type of second medical element. If the elements are the same, the values of these properties are the same, and the distance between the first medical element and the second medical element is small, then the first medical element and the second medical element Semantic values with do not conflict.

更に、第1の医用要素の診断状態と第2の医用要素の診断状態とが連続的に接続されている場合、または第1の医用要素の特性と第2の医用要素の特性とが連続的に接続されている場合、得られた意味論的意味が競合しなければ(すなわち、連続する接続が医用文書の記述基準を満たせば)、第1の医用要素と第2の医用要素との間の意味論的順序は競合しない。 Further, when the diagnostic state of the first medical element and the diagnostic state of the second medical element are continuously connected, or the characteristics of the first medical element and the characteristics of the second medical element are continuous. If connected to, if the resulting semantic meanings do not conflict (ie, if the contiguous connections meet the descriptive criteria of the medical document), then between the first and second medical elements. The semantic order of does not conflict.

そして、適合性係数決定部231が第1の医用要素と第2の医用要素との間の適合性係数を決定した後、適合性判定部232は、決定された適合性係数に基づいて第1の医用要素と第2の医用要素との間の適合性を判定する。また、適合性判定部232は、例えば、意味論的値と意味論的順序とが競合しない場合、第1の医用要素と第2の医用要素とが適合性があると判定する。 Then, after the suitability coefficient determination unit 231 determines the suitability coefficient between the first medical element and the second medical element, the suitability determination unit 232 determines the first suitability coefficient based on the determined suitability coefficient. The compatibility between the medical element of the above and the second medical element is determined. Further, the conformity determination unit 232 determines that the first medical element and the second medical element are compatible, for example, when the semantic values and the semantic order do not conflict with each other.

1つの例では、適合性係数決定部231は、以下のステップに従って適合性係数を決定することができる。 In one example, the suitability coefficient determination unit 231 can determine the suitability coefficient according to the following steps.

第1に、適合性係数決定部231は、以下の特徴のうちの少なくとも1つを計算するであろう。 First, the fitness factor determination unit 231 will calculate at least one of the following features:

1)第1の医用要素と第2の医用要素との間の距離。ここで、この距離は、例えば、第1の医用要素と第2の医用要素との間の文の距離に基づいて決定することができる。そして、距離が小さいほど、第1の医用要素と第2の要素は、同一の医用対象を示す可能性が高い。例えば、第1の医用要素に関連する文と第2の医用要素に関連する文が互いに隣接する場合(すなわち、距離はゼロ)、第1の医用要素と第2の医用要素は、同じ医用対象を示す可能性が高い。 1) The distance between the first medical element and the second medical element. Here, this distance can be determined, for example, based on the distance of the sentence between the first medical element and the second medical element. And the smaller the distance, the more likely the first and second elements are to indicate the same medical object. For example, if the sentence related to the first medical element and the sentence related to the second medical element are adjacent to each other (that is, the distance is zero), the first medical element and the second medical element are the same medical object. Is likely to indicate.

2)第1の医用要素の状態と第2の医用要素の状態との間の順序。 2) The order between the state of the first medical element and the state of the second medical element.

3)第1の医用要素の診断状態と第2の医用要素の診断状態との間の距離。ここで、この距離は、例えば、第1の医用要素の診断状態と第2の医用要素の診断状態との間の文の距離に基づいて決定することができる。そして、距離が小さいほど、第1の医用要素と第2の要素は、同一の医用対象を示す可能性が高い。例えば、第1の医用要素の診断状態と第2の医用要素の診断状態が互いに隣接する場合(すなわち、距離はゼロ)、第1の医用要素と第2の医用要素は、同じ医用対象を示す可能性が高い。 3) The distance between the diagnostic state of the first medical element and the diagnostic state of the second medical element. Here, this distance can be determined, for example, based on the sentence distance between the diagnostic state of the first medical element and the diagnostic state of the second medical element. And the smaller the distance, the more likely the first and second elements are to indicate the same medical object. For example, if the diagnostic state of the first medical element and the diagnostic state of the second medical element are adjacent to each other (ie, the distance is zero), the first medical element and the second medical element indicate the same medical object. Probability is high.

4)第1の医用要素と第2の医用要素の特性の種類。 4) Types of characteristics of the first medical element and the second medical element.

5)第1の医用要素の特性の種類と第2の医用要素の特性の種類との間の順序。 5) The order between the type of characteristic of the first medical element and the type of characteristic of the second medical element.

6)種類が第1の医用要素と第2の医用要素の両方に属する特性の値。 6) Value of the property whose type belongs to both the first medical element and the second medical element.

第2に、適合性係数決定部231は、算出された特徴および予め定義された規則に基づいて、意味論的値の競合および意味論的順序の競合を決定するであろう。 Second, the fitness factor determination unit 231 will determine semantic value conflicts and semantic order conflicts based on calculated features and predefined rules.

医用文書の記述基準を通して、医用文書における医用要素は、特定の規律を満たすことがわかる。1つの例において、2つの医用要素が同じ診断状態にある場合、これらの2つの医用要素に適合性があれば(すなわち、これらの2つの医用要素が同一の医用対象を示すのであれば)、上述の極性の種類を除いて、これら2つの医用要素の特性の種類は異なるべきである(すなわち、これら2つの医用要素の内容は、同一の医用対象の異なる側面である可能性が高い)。別の例において、2つの医用要素が同じ診断状態にある場合、これらの2つの医用要素に適合性があれば(すなわち、これらの2つの医用要素が同一の医用対象を示すのであれば)、これら2つの医用要素の特定の種類の特性は同じであるべきである(例えば、これら2つの医用要素の位置は同じとなるべきである)。したがって、予め定められた規則は、第1の医用要素と第2の医用要素とが同じ診断状態にあるときの特徴の競合する条件と、第1の医用要素と第2の医用要素とが異なる診断にあるときの特徴の競合する条件とを少なくとも含むことができる。更に、予め定義された規則は、例えば経験または統計的トレーニングに従って製造者またはユーザによって予め設定され得る。 Through the descriptive criteria of medical documents, it can be seen that the medical elements in medical documents meet certain disciplines. In one example, if the two medical elements are in the same diagnostic state, if the two medical elements are compatible (ie, if the two medical elements indicate the same medical object). Except for the polar types mentioned above, the types of properties of these two medical elements should be different (ie, the content of these two medical elements is likely to be different aspects of the same medical subject). In another example, if the two medical elements are in the same diagnostic state, if the two medical elements are compatible (ie, if the two medical elements indicate the same medical subject). The characteristics of certain types of these two medical elements should be the same (eg, the positions of these two medical elements should be the same). Therefore, the predetermined rules differ from the conflicting conditions of characteristics when the first and second medical elements are in the same diagnostic state, and the first and second medical elements. It can at least include competing conditions of features when in diagnosis. In addition, predefined rules may be preset by the manufacturer or user, eg, according to experience or statistical training.

一例として図3に示される医用要素「結節」310および医用要素「結節」320を取り上げ、医用要素「結節」310を第1の医用要素と見なし、医用要素「結節」320を第2の医用要素と見なす。上述したように、診断特徴検出部220は、それぞれ、診断状態と医用要素「結節」310と医用要素「結節」320の診断状態と特性とを検出するので、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」320が同じ診断状態にあることを、容易に判断することができる。また、診断特徴検出部220により抽出された医用要素「結節」310の特性は、「位置:右肺S4」、「サイズ:直径2.5cm」、「極性:陽性」であり、診断特徴検出部220により抽出された医用要素「結節」320の特性は、「形状:不整形」、「極性:陽性」である。ここで、「不整形」は「irregular」を意味する。 As an example, the medical element "nodule" 310 and the medical element "nodule" 320 shown in FIG. 3 are taken up, the medical element "nodule" 310 is regarded as the first medical element, and the medical element "nodule" 320 is regarded as the second medical element. Consider it as. As described above, the diagnostic feature detection unit 220 detects the diagnostic state and the diagnostic state and characteristics of the medical element “nodule” 310 and the medical element “nodule” 320, respectively, so that the compatibility coefficient determination unit 231 is for medical use. It can be easily determined that the element "nodule" 310 and the medical element "nodule" 320 are in the same diagnostic state. The characteristics of the medical element "nodule" 310 extracted by the diagnostic feature detection unit 220 are "position: right lung S4", "size: diameter 2.5 cm", and "polarity: positive". The characteristics of the medical element "nodule" 320 extracted by 220 are "shape: irregular" and "polarity: positive". Here, "irregular" means "irregular".

医用要素「結節」310と医用要素「結節」320の特性によれば、医用要素「結節」310および医用要素「結節」320が1つの同じ種類の特性(すなわち「極性」)を有し、この同じ種類の特性の値が同じ(すなわち陽性)であることは容易に分かる。更に、図3に示されるように、医用要素「結節」310に関連する文と、医用要素「結節」320に関連する文は、互いに隣接しているので、医用要素「結節」310と医用要素「結節」320との間の距離は例えばゼロと計算され得る。したがって、予め定義された規則に従えば、医用要素「結節」310と医用要素「結節」320の他の種類の特性は、極性の種類および医用要素「結節」310と医用要素「結節」320との間の距離が非常に小さいことを除いて異なるので、適合性係数部231は、医用要素「結節」310と医用要素「結節」320との間の意味論的値が競合していないと判断し得る。また、医用要素「結節」310と医用要素「結節」320の特性の種類が連続的に接続されていれば(すなわち、「位置」→「サイズ」→「極性」→「形状」→「極性」)、取得された意味論的意味は、競合しない(すなわち、連続的な接続は医用文書の記述基準を満たす)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」320との間の意味論的順序は競合しないと決定する。 According to the characteristics of the medical element "nodule" 310 and the medical element "nodule" 320, the medical element "nodule" 310 and the medical element "nodule" 320 have one and the same kind of characteristic (ie, "polarity"). It is easy to see that the values of the same type of property are the same (ie, positive). Further, as shown in FIG. 3, since the sentence related to the medical element "nodule" 310 and the sentence related to the medical element "nodule" 320 are adjacent to each other, the medical element "nodule" 310 and the medical element The distance to the "nodule" 320 can be calculated as, for example, zero. Therefore, according to predefined rules, other types of properties of the medical element "nodule" 310 and the medical element "nodule" 320 are the type of polarity and the medical element "nodule" 310 and the medical element "nodule" 320. Since the distance between them is different except that the distance between them is very small, the fitness factor 231 determines that the semantic values between the medical element "nodule" 310 and the medical element "nodule" 320 do not conflict. Can be. Further, if the characteristic types of the medical element "nodule" 310 and the medical element "nodule" 320 are continuously connected (that is, "position" → "size" → "polarity" → "shape" → "polarity" ), The acquired semantic meanings do not conflict (ie, continuous connections meet the descriptive criteria of medical documents). Therefore, according to the predefined rules, the fitness factor determination unit 231 determines that the semantic order between the medical element "nodule" 310 and the medical element "nodule" 320 does not conflict.

そして、適合性判定部232は、意味論的順序とそれらの間の意味値とが競合しないため、医用要素「結節」310と医用要素「結節」320とは適合性があると判定する。 Then, the conformity determination unit 232 determines that the medical element "nodule" 310 and the medical element "nodule" 320 are compatible because the semantic order and the semantic value between them do not conflict with each other.

更に、他の例として図3に示される医用要素「結節」310および医用要素「結節」330を取り上げ、医用要素「結節」310を第1の医用要素と見なし、医用要素「結節」330を第2の医用要素と見なす。医用要素「結節」310と医用要素「結節」330の検出された診断状態によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」330が同じ診断状態にあることを、容易に判断することができる。そして、診断特徴検出ユニット220によって抽出された医用要素「結節」330の特性は、「場所:縦隔」、「サイズ:1cm」、および「極性:陽性」である。ここで「縦隔」は「mediastinum」を意味する。 Further, as another example, the medical element "nodule" 310 and the medical element "nodule" 330 shown in FIG. 3 are taken up, the medical element "nodule" 310 is regarded as the first medical element, and the medical element "nodule" 330 is regarded as the first medical element. Considered as a medical element of 2. According to the detected diagnostic states of the medical element "nodule" 310 and the medical element "nodule" 330, the suitability coefficient determination unit 231 has the medical element "nodule" 310 and the medical element "nodule" 330 in the same diagnostic state. That can be easily determined. The characteristics of the medical element "nodule" 330 extracted by the diagnostic feature detection unit 220 are "location: mediastinum", "size: 1 cm", and "polarity: positive". Here, "mediastinum" means "mediastinum".

医用要素「結節」310および医用要素「結節」330の特性によれば、医用要素「結節」310および医用要素「結節」330は、3つの同じ種類の特性(すなわち、「位置」、「サイズ」および「極性」)を有することが容易に分かる。更に、図3に示されるように、医用要素「結節」310に関連する文と、医用要素「結節」330に関連する文との間に3つの文が存在するので、医用要素「結節」310と医用要素「結節」330との間の距離は例えば3と計算され得る。したがって、予め定義された規則によれば、医用要素「結節」310と医用要素結節330の特性のいくつかの種類は同じであり(例えば、「位置」と「サイズ」)、医用要素「結節」310と医用要素「結節」330との間の距離が小さくないので、適合性係数部231は、医用要素「結節」310と医用要素「結節」330との間の意味論的値が競合していると判断し得る。また、医用要素「結節」310と医用要素「結節」330の特性の種類が連続的に接続されていれば(すなわち、「位置」→「サイズ」→「極性」→「形状」→「極性」)、取得された意味論的意味は、競合する(すなわち、連続的な接続は医用文書の記述基準を満たさない)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」330との間の意味論的順序は競合すると決定する。 According to the characteristics of the medical element "nodule" 310 and the medical element "nodule" 330, the medical element "nodule" 310 and the medical element "nodule" 330 have three same types of characteristics (ie, "position", "size"). And it is easy to see that it has "polarity"). Further, as shown in FIG. 3, since there are three sentences between the sentence related to the medical element "nodule" 310 and the sentence related to the medical element "nodule" 330, the medical element "nodule" 310 The distance between and the medical element "nodule" 330 can be calculated as, for example, 3. Therefore, according to the predefined rules, some types of characteristics of the medical element "nodule" 310 and the medical element nodule 330 are the same (eg "position" and "size") and the medical element "nodule". Since the distance between 310 and the medical element "nodule" 330 is not small, the suitability factor 231 competes for semantic values between the medical element "nodule" 310 and the medical element "nodule" 330. It can be judged that there is. Further, if the types of characteristics of the medical element "nodule" 310 and the medical element "nodule" 330 are continuously connected (that is, "position" → "size" → "polarity" → "shape" → "polarity" ), The acquired semantic meanings conflict (ie, continuous connections do not meet the descriptive criteria of medical documents). Therefore, according to the predefined rules, the fitness factor determination unit 231 determines that the semantic order between the medical element "nodule" 310 and the medical element "nodule" 330 conflicts.

そして、適合性判定部232は、それらの間の意味論的順序と意味論的値とが競合するため、医用要素「結節」310と医用要素「結節」330とは適合性がないと判定する。 Then, the conformity determination unit 232 determines that the medical element "nodule" 310 and the medical element "nodule" 330 are incompatible because the semantic order and the semantic value between them conflict with each other. ..

また、別の例として、図3に示される医用要素「結節」310および医用要素「結節」34を取り上げ、医用要素「結節」310を第1の医用要素と見なし、医用要素「結節」340を第2の医用要素と見なす。医用要素「結節」310と医用要素「結節」340の検出された診断状態によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」340が異なる診断状態にあることを、容易に判断することができる。ここで、医用要素「結節」310は発見状態にあり、医用要素「結節」340は比較状態にある。そして、診断特徴検出部220により抽出された医用「結節」340の特性は、「場所:縦隔」、「対象:前回」、「傾向:増大」であり、ここで、「前回」は「last time」、「増大」は「enlarge」を意味する。 Further, as another example, the medical element "nodule" 310 and the medical element "nodule" 34 shown in FIG. 3 are taken up, the medical element "nodule" 310 is regarded as the first medical element, and the medical element "nodule" 340 is regarded as the first medical element. Considered as a second medical element. According to the detected diagnostic states of the medical element "nodule" 310 and the medical element "nodule" 340, the suitability coefficient determination unit 231 has the medical element "nodule" 310 and the medical element "nodule" 340 in different diagnostic states. That can be easily determined. Here, the medical element "nodule" 310 is in the discovered state and the medical element "nodule" 340 is in the comparative state. The characteristics of the medical "nodule" 340 extracted by the diagnostic feature detection unit 220 are "location: mediastinum", "target: previous time", and "tendency: increase", where "last time" is "last". "time" and "increase" mean "enlarge".

医用要素「結節」310と医用要素「結節」340の特性によれば、医用要素「結節」310および医用要素「結節」340が1つの同じ種類の特性(すなわち「極性」)を有し、この同じ種類の特性の値が異なることは容易に分かる。更に、図3に示されるように、医用要素「結節」310に関連する文と医用要素「結節」340に関連する文との間には5つの文が存在するため、医用要素「結節」310と医用要素「結節」340との間の距離は、例えば5と計算され得る。したがって、予め定義された規則によれば、医用要素「結節」310と医用要素「結節」340とで種類が同じ特性の値が異なり、医用要素「結節」310と医用要素「結節」340との間の距離が大きいため、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」340との間の意味論的値が競合すると判断する。さらに、医用要素「結節」310および医用要素「結節」340の診断状態が連続的に接続されている場合(すなわち、「発見状態」→「比較状態」)、取得された意味論的意味は競合しない(すなわち、連続的接続は、医用文書の記述基準を満たすか、または医用要素「結節」310と医用要素「結節」340の診断状態間の距離がゼロである)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」340との間の意味論的順序は競合しないと決定する。 According to the characteristics of the medical element "nodule" 310 and the medical element "nodule" 340, the medical element "nodule" 310 and the medical element "nodule" 340 have one and the same kind of characteristic (ie, "polarity"). It is easy to see that the values of the same type of property are different. Further, as shown in FIG. 3, since there are five sentences between the sentence related to the medical element "nodule" 310 and the sentence related to the medical element "nodule" 340, the medical element "nodule" 310 The distance between and the medical element "nodule" 340 can be calculated, for example, 5. Therefore, according to the predefined rules, the medical element "nodule" 310 and the medical element "nodule" 340 have different values of the same type, and the medical element "nodule" 310 and the medical element "nodule" 340 have different values. Due to the large distance between them, the suitability coefficient determination unit 231 determines that the semantic values between the medical element "nodule" 310 and the medical element "nodule" 340 conflict. Furthermore, if the diagnostic states of the medical element "nodule" 310 and the medical element "nodule" 340 are continuously connected (ie, "discovery state" → "comparison state"), the acquired semantic meanings are in conflict. No (ie, the continuous connection meets the descriptive criteria of the medical document, or the distance between the diagnostic states of the medical element "nodule" 310 and the medical element "nodule" 340 is zero). Therefore, according to the predefined rules, the fitness factor determination unit 231 determines that the semantic order between the medical element "nodule" 310 and the medical element "nodule" 340 does not conflict.

そして、適合性判定部232は、それらの間の意味論的値が競合する、医用要素「結節」310と医用要素「結節」340とは適合性がないと判定する。 Then, the conformity determination unit 232 determines that the medical element "nodule" 310 and the medical element "nodule" 340, which have conflicting semantic values between them, are not compatible.

また、別の例として、図3に示される医用要素「結節」330および医用要素「結節」340を取り上げ、医用要素「結節」330を第1の医用要素と見なし、医用要素「結節」340を第2の医用要素と見なす。医用要素「結節」330と医用要素「結節」340の検出された診断状態によれば、適合性係数決定部231は、医用要素「結節」330と医用要素「結節」340が異なる診断状態にあることを、容易に判定することができる。ここで、医用要素「結節」330は発見状態にあり、医用要素「結節」340は比較状態にある。 Further, as another example, the medical element "nodule" 330 and the medical element "nodule" 340 shown in FIG. 3 are taken up, the medical element "nodule" 330 is regarded as the first medical element, and the medical element "nodule" 340 is regarded as the first medical element. Considered as a second medical element. According to the detected diagnostic states of the medical element "nodule" 330 and the medical element "nodule" 340, the suitability coefficient determination unit 231 has the medical element "nodule" 330 and the medical element "nodule" 340 in different diagnostic states. It can be easily determined. Here, the medical element "nodule" 330 is in the discovered state, and the medical element "nodule" 340 is in the comparative state.

医用要素「結節」330と医用要素「結節」340の特性によれば、医用要素「結節」330および医用要素「結節」340が1つの同じ種類の特性(すなわち「極性」)を有し、この同じ種類の特性の値が同じ(すなわち陽性)であることは容易に分かる。更に、図3に示されるように、医用要素「結節」330に関連する文と医用要素「結節」340に関連する文との間には1つの文が存在するため、医用要素「結節」330と医用要素「結節」340との間の距離は、例えば1と計算され得る。したがって、予め定義された規則によれば、医用要素「結節」330と医用要素「結節」340とで種類が同じ特性の値が同じで、医用要素「結節」330と医用要素「結節」340との間の距離が小さいため、適合性係数決定部231は、医用要素「結節」330と医用要素「結節」340との間の意味論的値が競合しないと判断する。更に、医用要素「結節」330および医用要素「結節」340の診断状態が連続的に接続されている場合(すなわち、「発見状態」→「比較状態」)、取得された意味論的意味は競合しない(すなわち、連続的接続は、医用文書の記述基準を満たすか、または医用要素「結節」330と医用要素「結節」340の診断状態間の距離がゼロである)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」330と医用要素「結節」340との間の意味論的順序は競合しないと決定する。 According to the characteristics of the medical element "nodule" 330 and the medical element "nodule" 340, the medical element "nodule" 330 and the medical element "nodule" 340 have one and the same kind of characteristic (ie, "polarity"). It is easy to see that the values of the same type of property are the same (ie, positive). Further, as shown in FIG. 3, since there is one sentence between the sentence related to the medical element "nodule" 330 and the sentence related to the medical element "nodule" 340, the medical element "nodule" 330 The distance between and the medical element "nodule" 340 can be calculated as, for example, 1. Therefore, according to the predefined rules, the medical element "nodule" 330 and the medical element "nodule" 340 have the same characteristic value of the same type, with the medical element "nodule" 330 and the medical element "nodule" 340. Since the distance between them is small, the suitability coefficient determination unit 231 determines that the semantic values between the medical element "nodule" 330 and the medical element "nodule" 340 do not conflict. Furthermore, if the diagnostic states of the medical element "nodule" 330 and the medical element "nodule" 340 are continuously connected (ie, "discovery state" → "comparison state"), the acquired semantic meanings are in conflict. No (ie, the continuous connection meets the descriptive criteria of the medical document, or the distance between the diagnostic states of the medical element "nodule" 330 and the medical element "nodule" 340 is zero). Therefore, according to the predefined rules, the fitness factor determination unit 231 determines that the semantic order between the medical element "nodule" 330 and the medical element "nodule" 340 does not conflict.

そして、適合性判定部232は、それらの間の意味論的順序と意味論的値とが競合しないため、医用要素「結節」330と医用要素「結節」340とは適合性があると判定する。 Then, the conformity determination unit 232 determines that the medical element "nodule" 330 and the medical element "nodule" 340 are compatible because the semantic order and the semantic value between them do not conflict with each other. ..

更に、上述の例は、計算された特徴が予め定義された規則に従って競合しているかどうかを判定することによって、第1の医用要素と第2の医用要素との間の適合性を判定する。一方、第1の医用要素と第2の医用要素との間の適合性は、予め定義された規則に従って、計算された特徴の競合度に基づいて、適合性スコア(Compatibility score)を計算することによっても判断することができる。1つの例では、第1の医用要素と第2の医用要素が同じ診断対象にある場合、適合性係数決定部231は、以下の式に従って、それらの間の適合性スコアを計算し得る。 Further, the above example determines the compatibility between the first medical element and the second medical element by determining whether the calculated features are competing according to a predefined rule. On the other hand, the compatibility score between the first medical element and the second medical element is calculated according to a predefined rule, based on the degree of competition of the calculated features. It can also be judged by. In one example, if the first and second medical elements are in the same diagnostic object, the fitness factor determination unit 231 may calculate the compatibility score between them according to the following equation.

Figure 0006972029
Figure 0006972029

ここで、

Figure 0006972029
は、第1および第2の医用要素の特性の種類の総数に対する同じ種類の特性の数の比率を表し、
Figure 0006972029
は、値が第1および第2の医用要素の特性の種類の総数と異なる、同じ種類の特性の数の比率を表し、
Figure 0006972029
は、第1および第2の医用要素における特性の種類の総数に対する、意味論的順序が異常である特性の種類の数の比率を表し、
Figure 0006972029
は、診断状態にある文の総数に対する、第1の医用要素と第2の医用要素との間の文の距離の比率を表し、Wtype、 Wvalue、 Wsequence、 Wsentence distanceは、例えば経験に従って製造者またはユーザによって予め設定された所定の重みを表す。 here,
Figure 0006972029
Represents the ratio of the number of characteristics of the same type to the total number of types of characteristics of the first and second medical elements.
Figure 0006972029
Represents the ratio of the number of traits of the same type whose values differ from the total number of trait types of the first and second medical elements.
Figure 0006972029
Represents the ratio of the number of trait types that are out of semantic order to the total number of trait types in the first and second medical elements.
Figure 0006972029
Represents the ratio of the sentence distance between the first and second medical elements to the total number of sentences in the diagnostic state, where W type , W value , W sequence , W sentence distance are, for example, experience. Represents a predetermined weight preset by the manufacturer or user according to.

そして、適合性判定部232は、計算された適合性スコアが予め定義された閾値以上である場合、第1の医用要素と第2の医用要素は適合性があるがあると判断し得る。ここで、予め定義された閾値は、例えば、経験にしたがって、製造者またはユーザにより予め設定され得る。 Then, the conformity determination unit 232 can determine that the first medical element and the second medical element are compatible when the calculated conformity score is equal to or higher than the predetermined threshold value. Here, the predefined thresholds may be preset by the manufacturer or user, for example, according to experience.

別の例では、第1の医用要素と第2の医用要素が異なる診断対象にある場合、適合性係数決定部231は、以下の式に従って、それらの間の適合性スコアを計算し得る。 In another example, if the first and second medical elements are in different diagnostic targets, the fitness factor determination unit 231 may calculate the compatibility score between them according to the following equation.

Figure 0006972029
Figure 0006972029

ここで、

Figure 0006972029
は、第1および第2の医用要素の特性の種類の総数に対する、値が異なる同じ種類の特性の数の比率を表し、
Figure 0006972029
は、診断プロセス全体における状態の総数に対する、第1および第2の医用要素第1および第2の医用要素において意味論的順序が異常である状態の数の比率を表し、
Figure 0006972029
は、診断プロセス全体における文の総数に対する、第1の医用要素と第2の医用要素の間の文の距離の比率を表し、
Figure 0006972029
は、診断プロセス全体における状態の総数に対する、第1の医用要素と第2の医用要素との間の状態距離の比率を表し、Wvalue、 Wsequence、 Wsentence distance、 Wstate distanceは、例えば経験に従って製造者またはユーザによって予め設定された所定の重みを表す。 here,
Figure 0006972029
Represents the ratio of the number of traits of the same type with different values to the total number of trait types of the first and second medical elements.
Figure 0006972029
Represents the ratio of the number of states in which the semantic order is out of order in the first and second medical elements to the total number of states in the entire diagnostic process.
Figure 0006972029
Represents the ratio of the sentence distance between the first and second medical elements to the total number of sentences in the entire diagnostic process.
Figure 0006972029
Represents the ratio of the state distance between the first and second medical elements to the total number of states in the entire diagnostic process, where W value , W sequence , W sentence distance , W state distance are, for example, experience. Represents a predetermined weight preset by the manufacturer or user according to.

そして、適合性判定部232は、計算された適合性スコアが予め定義された閾値以上である場合、第1の医用要素と第2の医用要素は適合性があると判定し得る。ここで、予め定義された閾値は、例えば、経験にしたがって、製造者またはユーザにより予め設定され得る。 Then, the conformity determination unit 232 may determine that the first medical element and the second medical element are compatible when the calculated conformity score is equal to or higher than the predetermined threshold value. Here, the predefined thresholds may be preset by the manufacturer or user, for example, according to experience.

上述したように、適合性係数決定部231は、予め定義された規則に従って、適合性係数を決定する。代替の解決策として、適合性係数決定部231はまた、以下のステップに従って適合性係数を決定し得る。 As described above, the suitability coefficient determination unit 231 determines the suitability coefficient according to a predefined rule. As an alternative solution, the suitability factor determination unit 231 may also determine the suitability factor according to the following steps.

第1に、適合性係数決定部231は、上述の特徴のうちの少なくとも1つを計算するであろう。 First, the fitness factor determination unit 231 will calculate at least one of the above features.

第2に、適合性係数決定部231は、予め生成されたモデルに基づいて意味論的値の競合および意味論的順序の競合を決定するであろう。ここで、予め生成されたモデルは、第1の医用要素と第2の医用要素とが同じ診断状態にあるときの特徴に対するモデルと、第1の医用要素と第2の医用要素とが異なる診断状態にあるときの特徴に対するモデルとを少なくとも含む。更に、予め生成されたモデルは、例えば統計的トレーニングに従って製造者によって予め生成され得る。予め生成されたモデルに基づいて決定された適合性係数の運用は、予め定義された規則に基づいて決定された適合性係数の上述の運用と類似しているため、詳細な説明はここでは繰り返さない。 Second, the fitness factor determination unit 231 will determine semantic value competition and semantic order competition based on a pre-generated model. Here, the pre-generated model is a model for the characteristics when the first medical element and the second medical element are in the same diagnostic state, and the diagnosis that the first medical element and the second medical element are different from each other. Includes at least a model for features when in state. In addition, the pre-generated model can be pre-generated by the manufacturer, eg, according to statistical training. The detailed description is repeated here because the operation of the fitness factor determined based on the pre-generated model is similar to the above operation of the fitness factor determined based on the predefined rules. No.

図2に戻り、適合性決定部230が第1の医用要素と第2の医用要素との間の適合性を決定した後、共参照解析部240は、第1の医用要素と第2の医用要素が同一の医用対象を示すか否かを、決定した適合性に基づいて判定する。そして更に、共参照解析部240は、決定された適合性が適合可能である場合に、第1の医用要素と第2の医用要素は同一の医用対象を示すと決定し得る。 Returning to FIG. 2, after the compatibility determination unit 230 determines the compatibility between the first medical element and the second medical element, the co-reference analysis unit 240 determines the compatibility between the first medical element and the second medical element. Whether or not the elements indicate the same medical object is determined based on the determined suitability. Further, the co-reference analysis unit 240 may determine that the first medical element and the second medical element indicate the same medical object when the determined compatibility is compatible.

上述した例を参照すると、図3に示すように、医用要素「結節」310と医用要素結節は互いに適合性があり、医用要素「結節」310と医用要素「結節」330は互いに適合性がなく、医用要素「結節」310と医用要素「結節」340は互いに適合性がなく、医用要素「結節」330と医用要素「結節」340は互いに適合性がある。したがって、共参照解析部240は、医用要素「結節」310と医用要素「結節」320とが1つの同一の結節を示し、医用要素「結節」330と医用要素「結節」340は別の同一の結節を示すと判断する。 Referring to the above example, as shown in FIG. 3, the medical element "nodule" 310 and the medical element nodule are compatible with each other, and the medical element "nodule" 310 and the medical element "nodule" 330 are not compatible with each other. , The medical element "nodule" 310 and the medical element "nodule" 340 are not compatible with each other, and the medical element "nodule" 330 and the medical element "nodule" 340 are compatible with each other. Therefore, in the co-reference analysis unit 240, the medical element "nodule" 310 and the medical element "nodule" 320 indicate one and the same nodule, and the medical element "nodule" 330 and the medical element "nodule" 340 are different and the same. Judged to indicate a nodule.

上述したように、本発明は、2つの医用要素が互いに共参照されるかを、それらの間の適合性に基づいて決定する。適合性は、一定の制約条件を満たす一連の特徴(医用文書の記述基準など)が互いに競合しないようにするべきであると説明でき、そうでなければ一連の特徴は互いに適合性がない。すなわち、2つの医用要素に関連する特徴が競合しない場合、これらの2つの医用要素は適合性がある(すなわち、これらの2つの医用要素は同一の医用対象を示す)。更に、本発明は、医用文書の記述基準に基づいて2つの医用要素に関連する特徴間の競合を意味論的に決定するので、記述が表面的に互いに類似していない医用要素も正確に処理することができる。したがって、本発明により共参照解析の精度が向上する。
[全体処理1]
As mentioned above, the present invention determines whether two medical elements are co-referenced to each other based on the compatibility between them. Conformity can be explained as a set of features that meet certain constraints (such as the description criteria of a medical document) should not conflict with each other, otherwise the set of features are incompatible with each other. That is, if the features associated with the two medical elements do not conflict, the two medical elements are compatible (ie, these two medical elements indicate the same medical object). In addition, the invention semantically determines the conflict between features associated with two medical elements based on the descriptive criteria of the medical document, so that medical elements whose descriptions are superficially dissimilar to each other are also treated accurately. can do. Therefore, the present invention improves the accuracy of the co-reference analysis.
[Overall processing 1]

図4を参照して、図2における第1実施形態の構成により実行される全体処理について説明する。図4は、図2における第1実施形態に従う全体処理の手順を概略的に示すフローチャート400である。 With reference to FIG. 4, the whole process executed by the configuration of the first embodiment in FIG. 2 will be described. FIG. 4 is a flowchart 400 schematically showing a procedure of the whole processing according to the first embodiment in FIG.

上述したように、第1に、図1に示される入力装置150は、ユーザによって入力されるかまたは画像取得装置から出力される医用文書を受信する。ここで、医用文書は医用文書の一部または医用文書全体であり得る。更に、医用文書が画像フォーマットである場合には、CPU110は、入力装置150からシステムバス180を介して医用文書を受け取り、最初に医用文書を画像フォーマットからテキストフォーマットに変換する。 As mentioned above, first, the input device 150 shown in FIG. 1 receives a medical document input by the user or output from the image acquisition device. Here, the medical document can be a part of the medical document or the whole medical document. Further, when the medical document is in an image format, the CPU 110 receives the medical document from the input device 150 via the system bus 180, and first converts the medical document from the image format to the text format.

そして更に、入力装置150は、ユーザによって医用文書から選択された、または既存のテキスト情報抽出技術を使用することによりCPU110によって抽出された第1の医用要素と第2の医用要素を受信する。第2に、入力装置150は、システムバス180を介して、受信した医用文書、第1の医用要素、および第2の医用要素を、図2に示される取得部210に転送する。 Further, the input device 150 receives the first medical element and the second medical element selected from the medical document by the user or extracted by the CPU 110 by using the existing text information extraction technique. Second, the input device 150 transfers the received medical document, the first medical element, and the second medical element to the acquisition unit 210 shown in FIG. 2 via the system bus 180.

そして、図4に示すように、取得ステップS410において、取得部210は、システムバス180を介して入力装置150から第1の医用要素、第2の医用要素、および医用文書を取得する。 Then, as shown in FIG. 4, in the acquisition step S410, the acquisition unit 210 acquires the first medical element, the second medical element, and the medical document from the input device 150 via the system bus 180.

診断特徴検出ステップS420において、診断特徴検出部220は、医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出する。 In the diagnostic feature detection step S420, the diagnostic feature detection unit 220, from the medical document, describes the diagnostic state of the first medical element, at least one characteristic of the first medical element, the diagnostic state of the second medical element, and the second. Detects at least one characteristic of the medical element of.

適合性係数決定ステップS430において、適合性決定部230は、検出された診断状態および特性に基づいて、第1の医用要素と第2の医用要素との間の適合性係数を決定する。 In the suitability coefficient determination step S430, the suitability determination unit 230 determines the suitability coefficient between the first medical element and the second medical element based on the detected diagnostic condition and characteristics.

適合性判定ステップS440において、適合性決定部230は、決定された適合性係数に基づいて、第1の医用要素と第2の医用要素との間の適合性を判定する。 In the suitability determination step S440, the suitability determination unit 230 determines the suitability between the first medical element and the second medical element based on the determined suitability coefficient.

そして、第1の医用要素と第2の医用要素とが適合性がある場合、共参照解析ステップS450において、共参照解析部240は、第1の医用要素と第2の医用要素が同一の医用対象を示すと判断する。そうでなければ、共参照解析ステップS460において、共参照解析部240は、第1の医用要素と第2の医用要素とが同一の医用対象を指し示していないと判断する。 Then, when the first medical element and the second medical element are compatible, in the co-reference analysis step S450, the co-reference analysis unit 240 has the same medical element as the first medical element and the second medical element. Judge to indicate the target. Otherwise, in the co-reference analysis step S460, the co-reference analysis unit 240 determines that the first medical element and the second medical element do not point to the same medical object.

そして最後に、共参照解決部240は、処理結果をユーザに表示するために、または、情報抽出等といった、以下に説明する、続いて起こるオペレーションのために、システムバス180を介して共参照解決を図1に示す出力装置160に転送する。
[類似度と適合性を用いた共参照解析のための装置の構成]
And finally, the co-reference resolution unit 240 resolves the co-reference via the system bus 180 for the subsequent operations described below, such as to display the processing result to the user or to extract information, etc. Is transferred to the output device 160 shown in FIG.
[Device configuration for co-reference analysis using similarity and suitability]

第1の実施形態において説明したように、図2に示した共参照解析のための装置200は、第1の医用要素と第2の医用要素との間の適合性を使用することによってのみ、第1の医用要素と第2の医用要素が同一の医用対象を示すかどうかを決定する。しかしながら、本発明はまた、第1の医用要素と第2の医用要素との間の類似性の測度および適合性を使用することにより、共参照解析を実行することもできる。本実施形態では、図5および図7を参照して、類似性測度および適合性を用いて共参照解析を行う共参照のための装置の構成について次に説明する。本実施形態の共参照解析のための装置は、図1に説明したものと同じハードウェア構成を有する。 As described in the first embodiment, the apparatus 200 for semantic role analysis shown in FIG. 2 only uses the compatibility between the first medical element and the second medical element. Determine if the first medical element and the second medical element indicate the same medical object. However, the invention can also perform co-reference analysis by using a measure of similarity and suitability between a first medical element and a second medical element. In this embodiment, with reference to FIGS. 5 and 7, the configuration of a device for co-reference that performs co-reference analysis using a similarity measure and suitability will be described below. The apparatus for co-reference analysis of this embodiment has the same hardware configuration as that described in FIG.

図5は、本発明の第2実施形態に従う共参照解析のための装置500の構成を示すブロック図である。 FIG. 5 is a block diagram showing a configuration of an apparatus 500 for co-reference analysis according to the second embodiment of the present invention.

図5に示すブロックは、図1を参照して上述したCPU110として実現され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。 The block shown in FIG. 5 is realized as the CPU 110 described above with reference to FIG. 1 and is used to execute a program loaded in the RAM 120 and cooperate with each hardware shown in FIG. Some or all of the blocks may be implemented by dedicated hardware.

図5を図2と比較すると、図5に示す共参照解析のための装置500において2つの主な違いがある。 Comparing FIG. 5 with FIG. 2, there are two major differences in the apparatus 500 for semantic role analysis shown in FIG.

第1に、共参照解析のための装置500は更に、医用文書における第1と第2の医用要素の間の単語特徴の類似性測度と、医用文書における第1と第2の医用要素の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第1の類似性測度を決定するために使用される、第1の類似性測度決定部510を有する。ここで、第1の医用要素と第2の医用要素との間の類似性測度は、第1の医用要素と第2の医用要素との間の類似度を表す。例えば、類似度が非常に高い場合は、第1の医用要素と第2の医用要素がほぼ同じ単語の特徴を使用していることを意味する。そして、類似度が高い場合、第1の医用要素と第2の医用要素が非常に類似した単語特徴を使用するか、または第1の医用要素と第2の医用要素で使用される単語特徴が異なるか、単語特徴「失敗」のような同義語に置き換えられることを意味する。また、類似度は、例えば、上記[特許文献1]を用いて決定することができる。 First, the device 500 for co-reference analysis further measures the similarity of word features between the first and second medical elements in the medical document and the content of the first and second medical elements in the medical document. It has a first similarity measure determination unit 510 used to determine a first similarity measure between a first medical element and a second medical element based on the similarity measure of. Here, the similarity measure between the first medical element and the second medical element represents the similarity between the first medical element and the second medical element. For example, if the similarity is very high, it means that the first medical element and the second medical element use the characteristics of almost the same word. And if the degree of similarity is high, either the first medical element and the second medical element use word features that are very similar, or the word features used in the first medical element and the second medical element. It means different or replaced by a synonym such as the word feature "failure". Further, the degree of similarity can be determined by using, for example, the above [Patent Document 1].

第2に、診断特徴検出部220は、第1の類似性測度決定部510が第1の医用要素と第2の医用要素との間の第1の類似性測度が閾値(すなわち図6において示されるTH)以上であると判定した場合にのみ、第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および第2の医用要素の特性を検出する。ここで、閾値は、例えば実際の用途または経験に従って、製造者またはユーザにより予め定義され得る。すなわち、本実施形態では、本発明は、2つの医用要素の間の適合性を使用して、類似性測度を使用して共参照解析を実行することによって引き起こされる不正確な判断を修正することができる。ここで、不正確な判断は、2つの医用要素を共参照として決定するが、これら2つの医用要素は表面的には同じまたは類似しているが、実際には互いに共参照されていないことである。したがって、共参照解析の精度が向上する。 Secondly, in the diagnostic feature detection unit 220, the first similarity measure determination unit 510 has a threshold value (that is, the first similarity measure between the first medical element and the second medical element is shown in FIG. 6). Only when it is determined that the value is TH) or higher, the diagnostic state of the first medical element, the characteristics of the first medical element, the diagnostic state of the second medical element, and the characteristics of the second medical element are detected. .. Here, the threshold may be predefined by the manufacturer or user, for example according to actual use or experience. That is, in the present embodiment, the present invention uses the suitability between two medical elements to correct the inaccurate judgment caused by performing a collateral analysis using a similarity measure. Can be done. Here, an inaccurate judgment is determined by determining two medical elements as co-references, but these two medical elements are superficially the same or similar, but are not actually co-referenced to each other. be. Therefore, the accuracy of the co-reference analysis is improved.

図5に示した取得部210、診断特徴検出部220、適合性決定部230および共参照解析部240に関するその他の詳細な説明は、図2に示した対応する部分と同様であるので、その詳細な説明はここでは繰り返さない。 Other detailed explanations regarding the acquisition unit 210, the diagnostic feature detection unit 220, the suitability determination unit 230, and the co-reference analysis unit 240 shown in FIG. 5 are the same as the corresponding parts shown in FIG. 2, and thus the details thereof. The explanation is not repeated here.

図6を参照して、図5における第2実施形態の構成により実行される全体処理について説明する。図6は、図5における第2実施形態に従う全体処理の手順を概略的に示すフローチャート600である。 With reference to FIG. 6, the whole process executed by the configuration of the second embodiment in FIG. 5 will be described. FIG. 6 is a flowchart 600 schematically showing the procedure of the whole process according to the second embodiment in FIG.

図6を図4と比較すると、図6に示すフローチャート600において以下の主な違いがある。 Comparing FIG. 6 with FIG. 4, there are the following major differences in the flowchart 600 shown in FIG.

取得ステップS410において取得部210がシステムバス180を介して入力装置150から第1の医用要素、第2の医用要素、および医用文書を取得した後、第1の類似性測度決定ステップS610において、第1の類似性測度決定部510は、医用文書における第1および第2の医用要素間の単語特徴の類似性測度および医用文書における第1および第2の医用要素の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第1の類似性測度を決定する。また、S610において、第1の類似性測度決定部510が第1の医用要素と第2の医用要素との間の第1の類似性測度が閾値(すなわち、図6に示すTH)以上であると判断した場合、手順はステップS420に進み、そうでなければ、手順は終了する。 After the acquisition unit 210 acquires the first medical element, the second medical element, and the medical document from the input device 150 via the system bus 180 in the acquisition step S410, the first similarity measure determination step S610 is performed. The similarity measure determination unit 510 of 1 is based on the similarity measure of the word feature between the first and second medical elements in the medical document and the similarity measure of the contents of the first and second medical elements in the medical document. , Determine a first similarity measure between the first medical element and the second medical element. Further, in S610, in the first similarity measure determination unit 510, the first similarity measure between the first medical element and the second medical element is equal to or higher than the threshold value (that is, TH shown in FIG. 6). If it is determined, the procedure proceeds to step S420, and if not, the procedure ends.

図6に示したステップS410〜S460に対するその他の詳細な説明は、図4に示した対応するステップと同様であるので、その詳細な説明はここでは繰り返さない。 Since the other detailed description for steps S410 to S460 shown in FIG. 6 is the same as the corresponding step shown in FIG. 4, the detailed description is not repeated here.

上述したように、図5に示す実施形態は、適合性を使用して、共参照解析を実行するために類似性測度を使用することによって引き起こされる不正確な判断を修正する。更に、類似性測度および適合性を使用することにより共参照解析を実行するための別の解決策がある。図7は、本発明の第2の実施形態に従う共参照解析のための装置700の構成を示す別のブロック図である。 As mentioned above, the embodiment shown in FIG. 5 uses suitability to correct inaccurate judgments caused by using a similarity measure to perform a co-reference analysis. In addition, there is another solution for performing a collateral analysis by using a similarity measure and suitability. FIG. 7 is another block diagram showing the configuration of the apparatus 700 for co-reference analysis according to the second embodiment of the present invention.

図7に示すブロックは、図1を参照して上述したCPU110として実現され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。 The block shown in FIG. 7 is realized as the CPU 110 described above with reference to FIG. 1 and is used to execute a program loaded in the RAM 120 and cooperate with each hardware shown in FIG. Some or all of the blocks may be implemented by dedicated hardware.

図7を図2と比較すると、図7に示す共参照解析のための装置700において2つの主な違いがある。 Comparing FIG. 7 with FIG. 2, there are two major differences in the apparatus 700 for semantic role analysis shown in FIG.

共参照解析のための装置700は更に、医用文書における第1および第2の医用要素の間の単語特徴の類似性測度と、医用文書における第1および第2の医用要素の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第2の類似性測度を決定するために使用される、第2の類似性測度決定部710を有する。ここで、第1の医用要素と第2の医用要素との間の類似性測度は、例えば、上述の[特許文献1]を用いて決定することができる。 The apparatus 700 for co-reference analysis further measures the similarity measure of the word feature between the first and second medical elements in the medical document and the similarity measure of the contents of the first and second medical elements in the medical document. Has a second similarity measure determinant 710, which is used to determine a second similarity measure between the first medical element and the second medical element. Here, the similarity measure between the first medical element and the second medical element can be determined by using, for example, the above-mentioned [Patent Document 1].

第2に、共参照解析部240は、決定された第2の類似性測度と決定された適合度に基づいて、第1の医用要素と第2の医用要素は同一の医用対象を示すかを判断する。例えば、共参照解析部240は、決定された第2の類似性測度と決定された適合度が第1の閾値(TH1)以上である場合、または、決定された第2の類似性測度と決定された適合度が第2の閾値(TH2)以上である場合、第1の医用要素と第2の医用要素は同一の医用対象を示すと決定し得る。ここで、TH1およびTH2は、例えば実際の用途または経験に従って、製造業者またはユーザによって予め定義され得る。 Second, the co-reference analysis unit 240 determines whether the first medical element and the second medical element indicate the same medical object based on the determined second similarity measure and the determined goodness of fit. to decide. For example, the co-reference analysis unit 240 determines when the determined second similarity measure and the determined goodness of fit are equal to or greater than the first threshold value (TH1), or when the determined second similarity measure is determined. If the goodness of fit is greater than or equal to the second threshold (TH2), it can be determined that the first medical element and the second medical element represent the same medical object. Here, TH1 and TH2 may be predefined by the manufacturer or user, for example according to actual use or experience.

第1の実施形態において説明したように、2つの医用要素の間の決定された適合性は、適合性スコアとして記録され得るか、または適合性あり(適合可能)または適合性なし(適合不可)として記録され得る。従って、適合性ありと記録された場合、決定された適合性は1と見なされ、適合性なしと記録された場合は、決定された適合性は0と見なされ得る。更に、決定された第1の類似性測度と決定された適合性の両方の重みを1と設定することができ、そのような場合、上述の重み付き合計は、すなわち決定された第1の類似性測度と決定された適合性の合計である。 As described in the first embodiment, the determined compatibility between the two medical elements can be recorded as a compatibility score, or is compatible (compatible) or non-compatible (non-conforming). Can be recorded as. Therefore, if it is recorded as conforming, the determined conformance may be considered as 1, and if it is recorded as non-conforming, the determined conformance may be considered as 0. Further, the weights of both the determined first similarity measure and the determined suitability can be set to 1, in which case the weighted sum described above, i.e., the determined first similarity. It is the sum of the sex measure and the determined suitability.

図7に示した取得部210、診断特徴検出部220、適合性決定部230および共参照解析部240に関するその他の詳細な説明は、図2に示した対応する部分と同様であるので、その詳細な説明はここでは繰り返さない。本実施形態では、記述が医用文書の基準を満たさないいくつかの医用要素に関して、本発明は、医用要素間の類似性測度を使用して、適合性を使用して共参照解析を行うことによって引き起こされる不正確な判断を修正することができる。したがって、共参照解析の精度が向上する。 Other detailed explanations regarding the acquisition unit 210, the diagnostic feature detection unit 220, the suitability determination unit 230, and the co-reference analysis unit 240 shown in FIG. 7 are the same as the corresponding parts shown in FIG. 2, and thus the details thereof. The explanation is not repeated here. In this embodiment, for some medical elements whose description does not meet the criteria of a medical document, the present invention uses a similarity measure between the medical elements to perform a co-reference analysis using suitability. Inaccurate judgments caused can be corrected. Therefore, the accuracy of the co-reference analysis is improved.

図8を参照して、図7における第2実施形態の構成により実行される全体処理について説明する。図8は、図7における第2実施形態に従う全体処理の手順を概略的に示すフローチャート800である。 With reference to FIG. 8, the whole process executed by the configuration of the second embodiment in FIG. 7 will be described. FIG. 8 is a flowchart 800 schematically showing the procedure of the whole process according to the second embodiment in FIG. 7.

図8を図4と比較すると、図8に示すフローチャート800において2つの主な違いがある。 Comparing FIG. 8 with FIG. 4, there are two main differences in the flowchart 800 shown in FIG.

第1に、第1の医用要素と第2の医用要素との間の適合性を決定することに加えて、フローチャート800は更に、第2の類似性測度決定ステップS810を含む。このステップでは、第2の類似性測度決定部710は、医用文書における第1および第2の医用要素間の単語特徴の類似性測度、および、医用文書における第1および第2の医用要素間の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第2の類似性測度を決定する。 First, in addition to determining the compatibility between the first medical element and the second medical element, the flowchart 800 further includes a second similarity measure determination step S810. In this step, the second similarity measure determination unit 710 measures the similarity of word features between the first and second medical elements in the medical document, and between the first and second medical elements in the medical document. Based on the content similarity measure, a second similarity measure between the first medical element and the second medical element is determined.

第2に、適合性決定部230がステップS430〜S440で適合性を判定し、第2の類似性測度決定部710がステップS810で第2の類似性測度を決定した後、共参照解析ステップS820で、共参照解析部240は、決定された第2の類似性測度および決定された適合性に基づいて、第1の医用要素と第2の医用要素が同一の医用対象を示すか否かを決定する。 Second, the suitability determination unit 230 determines the suitability in steps S430 to S440, the second similarity measure determination unit 710 determines the second similarity measure in step S810, and then the co-reference analysis step S820. Then, the co-reference analysis unit 240 determines whether or not the first medical element and the second medical element indicate the same medical object based on the determined second similarity measure and the determined suitability. decide.

図8に示したステップS410〜S440に対するその他の詳細な説明は、図4に示した対応するステップと同様であるので、その詳細な説明はここでは繰り返さない。
[情報抽出のための装置の構成]
Since the other detailed description for steps S410 to S440 shown in FIG. 8 is the same as the corresponding step shown in FIG. 4, the detailed description is not repeated here.
[Device configuration for information extraction]

第1および第2の実施形態において説明したように、情報抽出のために、図2に示す共参照解析のための装置200、図5に示す共参照解析のための装置500、および図7に示す共参照解析のための装置700を使用することができる。本実施形態において、次に、図9を参照して、上述した共参照解析のための装置200、500、700を適用した情報抽出のための装置の構成について説明する。本実施形態の情報抽出のための装置は、図1に説明したものと同じハードウェア構成を有する。 As described in the first and second embodiments, in order to extract information, the device 200 for co-reference analysis shown in FIG. 2, the device 500 for co-reference analysis shown in FIG. 5, and FIG. 7 The device 700 for the shown co-reference analysis can be used. In the present embodiment, next, with reference to FIG. 9, the configuration of the device for information extraction to which the devices 200, 500, and 700 for the above-mentioned co-reference analysis are applied will be described. The device for extracting information of this embodiment has the same hardware configuration as that described in FIG.

図9は、本発明の第3実施形態に従う情報抽出のための装置900の構成を示すブロック図である。 FIG. 9 is a block diagram showing the configuration of the device 900 for information extraction according to the third embodiment of the present invention.

図9に示すブロックは、図1を参照して上述したCPU110として実現され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。 The block shown in FIG. 9 is realized as the CPU 110 described above with reference to FIG. 1 and is used to execute a program loaded in the RAM 120 and cooperate with each hardware shown in FIG. Some or all of the blocks may be implemented by dedicated hardware.

図9に示すように、本発明の第3実施形態による情報抽出のための装置900は、上述した共参照解析のための装置200、500、または700と、取得部910、医用要素抽出部920、および、医用要素統合部930とを備える。 As shown in FIG. 9, the apparatus 900 for information extraction according to the third embodiment of the present invention includes the above-mentioned apparatus 200, 500, or 700 for co-reference analysis, an acquisition unit 910, and a medical element extraction unit 920. , And a medical element integration unit 930.

第1に、第1実施形態において説明したように、図1に示される入力装置150は、ユーザによって入力されるかまたは画像取得装置から出力される医用文書を受信する。ここで、医用文書は医用文書の一部または医用文書全体であり得る。更に、医用文書が画像フォーマットである場合には、CPU110は、入力装置150からシステムバス180を介して医用文書を受け取り、最初に医用文書を画像フォーマットからテキストフォーマットに変換する。 First, as described in the first embodiment, the input device 150 shown in FIG. 1 receives a medical document input by the user or output from the image acquisition device. Here, the medical document can be a part of the medical document or the whole medical document. Further, when the medical document is in an image format, the CPU 110 receives the medical document from the input device 150 via the system bus 180, and first converts the medical document from the image format to the text format.

第2に、図9に示すように、取得部910は、システムバス180を介して入力装置150またはCPU110から医用文書を取得する。 Second, as shown in FIG. 9, the acquisition unit 910 acquires a medical document from the input device 150 or the CPU 110 via the system bus 180.

第3に、医用要素抽出部920は、取得部910により取得された医用文書から少なくとも2つの医用要素を抽出する。ここで、医用要素抽出部920は、例えば、医用要素を抽出するために、既存のテキスト情報抽出技術を使用することができる。 Third, the medical element extraction unit 920 extracts at least two medical elements from the medical document acquired by the acquisition unit 910. Here, the medical element extraction unit 920 can use an existing text information extraction technique for extracting a medical element, for example.

そして、上述の装置200、500、または700であり得る共参照解析のための装置は、図2〜図8を参照した上記の説明に従って、医用要素のいずれか2つが同一の医用対象を示すかを判断する。 And the device for co-reference analysis, which may be the device 200, 500, or 700 described above, indicates whether any two of the medical elements indicate the same medical object according to the above description with reference to FIGS. 2-8. To judge.

そして最後に、医用要素統合部930は、共参照のための装置により決定された互いに共参照される医用要素の診断状態と特性と統合する。そして、医用要素統合部930は、処理結果をユーザに表示するか、または、類似文書の検索等といった、以下に説明する、続いて起こるオペレーションのために、システムバス180を統合結果を介して図1に示す出力装置160に転送する。 And finally, the medical element integration unit 930 integrates with the diagnostic state and characteristics of the mutually co-referenced medical elements determined by the device for co-reference. The medical element integration unit 930 then displays the system bus 180 through the integration results for subsequent operations as described below, such as displaying the processing results to the user or searching for similar documents. Transfer to the output device 160 shown in 1.

これにより、本情報抽出の実施形態によれば、取得した医用文書における医用対象のそれぞれを、1つの記述データとして取得することができる。 Thereby, according to the embodiment of the present information extraction, each of the medical objects in the acquired medical document can be acquired as one descriptive data.

医用対象に対するより正確な記述データを得るために、好ましい解決策として、医用要素統合部930は、取得した医用文書における医用要素の出現順序(シーケンス)に基づいて、互いに共参照される医用要素の診断状態と特性を統合することができる。更に、医用要素統合部930は、図10〜図11を参照して以下に説明する様々な方法で統合を実施することができる。
[全体処理2]
In order to obtain more accurate descriptive data for the medical object, as a preferred solution, the medical element integration unit 930 is based on the appearance order (sequence) of the medical elements in the acquired medical document, and the medical elements are co-referenced with each other. Diagnostic status and characteristics can be integrated. Further, the medical element integration unit 930 can carry out the integration by various methods described below with reference to FIGS. 10 to 11.
[Overall processing 2]

図10〜図11を参照して、図9における第3実施形態の構成により実行される全体処理について説明する。図10は、図9の第3実施形態に従う全体処理の手順を概略的に示すフローチャート1000である。 With reference to FIGS. 10 to 11, the entire process executed by the configuration of the third embodiment in FIG. 9 will be described. FIG. 10 is a flowchart 1000 schematically showing a procedure of the whole processing according to the third embodiment of FIG.

上述したように、第1に、図1に示される入力装置150は、ユーザによって入力されるかまたは画像取得装置から出力される医用文書を受信する。ここで、医用文書は医用文書の一部または医用文書全体であり得る。更に、医用文書が画像フォーマットである場合には、CPU110は、入力装置150からシステムバス180を介して医用文書を受け取り、最初に医用文書を画像フォーマットからテキストフォーマットに変換する。 As mentioned above, first, the input device 150 shown in FIG. 1 receives a medical document input by the user or output from the image acquisition device. Here, the medical document can be a part of the medical document or the whole medical document. Further, when the medical document is in an image format, the CPU 110 receives the medical document from the input device 150 via the system bus 180, and first converts the medical document from the image format to the text format.

そして、図10に示すように、取得ステップS1010において、取得部910は、システムバス180を介して入力装置150またはCPU110から医用文書を取得する。 Then, as shown in FIG. 10, in the acquisition step S1010, the acquisition unit 910 acquires a medical document from the input device 150 or the CPU 110 via the system bus 180.

医用要素抽出ステップS1020において、医用要素抽出部920は、取得部910により取得された医用文書から少なくとも2つの医用要素を抽出する。 In the medical element extraction step S1020, the medical element extraction unit 920 extracts at least two medical elements from the medical document acquired by the acquisition unit 910.

共参照解析ステップS1030〜S1040において、最初にステップS1030において、上述の装置200、500または700であり得る共参照解析のための装置は、取得された医用文書に最初に現れる抽出された医用要素を、最初に現れた医用要素として選択する。そして、ステップS1040において、上述の装置200、500、または700であり得る共参照解析のための装置は、図2〜図8を参照した上記の説明に従って、最初に現れた医用要素と共参照されている医用要素を決定する。 In co-reference analysis steps S103 to S1040, first in step S1030, the device for co-reference analysis, which may be the device 200, 500 or 700 described above, is the extracted medical element that first appears in the obtained medical document. , Select as the first medical element to appear. Then, in step S1040, the device for co-reference analysis, which may be the device 200, 500, or 700 described above, is co-referenced with the first appearing medical element according to the above description with reference to FIGS. 2-8. Determine the medical factors that are in use.

医用要素統合ステップS1050において、医用要素統合部930は、最初に現れた医用要素と、最初に現れた医用要素と共参照されている医用要素の診断状態および特性を統合する。 In the medical element integration step S1050, the medical element integration unit 930 integrates the diagnostic state and characteristics of the first appearing medical element and the medical element co-referenced with the first appearing medical element.

そして、ステップS1060において、医用要素統合部930は、抽出された医用要素が残っているか否かを判定する。そして、残っている医用要素については、まだ医用要素が残っている場合、ステップS1030〜S1050で実行される動作を繰り返す。そうでなければ、手順は終了し、各医用対象に対する記述データはユーザに表示されるか、続いて起こるオペレーションのために表示される。 Then, in step S1060, the medical element integration unit 930 determines whether or not the extracted medical element remains. Then, with respect to the remaining medical elements, if the medical elements still remain, the operation executed in steps S103 to S1050 is repeated. Otherwise, the procedure ends and descriptive data for each medical subject is displayed to the user or for subsequent operations.

以下では、図11を参照して任意の解決策を説明する。図11は、図9における第3実施形態に従う全体処理の手順を概略的に示す別のフローチャート1100である。 In the following, any solution will be described with reference to FIG. FIG. 11 is another flowchart 1100 schematically showing the procedure of the whole process according to the third embodiment in FIG.

図11に示すように、図11に示すステップS1010〜S1030およびS1060の詳細な説明は、図10に示す対応するステップと同様であるので、ここでは詳細な説明は繰り返さない。 As shown in FIG. 11, since the detailed description of steps S101 to S1030 and S1060 shown in FIG. 11 is the same as the corresponding step shown in FIG. 10, the detailed description is not repeated here.

ステップS1030において最初に現れた医用要素が選択された後、ステップS1110において、上述の装置200、500または700であり得る共参照解析のための装置は、図2〜図8を参照して上述した説明に従って、最も近くかつ最初に現れた医用要素と共参照されている医用要素を決定する。 After the first appearing medical element in step S1030 is selected, in step S1110 the device for semantic role analysis, which may be the device 200, 500 or 700 described above, is described above with reference to FIGS. 2-8. Follow the instructions to determine the medical element that is co-referenced with the closest and first appearing medical element.

ステップS1120において、医用要素統合部930は、最初に現れた医用要素とステップS1110で決定された医用要素の診断状態と特性を統合する。 In step S1120, the medical element integration unit 930 integrates the diagnostic state and characteristics of the first appearing medical element and the medical element determined in step S1110.

ステップS1130において、統合された医用要素に関して、上述の装置200、500または700であり得る共参照解析のための装置は、図2〜図8を参照して上述した説明に従って、最初に現れた医用要素と最も近くかつ共参照されている医用要素が含まれるかを判定する。そして、統合された医用要素に最も近くかつそれと共参照されている医用要素がまだ含まれている場合、手順はステップS1140に進む。そうでなければステップS1060に進む。 In step S1130, with respect to the integrated medical element, the device for co-reference analysis, which may be the device 200, 500 or 700 described above, first appeared in accordance with the description described above with reference to FIGS. 2-8. Determine if a medical element that is closest to and co-referenced with the element is included. And if the integrated medical element still contains the closest and co-referenced medical element, the procedure proceeds to step S1140. If not, the process proceeds to step S1060.

ステップS1140において、医用要素統合部930は、ステップS1130で決定された医用要素の診断状態と特性を統合された医用要素に統合する。そして、手続は、統合された医用要素に最も近くかつそれと共参照される医用要素がなくなるまで、ステップS1130〜S1140で実行される動作を繰り返す。 In step S1140, the medical element integration unit 930 integrates the diagnostic state and characteristics of the medical element determined in step S1130 into the integrated medical element. Then, the procedure repeats the operation performed in steps S1130 to S1140 until there is no medical element closest to and co-referenced with the integrated medical element.

当業者には理解されるであろうが、図10〜図11を参照して説明した上述の統合動作は単なる例示であり、限定的ではない。 As will be appreciated by those skilled in the art, the above-mentioned integrated operations described with reference to FIGS. 10 to 11 are merely exemplary and not limiting.

上述のように、図3に示される上述の医用要素「結節」310〜340を例にとると、医用要素「結節」310および医用要素「結節」320は、1つの同一の結節を示し、医用要素「結節」330および医用要素結節は、別の同一の結節を示す。したがって、医用要素「結節」310および医用要素「結節」320の診断状態および特性は、医用対象に関する1つの記述データに統合することができ、対応する記述データは、例えば以下の表1に示される。更に、医用要素「結節」330および医用要素「結節」340の診断状態および特性は、別の医用対象に対する別の記述データに統合することができ、対応する記述データは、例えば以下の表2に示される。 As described above, taking the above-mentioned medical element "nodule" 310-340 shown in FIG. 3 as an example, the medical element "nodule" 310 and the medical element "nodule" 320 indicate one identical nodule and are medical. The element "nodule" 330 and the medical element nodule indicate another identical nodule. Thus, the diagnostic states and characteristics of the medical element "nodule" 310 and the medical element "nodule" 320 can be integrated into one descriptive data relating to the medical subject, the corresponding descriptive data being shown, for example, in Table 1 below. .. Further, the diagnostic status and characteristics of the medical element "nodule" 330 and the medical element "nodule" 340 can be integrated into different descriptive data for another medical subject, the corresponding descriptive data can be found in, for example, Table 2 below. Shown.

表1:

Figure 0006972029
Table 1:
Figure 0006972029

表2:

Figure 0006972029
[類似文書検索のための装置の構成] Table 2:
Figure 0006972029
[Device configuration for similar document retrieval]

第3の実施形態で説明したように、図9に示す情報抽出装置900を類似文書検索のために使用することができる。ここで、2つの文書が同じ文書であれば、これら2つの文書の内容はほぼ同じであることを意味する。そして、2つの文書が類似した文書である場合、それはこれら2つの文書の間に概念的な内容のかなりの重複があることを意味する。本実施形態では、次に、図12を参照して、上述した情報抽出装置900を適用した類似文書検索のための装置の構成について説明する。本実施形態の類似文書検索のための装置は、図1に説明したものと同じハードウェア構成を有する。 As described in the third embodiment, the information extraction device 900 shown in FIG. 9 can be used for similar document retrieval. Here, if the two documents are the same document, it means that the contents of these two documents are almost the same. And if the two documents are similar, it means that there is considerable overlap of conceptual content between the two documents. In the present embodiment, next, with reference to FIG. 12, the configuration of the device for searching for similar documents to which the above-mentioned information extraction device 900 is applied will be described. The apparatus for searching for similar documents according to this embodiment has the same hardware configuration as that described in FIG.

図12は、本発明の第4実施形態に従う類似文書検索のための装置1200の構成を示すブロック図である。 FIG. 12 is a block diagram showing the configuration of the apparatus 1200 for searching for similar documents according to the fourth embodiment of the present invention.

図12に示すブロックは、図1を参照して上述したCPU110として実装され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。 The block shown in FIG. 12 is implemented as the CPU 110 described above with reference to FIG. 1 and is used to execute a program loaded in the RAM 120 and cooperate with each hardware shown in FIG. Some or all of the blocks may be implemented by dedicated hardware.

図12に示すように、本発明の第4実施形態による類似文書検索のための装置1200は、上述した情報抽出のための装置900と、類似性測度算出部1210と、類似文書検索部1220とを備える。 As shown in FIG. 12, the apparatus 1200 for searching for similar documents according to the fourth embodiment of the present invention includes the above-mentioned device 900 for extracting information, a similarity measure calculation unit 1210, and a similar document search unit 1220. To prepare for.

ユーザ(例えば医師)が医用文書を書いたり読んだりするとき、彼/彼女は通常、自分が書いたまたは読んだ医用文書と類似している履歴医用文書を検索して参照したいと思う。 When a user (eg, a doctor) writes or reads a medical document, he / she usually wants to search for and refer to a historical medical document that is similar to the medical document he or she wrote or read.

したがって、第1に、図1に示される入力装置150は、ユーザによって書き込まれるかまたは読み取られる医用文書を受け取ることになる。ここで、医用文書は、ユーザによって直接入力されるか、または画像取得装置から出力されることができ、文書は、医用文書の一部または医用文書全体であり得る。 Thus, first, the input device 150 shown in FIG. 1 will receive a medical document written or read by the user. Here, the medical document can be directly input by the user or output from the image acquisition device, and the document can be a part of the medical document or the entire medical document.

入力装置150によって受信された医用文書に関しては、情報抽出のための装置900は、図9〜図11を参照して上述した説明に従って、取得された医用文書から、医用要素の統合された診断状態および特性(すなわち、各医用対象についての上記の記述データ)を抽出する。 With respect to the medical document received by the input device 150, the device 900 for information extraction is an integrated diagnostic state of the medical element from the obtained medical document according to the above description with reference to FIGS. 9-11. And the characteristics (ie, the above descriptive data for each medical subject) are extracted.

一方、1つの例では、図1に示すCPU110は、ROM130またはハードディスク140に格納された履歴医用文書を取得する。別の例では、CPU110は、ネットワークを介して類似文書検索のための装置1200に接続されているサーバに格納されている履歴医用文書を取得する。詳細な説明は図14を参照して後述する。そして、履歴医用文書のそれぞれについて、情報抽出のための装置900は、図9〜図11を参照して上述した説明に従って、対応する履歴医用文書から、医用要素の統合された診断状態と特性を抽出する。 On the other hand, in one example, the CPU 110 shown in FIG. 1 acquires a history medical document stored in the ROM 130 or the hard disk 140. In another example, the CPU 110 acquires a history medical document stored in a server connected to a device 1200 for searching for similar documents via a network. A detailed description will be described later with reference to FIG. Then, for each of the historical medical documents, the device 900 for information extraction provides the integrated diagnostic state and characteristics of the medical elements from the corresponding historical medical document according to the above description with reference to FIGS. 9-11. Extract.

そして、図12に示されるように、類似性測度計算部1210は、取得された医用文書から抽出された医用要素の統合された診断状態と特性と、履歴医用文書から抽出された医用要素の統合された診断状態と特性との間の類似性測度を計算する。ここで、類似性測度は、例えば編集距離であり得る。 Then, as shown in FIG. 12, the similarity measure calculation unit 1210 integrates the integrated diagnostic state and characteristics of the medical elements extracted from the acquired medical document and the medical elements extracted from the history medical document. Calculate a measure of similarity between the diagnosed state and the characteristic. Here, the similarity measure can be, for example, an edit distance.

最後に、類似文書検索部1220は、計算された類似性測度に基づいて、履歴医用文書から取得された医用文書に類似する少なくとも1つの医用文書を検索する。1つの例では、類似文書検索部1220は、最終的な処理結果として、最も大きい類似性測度に対応する1つの医用文書を検索することができる。別の例では、類似文書検索部1220は、計算された類似性測度の値に基づいてランキングされた特定の医用文書を検索することができる。 Finally, the similarity document search unit 1220 searches for at least one medical document similar to the medical document obtained from the history medical document based on the calculated similarity measure. In one example, the similarity document search unit 1220 can search for one medical document corresponding to the largest similarity measure as the final processing result. In another example, the similarity document search unit 1220 can search for a particular medical document ranked based on the calculated similarity measure value.

そして、類似文書検索部1220、処理結果をユーザに表示するか、または、診断サポートといった、続いて起こるオペレーションのために、システムバス180を介して検索された類似医用文書を図1に示す出力装置160に転送する。 Then, the similar document search unit 1220, an output device showing similar medical documents searched via the system bus 180 for subsequent operations such as displaying the processing result to the user or diagnostic support, is shown in FIG. Transfer to 160.

これにより、この類似文書検索の実施形態によれば、表面的には類似しているが実際にはユーザによって入力された医用文書と類似していない履歴医用文書は検索されず、ユーザによって入力された医用文書と実際には類似しているが表面的には類似していない履歴医用文書が検索される。すなわち、概念内容がユーザによって入力された医用文書および/またはユーザによって入力された医用文書と類似の主題を記述する履歴医用文書と著しい重なりを有する履歴医用文書が、本発明に従って検索されることになる。したがって、類似文書検索の精度が向上する。
[全体処理3]
As a result, according to this embodiment of the similar document search, historical medical documents that are superficially similar but not actually similar to the medical document entered by the user are not searched and are entered by the user. History medical documents that are actually similar to but not superficially similar to the medical documents are searched. That is, a historical medical document whose concept content has a significant overlap with a medical document input by the user and / or a historical medical document describing a subject similar to the medical document input by the user is searched according to the present invention. Become. Therefore, the accuracy of similar document retrieval is improved.
[Overall processing 3]

図13を参照して、図12における第4実施形態の構成により実行される全体処理について説明する。図13は、図12の第4実施形態に従う全体処理の手順を概略的に示すフローチャート1300である。 With reference to FIG. 13, the whole process executed by the configuration of the fourth embodiment in FIG. 12 will be described. FIG. 13 is a flowchart 1300 schematically showing the procedure of the whole processing according to the fourth embodiment of FIG.

上述したように、ユーザによって入力された医用文書と、ROM130またはハードディスク140またはサーバに格納された各履歴医用文書については、情報抽出ステップS1310において、図9〜図11を参照して上述した説明に従って、情報抽出のための装置900が、取得された医用文書から、医用要素の統合された診断対象と特性を抽出し、履歴医用文書から医用要素の統合された診断状態と特性を抽出する。 As described above, for the medical document input by the user and each history medical document stored in the ROM 130 or the hard disk 140 or the server, in the information extraction step S1310, according to the above description with reference to FIGS. 9 to 11. The device 900 for information extraction extracts the integrated diagnostic object and characteristics of the medical element from the acquired medical document, and extracts the integrated diagnostic state and characteristic of the medical element from the historical medical document.

類似性測度計算ステップS1320では、類似性測度計算部1210は、取得された医用文書から抽出された医用要素の統合された診断状態と特性と、履歴医用文書から抽出された医用要素の統合された診断状態と特性との間の類似性測度を計算する。 In the similarity measure calculation step S1320, the similarity measure calculation unit 1210 integrates the integrated diagnostic state and characteristics of the medical elements extracted from the acquired medical document and the medical elements extracted from the history medical document. Calculate a measure of similarity between diagnostic status and characteristics.

類似文書検索ステップS1330では、類似文書検索部1220は、計算された類似性測度に基づいて、履歴医用文書から取得された医用文書に類似する少なくとも1つの医用文書を検索する。 In the similar document search step S1330, the similar document search unit 1220 searches for at least one medical document similar to the medical document obtained from the historical medical document based on the calculated similarity measure.

そして、処理結果をユーザに表示するか、または、続いて起こるオペレーションをのために、類似文書検索部1220は、システムバス180を介して検索された類似医用文書を図1に示す出力装置160に転送する。
[類似文書検索システム]
Then, in order to display the processing result to the user or to perform a subsequent operation, the similar document search unit 1220 displays the similar medical document searched via the system bus 180 on the output device 160 shown in FIG. Forward.
[Similar document search system]

第4実施形態において説明したように、履歴医用文書は、ネットワークを介して類似文書検索装置1200に接続されているサーバに格納され得る。本実施形態では、次に、図14を参照して、上述した類似文書検索のための装置1200を適用した例示的な類似文書検索システム1400について説明する。図14は、本発明に従う例示的な類似文書検索システム1400の構成を示す。 As described in the fourth embodiment, the historical medical document may be stored in a server connected to the similar document retrieval device 1200 via a network. In the present embodiment, next, an exemplary similar document retrieval system 1400 to which the above-mentioned device 1200 for similar document retrieval is applied will be described with reference to FIG. 14. FIG. 14 shows the configuration of an exemplary similar document retrieval system 1400 according to the present invention.

図14に示すように、類似文書検索システム1400は、類似文書検索のための上述の装置としての電子装置1410と、履歴医用文書および他の履歴データを格納するために使用されるサーバ1430とを備える。本実施形態の電子装置1410は、図1に記載のものと同じハードウェア構成および図12に記載のものと同じ構成を有することができる。 As shown in FIG. 14, the similar document retrieval system 1400 includes an electronic device 1410 as the above-mentioned device for searching similar documents and a server 1430 used for storing historical medical documents and other historical data. Be prepared. The electronic device 1410 of this embodiment can have the same hardware configuration as that shown in FIG. 1 and the same configuration as that shown in FIG.

電子装置1410は、ネットワーク1420を介してサーバ1430から履歴医用文書を取得するように構成される。そして、電子装置1410は、図12〜図13を参照して上述した説明に従って、取得された履歴医用文書から、ユーザによって入力された医用文書と類似する医用文書を検索するように構成される。更に、電子装置1410は、パーソナルデータアシスタント(PDA)、携帯電話、ラップトップ、デスクトップ、タブレットコンピュータ、またはその他の適切な電子機器等により実装され得る。図14に示すように、電子装置1410は、例えばラップトップ(すなわち、パーソナルコンピュータ)である。 The electronic device 1410 is configured to acquire historical medical documents from the server 1430 via the network 1420. Then, the electronic device 1410 is configured to search for a medical document similar to the medical document input by the user from the acquired historical medical documents according to the above description with reference to FIGS. 12 to 13. Further, the electronic device 1410 may be implemented by a personal data assistant (PDA), mobile phone, laptop, desktop, tablet computer, or other suitable electronic device. As shown in FIG. 14, the electronic device 1410 is, for example, a laptop (ie, a personal computer).

上記のすべてのユニットは、本開示に記載の処理を実施するための例示的および/または好ましいモジュールである。これらのユニットは、ハードウェアユニット(フィールドプログラマブルゲートアレイ(FPGA)など)、デジタル信号プロセッサ、特定用途向け集積回路など、および/またはソフトウェアモジュール(コンピュータ可読プログラムなど)とすることができる。様々なステップを実施するためのユニットは、上に網羅的に記載されていない。しかしながら、特定の処理を実行するステップがある場合、同じ処理を実行するための対応する機能モジュールまたはユニット(ハードウェアおよび/またはソフトウェアによって実行される)があってもよい。記載されたステップおよびこれらのステップに対応するユニットのすべての組み合わせによる技術的解決法は、それらが構成する技術的解決法が完全で適用可能である限り、本出願の開示に含まれる。 All of the above units are exemplary and / or preferred modules for performing the processes described in this disclosure. These units can be hardware units (such as field programmable gate arrays (FPGAs)), digital signal processors, application-specific integrated circuits, and / or software modules (such as computer-readable programs). The units for performing the various steps are not exhaustively listed above. However, if there is a step to perform a particular process, there may be a corresponding functional module or unit (performed by hardware and / or software) to perform the same process. Technical solutions with the steps described and all combinations of units corresponding to these steps are included in the disclosure of this application as long as the technical solutions they constitute are complete and applicable.

更に、図2、図5、図7に示した共参照解析のための200、図9に示した情報抽出のための装置900、あるいは図12に示した類似文書検索のための装置1200がソフトウェアによって部分的または全体的に構成されている場合、それは図1に示されているハードディスク140に格納され得る。別の態様では、図2、図5、図7に示した共参照解析のための200、図9に示した情報抽出のための装置900、あるいは図12に示した類似文書検索のための装置1200がハードウェアまたはファームウェアによって部分的または全体的に構成されている場合、電子装置において、共参照解析に対する必要性、情報抽出に対する必要性、または類似文書検索に対する必要性がある限り、それは機能モジュールとしてコンピュータのような電子装置に組み込まれることもできる。 Further, the software is 200 for co-reference analysis shown in FIGS. 2, 5 and 7, 900 for information extraction shown in FIG. 9, or 1200 for similar document retrieval shown in FIG. If configured partially or entirely by, it may be stored on the hard disk 140 shown in FIG. In another embodiment, the device for co-reference analysis shown in FIGS. 2, 5, and 7, 900, the device 900 for information extraction shown in FIG. 9, or the device for searching similar documents shown in FIG. If the 1200 is partially or wholly configured by hardware or firmware, it is a functional module as long as there is a need for co-reference analysis, a need for information extraction, or a need for similar document retrieval in an electronic device. It can also be incorporated into an electronic device such as a computer.

本発明の方法および装置を多くの方法で実施することが可能である。例えば、本発明の方法および装置を、ハードウェア、ファームウェア、またはそれらのあらゆる組み合わせを通して実施することが可能である。上記の方法のステップの順序は、例示的なものに過ぎず、本発明の方法のステップは、特に明記しない限り、上記の具体的な順序に限定されない。さらに、いくつかの実施形態では、本発明は、本発明による方法を実施するための機械可読命令を含む、記録媒体に記録されたプログラムとして実施することもできる。このように、本発明は、本発明の方法を実施するためのプログラムを記録した記録媒体も含むものである。 It is possible to implement the methods and devices of the present invention in many ways. For example, the methods and devices of the invention can be implemented through hardware, firmware, or any combination thereof. The order of the steps in the above method is merely exemplary, and the steps in the method of the present invention are not limited to the specific order described above, unless otherwise specified. Further, in some embodiments, the invention can also be implemented as a program recorded on a recording medium, including machine-readable instructions for carrying out the method according to the invention. As described above, the present invention also includes a recording medium on which a program for carrying out the method of the present invention is recorded.

本発明のいくつかの特定の実施形態を実施例によって詳細に説明したが、上記の実施例は例示的なものにすぎず、本発明の範囲を限定するものではないことを当業者は理解されたい。当業者であれば、本発明の範囲および精神から逸脱することなく上記の実施形態を修正できることを理解されたい。本発明の範囲は添付の特許請求の範囲によって規定される。 Although some particular embodiments of the invention have been described in detail by way of examples, those skilled in the art will appreciate that the above examples are merely exemplary and do not limit the scope of the invention. sea bream. It will be appreciated by those skilled in the art that the above embodiments can be modified without departing from the scope and spirit of the invention. The scope of the present invention is defined by the appended claims.

本出願は、その全体が参照により本明細書に組み込まれる、2016年6月16日に出願された中国特許出願第20160428860.4号の利益を主張する。 This application claims the benefit of Chinese Patent Application No. 20160428860.4 filed June 16, 2016, which is incorporated herein by reference in its entirety.

Claims (21)

共参照解析のための装置であって、
入力医用文書から第1の医用要素と第2の医用要素を取得するように構成された取得手段と、
前記医用文書から、前記第1の医用要素の診断状態、前記第2の医用要素の診断状態、前記第1の医用要素の少なくとも1つの特性、および前記第2の医用要素の少なくとも1つの特性を検出するように構成された診断特徴検出手段と、
前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性を決定するように構成された適合性決定手段と、
前記決定された適合性に基づいて、前記第1の医用要素と前記第2の医用要素は同一の医用対象を示すかを判定するように構成された共参照解析手段と、を有し、
診断状態は、医用文書における診断プロセスにおける医用要素の位置を表し、
特性は、医用文書における医用要素の診断項目を表し、
適合性は、ある医用要素と別の医用要素が同一の医用対象を示す可能性を表す、装置。
A device for co-reference analysis
An acquisition means configured to acquire the first and second medical elements from the input medical document, and
From the medical document, the diagnostic state of the first medical element, the diagnostic state of the second medical element, at least one characteristic of the first medical element, and at least one characteristic of the second medical element. Diagnostic feature detection means configured to detect,
A compatibility determining means configured to determine compatibility between the first medical element and the second medical element based on the detected diagnostic condition and characteristics.
It has a co-reference analysis means configured to determine whether the first medical element and the second medical element indicate the same medical object based on the determined suitability.
The diagnostic status represents the position of the medical element in the diagnostic process in the medical document.
A characteristic represents a diagnostic item of a medical element in a medical document.
Compatibility is a device that represents the possibility that one medical element and another medical element indicate the same medical object.
請求項1に記載された装置であって、1つの医用要素に関して、前記診断特徴検出手段は、
前記医用文書から前記医用要素に関連する予め定義された内容を抽出し、
前記抽出された内容を分析することにより前記医用要素の前記診断状態を識別する、装置。
The device according to claim 1, wherein the diagnostic feature detecting means is for one medical element.
Extracting predefined content related to the medical element from the medical document
A device that identifies the diagnostic state of the medical element by analyzing the extracted content.
請求項1に記載の装置であって、前記適合性決定手段は、
前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性係数を決定するように構成された適合性係数決定手段であって、前記適合性係数は、第1の医用要素と第2の医用要素との間の意味論的競合を表す、手段と、
前記決定された適合性係数に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性を判定するように構成された適合性判定手段と、を有する、装置。
The apparatus according to claim 1, wherein the conformity determining means is used.
A suitability coefficient determining means configured to determine a suitability coefficient between the first medical element and the second medical element based on the detected diagnostic condition and characteristics. The fitness factor represents a means and means that represent the semantic conflict between the first and second medical elements.
An apparatus having a compatibility determining means configured to determine compatibility between the first medical element and the second medical element based on the determined compatibility coefficient.
請求項3に記載の装置であって、前記適合性係数は、
前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および、前記第2の医用要素の前記特性の間の意味論的値の競合、および、
前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および、前記第2の医用要素の前記特性の間の意味論的順序の競合を含む、装置。
The device according to claim 3, wherein the compatibility coefficient is
Semantic values between the diagnostic state of the first medical element, the characteristic of the first medical element, the diagnostic state of the second medical element, and the characteristic of the second medical element. Conflict and
The semantic order between the diagnostic state of the first medical element, the characteristic of the first medical element, the diagnostic state of the second medical element, and the characteristic of the second medical element. Equipment, including conflicts.
請求項4に記載の装置であって、前記適合性係数決定手段は、
前記第1の医用要素と前記第2の医用要素との間の距離、
第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の順序、
前記第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の距離、
前記第1の医用要素と前記第2の医用要素の前記特性の種類、
前記第1の医用要素の前記特性の前記種類と前記第2の医用要素の前記特性の前記種類との間の順序、
種類が前記第1の医用要素と前記第2の医用要素の両方に属する前記特性の値、の特徴のうち少なくとも1つを計算し、
前記計算された特徴および予め定義された規則に基づいて、前記意味論的値の前記競合および前記意味論的順序の前記競合を決定する、装置。
The apparatus according to claim 4, wherein the suitability coefficient determining means is used.
The distance between the first medical element and the second medical element,
The sequence between the diagnostic state of the first medical element and the diagnostic state of the second medical element,
The distance between the diagnostic state of the first medical element and the diagnostic state of the second medical element,
The type of property of the first medical element and the second medical element,
The order between the type of the property of the first medical element and the type of the property of the second medical element,
At least one of the features of the property, of which the type belongs to both the first medical element and the second medical element, is calculated.
A device for determining said conflicts of said semantic values and said conflicts of said semantic order based on the calculated features and predefined rules.
請求項4に記載の装置であって、前記適合性係数決定手段は、
前記第1の医用要素と前記第2の医用要素との間の距離、
第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の順序、
前記第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の距離、
前記第1の医用要素と前記第2の医用要素の前記特性の種類、
前記第1の医用要素の前記特性の前記種類と前記第2の医用要素の前記特性の前記種類との間の順序、
種類が前記第1の医用要素と前記第2の医用要素の両方に属する前記特性の値、の特徴のうち少なくとも1つを計算し、
前記計算された特徴および予め生成されたモデルに基づいて、前記意味論的値の前記競合および前記意味論的競合の前記競合を決定する、装置。
The apparatus according to claim 4, wherein the suitability coefficient determining means is used.
The distance between the first medical element and the second medical element,
The sequence between the diagnostic state of the first medical element and the diagnostic state of the second medical element,
The distance between the diagnostic state of the first medical element and the diagnostic state of the second medical element,
The type of property of the first medical element and the second medical element,
The order between the type of the property of the first medical element and the type of the property of the second medical element,
At least one of the features of the property, of which the type belongs to both the first medical element and the second medical element, is calculated.
A device for determining said competition of the semantic values and said competition of the semantic conflicts based on the calculated features and a pre-generated model.
請求項4に記載の装置であって、前記適合性判定手段は、前記意味論的値と前記意味論的順序が競合しない場合、前記第1の医用要素と前記第2の医用要素は適合性があると判定する、装置。 In the apparatus according to claim 4, when the semantic value and the semantic order do not conflict with each other, the first medical element and the second medical element are compatible with each other. A device that determines that there is. 請求項1に記載の装置であって、前記共参照解析手段は、前記決定された適合性が適合可能である場合に、前記第1の医用要素と前記第2の医用要素は前記同一の医用対象を示すと決定する、装置。 The apparatus according to claim 1, wherein the first medical element and the second medical element are the same medical element when the determined compatibility is compatible. A device that determines to indicate an object. 請求項1に記載の装置であって、更に、
前記医用文書における前記第1と第2の医用要素の間の単語特徴の類似性測度と、前記医用文書における前記第1と第2の医用要素の内容の類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第1の類似性測度を決定するために構成される第1の類似性測度決定手段を有し、
前記第1の類似性測度決定手段が前記第1の医用要素と前記第2の医用要素との間の前記第1の類似性測度が閾値以上であると判断した場合に、前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および前記第2の医用要素の前記特性を検出する、装置。
The device according to claim 1, further
The first is based on a measure of similarity of word features between the first and second medical elements in the medical document and a measure of similarity of the contents of the first and second medical elements in the medical document. Has a first similarity measure determining means configured to determine a first similarity measure between the medical element of the device and the second medical element.
When the first similarity measure determining means determines that the first similarity measure between the first medical element and the second medical element is equal to or greater than a threshold value, the first medical element is used. An apparatus for detecting the diagnostic state of an element, the characteristic of the first medical element, the diagnostic state of the second medical element, and the characteristic of the second medical element.
請求項1に記載の装置であって、更に、
前記医用文書における前記第1と第2の医用要素の間の単語特徴の類似性測度と、前記医用文書における前記第1と第2の医用要素のコンテキストの類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第2の類似性測度を決定するために構成された第2の類似性測度決定手段を有し、
前記共参照解析手段は、前記決定された第2の類似性測度と前記決定された適合性に基づいて、前記第1の医用要素と前記第2の医用要素は前記同一の医用対象を示すかを判断する、装置。
The device according to claim 1, further
The first is based on a measure of similarity of word features between the first and second medical elements in the medical document and a measure of similarity of the context of the first and second medical elements in the medical document. Has a second similarity measure determining means configured to determine a second similarity measure between the medical element and said second medical element.
Does the co-reference analysis means indicate that the first medical element and the second medical element indicate the same medical object based on the determined second similarity measure and the determined compatibility? The device to judge.
情報抽出のための装置であって、
医用文書を取得するように構成された取得手段と、
前記取得された医用文書から少なくとも2つの医用要素を抽出するように構成された医用要素抽出手段と、
前記医用要素のいずれか2つが同一の医用対象を示すかを判定するように構成された、請求項1から10のいずれか1項に従う共参照解析のための前記装置と、
互いに共参照される前記医用要素の前記診断状態と前記特性を統合するように構成された医用要素統合手段を有する、装置。
A device for extracting information
An acquisition method configured to acquire medical documents,
A medical element extraction means configured to extract at least two medical elements from the obtained medical document, and a medical element extraction means.
The apparatus for co-reference analysis according to any one of claims 1 to 10, configured to determine if any two of the medical elements represent the same medical object.
An apparatus having a medical element integration means configured to integrate the diagnostic state and the characteristic of the medical element that are co-referenced to each other.
請求項11に記載された装置であって、前記医用要素統合手段は、前記取得された医用文書における前記医用要素の出現順序に基づいて、互いに共参照される前記医用要素の前記診断状態と前記特性を統合する、装置。 The device according to claim 11, wherein the medical element integrating means has the diagnostic state of the medical element and said, which are co-referenced to each other, based on the order of appearance of the medical element in the acquired medical document. A device that integrates characteristics. 類似文書検索のための装置であって、
前記取得された医用文書から、前記医用要素の前記統合された診断状態と特性を抽出し、履歴医用文書から前記医用要素の前記統合された診断状態と特性を抽出するように構成された、請求項11または12に従う情報抽出のための前記装置と、
前記取得された医用文書から抽出された前記医用要素の前記統合された診断状態と特性と、前記履歴医用文書から抽出された前記医用要素の統合された前記診断状態と特性との間の類似性測度を算出するように構成された類似性測度算出手段と、
前記算出された類似性測度に基づいて、前記履歴医用文書から、取得された医用文書に類似する少なくとも1つの医用文書を検索するように構成された類似文書検索手段と、を有する装置。
A device for searching similar documents
A claim configured to extract the integrated diagnostic state and characteristics of the medical element from the acquired medical document and the integrated diagnostic state and characteristics of the medical element from the history medical document. The apparatus for extracting information according to item 11 or 12, and the apparatus.
Similarities between the integrated diagnostic state and characteristics of the medical element extracted from the acquired medical document and the integrated diagnostic state and characteristics of the medical element extracted from the history medical document. A similarity measure calculation means configured to calculate a measure,
A device comprising a similar document search means configured to search for at least one medical document similar to the acquired medical document from the history medical document based on the calculated similarity measure.
少なくとも1つのサーバと、ネットワークを介して前記サーバに接続された類似文書検索のための装置とにより構成された類似文書検索システムであって、
前記サーバは、履歴医用文書を格納するように構成され、
類似文書検索のための前記装置は、
前記取得された医用文書から、前記医用要素の前記統合された診断状態と特性を抽出し、履歴医用文書から前記医用要素の前記統合された診断状態と特性を抽出するように構成された、請求項11または12に従う情報抽出のための前記装置と、
前記取得された医用文書から抽出された前記医用要素の前記統合された診断状態と特性と、前記履歴医用文書から抽出された前記医用要素の統合された前記診断状態と特性との間の類似性測度を算出するように構成された類似性測度算出手段と、
前記算出された類似性測度に基づいて、前記履歴医用文書から、取得された医用文書に類似する少なくとも1つの医用文書を検索するように構成された類似文書検索手段と、を有する類似文書検索システム。
A similar document retrieval system composed of at least one server and a device for searching similar documents connected to the server via a network.
The server is configured to store historical medical documents.
The device for searching for similar documents is
A claim configured to extract the integrated diagnostic state and characteristics of the medical element from the acquired medical document and the integrated diagnostic state and characteristics of the medical element from the history medical document. The apparatus for extracting information according to item 11 or 12, and the apparatus.
Similarities between the integrated diagnostic state and characteristics of the medical element extracted from the acquired medical document and the integrated diagnostic state and characteristics of the medical element extracted from the history medical document. A similarity measure calculation means configured to calculate a measure,
A similar document search system comprising a similar document search means configured to search at least one medical document similar to the acquired medical document from the historical medical document based on the calculated similarity measure. ..
ソフトウェアの制御によってコンピュータが行う共参照解析のための情報処理方法であって、
取得手段が、入力医用文書から第1の医用要素と第2の医用要素を取得する取得工程と、
診断特徴検出手段が、前記医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出する診断特徴検出工程と、
適合性決定手段が、前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性を決定する適合性決定工程と、
共参照解析手段が、前記決定された適合性に基づいて、前記第1の医用要素と前記第2の医用要素は同一の医用対象を示すかを判定する共参照解析工程と、を含み、
診断状態は、医用文書における診断プロセスにおける医用要素の位置を表し、
特性は、医用文書における医用要素の診断項目を表し、
適合性は、ある医用要素と別の医用要素が同一の医用対象を示す可能性を表す、情報処理方法。
It is an information processing method for co-reference analysis performed by a computer under the control of software.
The acquisition process of acquiring the first medical element and the second medical element from the input medical document, and the acquisition process.
From the medical document, the diagnostic feature detecting means is a diagnostic state of the first medical element, at least one characteristic of the first medical element, a diagnostic state of the second medical element, and at least one of the second medical elements. Diagnostic feature detection process to detect characteristics and
A compatibility determination step in which the compatibility determination means determines the compatibility between the first medical element and the second medical element based on the detected diagnostic condition and characteristics.
The co-reference analysis means includes a co-reference analysis step of determining whether the first medical element and the second medical element indicate the same medical object based on the determined compatibility.
The diagnostic status represents the position of the medical element in the diagnostic process in the medical document.
A characteristic represents a diagnostic item of a medical element in a medical document.
Compatibility is an information processing method that represents the possibility that one medical element and another medical element indicate the same medical object.
請求項15に記載の情報処理方法であって、前記適合性決定工程は、
前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性係数を決定する適合性係数決定工程であって、前記適合性係数は、第1の医用要素と第2の医用要素との間の意味論的衝突を表す、工程と、
前記決定された適合性係数に基づいて、前記第1の医用要素と前記第2の医用要素との間の前記適合性を判定する適合性判定工程と、を含む、情報処理方法。
The information processing method according to claim 15, wherein the conformity determination step is performed.
A compatibility coefficient determination step for determining a compatibility coefficient between the first medical element and the second medical element based on the detected diagnostic condition and characteristics, wherein the compatibility coefficient is a method. A process that represents a semantic conflict between a first medical element and a second medical element,
An information processing method comprising a suitability determination step of determining the suitability between the first medical element and the second medical element based on the determined suitability coefficient.
請求項15に記載の情報処理方法であって、前記共参照解析工程において、前記決定された適合性が適合可能である場合に、前記第1の医用要素と前記第2の医用要素は前記同一の医用対象を示すと決定される、情報処理方法。 The information processing method according to claim 15, wherein the first medical element and the second medical element are the same when the determined compatibility is applicable in the co-reference analysis step. An information processing method that is determined to indicate a medical subject. 請求項15に記載の情報処理方法であって、更に、
第1の類似性測度決定手段が、前記医用文書における前記第1および第2の医用要素の間の単語特徴の類似性測度に基づいて、および、前記医用文書における前記第1および前記第2の医用要素の内容の類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第1の類似性測度を決定する第1の類似性速度決定工程を含み、前記診断特徴検出工程において、前記第1の医用要素と前記第2の医用要素との間の前記第1の類似性測度が前記第1の類似性決定工程における閾値以上であると判定された場合に、前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および前記第2の医用要素の前記特性が検出される、情報処理方法。
The information processing method according to claim 15, further.
The first similarity measure determining means is based on the similarity measure of the word feature between the first and second medical elements in the medical document, and the first and second in the medical document. It comprises a first similarity rate determination step of determining a first similarity measure between the first medical element and the second medical element based on the content similarity measure of the medical element. When it is determined in the diagnostic feature detection step that the first similarity measure between the first medical element and the second medical element is equal to or greater than the threshold in the first similarity determination step. , said diagnostic state of the first medical element, wherein the characteristic of the first medical element, said diagnostic state of the second medical element, and the characteristics of the second medical element is detected, the information processing Method.
請求項15に記載の情報処理方法であって、更に、
第2の類似性測度決定手段が、前記医用文書における前記第1および第2の医用要素の間の単語特徴の類似性測度に基づいて、また、前記医用文書における前記第1および第2の医用要素の内容の類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第2の類似性測度を決定する第2の類似性測度決定工程を含み、前記共参照解析工程において、前記第1の医用要素と前記第2の医用要素は、前記決定された第2の類似性測度および前記決定された適合性に基づいて、同一の医用対象を示すか否かが判定される、情報処理方法。
The information processing method according to claim 15, further.
The second similarity measure determining means is based on the similarity measure of the word feature between the first and second medical elements in the medical document, and the first and second medical use in the medical document. A second similarity measure determining step of determining a second similarity measure between the first medical element and the second medical element based on the content similarity measure of the element is included. In the reference analysis step, whether the first medical element and the second medical element indicate the same medical object based on the determined second similarity measure and the determined compatibility. Information processing method for which is determined.
ソフトウェアの制御によってコンピュータが行う情報抽出のための情報処理方法であって、
取得手段が、医用文書を取得する取得工程と、
医用要素抽出手段が、前記取得された医用文書から少なくとも2つの医用要素を抽出する医用要素抽出工程と、
共参照解析手段が、請求項15から19のいずれか1項に従う前記情報処理方法を用いることにより、前記医用要素のいずれか2つが同一の医用対象を示すか判定する共参照解析工程と、
医用要素統合手段が、互いに共参照される前記医用要素の前記診断状態と前記特性を統合するように構成された医用要素統合工程と、を含む、情報処理方法。
It is an information processing method for information extraction performed by a computer under the control of software.
The acquisition method is the acquisition process for acquiring medical documents,
A medical element extraction step in which the medical element extraction means extracts at least two medical elements from the acquired medical document, and a medical element extraction step.
A co-reference analysis step of determining whether any two of the medical elements indicate the same medical object by using the information processing method according to any one of claims 15 to 19 as the co-reference analysis means.
An information processing method comprising a medical element integration step configured such that the medical element integration means integrates the diagnostic state and the characteristic of the medical element that are co-referenced to each other.
ソフトウェアの制御によってコンピュータが行う類似文書検索のための情報処理方法であって、
情報抽出手段が、請求項20に従う前記情報処理方法を用いることにより、前記取得された医用文書から前記医用要素の前記統合された診断状態と特性を抽出し、履歴医用文書から前記医用要素の前記統合された診断状態と特性を抽出する情報抽出工程と、
類似性速度計算手段が、前記取得された医用文書から抽出された前記医用要素の前記統合された診断状態と特性と、前記履歴医用文書から抽出された前記医用要素の統合された前記診断状態と特性との間の類似性測度を計算する類似性速度計算工程と、
類似文書検索手段が、前記計算された類似性測度に基づいて、前記履歴医用文書から、取得された医用文書に類似する少なくとも1つの医用文書を検索する類似文書検索工程と、を含む情報処理方法。
It is an information processing method for searching similar documents performed by a computer under the control of software.
By using the information processing method according to claim 20 , the information extraction means extracts the integrated diagnostic state and characteristics of the medical element from the acquired medical document, and extracts the integrated diagnostic state and characteristics of the medical element from the history medical document. Information extraction process to extract integrated diagnostic status and characteristics,
The similarity rate calculation means has the integrated diagnostic state and characteristics of the medical element extracted from the acquired medical document and the integrated diagnostic state of the medical element extracted from the historical medical document. The similarity rate calculation process, which calculates the similarity measure between the characteristics, and
An information processing method comprising a similar document search step of searching for at least one medical document similar to the acquired medical document from the history medical document based on the calculated similarity measure. ..
JP2018562274A 2016-06-16 2017-06-15 Equipment for co-reference analysis, information extraction and similar document retrieval, similar document retrieval system and information processing method Active JP6972029B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610428860.4A CN107515851B (en) 2016-06-16 2016-06-16 Apparatus and method for coreference resolution, information extraction and similar document retrieval
CN201610428860.4 2016-06-16
PCT/JP2017/022114 WO2017217489A1 (en) 2016-06-16 2017-06-15 Apparatuses and methods for co-reference resolution, information extraction and similar document retrieval

Publications (2)

Publication Number Publication Date
JP2019522274A JP2019522274A (en) 2019-08-08
JP6972029B2 true JP6972029B2 (en) 2021-11-24

Family

ID=59270075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018562274A Active JP6972029B2 (en) 2016-06-16 2017-06-15 Equipment for co-reference analysis, information extraction and similar document retrieval, similar document retrieval system and information processing method

Country Status (3)

Country Link
JP (1) JP6972029B2 (en)
CN (1) CN107515851B (en)
WO (1) WO2017217489A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284497B (en) * 2017-07-20 2021-01-12 京东方科技集团股份有限公司 Method and apparatus for identifying medical entities in medical text in natural language
CN109359184B (en) * 2018-10-16 2020-08-18 苏州大学 English event co-fingering resolution method and system
US11573994B2 (en) 2020-04-14 2023-02-07 International Business Machines Corporation Encoding entity representations for cross-document coreference
CN111950281B (en) * 2020-07-02 2023-03-21 中国科学院软件研究所 Demand entity co-reference detection method and device based on deep learning and context semantics

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7813916B2 (en) * 2003-11-18 2010-10-12 University Of Utah Acquisition and application of contextual role knowledge for coreference resolution
US7818278B2 (en) * 2007-06-14 2010-10-19 Microsoft Corporation Large scale item representation matching
JP2010538374A (en) * 2007-08-31 2010-12-09 マイクロソフト コーポレーション Resolving the same instructions in an ambiguous natural language processing system
CN101499062B (en) * 2008-01-29 2012-07-04 国际商业机器公司 Method and equipment for collecting entity alias
US8880514B2 (en) * 2010-04-27 2014-11-04 Snu R&Db Foundation Terminology-based system for supporting data object definition
JP5699789B2 (en) * 2011-05-10 2015-04-15 ソニー株式会社 Information processing apparatus, information processing method, program, and information processing system
US8793199B2 (en) * 2012-02-29 2014-07-29 International Business Machines Corporation Extraction of information from clinical reports
CN103577491A (en) * 2012-08-09 2014-02-12 佳能株式会社 Method and device for representing functional entities and carrying out disambiguation on functional entities
US8457950B1 (en) 2012-11-01 2013-06-04 Digital Reasoning Systems, Inc. System and method for coreference resolution
CN103778346B (en) * 2014-02-18 2017-01-25 中国科学院上海技术物理研究所 Medical information processing method and device
CN104572904B (en) * 2014-12-25 2017-12-22 微梦创科网络科技(中国)有限公司 A kind of determination method and device of label correlation degree
CN105184074B (en) * 2015-09-01 2018-10-26 哈尔滨工程大学 A kind of medical data extraction and loaded in parallel method based on Multimodal medical image data model
CN105260457B (en) * 2015-10-14 2018-07-13 南京大学 A kind of multi-semantic meaning network entity contrast table automatic generation method towards coreference resolution

Also Published As

Publication number Publication date
CN107515851A (en) 2017-12-26
CN107515851B (en) 2021-09-10
JP2019522274A (en) 2019-08-08
WO2017217489A1 (en) 2017-12-21

Similar Documents

Publication Publication Date Title
Gonzalez et al. Disease staging and prognosis in smokers using deep learning in chest computed tomography
US10929420B2 (en) Structured report data from a medical text report
JP6972029B2 (en) Equipment for co-reference analysis, information extraction and similar document retrieval, similar document retrieval system and information processing method
US9734297B2 (en) Extraction of information from clinical reports
US8639678B2 (en) System for generating a medical knowledge base
CN111564223B (en) Infectious disease survival probability prediction method, and prediction model training method and device
US11527312B2 (en) Clinical report retrieval and/or comparison
US20170372443A1 (en) Method and apparatus for information analysis
JP6187474B2 (en) Medical information analysis program, medical information analysis apparatus, and medical information analysis method
US20190108175A1 (en) Automated contextual determination of icd code relevance for ranking and efficient consumption
US20180004900A1 (en) Method and apparatus for information analysis
CN111199796A (en) Disease aid decision-making method and device and electronic equipment
CN112115697A (en) Method, device, server and storage medium for determining target text
Aksoy et al. Detection of COVID-19 Disease in Chest X-Ray Images with capsul networks: application with cloud computing
Kotanidis et al. Selfies in cardiovascular medicine: welcome to a new era of medical diagnostics
JP2020204799A (en) Treatment selection support device
EP3467770B1 (en) Method for analysing a medical imaging data set, system for analysing a medical imaging data set, computer program product and a computer-readable medium
CN112329461A (en) Similar medical record determination method, computer equipment and computer storage medium
CN110456976B (en) Method and device for processing inspection sheet, storage medium and electronic device
JP2019512801A (en) Method and apparatus for dividing text
US12094584B2 (en) Document creation support apparatus, document creation support method, and program
JP2021524097A (en) Systems and methods for prioritizing and presenting heterogeneous medical data
CN114201613B (en) Test question generation method, test question generation device, electronic device, and storage medium
US10839299B2 (en) Non-leading computer aided detection of features of interest in imagery
KR20200082062A (en) Method for inferring life pattern and changed factor based on blood test result

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200507

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211102

R151 Written notification of patent or utility model registration

Ref document number: 6972029

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151