JP2019522274A - 共参照解析、情報抽出および類似文書検索のための装置および方法 - Google Patents

共参照解析、情報抽出および類似文書検索のための装置および方法 Download PDF

Info

Publication number
JP2019522274A
JP2019522274A JP2018562274A JP2018562274A JP2019522274A JP 2019522274 A JP2019522274 A JP 2019522274A JP 2018562274 A JP2018562274 A JP 2018562274A JP 2018562274 A JP2018562274 A JP 2018562274A JP 2019522274 A JP2019522274 A JP 2019522274A
Authority
JP
Japan
Prior art keywords
medical
medical element
document
characteristic
diagnostic state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018562274A
Other languages
English (en)
Other versions
JP6972029B2 (ja
Inventor
ビーチュアン ヂャン
ビーチュアン ヂャン
ヤオハイ ファン
ヤオハイ ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2019522274A publication Critical patent/JP2019522274A/ja
Application granted granted Critical
Publication of JP6972029B2 publication Critical patent/JP6972029B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Abstract

本発明は、共参照解析、情報抽出、および類似文書検索のための装置および方法を開示する。共参照解析のための装置は、入力医用文書から第1の医用要素および第2の医用要素を取得するように構成されたユニットと、該医用文書から、該第1の医用要素の診断状態、該第2の医用要素の少なくとも1つの特性、該第2の医用要素の診断状態、および該第2の医用要素の少なくとも1つの特性を検出するように構成されたユニットと、該検出された診断状態および特性に基づいて、該第1の医用要素と該第2の医用要素との間の適合性を決定するように構成されたユニットと、該決定された適合性に基づいて、該第1の医用要素と該第2の医用要素が同一の医用対象を示すか否かを判定するように構成されたユニットを有する。本発明を利用すると、共参照解析の精度が向上する。【選択図】図2

Description

本発明は、自然言語処理(NLP)に関し、特に、例えば、共参照解析(co-reference resolution)、情報抽出および類似文書検索のための装置および方法に関する。
現在、電子医用文書の使用および管理はますます普及している。電子医用文書の管理に基づいて、同様の医用文書検索、診断支援などの、医師に利益をもたらすであろう多くの用途を開発することができる。上記のアプリケーションは、医用文書に対してテキスト情報抽出技術を実行することによって実現される。テキスト情報抽出技術を介して得られた結果の表現は医用要素(言語要素)と呼ばれる。一般に、1つの医用文書内の医用要素はいくつかの異なる医用対象を示すことがあり、医用対象は、具体的な物理的対象(検査結果から診断される異常等)、または抽象的な医学的概念(例えば、医者によって判断される疾患等)であり得る。例えば、いくつかの医用要素は、検査結果から診断された異常(例えば、腫瘍)を示すことがあり、いくつかの医用要素は、患者の疾患などを示すことがある。すなわち、医用文書内の1つの医用対象(例えば腫瘍)に関して、医師は記録するためにいくつかの異なる表現(すなわち医用要素)を使用することができる。
したがって、異なる表現(すなわち2つの異なる医用要素)が同一の医用対象を示すか否かを判断することができる技術があることが必要である。また、共参照解析は重要な技術の1つである。特許文献1には、文書中のこれら2つの候補要素間の単語特徴の類似度および2つの候補要素の文脈(コンテキスト)に基づいて、2つの候補要素の類似性測度(similarity measure)を算出する共参照解決方法が開示されている。そして、これら2つの候補要素の類似性測度が所定の閾値以上である場合、これら2つの候補要素は共参照として決定されるだろう。
しかしながら、医用文書では、表面的に互いに同一または類似しているいくつかの単語特徴は、実際には同一の医用対象を示さないことがある。例えば、医用文書内の単語特徴「腫瘍」は、異なる異常が同じ表現(すなわち単語特徴)を使用することによって記述されることがあるので、異なる異常を示すことがある。加えて、互いに表面的に類似していないいくつかの単語特徴は、実際には同一の医用対象を示すことがある。例えば、医用文書中の単語特徴「腰椎骨折」と「脆弱性骨折」は、同じ異常を示すことがある。なぜなら、1つの異常の異なる側面は、他の読者が混乱しないように、異なる表現(すなわち単語特徴)を用いて記述されるからである。したがって、単語特徴の類似度を使用するのみの共参照解析の精度は低くなる。
米国特許第8457950号明細書
したがって、関連技術の説明において上記に詳述したことを考慮して、本開示は、上記のような問題を解決することを目的とする。
本発明の一態様によれば、共参照解析のための装置が提供され、当該装置は、入力医用文書から第1の医用要素と第2の医用要素を取得するように構成された取得部と、医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出するように構成された検出部と、検出された診断状態と特性に基づいて、第1の医用要素と第2の医用要素との間の適合性を決定するように構成された適合性決定部と、決定された適合性に基づいて第1の医用要素と第2の医用要素が同一の医用対象を示すか否かを判定するように構成された共参照解析部と、を有する。ここで、診断状態は、医用文書において診断プロセスにおける医用要素の位置を表し、特性は、医用文書における医用要素の診断項目を表し、適合性は、医用要素と別の第2の医用要素が同一の医用対象を示す可能性を表す。
本発明を利用すると、共参照解析の精度が向上する。
本発明の更なる特徴と利点は、図面を参照した以下の説明から、明らかになるだろう。
添付の図面は、本明細書に組み込まれ、その一部を構成し、本発明の実施形態を示し、明細書と共に本発明の原理を説明する役割を果たす。
図1は、本発明の実施形態に従う技術を実現することができるハードウェア構成を概略的に示すブロック図である。 図2は、本発明の第1実施形態に従う共参照解析のための装置の構成を示すブロック図である。 図3は、図2における第1実施形態に従う本発明の例示的な入力医用文書を示す図である。 図4は、図2における第1実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図5は、本発明の第2実施形態に従う共参照解析のための装置の構成を示すブロック図である。 図6は、図5における第2実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図7は、本発明の第2の実施形態に従う共参照解析のための装置の構成を示す別のブロック図である。 図8は、図7における第2実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図9は、本発明の第3実施形態に従う情報抽出のための装置の構成を示すブロック図である。 図10は、図9における第3実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図11は、図9における第3実施形態に従う全体処理の手順を概略的に示す別のフローチャートである。 図12は、本発明の第4実施形態に従う類似文書検索のための装置の構成を示すブロック図である。 図13は、図12における第4実施形態に従う全体処理の手順を概略的に示すフローチャートである。 図14は、本発明に従う例示的な類似文書検索システムの構成を示す。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。以下の説明は、本質的に単なる例示および例示であり、本発明およびその用途または使用を限定することを決して意図していないことに留意されたい。実施の形態に記載されている構成要素や工程の相対的な配置、数式、数値は、特に記載がない限り、発明の範囲を限定するものではない。さらに、当業者に知られている技術、方法および装置は詳細には論じられていないかもしれないが、適切な場合には明細書の一部であることが意図されている。
同様の参照番号および文字は、図中の類似の項目を参照しているので、項目が1つの図に定義されると、以下の図について議論する必要はない。
医学的診断において、1つの完全な診断プロセスは、いくつかの診断状態を含むことができる。当該診断状態は、検査結果(例えば、コンピュータ断層撮影(CT)、磁気共鳴映像法(MRI)、血液検査などであり得る)から医学的所見(例えば正常所見および異常所見)を識別する発見状態、診察結果の詳細情報を記述する記述状態、医学的知見に基づいて最初の疑いをする疑い状態、現在の状況と前回の調査結果とを比較する比較状態、現状の理由を分析した理由状態、最終判断を行う判断状態、最終判断ができなかったという情報を記録した遅延判断状態、手術や薬のような治療を提案する治療状態、詳細情報を調べるために更に検査を要求する要求状態、およびその他の診断状態といったものである。ここで、診断状態は、診断プロセスにおける医学的所見の位置を表す。NLP技術分野では、上述の医学的発見は、医用要素と見なすこともできる。ここで、医用要素(すなわち医学的発見)は、医用対象に対応する表現または記録である。そして、医用対象は、具体的な物理的対象(検査結果から診断された異常など)、または抽象的な医学的概念(医師が判断した疾患など)である可能性がある。
医用文書を作成する場合、1つの診断プロセスに関して、上記の診断状態の順序は固定されておらず、上記の診断状態の全てが必要というわけではない。更に、1つの医用文書において、検査結果から診断された患者の医学的所見(すなわち医用要素)を記録することができ、その患者に対する医師の考慮事項および/または判断を記録することができる。また、患者に対する他の必要な治療および/または検査を記録することもできる。すなわち、任意の診断状態に対応する内容を一つの医用文書に記録することができる。
更に、1つの診断状態では、1つの医用対象の詳細な情報(異なる態様など)を記述するために、複数の異なる表現を記録することができる。例えば、発見状態では、1つの腫瘍の詳細情報を記述するために複数の異なる表現を記録することができる。更に、異なる診断状態の間で、1つの医用対象も数回記録される可能性がある。例えば、1つの表現を、発見状態における1つの腫瘍の詳細情報を記述するために記録することができ、1つの異なる表現を、判定状態における腫瘍のレベルを記述するために記録することができ、次に他の1つの別の表現を、更なる診断状態のために腫瘍の検査を続けるための他の要求を記述するために記録することができる。すなわち、1つの医用対象は、1つの診断状態でも異なる診断状態でも、1つの医用文書内でいくつかの異なる表現(すなわち、いくつかの異なる医用要素)を使用することによって記述することができる。
上述したように、医用文書の構造は複雑である。一方、本発明者らは、医用文書の記述基準に基づいて医用要素の間に一定の適合性(互換性)が存在し、これらの医用要素が互いに適合性がある場合、医用要素は同一の医用対象を示すべきであることを見出した。1つの例では、異なる診断状態のうち、1つの診断プロセスが完了していない場合、1つの先行する診断状態において既に記載されている1つの医用対象は、他の後続の診断状態において依然として記載され、したがって、異なる診断状態の間で記録されたこれらの記述(すなわち、医用要素)は適合性があり、同一の医用対象を示す。他の例では、1つの診断状態において、1つの医用対象の記述が完了していない場合、この医用対象の他の記述はこの診断状態で記録され続け得る。よって、この診断状態において記録されたこれらの記述は適合性があり、同一の医用対象を示す。当然、1つの医用対象の記述がいくつかの診断状態で記録されるが診断プロセス全体では記録されない場合、および/または、1つの診断状態における記述が完全でない1つの医用対象の他の記述がこの診断状態で記録し続けることができない場合もある。
一方、本発明は、1つの医用文書における全診断プロセスを処理することを目的とするのではなく、入力医用文書における2つの医用要素間の適合性を識別することを目的とする。ここで、入力医用文書は、医用文書の一部または医用文書の全体であり得る。すなわち、本発明において、現在の医用要素の記述が完全ではない場合、または、現在の医用要素の診断状態が最終診断状態ではない場合、他の医用要素は現在の医用要素と適合性がある可能性がある。
[ハードウェア構成]
まず、図1を参照して、以下に説明する技術を実現することが可能なハードウェア構成について説明する。図1は、本発明の実施形態に従う技術を実現することができるハードウェア構成100を概略的に示すブロック図である。
ハードウェア構成100は、例えば、中央処理ユニット(CPU)110、ランダムアクセスメモリ(RAM)120、読み取り専用メモリ(ROM)130、ハードディスク140、入力装置150、出力装置160、ネットワークインタフェース170、およびシステムバス180を含み得る。更に、ハードウェア構成100は、パーソナルデータアシスタント(PDA)、携帯電話、ラップトップ、デスクトップ、タブレットコンピュータ、またはその他の適切な電子装置等により実装され得る。
CPU110は、任意の適切なプログラム可能制御装置とすることができ、ROM130またはハードディスク140に格納されているさまざまなアプリケーションプログラムを実行することによって、後述するさまざまな機能を実行することができる。RAM120は、ROM130またはハードディスク140からロードされたプログラムまたはデータを一時的に格納するために使用されるとともに、CPU110が、図2〜図14を参照して以下に詳細に説明する開示技術並びに他の利用可能な機能を実行するといった、各種プログラムを実行するための空間としても使用される。ハードディスク140は、オペレーティングシステム(OS)、様々なアプリケーション、制御プログラム、および製造者またはユーザによって予め記憶または設定されたデータなど、多くの種類の情報を記憶することができる。ここで、データは、例えば以下に記載される、履歴医用文書、閾値(TH)、規則またはモデルであり得る。
1つの実施形態では、入力装置150は入力インタフェースとすることができ、例えば画像取得装置から出力される医用文書の画像を受け取ることができる。ここで、画像取得装置は、例えば、カメラ、デジタルカメラまたは他の適切な電子装置とすることができる。また、出力装置160は、出力インタフェースとすることができ、処理結果を後述する、続いて起こるオペレーションに出力することができる。
別の実施形態では、入力装置150は、ユーザが入力装置150を介して、医用要素、医用文書、または医用文書の画像を入力することができるなど、ハードウェア構成100を実装する電子装置と相互作用することをユーザに可能にする。また、入力装置150は、ボタン、キーパッド、ダイヤル、クリックホイール、またはタッチスクリーンなどの様々な形態をとることができる。出力装置160は、陰極線管(CRT)または液晶ディスプレイを含むことができ、処理結果をユーザに表示することができる。また、ハードウェア構成100を実施する電子装置が、いわゆる、インテリジェント携帯電話、PDA、タブレットコンピュータ、または他の適切な電子装置などの装置である場合、入力装置150および出力装置160を一体的に組み込むことができる。また、ハードウェア構成100を実施する電子装置が、いわゆる、インテリジェント携帯電話、PDA、タブレットコンピュータ、または他の適切な電子装置などの装置である場合、入力装置150および出力装置160を一体的に組み込むことができる。
ネットワークインタフェース170は、ハードウェア構成100を実現する電子装置(図14に示す電子装置1410など)をネットワーク(図14に示すネットワーク1420など)に接続するためのインタフェースを提供する。例えば、ハードウェア構成100を実施する電子装置は、ネットワークインタフェース170を介して、ネットワークを介して接続された他の電子装置(図14に示すサーバ1430など)とのデータ通信を実行することができる。あるいは、無線データ通信を実行するためにハードウェア構成100を実施する電子装置に無線インタフェースを提供することができる。システムバス180は、CPU110、RAM120、ROM130、ハードディスク140、入力装置150、出力装置160、およびネットワークインタフェース170等との間で、互いにデータを転送するためのデータ転送経路を提供することができる。バスと呼ばれるが、システムバス180はいかなる特定のデータ転送技術にも限定されない。
上記のハードウェア構成と同じ機能を実現するソフトウェアを代わりに使用することができる。
共参照解析といった、本発明の1つの実施形態の例において、図4、図6、図8を参照することによって後述する本実施形態のプログラムは、予めハードディスク140にインストールしておき、CPU110が本実施形態のプログラムを実行する必要がある際にRAM120にロードすることもできる。他の例では、本実施形態のプログラムは、メモリマップの一部としてROM130に記録し、CPU110によって直接実行することができる。また、情報の抽出や類似文書の検索など、図10〜図11、および図13を参照して後述する他の実施形態のプログラムも、同様な手法で格納し実行することができる。
上述のハードウェア構成100は単なる例示であり、決して本発明、その用途、または使用を限定することを意図するものではない。また、簡単化のために、図1には1つのハードウェア構成しか示されていない。しかしながら、必要に応じて複数のハードウェア構成を使用することも可能である。
[適合性を用いる共参照解析のための装置の構成]
共参照解析のための構成を図2を参照して次に説明する。図2は、本発明の第1実施形態に従う共参照解析のための装置200の構成を示すブロック図である。
図2に示すブロックは、図1を参照して上述したCPU110として実装され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。
図2に示すように、本発明の第1実施形態に従う共参照解析のための装置200は、取得部210と、診断特徴検出部220と、適合性決定部230と、共参照解析部240とを備える。
上述したように、第1に、図1に示す入力装置150は、ユーザ(例えば医師)によって入力される医用文書を受け取るであろう。ここで、医用文書は、医用文書の一部または医用文書全体であり得る。そして更に、入力装置150は、ユーザによって医用文書から選択された第1の医用要素および第2の医用要素を受け取ることになる。第2に、入力装置150は、システムバス180を介して、受信した医用文書、第1の医用要素、および第2の医用要素を、取得部210に転送する。
上述のように、第1の医用要素と第2の医用要素はユーザによって選択される。代替の解決策として、既存のテキスト情報抽出技術を使用することによって、CPU110により受信された医用文書からそれらを抽出することもできる。例えば、CPU110により受信された受信した医用文書から複数の医用要素を抽出することができ、その後、任意の2つの医用要素を第1の医用要素および第2の医用要素と見なすことができる。
なお、上記医用文書はテキスト形式である。しかしながら、医用文書は画像フォーマットでもあり得る。例えば、入力装置150は、ユーザによって入力された、または画像取得装置から出力された医用文書の画像を受け取ることができる。入力装置150が医用文書の画像を受信した後、入力装置150は受信した医用文書の画像をシステムバス180を介してCPU110に転送する。そして、CPU110は、例えば既存の光学式文字認識(OCR)技術を使用することによって医用文書を画像フォーマットからテキストフォーマットに変換する。そして、第1の医用要素と第2の医用要素は、入力装置150を介してユーザによって変換医用文書から選択されるか、またはテキスト情報抽出技術を使用することによってCPU110によって変換医用文書から抽出されることができる。
本発明をより理解し易くするために、医用文書の一部である例示的な入力医用文書を図3に示す。ここでは医用文書は例えば日本語で記録されている。図3に示されるように、破線の楕円によって示される用語「結節」(すなわち、「結節」310、「結節」320、「結節」330、および「結節」340)は、上述の医用要素であり、これらの「結節」のうちの任意の2つは、上述した第1の医用要素と第2の医用要素と見なすことができる。ここで、「結節」は「noodle」を意味する。
図2に戻ると、第1に、取得部210は、システムバス180を介して入力装置150から第1の医用要素、第2の要素、および医用文書を取得する。
第2に、診断特徴検出部220は、医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出する。ここで、診断状態は、医用文書における診断プロセスにおける医用要素の位置を表し、特性は、医用文書における医用要素の診断項目を表し、診断項目は、診断を行うための医師が関心のある項目を表す。
上述したように、診断状態は、発見状態、記述状態、疑い状態、比較状態、理由状態、遅延判定状態、処置状態、および要求状態などの上述の診断状態のうちの少なくとも1つを含む。そして、特性は、少なくとも診断項目に対応する特性の種類と診断項目のパラメータに対応する特性の値とを含む。更に、特性の種類は、検査指標(サイズ、形状、位置、レベルおよび数値指標等)、医学用語集(検査、疾患、治療、薬物等)、診断アサーション(極性、原因等)のうちの少なくとも1つを含む。ここで、上記の極性は、例えば、陰性の極または陽性の極であり、上記の原因は、例えば、生活習慣または外傷によって異常が引き起こされることを表す。
例えば、第1の医用要素を例にとると、第1の医用要素がどの診断状態に属するかを識別するために、まず、診断特徴検出部220は、医用文書から第1の医用要素に関連する予め定義された内容(コンテンツ)を抽出することができる。予め定義された内容は、例えば実際の用途または経験に従って、あるいは各診断状態の記述基準に従って製造者またはユーザによって予め定義され得る。そして、予め定義された内容は、医用文書における医学的診断を行うことを支援することができる内容である。第2に、診断特徴検出部220は、抽出された内容を分析することにより、第1の医用要素の診断状態を識別することができる。例えば、第1の医用要素の診断状態は、予め生成された規則に従って抽出された内容を分析することによって、または予め生成されたモデルに従って抽出された内容を分類することによって識別され得る。ここで、予め生成された規則および予め生成されたモデルは、各診断状態の複数の発現サンプルに基づいて生成することができる。
例えば、図3に示す医用要素「結節」310を例にとると、診断特徴検出部220により抽出される内容は、「末梢」、「直径」、「cm」、「認められる」であり、診断特徴検出部220により識別された医用要素「結節」310の診断状態は発見状態である。ここで、「末梢」は「terminal」を意味し、「直径」は「diameter」を意味し、「cm」は長さの尺度であり、そして「認められる」は「be found」ことを意味する。
そして、第1の医用要素についてどのような情報が記録されているかを識別するために、一例として、診断特徴検出部220は、テンプレートに基づく情報抽出またはトレーニング言語コーパスに基づく情報抽出といった既存のNLP技術に従って、第1の医用要素の特性(特性の種類および/または特性の値など)をさらに抽出することができる。例えば、図3に示す医用要素「結節」310を連続的に取り上げると、診断特徴検出部220により抽出された医用要素「結節」310の特性は、「位置:右肺S4」、「サイズ:2.5cm」、「極性:陽極」である。ここで、抽出された「位置」、「サイズ」および「極性」は、特性の種類であり、抽出された「右肺S4」、「2.5cm」および「陽性」は、特性の値である。
上述のように、診断状態および医用要素の特性は全て、1つのユニット、すなわち診断特徴検出部220によって検出される。しかしながら、診断状態および医用要素の特性は、異なるユニットによっても検出され得る。図2に示すように、オプションの解決策として、診断状態識別部221によって医用要素の診断状態を識別することができ、特性抽出部222によって医用要素の特性を抽出することができる。
図2に戻り、診断特徴検出部220が第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および第2の医用要素の特性を検出した後、適合性決定部230は、検出された診断状態および特性に基づいて、第1の医用要素と第2の医用要素との間の適合性を決定(判定)する。ここで、適合性は、ある医用要素と別の医用要素が同一の医用対象を示す可能性を表す。そして、好適な解決策として、適合性決定部230は、適合性係数決定部231と、適合性判定部232とを更に有してもよい。
まず、適合性係数決定部231は、検出された診断状態および特性に基づいて、第1の医用要素と第2の医用要素との間の適合性係数を決定する。ここで、適合性係数は、第1の医用要素と第2の医用要素との間の意味論的競合を表す。一例として、適合性係数は、第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および、第2の医用要素の特性の間の意味論的値の競合を含み、第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および、第2の医用要素の特性の間の意味論的順序(シーケンス)の競合を含む。
例えば、第1医用要素の診断状態と第2医用要素の診断状態とが同じ診断状態にある場合、第1医用要素の特性の種類と第2医用要素の特性の種類とが異なり、第1の医用要素と第2の医用要素との間の距離が小さければ、第1の医用要素と第2の医用要素との間の意味論的値は競合しない。あるいは、第1の医用要素の診断状態と第2の医用要素の診断状態とが異なる診断状態にある場合、第1の医用要素の特定の種類の特性と第2の医用要素の特定の種類の要素が同じであって、これらの特性の値が同じであり、また、第1の医用要素と第2の医用要素との間の距離が小さい場合、第1の医用要素と第2の医用要素との間の意味論的値は競合しない。
更に、第1の医用要素の診断状態と第2の医用要素の診断状態とが連続的に接続されている場合、または第1の医用要素の特性と第2の医用要素の特性とが連続的に接続されている場合、得られた意味論的意味が競合しなければ(すなわち、連続する接続が医用文書の記述基準を満たせば)、第1の医用要素と第2の医用要素との間の意味論的順序は競合しない。
そして、適合性係数決定部231が第1の医用要素と第2の医用要素との間の適合性係数を決定した後、適合性判定部232は、決定された適合性係数に基づいて第1の医用要素と第2の医用要素との間の適合性を判定する。また、適合性判定部232は、例えば、意味論的値と意味論的順序とが競合しない場合、第1の医用要素と第2の医用要素とが適合性があると判定する。
1つの例では、適合性係数決定部231は、以下のステップに従って適合性係数を決定することができる。
第1に、適合性係数決定部231は、以下の特徴のうちの少なくとも1つを計算するであろう。
1)第1の医用要素と第2の医用要素との間の距離。ここで、この距離は、例えば、第1の医用要素と第2の医用要素との間の文の距離に基づいて決定することができる。そして、距離が小さいほど、第1の医用要素と第2の要素は、同一の医用対象を示す可能性が高い。例えば、第1の医用要素に関連する文と第2の医用要素に関連する文が互いに隣接する場合(すなわち、距離はゼロ)、第1の医用要素と第2の医用要素は、同じ医用対象を示す可能性が高い。
2)第1の医用要素の状態と第2の医用要素の状態との間の順序。
3)第1の医用要素の診断状態と第2の医用要素の診断状態との間の距離。ここで、この距離は、例えば、第1の医用要素の診断状態と第2の医用要素の診断状態との間の文の距離に基づいて決定することができる。そして、距離が小さいほど、第1の医用要素と第2の要素は、同一の医用対象を示す可能性が高い。例えば、第1の医用要素の診断状態と第2の医用要素の診断状態が互いに隣接する場合(すなわち、距離はゼロ)、第1の医用要素と第2の医用要素は、同じ医用対象を示す可能性が高い。
4)第1の医用要素と第2の医用要素の特性の種類。
5)第1の医用要素の特性の種類と第2の医用要素の特性の種類との間の順序。
6)種類が第1の医用要素と第2の医用要素の両方に属する特性の値。
第2に、適合性係数決定部231は、算出された特徴および予め定義された規則に基づいて、意味論的値の競合および意味論的順序の競合を決定するであろう。
医用文書の記述基準を通して、医用文書における医用要素は、特定の規律を満たすことがわかる。1つの例において、2つの医用要素が同じ診断状態にある場合、これらの2つの医用要素に適合性があれば(すなわち、これらの2つの医用要素が同一の医用対象を示すのであれば)、上述の極性の種類を除いて、これら2つの医用要素の特性の種類は異なるべきである(すなわち、これら2つの医用要素の内容は、同一の医用対象の異なる側面である可能性が高い)。別の例において、2つの医用要素が同じ診断状態にある場合、これらの2つの医用要素に適合性があれば(すなわち、これらの2つの医用要素が同一の医用対象を示すのであれば)、これら2つの医用要素の特定の種類の特性は同じであるべきである(例えば、これら2つの医用要素の位置は同じとなるべきである)。したがって、予め定められた規則は、第1の医用要素と第2の医用要素とが同じ診断状態にあるときの特徴の競合する条件と、第1の医用要素と第2の医用要素とが異なる診断にあるときの特徴の競合する条件とを少なくとも含むことができる。更に、予め定義された規則は、例えば経験または統計的トレーニングに従って製造者またはユーザによって予め設定され得る。
一例として図3に示される医用要素「結節」310および医用要素「結節」320を取り上げ、医用要素「結節」310を第1の医用要素と見なし、医用要素「結節」320を第2の医用要素と見なす。上述したように、診断特徴検出部220は、それぞれ、診断状態と医用要素「結節」310と医用要素「結節」320の診断状態と特性とを検出するので、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」320が同じ診断状態にあることを、容易に判断することができる。また、診断特徴検出部220により抽出された医用要素「結節」310の特性は、「位置:右肺S4」、「サイズ:直径2.5cm」、「極性:陽性」であり、診断特徴検出部220により抽出された医用要素「結節」320の特性は、「形状:不整形」、「極性:陽性」である。ここで、「不整形」は「irregular」を意味する。
医用要素「結節」310と医用要素「結節」320の特性によれば、医用要素「結節」310および医用要素「結節」320が1つの同じ種類の特性(すなわち「極性」)を有し、この同じ種類の特性の値が同じ(すなわち陽性)であることは容易に分かる。更に、図3に示されるように、医用要素「結節」310に関連する文と、医用要素「結節」320に関連する文は、互いに隣接しているので、医用要素「結節」310と医用要素「結節」320との間の距離は例えばゼロと計算され得る。したがって、予め定義された規則に従えば、医用要素「結節」310と医用要素「結節」320の他の種類の特性は、極性の種類および医用要素「結節」310と医用要素「結節」320との間の距離が非常に小さいことを除いて異なるので、適合性係数部231は、医用要素「結節」310と医用要素「結節」320との間の意味論的値が競合していないと判断し得る。また、医用要素「結節」310と医用要素「結節」320の特性の種類が連続的に接続されていれば(すなわち、「位置」→「サイズ」→「極性」→「形状」→「極性」)、取得された意味論的意味は、競合しない(すなわち、連続的な接続は医用文書の記述基準を満たす)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」320との間の意味論的順序は競合しないと決定する。
そして、適合性判定部232は、意味論的順序とそれらの間の意味値とが競合しないため、医用要素「結節」310と医用要素「結節」320とは適合性があると判定する。
更に、他の例として図3に示される医用要素「結節」310および医用要素「結節」330を取り上げ、医用要素「結節」310を第1の医用要素と見なし、医用要素「結節」330を第2の医用要素と見なす。医用要素「結節」310と医用要素「結節」330の検出された診断状態によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」330が同じ診断状態にあることを、容易に判断することができる。そして、診断特徴検出ユニット220によって抽出された医用要素「結節」330の特性は、「場所:縦隔」、「サイズ:1cm」、および「極性:陽性」である。ここで「縦隔」は「mediastinum」を意味する。
医用要素「結節」310および医用要素「結節」330の特性によれば、医用要素「結節」310および医用要素「結節」330は、3つの同じ種類の特性(すなわち、「位置」、「サイズ」および「極性」)を有することが容易に分かる。更に、図3に示されるように、医用要素「結節」310に関連する文と、医用要素「結節」330に関連する文との間に3つの文が存在するので、医用要素「結節」310と医用要素「結節」330との間の距離は例えば3と計算され得る。したがって、予め定義された規則によれば、医用要素「結節」310と医用要素結節330の特性のいくつかの種類は同じであり(例えば、「位置」と「サイズ」)、医用要素「結節」310と医用要素「結節」330との間の距離が小さくないので、適合性係数部231は、医用要素「結節」310と医用要素「結節」330との間の意味論的値が競合していると判断し得る。また、医用要素「結節」310と医用要素「結節」330の特性の種類が連続的に接続されていれば(すなわち、「位置」→「サイズ」→「極性」→「形状」→「極性」)、取得された意味論的意味は、競合する(すなわち、連続的な接続は医用文書の記述基準を満たさない)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」330との間の意味論的順序は競合すると決定する。
そして、適合性判定部232は、それらの間の意味論的順序と意味論的値とが競合するため、医用要素「結節」310と医用要素「結節」330とは適合性がないと判定する。
また、別の例として、図3に示される医用要素「結節」310および医用要素「結節」34を取り上げ、医用要素「結節」310を第1の医用要素と見なし、医用要素「結節」340を第2の医用要素と見なす。医用要素「結節」310と医用要素「結節」340の検出された診断状態によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」340が異なる診断状態にあることを、容易に判断することができる。ここで、医用要素「結節」310は発見状態にあり、医用要素「結節」340は比較状態にある。そして、診断特徴検出部220により抽出された医用「結節」340の特性は、「場所:縦隔」、「対象:前回」、「傾向:増大」であり、ここで、「前回」は「last time」、「増大」は「enlarge」を意味する。
医用要素「結節」310と医用要素「結節」340の特性によれば、医用要素「結節」310および医用要素「結節」340が1つの同じ種類の特性(すなわち「極性」)を有し、この同じ種類の特性の値が異なることは容易に分かる。更に、図3に示されるように、医用要素「結節」310に関連する文と医用要素「結節」340に関連する文との間には5つの文が存在するため、医用要素「結節」310と医用要素「結節」340との間の距離は、例えば5と計算され得る。したがって、予め定義された規則によれば、医用要素「結節」310と医用要素「結節」340とで種類が同じ特性の値が異なり、医用要素「結節」310と医用要素「結節」340との間の距離が大きいため、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」340との間の意味論的値が競合すると判断する。さらに、医用要素「結節」310および医用要素「結節」340の診断状態が連続的に接続されている場合(すなわち、「発見状態」→「比較状態」)、取得された意味論的意味は競合しない(すなわち、連続的接続は、医用文書の記述基準を満たすか、または医用要素「結節」310と医用要素「結節」340の診断状態間の距離がゼロである)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」310と医用要素「結節」340との間の意味論的順序は競合しないと決定する。
そして、適合性判定部232は、それらの間の意味論的値が競合する、医用要素「結節」310と医用要素「結節」340とは適合性がないと判定する。
また、別の例として、図3に示される医用要素「結節」330および医用要素「結節」340を取り上げ、医用要素「結節」330を第1の医用要素と見なし、医用要素「結節」340を第2の医用要素と見なす。医用要素「結節」330と医用要素「結節」340の検出された診断状態によれば、適合性係数決定部231は、医用要素「結節」330と医用要素「結節」340が異なる診断状態にあることを、容易に判定することができる。ここで、医用要素「結節」330は発見状態にあり、医用要素「結節」340は比較状態にある。
医用要素「結節」330と医用要素「結節」340の特性によれば、医用要素「結節」330および医用要素「結節」340が1つの同じ種類の特性(すなわち「極性」)を有し、この同じ種類の特性の値が同じ(すなわち陽性)であることは容易に分かる。更に、図3に示されるように、医用要素「結節」330に関連する文と医用要素「結節」340に関連する文との間には1つの文が存在するため、医用要素「結節」330と医用要素「結節」340との間の距離は、例えば1と計算され得る。したがって、予め定義された規則によれば、医用要素「結節」330と医用要素「結節」340とで種類が同じ特性の値が同じで、医用要素「結節」330と医用要素「結節」340との間の距離が小さいため、適合性係数決定部231は、医用要素「結節」330と医用要素「結節」340との間の意味論的値が競合しないと判断する。更に、医用要素「結節」330および医用要素「結節」340の診断状態が連続的に接続されている場合(すなわち、「発見状態」→「比較状態」)、取得された意味論的意味は競合しない(すなわち、連続的接続は、医用文書の記述基準を満たすか、または医用要素「結節」330と医用要素「結節」340の診断状態間の距離がゼロである)。したがって、予め定義された規則によれば、適合性係数決定部231は、医用要素「結節」330と医用要素「結節」340との間の意味論的順序は競合しないと決定する。
そして、適合性判定部232は、それらの間の意味論的順序と意味論的値とが競合しないため、医用要素「結節」330と医用要素「結節」340とは適合性があると判定する。
更に、上述の例は、計算された特徴が予め定義された規則に従って競合しているかどうかを判定することによって、第1の医用要素と第2の医用要素との間の適合性を判定する。一方、第1の医用要素と第2の医用要素との間の適合性は、予め定義された規則に従って、計算された特徴の競合度に基づいて、適合性スコア(Compatibility score)を計算することによっても判断することができる。1つの例では、第1の医用要素と第2の医用要素が同じ診断対象にある場合、適合性係数決定部231は、以下の式に従って、それらの間の適合性スコアを計算し得る。
Figure 2019522274
ここで、
Figure 2019522274
は、第1および第2の医用要素の特性の種類の総数に対する同じ種類の特性の数の比率を表し、
Figure 2019522274
は、値が第1および第2の医用要素の特性の種類の総数と異なる、同じ種類の特性の数の比率を表し、
Figure 2019522274
は、第1および第2の医用要素における特性の種類の総数に対する、意味論的順序が異常である特性の種類の数の比率を表し、
Figure 2019522274
は、診断状態にある文の総数に対する、第1の医用要素と第2の医用要素との間の文の距離の比率を表し、Wtype、 Wvalue、 Wsequence、 Wsentence distanceは、例えば経験に従って製造者またはユーザによって予め設定された所定の重みを表す。
そして、適合性判定部232は、計算された適合性スコアが予め定義された閾値以上である場合、第1の医用要素と第2の医用要素は適合性があるがあると判断し得る。ここで、予め定義された閾値は、例えば、経験にしたがって、製造者またはユーザにより予め設定され得る。
別の例では、第1の医用要素と第2の医用要素が異なる診断対象にある場合、適合性係数決定部231は、以下の式に従って、それらの間の適合性スコアを計算し得る。
Figure 2019522274
ここで、
Figure 2019522274
は、第1および第2の医用要素の特性の種類の総数に対する、値が異なる同じ種類の特性の数の比率を表し、
Figure 2019522274
は、診断プロセス全体における状態の総数に対する、第1および第2の医用要素第1および第2の医用要素において意味論的順序が異常である状態の数の比率を表し、
Figure 2019522274
は、診断プロセス全体における文の総数に対する、第1の医用要素と第2の医用要素の間の文の距離の比率を表し、
Figure 2019522274
は、診断プロセス全体における状態の総数に対する、第1の医用要素と第2の医用要素との間の状態距離の比率を表し、Wvalue、 Wsequence、 Wsentence distance、 Wstate distanceは、例えば経験に従って製造者またはユーザによって予め設定された所定の重みを表す。
そして、適合性判定部232は、計算された適合性スコアが予め定義された閾値以上である場合、第1の医用要素と第2の医用要素は適合性があると判定し得る。ここで、予め定義された閾値は、例えば、経験にしたがって、製造者またはユーザにより予め設定され得る。
上述したように、適合性係数決定部231は、予め定義された規則に従って、適合性係数を決定する。代替の解決策として、適合性係数決定部231はまた、以下のステップに従って適合性係数を決定し得る。
第1に、適合性係数決定部231は、上述の特徴のうちの少なくとも1つを計算するであろう。
第2に、適合性係数決定部231は、予め生成されたモデルに基づいて意味論的値の競合および意味論的順序の競合を決定するであろう。ここで、予め生成されたモデルは、第1の医用要素と第2の医用要素とが同じ診断状態にあるときの特徴に対するモデルと、第1の医用要素と第2の医用要素とが異なる診断状態にあるときの特徴に対するモデルとを少なくとも含む。更に、予め生成されたモデルは、例えば統計的トレーニングに従って製造者によって予め生成され得る。予め生成されたモデルに基づいて決定された適合性係数の運用は、予め定義された規則に基づいて決定された適合性係数の上述の運用と類似しているため、詳細な説明はここでは繰り返さない。
図2に戻り、適合性決定部230が第1の医用要素と第2の医用要素との間の適合性を決定した後、共参照解析部240は、第1の医用要素と第2の医用要素が同一の医用対象を示すか否かを、決定した適合性に基づいて判定する。そして更に、共参照解析部240は、決定された適合性が適合可能である場合に、第1の医用要素と第2の医用要素は同一の医用対象を示すと決定し得る。
上述した例を参照すると、図3に示すように、医用要素「結節」310と医用要素結節は互いに適合性があり、医用要素「結節」310と医用要素「結節」330は互いに適合性がなく、医用要素「結節」310と医用要素「結節」340は互いに適合性がなく、医用要素「結節」330と医用要素「結節」340は互いに適合性がある。したがって、共参照解析部240は、医用要素「結節」310と医用要素「結節」320とが1つの同一の結節を示し、医用要素「結節」330と医用要素「結節」340は別の同一の結節を示すと判断する。
上述したように、本発明は、2つの医用要素が互いに共参照されるかを、それらの間の適合性に基づいて決定する。適合性は、一定の制約条件を満たす一連の特徴(医用文書の記述基準など)が互いに競合しないようにするべきであると説明でき、そうでなければ一連の特徴は互いに適合性がない。すなわち、2つの医用要素に関連する特徴が競合しない場合、これらの2つの医用要素は適合性がある(すなわち、これらの2つの医用要素は同一の医用対象を示す)。更に、本発明は、医用文書の記述基準に基づいて2つの医用要素に関連する特徴間の競合を意味論的に決定するので、記述が表面的に互いに類似していない医用要素も正確に処理することができる。したがって、本発明により共参照解析の精度が向上する。
[全体処理1]
図4を参照して、図2における第1実施形態の構成により実行される全体処理について説明する。図4は、図2における第1実施形態に従う全体処理の手順を概略的に示すフローチャート400である。
上述したように、第1に、図1に示される入力装置150は、ユーザによって入力されるかまたは画像取得装置から出力される医用文書を受信する。ここで、医用文書は医用文書の一部または医用文書全体であり得る。更に、医用文書が画像フォーマットである場合には、CPU110は、入力装置150からシステムバス180を介して医用文書を受け取り、最初に医用文書を画像フォーマットからテキストフォーマットに変換する。
そして更に、入力装置150は、ユーザによって医用文書から選択された、または既存のテキスト情報抽出技術を使用することによりCPU110によって抽出された第1の医用要素と第2の医用要素を受信する。第2に、入力装置150は、システムバス180を介して、受信した医用文書、第1の医用要素、および第2の医用要素を、図2に示される取得部210に転送する。
そして、図4に示すように、取得ステップS410において、取得部210は、システムバス180を介して入力装置150から第1の医用要素、第2の医用要素、および医用文書を取得する。
診断特徴検出ステップS420において、診断特徴検出部220は、医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出する。
適合性係数決定ステップS430において、適合性決定部230は、検出された診断状態および特性に基づいて、第1の医用要素と第2の医用要素との間の適合性係数を決定する。
適合性判定ステップS440において、適合性決定部230は、決定された適合性係数に基づいて、第1の医用要素と第2の医用要素との間の適合性を判定する。
そして、第1の医用要素と第2の医用要素とが適合性がある場合、共参照解析ステップS450において、共参照解析部240は、第1の医用要素と第2の医用要素が同一の医用対象を示すと判断する。そうでなければ、共参照解析ステップS460において、共参照解析部240は、第1の医用要素と第2の医用要素とが同一の医用対象を指し示していないと判断する。
そして最後に、共参照解決部240は、処理結果をユーザに表示するために、または、情報抽出等といった、以下に説明する、続いて起こるオペレーションのために、システムバス180を介して共参照解決を図1に示す出力装置160に転送する。
[類似度と適合性を用いた共参照解析のための装置の構成]
第1の実施形態において説明したように、図2に示した共参照解析のための装置200は、第1の医用要素と第2の医用要素との間の適合性を使用することによってのみ、第1の医用要素と第2の医用要素が同一の医用対象を示すかどうかを決定する。しかしながら、本発明はまた、第1の医用要素と第2の医用要素との間の類似性の測度および適合性を使用することにより、共参照解析を実行することもできる。本実施形態では、図5および図7を参照して、類似性測度および適合性を用いて共参照解析を行う共参照のための装置の構成について次に説明する。本実施形態の共参照解析のための装置は、図1に説明したものと同じハードウェア構成を有する。
図5は、本発明の第2実施形態に従う共参照解析のための装置500の構成を示すブロック図である。
図5に示すブロックは、図1を参照して上述したCPU110として実現され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。
図5を図2と比較すると、図5に示す共参照解析のための装置500において2つの主な違いがある。
第1に、共参照解析のための装置500は更に、医用文書における第1と第2の医用要素の間の単語特徴の類似性測度と、医用文書における第1と第2の医用要素の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第1の類似性測度を決定するために使用される、第1の類似性測度決定部510を有する。ここで、第1の医用要素と第2の医用要素との間の類似性測度は、第1の医用要素と第2の医用要素との間の類似度を表す。例えば、類似度が非常に高い場合は、第1の医用要素と第2の医用要素がほぼ同じ単語の特徴を使用していることを意味する。そして、類似度が高い場合、第1の医用要素と第2の医用要素が非常に類似した単語特徴を使用するか、または第1の医用要素と第2の医用要素で使用される単語特徴が異なるか、単語特徴「失敗」のような同義語に置き換えられることを意味する。また、類似度は、例えば、上記[特許文献1]を用いて決定することができる。
第2に、診断特徴検出部220は、第1の類似性測度決定部510が第1の医用要素と第2の医用要素との間の第1の類似性測度が閾値(すなわち図6において示されるTH)以上であると判定した場合にのみ、第1の医用要素の診断状態、第1の医用要素の特性、第2の医用要素の診断状態、および第2の医用要素の特性を検出する。ここで、閾値は、例えば実際の用途または経験に従って、製造者またはユーザにより予め定義され得る。すなわち、本実施形態では、本発明は、2つの医用要素の間の適合性を使用して、類似性測度を使用して共参照解析を実行することによって引き起こされる不正確な判断を修正することができる。ここで、不正確な判断は、2つの医用要素を共参照として決定するが、これら2つの医用要素は表面的には同じまたは類似しているが、実際には互いに共参照されていないことである。したがって、共参照解析の精度が向上する。
図5に示した取得部210、診断特徴検出部220、適合性決定部230および共参照解析部240に関するその他の詳細な説明は、図2に示した対応する部分と同様であるので、その詳細な説明はここでは繰り返さない。
図6を参照して、図5における第2実施形態の構成により実行される全体処理について説明する。図6は、図5における第2実施形態に従う全体処理の手順を概略的に示すフローチャート600である。
図6を図4と比較すると、図6に示すフローチャート600において以下の主な違いがある。
取得ステップS410において取得部210がシステムバス180を介して入力装置150から第1の医用要素、第2の医用要素、および医用文書を取得した後、第1の類似性測度決定ステップS610において、第1の類似性測度決定部510は、医用文書における第1および第2の医用要素間の単語特徴の類似性測度および医用文書における第1および第2の医用要素の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第1の類似性測度を決定する。また、S610において、第1の類似性測度決定部510が第1の医用要素と第2の医用要素との間の第1の類似性測度が閾値(すなわち、図6に示すTH)以上であると判断した場合、手順はステップS420に進み、そうでなければ、手順は終了する。
図6に示したステップS410〜S460に対するその他の詳細な説明は、図4に示した対応するステップと同様であるので、その詳細な説明はここでは繰り返さない。
上述したように、図5に示す実施形態は、適合性を使用して、共参照解析を実行するために類似性測度を使用することによって引き起こされる不正確な判断を修正する。更に、類似性測度および適合性を使用することにより共参照解析を実行するための別の解決策がある。図7は、本発明の第2の実施形態に従う共参照解析のための装置700の構成を示す別のブロック図である。
図7に示すブロックは、図1を参照して上述したCPU110として実現され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。
図7を図2と比較すると、図7に示す共参照解析のための装置700において2つの主な違いがある。
共参照解析のための装置700は更に、医用文書における第1および第2の医用要素の間の単語特徴の類似性測度と、医用文書における第1および第2の医用要素の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第2の類似性測度を決定するために使用される、第2の類似性測度決定部710を有する。ここで、第1の医用要素と第2の医用要素との間の類似性測度は、例えば、上述の[特許文献1]を用いて決定することができる。
第2に、共参照解析部240は、決定された第2の類似性測度と決定された適合度に基づいて、第1の医用要素と第2の医用要素は同一の医用対象を示すかを判断する。例えば、共参照解析部240は、決定された第2の類似性測度と決定された適合度が第1の閾値(TH1)以上である場合、または、決定された第2の類似性測度と決定された適合度が第2の閾値(TH2)以上である場合、第1の医用要素と第2の医用要素は同一の医用対象を示すと決定し得る。ここで、TH1およびTH2は、例えば実際の用途または経験に従って、製造業者またはユーザによって予め定義され得る。
第1の実施形態において説明したように、2つの医用要素の間の決定された適合性は、適合性スコアとして記録され得るか、または適合性あり(適合可能)または適合性なし(適合不可)として記録され得る。従って、適合性ありと記録された場合、決定された適合性は1と見なされ、適合性なしと記録された場合は、決定された適合性は0と見なされ得る。更に、決定された第1の類似性測度と決定された適合性の両方の重みを1と設定することができ、そのような場合、上述の重み付き合計は、すなわち決定された第1の類似性測度と決定された適合性の合計である。
図7に示した取得部210、診断特徴検出部220、適合性決定部230および共参照解析部240に関するその他の詳細な説明は、図2に示した対応する部分と同様であるので、その詳細な説明はここでは繰り返さない。本実施形態では、記述が医用文書の基準を満たさないいくつかの医用要素に関して、本発明は、医用要素間の類似性測度を使用して、適合性を使用して共参照解析を行うことによって引き起こされる不正確な判断を修正することができる。したがって、共参照解析の精度が向上する。
図8を参照して、図7における第2実施形態の構成により実行される全体処理について説明する。図8は、図7における第2実施形態に従う全体処理の手順を概略的に示すフローチャート800である。
図8を図4と比較すると、図8に示すフローチャート800において2つの主な違いがある。
第1に、第1の医用要素と第2の医用要素との間の適合性を決定することに加えて、フローチャート800は更に、第2の類似性測度決定ステップS810を含む。このステップでは、第2の類似性測度決定部710は、医用文書における第1および第2の医用要素間の単語特徴の類似性測度、および、医用文書における第1および第2の医用要素間の内容の類似性測度に基づいて、第1の医用要素と第2の医用要素との間の第2の類似性測度を決定する。
第2に、適合性決定部230がステップS430〜S440で適合性を判定し、第2の類似性測度決定部710がステップS810で第2の類似性測度を決定した後、共参照解析ステップS820で、共参照解析部240は、決定された第2の類似性測度および決定された適合性に基づいて、第1の医用要素と第2の医用要素が同一の医用対象を示すか否かを決定する。
図8に示したステップS410〜S440に対するその他の詳細な説明は、図4に示した対応するステップと同様であるので、その詳細な説明はここでは繰り返さない。
[情報抽出のための装置の構成]
第1および第2の実施形態において説明したように、情報抽出のために、図2に示す共参照解析のための装置200、図5に示す共参照解析のための装置500、および図7に示す共参照解析のための装置700を使用することができる。本実施形態において、次に、図9を参照して、上述した共参照解析のための装置200、500、700を適用した情報抽出のための装置の構成について説明する。本実施形態の情報抽出のための装置は、図1に説明したものと同じハードウェア構成を有する。
図9は、本発明の第3実施形態に従う情報抽出のための装置900の構成を示すブロック図である。
図9に示すブロックは、図1を参照して上述したCPU110として実現され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。
図9に示すように、本発明の第3実施形態による情報抽出のための装置900は、上述した共参照解析のための装置200、500、または700と、取得部910、医用要素抽出部920、および、医用要素統合部930とを備える。
第1に、第1実施形態において説明したように、図1に示される入力装置150は、ユーザによって入力されるかまたは画像取得装置から出力される医用文書を受信する。ここで、医用文書は医用文書の一部または医用文書全体であり得る。更に、医用文書が画像フォーマットである場合には、CPU110は、入力装置150からシステムバス180を介して医用文書を受け取り、最初に医用文書を画像フォーマットからテキストフォーマットに変換する。
第2に、図9に示すように、取得部910は、システムバス180を介して入力装置150またはCPU110から医用文書を取得する。
第3に、医用要素抽出部920は、取得部910により取得された医用文書から少なくとも2つの医用要素を抽出する。ここで、医用要素抽出部920は、例えば、医用要素を抽出するために、既存のテキスト情報抽出技術を使用することができる。
そして、上述の装置200、500、または700であり得る共参照解析のための装置は、図2〜図8を参照した上記の説明に従って、医用要素のいずれか2つが同一の医用対象を示すかを判断する。
そして最後に、医用要素統合部930は、共参照のための装置により決定された互いに共参照される医用要素の診断状態と特性と統合する。そして、医用要素統合部930は、処理結果をユーザに表示するか、または、類似文書の検索等といった、以下に説明する、続いて起こるオペレーションのために、システムバス180を統合結果を介して図1に示す出力装置160に転送する。
これにより、本情報抽出の実施形態によれば、取得した医用文書における医用対象のそれぞれを、1つの記述データとして取得することができる。
医用対象に対するより正確な記述データを得るために、好ましい解決策として、医用要素統合部930は、取得した医用文書における医用要素の出現順序(シーケンス)に基づいて、互いに共参照される医用要素の診断状態と特性を統合することができる。更に、医用要素統合部930は、図10〜図11を参照して以下に説明する様々な方法で統合を実施することができる。
[全体処理2]
図10〜図11を参照して、図9における第3実施形態の構成により実行される全体処理について説明する。図10は、図9の第3実施形態に従う全体処理の手順を概略的に示すフローチャート1000である。
上述したように、第1に、図1に示される入力装置150は、ユーザによって入力されるかまたは画像取得装置から出力される医用文書を受信する。ここで、医用文書は医用文書の一部または医用文書全体であり得る。更に、医用文書が画像フォーマットである場合には、CPU110は、入力装置150からシステムバス180を介して医用文書を受け取り、最初に医用文書を画像フォーマットからテキストフォーマットに変換する。
そして、図10に示すように、取得ステップS1010において、取得部910は、システムバス180を介して入力装置150またはCPU110から医用文書を取得する。
医用要素抽出ステップS1020において、医用要素抽出部920は、取得部910により取得された医用文書から少なくとも2つの医用要素を抽出する。
共参照解析ステップS1030〜S1040において、最初にステップS1030において、上述の装置200、500または700であり得る共参照解析のための装置は、取得された医用文書に最初に現れる抽出された医用要素を、最初に現れた医用要素として選択する。そして、ステップS1040において、上述の装置200、500、または700であり得る共参照解析のための装置は、図2〜図8を参照した上記の説明に従って、最初に現れた医用要素と共参照されている医用要素を決定する。
医用要素統合ステップS1050において、医用要素統合部930は、最初に現れた医用要素と、最初に現れた医用要素と共参照されている医用要素の診断状態および特性を統合する。
そして、ステップS1060において、医用要素統合部930は、抽出された医用要素が残っているか否かを判定する。そして、残っている医用要素については、まだ医用要素が残っている場合、ステップS1030〜S1050で実行される動作を繰り返す。そうでなければ、手順は終了し、各医用対象に対する記述データはユーザに表示されるか、続いて起こるオペレーションのために表示される。
以下では、図11を参照して任意の解決策を説明する。図11は、図9における第3実施形態に従う全体処理の手順を概略的に示す別のフローチャート1100である。
図11に示すように、図11に示すステップS1010〜S1030およびS1060の詳細な説明は、図10に示す対応するステップと同様であるので、ここでは詳細な説明は繰り返さない。
ステップS1030において最初に現れた医用要素が選択された後、ステップS1110において、上述の装置200、500または700であり得る共参照解析のための装置は、図2〜図8を参照して上述した説明に従って、最も近くかつ最初に現れた医用要素と共参照されている医用要素を決定する。
ステップS1120において、医用要素統合部930は、最初に現れた医用要素とステップS1110で決定された医用要素の診断状態と特性を統合する。
ステップS1130において、統合された医用要素に関して、上述の装置200、500または700であり得る共参照解析のための装置は、図2〜図8を参照して上述した説明に従って、最初に現れた医用要素と最も近くかつ共参照されている医用要素が含まれるかを判定する。そして、統合された医用要素に最も近くかつそれと共参照されている医用要素がまだ含まれている場合、手順はステップS1140に進む。そうでなければステップS1060に進む。
ステップS1140において、医用要素統合部930は、ステップS1130で決定された医用要素の診断状態と特性を統合された医用要素に統合する。そして、手続は、統合された医用要素に最も近くかつそれと共参照される医用要素がなくなるまで、ステップS1130〜S1140で実行される動作を繰り返す。
当業者には理解されるであろうが、図10〜図11を参照して説明した上述の統合動作は単なる例示であり、限定的ではない。
上述のように、図3に示される上述の医用要素「結節」310〜340を例にとると、医用要素「結節」310および医用要素「結節」320は、1つの同一の結節を示し、医用要素「結節」330および医用要素結節は、別の同一の結節を示す。したがって、医用要素「結節」310および医用要素「結節」320の診断状態および特性は、医用対象に関する1つの記述データに統合することができ、対応する記述データは、例えば以下の表1に示される。更に、医用要素「結節」330および医用要素「結節」340の診断状態および特性は、別の医用対象に対する別の記述データに統合することができ、対応する記述データは、例えば以下の表2に示される。
表1:
Figure 2019522274
表2:
Figure 2019522274
[類似文書検索のための装置の構成]
第3の実施形態で説明したように、図9に示す情報抽出装置900を類似文書検索のために使用することができる。ここで、2つの文書が同じ文書であれば、これら2つの文書の内容はほぼ同じであることを意味する。そして、2つの文書が類似した文書である場合、それはこれら2つの文書の間に概念的な内容のかなりの重複があることを意味する。本実施形態では、次に、図12を参照して、上述した情報抽出装置900を適用した類似文書検索のための装置の構成について説明する。本実施形態の類似文書検索のための装置は、図1に説明したものと同じハードウェア構成を有する。
図12は、本発明の第4実施形態に従う類似文書検索のための装置1200の構成を示すブロック図である。
図12に示すブロックは、図1を参照して上述したCPU110として実装され、RAM120にロードされたプログラムを実行し、図1に示す各ハードウェアと協働するために使用される。ブロックのうちのいくつかまたはすべては、専用のハードウェアによって実施され得る。
図12に示すように、本発明の第4実施形態による類似文書検索のための装置1200は、上述した情報抽出のための装置900と、類似性測度算出部1210と、類似文書検索部1220とを備える。
ユーザ(例えば医師)が医用文書を書いたり読んだりするとき、彼/彼女は通常、自分が書いたまたは読んだ医用文書と類似している履歴医用文書を検索して参照したいと思う。
したがって、第1に、図1に示される入力装置150は、ユーザによって書き込まれるかまたは読み取られる医用文書を受け取ることになる。ここで、医用文書は、ユーザによって直接入力されるか、または画像取得装置から出力されることができ、文書は、医用文書の一部または医用文書全体であり得る。
入力装置150によって受信された医用文書に関しては、情報抽出のための装置900は、図9〜図11を参照して上述した説明に従って、取得された医用文書から、医用要素の統合された診断状態および特性(すなわち、各医用対象についての上記の記述データ)を抽出する。
一方、1つの例では、図1に示すCPU110は、ROM130またはハードディスク140に格納された履歴医用文書を取得する。別の例では、CPU110は、ネットワークを介して類似文書検索のための装置1200に接続されているサーバに格納されている履歴医用文書を取得する。詳細な説明は図14を参照して後述する。そして、履歴医用文書のそれぞれについて、情報抽出のための装置900は、図9〜図11を参照して上述した説明に従って、対応する履歴医用文書から、医用要素の統合された診断状態と特性を抽出する。
そして、図12に示されるように、類似性測度計算部1210は、取得された医用文書から抽出された医用要素の統合された診断状態と特性と、履歴医用文書から抽出された医用要素の統合された診断状態と特性との間の類似性測度を計算する。ここで、類似性測度は、例えば編集距離であり得る。
最後に、類似文書検索部1220は、計算された類似性測度に基づいて、履歴医用文書から取得された医用文書に類似する少なくとも1つの医用文書を検索する。1つの例では、類似文書検索部1220は、最終的な処理結果として、最も大きい類似性測度に対応する1つの医用文書を検索することができる。別の例では、類似文書検索部1220は、計算された類似性測度の値に基づいてランキングされた特定の医用文書を検索することができる。
そして、類似文書検索部1220、処理結果をユーザに表示するか、または、診断サポートといった、続いて起こるオペレーションのために、システムバス180を介して検索された類似医用文書を図1に示す出力装置160に転送する。
これにより、この類似文書検索の実施形態によれば、表面的には類似しているが実際にはユーザによって入力された医用文書と類似していない履歴医用文書は検索されず、ユーザによって入力された医用文書と実際には類似しているが表面的には類似していない履歴医用文書が検索される。すなわち、概念内容がユーザによって入力された医用文書および/またはユーザによって入力された医用文書と類似の主題を記述する履歴医用文書と著しい重なりを有する履歴医用文書が、本発明に従って検索されることになる。したがって、類似文書検索の精度が向上する。
[全体処理3]
図13を参照して、図12における第4実施形態の構成により実行される全体処理について説明する。図13は、図12の第4実施形態に従う全体処理の手順を概略的に示すフローチャート1300である。
上述したように、ユーザによって入力された医用文書と、ROM130またはハードディスク140またはサーバに格納された各履歴医用文書については、情報抽出ステップS1310において、図9〜図11を参照して上述した説明に従って、情報抽出のための装置900が、取得された医用文書から、医用要素の統合された診断対象と特性を抽出し、履歴医用文書から医用要素の統合された診断状態と特性を抽出する。
類似性測度計算ステップS1320では、類似性測度計算部1210は、取得された医用文書から抽出された医用要素の統合された診断状態と特性と、履歴医用文書から抽出された医用要素の統合された診断状態と特性との間の類似性測度を計算する。
類似文書検索ステップS1330では、類似文書検索部1220は、計算された類似性測度に基づいて、履歴医用文書から取得された医用文書に類似する少なくとも1つの医用文書を検索する。
そして、処理結果をユーザに表示するか、または、続いて起こるオペレーションをのために、類似文書検索部1220は、システムバス180を介して検索された類似医用文書を図1に示す出力装置160に転送する。
[類似文書検索システム]
第4実施形態において説明したように、履歴医用文書は、ネットワークを介して類似文書検索装置1200に接続されているサーバに格納され得る。本実施形態では、次に、図14を参照して、上述した類似文書検索のための装置1200を適用した例示的な類似文書検索システム1400について説明する。図14は、本発明に従う例示的な類似文書検索システム1400の構成を示す。
図14に示すように、類似文書検索システム1400は、類似文書検索のための上述の装置としての電子装置1410と、履歴医用文書および他の履歴データを格納するために使用されるサーバ1430とを備える。本実施形態の電子装置1410は、図1に記載のものと同じハードウェア構成および図12に記載のものと同じ構成を有することができる。
電子装置1410は、ネットワーク1420を介してサーバ1430から履歴医用文書を取得するように構成される。そして、電子装置1410は、図12〜図13を参照して上述した説明に従って、取得された履歴医用文書から、ユーザによって入力された医用文書と類似する医用文書を検索するように構成される。更に、電子装置1410は、パーソナルデータアシスタント(PDA)、携帯電話、ラップトップ、デスクトップ、タブレットコンピュータ、またはその他の適切な電子機器等により実装され得る。図14に示すように、電子装置1410は、例えばラップトップ(すなわち、パーソナルコンピュータ)である。
上記のすべてのユニットは、本開示に記載の処理を実施するための例示的および/または好ましいモジュールである。これらのユニットは、ハードウェアユニット(フィールドプログラマブルゲートアレイ(FPGA)など)、デジタル信号プロセッサ、特定用途向け集積回路など、および/またはソフトウェアモジュール(コンピュータ可読プログラムなど)とすることができる。様々なステップを実施するためのユニットは、上に網羅的に記載されていない。しかしながら、特定の処理を実行するステップがある場合、同じ処理を実行するための対応する機能モジュールまたはユニット(ハードウェアおよび/またはソフトウェアによって実行される)があってもよい。記載されたステップおよびこれらのステップに対応するユニットのすべての組み合わせによる技術的解決法は、それらが構成する技術的解決法が完全で適用可能である限り、本出願の開示に含まれる。
更に、図2、図5、図7に示した共参照解析のための200、図9に示した情報抽出のための装置900、あるいは図12に示した類似文書検索のための装置1200がソフトウェアによって部分的または全体的に構成されている場合、それは図1に示されているハードディスク140に格納され得る。別の態様では、図2、図5、図7に示した共参照解析のための200、図9に示した情報抽出のための装置900、あるいは図12に示した類似文書検索のための装置1200がハードウェアまたはファームウェアによって部分的または全体的に構成されている場合、電子装置において、共参照解析に対する必要性、情報抽出に対する必要性、または類似文書検索に対する必要性がある限り、それは機能モジュールとしてコンピュータのような電子装置に組み込まれることもできる。
本発明の方法および装置を多くの方法で実施することが可能である。例えば、本発明の方法および装置を、ハードウェア、ファームウェア、またはそれらのあらゆる組み合わせを通して実施することが可能である。上記の方法のステップの順序は、例示的なものに過ぎず、本発明の方法のステップは、特に明記しない限り、上記の具体的な順序に限定されない。さらに、いくつかの実施形態では、本発明は、本発明による方法を実施するための機械可読命令を含む、記録媒体に記録されたプログラムとして実施することもできる。このように、本発明は、本発明の方法を実施するためのプログラムを記録した記録媒体も含むものである。
本発明のいくつかの特定の実施形態を実施例によって詳細に説明したが、上記の実施例は例示的なものにすぎず、本発明の範囲を限定するものではないことを当業者は理解されたい。当業者であれば、本発明の範囲および精神から逸脱することなく上記の実施形態を修正できることを理解されたい。本発明の範囲は添付の特許請求の範囲によって規定される。
本出願は、その全体が参照により本明細書に組み込まれる、2016年6月16日に出願された中国特許出願第20160428860.4号の利益を主張する。

Claims (21)

  1. 共参照解析のための装置であって、
    入力医用文書から第1の医用要素と第2の医用要素を取得するように構成された取得手段と、
    前記医用文書から、前記第1の医用要素の診断状態、前記第2の医用要素の診断状態、前記第1の医用要素の少なくとも1つの特性、および前記第2の医用要素の少なくとも1つの特性を検出するように構成された診断特徴検出手段と、
    前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性を決定するように構成された適合性決定手段と、
    前記決定された適合性に基づて、前記第1の医用要素と前記第2の医用要素は同一の医用対象を示すかを判定するように構成された共参照解析手段と、を有し、
    診断状態は、医用文書における診断プロセスにおける医用要素の位置を表し、
    特性は、医用文書における医用要素の診断項目を表し、
    適合性は、ある医用要素と別の医用要素が同一の医用対象を示す可能性を表す、装置。
  2. 請求項1に記載された装置であって、1つの医用要素に関して、前記診断特徴検出手段は、
    前記医用文書から前記医用要素に関連する予め定義された内容を抽出し、
    前記抽出された内容を分析することにより前記医用要素の前記診断状態を識別する、装置。
  3. 請求項1に記載の装置であって、前記適合性決定手段は、
    前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性係数を決定するように構成された適合性係数決定手段であって、前記適合性係数は、第1の医用要素と第2の医用要素との間の意味論的競合を表す、手段と、
    前記決定された適合性係数に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性を判定するように構成された適合性判定手段と、を有する、装置。
  4. 請求項3に記載の装置であって、前記適合性係数は、
    前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および、前記第2の医用要素の前記特性の間の意味論的値の競合、および、
    前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および、前記第2の医用要素の前記特性の間の意味論的順序の競合を含む、装置。
  5. 請求項4に記載の装置であって、前記適合性係数決定手段は、
    前記第1の医用要素と前記第2の医用要素との間の距離、
    第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の順序、
    前記第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の距離、
    前記第1の医用要素と前記第2の医用要素の前記特性の種類、
    前記第1の医用要素の前記特性の前記種類と前記第2の医用要素の前記特性の前記種類との間の順序、
    種類が前記第1の医用要素と前記第2の医用要素の両方に属する前記特性の値、の特徴のうち少なくとも1つを計算し、
    前記計算された特徴および予め定義された規則に基づいて、前記意味論的値の前記競合および前記意味論的順序の前記競合を決定する、装置。
  6. 請求項4に記載の装置であって、前記適合性係数決定手段は、
    前記第1の医用要素と前記第2の医用要素との間の距離、
    第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の順序、
    前記第1の医用要素の前記診断状態と前記第2の医用要素の前記診断状態との間の距離、
    前記第1の医用要素と前記第2の医用要素の前記特性の種類、
    前記第1の医用要素の前記特性の前記種類と前記第2の医用要素の前記特性の前記種類との間の順序、
    種類が前記第1の医用要素と前記第2の医用要素の両方に属する前記特性の値、の特徴のうち少なくとも1つを計算し、
    前記計算された特徴および予め生成されたモデルに基づいて、前記意味論的値の前記競合および前記意味論的競合の前記競合を決定する、装置。
  7. 請求項4に記載の装置であって、前記適合性判定手段は、前記意味論的値と前記意味論的順序が競合しない場合、前記第1の医用要素と前記第2の医用要素は適合性があると判定する、装置。
  8. 請求項1に記載の装置であって、前記共参照解析手段は、前記決定された適合性が適合可能である場合に、前記第1の医用要素と前記第2の医用要素は前記同一の医用対象を示すと決定する、装置。
  9. 請求項1に記載の装置であって、更に、
    前記医用文書における前記第1と第2の医用要素の間の単語特徴の類似性測度と、前記医用文書における前記第1と第2の医用要素の内容の類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第1の類似性測度を決定するために構成される第1の類似性測度決定手段を有し、
    前記第1の類似性測度決定手段が前記第1の医用要素と前記第2の医用要素との間の前記第1の類似性測度が閾値以上であると判断した場合に、前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および前記第2の医用要素の前記特性を検出する、装置。
  10. 請求項1に記載の装置であって、更に、
    前記医用文書における前記第1と第2の医用要素の間の単語特徴の類似性測度と、前記医用文書における前記第1と第2の医用要素のコンテキストの類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第2の類似性測度を決定するために構成された第2の類似性測度決定手段を有し、
    前記共参照解析手段は、前記決定された第2の類似性測度と前記決定された適合性に基づいて、前記第1の医用要素と前記第2の医用要素は前記同一の医用対象を示すかを判断する、装置。
  11. 情報抽出のための装置であって、
    医用文書を取得するように構成された取得手段と、
    前記取得された医用文書から少なくとも2つの医用要素を抽出するように構成された医用要素抽出手段と、
    前記医用要素のいずれか2つが同一の医用対象を示すかを判定するように構成された、請求項1から11のいずれか1項に従う共参照解析のための前記装置と、
    互いに共参照される前記医用要素の前記診断状態と前記特性を統合するように構成された医用要素統合手段を有する、装置。
  12. 請求項11に記載された装置であって、前記医用要素統合手段は、前記取得された医用文書における前記医用要素の出現順序に基づいて、互いに共参照される前記医用要素の前記診断状態と前記特性を統合する、装置。
  13. 類似文書検索のための装置であって、
    前記取得された医用文書から、前記医用要素の前記統合された診断状態と特性を抽出し、履歴医用文書から前記医用要素の前記統合された診断状態と特性を抽出するように構成された、請求項11または12に従う情報抽出のための前記装置と、
    前記取得された医用文書から抽出された前記医用要素の前記統合された診断状態と特性と、前記履歴医用文書から抽出された前記医用要素の統合された前記診断状態と特性との間の類似性測度を算出するように構成された類似性測度算出手段と、
    前記算出された類似性測度に基づいて、前記履歴医用文書から、取得された医用文書に類似する少なくとも1つの医用文書を検索するように構成された類似文書検索手段と、を有する装置。
  14. 少なくとも1つのサーバと、ネットワークを介して前記サーバに接続された類似文書検索のための装置とにより構成された類似文書検索システムであって、
    前記サーバは、履歴医用文書を格納するように構成され、
    類似文書検索のための前記装置は、
    前記取得された医用文書から、前記医用要素の前記統合された診断状態と特性を抽出し、履歴医用文書から前記医用要素の前記統合された診断状態と特性を抽出するように構成された、請求項11または12に従う情報抽出のための前記装置と、
    前記取得された医用文書から抽出された前記医用要素の前記統合された診断状態と特性と、前記履歴医用文書から抽出された前記医用要素の統合された前記診断状態と特性との間の類似性測度を算出するように構成された類似性測度算出手段と、
    前記計算された類似性測度に基づいて、前記履歴医用文書から、取得された医用文書に類似する少なくとも1つの医用文書を検索するように構成された類似文書検索手段と、を有するシステム。
  15. 共参照解析のための方法であって、
    入力医用文書から第1の医用要素と第2の医用要素を取得する取得工程と、
    前記医用文書から、第1の医用要素の診断状態、第1の医用要素の少なくとも1つの特性、第2の医用要素の診断状態、および第2の医用要素の少なくとも1つの特性を検出する診断特徴検出工程と、
    前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性を決定する適合性決定工程と、
    前記決定された適合性に基づいて、前記第1の医用要素と前記第2の医用要素は同一の医用対象を示すかを判定する共参照解析工程と、を含み、
    診断状態は、医用文書における診断プロセスにおける医用要素の位置を表し、
    特性は、医用文書における医用要素の診断項目を表し、
    適合性は、ある医用要素と別の医用要素が同一の医用対象を示す可能性を表す、方法。
  16. 請求項15に記載の方法であって、前記適合性決定工程は、
    前記検出された診断状態および特性に基づいて、前記第1の医用要素と前記第2の医用要素との間の適合性係数を決定する適合性係数決定工程であって、前記適合性係数は、第1の医用要素と第2の医用要素との間の意味論的衝突を表す、工程と、
    前記決定された適合性係数に基づいて、前記第1の医用要素と前記第2の医用要素との間の前記適合性を判定する適合性判定工程と、を含む、方法。
  17. 請求項15に記載の方法であって、前記共参照解析工程において、前記決定された適合性が適合可能である場合に、前記第1の医用要素と前記第2の医用要素は前記同一の医用対象を示すと決定される、方法。
  18. 請求項15に記載の方法であって、更に、
    前記医用文書における前記第1および第2の医用要素の間の単語特徴の類似性測度に基づいて、および、前記医用文書における前記第1および前記第2の医用要素の内容の類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第1の類似性測度を決定する第1の類似性速度決定工程を含み、前記診断特徴検出工程において、前記第1の医用要素と前記第2の医用要素との間の前記第1の類似性測度が前記第1の類似性決定工程における閾値以上であると判定された場合に、前記第1の医用要素の前記診断状態、前記第1の医用要素の前記特性、前記第2の医用要素の前記診断状態、および前記第2の医用要素の前記特性が検出される、方法。
  19. 請求項15に記載の方法であって、更に、
    前記医用文書における前記第1および第2の医用要素の間の単語特徴の類似性測度に基づいて、また、前記医用文書における前記第1および第2の医用要素の内容の類似性測度に基づいて、前記第1の医用要素と前記第2の医用要素との間の第2の類似性測度を決定する第2の類似性測度決定工程を含み、前記共参照解析工程において、前記第1の医用要素と前記第2の医用要素は、前記決定された第2の類似性測度および前記決定された適合性に基づいて、同一の医用対象を示すか否かが判定される、方法。
  20. 情報抽出のための方法であって、
    医用文書を取得する取得工程と、
    前記取得された医用文書から少なくとも2つの医用要素を抽出する医用要素抽出工程と、
    請求項15から19のいずれか1項に従う前記方法を用いることにより、前記医用要素のいずれか2つが同一の医用対象を示すか判定する共参照解析工程と、
    互いに共参照される前記医用要素の前記診断状態と前記特性を統合するように構成された医用要素統合工程と、を含む、方法。
  21. 類似文書検索のための方法であって、
    請求項20に従う前記方法を用いることにより、前記取得された医用文書から前記医用要素の前記統合された診断状態と特性を抽出し、履歴医用文書から前記医用要素の前記統合された診断状態と特性を抽出する情報抽出工程と、
    前記取得された医用文書から抽出された前記医用要素の前記統合された診断状態と特性と、前記履歴医用文書から抽出された前記医用要素の統合された前記診断状態と特性との間の類似性測度を計算する類似性速度計算工程と、
    前記計算された類似性測度に基づいて、前記履歴医用文書から、取得された医用文書に類似する少なくとも1つの医用文書を検索する類似文書検索工程と、を含む方法。
JP2018562274A 2016-06-16 2017-06-15 共参照解析、情報抽出および類似文書検索のための装置、類似文書検索システムおよび情報処理方法 Active JP6972029B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610428860.4A CN107515851B (zh) 2016-06-16 2016-06-16 用于共指消解、信息提取以及相似文档检索的装置和方法
CN201610428860.4 2016-06-16
PCT/JP2017/022114 WO2017217489A1 (en) 2016-06-16 2017-06-15 Apparatuses and methods for co-reference resolution, information extraction and similar document retrieval

Publications (2)

Publication Number Publication Date
JP2019522274A true JP2019522274A (ja) 2019-08-08
JP6972029B2 JP6972029B2 (ja) 2021-11-24

Family

ID=59270075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018562274A Active JP6972029B2 (ja) 2016-06-16 2017-06-15 共参照解析、情報抽出および類似文書検索のための装置、類似文書検索システムおよび情報処理方法

Country Status (3)

Country Link
JP (1) JP6972029B2 (ja)
CN (1) CN107515851B (ja)
WO (1) WO2017217489A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284497B (zh) * 2017-07-20 2021-01-12 京东方科技集团股份有限公司 用于识别自然语言的医疗文本中的医疗实体的方法和装置
CN109359184B (zh) * 2018-10-16 2020-08-18 苏州大学 英文事件同指消解方法和系统
US11573994B2 (en) 2020-04-14 2023-02-07 International Business Machines Corporation Encoding entity representations for cross-document coreference
CN111950281B (zh) * 2020-07-02 2023-03-21 中国科学院软件研究所 一种基于深度学习和上下文语义的需求实体共指检测方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012238062A (ja) * 2011-05-10 2012-12-06 Sony Corp 情報処理装置、情報処理方法、プログラム及び情報処理システム
US8457950B1 (en) * 2012-11-01 2013-06-04 Digital Reasoning Systems, Inc. System and method for coreference resolution

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7813916B2 (en) * 2003-11-18 2010-10-12 University Of Utah Acquisition and application of contextual role knowledge for coreference resolution
US7818278B2 (en) * 2007-06-14 2010-10-19 Microsoft Corporation Large scale item representation matching
MX2010002349A (es) * 2007-08-31 2010-07-30 Microsoft Corp Resolucion de correferencia en un sistema de procesamiento de lenguaje natural sensible a la ambiguedad.
CN101499062B (zh) * 2008-01-29 2012-07-04 国际商业机器公司 用于收集实体别名的方法和设备
US8880514B2 (en) * 2010-04-27 2014-11-04 Snu R&Db Foundation Terminology-based system for supporting data object definition
US8793199B2 (en) * 2012-02-29 2014-07-29 International Business Machines Corporation Extraction of information from clinical reports
CN103577491A (zh) * 2012-08-09 2014-02-12 佳能株式会社 用于表征功能实体的和用于将功能实体消歧的方法和设备
CN103778346B (zh) * 2014-02-18 2017-01-25 中国科学院上海技术物理研究所 医疗信息处理方法和装置
CN104572904B (zh) * 2014-12-25 2017-12-22 微梦创科网络科技(中国)有限公司 一种标签关联程度的确定方法及装置
CN105184074B (zh) * 2015-09-01 2018-10-26 哈尔滨工程大学 一种基于多模态医学影像数据模型的医学数据提取和并行加载方法
CN105260457B (zh) * 2015-10-14 2018-07-13 南京大学 一种面向共指消解的多语义网实体对比表自动生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012238062A (ja) * 2011-05-10 2012-12-06 Sony Corp 情報処理装置、情報処理方法、プログラム及び情報処理システム
US8457950B1 (en) * 2012-11-01 2013-06-04 Digital Reasoning Systems, Inc. System and method for coreference resolution

Also Published As

Publication number Publication date
WO2017217489A1 (en) 2017-12-21
CN107515851A (zh) 2017-12-26
CN107515851B (zh) 2021-09-10
JP6972029B2 (ja) 2021-11-24

Similar Documents

Publication Publication Date Title
US11094034B2 (en) Determining appropriate medical image processing pipeline based on machine learning
US10929420B2 (en) Structured report data from a medical text report
JP5852970B2 (ja) 症例検索装置および症例検索方法
RU2686627C1 (ru) Автоматическое создание ориентированной на показатели продольной области для просмотра показателей пациента
US8934695B2 (en) Similar case searching apparatus and similar case searching method
CN111696642A (zh) 用于生成医学图像中的异常的描述的系统和方法
US20140142413A1 (en) Computer-aided diagnosis method and apparatus
US20150161329A1 (en) System and method for matching patient information to clinical criteria
JP5736007B2 (ja) 検査報告書を生成する装置、システム、方法およびプログラム
JP6972029B2 (ja) 共参照解析、情報抽出および類似文書検索のための装置、類似文書検索システムおよび情報処理方法
US20140288970A1 (en) Identifying relevant imaging examination recommendations for a patient from prior medical reports of the patient to facilitate determining a follow up imaging examination(s) for the patient
JP2014505950A (ja) 撮像プロトコルの更新及び/又はリコメンダ
US11527312B2 (en) Clinical report retrieval and/or comparison
US20170372443A1 (en) Method and apparatus for information analysis
JP6875993B2 (ja) 臨床の所見のコンテキストによる評価のための方法及びシステム
JP2020518050A (ja) エンティティ間のコンテキスト的類似度の学習及び適用
US20190108175A1 (en) Automated contextual determination of icd code relevance for ranking and efficient consumption
EP2922018A1 (en) Medical information analysis program, medical information analysis device, and medical information analysis method
WO2019193982A1 (ja) 医療文書作成支援装置、医療文書作成支援方法、及び医療文書作成支援プログラム
US20180004900A1 (en) Method and apparatus for information analysis
EP3467770B1 (en) Method for analysing a medical imaging data set, system for analysing a medical imaging data set, computer program product and a computer-readable medium
JP2021524097A (ja) 異種医用データの優先順位付け及び提示のためのシステム及び方法
CN114201613B (zh) 试题生成方法、试题生成装置、电子设备以及存储介质
US20240071586A1 (en) Systems and methods of radiology report processing and display enhancements
CN114549482A (zh) 一种图像关联方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200507

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211102

R151 Written notification of patent or utility model registration

Ref document number: 6972029

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151