JP2021190071A

JP2021190071A - 医療ファクト検証方法、医療ファクト検証装置、電子デバイス、記憶媒体、及びプログラム

Info

Publication number: JP2021190071A
Application number: JP2020193010A
Authority: JP
Inventors: ファン，ジョウ; Zhou Fang; シー，ヤンビン; Yabing Shi; ジャン，イェ; Ye Jiang; チャイ，チュングァン; Chunguang Chai
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-05-29
Filing date: 2020-11-20
Publication date: 2021-12-13
Anticipated expiration: 2040-11-20
Also published as: US20210374576A1; EP3916738B1; CN111640511A; EP3916738A1; KR102456535B1; JP7097423B2; CN111640511B; KR20210148813A

Abstract

【課題】医療ファクトの検証にかかる人件費を効果的にダウンさせる医療ファクト検証方法、装置、電子デバイス及び記憶媒体を提供する。【解決手段】医療ファクト検証方法は、ターゲットエンティティと、ターゲット属性と、ターゲット属性値とを含む、検証されるべき医療ファクト及び候補エビデンスを取得することと、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを属性判定モデルに入力して、判定属性を得ることと、ターゲット属性と判定属性とが一致する場合に、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを関連度判定モデルに入力して、候補エビデンスの関連度を得ることと、候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証することと、を含む。【選択図】図１

Description

本発明は、コンピュータ技術分野に関し、特に人工知能分野に関する。本発明は、ナレッジグラフ分野に応用可能である。

従来の医療ファクトの検証方法は、主な方法の一つとして、人手による検索とラベル付けによって検証を行う方式があり、当該方法は医療の専門知識を有するラベル付け人員が必要で、人件費が比較的高く、大規模な医療データを処理することは困難である。また、もう一つの方法として、人手により予めテキストテンプレートや品詞テンプレートを設定して医療文書に現れるファクトを抽出し、抽出したファクトと検証されるべきファクトとを比較して検証を行う方式がある。しかし、人手により定義されたルールは、一般性が比較的乏しく、また、同様に人件費がかかり、大規模な医療専門データを処理することは困難である。

本発明は、上記の技術課題における少なくとも１つを解決するために、医療ファクト検証方法、装置、電子デバイス、及び記憶媒体を提供する。

第１態様において、本発明の実施形態は、医療ファクト検証方法を提供している。当該医療ファクト検証方法は、
ターゲットエンティティと、ターゲット属性と、ターゲット属性値とを含む、検証されるべき医療ファクト及び候補エビデンスを取得することと、
ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを属性判定モデルに入力して、判定属性を得ることと、
ターゲット属性と判定属性とが一致する場合に、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを関連度判定モデルに入力して、候補エビデンスの関連度を得ることと、
候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証することと、を含む。

第２態様において、本発明の実施形態は、医療ファクト検証装置を提供している。当該医療ファクト検証装置は、
ターゲットエンティティと、ターゲット属性と、ターゲット属性値とを含む、検証されるべき医療ファクト及び候補エビデンスを取得する第１取得モジュールと、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを属性判定モデルに入力して、判定属性を得る第１判定モジュールと、
前記ターゲット属性と前記判定属性とが一致する場合に、前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを関連度判定モデルに入力して、前記候補エビデンスの関連度を得る第２判定モジュールと、
前記候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証する第１検証モジュールと、を備える。

第３態様において、本発明の実施形態は、電子デバイスを提供する。当該電子デバイスは、
１つ又は複数のプロセッサと、
１つ又は複数のプロセッサに通信接続されるメモリとを含み、
メモリには、前記１つ又は複数のプロセッサにより実行可能なコマンドを記憶しており、
１つ又は複数のプロセッサは、１つ又は複数のコマンドを実行する場合、第１態様のいずれか１項に記載のターゲット検出方法を実行させる。

第４態様において、コンピュータコマンドが記憶された非一過性のコンピュータ可読記憶媒体を提供し、コンピュータコマンドが第１態様のいずれか１項に記載のターゲット検出方法を実行させる。

本発明における少なくとも１つの実施形態は、下記のメリット或いは有益な効果を有する。即ち、属性判定モデルと関連度判定モデルを用いて、属性と関連度の判定を順次に完成することで、候補エビデンスに記載されている属性がターゲット属性を満たし、かつ、関連度が条件を満たす場合に医療ファクトが正しいことを検証する技術手段となり、従来の人手による検証に必要なコストが高くなってしまう技術問題を克服し、人件費をダウンでき、さらに大規模なデータを処理することに適するようになった。

上記の選択可能な実施形態の有する他の効果については、下記において具体的な実施形態を参照しながら説明する。

添付図面は、本開示の理解を促すためのものであり、いかなる限定をも目的としない。
本発明の実施形態による医療ファクト検証方法のフローチャート１である。本発明の実施形態による医療ファクト検証方法のフローチャート２である。本発明の実施形態による属性判定モデルの模式図である。本発明の実施形態による関連度判定モデルの模式図である。本発明の実施形態による医療ファクト検証装置の構成図１である。本発明の実施形態による医療ファクト検証装置の構成図２である。本発明の実施形態による医療ファクト検証装置の構成図３である。本発明の実施形態による医療ファクト検証装置の構成図４である。本発明の実施形態による医療ファクト検証装置の構成図５である。本発明の実施形態による医療ファクト検証方法を実現するための電子デバイスのブロック図である。

以下、図面を参照しながら本発明の例示的な実施形態を説明するが、本発明の実施形態の様々な詳細が理解を容易にするために含まれており、それらは単なる例示と考えられるべきである。したがって、当業者は、本発明の範囲及び旨から逸脱することなく、本発明明細書に記載された実施形態に対して様々な変更及び修正を行うことができることを理解すべきである。同様に、以下の説明では、公知な機能及び構造についての説明は、明瞭かつ簡明のために省略される。

本発明の実施形態は、医療ファクト検証方法を提供していて、電子デバイスに応用可能であり、数値計算、論理演算、データ記憶などのデータ処理機能を備えることができる。図１に示すように、図１は、本発明の実施形態に係る医療ファクト検証方法のフローチャートであり、当該方法は下記のステップを含む。

Ｓ１０１において、ターゲットエンティティと、ターゲット属性と、ターゲット属性値とを含む、検証されるべき医療ファクト及び候補エビデンスを取得する。

Ｓ１０２において、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを属性判定モデルに入力して、判定属性を得る。

Ｓ１０３において、ターゲット属性と判定属性とが一致する場合に、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを関連度判定モデルに入力して、候補エビデンスの関連度を得る。

Ｓ１０４において、候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証する。

本発明の実施形態において、各医療ファクトはＳＰＯの三次元の形式により表現でき、Ｓはエンティティを表し、Ｐは属性を表し、Ｏは属性値を表す。医療ファクト＜麻疹、症状、斑状丘疹状皮疹＞を例として、エンティティＳは麻疹であり、属性Ｐは症状であり、属性値Ｏは斑状丘疹状皮疹である。

相応的に、上記ステップＳ１０１〜Ｓ１０３の処理は、今回検証されるべき医療ファクトに対して処理を行ってもよく、かつ、異なる回では異なる検証されるべき医療ファクトに対して処理を行ってもよい。本発明では、毎回検検証されるべき医療ファクトにおけるエンティティ、属性及び属性値を、ターゲットエンティティ、ターゲット属性及びターゲット属性値とする。

選択的に、医療ファクトの属性は、臨床的特徴、病因病理、治療方案、推奨薬、合併症及び医薬品作用のうちの少なくとも１つを含むことができる。

選択的に、候補エビデンスは医療ファクトが正しいか否かを検証するための候補エビデンスであり、候補エビデンスは、検証されるべき医療ファクトに基づいて指定された医療データベースから検索して得ることができる。指定された医療データベースは、書籍、雑誌及び論文などを含む権威のある医療資料を記憶することができる。

本実施形態は、医療ナレッジグラフの構築に用いることができる医療ナレッジグラフの構築の過程において、例えば、＜麻疹、症状、斑状丘疹状皮疹＞などの医療ファクトを機械により抽出し、候補エビデンスは検証されるべき医療ファクトに基づいて指定された医療文書ベースにおいて検索して得ることができる。ステップＳ１０１〜Ｓ１０４により提供された検証方法により当該医療ファクトの検証を完成させ、検証が正しければ、当該医療ファクトを医療ナレッジグラフに加えると正式に決定するとともに、候補エビデンスの関連度を用いて対応する支持的なエビデンスを決定でき、医療ナレッジグラフの精度の向上を図ることができる。

上記実施形態において、検証されるべき医療ファクトと候補エビデンスとについて、まず、属性判定モデルにより候補エビデンスに記載されているターゲットエンティティとターゲット属性値とが対応している属性を判定し、判定属性を得る。当該判定属性がターゲット属性と一致する場合に、さらに関連度判定モデルにより候補エビデンスに対して、ターゲットエンティティと前記ターゲット属性値に関する関連度を判定する。候補エビデンスの関連度が所定の条件を満たす場合に、医療ファクトが正しいことを検証する。

本発明の実施形態は、属性判定モデルと相関判定モデルにより、属性と関連度の判定の二重判定を完了し、候補エビデンスに記載されている属性がターゲット属性を満たし、かつ、関連度が条件を満たす場合に医療ファクトが正しいことを検証し、医療ファクトと候補エビデンスとの関連判定を強化し、検証結果の厳密性を高め、さらに医療専門データ処理の要求を満たす。かつ、人手によるラベル付けや人手により定義されたルールを借りる必要がなく、人件費をダウンし、さらに大規模なデータ処理に適する。

１つの実施形態において、図２に示すように、ステップＳ１０１の前に、さらに、検証されるべき医療ファクトに基づいて、予め構築された医療文書ベースから検索して、検証されるべき医療ファクトに対応する複数の候補エビデンスを得る、ステップＳ１００を含む。

１つの実施形態において、図２に示すように、ステップＳ１０２の後に、さらに、ターゲット属性と前記判定属性とが同じでない場合に、候補エビデンスにより前記検証されるべき医療ファクトが正しいことを検証できないと決定する、Ｓ２０１を含む。例えば、検証されるべき医療ファクトが＜麻疹、症状、斑状丘疹状皮疹＞である場合、ステップＳ１０２において、ある候補エビデンスに基づき得た判定属性が「治療方案」であり、ターゲット属性の「症状」と異なるとき、当該候補エビデンスは検証されるべき医療ファクトが正しいことを検証できないと決定される。

本実施形態では、属性判定モデルにより属性が一致しないと判定された場合、候補エビデンスは検証されるべき医療ファクトが正しいことを検証できないと直接判断し、現在の当該候補エビデンスの検証を停止することにより、計算効率を効果的に向上し、特に大規模な医療専門データを処理するとき、検証効率を大幅に向上することができる。

１つの実施形態において、図３に示すよう、図３はステップＳ１０２に用いられる属性判定モデルの模式図であり、前記属性判定モデルは、第１自然言語処理モデルと第１分類器とを含む。

ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを属性判定モデルに入力して、判定属性を得るステップＳ１０２は、
ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを第１自然言語処理モデルに入力して、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとの第１特徴ベクトルを得ることと、
第１特徴ベクトルを第１分類器に入力して、判定属性を得ることと、を含む。

上記実施形態において、属性判定モデルとしては、自然言語処理モデルと分類器との構造を用いて、まずエンティティと属性値とを、候補エビデンスと特徴の抽出を行い、特徴に基づいて分類を行うことで所属属性を判定するため、構造が簡単な上に、属性判定を実現することができる。

上記実施形態における属性判定モデルの構造は、選択可能な方式であり、その実施形態において、当業者が他のモデルの構造を通して、ターゲットエンティティ、ターゲット属性値、及び候補エビデンスに基づく属性の判断を同様に実現した実施形態も、本発明の実施形態の保護範囲内にある。

選択的に、第１自然言語処理モデルは知識統合による拡張表現モデル（ＥＲＮＩＥ，ｅｎｈａｎｃｅｄｒｅｐｒｅｓｅｎｔａｔｉｏｎｆｒｏｍｋｎｏｗｌｅｄｇｅｉｎｔｅｇｒａｔｉｏｎ）を用いる。他の選択可能な形態において、第１自然言語処理モデルはＢＥＲＴモデルを用いでもよい。

選択的に、第１分類器はＳｏｆｔＭａｘ分類器を用いる。他の分類器を用いて、同様に自然言語処理モデルに基づいて分析した特徴ベクトルを処理し、分類を行うことで対応する属性を決定する実施形態も、本発明の実施形態の保護範囲内にある。

選択的に、図３に示すよう、ステップＳ１０２において、「ＳＯ［ＳＥＰ］ＰＡＲＡ」の形式を用いてターゲットエンティティＳ、ターゲット属性値Ｏ、及び候補エビデンスＰＡＲＡを属性判定モデルに入力し、［ＳＥＰ］を区切り記号とする。また、図３の「ＰＣＬＳ」は属性Ｐの出力を表し、「ＣＬＳ」は出力を表す。例えば、検証されるべき医療ファクトが＜麻疹、症状、斑状丘疹状皮疹＞であり、候補エビデンスが「ＸＸＸＸＸ」である場合、「麻疹斑状丘疹状皮疹［ＳＥＰ］ＸＸＸＸＸ」を属性判定モデルに入力し、属性判定モデルは出力に基づいて属性を「症状」と判定する。

１つの実施形態において、ステップＳ１０２において用いられる属性判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた第１自然言語処理モデルと、第１分類器とを用いて、属性判定モデルを構築することと、
構築した属性判定モデルを、正しい医療ファクトと支持的なエビデンスをそれぞれ含む複数の第１サンプルデータを用いて訓練することと、を含む。

上記実施形態において、医療用言語資料で予め訓練した第１自然言語処理モデルを用いるため、属性判定モデルの訓練は微調整を行えばよく、即ち少量のサンプルデータを用いて訓練を行えばよい。これにより、サンプルデータの数量に対する要求を大幅にダウンし、人手によりサンプルデータのラベル付けを行うコストをダウンすることができる。

１つの実施形態において、図４に示すよう、図４はステップＳ１０３において用いられる関連度判定モデルの模式図であり、関連度判定モデルは、第２自然言語処理モデルと、２つの第２分類器と、全結合層（ｆｕｌｌｙｃｏｎｎｅｃｔｅｄｌａｙｅｒｓ，ＦＣ）と、第３分類器とを含む。

対応的に、Ｓ１０３においてターゲットエンティティと、ターゲット属性値と、候補エビデンスとを関連度判定モデルに入力して、前記候補エビデンスの関連度を得ることは、
ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを第２自然言語処理モデルに入力して、ターゲットエンティティと候補エビデンスの第１層特徴ベクトル、及びターゲット属性値と候補エビデンスの第１層特徴ベクトルを得ることと、
ターゲットエンティティと候補エビデンスの第１層特徴ベクトル、及びターゲット属性値と候補エビデンスの第１層特徴ベクトルをそれぞれ２つの第２分類器に入力して、ターゲットエンティティと候補エビデンスの第２層特徴ベクトル、及びターゲット属性値と候補エビデンスの第２層特徴ベクトルを得ることと、
ターゲットエンティティと候補エビデンスの第２層特徴ベクトル、及びターゲット属性値と候補エビデンスの第２層特徴ベクトルを、全結合層にて処理した後に第３分類器に入力して、候補エビデンスの関連度を得ることと、を含む。

上記実施形態において、自然言語処理モデルと分類器とを用いた上で、自然言語処理モデルより出力されたデータを、エンティティと候補エビデンスの特徴ベクトル、及び属性値と候補エビデンスの特徴ベクトルに分け、２つの分類器によりそれぞれ単独に処理した後、候補エビデンスのエンティティと属性値との間の関連をそれぞれ効果的に高め、関連度の精度を高める。

全結合層の出力層のニューロンと入力層のそれぞれのニューロンは接続されている。そのため、上記実施形態は全結合層を用いることで、ターゲットエンティティと候補エビデンスの第２層特徴ベクトル、及びターゲット属性値と候補エビデンスの第２層特徴ベクトルを一つの列ベクトルとして処理し、後の第３分類器の処理を容易にする。

選択的に、第２自然言語処理モデルはＥＲＮＩＥモデルを用いる。他の選択可能な形態において、第１自然言語処理モデルはＢＥＲＴモデルを用いでもよい。

選択的に、２つの第２分類器と第３分類器はどちらもＳｏｆｔＭａｘ分類器を用いることができる。

選択的に、図４に示すよう、ステップＳ１０３において、「Ｓ［ＳＥＰ］Ｏ［ＳＥＰ］ＰＡＲＡ」の形式を用いてターゲットエンティティＳ、ターゲット属性値Ｏ、及び候補エビデンスＰＡＲＡを関連度判定モデルに入力する。例えば、検証されるべき医療ファクトが＜麻疹、症状、斑状丘疹状皮疹＞であり、候補エビデンスが「ＸＸＸＸＸ」である場合、「麻疹［ＳＥＰ］斑状丘疹状皮疹［ＳＥＰ］ＸＸＸＸＸ」を関連度判定モデルに入力する。

また、図４の「ＸＣＬＳ」はＸの出力を表し、Ｘは候補エビデンスの関連度である。

１つの実施形態において、ステップＳ１０３における関連度判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた第２自然言語処理モデルと、２つの第２分類器と、全結合層と、第３分類器とを用いて関連度判定モデルを構築することと、
構築した関連度判定モデルを、正しい医療ファクトと支持的なエビデンス、及び正しい医療ファクトと支持的なエビデンスの関連度をそれぞれ含む複数の第２サンプルデータを用いて訓練することと、を含む。

上記実施形態において、医療用言語資料で予め訓練した第２自然言語処理モデルを用いるため、関連度判定モデルの訓練は微調整を行えばよく、即ち少量のサンプルデータを用いて訓練を行えばよい。これにより、サンプルデータの数量に対する要求を大幅にダウンし、人手によりサンプルデータのラベル付けを行うコストをダウンすることができる。

選択的に、第２サンプルデータは、既存の医療ナレッジベースにおいて既知の三次元ＳＰＯとエビデンス検索モジュールにより返された結果に基づいて得ることができる。

選択的に、第２サンプルデータにおいて、医療ファクトと支持的なエビデンスの関連度は人手によるラベル付けで得ることができる。

１つの例において、ステップＳ１０３の関連度判定モデルが出力する候補エビデンスの関連度は１つの数値であってもよく、例えば、区間［０、１］の任意の数である。候補エビデンスの関連度が大きいほど、候補エビデンスの関連度は高く、候補エビデンスがさらに当該医療ファクトが正しいことを裏付けることとなり、当該医療ファクトが正しい確率がさらに高いことを側面から物語る。

他の業界に比べて、医療業界はデータ全体的の正確性に対してされに厳密で厳格である。そのため、上記実施形態が提供する属性判定モデルと関連度判定モデルの、そのモデル構造は巧妙であり、検証結果の正確性の向上に貢献し、さらに医療業界のデータに対する厳密な要求を満たす。その上、本発明の実施形態のモデルは、基礎的な特徴を通して、適切なディープランニングモデル構造を設計し、かつ、大規模なラベル付けされたデータにおいて訓練するため、人手により定義された高レベル特徴に依頼せず、より高い精度とリコール率を取得し、人件費をダウンすることができる。

１つの実施形態において、ステップＳ１０４は、
複数の候補エビデンスのうち少なくとも１つの候補エビデンスの関連度が所定の閾値よりも大きい場合、検証されるべき医療ファクトが正しいことを検証し、かつ、少なくとも１つの候補エビデンスのうち、相関連度が最も高い候補エビデンスを医療ファクトが正しいことを検証する支持的なエビデンスとすること、を含む。

属性判定モデルの検証を既に経ているため、関連度が所定の閾値よりも大きければ、医療ファクトが正しいことを検証でき、判定は簡単であり、かつ、正確度が高い。同時に、相関連度が最も高い候補エビデンスを支持的なエビデンスとし、医療ファクトが正しいことを検証する根拠を提供する。

上記ステップＳ１０４に対して、説明すべきなのは、複数の候補エビデンスのうち１つの候補エビデンスの関連度のみが所定の閾値よりも大きい場合、この１つの関連度が所定の閾値よりも大きい候補エビデンスを直接関連度が最も高い候補エビデンスと認識する。また、医療ファクトが１つの候補エビデンスにのみ対応している場合、候補エビデンスの関連度が所定の閾値よりも大きければ、即ち検証されるべき医療ファクトが正しいことを検証し、かつ、関連度が最も高い候補エビデンスを医療ファクトが正しいことを検証する支持的なエビデンスとする。

他の実施形態において、ステップＳ１０４において予め設定する条件は、他の条件を設定してもよく、例えば、所定の数量を超えた候補エビデンスの関連度は所定の閾値よりも大きいと設定し、所定の数量は１より大きいとする。また、例えば、複数の候補エビデンスのうち関連度が所定の閾値よりも大きい候補エビデンスの割合は所定の割合より大きいと設定する。

他の実施形態において、ステップＳ１０４において関連度の順序が前の複数の候補エビデンスを支持的なエビデンスに置き換えてもよく、かつ、複数の支持的なエビデンスを関連度に基づいて並べ替えて提示することもできる。

１つの実施形態において、本実施形態はさらに、
関連度が所定の閾値よりも大きい少なくとも１つの候補エビデンスが存在しない場合、医療ファクトが正しくないことを検証する。そのうち、関連度が所定の閾値よりも大きい少なくとも１つの候補エビデンスが存在しないことは、すべての候補エビデンスの関連度が所定の閾値よりも小さい、及び候補エビデンスはいずれも対応する関連度がない（即ち、ステップＳ１０２で得られた判定属性はいずれもターゲット属性値と一致しない）ことを含む。

以下、１つの例により上記ステップＳ１０１〜ステップＳ１０４について詳しく説明する。

ステップＳ１０１において、検証されるべき医療ファクト及び候補エビデンスを取得する。そのうち、検証されるべき医療ファクトを＜麻疹、症状、斑状丘疹状皮疹＞、
ターゲットエンティティを「麻疹」、
ターゲット属性を「症状」、
ターゲット属性値を「斑状丘疹状皮疹」とする。

候補エビデンス「麻疹（ｍｅａｓｌｅｓ）」は、麻疹ウイルス（ｍｅａｓｌｅｓｖｉｒｕｓ）により引き起こされるウイルス感染症であり、我が国における法定感染症の中で乙類感染症に属し、その主な臨床症状に発熱、咳、鼻水などのカタル症状と目の結膜炎があり、特徴的な症状はコプリック斑及び斑状丘疹状皮疹である。

ステップＳ１０２において、ターゲットエンティティ「麻疹」、ターゲット属性値「斑状丘疹状皮疹」、及び上記の候補エビデンスを属性判定モデルに入力し、「麻疹」と「斑状丘疹状皮疹」とに対応する判定属性「症状」を得る。

具体的に、図３を参照でき、属性判定モデルは、第１自然言語処理モデルと第１分類器とを含む。まず、第１自然言語処理モデルを通して「麻疹」、「斑状丘疹状皮疹」及び候補エビデンスの第１特徴ベクトルを得、次に、第１分類器を通して、第１特徴ベクトルに基づき判定属性を「症状」と決定する。

ステップＳ１０３において、ターゲット属性「症状」と判定属性「症状」が一致するため、続けてターゲットエンティティ「麻疹」とターゲット属性値「斑状丘疹状皮疹」とを関連度判定モデルに入力し、上記候補エビデンスのターゲットエンティティ「麻疹」とターゲット属性値「斑状丘疹状皮疹」とに関する関連度を得、仮に上記候補エビデンスの関連度を０．８とする。

具体的に、図４を参照でき、関連度判定モデルは、第２自然言語処理モデルと、２つの第２分類器と、全結合層と、第３分類器とを含む。第一に、第２自然言語処理モデルを通して「麻疹」と候補エビデンスの第１層特徴ベクトル、及び「斑状丘疹状皮疹」と候補エビデンスの第１層特徴ベクトルを得る。第二に、２つの第２分類器を通して、それぞれ「麻疹」と候補エビデンスの第１層特徴ベクトル、及び「斑状丘疹状皮疹」と候補エビデンスの第１層特徴ベクトルに基づき対応する「麻疹」と候補エビデンスの第２層特徴ベクトル、及び「斑状丘疹状皮疹」と候補エビデンスの第２層特徴ベクトルを得る。第三に、「麻疹」と候補エビデンスの第２層特徴ベクトル、及び「斑状丘疹状皮疹」と候補エビデンスの第２層特徴ベクトルを全結合層にて処理した後に第３分類器に入力し、第３分類器により出力された候補エビデンスの関連度を得る。

ステップＳ１０４において、仮に所定の条件を関連度が０．７よりも大きいとすると、０．８＞０．７より、候補エビデンスの関連度０．８は所定の条件に相応しく、検証されるべき医療ファクト＜麻疹、症状、斑状丘疹状皮疹＞は正しく、かつ、上記候補エビデンスを＜麻疹、症状、斑状丘疹状皮疹＞が正しいことを検証する支持的なエビデンスとすることができる。

上記提供したのは候補エビデンスの検証過程の例であり、複数の候補エビデンスが存在する場合、例えば、候補エビデンスＡ、候補エビデンスＢ、候補エビデンスＣが存在し、同様に、ステップＳ１０１〜ステップＳ１０４を通して、候補エビデンスＡ、候補エビデンスＢ、候補エビデンスＣの関連度をそれぞれ求め、関連度を順に０．３、０．７５、０．８と得、関連度が０．７よりも大きい候補エビデンスが存在するため、当該医療ファクトは成立することを検証でき、同時に、関連度が最も高い候補エビデンスＣを支持的なエビデンスとすることができる。

以下は、出力された医療ファクト検証結果の一例であり、具体的に、
「Ｓ」を「麻疹」、
「Ｐ」を「症状」、
「Ｏ」を「斑状丘疹状皮疹」、
「ｌａｂｅｌ」を「１」、
「ｅｖｉｄｅｎｃｅ」を「第五節麻疹候補エビデンス「麻疹（ｍｅａｓｌｅｓ）」は、麻疹ウイルス（ｍｅａｓｌｅｓｖｉｒｕｓ）により引き起こされるウイルス感染症であり、我が国における法定感染症の中で乙類感染症に属し、その主な臨床症状に発熱、咳、鼻水などのカタル症状と目の結膜炎があり、特徴的な症状はコプリック斑及び斑状丘疹状皮疹である。」
このうち、ｌａｂｅｌは医療ファクトの検証結果を表し、ｌａｂｅｌ＝１は検証が正しいことを表し、ｌａｂｅｌ＝０は検証が間違っていることを表す。ｅｖｉｄｅｎｃｅは医療ファクトが正しいことを検証する支持的なエビデンスを表す。そのため、上記の例において、検証されるべき医療ファクトＳＰＯ＜麻疹、症状、斑状丘疹状皮疹＞に対して、検証結果は正しく、かつ、『感染症学』第８版により上記ｅｖｉｄｅｎｃｅの段を選択し、当該医療ファクト検証が正しいことの支持的なエビデンスとする。

本発明の実施形態で実現される方法は、事前学習言語モデルに基づく医療ファクト検証方法であり、医療データにおけるファクト検証の効果問題を効果的に向上する。本発明の実施形態によって提供される方法は、下記の少なくとも一つのメリットを有する。

１．汎用性が強く、大量かつ広範な医療ファクト検証問題を処理することができる。

２．人件費が低く、主に次の二点に現れている。第一に、新しいファクト型や新しい文書セット、新しい表現方法に対して、抽出のルールを改めて人手により定義する必要がなく、モデル自体の一般化性によって正しい結果を得ることができる。第二に、事前学習と微調整とを組み合わせる方法でモデルを構築することにより、ラベル付きサンプルの数量に対する要求をダウンし、人手によるサンプルのラベル付けコストをダウンすることができる。

３．通常のファクト検証方法と比べて、本発明の実施形態は医療ファクト検証に適用でき、かつ、データに対する要求が比較的厳密であり、医療データに一定の効果向上をもたらすことができる。

対応敵に、本発明の実施形態は、さらに医療ファクト検証装置を提供し、当該装置に含まれる各モジュールは、電子デバイスのハードウェアに搭載または設定されてもよく、例えば、コンピュータのメモリは、コンピュータの中央プロセッサ（ＣＰＵ、ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）がメモリ内の各モジュールを実行するために、当該装置の各モジュールを搭載することができる。

図５に示すように、図５は当該医療ファクト検証装置５００の構成図であり、装置５００は、
ターゲットエンティティと、ターゲット属性と、ターゲット属性値とを含む、検証されるべき医療ファクト及び候補エビデンスを取得する第１取得モジュール５０１と、
ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを属性判定モデルに入力して、判定属性を得る第１判定モジュール５０２と、
ターゲット属性と判定属性とが一致する場合に、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを関連度判定モデルに入力して、前記候補エビデンスの関連度を得る第２判定モジュール５０３と、
候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証する第１検証モジュール５０４と、を備える。

１つの実施形態において、図６に示すように、医療ファクト検証装置６００はさらに、
ターゲット属性と判定属性とが一致しない場合に、候補エビデンスにより検証されるべき医療ファクトが正しいことを検証できないと決定する第２検証モジュール６０１を備える。

１つの実施形態において、属性判定モデルは、第１自然言語処理モデルと第１分類器とを含み、
図７に示すように、第１判定モジュール５０２は、
ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを第１自然言語処理モデルに入力して、ターゲットエンティティと、ターゲット属性値と、候補エビデンスとの第１特徴ベクトルを得る特徴サブモジュール７０１と、
第１特徴ベクトルを第１分類器に入力して、判定属性を得る属性判定サブモジュール７０２と、を備える。

１つの実施形態において、属性判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた第１自然言語処理モデルと、第１分類器とを用いて、属性判定モデルを構築することと、
構築した属性判定モデルを、正しい医療ファクトと支持的なエビデンスをそれぞれ含む複数の第１サンプルデータを用いて訓練することと、を含む。

１つの実施形態において、関連度判定モデルは、第２自然言語処理モデルと、２つの第２分類器と、全結合層と、第３分類器とを含み、
図８に示すように、第２判定モジュール５０３は、
ターゲットエンティティと、ターゲット属性値と、候補エビデンスとを第２自然言語処理モデルに入力して、ターゲットエンティティと候補エビデンスの第１層特徴ベクトル、及びターゲット属性値と候補エビデンスの第１層特徴ベクトルを得る第１層特徴サブモジュール８０１と、
ターゲットエンティティと候補エビデンスの第１層特徴ベクトル、及びターゲット属性値と候補エビデンスの第１層特徴ベクトルをそれぞれ２つの第２分類器に入力して、ターゲットエンティティと候補エビデンスの第２層特徴ベクトル、及びターゲット属性値と候補エビデンスの第２層特徴ベクトルを得る第２層特徴サブモジュール８０２と、
ターゲットエンティティと候補エビデンスの第２層特徴ベクトル、及びターゲット属性値と候補エビデンスの第２層特徴ベクトルを、全結合層にて処理した後に第３分類器に入力して、候補エビデンスの関連度を得る関連度判定サブモジュール８０３と、を備える。

１つの実施形態において、関連度判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた第２自然言語処理モデルと、２つの第２分類器と、全結合層と、第３分類器とを用いて関連度判定モデルを構築することと、
構築した関連度判定モデルを、正しい医療ファクトと支持的なエビデンス、及び正しい医療ファクトと支持的なエビデンスの関連度をそれぞれ含む複数の第２サンプルデータを用いて訓練することと、を含む。

１つの実施形態において、図９に示すように、第１検証モジュール５０４は、
複数の候補エビデンスのうち少なくとも１つの候補エビデンスの関連度が所定の閾値よりも大きい場合、検証されるべき医療ファクトが正しいことを検証する検証サブモジュール９０１と、
少なくとも１つの候補エビデンスのうち、相関連度が最も高い候補エビデンスを医療ファクトが正しいことを検証する支持的なエビデンスとするエビデンスサブモジュール９０２と、を備える。

本発明の実施形態に係る各装置における各モジュールの機能は、上述の方法における対応する説明を参照できるため、ここでは説明を省略する。
本発明に係る実施形態は、電子デバイスと非一過性のコンピュータ可読取記録媒体をさらに提供する。

図１０に示すように、本発明の実施形態による医療ファクト検証方法を実現する電子デバイスのブロック図である。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような様々な形態のデジタルコンピュータを表すことができる。また、電子デバイスはパーソナルデジタル処理、携帯電話、スマートフォン、装着可能デバイス、及びその他の類似のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。ここで示した構成要素、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本発明で説明されたもの及び／または要求される本発明の実施を制限することは意図されない。

図１０に示すように、当該電子デバイスは、１つ又は複数のプロセッサ１００１と、メモリ１００２と、高速インターフェースと低速インターフェースとを含む各構成要素を接続するためのインターフェースとを含む。各構成要素は、異なるバスを利用して互いに接続し、共通のマザーボードに取り付けられてもよいし、必要に応じて他の方法で取り付けられてもよい。プロセッサは、電子デバイス内で実行される命令を処理してもよく、また、外部入出力デバイス（例えば、インターフェースに接続された表示デバイス）にグラフィックユーザインターフェース（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ，ＧＵＩ）を表示するための、メモリまたはメモリ上に記憶されたグラフィカル情報の命令を含む。他の実施形態では、必要に応じて、複数のプロセッサ及び／または複数のバスを複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子デバイスを接続してもよく、各デバイスは、部分的に必要な動作（例えば、サーバアレイ、ブレードサーバのセット、またはマルチプロセッサシステムとして）を提供する。図１０においてプロセッサ１００１を例とする。

メモリ１００２は、本発明にて提供された非一過性のコンピュータ可読記憶媒体である。メモリは、本発明で提供される医療ファクト検証方法を少なくとも１つのプロセッサに実行させるように、少なくとも１つのプロセッサによって実行されることができる命令を記憶する。本発明における非一過性のコンピュータ可読記憶媒体は、本発明で提供された医療ファクト検証方法をコンピュータに実行させるためのコンピュータ命令を記憶する。

メモリ１００２は、非一過性のコンピュータ可読記憶媒体として、非一過性のソフトウェアプログラム、非一過性のコンピュータ実行可能なプログラム及びモジュールを記憶するために使用されてもよく、本発明の実施形態における医療ファクト検証方法に対応するプログラム命令／モジュール（例えば、図５に示される第１取得モジュール５０１、第１判定モジュール５０２、第２判定モジュール５０３及び第１検証モジュール５０４）のようなものである。プロセッサ１００１は、メモリ１００２に記憶されている非一過性のソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理、すなわち上述した方法に関する実施形態に係る医療ファクト検証方法を実行する。

メモリ１００２は、オペレーティングシステムや少なくとも１つの機能に必要なアプリケーションを記憶することができるプログラムの記憶領域と、ターゲット検出方法に係る電子デバイスの使用によって生成されたデータなどを記憶することができるデータの記憶領域と、を含むことができる。さらに、メモリ１００２は、高速ランダムアクセスメモリを含んでもよく、非一過性の固体記憶装置を含んでもよい。例えば、少なくとも１つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の非一過性の固体記憶装置を含むことができる。いくつかの実施形態では、メモリ１００２はオプションとして、プロセッサ１００１に対して遠隔的に設定されたメモリを含み、これらの遠隔メモリは、ネットワークを介して医療ファクト検証方法に係る電子デバイスに接続されてもよい。上記のネットワークの例は、インターネット、企業内ネットワーク、ローカルネットワーク、モバイル通信ネットワーク及びその組み合わせを含むが、これらに限定されない。

当該電子デバイスは、入力装置１００３と出力装置１００４とをさらに含むことができる。プロセッサ１００１、メモリ１００２、入力装置１００３、及び出力装置１００４は、バスまたは他の方法で接続されてもよく、図１０ではバスを介して接続されている。

入力装置１００３は、入力された数字または文字を受信し、ターゲット検出方法に係る電子デバイスのユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチパネル、キーパッド、マウス、トラックボード、タッチパッド、指示棒、１つまたは複数のマウスボタン、トラックボール、ジョイスティックなどを含むことができる。出力装置１００４は、表示装置、補助照明装置（例えばＬＥＤ）、及び触覚フィードバック装置（例えば、振動モータ）などを含むことができる。この表示装置は、液晶ディスプレイ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ、ＬＣＤ）、発光ダイオード（ＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ、ＬＥＤ）ディスプレイ及びプラズマディスプレイを含むことができるがこれらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。

本発明におけるシステム及び技術に係る様々な実施形態は、デジタル電子回路システム、集積回路システム、専用集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔｓ、ＡＳＩＣ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／またはこれらの組み合わせによって実現されることができる。これらの様々な実施形態は、１つまたは複数のコンピュータプログラムにおいて実装されてもよく、この１つまたは複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステム上で実行されてもよく、及び／または解釈されてもよく、このプログラマブルプロセッサは、専用または汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置より、データと命令を受信し、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置に、データと命令を送信する。

これらの計算プログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードともいう）は、プログラマブルプロセッサのマシン命令を含み、プロセス指向及び／またはオブジェクト指向プログラミング言語、及び／またはアセンブリ／マシン言語を用いてこれらの計算プログラムを実施することができる。本発明で使用されるように、「機械可読媒体」及び「コンピュータ可読媒体」という用語は、マシン命令及び／またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、及び／または装置（例えば、磁気ディスク、光ディスク、メモリ、編集可能論理デバイス（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｄｅｖｉｃｅ、ＰＬＤ）を意味し、機械読み取り可能な信号としてのマシン命令を受信する機械可読媒体を含む。「機械読み取り可能な信号」という用語は、マシン命令及び／またはデータをプログラマブルプロセッサに提供するための任意の信号を意味する。

ユーザとのイントラクションを提供するために、本発明で説明されているシステムや技術は、コンピュータ上で実施されてもよく、また、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ、ブラウン管）またはＬＣＤ（液晶ディスプレイ）モニタ）と、入力をコンピュータに提供するためのキーボード及びポインティングデバイス（例えば、マウスまたはトラックボール）とを備えてもよい。他の種類の装置も、ユーザとのイントラクションを提供するために使用され得る。例えば、ユーザに提供されたフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、ユーザからの入力は、いかなる形式（音響入力、音声入力、または触覚入力を含む）で受信されてもよい。

本発明で説明されているシステム及び技術は、バックグラウンド構成要素を含む計算システム（例えば、データサーバとして）、または中間部構成要素を含む計算システム（例えば、アプリケーションサーバ）、または、フロントエンド構成要素を含む計算システム（例えば、グラフィカルユーザインタフェースまたはネットワークブラウザを備えたユーザコンピュータであって、ユーザがこのグラフィカルユーザインタフェースまたはネットワークブラウザを介して本発明で説明されたシステム及び技術に係る実施形態とインタラクションを行うことができるユーザコンピュータ）に実行されてもよく、または、このようなバックグラウンド構成要素、中間部構成要素、またはフロントエンド構成要素の任意の組合せを含む計算システムにおいて実行されてもよい。システムの構成要素は、任意の形態または媒体のデジタルデータ通信（例えば、通信ネットワーク）によって相互に接続されてもよい。通信ネットワークの例えとして、ローカルネットワーク（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ，ＬＡＮ）、広域ネットワーク（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ，ＷＡＮ）及びインターネットを含む。

コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバは一般的に相互に離れており、通信ネットワークを介してインタラクションを行う。クライアントとサーバとの関係を持つコンピュータプログラムがそれぞれのコンピュータ上で実行されることによって、クライアントとサーバとの関係は構築される。

本発明の実施形態の技術案によると、属性判定モデルと関連度判定モデルを用いて、属性と関連度の判定を順次に完成することで、候補エビデンスに記載されている属性がターゲット属性を満たし、かつ、関連度が条件を満たす場合に医療ファクトが正しいことを検証する技術手段となり、従来の人手による検証が必要なためにコストが高くなってしまう技術問題を克服し、人件費をダウンでき、さらに大規模なデーターを処理することに適するようになった。

上記の様々な態様のフローを使用して、ステップを新たに順序付け、追加、または削除することが可能であることを理解すべきである。例えば、本発明で記載された各ステップは、並列に実行しても良いし、順次に実行しても良いし、異なる順序で実行しても良い。本発明で開示された技術案が所望する結果を実現することができる限り、本発明ではこれに限定されない。

上記具体的な実施形態は、本発明の保護範囲に対する限定を構成するものではない。当業者は、設計事項やその他の要因によって、様々な修正、組み合わせ、サブ組み合わせ、及び代替が可能であることを理解するべきである。本発明の要旨及び原則内における変更、均等な置換及び改善等は、いずれも本発明の保護範囲に含まれるべきである。

Claims

ターゲットエンティティと、ターゲット属性と、ターゲット属性値とを含む、検証されるべき医療ファクト及び候補エビデンスを取得することと、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを属性判定モデルに入力して、判定属性を得ることと、
前記ターゲット属性と前記判定属性とが一致する場合に、前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを関連度判定モデルに入力して、前記候補エビデンスの関連度を得ることと、
前記候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証することと、を含む、
ことを特徴とする医療ファクト検証方法。
前記ターゲット属性と前記判定属性とが一致しない場合に、前記候補エビデンスにより前記検証されるべき医療ファクトが正しいことを検証できないと決定する、
ことを特徴とする請求項１に記載の医療ファクト検証方法。
前記属性判定モデルは、第１自然言語処理モデルと第１分類器とを含み、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを属性判定モデルに入力して、判定属性を得ることは、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを前記第１自然言語処理モデルに入力して、前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとの第１特徴ベクトルを得ることと、
前記第１特徴ベクトルを前記第１分類器に入力して、前記判定属性を得ることと、を含む、
ことを特徴とする請求項１に記載の医療ファクト検証方法。
前記属性判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた前記第１自然言語処理モデルと、前記第１分類器とを用いて、前記属性判定モデルを構築することと、
前記構築した属性判定モデルを、正しい医療ファクトと支持的なエビデンスをそれぞれ含む複数の第１サンプルデータを用いて訓練することと、を含む、
ことを特徴とする請求項３に記載の医療ファクト検証方法。
前記関連度判定モデルは、第２自然言語処理モデルと、２つの第２分類器と、全結合層と、第３分類器とを含み、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを関連度判定モデルに入力して、前記候補エビデンスの関連度を得ることは、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを前記第２自然言語処理モデルに入力して、前記ターゲットエンティティと前記候補エビデンスの第１層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第１層特徴ベクトルを得ることと、
前記ターゲットエンティティと前記候補エビデンスの第１層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第１層特徴ベクトルをそれぞれ前記２つの第２分類器に入力して、前記ターゲットエンティティと前記候補エビデンスの第２層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第２層特徴ベクトルを得ることと、
前記ターゲットエンティティと前記候補エビデンスの第２層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第２層特徴ベクトルを、前記全結合層にて処理した後に前記第３分類器に入力して、前記候補エビデンスの関連度を得ることと、を含む、
ことを特徴とする請求項１に記載の医療ファクト検証方法。
前記関連度判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた前記第２自然言語処理モデルと、前記２つの第２分類器と、前記全結合層と、前記第３分類器とを用いて前記関連度判定モデルを構築することと、
前記構築した関連度判定モデルを、正しい医療ファクトと支持的なエビデンス、及び正しい医療ファクトと支持的なエビデンスの関連度をそれぞれ含む複数の第２サンプルデータを用いて訓練することと、を含む、
ことを特徴とする請求項５に記載の医療ファクト検証方法。
前記候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証することは、
複数の候補エビデンスのうち少なくとも１つの候補エビデンスの関連度が所定の閾値よりも大きい場合、前記検証されるべき医療ファクトが正しいことを検証し、かつ、前記少なくとも１つの候補エビデンスのうち、前記関連度が最も高い候補エビデンスを前記医療ファクトが正しいことを検証する支持的なエビデンスとする、
ことを特徴とする請求項１に記載の医療ファクト検証方法。
ターゲットエンティティと、ターゲット属性と、ターゲット属性値とを含む、検証されるべき医療ファクト及び候補エビデンスを取得する第１取得モジュールと、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを属性判定モデルに入力して、判定属性を得る第１判定モジュールと、
前記ターゲット属性と前記判定属性とが一致する場合に、前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを関連度判定モデルに入力して、前記候補エビデンスの関連度を得る第２判定モジュールと、
前記候補エビデンスの関連度が所定の条件を満たす場合に、検証されるべき医療ファクトが正しいことを検証する第１検証モジュールと、を備える、
ことを特徴とする医療ファクト検証装置。
前記ターゲット属性と前記判定属性とが一致しない場合に、前記候補エビデンスにより前記検証されるべき医療ファクトが正しいことを検証できないと決定する第２検証モジュールを備える
ことを特徴とする請求項８に記載の医療ファクト検証装置。
前記属性判定モデルは、第１自然言語処理モデルと第１分類器とを含み、
第１判定モジュールは、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを前記第１自然言語処理モデルに入力して、前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとの第１特徴ベクトルを得る特徴サブモジュールと、
前記第１特徴ベクトルを前記第１分類器に入力して、前記判定属性を得る属性判定サブモジュールと、を備える、
ことを特徴とする請求項８に記載の医療ファクト検証装置。
前記属性判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた前記第１自然言語処理モデルと、前記第１分類器とを用いて、前記属性判定モデルを構築することと、
前記構築した属性判定モデルを、正しい医療ファクトと支持的なエビデンスをそれぞれ含む複数の第１サンプルデータを用いて訓練することと、を含む、
ことを特徴とする請求項１０に記載の医療ファクト検証装置。
前記関連度判定モデルは、第２自然言語処理モデルと、２つの第２分類器と、全結合層と、第３分類器とを含み、
第２判定モジュールは、
前記ターゲットエンティティと、前記ターゲット属性値と、前記候補エビデンスとを前記第２自然言語処理モデルに入力して、前記ターゲットエンティティと前記候補エビデンスの第１層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第１層特徴ベクトルを得る第１層特徴サブモジュールと、
前記ターゲットエンティティと前記候補エビデンスの第１層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第１層特徴ベクトルをそれぞれ前記２つの第２分類器に入力して、前記ターゲットエンティティと前記候補エビデンスの第２層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第２層特徴ベクトルを得る第２層特徴サブモジュールと、
前記ターゲットエンティティと前記候補エビデンスの第２層特徴ベクトル、及び前記ターゲット属性値と前記候補エビデンスの第２層特徴ベクトルを、前記全結合層にて処理した後に前記第３分類器に入力して、前記候補エビデンスの関連度を得る関連度判定サブモジュールと、を備える、
ことを特徴とする請求項８に記載の医療ファクト検証装置。
前記関連度判定モデルの構築方式は、
医療用言語資料に基づき予め訓練して得られた前記第２自然言語処理モデルと、前記２つの第２分類器と、前記全結合層と、前記第３分類器とを用いて前記関連度判定モデルを構築することと、
前記構築した関連度判定モデルを、正しい医療ファクトと支持的なエビデンス、及び正しい医療ファクトと支持的なエビデンスの関連度をそれぞれ含む複数の第２サンプルデータを用いて訓練することと、を含む、
ことを特徴とする請求項１２に記載の医療ファクト検証装置。
第１検証モジュールは、
複数の候補エビデンスのうち少なくとも１つの候補エビデンスの関連度が所定の閾値よりも大きい場合、前記検証されるべき医療ファクトが正しいことを検証する検証サブモジュールと、
前記少なくとも１つの候補エビデンスのうち、前記関連度が最も高い候補エビデンスを前記医療ファクトが正しいことを検証する支持的なエビデンスとするエビデンスサブモジュールと、を備える、
ことを特徴とする請求項８に記載の医療ファクト検証装置。
１つ又は複数のプロセッサと、
前記１つ又は複数のプロセッサに通信接続されるメモリとを備え、
前記メモリには、前記１つ又は複数のプロセッサにより実行可能なコマンドを記憶しており、
前記１つ又は複数のプロセッサは、前記１つ又は複数のコマンドを実行する場合、請求項１〜７のいずれか１項に記載の医療ファクト検証方法を実行させる、
ことを特徴とする電子デバイス。
請求項１〜７のいずれか１項に記載のターゲット検出方法をコンピュータに実行させるためのコンピュータコマンドを記憶した非一過性のコンピュータ可読記憶媒体。
コンピュータにおいて、プロセッサにより実行される場合、請求項１〜７のいずれか１項に記載の医療ファクト検証方法を実現することを特徴とするプログラム。