JP6975253B2 - エンティティ間のコンテキスト的類似度の学習及び適用 - Google Patents

エンティティ間のコンテキスト的類似度の学習及び適用 Download PDF

Info

Publication number
JP6975253B2
JP6975253B2 JP2019556710A JP2019556710A JP6975253B2 JP 6975253 B2 JP6975253 B2 JP 6975253B2 JP 2019556710 A JP2019556710 A JP 2019556710A JP 2019556710 A JP2019556710 A JP 2019556710A JP 6975253 B2 JP6975253 B2 JP 6975253B2
Authority
JP
Japan
Prior art keywords
context
entity
similarity
function
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019556710A
Other languages
English (en)
Other versions
JP2020518050A (ja
JP2020518050A5 (ja
Inventor
ブライアン コンロイ
ミンナン シュウ
アシフ ラーマン
ブランドン クリスティアン モーリシオ ポテス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2020518050A publication Critical patent/JP2020518050A/ja
Publication of JP2020518050A5 publication Critical patent/JP2020518050A5/ja
Application granted granted Critical
Publication of JP6975253B2 publication Critical patent/JP6975253B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • G16H20/17ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients delivered via infusion or injection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medicinal Chemistry (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Automation & Control Theory (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

関連出願への相互参照
本願は、2017年4月20日に出願された米国仮出願第62/487,720号の優先権及び利益を主張し、その全体は参照により本明細書に組み込まれる。
[0001] 本明細書に説明する様々な実施形態は、概して、エンティティデータ分析に関する。より詳細には、排他的ではないが、本明細書に開示する様々な方法及び装置は、エンティティのコンテキスト的類似度を学習及び適用するための技術に関する。
[0002] 様々な臨床意思決定支援(「CDS」)アルゴリズムが開発されて、短期及び/又は長期の患者の状態悪化のリスクスコアが提供されている。これらのリスクスコアは、リスクの高い患者をうまく特定するのに役立ち、臨床医に介入方針を適切に計画する時間を与える。この治療の意思決定手順は、場合により、臨床ガイドラインによって決定される。
しかし、ガイドラインは個人に合わされておらず、考えられるすべての状況を考慮することができない。それどころか、決定は臨床医に任されることが多く、また、臨床医は過去の経験に頼らなければならない。
[0003] 本開示は、エンティティのコンテキスト類似度を学習及び適用するための技術に関する。例えば様々な実施形態において、本明細書において説明する技術は、特定の患者エンティティを治療する臨床医(例えば医師、看護師)、介護者等によって使用され、特に特定の医学的コンテキストにおいて類似する他の患者を特定することができる。コンテキスト的に類似する他の患者を特定することにより、臨床医はどの治療が効果的であったか又は効果的でなかったか、どの治療が特定の転帰をもたらす傾向があったか等を知ることができる。本明細書では、治療中の患者(本明細書では「クエリ患者」とも呼ぶ)(様々な医学的コンテキストにおいてクエリ患者に類似する他の患者(コホート等)を含む)に関する様々な情報へのアクセスを臨床医に提供する様々なポイントオブケア療法決定支援ツール(例えばプロセッサによって実行されるソフトウェア)について説明する。
[0004] 様々な実施形態において、人工知能(例えば深層学習、機械学習、カーネル分類、マルチカーネル学習等)及び/又は統計的技術といった技術を使用して、コンテキスト的に類似する患者の特定を容易にすることができる。例えば幾つかの実施形態では、複数の「テンプレート類似度関数」(又は「テンプレート類似度関数」の「プール」)が生成される。テンプレート類似度関数のプールの各テンプレート類似度関数は、クエリ患者に関連付けられる特徴ベクトルの幾つかのサブセットを、本明細書では「候補患者」と呼ぶ1人以上の他の患者に関連付けられる特徴ベクトルの対応するサブセットと比較する。患者といったエンティティは、時間と共に変化する状態を有する。したがって、クエリ患者特徴ベクトルといったエンティティ特徴ベクトルは、特定の瞬間における又は時間枠内のエンティティの状態の「スナップショット」とみなされる。例えば時間が経過し、患者が更に多くの検査、治療、測定等を受けると、患者の特徴ベクトルも、時間と共に同様に変化する。
[0005] 幾つかの実施形態では、各テンプレート類似度関数は、患者に関連付けられる特徴ベクトルの所与の特徴サブセットに関して、2人の患者がどれだけ類似しているかを決定するようにデザイン又は「調整」される。結果として、各テンプレート類似度関数の形状は、比較される特徴サブセットに関連付けられた母集団統計(例えば分布)によって誘導される。これらの母集団統計は、例えば遡及的患者データベースから導出されてよい。幾つかの実施形態では、1つ以上のテンプレート類似度関数を調整して、特定の特徴の分布の「裾(tail)」に向かう外れ値といった異常値を共有する患者間の類似度を強調又は増幅することができる。全体として、テンプレート類似度関数のプールは、2人の患者間の類似度を多角的に示す。
[0006] 幾つかの実施形態では、テンプレート類似度関数のプールからの出力は、本明細書で「合成類似度関数」と呼ぶものへの入力(例えば全体に適用される)として提供される。幾つかの実施形態では、合成類似度関数は、テンプレート類似度関数のプールの出力に基づいて、本明細書でクエリ患者及び候補患者の「総合類似度スコア」と呼ぶものを計算する。様々な実施形態において、合成類似度関数は、機械学習モデル、深層学習モデル、統計モデル等の形をとる。幾つかの実施形態では、合成類似度関数は、テンプレート類似度関数のプールの出力の凸結合を計算する。
[0007] 幾つかの実施形態では、合成類似度関数は、複数のテンプレート類似度関数の各出力の重み付き結合の形をとる。様々なコンテキストにおけるテンプレート類似度関数出力に、様々な重みセットが適用される。例えば第1の重みセットが血行動態不安定性のコンテキストにおいて適用され、第2の重みセットが急性腎障害のコンテキストにおいて適用され、その他同様にされる。特定の医学的コンテキストにおいて適用される重みは、そのコンテキストに比較的重要な個々のテンプレート類似度関数の出力を増幅するように調整することができる。当該医学的コンテキストにおいて重要性の低い他の出力は、それほど重い重みが付けられなくてよい。
[0008] 重みは様々なやり方で学習される。幾つかの実施形態では、重みは、カーネル平滑化アルゴリズムといった1つ以上のマルチカーネル学習技術を使用して学習される。これらの重みを学習すること、つまり、合成類似度関数のコンテキスト固有のバージョンをトレーニングすることは、特定の医学的コンテキストに対してラベル付けされたトレーニングデータに基づいていてよい。例えば血行動態不安定性のコンテキストの重みを学習するためには、血行動態不安定性の何らかの尺度でラベル付けされたトレーニングデータが適用され、急性腎障害のコンテキストの重みを学習するためには、急性腎障害の何らかの尺度でラベル付けされたトレーニングデータが適用され、その他同様にされる。
[0009] 様々な医学的コンテキストについての重みが学習されると、テンプレート類似度関数のプール及び合成類似度関数を、クエリ患者及び1人以上の候補患者の特徴ベクトルに適用して、様々なコンテキストにおける類似する候補患者を特定することができる。例えば血行動態不安定性のコンテキストにおいてクエリ患者と最も類似する候補患者のランクリストが決定されて提供される。幾つかの実施形態では、このランクリストを使用して、例えばコンテキスト的に類似する患者の「コホート」を特定することができる。そうすれば、臨床医は、類似患者のコホートに行われた治療及び結果としてもたらされる転帰を評価して、クエリ患者の治療をより理性的に選択することができる。更に又は或いは、幾つかの実施形態では、例えば関心コンテキストに関連付けられた重みを選択することにより、テンプレート類似度関数のプール及び合成類似度関数を使用して、特定のコンテキストにおけるクエリ患者の臨床状態を予測することができる。
[0010] 本明細書に説明する例はヘルスケアに関連しているが、これは限定を意味するものではない。本明細書に説明する技術は、ヘルスケア以外の様々な分野に適用することができる。例えば本明細書に説明する技術を使用して、薬物及び/又はアルコール乱用のリハビリテーションを必要とする個人とコンテキスト的に類似するエンティティを特定し、例えばコンテキスト的に類似する個人の転帰を学習して、リハビリテーション計画の選択に活用することができる。本明細書に説明する技術は、旅行(例えば趣味が似ている他の人を特定して、最も楽しめそうな旅程を選択する)や、スポーツ(例えばチーム選択のために運動選手を比較する)等といった他の分野でも使用することができる。
[0011] 更に、本明細書に説明する技術は、様々な技術的利点をもたらす。例えば本明細書に説明するようにテンプレート類似度関数を調整することによって、値が存在する場合にテンプレート類似度関数は合成類似度関数の出力にしか寄与しないので、欠損データへの代入手法を回避することができる。データ代入の必要性を排除することで、不正確さが減少され、プロセッササイクルやメモリ等といった計算リソースが節約される。更に、特に様々なコンテキストについて学習した様々な重みを持つ合成類似度関数を使用することにより、パフォーマンスを改善しないテンプレート類似度を無視できるようにするスパース化正則化機能(例えばL1ノルム等)を効果的に課すことができる。ヘルスケア分野では、コンテキスト的に類似するコホートを正確に特定し、特にコホートの治療及び/又は転帰を評価することができると、より理性的及び/又は効率的な臨床的意思決定を容易にすることができる。
[0012] 一般に、一態様において、方法は、複数のテンプレート類似度関数を提供するステップと、複数のテンプレート類似度関数のそれぞれの出力の重み付け結合として合成類似度関数を提供するステップと、第1のコンテキストトレーニングデータとして、第1の複数のラベル付きエンティティベクトルを提供するステップと、第1のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、合成類似度関数の出力と第1のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第1のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータに対する第1のコンテキストラベルを近似させるように近似関数を適用するステップと、合成類似度関数に基づいて、第1のコンテキスト固有の合成類似度関数をトレーニングするステップとを含む。複数のテンプレート類似度関数の各テンプレート類似度関数は、クエリエンティティ特徴ベクトルの特徴のサブセットを、候補エンティティ特徴ベクトルの特徴の対応するサブセットと比較する。第1のコンテキスト固有の合成類似度関数をトレーニングするステップは、第1のコンテキストトレーニングデータへの近似関数の適用の出力に基づいて、第1の損失関数を使用して、複数のテンプレート類似度関数の第1のコンテキスト重みを学習するステップを含む。第1のコンテキスト重みは、第1のコンテキスト固有の合成類似度関数の一部として使用するために格納される。
[0013] 様々な実施形態において、方法は更に、第2のコンテキストトレーニングデータとして、第2の複数のラベル付きエンティティベクトルを提供するステップと、第2のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、合成類似度関数の出力と第2のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第2のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータの第2のコンテキストラベルを近似させるように近似関数を適用するステップと、合成類似度関数に基づいて、第2のコンテキスト固有の合成類似度関数をトレーニングするステップとを含む。第2のコンテキスト固有の合成類似度関数をトレーニングするステップは、第2のコンテキストトレーニングデータへの近似関数の適用の出力に基づいて、第2の損失関数を使用して、複数のテンプレート類似度関数の第2のコンテキスト重みを学習するステップを含む。第2のコンテキスト重みは、第2のコンテキスト固有の合成類似度関数の一部として使用するために格納される。
[0014] 様々な実施形態において、第1のコンテキスト固有の合成類似度関数を、後続のクエリエンティティ特徴ベクトル及び候補エンティティ特徴ベクトルに適用して、第1の医学的コンテキストにおける後続のクエリエンティティ特徴ベクトルと候補エンティティ特徴ベクトルとの間の類似度尺度を決定することができる。様々な実施形態において、第2のコンテキスト固有の合成類似度関数を、後続のクエリエンティティ特徴ベクトル及び候補エンティティ特徴ベクトルに適用して、第1の医学的コンテキストとは異なる第2の医学的コンテキストにおける後続のクエリエンティティ特徴ベクトルと候補エンティティ特徴ベクトルとの間の別の類似度尺度を決定することができる。
[0015] 様々な実施形態において、第1の医学的コンテキストは、血行動態安定性を含む。様々な実施形態において、第2の医学的コンテキストは、急性腎障害を含む。様々な実施形態において、複数のテンプレート類似度関数を提供するステップは、クエリエンティティ特徴ベクトル及び候補エンティティ特徴ベクトルによって共有される少なくとも1つの特徴を選択するステップと、複数の候補エンティティにわたる選択された特徴の母集団分布を決定するステップと、母集団分布に従って、クエリエンティティ特徴ベクトルの選択された特徴値と候補エンティティ特徴ベクトルの選択された特徴値との間の選択された特徴値を有する任意のエンティティの累積確率スコアを計算する複数のテンプレート類似関数のうちの所与のテンプレート類似関数を生成するステップとを含む。
[0016] 様々な実施形態において、所与のテンプレート類似度関数は、母集団分布にわたる他のエンティティに対するクエリエンティティ特徴ベクトル及び候補エンティティ特徴ベクトルの少なくとも一方の平均類似度スコアに基づいて更に正規化される。様々な実施形態において、近似関数は、カーネル平滑化関数を含む。
[0017] なお、前述の概念及び以下でより詳しく説明する追加の概念のあらゆる組み合わせ(これらの概念が互いに矛盾しないものであることを条件とする)は、本明細書で開示される本発明の主題の一部をなすものと考えられることを理解すべきである。特に、本開示の終わりに登場する請求項に係る主題のあらゆる組み合わせは、本明細書に開示される本発明の主題の一部であると考えられる。なお、参照により組み込まれる任意の開示内容にも登場する、本明細書にて明示的に使用される用語には、本明細書に開示される特定の概念と最も整合性のある意味が与えられるべきであることを理解すべきである。
[0018] 図面において、同様の参照符号は、概して様々な図面全体で同じ部分を指す。また、図面は必ずしも縮尺通りではなく、代わりに、本明細書に説明する実施形態の様々な原理を例示することに重点が置かれている。
[0019]図1は、様々な実施形態に従って本開示の選択された態様が実装される環境を概略的に示す。 [0020]図2は、様々な実施形態に従ってテンプレート類似度関数を生成するための技術を説明する。 [0021]図3は、本明細書に説明する技術を使用して決定される情報を提示する例示的なグラフィカルユーザインターフェースを示す。 [0021]図4は、本明細書に説明する技術を使用して決定される情報を提示する例示的なグラフィカルユーザインターフェースを示す。 [0021]図5は、本明細書に説明する技術を使用して決定される情報を提示する例示的なグラフィカルユーザインターフェースを示す。 [0022]図6は、本開示の選択された態様を実施するための例示的な方法を示す。 [0022]図7は、本開示の選択された態様を実施するための例示的な方法を示す。 [0023]図8は、例示的なコンピューティングシステムの構造を概略的に示す。
[0024] 様々な臨床意思決定支援(「CDS」)アルゴリズムが開発されて、短期及び/又は長期の患者の状態悪化のリスクスコアが提供されている。これらのリスクスコアは、リスクの高い患者をうまく特定するのに役立ち、臨床医に介入方針を適切に計画する時間を与える。この治療の意思決定手順は、場合により、臨床ガイドラインによって決定される。しかし、ガイドラインは個人に合わされておらず、考えられるすべての状況を考慮することができない。それどころか、決定は臨床医に任されることが多く、また、臨床医は過去の経験に頼らなければならない。一般に、様々な領域において、様々な目的で、患者といったエンティティ間のコンテキスト的な類似度を決定することができると有益である。
[0025] 上記に鑑みて、本開示の様々な実施形態及び実施態様は、エンティティのコンテキスト的な類似度の学習及び適用に関する。図1を参照すると、本開示の選択された態様が実装される環境を概略的に示す。インターネットといった1つ以上のネットワーク110を介してネットワーク通信する1つ以上のクライアントデバイス102、エンティティ類似度システム104、遡及的患者データベース106及びトレーニングデータベース108を示す。様々な実施形態では、コンポーネント102〜108うちの1つ以上が省略されたり、他のコンポーネントと組み合わせられたり、また、他のコンポーネントが追加されてもされなくてもよい。
[0026] 1つ以上のクライアントデバイス102は、例えばデスクトップコンピューティングデバイス、ラップトップコンピューティングデバイス、タブレットコンピューティングデバイス、携帯電話コンピューティングデバイス、ユーザの車両のコンピューティングデバイス(例えば車載通信システム、車載エンターテイメントシステム、車載ナビゲーションシステム)、スタンドアロンのインタラクティブスピーカ、スマートテレビ等のスマート機器及び/又はコンピューティングを含むユーザのウェアラブル装置(例えばコンピューティングデバイスが備わったユーザの時計、コンピューティングデバイスが備わったユーザの眼鏡、仮想現実又は拡張現実コンピューティングデバイス)のうちの1つ以上を含んでよい。追加及び/又は代替のクライアントコンピューティングデバイスが提供されてもよい。
[0027] 様々な実施形態において、クライアントデバイス102は、ウェブブラウザ、電子メールクライアント、メッセージングクライアント、ソーシャルメディアクライアント等といった様々な異なるアプリケーションを動作させる。本開示では、最も重要なことは、クライアントデバイス102(以下、単数形で参照する)は、臨床医決定アプリケーション112を動作させることである。臨床医決定アプリケーション112は、本開示の様々な態様を使用して決定される情報を評価するために、例えば臨床医又は特定の患者状態に関心のある別の個人(例えば介護者、研究者等)によって操作可能なソフトウェアである。図3から図5は、様々な実施形態に従って臨床医決定アプリケーション112によって生成及び/又は提示されうる例示的なグラフィカルユーザインターフェース(「GUI」)を示す。
[0028] エンティティ類似度システム104は、本例及び本明細書に説明する他の例では患者であってよいコンテキスト的に類似するエンティティを特定するために使用可能なデータを収集、生成及び/又は計算するために集合的に動作してよい1つ以上のコンピューティングデバイスを含む。幾つかの実施形態では、エンティティ類似度システム104は、1つ以上のモジュール又はエンジンを含んでよく、そのいずれもハードウェア及び/又はソフトウェアの任意の組み合わせを使用して実現されてよい。図1では、例えばエンティティ類似度システム104は、類似度トレーニングエンジン114及び類似度検出エンジン116を含む。他の実施形態では、類似度トレーニングエンジン114及び類似度検出エンジン116は、単一のエンジン又はモジュールにまとめられてもよい。幾つかの実施形態では、また、以下でより詳細に説明するように、エンティティ類似度システム104は、複数の類似度テンプレート関数118及び/又は1つ以上の機械学習モデル120を使用して、患者といったエンティティ間のコンテキスト類似度を計算する。
[0029] 遡及的患者データベース106は、年齢、体重、診断、バイタルサイン、実施された検査、検査結果、処方された/行われた治療、薬物療法等といった患者に関する情報を含む。幾つかの実施形態では、遡及的患者データベース106は、例えば複数の患者の電子医療記録(「EMR」)を格納するために使用される従来の病院情報システム(「HIS」)の形をとる。以下でより詳細に説明するように、遡及的患者データベース106の患者記録と、場合によってはこれらの記録から生成/抽出された特徴ベクトルとを使用して、本明細書に説明する技術を行うための候補患者を提示することができる。遡及的患者データベース106(及び本明細書に説明する任意の他のデータベース又は指標)は、図1では単一のデータベースとして示すが、実際にはいわゆる「クラウド」コンピューティングシステム又はアーキテクチャを提供するように協働するコンピューティングシステムのグループといった1つ以上のコンピューティングシステムによって運用される任意の数のデータベースを使用して実現される。
[0030] トレーニングデータベース108は、例えば機械学習モデル120をトレーニングするために使用される1つ以上のコンテキストトレーニングデータセット1221−Nを格納する。幾つかの実施形態では、トレーニングデータベース108及び遡及的患者データベース106は、単一の論理的及び/又は物理的データベースにまとめられてよい。幾つかの実施形態では、複数のコンテキストトレーニングデータセット1221−Nが、トレーニングデータベース108に格納される。後で詳しく説明するが、幾つかの実施形態では、コンテキストトレーニングデータ122の各セットは、特定のコンテキストラベルでラベル付けされた個々のトレーニング例を含む。これらのラベルは、例えば異なるコンテキストで使用可能な機械学習モデル120の異なるインスタンスのトレーニングを容易にする。一例として、第1のコンテキストトレーニングデータセット122の個々のトレーニング例は、血行動態不安定性の尺度又は指標を示すためにラベル付けされ、第2のコンテキストトレーニングデータセット122の個々のトレーニング例は、急性腎障害の尺度を示すためにラベル付けされ、その他同様にされる。幾つかの実施形態では、ラベルは、例えば特定の病状の有無を示すためにバイナリであってよい。更に又は或いは、ラベルはバイナリではなく、代わりに、特定の特徴値の(例えば連続範囲内の)尺度を示してもよい。
[0031] エンティティ類似度システム104は、例えば類似度トレーニングエンジン114及び/又は類似度検出エンジン116により、本開示の様々な態様を行うことができる。例えば幾つかの実施形態では、エンティティ類似度システム104は、複数のテンプレート類似度関数118を提供/取得する。複数のテンプレート類似度関数118の各テンプレート類似度関数は、クエリエンティティ特徴ベクトル(例えばクエリ患者特徴ベクトル)の特徴のサブセットを、候補エンティティ特徴ベクトル(例えば候補患者特徴ベクトル)の特徴の対応するサブセットと比較する。
[0032] 幾つかの実施形態では、エンティティ類似度システム104はまた、テンプレート類似度関数118の出力を入力として受け取り、これらの値に基づいて、総合類似度スコアを計算する前述の機械学習モデル120を含む。幾つかの実施形態では、各機械学習モデル120は、合成類似度関数の形をとり、また、幾つかの実施形態では、複数のテンプレート類似度関数118のそれぞれの出力の重み付き結合であってよい。
[0033] 様々な実施形態において、類似度トレーニングエンジン114は、例えばトレーニングデータベース108から、第1のコンテキストトレーニングデータとして第1の複数のラベル付きエンティティベクトルを取得する。例えば機械学習モデル120が血行動態不安定性のコンテキストにおける患者間の類似度を計算するようにトレーニングされている場合、類似度トレーニングエンジン114は、血行動態安定性(又はその欠如)を示すラベルが付けられたトレーニング例を含むコンテキストトレーニングデータセット122を取得する。以下により詳細に説明するように、類似度トレーニングエンジン114は、これらのトレーニング例を使用して機械学習モデル120をトレーニングして機械学習モデル120を調整して、血行動態不安定性のコンテキストにおける患者間の類似度を計算する。様々な実施形態において、複数の機械学習モデル120がトレーニングされる。例えば所望のコンテキスト毎に1つの機械学習モデル120がトレーニングされる。例えば1つの機械学習モデル120が血行動態不安定性のコンテキストにおける患者間の類似度を計算するためにトレーニングされ、別の機械学習モデル120が急性腎障害のコンテキストにおける患者間の類似度を計算するためにトレーニングされ、その他同様にされる。
[0034] 類似度検出エンジン116は、例えば類似度テンプレート関数118及び1つ以上のトレーニングされた機械学習モデル120を使用して、エンティティから抽出された複数の特徴を含むクエリエンティティ特徴ベクトルを、1つ以上の候補エンティティ特徴ベクトルに適用する。例えば医学的コンテキストでは、類似度検出エンジン116は、類似度テンプレート関数118及び機械学習モデル120を使用して、バイタルサイン、年齢、体重、治療等のクエリ患者の特徴(これらはリアルタイムで及び/又は遡及的患者データベース106から取得されてよい)を、遡及的患者データベース106から取得される候補患者の対応する特徴と比較する。類似度検出エンジン116は、出力として、クエリエンティティと候補エンティティとの間のコンテキスト類似度スコアを単に提供するか、又は、クエリエンティティとの類似度に基づいてランク付けされた候補エンティティのリストを提供してもよい。
[0035] 類似度検出エンジン116の出力は、臨床医決定アプリケーション112によって使用されて、臨床医がクエリ患者に関する情報に基づいた決定を行うことを可能にする情報及び/又はツールが臨床医又は他の人に与えられる。非限定的な例として、臨床医はコンテキスト的に類似する患者のコホートを見て、どの治療が行われたか、及び、これらの治療の(例えば統計的)転帰を確認することができる。臨床医は、この情報に基づいて行動方針を決定することができる。更に又は或いは、例えばロボットによって治療が自動的に行われる幾つかの実施形態では、行われる治療は、類似度検出エンジン116によって提供される情報に少なくとも部分的に基づいて自動的に選択される。別の例として、臨床医決定アプリケーション112は、本明細書に説明する技術を使用して、特定のコンテキストにおけるクエリ患者の臨床状態を予測することができる。
テンプレート類似度関数
[0036] 次に、テンプレート類似度関数118を生成する技術の1つについて説明する。なお、この説明は限定を意味するものではなく、他の技術及び/又はテンプレート類似度関数を使用することもできる。また、本明細書で「テンプレート類似度関数」との用語を使用するが、これは限定を意味するものではない。これらの関数は「カーネル」とも呼ばれる。当該説明のために、クエリ患者(例えば臨床医が治療等に関する決定をしたい患者)はpと示し、pが比較される各候補患者はpと示す。
[0037] 幾つかの実施形態では、m個のテンプレート類似度関数S(p,p)、…、S(p,p)のプールが生成される。これらは、以下に説明する後続のコンテキスト類似度学習フェーズの基礎となる。各テンプレート類似度関数S(p,p)は、2つの特徴ベクトル、つまり、クエリ患者pから1つの特徴ベクトルと候補患者pから1つ特徴ベクトルとを入力として受け取り、pとpとの間の類似度を定量化する出力(例えばスコア)を返す。各テンプレート類似度関数は、患者の特徴ベクトルの様々なサブセットを考慮することにより、様々なやり方で類似度を判断する。例えば各テンプレート類似度関数は、異なる特徴について調整されてよい。例えば類似度関数は、心拍数又は血圧に基づく。また、特徴間の相互作用に対処するために、特徴の小さいグループを考慮することも可能である。結果として得られるテンプレート類似度関数S(p,p)、…、S(p,p)のプールは、類似度を多角的に示す。多角的に示される類似度は、コンテキスト固有の機械学習モデル120を使用して、臨床コンテキストに基づく単一スコアにまとめられる(以下により詳細に説明する)。
[0038] 図2は、特定の患者特徴、つまり、心拍数について単一のテンプレート類似度関数を適用する方法の例を示す。他の患者ベクトル特徴間の他のタイプの類似度を評価する他のテンプレート類似度関数も同様に機能する。様々な実施形態では、患者の心拍数について母集団分布が決定される。これは、例えばトレーニングデータベース108内のトレーニングデータ120のセットから心拍数のヒストグラムを計算することにより達成される。
[0039] この例では、クエリ患者pの心拍数(「HR」)は70で、候補患者pの心拍数は120である。クエリ患者及び候補患者から出ている矢印は、釣鐘曲線に似た患者心拍数の分布を示すヒストグラムにつながる(しかし、これは必須ではない)。このようなヒストグラムは、確率分布PHR(x)を提供する。幾つかの実施形態では、次式:
Figure 0006975253
のような式を使用して非正規化テンプレート類似度関数が計算される。幾つかの実施形態では、関数fは単調減少関数、例えばf(x)=(1−x)である。この例では、PHR(x HR)は、pの心拍数とpの心拍数との間の心拍数の患者の累積確率である。関数fは単調に減少するため、p及びpのそれぞれの心拍数間の類似度は、累積確率が増加(又は減少)するにつれて減少(又は増加)する。累積確率は、図2の釣鐘曲線下に示す面積Aで表される。
[0036] 幾つかの実施形態では、テンプレート類似度関数は、次式:
Figure 0006975253
のような式を使用して正規化される。式(2)では、分母項は、遡及的患者データベース106内のすべての他の患者に対するp及びpの期待される非正規化テンプレート類似度関数出力をそれぞれ表す。Eは期待値(平均値)を表す。この正規化は、テンプレート類似度関数の出力を共通範囲に正規化するのに役立つ。
[0037] この手法は、特徴の母集団分布又はコホート母集団分布を使用して類似度を定量化する。この手順より、p及びpの2つの心拍数値間の類似度が、それらがどれだけ近いかだけでなく、それらがどれほど異常であるかによっても決まる。類似度スコアは、2つの値間の確率分布下の面積(図2のA)に反比例するため、分布の裾に近い異常値はより高いスコアとなる。これは、臨床医が気になる可能性のある異常値を強調するという利点がある。直観的には、2人の患者(より一般的には2つのエンティティ)が与えられると、それらの類似度は、それらの間にある患者(より一般的にはエンティティ)の期待数に反比例する。
[0038] この心拍数の例は、患者間で比較される単一の特徴(心拍数)について適用されるが、これは限定を意味するものではない。これらの手順を一般化して、患者(より一般的にはエンティティ)ベクトルの複数の特徴を考慮する類似度尺度をテンプレート化することができる。具体的には多次元確率分布が採用されてよい。
[0039] 一般的に、テンプレート類似度ベクトル、即ち、「カーネル」は様々なやり方で生成される。例えばx及びzを、状態ベクトルx及びzを有する2つのエンティティの対応する特徴値として示す。次に、範囲[min(x,z),max(x,z)]内の値を有するエンティティの期待数は、当該区間内で、Xについて、母集団分布P(X)下の面積によって与えられる。幾つかの実施形態では、次のカーネル:
Figure 0006975253
を特徴Xについて使用してよい。様々な実施形態において、カーネルはバイナリの又は序数で示される個別の特徴に適用される。例えばXは、患者が症状を示すか又はまれな疾患若しくは併存疾患があるかどうかを特徴付けるベルヌーイ(Bernoulli)確率変数であってよい。この場合、式(A)は、次式:
Figure 0006975253
のように簡略化される。したがって、患者xと患者zとの間の類似度は、両方の患者に疾患がある又はない場合、臨床症状の有病率又は不在に反比例し、また、疾患の状態が異なる場合、類似度がない。上記カーネルは、確率変数値に対して順序関係を想定している。しかし、これは、c個のカテゴリの名義変数をc個のベルヌーイ確率変数に変換するワンホットエンコーディングによって、名義カテゴリ変数に拡張することができる。
機械学習モデルのトレーニング
[0040] 次に、機械学習モデル120をトレーニングして、m個のテンプレート類似度関数118の集約出力に基づいて総合類似度スコアを生成するための例示的な技術について説明する。幾つかの実施形態では、機械学習モデル120は、m個のテンプレート類似度関数の出力の凸結合であってよい合成類似度関数、S(p,p)であってよい。例えば幾つかの実施形態では、合成類似度関数は、次式:
Figure 0006975253
のようにモデル化することができる。したがって、この例におけるSは、m個の個々のテンプレート類似度関数の出力の加重平均であり、重みはα、α、…、αと示す。
[0040] 機械学習モデル120をトレーニングするために(これは例えば重みα、α、…、αを学習することを意味する)、様々な実施形態において、例えばトレーニングデータベース108からn対のトレーニング例(p(1),y(1)),…,(p(n),y(n))が提供される。p(i)は、所与の患者の入力特徴(バイタル、検査結果、人口動態等)のベクトルであり、y(i)は、その患者の臨床的コンテキストの状態を示すラベルである。臨床的コンテキストは、それが反映している臨床状態に応じて、バイナリラベルか又は実数値であってよい。例えばy(i)は、患者(i)が2つの疾患状態のどちらに属するかを示すバイナリラベルである。
[0041] 幾つかの実施形態では、重みα、α、…、αは、ラベル付きトレーニングセット(p(1),y(1)),…,(p(n),y(n))に行われるカーネル平滑化アルゴリズムといったマルチカーネル学習アルゴリズムを使用してトレーニングされる。例えば幾つかの実施形態では、次の近似関数:
Figure 0006975253
を使用して、各患者の近似ラベル
Figure 0006975253
が計算される。直観的に、式(6)は、i番目の患者の近傍患者の「真」のラベル(y)の加重平均を取ることにより、i番目の患者のラベル
Figure 0006975253
を近似させようとする。近傍患者は合成類似度Sによって定義される。したがって、Sの出力が2人の近傍患者が類似することを示す場合、一方の近傍患者の「真」のラベル(y)は、もう一方の近傍患者の近似ラベル
Figure 0006975253
により強く影響する。
[0042] 近似ラベルが計算されると、近似ラベルと「真」のラベルとの差を使用して、重みα、α、…、αが決定される。例えば損失関数
Figure 0006975253
を使用して、真のラベルyとその近似値
Figure 0006975253
との相違が測定される。例えばラベルがバイナリである場合、バイナリクロスエントロピーを使用することができる。ラベルが連続値である場合、二乗誤差を損失として使用することができる。いずれの場合でも、次式:
Figure 0006975253
のような式を使用して、すべてのトレーニング例全体の合計損失が最小限に抑えられる。なお、この目的は黙示的にSを介した重みα、α、…、αの関数である。最小化は、その後、例えば勾配降下法(例えば確率的、バッチ等)を使用して進み、このコンテキストにおける最適な重みが学習される。
[0043] 幾つかの実施形態では、式(6)はまた、類似する被験者に関連付けられる「真」のラベル(y)に基づいて特定の被験者の臨床コンテキスト(即ち、それらのラベル)を予測するために使用することもできる。例えば未知の臨床状態を有する被験者について決定されたラベル近似
Figure 0006975253
は、例えば上記式(3)〜(5)のうちの1つ以上を使用して決定される被験者に関連付けられる対応する真のラベルyの影響を受ける。
使用例
[0044] 図3から図5は、図1の臨床医決定アプリケーション112によってディスプレイ画面上にレンダリングされる例示的なグラフィカルユーザインターフェース(「GUI」)を示す。ここで図3を参照すると、例えば臨床医がクエリ患者の記録を取り出したときに、臨床医はダッシュボードGUI300を見ることができる。この例では、ダッシュボードGUI300のタイトルバーに示されているように、クエリ患者の名前は「ジョン・ドゥ(John Doe)」である。臨床医は、ダッシュボードGUI300によってクエリ患者の現在の臨床状態の概要を得ることができる。幾つかの異なるパネルがあり、図3では4つのパネル(3301〜4)が示されているが、各パネルは、特定の解剖学的器官の概要、特定の疾患の状態等といったクエリ患者の状態のコンテキスト固有の側面をそれぞれ伝える。例えば第1のパネル330は、心血管の健康状態の概要を示す。第2のパネル330は、クエリ患者の心腎症候群(「CRS」)の概要を示す。第3のパネル330は、クエリ患者の肝臓系の概要を示す。第4のパネル330は、クエリ患者の呼吸器系の概要を示す。これらのパネル3301〜4は単なる例であり、他の臨床的コンテキストの概要を示すより多い又はより少ないパネルがあってよい。
[0045] クエリ患者の様々な臨床医意思決定支援(「CDS」)統計の概要を提供する第5のパネル330も示されている。図3では、これには、クエリ患者の血行動態不安定指数(「HII」)の概要と、クエリ患者の急性腎障害(「AKI」)状態及び呼吸窮迫症候群(「ARDS」)の概要が含まれる。図3では、クエリ患者のHIIが上昇しているため(78)、クエリ患者のHIIに関する追加情報332が示されている。
[0046] 臨床医は、例えばマウスを使用して又はタッチスクリーンに触れることで、何れかのパネル330を選択して、それぞれの臨床コンテキストに関するより詳細な情報を得ることができる。例えばクエリ患者のHIIが上昇していることを考えると、臨床医は、追加情報を得るために、HIIに関連する第5のパネル330の一部を選択する可能性が高い。そうすると、図4に示すGUI400といった別のGUIがレンダリングされる。
[0047] 図4では、GUI400は、78のHIIスコアに寄与した様々なデータ(例えば年齢、CVP、心拍数等)を含むクエリ患者の血行動態不安定指数のより詳細な概要を含む。GUI400はまた、クエリ患者のHIIを経時的に示すチャート438も含む。加えて、GUI400は、臨床医が類似する患者を確認するために選択できるボタン440又は他の選択可能要素も含んでよい。当該ボタン440又は他の選択可能要素は、選択されると、複数のテンプレート類似度関数(図1の118)全体へのクエリ患者に関連付けられる特徴ベクトルの適用をトリガして、それぞれの出力が計算される。上記のように、これらの出力は、コンテキスト固有の機械学習モデル120に入力として適用される。当該コンテキスト固有の機械学習モデル120は、上記のように、現在のコンテキストについて学習した重みをテンプレート類似度関数の出力に適用して総合コンテキスト類似度スコアを計算する合成類似度関数(例えば上記式(3))である。具体的には、前述の様々な式を用いてトレーニングデータベース108からのコンテキストトレーニングデータセット122を使用することにより学習した重みは、テンプレート類似度関数のそれぞれの出力に適用される。幾つかの実施形態では、例えば遡及的患者データベース106からの情報を使用して複数の候補患者特徴ベクトルを、候補患者の特徴ベクトルと比較し、クエリ患者との類似度によってランク付けされた候補患者のリストを返される技術が適用される。幾つかの実施形態では、x人の最も類似する患者のみが返されてもよい。xは、例えば何らかの類似度閾値を満たす候補患者の数若しくは割合に基づいて手動で選択されるか又は決定される正の整数である。
[0048] 図5は、ボタン440の選択に応えてレンダリングされる1つの例示的なGUI500を示す。図5では、クエリ患者の78のHIIスコアに対して、複数の治療オプショングループにつながる線が描かれている。図5では、これらのオプションには、治療なし、流体治療、輸血、循環作動薬及び昇圧薬治療が含まれる。ただし、これらは限定を意味するものではない。各治療オプショングループについて、各自の治療オプションが施された類似患者数が、各自の平均転帰(この例では治療後の平均HII)と共に示されている。
[0049] 例えばコンテキスト的に類似する20人の患者には治療が行われずに、平均HIIスコアは85まで上昇した。コンテキスト的に類似する15人の患者には流体治療が行われ、平均HIIスコアは74にわずかに下がった。コンテキスト的に類似する30人の患者には輸血が行われ、平均HIIスコアは73にわずかに下がった。コンテキスト的に類似する30人の患者には循環作動薬治療が行われ、平均HIIスコアは69にわずかに下がった。コンテキスト的に類似する大半の患者、即ち、100人の患者には昇圧薬治療が行われ、平均HIIスコアが45に大幅に下がった。したがって、臨床医は、昇圧剤がコンテキスト的に類似する患者に行われた圧倒的に最も効果的な治療オプションであったことを容易に理解することができる。様々な実施態様では、各治療オプショングループ自体が選択可能であり、そのグループ内のコンテキスト的に類似する患者に関する詳細情報(例えばより精緻な統計)及び受けた治療を確認することができる。
[0050] 図示されていないが、様々な実施形態において、本明細書に説明される技術は、図5に示す情報以外の他の情報を臨床医に提供するために実現することもできる。例えば幾つかの実施形態では、臨床医は、何人かのコンテキスト的に最も類似する患者を例えばリストとして提示される。幾つかのそのような実施形態では、臨床医は、所与のコンテキスト的に類似する患者を選択して、彼らの病歴、特定の測定値(例えばバイタルサイン、検査結果)、行われた/処方された治療、家族歴等といったように、当該コンテキスト的に類似する患者について更に知ることができる。
[0041] 図6は、様々な実施形態に従って、本開示の選択された態様を実施するための例示的な方法600を示す。便宜上、フローチャートのステップは、当該ステップを行うシステムを参照して説明する。このシステムは、エンティティ類似度システム104を含む様々なコンピュータシステムの様々なコンポーネントを含んでよい。更に、方法600のステップは、特定の順序で示すが、これは限定を意味するものではない。1つ以上のステップを順序変更する、省略する又は追加することができる。更に、臓器不全率、在院日数、死亡率等といったその他の中期的又は長期的な転帰も表示されてよい。
[0042] ステップ602において、システムは、複数のテンプレート類似度関数(例えば図1の118)を提供する。複数のテンプレート関数は、様々な手段で提供される。幾つかの実施形態では、複数のテンプレート関数は、例えば1人以上の臨床医によって手動で作成される。上記のように、複数のテンプレート類似度関数の各テンプレート類似度関数は、クエリ患者に関連付けられるクエリエンティティ特徴ベクトルの特徴のサブセットを、候補患者に関連付けられる候補エンティティ特徴ベクトルの特徴の対応するサブセットと比較する。ステップ604において、システムは、複数のテンプレート類似度関数のそれぞれの出力の重み付き結合を含む合成類似度関数といった機械学習モデルを提供する。上記式(3)は、合成類似度関数の非限定的な一例である。
[0043] ステップ606において、システムは、例えばトレーニングデータベース108から、第1のコンテキストトレーニングデータ(例えば図1の120)として、第1の複数のラベル付きエンティティベクトルを提供及び/又は取得する。幾つかの実施形態では、この第1のコンテキストトレーニングデータは、特定のコンテキストにおける類似エンティティ(例えば患者)を見つけるために適用される合成類似度関数の重みをトレーニングするために特に選択される。例えば2型糖尿病と診断された患者に類似した患者を見つけることが目的である場合、第1のコンテキストトレーニングデータには、2型糖尿病の有無を示すラベルが付けられた患者特徴ベクトルの形のトレーニング例が含まれる。
[0044] ステップ608において、システムは、例えば類似度トレーニングエンジン114により、上記式(6)といった近似関数を適用して、第1のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、各ラベル付きエンティティベクトルデータに対する第1のコンテキストラベル
Figure 0006975253
を近似させる。幾つかの実施形態では、第1のコンテキストラベルは、合成類似度関数の出力と第1のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの「真」の第1のコンテキストラベル(y)とに基づいて近似される。上記のように、これは、直観的に、2人の患者が類似しているほど、1人の患者の真のラベル(y)がもう1人の患者の近似ラベル
Figure 0006975253
により多く寄与し、また、その逆も同様であることを意味する。
[0045] ステップ610において、システムは、合成類似度関数(例えば上記式(3))に基づいて、第1のコンテキスト固有の合成類似度関数をトレーニングする。これには、例えば近似関数(例えば上記式(6))の第1のコンテキストトレーニングデータへの適用の出力に基づく第1の損失関数(例えば
Figure 0006975253
)を使用して、複数のテンプレート類似度関数(例えば図1の118)に対する第1のコンテキスト重みα、α、…、αを学習することが含まれる。様々な実施形態において、第1の重みは、第1のコンテキスト固有の合成類似度関数の一部として後で使用するために格納される。
[0051] 前述のように、様々な実施形態において、様々なコンテキスト固有の合成類似度関数(より一般的には機械学習モデル120)が、様々なエンティティコンテキストについて学習される。例えば第1のコンテキスト固有の合成類似度関数は、血行動態不安定性について学習され、第2のコンテキスト固有の合成類似度関数は、急性腎障害について学習され、第3のコンテキスト固有の合成類似度関数は、1つの種類の癌について学習され、第4のコンテキスト固有の合成類似度関数は、別の種類の癌について学習され、第5のコンテキスト固有の合成類似度関数は、1型糖尿病について学習され、第6のコンテキスト固有の合成類似度関数は、2型糖尿病について学習され、その他同様にされる。したがって、ステップ612において、システムは、ステップ606と同様に、第2のコンテキストトレーニングデータとして第2の複数のラベル付きエンティティベクトルを提供する。
[0052] ステップ614において、システムは、近似関数(例えば上記式(6))を適用して、第2のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、合成類似度関数の出力と第2のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第2コンテキストラベルとに基づいて、各ラベル付きエンティティベクトルデータの第2のコンテキストラベルを近似させる。このステップはステップ608と同様であってよい。ステップ616において、システムは、ステップ610と同様に、合成類似度関数に基づいて、第2のコンテキスト固有の合成類似度関数をトレーニングする。幾つかの実施形態では、ステップ606〜610は、必要な数の異なるコンテキストについて繰り返され、これにより、後にコンテキスト的に類似するエンティティを見つける及び/又は特定のコンテキストにおけるクエリエンティティの状態を予測するために選択的に適用できるコンテキスト固有の合成類似度関数の「ライブラリ」がもたらされる。
[0053] 図7は、本開示の選択された態様を実施するための例示的な方法700、即ち、テンプレート類似度関数及び図6に示すようなステップを使用して学習しコンテキスト固有の機械学習モデル(例えば合成類似度関数)を適用して、コンテキスト的に類似するエンティティを特定する方法を示す。便宜上、フローチャートのステップは、当該ステップを行うシステムを参照して説明する。このシステムは、エンティティ類似度システム104及び/又は臨床医決定アプリケーション112を含む様々なコンピュータシステムの様々なコンポーネントを含んでよい。更に、方法700のステップは、特定の順序で示すが、これは限定を意味するものではない。1つ以上のステップを順序変更する、省略する又は追加することができる。
[0054] ステップ702において、システムは、インターフェース上に、クエリエンティティの第1の値を表示する。様々な実施形態において、第1の値は第1のコンテキストに関連する。第1のクエリエンティティは、臨床医が検査しているクエリ患者といった関心エンティティである。第1のコンテキストに関連する第1の値の例は、図3及び図4に示しており、コンテキストは血行動態不安定性であり、値は78のHIIスコアである。ステップ704において、システムは、複数のトレーニングされた類似度関数から、第1のコンテキストに関連付けられる第1のトレーニングされた類似度関数を選択する。トレーニングされた類似度関数には、例えば図6のステップを使用して学習したコンテキスト固有の合成類似度関数が含まれる。一例として、臨床医が図4のボタン440を選択すると、血行動態不安定性についてトレーニングされたコンテキスト固有の合成類似度関数の選択がトリガされる。具体的には、選択されたコンテキスト固有の合成類似度関数は、上記式(6)〜(7)といった式を使用して学習した血行動態不安定性に固有の重みを含む。
[0055] ステップ706において、システムは、第1の選択されたトレーニングされた類似度関数を、クエリエンティティに関連付けられる特徴のセット及び複数の候補エンティティに関連付けられる特徴の各セットに適用する。例えばクエリ患者特徴ベクトルには、人口動態(例えば年齢、体重、性別等)、併存疾患、バイタルサイン(例えば心拍数、収縮期血圧等)及び/又は検査結果(例えばナトリウム、乳酸、マグネシウム等)といった特徴が含まれる。候補患者特徴ベクトルは、遡及的患者データベース106から選択されて、同様の特徴を含む。幾つかの実施形態では、患者(クエリ又は候補)特徴ベクトルには、ディープニューラルネットワークの隠れ層から抽出された特徴といった潜在的変数モデルから抽出された特徴が含まれる。様々な実施形態において、クエリ患者特徴ベクトル及び候補患者特徴ベクトルは、テンプレート類似度関数118のプールへの入力として適用される。これらの関数の出力は、機械学習モデル120への入力として適用される。機械学習モデル120は、前述のように、選択されたコンテキストについてトレーニングされている、式(3)の合成類似度関数といった類似度関数である。
[0056] ステップ708において、システムは、ステップ706における第1のトレーニングされた類似度関数の適用に基づいて、複数の候補エンティティから1つ以上の類似候補エンティティのセットを選択する。例えば幾つかの実施形態では、システムは、クエリ患者とのコンテキスト的な類似度によってランク付けされた候補患者のリストを返す。ステップ710において、システムは、例えば臨床医決定アプリケーション112により、第1の1つ以上の類似候補エンティティのセットに関連付けられる情報をインターフェース上に表示する。
[0057] ステップ710において表示される情報は、様々な形をとることができる。幾つかの実施形態は、当該情報は、例えば返されたコンテキスト的に類似する候補患者毎に別個のパネルを含む。各パネルは、各候補患者に関する様々なコンテキスト固有情報を表示する。幾つかの実施形態では、臨床医がパネルを選択して、候補患者に関するより詳細な情報を表示させることができる。追加又は代替として、この情報には、行われた治療、転帰等といった属性によってグループ化されたコンテキスト的に類似する患者のグループのうち、治療、転帰等に関する統計といったコンテキスト的に類似する患者についての様々な統計値が含まれる。このような統計値の一例は図5に示されている。
[0058] 図8は、例示的なコンピュータシステム810のブロック図である。コンピュータシステム810は、通常、バスサブシステム812を介して幾つかの周辺機器と通信する少なくとも1つのプロセッサ814を含む。これらの周辺機器には、例えばメモリサブシステム825及びファイルストレージサブシステム826を含むストレージサブシステム824、ユーザインターフェース出力デバイス820、ユーザインターフェース入力デバイス822及びネットワークインターフェースサブシステム816が含まれる。入力及び出力デバイスにより、ユーザはコンピュータシステム810とのやり取りが可能になる。ネットワークインターフェイスサブシステム816は、外部ネットワークへのインターフェースを提供し、他のコンピュータシステムの対応するインターフェイスデバイスに結合される。
[0059] ユーザインターフェース入力デバイス822は、キーボード、マウス、トラックボール、タッチパッド又はグラフィックタブレットといったポインティングデバイス、スキャナ、ディスプレイに組み込まれたタッチスクリーン、音声認識システム、マイクといったオーディオ入力デバイス及び/又は他のタイプの入力デバイスを含んでよい。一般に、「入力デバイス」との用語の使用は、コンピュータシステム810又は通信ネットワークに情報を入力するあらゆる可能なタイプのデバイス及び方法を含むことを意図している。
[0060] ユーザインターフェース出力デバイス820は、ディスプレイサブシステム、プリンタ、ファックス機又は音声出力デバイスといった非視覚的ディスプレイを含んでよい。ディスプレイサブシステムは、陰極線管(CRT)、液晶ディスプレイ(LCD)といったフラットパネルデバイス、プロジェクションデバイス又は可視画像を作成する他のメカニズムを含んでよい。ディスプレイサブシステムは、音声出力デバイスを介した非視覚的ディスプレイも提供する。一般に、「出力デバイス」との用語の使用は、コンピュータシステム810から被験者又は別のマシン若しくはコンピュータシステムに情報を出力するあらゆる可能なタイプのデバイス及び方法を含むことを意図している。
[0061] ストレージサブシステム824は、本明細書に説明するモジュール/エンジンの一部又はすべての機能を提供するプログラミング及びデータ構造を格納する。例えばストレージサブシステム824は、方法600及び/又は700の選択された態様を行い、及び/又は、様々な図に示される1つ以上のコンポーネントを実装するためのロジックを含んでよい。ストレージサブシステム824において使用されるメモリ825は、プログラム実行中の命令及びデータを記憶するためのメインランダムアクセスメモリ(RAM)830と、固定命令が記憶される読み出し専用メモリ(ROM)832とを含む幾つかのメモリを含む。ファイルストレージサブシステム826は、プログラム及びデータファイルの永続ストレージを提供でき、ハードディスクドライブ、CD−ROMドライブ、光学ドライブ又はリムーバブルメディアカートリッジを含んでよい。特定の実施態様の機能を実装するモジュールは、ストレージサブシステム824又はプロセッサ814によってアクセス可能である他のマシン内のファイルストレージサブシステム826に記憶されてよい。
[0062] バスサブシステム812は、コンピュータシステム810の様々なコンポーネント及びサブシステムが意図したとおりに互いに通信するためのメカニズムを提供する。バスサブシステム812は単一バスとして概略的に示されているが、バスサブシステムの代替の実施態様は複数のバスを使用してもよい。
[0063] コンピュータシステム810は、ワークステーション、サーバ、コンピューティングクラスタ、ブレードサーバ、サーバファーム、スマートフォン、スマートウォッチ、スマート眼鏡、セットトップボックス、タブレットコンピュータ、ラップトップコンピュータ又はその他のデータ処理システム若しくはコンピューティングデバイスを含む様々なタイプであってよい。コンピュータ及びネットワークは絶えず変化するため、図8に示すコンピュータシステム810の説明は、幾つかの実施態様を説明するための特定の例としてのみ意図されている。図8に示すコンピュータシステムよりも多い又は少ない数のコンポーネントを有するコンピュータシステム810の他の多くの構成が可能である。
[0064] 幾つかの発明実施形態を本明細書に説明し例示したが、当業者であれば、本明細書にて説明した機能を実行するための、並びに/又は、本明細書にて説明した結果及び/若しくは1つ以上の利点を得るための様々な他の手段及び/若しくは構造体を容易に想到できよう。また、このような変更及び/又は改良の各々は、本明細書に説明される発明実施形態の範囲内であるとみなす。より一般的には、当業者であれば、本明細書にて説明されるすべてのパラメータ、寸法、材料及び構成は例示のためであり、実際のパラメータ、寸法、材料及び/又は構成は、発明教示内容が用いられる1つ以上の特定用途に依存することを容易に理解できよう。当業者であれば、本明細書にて説明した特定の発明実施形態の多くの等価物を、単に所定の実験を用いて認識又は確認できよう。したがって、上記実施形態は、ほんの一例として提示されたものであり、添付の請求項及びその等価物の範囲内であり、発明実施形態は、具体的に説明された又はクレームされた以外に実施可能であることを理解されるべきである。本開示の発明実施形態は、本明細書にて説明される個々の特徴、システム、品物、材料、キット及び/又は方法に関する。更に、2つ以上のこのような特徴、システム、品物、材料、キット及び/又は方法の任意の組み合わせも、当該特徴、システム、品物、材料、キット及び/又は方法が相互に矛盾していなければ、本開示の本発明の範囲内に含まれる。
[0065] 本明細書にて定義されかつ用いられた定義はすべて、辞書の定義、参照することにより組み込まれた文献における定義及び/又は定義された用語の通常の意味に優先されて理解されるべきである。
[0066] 本明細書及び特許請求の範囲にて使用される「a」及び「an」の不定冠詞は、特に明記されない限り、「少なくとも1つ」を意味するものと理解されるべきである。
[0067] 本明細書及び特許請求の範囲にて使用される「及び/又は」との表現は、等位結合された要素、即ち、ある場合は接続的に存在し、その他の場合は離接的に存在する要素の「いずれか又は両方」を意味すると理解すべきである。「及び/又は」を用いて列挙される複数の要素も同様に解釈されるべきであり、即ち、要素のうちの「1つ以上」が等位結合される。「及び/又は」節によって具体的に特定された要素以外の他の要素も、それが具体的に特定された要素に関連していてもいなくても、任意選択的に存在してよい。したがって、非限定的な例として、「A及び/又はB」との参照は、「含む」といった非制限的言語と共に用いられた場合、一実施形態では、Aのみ(任意選択的にB以外の要素を含む)を指し、別の実施形態では、Bのみ(任意選択的にA以外の要素を含む)を指し、更に別の実施形態では、A及びBの両方(任意選択的にその他の要素を含む)を指す。
[0068] 本明細書及び特許請求の範囲に用いられる場合、「又は」は、上に定義したような「及び/又は」と同じ意味を有すると理解すべきである。例えば、リストにおけるアイテムを分ける場合、「又は」又は「及び/又は」は包括的と解釈される。即ち、多数の要素又は要素のリストのうちの少なくとも1つを含むが、2つ以上の要素も含み、また、任意選択的にリストにないアイテムを含むと解釈される。「〜のうちの1つのみ」又は「ちょうど1つの」といった反対を明らかに示す用語、又は、特許請求の範囲に用いられる場合は、「〜からなる」という用語だけが、多数の要素又は要素のリストのうちのまさに1つの要素が含まれることを指す。一般的に、本明細書にて使用される「又は」との用語は、「いずれか」、「〜のうちの1つの」、「〜のうちの1つのみ」又は「〜のうちのちょうど1つのみ」といった排他的な用語が先行する場合にのみ、排他的な代替(即ち「一方又は他方であるが、両方ではない」)を示すと解釈される。「本質的に〜からなる」は、特許請求の範囲に用いられる場合、特許法の分野にて用いられる通常の意味を有する。
[0069] 本明細書及び特許請求の範囲に用いられる場合、1つ以上の要素を含むリストを参照した際の「少なくとも1つ」との表現は、要素のリストにおける任意の1つ以上の要素から選択された少なくとも1つの要素を意味すると理解すべきであるが、要素のリストに具体的に列挙された各要素の少なくとも1つを必ずしも含むわけではなく、要素のリストにおける要素の任意の組み合わせを排除するものではない。この定義はまた、「少なくとも1つの」との表現が指す要素のリストの中で具体的に特定された要素以外の要素が、それが具体的に特定された要素に関係していてもいなくても、任意選択的に存在してもよいことを可能にする。したがって、非限定的な例として、「A及びBの少なくとも1つ」(又は、同等に「A又はBの少なくとも1つ」、又は、同等に「A及び/又はBの少なくとも1つ」)は、一実施形態では、少なくとも1つのA(任意選択的に2つ以上のAを含む)であって、Bがない(任意選択的にB以外の要素を含む)ことを指し、別の実施形態では、少なくとも1つのB(任意選択的に2つ以上のBを含む)であって、Aがない(任意選択的にA以外の要素を含む)ことを指し、更に別の実施形態では、少なくとも1つのA(任意選択的に2つ以上のAを含む)と、少なくとも1つのB(任意選択的に2つ以上のBを含む)を指す(任意選択的に他の要素を含む)。
[0070] 更に、特に明記されない限り、本明細書に記載された2つ以上のステップ又は動作を含むどの方法においても、当該方法のステップ又は動作の順番は、記載された方法のステップ又は動作の順序に必ずしも限定されないことを理解すべきである。
[0071] 特許請求の範囲においても上記明細書においても、「備える」、「含む」、「担持する」、「有する」、「含有する」、「関与する」、「保持する」、「〜から構成される」等といったあらゆる移行句は、非制限的、即ち、含むがそれに限定されないことを意味すると理解すべきである。米国特許庁特許審査手続便覧の第2111.03項に記載される通り、「〜からなる」及び「本質的に〜からなる」との移行句のみが、制限又は半制限移行句である。なお、特許協力条約(「PCT」)の規則第6.2(b)項の規定により、請求項において使用される特定の表現及び参照符号は、範囲を限定するものではない。

Claims (20)

  1. 比較システムを使用して、類似度を決定するためのコンテキスト固有モデルをトレーニングし、適用する方法であって、前記方法は、
    複数のテンプレート類似度関数を提供するステップであって、前記複数のテンプレート類似度関数のうちの各テンプレート類似度関数は、クエリエンティティ特徴ベクトルのそれぞれの特徴のサブセットを、候補エンティティ特徴ベクトルの対応する特徴のサブセットと比較する、ステップと、
    前記複数のテンプレート類似度関数のそれぞれの出力の重み付け結合として合成類似度関数を提供するステップと、
    第1のコンテキストトレーニングデータとして、第1の複数のラベル付きエンティティベクトルを提供するステップと、
    前記第1のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、前記合成類似度関数の出力と、前記第1のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第1のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータに対する第1のコンテキストラベルを近似させるように近似関数を適用するステップと、
    前記合成類似度関数に基づいて、第1のコンテキスト固有の合成類似度関数をトレーニングするステップであって、前記トレーニングするステップは、前記第1のコンテキストトレーニングデータへの前記近似関数の適用の出力に基づいて、第1の損失関数を使用して、前記複数のテンプレート類似度関数に対する第1のコンテキスト重みを学習するステップを含み、前記第1のコンテキスト重みは、前記第1のコンテキスト固有の合成類似度関数の一部として使用するために格納される、ステップと、
    クエリエンティティを受信するステップと、
    トレーニングされた前記第1のコンテキスト固有の合成類似度関数を、前記クエリエンティティに適用して、前記クエリエンティティのエンティティ特徴ベクトルと、各々が候補エンティティを表す複数の候補エンティティ特徴ベクトルの各々との間の類似度尺度を決定するステップと、
    決定された前記類似度尺度に基づいて、2つ以上の前記候補エンティティ特徴ベクトルを選択するステップと、
    前記決定された類似度尺度に基づいて、選択された前記2つ以上の候補エンティティ特徴ベクトルによって表される2つ以上の候補エンティティをランク付けするステップであって、前記候補エンティティは、前記クエリエンティティと前記候補エンティティとの間の最も近い類似度を表す類似度尺度を用いてランク付けされる、ステップと、
    ユーザインターフェース上に、ランク付けされた前記2つ以上の候補エンティティのランクリストを表示するステップと、
    臨床医決定アプリケーションによって、前記ランク付けされた2つ以上の前記候補エンティティの前記ランクリストに基づいて、前記クエリエンティティに関する決定を行うステップと、
    を含む、方法
  2. 第2のコンテキストトレーニングデータとして、第2の複数のラベル付きエンティティベクトルを提供するステップと、
    前記第2のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、前記合成類似度関数の出力と、前記第2のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第2のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータの第2のコンテキストラベルを近似させるように前記近似関数を適用するステップと、
    前記合成類似度関数に基づいて、第2のコンテキスト固有の合成類似度関数をトレーニングするステップであって、前記トレーニングするステップは、前記第2のコンテキストトレーニングデータへの前記近似関数の適用の出力に基づいて、第2の損失関数を使用して、前記複数のテンプレート類似度関数に対する第2のコンテキスト重みを学習するステップを含み、前記第2のコンテキスト重みは、前記第2のコンテキスト固有の合成類似度関数の一部として使用するために格納される、ステップと、
    を更に含む、請求項1に記載の方法。
  3. 前記第1のコンテキスト固有の合成類似度関数を、後続のクエリエンティティ特徴ベクトル及び後続の候補エンティティ特徴ベクトルに適用して、第1の医学的コンテキストにおける前記後続のクエリエンティティ特徴ベクトルと前記後続の候補エンティティ特徴ベクトルとの間の類似度尺度を決定し、
    前記第2のコンテキスト固有の合成類似度関数を、前記後続のクエリエンティティ特徴ベクトル及び前記後続の候補エンティティ特徴ベクトルに適用して、前記第1の医学的コンテキストとは異なる第2の医学的コンテキストにおける前記後続のクエリエンティティ特徴ベクトルと前記後続の候補エンティティ特徴ベクトルとの間の別の類似度尺度を決定する、
    請求項2に記載の方法。
  4. 前記第1の医学的コンテキストは、血行動態安定性を含む、請求項3に記載の方法。
  5. 前記第2の医学的コンテキストは、急性腎障害を含む、請求項4に記載の方法。
  6. 前記複数のテンプレート類似度関数を提供するステップは、
    前記クエリエンティティ特徴ベクトル及び前記候補エンティティ特徴ベクトルによって共有される少なくとも1つの特徴を選択するステップと、
    複数の候補エンティティにわたる選択された前記少なくとも1つの特徴の母集団分布を決定するステップと、
    決定された前記母集団分布に従って、前記クエリエンティティ特徴ベクトルの選択された特徴値と前記候補エンティティ特徴ベクトルの選択された特徴値との間の選択された特徴値を有する任意のエンティティの累積確率スコアを計算する、前記複数のテンプレート類似度関数のうちの所与のテンプレート類似度関数を提供するステップと、
    を含む、請求項1に記載の方法。
  7. 前記所与のテンプレート類似度関数は、前記決定された母集団分布にわたる他のエンティティに対する前記クエリエンティティ特徴ベクトル及び前記候補エンティティ特徴ベクトルの少なくとも一方の平均類似度スコアに基づいて更に正規化される、請求項に記載の方法。
  8. 前記近似関数は、カーネル平滑化関数を含む、請求項に記載の方法。
  9. 1つ以上のプロセッサと、前記1つ以上のプロセッサに動作可能に結合されるメモリとを含むシステムであって、前記メモリは、前記1つ以上のプロセッサによる命令の実行に応答して、前記1つ以上のプロセッサに、
    複数のテンプレート類似度関数を提供する演算であって、前記複数のテンプレート類似度関数のうちの各テンプレート類似度関数は、クエリエンティティ特徴ベクトルのそれぞれの特徴のサブセットを、候補エンティティ特徴ベクトルの対応する特徴のサブセットと比較する、演算と、
    前記複数のテンプレート類似度関数のそれぞれの出力の重み付け結合として合成類似度関数を提供する演算と、
    第1のコンテキストトレーニングデータとして、第1の複数のラベル付きエンティティベクトルを提供する演算と、
    前記第1のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、前記合成類似度関数の出力と、前記第1のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第1のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータに対する第1のコンテキストラベルを近似させるように近似関数を適用する演算と、
    前記合成類似度関数に基づいて、第1のコンテキスト固有の合成類似度関数をトレーニングする演算であって、前記トレーニングする演算は、前記第1のコンテキストトレーニングデータへの前記近似関数の適用の出力に基づいて、第1の損失関数を使用して、前記複数のテンプレート類似度関数の第1のコンテキスト重みを学習する演算を含み、前記第1のコンテキスト重みは、前記第1のコンテキスト固有の合成類似度関数の一部として使用するために格納される、演算と、
    クエリエンティティを受信する演算と、
    トレーニングされた前記第1のコンテキスト固有の合成類似度関数を、前記クエリエンティティに適用して、前記クエリエンティティのエンティティ特徴ベクトルと、各々が候補エンティティを表す複数の候補エンティティ特徴ベクトルの各々との間の類似度尺度を決定する演算と、
    決定された前記類似度尺度に基づいて、2つ以上の前記候補エンティティ特徴ベクトルを選択する演算と、
    前記決定された類似度尺度に基づいて、選択された前記2つ以上の候補エンティティ特徴ベクトルによって表される2つ以上の候補エンティティをランク付けする演算であって、前記候補エンティティは、前記クエリエンティティと前記候補エンティティとの間の最も近い類似度を表す類似度尺度を用いてランク付けされる、演算と、
    ユーザインターフェース上に、ランク付けされた前記2つ以上の前記候補エンティティのランクリストを表示する演算と、
    臨床医決定アプリケーションによって、前記ランク付けされた2つ以上の前記候補エンティティの前記ランクリストに基づいて、前記クエリエンティティに関する決定を決定する演算と、
    を行わせる前記命令を格納する、システム
  10. 第2のコンテキストトレーニングデータとして、第2の複数のラベル付きエンティティベクトルを提供する演算と、
    前記第2のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、前記合成類似度関数の出力と、前記第2のコンテキストトレーニングデータの他のラベル付きのエンティティベクトルのそれぞれの第2のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータの第2のコンテキストラベルを近似させるように前記近似関数を適用する演算と、
    前記合成類似度関数に基づいて、第2のコンテキスト固有の合成類似度関数をトレーニングする演算であって、前記トレーニングする演算は、前記第2のコンテキストトレーニングデータへの前記近似関数の適用の出力に基づいて、第2の損失関数を使用して、前記複数のテンプレート類似度関数の第2のコンテキスト重みを学習する演算を含み、前記第2のコンテキスト重みは、前記第2のコンテキスト固有の合成類似度関数の一部として使用するために格納される、演算と、
    を行わせる命令を更に含む、請求項9に記載のシステム。
  11. 前記第1のコンテキスト固有の合成類似度関数を、後続のクエリエンティティ特徴ベクトル及び後続の候補エンティティ特徴ベクトルに適用して、第1の医学的コンテキストにおける前記後続のクエリエンティティ特徴ベクトルと前記後続の候補エンティティ特徴ベクトルとの間の類似度尺度を決定し、
    前記第2のコンテキスト固有の合成類似度関数を、前記後続のクエリエンティティ特徴ベクトル及び前記後続の候補エンティティ特徴ベクトルに適用して、前記第1の医学的コンテキストとは異なる第2の医学的コンテキストにおける前記後続のクエリエンティティ特徴ベクトルと前記後続の候補エンティティ特徴ベクトルとの間の別の類似度尺度を決定する、
    請求項10に記載のシステム。
  12. 前記第1の医学的コンテキストは、血行動態安定性を含む、請求項11に記載のシステム。
  13. 前記第2の医学的コンテキストは、急性腎障害を含む、請求項12に記載のシステム。
  14. 前記複数のテンプレート類似度関数を提供する演算は、
    前記クエリエンティティ特徴ベクトル及び前記候補エンティティ特徴ベクトルによって共有される少なくとも1つの特徴を選択する演算と、
    複数の候補エンティティにわたる選択された前記少なくとも1つの特徴の母集団分布を決定する演算と、
    決定された前記母集団分布に従って、前記クエリエンティティ特徴ベクトルの選択された特徴値と、前記候補エンティティ特徴ベクトルの選択された特徴値との間の選択された特徴値を有する任意のエンティティの累積確率スコアを計算する、前記複数のテンプレート類似度関数のうちの所与のテンプレート類似度関数を提供する演算と、
    を含む、請求項9に記載のシステム。
  15. 前記所与のテンプレート類似度関数は、前記決定された母集団分布にわたる他のエンティティに対する前記クエリエンティティ特徴ベクトル及び前記候補エンティティ特徴ベクトルの少なくとも一方の平均類似度スコアに基づいて更に正規化される、請求項14に記載のシステム。
  16. 前記近似関数は、カーネル平滑化関数を含む、請求項9に記載のシステム。
  17. 1つ以上のプロセッサによる命令の実行に応答して、前記1つ以上のプロセッサに、
    複数のテンプレート類似度関数を提供する演算であって、前記複数のテンプレート類似度関数のうちの各テンプレート類似度関数は、クエリエンティティ特徴ベクトルのそれぞれの特徴のサブセットを、候補エンティティ特徴ベクトルの対応する特徴のサブセットと比較する、演算と、
    前記複数のテンプレート類似度関数のそれぞれの出力の重み付け結合として合成類似度関数を提供する演算と、
    第1のコンテキストトレーニングデータとして、第1の複数のラベル付きエンティティベクトルを提供する演算と、
    前記第1のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、前記合成類似度関数の出力と、前記第1のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第1のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータに対する第1のコンテキストラベルを近似させるように近似関数を適用する演算と、
    前記合成類似度関数に基づいて、第1のコンテキスト固有の合成類似度関数をトレーニングする演算であって、前記トレーニングする演算は、前記第1のコンテキストトレーニングデータへの前記近似関数の適用の出力に基づいて、第1の損失関数を使用して、前記複数のテンプレート類似度関数の第1のコンテキスト重みを学習する演算を含み、前記第1のコンテキスト重みは、前記第1のコンテキスト固有の合成類似度関数の一部として使用するために格納される、演算と、
    クエリエンティティを受信する演算と、
    トレーニングされた前記第1のコンテキスト固有の合成類似度関数を、前記クエリエンティティに適用して、前記クエリエンティティのエンティティ特徴ベクトルと、各々が候補エンティティを表す複数の候補エンティティ特徴ベクトルの各々との間の類似度尺度を決定する演算と、
    決定された前記類似度尺度に基づいて、2つ以上の前記候補エンティティ特徴ベクトルを選択する演算と、
    前記決定された類似度尺度に基づいて、選択された前記2つ以上の候補エンティティ特徴ベクトルによって表される2つ以上の候補エンティティをランク付けする演算であって、前記候補エンティティは、前記クエリエンティティと前記候補エンティティとの間の最も近い類似度を表す類似度尺度を用いてランク付けされる、演算と、
    ユーザインターフェース上に、ランク付けされた前記2つ以上の前記候補エンティティのランクリストを表示する演算と、
    臨床医決定アプリケーションによって、前記ランク付けされた2つ以上の前記候補エンティティの前記ランクリストに基づいて、前記クエリエンティティに関する決定を決定する演算と、
    を行わせる前記命令を含む、少なくとも1つの非一時的コンピュータ可読媒体。
  18. 第2のコンテキストトレーニングデータとして、第2の複数のラベル付きエンティティベクトルを提供する演算と、
    前記第2のコンテキストトレーニングデータの各ラベル付きエンティティベクトルについて、前記合成類似度関数の出力と、前記第2のコンテキストトレーニングデータの他のラベル付きエンティティベクトルのそれぞれの第2のコンテキストラベルとに基づいて、それぞれのラベル付きエンティティベクトルデータの第2のコンテキストラベルを近似させるように前記近似関数を適用する演算と、
    前記合成類似度関数に基づいて、第2のコンテキスト固有の合成類似度関数をトレーニングする演算であって、前記トレーニングする演算は、前記第2のコンテキストトレーニングデータへの前記近似関数の適用の出力に基づいて、第2の損失関数を使用して、前記複数のテンプレート類似度関数の第2のコンテキスト重みを学習する演算を含み、前記第2のコンテキスト重みは、前記第2のコンテキスト固有の合成類似度関数の一部として使用するために格納される、演算と、
    を行わせる命令を更に含む、請求項17に記載の少なくとも1つの非一時的コンピュータ可読媒体。
  19. 前記第1のコンテキスト固有の合成類似度関数を、後続のクエリエンティティ特徴ベクトル及び後続の候補エンティティ特徴ベクトルに適用して、第1の医学的コンテキストにおける前記後続のクエリエンティティ特徴ベクトルと前記後続の候補エンティティ特徴ベクトルとの間の類似度尺度を決定することができ
    前記第2のコンテキスト固有の合成類似度関数を、前記後続のクエリエンティティ特徴ベクトル及び前記後続の候補エンティティ特徴ベクトルに適用して、前記第1の医学的コンテキストとは異なる第2の医学的コンテキストにおける前記後続のクエリエンティティ特徴ベクトルと前記後続の候補エンティティ特徴ベクトルとの間の別の類似度尺度を決定することができる
    請求項18に記載の少なくとも1つの非一時的コンピュータ可読媒体。
  20. 前記第1の医学的コンテキストは、血行動態安定性を含む、請求項19に記載の少なくとも1つの非一時的コンピュータ可読媒体。
JP2019556710A 2017-04-20 2018-04-12 エンティティ間のコンテキスト的類似度の学習及び適用 Active JP6975253B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762487720P 2017-04-20 2017-04-20
US62/487,720 2017-04-20
US201762608878P 2017-12-21 2017-12-21
US62/608,878 2017-12-21
PCT/EP2018/059358 WO2018192831A1 (en) 2017-04-20 2018-04-12 Learning and applying contextual similarities between entities

Publications (3)

Publication Number Publication Date
JP2020518050A JP2020518050A (ja) 2020-06-18
JP2020518050A5 JP2020518050A5 (ja) 2021-08-19
JP6975253B2 true JP6975253B2 (ja) 2021-12-01

Family

ID=62089718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019556710A Active JP6975253B2 (ja) 2017-04-20 2018-04-12 エンティティ間のコンテキスト的類似度の学習及び適用

Country Status (5)

Country Link
US (2) US11126921B2 (ja)
EP (1) EP3613060A1 (ja)
JP (1) JP6975253B2 (ja)
CN (1) CN110770850B (ja)
WO (1) WO2018192831A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10438130B2 (en) * 2015-12-01 2019-10-08 Palo Alto Research Center Incorporated Computer-implemented system and method for relational time series learning
US20190019107A1 (en) * 2017-07-12 2019-01-17 Samsung Electronics Co., Ltd. Method of machine learning by remote storage device and remote storage device employing method of machine learning
WO2019186650A1 (en) * 2018-03-26 2019-10-03 Nec Corporation Kernel learning apparatus using transformed convex optimization problem
RU2731658C2 (ru) 2018-06-21 2020-09-07 Общество С Ограниченной Ответственностью "Яндекс" Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения
RU2744029C1 (ru) * 2018-12-29 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Система и способ формирования обучающего набора для алгоритма машинного обучения
US11646116B2 (en) * 2019-03-22 2023-05-09 International Business Machines Corporation Intelligent identification of appropriate sections of clinical practical guideline
US11783189B2 (en) * 2019-08-29 2023-10-10 Nec Corporation Adversarial cooperative imitation learning for dynamic treatment
US11107555B2 (en) 2019-10-02 2021-08-31 Kpn Innovations, Llc Methods and systems for identifying a causal link
US11373095B2 (en) * 2019-12-23 2022-06-28 Jens C. Jenkins Machine learning multiple features of depicted item

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702631B1 (en) * 2006-03-14 2010-04-20 Google Inc. Method and system to produce and train composite similarity functions for product normalization
US8768718B2 (en) * 2006-12-27 2014-07-01 Cardiac Pacemakers, Inc. Between-patient comparisons for risk stratification of future heart failure decompensation
US7899764B2 (en) * 2007-02-16 2011-03-01 Siemens Aktiengesellschaft Medical ontologies for machine learning and decision support
GB201200643D0 (en) * 2012-01-16 2012-02-29 Touchtype Ltd System and method for inputting text
US8566268B2 (en) * 2010-10-08 2013-10-22 International Business Machines Corporation System and method for composite distance metric leveraging multiple expert judgments
US20130268547A1 (en) * 2010-12-16 2013-10-10 Koninklijke Philips N.V. System and method for clinical decision support for therapy planning using case-based reasoning
CN102033933B (zh) * 2010-12-17 2012-02-01 南方医科大学 最大化平均查准率均值的距离测度优化方法
CN103477353A (zh) * 2011-03-16 2013-12-25 皇家飞利浦有限公司 用于医学数据的智能链接的方法和系统
US8965818B2 (en) * 2012-05-16 2015-02-24 Siemens Aktiengesellschaft Method and system for supporting a clinical diagnosis
US8788439B2 (en) * 2012-12-21 2014-07-22 InsideSales.com, Inc. Instance weighted learning machine learning model
US9417256B2 (en) 2012-12-12 2016-08-16 Repsol, S. A. System, method and program product for automatically matching new members of a population with analogous members
US20160103973A1 (en) * 2014-01-03 2016-04-14 Foundation Medicine, Inc. Computer-implemented system and method for identifying similar patients
US9135571B2 (en) * 2013-03-12 2015-09-15 Nuance Communications, Inc. Methods and apparatus for entity detection
US9754081B2 (en) * 2013-05-14 2017-09-05 The Regents Of The University Of California Context-aware prediction in medical systems
CN103530651A (zh) * 2013-10-22 2014-01-22 东南大学 一种基于标记分布的头部姿态估计方法
US11495355B2 (en) * 2014-05-15 2022-11-08 The Johns Hopkins University Method, system and computer-readable media for treatment plan risk analysis
US9349178B1 (en) * 2014-11-24 2016-05-24 Siemens Aktiengesellschaft Synthetic data-driven hemodynamic determination in medical imaging
US9792549B2 (en) * 2014-11-21 2017-10-17 International Business Machines Corporation Extraction of semantic relations using distributional relation detection
EP3234841A4 (en) 2014-12-17 2018-08-29 Foundation Medicine, Inc. Computer-implemented system and method for identifying similar patients
CN106326906B (zh) * 2015-06-17 2019-11-01 姚丽娜 活动识别方法和装置
US20200327404A1 (en) * 2016-03-28 2020-10-15 Icahn School Of Medicine At Mount Sinai Systems and methods for applying deep learning to data
US20180032678A1 (en) * 2016-07-29 2018-02-01 International Business Machines Corporation Medical recording system
EP3306617A1 (en) * 2016-10-06 2018-04-11 Fujitsu Limited Method and apparatus of context-based patient similarity

Also Published As

Publication number Publication date
US11126921B2 (en) 2021-09-21
US20220004906A1 (en) 2022-01-06
US20180307995A1 (en) 2018-10-25
CN110770850A (zh) 2020-02-07
US11875277B2 (en) 2024-01-16
CN110770850B (zh) 2024-03-08
EP3613060A1 (en) 2020-02-26
WO2018192831A1 (en) 2018-10-25
JP2020518050A (ja) 2020-06-18

Similar Documents

Publication Publication Date Title
JP6975253B2 (ja) エンティティ間のコンテキスト的類似度の学習及び適用
Zhang et al. Shifting machine learning for healthcare from development to deployment and from models to data
Dey et al. Artificial intelligence in cardiovascular imaging: JACC state-of-the-art review
Sekeroglu et al. <? COVID19?> detection of covid-19 from chest x-ray images using convolutional neural networks
US11864944B2 (en) Systems and methods for a deep neural network to enhance prediction of patient endpoints using videos of the heart
Choe et al. Content-based image retrieval by using deep learning for interstitial lung disease diagnosis with chest CT
Amal et al. Use of multi-modal data and machine learning to improve cardiovascular disease care
US11288279B2 (en) Cognitive computer assisted attribute acquisition through iterative disclosure
WO2019229562A1 (en) Personalized device recommendations for proactive health monitoring and management
WO2021098534A1 (zh) 相似度确定、网络训练、查找方法及装置、电子装置和存储介质
Li et al. Multithreshold change plane model: Estimation theory and applications in subgroup identification
Karaca et al. Stroke Subtype Clustering by Multifractal Bayesian Denoising with Fuzzy C Means and K‐Means Algorithms
US20220292405A1 (en) Methods, systems, and frameworks for data analytics using machine learning
US20210398677A1 (en) Predicting changes in medical conditions using machine learning models
Yang et al. Right ventricular stroke work correlates with outcomes in pediatric pulmonary arterial hypertension
Teo et al. Discovering the predictive value of clinical notes: machine learning analysis with text representation
WO2020185758A1 (en) Systems and methods for assessing a likelihood of cteph and identifying characteristics indicative thereof
JP7346419B2 (ja) エンティティ間のコンテキスト的類似性の学習および適用
US20210335457A1 (en) Mapping a patient to clinical trials for patient specific clinical decision support
CN113223698B (zh) 急诊分级处理方法、装置、电子设备以及存储介质
US20240233891A1 (en) Clinical system integration
Martín-Rodríguez et al. Use of Machine Learning Techniques for Predicting Heart Disease Risk from Phone Enquiries Data
TW202407713A (zh) 識別高風險患者以進行保護性經皮冠狀動脈介入治療之方法及設備
Krishnaswami et al. Can we improve mortality estimation in women after treadmill testing by using sex-specific scores?
WO2024064852A1 (en) Spacetime attention for clinical outcome prediction

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210409

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210706

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211105

R150 Certificate of patent or registration of utility model

Ref document number: 6975253

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150