JP2023123711A

JP2023123711A - 健康情報に基づく予後スコア

Info

Publication number: JP2023123711A
Application number: JP2023105485A
Authority: JP
Inventors: ヘイムソン，ジョシュア，ディー．; D Haimson Joshua; バクシー，シュルジャル; Baxi Shrujal; メロポール，ニール; Meropol Neal; アムブワニ，ギートゥ; Ambwani Geetu; バッケンロス，ダニエル; Backenroth Daniel; ムラリ，マヘシュ; Murali Mahesh; ロシック，アンドレユ; Rosic Andrej; ジャン，チェンシェ; Chengsheng Jiang
Original assignee: Flatiron Health Inc
Current assignee: Flatiron Health Inc
Priority date: 2019-02-26
Filing date: 2023-06-27
Publication date: 2023-09-05
Also published as: US20200272919A1; US20240078448A1; EP3931844A1; JP7304960B2; US11651252B2; JP2022522148A; WO2020176476A1

Abstract

【課題】患者の生存率を予測するためのモデル支援システム及び方法を提供する。【解決手段】少なくとも１つのプロセッサを含む患者の生存率を予測するためのモデル支援システムであって、プロセッサは、患者の医療記録を格納するデータベースにアクセスし、患者に関係する構造化情報及び非構造化情報の少なくとも１つを分析し、分析に基づき、構造化ＥＣＯＧスコア無しに、患者のパフォーマンスステータス予測を生成し、予測パフォーマンスステータスを示す出力を提供する。構造化情報及び非構造化情報の少なくとも１つの情報の分析並びに予測パフォーマンスステータスの生成は、トレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも１つにより行われる。【選択図】図５

Description

関連出願の相互参照
[0001] 本出願は２０１９年２月２６日出願の米国仮出願第６２／８１０，７００号及び２０１９年３月２８日出願の米国仮出願第６２／８２５，３３８号の優先権の利点を請求する。前述の出願の全体を参照により本明細書に援用する。

背景
技術分野
[0002] 本開示は患者の生存率を予測するためのモデル支援システム及び方法に関する。

背景情報
[0003] 末期的な可能性の医療状態を有する患者を治療する際、医者はしばしば患者の福利及び改善の尤度について難しい評価を行う。これらの予後判断はしばしば患者の適切な治療計画を判断する。患者の改善の尤度又は生存率の評価は、その多くが主観的であり且つ容易に測定可能でない多数の要因の組み合わせの考察に関与し得る。したがって、適切な治療計画を判断するのを助けるために、患者の死亡の尤度、短期改善及び全体的福利のより定量化可能な評価の必要性がある。

[0004] 患者の一般的福利を定量化しようとするいくつかの解決策が開発されてきた。例えば、Eastern Cooperative Oncology Group（ＥＣＯＧ）スコアは、医師が患者の機能のレベルを追跡することを可能にする予後スコアである（０～５；０は良好；５は死亡）。このスコアはいくつかの療法に耐える患者の能力を評価する際に役立ち得る。例えば、１のＥＣＯＧスコアを有する患者は４のＥＣＯＧスコアを有する患者より毒性が高い薬をより自由に処方され得る。しかし、ＥＣＯＧスコアの展開は個々の医者からの評価に依存する。実際、多くの医者及び臨床医はＥＧＯＧスコアを追跡しておらず、このことは、ＥＣＯＧスコア情報が患者群に関し無い又は不完全であるかもしれないので医療データの現実世界分析を困難にし得る。さらに、これらのＥＣＯＧスコアは、主観的であり、患者を評価する各医者の個々の判断に依存する。したがって、所与の患者のＥＣＯＧスコアは評価を提供する医者に依存して変わり得る。

[0005] したがって、特にＥＣＯＧスコアが無い場合には、患者の改善された予後評価の必要性がある。解決策は有利には、個々のケア提供者によりなされるスコア評価に関与すること無しに、患者に関連するデータに基づく予後スコアの展開を可能にするべきである。解決策は、例えば患者の医療記録からのデータなど患者に関連する広範囲のデータに基づき患者を採点することができるべきである。解決策はさらに、特定治療に対する患者の反応を予測すること又は患者の臨床試験の適合性を評価することなど、生存率スコアを越えた追加予後を可能にするべきである。

概要
[0006] 本開示に整合する実施形態は患者の生存率を予測するためのシステム及び方法を含む。例示的実施形態では、少なくとも１つのプロセッサを含む患者のパフォーマンスステータスを予測するためのモデル支援システムが存在し得る。プロセッサは、患者に関連する構造化情報及び非構造化情報の少なくとも１つを含む患者の医療記録であって構造化患者ＥＣＯＧスコアを欠く医療記録を格納するデータベースにアクセスし；患者に関連する構造化情報及び非構造化情報の少なくとも１つを分析し；上記分析に基づき、そして構造化ＥＣＯＧスコア無しに、患者のパフォーマンスステータス予測を生成し；そして患者の予測パフォーマンスステータスを示す出力を提供するようにプログラムされ得、患者に関連する構造化情報及び非構造化情報の少なくとも１つの分析並びに患者の予測パフォーマンスステータスの生成はトレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも１つにより行われる。

[0007] 別の開示された実施形態によると、患者のパフォーマンスステータスを予測する方法が実施され得る。本方法は、患者に関連する構造化情報及び非構造化情報の少なくとも１つを含む患者の医療記録であって構造化患者ＥＣＯＧスコアを欠く医療記録を格納するデータベースにアクセスすること；患者に関連する構造化情報及び非構造化情報の少なくとも１つを分析すること；上記分析に基づき、そして構造化ＥＣＯＧスコア無しに、患者のパフォーマンスステータス予測を生成すること；及び患者の予測パフォーマンスステータスを示す出力を提供することを含み得、患者に関連する構造化情報及び非構造化情報の少なくとも１つの分析並びに患者の予測パフォーマンスステータスの生成は、トレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも１つにより行われる。

[0008] 別の開示された実施形態によると、患者のパフォーマンスステータススコアを提供するシステムは少なくとも１つのプロセッサを含み得る。少なくとも１つのプロセッサは、患者に関連する構造化及び非構造化情報を含む患者の医療記録を格納するデータベースにアクセスし；患者に関連する治療方針を医療記録に基づき識別し、構造化情報は治療方針に関連する患者のパフォーマンスステータススコアを欠き；治療方針に関連する患者のパフォーマンスステータススコアを判断するために非構造化情報を分析し、パフォーマンスステータススコアはトレーニング済み機械学習モデル又は自然言語処理アルゴリズムのうちの少なくとも１つにより判断され；そしてパフォーマンスステータススコアを示す出力を提供するようにプログラムされ得る。

[0009] 他の開示された実施形態に整合して、非一時的コンピュータ可読ストレージ媒体は、少なくとも１つの処理装置により実行されるプログラム命令であって本明細書における説明される方法のうちの任意のものを行うプログラム命令を格納し得る。

図面の簡単な説明
[0010] 本明細書に援用され本明細書の一部を構成する添付図面は本明細書と共に、様々な実施形態の原理を示しており、その原理を説明する役目を果たす。

[0011]本開示に整合する実施形態を実施するための例示的システム環境を示すブロック図である。 [0012]本開示に整合する患者の例示的医療記録を示すブロック図である。 [0013]本開示に整合する患者の例示的予後予測を示すブロック図である。 [0014]本開示に整合する実施形態を実施するための例示的機械学習過程を示すブロック図である。 [0015]本開示に整合する患者のパフォーマンスステータスを予測する例示的方法を示す流れ図である。 [0016]本開示に整合するトレーニング済み機械学習モデルの精度レベルを判断する例示的方法を示す流れ図である。 [0017]本開示に整合する患者パフォーマンスステータススコアを判断する例示的方法を示す流れ図である。

詳細な説明
[0018] 以下の詳細説明は添付図面を参照する。可能な限り、同じ参照符号が、同じ又は同様な部分を参照するために添付図面及び以下の明細書を通して使用される。いくつかの例示的実施形態が本明細書において説明されるが、修正形態、適応化形態及び他の実施形態が可能である。例えば、置換、追加又は修正が添付図面に示された部品に対しなされ得、本明細書において説明される例示的方法は、本開示方法に対して工程を置換、再順序付け、除去、又は追加することにより修正され得る。したがって、以下の詳細説明は開示された実施形態及び例に限定されない。その代りに、適切な範囲が添付の特許請求の範囲により定義される。

[0019] 本明細書における実施形態はコンピュータ実施方法、有形な非一時的コンピュータ可読媒体、及びシステムを含む。コンピュータ実施方法は、非一時的コンピュータ可読ストレージ媒体から命令を受信する例えば少なくとも１つのプロセッサ（例えば処理装置）により実行され得る。同様に、本開示に整合するシステムは少なくとも１つのプロセッサ（例えば処理装置）及びメモリを含み得、メモリは非一時的コンピュータ可読ストレージ媒体であり得る。本明細書で使用されるように、非一時的コンピュータ可読ストレージ媒体は、少なくとも１つのプロセッサにより読み取り可能な情報又はデータが格納され得る任意のタイプの物理的メモリを指す。この例はランダムアクセスメモリ（ＲＡＭ：random access memory）、読み出し専用メモリ（ＲＯＭ：read-only memory）、揮発性メモリ、不揮発性メモリ、ハードドライブ、ＣＤＲＯＭ、ＤＶＤ、フラッシュドライブ、ディスク及び任意の他の公知の物理的ストレージ媒体を含む。「メモリ」及び「コンピュータ可読ストレージ媒体」などの単数用語は、複数のメモリ及び／又はコンピュータ可読ストレージ媒体などのような複数の構造を追加的に指し得る。本明細書で参照されるように、「メモリ」は別途規定しない限り任意のタイプのコンピュータ可読ストレージ媒体を含み得る。コンピュータ可読ストレージ媒体は少なくとも１つのプロセッサによる実行のための命令（プロセッサに本明細書内の実施形態に整合する工程又は段階を行わせるための命令を含む）を格納し得る。加えて、１つ又は複数のコンピュータ可読ストレージ媒体はコンピュータ実施方法を実施する際に利用され得る。用語「コンピュータ可読ストレージ媒体」は、有形物品を含むが搬送波及び一時的信号を除外するものと理解されるべきである。

[0020] 本開示の実施形態は患者のパフォーマンスステータスを予測するためのシステム及び方法を提供する。開示されたシステム及び方法のユーザは、患者の臨床経験にアクセスしたい及び／又は患者データを分析したいかもしれない任意の個人を包含し得る。したがって、本開示を通じて、本開示システム及び方法の「ユーザ」への言及は医師、ヘルスケア機関における品質保証部及び／又は患者などの任意の個人を包含し得る。腫瘍又は癌療法が本開示を通じて参照されるが、これらは一例として提供されるに過ぎず、そして開示されるシステム及び方法は様々な他の病気及び／又は治療に適用し得るということが理解される。

[0021] 図１は以下に詳細に説明される本開示に整合する実施形態を実施するための例示的システム環境１００を示す。図１に示すように、システム環境１００はいくつかの部品を含む。これらの部品の数及び配置は例示的でありそして例示のために提供されるということが本開示から理解されることになる。他の配置及び他の数の部品が本開示の教示及び実施形態から逸脱することなく使用され得る。

[0022] 図１に示すように、例示的システム環境１００はシステム１３０を含む。システム１３０は、ネットワーク上のエンティティから情報を受信し、この情報を処理し、格納し、そしてネットワーク上の他のエンティティへ表示／送信するように構成された１つ又は複数のサーバシステム、データベース及び／又は計算システムを含み得る。したがって、いくつかの実施形態では、ネットワークは、クラウド共有、格納及び／又は計算を容易にし得る。一実施形態では、システム１３０は、図１のシステム１３０を表す点線により囲まれた領域内に示される処理エンジン１４０及び１つ又は複数のデータベース１５０を含み得る。処理エンジン１４０は、１つ又は複数の一般的プロセッサ（例えば中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）など）及び／又は１つ又は複数の特殊プロセッサ（例えば特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）など）などの少なくとも１つの処理装置を含み得る。

[0023] 一実施形態では、システム１３０は、１つ又は複数のデータソース１１０及びクライエント装置１６０などの様々な他の部品から及び／又はそれへ患者医療データを受信及び／又は送信し得る。医療データは、それぞれが患者に関連する１つ又は複数の医療記録内に格納され得る。具体的には、システム１３０は、データソース１１０を含む様々なデータソースからネットワーク１２０（例えばインターネット、イントラネット、ＷＡＮ、ＬＡＮ、セルラーネットワーク、ブルートゥースなど）上で送信されるデータを受信及び格納し、受信されたデータを処理し、そしてこの処理に基づくデータ及び結果をクライエント装置１６０へ送信するように構成され得る。

[0024] システム環境１００の様々な部品は、メモリ、中央処理ユニット（ＣＰＵ）及び／又はユーザインターフェースを含むハードウェア、ソフトウェア及び／又はファームウェアのアセンブリを含み得る。メモリは、フロッピーディスク、ハードディスク又は磁気テープを含む磁気ストレージ；ソリッドステートディスク（ＳＳＤ）又はフラッシュメモリなどの半導体ストレージ；光ディスクストレージ；又は磁気光学ディスクストレージなどの物理的ストレージ媒体で具現化される任意のタイプのＲＡＭ又はＲＯＭを含み得る。ＣＰＵは、メモリ内に格納された一組のプログラム可能命令又はソフトウェアに従ってデータを処理するための１つ又は複数のプロセッサを含み得る。各プロセッサの機能は、単一専用プロセッサにより又は複数のプロセッサにより提供され得る。さらに、プロセッサは、限定しないがデジタルシグナルプロセッサ（ＤＳＰ）ハードウェア、又はソフトウェアを実行することができる任意の他のハードウェアを含み得る。任意選択的ユーザインターフェースはディスプレイモニタ、キーボード及び／又はマウスなどの任意のタイプ又は組み合わせの入力／出力装置を含み得る。

[0025] システム環境１００内で送信及び／又は交換されるデータはデータインターフェース上で発生し得る。本明細書で使用されるように、データインターフェースは、システム環境１００の２つ以上の部品がデータを交換する任意の境界を含み得る。例えば、環境１００は、ソフトウェア、ハードウェア、データベース、装置、人又は前述の任意の組み合わせの間でデータを交換し得る。さらに、ソフトウェア、プロセッサ、データストレージ装置及びネットワークの任意の好適な構成がシステム環境１００の部品及び関連実施形態の特徴を実現するために選択され得るということが理解されることになる。

[0026] 以下にさらに説明するように、システム１３０はネットワーク１２０内のデータソース１１０又は他のソースから患者医療記録を受信するように構成され得る。データソース１１０は患者の医療データの様々なソースを含み得る。例えば、データソース１１０は、患者の医療提供者（医師、看護婦、専門家、コンサルタント、病院、診療所など）を含み得る。データソース１１０はまた、放射線学又は他の撮像研究所、血液学研究所、病理学研究所などの研究所を含み得る。データソース１１０はまた、保険会社又は患者データの任意の他のソースを含み得る。システム１３０は、患者に関するデータを予測するために１つ又は複数のモデルを開発するように構成され得る。例えば、システム１３０は、トレーニングデータに基づきモデルを開発するために機械学習技術を使用し得る。システム１３０は、例えば生存率スコアと患者の治療又は福利に関係する他のパフォーマンスステータス指標とを含む予後結果を生成するために１つ又は複数のモデルを、受信された医療結果へ適用し得る。

[0027] システム１３０はさらに、ネットワーク１２０上の１つ又は複数のクライエント装置１６０と通信し得る。例えば、システム１３０はデータソース１１０からのデータの分析に基づく予後結果をクライエント装置１６０へ提供し得る。クライエント装置１６０は、ネットワーク１２０上のデータを受信又は送信することができる任意のエンティティ又は装置を含み得る。例えば、クライエント装置１６０は、サーバ又はデスクトップ又はラップトップコンピュータなどの計算装置を含み得る。クライエント装置１６０はまた、モバイル装置、タブレット、ウェアラブル装置（すなわちスマートウオッチ、移植可能装置、フィットネス追跡器など）、仮想マシン、ＩｏＴ装置などの他の装置又は他の様々な技術を含み得る。いくつかの実施形態では、クライエント装置１６０は、ネットワーク１２０上の患者に関する情報の照会（予後スコア、患者医療記録又は患者に関する様々な他の情報の照会など）をシステム１３０へ送信し得る。

[0028] 図２は患者の例示的医療記録２００を示す。医療記録２００は、上述のようにデータソース１１０から受信され、そしてシステム１３０により処理され得る。データソース１１０（又は他のどこか）から受信される記録は図２に示すように構造化データ２１０及び非構造化データ２２０の両方を含み得る。構造化データ２１０は、患者に関する定量化可能又は分類可能データ、例えば性別、年齢、人種、体重、バイタルサイン、研究所結果、診断の日、診断タイプ、病期（例えば課金コード）、療法タイミング、行われる手順、訪問日、診療タイプ、保険業者及び保険開始日、投薬指示、投薬管理、又は患者に関する任意の他の測定可能データを含み得る。非構造化データは、医師のノート又は患者の研究所報告など定量化可能でない又は容易に分類されない患者に関する情報を含み得る。非構造化データ２２０は、治療計画に関する医師の記述、何が訪問時に発生したかを記述するノート、患者の具合に関する記述、放射線学的報告、病理報告などの情報を含み得る。いくつかの実施形態では、非構造化データは抽象化処理により捕捉され得るが、構造化データは、ヘルスケア専門家により入力され得る、又はいくつかのアルゴリズムを使用して計算され得る。

[0029] データソース１１０から受信されるデータでは、各患者は、１又は複数の医療従事者により又は患者により生成される１つ又は複数の記録により表され得る。例えば、患者に関連する医者、患者に関連する看護婦、患者に関連する理学療法士などがそれぞれ患者の医療記録を生成し得る。いくつかの実施形態では、１つ又は複数の記録は、同じデータベース内で照合及び／又は同じデータベース内に格納され得る。他の実施形態では、１つ又は複数の記録は複数のデータベースにわたって分散され得る。いくつかの実施形態では、これらの記録は複数の電子データ表現で格納及び／又は提供され得る。例えば、患者記録は、テキストファイル、ポータブル文書フォーマット（ＰＤＦ：portable document format）ファイル、拡張可能マークアップ言語（ＸＭＬ：extensible markup language）ファイルなどの１つ又は複数の電子ファイルとして表現され得る。文書がＰＤＦファイル、画像、又はテキスト無しの他のファイルとして格納されれば、電子データ表現はまた、光学式文字認識処理から導出される文書に関連するテキストを含み得る。

[0030] 図３は本開示に整合する患者の例示的予後結果３００を示す。例えば、予後結果３００は、データソース１１０から受信される患者医療データへモデルを適用することによりシステム１３０により生成され得る。予後結果３００は医療記録２００に基づく患者に関する多種多様な予測を含み得る。例えば、図３に示すように、予後結果３００は計算された生存率スコアを含み得る。このスコアは機械学習技術に基づくので、計算されたスコアは、ＥＣＯＧスコアより全体的生存率のより良い予測として役立ち得る。いくつかの実施形態では、生存率スコアは、患者が生き延びることが予想される期間の時間推定を含み得る。例えば、生存率スコアは、図３に示すように何か月にわたる患者の生存率を予測し得る。任意の他の適切な時間増分又は時間間隔もまた使用され得る。いくつかの実施形態では、時間推定は、患者の治療又は療法の開始日など特定日に対するものであり得る。生存率スコアはまた、スケール（例えば１～１０又は１～５の範囲）上で又はパーセントとして表され得る。様々な形式又はフォーマットが上に説明されたが、開示される実施形態は生存率スコアの任意特定形式又はフォーマットに限定されないということが理解される。

[0031] さらに、生存率スコアが一例として提供されたが、様々な他のパフォーマンスステータス指標が予後結果３００に含まれ得る。本明細書で使用されるように、患者の「パフォーマンスステータス」は患者の現在の健康又は福利の任意の表示を含み得る。パフォーマンスステータスは、患者の生存率スコアに限定されなく、そして患者の状態の他の指標を含み得る。一例として、パフォーマンスステータスは患者の感情的又は精神的健康に関係し得る。例えば、医師により書かれたノートの分析に基づき、システム１３０は、患者が治療に応じた前向きな見通し又は後向きな見通しを有するか、患者が鬱の兆しを示すかどうか、患者が、いくつかの精神的副作用、又は患者の情緒面の健康に関する任意の他の情報を呈示するかを判断し得る。このような情報は、適切な処理を判断するために、患者が臨床試験に含まれるべきかどうかなどを判断するために有用であり得る。パフォーマンスステータスは、上述の生存率スコアに似たスコア（例えば数値、テキストベース等級など）として表され得る。

[0032] 予後結果３００はまた、患者の治療、患者の病気の進展、又は患者の福利全体に関連する様々な他のパフォーマンスステータス予測を含み得る。いくつかの実施形態では、システム１３０は、病気に起因する患者の予想改善又は悪化の時間推定を生成し得る。例えば、予後結果３００は患者の回復の推定時間枠を反映し得る。他の実施形態では、予後結果３００は、患者の悪化の時間（例えば癌治療患者が病気の進行ステージに到達するのにかかる時間などの）推定を含み得る。これらの時間推定は、患者の特定治療又は療法の開始日又は患者のケアに関係する他の日に対するものであり得る。パフォーマンスステータス予測は、回復の予測尤度、特定処理に対する予測反応性、特定病気に対する予測感受性、予測複雑性若しくは発生し得る他の事象、又は患者の福利に関する様々な他の予測などの患者に関する他の予測を含み得る。

[0033] 予後結果３００はまた、患者を臨床試験に含むことの適合性を含み得る。例えば、システム１３０は、生成された生存率スコア、又は機械学習過程において使用される他の要因などの生成されたパフォーマンスステータス表示に基づき１つ又は複数の臨床試験の患者の適合性を判断し得る。臨床試験は特定の療法又は技術を使用して患者を治療することに関与し得る。例えば、これは革新的癌療法又は実験的薬物治療を含み得る。患者の適合性出力は図３に示すように２値「推奨」又は「非推奨」フォーマットで予後結果内に表され得る。代替的に、患者の適合性は、スケールで（例えば１～１０）、パーセントとして、一連の等級（例えば「高度に好適」、「適度に好適」など）として又は様々な他のフォーマットでなど累進的フォーマットで表され得る。いくつかの実施形態では、患者が臨床試験に含まれる適合性はシステム１３０により生成される生存率スコアに基づき得る。例えばより長い予測生存率を有する患者は臨床試験に含まれる可能性がより高いかもしれない。

[0034] 予後結果３００はまた、未治療患者の病気又は特定療法に応じた患者の病気のいずれかの予測反応を含み得る。例えば、癌患者を治療する際、システム１３０は、所定期間にわたってどれだけ患者内の腫瘍が縮小又は成長することが予測されるかを示すサイズ推定を生成し得る。いくつかの実施形態では、腫瘍のサイズの予測は療法の開始日後の所定時間に基づき判断され得る。腫瘍反応推定は、図３に示すようにサイズ（重量による、容積による、又は測定の他のある単位による、のいずれか）のパーセント増加又はパーセント低下として表され得る。予測腫瘍反応はまた、重量により、容積により、又は長さ（例えば直径、外周など）としてなど絶対項で表現され得る。

[0035] 図４は本開示に整合する実施形態を実施するための例示的機械学習システム４００を示す。機械学習システム４００はシステム１３０（図１）の一部として実現され得る。例えば、機械学習システム４００は処理エンジン１４０の一部品又は処理であり得る。開示された実施形態によると、機械学習システム４００はトレーニング済みモデル（例えば監視（supervised）機械学習システム）を、患者に関連する一組のトレーニングデータに基づき生成し得、そして生存率スコア又は患者に関係する多くの他の予測を生成するためにこのモデルを使用し得る。例えば、図４に示すように、機械学習システム４００は予後結果３００を生成するためのモデル４３０を生成し得る。機械学習システム４００は、例えばトレーニングアルゴリズム４２０を使用することにより、トレーニング処理を通じてモデル４３０を開発し得る。

[0036] モデル４３０のトレーニングは、モデルを開発するためにトレーニングアルゴリズム４２０へ入力され得るトレーニングデータセット４１０の使用に関与し得る。トレーニングデータ４１０は、モデルにより推定される様々な結果（例えば患者生存率、患者パフォーマンスステータス、腫瘍反応、病気進展時間枠、臨床試験の適合性など）が既に知られている複数の患者医療記録（例えば図４に示すように「記録１」、「記録２」、「記録３」など）を含み得る。いくつかの実施形態では、トレーニングデータ４１０はまた、トレーニング処理を容易にするために、トレーニングアルゴリズム４２０への入力に先立ってクリーンにされ得る、条件付けられ得る及び／又は操作され得る。機械学習システム４００は、特徴と特定患者結果との間の相関を判断するために１つ又は複数の特徴（又は特徴ベクトル）を記録から抽出し得る。これらの特徴は上述の医療記録内の構造化及び非構造化データから抽出され得る。例えば、トレーニング処理は、患者の体重、性別、記録されたバイタルサイン、診断コードなどのデータと患者の関連生存率又は他の結果とを相関付け得る。

[0037] 非構造化データに関して、様々な技術（例えば自然言語処理技術）が、特徴ベクトルをモデルへ提供するために使用され得る。患者の医療記録の文書のいくつか又は一部は電子的に利用可能であり得るが、記録内のタイプされた、手書きされた、又は印刷されたテキストは機械符号化テキストへ変換され得る（例えば光学式文字認識（ＯＣＲ）を介し）。電子テキストが、特定結果に関連するいくつかのキーワード又は語句に関し検索され得る。いくつかの実施形態では、識別されたワード又はテキストの近傍のテキストのスニペット（snippet）がワード又は語句の文脈に関する追加情報を収集するために試験され得る。例えば、用語「転移性」を検索する際、語句「転移性活動の証拠無し」は「ステージＩＶ；転移性」とは著しく異なる意味を伝え得る。興味あるワード又は語句を囲むテキストのスニペットを分析することにより、１つ又は複数の特徴が、抽出され得、トレーニング済み選択モデルへの入力として提供され得る特徴ベクトルを形成する。非構造化文書からのこれらの特徴は、患者の医療記録又は他の利用可能データソース（例えばクレームデータ、患者報告データ）に関連する構造化データからの特徴と組み合わせられ得る。

[0038] 所望結果に関する情報（例えば患者の生存率）と共に、抽出された特徴の一部はトレーニングデータ４１０として格納され得る。次に、トレーニングデータ４１０（又はその一部）は、モデルをトレーニングするためにトレーニングアルゴリズム４２０によって配置され得る。多くのこのようなインスタンスへ晒されることにより、モデル４３０は、予想結果と同一な又はそれに近い出力を「学習」し、提供し得る。

[0039] 機械学習システム４００はモデル４３０を開発するために任意の好適な機械学習アルゴリズムを採用し得る。例えば、トレーニングアルゴリズム４２０は、抽出された特徴を特定患者結果へ関連付ける１つ又は複数の機能（又は規則）を生成するロジスティック回帰を含み得る。追加的に又はその代わりに、トレーニングアルゴリズム４２０は、特徴の入力層が１つ又は複数の隠れ層に挿通され次に（関連確率を有する）患者結果の出力層に挿通されるように１つ又は複数のノードの重み付けを調整する１つ又は複数のニューラルネットワークを含み得る。他のタイプの機械学習技術がまた、線形回復モデル、lasso回帰分析、ランダムフォレストモデル、K-Nearest Neighbor（ＫＮＮ）モデル、Ｋ－平均モデル、決定木、コックス比例ハザード（cox proportional hazards）回帰モデル、Na「i」ve Bayesモデル、サポートベクトルマシン(SVM：Support Vector Machines)モデル、又はgradient boostingアルゴリズムなどのロジスティック回帰技術と組み合わせて又はこれとは別にのいずれかで使用され得る。これらのモデルはまた、手動トレーニングが必要とされない非監視（unsupervised）機械学習過程又は強化機械学習過程を使用して開発され得る。

[0040] トレーニングデータ４１０の残り部分は、トレーニング済みモデル４３０を試験するとともにそのパフォーマンスを評価するために使用され得る。例えば、トレーニングデータセット４１０の残りにおいて個人毎に、特徴ベクトルが、当該患者に関連する医療記録から抽出され得る。これらの特徴ベクトルはモデル４３０へ提供され得、当該個人の出力は当該個人の既知の結果（例えば当該個人の実際の生存時間）と比較され得る。モデル４３０の出力と、トレーニングデータセット４１０内の任意の個人の既知の結果との間の乖離は、図４に示すようにパフォーマンス測定結果４６０を生成するために使用され得る。パフォーマンス測定結果４６０は、予後結果４５０と既知の患者結果との間の乖離を低減するためにモデル４３０を更新する（例えば、モデルを再トレーニングする）ために使用され得る。例えば、モデルの１つ又は複数の関数が追加、除去、又は修正され得る（例えば、二次関数が三次関数へ修正され得る、指数関数が多項式関数へ修正され得る、等々）。したがって、乖離は、モデル４３０へ渡された特徴がどのように構築されたか又はどのタイプのモデルが採用されたかを修正するための決定を通知するために使用され得る。代替案として、いくつかの実施形態では、回帰の１つ又は複数の重み付け（又は、モデルがニューラルネットワークを含めばノードの１つ又は複数の重み付け）が乖離を低減するために調整され得る。乖離のレベルが所望限界内（例えば１０％未満、５％未満）である場合、１つ又は複数のモデル４３０は、「患者結果が未知である」データセットに対する操作に好適であると見做され得る。

[0041] 「乖離」の観点で上に説明されたが、１つ又は複数の損失関数もまた、モデルの精度を測定するために使用され得る。例えば、二次損失関数、ヒンジ損失関数、ロジスティック損失関数、クロスエントロピー損失関数又は任意の他の損失関数が使用され得る。このような実施形態では、モデルに対する更新は１つ又は複数の損失関数を低減する（又は、少なくとも局所的に最小化すらする）ように構成され得る。

[0042] モデル４３０が構築されると、医療記録４４０などの新しいデータがモデル４３０へ入力され得る。医療記録４４０は上述の医療記録２００に対応し得る。例えば、医療記録４４０は、各患者が１つ又は複数の医療記録に関連付けられるように複数の患者に関連する構造化及び非構造化データを含み得る。モデル４３０は、予後結果４５０などのスコア及び／又は予測を生成するために特徴を医療記録４４０から抽出し得る。予後結果４５０は予後結果３００に関して上述したように、生存率スコアだけでなく他のスコア又は予測も含み得る。

[0043] いくつかの実施形態では、非構造化データ２１０及び構造化データ２２０は１つ又は複数の自然言語処理アルゴリズムを使用して分析され得る。本明細書で使用されるように、「自然言語処理」は、書かれた自然言語情報を分析及び処理するための任意の技術又は処理を指し得る。自然言語情報は、書かれた又は話された言語を通じて人により生成されるテキスト又は音声データを含み得る。例えば、自然言語情報は、上述のように分析され得る非構造化データとして医療記録に含まれ得る。自然言語処理アルゴリズムは自然言語情報を分析するための任意のコンピュータベース技術を含み得る。例えば、自然言語処理アルゴリズムは、レマタイゼーション（lemmatization）、品詞タグ付け、文章解読（sentence breaking）、ワードステミング（word stemming）、語彙意味論、機械翻訳、名前エンティティ認識（ＮＥＲ：name entity recognition）、光学式文字認識（ＯＣＲ：optical character recognition）、又は非構造化データ若しくは構造化データから情報を抽出することを容易にし得る様々な他の技術などの技術を含み得る。これらのアルゴリズムは、単独で、又は上述の機械学習技術と組み合わせて使用され得る。例えば、自然言語処理アルゴリズムは上述の非構造化データの条件付けの一部として使用され得る。

[0044] 図５は患者のパフォーマンスステータスを生成する例示的方法５００を示す。方法５００は例えばシステム１００（図１に示す）の処理エンジン１４０の少なくとも１つのプロセッサにより実施され得る。

[0045] 工程５１０では、方法５００は患者の医療記録を格納するデータベースにアクセスすることを含み得る。医療記録は患者に関連する構造化情報及び非構造化情報の少なくとも１つを含み得る。例えば、処理エンジン１４０は、データソース１１０又は他の様々なソースからネットワーク１２０を介しデータベースにアクセスし得る。上述のように、データソース１１０は患者医療データの様々なソースを含み得、例えば、患者の医療記録は医療提供者、研究所又は保険会社から受信され得る。代替的に又は加えて、処理エンジンはデータベース１５０などのローカルデータベースにアクセスし得る。

[0046] 処理エンジン１４０は、上述のように、医療記録２００に整合する１つ又は複数の医療記録にアクセスし得る。医療記録は１つ又は複数の電子ファイル（テキストファイル、画像ファイル、ＰＤＦファイル、ＸＬＭファイル、ＹＡＭＬファイルなど）を含み得る。医療記録は、性別、生年月日、人種、体重、研究所結果、バイタルサイン、診断日、訪問日、投薬指示、診断コード、手順コード、薬コード、以前の療法、又は投薬管理を含み得る構造化情報、及びヘルスケア提供者により書かれるテキスト、放射線学的報告、又は病理学報告を含み得る非構造化情報を含み得る。各医療記録は特定患者に関連付けられ得、そして、いくつかの実施形態では、複数の医療記録が特定患者に関連付けられ得る。医療記録は、医療機関からのデータに限定され得なく、そして、クレームデータ（例えば保険会社からの）、患者報告データ、又は患者の治療若しくは福利に関連する他の情報などの他の関連形式のデータを含み得る。開示された実施形態に整合して、医療記録は患者ＥＣＯＧスコアを欠き得る。いくつかの実施形態では、医療記録は構造化ＥＣＯＧスコアを欠き得る。例えば、ＥＣＯＧスコアは構造化情報内に含まれないかもしれないが、非構造化情報に含まれ得る。他の実施形態では、医療記録は構造化情報及び非構造化情報の両方内にＥＣＯＧスコアを欠き得る。

[0047] 工程５２０では、方法５００は、患者に関連する構造化情報及び非構造化情報の少なくとも１つを分析することを含み得る。いくつかの実施形態では、患者に関連する構造化情報及び非構造化情報の少なくとも１つの分析並びに患者の予測パフォーマンスステータスの生成はトレーニング済み機械学習モデルにより行われ得る。例えば、処理エンジン１４０は上述のように、患者の医療記録を分析するために機械学習技術を採用し得る。工程５２０は図４に関連して述べたように、機械学習過程を通じて開発された１つ又は複数のトレーニング済み機械学習モデルを使用し得る。例えば、トレーニング済みモデルはロジスティック回帰モデル、ニューラルネットワーク、コックス比例ハザード回帰、lasso回帰分析ネットワーク又はランダムフォレストモデルを含み得る。同様に、自然言語処理アルゴリズムは、ロジスティック回帰、ニューラルネットワーク、コックス比例ハザード回帰、lasso回帰分析ネットワーク又はランダムフォレストアルゴリズムのうちの１つ又は複数を含み得る。いくつかの実施形態では、モデルはまた、手動トレーニングが必要とされない非監視学習過程又は強化機械学習過程を使用して開発され得る。他の実施形態では、患者に関連する構造化情報及び非構造化情報の少なくとも１つの分析並びに患者の予測パフォーマンスステータスの生成は自然言語処理アルゴリズムにより行われ得る。例えば、工程５２０は、腫瘍反応、処方治療に対する反応、患者の状態の改善又は悪化、又は患者のパフォーマンスステータスを示し得る任意の他のテキストベース情報を示す情報を抽出するために構造化データ又は非構造化データに対し自然言語処理アルゴリズムを使用することを含み得る。

[0048] 工程５２０は、医療記録の分析を容易にするために追加副工程（記録内の情報を条件付ける又は変更することなど）を含み得る。処理エンジン１４０は構造化情報又は非構造化情報を解釈するために様々な技術を採用し得る。記録内のタイプされた、手書きされた、又は印刷されたテキストは機械符号化テキストへ変換され得る（例えば光学式文字認識（ＯＣＲ）を介し）。上述のように、電子テキストが、特定結果に関連する及び識別されたワードの近傍のテキストのスニペットに関連するいくつかのキーワード若しくは語句に関し検索され得る、又はテキストが、ワード又は語句の文脈に関する追加情報を収集するために試験され得る。処理エンジン１４０はまた、上述のように医療記録から１つ又は複数の特徴ベクトルを抽出し得る。処理エンジン１４０は医療記録（又は抽出された特徴）をトレーニング済み機械学習モデルへ入力し得る。

[0049] 工程５３０では、方法５００は分析に基づき患者のパフォーマンスステータス予測を生成することを含み得る。論述したように、この分析は構造化ＥＣＯＧスコア無しに行われ得る。いくつかの実施形態では、パフォーマンスステータス予測は患者の生存率予測を含み得る。例えば、処理エンジン１４０は、図３に関して上に述べたように生存率スコアを生成し得る。生存率予測は患者の生存の推定期間を示し得る。例えば、生存率予測は、患者が生き延びることが予想される期間の時間推定を含み得る。いくつかの実施形態では、患者が生き延びることが予想される期間の時間推定は薬の投与又は特定癌治療の開始などの療法の開始日に対するものであり得る。生存率スコアはまた様々な他のフォーマットで提示され得る。予測パフォーマンスステータスは、生存率スコアに限定されなく、患者の状態の他の指標（患者が受けている治療の現在のステージ、患者の現在の健康又は状態の評価、特定治療に対する患者の反応、ある病気に対する患者の感受性、患者の感情的又は精神的健康、又は様々な他の状態指標など）を含み得る。これらの予測パフォーマンスステータスは、上に詳細に説明された生存率スコアと同様なスコアを割り当てられ得る。

[0050] いくつかの実施形態では、パフォーマンスステータス予測は、工程５２０と同様に、１つ又は複数の機械学習モデルを使用して工程５３０において生成され得る。例えば、処理エンジン１４０は、工程５１０においてアクセスされた医療記録に関連するデータをトレーニング済み機械学習モデル４３０へ入力し得る。モデルは、医療記録に関連する患者のパフォーマンスステータスを含む一組の予後結果を出力し得る。いくつかの例では、予後結果は上に論述したような生存率スコア又は他のパフォーマンスステータススコアを含み得る。

[0051] 工程５４０では、方法５００は患者の予測パフォーマンスステータスを示す出力を提供することを含み得る。例えば、システム１３０は予測パフォーマンスステータスをネットワーク１２０内の別の装置又はエンティティへ送信し得る。いくつかの実施形態では、システム１３０は予測パフォーマンスステータス（例えば生存率スコア）をコンピュータ、サーバ又はモバイル装置などのクライエント装置へ送信し得る。代替的に又は追加的に、システム１３０は予測をデータソース１１０（例えば医療記録を提供する医療提供者）へ送信し得る。処理エンジン１４０はまた、報告、又はパフォーマンスステータス予測を含む情報の他の編纂物を生成し得る。パフォーマンスステータス予測はまた、ローカルに（例えばシステム１３０に関連するディスプレイ上に）提示され得る。例えば、生存率スコア（又はパフォーマンスの他の指標）が、数値として、テキスト（例えば、「患者は２年間生き延びると予想される」など期間の記述）として、タイムライン又は他の図的表現などのグラフィックとして、テキストとグラフィックスとの組み合わせとして、又は情報を提示する任意の他のやり方で表示され得る。

[0052] 方法５００はさらに追加工程を含み得る。例えば、追加の結果又は予測が、予測パフォーマンスステータスに加えて又はその代わりに生成され得る。いくつかの実施形態では、方法５００はさらに、患者の予測パフォーマンスステータスを示す少なくとも出力に基づき、患者を臨床試験に含むことの適合性を判断することを含み得る。上述のように、パフォーマンスステータスは、臨床試験に含むことの患者の適合性を評価する際に有用であり得る。例えば、より長く生き延びると予想される患者（生存率予測により判断される）は臨床試験に含まれる可能性がより高いかもしれない。患者の状態、患者の感情的若しくは精神的状態、又は他の状態指標などの他のパフォーマンスステータス指標又はスコアが同様に、臨床試験に含まれる適合性を判断するのに役立ち得る。いくつかの実施形態では、例えば、臨床試験は癌療法などの療法を使用して患者を治療することに関与し得る。方法５００はまた、工程５４０の出力と同様な、患者を臨床試験に含むことの適合性を示す出力を提供することを含み得る。

[0053] 他の予測もまた、方法５００の一部として、医療記録に含まれる情報に基づき生成され得る。例えば、方法５００はさらに、上述のように、患者に関連する構造化情報及び非構造化情報の少なくとも１つの分析に基づき、病気に起因する患者の予想改善又は悪化の時間推定を生成することを含み得る。この時間推定は患者の療法の開始日などの特定日に対するものであり得る。いくつかの実施形態では、方法５００はさらに、患者に関連する構造化情報及び非構造化情報の少なくとも１つの分析に基づき、療法の開始日後の所定期間にわたって、患者内の腫瘍がどれだけ縮小又は成長すると予測されるかを示すサイズ推定を生成することを含み得る。

[0054] 図６はトレーニング済み機械学習モデルの精度レベルを判断する例示的方法６００を示す。方法６００は例えば、機械学習モデルのトレーニングの一部として処理エンジン１４０の少なくとも１つのプロセッサにより実施され得る。判断された精度レベルは、モデルを修正（例えば再トレーニング）して精度を改善するために使用され得る。

[0055] 工程６１０では、方法６００は複数の患者の医療記録にアクセスすることを含み得る。医療記録は、例えばデータベース１５０などの医療記録を格納するデータベースからアクセスされ得る。いくつかの実施形態では、医療記録は例えばデータソース１１０からネットワークを介しアクセスされ得る。他の実施形態では、医療記録は、上述のように、機械学習モデルをトレーニング／試験するためのトレーニングデータセットの一部として提供され得る。医療記録は、一組の患者に関連付けられ得、そして上述のように構造化及び非構造化情報を含み得る。医療記録はまた患者ＥＣＯＧスコア（例えば構造化及び／又は非構造化ＥＣＯＧスコア）を欠き得る。

[0056] 工程６２０では、方法６００は、工程６１０においてアクセスされた医療記録の第１の下位集合を選択することを含み得る。例えば、医療記録に関連する患者の下位集合が識別され得、そして患者の下位集合に関連するそれらの記録が選択され得る。工程６３０では、方法６００は、第１の下位集合内の患者の予測パフォーマンスステータスを生成するために医療記録の第１の下位集合を分析することを含み得る。いくつかの実施形態では、予測パフォーマンスステータスは、上述のように患者の予測生存率を含み得る。医療記録の分析は、方法５００を参照して上に説明した工程５２０、５３０に整合し得る。例えば、医療記録の下位集合は、構造化及び非構造化情報から情報を識別及び／又は分離しそして特徴又は特徴ベクトルを抽出するために分析され得る。次に、医療記録（又は特徴又は特徴ベクトル）は、第１の下位集合内の患者の予測パフォーマンスステータススコアを出力し得るトレーニング済み機械学習モデルへ入力され得る。方法５００と同様に、パフォーマンスステータス予測は、患者の生存率の推定時間を含む様々なフォーマットで表され得る。

[0057] 工程６４０では、方法６００は、第１の下位集合を含まない医療記録の第２の下位集合を選択することを含み得る。例えば、第２の下位集合は、第１の下位集合に含まれる医療記録のいずれも第２の下位集合内に含まれないように選択され得る。工程６５０では、方法６００は、第２の下位集合内の患者の予測パフォーマンスステータスを生成するために医療記録の第２の下位集合を分析することを含み得る。医療記録の第２の下位集合は、工程６３０における第１の下位集合と同様に、パフォーマンスステータススコア又は他の指標を生成するために機械学習モデルを介し分析され得る。

[0058] 工程６６０では、方法６００は、トレーニング済み機械学習モデルの精度レベルを第１の下位集合内の患者の予測パフォーマンスステータス及び第２の下位集合内の患者の予測パフォーマンスステータスに基づき判断することを含み得る。工程６６０は、第１及び第２の下位集合の予測パフォーマンスステータスと医療記録の下位集合に関連する患者の既知のパフォーマンスステータスとを比較することを含み得る。例えば、工程６１０においてアクセスされた医療記録がトレーニング又は試験データセットの一部であれば、患者の実際のパフォーマンスステータスは既知であり得る。方法６００を行うシステムは、トレーニング済み機械学習モデルの精度を、予測された患者パフォーマンスステータス値と既知の患者パフォーマンスステータス値との間の乖離に基づき判断し得る。１つ又は複数の損失関数がまた、例えば二次損失関数、ヒンジ損失関数、ロジスティック損失関数、クロスエントロピー損失関数、又は任意の他の損失関数を使用することによりモデルの精度を測定するために使用され得る。

[0059] トレーニング済み機械学習モデルの判断された精度レベルはモデルを改善するために使用され得る。例えば、判断された精度レベルに基づき、モデルの１つ又は複数の関数又は変数が上述のように追加、除去、又は修正され得る。判断された精度レベルは、モデルへ渡された特徴がどのように構築されたか又はどのタイプのモデルが採用されたかを修正するための決定を通知するために使用され得る。いくつかの実施形態では、回帰の１つ又は複数の重み付け（又は、モデルがニューラルネットワークを含めばノードの１つ又は複数の重み付け）は乖離を低減するために調整され得る。乖離のレベルが所望限界内（例えば１０％未満、５％未満）である場合、１つ又は複数のモデルは、例えば上述の方法５００を使用することにより、「患者結果が未知である」データセットに対する操作に好適であると見做され得る。

[0060] 上に説明された方法は、医療記録２００などの医療記録が構造化スコア（ＥＣＯＧスコアなど）を含まない場合に特に有用であり得る。例えば、構造化データ２１０は、ＥＣＯＧスコア又は他の同様なタイプのスコアを指定するフィールドを含まないかもしれない。しかし、いくつかの実施形態では、医療記録２００は、構造化ＥＣＯＧスコアを含まないかもしれないが、非構造化データ２１０内にＥＣＯＧスコアを含み得る。例えば、医師又は他の医療専門家は、患者が１のＥＣＯＧスコアを有するということを示し得る「ＥＣＯＧ１」又は「１の患者ステータス」などの手書きのノートを含み得る。開示されたシステムはさらに、非構造化患者医療データからＥＣＯＧスコアなどの患者ステータススコアを抽出するように構成され得る。抽出されたＥＣＯＧスコアデータは、患者のパフォーマンスステータスを単独で又は上述の技術と組み合わせて評価するために使用され得る。いくつかの実施形態では、抽出されたＥＣＯＧスコアは、欠落ＥＣＯＧスコアデータを構造化データ２１０内に埋めるために使用され得る。

[0061] ＥＣＯＧスコアは様々な技術を使用して非構造化データ２２０から抽出され得る。例えば、単純な検索照会が、ＥＣＯＧスコアを識別するために非構造化データに対し行われ得る。いくつかの実施形態では、上述のスニペットと同様なスニペット手法が使用され得る。例えば、システム１３０は、ＥＣＯＧスコアを示し得る数（例えば０～５の間の数）のうちのある数のワード内のキーワード項を含む文書又は文書の一部を検索し得る。例示として、照会は、０～５の間の数の３ワード内に「ＥＣＯＧ」（又は「パフォーマンスステータス」、「患者ステータス」などの他の同様な用語）を含む文書をフェッチするために行われ得る。様々な他の範囲のワード（例えば３ワードより多い又は少ないワード）が使用され得る。次に、上に説明したものを含む正規表現（又は様々な他の機械学習アルゴリズム）が、数値スコアを抽出するために検索結果へ適用され得る。次に、抽出された構造化スコアは、患者に関連するさらなる分析に使用するために表内に又は他のフォーマットで格納され得る。いくつかの実施形態では、抽出されたＥＣＯＧスコアはデータベース１５０内に格納され得る。

[0062] いくつかの実施形態では、ＥＣＯＧスコアの抽出は患者の特定治療方針に関連し得る。本明細書で使用されるように、「治療方針」は患者を治療するための任意の周期又は処理を指し得る。例えば、治療方針は、単独薬又はいくつかの薬の組み合わせの全周期などの薬物治療法を含み得る。別の例として、治療方針は放射線療法など癌療法の全周期を含み得る。治療方針は任意の特定な形式又は療法又は治療に限定されない。システム１３０は、医療記録から１又は複数の患者の一連の治療方針を識別し得、そしてベースライン構造化ＥＣＯＧスコアを欠く治療方針をさらに識別し得る。ＥＣＯＧスコアの抽出は、ベースライン構造化ＥＣＯＧスコアを欠く治療方針に関連する非構造化データに対し行われ得る。いくつかの実施形態では、非構造化情報に対し行われる検索照会は治療方針に関連する特定時間枠に限定され得る。時間枠は、特定治療方針の関連検索結果を提供する可能性が高い任意の所定量の時間であり得る。例えば、検索は、治療開始日前の一定期間（例えば２か月、３０日、１５日など）及び治療開始日後の一定期間（例えば２日、７日、２週間など）に限定され得る。

[0063] 図７は本開示に整合する患者ステータススコアを判断する例示的方法７００を示す流れ図である。方法７００は例えばシステム１００（図１に示す）の処理エンジン１４０の少なくとも１つのプロセッサにより実施され得る。

[0064] 工程７１０では、方法７００は患者の医療記録を格納するデータベースにアクセスすることを含み得る。例えば、処理エンジン１４０は、医療記録２００を取得するためにデータソース１１０又は他の様々なソースからネットワーク１２０を介しデータベースにアクセスし得る。医療記録は患者に関連する構造化情報及び非構造化情報を含み得る。例えば、医療記録は上述のように構造化情報２１０及び非構造化情報２２０を含み得る。

[0065] 工程７２０において、方法７００は、患者に関連する治療方針を医療記録に基づき識別することを含み得る。上述のように、医療記録内の構造化情報は治療方針に関連する患者のステータススコアを欠き得る。ステータススコアは患者のパフォーマンスステータスの任意の指標であり得る。例えば、いくつかの実施形態では、ステータススコアは患者のＥＣＯＧスコアを含み得る。

[0066] 工程７３０では、方法７００は、治療方針に関連する患者のステータススコアを判断するために非構造化情報を分析することを含み得る。上述のように、分析は、数のうちのある数のワード内のキーワードを含む文書又は文書の一部を識別するために検索を非構造化データに対し行うことを含み得る。いくつかの実施形態では、非構造化情報の分析並びに患者の予測パフォーマンスステータスの生成はトレーニング済み機械学習モデルにより行われ得る。例えば、キーワードは「ＥＣＯＧ」又は「パフォーマンスステータス」などの項を含み得る。キーワードが数０～５（又はステータススコアを表し得る任意の他の数の範囲）内のある数のワード（例えば３ワード、５ワードなど）内に出現する文書が識別され得る。線形回帰又は他のアルゴリズムが、患者ステータススコアを抽出するために検索結果に対し行われ得る。他の実施形態では、自然言語処理アルゴリズムが上述のように非構造化情報を分析するために使用され得る。いくつかの実施形態では、非構造化情報の分析は、治療方針の開始日の所定時間枠内に記録される非構造化情報に限定され得る。例えば、治療方針の開始日前の３０日以内及び治療方針の開始日後の７日以内に記録される非構造化情報が分析され得る。

[0067] 工程７４０では、方法７００はステータススコアを示す出力を提供することを含み得る。この出力は、患者のパフォーマンスステータスの出力に関して上に説明された様々な方法のうちの任意のものを使用することにより提供され得る。例えば、システム１３０はステータススコアをネットワーク１２０内の別の装置又はエンティティへ送信し得る。いくつかの実施形態では、ステータススコアは例えばデータベース１５０内に格納され得る。いくつかの実施形態では、ステータススコアはベースラインＥＣＯＧスコアを欠く他の治療方針のステータススコアを含む表内に格納され得る。いくつかの実施形態では、ステータススコアは、装置の画面上に表示されるユーザインターフェースの一部として表示するために出力され得る。

[0068] これまでの説明は、例示を目的として提示された。これは、網羅的ではなく、したがって、開示された実施形態の精密な形式に限定されない。修正及び適応化は、本明細書の考察と開示された実施形態の実行とから当業者に明らかになる。加えて、開示された実施形態の態様はメモリ内に格納されるとして説明されたが、当業者は、これらの態様が例えばハードディスク又はＣＤＲＯＭ、又は他の形式のＲＡＭ又はＲＯＭ、ＵＳＢ媒体、ＤＶＤ、ブルーレイ、４ＫウルトラＨＤブルーレイ、又は他の光ドライブ媒体などの二次ストレージ装置などの他のタイプのコンピュータ可読媒体上にも格納され得るということを理解することになる。

[0069] 本明細書及び開示方法に基づくコンピュータプログラムは経験を積んだ開発者のスキル範囲内である。様々なプログラム又はプログラムモジュールは、当業者に知られた技術のうちの任意のものを使用して生成され得る又は既存ソフトウェアと接続して設計され得る。例えば、プログラム部又はプログラムモジュールは、.Net Framework、.Net Compact Framework（そしてVisual Basic、Ｃなどの関連言語）、Java、Python、Ｒ、Ｃ＋＋、Objective-C、ＨＴＭＬ、ＨＴＭＬ／ＡＪＡＸ組み合わせ、ＸＭＬ、又は包含型Ｊａｖａアプレットを有するＨＴＭＬで又はこれを使用して設計され得る。

[0070] さらに、例示的実施形態が本明細書において説明されたが、等価的要素、修正、省略、組み合わせ（例えば様々な実施形態全体にわたる態様の）、適応化、及び／又は代替形態を有するありとあらゆる実施形態の範囲は、本開示に基づき当業者により理解されるだろう。特許請求の範囲における制限は、特許請求の範囲において採用される言語に基づき広く解釈されるべきであり、そして本明細書内で又は本出願の審査中に説明された例に限定されない。これらの例は非排他的であると解釈されるべきである。さらに、本開示方法の工程は、工程を再順序付けすることにより及び／又は工程を挿入又は削除することを含む任意のやり方で修正され得る。したがって、本明細書及び例は単なる例示と考えられ得、真の範囲及び精神は以下の特許請求の範囲及びそれらの等価物の全範囲により示されるということが意図されている。

Claims

患者のパフォーマンスステータスを予測するためのモデル支援システムであって、前記システムは、
前記患者に関連する構造化情報及び非構造化情報の少なくとも１つを含む前記患者の医療記録であって構造化患者ＥＣＯＧスコアを欠く医療記録を格納するデータベースにアクセスし；
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも１つを分析し；
前記分析に基づき、そして構造化ＥＣＯＧスコア無しに、前記患者のパフォーマンスステータス予測を生成し；そして
前記患者の前記予測パフォーマンスステータスを示す出力を提供するようにプログラムされた少なくとも１つのプロセッサを含み：
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも１つの前記分析並びに前記患者の前記予測パフォーマンスステータスの前記生成は、トレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも１つにより行われる、システム。
前記トレーニング済み機械学習モデルはロジスティック回帰モデル、ニューラルネットワーク又はランダムフォレストモデルを含む、請求項１に記載のシステム。
前記トレーニング済み機械学習モデルはコックス比例ハザード回帰モデルを含む、請求項１に記載のシステム。
前記トレーニング済み機械学習モデルはlasso回帰分析を適用する、請求項１に記載のシステム。
前記患者の前記医療記録は医療提供者、研究所又は保険会社から受信される、請求項１に記載のシステム。
前記構造化情報は、性別、生年月日、人種、体重、研究所結果、バイタルサイン、診断日、訪問日、投薬指示、診断コード、手順コード、薬コード、以前の療法、又は投薬管理を含む、請求項１に記載のシステム。
前記非構造化情報は、ヘルスケア提供者により書かれたテキスト、放射線学的報告、又は病理学報告を含む、請求項１に記載のシステム。
前記パフォーマンスステータス予測は前記患者の生存率予測を含む、請求項１に記載のシステム。
前記予測パフォーマンスステータスを示す前記出力は前記患者が生き延びることが予想される期間の時間推定を含む、請求項８に記載のシステム。
前記患者が生き延びることが予想される期間の前記時間推定は療法の開始日に対するものである、請求項９に記載のシステム。
前記少なくとも１つのプロセッサはさらに、前記予測パフォーマンスステータスを示す少なくとも前記出力に基づき前記患者を臨床試験に含むことの適合性を判断するようにプログラムされる、請求項１に記載のシステム。
前記少なくとも１つのプロセッサはさらに、前記患者を前記臨床試験に含むことの前記適合性を示す出力を提供するようにプログラムされる、請求項１１に記載のシステム。
前記臨床試験は療法を使用して前記患者を治療することに関与する、請求項１２に記載のシステム。
前記療法は癌療法である、請求項１３に記載のシステム。
前記少なくとも１つのプロセッサはさらに：前記患者に関係する前記構造化情報及び非構造化情報の少なくとも１つの前記分析に基づき、病気に起因する前記患者の予想改善又は悪化の時間推定を生成するようにプログラムされる、請求項１に記載のシステム。
前記病気に起因する前記患者の予想改善又は悪化の前記時間推定は療法の開始日に対するものである、請求項１５に記載のシステム。
前記少なくとも１つのプロセッサはさらに：前記患者に関係する前記構造化情報及び非構造化情報の少なくとも１つの前記分析に基づき、療法の開始日後の所定期間にわたって、前記患者内の腫瘍がどれだけ縮小又は成長すると予測されるかを示すサイズ推定を生成するようにプログラムされる、請求項１に記載のシステム。
前記トレーニング済み機械学習モデルは：
複数の患者の医療記録にアクセスし；
前記医療記録の第１の下位集合を選択し；
前記第１の下位集合内の前記患者の予測パフォーマンスステータスを生成するために前記医療記録の前記第１の下位集合を分析し；
前記第１の下位集合を含まない前記医療記録の第２の下位集合を選択し；
前記第２の下位集合内の前記患者の予測パフォーマンスステータスを生成するために前記医療記録の前記第２の下位集合を分析し；そして
前記トレーニング済み機械学習モデルの精度レベルを前記第１の下位集合内の前記患者の前記予測パフォーマンスステータス及び前記第２の下位集合内の前記患者の前記予測パフォーマンスステータスに基づき判断するように構成される、請求項１に記載のシステム。
前記複数の患者の前記医療記録は前記構造化患者ＥＣＯＧスコアを欠く、請求項１８に記載のシステム。
前記自然言語処理アルゴリズムはロジスティック回帰、ニューラルネットワーク又はランダムフォレストアルゴリズムを含む、請求項１に記載のシステム。
前記自然言語処理アルゴリズムはコックス比例ハザード回帰アルゴリズムを含む、請求項１に記載のシステム。
前記自然言語処理アルゴリズムはlasso回帰分析を適用する、請求項１に記載のシステム。
患者のパフォーマンスステータスを予測するための方法であって、前記方法は、
前記患者に関連する構造化情報及び非構造化情報の少なくとも１つを含む前記患者の医療記録であって構造化患者ＥＣＯＧスコアを欠く医療記録を格納するデータベースにアクセスすること；
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも１つを分析すること；
前記分析に基づき、そして構造化ＥＣＯＧスコア無しに、前記患者のパフォーマンスステータス予測を生成すること；及び
前記患者の前記予測パフォーマンスステータスを示す出力を提供することを含み、
前記患者に関連する前記構造化情報及び非構造化情報の少なくとも１つの前記分析並びに前記患者の前記パフォーマンスステータス予測の前記生成は、トレーニング済み機械学習モデル又は自然言語処理アルゴリズムの少なくとも１つにより行われる、方法。
前記トレーニング済み機械学習モデルはロジスティック回帰モデル、ニューラルネットワーク又はランダムフォレストモデルを含む、請求項２３に記載の方法。
前記構造化情報は、性別、生年月日、人種、体重、研究所結果、バイタルサイン、診断日、訪問日、投薬指示、診断コード、手順コード、薬コード、以前の療法、又は投薬管理を含む、請求項２３に記載の方法。
前記非構造化情報は、ヘルスケア提供者により書かれるテキスト、放射線学的報告、又は病理学報告を含む、請求項２３に記載の方法。
前記予測パフォーマンスステータスを示す少なくとも前記出力に基づき前記患者を臨床試験に含むことの適合性を判断することをさらに含む請求項２３に記載の方法。
前記患者に関係する前記構造化情報及び非構造化情報の少なくとも１つの前記分析に基づき、病気に起因する前記患者の予想改善又は悪化の時間推定を生成することをさらに含む請求項２３に記載の方法。
前記患者に関係する前記構造化情報及び非構造化情報の少なくとも１つの前記分析に基づき、療法の開始日後の所定期間にわたって、前記患者内の腫瘍がどれだけ縮小又は成長すると予測されるかを示すサイズ推定を生成することをさらに含む請求項２３に記載の方法。
前記パフォーマンスステータス予測を生成することは前記患者の生存率予測を生成することを含む、請求項２３に記載の方法。
患者のパフォーマンスステータススコアを提供するシステムであって、前記システムは、
前記患者に関連する構造化及び非構造化情報を含む前記患者の医療記録を格納するデータベースにアクセスし；前記患者に関連する治療方針を前記医療記録に基づき識別し、
前記構造化情報は前記治療方針に関連する前記患者のパフォーマンスステータススコアを欠き；
前記治療方針に関連する前記患者のパフォーマンスステータススコアを判断するために前記非構造化情報を分析し、前記パフォーマンスステータススコアはトレーニング済み機械学習モデル又は自然言語処理アルゴリズムのうちの少なくとも１つにより判断され；そして
前記パフォーマンスステータススコアを示す出力を提供するようにプログラムされる少なくとも１つのプロセッサを含む、システム。
前記パフォーマンスステータススコアはＥＣＯＧスコアを含む、請求項３１に記載のシステム。
前記非構造化情報の前記分析は前記治療方針の開始日の所定時間枠内に記録される非構造化情報に限定される、請求項３１に記載のシステム。