JP7261846B2 - 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック - Google Patents

類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック Download PDF

Info

Publication number
JP7261846B2
JP7261846B2 JP2021154060A JP2021154060A JP7261846B2 JP 7261846 B2 JP7261846 B2 JP 7261846B2 JP 2021154060 A JP2021154060 A JP 2021154060A JP 2021154060 A JP2021154060 A JP 2021154060A JP 7261846 B2 JP7261846 B2 JP 7261846B2
Authority
JP
Japan
Prior art keywords
patient
patients
features
feature
selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021154060A
Other languages
English (en)
Other versions
JP2022020620A (ja
Inventor
ヴァルティカ アグラワル
アレクサンデル ライアン マンコヴィッチ
ネヴェンカ ディミトロヴァ
ニランジャナ バネルジー
イー ヒム チューン
ボント ヨハンナ マリア デ
ヨゼフ ヒエロニムス マリア ライマケルス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2022020620A publication Critical patent/JP2022020620A/ja
Application granted granted Critical
Publication of JP7261846B2 publication Critical patent/JP7261846B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明は、一般的に医療分野、電子臨床決定支援(CDS)分野、臨床検査分野、ゲノム分野及び関連分野に関する。
種々の医療タスクは、関連する類似性を持つ患者のコホート(cohort)を識別することから利益を得る。例えば、臨床試験を設計する際の重要な最初のステップは、臨床試験の登録のため患者を識別することである。結果の正当性を確実にするため、登録された患者は、他の患者と十分に類似しているべきであり、これにより、異なる患者結果が、年齢、性別、民族性、慢性の医療条件の有無等(これらが臨床試験の目標に関連しない場合)における相違のような外来性の要因による患者結果の相違ではなく、臨床試験の対象(例えば新たな製薬)に信頼性高く起因するものとなるようにするべきである。患者結果は多くの関連する要因によって影響を受け得るため、臨床試験において登録するため適切な患者を識別するタスクは困難である。
コホート識別はまた、登録の後に、臨床試験の結果の解析の間に実施されても良い。該登録の範囲内で、負の結果を持つか正の結果を持つかで、患者が関連のある2つのコホートを自然に形成する。しかしながら、臨床試験の生のデータ結果に影響を与え得るいずれかの外来性の要因を識別し考慮するため、これらのコホートが更に、正及び負のコホート内で類似性及び相違性に基づいて更にセグメント化されても良い。
類似コホート識別タスクは、例えば疾患リスク因子を評価するため、又は種々の以前の検査からのデータを組み合わせる「メタ検査」を実行する際のように、他のタイプの医療検査において実行される。
他の医療タスクは、臨床診断及び患者の処置を含む。斯かるタスクにおいては、臨床医は、類似する過去の患者と現在の患者を比較することから利益を得ることができる。ここでもまた、「類似する」患者を識別するタスクは困難である。2人の患者は同一ではなく、コホート選択タスクは、どの相違が重要であるか重要でないかを評価することを必要とする。
以下は、以上に言及された問題及びその他の問題に対処する新規で改善されたシステム及び方法を開示する。
開示される一態様においては、患者コホート識別装置が開示される。コンピュータは、表示要素及び少なくとも1つのユーザ入力装置を持つ。前記コンピュータは、患者データベース中の患者についての特徴の値を有する患者データを保存する患者データベースと通信する。前記コンピュータは、以下を含む患者コホート識別方法を実行するようプログラムされる。特徴のセットを選択するための患者データに対する自動特徴選択処理が実行され、前記特徴のセットに依存した患者比較メトリックを用いた前記患者データベースの患者の自動分類が実行される。少なくとも1回の繰り返しが実行され、該繰り返しは、前記自動分類に従ってクエリ患者に類似する又は類似しない1人以上のサンプル患者を前記表示要素上に表示するステップと、前記少なくとも1つのユーザ入力装置を介して前記1人以上のサンプル患者を前記クエリ患者と比較するユーザ入力された比較値を受信するステップと、前記ユーザ入力された値と前記1人以上のサンプル患者を前記クエリ患者と比較する前記患者比較メトリックによって計算された比較値との間の一致度を上昇させるよう前記患者比較メトリックを調節するステップであって、前記特徴のセット及び前記患者比較メトリックの特徴の重みの少なくとも一方を調節することを含む、ステップと、前記調節された患者比較メトリックを用いて前記自動分類を繰り返すステップと、を含む。最後の繰り返しにより生成された前記調節された患者比較メトリックを用いて、前記クエリ患者についての患者コホートが識別される。
他の開示される態様においては、患者コホート識別装置が開示される。コンピュータは、表示要素及び少なくとも1つのユーザ入力装置を持つ。前記コンピュータは、患者データベース中の患者についての特徴の値を有する患者データを保存する患者データベースと通信する。前記コンピュータは、それぞれが2つ以上のモダリティの座標特徴に対してデータベースの患者をプロットする、2つ以上のグラフィカルなモダリティ表現を、前記表示要素上に同時に表示するステップと、1つのグラフィカルなモダリティ表現における患者のクラスタの選択を受信するステップと、前記選択の受信に応答して、他の同時に表示されたグラフィカルなモダリティ表現における選択された患者のクラスタの患者を強調するステップと、を含む、患者コホート識別方法を実行するようプログラムされる。
他の開示される態様においては、患者コホート識別方法が開示され、前記方法は、表示要素及び少なくとも1つのユーザ入力装置を持ち、患者データベース中の患者についての特徴の値を有する患者データを保存する患者データベースと通信するコンピュータとともに実行される。前記患者コホート識別方法は、以下を含む。特徴のセットに依存した患者比較メトリックを用いて、前記患者データベースの患者の自動分類が実行される。前記自動分類に従ってクエリ患者に類似する又は類似しない1人以上のサンプル患者についての情報を前記表示要素上に表示するステップと、前記少なくとも1つのユーザ入力装置を介して前記1人以上のサンプル患者を前記クエリ患者と比較するユーザ入力された比較値を受信するステップと、調節のない患者比較メトリックと比較して、前記ユーザ入力された値との改善された一致を持つ調節された患者比較メトリックを生成するよう、前記特徴のセット及び前記患者比較メトリックの特徴の重みの少なくとも一方を調節するステップと、前記調節された患者比較メトリックを用いて前記自動分類を繰り返すステップと、を含む少なくとも1回の繰り返しが実行される。最後の繰り返しの前記自動分類の反復によって生成された前記クエリ患者を含むクラスタの少なくとも一部として、前記クエリ患者についての患者コホートが識別される。
利点のひとつは、改善されたコホート選択についての臨床医からの適合性フィードバック(relevance feedback)を提供する点にある。
他の利点は、臨床医による全体的な患者レベルの解析に基づくコホート選択についての適合性フィードバックを提供する点にある。
他の利点は、臨床医が特徴レベルの解析を実行することなく、関連する特徴の選択についての臨床医からの適合性フィードバックを提供する点にある。
他の利点は、臨床医が種々のモダリティの相互関係(臨床、放射線、ゲノム、人口統計学的、生理学的等)を視覚化することができる、グラフィカルなユーザインタフェースを提供する点にある。
所与の実施例は、以上の利点のうちの0個、1つ、2つ、それ以上又は全てを提供し得、及び/又は、本開示を読み理解することにより当業者には明らかとなる他の利点を提供し得る。
本発明は、種々の構成要素及び構成要素の配置、並びに種々のステップ及びステップの配置の形をとり得る。図面は単に好適な実施例を説明する目的のためのものであり、本発明を限定するものとして解釈されるべきではない。
患者コホート識別装置を図式的に示す。 図1の患者コホート識別装置により適切に実行される患者コホート識別方法を図式的に示す。 図2の方法の提示動作の適切な実施例の例を図式的に示す。 図2の方法の提示動作の適切な実施例の例を図式的に示す。 ここで記載される患者コホート視覚表現及びナビゲーションツールを図式的に示す。
ここで、コホートを選択することの複雑さが、患者をコホートにグループ化するための適切な(低減された)患者特徴セットを選択することにより低減させられ得ることが認識される。コホートを選択するために用いられる患者特徴は、当面の医療タスク(例えば臨床試験における登録のため患者を選択すること、又は現在臨床診断中である患者に類似する患者を選択すること、等)に関連のあるものを含むべきであり、当該医療タスクに関連しない患者特徴を含むべきではない。特徴選択は、利用可能な患者特徴の数は非常に多く、例えば人口統計学的データ(年齢、性別、体重、民族性等)、常習的な行動条件(喫煙、大量のアルコール消費、種々の娯楽薬の消費等)の有無、種々の慢性臨床条件(高血圧、糖尿病、喘息、心臓病等)の有無、種々の急性疾患(肺炎又はその他の急性呼吸病、種々の腫瘍状態等)の有無、これらに関する特徴(例えば癌のステージ及びグレード、等を含み得るため、容易なものではない。遺伝子のシーケンシングは、種々の医療条件との変化する既知の又は考えられ得る相関を持つ、多くのゲノム標識を提供し得るため、急速に発展するゲノム分野が、利用可能な患者特徴のリストに迅速に追加している。例えば、幾つかの医療データベースは、数百以上の特徴を定義するデータを含み、ゲノムデータの利用可能性の継続的な拡大は、患者についての特徴の数を数千にまで増大させ得る。斯かる大きな特徴空間は、臨床タスクについてコホートを選択するための「最適な」特徴セットを選択するための、大きな困難さをもたらしている。
種々の教師なしの(低減された)特徴セット選択手法が知られている。典型的な自動化された特徴選択手法は、特徴の弁別力を測定し、最も弁別的な特徴を選択する。斯かる手法のひとつは、主成分分析(PCA)であり、低減された数の特徴を持つデータセットの分散を捕捉するよう特徴を選択する。例えば特徴毎の情報取得(IG)、又は種々の対毎の特徴相関メトリック(例えば最も高いIGを提供する特徴を選択すること、又は他の特徴と強く相関する特徴を除去すること)といった、他の区別メトリックが利用されても良い。
強力であるが教師なし自動特徴セット選択手法は、患者コホートを識別するための特徴を選択するために用いられる場合、大きな制限を持つ。臨床タスクと相関しない非常に弁別的な特徴は、あまり弁別力がないが医療タスクと相関している他の特徴より、選択され得る。教師なし特徴セット選択手法は、患者特徴がなぜ根拠となるべきかについての生理学的な根拠を考慮に入れることができない。例えば、特定の代謝経路についての問題によって疑われる臨床状態を考える。当該代謝経路の一部であると知られているゲノム標識は、この場合には関連性のあるものである見込みが高いが、PCA又はその他の教師なし特徴選択手法は、全体的な弁別力が低い場合には、当該ゲノム標識を選択しない可能性がある。
原則的に、これらの問題は、臨床医により実行される手動の特徴選択、又は医師が教師なし自動特徴選択により生成された初期特徴セットを調節する(適合性フィードバック)ハイブリッド型の手法によって、軽減され得る。しかしながら、実際には臨床医は、或る患者がなぜ対象の患者(ここでは「クエリ患者」と呼ばれる)に類似する又は類似しないと考えられるかを、特定の特徴について明瞭に表現できない場合がある。臨床医は、医師の過去の体験及び学習の全体について、患者を全体的にみる傾向がある。従って、臨床医は、どの特徴が効果的に類似性又は非類似性を要約するかを正確に表現することができない状態で、特定の患者がクエリ患者に類似する又は類似しないと認識し得る。更に、所与の臨床タスクについて根拠となる特徴を識別するための数百もの利用可能な特徴の候補を調べるために必要な時間を熟練の臨床医がとることは、実用的ではない。
ここで開示される手法は、自動的に選択される特徴セットを用いて実行された自動分類の閲覧を通して患者レベルにおいて臨床医により提供された後続する適合性フィードバックと教師なし特徴選択を組み合わせることにより、これらの困難さを克服する。これらの手法においては、クエリ患者及びその他のクラスタを含む患者のクラスタを識別するため教師なし自動患者分類を実行するために、初期の自動化された特徴セットが利用される。クエリ患者を含むクラスタは、初期特徴セットによる類似する患者のセットを定義し、他のクラスタは、種々のあまり類似しない患者をグループ化する。臨床医は次いで、これらの分類結果を閲覧し、類似する又は類似しない患者を選択する(適合性フィードバック)。次いで、これらの臨床医の選択に好適に合致するよう特徴セットが自動的に調節され、該調節された特徴セットを用いて分類が繰り返される。この処理は、教師なし自動分類が、臨床医が(少なくとも部分的に)満足できるクラスタを生成するまで、繰り返されても良い。
当該手法は、大きな特徴空間の初期の近似的な選別を提供するための、教師なし特徴セット選択の能力を利用する。PCA又はその他の教師なし特徴選択処理により選択された初期特徴セットを用いて、当該初期特徴セットを用いて測定されたクエリ患者に類似する(又は類似しない)患者を識別するよう患者が分類される。臨床医は、1つ以上の類似する(又は類似しない)サンプル患者を提示され、臨床医が適合性フィードバックを提供することができるユーザインタフェースを提供される。例えば、医師は、診断されている患者(クエリ患者PQ)に類似するもものとして初期の分類において識別された類似するサンプル患者のセット{PC}を提示され得る。これらの「類似する」サンプル患者は例えば、分類がクエリ患者PQを割り当てた同じクラスタから、又は初期の特徴セットにより定義された距離メトリックを用いて最短距離|PQ-PC|を持つクラスタのサブセットから引き出されても良い。医師は次いで、ランクスケール1乃至5を用いて、クエリ患者PQに類似する又は類似しないものとして患者をランク付けしても良く、ここで1は最も類似し5が最も類似しないことを示す。その後、考慮される患者についての医師の類似度ランクに最も整合する調節された特徴セットを生成するため、特徴セット調節が実行される。分類が再び繰り返され、クエリ患者PQ又は幾つかのそのサブセットを含むクラスタが再び、類似度ランク付けのため医師に提示される。当該処理は、クエリ患者PQを含むクラスタが当面の医療タスクを実行するための適切なコホートであると医師が満足するまで、繰り返されても良い。
有利にも、適合性フィードバックのための当該手法は、臨床医が特徴空間の抽象化されたレベルにおいて特徴セットを評価することを必要としない。その代わり、臨床医は、個々の患者を比較及び対比するより慣れた設定で操作を行い、それにより臨床医が、医師の過去の体験及び学習の全体を利用して、適合性フィードバックの決定を為すことができる。好適には、ユーザインタフェースは、医師が考察中のそれぞれの提案された類似する患者PCの完全な医療記録を探し、更にクエリ患者PQの完全な医療記録を探して、臨床医がアクセスのために利用している情報の同じ供給源を用いて適合性フィードバック評価を為すことを可能とする。
図1を参照すると、患者コホート識別装置は、表示要素及び少なくとも1つのユーザ入力装置を持つコンピュータを含む。図示されるコンピュータは、2つのコンピュータ、即ち特徴選択又は分類のような計算が集中する動作を実行するサーバコンピュータ10と、表示要素14並びに例えばキーボード16及びマウス18(又はトラックボール、トラックパッド、タッチスクリーン若しくはその他のポインティングデバイス)のような少なくとも1つのユーザ入力部を含むか又はこれらと動作可能に接続された、デスクトップコンピュータ、ノート型コンピュータ、タブレットコンピュータ等のような、ユーザインタフェースコンピュータ12と、を含む。コンピュータ10、12は、患者データベース中の患者についての特徴の値を有する患者データを保存する患者データベース20と通信する。患者データベース20は例えば、電子健康記録(EHR)、電子医療記録(EMR)、画像保存及び通信システム(放射線画像/データのために利用されるPACS)、心臓血管情報システム(CVIS)、又はこれらの種々の組み合わせ等の1つ以上を含んでも良い。種々の要素10、12、20は、病院のローカルエリアネットワーク(LAN)、無線LAN(WLAN)、インターネット、又はこれらの種々の組み合わせ等のような、種々のデータ経路により相互接続されても良い。
コンピュータ10、12は、種々の処理を実装するようプログラムされる。自動特徴選択処理22は、患者データベース20に含まれる利用可能な、又は患者データベース20に含まれる情報から導出可能な、特徴の典型的に非常に大きなセットから、低減された特徴のセットを選択するよう実行される。特徴選択処理22は例えば、主成分分析(PCA)特徴選択処理、情報取得(IG)特徴ランク付け処理、又は対相関特徴除去処理等であっても良い。自動特徴選択処理22は、特徴24のセットを識別し、典型的には高い弁別力を持つ特徴を選択する。患者データベース20は、数十、数百、又はそれ以上の特徴を患者毎に保存し得る(明示的に又は暗黙的に、即ち他の保存された情報から導出可能)ことは理解されるであろう。幾つかの限定するものではない特徴の例は、人口統計学的特徴(患者の年齢、性別、体重、民族性等)、常習的な行動条件(喫煙、大量のアルコール消費、種々の娯楽薬の消費等)の有無を示す特徴、種々の慢性臨床条件(高血圧、糖尿病、喘息、心臓病等)の有無を示す特徴、種々の急性疾患(肺炎又はその他の急性呼吸病、種々の腫瘍状態等)の有無を示す特徴、癌のステージ、癌のグレードのような状況に特有な特徴、特定の遺伝子の値、種々のタンパク質発現レベル、又はその他の遺伝標識のようなゲノム特徴、等を含む。患者データセット26が斯くして生成され、各患者が、特徴のセット24の特徴について患者データベース20から引き出された値によって注記付けされるか又は表現される。
分類処理30は、患者データセット26の患者を、クラスタのセット32へとグループ化するため、教師なし学習を実行する。一般的に、目標は、クエリ患者PQに類似する患者の患者コホートを識別することであり、従って、クラスタのセット32は、クエリ患者PQを含むクラスタ34(換言すれば、クラスタ34は、クエリ患者PQが属する分類処理30により生成されたクラスタである)と、分類処理により生成された他のクラスタ36と、を含む。分類処理は、k平均分類、連結度ベース又は階層的分類、セントロイドベースの分類、又は期待値最大化(EM)分類等のような、いずれの既知の分類手法を利用しても良い。該分類は、特徴のセット24に依存する患者比較メトリックを利用する。2人の患者Pi及びPjについて、これらの2人の患者を比較する患者比較メトリックの値は、ここでは省略表記|Pi-Pj|を用いて記述される。限定するものではない例として、患者比較メトリックは、より類似する患者について値が小さくなるような距離メトリックであっても良い。幾つかの適切な距離メトリックは、ユークリッド距離:
Figure 0007261846000001
であり、ここでn=1、…、Nは、特徴のセット24の特徴をインデクシングし
fn,i及びfn,jは、それぞれ患者Pi及びPjについてのn番目の特徴の値であり、wnは、式(1)のユークリッド距離におけるn番目の特徴についての特徴重みである。他の例としては、患者比較メトリックは、平方根が省略されること以外は式(1)と同一であるユークリッド二乗距離であっても良い。距離メトリックの代わりに、患者比較メトリックは代替として、より類似する患者について値が大きくなるような類似度メトリックであっても良い。これらは単に例である。一般的に、患者比較メトリックは好適には、特徴のセット24に機能的に依存し、個々の特徴の寄与が特徴重み(例えば式(1)のユークリッド距離の例における特徴重みwn)により制御される。調節可能な特徴重みを含まない患者比較メトリックを利用することも考えられ得る。
選択された分類処理30について、分類結果32の特性は、患者比較メトリックの詳細、特に患者比較メトリックが機能的に依存する特徴のセット24、及び特徴重み(利用可能である場合)に依存する。自動特徴選択処理22は、弁別能力の評価に基づいて特徴を選択するが、当該手法は、当面の医療タスクにより強く相関する、又は、当面のタスクに関連する幾つかの生理学的な根拠を持つ、低い弁別能力を持つ他の特徴よりも、高い弁別力の特徴を選択し得る。
図1の患者コホート識別装置の例においては、これらの問題は、患者比較メトリックを改善するよう適合性フィードバックを提供することにより、例えば特徴のセット24及び/又は特徴重みを調節することにより、対処される。この目的のため、例えば図示された実施例におけるコンピュータ12において、グラフィカルユーザインタフェース(GUI)処理40が実装される。GUI処理40は、自動分類に従って、クエリ患者PQに類似する又は類似しない1人以上のサンプル患者についての情報を(表示要素14上に)提示する。例えば、該サンプル患者は、クエリ患者PQを含むクラスタ34から(疑似)ランダム的に選択された類似サンプル患者であっても良い。代替としては、類似サンプル患者は、例えば患者比較メトリックにより測定されたクエリ患者PQに最も近い患者を選択することにより、非ランダム的に当該クラスタ34から選択されても良い。これに加えて又は代替として、類似しないサンプル患者が、例えばランダム的に又は患者比較メトリックにより測定されたクエリ患者PQからのセントロイドが最も遠い他のクラスタから、選択されても良い。サンプル患者は、表示要素14を介してユーザに提示され、臨床医は、1人以上のサンプル患者をクエリ患者と比較する比較値を提供するよう要求される。例えば、臨床医は、クエリ患者に対するサンプル患者の類似度を、1乃至5のスケールで(又は1乃至10のスケール等で)ランク付けするよう要求されても良い。これに加えて又は代替として、臨床医は、2人のサンプル患者のどちらのほうがクエリ患者に類似するかを選択するよう要求されても良い。斯かる手法は、特徴レベルで類似度を評価するよう臨床医に(少なくとも直接的には)要求しないものであり、患者レベルにおける評価を要求するものであることは、留意されるであろう。このことは、一般に臨床医の教育及び経験とともに患者記録におけるあらゆる利用可能な情報に基づいて患者を分析するよう訓練された一般的な臨床医の強みを利用するものである。この手法は、臨床医の自然な動作範囲ではない特徴レベルの分析を医師が実行することを要求することを回避する。
GUI処理40は、少なくとも1つのユーザ入力装置16、18を介して、1人以上のサンプル患者をクエリ患者と比較するユーザ入力された比較値を受信する。このことは、「適合性フィードバック」を構成する。次いで、患者比較メトリック調節処理42が、特徴のセット24を調節し、及び/又は特徴重みwnを調節し、ユーザ入力された比較値と、1人以上のサンプル患者をクエリ患者PQと比較する患者比較メトリックにより計算された比較値と、の間の一致度を上昇させるようにする。
一手法においては、患者比較メトリック調節処理42は、それぞれが以下のように実行される、特徴セット調節の繰り返しを実行する。該繰り返しの第1のステップにおいては、特徴のセット24は、該セットに特徴を追加し、又は該セットから特徴を除去し、特徴の調節されたセットの候補を生成することにより調節される。次いで、1人以上のサンプル患者をクエリ患者PQと比較する特徴の調節されたセットの候補を持つ患者比較メトリックを用いて、比較値が計算される。特徴の調節されたセットの候補は、計算された比較値が、ユーザ入力された比較値に対して、それぞれ増大した一致度を呈するか、減少した一致度を呈するかに基づいて、許容されるか又は棄却される。棄却された場合には、特徴の調節されたセットの候補は破棄される。許容された場合、特徴の調節されたセットの候補は、新たな(即ち更新された)特徴のセット24となる。この処理は、一定の回数だけ繰り返されても良いし、又は、幾つかの連続する反復の結果が棄却されるまで繰り返されても良いし、若しくは他の何らかの基準が用いられても良い。
他の手法においては、患者比較メトリック調節処理42は、それぞれが以下のように実行される、特徴重み調節の繰り返しを実行する。該繰り返しの第1のステップにおいては、特徴比較メトリックの少なくとも1つの特徴重みの値を増大又は減少させて、調節された特徴比較メトリックの候補を生成することにより、患者比較メトリックが調節される。1人以上のサンプル患者をクエリ患者と比較する調節された患者比較メトリックを用いて、比較値が計算される。調節された患者比較メトリックの候補は、ユーザ入力された比較値に対して、それぞれ増大した一致度を呈するか、減少した一致度を呈するかに基づいて、許容されるか又は棄却される。許容された場合には、新たな特徴重みが利用され、棄却された場合には破棄される。
ここで図2を参照しながら、図1の患者コホート識別装置を用いて実行される処理が説明される。動作50において、特徴選択処理22が実行され、特徴の(初期の)セット24を選択する。動作52において、分類処理30が実行され、(初期の)クラスタ32を生成する。動作54において、臨床医は、1人以上の類似する及び/又は類似しないサンプル患者を提示され、患者比較メトリックを用いて、クエリ患者PQに対する類似度/非類似度が測定される。より詳細には、好適には、クエリ患者に対するサンプル患者の類似度のランク付けのような、臨床医が慣れた態様で形式化された情報に対する要求、又は2人のサンプル患者のうちどちらがクエリ患者に類似するかを識別する要求の形をとる、サンプル患者についての情報が提示される。動作56において、ユーザ入力された比較値が受信される(例えばサンプル患者のランク付け、又は2人のサンプル患者のセットのうち類似するほうのサンプル患者の選択)。動作60において、サンプル患者に適用された患者比較メトリックの、ユーザ入力された比較値との一致度を増大させるよう、特徴のセット24及び/又は特徴重みwnが調節される。例えば、ユーザがサンプル患者をクエリ患者と非常に類似するとランク付けした場合、(調節された)患者比較メトリックにより測定される、より短いサンプル患者-クエリ患者間距離に帰着する調節が許容され、当該距離を増大させる調節は棄却される。動作62において、調節された患者比較メトリックを用いて分類処理30が繰り返される。フローは次いで動作54に戻り、該動作により、臨床医は更新された分類に従って類似する及び/又は類似しない患者を提示される。このループは、動作64において、最後の分類結果を閲覧した臨床医が、満足する結果であると結論するまで、いずれの回数だけ繰り返されても良い。
以下、臨床専門家による関連する特徴(動作56からの)が短い距離を呈する、元の空間から新たな空間への特徴の自動化されたマッピングとして、動作60を実装するための、幾つかの手法の例が開示される。第1の手法の例は、次元低減方法を利用し、第2の手法の例は、特徴重み調節方法を利用する。
次元低減を用いる第1の手法の例においては、患者P={p1,…,pm}についての特徴F={f1,…,fn}を含む患者データ(V)が表される。次いで、患者間の距離が計算されて、距離行列(Sm、サイズm×mの正方な対称の行列)が得られ、古典的な多次元尺度構成法(MDS)が利用されて、当該データのより低い次元の射影が得られる。代替の手法においては、MDS解析は、2から(m-l)の次元の数を特定し、それぞれの低次元の投射について患者p1、…pmの間の対のユークリッド距離を計算して、距離行列D(2),…D(m-l)を得ることにより、実行される。動作56において、特定の患者(グループ又は別個の対)がより類似すると予測されると考える場合、当該グループにおける全てのとり得る対の間の対の距離が最小化される。ここで、当該メトリックが最小となる{2,…,(m-l)におけるKを特定する。行列表記:
Figure 0007261846000002
及び
Figure 0007261846000003
を用い、ここで行列Smは対称であり(dm(p,q)=dm(q,p);p≠q;p={1,…,m};q={1,…,m})、MDS関数は距離行列(サイズm×m)及び次元の数(l;l<m)をとる。範囲{2,…(m-l)}におけるlについて、m個の点の対毎の距離を計算して、対称な距離行列D(l)を得る。医師のフィードバックに基づく類似する患者のグループは、G={g1,g2,…}と示され、giはPからの患者のセットである。このとき、
Figure 0007261846000004
及び
Figure 0007261846000005
であり、ここでkは、Gにおける患者グループを最も近くに配置する最も小さな次元を表す{2,…,(m-l)}における整数である。主成分分析(PCA)又はその他の特徴低減アルゴリズムが、上位k個の重要な特徴を特定するために利用される。これらk個の特徴は、動作62において新たな患者を分類するために利用される。医師が情報入力したグループGは任意に、相互検証を得るため及びオーバーフィッティング問題を回避するため分割される。
動作60を実装するための第2の手法の例は、新たな空間における特徴値を、これら特徴の重要度の重みを調節することにより表す。例として、3人の患者の例が以下のとおりであるとする:
特徴値(3,2,4,7)を持つ患者P1
特徴値(3,3,3,3)を持つ患者P2
特徴値(4,4,4,7)を持つ患者P3
この表記において、各患者Piは、値(f1,f2,f3,f4)を持つ列1乃至4に特徴を持つ。説明のため、以下の距離が仮定される:
患者距離D(P1,P3)=3
患者距離D(P1,P2)=6
患者距離D(P2,P3)=5
マンハッタン距離を用いた初期の分類動作52において、第1のクラスタは患者P1及びP2を含み、患者P2は第2のクラスタにある。しかしながら、ことによると医師が特徴f2及びf3がより重要であると考えるために、動作56において該医師が、患者P2とP3とはより類似すると判断し、それにより分類がP2及びP3が同じクラスタに割り当てられ、P1が別個のクラスタに属するよう更新される。
新たなクラスタのセントロイドは、クラスタにおける特徴値の平均として算出され、Pc=(3.5,3,3,5)である。次に、元のサンプルが新たな空間にマッピングされ、新たな空間における2つのサンプルのセントロイドに対する距離が最小である(前もって規定されていても良いし、又はユーザによって規定されても良い)。新たな空間の座標を調節するため、元の座標が各特徴についての調節された重みと乗算される(新たな空間における座標)。
これを解くため、一次方程式のセットが適切に用いられる。しかしながら、患者の数nと特徴の数mとは、通常等しくはない。従って、選択された患者の数p(p≦n)について、新たな空間にマッピングされるべき最も変動する特徴のセットが導出される。表記すると、
w1*f11+w2*f12+…+wp*f1p=d1
w2*f21+w2*f22+…+wp*f2p=d2

wp*fp1+w2*fp2+…+wp*f2p=d2
この目的のため、全ての特徴についての分散が算出され、上位p個の変動する特徴が選択される。新たな行列は、p×pの次元を持つ。該新たな行列について、適切な重みを見出すために、一次方程式のセットが解かれる。重みが決定されると、ユーザによって選択されなかった患者に対して、新たな空間へと、同じ重みが適用される。
以上の例においては、これは以下のように変形される:
w1*3+w4*3=d1
w1*4+w4*7=d2
ここでw1及びw4は重みであり、列1及び列4における特徴は(患者P1及びP2について)最も変動する特徴であると仮定される。
以上は単に例であり、動作60を実行するための他の手法も考えられる。また、例えば重み調節(第2の手法の例)により後続される次元低減(第1の手法の例)を実行する、又はその逆のような、調節の組み合わせを利用することも考えられる。
図3を参照すると、表示要素14における類似するサンプル患者の表現の例が示されており(即ち図2の動作54)、ここでの例においては、クエリ患者PQは「John Smith」であり、最後の分類の繰り返しにより特定された2人の類似するサンプル患者は「Bob Brown」及び「Mickey Red」である。2つの適合性フィードバック応答が要求される。第1のものは、「Bob Brown」の「John Smith」に対する類似度を1乃至5のスケールでランク付けする要求の形をとり、ここで「1」が最も類似し「5」が最も類似しないとするものである。臨床医は、この要求に回答するため、マウスポインタを用いて、「1」乃至「5」とラベル付けされたボタンの1つを選択することができる。第2の要求は、2人の患者「Bob Brown」及び「Mickey Red」のどちらがクエリ患者「John Smith」に類似するかを選択するものである。臨床医は、「Bob Brown」ボタン又は「Mickey Red」ボタンのいずれかを選択するようマウスポインタを用いることによりこれに回答することができる。
これら要求に有意に回答するため、臨床医は、クエリ患者「John Smith」について並びに各サンプル患者「Bob Brown」及び「Mickey Red」についての医療記録又はその他の患者情報を閲覧したいと欲する見込みが高いであろうことは理解されよう。この目的のため、これらの患者の1人に対する各参照は、図3の表示におけるハイパーリンクとして示され(患者名に下線を引くことにより示されている)、表示は「注:患者の医療記録をポップアップウィンドウで閲覧するには上の患者名のいずれかをクリックしてください」と説明している。斯くして、臨床医がマウスポインタを用いて「John Smith」をクリックすることに応答して、John Smithについての患者記録情報が表示されたポップアップウィンドウ(図示されていない)が表示され、好適にはJohn Smithの医療記録を臨床医が閲覧することを可能とする適切なナビゲーションツールが伴われる。同様に、患者名「Bob Brown」又は「Mickey Red」の表示がマウスでクリックされる。斯かるポップアップの表示は、患者の特徴情報を含んでも良いが、臨床医は、患者記録の全体を閲覧することが可能であり、1つの患者の特徴又は患者の特徴の小さな群に基づいて患者の類似度を評価するようには要求されない。他の閲覧ツールの枠組みが用いられても良く、例えばポップアップウィンドウではなく、別個の表示要素(利用可能である場合;図1には示されていない)に患者記録が表示されても良いことは、理解されるであろう。
図4を参照すると、他の実施例においては、サンプル患者についての情報は他の態様で表示されても良い。例えば図4は、2つ以上のグラフィカルなモダリティ表現が表示要素14に同時に表示される視覚化ツールを示している。図4の例は、3つの同時に表示されるグラフィカルなモダリティ表現を含み、それぞれは、ゲノムモダリティについてのグラフィカルなモダリティ表現70、放射線モダリティについてのグラフィカルなモダリティ表現72、及び臨床モダリティについてのグラフィカルなモダリティ表現74、である。各グラフィカルなモダリティ表現70、72、74は、2つ以上のモダリティの特徴に対して、ウォーターフォール(waterfall)プロットにおける1人以上のサンプル患者及びクエリ患者(図4の例においては、2人の患者Bob Brown及びMickey Red並びにクエリ患者John Smith)をプロットする。図2の例においては、ゲノムのモダリティ表現70は、患者をER、HER2及びPRのゲノムマーカ特徴に対してプロットしている。放射線のモダリティ表現72は、患者をテクスチャ(粗さ)、体積及び形態の画像特徴に対してプロットしている。臨床のモダリティ表現74は、腫瘍のステージのモダリティについてのものであり、患者を腫瘍サイズ(T)、結節状態(N)及び転移値(M)の腫瘍特徴に対してプロットしている。図4から、臨床医は、提示された特徴について、サンプル患者Mickey Redに比べてサンプル患者Bob Brownのほうがクエリ患者John Smithに類似しているように考えられることを、容易に観察することができる。
図5を参照しながら、図4の視覚表現がより一般的に適用可能であり、インタラクティブなグラフィカルな視覚化によって患者コホートを識別するため患者データベース20を閲覧するために用いられ得ることに注意されたい。図5の例においては、図4のゲノム、放射線及び臨床のモダリティ表現70、72、74が再び表示されている。ゲノムのモダリティ表現70においては、GUI処理40(図1参照)が、クラスタの各患者を個別にクリックすることのような適切な選択方法によって、又は本例においては、少なくとも1つのユーザ入力装置(例えばマウス18、トラックボール、トラックパッド、タッチスクリーン又はその他のポインティングデバイス)を介して患者のクラスタ{1,2,4,8}の包含80を受信することによって、患者のクラスタ(任意に患者{1,2,4,8}と示されている)の選択を受信している。他の同時に表示されているモダリティのグラフィカル表現72、74のそれぞれにおいては、選択80に応答して、選択された患者のクラスタ{1,2,4,8}の患者が同様に強調されている。図5の例においては、当該強調は、他の全ての患者の表示を削除し、患者1、2、4及び8のみが表示されるようにすることにより、他のモダリティのグラフィカル表現72、74において為される。該強調は、選択されたクラスタの患者を赤色で表示し、他の患者の全てを黒色で表示し続けることのような、他の手法を用いても良い。
図5に示されるように、患者1、4及び8は、放射線のグラフィカル表現72において好適に分類されているが、患者2は当該モダリティのビューにおいて分類から外れている。臨床のモダリティのグラフィカル表現74においては、患者1及び8のみがともに分類されており、患者2及び4は外れている。これらの結果に基づいて、臨床医は、種々の結論を導くことが可能であり得る。例えば、クエリ患者が患者1である場合、患者8がクエリ患者1に最も近い患者であると決定され得(患者8が3つのビューのいずれにおいても患者1に近いため)、患者2は最も類似しないものであるように見える。他のビューにおいては、臨床医は、2つ以上の座標特徴を更新することにより、表現72、74の1つ以上を変更することを試みるよう決定し得、これに応答して、GUI処理40は、更新されたグラフィカルなモダリティ表現を再描画し、患者を更新された2つ以上のモダリティの座標特徴に対してプロットする。
図4及び5は、ゲノム、放射線及び臨床についての視覚化の例を示すが、種々のモダリティ表現はより一般的に、臨床、放射線、ゲノム、人口統計学、及び/又は生理学的なモダリティのようなモダリティを含んでも良い。一般的に、ユーザは、利用可能なモダリティのパレット又はリストから、どのモダリティを表示するかを選択し、更に各モダリティのどの特徴に対してプロットするかを選択しても良い。
以下、図4及び5の表現70、72、74のような2つ以上のグラフィカルなモダリティ表現を用いて図1のGUI処理40により適切に実行された視覚化表現及びナビゲーション処理の更に詳細な例が記載される。該手法は、例えば名前又は電子医療記録(EMR)番号の検索を介して、クエリ患者を選択することにより開始する。名前、年齢、主治医、疾患等のような、当該患者についての基本情報が表示されても良い。グラフィカルなモダリティ表現70、72、74を含む、ユーザ作業領域が表示される。図4及び5の例においては、各モダリティ表現は、円として表され、患者がプロットされるモダリティ特徴が、該円のまわりに等間隔で配置される(例えばゲノムのモダリティの場合には特定の疾患に関連する生物マーカの存在)。他の患者が、当該視覚化に自動的に統合され、いずれかの利用可能なコホート(例えば図1の患者コホート識別装置を用いて生成されたもの)から引き抜かれ、該円に配置される。このことは、より大きな患者の集団という観点から、対象の患者を配置する。デフォルトでは、全てのモダリティが同時に表示されるが、それぞれが個々に調べるためにズームインされることができる。円の周辺に配置された特徴(即ちプロットされる特徴)は選択されることができる。値が割り当てられた患者に結合されたいずれの値も、全ての利用可能なモダリティに亘って後続して強調される。後続する解析が、これらの選択された患者に対して実行されても良い。
任意に、ユーザが患者を選択すると、選択された患者の顕著な特性を強調する統計的な概要が、画面に表示される。当該概要は、患者の選択が更新されると、動的に更新される。該概要の内容は、離散的又は連続的といった変数の特性に基づいて記述されても良い。
多量の利用可能な人口統計学的、病理学的、臨床的及びゲノムの特徴(例えば幾つかの患者データベースにおいては200以上)に対して、対象の特定のコンテキストに関連するデータの効果的な要約及び視覚化のため、生物マーカ、署名、予後スコア等及びコホートのサンプルのような特徴の選択を支援するナビゲーションツールが提供される。任意に、GUIツールもが、臨床医がカスタマイズされた選択を定義及び保存し容易に或るコンテキストから他のコンテキストに切り換えることができるようにする。
図5の例においては、臨床医は、データベース又は選択されたコホートにおける他の患者のコンテキストにおける選択された患者のゲノムのグラフィカルなビュー70において、ER、HER2及びPR受容体の状態を閲覧し、同じ患者を他のモダリティのグラフィカルなビュー72、74において閲覧する柔軟性を持つ。臨床医は、例えば包含80を用いて、ゲノムのビューから関心のある患者のサブセットを選択/強調することができ、これら患者は、他のビュー72、74において強調される。斯くして、例えば、選択された患者{1,2,4,8}のT、N、Mのステージは、臨床の(癌のステージの)グラフィカルなビュー74において閲覧され、選択された患者のT(腫瘍サイズ)、N(結節状態)及びM(転移状態)の分布が評価される(選択された患者の数が4人の選択された患者の例よりも多い場合には、より良く定義された分布が得られる見込みが高いことは、理解されるであろう)。同様に、撮像のグラフィカルなビュー72においては、例えば体積、捩じり上げ、捩じり下げ特性、テクスチャ、及び形態特徴のようなMRI特徴が表示される。他のモダリティのビューが、臨床医により選択されても良い(図示されていない)。このようにして、臨床医は、異なるモダリティ間で、選択された患者の群について、1つのモダリティにおける特徴又は特徴の群の関連について、インタラクティブに試験することができる。
更なる例として、ゲノムのグラフィカルなビュー70が更に詳細に説明される。図5に示されるように、ゲノムの層が円に表示され、乳癌を評価するタスクに適切な例が特に示されている。このタスクのため、対象の特徴は、乳癌の診断及び予後についての臨床的な有用性を示したER、PR及びHER2活動レベルを含む(当然ながら、他のタスクについては、他の顕著なゲノム特徴がプロットのため選択される)。臨床医がアプリケーションを開くと、該アプリケーションは選択されたコホート(例えば図1のコホート識別装置を用いて生成されたもの)における他の患者とともに対象の患者(クエリ患者)を表示する。図5の例においては、3つのウォーターフォールプロット(降順でプロットされたバー)が示され、それぞれがER/PR/HER2活動度の1つを表し、ゲノムの円70に均等に配置される。ナビゲーション手法の1つにおいては、クエリ患者が、コホートの残りのものに対して、円における各生物マーカについてのクエリ患者の活動レベルを強調するよう、自動的に選択される。任意に、患者を表すこれら3本のバーから、円の中心における領域まで、線(図示されていない)が描画され、コホートのER/PR/HER2データから算出された機械学習アルゴリズム(例えば主成分解析)が、適切に視覚化される。該線は、コホートに対して対象の患者が位置する場合へと正確に描画される。この全体的な視覚化から、例えば包含80を用いて、類似するER/PR/HER2発現レベルを持つ更なる患者が選択される。機械学習空間において選択されたいずれの更なる患者も、円を囲むそれぞれのER/PR/HER2活動度レベルに対して引かれた線を持つこととなる。
選択されたグループ(例えば図5におけるグループ{1,2,4,8})について、統計的な概要が提供されても良い。年齢及び遺伝子の発現値のような連続的な変数については、選択されたグループの平均が算出されても良い。性別及びER状態のような離散的な変数については、超幾何試験のような試験及びp値の降順に保存された特性を用いるエンリッチメント解析が実行されても良い。乳癌のデータセットについて選択された患者の典型的な概要が、表1に示される。
Figure 0007261846000006
この表においては、FPKM(fragments per kilobase of exon per million reads mapped)が、RNAシーケンシングデータに基づいてp53遺伝子の発現値を示す。これら変数の有意な数は、乳癌の診断のタスクの例に特有であり、統計的な概要の要素は、各疾患又は臨床タスクについて概要形式で適切に事前に記述される。
図4及び5のグラフィカルな視覚化及びナビゲーションツールは、例である。例示した円の幾何以外の幾何が利用されても良い。円の幾何の利点は、プロットされるべきモダリティの特徴の適切な数(即ち円の周りに好適にフィッティングされ得る特徴のいずれかの数)に容易に更新される点であり、正方形の幾何は、2つのモダリティの特徴に対するプロットにのみ適している。
1つのグラフィカルなモダリティ表現において患者のクラスタを選択する動作は、臨床医がユーザ入力装置16、18を操作する(例えば図5におけるような包含選択80を為す)以外のエンティティ/機構によって実行されても良いことも想到される。例えば、図4の例においては、例えば分類処理30のような、コンピュータ10、12上で動作する他のプログラムが、クエリ患者及び1人以上のサンプル患者(図4の例においてはサンプル患者Bob Brown及びMickey Red並びにクエリ患者John Smith)のセットとして患者のクラスタを選択する。
図1及び2に戻り参照しながら、患者レベルの適合性フィードバックを用いた患者コホート識別喜悦の実装の他の例がテキストで説明され、以下のステップを含む。
ステップ1:大量のデータセット(第2の実施例においては百万以上のサンプル)における全ての患者及び選択された患者の特徴に対する階層的な分類をもちいて、教師なし学習を実行する。
ステップ2:クラスタの数を決定し、クラスタのセントロイドを算出する。
ステップ3:全ての特徴に基づいてクエリ患者PQを含むクラスタを選択し、同じクラスタから付加的なシード(seed)を選択する。
ステップ4:各シードについて、患者比較メトリックを用いて測定された全ての異なるクラスタのセントロイドに対する当該患者の距離に基づいて、最も類似する患者を見つける。
ステップ5:(単一のクラスタに属するもののうち)類似する患者の優先順位付けされたリストに基づいて、サンプル及び現在のサンプルに類似するサンプルを選択する。
ステップ6:一度に1つの特徴を削除することにより、どの特徴が患者の当該類似度を重要とするかを決定する。
ステップ7:患者比較メトリックを用いて、現在の患者と全ての選択された患者との間の距離を見出す。
ステップ8:中央値が0に近い列を見つける。大きな数を持つ列を破棄する。
ステップ9:選択された特徴に基づいて、選択された分類のみを用いて、データセット全体に対して教師なし分類を実行する。
ステップ10:元のクエリ患者PQのクラスタ又は選択された患者の大部分が出現するクラスタにおける患者を最後に提示する。
最後に、サンプルのセットが全て臨床医に関連するものとなるまで、以上のステップ1乃至10を反復的に繰り返す。
本発明は、好適な実施例を参照しながら説明された。以上の詳細な説明を読むことにより、他への変更及び変形が生じ得る。本発明は、添付される請求の範囲又はそれと同等のものの範囲内である限り、斯かる変更及び変形の全てを含むものとして解釈されることを意図される。

Claims (4)

  1. 患者コホート識別装置であって、
    表示要素及び少なくとも1つのユーザ入力装置を持つコンピュータを有し、前記コンピュータは、患者データベース中の患者についての特徴の値を有する患者データを保存する患者データベースと通信し、前記コンピュータは、患者コホート識別方法を実行するようプログラムされ、前記方法は、
    それぞれが2つ以上のモダリティの座標特徴に対してデータベースの患者をプロットする、2つ以上のグラフィカルなモダリティ表現を、前記表示要素上に同時に表示するステップと、
    1つのグラフィカルなモダリティ表現における患者のクラスタの選択を受信するステップと、
    前記選択の受信に応答して、他の同時に表示されたグラフィカルなモダリティ表現における前記選択された患者のクラスタの患者を強調表示するステップと、
    を含む、患者コホート識別装置。
  2. 前記受信するステップは、
    (I)1つのグラフィカルなモダリティ表現に対して動作する少なくとも1つのユーザ入力装置を介して、患者のクラスタの選択を受信するステップであって、前記選択は、マウス、トラックボール、トラックパッド、タッチスクリーン又はその他のポインティングデバイスの1つを有する前記少なくとも1つのユーザ入力装置を介して、前記患者のクラスタの包含を受信するステップを有する、ステップ、又は
    (II)コンピュータ上で動作する他のコンピュータプログラムから患者のクラスタの選択を受信するステップ
    を有する、請求項1に記載の患者コホート識別装置。
  3. 前記患者コホート識別方法は更に、
    同時に表示されたグラフィカルなモダリティ表現の1つについて2つ以上の座標特徴の更新の選択を受信するステップを含み、前記グラフィカルなモダリティ表現は、前記更新されたモダリティの2つ以上の座標特徴に対してデータベースの患者をプロットするよう更新される、請求項1乃至2のいずれか一項に記載の患者コホート識別装置。
  4. 前記2つ以上のグラフィカルなモダリティ表現は、臨床、放射線、ゲノム、人口統計学的及び生理学的モダリティから成る群から選択されたモダリティについてのグラフィカルなモダリティ表現を含む、請求項1乃至3のいずれか一項に記載の患者コホート識別装置。
JP2021154060A 2016-03-16 2021-09-22 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック Active JP7261846B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662309067P 2016-03-16 2016-03-16
US62/309,067 2016-03-16
PCT/IB2017/051345 WO2017158472A1 (en) 2016-03-16 2017-03-08 Relevance feedback to improve the performance of clustering model that clusters patients with similar profiles together
JP2018548312A JP7117246B2 (ja) 2016-03-16 2017-03-08 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018548312A Division JP7117246B2 (ja) 2016-03-16 2017-03-08 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック

Publications (2)

Publication Number Publication Date
JP2022020620A JP2022020620A (ja) 2022-02-01
JP7261846B2 true JP7261846B2 (ja) 2023-04-20

Family

ID=58410385

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018548312A Active JP7117246B2 (ja) 2016-03-16 2017-03-08 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
JP2021154060A Active JP7261846B2 (ja) 2016-03-16 2021-09-22 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018548312A Active JP7117246B2 (ja) 2016-03-16 2017-03-08 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック

Country Status (5)

Country Link
US (1) US11854694B2 (ja)
EP (1) EP3430545A1 (ja)
JP (2) JP7117246B2 (ja)
CN (1) CN108780661A (ja)
WO (1) WO2017158472A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11594310B1 (en) 2016-03-31 2023-02-28 OM1, Inc. Health care information system providing additional data fields in patient data
CA2984267A1 (en) * 2016-11-01 2018-05-01 Medarchon, Inc. Patient handoff device, system and predictive method
US11257574B1 (en) 2017-03-21 2022-02-22 OM1, lnc. Information system providing explanation of models
US10910112B2 (en) 2017-12-04 2021-02-02 Koninklijke Philips N.V. Apparatus for patient record identification
US11967428B1 (en) 2018-04-17 2024-04-23 OM1, Inc. Applying predictive models to data representing a history of events
US11862346B1 (en) 2018-12-22 2024-01-02 OM1, Inc. Identification of patient sub-cohorts and corresponding quantitative definitions of subtypes as a classification system for medical conditions
CN110188289B (zh) * 2019-06-05 2021-02-26 南京邮电大学 一种面向群组的服务推荐列表生成方法
WO2021014405A1 (en) * 2019-07-24 2021-01-28 Janssen Pharmaceuticals, Inc. Learning platform for patient journey mapping
US11657300B2 (en) * 2020-02-26 2023-05-23 Samsung Electronics Co., Ltd. Systems and methods for predicting storage device failure using machine learning
WO2021233795A1 (en) * 2020-05-20 2021-11-25 Koninklijke Philips N.V. Personalized radiology decision guidelines drawn from past analogous imaging and clinical phenotype applicable at the point of reading
CN112259254B (zh) * 2020-10-19 2024-05-07 平安科技(深圳)有限公司 基于交互反馈的病例搜索方法、装置及可读存储介质
US20220261668A1 (en) * 2021-02-12 2022-08-18 Tempus Labs, Inc. Artificial intelligence engine for directed hypothesis generation and ranking
US20230020866A1 (en) * 2021-07-16 2023-01-19 Innoplexus Ag Method and system for identifying cancer twin
KR102516855B1 (ko) * 2022-06-28 2023-03-31 주식회사 메디마인드 가상현실 기술을 이용하여 학습자에게 제왕절개시술용 적응형 컨텐츠를 제공하기 위한 방법 및 이를 이용한 장치
CN116364261B (zh) * 2023-06-02 2023-08-01 北京小懂科技有限公司 一种智能推荐方法、系统、设备及存储介质
CN117874497B (zh) * 2024-03-11 2024-05-07 国网北京市电力公司 一种负荷特征提取方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010125022A (ja) 2008-11-27 2010-06-10 Konica Minolta Medical & Graphic Inc 医用画像表示装置及び医用画像出力装置
JP2011520206A (ja) 2008-05-12 2011-07-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 医療分析システム
JP2012523877A (ja) 2009-04-15 2012-10-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 臨床決定支援システム及び方法
US20140108379A1 (en) 2012-10-12 2014-04-17 International Business Machines Corporation Iterative Refinement of Cohorts Using Visual Exploration and Data Analytics

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611846B1 (en) 1999-10-30 2003-08-26 Medtamic Holdings Method and system for medical patient data analysis
JP2003030224A (ja) * 2001-07-17 2003-01-31 Fujitsu Ltd 文書クラスタ作成装置、文書検索システムおよびfaq作成システム
US20050210015A1 (en) * 2004-03-19 2005-09-22 Zhou Xiang S System and method for patient identification for clinical trials using content-based retrieval and learning
US7809660B2 (en) 2006-10-03 2010-10-05 International Business Machines Corporation System and method to optimize control cohorts using clustering algorithms
WO2009083841A1 (en) 2007-12-27 2009-07-09 Koninklijke Philips Electronics, N.V. Method and apparatus for refining similar case search
US9997260B2 (en) * 2007-12-28 2018-06-12 Koninklijke Philips N.V. Retrieval of similar patient cases based on disease probability vectors
US20110270628A1 (en) 2010-04-29 2011-11-03 Microsoft Corporation Comparisons between entities of a particular type
US20120078840A1 (en) 2010-09-27 2012-03-29 General Electric Company Apparatus, system and methods for comparing drug safety using holistic analysis and visualization of pharmacological data
US20120078521A1 (en) 2010-09-27 2012-03-29 General Electric Company Apparatus, system and methods for assessing drug efficacy using holistic analysis and visualization of pharmacological data
US8589187B2 (en) 2010-12-28 2013-11-19 Microsoft Corporation Automated clustering for patient disposition
US8560342B2 (en) 2011-06-13 2013-10-15 International Business Machines Corporation Cohort driven selection of medical diagnostic tests
US20130231953A1 (en) 2012-03-01 2013-09-05 Shahram Ebadollahi Method, system and computer program product for aggregating population data
EP3019865A4 (en) 2013-07-12 2017-04-05 Immuneering Corporation Systems, methods, and environment for automated review of genomic data to identify downregulated and/or upregulated gene expression indicative of a disease or condition
US20150095067A1 (en) 2013-10-01 2015-04-02 Cerner Innovation, Inc. Providing cross venue antiobiograms, comprehensive medication advisors, and medication stewardship claims
CN103530689B (zh) * 2013-10-31 2016-01-20 中国科学院自动化研究所 一种基于深度学习的聚类方法
US20150161332A1 (en) 2013-12-06 2015-06-11 Cardiac Pacemakers, Inc. Multi-patient data visualization system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011520206A (ja) 2008-05-12 2011-07-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 医療分析システム
JP2010125022A (ja) 2008-11-27 2010-06-10 Konica Minolta Medical & Graphic Inc 医用画像表示装置及び医用画像出力装置
JP2012523877A (ja) 2009-04-15 2012-10-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 臨床決定支援システム及び方法
US20140108379A1 (en) 2012-10-12 2014-04-17 International Business Machines Corporation Iterative Refinement of Cohorts Using Visual Exploration and Data Analytics

Also Published As

Publication number Publication date
JP2022020620A (ja) 2022-02-01
JP7117246B2 (ja) 2022-08-12
CN108780661A (zh) 2018-11-09
JP2019512795A (ja) 2019-05-16
US11854694B2 (en) 2023-12-26
WO2017158472A1 (en) 2017-09-21
US20190079938A1 (en) 2019-03-14
EP3430545A1 (en) 2019-01-23

Similar Documents

Publication Publication Date Title
JP7261846B2 (ja) 類似するプロファイルを持つ患者を共に分類する分類モデルの性能を改善するための適合性フィードバック
Skaf et al. Topological data analysis in biomedicine: A review
Azar et al. Decision tree classifiers for automated medical diagnosis
JP5506912B2 (ja) 臨床決定支援システム及び方法
JP5523342B2 (ja) 類似事例検索を精密化するための方法及び装置
US20170193660A1 (en) Identifying a Successful Therapy for a Cancer Patient Using Image Analysis of Tissue from Similar Patients
US10593431B1 (en) Methods and systems for causative chaining of prognostic label classifications
Newman et al. Visualizing search results and document collections using topic maps
WO2010082246A1 (ja) 情報処理装置および情報処理方法
US20070156451A1 (en) System and method for portable display of relevant healthcare information
Sallaberry et al. Sequential patterns mining and gene sequence visualization to discover novelty from microarray data
JP5431924B2 (ja) 臨床医駆動の例示ベースのコンピュータ支援診断
JP2012118583A (ja) レポート作成支援装置及びその作成支援方法、並びにプログラム
US20180330805A1 (en) Cohort explorer for visualizing comprehensive sample relationships through multi-modal feature variations
Babu et al. Implementation of partitional clustering on ILPD dataset to predict liver disorders
US20220044762A1 (en) Methods of assessing breast cancer using machine learning systems
Ashraf et al. Iterative weighted k-NN for constructing missing feature values in Wisconsin breast cancer dataset
To et al. Receiver operating characteristic estimation and threshold selection criteria in three-class classification problems for clustered data
Kortum et al. Improving the decision support in diagnostic systems using classifier probability calibration
WO2008156716A1 (en) Automated reduction of biomarkers
Lobo et al. Predicting protein in cancer diagnosis using effective classification and feature selection technique
Hassan et al. Efficient prediction of coronary artery disease using machine learning algorithms with feature selection techniques
Raj Enhancing Thyroid Cancer Diagnostics Through Hybrid Machine Learning and Metabolomics Approaches.
US20240105345A1 (en) Automatic ranking and rank order disply of medical information, and associated devices, systems, and methods
EP4111942A1 (en) Methods and systems for identifying slices in medical image data sets

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211015

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230410

R150 Certificate of patent or registration of utility model

Ref document number: 7261846

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150