JP2023553586A - 肺高血圧症の検出のための非侵襲的方法 - Google Patents

肺高血圧症の検出のための非侵襲的方法 Download PDF

Info

Publication number
JP2023553586A
JP2023553586A JP2023524175A JP2023524175A JP2023553586A JP 2023553586 A JP2023553586 A JP 2023553586A JP 2023524175 A JP2023524175 A JP 2023524175A JP 2023524175 A JP2023524175 A JP 2023524175A JP 2023553586 A JP2023553586 A JP 2023553586A
Authority
JP
Japan
Prior art keywords
feature vector
subject
voltage
generating
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023524175A
Other languages
English (en)
Inventor
カーペンター,コリン
カールソン,キャサリン
ワグナー、タイラー
アワスチ,サミル
サウンダララジャン,ヴェンカタラマナン
アラヴァムダン,ムラリ
ザヒ アッティア,イサク
フリードマン,ポール,エー.
アシルバサム,サミュエル,ジェイ.
カパ,スラジュ
ロペス-ジメネス,フランシスコ
エム. ダブロック,ヒラリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2023553586A publication Critical patent/JP2023553586A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/339Displays specially adapted therefor
    • A61B5/341Vectorcardiography [VCG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Cardiology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

対象の心電計の複数のリードの電圧-時間データを受信する工程と、電圧-時間データから特徴ベクトルを生成する工程と、特徴ベクトルを事前訓練済み学習システムに提供する工程と、事前訓練済み学習システムから対象における肺高血圧症の有無の指示を受信する工程とを含む、肺高血圧症の検出のための方法、システムおよびコンピュータプログラム製品が本明細書において提供される。【選択図】図1

Description

関連出願の相互参照
本出願は、2020年10月14日に出願された米国仮出願第63/091,715号の利益を主張するものであり、前記出願の内容全体が参照により本明細書に組み込まれる。
本開示の実施形態は、肺高血圧症の診断および治療のための方法に関する。肺高血圧症(PH)は世界人口の1%であって65歳を超える年齢の患者の最大10%を冒すと推定されている生命にかかわる疾患である。PHの時宜を得た診断は、有効な治療的介入のためだけではなく生存の可能性を高めるためにも肝要である。複数の研究が、たとえ数ヶ月であってもより早期の診断により、生活の質および寿命の延長において劇的な向上をもたらすことができるということを示唆している。しかしPHの症状は非特異的であり、喘息、慢性閉塞性肺疾患(COPD)および心不全を含む他の一般的な疾患で認められる症状に非常に類似している。これは外来診療環境内においてPHの疑いを減らすため、診断を確認することができる呼吸器科医または心臓病専門医への時宜を得た紹介は非常に重要である。現在のところ診断の遅れは主に、適切な専門医への紹介の遅れが原因で2.5年(症状の発症から診断まで)、場合によっては最長4年の平均期間で起こり得る。実際には、PHの決定的な診断のためのゴールドスタンダードは右心カテーテル法(RHC)であり、これは無視できないリスクを伴う侵襲的処置であるため、医師は全ての他の疾患が順次除外されるまで先に進むことを躊躇することが多い。従って、PHの早期かつ正確な検出のための新しく、かつ改良された方法(例えば診断方法)が大いに必要とされている。従って、本明細書に開示されている本発明の実施形態は、PHの検出およびPHのリスクに基づく患者の層別化のためのPHの精密診断における非侵襲的手順である心電図(ECG)に適用されるアルゴリズムを含み、より早期の診断および介入を可能にする。
本開示の実施形態によれば、肺高血圧症の検出のための方法およびコンピュータプログラム製品が提供される。
本発明のいくつかの態様では、心電計の複数のリードの電圧データを含む対象の電圧-時間データを受信する工程と、電圧-時間データから特徴ベクトルを生成する工程と、特徴ベクトルを事前訓練済み学習システムに提供する工程と、事前訓練済み学習システムから対象における肺高血圧症の有無の指示を受信する工程とを含む方法が本明細書に開示されている。
本明細書に開示されている本発明の態様は、複数のリードを含む心電計と、それと共に具体化されているプログラム命令を有するコンピュータ可読記憶媒体を備えた計算ノードであって、プログラム命令は、計算ノードのプロセッサによって実行可能であり、心エコー図からの複数のリードの電圧データを含む対象の電圧-時間データを受信する工程と、電圧-時間データから特徴ベクトルを生成する工程と、特徴ベクトルを事前訓練済み学習システムに提供する工程と、事前訓練済み学習システムから対象における肺高血圧症の有無の指示を受信する工程と、を含む方法をプロセッサに実行させる、計算ノードと、を備えるシステムも含む。
本発明の特定の態様では、それと共に具体化されているプログラム命令を有するコンピュータ可読記憶媒体を含み、プログラム命令は、プロセッサによって実行可能であり、心エコー図からの複数のリードの電圧データを含む対象の電圧-時間データを受信する工程と、電圧-時間データから特徴ベクトルを生成する工程と、特徴ベクトルを事前訓練済み学習システムに提供する工程と、事前訓練済み学習システムから対象における肺高血圧症の有無の指示を受信する工程と、を含む方法をプロセッサに実行させる、肺高血圧症の検出のためのコンピュータプログラム製品が本明細書に開示されている。
本開示の実施形態に係る肺高血圧症を検出するためのシステムの概略図である。 本開示の実施形態に係る肺高血圧症を検出するための方法を示すフローチャートである。 本開示の一実施形態に係る計算ノードを示す。 MayoのPHコホート(陽性対照)のためのセンテンス感情の分布を示し、ここでは「肺高血圧症」という用語を含む患者に関連する約180,000個のセンテンスをモデルによって分類した。 患者の臨床ノートに従ってPHを有していないMayoのPHコホートにおける患者を特定するために使用される感情分析の出力を示す。 潜在的PHコホートにおける診断モデルからの出力を表し、ここではモデルは「肺高血圧症」を含むセンテンスに対して実行された。 拡張キュレーションの結果および心エコー測定値の組み合わせを用いたロジスティック回帰モデルからの出力を表す。 診断窓からのECGに関するコホート3診断モデルを示す。 予防窓からのECGに関するコホート3診断モデルを示す。 診断の5年前に遡って6ヶ月の窓からのECGに関する経時的なコホート3診断モデル性能を示す。 nferX(登録商標)Human Geneticsアプリケーションの出力を表し、これによりその突然変異が肺高血圧症に関連づけられた26種の遺伝子を特定した。これらのうちの2つ、すなわちKCNK3およびKCNA5は、カリウムチャネルである。 nferX(登録商標)RNA Explorerアプリケーションの出力を表し、これによりKCNK3およびKCNA5の両方の発現が心臓組織ならびに神経組織において観察されることが実証された。 nferX Single Cellアプリケーションの出力を表し、これからKCNK3(上の行)およびKCNA5(下の行)の両方が神経および心臓細胞型においてそれぞれ強く発現されることが分かった。特にKNCK3発現は、より低い発現レベルで心臓細胞型においても観察される(図示せず)。 nferX Signalsアプリケーションの出力を表し、これによりKCNK3(左)(TASK1とも呼ばれる)、およびKCNA5(右)の両方における突然変異が心臓電気生理に影響を与え、従って心電図において検出可能であり得ることを示唆する数多くの文献証拠提供元が特定された。 トランスフォーマー(transformer)層を含まない例示的な7層畳み込みニューラルネットワークCNNモデルのためのネットワークアーキテクチャー図を示す。 2つのトランスフォーマー層を含む例示的な9層畳み込みニューラルネットワーク(CNN)モデルのためのネットワークアーキテクチャー図を示す。 ニューラルネットワークが過学習になる傾向が少なくなるようにするための訓練セットにおけるデータ拡張を示す。前記データは、(A)信号全体において時間の一部をマスキングすること、(B)0.5~50Hzの周波数のみを可能にすること、(C)いくつかのズームレベルにより信号を引き延ばすこと、(D)異なるリードにおいて小さい電圧で電圧をシフトさせること、(E)1および50Hzで周波数帯を下げること、または小さいリードのセットを組み換えること、のうちの1つをランダムに適用することにより拡張させる。
畳み込みニューラルネットワークは、単一のECGにおいて生成された膨大な量のデータを分析および解釈する包括的手法を提供する。PHの患者をスクリーニングするために、ECG、手順的測定値、医師のノートおよび患者の人口統計学的データを含む、過去に遡るMayo Clinicの患者レベルのデータを用いてアルゴリズムを開発した。モデル訓練のためにPH患者と非PH患者とを区別するために、各ECGをRHCまたは心エコー図のいずれかと対にした。これらの手順から得られた測定値を使用してコホートを定めた。これにより65,994人の一意的患者(11,238人のPHおよび54,756人の非PH)が得られ、そのうちの48%をモデル訓練において使用し、12%を予備検証のために提供し、最後の40%を試験のために提供した。
全てのモデルは、入力として12リードECGからの電圧-時間情報を使用した。探求されたモデリング技術は、12リード全てを単一の入力として使用する、3リードのグループを別々の入力として使用する、スペクトログラムに変換された各リードを使用する、およびこれらの方法の組み合わせなどの、異なる構造を有する畳み込みニューラルネットワークを含んでいた。さらに、2つの異なる予備モデルを作り出し、その1つでは患者の診断の1ヶ月以内にECGを行い(診断モデル)、もう1つでは診断日の6~18ヶ月前にECGを行った(予防モデル)。その時の相対的性能に基づいて、さらなる開発のために予備診断モデルを選択した。
最も性能の良い予備診断モデルは、12リードの単一の入力が組み込まれた残差接続を含む畳み込みニューラルネットワークであった。更新された診断モデルにより、診断検証および試験セットに関して0.94の曲線下面積(AUC)が得られ、検証および試験セットに関する0.90のAUCにより診断の6~18ヶ月前にPHを区別することができた。最後に、診断の3~5年前に行われたECGは性能における有意な低下を示さず、0.8466超のAUCであった。最終的に、これらの結果は、PHを検出するためのECG内の強力な信号を示し、一次医療および二次医療の状況下で患者の診断および介入を促進させるために、ECG機器に実装できる可能性がある。さらに、当該疾患は、根底にある遺伝子要素も含み、これは診断の3~5年前のこれらの診断信号の検出によって支持される。本明細書に開示されている方法は、遺伝子パネルと組み合わせてさらなる特異性および感度を提供し得る。同様に、このような方法を遺伝子パネルと共に使用して、疾患の新規なバイオマーカーを検出し得る。
従って、本発明のいくつかの態様では、心電計の複数のリードの電圧データを含む対象の電圧-時間データを受信する工程と、電圧-時間データから特徴ベクトルを生成する工程と、特徴ベクトルを事前訓練済み学習システムに提供する工程と、事前訓練済み学習システムから対象における肺高血圧症の有無の指示を受信する工程とを含む方法が本明細書に開示されている。特徴ベクトルを生成する工程は、複数のリードの電圧データに基づいてスペクトログラムを生成することを含んでもよい。いくつかの実施形態では、特徴ベクトルを生成する工程は、複数のリードの電圧データを複数のサブセットにグループ化することを含む。
いくつかの実施形態では、そのような方法は対象の人口統計学的情報を受信する工程をさらに含み、ここでは特徴ベクトルを生成する工程は人口統計学的情報を特徴ベクトルに追加することを含む。いくつかのそのような実施形態では、学習システムは畳み込みニューラルネットワークを含む。そのような畳み込みニューラルネットワークは少なくとも1つの残差接続を含んでいてもよい。
いくつかの実施形態では、対象の電圧-時間データは心電計から受信される。さらなる実施形態では、対象の電圧-時間データは電子医療記録から受信される。
いくつかの実施形態では、本方法は、対象に関連づけられた健康記録への記憶のために電子健康記録システムに指示を提供する工程をさらに含む。いくつかの実施形態では、本方法はユーザへの表示のために計算ノードに指示を与える工程をさらに含む。
次に図1を参照すると、本開示の実施形態に係る肺高血圧症を検出するためのシステムが示されている。上に概説されているように、様々な実施形態では、肺高血圧症の存在を決定するために心電図(ECG)データを含む患者情報が学習システムに提供される。従って、本明細書に開示されている本発明の態様は、複数のリードを含む心電計と、それと共に具体化されているプログラム命令を有するコンピュータ可読記憶媒体を備えた計算ノードとを備えるシステムであって、プログラム命令は、計算ノードのプロセッサによって実行可能であり、心エコー図からの複数のリードの電圧データを含む対象の電圧-時間データを受信する工程と、電圧-時間データから特徴ベクトルを生成する工程と、特徴ベクトルを事前訓練済み学習システムに提供する工程と、事前訓練済み学習システムから対象における肺高血圧症の有無の指示を受信する工程とを含む方法をプロセッサに実行させる、システムも含む。特徴ベクトルを生成する工程は、複数のリードの電圧データに基づいてスペクトログラムを生成することを含んでもよい。いくつかの実施形態では、特徴ベクトルを生成する工程は、複数のリードの電圧データを複数のサブセットにグループ化することを含む。
いくつかの実施形態では、そのようなシステムは、対象の人口統計学的情報を受信する工程をさらに含み、ここでは特徴ベクトルを生成する工程は、人口統計学的情報を特徴ベクトルに追加することを含む。いくつかのそのような実施形態では、学習システムは畳み込みニューラルネットワークを含む。そのような畳み込みニューラルネットワークは少なくとも1つの残差接続を含んでいてもよい。
いくつかの実施形態では対象の電圧-時間データは心電計から受信される。さらなる実施形態では、対象の電圧-時間データは電子医療記録から受信される。
いくつかの実施形態では、本システムは、対象に関連づけられた健康記録への記憶のために電子健康記録システムに指示を提供する工程をさらに含む。いくつかの実施形態では、本システムは、ユーザへの表示のために計算ノードに指示を与える工程をさらに含む。
患者データは電子健康記録(EHR)101から受信してもよい。電子健康記録(EHR)、または電子医療記録(EMR)は、デジタル形式の患者および集団の電子的に記憶された健康情報の体系化された収集物を指してもよい。これらの記録は、異なる健康管理環境全体で共有することができる。記録はネットワーク接続された企業規模の情報システムまたは他の情報ネットワークおよび交換を通して共有してもよい。EHRは、人口統計学的データ、病歴、投薬およびアレルギー、予防接種記録、臨床検査の結果、放射線画像、バイタルサイン、年齢および体重のような個人統計ならびに請求書作成情報を含むある範囲のデータを含んでもよい。EHRシステムはデータを記憶し、かつ経時的な患者の状態を取り込むように設計されていてもよい。このようにして、患者の過去の紙の医療記録を探し出す必要性を取り除く。
心電図(ECG)データは、心電図装置102から直接受信してもよい。例示的な12リードECGでは、10個の電極を患者の肢および胸の表面に取り付ける。次いで、心臓の電位の全体的な大きさを12の異なる角度(リード)から測定し、ある期間(通常は10秒間)にわたって記録する。このようにして、心臓の電気的な脱分極の全体的な大きさおよび方向を心周期全体を通して各瞬間に取り込む。
さらなるデータストア103は本明細書に記載されているさらなる患者情報を含んでいてもよい。好適なデータストアとしては、データベース、単層ファイルおよび当該技術分野で知られている他の構造が挙げられる。
当然のことながら、ECGデータは後の検索のためにEHRに記憶してもよい。また当然のことながら、ECGデータはさらなる処理のために学習システムに直接送るのではなくキャッシュしてもよい。
学習システム104はEHR101、ECG102およびさらなるデータストア103の1つ以上から患者情報を受信する。上述のとおりいくつかの実施形態では、学習システムは畳み込みニューラルネットワークを含む。様々な実施形態では、畳み込みニューラルネットワークへの入力はECGに関する電圧-時間情報を含み、これはいくつかの実施形態では、人口統計学的データまたは遺伝情報などのさらなる患者情報と対にされている。
学習システム104は、肺高血圧症の有無の指示を生成するために実施例に記載されているように好適な人口データを用いて事前訓練されていてもよい。いくつかの実施形態では、この指示はバイナリである。いくつかの実施形態では、この指示は、入力された患者データを考慮した肺高血圧症の可能性を示す確率値である。
いくつかの実施形態では、学習システム104はEHRの一部としての記憶のために肺高血圧症の指示を与える。このようにして、臨床医によって参照され得るコンピュータ支援診断が提供される。いくつかの実施形態では、学習システム104は肺高血圧症の指示をリモートクライアント105に提供する。例えばリモートクライアントは、健康アプリケーション、クラウドサービスまたは診断データの別の消費者であってもよい。いくつかの実施形態では、学習システム104は試験中のユーザへの即座のフィードバックのためにECG機器に統合されている。
いくつかの実施形態では、特徴ベクトルは学習システムに提供される。入力された特徴に基づいて、学習システムは1つ以上の出力を生成する。いくつかの実施形態では、学習システムの出力は特徴ベクトルである。
いくつかの実施形態では、学習システムはSVMを含む。他の実施形態では、学習システムは人工ニューラルネットワークを含む。いくつかの実施形態では、学習システムは訓練データを用いて事前訓練されている。いくつかの実施形態では、訓練データは後ろ向きデータである。いくつかの実施形態では、後ろ向きデータはデータストアに記憶されている。いくつかの実施形態では、学習システムは過去に生成された出力の手動でのキュレーションによりさらに訓練されていてもよい。
いくつかの実施形態では、学習システムは訓練済み分類器である。いくつかの実施形態では、訓練済み分類器はランダム決定フォレストである。但し当然のことながら、線形分類器、サポートベクターマシン(SVM)、または再帰型ニューラルネットワーク(RNN)などのニューラルネットワークを含む様々な他の分類器が本開示に従って使用するのに適している。
好適な人工ニューラルネットワークとしては、限定されるものではないが順伝播型ニューラルネットワーク、動径基底関数ネットワーク、自己組織化マップ、学習ベクトル量子化、再帰型ニューラルネットワーク、ホップフィールドネットワーク、ボルツマンマシン、エコーステートネットワーク、長・短期記憶、双方向再帰型ニューラルネットワーク、階層再帰型ニューラルネットワーク、確率的ニューラルネットワーク、モジュラーニューラルネットワーク、連想型ニューラルネットワーク、ディープニューラルネットワーク、ディープビリーフネットワーク、畳み込みニューラルネットワーク、畳み込みディープビリーフネットワーク、大容量記憶および検索ニューラルネットワーク、ディープボルツマンマシン、ディープスタッキングネットワーク、テンソルディープスタッキングネットワーク、スパイク・アンド・スラブ制限付きボルツマンマシン、複合階層型ディープモデル、ディープコーディングネットワーク、多層カーネルマシンまたはディープQネットワークが挙げられる。
機械学習では、畳み込みニューラルネットワーク(CNN)は視覚心像および他の自然信号を分析するのに適用可能な順伝播型人工ニューラルネットワークのクラスである。CNNは入力および出力層ならびに複数の隠れ層からなる。CNNの隠れ層は典型的には畳み込み層、プーリング層、全結合層および正規化層からなる。畳み込み層は畳み込み動作を入力に適用し、その結果を次の層に送る。畳み込みは刺激に対する個々のニューロンの応答を模倣する。各畳み込みニューロンはその受容野のためにのみデータを処理する。
畳み込み動作は、全結合順伝播型ネットワークと比較した場合に自由パラメータの減少を可能にする。特に所与のカーネルをタイリングすることにより、画像サイズに関わらず固定数のパラメータを学習させることが可能になる。これは同様に、所与のネットワークのためのメモリフットプリントを減らす。
畳み込み層のパラメータは、小さい受容野を有するが入力ボリュームの全深さを通って延在する学習可能なフィルタ(またはカーネル)のセットからなる。フォワードパスの間に、各フィルタは入力ボリュームの幅および高さにわたって畳み込まれ、フィルタのエントリと入力との間でドット積を計算し、そのフィルタの2次元活性化マップを作成する。結果として、そのネットワークは、その入力においていくつかの空間位置でいくつかの特定の種類の特徴を検出した場合に活性化するフィルタを学習する。
例示的な畳み込みでは、カーネルは複数の重みw…wを含む。当然のことながら、ここに提供されているサイズは単なる例示であり、本明細書に記載されているように任意のカーネル寸法を使用してもよい。カーネルを入力(例えば画像)の各タイルに適用する。各タイルの結果は特徴マップの要素である。当然のことながら、複数の特徴マップを生成するために複数のカーネルを同じ入力に適用してもよい。
全てのカーネルのために特徴マップを積み重ねて畳み込み層の出力ボリューム全体を形成する。従って出力ボリュームにおける全てのエントリは、入力における小さい領域を見て同じ特徴マップにおいてニューロンとパラメータを共有するニューロンの出力として解釈することもできる。
畳み込みニューラルネットワークは、ハードウェアCNNアクセラレータおよびGPUを含む様々なハードウェアに実装してもよい。
次に図2を参照すると、本開示の実施形態に係る肺高血圧症を検出するための方法を示すフローチャートが提供されている。201では、対象の電圧-時間データを受信する。電圧-時間データは心電計の複数のリードの電圧データを含む。202では、電圧-時間データから特徴ベクトルを生成する。203では、特徴ベクトルを事前訓練済み学習システムに提供する。204では、対象における肺高血圧症の有無の指示を事前訓練済み学習システムから受信する。
次に図3を参照すると、計算ノードの例の概略図が示されている。計算ノード10は好適な計算ノードの単に一例であり、本明細書に記載されている実施形態の使用または機能性の範囲に関していかなる限定をも示唆するものではない。それにも関わらず、計算ノード10は上に記載されている機能性のいずれかを実装および/または実行することができる。
計算ノード10には、数多くの他の汎用もしくは専用計算システム環境または構成と共に動作するコンピュータシステム/サーバ12が存在する。コンピュータシステム/サーバ12と共に使用するのに適し得る周知の計算システム、環境および/または構成の例としては、限定されるものではないが、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、シッククライアント、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能な家庭用電化製品、ネットワークPC、ミニコンピュータシステム、メインフレームコンピュータシステム、および上記システムまたは装置のいずれかを備える分散型クラウドコンピューティング環境などが挙げられる。
コンピュータシステム/サーバ12は、コンピュータシステムによって実行されるプログラムモジュールなどのコンピュータシステム実行可能命令の一般的な文脈において記載されている場合がある。一般にプログラムモジュールは、特定のタスクを実行するか特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、ロジックおよびデータ構造などを含んでもよい。コンピュータシステム/サーバ12は、タスクが通信ネットワークを介してリンクされている遠隔処理装置によって実行される分散型クラウドコンピューティング環境で実行されてもよい。分散型クラウドコンピューティング環境では、プログラムモジュールはメモリ記憶装置などのローカルおよび遠隔コンピュータシステム記憶媒体の両方に位置していてもよい。
図3に示すように、計算ノード10のコンピュータシステム/サーバ12は汎用計算装置の形態で示されている。コンピュータシステム/サーバ12のコンポーネントとしては、限定されるものではないが、1つ以上のプロセッサまたは処理装置16、システムメモリ28、およびシステムメモリ28などの各種システムコンポーネントをプロセッサ16に繋げるバス18が挙げられる。
バス18は、メモリバスまたはメモリコントローラ、周辺バス、アクセラレイティッド・グラフィックス・ポート、および様々なバスアーキテクチャーのいずれかを使用するプロセッサもしくはローカルバスなどの何種類かのバス構造のうちのいずれかの1つ以上を表す。例としてであって限定としてではないが、そのようなアーキテクチャーとしては、工業標準アーキテクチャー(ISA)バス、マイクロチャネルアーキテクチャー(MCA)バス、拡張ISA(EISA)バス、ビデオエレクトロニクススタンダーズアソシエーション(VESA)ローカルバス、周辺機器相互接続(PCI)バス、周辺機器相互接続エクスプレス(PCIe)およびアドバンストマイクロコントローラバスアーキテクチャー(AMBA)が挙げられる。
コンピュータシステム/サーバ12は典型的に様々なコンピュータシステム読み取り可能媒体を備える。そのような媒体は、コンピュータシステム/サーバ12によってアクセス可能な任意の利用可能な媒体であってもよく、揮発性および不揮発性媒体、取外し可能および取外し不可能な媒体の両方を含む。
システムメモリ28は、ランダムアクセスメモリ(RAM)30および/またはキャッシュメモリ32などの揮発性メモリの形態のコンピュータシステム読み取り可能媒体を含むことができる。コンピュータシステム/サーバ12は、他の取外し可能/取外し不可能な揮発性/不揮発性コンピュータシステム記憶媒体をさらに備えてもよい。単なる一例として、記憶システム34は、取外し不可能な不揮発性磁気媒体(図示されておらず、典型的には「ハードドライブ」と呼ばれる)に読み書きするために設けることができる。図示されていないが、取外し可能な不揮発性磁気ディスク(例えば、「フロッピディスク」)に読み書きするための磁気ディスクドライブ、およびCD-ROM、DVD-ROMまたは他の光媒体などの取外し可能な不揮発性光ディスクに読み書きするための光ディスクドライブを設けることができる。そのような場合には、それぞれを1つ以上のデータ媒体インタフェースによってバス18に接続することができる。以下にさらに示され、かつ記載されているように、メモリ28は、本開示の実施形態の機能を実行するように構成されたプログラムモジュールのセット(例えば少なくとも1つ)を有する少なくとも1つのプログラム製品を含んでもよい。
プログラムモジュール42のセット(少なくとも1つ)を有するプログラム/ユーティリティ40は、例としてであって限定としてではないが、メモリ28ならびにオペレーティングシステム、1つ以上のアプリケーションプログラム、他のプログラムモジュールおよびプログラムデータに記憶されていてもよい。オペレーティングシステム、1つ以上のアプリケーションプログラム、他のプログラムモジュールおよびプログラムデータのそれぞれまたはそれらのいくつかの組み合わせは、ネットワーキング環境の実装を含んでもよい。プログラムモジュール42は一般に、本明細書に記載されている実施形態の機能および/または方法論を実行する。
またコンピュータシステム/サーバ12は、キーボード、ポインティングデバイス、ディスプレイ24などの1つ以上の外部装置14、ユーザがコンピュータシステム/サーバ12と対話するのを可能にする1つ以上の装置、および/またはコンピュータシステム/サーバ12が1つ以上の他の計算装置と通信するのを可能にする任意の装置(例えば、ネットワークカード、モデムなど)と通信していてもよい。そのような通信は入力/出力(I/O)インタフェース22を介して行うことができる。なおさらに、コンピュータシステム/サーバ12はネットワークアダプタ20を介して、ローカルエリアネットワーク(LAN)、一般的なワイドエリアネットワーク(WAN)および/または公衆ネットワーク(例えばインターネット)などの1つ以上のネットワークと通信することができる。図示されているように、ネットワークアダプタ20は、バス18を介してコンピュータシステム/サーバ12の他のコンポーネントと通信する。図示されていないが、他のハードウェアおよび/またはソフトウェアコンポーネントをコンピュータシステム/サーバ12と共に使用することができることを理解すべきである。例としては、限定されるものではないが、マイクロコード、デバイスドライバ、冗長処理装置、外部ディスクドライブアレイ、RAIDシステム、テープドライブおよびデータアーカイブ記憶システムなどが挙げられる。
本開示はシステム、方法および/またはコンピュータプログラム製品として具体化してもよい。例えば本発明のいくつかの態様では、肺高血圧症の検出のためのコンピュータプログラム製品であって、それと共に具体化されているプログラム命令を有するコンピュータ可読記憶媒体を含み、プログラム命令はプロセッサによって実行可能であり、心エコー図からの複数のリードの電圧データを含む対象の電圧-時間データを受信する工程と、電圧-時間データから特徴ベクトルを生成する工程と、特徴ベクトルを事前訓練済み学習システムに提供する工程と、事前訓練済み学習システムから対象における肺高血圧症の有無の指示を受信する工程とを含む方法をプロセッサに実行させる、コンピュータプログラム製品が本明細書において提供される。特徴ベクトルを生成する工程は、複数のリードの電圧データに基づいてスペクトログラムを生成することを含んでもよい。いくつかの実施形態では、特徴ベクトルを生成する工程は複数のリードの電圧データを複数のサブセットにグループ化することを含む。
いくつかの実施形態では、そのようなコンピュータプログラム製品は、対象の人口統計学的情報を受信する工程をさらに含み、ここでは特徴ベクトルを生成する工程は、人口統計学的情報を特徴ベクトルに追加することを含む。いくつかのそのような実施形態では、学習システムは畳み込みニューラルネットワークを含む。そのような畳み込みニューラルネットワークは、少なくとも1つの残差接続を含んでいてもよい。
いくつかの実施形態では、対象の電圧-時間データは心電計から受信される。さらなる実施形態では、対象の電圧-時間データは電子医療記録から受信される。
いくつかの実施形態では、コンピュータプログラム製品は、対象に関連づけられた健康記録への記憶のために電子健康記録システムに指示を提供する工程をさらに含む。いくつかの実施形態では、本システムはユーザへの表示のために計算ノードに指示を与える工程をさらに含む。
本明細書において提供されるコンピュータプログラム製品は、プロセッサに本開示の態様を実行させるために、コンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体を含んでもよい。
コンピュータ可読記憶媒体は、命令実行装置によって使用するための命令を保持および記憶することができるタンジブルデバイスであってもよい。コンピュータ可読記憶媒体は、例えば限定されるものではないが、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置または上記の任意の好適な組み合わせであってもよい。コンピュータ可読記憶媒体のより具体的な例の非包括的リストは、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラム可能リードオンリーメモリ(EPROMまたはフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピディスク、パンチカードまたは命令が記録されている溝の中の隆起構造体などの機械的に符号化された装置、および上記の任意の好適な組み合わせを含む。本明細書で使用されるコンピュータ可読記憶媒体はそれ自体が、電波または他の自由に伝搬する電磁波、導波管または他の伝送媒体を通って伝搬する電磁波(例えば、光ファイバーケーブルを通過する光パルス)または電線を通って伝送される電気信号などの一時的信号であると解釈されるべきではない。
本明細書に記載されているコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各自の計算/処理装置に、あるいはネットワーク、例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワークおよび/または無線ネットワークを介して外部コンピュータまたは外部記憶装置にダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータおよび/またはエッジサーバを含んでもよい。各計算/処理装置内のネットワークアダプタカードまたはネットワークインタフェースは、コンピュータ可読プログラム命令をネットワークから受信して、各自の計算/処理装置内のコンピュータ可読記憶媒体への記憶のためにコンピュータ可読プログラム命令を転送する。
本開示の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャー(ISA)命令、機械命令、機械依存命令(machine dependent instruction)、マイクロコード、ファームウェア命令、状態設定データ(state-setting data)、あるいは、スモールトークまたはC++などのオブジェクト指向プログラミング言語および「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語などの1つ以上のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかであってもよい。コンピュータ可読プログラム命令は、全体的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、独立型ソフトウェアパッケージとして、部分的にユーザのコンピュータ上であって部分的に遠隔コンピュータ上で、あるいは全体的に遠隔コンピュータまたはサーバ上で実行されてもよい。後者のシナリオでは、遠隔コンピュータはローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)などの任意の種類のネットワークを介してユーザのコンピュータに接続されていてもよく、あるいは、その接続は外部コンピュータに対してなされてもよい(例えば、インターネットサービスプロバイダを用いてインターネットを通して)。いくつかの実施形態では、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)またはプログラマブルロジックアレイ(PLA)などの電子回路は、本開示の態様を実施するためにコンピュータ可読プログラム命令の状態情報を利用して電子回路を個別化することによってコンピュータ可読プログラム命令を実行してもよい。
本開示の態様は、本開示の実施形態に係る方法、装置(システム)およびコンピュータプログラム製品のフローチャート図および/またはブロック図を参照しながら本明細書に記載されている。当然のことながら、フローチャート図および/またはブロック図の各ブロックならびにフローチャート図および/またはブロック図のブロックの組み合わせは、コンピュータ可読プログラム命令によって実行することができる。
コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令がフローチャートおよび/またはブロック図のブロックに明記されている機能/動作を実装するための手段を作り出すように、これらのコンピュータ可読プログラム命令を汎用コンピュータ、専用コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサに与えて機械を作製してもよい。また、命令が記憶されているコンピュータ可読記憶媒体がフローチャートおよび/またはブロック図のブロックに明記されている機能/動作の態様を実装する命令を含む製造品を含むように、これらのコンピュータ可読プログラム命令はコンピュータ、プログラム可能なデータ処理装置および/または特定の方法で機能するための他の装置に指示することができるコンピュータ可読記憶媒体に記憶されていてもよい。
またコンピュータ、他のプログラム可能な装置または他の装置上で実行される命令がフローチャートおよび/またはブロック図のブロックに明記されている機能/動作を実行するように、コンピュータ可読プログラム命令をコンピュータ、他のプログラム可能なデータ処理装置、または一連の動作工程をコンピュータ、他のプログラム可能な装置または他の装置上で実行させるための他の装置にロードして、コンピュータに実装されるプロセスを生成してもよい。
図中のフローチャートおよびブロック図は、本開示の様々な実施形態に係るシステム、方法およびコンピュータプログラム製品の可能な実装のアーキテクチャー、機能性および動作を示す。この点に関しては、フローチャートまたはブロック図の各ブロックは、明記されている論理機能を実装するための1つ以上の実行可能命令を含む命令のモジュール、セグメントまたは一部を表してもよい。いくつかの他の実装では、ブロックに記載されている機能は図に記載されている順序以外で行われてもよい。例えば連続して示されている2つのブロックは、実際には実質的に同時に実行されてもよく、あるいは、それらのブロックは時として関連する機能性に応じて逆の順序で実行されてもよい。ブロック図および/またはフローチャート図の各ブロックならびにブロック図および/またはフローチャート図のブロックの組み合わせは、明記されている機能または動作を実行するか専用ハードウェアおよびコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実行することができることにも留意されたい。
本開示の各種実施形態の説明を例示のために提供してきたが、それらは網羅的であることおよび開示されている実施形態に限定されることを意図するものではない。記載されている実施形態の範囲および趣旨から逸脱しない多くの修正および変形が当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、実際の適用または市場で見出される技術を凌ぐ技術改良を最も良く説明したり、他の当業者が本明細書に開示されている実施形態を理解することができるようにしたりするために選択された。
実施例1:コホート特定および拡張キュレーション
RHC中に測定した平均肺動脈圧(mPAP)および心エコー検査中に測定した三尖弁逆流速度(TRV)の組み合わせを用いて、予備モデルの開発のために多様なセットのコホートを生成した(表1)。RHCはPH診断のためのゴールドスタンダードであり、21mmHg以上のmPAPはPHを意味する(最近では25mmHgの過去の閾値よりも低くなっている)。TRV測定値はそれほど決定的なものではなく、すなわち2.8m/s以下のTRVはPHの不存在を示し、3.4m/s以上のTRVはその存在を示すが、TRVのみを用いた場合に診断が決定的なものではない中間領域が存在し、他の測定値も検討しなければならない。
さらに、臨床ノートから抽出された診断を用いて1つのコホートを生成し、エコー測定値と組み合わせて拡張キュレーションの可能性を試験した(コホート7)。このコホートは、より少ないPH患者数からなる、心エコー測定値を有する患者のサブセットを用いて生成した。この目的に向けた第1の工程として、Mayoの医師は1,630人の患者の陽性対照コホートを提供し、以後これをMayoのPHコホートと呼ぶ。このコホートを拡大させるために、「肺高血圧症」という用語を含むさらなる19,504人の患者を彼らのノート内で特定し、以後これを潜在的PHコホートと呼ぶ。BERTモデルをPH診断に関する感情を分類するように訓練した。このモデルを使用して、MayoのPHコホートおよび潜在的PHコホートにおいて真陽性患者と陰性患者とを識別し、かつそのようなモデルはさらなる疾患および特徴まで拡張することができた。
実施例2:診断のためのBERTモデルの訓練
診断のためのBERTモデルの作成に向けた第1の工程として、nference(登録商標)Signalsアプリケーションを使用して「肺高血圧症」に最も密接に関連づけられた上位250個の表現型を決定し、臨床ノートのMayoコーパスからのセンテンスをこれらの表現型のために抽出した。nferenceのMDおよびPhDレベルの科学者によってセンテンスをカテゴリー、例えば陽性(YES)、陰性(NO)、疑いあり(MAYBE)および他のコンテキスト(OTHER)に手動で分類し、例が表2に示されている。
Figure 2023553586000003
任意に、さらなるカテゴリーをこの訓練セットに追加してモデル粒度の向上を支持してもよく、例えば家族歴および/または投薬から生じる疾患リスクを分別する(両方とも上に例示されているようにOTHERによって包含される)。
センテンスのタグ付けのために、効率を高めると共に複数のユーザ間でなされた変化も追跡するユーザインタフェースを備えたDeep Model Builderアプリケーションを開発した。11,433個のセンテンスを用いて第1のモデルを生成し、これは、全センテンスに対して正確に予測されたモデルをラベルの割合として定めた0.85の全体正解率を有していた。Deep Model Builderは、モデルが不正確に分類されたというタグ付けされたセンテンスをユーザが見直すのを可能にするだけでなく、タグ付けされていないセンテンスのセットを用いてモデルを実行するためにも使用することができ、その時点の「拡張キュレーション」の下流での効率を再度高める。表3に示すように、拡張キュレーションの複数のサイクルによりモデルの正解率が0.85から0.936に向上した。
Figure 2023553586000004
上記モデルは250個の異なるPH関連表現型を用いて訓練したため、このモデルを訓練するために使用したセンテンスは主として心臓病、呼吸器系および代謝異常に関連する疾患について考察するものであった。モデルによって既に取り込まれている表現型の幅を考慮すると、最小の再訓練(約1000~3000個のセンテンス)により、COVID-19から腫瘍の範囲まで、さらなる治療領域まで拡張させるのに十分な程にモデルがロバストであることを示唆している。いくつかの領域は、その特定の分野において特定の言語またはコンテキストを取り込むためにさらなるキュレーションを必要とする。
新しい特徴またはより特定された関連付けを取り巻くコンテキストを抽出するために、新しいモデルを訓練する必要がある。この場合、拡張キュレーションが、あらゆる使用事例のために特定の改良モデルを作成するための柔軟性を可能にするという理由から、重要となる。従って、手動でのキュレーションのために構造テキストデータにより必要なフィールドを予め定めなければならない他の方法は、開示されている方法によって目的とする任意の特徴のために新しいモデルを訓練することができる速度に対応することができない。
実施例3:コホート選択のための診断モデルの使用
さらなるPH患者を特定するために潜在的PHコホートに対してBERTモデルを実行する前に、それをMayoのPHコホートに対して実行して陽性対照についてセンテンス感情分析の分布を評価した。ここでは、「肺高血圧症」という用語を含むこれらの患者のための約180,000個のセンテンスをそのモデルによって分類した。図4に示すように、平均して68%のセンテンスがYES感情として、2%のみがNOとして、7%がMAYBEとして、23%がOTHERとして分類され、本発明者らのモデルと陽性のコホートで優れた検証を示す。
上に示されている感情分析は、MayoのPHコホートにおいてPHを有していない患者を彼らの臨床ノートに従って特定するためにも使用した。臨床ノートが提供されている1,630人の患者のうち、感情分析およびその後の手動での見直しにより、このコホートにおいてPHを有していない35人の患者を特定した。この半自動化ワークフローの例が図5に示されている。ここでは当該分布はPH陰性の患者を含み、NO分類ではより長いテールが生じている。この特定のテール内の25人の患者について、Mayo環境内で構築されたnferenceアプリケーションを使用して、これらの患者のノートにおいて「肺高血圧症」という各記載を調べたところ、7人の患者がPHを有し、2人がPHの疑いがあり、16人がPHを有しないという結果となった。このコホート内のPHを有しない残りの19人の患者は、これまでの繰り返しにおいて特定された。MayoのPHコホートの2%超を表すこれらの35人の患者を除くことで、モデル性能について有意であることを証明することができた。
MayoのPHコホートに対して診断モデルを検証した後に、潜在的PHコホートの中の19,504人の患者について「肺高血圧症」を含むセンテンスを用いてそのモデルを実行した。図6に示すように、58%の平均YES感情はMayoのPHコホートよりも低いが、この結果は主として、YESセンテンスを含まない30%の患者によって説明することができる。同様に、ほぼ80%の患者がNO感情を含むセンテンスを有さず、これはnferenceがPH陽性対照セットを一桁の大きさで潜在的に増加させることができることを意味している。
これらのコホートにおける陽性および陰性のPH患者の識別を自動化するために、拡張キュレーションの結果および/または心エコー測定値、すなわちTRVおよび推定される右心房圧(RAP)の組み合わせを用いて、様々なロジスティック回帰モデルを試験した。拡張キュレーションにより患者を記述するために使用した特徴は、YES、NO、MAYBEおよびOTHERの感情を含むセンテンスのパーセントならびにノートごとのPH発生の数を含んでいた。TRVおよびRAPのために使用した特徴は、各測定の平均、中央、最小、最大および標準偏差を含んでいた。陽性の診断および心エコー測定値を有する1556人の患者の陽性対照コホートをMayoのPHコホートから生成した。陰性対照コホートは、TRVおよびRAP測定値を有する患者の記録の手動でのキュレーションにより生成した。10分割交差検証および90:10の訓練/試験分割を用いてモデルを評価した。
図7に示すように、拡張キュレーションを心エコー測定値と組み合わせることにより、いずれか単独の場合よりも良好に機能する。さらに、拡張キュレーションは心エコー測定値単独よりも非常に良好に機能にする。拡張キュレーションの目標は患者の記録の総体的結果に対する医師の解釈を取り込むことであるため、これは期待されていたものである。
200人の患者をホールドアウトセットとしてランダムにサンプリングし、彼らの記録を手動でキュレートしてその患者がPHであると診断されたか否かを決定した。1人の患者が同意を撤回し、その後に除外された。残りの199人の患者のうち、191人、すなわち95.9%がロジスティック回帰モデルにより正確に分類された。
実施例4:アルゴリズムの開発および結果
各コホートについて2つの異なる時間窓、すなわち診断日の前後1ヶ月のいずれか(診断窓)および診断の6~18ヶ月前(予防窓)において予備モデルを評価した。予備モデルでは、陰性の患者の全てのECGを検討した。更新されたモデルでは、陰性の患者のECGは、前記患者を分類するために使用した最後の手順の前のものに限定した。患者が18歳よりも若い年齢である時に測定された全てのECGは除外した。各コホートについて、患者を訓練(48%)、試験(40%)および検証(12%)セットに分けた。
2つの性能指標、すなわち患者に関する曲線下面積(AUC)および年齢-性別に関するAUCを使用して各モデルを評価した。患者に関するAUCは患者ごとに1つのECGをランダムにサンプリングし、50回のランダムな実行の平均を報告した。患者に関するAUCは、より多くのECGを有する患者、すなわち潜在的により病気傾向にある患者が過剰に含められないことを保証する。年齢-性別に関するAUCは、ECGが行われた時間において年齢および性別に一致させた各陽性のECGに対して4つの陰性のECGをランダムにサンプリングした。4つの陰性のECGが入手可能でない場合には、1:4の陽性-陰性ECG比を維持するように陽性のECGをアンダーサンプリングした。繰り返して言うが、50回のランダムな実行の平均が報告される。ここでの利点は、年齢および性別の分布が陽性および陰性のコホート間で維持されるという点である。
12リードの電圧-時間信号を1つの入力として、3リードからなる4つのグループ、および個々のリードをそれぞれ用いて、単一分岐、4分岐、および12分岐の1D畳み込みニューラルネットワーク(CNN)を試験するアルゴリズムを開発した。他の様々なパラメータは、入力として年齢および性別、さらなる2Dスペクトログラム、残差接続および窓サイズ(すなわち、10秒間の窓または重複する2秒間の窓)を含んでいた(予備モデルからの結果については表4を参照)。最適なモデルアーキテクチャーは、残差接続および重複する2秒間の窓を使用する単一分岐の1DのCNNを用いたものであると分かった(図8:更新されたモデルについて示されている)。年齢および性別は入力として必要とされず、2Dスペクトログラムを含めても性能は劇的に上昇しなかった(データは示されていない)。また洞調律のみを含むECGを用いて、またはペースメーカーを使用している患者を除外することによってもモデルを訓練したが、いずれの修正も性能を劇的に向上させなかった(予備モデルからの結果については表5および表6を参照)。最後に本発明者らは、予防窓からのECGに対して診断モデルを試験し(図9:更新されたモデルについて示されている)、これらのECGでは診断モデルが予防モデルよりも良好に機能することが分かった(データは示されていない)。コホート3に対して訓練した予備診断モデルは最も性能の良いモデルのうちの1つであり、さらなる研究のために使用した。本発明者らは更新された診断モデルを使用して、6ヶ月の窓において診断の0~5年前からECGを試験した(図10:更新されたモデルについて示されている)。
実施例5:肺高血圧症に関連する早期ECG信号を説明することができる推定遺伝子バイオマーカーの特定
肺高血圧症を診断するためのECGをベースとするモデルが診断日の最長5年前に肺高血圧症患者を特定する際に性能を維持するという発見は、ECG信号が肺高血圧症への患者の長期感受性に関する情報を提供するということを暗示している。理論によって縛られたくはないが、これについての1つの可能な説明は、患者を肺高血圧症に罹患させやすくする特定の生殖系列遺伝子突然変異が心臓電気生理の調節もしており、従って肺高血圧症診断のかなり前にECGにおいて検出可能であるということである。nferX(登録商標)プラットフォームを用いて、肺高血圧症に関連づけられた遺伝子の突然変異を特定し、その後にこれらの遺伝子がECG信号を調節するという概念を支持する証拠をトライアンギュレーションした。2種類のカリウムチャネルKCNK3およびKCNA5、ならびにCAV1、SMAD4、GJB2、TBX4を含む4つのさらなる遺伝子を含む6種類の候補遺伝子を特定した(表7を参照)。
nferX Human Geneticsアプリケーションにより、26種の遺伝子が肺高血圧症に関連することが明らかにされている(図11)。これらの遺伝子のうち、KCNK3およびKCNA5の2つは心臓組織において発現されるカリウムチャネルである(図12)。カリウムチャネルは細胞活動電位への公知の寄与体であり、かつ心臓活動電位はECGによって観察される信号の基礎であるため、本発明者らはさらなる調査のためにKCNK3およびKNCA5を優先した。nferX Single Cellアプリケーションにより、単一細胞レベルにおいてKCNK3およびKCNA5は神経および心臓細胞型においてそれぞれ強く発現されることが実証されている(図13)。より低い発現レベルで、KNCK3発現は心臓の細胞型においても観察されている(図示せず)。最後に、nferX Signalsアプリケーションにより、KCNK3およびKCNA5の両方が心臓電気生理学に影響を与えるという文献証拠が確認されている(図14)。
本発明者らは、肺高血圧症に関連づけられている突然変異を含むものとしてnferX Human Geneticsによって特定された非イオンチャネル遺伝子をさらに調査した。これらの遺伝子のうちの8つ、CAV1、SMAD4、GJB2、ACVRL1、SMAD4、BMPR1A、BMPR2およびTBX4は、「心電図」、「ECG」、「心臓活動電位」および「心伝導」などの心臓電気生理学に関連づけられている関連用語との顕著な関連性を有する。nferX RNA ExplorerおよびnferX Single Cellアプリケーションを使用して、これらの遺伝子を心臓と結びつける証拠を蓄積した。これらの遺伝子は、カリウムチャネル遺伝子に加えて、陽性のECGをベースとする予測試験を考慮して肺高血圧症の診断をさらに支持する少なくとも10個の遺伝子からなる遺伝子パネルの一部として機能する可能性がある。
実施例6:トランスフォーマー層を含まないTime Series Convolutionニューラルネットワークアーキテクチャー
7層「Convolution Transformer」ニューラルネットワークアーキテクチャーを設計し、これは12チャネルECGを受信し、かつ上に記載されているように肺高血圧症の存在の指示を出力する(図15を参照)。
実施例7:トランスフォーマー層を含む「Convolution Transformer」ニューラルネットワークアーキテクチャー
実施例6のTime Series Convolutionモデルと比較してECG信号の異なる部分間での相互作用を増加させるために、「Convolution Transformer」と呼ばれる他のニューラルネットワークアーキテクチャーが提供されている。それは畳み込みニューラルネットワークを用いてECG波形のより小さい部分に対して固定サイズのエンコーディングを生成した。一連のそのような生成されたエンコーディングはトランスフォーマーネットワークに送られて、図16のネットワークアーキテクチャー図に示されているように予測を生成する。2秒の切り取りの代わりに5秒の切り取りを使用することにより、これらのより長い相互作用が可能になった。
実施例8:データ拡張
訓練段階中にデータ拡張を使用して、過学習へのニューラルネットワークの感受性を低下させた。下のパラメータA~Fのうちの1つをランダムに適用することにより訓練データセットを拡張させ、訓練のみの間は40%の確率であった。図17(A~E)も参照されたい。
A.信号全体において時間の一部をマスキングすること
B.0.5~50Hzの周波数のみを可能にすること
C.いくつかのズームレベルにより信号を引き延ばすこと
D.異なるリードにおいて小さい電圧で電圧をシフトさせること
E.1および50Hzで周波数帯を下げること
F.小さいリードのセットを組み換えること
トランスフォーマー層を含む場合と含まない場合のCNNの拡張試験の結果が表8に示されている。
Figure 2023553586000009
全ての刊行物(本明細書で言及されている特許、特許出願公開および配列受入番号を含む)は、あたかも各個々の刊行物が参照により本明細書に組み込まれるために具体的に、かつ個々に示されているかのように、それら全体が参照により本明細書に組み込まれる。矛盾する場合は任意の定義を含む本出願が優先される。
当業者であれば、本明細書に記載されている本発明の具体的な実施形態との多くの均等物を認識しているか、日常的な実験法のみを用いて確認することができるであろう。そのような均等物は、以下の特許請求の範囲によって包含されることが意図されている。

Claims (33)

  1. 心電計の複数のリードの電圧データを含む、対象の電圧-時間データを受信する工程と、
    前記電圧-時間データから特徴ベクトルを生成する工程と、
    前記特徴ベクトルを事前訓練済み学習システムに提供する工程と、
    前記事前訓練済み学習システムから前記対象における肺高血圧症の有無の指示を受信する工程と
    を含む方法。
  2. 前記特徴ベクトルを生成する工程は、前記複数のリードの前記電圧データに基づいてスペクトログラムを生成することを含む、請求項1に記載の方法。
  3. 前記特徴ベクトルを生成する工程は、前記複数のリードの前記電圧データを複数のサブセットにグループ化することを含む、請求項1に記載の方法。
  4. 前記対象の人口統計学的情報を受信する工程をさらに含み、前記特徴ベクトルを生成する工程は前記人口統計学的情報を前記特徴ベクトルに追加することを含む、請求項1に記載の方法。
  5. 前記対象のゲノム情報を受信する工程をさらに含み、前記特徴ベクトルを生成する工程は前記ゲノム情報を前記特徴ベクトルに追加することを含む、請求項1に記載の方法。
  6. 前記学習システムは畳み込みニューラルネットワークを含む、請求項1に記載の方法。
  7. 前記畳み込みニューラルネットワークは少なくとも1つの残差接続を含む、請求項6に記載の方法。
  8. 前記対象の電圧-時間データは心電計から受信される、請求項1に記載の方法。
  9. 前記対象の電圧-時間データは電子医療記録から受信される、請求項1に記載の方法。
  10. 前記対象に関連づけられた健康記録への記憶のために電子健康記録システムに指示を提供する工程をさらに含む、請求項1に記載の方法。
  11. ユーザへの表示のために計算ノードに指示を与える工程をさらに含む、請求項1に記載の方法。
  12. 複数のリードを含む心電計と、
    それと共に具体化されているプログラム命令を有するコンピュータ可読記憶媒体を備えた計算ノードであって、前記プログラム命令は、前記計算ノードのプロセッサによって実行可能であり、
    心エコー図からの前記複数のリードの電圧データを含む、対象の電圧-時間データを受信する工程と、
    前記電圧-時間データから特徴ベクトルを生成する工程と、
    前記特徴ベクトルを事前訓練済み学習システムに提供する工程と、
    前記事前訓練済み学習システムから前記対象における肺高血圧症の有無の指示を受信する工程と
    を含む方法を前記プロセッサに実行させる、
    計算ノードと
    を備えるシステム。
  13. 前記特徴ベクトルを生成する工程は、前記複数のリードの前記電圧データに基づいてスペクトログラムを生成することを含む、請求項12に記載のシステム。
  14. 前記特徴ベクトルを生成する工程は、前記複数のリードの前記電圧データを複数のサブセットにグループ化することを含む、請求項12に記載のシステム。
  15. 前記対象の人口統計学的情報を受信する工程をさらに含み、前記特徴ベクトルを生成する工程は前記人口統計学的情報を前記特徴ベクトルに追加することを含む、請求項12に記載のシステム。
  16. 前記対象のゲノム情報を受信する工程をさらに含み、前記特徴ベクトルを生成する工程は前記ゲノム情報を前記特徴ベクトルに追加することを含む、請求項12に記載のシステム。
  17. 前記学習システムは畳み込みニューラルネットワークを含む、請求項12に記載のシステム。
  18. 前記畳み込みニューラルネットワークは少なくとも1つの残差接続を含む、請求項16に記載のシステム。
  19. 前記対象の電圧-時間データは心電計から受信される、請求項12に記載のシステム。
  20. 前記対象の電圧-時間データは電子医療記録から受信される、請求項12に記載のシステム。
  21. 前記対象に関連づけられた健康記録への記憶のために電子健康記録システムに指示を提供する工程をさらに含む、請求項12に記載のシステム。
  22. ユーザへの表示のために計算ノードに指示を与える工程をさらに含む、請求項12に記載のシステム。
  23. 肺高血圧症の検出のためのコンピュータプログラム製品であって、
    それと共に具体化されているプログラム命令を有するコンピュータ可読記憶媒体を含み、
    前記プログラム命令は、プロセッサによって実行可能であり、
    心エコー図からの前記複数のリードの電圧データを含む、対象の電圧-時間データを受信する工程と、
    前記電圧-時間データから特徴ベクトルを生成する工程と、
    前記特徴ベクトルを事前訓練済み学習システムに提供する工程と、
    前記事前訓練済み学習システムから前記対象における肺高血圧症の有無の指示を受信する工程と
    を含む方法を前記プロセッサに実行させる、
    コンピュータプログラム製品。
  24. 前記特徴ベクトルを生成する工程は、前記複数のリードの前記電圧データに基づいてスペクトログラムを生成することを含む、請求項23に記載のコンピュータプログラム製品。
  25. 前記特徴ベクトルを生成する工程は、前記複数のリードの前記電圧データを複数のサブセットにグループ化することを含む、請求項23に記載のコンピュータプログラム製品。
  26. 前記対象の人口統計学的情報を受信する工程をさらに含み、前記特徴ベクトルを生成する工程は前記人口統計学的情報を前記特徴ベクトルに追加することを含む、請求項23に記載のコンピュータプログラム製品。
  27. 前記対象のゲノム情報を受信する工程をさらに含み、前記特徴ベクトルを生成する工程は前記ゲノム情報を前記特徴ベクトルに追加することを含む、請求項23に記載のコンピュータプログラム製品。
  28. 前記学習システムは畳み込みニューラルネットワークを含む、請求項23に記載のコンピュータプログラム製品。
  29. 前記畳み込みニューラルネットワークは少なくとも1つの残差接続を含む、請求項27に記載のコンピュータプログラム製品。
  30. 前記対象の電圧-時間データは心電計から受信される、請求項23に記載のコンピュータプログラム製品。
  31. 前記対象の電圧-時間データは電子医療記録から受信される、請求項23に記載のコンピュータプログラム製品。
  32. 前記対象に関連づけられた健康記録への記憶のために電子健康記録システムに指示を提供する工程をさらに含む、請求項23に記載のコンピュータプログラム製品。
  33. ユーザへの表示のために計算ノードに指示を与える工程をさらに含む、請求項23に記載のコンピュータプログラム製品。

JP2023524175A 2020-10-14 2021-10-13 肺高血圧症の検出のための非侵襲的方法 Pending JP2023553586A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063091715P 2020-10-14 2020-10-14
US63/091,715 2020-10-14
PCT/US2021/054693 WO2022081646A1 (en) 2020-10-14 2021-10-13 Noninvasive methods for detection of pulmonary hypertension

Publications (1)

Publication Number Publication Date
JP2023553586A true JP2023553586A (ja) 2023-12-25

Family

ID=81209434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023524175A Pending JP2023553586A (ja) 2020-10-14 2021-10-13 肺高血圧症の検出のための非侵襲的方法

Country Status (4)

Country Link
US (1) US20220189634A1 (ja)
EP (1) EP4228497A1 (ja)
JP (1) JP2023553586A (ja)
WO (1) WO2022081646A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023553586A (ja) * 2020-10-14 2023-12-25 エヌファレンス,インコーポレイテッド 肺高血圧症の検出のための非侵襲的方法
WO2023212297A1 (en) * 2022-04-29 2023-11-02 Attia Itzhak Zachi Artificial-intelligence enhanced screening for cardiac amyloidosis by electrocardiography
WO2023224948A1 (en) * 2022-05-16 2023-11-23 Attia Itzhak Zachi Deep learning enabled electrocardiographic prediction of computer tomography-based high coronary calcium score (cac)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7106077B2 (ja) * 2016-09-22 2022-07-26 エヌフェレンス,インコーポレイテッド 意味的情報の可視化およびライフサイエンスエンティティ間の顕著な関連を示す時間的信号の推測のためのシステム、方法、およびコンピュータ可読媒体
US11623102B2 (en) * 2018-07-31 2023-04-11 Medtronic, Inc. Wearable defibrillation apparatus configured to apply a machine learning algorithm
JP2023553586A (ja) * 2020-10-14 2023-12-25 エヌファレンス,インコーポレイテッド 肺高血圧症の検出のための非侵襲的方法

Also Published As

Publication number Publication date
US20220189634A1 (en) 2022-06-16
WO2022081646A1 (en) 2022-04-21
EP4228497A1 (en) 2023-08-23

Similar Documents

Publication Publication Date Title
RU2703679C2 (ru) Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов
Elola et al. Deep neural networks for ECG-based pulse detection during out-of-hospital cardiac arrest
Kay et al. DropConnected neural networks trained on time-frequency and inter-beat features for classifying heart sounds
JP2023502983A (ja) 心臓のビデオを使用して患者のエンドポイントの予測を強化するためのディープニューラルネットワークのためのシステムおよび方法
JP2023553586A (ja) 肺高血圧症の検出のための非侵襲的方法
CN110459328B (zh) 临床监护设备
Batin et al. Artificial intelligence in life extension: from deep learning to superintelligence
Chantamit-O-Pas et al. Long short-term memory recurrent neural network for stroke prediction
Alshammri et al. Machine learning approaches to identify Parkinson's disease using voice signal features
Kaswan et al. AI-based natural language processing for the generation of meaningful information electronic health record (EHR) data
KR20220102634A (ko) 건강 관리 집단들의 관리에 대한 머신 러닝 접근법들을 위한 시스템들 및 방법들
Le et al. Detecting of a patient's condition from clinical narratives using natural language representation
Tay et al. The effect of sample age and prediction resolution on myocardial infarction risk prediction
WO2019132686A1 (ru) Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта
Khazaal et al. Predicting Coronary Artery Disease Utilizing Support Vector Machines: Optimizing Predictive Model
Wu et al. A deep learning method for predicting the COVID-19 ICU patient outcome fusing X-rays, respiratory sounds, and ICU parameters
RU2752792C1 (ru) Система для поддержки принятия врачебных решений
Barakat et al. Lessons learned on using high-performance computing and data science methods towards understanding the acute respiratory distress syndrome (ards)
WO2023031235A1 (en) Semi-supervised machine learning method and system suitable for identification of patient subgroups in electronic healthcare records
KR102049829B1 (ko) 피검체의 위험도를 평가하여 상기 위험도에 따라 상기 피검체를 분류하는 방법 및 이를 이용한 장치
Tang et al. A deep learning approach to handling temporal variation in chronic obstructive pulmonary disease progression
Tyagi et al. Data Imaging, Clinical Studies, and Disease Diagnosis using Artificial Intelligence in Healthcare
WO2023019022A1 (en) Machine-learning for processing lead-invariant electrocardiogram inputs
Sathiyaraj et al. Convergence of Big Data and Cognitive Computing in Healthcare
Stephens Deep Learning with SPECT Accurately Predicts Major Adverse Cardiac Events

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20230724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231211