JP2022514080A - 有害事象を発見するための自然言語処理の使用 - Google Patents

有害事象を発見するための自然言語処理の使用 Download PDF

Info

Publication number
JP2022514080A
JP2022514080A JP2021535564A JP2021535564A JP2022514080A JP 2022514080 A JP2022514080 A JP 2022514080A JP 2021535564 A JP2021535564 A JP 2021535564A JP 2021535564 A JP2021535564 A JP 2021535564A JP 2022514080 A JP2022514080 A JP 2022514080A
Authority
JP
Japan
Prior art keywords
word
clinical description
active region
clinical
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021535564A
Other languages
English (en)
Other versions
JP7475353B2 (ja
Inventor
チェン リュウ
アーマッド エル カテルジ
Original Assignee
アビオメド インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アビオメド インコーポレイテッド filed Critical アビオメド インコーポレイテッド
Publication of JP2022514080A publication Critical patent/JP2022514080A/ja
Application granted granted Critical
Publication of JP7475353B2 publication Critical patent/JP7475353B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/40ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management of medical equipment or devices, e.g. scheduling maintenance or upgrades
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

自然言語処理を使用してコンピュータプロセッサにより患者の臨床記述を自動的に分類するための方法が提供される。当該臨床記述は、患者を治療するための心室補助装置の使用に関連する。方法は、テキストを含む少なくとも1つの臨床記述を受け取る工程を含む。方法はまた次に、テキスト内の対象語の位置を決定する工程も含む。さらに方法は、アクティブ領域内の少なくとも1つの否定語の存在を判定する工程を含み、該アクティブ領域は、対象語を含む、対象語の直前および直後に存在するテキスト内の所定数の単語を含む。方法は、次いで、アクティブ領域内の少なくとも1つの身体部位語の存在を判定する工程を含む。最後に、方法は、アクティブ領域が否定語または身体部位語のどちらかを含む場合、臨床記述が無視されるべきであると判定する工程を含む。TIFF2022514080000005.tif80170

Description

関連出願の相互参照
本出願は、その内容全体が参照により本明細書に組み入れられる、2018年12月21日に出願された、米国仮出願第62/784,192号からの米国特許法第119条(e)の優先権の恩典を主張するものである。
背景
心血管疾患は、患者の生活の質を低下させる可能性がある。そのような疾患の心臓を治療するために、医薬品から機械的装置および移植に至るまで、様々な治療選択肢が開発されてきた。心臓ポンプシステムやカテーテルシステムなどの心室補助装置(VAD)が、心臓の治療において血行力学的補助を提供し、回復を促進するためによく使用される。心臓ポンプシステムの中には、心臓に経皮的に挿入され、心拍出量を補うために自己心と並行して動作することができるものもある。そのような心臓ポンプシステムには、マサチューセッツ州ダンバーズのAbiomed,Inc.によるImpella(登録商標)ファミリーの機器が含まれる。これらの医療手技の中には、治療中に患者に発生する有害事象につながり得るものがある。これは、機器の誤った使用、または準最適な機器構成に起因する可能性がある。
VADなどの医療機器を使用して患者に治療を施した後、患者に提供された治療の詳細な説明、およびそのような治療中の任意の臨床的適応が記録される。そのような記録は、従来、医療用の略語で手書きで書き込むか、またはコンピュータにタイプ入力されている。あるいは、治療の詳細が、音声をテキストに変換する機器(ディクタフォンや、音声認識ソフトウェアが動作しているラップトップマイクロホンなど)に提供され、テキストファイルとして格納される。そのようなファイルは、多くの場合、患者データリポジトリに格納され、患者の医療ファイルへのアクセスを必要とする他の臨床医に提供される。
通常、臨床医は、さらなる治療を決定する前に、患者が治療中に有害事象を経験したかどうかを判定しなければならない。例えば、有害事象には、(例えば、Impella(登録商標)ポンプを備えた新しいガイドワイヤーの使用による)患者を治療するためのVADの使用中に発生した可能性がある、出血、溶血および虚血が含まれる。そのような判定は、臨床記録を読み取り、検査して、治療中に何らかのそのような有害事象が発生したかどうかを手動で確認することを伴う。手動検査は、ある程度の自由度を伴う。例えば、臨床記述のテキストの特定の部分が見落とされたり、判読が困難であったりする場合もあり、または臨床記述の解釈が人によって異なる場合もある。さらに、治療計画(成功率など)の臨床兆候を取得するために、典型となる指標を取得するように臨床記述のリポジトリが解析される必要がある。多数の臨床記述の手動検査には時間がかかり、前述の自由度に起因するいくつかの誤りを伴う可能性がある。
臨床記述の解析を自動化する試みは、例えば、バギングおよびランダムフォレスト、ロジスティック回帰、ならびに回帰木などの自然言語前処理および機械学習の使用を伴う。そのようなアルゴリズムは複雑で再帰的であり、特にアルゴリズムが容易に収束しない場合、コンピューティングシステム上のプロセッサリソースを占有する。そのようなアルゴリズムを使用する機械学習はまた、多くの場合、機械モデルを信頼できるようになるまでに、訓練データのかなりの大きさのプールを必要とする。したがって、小さなデータリポジトリの場合、不十分な訓練データにより不安定な機械学習モデルが得られ、臨床記述の解析におけるその出力は信頼できないものとなる。
概要
本明細書に記載される方法およびシステムは、コンピューティング装置のプロセッサによる自然言語処理およびキーワード検索を使用して、臨床記述が有害事象を含む治療に関連するかどうかを判定する。方法は、テキストを含む少なくとも1つの臨床記述を受け取ることから開始する。プロセッサは、次いで、テキスト内の対象語の位置を決定する。プロセッサは、次いで、処理を進めて、(対象語を含む、対象語の直前および直後に存在するテキスト内の所定数の単語を含む)アクティブ領域内の少なくとも1つの否定語の存在を判定する。次に、プロセッサは、アクティブ領域内の少なくとも1つの身体部位語の存在を判定する。方法は、次いで、アクティブ領域が否定語または身体部位語のどちらかを含む場合、臨床記述が無視されるべきであると判定する。
臨床記述のテキスト内のキーワードを検索することによって、(訓練データを必要とする)機械学習アルゴリズムの訓練が必要とされず、それにより、コンピューティング装置のシステムリソースが解放される。本開示の方法およびシステムのキーワード検索の性質は、臨床記述の解析を行うコンピューティング装置のプロセッサを独占するものではない。
いくつかの実施態様では、方法は、単語トークンを生成するためにテキストを処理する工程、ある単語の活用形を含む単語トークンを判定およびグループ化する工程、ならびにグループ化された単語トークンを使用してテキストに対してキーワード検索を行う工程をさらに含む。他の実施態様では、方法は、アクティブ領域が否定語および身体部位語を含まない場合、臨床記述にフラグを立てる工程を含む。特定の実施態様では、方法は、臨床記述のヘッダにフラグを書き込む工程を含む。いくつかの実施態様では、アクティブ領域の所定数の単語は少なくとも3語である。他の実施態様では、アクティブ領域の単語の所定数は3である。特定の実施態様では、少なくとも1つの否定語は、「no(ない)」、「not(~ない)」、「nor(~もまた~ない)」、「non(非)」、「without(~なしの)」、「never(決して~ない)」、および「false(偽)」のうちのいずれか1つを含む。いくつかの実施態様では、臨床記述は、急性心筋梗塞心原性ショック(Acute Myocardial Infarction Cardiogenic Shock(AMICS))リポジトリから取得される。
別の態様では、患者の臨床記述を自動的に分類するためのシステムが提供される。システムは、患者を治療するための少なくとも1つの心室補助装置(VAD)を含む。システムはまた、VADと通信し、かつ、VADによる患者の治療の少なくとも1つの臨床記述を生成するように構成された、コントローラも含む。さらに、システムは、治療の臨床記述を格納するためのデータリポジトリを含む。システムはまた、前述の態様のいずれかによる方法を実行するように構成された、データリポジトリと通信するプロセッサも含む。いくつかの実施態様では、システムは、有害事象を含む臨床記述の数が所定の閾値を超える場合、VADの使用を不可にする。
さらに別の態様では、患者の臨床記述を自動的に分類するためのシステムが提供され、各臨床記述は、患者に対する心室補助装置の使用に関連している。システムは、前述の態様のいずれかによる方法を行うように構成されたプロセッサを含む。
さらなる態様では、プロセッサを含むコンピューティング装置によって実行されると、前述の態様のいずれかによる方法をコンピューティング装置に行わせる、コンピュータ実行可能命令を含むコンピュータプログラムが提供される。
上記その他の目的および利点は、以下の詳細な説明を添付の図面と併せて考察すれば明らかになるであろう。図面において、同様の参照符号は全体を通して同様の部分を指す。
本開示の一態様による、臨床記述において有害事象を発見するための例示的なシステムを示す図である。 キーワード検索を使用した自然言語処理の方法を示す例示的なフローチャートである。 本開示の一態様による臨床記述内の有害事象を発見する方法を示す例示的なフローチャートである。 図1の方法を使用して生じる偽陽性の数に関連する、対象語を囲むアクション領域の長さの最適化を示す図である。 図5Aおよび5Bは、否定語を含む臨床記述に対する図1の方法の使用を示す図である。 図6Aおよび6Bは、身体部位語を含む臨床記述に対する図1の方法の使用を示す図である。
詳細な説明
本明細書に記載される方法およびシステムの全体的な理解を提供するために、特定の例示的な態様について説明する。本明細書に記載される態様および特徴は、心室補助装置(VAD)の使用を伴う臨床記述内の有害事象を自動的に検出するための自然言語処理の使用に関連した使用について特に説明されているが、以下で概説されるすべての構成要素および他の特徴は、任意の適切な方法で互いに組み合わされ得、関連付けられた臨床記述を有する他のタイプの医学療法に適応および適用され得ることが理解されよう。
本明細書に記載されるシステムおよび方法は、自然言語処理(NLP)を使用して、臨床記述内の有害事象の発生を自動的に検出する。NLPは、臨床記述に含まれる対象語のアクティブ領域内のキーワードの検索を行うために使用される。キーワードが発見されると、プロセッサは、その臨床記述が、有害事象が発生した治療に関連している(場合によっては、関連していない)とみなす。本開示のいくつかの態様では、臨床記述テキストファイルのヘッダにフラグが書き込まれる。臨床記述のテキスト内のキーワードを検索することによって、(訓練データを必要とする)機械学習アルゴリズムの訓練が必要とされず、それにより、コンピューティング装置のシステムリソースが解放される。本開示の方法およびシステムのキーワード検索の性質は、臨床記述の解析を行うコンピューティング装置のプロセッサを独占するものではない。
図1に、臨床記述110内の有害事象の発生を自動的に検出するためのシステム100のブロック図を示す。システム100は、例えば、患者データリポジトリ130と通信する、ラップトップなどのコンピューティング装置120を含む。簡潔にするために、図1にはコンピューティング装置120のプロセッサ125のみが示されている。しかしながら、コンピューティング装置120は、例えば、揮発性メモリ(ランダム・アクセス・メモリRAMなど)、不揮発性メモリ(読取り専用メモリROMなど)、ディスプレイ、および、これらの構成要素間の通信を可能にする接続バスなどの、コンピューティング装置と通常関連付けられる他の構成要素も含み、これらすべてが本開示に含まれることが理解されよう。
コンピューティング装置120は、機械可読命令を実行して、自然言語処理を使用してテキストデータに対して演算を行うことができるプロセッサ125を含む。コンピューティング装置120は、様々な医療機関から取得された患者データを含む患者データリポジトリ130と通信する。本開示の特定の態様によれば、患者データリポジトリ130は、Salesforce.com,Inc.などのCRMによって集計および維持される急性心筋梗塞心原性ショック(AMICS)データベースを含み得る。AMICSデータベース130は、高リスク経皮的冠動脈インターベンション(percutaneous coronary intervention(PCI))患者および心原性ショックの患者の治療からのデータを格納する。AMICSデータベース130はまた、治療に利用可能なVAD140に固有のデータをVADデータベース135に格納し得る。VADデータベース135は、機器ごとの動作パラメータを含み得る。
患者データは、心原性ショックの患者の治療後にAMICSデータベース130に格納された臨床記述110を含む。そのような治療は、例えばVAD140などの、患者の状態を緩和するための医療機器の使用を含む。VADは、心原性ショックの患者に心室補助を提供し、Impella(登録商標)ポンプ、体外式膜型人工肺(ECMO)ポンプ、バルーンポンプ、およびスワン・ガンツカテーテルを含み得るが、これに限定されない。Impella(登録商標)ポンプは、すべてマサチューセッツ州ダンバーズのAbiomed,Inc.によるものである、Impella 2.5(登録商標)ポンプ、Impella 5.0(登録商標)ポンプ、Impella CP(登録商標)ポンプ、およびImpella LD(登録商標)ポンプを含み得る。
VAD140は、患者170を治療するときに医師160がVAD140を操作することを可能にするコントローラ150に接続される。そのような操作は、患者170内でのVADの誘導、および患者170の状態に適合するようなVAD140の動作パラメータの調整を含み得る。動作パラメータは、例えば、パージ量、流量、およびポンプ速度を含むが、これらに限定されない。本開示の特定の態様によれば、コントローラ150は、マサチューセッツ州ダンバーズのAbiomed,Inc.によるAutomated Impella(登録商標)Controller(AIC)を含み得る。
各VAD140は、VADが患者の治療に使用されている間に患者170からデータを収集する少なくとも1つのセンサを含み得る。患者データは、信号としてコントローラ150に送信される。そのようなデータは、平均動脈圧(MAP)、左心室圧(LVP)、左心室拡張末期圧(LVEDP)、肺動脈楔入圧(PAWP)、肺毛細血管楔入圧(PCWP)、肺動脈閉塞圧(PAOP)を含み得るが、これに限定されない。コントローラ150は、治療後の解析のためのデータを格納するAMICSデータベース130に患者データを伝達する。AMICSデータベース130には、患者データと一緒に格納され得る医師160からの追加データ(患者の治療からのメモなど)も提供され得る。
患者および医師からのデータは、臨床記述110としてリポジトリ130に格納され得る。本開示の特定の態様では、臨床記述110は、*.txt拡張子を有する少なくとも1つのテキストファイルとしてAMICSデータベース130に格納され得る。臨床記述110は、任意の言語(英語など)のテキストおよび/または略語(医療用の略語など)を含み得る。例示的な臨床記述を表1に示す。テキストファイルはまた、例えば、患者および医療機関の名前、患者人口統計、日付、時刻(表1には示されていない)などの識別データを含むヘッダ情報も含み得る。上記は臨床記述の例示的な態様であり、「臨床記述」という用語は、VADを使用する心血管治療など、患者に対して行われる医療手技に関連する情報を含む機械可読文字の任意のグループを包含することが理解されよう。
(表1)*.txt形式の例示的な臨床記述
Figure 2022514080000002
臨床記述110は、それぞれの治療中に発生する様々な事象の分類のためにコンピューティング装置120によって評価される。事象は、例えば、有害事象の発生、治療装置の誤動作、および治療の成功を含み得る。臨床記述110は、例えば、地理的地域、期間、診断タイプ、患者年齢、および使用された治療装置のタイプ(Impella(登録商標)CPポンプからなるVADなど)といった、指定された基準のセットに基づいて選択され得る。そのような基準は、事前に決定され得るか、または、例えば、グラフィカルユーザインターフェース(GUI)を介してラップトップ120を操作する臨床医によって入力され得る。選択された各臨床記述110は、次いで、ソフトウェアによって実装された自然言語処理(NLP)アルゴリズムを使用して、コンピューティング装置120のプロセッサ125によって解析される。NLPソフトウェアの例には、Apache OpenNPL、Mallet、ELIZAおよびcTAKESが含まれるが、これらに限定されない。
自然言語処理アルゴリズムは、選択された各臨床記述110内のキーワードが存在するかどうかを判定する。キーワードは、臨床記述110内の対象語に対して、または対象語に関連して作用する少なくとも1つの単語を含み得る。キーワードは、臨床記述110の選択を分類するために使用され得る。本開示の一態様によれば、対象語は、患者の心臓の治療中に発生した有害事象(出血、溶血または虚血など)を記述するために使用され得る。対象語の例には、「bleed(出血)」、「clot(血餅)」、および「heart(心臓)」が含まれ得、キーワードの例には、「not」、「non」、および「no」が含まれ得る。そのようなキーワードおよび対象語は、事前に決定され、特定のタイプの解析のためにコンピューティング装置120のメモリに格納され得る。あるいは、キーワードおよび対象語は、NLPソフトウェアのGUIを介してコンピューティング装置120を操作する臨床医によって入力されてもよい。対象語を囲むアクティブ領域におけるキーワードの存在は、次いで、それぞれの治療中に特定の事象が発生したかどうかを判定するためにNLPによって解析される。例えば、NPLは、有害事象の発生を識別し、臨床記述110に、有害事象122を含むまたは有害事象124を含まないとしてフラグを立ててもよい。
図2に、本開示の一態様による自然言語処理の方法200を表すフローチャートを示す。図2の方法200は、図1のプロセッサ125によって実行される。方法は、工程210から開始し、そこでコンピューティング装置120のプロセッサ125がAMICSデータベース130から臨床記述110の選択を取得する。前述のように、臨床記述110の選択は、例えば、地理的地域、期間、診断タイプ、患者年齢、および使用された治療装置のタイプ(VADなど)といった、指定された基準のセットに基づくものであり得る。工程220で、NPLアルゴリズムは、各臨床記述110のテキストを断片またはトークンに分割する(これはテキストのトークン化と呼ばれる)。使用されるNPLアルゴリズムに応じて、句読文字などのテキスト内の特定の文字は無視され得る。各トークンは、選択された臨床記述と関連付けられたテキストの処理のための意味単位として使用される。
テキストのトークン化の後、方法200は、次いで、レンマ化としても知られる工程230に進み、ここで、類似のトークンが、トークンの活用形に基づいて一緒にグループ化され、よって単一項目として解析されることができる。本質的に、レンマ化(またはステミング)は、同じ基本形(語根)を有するトークンをリンクし、それらをグループ化して、それらのトークンを同様の方法で処理できるようにする。例えば、英語では、「walk(歩く)」という動詞は、「walk」、「walked」、「walks」、「walking」として現れ得る。ここでの基本形は「walk」であり、辞書で調べることができる。レンマ化工程230の出力は、トークンのグループを含むbag-of-words(バッグ・オブ・ワーズ)(BOW)であり、各グループは関連付けられた基本形を有する。
選択された臨床記述110についてのBOWが形成されると、キーワード検索を行うことができる(工程240)。NPLは、対象語をレンマ化し、対象語の語根を識別する。次に、NPLは、BOWをスキャンして、BOWにおいて対象語の語根が存在するかどうかを判定する。そのような判定が肯定的である場合、すなわち、BOWが対象語の語根と一致する語根を含む場合、選択された臨床記述110は、対象語を含むとみなされる。逆に、判定が否定的である場合、すなわち、BOWが対象語の語根を含まない場合、選択された臨床記述110は対象語を含まないとみなされる。
図3に、本開示の一態様による臨床記述110を自動的に分類するための方法300のフロー図を示す。図3の方法300は、図1のプロセッサ125によって実行される。方法200と同様に、方法300は工程310から開始し、そこでコンピューティング装置120のプロセッサ125がAMICSデータベース130から臨床記述110の選択を取得する。前述のように、臨床記述110の選択は、例えば、地理的地域、期間、診断タイプ、患者年齢、および使用された治療装置のタイプ(VADなど)といった、指定された基準のセットに基づくものであり得る。基準は、コンピューティング装置120のGUIを介して臨床医によって指定され得る。
工程320で、プロセッサ125は、プロセッサ125上で動作しているNPLアルゴリズムを使用して、選択された各臨床記述110内の対象語の位置を決定する。対象語の位置が識別されると、方法300は、NPLプロセス200をさらに使用して、対象語に関連するアクティブ領域をさらに識別する。アクティブ領域は、対象語の直前および直後に存在する選択された臨床記述110のテキスト内の所定数の単語を含む。アクティブ領域はまた、対象語も含む。所定数の単語は、コンピューティング装置120内に格納され得るか、またはGUIを介して臨床医からの入力として提供され得る。所定数の単語は、アクティブ領域のサイズ(すなわち、方法300の粒度)を定義し、以下ではこれを粒度サイズと呼ぶ。
方法300は、次いで、選択された各臨床記述110内のアクティブ領域を続いて解析する。ここで、プロセッサ125は、NPL法200を使用して、選択された臨床記述110の各々のアクティブ領域をキーワードについて検索する。上記で説明されているように、キーワードは、各臨床記述110内の対象語に対して、または対象語に関連して作用する。本開示の態様によれば、キーワードは否定語または身体部位語を含み得る。否定語は、「no」、「not」、「nor」、「non」、「without」、「never」、および「false」を含み得るが、これらに限定されない。対象語のアクティブ領域内に否定語が存在すると、対象語の通常の意味が逆転するか、または無効になる。例えば、臨床記述が「… groin site is dry with no evidence of bleeding at all(鼠径部は乾いており出血の証拠は全くない)… 」と読める場合、否定語「no」の存在は、その鼠径部で発生する対象語「bleeding(出血)」の意味を無効にする。よって、そのアクティブ領域内で否定語「no」を検出すると、プロセッサ125は、この臨床記述に、(鼠径部での出血である)有害事象に関連しないとしてフラグを立てる。
同様に、身体部位語は、例えば「leg(脚)」、「arm(腕)」、「abdomen(腹部)」および「groin(鼠径部)」などの任意の身体部位を含み得る。対象語のアクティブ領域に身体部位語が存在すると、対象語の通常の意味が無効になる。否定語とは異なり、本開示の一態様によれば、身体部位語の存在は、有害事象(例えば、出血)が心臓内で発生しないことを表す。例えば、臨床記述が「…patient is very sick and they feel she is bleeding into her abdomen(患者は重症であり、彼らは患者がその腹部に出血していると感じている)…」と読める場合、身体部位語「abdomen」の存在は、心臓に関連しないため、対象語「bleeding」の意味を無効にする。本開示の一態様によれば、対象語に対して作用する身体部位語を有しない臨床記述内のあらゆる有害事象は、患者の心臓で発生すると想定される。よって、アクティブ領域内で身体部位語「abdomen」を検出すると、プロセッサ125は、この臨床記述に、心臓での出血の有害事象に関連しないとしてフラグを立てる。NPLのキーワード検索を、アクティブ領域内の単語を特定の身体部位語、例えば「heart」と一致させ、一致に基づいて臨床記述にフラグを立てるように、さらにカスタマイズできることが理解されよう。
図3に戻って、臨床記述110のテキスト内の対象語の位置が決定されると、方法300は工程330に進み、そこでアクティブ領域に否定語が存在するかどうかがさらに判定される。アクティブ領域に否定語が存在する場合(工程330で「はい」)、臨床記述は有害事象を含まないとしてフラグを立てられる。本開示の特定の態様では、フラグは、(例えば、ASCII文字で)臨床記述ごとのテキストファイルのヘッダに書き込まれ得、フラグ付き臨床記述110は、コンピューティング装置120によってAMICSデータベースに書き戻され得る。
否定語がアクティブ領域に存在しない場合(工程330で「いいえ」)、方法300は工程340に進み、そこでアクティブ領域に身体部位語が存在するかどうかがさらに判定される。身体部位語が存在する場合(工程340で「はい」)、工程350のように、臨床記述は有害事象を含まないとしてフラグを立てられる。身体部位語が存在しない場合(工程340で「いいえ」)、工程360のように、臨床記述は有害事象を含むとしてフラグを立てられる。本開示の特定の態様では、工程340に対する「はい」と「いいえ」の両方の場合のフラグが、臨床記述ごとのテキストファイルのヘッダに格納され得、フラグ付き臨床記述110は、コンピューティング装置120によってAMICSデータベースに書き戻され得る。
本開示の戦略的キーワード検索は、各臨床記述110内のテキストをスキャンして、対象語および対象語のアクティブ領域内の任意の指定されたキーワードを見つける。キーワードが識別されると、臨床記述はフラグを立てられ、解析は次のテキストファイルに進む。これは、機械学習を使用するNPLと比較してプロセッサに負担をかけず、したがってコンピューティング装置の処理能力を解放する。
図4に、本開示の一態様による、対象語に関する否定語を検出するためのアクティブ領域のサイズに基づくNPLアルゴリズムの最適化チャート400を示す。実際には、これは方法300の粒度を最適化する。前述のように、偽陽性(FP)の数は、プロセッサ125が、アクティブ領域内の否定語または身体部位語が実際には存在する場合に該否定語および身体部位語の存在を検出しない回数を指し、真陽性TPは、否定語または身体部位語が存在しかつ検出されることを意味する。実際には、FPは警報の見落としであり、例えば、プロセッサ125は、臨床記述のアクティブ領域内の否定語または身体部位語を誤って識別することによって、臨床記述110による患者の心臓内の出血事象の検出を見落とす。同様に、偽陰性(FN)の数は、プロセッサ125が、否定語および身体部位語が実際には存在しない場合にアクティブ領域内の否定語または身体部位語の存在を誤って検出する回数を指し、真陰性TNは、否定語および身体部位語が存在せず検出されもしないことを意味する。
図4では、アクティブ領域のサイズは、対象語の直前および直後の単語の数に関して参照される。最適化は、偽陽性の数に関して行われる。最適化チャート400の折れ線グラフ410は、偽陽性の発生が、3語以上の粒度を有するアクティブ領域で最小の変動を示すことを示している。さらに、表2に、アクティブ領域の粒度が変化するときのTP、FP、FNおよびTNの例示的な値を示す。表2の値は、アクティブ領域のサイズが増加するにつれて警報の見落とし、すなわちFPの数が減少する、図4に示される傾向を補強する。FPの減少率は、アクティブ領域の臨界粒度後に横ばい状態になる。本明細書の態様によれば、アクティブ領域の臨界サイズは3語とみなされる。
(表2)アクティブ領域のサイズによるFPの最適化
Figure 2022514080000003
図5Aおよび図5Bに、上記で説明されているシステムおよび方法による、NPLアルゴリズムを使用して臨床記述500、550内の否定語の存在を自動的に検出する例を示す。図5Aでは、対象語510は「bleeding」であり、アクティブ領域520は3の粒度を有する。キーワード530は否定語「no」である。否定語530が対象語510のアクティブ領域520内に存在するとき、臨床記述500は、有害事象を含まないとしてフラグを立てられる。同様に、図5Bでは、対象語560は「bleeding」であり、アクティブ領域570は3の粒度を有する。キーワード580は否定語「no」である。否定語580が対象語560のアクティブ領域570内に存在するとき、臨床記述550は、有害事象を含まないとしてフラグを立てられる。上記のどちらの例でも、対象語、否定語、およびアクティブ領域内の単語を識別するために図2に示される方法200によるNPL処理が使用される。
図6Aおよび図6Bに、上記で説明されているシステムおよび方法による、NPLアルゴリズムを使用して臨床記述600、650内の身体部位語の存在を自動的に検出する例を示す。図6Aでは、対象語610は「bleeding」であり、アクティブ領域620は3の粒度を有する。キーワード630は、身体部位語「abdomen」である。身体部位語630が対象語610のアクティブ領域620内に存在するとき、臨床記述600は、有害事象を含まないとしてフラグを立てられる。前述のように、対象語に対して作用する身体部位語を有しない臨床記述内の有害事象は、患者の心臓で発生すると想定される。よって、アクティブ領域620内で身体部位語「abdomen」を検出するとき、プロセッサ125は、この臨床記述600に、心臓での出血の有害事象に関連しないとしてフラグを立てる。同様に、図6Bでは、対象語660は「bleeding」であり、アクティブ領域670は3の粒度を有する。キーワード680は、身体部位語「groin」である。身体部位語680が対象語660のアクティブ領域670内に存在するとき、臨床記述650は、有害事象を含まないとしてフラグを立てられる。上記のどちらの例でも、対象語、身体部位語、およびアクティブ領域内の単語を識別するために図2に示される方法200によるNPL処理が使用される。
表3に、本開示の方法およびシステムの有効性を例示するための例示的な図を提供する混同行列を示す。表3は、NPLを使用して、臨床記述内のすべての単語に対してNPLを使用して完全なキーワード検索を行った結果を、本開示の態様による、NPLを使用して、対象語のアクティブ領域内の否定語および/または身体部位語だけを検索する戦略的な否定および/または身体部位キーワード検索に対して比較している。混同行列に関連する指標には、適合率、再現率、および正解率が含まれる。適合率は、式:TP/(TP+FP)を使用して求められ、再現率は、式:TP/(TP+FN)を使用して求められ、正解率は、式:(TP+TN)/(TP+FP+FN+TN)を使用して求められる。表3の例示的な混同行列では、完全なキーワード検索の適合率、再現率、および正解率の指標は、それぞれ、53.4%、97.5%、および91.7%であるのに対して、戦略的否定および/または身体部位キーワード検索の同じ指標は、それぞれ、74.0%、92.5%、および96.2%である。これらの指標比較は、戦略的否定および/または身体部位キーワード検索がより高い適合率および正解率でキーワードを識別することを示している。そのような数字は、本開示の戦略的否定および/または身体部位キーワード検索が、従来のNPL技術よりも優れており、同時に、そのような自然言語処理を行うためのシステムリソースの使用も最小限に抑えることを示している。
前述のように、選択された各臨床記述110がフラグを立てられた後、フラグは各臨床記述テキストファイルのヘッダに記憶され得、テキストファイルはコンピューティング装置120によってAMICSデータベース130に書き戻され得る。そのために、臨床医は、特定の基準(VADタイプ、患者年齢、医療機関の名称など)に基づいてAMICSデータベースからフラグ付き臨床記述をフィルタリングして、対象語を含む臨床記述の割合を取得することもできる。例えば、コンピューティング装置120を操作する臨床医は、心臓手技中に心臓内で出血したマサチューセッツ州ボストンの50~55歳の男性患者に使用されたImpella(登録商標)2.5心臓ポンプに関連するAMICSデータベースからのデータを取得することもできる。そのようなデータが、基準に一致している患者について統計的に示されたデータを下回る場合、それは様々な問題を示している可能性がある。そのような問題には、例えば、心臓手技が該患者に誤って施されていること、または、使用されたVADに調整を要する欠陥があることが、含まれ得る。心臓手技を誤って施した場合、そのようなデータにより医療機関でのさらなる訓練が開始される可能性がある。VADの欠陥が疑われる場合、そのようなデータを、そのような機器の製造中の品質管理として使用することができる。さらに、有害事象を含むフラグ付き臨床記述から得られたデータは、フラグ付き臨床記述の数が所定の閾値を超えた場合にVADの使用に対して医師に警告するためのロックアウト機構をトリガするために使用され得る。上記で説明されているように臨床記述にそのように自動的にフラグを立てることにより、臨床医に、患者に提供される治療を改善することができるフィードバックを提供することができるようになる。
(表3)混同行列の比較
Figure 2022514080000004
以上は本開示の原理の単なる例示であり、装置は、限定ではなく例示を目的として提示されている記載の実施態様以外によっても実施することができる。本明細書に開示されている方法は、自動化された心室補助システムで使用するために示されているが、他の自動化された医療システムで使用されるべきシステムにも適用され得ることを理解されたい。
本開示を検討した後、当業者には変更および修正が想起されるであろう。開示の特徴は、本明細書に記載されている1つまたは複数の他の特徴との、任意の組み合わせおよび部分的組み合わせ(複数の従属的組み合わせおよび部分的組み合わせを含む)として実装され得る。以上で説明または例示された様々な特徴は、それらの任意の構成要素を含めて、他のシステムにおいて結合または統合される場合もある。さらに、特定の特徴が省略され、または実装されない場合もある。
変更、置換、および改変の例は、当業者であれば確かめることができ、本明細書に開示されている情報の範囲から逸脱することなくなされ得る。本明細書中に引用されたすべての参考文献は、参照によりその全体が組み入れられ、本出願の一部をなす。

Claims (12)

  1. 以下の工程を含む、自然言語処理を使用してコンピュータプロセッサにより患者の臨床記述を自動的に分類するための方法であって、該臨床記述が、該患者を治療するための心室補助装置(VAD)の使用に関連する、方法:
    テキストを含む少なくとも1つの臨床記述を受け取る工程;
    前記テキスト内の対象語の位置を決定する工程;
    アクティブ領域内の少なくとも1つの否定語の存在を判定する工程であって、該アクティブ領域が、前記対象語を含む、前記対象語の直前および直後に存在する前記テキスト内の所定数の単語を含む、工程;
    前記アクティブ領域内の少なくとも1つの身体部位語の存在を判定する工程;ならびに
    前記アクティブ領域が否定語または身体部位語のどちらかを含む場合、前記臨床記述が無視されるべきであると判定する工程。
  2. 単語トークンを生成するために前記テキストを処理する工程;
    ある単語の活用形を含む単語トークンを判定およびグループ化する工程;ならびに
    前記グループ化された単語トークンを使用して前記テキストに対してキーワード検索を行う工程
    をさらに含む、請求項1記載の方法。
  3. 前記アクティブ領域が否定語および身体部位語を含まない場合、前記臨床記述にフラグを立てる工程
    をさらに含む、前記請求項のいずれか一項記載の方法。
  4. 前記臨床記述のヘッダにフラグを書き込む工程
    をさらに含む、前記請求項のいずれか一項記載の方法。
  5. 前記アクティブ領域の前記所定数の単語が少なくとも3語である、前記請求項のいずれか一項記載の方法。
  6. 前記アクティブ領域の単語の前記所定数が3である、請求項5記載の方法。
  7. 前記少なくとも1つの否定語が、「no(ない)」、「not(~ない)」、「nor(~もまた~ない)」、「non(非)」、「without(~なしの)」、「never(決して~ない)」、および「false(偽)」のうちのいずれか1つを含む、前記請求項のいずれか一項記載の方法。
  8. 前記臨床記述が、急性心筋梗塞心原性ショック(Acute Myocardial Infarction Cardiogenic Shock(AMICS))リポジトリから取得される、前記請求項のいずれか一項記載の方法。
  9. 患者を治療するための少なくとも1つの心室補助装置(VAD)と、
    前記VADと通信し、かつ、前記VADによる前記患者の前記治療の少なくとも1つの臨床記述を生成するように構成された、コントローラと、
    前記治療の前記臨床記述を格納するためのデータリポジトリと、
    前記データリポジトリと通信し、かつ、請求項1~9のいずれか一項記載の方法を行うように構成された、プロセッサと
    を含む、患者の臨床記述を自動的に分類するためのシステム。
  10. 有害事象を含む臨床記述の数が所定の閾値を超える場合、VADの使用を不可にする、請求項9記載のシステム。
  11. 患者の臨床記述を自動的に分類するためのシステムであって、各臨床記述が、該患者に対する心室補助装置の使用に関連しており、該システムが、請求項1~8のいずれか一項記載の方法を行うように構成されたプロセッサを含む、システム。
  12. プロセッサを含むコンピューティング装置によって実行されると、請求項1~8のいずれか一項記載の方法を前記コンピューティング装置に行わせる、コンピュータ実行可能命令を含むコンピュータプログラム。
JP2021535564A 2018-12-21 2019-12-20 有害事象を発見するための自然言語処理の使用 Active JP7475353B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862784192P 2018-12-21 2018-12-21
US62/784,192 2018-12-21
PCT/US2019/067741 WO2020132390A1 (en) 2018-12-21 2019-12-20 Using natural language processing to find adverse events

Publications (2)

Publication Number Publication Date
JP2022514080A true JP2022514080A (ja) 2022-02-09
JP7475353B2 JP7475353B2 (ja) 2024-04-26

Family

ID=69191256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021535564A Active JP7475353B2 (ja) 2018-12-21 2019-12-20 有害事象を発見するための自然言語処理の使用

Country Status (10)

Country Link
US (2) US11521723B2 (ja)
EP (1) EP3899964A1 (ja)
JP (1) JP7475353B2 (ja)
KR (1) KR20210104864A (ja)
CN (1) CN113243032A (ja)
AU (1) AU2019404335A1 (ja)
CA (1) CA3123611A1 (ja)
IL (1) IL284137A (ja)
SG (1) SG11202105963TA (ja)
WO (1) WO2020132390A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3768349A4 (en) 2018-03-20 2021-12-29 Second Heart Assist, Inc. Circulatory assist pump

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012200546A (ja) * 2011-03-28 2012-10-22 Fujitsu Ltd 診療情報入力装置、プログラム及び診療情報入力方法
US20150223731A1 (en) * 2013-10-09 2015-08-13 Nedim T. SAHIN Systems, environment and methods for identification and analysis of recurring transitory physiological states and events using a wearable data collection device
US20150302161A1 (en) * 2012-12-20 2015-10-22 Koninklijke Philips N.V. Systsem for monitoring a user
JP2016131017A (ja) * 2015-01-08 2016-07-21 株式会社ジェイマックシステム 読影レポート処理装置、読影レポート処理方法および読影レポート処理プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1377912A4 (en) * 2001-02-22 2007-11-14 Classen Immunotherapies Inc Improved computer algorithms and methods for enhancing product safety
US20130046529A1 (en) * 2009-12-22 2013-02-21 Health Ewords Pty Ltd. Method and System for Classification of Clinical Information
WO2015035193A1 (en) * 2013-09-05 2015-03-12 A-Life Medical, Llc Automated clinical indicator recognition with natural language processing
US20160335403A1 (en) * 2014-01-30 2016-11-17 Koninklijke Philips N.V. A context sensitive medical data entry system
US11183293B2 (en) * 2014-11-07 2021-11-23 Koninklijke Philips N.V. Optimized anatomical structure of interest labelling
WO2016094330A2 (en) * 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
US20160357861A1 (en) * 2015-06-07 2016-12-08 Apple Inc. Natural language event detection
EP3341870B1 (en) * 2015-08-26 2022-10-12 Koninklijke Philips N.V. System and methods for extracting infiltrate information from imaging reports for disease decision support applications
AU2018389238A1 (en) * 2017-12-21 2020-07-02 Abiomed, Inc. Systems and methods for predicting patient health status
CN108091396A (zh) * 2017-12-25 2018-05-29 中山大学 一种心脏病智能预测和心脏保健信息推荐系统及其方法
EP3567605A1 (en) * 2018-05-08 2019-11-13 Siemens Healthcare GmbH Structured report data from a medical text report

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012200546A (ja) * 2011-03-28 2012-10-22 Fujitsu Ltd 診療情報入力装置、プログラム及び診療情報入力方法
US20150302161A1 (en) * 2012-12-20 2015-10-22 Koninklijke Philips N.V. Systsem for monitoring a user
JP2016508041A (ja) * 2012-12-20 2016-03-17 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. ユーザーをモニタリングするためのシステム
US20150223731A1 (en) * 2013-10-09 2015-08-13 Nedim T. SAHIN Systems, environment and methods for identification and analysis of recurring transitory physiological states and events using a wearable data collection device
JP2016131017A (ja) * 2015-01-08 2016-07-21 株式会社ジェイマックシステム 読影レポート処理装置、読影レポート処理方法および読影レポート処理プログラム

Also Published As

Publication number Publication date
US20230170064A1 (en) 2023-06-01
US11521723B2 (en) 2022-12-06
KR20210104864A (ko) 2021-08-25
US20200202990A1 (en) 2020-06-25
EP3899964A1 (en) 2021-10-27
AU2019404335A1 (en) 2021-07-08
JP7475353B2 (ja) 2024-04-26
CN113243032A (zh) 2021-08-10
IL284137A (en) 2021-08-31
SG11202105963TA (en) 2021-07-29
WO2020132390A1 (en) 2020-06-25
CA3123611A1 (en) 2020-06-25

Similar Documents

Publication Publication Date Title
US11182682B2 (en) System for extracting semantic triples for building a knowledge base
CN112365987B (zh) 诊断数据异常检测方法、装置、计算机设备及存储介质
US8285734B2 (en) Comparison of documents based on similarity measures
Loghmanpour et al. A Bayesian model to predict right ventricular failure following left ventricular assist device therapy
US9257052B2 (en) Evaluating candidate answers to questions in a target knowledge domain
WO2018076243A1 (zh) 一种查找方法及装置
US20110040576A1 (en) Converting arbitrary text to formal medical code
CN110032728B (zh) 疾病名称标准化的转换方法和装置
WO2017010506A1 (ja) 情報処理装置、情報処理方法およびコンピュータプログラム
Ji et al. Towards mitigating LLM hallucination via self reflection
CN111640512B (zh) 肾脏替代疗法启动策略评估方法、装置及电子设备
US20160350359A1 (en) Informal data-based rule management method and apparatus
CN112802575A (zh) 基于图形状态机的用药决策支持方法、装置、设备、介质
Barrows Jr et al. Limited parsing of notational text visit notes: ad-hoc vs. NLP approaches.
TWI833072B (zh) 語音辨識系統及語音辨識方法
US20230170064A1 (en) Using natural language processing to find adverse events
JP2017134694A (ja) 属性付与制御プログラム、情報処理装置および属性付与制御方法
CN111968740B (zh) 一种诊断标签推荐方法、装置、存储介质及电子设备
Mahendra et al. Impact of different approaches to preparing notes for analysis with natural language processing on the performance of prediction models in intensive care
US20240112765A1 (en) Method and system for clinical trials matching
CN115905960A (zh) 一种基于心室辅助装置的不良事件检测方法及装置
Boytcheva et al. Mining Association Rules from Clinical Narratives.
CN112309580A (zh) 疾病类型的确定方法、装置、电子设备及存储介质
EP4180989A1 (en) Method and apparatus for processing data
Griffioen et al. Patient selection for left ventricular unloading: is lactate the vital piece of the puzzle?

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221215

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230823

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20231003

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20231010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240416

R150 Certificate of patent or registration of utility model

Ref document number: 7475353

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150