JP2022546593A - 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 - Google Patents
自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 Download PDFInfo
- Publication number
- JP2022546593A JP2022546593A JP2022514699A JP2022514699A JP2022546593A JP 2022546593 A JP2022546593 A JP 2022546593A JP 2022514699 A JP2022514699 A JP 2022514699A JP 2022514699 A JP2022514699 A JP 2022514699A JP 2022546593 A JP2022546593 A JP 2022546593A
- Authority
- JP
- Japan
- Prior art keywords
- entity
- nlp
- text string
- entities
- pathology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007170 pathology Effects 0.000 title claims abstract description 165
- 238000003058 natural language processing Methods 0.000 title claims abstract description 26
- 238000000605 extraction Methods 0.000 title description 48
- 238000000034 method Methods 0.000 claims abstract description 71
- 238000013507 mapping Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims description 34
- 238000012015 optical character recognition Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 25
- 230000003287 optical effect Effects 0.000 claims description 22
- 230000001575 pathological effect Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 28
- 206010028980 Neoplasm Diseases 0.000 description 25
- 210000004072 lung Anatomy 0.000 description 17
- 238000001514 detection method Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 9
- 229940079593 drug Drugs 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000003628 erosive effect Effects 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 210000001165 lymph node Anatomy 0.000 description 3
- 238000002483 medication Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 201000000462 keratinizing squamous cell carcinoma Diseases 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 206010041823 squamous cell carcinoma Diseases 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 208000009458 Carcinoma in Situ Diseases 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002962 histologic effect Effects 0.000 description 1
- 201000004933 in situ carcinoma Diseases 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/30—Character recognition based on the type of data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Description
[0001]本出願は、その内容がすべての目的のために全体として参照により本明細書に組み込まれる、2019年9月6日に出願された米国仮特許出願第62/897,252号に対する優先権の利益を主張する。
[0011]発明を実施するための形態は、添付図面を参照して記載される。
[0031]図1は、従来の病理報告100の一例を示す。病理報告は、病理医によって書かれた医療文書であり、患者の腫瘍から取られた組織のサンプルの病理医の検査に基づく組織学的診断を提供することができる。腫瘍組織から、病理医は、たとえば、組織ががん性か又は非がん性か、及び腫瘍の特徴に関する他の具体的詳細を見出すことができる。すべてのこの情報は、病理報告の一部であり得る。これらの情報に基づいて、治療が策定され得る。
[0042]上述されたように、病理報告100などの従来の病理報告は、紙の形態又は走査された画像の形態のいずれかであるデータにアクセスし分析することが困難である。データの物理的な形態、並びにデータが構造化されていないという事実のために、臨床医及び臨床スタッフは、通常、病理報告を読み通して、重要な臨床データを取得することに多大な時間を費やす必要があり、それは、骨が折れ、遅く、コストがかかり、間違いの元になる。その上、報告内の臨床データは非標準化用語を含む場合があるので、臨床医が報告内の非標準化用語を解釈するときに潜在的な不明確さ及び混乱が生じる場合があり、それは、病理報告からの臨床データの抽出に対する間違いを引き起こす可能性がある。
[0043]図3は、上述された問題のうちの少なくともいくつかに対処するために、病理報告の自動化された情報の抽出及び改良を実行することができるシステム300を示す。システム300は、エンドツーエンド改良ワークフロー動作を実施する臨床ポータルアプリケーションの一部であり得る。図3を参照すると、システム300は、患者データベース301から、入力として(たとえば、病理報告100の)病理報告画像ファイル302を受信することができる。システム300は、出力として、(たとえば、病理報告200の)後処理された病理報告データ304を生成することができる。以下に記載されるように、後処理された病理報告データ304は、上記の図2A及び表1に記載されたものなどの病理エンティティ、並びに病理報告画像ファイル302から識別された関連付けられた値を含む、病理報告画像ファイル302から抽出された情報を含むことができる。加えて、後処理された病理報告データ304はまた、標準化された病理エンティティ値(たとえば、SNOMED概念)などの改良情報を含む場合がある。後処理された病理報告データ304は、患者の構造化医療データとして患者データベース301(又は他の臨床データベース)に書き戻され得る。いくつかの例では、システム300はまた、構造化された形式で(たとえば、表、入力フォームの形式で)後処理された病理報告データ304を表示するために、表示インターフェース305を含む。いくつかの例では、表示インターフェース305はまた、後処理された病理報告データ304に基づいて、テキスト及びグラフィカル情報と重ね合わされた病理報告画像ファイル302を表示することができる。
[0048]図4Aは、NLPモデル328の一例を示す。図4Aに示されたように、NLPモデル328は、ノード402、404a、404b、406a、406b、406c、及び408などのノードを備えるグラフを含む。各ノードはテキスト文字列に対応することができる。グラフ内でノードはアークによって接続され、アークの方向はNLPモデル328によって検出されるべきテキスト文字列のシーケンスを定義する。たとえば、ノード402及び404aはアーク410によって接続され、ノード404a及び406bはアーク412によって接続され、ノード406b及び408はアーク414によって接続される。これらのノード及びアークは、テキストのシーケンス「right lung middle lobe」を定義することができる。ノードはまた、階層に整理され、エンティティ-値ペア、コンテキストなどであり得る検出出力は、各階層から生成され得る。図4Aの例では、ノード402はエンティティ「検体側性」を検出する第1の階層内にあり得、ノード404a及び404bはコンテキストを検出する第2の階層内にあり得、ノード406a~406c及び408はエンティティ「腫瘍部位」を検出する第3の階層内にあり得る。検出は、たとえば、テキスト文字列の入力シーケンスとノードによって表されたテキスト文字列との間の類似度に基づいてスコアを計算するパラメータ化された式に基づくことができ、所定のエンティティ-ペア及び/又はコンテキスト情報は、スコアに基づいて出力され得る。
[0054]図3に戻ると、改良モジュール310は、改良動作を実行して、病理報告画像ファイル302から抽出された医療情報の質を改善することができる。1つの例示的な改良動作は、図2Bに示されたように、病理報告内のエンティティ値をSNOMED概念などの標準化された値に変換することを含む場合がある。システム300は、改良モジュール310による改良動作を支援するために、用語マッピングデータベース370をさらに含む場合がある。
[0057]図3に戻ると、システム300は、後処理された病理報告データ304を表示するために表示インターフェース305を含む場合がある。いくつかの例では、表示インターフェース305は、構造化形式で(たとえば、表、入力フォームの形式で)後処理された病理報告データ304の構造化医療データを表示して、ポータルのユーザ(たとえば、臨床医、臨床スタッフ)が探している医療情報を効率的に識別することを可能にすることができる。いくつかの例では、表示インターフェース305は、病理報告画像ファイル302、並びにNLP328が病理エンティティを表示するように決定したテキスト文字列に重ね合わされた強調マークアップ(テキスト)を表示することができる。強調マークアップは選択可能である。表示インターフェース305はまた、テキスト文字列のセットの上の強調マーキングの選択を検出し、エンティティのラベル及び値、並びに選択されたテキスト文字列の他の改良情報(たとえば、SNOMEDに基づく標準化データ)を含むポップアップウィンドウを表示することができる。
[0060]図3に戻ると、NLPモデル328は、訓練される機械学習モデルであり得る。図3に示されたように、システム300は、NLPモデル328を訓練することができる訓練モジュール340を含む場合がある。訓練モジュール340は、ラベル付けされた一般医療文書348及びラベル付けされた病理報告350に基づいて、NLPモデル328を訓練することができる。一般医療文書348は、様々なカテゴリの生物医学の文献、報告などを含むことができる。訓練は、医療用語の単語を表すノード、並びに図4AのNLPモデル328のエッジなどの単語の間の順序関係を表すエッジを作成する。訓練動作の一部として、特定のラベルを有するテキスト文字列のシーケンス(たとえば、ラベル付けされたエンティティ、ラベル付けされたエンティティ値、ラベル付けされたコンテキスト)は、NLPが正しいエンティティ-値ペア及び/又はコンテキスト情報を出力するかどうかを判定するために、NLPモデル328に入力され得る。(テキスト文字列のシーケンスのラベル付けされたエンティティ/エンティティ値と、テキスト文字列のシーケンスに対してNLPモデルによって出力されたエンティティ-値ペアを比較することに基づいて)NLPモデル328が正しいエンティティ-値ペア及び/又はコンテキスト情報を出力しないと訓練モジュール340が判定した場合、訓練モジュール340は、新しい単語を表す新しいノードを作成し、既存のノードの間にエッジを追加することなどにより、NLPモデル328を修正することができる。エンティティ-値ペアを出力する判断機構(たとえば、パラメータ化された式)はまた、正しいエンティティ-ペア及び/又はコンテキスト情報を出力する可能性を高めるために、(たとえば、パラメータを更新することによって)更新され得る。
精度=tp/(tp+fp) (式1)
再現率=tp/(tp+fn) (式2)
F1=(精度×再現率)/(精度+再現率) (式3)
[0071]加えて、様々な技法は、NLPの抽出精度を向上させるように画像認識動作の様々なパラメータを決定することができる。光学式文字認識(OCR)動作用のパラメータは、エロージョン値、ページイテレータレベル、ページセグメント化モード、又は倍率を含む場合がある。エロージョン値は、ぼやけた線の平滑化動作が実行されたかどうかを示すことができる。ページイテレータレベルは、画像認識動作の細分性-画像認識動作の細分性を高めるために、ページ全体をブロックとして扱うか、又はページ内のセクション(段落、行、単語、文字など)をブロックとして扱うことによってそれが実行されたがどうかを指すことができる。ページセグメント化モードは、処理されているページの傾斜した向きを検出し、傾斜した向きを補正するように画像認識動作を調整することができる。倍率は、処理されるべき画像をズームイン又はズームアウトするようにズームレベルを設定することができる。
[0074]ステップ602において、エロージョン値、ページイテレータレベル、ページセグメント化モード、倍率などのOCRパラメータのセットが決定され得る。それらのパラメータは、デフォルト値又はパラメータ掃引動作から決定された値に設定され得る。パラメータ掃引動作は、病理報告の画像の同じセットに対する画像認識動作のために実行され得、その中で、画像認識動作は繰り返し実行され得、各繰り返しは、パラメータの値の異なる組合せに基づいて実行される。次いで、繰り返しごとのテキスト認識精度が測定され得、ワークフローのための画像認識動作を構成するために、最も高い認識精度につながるパラメータの値の組合せが使用され得る。
[0076]ステップ606において、エンティティ-値ペアを抽出するためにNLPを使用して病理報告テキストデータが処理され得る。
[0079]抽出精度がしきい値を超えた場合、OCRパラメータ調整動作はステップ612において記憶され得る。しかし、抽出精度がしきい値を下回る場合、OCRパラメータはステップ614において調整され、次いで、ステップ604が繰り返される。調整されるパラメータは、最も低い精度を有するエンティティ-値ペアを識別することに基づいて選択され得る。説明のための例として、低い精度を有するエンティティ-値ペアに属する病理報告内のいくつかの単語が非常に小さい画像サイズを有すると判定される場合がある。そのような例では、OCR動作の倍率が増大され得る。
[0081]図7は、後処理された病理報告データ304及びメタデータファイル314の例示的なアプリケーションを示す。図7に示されたように、後処理された病理報告データ304は、図4Eの表示インターフェース305を含むことができる臨床医ポータル702に提供され得る。いくつかの例では、臨床医ポータル702は、所定の構造化形式で(たとえば、表、入力フォームの形式で)ユーザにエンティティ-値ペア(及び/又はSNOMED概念)を表示して、ポータルのユーザ(たとえば、臨床医、臨床スタッフ)が探している医療情報を効率的に識別することを可能にすることができる。別の例として、臨床医ポータル702はまた、元の病理報告の画像を表示することができ、テキスト文字列のうちのいくつか又はすべてはエンティティ-値ペア及び/もしくはSNOMED概念と置き換えられるか、又はテキスト文字列は強調表示され、エンティティ-値ペア/SNOMED概念でタグ付けされる。臨床医ポータル702は、図4Eに記載されたように、メタデータファイル314内で示されたテキスト文字列のピクセル位置に基づいて、画像内のテキスト文字列の強調表示を実行することができる。
[0083]図8は、自動化された情報の抽出及び改良の方法800を示す。方法800は、たとえば、図3のシステム300によって実行され得る。
[0091]本明細書で言及されたコンピュータシステムのいずれも、任意の適切な数のサブシステムを利用することができる。そのようなサブシステムの例が、コンピュータシステム10において図9に示されている。いくつかの実施形態では、コンピュータシステムは単一のコンピュータ装置を含み、サブシステムはコンピュータ装置の構成要素であり得る。他の実施形態では、コンピュータシステムは、各々がサブシステムであり、内部構成要素を有する複数のコンピュータ装置を含むことができる。コンピュータシステムは、デスクトップコンピュータ及びラップトップコンピュータ、タブレット、携帯電話、並びに他のモバイルデバイスを含むことができる。いくつかの実施形態では、開示された技法を実施するために、クラウド基盤(たとえば、Amazon Web Services)、グラフィカル処理装置(GPU)などが使用され得る。
Claims (19)
- コンピュータシステムによって実行される方法であって、
病理報告を含む画像ファイルを受信するステップと、
入力テキスト文字列を抽出するために前記画像ファイルに対して画像認識動作を実行するステップと、
自然言語処理(NLP)モデルを使用して、前記入力テキスト文字列からエンティティを検出するステップであって、各エンティティがラベル及び値を含む、ステップと、
前記NLPモデルを使用して、前記入力テキスト文字列から前記エンティティの前記値を抽出するステップと、
エンティティ及び値を所定の用語にマッピングするマッピングテーブルに基づいて、少なくともいくつかの前記エンティティの前記値を対応する前記所定の用語に変換するステップと、
前記入力テキスト文字列から検出された前記エンティティ及び対応する前記所定の用語を含む、後処理された病理報告を生成するステップと
を含む、方法。 - 前記画像認識動作が、光学式文字認識(OCR)プロセス又は光学式単語認識プロセスのうちの少なくとも1つを含む、請求項2に記載の方法。
- 前記画像ファイルが、ポータブルドキュメントフォーマット(pdf)フォーマットである、請求項1に記載の方法。
- 前記NLPモデルが、ノード及びエッジを備えるグラフを含み、
各ノードがテキスト文字列に対応し、
2つのノード間のエッジが、前記2つのノードによって表された2つのテキスト文字列間の順序関係を示し、
前記エンティティを検出するステップが、前記入力テキスト文字列のテキスト文字列のシーケンスを前記グラフ内で表されたテキスト文字列のシーケンスと照合するステップを含む、
請求項1に記載の方法。 - エンティティの名前でタグ付けされた訓練テキスト文字列に基づいて、前記グラフを更新するステップをさらに含む、請求項4に記載の方法。
- 前記NLPモデルが、ベースラインNLPサブモデル及び病理NLPサブモデルを備え、
前記ベースラインNLPサブモデルが、一般医療文書からの第1の訓練テキスト文字列に基づいて訓練され、
前記病理NLPサブモデルが、病理報告からの第2の訓練テキスト文字列に基づいて訓練される、
請求項4に記載の方法。 - 前記NLPモデルによる前記入力テキスト文字列から前記エンティティを認識する精度を特定するステップと、
前記精度に基づいて、前記入力テキスト文字列に基づいて前記訓練テキスト文字列を更新するステップと、
前記更新された訓練テキスト文字列に基づいて前記グラフを更新するステップと
をさらに含む、請求項5に記載の方法。 - 前記入力テキストの隣接するテキスト文字列のセットから複数のエンティティが認識される、請求項1に記載の方法。
- 前記入力テキスト文字列が第1の入力テキスト文字列であり、
前記画像認識動作のパラメータが、前記NLPモデルによる第2の入力テキスト文字列からエンティティを認識する精度に基づいて決定され、前記第2の入力テキスト文字列が、前記パラメータを使用して前記画像認識動作によって生成される、
請求項1に記載の方法。 - 前記標準用語が国際医療用語集(SNOMED)規格に基づき、前記標準用語が、SNOMED概念又はSNOMED概念識別子(ID)
のうちの少なくとも1つを含む、請求項1に記載の方法。 - 前記マッピングが複数のエンティティに基づく、請求項10に記載の方法。
- 臨床判断支援ツール、医療従事者ポータル、又は検索可能な医療データベースのうちの少なくとも1つに、構造化医療データを提供するステップをさらに含む、請求項1に記載の方法。
- 前記画像認識動作が、前記画像ファイル内の前記入力テキスト文字列の画像位置を出力し、
前記方法が、
表示インターフェース内で、前記画像ファイルを表示するステップと、
前記画像位置に基づいて、エンティティが検出された前記入力テキスト文字列のサブセットの上に強調マークアップを表示するステップと、
前記強調マークアップのうちの少なくとも1つの選択を検出するステップと、
前記選択を検出するステップに応答して、前記選択された強調マーキングの上にポップアップウィンドウを表示するステップであって、前記ポップアップウィンドウが、前記選択された強調マーキングの前記入力テキスト文字列から検出された前記エンティティの前記標準用語を含む、ステップと
をさらに含む、請求項12に記載の方法。 - 前記画像ファイルが、EMR(電子医療記録)データベース、PACS(画像保管通信システム)、デジタル病理学(DP)システム、LIS(実験室情報システム)、RIS(放射線医学情報システム)、患者報告結果データベース、ウェアラブルデバイス、又はソーシャルメディアウェブサイトのうちの少なくとも1つを含む、1つ又は複数の情報源から受信される、請求項1に記載の方法。
- 上記の方法のうちのいずれかの動作を実行するようにコンピュータシステムを制御するための複数の命令を記憶するコンピュータ可読媒体を備える、コンピュータ製品。
- 請求項15に記載のコンピュータ製品と、
前記コンピュータ可読媒体に記憶された命令を実行するための1つ又は複数のプロセッサと
を備える、システム。 - 上記の方法のうちのいずれかを実行するための手段を備える、システム。
- 上記の方法のうちのいずれかを実行するように構成された、システム。
- 上記の方法のうちのいずれかのステップをそれぞれ実行するモジュールを備える、システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023197189A JP2024012659A (ja) | 2019-09-06 | 2023-11-21 | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962897252P | 2019-09-06 | 2019-09-06 | |
US62/897,252 | 2019-09-06 | ||
PCT/US2020/049738 WO2021046536A1 (en) | 2019-09-06 | 2020-09-08 | Automated information extraction and enrichment in pathology report using natural language processing |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023197189A Division JP2024012659A (ja) | 2019-09-06 | 2023-11-21 | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022546593A true JP2022546593A (ja) | 2022-11-04 |
JP7392120B2 JP7392120B2 (ja) | 2023-12-05 |
Family
ID=72644901
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022514699A Active JP7392120B2 (ja) | 2019-09-06 | 2020-09-08 | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 |
JP2023197189A Pending JP2024012659A (ja) | 2019-09-06 | 2023-11-21 | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023197189A Pending JP2024012659A (ja) | 2019-09-06 | 2023-11-21 | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220301670A1 (ja) |
EP (1) | EP4026047A1 (ja) |
JP (2) | JP7392120B2 (ja) |
CN (1) | CN114341838A (ja) |
WO (1) | WO2021046536A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7392120B2 (ja) * | 2019-09-06 | 2023-12-05 | エフ. ホフマン-ラ ロシュ アーゲー | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 |
CA3153085A1 (en) | 2020-06-19 | 2021-12-23 | F. Hoffmann-La Roche Ag | Antibodies binding to cd3 and cd19 |
JP2024503865A (ja) | 2021-01-15 | 2024-01-29 | エフ. ホフマン-ラ ロシュ アーゲー | 臨床判断支援のための腫瘍学ワークフロー |
KR102588270B1 (ko) * | 2021-11-24 | 2023-10-12 | 한국과학기술원 | 의료 데이터 임베딩 방법 및 장치, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램 |
WO2023166328A2 (en) * | 2022-03-01 | 2023-09-07 | Mofaip, Llc | Augmented documentation through computer vision detection, alignment, and application of paper markup to digital maps and forms |
CN114328938B (zh) * | 2022-03-16 | 2022-06-24 | 浙江卡易智慧医疗科技有限公司 | 一种影像报告结构化提取方法 |
CN114783559B (zh) * | 2022-06-23 | 2022-09-30 | 浙江太美医疗科技股份有限公司 | 医学影像报告信息抽取方法、装置、电子设备和存储介质 |
CN117095782B (zh) * | 2023-10-20 | 2024-02-06 | 上海森亿医疗科技有限公司 | 医学文本快速录入方法、系统、终端及编辑器 |
CN117556808B (zh) * | 2024-01-12 | 2024-04-05 | 万里云医疗信息科技(北京)有限公司 | 基于大语言模型和影像知识库的语料自动生成方法及装置 |
CN118093736B (zh) * | 2024-04-23 | 2024-08-16 | 奇点数联(北京)科技有限公司 | 一种病历文本对应实体和实体标签的获取系统 |
CN118262220B (zh) * | 2024-05-29 | 2024-10-11 | 青岛美迪康数字工程有限公司 | 放射影像报告的质量评估方法、装置和设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017513590A (ja) * | 2014-04-17 | 2017-06-01 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 患者履歴の視覚化のための方法及びシステム |
US10395772B1 (en) * | 2018-10-17 | 2019-08-27 | Tempus Labs | Mobile supplementation, extraction, and analysis of health records |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5222082B2 (ja) * | 2008-09-25 | 2013-06-26 | キヤノン株式会社 | 情報処理装置およびその制御方法、データ処理システム |
US8935155B2 (en) * | 2012-09-14 | 2015-01-13 | Siemens Aktiengesellschaft | Method for processing medical reports |
US10133727B2 (en) * | 2013-10-01 | 2018-11-20 | A-Life Medical, Llc | Ontologically driven procedure coding |
TR201908751T4 (tr) * | 2015-02-25 | 2019-07-22 | Koninklijke Philips Nv | Boylamasına bulgu görüntüsünün otomatik oluşturulması için eksik bulguların saptanması. |
CN106383853A (zh) * | 2016-08-30 | 2017-02-08 | 刘勇 | 一种电子病历后结构化以及辅助诊断的实现方法及其系统 |
US10276265B2 (en) * | 2016-08-31 | 2019-04-30 | International Business Machines Corporation | Automated anatomically-based reporting of medical images via image annotation |
EP3586250B1 (en) * | 2017-02-22 | 2023-09-20 | OpSec Online Limited | Systems and methods for direct in-browser markup of elements in internet content |
US10679345B2 (en) * | 2017-12-20 | 2020-06-09 | International Business Machines Corporation | Automatic contour annotation of medical images based on correlations with medical reports |
EP3891755A4 (en) * | 2018-12-03 | 2022-09-07 | Tempus Labs, Inc. | SYSTEM FOR IDENTIFICATION, EXTRACTION AND PREDICTION OF CLINICAL CONCEPTS AND ASSOCIATED PROCESSES |
WO2020142558A1 (en) * | 2018-12-31 | 2020-07-09 | Tempus Labs | Automated quality assurance testing of structured clinical data |
US11100933B2 (en) * | 2019-04-17 | 2021-08-24 | Tempus Labs, Inc. | Collaborative artificial intelligence method and system |
US10970320B2 (en) * | 2019-04-26 | 2021-04-06 | Open Text Sa Ulc | Systems and methods for coordinate-based search |
US11705226B2 (en) * | 2019-09-19 | 2023-07-18 | Tempus Labs, Inc. | Data based cancer research and treatment systems and methods |
US11080467B1 (en) * | 2019-08-22 | 2021-08-03 | Quantcast Corporation | Visual tag builder |
JP7392120B2 (ja) * | 2019-09-06 | 2023-12-05 | エフ. ホフマン-ラ ロシュ アーゲー | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 |
JP2024503865A (ja) * | 2021-01-15 | 2024-01-29 | エフ. ホフマン-ラ ロシュ アーゲー | 臨床判断支援のための腫瘍学ワークフロー |
US11816176B2 (en) * | 2021-07-27 | 2023-11-14 | Locker 2.0, Inc. | Systems and methods for enhancing online shopping experience |
-
2020
- 2020-09-08 JP JP2022514699A patent/JP7392120B2/ja active Active
- 2020-09-08 WO PCT/US2020/049738 patent/WO2021046536A1/en unknown
- 2020-09-08 CN CN202080062284.0A patent/CN114341838A/zh active Pending
- 2020-09-08 EP EP20780426.1A patent/EP4026047A1/en active Pending
- 2020-09-08 US US17/639,441 patent/US20220301670A1/en active Pending
-
2023
- 2023-11-21 JP JP2023197189A patent/JP2024012659A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017513590A (ja) * | 2014-04-17 | 2017-06-01 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 患者履歴の視覚化のための方法及びシステム |
US10395772B1 (en) * | 2018-10-17 | 2019-08-27 | Tempus Labs | Mobile supplementation, extraction, and analysis of health records |
Also Published As
Publication number | Publication date |
---|---|
JP2024012659A (ja) | 2024-01-30 |
WO2021046536A1 (en) | 2021-03-11 |
CN114341838A (zh) | 2022-04-12 |
US20220301670A1 (en) | 2022-09-22 |
EP4026047A1 (en) | 2022-07-13 |
JP7392120B2 (ja) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7392120B2 (ja) | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 | |
CN110993064B (zh) | 面向深度学习的医学影像标注方法及装置 | |
US20220044812A1 (en) | Automated generation of structured patient data record | |
CN112329964B (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
JP6749835B2 (ja) | コンテキスト依存医学データ入力システム | |
US20190139642A1 (en) | System and methods for medical image analysis and reporting | |
JP5952835B2 (ja) | 撮像プロトコルの更新及び/又はリコメンダ | |
CN109710670B (zh) | 一种将病历文本从自然语言转换为结构化元数据的方法 | |
CN111696642A (zh) | 用于生成医学图像中的异常的描述的系统和方法 | |
WO2021073157A1 (zh) | 图像管理显示方法、装置、计算机设备及存储介质 | |
CN112749277B (zh) | 医学数据的处理方法、装置及存储介质 | |
CN115083550B (zh) | 基于多源信息的病人相似度分类方法 | |
US20220415456A1 (en) | Character acquisition, page processing and knowledge graph construction method and device, medium | |
JP2024528381A (ja) | 医用画像データの自動追跡読影方法及びシステム | |
CN113762100B (zh) | 医疗票据中名称提取及标准化方法、装置、计算设备及存储介质 | |
CN112101030B (zh) | 建立术语映射模型、实现标准词映射的方法、装置及设备 | |
Chahid et al. | Data Preprocessing For Machine Learning Applications in Healthcare: A Review | |
CN112735543B (zh) | 医学数据的处理方法、装置及存储介质 | |
CN115101158A (zh) | 基于超声检查报告的乳腺癌诊断知识图谱构建方法及系统 | |
Zeng et al. | Recognition of rare antinuclear antibody patterns based on a novel attention-based enhancement framework | |
TWI811598B (zh) | 智慧化影像診斷報告轉譯方法 | |
US20240177818A1 (en) | Methods and systems for summarizing densely annotated medical reports | |
US20220208317A1 (en) | Image content extraction method and image content extraction device | |
Balas et al. | OCTess: An Optical Character Recognition Algorithm for Automated Data Extraction of Spectral Domain Optical Coherence Tomography Reports | |
US20240177814A1 (en) | Test result processing and standardization across medical testing laboratories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220419 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220419 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230929 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7392120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |