JP7464800B2 - 小サンプル弱ラベル付け条件での医療イベント認識方法及びシステム - Google Patents
小サンプル弱ラベル付け条件での医療イベント認識方法及びシステム Download PDFInfo
- Publication number
- JP7464800B2 JP7464800B2 JP2023536800A JP2023536800A JP7464800B2 JP 7464800 B2 JP7464800 B2 JP 7464800B2 JP 2023536800 A JP2023536800 A JP 2023536800A JP 2023536800 A JP2023536800 A JP 2023536800A JP 7464800 B2 JP7464800 B2 JP 7464800B2
- Authority
- JP
- Japan
- Prior art keywords
- medical
- factor
- event
- sample
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 87
- 238000002372 labelling Methods 0.000 title claims description 83
- 239000012634 fragment Substances 0.000 claims description 93
- 238000012549 training Methods 0.000 claims description 54
- 238000005070 sampling Methods 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 23
- 208000024891 symptom Diseases 0.000 claims description 16
- 201000010099 disease Diseases 0.000 claims description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 10
- 229940079593 drug Drugs 0.000 claims description 9
- 239000003814 drug Substances 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 8
- 238000011282 treatment Methods 0.000 claims description 8
- 238000003745 diagnosis Methods 0.000 claims description 6
- 238000001356 surgical procedure Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 206010020751 Hypersensitivity Diseases 0.000 claims description 3
- 208000026935 allergic disease Diseases 0.000 claims description 3
- 230000007815 allergy Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 10
- 230000002457 bidirectional effect Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 206010000087 Abdominal pain upper Diseases 0.000 description 3
- 206010047700 Vomiting Diseases 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000291 postprandial effect Effects 0.000 description 3
- 230000008673 vomiting Effects 0.000 description 3
- 208000004998 Abdominal Pain Diseases 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000035622 drinking Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000391 smoking effect Effects 0.000 description 2
- 206010008111 Cerebral haemorrhage Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Pathology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
医療イベントライブラリの構築及びデータのラベル付けを行うステップ一と、
医療因子及びイベントのメタ学習を行うステップ二と、
医療因子を認識するステップ三と、
医療イベントを認識するステップ四とを含み、
前記ステップ一では、専門家知識に基づいて、医療イベント種別と各種別に対応する医療因子とを含む医療イベントライブラリを定義して構築し、医療イベントライブラリに基づいて遠隔教師あり方法を用いて中国語電子カルテテキストに対して医療因子のラベル付けを行い、医療因子認識モデルのトレーニングデータを生成し、
前記ステップ二は、サブステップ2.1~サブステップ2.4を含み、
前記サブステップ2.1では、各分野に公開された中国語イベント及び因子ラベル付けコーパスをトレーニングセットとして選択してサンプリングし、対応するトレーニング―サポートセット及びトレーニング―検索セットを複数回のサンプリングによって取得し、
前記サブステップ2.2では、トレーニング―サポートセットに基づいて、対応するイベント及び因子のプロトタイプ表現を構築し、
前記サブステップ2.3では、因子及びイベントのプロトタイプ表現に基づいて、トレーニング―検索セットサンプルとプロトタイプ表現の距離類似度スコアを算出し、実際結果及び認識結果に基づいてメタ学習モデルの損失を算出し、前記メタ学習モデルのパラメータを更新し、
前記サブステップ2.4では、小サンプル医療因子及びイベントデータセットをテストセットとし、対応するテスト―サポートセット及びテスト―検索セットをサンプリングによって取得し、トレーニングによって得られたメタ学習モデルをテスト―サポートセットにおいて更にトレーニングして医療因子及びイベントメタ学習モデルを取得し、
前記ステップ三は、サブステップ3.1~サブステップ3.4を含み、
前記サブステップ3.1では、中国語電子カルテテキストの系列エンコーダモデルをトレーニングし、テキストの文字レベルの意味ベクトル表現を取得し、
前記サブステップ3.2では、遠隔教師あり方法でラベル付けして得られた医療因子断片について、取得された文字レベルの意味ベクトル表現に基づいて、医療因子断片の特徴表現を算出し、
前記サブステップ3.3では、医療因子断片の特徴表現に基づいて、意味類似度を用いて医療因子断片を分類し、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片について、負サンプリングサンプルを構築し、医療因子及びイベントメタ学習モデルを用いて医療因子種別の重みを取得し、
前記サブステップ3.4では、医療因子種別の重みに基づいて、医療因子と負サンプリングサンプルとの医療因子認識モデルにおける損失を算出し、前記医療因子認識モデルのパラメータを更新し、
前記ステップ四は、サブステップ4.1~サブステップ4.3を含み、
前記サブステップ4.1では、医療イベントライブラリに基づいて各種別の医療イベントにおける医療因子の共起性及びイベント関連性特徴を算出し、専門家が医療イベント種別中の医療因子種別について採点した状況と組み合わせ、各種別の医療イベントの医療因子重要度スコアを取得し、
前記サブステップ4.2では、医療因子認識モデルから出力された中国語電子カルテテキストに存在する医療因子断片を基に、医療因子重要度スコアと組み合わせ、各種別の医療イベントの確率分布を取得し、
前記サブステップ4.3では、医療因子及びイベントメタ学習モデルを用いて、中国語電子カルテテキストと各種別の医療イベントの距離類似度スコアを算出し、ステップ4.2における各種別の医療イベントの確率分布と組み合わせ、対応する医療イベント種別を計算によって取得する。
前記医療因子ライブラリの構築過程は、
小サンプル医療因子及びイベントデータセットにおける2回以上現れた医療因子を対応する医療因子種別に応じて対応する種別の医療因子ライブラリに加えるステップa)と、
公開された高品質の外部医学資源の一部を選別して処理して対応する医療因子ライブラリに加えるステップb)とを含み、
前記医療イベントライブラリの構築において、小サンプル医療因子及びイベントデータセットにおけるラベル付けの小サンプル医療イベント及び医療因子種別を統計し、各ラベル付けのイベント及び因子について、対応関係を確立して記憶記録を行う。
前記処理a)では、中国語電子カルテテキスト
に対して無効文字のクリア、大文字小文字変換、句読点変換、文分割処理を行い、
前記処理b)では、中国語電子カルテテキスト
について、医療因子ライブラリを用いてマッチングを行い、疾患、薬物、症状、手術、原因、治療、診断との7種別に属さない医療因子について、医療因子ライブラリにマッチングする方法でラベル付けすることなく、ルールに基づく方式でラベル付け及び抽出を行い、
前記処理c)では、医療因子ライブラリにおける医療因子の最大断片長さ
を統計し、遠隔教師あり方法でラベル付けするときに断片の最大長さを
と規定し、マッチングによって得られた医療因子断片テキストに対して断片ラベル付けの方式でラベル付けを行い、医療因子としてマッチングされていない他のテキスト断片を負サンプルとしてラベル付けし、ラベル付けされたサンプルを
と記し、サンプル断片を
と記し、
は、サンプル断片
のテキスト
における開始位置と終了位置をそれぞれ示し、
は、サンプルに対応する種別である。
と余弦類似度スコア
との2つの部分を含み、
Bregmanダイバージェンス
は、
は、ユークリッド距離の計算関数であり、
は、因子又はイベントサンプル
の特徴表現であり、
は、種別
のプロトタイプ表現であり、
余弦類似度スコア
は、
は、種別
の特徴表現であり、
は、トレーニングパラメータであり、
サンプル
が種別
に属する距離類似度スコア
を
は、トレーニングパラメータであり、
サンプル
が種別
として予測される確率
を
は、トレーニング―検索セット
中の何れかの種別であり、
トレーニング―検索セットにおけるサンプル種別の実際結果及び認識結果に基づいて、メタ学習モデルの損失を算出し、Adamアルゴリズムで逆伝播を行ってパラメータを更新し、メタ学習モデルの損失関数
を
入力された中国語電子カルテテキストを
(ただし、
は、入力されたテキスト長さである)と記し、遠隔教師あり方法でラベル付けして得られたサンプルを
と記し、サンプル断片を
と記し、
は、サンプル断片
のテキスト
における開始位置と終了位置をそれぞれ示し、
は、サンプルに対応する種別であり、
系列エンコーダモデルを用いてテキストの文字レベルの意味ベクトル表現を取得し、即ち、医療因子の認識時に、テキスト
について、系列エンコーダモデルを介して各文字の意味ベクトル
を取得し、
サンプル
について、サンプル断片
の特徴表現
を
は、ベクトルのつなぎ合わせを示し、
は、ベクトルの対応する位置における要素の内積演算を示し、
サンプル断片の特徴表現を非線形変換し、サンプルが各種別に属する確率分布
を
は、トレーニングパラメータであり、
の出力次元は、サンプル種別数であり、
とし、
は、サンプル断片
が種別
に属する確率を示す。
とし、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片数を
とし、
個のサンプルをランダムにサンプリングして負サンプリングサンプルセット
(ただし、
)を構成し、負サンプリングサンプルセットを医療因子及びイベントメタ学習モデルに送り込み、負サンプリングサンプル
が各種別の医療因子に属する確率を取得し、確率値を重み
とし、
は、予測されたサンプル種別であり、合計
種別の医療因子があるとすると、グローバル損失関数
を
損失関数
を用いて勾配逆伝播を経て医療因子認識モデルのパラメータを更新する
が医療イベント種別
中の医療因子種別
について採点したスコアが
であり、スコアが整数であり且つ同一の専門家が各医療因子について採点したスコアが必ず異なると規定し、スコアの値範囲を
とし、
は、医療イベント種別
中の医療因子種別の総数であり、最終の医療イベント種別
中の医療因子種別
の正規化された専門家スコア
を
は、専門家数であり、医療因子種別
の医療イベント種別
における最終重要度スコア
を
入力された中国語電子カルテテキストを
と記し、
は、入力されたテキスト長さであり、医療因子認識モデルの予測によって得られた医療因子を
と記し、
は、テキストにおける医療因子数であり、医療イベント種別が合計Η個あるとし、医療因子重要度スコアと組み合わせ、テキスト
が医療イベント種別
に属する確率分布
を
中国語電子カルテテキスト
を医療因子及びイベントメタ学習モデルに送り込み、テキストと各種別の医療イベントの距離類似度スコア
を算出し、距離類似度スコアと医療イベントの確率分布とを組み合わせ、テキスト
が医療イベント種別
に属するスコア
を
を最終テキスト
の医療イベントとし、
医療イベントライブラリ構築及びデータラベル付けモジュールと、医療因子及びイベントメタ学習モジュールと、医療因子認識モジュールと、医療イベント認識モジュールとを備え、
前記医療イベントライブラリ構築及びデータラベル付けモジュールは、専門家知識に基づいて、医療イベント種別と各種別に対応する医療因子とを含む医療イベントライブラリを定義して構築し、医療イベントライブラリに基づいて遠隔教師あり方法を用いて中国語電子カルテテキストに対して医療因子のラベル付けを行い、医療因子認識モデルのトレーニングデータを生成し、
前記医療因子及びイベントメタ学習モジュールは、各分野に公開された中国語イベント及び因子ラベル付けコーパスをトレーニングセットとして選択してサンプリングし、対応するトレーニング―サポートセット及びトレーニング―検索セットを複数回のサンプリングによって取得し、トレーニング―サポートセットに基づいて対応するイベント及び因子のプロトタイプ表現を構築し、トレーニング―検索セットサンプルとプロトタイプ表現の距離類似度スコアを算出し、実際結果及び認識結果に基づいてメタ学習モデルの損失を算出し、前記メタ学習モデルのパラメータを更新し、小サンプル医療因子及びイベントデータセットをテストセットとし、対応するテスト―サポートセット及びテスト―検索セットをサンプリングによって取得し、トレーニングによって得られたメタ学習モデルをテスト―サポートセットにおいて更にトレーニングして医療因子及びイベントメタ学習モデルを取得し、
前記医療因子認識モジュールは、中国語電子カルテテキストの系列エンコーダモデルをトレーニングし、テキストの文字レベルの意味ベクトル表現を取得し、遠隔教師あり方法でラベル付けして得られた医療因子断片について、医療因子断片の特徴表現を算出し、意味類似度を用いて医療因子断片を分類し、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片について、負サンプリングサンプルを構築し、医療因子及びイベントメタ学習モデルを用いて医療因子種別の重みを取得し、医療因子と負サンプリングサンプルとの医療因子認識モデルにおける損失を算出し、医療因子認識モデルのパラメータを更新し、
前記医療イベント認識モジュールは、医療イベントライブラリに基づいて各種別の医療イベントにおける医療因子の共起性及びイベント関連性特徴を算出し、専門家が医療イベント種別中の医療因子種別について採点した状況と組み合わせ、各種別の医療イベントの医療因子重要度スコアを取得し、医療因子認識モデルから出力された中国語電子カルテテキストに存在する医療因子断片を基に、各種別の医療イベント確率分布を取得し、医療因子及びイベントメタ学習モデルを用いて中国語電子カルテテキストと各種別の医療イベントの距離類似度スコアを算出し、各種別の医療イベント確率分布と組み合わせ、対応する医療イベント種別を取得する。
1.医療イベントライブラリを構築し、遠隔教師あり方法を用いて、小サンプル弱ラベル付け条件での医療因子に対する自動ラベル付けを実現する。
2.複数の次元から医療因子及びイベントメタ学習モデルを構築し、小サンプル弱ラベル付け条件において医療イベント認識モデルの凡化性が悪くてラベル付けデータが不足である問題を解決する。
3.医療因子及びイベントメタ学習モデルを用いて負サンプリングを行い、ラベルなし医療因子を低い範囲に抑制し、遠隔教師あり方法によるラベル漏れ問題を減少させ、医療因子認識モデルの性能を向上させる。
4.医療イベントライブラリ及び専門家知識に基づいて医療因子重要度を算出し、医療因子重要度と医療因子及びイベントメタ学習モデルとを用いて医療イベントに対して分類認識を行い、医療イベントのトリガ単語が定義されにくい問題を解決する。
(1.1)医療イベント及び対応医療因子の定義:大量の中国語電子カルテテキストの特点に応じて、専門医者の指導の下で、9種の汎用の医療イベント種別、即ち、個人基本情報イベント、家族疾患イベント、過去疾患イベント、投薬イベント、アレルギーイベント、手術イベント、症状イベント、治療イベント、診断イベントを初歩的に定義する。また、各種のイベントについて、対応する医療因子を定義する。例えば、個人基本情報イベントにおいて、性別、年齢、身長、体重、婚姻状況、喫煙歴、飲酒歴をイベントの因子として定義する。症状イベントにおいて、症状、時間、頻度、傾向、再発状況、原因をイベント因子として定義する。更に例えば、過去疾患イベントにおいて、疾患、時間、治療方法をイベント因子として定義する。医療イベント及び因子の具体的な定義は、以下の表に示される。
ヒューリスティックな仮定に基づいて、医療因子断片が医療因子ライブラリにおいてある種別の医療因子としてラベル付けされた場合に、ラベル付けなしの中国語電子カルテテキスト中の当該因子断片は、何れも対応する種別の医療因子としてラベル付けされる。具体的な自動ラベル付けのステップは、下記のようになる。
について、医療因子ライブラリを用いてマッチングを行い、7種別に属さない医療因子、例えば、時間、性別、年齢等の情報について、ルールに基づく方式でマッチングを行う。
c)医療因子ライブラリにおける医療因子の最大断片長さ
を統計し、遠隔教師あり方法でラベル付けするときに断片の最大長さを
と規定する。マッチングによって得られた医療因子断片テキストに対して断片ラベル付けの方式でラベル付けを行い、医療因子としてマッチングされていない他のテキスト断片を負サンプルとしてラベル付けする。ラベル付けされたサンプルを
と記し、サンプル断片を
と記し、
は、サンプル断片
のテキスト
における開始位置と終了位置をそれぞれ示し、
は、サンプルに対応する種別である。
a)小サンプル弱ラベル付け条件において、小サンプル医療因子及びイベントデータセットトレーニング医療イベント認識モデルをそのまま使用すると、ラベル付けデータが少なく過ぎて深刻なオーバーフィッティングを引き起こす。メタ学習方法では、他の分野の大量のラベル付けコーパスを用いて、小サンプルデータのみを含むトレーニングタスクを複数構築し、小サンプルデータにおいて新たなタスクを迅速に習得する能力を有するモデルをトレーニングして取得する。
と記し、
中の医療因子及びイベントが合計N種別があるとし、各種別にT個のサンプルがある。サンプルを3:2で更にサポートセット
と検索セット
とに区分し、
での各種別にK個のサンプルがあるとし、
のメタ学習タスクを構築する。医療因子及びイベントラベル付けコーパスが少ないため、本発明では、各分野の高品質に公開された中国語イベント及び因子ラベル付けコーパスをトレーニングセットとし、
と記し、
でのイベント及び因子種別と医療イベント及び因子種別とが異なる。
を用いて
のメタ学習モデルをトレーニングする。テストセットサンプル構造過程に基づいて、トレーニングセット
からM回サンプリングし、毎回N種別のサンプルをサンプリングし、各種のサンプルに関し、K個のサンプルをサポートセット
としてサンプリングし、
中の同じ種別のサンプル数を検索セット
としてサンプリングする。
及び
を用いてM回のメタ学習モデルトレーニングを行うことにより、メタ学習モデルを
条件において医療因子及びイベント認識タスクを迅速に習得する能力を持たせる。得られたメタ学習モデルを更に医療因子及びイベントサンプルサポートセット
においてトレーニングして医療因子及びイベントメタ学習モデルを取得する。
を意味ベクトル
に符号化し、
は、入力されたテキスト長さであり、
は、第
個の文字であり、次に、
関数を用いて因子及びイベントの特徴を算出し、因子又はイベントサンプルを
とし、
をサンプル長さをとすると、その特徴表現は、
は、トレーニングパラメータである。
そして、分類モデルにおいて
中のN個の種別サンプルについてプロトタイプモデル化を行い、種別
に関し、
を種別
のサンプルセットとし、種別
のプロトタイプ表現は、
は、
中の各因子及びイベントとプロトタイプ表現
の距離類似度スコアを算出し、距離類似度スコアは、Bregmanダイバージェンス
と余弦類似度スコア
との2つの部分を含む。
Bregmanダイバージェンスは、ユークリッド距離であってもよく、即ち、
は、ユークリッド距離の計算関数である。
それとともに、因子及びイベントと種別
の余弦類似度スコア
を算出し、
を種別
の特徴表現として選択し、
は、トレーニングパラメータであり、
が種別
に属する距離類似度スコア
を
は、種別
に類似する。
は、トレーニングパラメータであり、一般的に(0,1)とし、本発明では、2つの側面を考慮し、距離類似度スコアをより全面的且つ正確に算出することができる。
サンプル
が種別
として予測される確率
を
は、
中の何れかの種別である。
中のサンプル種別の実際結果及び認識結果に基づいて、メタ学習モデルの損失を算出し、Adamアルゴリズムで逆伝播を行ってパラメータを更新し、メタ学習モデルの損失関数
を
においてトレーニングし、モデルのパラメータを最適化し、医療因子及びイベントメタ学習モデルを取得する。認識時に、
中の医療因子及びイベントサンプルを医療因子及びイベントメタ学習モデルに送り込み、対応する種別を取得する。
a)遠隔教師あり方法でラベル付けされた医療因子を用いて医療因子認識モデルをトレーニングする
入力された中国語電子カルテテキストを
と記し、
は、入力されたテキスト長さである。遠隔教師あり方法でラベル付けして得られたサンプルを
と記し、サンプル断片を
と記し、
は、サンプル断片
のテキスト
における開始位置と終了位置をそれぞれ示し、
は、サンプルに対応する種別である。
を
は、トレーニングパラメータであり、
の出力次元は、サンプル種別数であり、
とし、即ち、
は、サンプル断片
が種別
に属する確率を示す。
遠隔教師あり方法でデータをラベル付けする時に、構築された医療イベントライブラリと使用されるルールが限られた医療因子断片のみをカバーでき、全ての医療因子をカバーできず、真の医療因子断片が負サンプルとしてラベル付けされる場合もあり、これらの医療因子としてラベル付けされていない断片が医療因子認識モデルの結果へ大きな影響を与える。本発明では、トレーニング時に、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片に対して負サンプリングを行うとともに、医療因子及びイベントメタ学習モデルを用いてサンプリングサンプルの種別重みを取得することにより、医療因子認識モデルの小サンプル弱ラベル付け条件での凡化性を向上させる。
とし、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片数を
とし、
個のサンプルをランダムにサンプリングし、負サンプリングサンプルセット
を構成し、
とする。負サンプリングサンプルセットを医療因子及びイベントメタ学習モデルに送り込み、負サンプリングサンプル
が各種別の医療因子に属する確率を取得し、当該確率値作為重み
を
は、予測されたサンプル種別であり、合計
種別の医療因子があるとすると、構造グローバル損失関数
を
医療イベントテキストの意味が複雑であり、形式も統一されにくく、医療イベントのトリガ単語が定義されにくい問題を考慮し、本発明では、医療因子に基づいて医療イベントを認識する。それとともに、小サンプル弱ラベル付け条件でのモデルの凡化性及び正確性を向上させるために、医療因子及びイベントメタ学習モデルを用いて中国語電子カルテテキストと各種別の医療イベントの距離類似度スコアの側面から医療イベントをモデル化して認識する。
の医療イベント種別
における共起性スコア
を
は、医療イベントライブラリにおいて医療因子種別
と医療イベント種別
とがともに現れた回数を表し、
は、医療イベントライブラリにおいて医療イベント種別
が現れた回数を表す。
医療因子と医療イベントの関連性スコアを算出し、異なる医療因子種別と医療イベント関連性を区分する。同一の種別医療因子が非常に多い医療イベント種別に現れた場合に、当該類医療因子と各種別の医療イベントとの関連性が悪いと考えられる。
は、医療因子種別
と医療イベント種別
の関連性スコアを表し、
は、医療イベントライブラリにおいて医療因子種別
が現れた回数を表す。
医療因子種別
の医療イベント種別
における重要度スコア
を
とする。専門家
が医療イベント種別
中の医療因子種別
について採点したスコアを
とし、スコアが整数であり且つ同一の専門家が各医療因子について採点したスコアが必ず異なると規定し、スコアの値範囲を
とし、
は、医療イベント種別
中の医療因子種別の総数である。最終の医療イベント種別
中の医療因子種別
の正規化された専門家スコア
を
と記し、
は、入力されたテキスト長さであり、医療因子認識モデルの予測によって得られた医療因子を
と記し、
は、テキストにおける医療因子数であり、医療イベント種別が合計Η個あるとする。医療因子重要度スコアと組み合わせ、テキスト
が医療イベント種別
に属する確率分布
を
を医療因子及びイベントメタ学習モデルに送り込み、テキストと各種別の医療イベントの距離類似度スコア
を算出し、距離類似度スコアと医療イベントの確率分布とを組み合わせ、テキスト
が医療イベント種別
に属するスコア
を
を最終テキスト
の医療イベントとし、
Claims (9)
- 医療イベントライブラリ構築及びデータラベル付けモジュールと、医療因子及びイベントメタ学習モジュールと、医療因子認識モジュールと、医療イベント認識モジュールとを備える小サンプル弱ラベル付け条件での医療イベント認識システムが実行する小サンプル弱ラベル付け条件での医療イベント認識方法であって、
前記医療イベントライブラリ構築及びデータラベル付けモジュールが医療イベントライブラリの構築及びデータのラベル付けを行うステップ一と、
前記医療因子及びイベントメタ学習モジュールが医療因子及びイベントのメタ学習を行うステップ二と、
前記医療因子認識モジュールが医療因子を認識するステップ三と、
前記医療イベント認識モジュールが医療イベントを認識するステップ四とを含み、
前記ステップ一では、専門家知識に基づいて、医療イベント種別と各種別に対応する医療因子とを含む医療イベントライブラリを定義して構築し、医療イベントライブラリに基づいて遠隔教師あり方法を用いて中国語電子カルテテキストに対して医療因子のラベル付けを行い、医療因子認識モデルのトレーニングデータを生成し、
前記ステップ二は、サブステップ2.1~サブステップ2.4を含み、
前記サブステップ2.1では、各分野に公開された中国語イベント及び因子ラベル付けコーパスをトレーニングセットとして選択してサンプリングし、対応するトレーニング―サポートセット及びトレーニング―検索セットを複数回のサンプリングによって取得し、
前記サブステップ2.2では、トレーニング―サポートセットに基づいて、対応するイベント及び因子のプロトタイプ表現を構築し、
前記サブステップ2.3では、因子及びイベントのプロトタイプ表現に基づいて、トレーニング―検索セットサンプルとプロトタイプ表現の距離類似度スコアを算出し、実際結果及び認識結果に基づいてメタ学習モデルの損失を算出し、前記メタ学習モデルのパラメータを更新し、
前記サブステップ2.4では、小サンプル医療因子及びイベントデータセットをテストセットとし、対応するテスト―サポートセット及びテスト―検索セットをサンプリングによって取得し、トレーニングによって得られたメタ学習モデルをテスト―サポートセットにおいて更にトレーニングして医療因子及びイベントメタ学習モデルを取得し、
前記ステップ三は、サブステップ3.1~サブステップ3.4を含み、
前記サブステップ3.1では、中国語電子カルテテキストの系列エンコーダモデルをトレーニングし、テキストの文字レベルの意味ベクトル表現を取得し、入力された中国語電子カルテテキストを
(ただし、
は、入力されたテキスト長さである)と記し、遠隔教師あり方法でラベル付けして得られたサンプルを
と記し、サンプル断片を
と記し、
は、サンプル断片
のテキスト
における開始位置と終了位置をそれぞれ示し、
は、サンプルに対応する種別であり、
前記サブステップ3.2では、遠隔教師あり方法でラベル付けして得られた医療因子断片について、取得された文字レベルの意味ベクトル表現に基づいて、医療因子断片の特徴表現を算出し、医療因子の認識時に、テキスト
について、系列エンコーダモデルを介して各文字の意味ベクトル
を取得し、
サンプル
について、サンプル断片
の特徴表現
を
は、ベクトルのつなぎ合わせを示し、
は、ベクトルの対応する位置における要素の内積演算を示し、
サンプル断片の特徴表現を非線形変換し、サンプルが各種別に属する確率分布
を
は、トレーニングパラメータであり、
の出力次元は、サンプル種別数であり、
とし、
は、サンプル断片
が種別
に属する確率を示し、
前記サブステップ3.3では、医療因子断片の特徴表現に基づいて、意味類似度を用いて医療因子断片を分類し、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片について、負サンプリングサンプルを構築し、医療因子及びイベントメタ学習モデルを用いて医療因子種別の重みを取得し、
前記サブステップ3.4では、医療因子種別の重みに基づいて、医療因子と負サンプリングサンプルとの医療因子認識モデルにおける損失を算出し、前記医療因子認識モデルのパラメータを更新し、
前記ステップ四は、サブステップ4.1~サブステップ4.3を含み、
前記サブステップ4.1では、医療イベントライブラリに基づいて各種別の医療イベントにおける医療因子の共起性及びイベント関連性特徴を算出し、専門家が医療イベント種別中の医療因子種別について採点した状況と組み合わせ、各種別の医療イベントの医療因子重要度スコアを取得し、
前記サブステップ4.2では、医療因子認識モデルから出力された中国語電子カルテテキストに存在する医療因子断片を基に、医療因子重要度スコアと組み合わせ、各種別の医療イベントの確率分布を取得し、
前記サブステップ4.3では、医療因子及びイベントメタ学習モデルを用いて、中国語電子カルテテキストと各種別の医療イベントの距離類似度スコアを算出し、ステップ4.2における各種別の医療イベントの確率分布と組み合わせ、対応する医療イベント種別を計算によって取得することを特徴とする小サンプル弱ラベル付け条件での医療イベント認識方法。 - 前記ステップ一では、前記医療イベントライブラリのデータは、小サンプル医療因子及びイベントデータセットと外部医学資源とに由来し、前記医療イベント種別は、個人基本情報イベント、家族疾患イベント、過去疾患イベント、投薬イベント、アレルギーイベント、手術イベント、症状イベント、治療イベント及び診断イベントを含むことを特徴とする請求項1に記載の小サンプル弱ラベル付け条件での医療イベント認識方法。
- 前記ステップ一では、医療因子ライブラリを構築してから医療イベントライブラリを構築し、
前記医療因子ライブラリの構築過程は、
小サンプル医療因子及びイベントデータセットにおける2回以上現れた医療因子を対応する医療因子種別に応じて対応する種別の医療因子ライブラリに加えるステップa)と、
公開された高品質の外部医学資源の一部を選別して処理して対応する医療因子ライブラリに加えるステップb)とを含み、
前記医療イベントライブラリの構築において、小サンプル医療因子及びイベントデータセットにおけるラベル付けの小サンプル医療イベント及び医療因子種別を統計し、各ラベル付けのイベント及び因子について、対応関係を確立して記憶記録を行うことを特徴とする請求項2に記載の小サンプル弱ラベル付け条件での医療イベント認識方法。 - 前記ステップ一では、遠隔教師あり方法を用いて医療因子をラベル付けすることは、処理a)と、処理b)と、処理c)と、を含み、
前記処理a)では、中国語電子カルテテキスト
に対して無効文字のクリア、大文字小文字変換、句読点変換、文分割処理を行い、
前記処理b)では、中国語電子カルテテキスト
について、医療因子ライブラリを用いてマッチングを行い、疾患、薬物、症状、手術、原因、治療、診断との7種別に属さない医療因子について、医療因子ライブラリにマッチングする方法でラベル付けすることなく、ルールに基づく方式でラベル付け及び抽出を行い、
前記処理c)では、医療因子ライブラリにおける医療因子の最大断片長さ
を統計し、遠隔教師あり方法でラベル付けするときに断片の最大長さを
と規定し、マッチングによって得られた医療因子断片テキストに対して断片ラベル付けの方式でラベル付けを行い、医療因子としてマッチングされていない他のテキスト断片を負サンプルとしてラベル付けし、ラベル付けされたサンプルを
と記し、サンプル断片を
と記し、
は、サンプル断片
のテキスト
における開始位置と終了位置をそれぞれ示し、
は、サンプルに対応する種別であることを特徴とする請求項3に記載の小サンプル弱ラベル付け条件での医療イベント認識方法。 - 前記ステップ2.2において、トレーニング―サポートセットに基づいて、対応するイベント及び因子のプロトタイプ表現を構築することは、各種別のサンプルの意味ベクトルを高次元の特徴空間に投影し、各サンプルの特徴を次元に応じて加算平均して種別のプロトタイプ表現とすることを含むことを特徴とする請求項1に記載の小サンプル弱ラベル付け条件での医療イベント認識方法。
- 前記ステップ2.3において、距離類似度スコアは、Bregmanダイバージェンス
と余弦類似度スコア
との2つの部分を含み、
Bregmanダイバージェンス
は、
は、ユークリッド距離の計算関数であり、
は、因子又はイベントサンプル
の特徴表現であり、
は、種別
のプロトタイプ表現であり、
余弦類似度スコア
は、
は、種別
の特徴表現であり、
は、トレーニングパラメータであり、
サンプル
が種別
に属する距離類似度スコア
を
は、トレーニングパラメータであり、
サンプル
が種別
として予測される確率
を
は、トレーニング―検索セット
中の何れかの種別であり、
トレーニング―検索セットにおけるサンプル種別の実際結果及び認識結果に基づいて、メタ学習モデルの損失を算出し、Adamアルゴリズムで逆伝播を行ってパラメータを更新し、メタ学習モデルの損失関数
を
- 前記ステップ三では、全てのサンプルセットを
とし、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片数を
とし、
個のサンプルをランダムにサンプリングして負サンプリングサンプルセット
(ただし、
)を構成し、負サンプリングサンプルセットを医療因子及びイベントメタ学習モデルに送り込み、負サンプリングサンプル
が各種別の医療因子に属する確率を取得し、確率値を重み
とし、
は、予測されたサンプル種別であり、合計
種別の医療因子があるとすると、グローバル損失関数
を
損失関数
を用いて勾配逆伝播を経て医療因子認識モデルのパラメータを更新することを特徴とする請求項1に記載の小サンプル弱ラベル付け条件での医療イベント認識方法。 - 前記ステップ四では、構築された医療イベントライブラリについて、医療因子種別
の医療イベント種別
における重要度スコア
を
は、医療因子種別
の医療イベント種別
における共起性スコアであり、
は、医療因子種別
と医療イベント種別
との関連性スコアであり、
医療因子を医療イベントの基本次元とし、複数の専門家が同時に医療因子について採点したとし、専門家
が医療イベント種別
中の医療因子種別
について採点したスコアが
であり、スコアが整数であり且つ同一の専門家が各医療因子について採点したスコアが必ず異なると規定し、スコアの値範囲を
とし、
は、医療イベント種別
中の医療因子種別の総数であり、最終の医療イベント種別
中の医療因子種別
の正規化された専門家スコア
を
は、専門家数であり、医療因子種別
の医療イベント種別
における最終重要度スコア
を
入力された中国語電子カルテテキストを
と記し、
は、入力されたテキスト長さであり、医療因子認識モデルの予測によって得られた医療因子を
と記し、
は、テキストにおける医療因子数であり、医療イベント種別が合計Η個あるとし、医療因子重要度スコアと組み合わせ、テキスト
が医療イベント種別
に属する確率分布
を
中国語電子カルテテキスト
を医療因子及びイベントメタ学習モデルに送り込み、テキストと各種別の医療イベントの距離類似度スコア
を算出し、距離類似度スコアと医療イベントの確率分布とを組み合わせ、テキスト
が医療イベント種別
に属するスコア
を
を最終テキスト
の医療イベントとし、
- 小サンプル弱ラベル付け条件での医療イベント認識システムであって、
医療イベントライブラリ構築及びデータラベル付けモジュールと、医療因子及びイベントメタ学習モジュールと、医療因子認識モジュールと、医療イベント認識モジュールとを備え、
前記医療イベントライブラリ構築及びデータラベル付けモジュールは、専門家知識に基づいて、医療イベント種別と各種別に対応する医療因子とを含む医療イベントライブラリを定義して構築し、医療イベントライブラリに基づいて遠隔教師あり方法を用いて中国語電子カルテテキストに対して医療因子のラベル付けを行い、医療因子認識モデルのトレーニングデータを生成し、
前記医療因子及びイベントメタ学習モジュールは、各分野に公開された中国語イベント及び因子ラベル付けコーパスをトレーニングセットとして選択してサンプリングし、対応するトレーニング―サポートセット及びトレーニング―検索セットを複数回のサンプリングによって取得し、トレーニング―サポートセットに基づいて対応するイベント及び因子のプロトタイプ表現を構築し、トレーニング―検索セットサンプルとプロトタイプ表現の距離類似度スコアを算出し、実際結果及び認識結果に基づいてメタ学習モデルの損失を算出し、前記メタ学習モデルのパラメータを更新し、小サンプル医療因子及びイベントデータセットをテストセットとし、対応するテスト―サポートセット及びテスト―検索セットをサンプリングによって取得し、トレーニングによって得られたメタ学習モデルをテスト―サポートセットにおいて更にトレーニングして医療因子及びイベントメタ学習モデルを取得し、
前記医療因子認識モジュールは、中国語電子カルテテキストの系列エンコーダモデルをトレーニングし、テキストの文字レベルの意味ベクトル表現を取得し、遠隔教師あり方法でラベル付けして得られた医療因子断片について、医療因子断片の特徴表現を算出し、意味類似度を用いて医療因子断片を分類し、医療因子認識モデルがトレーニング中に予測した全ての非医療因子断片について、負サンプリングサンプルを構築し、医療因子及びイベントメタ学習モデルを用いて医療因子種別の重みを取得し、医療因子と負サンプリングサンプルとの医療因子認識モデルにおける損失を算出し、医療因子認識モデルのパラメータを更新し、
遠隔教師あり方法でラベル付けされた医療因子を用いて医療因子認識モデルをトレーニングすることは、
入力された中国語電子カルテテキストを
(ただし、
は、入力されたテキスト長さである)と記し、遠隔教師あり方法でラベル付けして得られたサンプルを
と記し、サンプル断片を
と記し、
は、サンプル断片
のテキスト
における開始位置と終了位置をそれぞれ示し、
は、サンプルに対応する種別であり、
系列エンコーダモデルを用いてテキストの文字レベルの意味ベクトル表現を取得し、医療因子の認識時に、テキスト
について、系列エンコーダモデルを介して各文字の意味ベクトル
を取得し、
サンプル
について、サンプル断片
の特徴表現
を
は、ベクトルのつなぎ合わせを示し、
は、ベクトルの対応する位置における要素の内積演算を示し、
サンプル断片の特徴表現を非線形変換し、サンプルが各種別に属する確率分布
を
は、トレーニングパラメータであり、
の出力次元は、サンプル種別数であり、
とし、
は、サンプル断片
が種別
に属する確率を示し、
前記医療イベント認識モジュールは、医療イベントライブラリに基づいて各種別の医療イベントにおける医療因子の共起性及びイベント関連性特徴を算出し、専門家が医療イベント種別中の医療因子種別について採点した状況と組み合わせ、各種別の医療イベントの医療因子重要度スコアを取得し、医療因子認識モデルから出力された中国語電子カルテテキストに存在する医療因子断片を基に、各種別の医療イベント確率分布を取得し、医療因子及びイベントメタ学習モデルを用いて中国語電子カルテテキストと各種別の医療イベントの距離類似度スコアを算出し、各種別の医療イベント確率分布と組み合わせ、対応する医療イベント種別を取得することを特徴とする小サンプル弱ラベル付け条件での医療イベント認識システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111247796.7A CN113688248B (zh) | 2021-10-26 | 2021-10-26 | 一种小样本弱标注条件下的医疗事件识别方法及系统 |
CN202111247796.7 | 2021-10-26 | ||
PCT/CN2022/116968 WO2023071530A1 (zh) | 2021-10-26 | 2022-09-05 | 一种小样本弱标注条件下的医疗事件识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023552912A JP2023552912A (ja) | 2023-12-19 |
JP7464800B2 true JP7464800B2 (ja) | 2024-04-09 |
Family
ID=78588046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023536800A Active JP7464800B2 (ja) | 2021-10-26 | 2022-09-05 | 小サンプル弱ラベル付け条件での医療イベント認識方法及びシステム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7464800B2 (ja) |
CN (1) | CN113688248B (ja) |
WO (1) | WO2023071530A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113688248B (zh) * | 2021-10-26 | 2022-02-22 | 之江实验室 | 一种小样本弱标注条件下的医疗事件识别方法及系统 |
CN115187187A (zh) * | 2022-05-25 | 2022-10-14 | 中核武汉核电运行技术股份有限公司 | 一种核电数据标注工具 |
CN116452895B (zh) * | 2023-06-13 | 2023-10-20 | 中国科学技术大学 | 基于多模态对称增强的小样本图像分类方法、装置及介质 |
CN117390090B (zh) * | 2023-12-11 | 2024-04-12 | 安徽思高智能科技有限公司 | 一种rpa流程挖掘方法、存储介质、电子设备 |
CN117435747B (zh) * | 2023-12-18 | 2024-03-29 | 中南大学 | 基于多层级细化网络的少样本链接预测药物再利用方法 |
CN117520484B (zh) * | 2024-01-04 | 2024-04-16 | 中国电子科技集团公司第十五研究所 | 基于大数据语义的相似事件检索方法、系统、设备和介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200176112A1 (en) | 2018-11-30 | 2020-06-04 | International Business Machines Corporation | Automated labeling of images to train machine learning |
CN111834014A (zh) | 2020-07-17 | 2020-10-27 | 北京工业大学 | 一种医疗领域命名实体识别方法及系统 |
CN112365464A (zh) | 2020-11-09 | 2021-02-12 | 成都信息工程大学 | 一种基于gan的医学图像病变区域弱监督定位方法 |
CN112488996A (zh) | 2020-11-18 | 2021-03-12 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 非齐次三维食管癌能谱ct弱监督自动标注方法与系统 |
CN112598622A (zh) | 2020-12-03 | 2021-04-02 | 天津理工大学 | 一种融合深度多示例学习和包间相似性的乳腺癌检测方法 |
US20210272681A1 (en) | 2019-04-10 | 2021-09-02 | Tencent Technology (Shenzhen) Company Limited | Image recognition model training method and apparatus, and image recognition method, apparatus, and system |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357924B (zh) * | 2017-07-25 | 2020-04-24 | 为朔医学数据科技(北京)有限公司 | 一种精准医学知识图谱构建方法和装置 |
US11250331B2 (en) * | 2017-10-31 | 2022-02-15 | Microsoft Technology Licensing, Llc | Distant supervision for entity linking with filtering of noise |
CN112542223A (zh) * | 2020-12-21 | 2021-03-23 | 西南科技大学 | 一种从中文电子病历构建医疗知识图谱的半监督学习方法 |
CN112906393A (zh) * | 2021-03-05 | 2021-06-04 | 杭州费尔斯通科技有限公司 | 一种基于元学习的少样本实体识别方法 |
CN113688248B (zh) * | 2021-10-26 | 2022-02-22 | 之江实验室 | 一种小样本弱标注条件下的医疗事件识别方法及系统 |
-
2021
- 2021-10-26 CN CN202111247796.7A patent/CN113688248B/zh active Active
-
2022
- 2022-09-05 WO PCT/CN2022/116968 patent/WO2023071530A1/zh active Application Filing
- 2022-09-05 JP JP2023536800A patent/JP7464800B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200176112A1 (en) | 2018-11-30 | 2020-06-04 | International Business Machines Corporation | Automated labeling of images to train machine learning |
US20210272681A1 (en) | 2019-04-10 | 2021-09-02 | Tencent Technology (Shenzhen) Company Limited | Image recognition model training method and apparatus, and image recognition method, apparatus, and system |
CN111834014A (zh) | 2020-07-17 | 2020-10-27 | 北京工业大学 | 一种医疗领域命名实体识别方法及系统 |
CN112365464A (zh) | 2020-11-09 | 2021-02-12 | 成都信息工程大学 | 一种基于gan的医学图像病变区域弱监督定位方法 |
CN112488996A (zh) | 2020-11-18 | 2021-03-12 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 非齐次三维食管癌能谱ct弱监督自动标注方法与系统 |
CN112598622A (zh) | 2020-12-03 | 2021-04-02 | 天津理工大学 | 一种融合深度多示例学习和包间相似性的乳腺癌检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113688248A (zh) | 2021-11-23 |
JP2023552912A (ja) | 2023-12-19 |
CN113688248B (zh) | 2022-02-22 |
WO2023071530A1 (zh) | 2023-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7464800B2 (ja) | 小サンプル弱ラベル付け条件での医療イベント認識方法及びシステム | |
CN112597774B (zh) | 中文医疗命名实体识别方法、系统、存储介质和设备 | |
CN111048167B (zh) | 一种层级式病例结构化方法及系统 | |
CN109299239A (zh) | 一种基于es的电子病历检索方法 | |
Huddar et al. | Predicting complications in critical care using heterogeneous clinical data | |
Ramachandran et al. | Named entity recognition on bio-medical literature documents using hybrid based approach | |
CN106909783A (zh) | 一种基于时间线的病历文本医学知识发现方法 | |
Wang et al. | A framework and its empirical study of automatic diagnosis of traditional Chinese medicine utilizing raw free-text clinical records | |
CN110569343B (zh) | 一种基于问答的临床文本结构化方法 | |
Fakhfakh et al. | Prognet: Covid-19 prognosis using recurrent and convolutional neural networks | |
CN112466462B (zh) | 一种基于图深度学习的emr信息关联及演化方法 | |
CN115171871A (zh) | 一种基于知识图谱与注意力机制的心血管疾病预测方法 | |
Liu et al. | Knowledge-aware deep dual networks for text-based mortality prediction | |
Ke et al. | Medical entity recognition and knowledge map relationship analysis of Chinese EMRs based on improved BiLSTM-CRF | |
Leng et al. | Bi-level artificial intelligence model for risk classification of acute respiratory diseases based on Chinese clinical data | |
Mansouri et al. | Predicting hospital length of stay of neonates admitted to the NICU using data mining techniques | |
An | Construction and application of Chinese breast cancer knowledge graph based on multi-source heterogeneous data | |
Wang et al. | Research on named entity recognition of doctor-patient question answering community based on bilstm-crf model | |
Galitsky | Multi-case-based reasoning by syntactic-semantic alignment and discourse analysis | |
CN113643825B (zh) | 基于临床关键特征信息的医疗案例知识库构建方法和系统 | |
Yu et al. | Fusion model for tentative diagnosis inference based on clinical narratives | |
Wang et al. | Automatic ICD-10 coding based on multi-head attention mechanism and gated residual network | |
Zhang et al. | Medical Q&A statement NER based on ECA attention mechanism and lexical enhancement | |
Li et al. | Medical text entity recognition based on CRF and joint entity | |
US20230317279A1 (en) | Method and system for medical diagnosis using graph embeddings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230615 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7464800 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |