JP2021532499A - 機械学習に基づく医療データ分類方法、装置、コンピュータデバイス及び記憶媒体 - Google Patents
機械学習に基づく医療データ分類方法、装置、コンピュータデバイス及び記憶媒体 Download PDFInfo
- Publication number
- JP2021532499A JP2021532499A JP2021506440A JP2021506440A JP2021532499A JP 2021532499 A JP2021532499 A JP 2021532499A JP 2021506440 A JP2021506440 A JP 2021506440A JP 2021506440 A JP2021506440 A JP 2021506440A JP 2021532499 A JP2021532499 A JP 2021532499A
- Authority
- JP
- Japan
- Prior art keywords
- text
- medical
- data
- vectors
- record information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/20—ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioethics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Description
本願は、2019年3月7日に中国国家知識産権局に提出された「機械学習に基づく医療データ分類方法、装置及びコンピュータデバイス」と題する中国特許出願第2019101715930号の優先権を主張し、その全体が引用により本願に組み込まれる。
ステップ202で、端末が送信した医療データ分類要求を受信し、医療データ分類要求は診療録情報を含む。
ステップ302で、予め設定された医療用語集を取得し、医療用語集には複数の医療用語が含まれ、診療録情報中の複数のテキストデータと医療用語集とのマッチングを行って、診療録情報中のテキストデータと複数の医療用語とのマッチング度を計算し、予め設定されたマッチング度に達するテキストデータを抽出する。
ステップ402で、複数の医療データを取得し、複数の医療データに基づいて対応するトレーニングセットデータ及び検証セットデータを生成する。
単語分割処理モジュール504は、予め設定された医療用語集を取得し、医療用語集中の医療用語に基づいて診療録情報に単語分割処理を行って、複数のテキストベクトルを得るために用いられる。
特徴抽出モジュール506は、複数のテキストベクトルに特徴抽出を行って、複数のテキストベクトル及び対応する特徴次元値を得るために用いられる。
データ分類モジュール508は、ターゲット分類器を取得し、ターゲット分類器の複数のニューラルネットワークノードによって複数のテキストベクトル及び対応する特徴次元値を走査して計算するために用いられ、ターゲット分類器は複数の医療データでトレーニングして得られ、さらに、複数のテキストベクトルに対応するターゲットノードまで走査すると、ターゲットノードに基づいて複数のテキストベクトルに対応するカテゴリ確率を計算し、カテゴリ確率に基づいて診療録情報に対応するカテゴリ結果を得るために用いられる。
データプッシュ通知モジュール510は、診療録情報に対応するカテゴリ結果を端末にプッシュ通知するために用いられる。
Claims (20)
- 端末が送信した医療データ分類要求を受信するステップであって、前記医療データ分類要求は診療録情報を含むステップと、
予め設定された医療用語集を取得し、前記医療用語集中の医療用語に基づいて前記診療録情報に単語分割処理を行って、複数のテキストベクトルを得るステップと、
前記複数のテキストベクトルに特徴抽出を行って、複数のテキストベクトル及び対応する特徴次元値を得るステップと、
ターゲット分類器を取得し、前記ターゲット分類器の複数のニューラルネットワークノードによって前記複数のテキストベクトル及び対応する特徴次元値を走査して計算するステップであって、前記ターゲット分類器は複数の医療データでトレーニングして得られるステップと、
前記複数のテキストベクトルに対応するターゲットノードまで走査すると、前記ターゲットノードに基づいて前記複数のテキストベクトルに対応するカテゴリ確率を計算し、前記カテゴリ確率に基づいて前記診療録情報に対応するカテゴリ結果を得るステップと、
前記診療録情報に対応するカテゴリ結果を前記端末にプッシュ通知するステップとを含む、機械学習に基づく医療データ分類方法。 - 前記診療録情報には複数のテキストデータが含まれ、前記診療録情報に単語分割処理を行う前記ステップは、
予め設定された複数の医療用語を含む医療用語集を取得し、前記診療録情報中の複数のテキストデータと前記医療用語集とのマッチングを行って、前記診療録情報中のテキストデータと複数の医療用語とのマッチング度を計算し、予め設定されたマッチング度に達するテキストデータを抽出するステップと、
マッチング後のテキストデータに基づいて前記診療録情報に単語分割を行って、単語分割後の複数のテキストデータを得るステップと、
前記単語分割後の複数のテキストデータにベクトル変換を行って、複数のテキストベクトルを得るステップとを含むことを特徴とする、請求項1に記載の方法。 - 前記複数のテキストベクトルに特徴抽出を行って、複数のテキストベクトル及び対応する特徴次元値を得る前記ステップは、
前記複数のテキストベクトルの単語出現頻度及び逆文書頻度を計算するステップと、
前記単語出現頻度及び前記逆文書頻度に基づいて、予め設定されたアルゴリズムに従って複数のテキストベクトルの重みを計算するステップと、
前記重みが予め設定された閾値に達するテキストベクトルを抽出するステップと、
予め設定されたアルゴリズム及び前記重みに基づいて前記テキストベクトルに対応する特徴次元値を計算するステップとを含むことを特徴とする、請求項1に記載の方法。 - 前記ターゲット分類器を構築するステップは、
複数の医療データを取得し、前記複数の医療データに基づいて対応するトレーニングセットデータ及び検証セットデータを生成するステップと、
前記トレーニングセットデータ中の複数の医療データにクラスター分析を行って、クラスタリング結果を得るステップと、
前記クラスタリング結果に特徴抽出を行って、複数の特徴変数を抽出するステップと、
予め設定されたニューラルネットワークモデルを取得し、前記ニューラルネットワークモデルによって前記トレーニングセットデータをトレーニングすることにより、複数の特徴変数に対応する特徴次元値及び重みを得、複数の特徴変数に対応する特徴次元値及び重みに基づいて初期分類器を構築するステップと、
前記検証セットデータを利用して前記初期分類器の更なるトレーニング及び検証を行い、前記検証セットデータで予め設定された閾値を満たすデータの数量が予め設定された比率に達すると、トレーニングを終了し、所定のターゲット分類器を得るステップとを含むことを特徴とする、請求項1に記載の方法。 - テキストには複数のテキストセンテンスが含まれ、前記複数のテキストセンテンスがテキストブロックを構成し、前記ターゲット分類器の複数のニューラルネットワークノードによって前記複数のテキストベクトル及び対応する特徴次元値を走査して複数のテキストベクトルに対応するカテゴリを計算する前記ステップは、
前記ターゲット分類器を利用して前記特徴次元値から前記複数のテキストベクトル間の相関性を計算し、前記相関性に基づいて前記テキストで文と認められるテキストセンテンスを計算し、前記テキストセンテンスのセンテンスベクトルを計算するステップと、
前記センテンスベクトルの特徴を抽出し、前記複数のセンテンスベクトルの特徴に基づいてテキストブロックベクトルを算出するステップと、
前記テキストブロックベクトルの各カテゴリに対応する確率を計算し、予め設定された確率値に達するカテゴリを抽出し、前記テキストブロックに対して対応するカテゴリタグを追加するステップとを含むことを特徴とする、請求項1から4のいずれか1項に記載の方法。 - 予め設定された頻度に基づいて、予め設定されたデータベースから複数の過去医療データを取得するステップと、
複数の過去医療データにクラスター分析を行って、分析結果を得るステップと、
前記分析結果に基づいて特徴選択を行って、複数の特徴変数を得るステップと、
予め設定されたアルゴリズムに従って複数の特徴変数の重みを計算するステップと、
複数の特徴変数及び対応する重みに基づいて前記ターゲット分類器の最適化を行って調整するステップとをさらに含むことを特徴とする、請求項1に記載の方法。 - 端末が送信した医療データ分類要求を受信するために用いられ、前記医療データ分類要求は診療録情報を含む要求受信モジュールと、
予め設定された医療用語集を取得し、前記医療用語集中の医療用語に基づいて前記診療録情報に単語分割処理を行って、複数のテキストベクトルを得るための単語分割処理モジュールと、
前記複数のテキストベクトルに特徴抽出を行って、複数のテキストベクトル及び対応する特徴次元値を得るための特徴抽出モジュールと、
ターゲット分類器を取得し、前記ターゲット分類器の複数のニューラルネットワークノードによって前記複数のテキストベクトル及び対応する特徴次元値を走査して計算するために用いられ、前記ターゲット分類器は複数の医療データでトレーニングして得られるデータ分類モジュールであって、前記複数のテキストベクトルに対応するターゲットノードまで走査すると、前記ターゲットノードに基づいて前記複数のテキストベクトルに対応するカテゴリ確率を計算し、前記カテゴリ確率に基づいて前記診療録情報に対応するカテゴリ結果を得るデータ分類モジュールと、
前記診療録情報に対応するカテゴリ結果を前記端末にプッシュ通知するためのデータプッシュ通知モジュールとを含む、機械学習に基づく医療データ分類装置。 - 前記単語分割処理モジュールは予め設定された複数の医療用語を含む医療用語集を取得し、前記診療録情報中の複数のテキストデータと前記医療用語集とのマッチングを行って、前記診療録情報中のテキストデータと複数の医療用語とのマッチング度を計算し、予め設定されたマッチング度に達するテキストデータを抽出し、マッチング後のテキストデータに基づいて前記診療録情報に単語分割を行って、単語分割後の複数のテキストデータを得、前記単語分割後の複数のテキストデータをベクトル化して、複数のテキストベクトルを得るためにも用いられることを特徴とする、請求項7に記載の装置。
- 前記特徴抽出モジュールは、前記複数のテキストベクトルの単語出現頻度及び逆文書頻度を計算し、前記単語出現頻度及び前記逆文書頻度に基づいて、予め設定されたアルゴリズムに従って複数のテキストベクトルの重みを計算し、前記重みが予め設定された閾値に達するテキストベクトルを抽出し、予め設定されたアルゴリズム及び前記重みに基づいて前記テキストベクトルに対応する特徴次元値を計算するためにも用いられることを特徴とする、請求項7に記載の装置。
- 分類器構築モジュールであって、複数の医療データを取得し、前記複数の医療データに基づいて対応するトレーニングセットデータ及び検証セットデータを生成し、前記トレーニングセットデータ中の複数の医療データにクラスター分析を行って、クラスタリング結果を得、前記クラスタリング結果に特徴抽出を行って、複数の特徴変数を抽出し、予め設定されたニューラルネットワークモデルを取得し、前記ニューラルネットワークモデルによって前記トレーニングセットデータをトレーニングすることにより、複数の特徴変数に対応する特徴次元値及び重みを得、複数の特徴変数に対応する特徴次元値及び重みに基づいて初期分類器を構築し、前記検証セットデータを利用して前記初期分類器の更なるトレーニング及び検証を行い、前記検証セットデータで予め設定された閾値を満たすデータの数量が予め設定された比率に達すると、トレーニングを終了し、所定のターゲット分類器を得るための分類器構築モジュールをさらに含むことを特徴とする、請求項7に記載の装置。
- テキストには複数のテキストセンテンスが含まれ、前記複数のテキストセンテンスがテキストブロックを構成し、前記データ分類モジュールは、前記ターゲット分類器を利用して前記特徴次元値から前記複数のテキストベクトル間の相関性を計算し、前記相関性に基づいて前記テキストで文と認められるテキストセンテンスを計算し、前記テキストセンテンスのセンテンスベクトルを計算し、前記センテンスベクトルの特徴を抽出し、前記複数のセンテンスベクトルの特徴に基づいてテキストブロックベクトルを算出し、前記テキストブロックベクトルの各カテゴリに対応する確率を計算し、予め設定された確率値に達するカテゴリを抽出し、前記テキストブロックに対して対応するカテゴリタグを追加するためにも用いられることを特徴とする、請求項7に記載の装置。
- モデル最適化モジュールであって、予め設定された頻度に基づいて、予め設定されたデータベースから複数の過去医療データを取得し、複数の過去医療データにクラスター分析を行って、分析結果を得、前記分析結果に基づいて特徴選択を行って、複数の特徴変数を得、予め設定されたアルゴリズムに従って複数の特徴変数の重みを計算し、複数の特徴変数及び対応する重みに基づいて前記ターゲット分類器の最適化を行って調整するモデル最適化モジュールをさらに含むことを特徴とする、請求項7に記載の装置。
- メモリと、プロセッサとを含み、前記メモリには少なくとも1つのコンピュータ可読コマンドが記憶されており、前記コンピュータ可読コマンドが前記プロセッサによってロードされると、
端末が送信した医療データ分類要求を受信するステップであって、前記医療データ分類要求は診療録情報を含むステップと、
予め設定された医療用語集を取得し、前記医療用語集中の医療用語に基づいて前記診療録情報に単語分割処理を行って、複数のテキストベクトルを得るステップと、
前記複数のテキストベクトルに特徴抽出を行って、複数のテキストベクトル及び対応する特徴次元値を得るステップと、
ターゲット分類器を取得し、前記ターゲット分類器の複数のニューラルネットワークノードによって前記複数のテキストベクトル及び対応する特徴次元値を走査して計算するステップであって、前記ターゲット分類器は複数の医療データでトレーニングして得られるステップと、
前記複数のテキストベクトルに対応するターゲットノードまで走査すると、前記ターゲットノードに基づいて前記複数のテキストベクトルに対応するカテゴリ確率を計算し、前記カテゴリ確率に基づいて前記診療録情報に対応するカテゴリ結果を得るステップと、
前記診療録情報に対応するカテゴリ結果を前記端末にプッシュ通知するステップとが実行される、コンピュータデバイス。 - 前記診療録情報には複数のテキストデータが含まれ、前記プロセッサがコンピュータ可読コマンドを実行する時には、予め設定された医療用語集を取得するステップであって、前記医療用語集には複数の医療用語が含まれるステップと、前記診療録情報中の複数のテキストデータと前記医療用語集とのマッチングを行って、前記診療録情報中のテキストデータと複数の医療用語とのマッチング度を計算し、予め設定されたマッチング度に達するテキストデータを抽出するステップと、マッチング後のテキストデータに基づいて前記診療録情報に単語分割を行って、単語分割後の複数のテキストデータを得るステップと、前記単語分割後の複数のテキストデータにベクトル変換を行って、複数のテキストベクトルを得るステップとをさらに実行することを特徴とする、請求項13に記載のコンピュータデバイス。
- 前記プロセッサがコンピュータ可読コマンドを実行する時には、前記複数のテキストベクトルの単語出現頻度及び逆文書頻度を計算するステップと、前記単語出現頻度及び前記逆文書頻度に基づいて、予め設定されたアルゴリズムに従って複数のテキストベクトルの重みを計算するステップと、前記重みが予め設定された閾値に達するテキストベクトルを抽出するステップと、予め設定されたアルゴリズム及び前記重みに基づいて前記テキストベクトルに対応する特徴次元値を計算するステップとをさらに実行ことを特徴とする、請求項13に記載のコンピュータデバイス。
- テキストには複数のテキストセンテンスが含まれ、前記複数のテキストセンテンスがテキストブロックを構成し、前記プロセッサがコンピュータ可読コマンドを実行する時には、前記ターゲット分類器を利用して前記特徴次元値から前記複数のテキストベクトル間の相関性を計算し、前記相関性に基づいて前記テキストで文と認められるテキストセンテンスを計算し、前記テキストセンテンスのセンテンスベクトルを計算するステップと、前記センテンスベクトルの特徴を抽出し、前記複数のセンテンスベクトルの特徴に基づいてテキストブロックベクトルを算出するステップと、前記テキストブロックベクトルの各カテゴリに対応する確率を計算し、予め設定された確率値に達するカテゴリを抽出し、前記テキストブロックに対して対応するカテゴリタグを追加するステップとをさらに実行することを特徴とする、請求項13に記載のコンピュータデバイス。
- 不揮発性コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体には少なくとも1つのコンピュータ可読コマンドが記憶されており、前記コンピュータ可読コマンドがプロセッサによってロードされると、
端末が送信した医療データ分類要求を受信するステップであって、前記医療データ分類要求は診療録情報を含むステップと、
予め設定された医療用語集を取得し、前記医療用語集中の医療用語に基づいて前記診療録情報に単語分割処理を行って、複数のテキストベクトルを得るステップと、
前記複数のテキストベクトルに特徴抽出を行って、複数のテキストベクトル及び対応する特徴次元値を得るステップと、
ターゲット分類器を取得し、前記ターゲット分類器の複数のニューラルネットワークノードによって前記複数のテキストベクトル及び対応する特徴次元値を走査して計算するステップであって、前記ターゲット分類器は複数の医療データでトレーニングして得られるステップと、
前記複数のテキストベクトルに対応するターゲットノードまで走査すると、前記ターゲットノードに基づいて前記複数のテキストベクトルに対応するカテゴリ確率を計算し、前記カテゴリ確率に基づいて前記診療録情報に対応するカテゴリ結果を得るステップと、
前記診療録情報に対応するカテゴリ結果を前記端末にプッシュ通知するステップとが実行される、不揮発性コンピュータ可読記憶媒体。 - 前記診療録情報には複数のテキストデータが含まれ、前記コンピュータ可読コマンドが前記プロセッサによって実行される時には、予め設定された医療用語集を取得するステップであって、前記医療用語集には複数の医療用語が含まれるステップと、前記診療録情報中の複数のテキストデータと前記医療用語集とのマッチングを行って、前記診療録情報中のテキストデータと複数の医療用語とのマッチング度を計算し、予め設定されたマッチング度に達するテキストデータを抽出するステップと、マッチング後のテキストデータに基づいて前記診療録情報に単語分割を行って、単語分割後の複数のテキストデータを得るステップと、前記単語分割後の複数のテキストデータにベクトル変換を行って、複数のテキストベクトルを得るステップとがさらに実行されることを特徴とする、請求項17に記載の記憶媒体。
- 前記コンピュータ可読コマンドが前記プロセッサによって実行される時には、前記複数のテキストベクトルの単語出現頻度及び逆文書頻度を計算するステップと、前記単語出現頻度及び前記逆文書頻度に基づいて、予め設定されたアルゴリズムに従って複数のテキストベクトルの重みを計算するステップと、前記重みが予め設定された閾値に達するテキストベクトルを抽出するステップと、予め設定されたアルゴリズム及び前記重みに基づいて前記テキストベクトルに対応する特徴次元値を計算するステップとがさらに実行されることを特徴とする、請求項17に記載の記憶媒体。
- テキストには複数のテキストセンテンスが含まれ、前記複数のテキストセンテンスがテキストブロックを構成し、前記コンピュータ可読コマンドが前記プロセッサによって実行される時には、前記ターゲット分類器を利用して前記特徴次元値から前記複数のテキストベクトル間の相関性を計算し、前記相関性に基づいて前記テキストで文と認められるテキストセンテンスを計算し、前記テキストセンテンスのセンテンスベクトルを計算するステップと、前記センテンスベクトルの特徴を抽出し、前記複数のセンテンスベクトルの特徴に基づいてテキストブロックベクトルを算出するステップと、前記テキストブロックベクトルの各カテゴリに対応する確率を計算し、予め設定された確率値に達するカテゴリを抽出し、前記テキストブロックに対して対応するカテゴリタグを追加するステップとがさらに実行されることを特徴とする、請求項17に記載の記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910171593.0 | 2019-03-07 | ||
CN201910171593.0A CN110021439B (zh) | 2019-03-07 | 2019-03-07 | 基于机器学习的医疗数据分类方法、装置和计算机设备 |
PCT/CN2019/090873 WO2020177230A1 (zh) | 2019-03-07 | 2019-06-12 | 基于机器学习的医疗数据分类方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021532499A true JP2021532499A (ja) | 2021-11-25 |
JP7162726B2 JP7162726B2 (ja) | 2022-10-28 |
Family
ID=67189351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021506440A Active JP7162726B2 (ja) | 2019-03-07 | 2019-06-12 | 機械学習に基づく医療データ分類方法、装置、コンピュータデバイス及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210257066A1 (ja) |
JP (1) | JP7162726B2 (ja) |
CN (1) | CN110021439B (ja) |
SG (1) | SG11202008485XA (ja) |
WO (1) | WO2020177230A1 (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110491519B (zh) * | 2019-07-17 | 2024-01-02 | 上海明品医学数据科技有限公司 | 一种医学数据的检验方法 |
CN110472049B (zh) * | 2019-07-19 | 2023-01-24 | 上海联影智能医疗科技有限公司 | 疾病筛查文本分类方法、计算机设备和可读存储介质 |
CN110427486B (zh) * | 2019-07-25 | 2022-03-01 | 北京百度网讯科技有限公司 | 身体病况文本的分类方法、装置及设备 |
CN110765265B (zh) * | 2019-09-06 | 2023-04-11 | 平安科技(深圳)有限公司 | 信息分类抽取方法、装置、计算机设备和存储介质 |
CN110781298B (zh) * | 2019-09-18 | 2023-06-20 | 平安科技(深圳)有限公司 | 药品分类方法、装置、计算机设备及存储介质 |
CN110767318A (zh) * | 2019-10-11 | 2020-02-07 | 平安医疗健康管理股份有限公司 | 医疗数据异常检测方法、装置、计算机设备和存储介质 |
CN111081370B (zh) * | 2019-10-25 | 2023-11-03 | 中国科学院自动化研究所 | 一种用户分类方法及装置 |
CN110797101B (zh) * | 2019-10-28 | 2023-11-03 | 腾讯医疗健康(深圳)有限公司 | 医学数据处理方法、装置、可读存储介质和计算机设备 |
CN110875093A (zh) * | 2019-11-19 | 2020-03-10 | 泰康保险集团股份有限公司 | 治疗方案的处理方法、装置、设备及存储介质 |
CN111178064B (zh) * | 2019-12-13 | 2022-11-29 | 深圳平安医疗健康科技服务有限公司 | 基于字段分词处理的信息推送方法、装置和计算机设备 |
CN111177375B (zh) * | 2019-12-16 | 2023-06-02 | 医渡云(北京)技术有限公司 | 一种电子文档分类方法及装置 |
CN111128391B (zh) * | 2019-12-24 | 2021-01-12 | 推想医疗科技股份有限公司 | 一种信息处理设备、方法和存储介质 |
CN111178070B (zh) * | 2019-12-25 | 2022-11-25 | 深圳平安医疗健康科技服务有限公司 | 基于分词的单词序列获取方法、装置和计算机设备 |
CN111477320B (zh) * | 2020-03-11 | 2023-05-30 | 北京大学第三医院(北京大学第三临床医学院) | 治疗效果预测模型的构建系统、治疗效果预测系统及终端 |
CN111755118B (zh) * | 2020-03-16 | 2024-03-08 | 腾讯科技(深圳)有限公司 | 医疗信息处理方法、装置、电子设备及存储介质 |
CN111403028B (zh) * | 2020-03-19 | 2022-12-06 | 医渡云(北京)技术有限公司 | 医疗文本分类方法及装置、存储介质、电子设备 |
CN111415751B (zh) * | 2020-03-19 | 2023-08-08 | 北京嘉和海森健康科技有限公司 | 电子病历数据的主题切分方法、装置及系统 |
CN111522795A (zh) * | 2020-04-23 | 2020-08-11 | 北京互金新融科技有限公司 | 处理数据的方法和装置 |
CN113744851A (zh) * | 2020-05-27 | 2021-12-03 | 阿里巴巴集团控股有限公司 | 一种就医分组方法、设备及存储介质 |
CN111949795A (zh) * | 2020-08-14 | 2020-11-17 | 中国工商银行股份有限公司 | 工单自动分类方法及装置 |
CN111951976B (zh) * | 2020-08-21 | 2024-03-22 | 上海交通大学医学院附属第九人民医院 | 基于医学资料余量的价值判断方法、系统、终端以及介质 |
CN112632222B (zh) * | 2020-12-25 | 2023-02-03 | 海信视像科技股份有限公司 | 一种终端设备和确定数据所属领域的方法 |
CN112749277B (zh) * | 2020-12-30 | 2023-08-04 | 杭州依图医疗技术有限公司 | 医学数据的处理方法、装置及存储介质 |
CN112836492B (zh) * | 2021-01-30 | 2024-03-08 | 云知声智能科技股份有限公司 | 一种医疗项目名称对齐方法 |
CN112579916B (zh) * | 2021-03-01 | 2021-05-25 | 广州汇图计算机信息技术有限公司 | 一种基于多渠道用户信息的数据处理系统 |
CN113380414B (zh) * | 2021-05-20 | 2023-11-10 | 心医国际数字医疗系统(大连)有限公司 | 基于大数据的数据采集方法及系统 |
CN113377911B (zh) * | 2021-06-09 | 2022-10-14 | 广东电网有限责任公司广州供电局 | 一种文本信息提取方法、装置、电子设备及存储介质 |
CN113270181A (zh) * | 2021-06-22 | 2021-08-17 | 中国平安人寿保险股份有限公司 | 指标数据的区分方法、装置、设备及存储介质 |
CN113421653B (zh) * | 2021-06-23 | 2022-09-09 | 平安科技(深圳)有限公司 | 医疗信息的推送方法及装置、存储介质、计算机设备 |
CN113421632A (zh) * | 2021-07-09 | 2021-09-21 | 中国人民大学 | 一种基于时间序列的心理疾病类型诊断系统 |
CN113591458B (zh) * | 2021-07-29 | 2023-09-01 | 平安科技(深圳)有限公司 | 基于神经网络的医学术语处理方法、装置、设备及存储介质 |
CN113569996B (zh) * | 2021-08-30 | 2024-05-07 | 平安医疗健康管理股份有限公司 | 病案信息的分类方法、装置、设备以及存储介质 |
CN113779275B (zh) * | 2021-09-18 | 2024-02-09 | 中国平安人寿保险股份有限公司 | 基于医疗数据的特征提取方法、装置、设备及存储介质 |
CN113822365B (zh) * | 2021-09-28 | 2023-09-05 | 北京恒生芸泰网络科技有限公司 | 基于区块链技术的医疗数据存储及大数据挖掘方法及系统 |
CN113821641B (zh) * | 2021-09-29 | 2024-04-05 | 深圳平安医疗健康科技服务有限公司 | 基于权重分配的药品分类的方法、装置、设备及存储介质 |
CN113806492B (zh) * | 2021-09-30 | 2024-02-06 | 中国平安人寿保险股份有限公司 | 基于语义识别的记录生成方法、装置、设备及存储介质 |
CN113641799B (zh) * | 2021-10-13 | 2022-02-11 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、计算机设备及存储介质 |
CN114003791B (zh) * | 2021-12-30 | 2022-04-08 | 之江实验室 | 基于深度图匹配的医疗数据元自动化分类方法及系统 |
CN114582494B (zh) * | 2022-03-03 | 2022-11-15 | 数坤(北京)网络科技股份有限公司 | 诊断结果分析方法、装置、存储介质及电子设备 |
CN115146712B (zh) * | 2022-06-15 | 2023-04-28 | 北京天融信网络安全技术有限公司 | 物联网资产识别方法、装置、设备及存储介质 |
CN114913953B (zh) * | 2022-07-19 | 2022-10-04 | 北京惠每云科技有限公司 | 医学实体关系的识别方法、装置、电子设备及存储介质 |
CN115269838B (zh) * | 2022-07-20 | 2023-06-23 | 北京新纽科技有限公司 | 一种电子病历的分类方法 |
CN115314550B (zh) * | 2022-08-17 | 2023-08-25 | 常州市儿童医院(常州市第六人民医院) | 基于数字化的智慧医疗信息推送方法及系统 |
CN115391494B (zh) * | 2022-10-27 | 2023-02-17 | 北京元知创智科技有限公司 | 中医症候智能识别方法及装置 |
CN116049693B (zh) * | 2023-03-17 | 2023-06-06 | 济南市计量检定测试院 | 一种基于医疗设备的计量检定数据管理方法 |
CN116092672A (zh) * | 2023-03-21 | 2023-05-09 | 四川大学华西医院 | 谵妄识别装置 |
CN116842330B (zh) * | 2023-08-31 | 2023-11-24 | 庆云县人民医院 | 一种可对比历史记录的保健信息处理方法及装置 |
CN117312963B (zh) * | 2023-11-29 | 2024-03-12 | 山东企联信息技术股份有限公司 | 一种采集信息数据智能分类方法、系统及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107785075A (zh) * | 2017-11-01 | 2018-03-09 | 杭州依图医疗技术有限公司 | 基于文本病历的小儿发热疾病深度学习辅助诊断系统 |
CN107863147A (zh) * | 2017-10-24 | 2018-03-30 | 清华大学 | 基于深度卷积神经网络的医疗诊断的方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102486791A (zh) * | 2010-12-06 | 2012-06-06 | 腾讯科技(深圳)有限公司 | 书签智能分类的方法和服务器 |
US20150286783A1 (en) * | 2014-04-02 | 2015-10-08 | Palo Alto Research Center Incorporated | Peer group discovery for anomaly detection |
CN104750833A (zh) * | 2015-04-03 | 2015-07-01 | 浪潮集团有限公司 | 一种文本分类方法及装置 |
US20170228500A1 (en) * | 2016-02-09 | 2017-08-10 | Justin Massengale | Process of generating medical records |
WO2018157330A1 (zh) * | 2017-03-01 | 2018-09-07 | 深圳市博信诺达经贸咨询有限公司 | 大数据的划分方法及系统 |
CN107680689A (zh) * | 2017-05-05 | 2018-02-09 | 平安科技(深圳)有限公司 | 医疗文本的潜在疾病推断方法、系统及可读存储介质 |
CN107808011B (zh) * | 2017-11-20 | 2021-04-13 | 北京大学深圳研究院 | 信息的分类抽取方法、装置、计算机设备和存储介质 |
CN108447534A (zh) * | 2018-05-18 | 2018-08-24 | 灵玖中科软件(北京)有限公司 | 一种基于nlp的电子病历数据质量管理方法 |
CN109215754A (zh) * | 2018-09-10 | 2019-01-15 | 平安科技(深圳)有限公司 | 病历数据处理方法、装置、计算机设备和存储介质 |
AU2019392537A1 (en) * | 2018-12-03 | 2021-07-01 | Tempus Ai, Inc. | Clinical concept identification, extraction, and prediction system and related methods |
-
2019
- 2019-03-07 CN CN201910171593.0A patent/CN110021439B/zh active Active
- 2019-06-12 WO PCT/CN2019/090873 patent/WO2020177230A1/zh active Application Filing
- 2019-06-12 SG SG11202008485XA patent/SG11202008485XA/en unknown
- 2019-06-12 JP JP2021506440A patent/JP7162726B2/ja active Active
-
2021
- 2021-02-02 US US17/165,665 patent/US20210257066A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107863147A (zh) * | 2017-10-24 | 2018-03-30 | 清华大学 | 基于深度卷积神经网络的医疗诊断的方法 |
CN107785075A (zh) * | 2017-11-01 | 2018-03-09 | 杭州依图医疗技术有限公司 | 基于文本病历的小儿发热疾病深度学习辅助诊断系统 |
Non-Patent Citations (1)
Title |
---|
衛藤亮太ほか: "深層学習を用いた電子カルテ医療情報の多角的解析", 情報処理学会研究報告 [ONLINE], vol. Vol.2017-DBS-165, No.8, JPN6022014151, 11 September 2017 (2017-09-11), pages 1 - 7, ISSN: 0004749261 * |
Also Published As
Publication number | Publication date |
---|---|
CN110021439A (zh) | 2019-07-16 |
SG11202008485XA (en) | 2020-10-29 |
WO2020177230A1 (zh) | 2020-09-10 |
CN110021439B (zh) | 2023-01-24 |
JP7162726B2 (ja) | 2022-10-28 |
US20210257066A1 (en) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021532499A (ja) | 機械学習に基づく医療データ分類方法、装置、コンピュータデバイス及び記憶媒体 | |
CN108986908B (zh) | 问诊数据处理方法、装置、计算机设备和存储介质 | |
CN110765265B (zh) | 信息分类抽取方法、装置、计算机设备和存储介质 | |
WO2020177377A1 (zh) | 基于机器学习的数据预测处理方法、装置和计算机设备 | |
KR102304673B1 (ko) | 키워드 추출 방법, 컴퓨터 장치, 및 저장 매체 | |
US11531824B2 (en) | Cross-lingual information retrieval and information extraction | |
WO2021027553A1 (zh) | 微表情分类模型生成、图像识别方法、装置、设备及介质 | |
US10593422B2 (en) | Interaction network inference from vector representation of words | |
CN108536800B (zh) | 文本分类方法、系统、计算机设备和存储介质 | |
WO2021169111A1 (zh) | 简历筛选方法、装置、计算机设备和存储介质 | |
US11468241B2 (en) | Techniques to add smart device information to machine learning for increased context | |
US11551026B2 (en) | Dynamic reconfiguration training computer architecture | |
WO2020147395A1 (zh) | 基于情感的文本分类处理方法、装置和计算机设备 | |
WO2020177365A1 (zh) | 基于数据挖掘的社保数据处理方法、装置和计算机设备 | |
US20210023331A1 (en) | Computer architecture for identifying sleep stages | |
CN111914562B (zh) | 电子信息分析方法、装置、设备及可读存储介质 | |
WO2020034801A1 (zh) | 医疗特征筛选方法、装置、计算机设备和存储介质 | |
CN112418059B (zh) | 一种情绪识别的方法、装置、计算机设备及存储介质 | |
US20210375441A1 (en) | Using clinical notes for icu management | |
CN113241193A (zh) | 药物推荐模型训练方法、推荐方法、装置、设备及介质 | |
US20230097940A1 (en) | System and method for extracting and using groups of features for interpretability analysis | |
WO2018171499A1 (zh) | 一种信息检测方法、设备及存储介质 | |
CN113643283A (zh) | 一种人体衰老状况的检测方法、装置、设备及存储介质 | |
CN111782821B (zh) | 基于fm模型的医学热点的预测方法、装置和计算机设备 | |
Rajasekhar et al. | A novel speech emotion recognition model using mean update of particle swarm and whale optimization-based deep belief network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221018 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7162726 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |