JP2022525089A - 医療データ自動収集セグメンテーション及び分析のための方法、装置、及びコンピュータプログラム - Google Patents
医療データ自動収集セグメンテーション及び分析のための方法、装置、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2022525089A JP2022525089A JP2021554635A JP2021554635A JP2022525089A JP 2022525089 A JP2022525089 A JP 2022525089A JP 2021554635 A JP2021554635 A JP 2021554635A JP 2021554635 A JP2021554635 A JP 2021554635A JP 2022525089 A JP2022525089 A JP 2022525089A
- Authority
- JP
- Japan
- Prior art keywords
- medical data
- unstructured
- medical
- score
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/137—Hierarchical processing, e.g. outlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Machine Translation (AREA)
Abstract
Description
加算した第1の標準導出スコア及び第2の標準導出スコアを平均させて、平均スコアを決定させ、平均スコアに基づいて、複数の文のそれぞれの文のトピックを決定させるように構成され得る。
Claims (9)
- 少なくとも1つのプロセッサが実行する医療データ自動収集セグメンテーション及び分析の方法であって、
複数のソースから、複数のフォーマットにある非構造化医療データを収集するステップと、
医学辞書を用いて、前記非構造化医療データの各ピースの医学名エンティティを認識するステップと、
前記非構造化医療データの各ピースが、同じトピックを共有するグループに分割されるように、前記非構造化医療データの各ピースに対してセマンティックテキスト分割を実行するステップと、
前記医学名エンティティが認識された前記非構造化医療データの各ピースを構造化医療データとして生成するステップであり、前記非構造化医療データの各ピースは前記グループに分割されている、ステップと、
前記構造化医療データをエラスティック検索クラスタへとインデックス付けするステップと、
を有する方法。 - 前記エラスティック検索クラスタのうちの少なくとも1つを探索して表示するように制御するステップ、を更に有する請求項1に記載の方法。
- 前記非構造化医療データを用いて前記医学辞書を生成するステップ、を更に有する請求項1又は2に記載の方法。
- 前記セマンティックテキスト分割を実行するステップは、前記非構造化医療データを用いて、潜在的ディリクレ配分(LDA)モデル及び非負値行列因数分解(NMF)モデルを訓練することを有する、請求項1乃至3のいずれか一項に記載の方法。
- 前記セマンティックテキスト分割を実行するステップは更に、前記非構造化医療データの複数の文の各々について、
前記LDAモデル及び前記NMFモデルから、それぞれ、LDAスコア及びNMFスコアを出力し、
前記LDAスコア及び前記NMFスコアの各々に対してソフトマックス関数を実行して、それぞれ、第1の標準導出スコア及び第2の標準導出スコアを生成し、
前記第1の標準導出スコアと前記第2の標準導出スコアとを加算し、
加算した前記第1の標準導出スコア及び前記第2の標準導出スコアを平均して、平均スコアを決定し、
前記平均スコアに基づいて、前記複数の文のそれぞれの文のトピックを決定する、
ことを有する、請求項4に記載の方法。 - 前記非構造化医療データの各ピースのメタデータの階層ツリー構造を生成するステップ、を更に有し、
前記構造化医療データをインデックス付けするステップは、前記非構造化医療データの各ピースのメタデータの前記階層ツリー構造を用いて、前記構造化医療データを前記エラスティック検索クラスタへとインデックス付けすることを有する、
請求項1乃至5のいずれか一項に記載の方法。 - 前記非構造化医療データは、インターネットからの、医学書、診断事例、フォーラムディスカッション及び医学論文のうちのいずれか1つ又は任意の組み合わせを有する、請求項1乃至6のいずれか一項に記載の方法。
- 医療データ自動収集セグメンテーション及び分析のための装置であって、当該装置は、
プログラムコードを格納するように構成された少なくとも1つのメモリと、
少なくとも1つのプロセッサと、
を有し、
前記プログラムコードは、前記少なくとも1つのプロセッサによって実行されるときに、前記少なくとも1つのプロセッサに、請求項1乃至7のいずれか一項に記載の方法を実行させる、装置。 - コンピュータに請求項1乃至7のいずれか一項に記載の方法を実行させるコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/379,992 US10943673B2 (en) | 2019-04-10 | 2019-04-10 | Method and apparatus for medical data auto collection segmentation and analysis platform |
US16/379,992 | 2019-04-10 | ||
PCT/US2020/020068 WO2020209945A1 (en) | 2019-04-10 | 2020-02-27 | Method and apparatus for medical data auto collection segmentation and analysis platform |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022525089A true JP2022525089A (ja) | 2022-05-11 |
JP7242889B2 JP7242889B2 (ja) | 2023-03-20 |
Family
ID=72749220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021554635A Active JP7242889B2 (ja) | 2019-04-10 | 2020-02-27 | 医療データ自動収集セグメンテーション及び分析のための方法、装置、及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10943673B2 (ja) |
EP (1) | EP3923792A4 (ja) |
JP (1) | JP7242889B2 (ja) |
CN (1) | CN114008623A (ja) |
WO (1) | WO2020209945A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112447291B (zh) * | 2020-11-23 | 2023-03-28 | 四川大学华西医院 | 基于区块链的医联体数据之间的共享方法 |
CN112699669B (zh) * | 2020-12-29 | 2022-11-11 | 医渡云(北京)技术有限公司 | 流行病学调查报告的自然语言处理方法、装置及存储介质 |
CN113220951B (zh) * | 2021-05-17 | 2023-08-22 | 鞠悦 | 一种基于智能内容的医学临床支持方法和系统 |
CN117216040B (zh) * | 2023-11-08 | 2024-04-09 | 中电数据服务有限公司 | 基于医疗数据运营模式下的数据分层治理设计方法及系统 |
US12001464B1 (en) * | 2024-01-19 | 2024-06-04 | OneSource Solutions International, Inc | System and method for medical data governance using large language models |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004185330A (ja) * | 2002-12-03 | 2004-07-02 | Advanced Biomedicare Research Inc | 医療情報サービス提供システム、医療情報提供装置、医療情報サービス提供方法、及び、医療情報サービス提供プログラム |
JP2005149015A (ja) * | 2003-11-13 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | ドメイン別概念辞書構築方法及び装置及びプログラム |
JP2007034871A (ja) * | 2005-07-29 | 2007-02-08 | Sanyo Electric Co Ltd | 文字入力装置および文字入力装置プログラム |
US20120209847A1 (en) * | 2011-02-16 | 2012-08-16 | Clearwell Systems, Inc. | Methods and systems for automatically generating semantic/concept searches |
JP2015071070A (ja) * | 2014-12-08 | 2015-04-16 | 株式会社三共 | 遊技機 |
JP2019049964A (ja) * | 2017-06-30 | 2019-03-28 | アクセンチュア グローバル ソリューションズ リミテッド | 電子診療レコードからの医学的状態および事実の自動的特定および抽出 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040225865A1 (en) * | 1999-09-03 | 2004-11-11 | Cox Richard D. | Integrated database indexing system |
WO2007131064A2 (en) | 2006-05-02 | 2007-11-15 | Physiostream, Inc. | Collection and analysis of physiological data |
US20130046558A1 (en) | 2011-08-18 | 2013-02-21 | Siemens Medical Solutions Usa, Inc. | System and Method for Identifying Inconsistent and/or Duplicate Data in Health Records |
CA2921182A1 (en) | 2013-08-12 | 2015-02-19 | Ironwood Medical Information Technologies, LLC | Medical data system and method |
US10121557B2 (en) | 2014-01-21 | 2018-11-06 | PokitDok, Inc. | System and method for dynamic document matching and merging |
WO2017015392A1 (en) * | 2015-07-21 | 2017-01-26 | The Arizona Obard Of Regents On Behalf Of The University Of Arizona | Systems and methods for analyzing healthcare data |
US10691885B2 (en) * | 2016-03-30 | 2020-06-23 | Evernote Corporation | Extracting structured data from handwritten and audio notes |
KR20180077690A (ko) * | 2016-12-29 | 2018-07-09 | 주식회사 엔씨소프트 | 문서의 내러티브 학습 장치 및 방법, 문서의 내러티브 생성 장치 및 방법 |
US11574122B2 (en) * | 2018-08-23 | 2023-02-07 | Shenzhen Keya Medical Technology Corporation | Method and system for joint named entity recognition and relation extraction using convolutional neural network |
CN109299239B (zh) * | 2018-09-29 | 2021-11-23 | 福建弘扬软件股份有限公司 | 一种基于es的电子病历检索方法 |
US10949622B2 (en) * | 2018-10-30 | 2021-03-16 | The Florida International University Board Of Trustees | Systems and methods for segmenting documents |
US20200134511A1 (en) * | 2018-10-30 | 2020-04-30 | Intuit Inc. | Systems and methods for identifying documents with topic vectors |
US20200233875A1 (en) * | 2019-01-17 | 2020-07-23 | Edamam, Llc | Methods and systems for nutritional analysis |
-
2019
- 2019-04-10 US US16/379,992 patent/US10943673B2/en active Active
-
2020
- 2020-02-27 WO PCT/US2020/020068 patent/WO2020209945A1/en unknown
- 2020-02-27 EP EP20787102.1A patent/EP3923792A4/en active Pending
- 2020-02-27 JP JP2021554635A patent/JP7242889B2/ja active Active
- 2020-02-27 CN CN202080022427.5A patent/CN114008623A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004185330A (ja) * | 2002-12-03 | 2004-07-02 | Advanced Biomedicare Research Inc | 医療情報サービス提供システム、医療情報提供装置、医療情報サービス提供方法、及び、医療情報サービス提供プログラム |
JP2005149015A (ja) * | 2003-11-13 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | ドメイン別概念辞書構築方法及び装置及びプログラム |
JP2007034871A (ja) * | 2005-07-29 | 2007-02-08 | Sanyo Electric Co Ltd | 文字入力装置および文字入力装置プログラム |
US20120209847A1 (en) * | 2011-02-16 | 2012-08-16 | Clearwell Systems, Inc. | Methods and systems for automatically generating semantic/concept searches |
JP2015071070A (ja) * | 2014-12-08 | 2015-04-16 | 株式会社三共 | 遊技機 |
JP2019049964A (ja) * | 2017-06-30 | 2019-03-28 | アクセンチュア グローバル ソリューションズ リミテッド | 電子診療レコードからの医学的状態および事実の自動的特定および抽出 |
Non-Patent Citations (2)
Title |
---|
D. LE-PHUOC: "The Graph of Things: A step towards the Live Knowledge Graph of connected things", JOURNAL OF WEB SEMANTICS, JPN6022047696, January 2016 (2016-01-01), ISSN: 0004921337 * |
J. L. AMBITE AT EL.: "BD2K Training Coordinating Center’s ERuDIte: the Educational Resource Discovery Index for Data Scie", IEEE TRANSACTIONS ON EMERGING TOPICS IN COMPUTING, vol. 9, no. 1, JPN6022047697, 6 March 2019 (2019-03-06), pages 316 - 328, XP011841280, ISSN: 0004921336, DOI: 10.1109/TETC.2019.2903466 * |
Also Published As
Publication number | Publication date |
---|---|
US20200327964A1 (en) | 2020-10-15 |
CN114008623A (zh) | 2022-02-01 |
JP7242889B2 (ja) | 2023-03-20 |
WO2020209945A1 (en) | 2020-10-15 |
EP3923792A1 (en) | 2021-12-22 |
US10943673B2 (en) | 2021-03-09 |
EP3923792A4 (en) | 2022-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10963794B2 (en) | Concept analysis operations utilizing accelerators | |
JP7242889B2 (ja) | 医療データ自動収集セグメンテーション及び分析のための方法、装置、及びコンピュータプログラム | |
US11361243B2 (en) | Recommending machine learning techniques, features, and feature relevance scores | |
US10310812B2 (en) | Matrix ordering for cache efficiency in performing large sparse matrix operations | |
US10366107B2 (en) | Categorizing questions in a question answering system | |
US9875301B2 (en) | Learning multimedia semantics from large-scale unstructured data | |
US9997157B2 (en) | Knowledge source personalization to improve language models | |
US9996604B2 (en) | Generating usage report in a question answering system based on question categorization | |
JP7136752B2 (ja) | 受信したデータ入力に基づいて過少データに関連するデータを生成する方法、デバイス、および非一時的コンピュータ可読媒体 | |
US20200342056A1 (en) | Method and apparatus for natural language processing of medical text in chinese | |
WO2016092406A1 (en) | Inferred facts discovered through knowledge graph derived contextual overlays | |
US11232267B2 (en) | Proximity information retrieval boost method for medical knowledge question answering systems | |
US10394955B2 (en) | Relation extraction from a corpus using an information retrieval based procedure | |
Zhou et al. | Learning the multilingual translation representations for question retrieval in community question answering via non-negative matrix factorization | |
US10083398B2 (en) | Framework for annotated-text search using indexed parallel fields | |
US11734322B2 (en) | Enhanced intent matching using keyword-based word mover's distance | |
CN104750692B (zh) | 一种信息处理方法、信息检索方法及其对应的装置 | |
US10971273B2 (en) | Identification of co-located artifacts in cognitively analyzed corpora | |
CN113051390B (zh) | 知识库构建方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7242889 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |