CN106484674A - 一种基于深度学习的中文电子病历概念抽取方法 - Google Patents
一种基于深度学习的中文电子病历概念抽取方法 Download PDFInfo
- Publication number
- CN106484674A CN106484674A CN201610835901.1A CN201610835901A CN106484674A CN 106484674 A CN106484674 A CN 106484674A CN 201610835901 A CN201610835901 A CN 201610835901A CN 106484674 A CN106484674 A CN 106484674A
- Authority
- CN
- China
- Prior art keywords
- feature
- layer
- rbm
- input
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 34
- 230000036541 health Effects 0.000 title claims abstract description 29
- 238000013135 deep learning Methods 0.000 title claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 30
- 239000003550 marker Substances 0.000 claims abstract description 13
- 230000007423 decrease Effects 0.000 claims abstract description 8
- 239000010410 layer Substances 0.000 claims description 54
- 238000002372 labelling Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 8
- 239000002356 single layer Substances 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 238000007477 logistic regression Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 abstract description 7
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 abstract description 2
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 101000972273 Homo sapiens Mucin-7 Proteins 0.000 description 1
- 102100022492 Mucin-7 Human genes 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G06F19/32—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610835901.1A CN106484674B (zh) | 2016-09-20 | 2016-09-20 | 一种基于深度学习的中文电子病历概念抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610835901.1A CN106484674B (zh) | 2016-09-20 | 2016-09-20 | 一种基于深度学习的中文电子病历概念抽取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106484674A true CN106484674A (zh) | 2017-03-08 |
CN106484674B CN106484674B (zh) | 2020-09-25 |
Family
ID=58267656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610835901.1A Active CN106484674B (zh) | 2016-09-20 | 2016-09-20 | 一种基于深度学习的中文电子病历概念抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106484674B (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145511A (zh) * | 2017-03-31 | 2017-09-08 | 上海森亿医疗科技有限公司 | 基于医学文本信息的结构化医学数据库生成方法及系统 |
WO2017172629A1 (en) * | 2016-03-28 | 2017-10-05 | Icahn School Of Medicine At Mount Sinai | Systems and methods for applying deep learning to data |
CN107833603A (zh) * | 2017-11-13 | 2018-03-23 | 医渡云(北京)技术有限公司 | 电子病历文档分类方法、装置、电子设备及存储介质 |
CN107833605A (zh) * | 2017-03-14 | 2018-03-23 | 北京大瑞集思技术有限公司 | 一种医院病历信息的编码方法、装置、服务器及系统 |
CN108038104A (zh) * | 2017-12-22 | 2018-05-15 | 北京奇艺世纪科技有限公司 | 一种实体识别的方法及装置 |
CN108334501A (zh) * | 2018-03-21 | 2018-07-27 | 王欣 | 基于机器学习的电子文档分析系统及方法 |
CN108959375A (zh) * | 2018-05-24 | 2018-12-07 | 南京网感至察信息科技有限公司 | 一种基于规则与深度学习的知识抽取方法 |
CN108985330A (zh) * | 2018-06-13 | 2018-12-11 | 华中科技大学 | 一种自编码网络及其训练方法、异常用电检测方法和系统 |
CN109034066A (zh) * | 2018-07-27 | 2018-12-18 | 北方工业大学 | 基于多特征融合的建筑物识别方法 |
CN109308471A (zh) * | 2018-09-29 | 2019-02-05 | 河海大学常州校区 | 一种肌电信号特征提取方法 |
CN109326278A (zh) * | 2017-07-31 | 2019-02-12 | 科大讯飞股份有限公司 | 一种声学模型构建方法及装置、电子设备 |
CN109378064A (zh) * | 2018-10-29 | 2019-02-22 | 南京医基云医疗数据研究院有限公司 | 医疗数据处理方法、装置电子设备及计算机可读介质 |
CN109543046A (zh) * | 2018-11-16 | 2019-03-29 | 重庆邮电大学 | 一种基于深度学习的机器人数据互操作领域本体构建方法 |
CN109697285A (zh) * | 2018-12-13 | 2019-04-30 | 中南大学 | 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法 |
CN109800411A (zh) * | 2018-12-03 | 2019-05-24 | 哈尔滨工业大学(深圳) | 临床医疗实体及其属性抽取方法 |
CN109920501A (zh) * | 2019-01-24 | 2019-06-21 | 西安交通大学 | 基于卷积神经网络和主动学习的电子病历分类方法及系统 |
CN109977112A (zh) * | 2018-12-28 | 2019-07-05 | 万康源(天津)基因科技有限公司 | 科研文献的结构化信息提取方法及系统 |
CN111488211A (zh) * | 2020-04-09 | 2020-08-04 | 北京嘀嘀无限科技发展有限公司 | 基于深度学习框架的任务处理方法、装置、设备及介质 |
CN111695347A (zh) * | 2019-03-15 | 2020-09-22 | 百度(美国)有限责任公司 | 用于主题发现和词嵌入的相互学习的系统和方法 |
CN111727478A (zh) * | 2018-02-16 | 2020-09-29 | 谷歌有限责任公司 | 使用深度卷积网络从医学文本中自动提取结构化标签并将其用于训练计算机视觉模型 |
WO2020261002A1 (en) * | 2019-06-27 | 2020-12-30 | International Business Machines Corporation | Deep learning approach to computing spans |
CN112445789A (zh) * | 2019-08-16 | 2021-03-05 | 北京大数医达科技有限公司 | 用于将目标文本转化成结构化数据的方法和装置 |
CN112466462A (zh) * | 2020-11-26 | 2021-03-09 | 华侨大学 | 一种基于图深度学习的emr信息关联及演化方法 |
US20230103143A1 (en) * | 2021-09-24 | 2023-03-30 | International Business Machines Corporation | Machine Learning Augmented System for Medical Episode Identification and Reporting |
US11984206B2 (en) | 2018-02-16 | 2024-05-14 | Google Llc | Automated extraction of structured labels from medical text using deep convolutional networks and use thereof to train a computer vision model |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140032570A1 (en) * | 2012-07-30 | 2014-01-30 | International Business Machines Corporation | Discriminative Learning Via Hierarchical Transformations |
CN105894088A (zh) * | 2016-03-25 | 2016-08-24 | 苏州赫博特医疗信息科技有限公司 | 基于深度学习及分布式语义特征医学信息抽取系统及方法 |
-
2016
- 2016-09-20 CN CN201610835901.1A patent/CN106484674B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140032570A1 (en) * | 2012-07-30 | 2014-01-30 | International Business Machines Corporation | Discriminative Learning Via Hierarchical Transformations |
CN105894088A (zh) * | 2016-03-25 | 2016-08-24 | 苏州赫博特医疗信息科技有限公司 | 基于深度学习及分布式语义特征医学信息抽取系统及方法 |
Non-Patent Citations (4)
Title |
---|
冯蕴天 等: "基于深度信念网络的命名实体识别", 《计算机科学》 * |
张良均著: "《Python数据分析与挖掘实战》", 31 January 2016, 北京:机械工业出版社 * |
李思琴: "基于深度学习的搜索广告点击率预测方法研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 * |
陈宇: "基于深度置信网络的中文信息抽取方法", 《中国博士学位论文全文数据库-信息科技辑》 * |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017172629A1 (en) * | 2016-03-28 | 2017-10-05 | Icahn School Of Medicine At Mount Sinai | Systems and methods for applying deep learning to data |
CN107833605A (zh) * | 2017-03-14 | 2018-03-23 | 北京大瑞集思技术有限公司 | 一种医院病历信息的编码方法、装置、服务器及系统 |
CN107145511A (zh) * | 2017-03-31 | 2017-09-08 | 上海森亿医疗科技有限公司 | 基于医学文本信息的结构化医学数据库生成方法及系统 |
CN109326278A (zh) * | 2017-07-31 | 2019-02-12 | 科大讯飞股份有限公司 | 一种声学模型构建方法及装置、电子设备 |
CN109326278B (zh) * | 2017-07-31 | 2022-06-07 | 科大讯飞股份有限公司 | 一种声学模型构建方法及装置、电子设备 |
CN107833603A (zh) * | 2017-11-13 | 2018-03-23 | 医渡云(北京)技术有限公司 | 电子病历文档分类方法、装置、电子设备及存储介质 |
CN108038104A (zh) * | 2017-12-22 | 2018-05-15 | 北京奇艺世纪科技有限公司 | 一种实体识别的方法及装置 |
US11984206B2 (en) | 2018-02-16 | 2024-05-14 | Google Llc | Automated extraction of structured labels from medical text using deep convolutional networks and use thereof to train a computer vision model |
CN111727478A (zh) * | 2018-02-16 | 2020-09-29 | 谷歌有限责任公司 | 使用深度卷积网络从医学文本中自动提取结构化标签并将其用于训练计算机视觉模型 |
CN108334501B (zh) * | 2018-03-21 | 2021-07-20 | 王欣 | 基于机器学习的电子文档分析系统及方法 |
CN108334501A (zh) * | 2018-03-21 | 2018-07-27 | 王欣 | 基于机器学习的电子文档分析系统及方法 |
CN108959375A (zh) * | 2018-05-24 | 2018-12-07 | 南京网感至察信息科技有限公司 | 一种基于规则与深度学习的知识抽取方法 |
CN108985330A (zh) * | 2018-06-13 | 2018-12-11 | 华中科技大学 | 一种自编码网络及其训练方法、异常用电检测方法和系统 |
CN108985330B (zh) * | 2018-06-13 | 2021-03-26 | 华中科技大学 | 一种自编码网络及其训练方法、异常用电检测方法和系统 |
CN109034066A (zh) * | 2018-07-27 | 2018-12-18 | 北方工业大学 | 基于多特征融合的建筑物识别方法 |
CN109034066B (zh) * | 2018-07-27 | 2022-05-03 | 北方工业大学 | 基于多特征融合的建筑物识别方法 |
CN109308471A (zh) * | 2018-09-29 | 2019-02-05 | 河海大学常州校区 | 一种肌电信号特征提取方法 |
CN109378064A (zh) * | 2018-10-29 | 2019-02-22 | 南京医基云医疗数据研究院有限公司 | 医疗数据处理方法、装置电子设备及计算机可读介质 |
CN109543046A (zh) * | 2018-11-16 | 2019-03-29 | 重庆邮电大学 | 一种基于深度学习的机器人数据互操作领域本体构建方法 |
CN109800411A (zh) * | 2018-12-03 | 2019-05-24 | 哈尔滨工业大学(深圳) | 临床医疗实体及其属性抽取方法 |
CN109800411B (zh) * | 2018-12-03 | 2023-07-18 | 哈尔滨工业大学(深圳) | 临床医疗实体及其属性抽取方法 |
CN109697285A (zh) * | 2018-12-13 | 2019-04-30 | 中南大学 | 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法 |
CN109977112A (zh) * | 2018-12-28 | 2019-07-05 | 万康源(天津)基因科技有限公司 | 科研文献的结构化信息提取方法及系统 |
CN109920501B (zh) * | 2019-01-24 | 2021-04-20 | 西安交通大学 | 基于卷积神经网络和主动学习的电子病历分类方法及系统 |
CN109920501A (zh) * | 2019-01-24 | 2019-06-21 | 西安交通大学 | 基于卷积神经网络和主动学习的电子病历分类方法及系统 |
CN111695347A (zh) * | 2019-03-15 | 2020-09-22 | 百度(美国)有限责任公司 | 用于主题发现和词嵌入的相互学习的系统和方法 |
CN111695347B (zh) * | 2019-03-15 | 2023-08-18 | 百度(美国)有限责任公司 | 用于主题发现和词嵌入的相互学习的系统和方法 |
GB2598879A (en) * | 2019-06-27 | 2022-03-16 | Ibm | Deep learning approach to computing spans |
WO2020261002A1 (en) * | 2019-06-27 | 2020-12-30 | International Business Machines Corporation | Deep learning approach to computing spans |
US11379660B2 (en) | 2019-06-27 | 2022-07-05 | International Business Machines Corporation | Deep learning approach to computing spans |
CN112445789A (zh) * | 2019-08-16 | 2021-03-05 | 北京大数医达科技有限公司 | 用于将目标文本转化成结构化数据的方法和装置 |
CN111488211A (zh) * | 2020-04-09 | 2020-08-04 | 北京嘀嘀无限科技发展有限公司 | 基于深度学习框架的任务处理方法、装置、设备及介质 |
CN112466462A (zh) * | 2020-11-26 | 2021-03-09 | 华侨大学 | 一种基于图深度学习的emr信息关联及演化方法 |
CN112466462B (zh) * | 2020-11-26 | 2023-03-07 | 华侨大学 | 一种基于图深度学习的emr信息关联及演化方法 |
US20230103143A1 (en) * | 2021-09-24 | 2023-03-30 | International Business Machines Corporation | Machine Learning Augmented System for Medical Episode Identification and Reporting |
Also Published As
Publication number | Publication date |
---|---|
CN106484674B (zh) | 2020-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106484674A (zh) | 一种基于深度学习的中文电子病历概念抽取方法 | |
CN110717334B (zh) | 基于bert模型和双通道注意力的文本情感分析方法 | |
CN109344391B (zh) | 基于神经网络的多特征融合中文新闻文本摘要生成方法 | |
CN106202010B (zh) | 基于深度神经网络构建法律文本语法树的方法和装置 | |
CN111753024B (zh) | 一种面向公共安全领域的多源异构数据实体对齐方法 | |
CN108073711A (zh) | 一种基于知识图谱的关系抽取方法和系统 | |
CN108549658A (zh) | 一种基于语法分析树上注意力机制的深度学习视频问答方法及系统 | |
CN111858932A (zh) | 基于Transformer的多重特征中英文情感分类方法及系统 | |
CN108197294A (zh) | 一种基于深度学习的文本自动生成方法 | |
CN110765755A (zh) | 一种基于双重选择门的语义相似度特征提取方法 | |
Zhang et al. | A BERT fine-tuning model for targeted sentiment analysis of Chinese online course reviews | |
CN111400494A (zh) | 一种基于GCN-Attention的情感分析方法 | |
CN115358234A (zh) | 基于图卷积网络与关系证据互指导的篇章关系抽取方法 | |
Wu et al. | WTMED at MEDIQA 2019: A hybrid approach to biomedical natural language inference | |
CN115496072A (zh) | 一种基于对比学习的关系抽取方法 | |
CN113177113B (zh) | 任务型对话模型预训练方法、装置、设备及存储介质 | |
CN117036833B (zh) | 一种视频分类方法、装置、设备和计算机可读存储介质 | |
CN117421595A (zh) | 一种基于深度学习技术的系统日志异常检测方法及系统 | |
CN117033558A (zh) | 一种融合bert-wwm与多特征的影评情感分析方法 | |
Sairam et al. | Image Captioning using CNN and LSTM | |
CN113449517B (zh) | 基于bert门控多窗口注意力网络模型的实体关系抽取方法 | |
CN115204171A (zh) | 基于超图神经网络的文档级事件抽取方法及系统 | |
CN115114930A (zh) | 一种基于序列到森林的非连续实体识别方法 | |
CN114429121A (zh) | 一种面向试题语料情感与原因句子对的抽取方法 | |
CN113836910A (zh) | 一种基于多层次语义的文本识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210610 Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province Patentee after: Yami Technology (Guangzhou) Co., Ltd Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing Patentee before: Beijing University of Technology |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211122 Address after: 510000 Room 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 401, building D, No. 288 Shenzhou Road, Huangpu District, Guangzhou, Guangdong Patentee after: Kingtel Technology Co.,Ltd. Address before: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province Patentee before: Yami Technology (Guangzhou) Co., Ltd |
|
TR01 | Transfer of patent right |