CN117316372A - 一种基于深度学习的耳疾电子病历解析方法 - Google Patents
一种基于深度学习的耳疾电子病历解析方法 Download PDFInfo
- Publication number
- CN117316372A CN117316372A CN202311620641.2A CN202311620641A CN117316372A CN 117316372 A CN117316372 A CN 117316372A CN 202311620641 A CN202311620641 A CN 202311620641A CN 117316372 A CN117316372 A CN 117316372A
- Authority
- CN
- China
- Prior art keywords
- entity
- internal
- medical record
- vector
- electronic medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 15
- 238000013135 deep learning Methods 0.000 title claims abstract description 15
- 208000032625 disorder of ear Diseases 0.000 title claims abstract description 14
- 239000013598 vector Substances 0.000 claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 239000013604 expression vector Substances 0.000 claims abstract description 10
- 230000005540 biological transmission Effects 0.000 claims abstract description 7
- 239000003814 drug Substances 0.000 claims abstract description 6
- 201000010099 disease Diseases 0.000 claims description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 10
- 208000024891 symptom Diseases 0.000 claims description 9
- 229940079593 drug Drugs 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 239000003086 colorant Substances 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 210000000613 ear canal Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 235000019580 granularity Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000009411 base construction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于深度学习的耳疾电子病历解析方法,涉及到医学领域,包括以下步骤:S1:数据的输入和预处理;获取真实电子病历文本数据,进行预处理;S2:Schema定义;定义外部实体类别和内部实体类别,将外部实体类别和内部实体类别作为病历语料库中重要的信息;S3:实体识别模型基于堆叠的平面实体识别层而设计;当词向量+字符向量输入到第一层时,该识别层进行实体类别的识别;若识别出外部实体,则其对应的表示向量不参与后续传递,用于外部实体提取;若识别出内部实体,则将内部实体生成内部实体表示向量,用于内部实体的提取,本发明针对中文以及医疗领域的特点,提出了一种多层堆叠的实体识别方法,可以有效的解决嵌套实体识别的问题。
Description
技术领域
本发明涉及医学领域,特别涉及一种基于深度学习的耳疾电子病历解析方法。
背景技术
电子病历(EMR)作为医疗领域信息化的主要数据来源之一,越来越受到人们的重视。EMR中存在大段的患者主诉信息,这种非结构化的自然语言中存在大量的有用信息。如何从中识别出提及的有效信息(疾病,用药,发病部位,症状等),成为了有效使用EMR数据的关键。
随着NLP技术的发展,将NLP技术应用到电子病历解析中获得越来越多的关注。大量的命名实体识别(NER)算法(BERT,BiLSTM,CRF)被应用到EMR解析中,用来识别EMR中患者主诉的实体。
然而随着深入的应用和研究发现,传统的命名实体识别(NER)方法大部分关注于处理平面实体,但电子病历中的患者的主诉信息通常会受到登记医生的经验和习惯产生区别,因此传统的命名实体(NER)识别过程中仅能将实体识别当作序列标注,导致实体识别准确性和全面性不足,从而影响后续知识库的构建。
本发明提出一种基于深度学习的电子病历解析方法。该方法设计了一种组合实体识别模型用来解决电子病历解析识别准确性和全面性不足的问题,为知识库构建等后续工作提供更好的数据支持。
发明内容
本发明的目的在于提供一种基于深度学习的耳疾电子病历解析方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习的耳疾电子病历解析方法,包括以下步骤:
S1:数据的输入和预处理:获取真实电子病历文本数据,进行预处理,得到词向量+字符向量的组合;
S2:Schema定义:基于病历语料库中的重要信息,定义外部实体类别和内部实体类别;
S3:建立实体识别模型:
实体识别模型基于堆叠的平面实体识别层而设计;将词向量+字符向量输入到第一层时,该识别层进行实体类别的识别;
若识别出外部实体,则其对应的表示向量不参与后续传递,用于外部实体提取;
若识别出内部实体,则将内部实体生成内部实体表示向量,用于内部实体的提取;之后将该层未识别出实体类别的字符,保留为原始表示向量,并与本层识别出的内部实体表示向量一起传递到下一识别层;
实体识别模型在后续每个识别层内重复上述外部实体识别和内部实体识别及传递的识别步骤,直至某一层的识别结果均为“0”;则表示所有的内部实体和外部实体均已识别完成;此时,停止模型堆叠,完成全部内部实体和外部实体的识别工作;
S4:结构化输出:将识别出来的内部实体和外部实体,结合步骤S2中定义的schema,形成结构化数据。
进一步的,所述S1中数据的预处理包括:通过 word2vec模型预训练的词向量表将每个词映射成一个词向量,然后使用原始文本来训练 word2vec 模型获得字符嵌入并将每个字符映射到一个字符向量中,最后预处理的结果是词向量+字符向量的组合,以便更好的利用语义信息和句法信息。
进一步的,所述S2中外部实体类别包括疾病、症状、用药和检查4种。
进一步的,所述S2中内部实体类别包括六个细粒度实体,六个细粒度实体分别为发病部位、频率、颜色、剂量、程度和状态。
进一步的,所述S3中,实体识别模型每层均采用LSTM+CRF组成的识别层进行识别工作。
进一步的,所述S3中,内部实体表示向量或外部实体表示向量生成方式如下:将识别出的内部实体或外部实体合并,并且计算内部实体或外部实体的上下文向量表示的平均值,对识别出的内部实体或外部实体中包含的每个字符的向量平均后,将每个识别出的内部实体或外部实体视为一个词,并标记为内部实体表示向量或外部实体表示向量。
进一步的,所述S4中结构化数据包括value、type、classification。
本发明的技术效果和优点:
针对中文信息及医疗术语嵌套性的特点,提出了一种内部实体识别和外部实体识别结合的多层堆叠识别方式,通过不同粗细粒度的多层识别形式,能够有效对嵌套实体中的嵌套信息进行筛分识别,从而提高嵌套实体识别的准确度和全面性。
针对医疗领域实体中,单个字存在完整信息的情况,我们提出一种词向量+字符向量组合的表示方式,再结合内部实体识别和外部实体识别不同粗细粒度组合的多层堆叠识别,能够提高实体部分匹配的跨度的利用程度,降低长实体识别困难的状况,进一步有效降低计算成本,减少信息遗漏。
附图说明
图1为本发明病历解析方法步骤图结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
基于深入的应用和研究发现,传统的命名实体识别(NER)方法大部分关注于处理平面实体,其仅将实体识别当作序列标注问题,而忽略了嵌套实体。申请人发现在医疗领域,医生在登记过程中存在大量的实体嵌套性,尤其是听觉疾病中更为常见。例如:【外耳道感染】,其中【外耳道】属于实体:发病部位,【外耳道感染】属于实体:症状。传统的实体识别方法在处理嵌套实体识别的问题上,存在计算成本高、边界信息无知、与实体部分匹配的跨度利用不足以及长实体识别困难等问题,很难准确的识别出嵌套实体,进而在电子病历解析中漏掉了很多有用的信息。
为解决上述实体嵌套的问题导致的信息识别不准确和不全面的问题。
本发明提供了如图1所示的一种基于深度学习的耳疾电子病历解析方法。
本申请的电子病历解析整体分为四部分:1.数据的输入和预处理2.Schema定义3.建立实体识别模型4.结构化数据输出。
1.数据的输入和预处理
获取真实电子病历文本数据,进行预处理,得到词向量+字符向量的组合。
由于目前大部分的中文实体识别都是基于词嵌入的向量表示方法,但是在医疗领域中,往往一个字就包含了所有的信息,所以仅仅采用词向量表示的方法是远远不够用的。因此,本申请的预处理采用一种词向量+字符向量组合表示的数据预处理方法。
首先通过word2vec模型预训练的词向量表将每个词映射成一个词向量;然后使用原始文本来训练word2vec模型获得字符嵌入并将每个字符映射到一个字符向量中;最后预处理的结果是词向量+字符向量的组合,以便更好的利用语义信息和句法信息。
2.Schema定义
本步骤中基于病历语料库中的重要信息,定义外部实体类别和内部实体类别分别定义外部实体类别和内部实体类别
针对电子病历中以症状实体为代表的嵌套实体抽取问题,本申请设计了一种双层标注策略。
首先,基于电子病历最具代表性的实体类别,我们定义包括疾病、症状、用药和检查在内的4个粗粒度的外部实体作为外部实体类别。
其次,为了满足细粒度提取的要求,设计六个细粒度实体,包括发病部位、频率、颜色、剂量、程度和状态等内部实体作为内部实体类别。
作为病历语料库中最重要的信息,症状实体通常包含大部分内部实体;因此,采用外部实体类别+内部实体类别的双层标注策略可以更完整地提取电子病历中的有效信息,同时对症状实体的提取有至关重要的改进;并且内部实体对外部实体具有启发式作用,可以进一步提高外部实体识别结果的准确性。
3.建立实体识别模型
本申请的实体识别模型基于堆叠的平面实体识别层而设计的。且该实体模型每层均由LSTM(长短期记忆人工神经网络)+CRF(固定速率系数)组成的识别层去识别内部实体类别。
当词向量+字符向量输入到第一层时,该识别层进行实体类别的识别;
若识别出外部实体,则其对应的表示向量不参与后续传递,用于外部实体提取;可以简单理解为,识别出外部实体则可以讲对应的表示向量提取封存,用于后续步骤的输出提取。
若该识别层识别出内部实体,将识别出的内部实体合并并且计算内部实体对应的上下文向量表示的平均值,计算公式下所示:
式中表示第 i 个字符的表示向量,start表示识别内部实体的起始位置,end是识别内部实体的结束位置。
对识别出的内部实体中包含的每个字符的向量进行平均后,将每个识别出的内部实体视为一个词,并将其标记为内部实体表示向量,用于内部实体的提取。
之后将该层未识别出实体类别的字符,保留为原始表示向量,并与本层识别出的内部实体表示向量一起传递到下一识别层。
实体识别模型在后续每个识别层内重复上述外部实体识别和内部实体识别及传递的识别步骤,直至某一层的识别结果均为“0”;则表示所有的内部实体和外部实体均已识别完成;此时,停止模型堆叠,完成全部内部实体和外部实体的识别工作。
值得注意的是,针对病历语料中最重要信息存在的内部实体嵌套,需要采用上述实体模型中分多层标注并匹配内部实体类别之后,最终完成嵌套的多层内部实体的识别和提取;而针对部分直接能够识别的外部实体,可以在第一层直接提取;针对需要结合内部实体类别的外部实体,则需要多层识别后才能识别出来提取。
4.结构化输出
将识别出来的实体,结合前面定义好的schema,形成(value,type,classification)结构化数据。例:(value:外耳道感染,type: 症状,classification:外部实体),(value:外耳道,type:发病部位,classification:内部实体)。为后续的工作提供标准的数据支撑。
Claims (7)
1.一种基于深度学习的耳疾电子病历解析方法,其特征在于:包括以下步骤:
S1:数据的输入和预处理:获取真实电子病历文本数据,进行预处理,得到词向量+字符向量的组合;
S2:Schema定义:基于病历语料库中的重要信息,定义外部实体类别和内部实体类别;
S3:建立实体识别模型:
实体识别模型基于堆叠的平面实体识别层而设计;当词向量+字符向量输入到第一层时,该识别层进行实体类别的识别;
若识别出外部实体,则其对应的表示向量不参与后续传递,用于外部实体提取;
若识别出内部实体,则将内部实体生成内部实体表示向量,用于内部实体的提取;之后将该层未识别出实体类别的字符,保留为原始表示向量,并与本层识别出的内部实体表示向量一起传递到下一识别层;
实体识别模型在后续每个识别层内重复上述外部实体识别和内部实体识别及传递的识别步骤,直至某一层的识别结果均为“0”;则表示所有的内部实体和外部实体均已识别完成;此时,停止模型堆叠,完成全部内部实体和外部实体的识别工作;
S4:结构化输出:将识别出来的内部实体和外部实体,结合步骤S2中定义的schema,形成结构化数据。
2.根据权利要求1所述的一种基于深度学习的耳疾电子病历解析方法,其特征在于:所述S1中数据的预处理包括:通过word2vec模型预训练的词向量表将每个词映射成一个词向量,然后使用原始文本来训练word2vec 模型获得字符嵌入并将每个字符映射到一个字符向量中,最后预处理的结果是词向量+字符向量的组合,以便更好的利用语义信息和句法信息。
3.根据权利要求1所述的一种基于深度学习的耳疾电子病历解析方法,其特征在于:所述S2中外部实体类别包括疾病、症状、用药和检查4种。
4.根据权利要求1所述的一种基于深度学习的耳疾电子病历解析方法,其特征在于:所述S2中内部实体类别包括六个细粒度实体,六个细粒度实体分别为发病部位、频率、颜色、剂量、程度和状态。
5.根据权利要求1所述的一种基于深度学习的耳疾电子病历解析方法,其特征在于:所述S3中,实体识别模型每层均采用LSTM+CRF组成的识别层进行识别工作。
6.根据权利要求1所述的一种基于深度学习的耳疾电子病历解析方法,其特征在于:所述S3中,内部实体表示向量生成方式如下:
将识别出的内部实体合并,并且计算内部实体的上下文向量表示的平均值,对识别出的内部实体中包含的每个字符的向量平均后,将每个识别出的内部实体视为一个词,并标记为内部实体表示向量。
7.根据权利要求1所述的一种基于深度学习的耳疾电子病历解析方法,其特征在于:所述S4中结构化数据包括value、type、classification。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311620641.2A CN117316372B (zh) | 2023-11-30 | 2023-11-30 | 一种基于深度学习的耳疾电子病历解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311620641.2A CN117316372B (zh) | 2023-11-30 | 2023-11-30 | 一种基于深度学习的耳疾电子病历解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117316372A true CN117316372A (zh) | 2023-12-29 |
CN117316372B CN117316372B (zh) | 2024-04-09 |
Family
ID=89288846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311620641.2A Active CN117316372B (zh) | 2023-11-30 | 2023-11-30 | 一种基于深度学习的耳疾电子病历解析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117316372B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079377A (zh) * | 2019-12-03 | 2020-04-28 | 哈尔滨工程大学 | 一种面向中文医疗文本命名实体识别的方法 |
CN112001177A (zh) * | 2020-08-24 | 2020-11-27 | 浪潮云信息技术股份公司 | 融合深度学习与规则的电子病历命名实体识别方法及系统 |
CN112151183A (zh) * | 2020-09-23 | 2020-12-29 | 上海海事大学 | 一种基于Lattice LSTM模型的中文电子病历的实体识别方法 |
CN112257421A (zh) * | 2020-12-21 | 2021-01-22 | 完美世界(北京)软件科技发展有限公司 | 嵌套实体数据的识别方法、装置及电子设备 |
CN113343694A (zh) * | 2021-04-29 | 2021-09-03 | 山东师范大学 | 一种医疗命名实体识别方法及系统 |
WO2021190236A1 (zh) * | 2020-03-23 | 2021-09-30 | 浙江大学 | 一种基于生物医学文献的实体关系挖掘方法 |
CN114281937A (zh) * | 2021-10-08 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 嵌套实体识别模型的训练方法、嵌套实体识别方法及装置 |
CN114519355A (zh) * | 2021-08-25 | 2022-05-20 | 浙江万里学院 | 一种医药命名实体识别与实体规范化方法 |
CN114881030A (zh) * | 2022-03-25 | 2022-08-09 | 河海大学 | 一种面向水利文本的嵌套实体识别方法 |
CN115017910A (zh) * | 2022-06-29 | 2022-09-06 | 大连理工大学 | 基于中文电子病历的实体关系联合抽取方法、网络、设备和计算机可读存储介质 |
KR20230055021A (ko) * | 2021-10-18 | 2023-04-25 | 한양대학교 산학협력단 | Nested 와 Overlapped Named Entity 인식을 위한 피라미드 Layered 어텐션 모델 |
CN116050413A (zh) * | 2022-12-16 | 2023-05-02 | 西安交通大学 | 一种面向涉税法律文本的命名实体识别依赖增强方法 |
WO2023109436A1 (zh) * | 2021-12-13 | 2023-06-22 | 广州大学 | 词性感知嵌套命名实体识别方法、系统、设备和存储介质 |
-
2023
- 2023-11-30 CN CN202311620641.2A patent/CN117316372B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079377A (zh) * | 2019-12-03 | 2020-04-28 | 哈尔滨工程大学 | 一种面向中文医疗文本命名实体识别的方法 |
WO2021190236A1 (zh) * | 2020-03-23 | 2021-09-30 | 浙江大学 | 一种基于生物医学文献的实体关系挖掘方法 |
CN112001177A (zh) * | 2020-08-24 | 2020-11-27 | 浪潮云信息技术股份公司 | 融合深度学习与规则的电子病历命名实体识别方法及系统 |
CN112151183A (zh) * | 2020-09-23 | 2020-12-29 | 上海海事大学 | 一种基于Lattice LSTM模型的中文电子病历的实体识别方法 |
CN112257421A (zh) * | 2020-12-21 | 2021-01-22 | 完美世界(北京)软件科技发展有限公司 | 嵌套实体数据的识别方法、装置及电子设备 |
CN113343694A (zh) * | 2021-04-29 | 2021-09-03 | 山东师范大学 | 一种医疗命名实体识别方法及系统 |
CN114519355A (zh) * | 2021-08-25 | 2022-05-20 | 浙江万里学院 | 一种医药命名实体识别与实体规范化方法 |
CN114281937A (zh) * | 2021-10-08 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 嵌套实体识别模型的训练方法、嵌套实体识别方法及装置 |
KR20230055021A (ko) * | 2021-10-18 | 2023-04-25 | 한양대학교 산학협력단 | Nested 와 Overlapped Named Entity 인식을 위한 피라미드 Layered 어텐션 모델 |
WO2023109436A1 (zh) * | 2021-12-13 | 2023-06-22 | 广州大学 | 词性感知嵌套命名实体识别方法、系统、设备和存储介质 |
CN114881030A (zh) * | 2022-03-25 | 2022-08-09 | 河海大学 | 一种面向水利文本的嵌套实体识别方法 |
CN115017910A (zh) * | 2022-06-29 | 2022-09-06 | 大连理工大学 | 基于中文电子病历的实体关系联合抽取方法、网络、设备和计算机可读存储介质 |
CN116050413A (zh) * | 2022-12-16 | 2023-05-02 | 西安交通大学 | 一种面向涉税法律文本的命名实体识别依赖增强方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117316372B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106682397B (zh) | 一种基于知识的电子病历质控方法 | |
US10169454B2 (en) | Unsupervised ontology-based graph extraction from texts | |
CN113505243A (zh) | 基于医疗知识图谱的智能问答方法和装置 | |
Quamar et al. | An ontology-based conversation system for knowledge bases | |
CN101149751B (zh) | 用于分析中医方剂药物组配规律的泛化关联规则挖掘方法 | |
CN113076411B (zh) | 一种基于知识图谱的医疗查询扩展方法 | |
CN117056493A (zh) | 基于病历知识图谱的大语言模型医疗问答系统 | |
CN112487202A (zh) | 融合知识图谱与bert的中文医学命名实体识别方法、装置 | |
CN117316466B (zh) | 一种基于知识图谱与自然语言处理技术的临床决策方法、系统及设备 | |
CN112541086A (zh) | 一种针对脑卒中的知识图谱构建方法 | |
CN116089581A (zh) | 一种基于知识图谱的智能问答方法 | |
Ke et al. | Medical entity recognition and knowledge map relationship analysis of Chinese EMRs based on improved BiLSTM-CRF | |
CN117577254A (zh) | 医疗领域语言模型构建及电子病历文本结构化方法、系统 | |
CN116227594A (zh) | 面向多源数据的医疗行业高可信度知识图谱的构建方法 | |
US20200294664A1 (en) | Adding new electronic events into an electronic user profile using a language-independent data format | |
CN117316372B (zh) | 一种基于深度学习的耳疾电子病历解析方法 | |
Biswas et al. | Can ChatGPT be Your Personal Medical Assistant? | |
Yanling et al. | Research on entity recognition and knowledge graph construction based on TCM medical records | |
CN113314236A (zh) | 一种面向高血压的智能问答系统 | |
CN114582449A (zh) | 基于XLNet-BiGRU-CRF模型的电子病历命名实体标准化方法和系统 | |
CN113408296A (zh) | 一种文本信息提取方法、装置及设备 | |
Šuman et al. | A Corpus-Based Sentence Classifier for Entity–Relationship Modelling | |
Chen et al. | Constructing Medical Image Domain Ontology with Anatomical Knowledge | |
Purwitasari et al. | A Comparison of Transformer and BiLSTM Based BioNER Model with Self-Training on Low-Resource Language Texts of Online Health Consultations. | |
Qu et al. | A Review of Knowledge Graph in Traditional Chinese Medicine: Analysis, Construction, Application and Prospects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |