CN110010217A - 一种电子病历的标注方法及装置 - Google Patents

一种电子病历的标注方法及装置 Download PDF

Info

Publication number
CN110010217A
CN110010217A CN201910289691.4A CN201910289691A CN110010217A CN 110010217 A CN110010217 A CN 110010217A CN 201910289691 A CN201910289691 A CN 201910289691A CN 110010217 A CN110010217 A CN 110010217A
Authority
CN
China
Prior art keywords
mark
case history
medical record
data collection
record data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910289691.4A
Other languages
English (en)
Inventor
胡佳慧
方安
赵琬清
杨晨柳
任慧玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medical Information CAMS
Original Assignee
Institute of Medical Information CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medical Information CAMS filed Critical Institute of Medical Information CAMS
Priority to CN201910289691.4A priority Critical patent/CN110010217A/zh
Publication of CN110010217A publication Critical patent/CN110010217A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请提供了一种电子病历的标注方法及装置,获取人工标注病历数据集和未标注病历数据集;利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。本发明综合利用自然语言处理技术和机器学习方法对电子病历进行自动化标注,提高了电子病历的标注效率。

Description

一种电子病历的标注方法及装置
技术领域
本发明涉及数据处理技术领域,更具体的,涉及一种电子病历的标注方法及装置。
背景技术
电子病历是医疗活动过程中产生的一种重要的信息资源,包括病历特点、检查记录、临床诊断、诊疗计划等内容,极具深度挖掘的潜力和医疗知识复用的价值。
电子病历采用自由文本形式记录,这给医疗工作者的病历撰写提供了便利,然而却给临床知识发现的自动分析与获取带来了巨大挑战。文本标注是文本资源知识化的重要环节,数据标注的质量关系到知识发现的效率与深度。然而,在实践中存在海量的电子病历,人工对电子病历进行标注需要大量的人力物力,且标注效率低下。因此,如何提高电子病历的标注效率成为本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本发明提供了一种电子病历的标注方法及装置,综合利用自然语言处理技术和机器学习方法对电子病历进行自动化标注,提高了电子病历的标注效率。
为了实现上述发明目的,本发明提供的具体技术方案如下:
一种电子病历的标注方法,包括:
获取人工标注病历数据集和未标注病历数据集;
利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;
在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
可选的,在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集,包括:
将所述未标注病历数据集导入到所述可视化病历标注平台;
在所述可视化病历标注平台,利用所述病历标注模型对所述未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注;
在所述可视化病历标注平台显示对所述未标注病历数据集的分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果;
当接收到修改指令时,对所述修改指令对应的标注结果进行修改,并在所述可视化病历标注平台显示修改结果,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
可选的,在所述将所述未标注病历数据集导入到所述可视化病历标注平台之后,所述方法还包括:
对所述未标注病历数据集进行脱敏处理。
可选的,所述利用所述病历标注模型对所述未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注,包括:
利用所述病历标注模型中的单字特征训练临床命名实体识别算法,对所述未标注病历数据集中的医疗实体的字符进行编码,其中,字符在医疗实体中位置的编码采用BEMS序列标注。
可选的,在所述得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集之后,所述方法还包括:
将所述病历标注结果数据集按照预设数据格式和预设存储路径导出。
一种电子病历的标注装置,包括:
数据获取单元,用于获取人工标注病历数据集和未标注病历数据集;
模型训练单元,用于利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;
标注审校单元,用于在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
可选的,所述标注审校单元包括:
导入子单元,用于将所述未标注病历数据集导入到所述可视化病历标注平台;
标注子单元,用于在所述可视化病历标注平台,利用所述病历标注模型对所述未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注;
显示子单元,用于在所述可视化病历标注平台显示对所述未标注病历数据集的分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果;
修改子单元,用于当接收到修改指令时,对所述修改指令对应的标注结果进行修改,并在所述可视化病历标注平台显示修改结果,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
可选的,所述标注审校单元还包括:
脱敏处理子单元,用于对所述未标注病历数据集进行脱敏处理,并触发所述标注子单元。
可选的,所述标注子单元,具体用于利用所述病历标注模型中的单字特征训练临床命名实体识别算法,对所述未标注病历数据集中的医疗实体的字符进行编码,其中,字符在医疗实体中位置的编码采用BEMS序列标注。
可选的,所述装置还包括:
数据导出单元,用于将所述病历标注结果数据集按照预设数据格式和预设存储路径导出。
相对于现有技术,本发明的有益效果如下:
本发明公开的一种电子病历的标注方法及装置,利用人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型,构建可视化病历标注平台,利用病历标注模型对未标注病历数据集进行标注,提高了电子病历的标注效率。同时,在可视化病历标注平台对标注结果进行审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集,提高电子病历标注的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种电子病历的标注方法的流程示意图;
图2为本发明实施例公开的一种未标注病历数据集的标注和审校方法的流程示意图;
图3为本发明实施例公开的可视化病历标注平台示意图;
图4为本发明实施例公开的五类医疗实体的统计数据示意图;
图5为本发明实施例公开的训练集的实验结果示意图;
图6为本发明实施例公开的测试集的实验结果示意图;
图7为本发明实施例公开的训练集和测试集实体重合度示意图;
图8为本发明实施例公开的采用Pipeline进行实验中比较补充数据集前后的F值示意图;
图9为本发明实施例公开的一种电子病历的标注装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例公开了一种电子病历的标注方法,实现电子病历的自动化标注,进而提高电子病历的标注效率,具体的,请参阅图1,本实施例公开的电子病历的标注方法包括以下步骤:
S101:获取人工标注病历数据集和未标注病历数据集;
其中,人工标注病历数据集是有经验的工作人员标注过的电子病历,人工标注病历数据集包括对电子病历的分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果。
未标注病历数据集为质量较好的未标注电子病历的集合,每份电子病历包括病史特点、出院情况、一般项目和诊疗经过4个文本域。
人工标注病历数据集中的每份电子病历也包括病史特点、出院情况、一般项目和诊疗经过4个文本域。
S102:利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;
条件随机场(ConditionalRandomField,CRF)是序列标注模型,能利用更多的特征,且更能抵抗标记偏置。
其中,利用人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型的过程包括:将人工标注病历数据集划分为训练集和测试集,利用训练集对条件随机场模型进行训练,并利用测试集对训练结果进行测试,当测试结果的准确率大于阈值则认为对条件随机场模型的训练结束,得到病历标注模型。
S103:在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
请参阅图2,对未标注病历数据集进行标注和审校包括以下步骤:
S201:将未标注病历数据集导入到所述可视化病历标注平台;
需要说明的是,在实际应用中导入可视化病历标注平台的电子病历还可以为入院记录、病程记录、手术记录和出院记录。
由于电子病历数据包含有患者和医生的隐私信息,因此,需要在对电子病历进行标注之前对电子病历中的敏感信息进行脱敏处理。
其中,脱敏处理的方法可以为现有技术中的任意一种脱敏处理方法。
S202:在可视化病历标注平台,利用病历标注模型对未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注;
具体的,利用病历标注模型中的单字特征训练临床命名实体识别算法,将位置编码与实体编码相结合,对医疗实体进行编码,字符在实体中位置的编码采用BEMS序列标注,以对“伤及右髋部”进行标注为例,B代表Begin,即词首;E代表End,即词尾;M代表Middle,即词中,对“伤及右髋部”的标注结果如下所示。
进一步,采用“分词-词性标注-医疗实体识别”的方法对电子病历进行标注,例如,对“伤及右髋部”的标注结果如下所示。
在病历标注模型中以“分词-词性标注-医疗实体识别”的顺序进行标注,其中,以分词结果作为词性标注的输入数据,词性标注的输出数据,即词性标注结果作为医疗实体识别的输入数据,得到医疗实体识别结果,依据医疗实体识别结果对实体关系进行标注。
S203:在可视化病历标注平台显示对未标注病历数据集的分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果;
请参阅图3,图3为可视化病历标注平台示意图,实现了对分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果的显示。
S204:当接收到修改指令时,对修改指令对应的标注结果进行修改,并在可视化病历标注平台显示修改结果,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
用户可以对分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果进行审校,当发现有标注错误时,对可视化病历标注平台发送修改指令,该修改指令包括修改种类和修改内容,修改种类包括:分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果,修改内容则为具体需要进行修改的内容以及修改后的内容。
还需要说明的是,可视化病历标注平台还提供了数据导出功能,具体的,当接收到数据导出指令时,将病历标注结果数据集按照预设数据格式和预设存储路径导出,其中,预设数据格式为数据导出指令中所指示的数据格式,预设存储路径为数据导出指令中所指示的存储路径。
为了进一步对本实施例公开的电子病历的标注方法的准确性进行验证,以下采用CCKS2017“电子病历命名实体识别”评测任务数据集,该数据集包括300份人工标注病历和400份质量较好的未标注病历,标注的目标是识别出电子病历文本中的症状和体征、检查和检验、治疗、疾病和诊断、身体部分5类实体。
首先利用病历标注模型对400份未标注病历进行标注,得到400份标注后的病历,并与300份人工标注病历形成700份标注病历数据集,基于700份标注病历按照4:1的比例将数据集划分为560份训练集合140份测试集,采用Pipeline方式对病历数据进行分词、词性标注、临床命名实体识别,对比增加数据集前后的试验结果,评估本实施例提出的电子病历标注方法在原始300份标注病历以及增加标注数据后的700份病历上的性能。
具体的,五类医疗实体的统计数据请参阅4,训练集和测试集的实验结果分别参阅图5和图6,在训练集上,5类医疗实体均得到较高的F值,且总体表现达到0.9331。在测试集上,总体F值达到0.8522,但对于不同的类型的实体,表现各有差异。
在训练集中出现的实体,在测试集中一般能够被识别出来,从图6可以看出,虽然症状和体征的F值达到了0.9536,但治疗类实体的F值却较低,只有0.6804,这可能与测试集中的治疗类实体未出现在训练集中有关。因此,对测试集与训练集重合实体的占比进行统计,统计结果请参阅图7,可以看出治疗类的重合度最低,与设想一致,从而证明图6中不同实体类型之前的差异表现是合理的。
采用Pipeline方式进行实验,比较补充数据集前后的F值,实验结果如图8所示,图中,Train A和Test A分别表示未增加标注数据时在训练集和测试集上的表现,Train B和Test B分别表示增加标注数据时在训练集和测试集上的表现。
实验表明,基于300份病历数据,训练集和测试集上的F值均低于0.8,因此,基于词的临床命名实体识别方法在较少的语料上未能达到理想的效果,通过本实施例公开的电子病历标注方法,在测试集上的总体F值可达到0.8772,较基于原始标注病历数据集的F值0.5884提升了32.9%,从而验证了本实施例提出的电子病历标注方法的可行性。
基于上述实施例公开的一种电子病历的标注方法,本实施例对应公开了一种电子病历的标注装置,请参阅图9,该装置包括:
数据获取单元301,用于获取人工标注病历数据集和未标注病历数据集;
模型训练单元302,用于利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;
标注审校单元303,用于在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
可选的,所述标注审校单元303包括:
导入子单元,用于将所述未标注病历数据集导入到所述可视化病历标注平台;
标注子单元,用于在所述可视化病历标注平台,利用所述病历标注模型对所述未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注;
显示子单元,用于在所述可视化病历标注平台显示对所述未标注病历数据集的分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果;
修改子单元,用于当接收到修改指令时,对所述修改指令对应的标注结果进行修改,并在所述可视化病历标注平台显示修改结果,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
可选的,所述标注审校单元还包括:
脱敏处理子单元,用于对所述未标注病历数据集进行脱敏处理,并触发所述标注子单元。
可选的,所述标注子单元,具体用于利用所述病历标注模型中的单字特征训练临床命名实体识别算法,对所述未标注病历数据集中的医疗实体的字符进行编码,其中,字符在医疗实体中位置的编码采用BEMS序列标注。
可选的,所述装置还包括:
数据导出单元,用于将所述病历标注结果数据集按照预设数据格式和预设存储路径导出。
本实施例公开的一种电子病历的标注装置,利用人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型,构建可视化病历标注平台,利用病历标注模型对未标注病历数据集进行标注,提高了电子病历的标注效率。同时,在可视化病历标注平台对标注结果进行审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集,提高电子病历标注的准确率。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种电子病历的标注方法,其特征在于,包括:
获取人工标注病历数据集和未标注病历数据集;
利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;
在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
2.根据权利要求1所述的方法,其特征在于,在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集,包括:
将所述未标注病历数据集导入到所述可视化病历标注平台;
在所述可视化病历标注平台,利用所述病历标注模型对所述未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注;
在所述可视化病历标注平台显示对所述未标注病历数据集的分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果;
当接收到修改指令时,对所述修改指令对应的标注结果进行修改,并在所述可视化病历标注平台显示修改结果,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
3.根据权利要求2所述的方法,其特征在于,在所述将所述未标注病历数据集导入到所述可视化病历标注平台之后,所述方法还包括:
对所述未标注病历数据集进行脱敏处理。
4.根据权利要求2所述的方法,其特征在于,所述利用所述病历标注模型对所述未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注,包括:
利用所述病历标注模型中的单字特征训练临床命名实体识别算法,对所述未标注病历数据集中的医疗实体的字符进行编码,其中,字符在医疗实体中位置的编码采用BEMS序列标注。
5.根据权利要求1所述的方法,其特征在于,在所述得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集之后,所述方法还包括:
将所述病历标注结果数据集按照预设数据格式和预设存储路径导出。
6.一种电子病历的标注装置,其特征在于,包括:
数据获取单元,用于获取人工标注病历数据集和未标注病历数据集;
模型训练单元,用于利用所述人工标注病历数据集对条件随机场模型进行训练,得到病历标注模型;
标注审校单元,用于在可视化病历标注平台,利用循环标注法和所述病历标注模型对所述未标注病历数据集进行标注和审校,得到包括分词、词性标注、临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
7.根据权利要求6所述的装置,其特征在于,所述标注审校单元包括:
导入子单元,用于将所述未标注病历数据集导入到所述可视化病历标注平台;
标注子单元,用于在所述可视化病历标注平台,利用所述病历标注模型对所述未标注病历数据集进行分词、词性标注、临床医疗命名实体标注和实体关系标注;
显示子单元,用于在所述可视化病历标注平台显示对所述未标注病历数据集的分词结果、词性标注结果、临床医疗命名实体标注结果和实体关系标注结果;
修改子单元,用于当接收到修改指令时,对所述修改指令对应的标注结果进行修改,并在所述可视化病历标注平台显示修改结果,得到包括分词、词性标注和临床医疗命名实体标注和实体关系标注的病历标注结果数据集。
8.根据权利要求7所述的装置,其特征在于,所述标注审校单元还包括:
脱敏处理子单元,用于对所述未标注病历数据集进行脱敏处理,并触发所述标注子单元。
9.根据权利要求7所述的装置,其特征在于,所述标注子单元,具体用于利用所述病历标注模型中的单字特征训练临床命名实体识别算法,对所述未标注病历数据集中的医疗实体的字符进行编码,其中,字符在医疗实体中位置的编码采用BEMS序列标注。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
数据导出单元,用于将所述病历标注结果数据集按照预设数据格式和预设存储路径导出。
CN201910289691.4A 2019-04-11 2019-04-11 一种电子病历的标注方法及装置 Pending CN110010217A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910289691.4A CN110010217A (zh) 2019-04-11 2019-04-11 一种电子病历的标注方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910289691.4A CN110010217A (zh) 2019-04-11 2019-04-11 一种电子病历的标注方法及装置

Publications (1)

Publication Number Publication Date
CN110010217A true CN110010217A (zh) 2019-07-12

Family

ID=67171165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910289691.4A Pending CN110010217A (zh) 2019-04-11 2019-04-11 一种电子病历的标注方法及装置

Country Status (1)

Country Link
CN (1) CN110010217A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081353A (zh) * 2019-12-17 2020-04-28 浙江明峰智能医疗科技有限公司 一种自动化在线学习智能辅助标注医学影像的方法和系统
CN111126068A (zh) * 2019-12-25 2020-05-08 中电云脑(天津)科技有限公司 一种中文命名实体识别方法和装置及电子设备
CN111144099A (zh) * 2019-12-31 2020-05-12 厦门快商通科技股份有限公司 一种基于词性的实体标注的质检方法和装置以及设备
CN111739617A (zh) * 2020-06-15 2020-10-02 中国医学科学院医学信息研究所 医疗影像人工智能质控标注方法、装置、设备及存储介质
CN111986765A (zh) * 2020-09-03 2020-11-24 平安国际智慧城市科技股份有限公司 电子病例实体标记方法、装置、计算机设备及存储介质
CN112614562A (zh) * 2020-12-23 2021-04-06 联仁健康医疗大数据科技股份有限公司 基于电子病历的模型训练方法、装置、设备及存储介质
CN112632597A (zh) * 2020-12-08 2021-04-09 国家计算机网络与信息安全管理中心 一种数据脱敏方法、装置可读存储介质
CN112669918A (zh) * 2020-12-24 2021-04-16 上海市第一人民医院 眼科vegf相关的多维临床试验数据处理方法和系统
CN117034864A (zh) * 2023-09-07 2023-11-10 广州市新谷电子科技有限公司 可视化标注方法、装置、计算机设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020446A (zh) * 2012-12-10 2013-04-03 吴志宏 慢性脊椎退行性疾病及畸形信息的数据处理系统
CN109509557A (zh) * 2018-11-16 2019-03-22 郑州大学第附属医院 一种基于大数据平台的中文电子病历信息抽取预处理方法
CN109522546A (zh) * 2018-10-12 2019-03-26 浙江大学 基于上下文相关的医学命名实体识别方法
CN109582975A (zh) * 2019-01-31 2019-04-05 北京嘉和美康信息技术有限公司 一种命名实体的识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020446A (zh) * 2012-12-10 2013-04-03 吴志宏 慢性脊椎退行性疾病及畸形信息的数据处理系统
CN109522546A (zh) * 2018-10-12 2019-03-26 浙江大学 基于上下文相关的医学命名实体识别方法
CN109509557A (zh) * 2018-11-16 2019-03-22 郑州大学第附属医院 一种基于大数据平台的中文电子病历信息抽取预处理方法
CN109582975A (zh) * 2019-01-31 2019-04-05 北京嘉和美康信息技术有限公司 一种命名实体的识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙姗姗: ""中文电子病历命名实体识别算法研究与系统实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
蒋志鹏: ""中文电子病历的词法和句法分析研究"", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081353A (zh) * 2019-12-17 2020-04-28 浙江明峰智能医疗科技有限公司 一种自动化在线学习智能辅助标注医学影像的方法和系统
CN111126068A (zh) * 2019-12-25 2020-05-08 中电云脑(天津)科技有限公司 一种中文命名实体识别方法和装置及电子设备
CN111144099A (zh) * 2019-12-31 2020-05-12 厦门快商通科技股份有限公司 一种基于词性的实体标注的质检方法和装置以及设备
CN111739617A (zh) * 2020-06-15 2020-10-02 中国医学科学院医学信息研究所 医疗影像人工智能质控标注方法、装置、设备及存储介质
CN111986765A (zh) * 2020-09-03 2020-11-24 平安国际智慧城市科技股份有限公司 电子病例实体标记方法、装置、计算机设备及存储介质
CN111986765B (zh) * 2020-09-03 2023-11-21 深圳平安智慧医健科技有限公司 电子病例实体标记方法、装置、计算机设备及存储介质
CN112632597A (zh) * 2020-12-08 2021-04-09 国家计算机网络与信息安全管理中心 一种数据脱敏方法、装置可读存储介质
CN112614562A (zh) * 2020-12-23 2021-04-06 联仁健康医疗大数据科技股份有限公司 基于电子病历的模型训练方法、装置、设备及存储介质
CN112614562B (zh) * 2020-12-23 2024-05-31 联仁健康医疗大数据科技股份有限公司 基于电子病历的模型训练方法、装置、设备及存储介质
CN112669918A (zh) * 2020-12-24 2021-04-16 上海市第一人民医院 眼科vegf相关的多维临床试验数据处理方法和系统
CN117034864A (zh) * 2023-09-07 2023-11-10 广州市新谷电子科技有限公司 可视化标注方法、装置、计算机设备以及存储介质
CN117034864B (zh) * 2023-09-07 2024-05-10 广州市新谷电子科技有限公司 可视化标注方法、装置、计算机设备以及存储介质

Similar Documents

Publication Publication Date Title
CN110010217A (zh) 一种电子病历的标注方法及装置
US20160132648A1 (en) Data Processing System and Method for Computer-Assisted Coding of Natural Language Medical Text
Constant et al. MWU-aware part-of-speech tagging with a CRF model and lexical resources
CN107577826A (zh) 基于原始诊断数据的疾病分类编码方法及系统
CN107705839A (zh) 疾病自动编码方法及系统
CN110162779A (zh) 病历质量的评估方法、装置及设备
CN107943847A (zh) 企业关系提取方法、装置及存储介质
WO2022033073A1 (zh) 一种面向认知服务的用户意图识别方法及系统
US20150095016A1 (en) Ontologically driven procedure coding
CN108509419B (zh) 中医药古籍文献分词和词性标引方法及系统
CN107145511A (zh) 基于医学文本信息的结构化医学数据库生成方法及系统
CN110377902B (zh) 描述文本生成模型的训练方法和装置
Khin et al. A deep learning architecture for de-identification of patient notes: Implementation and evaluation
CN108959566A (zh) 一种基于Stacking集成学习的医疗文本去隐私方法和系统
CN106202395A (zh) 文本聚类方法和装置
CN112749277B (zh) 医学数据的处理方法、装置及存储介质
CN112613322B (zh) 文本处理方法、装置、设备及存储介质
CN110471835A (zh) 一种基于电力信息系统代码文件的相似度检测方法及系统
CN111477320A (zh) 治疗效果预测模型的构建系统、治疗效果预测系统及终端
CN108920446A (zh) 一种工程文本的处理方法
Haq et al. Mining adverse drug reactions from unstructured mediums at scale
CN117216578A (zh) 基于元学习的可自定义标签深度学习模型构建方法及系统
CN108491487A (zh) 一种临床指南知识编码方法及系统
Dong et al. Open Information Extraction via Chunks
Cuartas et al. Formal Verification of a Mechanical Ventilator Using UPPAAL

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190712

RJ01 Rejection of invention patent application after publication