CN109710670A - 一种将病历文本从自然语言转换为结构化元数据的方法 - Google Patents

一种将病历文本从自然语言转换为结构化元数据的方法 Download PDF

Info

Publication number
CN109710670A
CN109710670A CN201811511195.0A CN201811511195A CN109710670A CN 109710670 A CN109710670 A CN 109710670A CN 201811511195 A CN201811511195 A CN 201811511195A CN 109710670 A CN109710670 A CN 109710670A
Authority
CN
China
Prior art keywords
data
content
row
characteristic value
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811511195.0A
Other languages
English (en)
Other versions
CN109710670B (zh
Inventor
曾凡
邰海军
黄锦
柯钦瑜
黄勇
段惠峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Xuanwei Digital Medical Technology Co ltd
Xuanwei Henan Life Science Co ltd
Original Assignee
Henan Tongyu Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Tongyu Medical Technology Co Ltd filed Critical Henan Tongyu Medical Technology Co Ltd
Priority to CN201811511195.0A priority Critical patent/CN109710670B/zh
Publication of CN109710670A publication Critical patent/CN109710670A/zh
Application granted granted Critical
Publication of CN109710670B publication Critical patent/CN109710670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种将病历文本从自然语言转换为结构化元数据的方法,包括以下步骤:步骤一:从历史病例报告中提取该文本格式中具体器官、部位和术式的特征值文本,并对其进行特征值分析,得出特征字典;步骤二:从医院导出需要分析的历史检测报告,合并成为一个待处理数据集;步骤三:遍历该数据集患者病例,并根据特征值字典分词,截取该器官、部位或术式的说明;步骤四:将该部位截取的数据内容持久化至结构化的数据库中。本发明利用历史病例,使用遍历算法,降低了使用成本,免去了训练集的生成步骤,转换后的结构化病例可以方便的对不同器官和部位的病变进行统计、分析和查找,方便医生进行医学研究、编写论文和教学。

Description

一种将病历文本从自然语言转换为结构化元数据的方法
技术领域
本发明属于医疗信息领域,具体涉及一种将病历文本从自然语言转换为结构化元数据的方法。
背景技术
随着信息技术的发展和医疗信息化的建设,现在医院都在逐渐使用了结构化报告系统进行报告书写,但是输出到打印报告单上时,影像表现和诊断等信息显示形式单一,基本都是标签和值的形式,又或者是带数字和值的模式,显然这种形式不能应用于所有类型报告中,而国内的医院和各个系统需求又需要文本报告,那就需要医生再重新写一份报告,或者在标签和值的报告形式上进行修改,生成我们的自然语言报告,这样,就增加了医生的工作量,降低了效率。
申请号为“CN201810375610.8”名称为“一种将预结构化数据生成医学报告的方法和系统”的专利采用封装模块进行文字替换达到生成不同结构化报告的目的,然而这种方法对于封装模块内的各字段文字描述无法单独编辑成医生惯用语句,对于医生体验而言仍不符合使用习惯。
发明内容
本发明的目的就是为了解决上述问题,提供这一种将病历文本从自然语言转化为结构化元数据的方法,为大数据分析提供基础的元数据支持。
为了实现上述目的,本发明采用如下技术方案:
一种将病历文本从自然语言转换为结构化元数据的方法,包括以下步骤:
步骤一:从历史病例报告中提取该文本格式中具体器官、部位和术式的特征值文本,并对其进行特征值分析,得出特征字典;
步骤二:从医院导出需要分析的历史检测报告,合并成为一个待处理数据集;
步骤三:遍历该数据集患者病例,并根据特征值字典分词,截取该器官、部位或术式的说明;
步骤四:将该部位截取的数据内容持久化至结构化的数据库中。
所述步骤一特征值提取包括如下子步骤:
1)导出一定量的检测报告,将检测报告合并后生成一个大的报告表格,表格内容中需要包括:内容,检查项目,病症,治疗方法;
2)将每个检查项目对应的内容,进行中文分词处理,并将每个不重复的词语列出,并在其后对其统计出现次数后排序;
3)将排序后得到的分词,经医生的删除和补充,得到该医院检查项目对应的内容的特征值字典;
4)重复步骤2和3可以生成每一个检查项目对应的病症和治疗方法的特征值字典;
所述步骤二包括以下子步骤:
5)导出历史数据,以合并的方式准备数据集;
6)遍历数据集,并将导出的数据表合并,得到“住院号”、“患者姓名”、“患者年龄”、“就诊时间” 、“内容”、“病症”、“检查项目”和“治疗方法”,其中“住院号”是患者本次检查的唯一标志,如果报告中的病症和治疗方法是写在一起的, 治疗方法可以为空。
所述步骤三包括以下子步骤:
7)生成检测报告“内容”的结构化数据内容:遍历数据集每位患者的检测报告,在遍历的每行数据中,取每条的 “住院号”、“内容”和“检查项目”所在列的数据,根据“检测项目”,选择对应的特征值字典,根据特征值字典截取对应部位的说明;
8)生成检测报告“病症”和“治疗方法”的结构化数据内容:遍历数据集每位患者的检测报告,在遍历的每行数据中,取每条的 “住院号”、“病症”和“治疗方法”所在列的数据,如果出现了“术”字,且没有出现“术后”,则选择“病症”的特征值字典,如果如果出现了“术”字,则选择“治疗方法”的特征值字典,根据特征值字典截取对应部位的说明。
所述子步骤7)包括以下步骤:
7.1)对“内容”文本进行分段:如果报告中出现了逗号、句号、分号和冒号,则将文本按这些标点符号进行分段,生成一个以分词后独立语句为元素的一维矩阵;
7.2)根据特征值生成二维矩阵:遍历一维矩阵,将其中内容数据段与特征值字典进行比较,如果该数据段包括了特征值字典中的特征,则将该部分及该部分后没有见到下一个特征值前的元素放入矩阵数据格式的“列”,特征值作为该 “行”第一列;
7.3)二维矩阵行拆分:对二维矩阵的“行”进行遍历,得到每列数据,遍历“列”数据,如果该行除了第一“列”还有其他的文本在特征值字典中,则复制该“行”的所有“列”到新的“行”,并将该特征值作为该 “行”第一列;
7.4)二维矩阵行合并:对二维矩阵的“行”进行遍历,得到每列数据,遍历“列”数据,如果有多“行”第一列的特征值有相同的内容,这对这些“行”进行合并;
7.5)每个二维矩阵都是一个患者病例内“内容”的结构化内容,“住院号”是这个矩阵的唯一标志,将他们作为一个“键值对”数据结构进行存储,其“键”是“住院号”,“值”是结构化的“内容”。
所述步骤四包括以下子步骤:
9)将“检查项目”对应的“内容”特征值字典中的值取出,转换为医学英文,并将其作为数据库的列字段,其中“主键”字段就是“住院号”,建立“检查项目”的“内容”表;
10)遍历“检查项目”的“内容”分析后的“键值对”数据结构,将“住院号”放入数据库主键字段,得到每个患者的“内容”结构化矩阵,遍历矩阵,将每“行”第一列和数据库列名进行比较,如果同属一类,则将本行内容放入该数据库字段;
11)“检查项目”的“病症”和“治疗方法”同上述方法进行持久化,其他“检查项目”除特征值字典外,过程与上述一致。
本发明具有以下有益效果:
本发明利用医院沉积的历史病例,一次性转换和生成完成,不用每次使用都去分析,使用遍历算法替代传统递归和机器学习算法(超平面分类、神经元网络),降低了使用成本,在每个医院都可以直接修改和生成,免去了训练集的生成步骤,转换后的结构化病例可以方便的对不同器官和部位的病变进行统计、分析和查找,方便医生进行医学研究、编写论文和教学。
附图说明
图1为本发明原理框图。
图2为本发明步骤一原理图。
图3为本发明步骤一的子步骤原理图。
图4为本发明步骤三原理图。
图5为本发明步骤四原理图。
具体实施方式
如图1-4所示,一种将病历文本从自然语言转换为结构化元数据的方法,包括以下步骤:
步骤一:从历史病例报告中提取该文本格式中具体器官、部位和术式的特征值文本,并对其进行特征值分析,得出特征字典;
步骤二:从医院导出需要分析的历史检测报告,合并成为一个待处理数据集;
步骤三:遍历该数据集患者病例,并根据特征值字典分词,截取该器官、部位或术式的说明;
步骤四:将该部位截取的数据内容持久化至结构化的数据库中。
步骤一特征值提取包括如下子步骤:
1)导出一定量的检测报告,将检测报告合并后生成一个大的报告表格,表格内容中需要包括:“镜下所见”、“镜下诊断”、“检查项目”和“镜下治疗”,其中“镜下所见”描述了消化胃肠镜镜下所见的内容,“检查项目”用于区分是胃镜还是肠镜,“镜下诊断”描述了具体的病症,“镜下治疗”描述了具体的治疗方法;
2)将“检查项目”是“胃镜”的“镜下所见”列在程序中进行中文分词处理,并将每个不重复的词语列出,并在其后对其统计出现次数后排序,例如:“贲门,次数2048”,“胃底,次数1024”,“幽门,次数512”;
3)将排序后得到的分词,经医生的删除和补充,得到该医院“胃镜”的“镜下所见”特征值字典,例如:“咽部”,“会厌”,“消化道”,“食管”,“胃底”,“胃角”,“胃窦”,“胃体”,“贲门”,“幽门”,“胃”,“十二指肠球部”,“十二指肠降部”,“十二指肠”这些关键词组成的“胃镜镜下所见”字典;
4)按步骤2和3可以生成“胃镜”的“镜下诊断”和“镜下治疗”字典;
5)将“检查项目”是“肠镜”的“镜下所见”列在程序中进行中文分词处理,并将每个不重复的词语列出,并在其后对其统计出现次数后排序,例如:“循腔进镜,次数2048”,“回盲瓣,次数1024”,“回肠,次数512”;
6)将排序后得到的分词,经医生的删除和补充,得到该医院“胃镜”的“镜下所见”特征值字典,例如:“循腔进镜”,“进镜”,“回肠”,“回盲瓣”,“阑尾”,“肠道准备”,“横结肠”,“余结肠”,“升结肠”,“降结肠”,“乙状结肠”,“结肠”,“肝曲”,“脾曲”,“结直肠”,“直肠”,“这些关键词组成的“肠镜镜下所见”字典;
7)按步骤5和6可以生成“肠镜”的“镜下诊断”和“镜下治疗”字典。
步骤二包括以下子步骤:
8)从工作站导出历史数据,再进行合并的方式准备数据集;
9)遍历所有的数据集,并将导出的数据表合并,得到“住院号”、“患者姓名”、“患者年龄”、“就诊时间” 、“镜下所见”、“镜下诊断”、“检查项目”和“镜下治疗”,其中“住院号”是患者本次检查的唯一标志,需要注意:有些报告的“诊断”和“治疗”是写在一起的,如果是在一起的情况,“镜下治疗”可以为空。
步骤三包括以下子步骤:
10)生成胃肠镜检测报告“镜下所见”的结构化数据内容:遍历数据集每位患者的检测报告,在遍历的每行数据中,取每条的列“住院号”、“镜下所见”和“检查项目”的数据,根据“检测列表”取分类是“胃镜”还是“肠镜”并选择对应的特征值字典,根据特征值字典截取对应部位的说明;
11)生成胃肠镜检测报告“镜下诊断”和“镜下治疗”的结构化数据内容:遍历数据集每位患者的检测报告,在遍历的每行数据中,取每条的列“住院号”、“镜下诊断”和“镜下治疗”的数据,如果出现了“术”字,且没有出现“术后”,则选择“镜下诊断”的特征值字典,如果如果出现了“术”字,则选择“镜下治疗”,根据特征值字典截取对应部位的说明,截取过程见上一段“镜下所见”。
子步骤10)包括以下步骤:
10.1)对“镜下所见”文本进行分段:如果报告中出现了逗号、句号、分号和冒号,则将文本按这些标点符号进行分段,生成一个以分词后独立语句为元素的一维矩阵;
10.2)根据特征值生成二维矩阵:遍历一维矩阵,将其中内容数据段与特征值字典进行比较,如果该数据段包括了特征值字典中的特征,则将该部分及该部分后没有见到下一个特征值前或的元素放入矩阵数据格式的“列”,特征值作为该 “行”第一列;
10.3)二维矩阵行拆分:对二维矩阵的“行”进行遍历,得到每列数据,遍历“列”数据,如果该行除了第一“列”还有其他的文本在特征值字典中,则复制该“行”的所有“列”到新的“行”,并将该特征值作为该 “行”第一列;
10.4)二维矩阵行合并:对二维矩阵的“行”进行遍历,得到每列数据,遍历“列”数据,如果有多“行”第一列的特征值有相同的内容,这对这些“行” 进行合并;
10.5)每个二维矩阵都是一个患者病例内“镜下所见”的结构化内容,“住院号”是这个矩阵的唯一标志,将他们作为一个“键值对”数据结构进行存储,其“键”是“住院号”,“值”是结构化的“镜下所见”。
步骤四包括以下子步骤:
12)将“胃镜”的“镜下所见”特征值字典中的值取出,转换为医学英文,并将其作为数据库的列字段,其中“主键”字段就是“住院号”,建立“胃镜”的“镜下所见”表;
13)遍历“胃镜”的“镜下所见”分析后的“键值对”数据结构,将“住院号”放入数据库主键字段,得到每个患者的“镜下所见”结构化矩阵,遍历矩阵,将每“行”第一列和数据库列名进行比较,如果同属一类,则将本行内容放入该数据库字段;
14)“胃镜”的“镜下诊断”和“镜下治疗”同上述方法进行持久化,“肠镜”除特征值字典外,过程与“胃镜”一致。
本发明利用医院沉积的历史病例,一次性转换和生成完成,不用每次使用都去分析,使用遍历算法替代传统递归和机器学习算法(超平面分类、神经元网络),降低了使用成本和可维护性,在每个医院都可以直接修改和生成,免去了训练集的生成步骤,转换后的结构化病例可以方便的对不同器官和部位的病变进行统计、分析和查找,方便医生进行医学研究、编写论文和教学。
值得说明的是,文中所有出现“二维矩阵”的地方,矩阵也可以使用“键值对(Key-Value)”、“嵌套的链表(Linked list)”、“嵌套的数组(Array、Vector) ”、“集合(Set)”数据结构说明或表示,所有的“遍历”也都可以用“广度(Breadth First)”或“深度优先(depth-first)”、“递归(recursion)”替换,
本发明实现上述实施例方法中的全部或部分步骤,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

Claims (7)

1.一种将病历文本从自然语言转换为结构化元数据的方法,其特征在于,包括以下步骤:
步骤一:从历史病例报告中提取该文本格式中具体器官、部位和术式的特征值文本,并对其进行特征值分析,得出特征字典;
步骤二:从医院导出需要分析的历史检测报告,合并成为一个待处理数据集;
步骤三:遍历该数据集患者病例,并根据特征值字典分词,截取该器官、部位或术式的说明;
步骤四:将该部位截取的数据内容持久化至结构化的数据库中。
2.根据权利要求1所述的一种将病历文本从自然语言转换为结构化元数据的方法,其特征在于:所述步骤一特征值提取包括如下子步骤:
1)导出一定量的检测报告,将检测报告合并后生成一个大的报告表格,表格内容中需要包括:内容,检查项目,病症,治疗方法;
2)将每个检查项目对应的内容,进行中文分词处理,并将每个不重复的词语列出,并在其后对其统计出现次数后排序;
3)将排序后得到的分词,经医生的删除和补充,得到该医院检查项目对应的内容的特征值字典;
4)重复步骤2和3可以生成每一个检查项目对应的病症和治疗方法的特征值字典。
3.根据权利要求1所述的一种将病历文本从自然语言转换为结构化元数据的方法,其特征在于:所述步骤二包括以下子步骤:
5)导出历史数据,以合并的方式准备数据集;
6)遍历数据集,并将导出的数据表合并,得到“住院号”、“患者姓名”、“患者年龄”、“就诊时间” 、“内容”、“病症”、“检查项目”和“治疗方法”,其中“住院号”是患者本次检查的唯一标志,如果报告中的病症和治疗方法是写在一起的, 治疗方法可以为空。
4.根据权利要求1所述的一种将病历文本从自然语言转换为结构化元数据的方法,其特征在于:所述步骤三包括以下子步骤:
7)生成检测报告“内容”的结构化数据内容:遍历数据集每位患者的检测报告,在遍历的每行数据中,取每条的 “住院号”、“内容”和“检查项目”所在列的数据,根据“检测项目”,选择对应的特征值字典,根据特征值字典截取对应部位的说明;
8)生成检测报告“病症”和“治疗方法”的结构化数据内容:遍历数据集每位患者的检测报告,在遍历的每行数据中,取每条的 “住院号”、“病症”和“治疗方法”所在列的数据,如果出现了“术”字,且没有出现“术后”,则选择“病症”的特征值字典,如果如果出现了“术”字,则选择“治疗方法”的特征值字典,根据特征值字典截取对应部位的说明。
5.根据权利要求4所述的一种将病历文本从自然语言转换为结构化元数据的方法,其特征在于:所述子步骤7)包括以下步骤:
7.1)对“内容”文本进行分段:如果报告中出现了逗号、句号、分号和冒号,则将文本按这些标点符号进行分段,生成一个以分词后独立语句为元素的一维矩阵;
7.2)根据特征值生成二维矩阵:遍历一维矩阵,将其中内容数据段与特征值字典进行比较,如果该数据段包括了特征值字典中的特征,则将该部分及该部分后没有见到下一个特征值前的元素放入矩阵数据格式的“列”,特征值作为该 “行”第一列;
7.3)二维矩阵行拆分:对二维矩阵的“行”进行遍历,得到每列数据,遍历“列”数据,如果该行除了第一“列”还有其他的文本在特征值字典中,则复制该“行”的所有“列”到新的“行”,并将该特征值作为该 “行”第一列;
7.4)二维矩阵行合并:对二维矩阵的“行”进行遍历,得到每列数据,遍历“列”数据,如果有多“行”第一列的特征值有相同的内容,这对这些“行”进行合并;
7.5)每个二维矩阵都是一个患者病例内“内容”的结构化内容,“住院号”是这个矩阵的唯一标志,将他们作为一个“键值对”数据结构进行存储,其“键”是“住院号”,“值”是结构化的“内容”。
6.根据权利要求1所述的一种将病历文本从自然语言转换为结构化元数据的方法,其特征在于:所述步骤四包括以下子步骤:
9)将“检查项目”对应的“内容”特征值字典中的值取出,转换为医学英文,并将其作为数据库的列字段,其中“主键”字段就是“住院号”,建立“检查项目”的“内容”表;
10)遍历“检查项目”的“内容”分析后的“键值对”数据结构,将“住院号”放入数据库主键字段,得到每个患者的“内容”结构化矩阵,遍历矩阵,将每“行”第一列和数据库列名进行比较,如果同属一类,则将本行内容放入该数据库字段;
11)“检查项目”的“病症”和“治疗方法”同上述方法进行持久化,其他“检查项目”除特征值字典外,过程与上述一致。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1至6任意一项所述方法的步骤。
CN201811511195.0A 2018-12-11 2018-12-11 一种将病历文本从自然语言转换为结构化元数据的方法 Active CN109710670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811511195.0A CN109710670B (zh) 2018-12-11 2018-12-11 一种将病历文本从自然语言转换为结构化元数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811511195.0A CN109710670B (zh) 2018-12-11 2018-12-11 一种将病历文本从自然语言转换为结构化元数据的方法

Publications (2)

Publication Number Publication Date
CN109710670A true CN109710670A (zh) 2019-05-03
CN109710670B CN109710670B (zh) 2020-04-28

Family

ID=66256318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811511195.0A Active CN109710670B (zh) 2018-12-11 2018-12-11 一种将病历文本从自然语言转换为结构化元数据的方法

Country Status (1)

Country Link
CN (1) CN109710670B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362829A (zh) * 2019-07-16 2019-10-22 北京百度网讯科技有限公司 结构化病历数据的质量评估方法、装置及设备
CN111026799A (zh) * 2019-12-06 2020-04-17 安翰科技(武汉)股份有限公司 胶囊内窥镜检查报告文本结构化方法、设备及介质
CN111259664A (zh) * 2020-01-14 2020-06-09 腾讯科技(深圳)有限公司 医学文本信息的确定方法、装置、设备及存储介质
CN111739599A (zh) * 2020-06-19 2020-10-02 北京嘉和海森健康科技有限公司 一种教学病历生成方法和装置
CN111986754A (zh) * 2020-08-21 2020-11-24 南通大学 一种基于糖尿病的电子病历管理模型构建方法
CN112116968A (zh) * 2019-06-21 2020-12-22 上海交通大学医学院附属瑞金医院 一种医学检验报告的识别方法、装置、设备及存储介质
CN112185572A (zh) * 2020-09-25 2021-01-05 志诺维思(北京)基因科技有限公司 一种肿瘤专病数据库构建系统、方法、电子设备和介质
CN112349367A (zh) * 2020-11-11 2021-02-09 北京嘉和海森健康科技有限公司 一种生成仿真病历的方法、装置、电子设备及存储介质
CN112800763A (zh) * 2021-04-14 2021-05-14 北京金山云网络技术有限公司 数据处理方法、医学文本数据处理方法、装置及电子设备
CN112800759A (zh) * 2021-04-14 2021-05-14 北京金山云网络技术有限公司 标准化数据的生成方法、医学文本数据的处理方法和装置

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080243500A1 (en) * 2007-03-30 2008-10-02 Maximilian Bisani Automatic Editing Using Probabilistic Word Substitution Models
CN103530513A (zh) * 2013-10-10 2014-01-22 中国中医科学院 一种实现电子病历快速录入的输入系统
US20140344274A1 (en) * 2013-05-20 2014-11-20 Hitachi, Ltd. Information structuring system
US20150347521A1 (en) * 2014-05-08 2015-12-03 Koninklijke Philips N.V. Systems and methods for relation extraction for chinese clinical documents
CN106095913A (zh) * 2016-06-08 2016-11-09 广州同构医疗科技有限公司 一种电子病历文本结构化方法
CN106126577A (zh) * 2016-06-17 2016-11-16 北京理工大学 一种基于数据源划分矩阵的加权关联规则挖掘方法
CN106776606A (zh) * 2015-11-20 2017-05-31 株式会社日立制作所 基于电子病历数据库的检索装置和检索方法
CN106919793A (zh) * 2017-02-24 2017-07-04 黑龙江特士信息技术有限公司 一种医疗大数据的数据标准化处理方法及装置
CN107341264A (zh) * 2017-07-19 2017-11-10 东北大学 一种支持自定义实体的电子病历检索系统及方法
CN107656952A (zh) * 2016-12-30 2018-02-02 青岛中科慧康科技有限公司 平行智能病例推荐模型的建模方法
CN107833595A (zh) * 2017-10-12 2018-03-23 山东大学 医疗大数据多中心整合平台及方法
CN108538395A (zh) * 2018-04-02 2018-09-14 上海市儿童医院 一种通用的医疗专病数据系统的构建方法
CN108711443A (zh) * 2018-05-07 2018-10-26 成都智信电子技术有限公司 电子病历的文本数据解析方法和装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080243500A1 (en) * 2007-03-30 2008-10-02 Maximilian Bisani Automatic Editing Using Probabilistic Word Substitution Models
US20140344274A1 (en) * 2013-05-20 2014-11-20 Hitachi, Ltd. Information structuring system
CN103530513A (zh) * 2013-10-10 2014-01-22 中国中医科学院 一种实现电子病历快速录入的输入系统
US20150347521A1 (en) * 2014-05-08 2015-12-03 Koninklijke Philips N.V. Systems and methods for relation extraction for chinese clinical documents
CN106776606A (zh) * 2015-11-20 2017-05-31 株式会社日立制作所 基于电子病历数据库的检索装置和检索方法
CN106095913A (zh) * 2016-06-08 2016-11-09 广州同构医疗科技有限公司 一种电子病历文本结构化方法
CN106126577A (zh) * 2016-06-17 2016-11-16 北京理工大学 一种基于数据源划分矩阵的加权关联规则挖掘方法
CN107656952A (zh) * 2016-12-30 2018-02-02 青岛中科慧康科技有限公司 平行智能病例推荐模型的建模方法
CN106919793A (zh) * 2017-02-24 2017-07-04 黑龙江特士信息技术有限公司 一种医疗大数据的数据标准化处理方法及装置
CN107341264A (zh) * 2017-07-19 2017-11-10 东北大学 一种支持自定义实体的电子病历检索系统及方法
CN107833595A (zh) * 2017-10-12 2018-03-23 山东大学 医疗大数据多中心整合平台及方法
CN108538395A (zh) * 2018-04-02 2018-09-14 上海市儿童医院 一种通用的医疗专病数据系统的构建方法
CN108711443A (zh) * 2018-05-07 2018-10-26 成都智信电子技术有限公司 电子病历的文本数据解析方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张立君: ""电子病历数据的结构化分析与研究"", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *
陈德华等: ""病理镜检文本数据的结构化处理方法"", 《计算机与现代化》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116968A (zh) * 2019-06-21 2020-12-22 上海交通大学医学院附属瑞金医院 一种医学检验报告的识别方法、装置、设备及存储介质
CN110362829B (zh) * 2019-07-16 2023-01-03 北京百度网讯科技有限公司 结构化病历数据的质量评估方法、装置及设备
CN110362829A (zh) * 2019-07-16 2019-10-22 北京百度网讯科技有限公司 结构化病历数据的质量评估方法、装置及设备
CN111026799A (zh) * 2019-12-06 2020-04-17 安翰科技(武汉)股份有限公司 胶囊内窥镜检查报告文本结构化方法、设备及介质
CN111259664A (zh) * 2020-01-14 2020-06-09 腾讯科技(深圳)有限公司 医学文本信息的确定方法、装置、设备及存储介质
CN111739599A (zh) * 2020-06-19 2020-10-02 北京嘉和海森健康科技有限公司 一种教学病历生成方法和装置
CN111739599B (zh) * 2020-06-19 2023-08-08 北京嘉和海森健康科技有限公司 一种教学病历生成方法和装置
CN111986754A (zh) * 2020-08-21 2020-11-24 南通大学 一种基于糖尿病的电子病历管理模型构建方法
CN112185572A (zh) * 2020-09-25 2021-01-05 志诺维思(北京)基因科技有限公司 一种肿瘤专病数据库构建系统、方法、电子设备和介质
CN112185572B (zh) * 2020-09-25 2024-03-01 志诺维思(北京)基因科技有限公司 一种肿瘤专病数据库构建系统、方法、电子设备和介质
CN112349367A (zh) * 2020-11-11 2021-02-09 北京嘉和海森健康科技有限公司 一种生成仿真病历的方法、装置、电子设备及存储介质
CN112349367B (zh) * 2020-11-11 2023-08-08 北京嘉和海森健康科技有限公司 一种生成仿真病历的方法、装置、电子设备及存储介质
CN112800763A (zh) * 2021-04-14 2021-05-14 北京金山云网络技术有限公司 数据处理方法、医学文本数据处理方法、装置及电子设备
CN112800759A (zh) * 2021-04-14 2021-05-14 北京金山云网络技术有限公司 标准化数据的生成方法、医学文本数据的处理方法和装置
CN112800763B (zh) * 2021-04-14 2021-08-06 北京金山云网络技术有限公司 数据处理方法、医学文本数据处理方法、装置及电子设备
CN112800759B (zh) * 2021-04-14 2021-08-06 北京金山云网络技术有限公司 标准化数据的生成方法、医学文本数据的处理方法和装置

Also Published As

Publication number Publication date
CN109710670B (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN109710670A (zh) 一种将病历文本从自然语言转换为结构化元数据的方法
Jayatilake et al. Involvement of machine learning tools in healthcare decision making
Zhang et al. Large-scale domain-specific pretraining for biomedical vision-language processing
Li et al. Auxiliary signal-guided knowledge encoder-decoder for medical report generation
Ukwuoma et al. A hybrid explainable ensemble transformer encoder for pneumonia identification from chest X-ray images
Zeng et al. Counterfactual generator: A weakly-supervised method for named entity recognition
Naeem et al. SCDNet: a deep learning-based framework for the multiclassification of skin cancer using dermoscopy images
Iftikhar et al. An evolution based hybrid approach for heart diseases classification and associated risk factors identification
Hassan et al. Developing intelligent medical image modality classification system using deep transfer learning and LDA
CN109670179A (zh) 基于迭代膨胀卷积神经网络的病历文本命名实体识别方法
CN110428907A (zh) 一种基于非结构化电子病历的文本挖掘方法及系统
EP4026047A1 (en) Automated information extraction and enrichment in pathology report using natural language processing
Yue et al. Attention-driven cascaded network for diabetic retinopathy grading from fundus images
Zakaria et al. Mining massive archives of mice sounds with symbolized representations
Khan et al. An effective approach for early liver disease prediction and sensitivity analysis
Fung et al. A self-knowledge distillation-driven CNN-LSTM model for predicting disease outcomes using longitudinal microbiome data
Thakur et al. RNN-CNN based cancer prediction model for gene expression
Wu et al. AGNet: Automatic generation network for skin imaging reports
Rajput et al. Automated detection of colon cancer using deep learning
Maheswari et al. SENTIMENT ANALYSIS IN MELANOMA CANCER DETECTION USING ENSEMBLE LEARNING MODEL.
Kapadia et al. Content based medical image retrieval system for accurate disease diagnoses using modified multi feature fused Xception model
Fei et al. Adversarial shared-private model for cross-domain clinical text entailment recognition
Khedikar et al. Identification of Disease by Using SVM Classifier
Tu et al. Deep Multi-Dictionary Learning for Survival Prediction With Multi-Zoom Histopathological Whole Slide Images
Jansi Rani et al. Microarray Data Classification and Gene Selection Using Convolutional Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190902

Address after: Room 102, 104, 108, 110, 112, 114, 116, 122, Building 4, 220 Huashan Road, Zhongyuan District, Zhengzhou City, Henan Province, 450000

Applicant after: Xuan Yun (Henan) Academy of Life Sciences Co.,Ltd.

Address before: 450007 No. 1305, Block B, Shengyin Thailand International Center, Zhongyuan District, Zhengzhou City, Henan Province

Applicant before: HENAN TONGYU MEDICAL TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 450000 rooms 102, 104, 108, 110, 112, 114, 116, 122, 1st floor, building 4, 220 Huashan Road, Zhongyuan District, Zhengzhou City, Henan Province

Patentee after: Xuanwei (Henan) Life Science Co.,Ltd.

Country or region after: China

Address before: 450000 rooms 102, 104, 108, 110, 112, 114, 116, 122, 1st floor, building 4, 220 Huashan Road, Zhongyuan District, Zhengzhou City, Henan Province

Patentee before: Xuan Yun (Henan) Academy of Life Sciences Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240524

Address after: 450000 rooms 109 and 113, 1st floor, building 4, No. 220 Huashan Road, Zhongyuan District, Zhengzhou City, Henan Province

Patentee after: Henan Xuanwei Digital Medical Technology Co.,Ltd.

Country or region after: China

Address before: 450000 rooms 102, 104, 108, 110, 112, 114, 116, 122, 1st floor, building 4, 220 Huashan Road, Zhongyuan District, Zhengzhou City, Henan Province

Patentee before: Xuanwei (Henan) Life Science Co.,Ltd.

Country or region before: China