CN105468900B - 一种基于知识库的智能病历录入平台 - Google Patents

一种基于知识库的智能病历录入平台 Download PDF

Info

Publication number
CN105468900B
CN105468900B CN201510799684.0A CN201510799684A CN105468900B CN 105468900 B CN105468900 B CN 105468900B CN 201510799684 A CN201510799684 A CN 201510799684A CN 105468900 B CN105468900 B CN 105468900B
Authority
CN
China
Prior art keywords
typing
case history
user
module
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510799684.0A
Other languages
English (en)
Other versions
CN105468900A (zh
Inventor
邹远强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510799684.0A priority Critical patent/CN105468900B/zh
Publication of CN105468900A publication Critical patent/CN105468900A/zh
Application granted granted Critical
Publication of CN105468900B publication Critical patent/CN105468900B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于知识库的智能病历录入平台。通过对医院历史病历进行信息提取,形成病历录入所需的知识库,其具体操作流程如下:(1)上传电子病历到后台业务管理模块;(2)后台模块自动扫描并批量从电子病历中提取语料和病案实例形成知识库;(3)智能病历录入模块自动从服务器端下载生成好的知识库,用户使用智能病历录入客户端录入病历;(4)用户触发客户端功能键,将当前录入的信息送至后台进行病案相关因素的查询给出诊断提示。本发明在对医院历史病历进行信息提取形成的知识库基础上,实现用户在最小的语境内,选择最高准确度的词或句进行病历快捷录入,给用户在录入过程中提供了辅助诊断信息提示功能,使用方便。

Description

一种基于知识库的智能病历录入平台
技术领域
本发明涉及一种基于知识库的智能病历录入平台,属于智能病历管理技术领域。
背景技术
目前,医疗治疗中,经常需要针对各种各样的病历进行管理,一般的产品中,存在以下几点不足:1)没有完整专业的病历语境语料作为录入的依据,医生需要较多的点击、选择才能完成录入工作;2)不能根据已经录入的内容切换更精确的语境;3)不能将已经录入的内容结合历史数据有效地预测下文;4)没有基于历史病历数据的智能辅助诊断功能。对此,需要采用合适的方式予以改进。
发明内容
本发明的目的在于提供一种基于知识库的智能病历录入平台,通过对医院历史病历进行信息提取,形成智能病历录入平台所需的语料知识库,以及智能辅助诊断所需的病案库,在此基础上,实现病历快捷录入和智能辅助诊断;智能辅助诊断功能的目的是方便医生参考历史病历知识,迅速做出判断,加速病历录入。
为了实现上述目的,本发明的技术方案如下。
一种基于知识库的智能病历录入平台,采用C/S架构,并扩展至云计算架构,通过对医院历史病历进行信息提取,形成智能病历录入所需的语料和病案库,其具体操作流程如下:
(1)授权人员上传电子病历到后台业务管理模块;
(2)后台业务管理模块自动扫描并批量处理电子病历,从电子病历中提取出字、词、短语、短句以及病案实例并入库,同时训练出拼音分类模型、语境识别、录入预测和智能辅助诊断四大模型;
(3)智能病历录入模块自动从服务器端下载生成好的语料知识库。用户使用智能病历录入客户端录入病历。客户端通过纠错算法、语境识别算法以及预测算法为用户提供高准确度的候选项;对于用户自定义的或不在全部词库中的词汇,通过对本地临时词库的管理,自动与服务器端同步,作为服务器词库的扩展;
(4)用户通过手动触发智能病历录入客户端的功能键,将当前录入的信息送至智能辅助诊断模块进行预处理,再通过消息接口送至后台业务管理模块,调用智能辅助诊断模型,为用户推荐可能的诊断、用药、检验检查及处理方法信息;用户在辅助诊断信息的基础上,能够加快病历的录入。
上述基于知识库的智能病历录入平台由智能病历录入模块、统一接口模块、后台业务管理模块、统一数据库访问模块以及知识库五部分组成,各部分模块功能如下:
(1)智能病历录入模块:本模块实现一种在病案库基础上的智能病历录入功能,尤其适用于门诊电子病历的录入;本录入功能,基于拼音输入法,根据用户所在科室、专业及所录入的文本信息,智能识别语境,优先在精确的语料库中,为用户提供高准确度的候选项;智能病历录入模块包括以下六大子模块:用户注册登录模块、输入输出模块、算法模块、词库模块、辅助诊断模块、升级管理模块,其中,(a)用户注册登录模块支持未注册用户注册、注册用户登录,用户参数设置;(b)输入输出模块用于用户录入和向用户系统输出病历;对于输入部分,根据用户输入的拼音,通过拼音模式匹配判断是否需要调用纠错算法,如果拼写错误,则平台会自动纠正,给出正确的发音;接着,根据正确的录入,平台根据用户的输入语境优先选择病案库词汇作为候选项,再通过点击空格或者触发系统热键,调用录入预测算法。如果不在病案库中的字或词,则通过录入模块的基础码表及词典实现。对于输出部分,用户通过点击鼠标或者敲击键盘,完成从候选项到用户系统的文字输出。(c)算法模块包括三大部分算法及其对应的三大机器学习模型,分别是用于拼写检查的纠错算法、用于切换录入依赖的语料库的语境识别算法、用于生成候选项的录入预测算法,其中,纠错算法是通过获取录入的拼音,调用基础拼音校验算法识别诸如平/卷舌,f/h基础错误,接着调用拼音分类模型,优先在语料库中筛选最相似的拼音及对应的字、词或者短语;如果可能存在录入错误,平台提供的候选项由一个纠错后的词汇加若干可匹配词汇构成;语境识别算法是通过用户录入的最近四个词汇,根据这四个词汇的词性以及构词类型,实时调用语境识别模型,将候选项的选择范围逐步缩小到平台定义的最小类别-病历块;当用户录入完句号或者回车符后,语境识别算法将当前语境重新初始化;录入预测算法,是通过记录用户最近录入的四个词汇,及其词性和构词类型,实时调用录入预测模型生成最优的候选项集,并根据上文内容推荐最优的下文,如:医学单位、短语或短句。(d)词库模块包括输入法依赖的基础码表、词汇表、专业词汇表,以及用户的临时词库。当用户录入拼音后,平台会优先调用录入预测算法,此时,候选项由历史病历词汇和基础词汇共同构成。当用户录入的拼音,得不到或者得到空的录入预测算法的返回结果,此时,候选项仅由基础词库的词汇构成。(e)辅助诊断模块主要是将当前录入环境中用户已经录入的词汇及其构词类型进行封装通过统一接口模块发送至后台业务管理模块,并将后台返回的结果在录入客户端上显示。(f)升级管理模块负责定时向统一接口模块发送软件升级、词库升级查询指令,并将返回的信息进行展示。
(2)统一接口模块:本模块实现智能病历录入客户端同服务器端的统一通信适配、收发及调度功能。包括以下三大子模块:消息适配器、消息发送和管理模块以及调度中心:(a)消息适配器:消息模板管理,通过命令字适配并实例化各类消息。(b)消息发送和管理模块:管理、封装和转发消息。(c)调度中心:实现消息同步或者异步调用。
(3)后台业务管理模块:本模块实现智能病历录入平台的服务器端。统一管理用户,提取历史病历信息以及计算病历知识相关性以辅助诊断。本模块包括四个子模块:用户管理、升级及同步管理、智能辅助诊断、病历管理及信息提取。(a)用户管理:用户基本信息管理,权限管理。(b)升级及同步管理:对应客户端的升级管理模块,实现升级业务逻辑的判断。(c)智能辅助诊断:本模块对应客户端的辅助诊断模块,包括智能辅助诊断模型,通过对客户端输入的患者症状信息,匹配病案库中的相关案例,计算各个特征的相关性,给用户在诊断、用药、检查检验以及处理方法方面的提示信息。(d)病历管理及信息提取:本模块集中处理历史病历文本,并将上传的病历进行信息抽取入语料库及病案库。信息抽取流程为:
(01)用户指定若干份病历作为机器学习的训练集,平台依据基础数据库,采用高精度反向最大匹配算法自动标注语料库,并提供交互式界面进行人工核对。
(02)人工校验修改完毕后,采用基于监督的机器学习算法对剩余病历进行信息标注,再结合句法规则库提取病历信息。
(03)接着将所提取的语料库按照科室、病历块来计算词频,形成转移矩阵,生成拼音分类模型、语境识别、录入预测三个模型;所提取的病人事实数据被入库为智能辅助诊断提供数据源,生成智能辅助诊断模型;拼音分类模型、语境识别、录入预测和智能辅助诊断四大模型的基本功能为:拼音分类模型,该模型以历史病历提取的字和词,加上基础词汇为样本,用拼音为特征进行分类,每个拼音类别中将字、词汇按词频由高到低排序,通过短文本相似度计算算法以及机器学习中基于监督的分类模型进行建模;根据输入的拼音,输出最优的候选字或者词;语境识别模型,该模型以历史病历提取的词及其词性和构成类型为基础,通过非监督的机器学习算法,自动从病历中提取出科室与高频词汇的概率模型,科室病历块与高频词汇的概率模型;从而实现根据用户最近录入的若干词汇,准确识别用户当前可能在录入的病历块环境;输入最近录入的若干词及其词性和构词类别,输出语境标识,并设置录入预测模型的语境参数;录入预测模型,该模型根据语境识别模型设定的语境参数选择最优的词库,并在拼音分类模型校正输入的基础上,通过高速索引从最优的词库中组织候选项,实现字、词的录入预测;并通过查询全局的二元词汇转移矩阵和科室及病历块级别的三元词汇转移矩阵,根据从病历中提出的上下文语义模式规则,实现对下文的录入预测;该模块输入拼音,输出若干候选项集。
(4)统一数据库访问模块:本模块实现对数据库的统一访问管理。实现业务层与数据层的隔离。包括适配管理、索引管理、封装器、元数据管理四大子模块。(a)适配管理:自动适配各类数据库。(b)索引管理:通过整合lucence、solr对数据库进行统一索引。(c)封装器:封装数据库访问原语,统一数据库访问。(d)元数据管理:存储数据库元数据,统一生成各类SQL操作语句。
(5)知识库:本模块存储用户信息、历史病历信息、语料信息,为智能录入和辅助诊断提供数据支持;主要包括以下几大类数据:用户数据库、基础词库、病历词库、规则库及病案库;(a)用户数据库:存储用户基本数据、权限数据;(b)基础词库:存储拼音输入法依赖的基础码表、词库、专业词库数据;(c)病历词库:存储从历史病历中提出的病历中出现的字、词及短句,字频、词频、短句频率,以及全局的二元词汇转移矩阵,科室及病历块下的三元词汇转移关系;(d)规则库:存储基础的上下文语义关系,机器从病历中学习到的语义关系,句法规则,医学单位使用规则;(e)病案库:以患者编号、住院次数为线索,按雪花模型存储患者的人口统计学信息、住院信息、门诊信息、检验信息、诊断信息、用药信息、症状信息、体征信息等其他从历史病历中提取的信息。
该发明的有益效果在于:本发明在对医院历史病历进行信息提取形成的知识库基础上,实现用户在最小的语境内,选择最高准确度的词进行病历快捷录入,并且结合历史病历知识,给用户在录入过程中提供了辅助诊断信息提示功能,使用方便。
附图说明
图1是本发明实施例中的总体结构示意图。
图2是本发明实施例中的功能模块视图。
图3是本发明实施例中的智能录入流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便更好的理解本发明。
实施例
图1是本发明实施例中的总体结构示意图。本实施例中的基于知识库的智能病历录入平台,采用C/S架构,并扩展至云计算架构,通过对医院历史病历进行信息提取,形成智能病历录入所需的语料和病案库,其具体操作流程如下:
(1)授权人员上传电子病历到后台业务管理模块;
(2)后台业务管理模块自动扫描并批量处理电子病历,从电子病历中提取出字、词、短语、短句以及病案实例并入库,同时训练出拼音分类模型、语境识别、录入预测和智能辅助诊断四大模型;
(3)智能病历录入模块自动从服务器端下载生成好的语料知识库。用户使用智能病历录入客户端录入病历。客户端通过纠错算法、语境识别算法以及预测算法为用户提供高准确度的候选项;对于用户自定义的或不在全部词库中的词汇,通过对本地临时词库的管理,自动与服务器端同步,作为服务器词库的扩展;
(4)用户通过手动触发智能病历录入客户端的功能键,将当前录入的信息送至智能辅助诊断模块进行预处理,再通过消息接口送至后台业务管理模块,调用智能辅助诊断模型,为用户推荐可能的诊断、用药、检验检查及处理方法等信息;用户在辅助诊断信息的基础上,能够加快病历的录入。
如图2所示的本发明实施例中的功能模块视图,上述基于知识库的智能病历录入平台由智能病历录入模块、统一接口模块、后台业务管理模块、统一数据库访问模块以及知识库五部分组成,各部分模块功能如下:
(1)智能病历录入模块:本模块实现一种在病案库基础上的智能病历录入功能,尤其适用于门诊电子病历的录入;本录入功能,基于拼音输入法,根据用户所在科室、专业及所录入的文本信息,智能识别语境,优先在精确的语料库中,为用户提供高准确度的候选项;智能病历录入模块包括以下六大子模块:用户注册登录模块、输入输出模块、算法模块、词库模块、辅助诊断模块、升级管理模块,其中,(a)用户注册登录模块支持未注册用户注册、注册用户登录用户参数设置;(b)输入输出模块用于用户录入和向用户系统输出病历;对于输入部分,根据用户输入的拼音,通过拼音模式匹配判断是否需要调用纠错算法,如果拼写错误,则平台会自动纠正,给出正确的发音;接着,根据正确的录入,平台根据用户的输入语境优先选择病案库词汇作为候选项,再通过点击空格或者触发系统热键,调用录入预测算法。如果不在病案库中的字或词,则通过录入模块的基础码表及词典实现。对于输出部分,用户通过点击鼠标或者敲击键盘,完成从候选项到用户系统的文字输出。(c)算法模块包括三大部分算法及其对应的三大机器学习模型,分别是用于拼写检查的纠错算法、用于切换录入依赖的语料库的语境识别算法、用于生成候选项的录入预测算法,其中,纠错算法是通过获取录入的拼音,调用基础拼音错误模型识别诸如平/卷舌,f/h等基础错误,接着调用拼音分类模型,优先在语料库中筛选最相似的拼音及对应的字、词或者短语;如果可能存在录入错误,平台提供的候选项由一个纠错后的词汇加若干可匹配词汇构成;语境识别算法是通过用户录入的最近四个词汇,根据这四个词汇的词性以及构词类型,实时调用语境识别模型,将候选项的选择范围逐步缩小到平台定义的最小类别-病历块;当用户录入完句号或者回车符后,语境识别算法将当前语境重新初始化;录入预测算法,是通过记录用户最近录入的四个词汇,及其词性和构词类型,实时调用录入预测模型生成最优的候选项集,并根据上文内容推荐最优的下文,如:医学单位、短语或短句。(d)词库模块包括输入法依赖的基础码表、词汇表、专业词汇表,以及用户的临时词库。当用户录入拼音后,平台会优先调用录入预测算法,此时,候选项由历史病历词汇和基础词汇共同构成。当用户录入的拼音,得不到或者得到空的录入预测算法的返回结果,此时,候选项仅由基础词库的词汇构成。(e)辅助诊断模块主要是将当前录入环境中用户已经录入的词汇及其构词类型进行封装通过统一接口模块发送至后台业务管理模块,并将后台返回的结果在录入客户端上显示。(f)升级管理模块负责定时向统一接口模块发送软件升级、词库升级查询指令,并将返回的信息进行展示。
(2)统一接口模块:本模块实现智能病历录入客户端同服务器端的统一通信适配、收发及调度功能。包括以下三大子模块:消息适配器、消息发送和管理模块以及调度中心:(a)消息适配器:消息模板管理,通过命令字适配并实例化各类消息。(b)消息发送和管理模块:管理、封装和转发消息。(c)调度中心:实现消息同步或者异步调用。
(3)后台业务管理模块:本模块实现智能病历录入平台的服务器端。统一管理用户,提取历史病历信息以及计算病历知识相关性以辅助诊断。本模块包括四个子模块:用户管理、升级及同步管理、智能辅助诊断、病历管理及信息提取。(a)用户管理:用户基本信息管理,权限管理。(b)升级及同步管理:对应客户端的升级管理模块,实现升级业务逻辑的判断。(c)智能辅助诊断:本模块对应客户端的辅助诊断模块,包括智能辅助诊断模型,通过对客户端输入的患者症状等信息,匹配病案库中的相关案例,计算各个特征的相关性,给用户在诊断、用药、检查检验以及处理方法等方面的提示信息。(d)病历管理及信息提取:本模块集中处理历史病历文本,并将上传的病历进行信息抽取入语料库及病案库。信息抽取流程为:
(01)用户指定若干份病历作为机器学习的训练集,平台依据基础数据库,采用高精度反向最大匹配算法自动标注语料库,并提供交互式界面进行人工核对。
(02)人工校验修改完毕后,采用基于监督的机器学习算法对剩余病历进行信息标注,再结合句法规则库提取病历信息。
(03)接着将所提取的语料库按照科室、病历块来计算词频,形成转移矩阵,生成拼音分类模型、语境识别、录入预测三个模型;所提取的病人事实数据被入库为智能辅助诊断提供数据源,生成智能辅助诊断模型;拼音分类模型、语境识别、录入预测和智能辅助诊断四大模型的基本功能为:拼音分类模型,该模型以历史病历提取的字和词,加上基础词汇为样本,用拼音为特征进行分类,每个拼音类别中将字、词汇按词频由高到低排序,通过短文本相似度计算算法以及机器学习中基于监督的分类模型进行建模;根据输入的拼音,输出最优的候选字或者词;语境识别模型,该模型以历史病历提取的词及其词性和构成类型为基础,通过非监督的机器学习算法,自动从病历中提取出科室与高频词汇的概率模型,科室病历块与高频词汇的概率模型;从而实现根据用户最近录入的若干词汇,准确识别用户当前可能在录入的病历块环境;输入最近录入的若干词及其词性和构词类别,输出语境标识,并设置录入预测模型的语境参数;录入预测模型,该模型根据语境识别模型设定的语境参数选择最优的词库,并在拼音分类模型校正输入的基础上,通过高速索引从最优的词库中组织候选项,实现字、词的录入预测;并通过查询全局的二元词汇转移矩阵和科室及病历块级别的三元词汇转移矩阵,根据从病历中提出的上下文语义模式规则,实现对下文的录入预测;该模块输入拼音,输出若干候选项集。
(4)统一数据库访问模块:本模块实现对数据库的统一访问管理。实现业务层与数据层的隔离。包括适配管理、索引管理、封装器、元数据管理四大子模块。(a)适配管理:自动适配各类数据库。(b)索引管理:通过整合lucence、solr对数据库进行统一索引。(c)封装器:封装数据库访问原语,统一数据库访问。(d)元数据管理:存储数据库元数据,统一生成各类SQL操作语句。
(5)知识库:本模块存储用户信息、历史病历信息、语料信息,为智能录入和辅助诊断提供数据支持;主要包括以下几大类数据:用户数据库、基础词库、病历词库、规则库及病案库;(a)用户数据库:存储用户基本数据、权限数据;(b)基础词库:存储拼音输入法依赖的基础码表、词库、专业词库数据;(c)病历词库:存储从历史病历中提出的病历中出现的字、词及短句,字频、词频、短句频率,以及全局的二元词汇转移矩阵,科室及病历块下的三元词汇转移关系;(d)规则库:存储基础的上下文语义关系,机器从病历中学习到的语义关系,句法规则,医学单位使用规则;(e)病案库:以患者编号、住院次数为线索,按雪花模型存储患者的人口统计学信息、住院信息、门诊信息、检验信息、诊断信息、用药信息、症状信息、体征信息等其他从历史病历中提取的信息。图3是本发明实施例中的智能录入流程图。
以录入胸外科查体部分信息为例,上述平台具体操作流程如下:
(1)用户登录平台;
(2)平台根据用户权限选取胸外科相关历史数据作为当前语境;
(3)用户开始录入拼音缩写“tw”,平台优先推荐“体温”,“体外”等候选项;
(4)用户选择“体温”,接着录入相关数字,点击“空格”键,平台自动提示单位“℃”;
(5)平台根据用户录入的数据,实时识别当前用户语境,选择合适的语料集。在用户录入完体温信息后,平台识别出当前语境为胸外科病历的“查体/体格检查”病历块;
(6)用户继续录入信息,比如录入“发育”,点击“空格”键,系统提示“正常”,“不良”等候选项,选择“正常”后,继续录入“,”,平台根据特殊分隔符预测下文短句,此时平台提示“营养良好”,“营养中等”等候选项供选择;
(7)若新录入的词语不在当前语境历史语料中,平台将回到上层病种语境。对于不存在于历史病历语料中的,甚至不存在基础词库中的词语,平台将保存至本地临时词库,并对本地临时词库词频的实时更新,本地临时词库中词频超过阈值的词汇,将被同步到服务器的词库中。
(8)用户触发智能病历录入模块功能键,平台会根据本次录入的文本及语境信息,查找数据库中相似的病案信息。通过调用智能辅助诊断模型,用药、检查检验、诊断、处理方法等信息将会按照相关性系数排序后展示出来,供用户参考,以便加速后续内容的录入。比如录入信息中包括“体温38℃,痰中带血”,平台智能辅助诊断模块会提示“肺癌(0.19);贫血(0.1);流行性感冒(0.1);建议胸部X线检查”,如果录入的信息更全“体温38℃,痰中带血,左侧肺部有阴影”,平台智能辅助诊断模块会提示“肺癌(0.9);贫血(0.1);流行性感冒(0.1);建议胸部CT检查,低剂量螺旋胸部CT,MRI检查,B型超声检查,纵隔镜检查,胸腔穿刺术,胸腹活检术,胸腔镜检查,纤维支气管镜检查…”。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (1)

1.一种基于知识库的智能病历录入平台,其特征在于:采用C/S架构,并扩展至云计算架构,通过对医院历史病历进行信息提取,形成智能病历录入所需的语料和病案库,其具体操作流程如下:
(1)授权人员上传电子病历到后台业务管理模块;
(2)后台业务管理模块自动扫描并批量处理电子病历,从电子病历中提取出字、词、短语、短句以及病案实例并入库,同时训练出拼音分类模型、语境识别、录入预测和智能辅助诊断四大模型;
(3)智能病历录入模块自动从服务器端下载生成好的语料知识库;用户使用智能病历录入客户端录入病历;客户端通过纠错算法、语境识别算法以及预测算法为用户提供高准确度的候选项;对于用户自定义的或不在全部词库中的词汇,通过对本地临时词库的管理,自动与服务器端同步,作为服务器词库的扩展;
(4)用户通过手动触发智能病历录入客户端的功能键,将当前录入的信息送至智能辅助诊断模块进行预处理,再通过消息接口送至后台业务管理模块,调用智能辅助诊断模型,为用户推荐可能的诊断、用药、检验检查及处理方法等信息;用户在辅助诊断信息的基础上,能够加快病历的录入;所述平台由智能病历录入模块、统一接口模块、后台业务管理模块、统一数据库访问模块以及知识库五部分组成,各部分模块功能如下:
(1)智能病历录入模块:本模块实现一种在病案库基础上的智能病历录入功能,尤其适用于门诊电子病历的录入;本录入功能,基于拼音输入法,根据用户所在科室、专业及所录入的文本信息,智能识别语境,优先在精确的语料库中,为用户提供高准确度的候选项;智能病历录入模块包括以下六大子模块:用户注册登录模块、输入输出模块、算法模块、词库模块、辅助诊断模块、升级管理模块,其中,(a)用户注册登录模块支持未注册用户注册、注册用户登录,用户参数设置;(b)输入输出模块用于用户录入和向用户系统输出病历;对于输入部分,根据用户输入的拼音,通过拼音模式匹配判断是否需要调用纠错算法,如果拼写错误,则平台会自动纠正,给出正确的发音;接着,根据正确的录入,平台根据用户的输入语境优先选择病案库词汇作为候选项,再通过点击空格或者触发系统热键,调用录入预测算法;如果不在病案库中的字或词,则通过录入模块的基础码表及词典实现;对于输出部分,用户通过点击鼠标或者敲击键盘,完成从候选项到用户系统的文字输出;(c)算法模块包括三大部分算法及其对应的三大机器学习模型,分别是用于拼写检查的纠错算法、用于切换录入依赖的语料库的语境识别算法、用于生成候选项的录入预测算法,其中,纠错算法是通过获取录入的拼音,调用基础拼音校验算法识别诸如平/卷舌,f/h基础错误,接着调用拼音分类模型,优先在语料库中筛选最相似的拼音及对应的字、词或者短语;如果可能存在录入错误,平台提供的候选项由一个纠错后的词汇加若干可匹配词汇构成;语境识别算法是通过用户录入的最近四个词汇,根据这四个词汇的词性以及构词类型,实时调用语境识别模型,将候选项的选择范围逐步缩小到平台定义的最小类别-病历块;当用户录入完句号或者回车符后,语境识别算法将当前语境重新初始化;录入预测算法,是通过记录用户最近录入的四个词汇,及其词性和构词类型,实时调用录入预测模型生成最优的候选项集,并根据上文内容推荐最优的下文,如:医学单位、短语或短句;(d)词库模块包括输入法依赖的基础码表、词汇表、专业词汇表,以及用户的临时词库;当用户录入拼音后,平台会优先调用录入预测算法,此时,候选项由历史病历词汇和基础词汇共同构成;当用户录入的拼音,得不到或者得到空的录入预测算法的返回结果,此时,候选项仅由基础词库的词汇构成;(e)辅助诊断模块主要是将当前录入环境中用户已经录入的词汇及其构词类型进行封装通过统一接口模块发送至后台业务管理模块,并将后台返回的结果在录入客户端上显示;(f)升级管理模块负责定时向统一接口模块发送软件升级、词库升级查询指令,并将返回的信息进行展示;
(2)统一接口模块:本模块实现智能病历录入客户端同服务器端的统一通信适配、收发及调度功能;包括以下三大子模块:消息适配器、消息发送和管理模块以及调度中心:(a)消息适配器:消息模板管理,通过命令字适配并实例化各类消息;(b)消息发送和管理模块:管理、封装和转发消息;(c)调度中心:实现消息同步或者异步调用;
(3)后台业务管理模块:本模块实现智能病历录入平台的服务器端;统一管理用户,提取历史病历信息以及计算病历知识相关性以辅助诊断;本模块包括四个子模块:用户管理、升级及同步管理、智能辅助诊断、病历管理及信息提取;(a)用户管理:用户基本信息管理,权限管理;(b)升级及同步管理:对应客户端的升级管理模块,实现升级业务逻辑的判断;(c)智能辅助诊断:本模块对应客户端的辅助诊断模块,包括智能辅助诊断模型,通过对客户端输入的患者症状信息,匹配病案库中的相关案例,计算各个特征的相关性,给用户在诊断、用药、检查检验以及处理方法方面的提示信息;(d)病历管理及信息提取:本模块集中处理历史病历文本,并将上传的病历进行信息抽取入语料库及病案库;
(4)统一数据库访问模块:本模块实现对数据库的统一访问管理;实现业务层与数据层的隔离;包括适配管理、索引管理、封装器、元数据管理四大子模块;(a)适配管理:自动适配各类数据库;(b)索引管理:通过整合lucence、solr对数据库进行统一索引;(c)封装器:封装数据库访问原语,统一数据库访问;(d)元数据管理:存储数据库元数据,统一生成各类SQL操作语句;
(5)知识库:本模块存储用户信息、历史病历信息、语料信息,为智能录入和辅助诊断提供数据支持;主要包括以下几大类数据:用户数据库、基础词库、病历词库、规则库及病案库;(a)用户数据库:存储用户基本数据、权限数据;(b)基础词库:存储拼音输入法依赖的基础码表、词库、专业词库数据;(c)病历词库:存储从历史病历中提出的病历中出现的字、词及短句,字频、词频、短句频率,以及全局的二元词汇转移矩阵,科室及病历块下的三元词汇转移关系;(d)规则库:存储基础的上下文语义关系,机器从病历中学习到的语义关系,句法规则,医学单位使用规则;(e)病案库:以患者编号、住院次数为线索,按雪花模型存储患者的人口统计学信息、住院信息、门诊信息、检验信息、诊断信息、用药信息、症状信息、体征信息等其他从历史病历中提取的信息;所述后台业务管理模块中的信息抽取流程为:
(01)用户指定若干份病历作为机器学习的训练集,平台依据基础数据库,采用高精度反向最大匹配算法自动标注语料库,并提供交互式界面进行人工核对;
(02)人工校验修改完毕后,采用基于监督的机器学习算法对剩余病历进行信息标注,再结合句法规则库提取病历信息;
(03)接着将所提取的语料库按照科室、病历块来计算词频,形成转移矩阵,生成拼音分类模型、语境识别、录入预测三个模型;所提取的病人事实数据被入库为智能辅助诊断提供数据源,生成智能辅助诊断模型;拼音分类模型、语境识别、录入预测和智能辅助诊断四大模型的基本功能为:拼音分类模型,该模型以历史病历提取的字和词,加上基础词汇为样本,用拼音为特征进行分类,每个拼音类别中将字、词汇按词频由高到低排序,通过短文本相似度计算算法以及机器学习中基于监督的分类模型进行建模;根据输入的拼音,输出最优的候选字或者词;语境识别模型,该模型以历史病历提取的词及其词性和构成类型为基础,通过非监督的机器学习算法,自动从病历中提取出科室与高频词汇的概率模型,科室病历块与高频词汇的概率模型;从而实现根据用户最近录入的若干词汇,准确识别用户当前可能在录入的病历块环境;输入最近录入的若干词及其词性和构词类别,输出语境标识,并设置录入预测模型的语境参数;录入预测模型,该模型根据语境识别模型设定的语境参数选择最优的词库,并在拼音分类模型校正输入的基础上,通过高速索引从最优的词库中组织候选项,实现字、词的录入预测;并通过查询全局的二元词汇转移矩阵和科室及病历块级别的三元词汇转移矩阵,根据从病历中提出的上下文语义模式规则,实现对下文的录入预测;该模块输入拼音,输出若干候选项集。
CN201510799684.0A 2015-11-20 2015-11-20 一种基于知识库的智能病历录入平台 Expired - Fee Related CN105468900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510799684.0A CN105468900B (zh) 2015-11-20 2015-11-20 一种基于知识库的智能病历录入平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510799684.0A CN105468900B (zh) 2015-11-20 2015-11-20 一种基于知识库的智能病历录入平台

Publications (2)

Publication Number Publication Date
CN105468900A CN105468900A (zh) 2016-04-06
CN105468900B true CN105468900B (zh) 2018-08-14

Family

ID=55606592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510799684.0A Expired - Fee Related CN105468900B (zh) 2015-11-20 2015-11-20 一种基于知识库的智能病历录入平台

Country Status (1)

Country Link
CN (1) CN105468900B (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808925B (zh) * 2016-03-02 2018-03-30 上海市疾病预防控制中心 基于实时事件感知实现临床疾病监测与报告的系统及方法
CN106326640A (zh) * 2016-08-12 2017-01-11 上海交通大学医学院附属瑞金医院卢湾分院 一种医疗语音控制系统及其控制方法
CN106295204A (zh) * 2016-08-16 2017-01-04 深圳市智亲科技有限公司 健康数据的录入方法及装置
CN106339602B (zh) * 2016-08-26 2019-02-26 丁腊春 一种智能咨询机器人
CN106383853A (zh) * 2016-08-30 2017-02-08 刘勇 一种电子病历后结构化以及辅助诊断的实现方法及其系统
CN106406682A (zh) * 2016-09-29 2017-02-15 广州鹤互联网科技有限公司 一种签核文件选择生成方法及装置
CN106651707A (zh) * 2016-10-13 2017-05-10 合肥思盟信息科技有限公司 一种基于康复诊疗据测支援系统构建区域康复服务系统
CN106503469A (zh) * 2016-11-05 2017-03-15 深圳市前海安测信息技术有限公司 基于分区数据库的电子病历信息查询系统及方法
CN108231137A (zh) * 2016-12-15 2018-06-29 童综合医疗社团法人童综合医院 一种具有回馈学习的医疗系统
CN108288491B (zh) * 2017-05-17 2021-01-15 上海明品医学数据科技有限公司 一种自动处理病历数据的控制方法、控制系统以及存储设备
CN107229831A (zh) * 2017-06-08 2017-10-03 成都深泉科技有限公司 电子病历生成方法、装置及系统
CN107451400A (zh) * 2017-07-11 2017-12-08 武汉金豆医疗数据科技有限公司 一种医疗行为监控方法和系统
CN107818816A (zh) * 2017-12-12 2018-03-20 刘忠于 基于人工智能学习的医生电子病历自动生成系统
CN108735273B (zh) * 2017-12-22 2021-10-15 深圳大学 一种数据处理的方法及医疗管理系统
CN108304667A (zh) * 2018-02-11 2018-07-20 合肥市太泽透平技术有限公司 基于知识库数据统一管理的cea集成平台的一维中线单元
CN108564993A (zh) * 2018-04-21 2018-09-21 四川易通天下科技有限公司 基于区块链技术的电子病历自动整合翻译系统
CN108447534A (zh) * 2018-05-18 2018-08-24 灵玖中科软件(北京)有限公司 一种基于nlp的电子病历数据质量管理方法
CN109785959A (zh) * 2018-12-14 2019-05-21 平安医疗健康管理股份有限公司 一种疾病编码方法和装置
CN109657062A (zh) * 2018-12-24 2019-04-19 万达信息股份有限公司 一种基于大数据技术的电子病历文本解析闭环方法
US20200210855A1 (en) * 2018-12-28 2020-07-02 Robert Bosch Gmbh Domain knowledge injection into semi-crowdsourced unstructured data summarization for diagnosis and repair
CN109935336B (zh) * 2019-01-15 2023-10-31 北京思普科软件股份有限公司 一种儿童呼吸科疾病的智能辅助诊断系统
CN109859815A (zh) * 2019-01-24 2019-06-07 西安交通大学 一种辅助用药决策方法及智能辅助用药系统
CN110187780B (zh) * 2019-06-10 2023-07-21 北京百度网讯科技有限公司 长文本预测方法、装置、设备和存储介质
CN110444264B (zh) * 2019-08-16 2023-04-14 宜昌市中心人民医院 基于DRGs的病案首页智能填写及训练系统
CN110600094A (zh) * 2019-08-23 2019-12-20 和宇健康科技股份有限公司 一种电子病历的智能书写方法及系统
CN110739035A (zh) * 2019-09-28 2020-01-31 宏脉信息技术(广州)股份有限公司 一种医疗机构的患者病历管理系统
CN111179252B (zh) * 2019-12-30 2021-02-05 山东大学齐鲁医院 基于云平台的消化道病灶辅助识别与正反馈系统
CN111259635A (zh) * 2020-01-09 2020-06-09 智业软件股份有限公司 一种对病历书写文本补全和预测的方法及系统
CN111354465B (zh) * 2020-02-26 2023-02-28 深圳市凯利博实业有限公司 一种基于体温计和区块链的健康分析方法及系统
CN111859888B (zh) * 2020-07-22 2024-04-02 北京致医健康信息技术有限公司 一种诊断辅助方法、装置、电子设备和存储介质
CN111899829B (zh) * 2020-07-31 2022-06-21 青岛百洋智能科技股份有限公司 一种基于icd9/10分词词库的全文检索匹配引擎
CN111967238B (zh) * 2020-09-03 2023-11-14 卫宁健康科技集团股份有限公司 一种病历模板知识库的构建方法及其医疗系统和构建装置
CN112133390B (zh) * 2020-09-17 2024-03-22 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知系统
CN112863648B (zh) * 2020-12-31 2022-08-26 四川大学华西医院 脑肿瘤术后mri多模态输出系统及方法
CN112768026A (zh) * 2021-01-08 2021-05-07 苏州麦迪斯顿医疗科技股份有限公司 针对临床危重症患者电子病历的同步方法、系统及介质
CN112800765A (zh) * 2021-01-22 2021-05-14 南京亚派软件技术有限公司 一种工单的自动生成方法
CN113066551A (zh) * 2021-04-13 2021-07-02 常州市第二人民医院 一种引导式电子病历录入系统及录入方法
CN114512241B (zh) * 2021-12-27 2024-05-03 中国人民解放军总医院第一医学中心 一种基于频次分析的食管静脉瘤信息智能搜寻方法及系统
CN114117082B (zh) * 2022-01-28 2022-04-19 北京欧应信息技术有限公司 用于对待校正数据校正的方法、设备和介质
CN114912887B (zh) * 2022-04-20 2023-05-23 深圳市医未医疗科技有限公司 一种基于电子病历的临床数据录入方法及录入装置
CN114708964B (zh) * 2022-06-06 2022-09-06 上海志听医疗科技有限公司 一种基于智能特征分类的眩晕症辅助分析统计方法及系统
CN117116436A (zh) * 2023-09-11 2023-11-24 北京透彻未来科技有限公司 一种条目化数字病理切片诊断系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530358A (zh) * 2013-10-10 2014-01-22 中国中医科学院 一种基于递增式术语库的电子病历快速录入系统
CN103578074A (zh) * 2013-11-25 2014-02-12 方正国际软件有限公司 病历的输入协助系统和输入协助方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9230061B2 (en) * 2011-08-15 2016-01-05 Medcpu, Inc. System and method for text extraction and contextual decision support

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530358A (zh) * 2013-10-10 2014-01-22 中国中医科学院 一种基于递增式术语库的电子病历快速录入系统
CN103578074A (zh) * 2013-11-25 2014-02-12 方正国际软件有限公司 病历的输入协助系统和输入协助方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
模糊逻辑推理在电子病历智能辅助诊断系统中的应用研究;丁卫平,等;《南通大学学报(自然科学版)》;20061231;第5卷(第4期);第2章,第3章 *

Also Published As

Publication number Publication date
CN105468900A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN105468900B (zh) 一种基于知识库的智能病历录入平台
CN111708874B (zh) 基于复杂意图智能识别的人机交互问答方法与系统
Bhat et al. Iiit-h system submission for fire2014 shared task on transliterated search
US7672987B2 (en) System and method for integration of medical information
CN100511215C (zh) 多语种翻译存储器和翻译方法
CN106202059A (zh) 机器翻译方法以及机器翻译装置
CN110895559B (zh) 模型训练、文本处理方法、装置以及设备
US11755661B2 (en) Text entry assistance and conversion to structured medical data
CN108509409A (zh) 一种自动生成语义相近句子样本的方法
JP2013502643A (ja) 構造化データ翻訳装置、システム及び方法
CN104199965A (zh) 一种语义信息检索方法
CN108229902A (zh) 一种基于智能云台服务的财务档案信息录入系统
US20210042344A1 (en) Generating or modifying an ontology representing relationships within input data
CA2853627C (en) Automatic creation of clinical study reports
CN107329961A (zh) 一种云翻译记忆库快速增量式模糊匹配的方法
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
Shiwen et al. Rule-based machine translation
CN112825111A (zh) 自然语言处理方法与其计算装置
Korpusik et al. Data collection and language understanding of food descriptions
Cabot et al. SIBM at CLEF eHealth Evaluation Lab 2017: Multilingual Information Extraction with CIM-IND.
Dougal et al. Improving NMT quality using terminology injection
CN101520778A (zh) 用于确定中文词性的设备和方法
Ferreira et al. Evaluating human-machine translation with attention mechanisms for industry 4.0 environment SQL-based systems
CN107818078B (zh) 汉语自然语言对话的语义关联与匹配方法
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180814

Termination date: 20211120