CN111429989B - 一种生成诊前病历的方法及装置 - Google Patents

一种生成诊前病历的方法及装置 Download PDF

Info

Publication number
CN111429989B
CN111429989B CN202010317968.2A CN202010317968A CN111429989B CN 111429989 B CN111429989 B CN 111429989B CN 202010317968 A CN202010317968 A CN 202010317968A CN 111429989 B CN111429989 B CN 111429989B
Authority
CN
China
Prior art keywords
history
data
medical
medical record
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010317968.2A
Other languages
English (en)
Other versions
CN111429989A (zh
Inventor
任彩红
王硕
胡可云
陈联忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiahesen Health Technology Co ltd
Original Assignee
Beijing Jiahesen Health Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiahesen Health Technology Co ltd filed Critical Beijing Jiahesen Health Technology Co ltd
Priority to CN202010317968.2A priority Critical patent/CN111429989B/zh
Publication of CN111429989A publication Critical patent/CN111429989A/zh
Application granted granted Critical
Publication of CN111429989B publication Critical patent/CN111429989B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请公开了一种生成诊前病历的方法和装置,包括:基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历;对历史相关病历中的数据进行预设处理,预设处理包括时间节点规范化处理和病历数据规范化处理;将经过预设处理后的历史相关病历进行合并处理,得到诊前病历。所述生成诊前病历的方法及装置,生成诊前病历时,并不直接将最新的历史病历作为诊前病历,而是首先将与患者本次就诊相关的历史相关病历筛选出来,然后对筛选出的病历进行合并前的数据处理,最后将处理后的历史相关病历中的相关数据进行整合,得到诊前病历,从而保证了诊前病历中信息的完整性,同时剔除了一些不相关的历史病历,综合提高了诊前病历的病历质量。

Description

一种生成诊前病历的方法及装置
技术领域
本发明涉及数据处理技术,更具体的说,是涉及一种生成诊前病历的方法及装置。
背景技术
医生坐诊时,经常会出现患者人数多,问诊时间有限,医生没有足够时间将患者的病情详细记录的情况,从而导致患者病历内容不完整,病历质量不高的问题。
基于上述问题,目前存在一种生成诊前病历的方法,用于在患者就医时,将距离本次就诊时间最近的患者的医疗电子病历作为本次就诊的诊前病历提供给医生,供其了解选用。
由于患者病情可能存在多样性和反复性,每次就诊的情况可能都不一样,且不同医生对病历信息的记载习惯不同,这就导致使用最新的医疗电子病历作为诊前病历的方案确定的诊前病历中,可能会缺失很多有价值的诊前信息。
发明内容
有鉴于此,本发明提供如下技术方案:
一种生成诊前病历的方法,包括:
基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历;
对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理;
将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历。
可选的,还包括:
预先对患者的历史病历进行预处理。
可选的,所述预先对患者的历史病历进行预处理,包括:
预先依据患者历史病历的病历模型对所述历史病历中的数据进行结构化处理;
对进行了结构化处理的一诉五史数据中的字段进行类别标记。
可选的,所述基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历,包括:
在当前患者没有诊断数据的情况下,使用当前主诉症状,与历史病历的主诉症状或治疗并发症进行匹配,将主诉症状或治疗并发症与所述当前主诉症状具有交集的历史病历确定为历史相关病历;
在当前患者有诊断数据的情况下,使用当前诊断数据,与历史病历的诊断数据或治疗并发症进行匹配,将诊断数据或治疗并发症与所述当前诊断数据具有交集的历史病历确定为历史相关病历;或,使用当前主诉症状与历史病历的治疗并发症进行匹配,将治疗并发症与所述当前主诉症状具有交集的历史病历确定为历史相关病历。
可选的,所述对所述历史相关病历中的数据进行预设处理,包括:
将所述历史相关病历中的一诉五史数据基于当前就诊时间进行规范化处理;
在所述一诉五史中的现病史没有内容的情况下,将有内容的主诉数据按所述现病史的模型处理,并将处理后的数据作为所述现病史的数据;
在所述一诉五史中的现病史有内容的情况下,若现病史六大类实体数据与主诉六大类实体数据完全不一致时,则将主诉内容与现病史内容合并作为所述现病史的数据。
可选的,所述将经过所述预处理后的历史相关病历进行合并处理,得到诊前病历,包括:
对所有的所述历史相关病历中的五史数据分别进行合并处理,包括:针对同一类别的五史数据:对于有时间节点的五史数据,按照时间节点进行数据合并;对于没有时间节点的五史数据,进行不同历史相关病历中对应类型的五史数据的文本相似度计算,若相似度大于第一阈值,选取数据内容多的五史数据作为合并内容;若相似度不大于所述第一阈值,将参与比较的五史内容进行合并。
可选的,还包括:
在对所述历史相关病历中的数据进行预设处理的过程中,进行医疗同义词扩充。
一种生成诊前病历的装置,包括:
病历筛选模块,用于基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历;
病历处理模块,用于对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理;
病历合并模块,用于将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历。
可选的,还包括:
预处理模块,用于预先对患者的历史病历进行预处理。
可选的,所述预处理模块包括:
数据结构化模块,用于预先依据患者历史病历的病历模型对所述历史病历中的数据进行结构化处理;
类别标记模块,用于对进行了结构化处理的一诉五史数据中的字段进行类别标记。
经由上述的技术方案可知,与现有技术相比,本发明实施例公开了一种生成诊前病历的方法和装置,包括:基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历;对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理;将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历。所述生成诊前病历的方法及装置,生成诊前病历时,并不直接将最新的历史病历作为诊前病历,而是首先将与患者本次就诊相关的历史相关病历筛选出来,然后对筛选出的病历进行合并前的数据处理,最后将处理后的历史相关病历中的相关数据进行整合,得到诊前病历,从而保证了诊前病历中信息的完整性,同时剔除了一些不相关的历史病历,综合提高了诊前病历的病历质量,便于医生及时了解患者病程发展,有助于提高医生的工作效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的医疗电子病历示意图;
图2为本申请实施例公开的医疗电子病历模型样例图;
图3为本申请实施例公开的一种生成诊前病历的方法流程图;
图4为本申请实施例公开的某患者历史病历中不同时间节点的样例示意图;
图5为本申请实施例公开的时间规范化处理前后对比示意图;
图6为本申请实施例公开的另一种生成诊前病历的方法流程图;
图7为本申请实施例公开的医疗病历模型类别标注结果示意图;
图8为本申请实施例公开的一个医疗病历模型类别标注示例图;
图9为本申请实施例公开的诊前病历的生成流程示意图;
图10为本申请实施例公开的一种生成诊前病历的装置的结构示意图。
具体实施方式
为了引用和清楚起见,下文中使用的技术名词的说明、简写或缩写总结如下:
医疗电子病历:病历是病人在医院诊断治疗全过程的原始记录,它包含有病案首页、病程记录、检查检验结果、医嘱、手术记录、护理记录等等。电子病历(EMR)不仅指静态病历信息,还包括提供的相关服务(如查看历史病历服务和临床决策服务)。是以电子化方式管理的有关个人终生健康状态和医疗保健行为的信息,涉及病人信息的采集、存储、传输、处理和利用的所有过程信息。已经存在的病历,称为历史病历。图1为本申请实施例公开的医疗电子病历示意图。
医疗分类词库:在医疗领域,常用的词库有疾病、症状、手术、药品、检验、检查等六大类。
医疗病历模型:医疗病历模型是基于电子病历数据,根据适用场景定义的结构化的数据结构,将电子病历数据,按照定义好的结构进行存储。图2为本申请实施例公开的医疗电子病历模型样例图。
医疗同义词:医疗同义词是将医疗分类词库中的词,基于电子病历数据,将其不同的表达方式列举出来。
自然语言处理:自然语言处理(NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。也就是说让计算机理解人们日常所使用的语言。
半结构化数据:目前数据分为结构化数据、半结构化数据、结构化数据。结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。非结构化数据就是没有固定结构的数据,例如图片、文档等。半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构,常见的半结构数据有XML和JSON。
文本相似度:考察两个文本是否相似,相似程度的一种方法。
诊前病历:诊前病历是患者历史病历的所有的一诉五史(主诉、现病史、既往史、个人史、家族史、月经婚育史)。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图3为本申请实施例公开的一种生成诊前病历的方法流程图,参见图3所示,生成诊前病历的方法可以包括:
步骤301:基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历。
本实施例公开的生成诊前病历的方法,意在针对患者历史病历数据生成诊前病历,通过本申请实施例公开的方案,可以在患者就诊时,有效的进行诊前信息的快速获取。
患者在进行就诊时,当前患者的历史病历可能有很多,但其中一些病历可能与本次就诊的症状或疾病无关;如果对所有的历史病历进行合并,可能会整合出一些无用的病历信息,而且信息过多,也会干扰到医生的诊断。例如:患者就诊时,主诉为流鼻涕、发热。
该患者的历史病历有三个,其中的主诉分别为:
1)头疼、发热
2)流涕、浑身无力
3)膝盖疼
那当前患者就诊时,需要合并的历史病历就是1、2,无需合并3,3中的主诉与当前患者的描述无关。因此,对历史病历的合并,不需要将所有的历史病历进行合并,而是需要首先从所有的历史病历中筛选出与患者本次就诊的症状或疾病相关的历史病历。
步骤302:对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理。
患者以往的历史病历中,由于可能存在病历模型不同,历史就诊的医生不同,导致历史病历中的时间节点字段复杂。在历史病历中,不同医院不同医生不同患者对于时间节点的描述是不一样的,因此本实施例中,需要将不同的时间节点进行规范化后,再进行后续的比较合并的处理。图4本申请实施例公开的为某患者历史病历中不同时间节点的样例示意图。
时间节点规范化处理的具体实现可以是首先获取当前病历(处理生成的诊前病历)的就诊时间,例如:2019-08-01 01:53:09,然后将一诉五史汇总,关于时间节点的字段,基于就诊时间,使用预设的表达式进行时间规范化处理,图5为本申请实施例公开的时间规范化处理前后对比示意图,可结合图5理解上述内容。
对于病历数据规范化处理,历史病历中,一诉五史中的主诉内容不单独作为诊前病历进行合并,需要和现病史进行规则处理,具体的处理方式将在后续实施例中详细介绍,在此不再过多介绍。
步骤303:将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历。
本申请实施例中,诊前病历需要对历史相关病历中的现病史、既往史、个人史、家族史、月经婚育史分别进行合并,形成诊前病历,以供医生了解使用。具体的合并实现将在后面的实施例中详细介绍,在此不再过多介绍。
本实施例中,所述生成诊前病历的方法,生成诊前病历时,并不直接将最新的历史病历作为诊前病历,而是首先将与患者本次就诊相关的历史相关病历筛选出来,然后对筛选出的病历进行合并前的数据处理,最后将处理后的历史相关病历中的相关数据进行整合,得到诊前病历,从而保证了诊前病历中信息的完整性,同时剔除了一些不相关的历史病历,综合提高了诊前病历的病历质量,便于医生及时了解患者病程发展,有助于提高医生的工作效率。
图6为本申请实施例公开的另一种生成诊前病历的方法流程图,如图6所示,生成诊前病历的方法可以包括:
步骤601:预先对患者的历史病历进行预处理。
预先对患者的历史病历进行预处理,使得处理后的数据便于在后续的筛选和合并过程中直接使用,能够提升生成诊前病历的效率。
对患者的历史病历进行的预处理可以包括数据的结构化处理和结构化处理后的数据的类别标注。结构化的数据便于比较,标注了类别的数据便于识别分类。预处理的具体实现将在后续内容中详细介绍。
步骤602:基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历。
步骤603:对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理。
步骤604:将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历。
本实现中,预先对患者的历史病历进行预处理,使得处理后的数据具备易于比较和易于识别归类的特点,这样,在后续的历史病历的筛选和合并的相关处理中,能够直接对预处理后的数据进行操作,有助于提升诊前病历的生成效率。
上述实施例中,所述预先对患者的历史病历进行预处理,可以包括:预先依据患者历史病历的病历模型对所述历史病历中的数据进行结构化处理;对进行了结构化处理的一诉五史数据中的字段进行类别标记。
基于历史病历的病历模型,可以使用自然语言处理技术将该历史病历中的一诉五史的数据进行结构化处理。以现病史为例,某患者的历史病历中,现病史为:患者5天前睡眠中突发搏动性头痛,程度剧烈,伴头晕、大汗、心慌、乏力,持续约3小时不缓解,无胸痛、胸闷、呕吐、意识障碍等,诊断“冠心病高血压”。结构化后,可表示为:
Figure GDA0004100682200000081
/>
Figure GDA0004100682200000091
结构化处理后,可以进一步对一诉五史章节的字段进行类别标记。依据医疗领域中关注的六大实体类别数据,即疾病、症状、检验、检查、手术和药品,对一诉五史章节的字段进行类别标记。图7为本申请实施例公开的医疗病历模型类别标注结果示意图。
上述实施例中,所述基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历,可以包括:在当前患者没有诊断数据的情况下,使用当前主诉症状,与历史病历的主诉症状或治疗并发症进行匹配,将主诉症状或治疗并发症与所述当前主诉症状具有交集的历史病历确定为历史相关病历;在当前患者有诊断数据的情况下,使用当前诊断数据,与历史病历的诊断数据或治疗并发症进行匹配,将诊断数据或治疗并发症与所述当前诊断数据具有交集的历史病历确定为历史相关病历;或,使用当前主诉症状与历史病历的治疗并发症进行匹配,将治疗并发症与所述当前主诉症状具有交集的历史病历确定为历史相关病历。
具体的,在当前患者没有诊断时,即还没有确定患者为何种疾病的情况下,使用当前的主诉症状,与历史病历的主诉症状进行匹配,或者当前的主诉症状与历史病历的治疗并发症进行匹配,有交集,则选择,反之,则不选择。例如:
当前的主诉症状集合为A:{搏动性头痛,头晕,大汗,心慌,乏力}
历史某份病历的主诉症状集合为B:{头痛,发热}
历史某份病历的治疗并发症集合为C:{心律失常,糖尿病,血压升高}
基于医疗同义词库进行集合扩充后:
当前的主诉症状集合为A:{搏动性头痛,头痛,头晕,大汗,出汗,心慌,乏力}
历史某份病历的主诉症状集合为B:{头痛,搏动性头痛,发热,发烫}
历史某份病历的治疗并发症集合为C:{心律失常,糖尿病,血压升高}
计算A与B的交集,A与C的交集,最后并集里有值,则作为候选集(即历史相关病历),如下:
A∩B={头痛,搏动性头痛}
A∩C=□
(A∩B)∪(A∩C)={头痛,搏动性头痛}
在当前患者有诊断时,即医生已经诊断出患者所患疾病,这种情况下,使用当前的诊断,与历史病历的诊断进行匹配,或者与历史病历的治疗并发症进行匹配,或者使用当前主诉症状与历史病历的治疗并发症进行匹配,有交集,则选择,反之,则不选择。例如:
当前的主诉症状集合为A:{搏动性头痛,头晕,大汗,心慌,乏力}
当前诊断集合为B:{冠心病,高血压}
历史某份病历的治疗并发症集合为C:{心律失常,糖尿病,血压升高}
历史某病历的诊断集合为D:{冠状动脉粥样硬化性心脏病}
基于医疗同义词库进行集合扩充后:
当前的主诉症状集合为A:{搏动性头痛,头痛,头晕,大汗,出汗,心慌,乏力}
当前诊断集合为B:{冠心病,冠状动脉粥样硬化性心脏病,高血压}
历史某份病历的治疗并发症集合为C:{心律失常,糖尿病,血压升高}
历史某病历的诊断集合为D:{冠状动脉粥样硬化性心脏病,冠心病}
计算A与C的交集,B与C的交集,B与D的交集,最后并集里有值,则作为候选集。如下:
Figure GDA0004100682200000111
Figure GDA0004100682200000112
B∩D={冠状动脉粥样硬化性心脏病,冠心病}
(A∩C)∪(B∩C)∪(B∩D)={冠状动脉粥样硬化性心脏病,冠心病}
上述实施例中,所述对所述历史相关病历中的数据进行预设处理,可以包括:将所述历史相关病历中的一诉五史数据基于当前就诊时间进行规范化处理;在所述一诉五史中的现病史没有内容的情况下,将有内容的主诉数据按所述现病史的模型处理,并将处理后的数据作为所述现病史的数据;在所述一诉五史中的现病史有内容的情况下,若现病史六大类实体数据与主诉六大类实体数据完全不一致时,则将主诉内容与现病史内容合并作为所述现病史的数据。
具体的,历史病历中,由于主诉的内容和现病史的内容可能存在重复,因此,一诉五史中主诉内容不单独使用,需要和现病史进行规则处理,处理方式可以包括:(1)当现病史没有内容时,将有内容的主诉按现病史模型处理;且作为现病史最近的时间节点对应内容;若以下时间字段有值,则用“就诊时间-实体时间值=现病史时间节点”;若以下时间字段没有值,则现病史时间节点为主诉对应就诊时间。
(2)当现病史有内容,且现病史六大类实体数据与主诉六大类实体数据完全不一致时,需将主诉内容与现病史内容合并;且作为现病史最近的时间节点对应内容;若以下时间字段有值,则用“就诊时间-实体时间值=现病史时间节点”;若以下时间字段没有值,则现病史时间节点为主诉对应就诊时间。
实体时间值:
Figure GDA0004100682200000121
症状:症状持续时间、持续时间单位
Figure GDA0004100682200000122
疾病:患病时长、患病时长单位
Figure GDA0004100682200000123
检验:报告时间
Figure GDA0004100682200000124
检查:检查时间
Figure GDA0004100682200000125
手术:手术时间
Figure GDA0004100682200000126
药品:用药开始时间
(3)当现病史有内容时,且现病史分词后实体名称与主诉分词后实体名称部分一致时,无需将主诉合并到现病史中。即主诉内容和现病史内容有重复,则不取主诉的内容。
实体名称是否一致,需使用医疗同义词库中过滤,看过滤后实体名称是否一致,若一致则视为实体相同。
上述实施例中,所述将经过所述预处理后的历史相关病历进行合并处理,得到诊前病历,可以包括:对所有的所述历史相关病历中的五史数据分别进行合并处理,包括:针对同一类别的五史数据:对于有时间节点的五史数据,按照时间节点进行数据合并;对于没有时间节点的五史数据,进行不同历史相关病历中对应类型的五史数据的文本相似度计算,若相似度大于第一阈值,选取数据内容多的五史数据作为合并内容;若相似度不大于所述第一阈值,将参与比较的五史内容进行合并。
具体的,诊前病历需要对历史相关病历的现病史、既往史、个人史、家族史、月经婚育史分别进行合并,形成诊前的病历。对于既往史、个人史、家族史、月经婚育史没有明确的时间节点的情况,需要进行文本相似度计算,相似度高(实现中可以设置一个阈值,当相似度高于该阈值时,确定为相似度高,低于阈值时,确定为相似度低或不相似),则选取章节长的,不相似则合并处理。对于现病史来说,有明确的不同的时间节点,需要根据时间节点进行合并,以下为可行的合并逻辑:
(1)转换后的时间节点相同,且有实体,进行实体相似度计算。图8为本申请实施例公开的一个医疗病历模型类别标注示例图,可结合图8所示内容理解本实施例的内容。
A∩B={搏动性头痛,头痛,头疼,冠状动脉粥样硬化性心脏病,冠心病}
如果有交集,则取原始数据src字数多的节点内容;每个时间节点对应一个src;
如果没有交集,则合并src内容。
(2)转换后的时间节点相同进行,且无实体,进行文本相似度计算。
先对现病史原始数据src进行分词,使用TF-IDF算法进行每个词的TF-IDF值的计算,然后结合余弦相似度计算两个src内容的文本相似度,相似度达70%,则取原始数据src字数多的内容。
其中,TF:词频,某个词在文档中的出现次数,文档有长短之分,为了便于不同文档的比较,可以将"词频"标准化。词频(TF)=某个词在文档中的出现次数/文档总词数或者词频(TF)=某个词在文档中的出现次数/拥有最高词频的词的次数。
IDF:一个词在N个文档中出现过,那么N越大,此词的权重越小,反之亦然。当这个词为常用词时,其权重极小,从而解决词频统计的缺陷。逆文档频率(IDF)=log(语料库的文档总数/包含该词的文档总数+1)
TF-IDF=TF*IDF
余弦相似度:
Figure GDA0004100682200000131
(3)转换后的时间节点为未知时间,且有实体,需和有时间节点的进行实体相似度计算。
实体完全相同,则取原始数据src字数多的内容;
文本包含关系,则取原始数据src字数多的内容;
实体部分相同,需进行文本相似度计算,如相似度达70%,则取原始数据src字数多的内容。
(4)最后按照时间先后顺序,将不同的时间节点进行合并,生成诊前病历。
通过上述内容可知,生成诊前病历的过程中还采用了同义词扩充的技术手段。具体的,是在对所述历史相关病历中的数据进行预设处理的过程中,进行医疗同义词扩充。以消除同一患者的历史病历中对于同一医疗词叫法不统一而可能导致的影响诊前病历准确性的问题。
图9为本申请实施例公开的诊前病历的生成流程示意图,可结合图9理解前述内容。通过上述内容,可知本申请实施例公开的生成诊前病历的方法,首先通过筛选规则,筛选出需要合并的历史病历,然后可以将筛选出的患者历史病历的一诉五史数据通过专业的医疗知识库以及病历数据模型,进行清洗,转换,结构化,标准化,其中将现病史按照时间节点进行转换;再将涉及到时间节点的字段内容进行规范化处理,最后将时间节点中实体的对比,文本相似度对比,以及不同时间节点下的规则处理(精确时间、模糊时间、未知时间),将不同就诊次的一诉五史进行合并。
本申请所述生成诊前病历的方法生成诊前病历时,并不是单单拿到患者的历史病历进行合并,而是根据当前患者的信息,对历史的病历先做筛选,然后再进行合并。
在进行合并时,使用文本相似度计算两个章节的相似度可以解决部分章节去重的问题,但是在医疗领域,很多医疗术语描述都很复杂且多样化,文本相似度往往识别不出来,本技术中,将一诉五使进行实体结构化,再基于医疗同义词库,进行相似度的计算,效果会更优。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种装置,下面给出具体的实施例进行详细说明。
图10为本申请实施例公开的一种生成诊前病历的装置的结构示意图,参见图10所示,生成诊前病历的装置100可以包括:
病历筛选模块1001,用于基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历。
病历处理模块1002,用于对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理。
病历合并模块1003,用于将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历。
本实施例中,所述生成诊前病历的装置,生成诊前病历时,并不直接将最新的历史病历作为诊前病历,而是首先将与患者本次就诊相关的历史相关病历筛选出来,然后对筛选出的病历进行合并前的数据处理,最后将处理后的历史相关病历中的相关数据进行整合,得到诊前病历,从而保证了诊前病历中信息的完整性,同时剔除了一些不相关的历史病历,综合提高了诊前病历的病历质量,便于医生及时了解患者病程发展,有助于提高医生的工作效率。
在其他实现中,生成诊前病历的装置还可以包括预处理模块,用于预先对患者的历史病历进行预处理。所述预处理模块包括:数据结构化模块,用于预先依据患者历史病历的病历模型对所述历史病历中的数据进行结构化处理;类别标记模块,用于对进行了结构化处理的一诉五史数据中的字段进行类别标记。
生成诊前病历的装置及其各模块的具体实现,可参见方法实施例中相关部分的内容介绍,在此不再重复赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种生成诊前病历的方法,其特征在于,包括:
基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历,包括:基于预设的匹配规则,从患者所有的历史病历中筛选出与当前诊断数据或当前主诉症状具有交集的历史病历作为所述历史相关病历;
对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理;
将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历。
2.根据权利要求1所述的生成诊前病历的方法,其特征在于,还包括:
预先对患者的历史病历进行预处理。
3.根据权利要求2所述的生成诊前病历的方法,其特征在于,所述预先对患者的历史病历进行预处理,包括:
预先依据患者历史病历的病历模型对所述历史病历中的数据进行结构化处理;
对进行了结构化处理的一诉五史数据中的字段进行类别标记。
4.根据权利要求1所述的生成诊前病历的方法,其特征在于,所述基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历,包括:
在当前患者没有诊断数据的情况下,使用当前主诉症状,与历史病历的主诉症状或治疗并发症进行匹配,将主诉症状或治疗并发症与所述当前主诉症状具有交集的历史病历确定为历史相关病历;
在当前患者有诊断数据的情况下,使用当前诊断数据,与历史病历的诊断数据或治疗并发症进行匹配,将诊断数据或治疗并发症与所述当前诊断数据具有交集的历史病历确定为历史相关病历;或,使用当前主诉症状与历史病历的治疗并发症进行匹配,将治疗并发症与所述当前主诉症状具有交集的历史病历确定为历史相关病历。
5.根据权利要求1所述的生成诊前病历的方法,其特征在于,所述对所述历史相关病历中的数据进行预设处理,包括:
将所述历史相关病历中的一诉五史数据基于当前就诊时间进行规范化处理;
在所述一诉五史中的现病史没有内容的情况下,将有内容的主诉数据按所述现病史的模型处理,并将处理后的数据作为所述现病史的数据;
在所述一诉五史中的现病史有内容的情况下,若现病史六大类实体数据与主诉六大类实体数据完全不一致时,则将主诉内容与现病史内容合并作为所述现病史的数据。
6.根据权利要求1所述的生成诊前病历的方法,其特征在于,所述将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历,包括:
对所有的所述历史相关病历中的五史数据分别进行合并处理,包括:针对同一类别的五史数据:对于有时间节点的五史数据,按照时间节点进行数据合并;对于没有时间节点的五史数据,进行不同历史相关病历中对应类型的五史数据的文本相似度计算,若相似度大于第一阈值,选取数据内容多的五史数据作为合并内容;若相似度不大于所述第一阈值,将参与比较的五史内容进行合并。
7.根据权利要求1-6任一项所述的生成诊前病历的方法,其特征在于,还包括:
在对所述历史相关病历中的数据进行预设处理的过程中,进行医疗同义词扩充。
8.一种生成诊前病历的装置,其特征在于,包括:
病历筛选模块,用于基于预设的匹配规则,从患者所有的历史病历中筛选出历史相关病历;
病历处理模块,用于对所述历史相关病历中的数据进行预设处理,所述预设处理包括时间节点规范化处理和病历数据规范化处理;
病历合并模块,用于将经过所述预设处理后的历史相关病历进行合并处理,得到诊前病历;
所述病历筛选模块,具体用于基于预设的匹配规则,从患者所有的历史病历中筛选出与当前诊断数据或当前主诉症状具有交集的历史病历作为所述历史相关病历。
9.根据权利要求8所述的生成诊前病历的装置,其特征在于,还包括:
预处理模块,用于预先对患者的历史病历进行预处理。
10.根据权利要求9所述的生成诊前病历的装置,其特征在于,所述预处理模块包括:
数据结构化模块,用于预先依据患者历史病历的病历模型对所述历史病历中的数据进行结构化处理;
类别标记模块,用于对进行了结构化处理的一诉五史数据中的字段进行类别标记。
CN202010317968.2A 2020-04-21 2020-04-21 一种生成诊前病历的方法及装置 Active CN111429989B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010317968.2A CN111429989B (zh) 2020-04-21 2020-04-21 一种生成诊前病历的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010317968.2A CN111429989B (zh) 2020-04-21 2020-04-21 一种生成诊前病历的方法及装置

Publications (2)

Publication Number Publication Date
CN111429989A CN111429989A (zh) 2020-07-17
CN111429989B true CN111429989B (zh) 2023-05-23

Family

ID=71554190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010317968.2A Active CN111429989B (zh) 2020-04-21 2020-04-21 一种生成诊前病历的方法及装置

Country Status (1)

Country Link
CN (1) CN111429989B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112133390B (zh) * 2020-09-17 2024-03-22 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知系统
CN112349367B (zh) * 2020-11-11 2023-08-08 北京嘉和海森健康科技有限公司 一种生成仿真病历的方法、装置、电子设备及存储介质
CN112259183B (zh) * 2020-11-11 2023-08-08 北京嘉和海森健康科技有限公司 一种基于电子病历的患者健康时间轴的提取方法和装置
CN115618817B (zh) * 2022-09-21 2024-03-08 上海柯林布瑞信息技术有限公司 医疗文本时间数据规范化处理方法及装置
CN116344009B (zh) * 2023-05-22 2023-08-15 武汉盛博汇信息技术有限公司 一种线上就诊通知方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN207638698U (zh) * 2017-11-27 2018-07-20 上海贝生医疗科技有限公司 一种诊前病史综合系统
CN109036549A (zh) * 2018-06-29 2018-12-18 重庆柚瓣家科技有限公司 一种基于模糊决策和病历数据的疾病预诊系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005089481A2 (en) * 2004-03-17 2005-09-29 Kong Francis K Method and apparatus creating, integrating, and using a patient medical history
US20160217256A1 (en) * 2015-01-26 2016-07-28 Back Kyun Kim Method and system for generating an electronic health record including patient progress notes
JP6690224B2 (ja) * 2015-12-18 2020-04-28 日本電気株式会社 医療情報処理装置、その情報処理方法、およびプログラム
CN107908768A (zh) * 2017-09-30 2018-04-13 北京颐圣智能科技有限公司 电子病历处理的方法、装置、计算机设备及存储介质
CN107562732B (zh) * 2017-10-26 2022-06-14 北京康夫子健康技术有限公司 电子病历的处理方法及系统
CN109036545B (zh) * 2018-05-31 2023-04-18 平安医疗科技有限公司 医疗信息处理方法、装置、计算机设备和存储介质
CN108899064A (zh) * 2018-05-31 2018-11-27 平安医疗科技有限公司 电子病历生成方法、装置、计算机设备和存储介质
CN109559788A (zh) * 2018-11-21 2019-04-02 上海依智医疗技术有限公司 一种病史采集方法及装置
CN110070925A (zh) * 2019-03-11 2019-07-30 张宏家 一种电子病历的生成方法、装置及电子设备
CN110277149A (zh) * 2019-06-28 2019-09-24 北京百度网讯科技有限公司 电子病历的处理方法、装置及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN207638698U (zh) * 2017-11-27 2018-07-20 上海贝生医疗科技有限公司 一种诊前病史综合系统
CN109036549A (zh) * 2018-06-29 2018-12-18 重庆柚瓣家科技有限公司 一种基于模糊决策和病历数据的疾病预诊系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jin, Y 等.Evaluating the Validity of the Braden Scale Using Longitudinal Electronic Medical Records.《RESEARCH IN NURSING &amp HEALTH》.2015,第38卷(第2期),第152-161页. *
陈凯.基于患者个人信息的智能预诊方法.《中国优秀硕士学位论文全文数据库医药卫生科技辑》.2017,(第2期),第E053-352页. *

Also Published As

Publication number Publication date
CN111429989A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN111429989B (zh) 一种生成诊前病历的方法及装置
US20200303072A1 (en) Method and system for supporting medical decision making
US9165116B2 (en) Patient data mining
Meystre et al. Natural language processing to extract medical problems from electronic clinical documents: performance evaluation
US20220358410A1 (en) Methods and systems for medical record searching with transmittable machine learning
JP6907831B2 (ja) コンテキストベースの患者類似性の方法及び装置
EP3223178A1 (en) A system and a method for assessing patient treatment risk using open data and clinician input
US20020035486A1 (en) Computerized clinical questionnaire with dynamically presented questions
JP2017174404A (ja) オープンデータ及び臨床医の入力を用いて患者のリスクを評価するシステム及び方法
US20110093293A1 (en) Method and system for performing clinical data mining
WO2009037615A1 (en) System and method for analyzing electronic data records
US20180121603A1 (en) Identification of Related Electronic Medical Record Documents in a Question and Answer System
JP6875993B2 (ja) 臨床の所見のコンテキストによる評価のための方法及びシステム
US11527312B2 (en) Clinical report retrieval and/or comparison
Viani et al. Information extraction from Italian medical reports: An ontology-driven approach
Lu et al. Learning electronic health records through hyperbolic embedding of medical ontologies
CN112349367B (zh) 一种生成仿真病历的方法、装置、电子设备及存储介质
Bhattacharya et al. Identifying patterns of associated-conditions through topic models of Electronic Medical Records
JP2021536636A (ja) 医療記録を分類する方法
Ordónez et al. Classification of patients using novel multivariate time series representations of physiological data
Crowson et al. Machine learning for pattern detection in cochlear implant FDA adverse event reports
EP4239642A1 (en) Method for generating protocol data of a radiological image data measurement
Mishra et al. DiagnosisQA: A semi-automated pipeline for developing clinician validated diagnosis specific QA datasets
Grechishcheva et al. Filtering free-text medical data based on machine learning
Oleksandr et al. RELATION DATALOGIC MODEL FOR DETERMINING THE DIAGNOSIS BASED ON INTELLECTUAL NLP-ANALYSIS OF SYMPTOM DESCRIPTION

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant