CN111435364B - 电子病历质检方法和装置 - Google Patents

电子病历质检方法和装置 Download PDF

Info

Publication number
CN111435364B
CN111435364B CN201910031488.7A CN201910031488A CN111435364B CN 111435364 B CN111435364 B CN 111435364B CN 201910031488 A CN201910031488 A CN 201910031488A CN 111435364 B CN111435364 B CN 111435364B
Authority
CN
China
Prior art keywords
target data
abnormal alarm
quality inspection
data
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910031488.7A
Other languages
English (en)
Other versions
CN111435364A (zh
Inventor
仇伟
陈漠沙
程钰淇
李兆融
李林琳
司罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910031488.7A priority Critical patent/CN111435364B/zh
Publication of CN111435364A publication Critical patent/CN111435364A/zh
Application granted granted Critical
Publication of CN111435364B publication Critical patent/CN111435364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例提供了一种电子病历质检方法和装置。其中,电子病历质检方法包括:获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,则标注所述异常警报为负异常警报;和/或,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作,则标注所述异常警报为正异常警报;使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成用于训练分类模型的样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检。通过本发明实施例,可以提升分类模型训练效率。

Description

电子病历质检方法和装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种电子病历质检方法和装置。
背景技术
随着科技的发展和信息化建设的推广,使得越来越多的数据以电子数据的方式存储,但是很多人为操作不规范会导致电子数据的质量不高。例如,在医疗领域,利用电子病历存储患者病历信息的方式越来越普遍。但是,在日常电子病历的填写过程中,存在着用户(如,医生)操作不规范,导致填写的电子病历质量不高的问题。例如,医生在填写电子病历时可能会从其他病历中全部或部分拷贝相关信息,使得电子病历的质量大大下降,往往不能准确反映患者的实际状况,给医院带来了极大的诊疗风险。
目前,通常采用手工抽检的方式对电子数据进行质检,这种方式需要投入大量人力,而且还不能做到实时检测,检测的数量也仅能覆盖极少的电子数据,导致电子数据质检效果不好。为此,利用机器学习模型对电子数据进行质检正逐渐被广泛使用。但这种方式使用大量标注的样本对机器学习模型进行训练,需要耗费大量时间和人力来收集样本,并对样本进行标注,使得训练成本高,耗费时间长,而且人工标注样本还存在标注错误的情况。由此,造成对电子数据进行质检的机器学习模型训练效率低下的问题。
发明内容
有鉴于此,本发明实施例提供一种电子病历质检方案,以解决上述问题。
根据本发明实施例的第一方面,提供了一种电子病历质检方法,包括:获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,则标注所述异常警报为负异常警报;和/或,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作,则标注所述异常警报为正异常警报;使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成用于训练分类模型的样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检。
根据本发明实施例的第二方面,提供了一种电子病历质检装置,包括:第一获取模块,用于获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;标注模块,用于当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作时,标注所述异常警报为负异常警报;和/或,当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作时,标注所述异常警报为正异常警报;生成训练模块,用于使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成用于训练分类模型的样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检。
根据本发明实施例提供的电子病历质检方案,利用用户的历史行为数据对检测为发生异常警报的目标数据进行标注,实现了无需人工干预的标注,一方面,提升了标注效率;另一方面,相较于人工标注,机器标注的准确率也更高,因此提高了标注的准确性。进一步地,使用标注后的正异常警报和/或负异常警报及其对应的目标数据生成样本数据集,并利用该样本数据集训练用于对电子数据(例如电子病历数据)进行质检的分类模型,由于样本数据集生成效率更高,因此有效提高了对分类模型的训练效率。此外,还提升了使用该分类模型对电子病历进行质检的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例一的一种电子病历质检方法的步骤流程图;
图2为根据本发明实施例二的一种电子病历质检方法的步骤流程图;
图3为根据本发明实施例三的一种电子病历质检装置的结构框图;
图4为根据本发明实施例四的一种电子病历质检装置的结构框图;
图5为根据本发明实施例五的一种电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
实施例一
参照图1,示出了根据本发明实施例一的一种电子病历质检方法的步骤流程图。
本实施例的电子病历质检方法包括以下步骤:
步骤S102:获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据。
在本申请一具体实现中,所述目标数据可以是任何需要进行质检的电子数据,例如,其可以是电子病历中的部分或全部数据,或者可以是需要质检的电子产品说明书中的全部或部分参数数据等。当质检确定目标数据不能满足质检的要求或条件时,则认为目标数据发生异常警报,可以将此种情况下的目标数据称为发生异常警报的目标数据。
本实施例中,以所述目标数据是所述电子病历中的数据为例进行说明。根据不同的需求,电子病历中可以包括多种不同的目标数据,如,患者体征数据、入院信息数据、手术数据等等。针对电子病历中的各目标数据对应地配置有至少一个质检要求或条件(即质检项目)。
例如,针对入院信息数据,配置的一个对应的质检项目为所述入院信息数据填写完成时间应在患者入院24小时内。又例如,针对患者体征数据,配置的一个质检项目为患者体征数据与数据库中的所有患者体征数据记录的相似度小于权重值。
在本实施例中,针对每个质检项目,使用质检规则对该质检项目对应的目标数据进行一次质检,以确定所述目标数据是否满足对应的质检项目,若满足,则确定其不为发生异常警报的目标数据,反之,若不满足,则确定其为发生异常警报的目标数据。
质检规则可以是根据质检要求预先设定的规则。
采用这种方式无须人工对目标数据进行质检,提升了质检效率,质检出的发生异常警报的目标数据后续可以用于生成训练样本,解决现有技术中人工收集训练样本存在的收集成本高、收集效率低的问题。
其中,所述质检规则可以由本领域技术人员根据实际情况预先进行设置,只要能够对所述目标数据进行质检,确定其是否满足对应的质检项目即可,本发明实施例对具体的质检规则不作限定。此外,所述一次质检中的“一次”用于表征次序,并不表示质检次数。
当然,在其他实施例中,可以通过所述质检规则之外的其他任何适当的方式确定所述目标数据是否为发生异常警报的目标数据,本实施例对此不作限定。
针对确定为发生异常警报的目标数据,其对应的异常警报中可以包括所述目标数据的信息,根据需要还可以包括所述目标数据不符合的所述质检项目的信息,和/或不符合的所述质检规则的信息。
当目标数据质检为异常,生成异常警报后,用户通常会根据异常警报对相应的目标数据进行第一操作,这些第一操作被记录形成用户的历史行为数据。
在一种可行方式中,用户的历史行为数据中包括用户的第一操作、所述第一操作针对的目标数据、所述第一操作对应的异常警报等。所述第一操作包括:修改操作、未修改操作或者其他适当操作。
步骤S104:若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,则标注所述异常警报为负异常警报;和/或,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作,则标注所述异常警报为正异常警报。
在本申请一具体实现中,根据所述历史行为数据获取用户对所述发生异常警报的目标数据进行了第一操作或第二操作,从而对相应的所述异常警报进行标注,以指示所述异常警报为正异常警报或负异常警报。这种标注方式无须人工手动进行标注,从而提升了标注效率、降低了标注成本、保证标注准确性,避免了人工标注可能存在误操作的情况。
例如,以第一操作包括未修改操作,第二操作为修改操作为例,针对某个发生异常警报的目标数据,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了未修改操作(如忽略操作、关闭操作等),则标注所述异常警报为负异常警报。
再例如,针对某个发生异常警报的目标数据,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了修改操作,则标注所述异常警报为正异常警报。
步骤S106:使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成用于训练分类器的样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检。
所述样本数据集用于训练分类模型,其包括多个训练样本,这些训练样本可以使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成。
分类模型用于对输入的电子病历进行分类,以根据分类结果确定电子病历是否满足质检要求。分类模型可以是任何适当的机器学习模型,如卷积神经网络模型、深度神经网络模型等等。
这样使用所述样本数据集训练分类模型,令所述分类模型能够准确地确定目标数据是否存在异常。通过所述分类模型对电子数据(如电子病历中的数据)进行检测可以提高电子病历质检的准确性,实现高效、准确地质检。
通过本实施例,利用用户的历史行为数据对检测为发生异常警报的目标数据进行标注,实现了无需人工干预的标注,一方面,提升了标注效率;另一方面,相较于人工标注,机器标注的准确率也更高,因此提高了标注的准确性。
进一步地,使用标注后的正异常警报和/或负异常警报及其对应的目标数据生成样本数据集,并利用该样本数据集训练用于对电子数据(例如电子病历数据)进行质检的分类模型,由于样本数据集生成效率更高,因此有效提高了对分类模型的训练效率。此外,还提升了使用该分类模型对电子病历进行质检的准确性。
本实施例的电子病历质检方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端和PC机等。
实施例二
参照图2,示出了根据本发明实施例二的一种电子病历质检方法的步骤流程图。
本实施例的电子病历质检方法包括以下步骤:
步骤S202:获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据。
如实施例一中所述,所述目标数据可以是任何需要进行质检的电子数据。例如,目标数据是电子病历中的数据。
在本实施例中,发生异常警报的目标数据可以是通过预设的质检规则对所述目标数据进行一次质检(可以是在线质检或离线质检),确定为发生异常警报的目标数据,或者采用其他方式对所述目标数据进行质检,确定为发生异常警报的目标数据。
在一具体实现中,发生异常警报的目标数据是使用所述质检规则对所述目标数据进行在线质检获得的确定为发生异常警报的目标数据。例如,用户(如医生)在线填写电子病历时,使用所述质检规则对相应的所述目标数据进行实时质检,以确定发生异常警报的目标数据。这种在线质检方式实时性好,可以在电子病历填写过程中进行质检并收集样本,提升了样本收集效率。此外,在质检确定目标数据存在异常时,可以及时生成异常警报。
以目标数据为患者体征数据为例,使用所述质检规则对所述目标数据进行一次质检的过程可以包括:获取用户填写的所述患者体征数据,确定数据库中是否所有患者体征数据记录与所述患者体征数据的相似度均小于所述质检规则中的权重值,若均小于权重值,则所述目标数据满足所述质检规则对应的质检项目,不为发生异常警报的目标数据;反之,则所述目标数据不满足所述质检规则对应的质检项目,为发生异常警报的目标数据。
可选地,针对包括所述权重值的所述质检规则,为了保证使用所述质检规则进行质检时的召回率,避免漏检,在本实施例中,将所述质检规则中的权重值设置的较低,例如,所述权重值的取值范围在0.5~0.7之间。
当所述质检规则确定所述目标数据为发生异常警报的目标数据时,可以生成异常警报,以提示用户。如前所述,所述异常警报中可以包括所述目标数据的信息,根据需要还可以包括所述目标数据不符合的所述质检项目的信息,和/或不符合的所述质检规则的信息。
步骤S204:若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,则标注所述异常警报为负异常警报;和/或,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行第二操作,则标注所述异常警报为正异常警报。
其中,所述第一操作包括但不限于未修改操作,如忽略操作、关闭操作等。第二操作包括修改操作。
由于本实施例的电子病历质检方法中使用发生异常警报的目标数据中的文本数据生成训练样本,故而,在本实施例中,根据历史行为数据确定用户是否对发生异常警报的目标数据中的文本进行了修改操作,将异常警报标注为正异常警报或者标注为负异常警报。
这种标注方式,一方面无须人工手动进行操作,从而提升了标注效率、降低了标注成本、保证了标注准确性,避免了人工标注可能存在误操作的情况,另一方面,对异常警报进行标注,无需对目标数据本身内容和/或结构进行改变,降低了标注成本。
例如,针对某个发生异常警报的目标数据,若根据所述历史行为数据确定用户对发生异常警报的目标数据中的文本进行了未修改操作,则标注所述异常警报为负异常警报。
又例如,针对某个发生异常警报的目标数据,若根据所述历史行为数据确定用户对发生异常警报的目标数据中的文本进行了修改操作,则标注所述异常报警为正异常报警。
在一种可行方式中,标注完正异常警报和/或负异常警报之后,可以通过下述的步骤S206~S210实现使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成样本数据集以训练分类模型的过程。
步骤S206:获取所述正异常警报和/或所述负异常警报所对应的目标数据中的文本。
对于本领域技术人员而言,其可以采用任何适当的提取文本的方式获取目标数据中的文本,本实施例对此不作限定。例如通过训练的用于文本提取的文本提取模型获取所述文本。
例如,针对某个对应的目标数据是患者的体征数据的正异常警报,使用文本提取模型从所述目标数据中提取的所述文本为:“体温:36.5℃”;“体重:107KG”;“血压:160,95”等等。
步骤S208:使用所述正异常警报和/或所述负异常警报及其对应的文本构建用于训练所述分类模型的样本数据集。
所述样本数据集中包括多个训练样本,所述多个训练样本中可以全部为正训练样本,或者全部为负训练样本,或者部分为正训练样本,部分为负训练样本。
其中,使用所述正异常警报及其对应的目标数据生成的训练样本为正训练样本,训练样本中的内容可以根据相应的目标数据中的文本生成;使用所述负异常警报及其对应的目标数据生成的训练样本为负训练样本,训练样本中的内容可以根据相应的目标数据中的文本生成。
步骤S210:使用样本数据集中的训练样本对分类模型进行训练。
分类模型可以是任何适当的模型,例如,机器学习模型,如卷积神经网络模型、深度神经网络模型等。该分类模型可以是二元分类模型或者多元分类模型。
本领域技术人员可以采用任何适当的方式使用样本数据集中的训练样本对分类模型进行训练。以分类模型为卷积神经网络模型为例,训练过程可以是:将一训练样本输入到分类模型中,根据分类模型的输出,调整分类模型中的参数,再将另一训练样本输入到调整后的分类模型中,如此重复直至满足训练终止条件。
在本实施一具体实现中,通过所述训练样本集训练的分类模型可以进行文本分类,例如,将输入的文本形式的待检测目标数据(如电子病历)分为符合质检项目的类别或者分为不符合质检项目的类别,从而根据分类结果确定待检测目标数据是否满足质检项目,进而确定电子病历的质量是否满足要求。
在一具体实现中,通过步骤S212~S214实现对电子病历质检的过程。
步骤S212:通过预设的质检规则,对获取的所述目标数据进行一次质检,并根据所述一次质检的检测结果确定所述目标数据是否为发生异常警报的目标数据。
采用预设的质检规则对目标数据进行质检的方式可以采用前述的步骤S202中利用质检规则对目标数据进行在线质检的方式。预设的质检规则可以与前述的在线质检过程中使用的质检规则相同或者不同。
例如,在一具体实现中,所述目标数据包括电子病历中的部分或全部数据。
在对所述电子病历进行质检的过程中,通常是通过对所述电子病历中的目标数据进行质检,确定目标数据是否满足对应的质检项目的方式,确定所述电子病历的质量。
针对电子病历中的各目标数据,至少配置一个对应的质检项目。例如,针对电子病历中的入院信息数据,相应的质检项目的内容为:电子病历中入院记录完成时间应在患者入院24小时内。
又例如,针对电子病历中的患者体征数据,相应的质检项目的内容为:患者体征数据与数据库中的所有患者体征数据记录的相似度小于某一权重值。
在质检时,针对每个质检项目对应的目标数据,使用对应的质检规则进行质检。例如,使用对应的质检规则对某一目标数据进行一次质检,确定其是否满足对应的质检项目,若满足,则确定所述目标数据不为发生异常警报的目标数据;反之,若不满足,则确定所述目标数据为发生异常警报的目标数据。所述质检规则可以是本领域技术人员根据需要预先设定的规则。
以目标数据为患者体征数据为例,使用质检规则对目标数据进行质检的具体过程可以是:计算确定所述目标数据与数据库中所有患者体征数据记录的相似度是否均小于某一权重值,若均小于所述权重值,则确定所述目标数据满足所述质检项目,不为发生异常警报的目标数据;反之,则确定所述目标数据不满足所述质检项目,为发生异常警报的目标数据。
在本实施例中,将不满足质检项目的目标数据确定为发生异常警报的目标数据,当然,在其他实施例中,本领域技术人员可以根据需要调整质检项目的内容,将满足质检项目的目标数据确定为发生异常警报的目标数据。
需要说明的是,针对一些具有权重值的质检规则,为了避免漏检,权重值通常较低,因此,在一次质检的检测结果中可能包含误检测的情况,即目标数据实际上满足质检项目,但使用质检规则对其质检确定其为发生异常警报的目标数据。为了提升质检准确性,可以使用本实施例的后续步骤进行二次质检。本发明实施例中,一次质检和二次质检的描述用于表征质检的次序,并不表示质检的数量。
步骤S214:若确定为发生异常警报的目标数据,则通过所述分类模型进行二次质检。
当使用预设的质检规则对目标数据进行检测确定其为发生异常警报的目标数据时,为了提升检测的准确性,通过分类模型对确定为发生异常警报的目标数据进行二次质检,以避免质检规则的误检。
在一具体实现中,通过分类模型进行二次质检的过程为:将被确认发生异常警报的目标数据输入到分类模型中,根据分类模型的输出结果确定其是否为发生异常警报的目标数据。
若分类模型的输出结果将所述目标数据分类到不满足质检要求的类别,则指示该目标数据属于发生异常警报的目标数据,反之,若输出结果将所述目标数据分类到满足质检要求的类别,则指示该目标数据不属于发生异常警报的目标数据。
利用该分类模型可以实现对电子病历中数据的全面质检,无须人工质检,提升质检效率和准确性,可以使用其对电子病历进行质检,以保证电子病历的质量,降低电子病历质检成本。
当然,在其他实施例中,分类模型并非必须是文本分类模型,其还可以是其他任何适当的能够对目标数据进行质检的模型。
需要说明的是,为了提升质检的效率,针对一些使用预设的质检规则可以准确检测的目标数据,可以直接将一次质检的质检结果作为最终质检结果,而不进行二次质检。本领域技术人员可以根据需要确定需要进行二次质检的目标数据和不需要进行二次质检的目标数据。
步骤S216:根据所述二次质检的检测结果,调整所述质检规则中的权重值。
需要说明的是,本步骤为可选步骤。
为了进一步提升所述质检规则进行质检的准确性,可以根据二次质检的检测结果,调整质检规则中的权重值。例如,若使用分类模型对发生异常警报的目标数据进行二次质检确定其不为发生异常警报的目标数据,则可以将对应的质检规则的权重值调高,以减少误检测的情况。通过本实施例,利用用户的历史行为数据对异常警报的目标数据进行标注,从而实现无需人工干预的标注,一方面,提升了标注效率;另一方面,相较于人工标注,机器标注的准确率也更高,因此也提高了标注的准确性。进一步地,使用该样本数据集训练分类模型,有效提高了对电子数据进行质检的分类模型的训练效率。利用该分类模型对电子数据进行质检,确定其是否满足质检项目,实现了对电子数据的准确质检,提升质检效率和准确度。使用其对电子病历进行质检可以解决现有技术中对电子病历进行质检时针对一些质检项目无法准确质检,需要依赖医生经验判断的问题。
此外,利用预设的质检规则对目标数据进行一次质检,利用分类模型对一次质检确定为发生异常警报的目标数据进行二次质检,可以实现对目标数据的质检,且可以提升质检的准确性,以此解决现有技术中电子数据质检成本高、效率低、准确性低的问题。
本实施例的电子病历质检方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端和PC机等。
实施例三
参照图3,示出了根据本发明实施例三的一种电子病历质检装置的结构框图。
本实施例的电子病历质检装置包括:第一获取模块302,用于获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;标注模块304,用于当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作时,标注所述异常警报为负异常警报;和/或,当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作时,标注所述异常警报为正异常警报;生成训练模块306,用于使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成用于训练分类模型的样本数据集,以通过使用所述样本数据集训练的分类模型对电子病历进行质检。
通过本实施例,利用用户的历史行为数据对异常警报的目标数据进行标注,从而实现无需人工干预的标注,一方面,提升了标注效率;另一方面,相较于人工标注,机器标注的准确率也更高,因此也提高了标注的准确性。进一步地,使用标注后的正异常警报和/或负异常警报及其对应的目标数据生成样本数据集,并利用该样本数据集训练分类模型,有效提高了对电子数据进行质检的分类模型的训练效率。
实施例四
参照图4,示出了根据本发明实施例四的一种电子病历质检装置的结构框图。
本实施例的电子病历质检装置包括:第一获取模块402,用于获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;标注模块404,用于当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作时,标注所述异常警报为负异常警报;和/或,当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作时,标注所述异常警报为正异常警报;生成训练模块406,用于使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成用于训练分类模型的样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检。
可选地,所述第一操作包括未修改操作,所述标注模块404用于在根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,标注所述异常警报为负异常警报时,若确定用户对发生异常警报的所述目标数据中的文本进行了未修改操作,则标注所述异常警报为负异常警报。
可选地,所述第二操作包括修改操作,所述标注模块404用于在根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作,标注所述异常警报为正异常警报时,若确定用户对发生异常警报的所述目标数据中的文本进行了修改操作,则标注所述异常警报为正异常警报。
可选地,所述生成训练模块406包括:第二获取模块4061,用于获取所述正异常警报和/或所述负异常警报所对应的目标数据中的文本;构建模块4062,用于使用所述正异常警报和/或所述负异常警报及其对应的文本构建用于训练所述分类模型的样本数据集;训练模块4063,用于使用所述样本数据集中的训练样本对所述分类模型进行训练。
可选地,所述装置还包括:一次质检模块408,用于通过预设的质检规则,对获取的所述目标数据进行一次质检,并根据所述一次质检的检测结果确定所述目标数据是否为发生异常警报的目标数据;二次质检模块410,用于对确定为发生异常警报的目标数据,通过所述分类模型进行二次质检。
可选地,所述装置还包括:调整模块412,用于根据所述二次质检的检测结果,调整所述质检规则中的权重值。
可选地,所述目标数据包括电子病历中的数据。
本实施例的电子病历质检装置用于实现前述多个方法实施例中相应的电子病历质检方法,并具有相应方法实施例的有益效果,在此不再赘述。
实施例五
参照图5,示出了根据本发明实施例五的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图5所示,该电子设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:
处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它电子设备如终端设备或服务器进行通信。
处理器502,用于执行程序510,具体可以执行上述下载应用的方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,则标注所述异常警报为负异常警报;和/或,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行第二操作,则标注所述异常警报为正异常警报;使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成用于训练分类模型样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检。
在一种可选的实施方式中,第一操作包括未修改操作,程序510还用于使得处理器502在根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,则标注所述异常警报为负异常警报时,若确定用户对发生异常警报的所述目标数据中的文本进行了未修改操作,则标注所述异常警报为负异常警报。
在一种可选的实施方式中,第二操作包括修改操作,程序510还用于使得处理器502在根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作,则标注所述异常警报为正异常警报时,若确定用户对发生异常警报的所述目标数据中的文本进行了修改操作,则标注所述异常警报为正异常警报。
在一种可选的实施方式中,程序510还用于使得处理器502在使用所述正异常警报和/或所述负异常警报以及其对应的目标数据生成样本数据集以训练分类模型时,获取所述正异常警报和/或所述负异常警报所对应的目标数据中的文本;使用所述正异常警报和/或所述负异常警报及其对应的文本构建用于训练所述分类模型样本数据集;使用所述样本数据集中的训练样本对所述分类模型进行训练。
在一种可选的实施方式中,程序510还用于使得处理器502通过预设的质检规则,对获取的所述目标数据进行一次质检,并根据所述一次质检的检测结果确定所述目标数据是否为发生异常警报的目标数据;若确定为发生异常警报的目标数据,则通过所述分类模型进行二次质检。
在一种可选的实施方式中,程序510还用于使得处理器502根据所述二次质检的检测结果,调整所述质检规则中的权重值。
在一种可选的实施方式中,所述目标数据包括电子病历中的数据。
程序510中各步骤的具体实现可以参见上述电子病历质检方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例的电子设备,利用用户的历史行为数据对异常警报的目标数据进行标注,从而实现无需人工干预的标注,一方面,提升了标注效率;另一方面,相较于人工标注,机器标注的准确率也更高,因此也提高了标注的准确性。进一步地,使用标注后的正异常警报和/或负异常警报及其对应的目标数据生成样本数据集,并利用该样本数据集训练分类模型,有效提高了对电子数据进行质检的分类模型的训练效率。
利用分类模型对发生异常警报的目标数据进行二次质检,可以实现对目标数据的质检,且可以提升质检的准确性,以此解决现有技术中电子数据质检成本高、效率低、准确性低的问题,使用分类模型对电子病历进行质检时,可以提升质检准确性和质检效率。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的电子病历质检方法。此外,当通用计算机访问用于实现在此示出的电子病历质检方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的电子病历质检方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

Claims (10)

1.一种电子病历质检方法,包括:
获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;
若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作,则标注所述异常警报为负异常警报;和,若根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作,则标注所述异常警报为正异常警报;
使用所述正异常警报和所述负异常警报以及其对应的目标数据生成用于训练分类模型的样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检;
通过质检规则,对获取的所述目标数据进行一次质检,并根据所述一次质检的检测结果确定所述目标数据是否为发生异常警报的目标数据;
若确定为发生异常警报的目标数据,则通过所述分类模型进行二次质检;根据所述二次质检的检测结果,调整所述质检规则中的权重值;
其中,通过质检规则,对获取的所述目标数据进行一次质检,包括:
计算确定所述目标数据与数据库中所有患者对应的数据记录的相似度是否均小于所述权重值,若均小于所述权重值,则确定所述目标数据不为发生异常警报的目标数据;反之,则确定所述目标数据为发生异常警报的目标数据。
2.根据权利要求1所述的方法,其中:
所述第一操作包括未修改操作,若确定用户对发生异常警报的所述目标数据中的文本进行了所述未修改操作,则标注所述异常警报为负异常警报。
3.根据权利要求1所述的方法,其中:
所述第二操作包括修改操作,若确定用户对发生异常警报的所述目标数据中的文本进行了修改操作,则标注所述异常警报为正异常警报。
4.根据权利要求1所述的方法,其中:
获取所述正异常警报和/或所述负异常警报所对应的目标数据中的文本;
使用所述正异常警报和/或所述负异常警报及其对应的文本构建用于训练所述分类模型的样本数据集;
使用所述样本数据集中的训练样本对所述分类模型进行训练。
5.根据权利要求1-4中任一项所述的方法,其中:所述目标数据包括电子病历中的数据。
6.一种电子病历质检装置,包括:
第一获取模块,用于获取被检测发生异常警报的目标数据以及用户针对所述发生异常警报的目标数据进行的历史行为数据;
标注模块,用于当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第一操作时,标注所述异常警报为负异常警报;和,当根据所述历史行为数据确定所述用户对所述发生异常警报的目标数据进行了第二操作时,标注所述异常警报为正异常警报;
生成训练模块,用于使用所述正异常警报和所述负异常警报以及其对应的目标数据生成用于训练分类模型的样本数据集,以通过使用所述样本数据集训练的所述分类模型对电子病历进行质检;
一次质检模块,用于通过质检规则,对获取的所述目标数据进行一次质检,并根据所述一次质检的检测结果确定所述目标数据是否为发生异常警报的目标数据;
二次质检模块,用于对确定为发生异常警报的目标数据,通过所述分类模型进行二次质检;
调整模块,用于根据所述二次质检的检测结果,调整所述质检规则中的权重值;
其中,一次质检模块,具体用于:计算确定所述目标数据与数据库中所有患者对应的数据记录的相似度是否均小于所述权重值,若均小于所述权重值,则确定所述目标数据不为发生异常警报的目标数据;反之,则确定所述目标数据为发生异常警报的目标数据。
7.根据权利要求6所述的装置,其特征在于,所述第一操作包括未修改操作,所述标注模块用于若确定用户对发生异常警报的所述目标数据中的文本进行了所述未修改操作,则标注所述异常警报为负异常警报。
8.根据权利要求6所述的装置,其特征在于,所述第二操作包括修改操作,所述标注模块用于若确定用户对发生异常警报的所述目标数据中的文本进行了所述修改操作,则标注所述异常警报为正异常警报。
9.根据权利要求6所述的装置,其特征在于,所述生成训练模块包括:
第二获取模块,用于获取所述正异常警报和/或所述负异常警报所对应的目标数据中的文本;
构建模块,用于使用所述正异常警报和/或所述负异常警报及其对应的文本构建用于训练所述分类模型的样本数据集;
训练模块,用于使用所述样本数据集中的训练样本对所述分类模型进行训练。
10.根据权利要求6-9中任一项所述的装置,其中,所述目标数据包括电子病历中的数据。
CN201910031488.7A 2019-01-14 2019-01-14 电子病历质检方法和装置 Active CN111435364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910031488.7A CN111435364B (zh) 2019-01-14 2019-01-14 电子病历质检方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910031488.7A CN111435364B (zh) 2019-01-14 2019-01-14 电子病历质检方法和装置

Publications (2)

Publication Number Publication Date
CN111435364A CN111435364A (zh) 2020-07-21
CN111435364B true CN111435364B (zh) 2023-04-18

Family

ID=71579873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910031488.7A Active CN111435364B (zh) 2019-01-14 2019-01-14 电子病历质检方法和装置

Country Status (1)

Country Link
CN (1) CN111435364B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112711579A (zh) * 2020-12-30 2021-04-27 医渡云(北京)技术有限公司 医疗数据的质量检测方法及装置、存储介质及电子设备
CN112700880A (zh) * 2020-12-31 2021-04-23 杭州依图医疗技术有限公司 优化方法、训练方法、模型、处理装置及存储介质
CN113793681B (zh) * 2021-11-15 2022-02-15 广州悦微信息技术有限公司 医院多级医疗指标质控方法及系统
CN116092622B (zh) * 2023-04-10 2023-07-04 江苏瀚云医疗信息技术有限公司 基于Neo4j图谱及AI算法的电子病历质量控制系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101231848A (zh) * 2007-11-06 2008-07-30 安徽科大讯飞信息科技股份有限公司 一种基于支持向量机进行发音错误检测的方法
CN106131071A (zh) * 2016-08-26 2016-11-16 北京奇虎科技有限公司 一种Web异常检测方法和装置
CN106991072A (zh) * 2016-01-21 2017-07-28 杭州海康威视数字技术股份有限公司 在线自学习事件检测模型更新方法及装置
CN106997692A (zh) * 2017-05-26 2017-08-01 广州数字方舟信息技术股份有限公司 一种混合型航标报警智能检测方法
CN107291911A (zh) * 2017-06-26 2017-10-24 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN108173708A (zh) * 2017-12-18 2018-06-15 北京天融信网络安全技术有限公司 基于增量学习的异常流量检测方法、装置及存储介质
WO2018121690A1 (zh) * 2016-12-29 2018-07-05 北京市商汤科技开发有限公司 对象属性检测、神经网络训练、区域检测方法和装置
CN108268632A (zh) * 2018-01-16 2018-07-10 中国人民解放军海军航空大学 异常情报数据识别机器学习方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10147049B2 (en) * 2015-08-31 2018-12-04 International Business Machines Corporation Automatic generation of training data for anomaly detection using other user's data samples

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101231848A (zh) * 2007-11-06 2008-07-30 安徽科大讯飞信息科技股份有限公司 一种基于支持向量机进行发音错误检测的方法
CN106991072A (zh) * 2016-01-21 2017-07-28 杭州海康威视数字技术股份有限公司 在线自学习事件检测模型更新方法及装置
CN106131071A (zh) * 2016-08-26 2016-11-16 北京奇虎科技有限公司 一种Web异常检测方法和装置
WO2018121690A1 (zh) * 2016-12-29 2018-07-05 北京市商汤科技开发有限公司 对象属性检测、神经网络训练、区域检测方法和装置
CN106997692A (zh) * 2017-05-26 2017-08-01 广州数字方舟信息技术股份有限公司 一种混合型航标报警智能检测方法
CN107291911A (zh) * 2017-06-26 2017-10-24 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN108173708A (zh) * 2017-12-18 2018-06-15 北京天融信网络安全技术有限公司 基于增量学习的异常流量检测方法、装置及存储介质
CN108268632A (zh) * 2018-01-16 2018-07-10 中国人民解放军海军航空大学 异常情报数据识别机器学习方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Xiaoshu Hang.Applying both positive and negative selection to supervised learning for anomaly detection.《GECCO '05: Proceedings of the 7th annual conference on Genetic and evolutionary computation》.2005,全文. *
包小源 ; 黄婉晶 ; 张凯 ; 金梦 ; 李岩 ; 牛承志 ; .非结构化电子病历中信息抽取的定制化方法.北京大学学报(医学版).2018,(02),全文. *

Also Published As

Publication number Publication date
CN111435364A (zh) 2020-07-21

Similar Documents

Publication Publication Date Title
CN111435364B (zh) 电子病历质检方法和装置
CN106951925B (zh) 数据处理方法、装置、服务器及系统
CN112015917A (zh) 基于知识图谱的数据处理方法、装置及计算机设备
EP2478423A1 (en) Supervised fault learning using rule-generated samples for machine condition monitoring
CN112885481A (zh) 病例分组方法、装置、电子设备及存储介质
CN110647523B (zh) 数据质量的分析方法及装置、存储介质、电子设备
CN113204942A (zh) 病案编码方法、装置、终端设备及可读存储介质
CN113642562A (zh) 基于图像识别的数据解读方法、装置、设备及存储介质
CN112527862A (zh) 一种时间序列数据的处理方法及装置
CN117036947A (zh) 基于图像识别的农险出险预警方法、装置、设备及介质
CN116843395A (zh) 一种业务系统的告警分级方法、装置、设备及存储介质
CN116166999A (zh) 异常交易数据识别方法、装置、计算机设备及存储介质
CN113707304B (zh) 分诊数据处理方法、装置、设备及存储介质
CN115775635A (zh) 基于深度学习模型的药品风险识别方法、装置及终端设备
CN114724693A (zh) 异常诊疗行为的检测方法及装置、电子设备和存储介质
CN108572948A (zh) 门牌信息的处理方法及装置
CN110837459A (zh) 一种基于大数据的运行绩效分析方法及系统
CN116506205B (zh) 一种智慧医疗平台的数据处理方法及系统
CN113724816A (zh) 基于人工智能的医疗数据质检方法、装置、设备及介质
CN113780457B (zh) 中医资源消耗的异常检测方法、装置、设备及介质
CN111079420B (zh) 文本识别方法、装置、计算机可读介质及电子设备
CN116364309B (zh) 一种基于神经网络的临床试验风险评估方法及系统
CN117708729A (zh) 一种区块链金融安全监测方法、装置、存储介质以及设备
CN115829763A (zh) 数据报送方法、装置、计算机设备及存储介质
CN116992284A (zh) 医疗数据的标注方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant