CN109635005A - 异常数据检测方法、装置、设备及存储介质 - Google Patents
异常数据检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109635005A CN109635005A CN201811530504.9A CN201811530504A CN109635005A CN 109635005 A CN109635005 A CN 109635005A CN 201811530504 A CN201811530504 A CN 201811530504A CN 109635005 A CN109635005 A CN 109635005A
- Authority
- CN
- China
- Prior art keywords
- data
- chemicotherapy
- abnormal
- detection model
- standardized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000001514 detection method Methods 0.000 claims abstract description 135
- 230000008569 process Effects 0.000 claims abstract description 28
- 230000008520 organization Effects 0.000 claims abstract description 22
- 239000003814 drug Substances 0.000 claims description 25
- 229940079593 drug Drugs 0.000 claims description 23
- 239000008280 blood Substances 0.000 claims description 19
- 210000004369 blood Anatomy 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 15
- 238000003058 natural language processing Methods 0.000 claims description 11
- 238000000502 dialysis Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 7
- 241001269238 Data Species 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000007689 inspection Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012742 biochemical analysis Methods 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 108010034145 Helminth Proteins Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 244000000013 helminth Species 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 238000007449 liver function test Methods 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000011127 radiochemotherapy Methods 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种异常数据检测方法、装置、设备及存储介质,该方法包括:从定点医疗机构中获取待检测的放化疗数据;根据预设流程对所述放化疗数据进行处理,获得标准化数据;通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据判定为异常数据。本发明基于智能决策建立数据检测模型,对放化疗数据进行检测,提高了异常数据检测的效率和准确性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种异常数据检测方法、装置、设备及存储介质。
背景技术
目前,放化疗已纳入医保报销范筹,参保人在定点医疗机构进行结算时只需要支付医保报销后的费用。因此为保障医保基金的合理支出,负责管理医保的相关部门需要对参保人的放化疗数据进行异常检测,以减少虚假报销的发生。由于需要检测的数据量大,如果依靠人工进行检测,则效率低,准确性不高。
发明内容
本发明提供一种异常数据检测方法、装置、设备及存储介质,旨在提高异常数据检测的效率和准确性。
为实现上述目的,本发明提供一种从定点医疗机构中获取待检测的放化疗数据;
根据预设流程对所述放化疗数据进行处理,获得标准化数据;
通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。
优选地,所述从定点医疗机构中获取待检测的放化疗数据的步骤之前还包括:
设置多个放化疗判断依据,所述放化疗判断依据包括生化指标、血常规、相关药品以及静脉留置针;
分别设置每一个所述放化疗判断依据对应的判断条件;
根据每一个所述放化疗判断依据及每一个所述放化疗判断依据对应的判断条件,建立放化疗数据检测模型。
优选地,所述建立放化疗数据检测模型步骤包括:
将所述放化疗数据检测模型设置成横向放化疗数据检测模型;或者
将所述放化疗数据检测模型设置成纵向放化疗数据检测模型。
优选地,所述建立放化疗数据检测模型的步骤之后还包括:
在所述放化疗数据检测模型中输入验证数据,由所述放化疗数据检测模型对所述验证数据进行判断并输出所述验证数据中的第一异常验证数据;
将所述第一异常验证数据与第二异常数据进行比对,所述第二异常数据是预先获得的所述验证数据中的异常数据;
若所述第一异常验证数据与所述第二异常数据一致,则判定所述放化疗数据检测模型建立成功,保存所述放化疗数据检测模型以供后续使用;
若所述第一异常验证数据与所述第二异常数据不一致,则判定所述放化疗数据检测模型建立失败,将所述放化疗数据检测模型进行调试后,重新进行验证。
优选地,所述预设流程是自然语言处理NLP流程,所述根据预设流程对所述放化疗数据进行处理,获得标准化数据的步骤包括:
对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式;
使用基于字符匹配的分词方法对纯文本格式的所述透析数据进行分词,得到词组序列;
将所述词组序列与预先设置的关键词模板进行匹配,得到标准化数据。所述由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据判定为异常数据的步骤包括:
若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述所述标准化数据对应的放化疗数据判定为异常数据,并输出所述异常数据;
所述方法还包括:
若所述标准化数据中的每一个信息都符合预设判断条件,则将所述标准化数据对应的放化疗数据判定为正常数据。
优选地,所述通过预先建立的放化疗数据检测模型对所述标准化数据进行检测的步骤之后还包括:
将所述异常数据发送至相关平台,以供所述相关平台对所述异常数据进行分析并输出相应的决策。
此外,本发明实施例还提供一种异常数据检测装置,所述异常数据检测装置包括:
获取模块,用于从定点医疗机构中获取待检测的放化疗数据;
处理模块,用于根据预设流程对所述放化疗数据进行处理,获得标准化数据;
检测模块,用于通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。
此外,本发明实施例还提供一种异常数据检测设备,所述异常数据检测设备包括处理器,存储器以及存储在所述存储器中的异常数据检测程序,所述异常数据检测程序被所述处理器运行时,实现如上所述的异常数据检测方法的步骤。
此外,本发明实施例还提供一种计算机存储介质,所述计算机存储介质上存储有异常数据检测程序,所述异常数据检测程序被处理器运行时实现如上所述异常数据检测方法的步骤。
相比现有技术,本发明还提供一种异常数据检测方法、装置、设备及存储介质,从定点医疗机构中获取待检测的放化疗数据;根据预设流程对所述放化疗数据进行处理,获得标准化数据;用于通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。由此,基于智能决策建立数据检测模型,对放化疗数据进行检测,提高了异常数据检测的效率和准确性。
附图说明
图1是本发明各实施例涉及的异常数据检测设备的硬件结构示意图;
图2是本发明异常数据检测方法第一实施例的流程示意图;
图3是本发明异常数据检测方法第二实施例的流程示意图;
图4是本发明异常数据检测装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例主要涉及的异常数据检测设备是指能够实现网络连接的网络连接设备,所述异常数据检测设备可以是服务器、云平台等。
参照图1,图1是本发明各实施例涉及的异常数据检测设备的硬件结构示意图。本发明实施例中,异常数据检测设备可以包括处理器1001(例如中央处理器CentralProcessing Unit、CPU),通信总线1002,输入端口1003,输出端口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;输入端口1003用于数据输入;输出端口1004用于数据输出,存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种可读存储介质的存储器1005可以包括操作系统、网络通信模块、应用程序模块以及异常数据检测程序。在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的异常数据检测程序,并执行本发明实施例提供的异常数据检测方法。
本发明实施例提供了一种异常数据检测方法。
参照图2,图2是本发明异常数据检测方法第一实施例的流程示意图。
本实施例中,所述异常数据检测方法应用于异常数据检测设备,所述方法包括:
步骤S101,从定点医疗机构中获取待检测的放化疗数据;
一般地,参保人使用社保卡在定点医疗机构就诊后,定点医疗机构会保存相关诊疗、用药、费用等数据。本实施例中,所述放化疗是指化学治疗,是对病原微生物、寄生虫以及恶性肿瘤所致疾病的药物晋升治疗。放化疗作为治疗恶性肿瘤的一个重要手段,特点是可杀灭肿瘤细胞、抑制生长繁殖,副作用是导致人体免疫功能下降、骨髓抑制。一般地,在临床上放化疗按治疗疗程进行,由专业人员根据患者实际情况实施对应的放化疗。
本实施例中,从定点医疗机构中获取待检测的放化疗数据,所述放化疗数据包括参保人信息、生化检查信息、血常规信息、相关药品信息、静脉留置针,其中,所述生化检查信息包括肝功能检查信息、肾功能信息、尿酸信息等,所述相关药品信息包括升血药物、抗肿瘤放化疗药物、肠外营养液等。
步骤S102,根据预设流程对所述放化疗数据进行处理,获得标准化数据;
本实施例中,获取到待检测的放化疗数据后,则根据预设流程对所述放化疗数据进行处理,获得标准化数据。所述预设流程是自然语言处理(Natural LanguageProcessing,NLP)流程,NLP是人工智能的一个子领域,对文字或语音进行各种各样的处理和加工,是研究人与人交际,以及人与机器交互的一门学科,是人工智能的重要内容。NLP主要用于语音识别、自动分词、词性标注、句法分析、信息检索、文字核对、信息抽取等。
本实施例中通过NLP流程对所述放化疗数据依次进行预处理、分词、关键词模板匹配的处理流程,得到标准化数据。具体地,首先对所述放化疗数据进行预处理,将所述放化疗数据的类型转换为可供后续处理的纯文本格式,一般地,由于所述放化疗数据中包括日期、数值等非文本格式的信息,故需要先将所述非文本信息转换成文本格式,以免在后续处理过程中出现格式错误。然后基于字符匹配的分词方法对所述放化疗数据进行分词,得到词组序列,所述放化疗数据往往是复杂凌乱且没有统一规则的文本或数字,因此在应用所述放化疗数据之前需要将获得的所述纯文本格式的放化疗数据进行分词,得到一系列的可进行机器处理的词组序列,再对所述词组序列进行浅层语义分析,标注语义角色,得到关键词逻辑序列。将处理后的放化疗数据与预先设置的关键词模板进行匹配,以获得标准化数据。可以预先在所述关键词模板中设置所需要的关键词,例如生化指标、血常规、相关药品等。所述标准化数据是指经过自然语言处理流程后获得的数据,所述标准化数据是将所述放化疗数据中的参保人信息、生化检查信息、血常规信息、相关药品信息、静脉留置针等信息匹配到相应的标准化字段中。
此外,对于复杂的放化疗数据,也可以通过循环神经网络(Recurrent NeuralNetwork,RNN)来处理,神经网络是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。RNN可以利用内部的记忆来处理任意时序的输入序列,这让它可以更容易处理如不分段的手写识别、语音识别、数据文本等。一般地,RNN包括输入层、隐藏层以及输出层,在输入层中设置好词向量,由输出层进行结果输出。
步骤S103,通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。
本实施例中,将所述标准化数据输入预先建立的放化疗数据检测模型。由所述放化疗数据检测模型依次对所述标准化数据进行检测;由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。具体地,所述放化疗数据检测模型是基于多个条件判断的检测模型。所述放化疗数据检测模型可以对所述标准化化数据中的多个信息进行同时判断,并输出对所述多个信息的判断结果,此时可以将所述放化疗数据检测模型理解为横向放化疗数据检测模型,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述所述标准化数据对应的放化疗数据判定为异常数据,并输出所述异常数据。若所述标准化数据中的每一个信息都符合预设判断条件,则将所述标准化数据对应的放化疗数据判定为正常数据。例如,由于放化疗一般是按疗程进行,对于所述标准化数据中的血常规信息进行判断的预设判断条件可以设置为在治疗期间三天一次,若所述血常规数据是三天一次,则判定所述血常规数据符合预设判断条件,若所述血常规数据不是三天一次,则判定所述血常规数据不符合预设判断条件。在实际设置中,可以根据具体情况设置所述标准化数据中各个信息的具体判断条件。
另外,为所述标准化数据中的每一个信息设置编号,所述放化疗数据检测模型可以对所述标准化数据中的每一个信息按所述编号进行逐一判断,若所述标准化数据中的每一个信息中的第一个信息符合预设判断条件,则继续判断下一个信息,直至完成所有信息的判断,若所述标准化数据中的每一个信息都符合预设判断条件,则判定所述标准化数据对应的放化疗数据是正常数据;若所述所述标准化数据中的每一个信息中的第一个信息不符合预设判断条件,停止判断,并判定所述标准化数据对应的放化疗数据是异常数据,并输出所述异常数据,可理解为所述放化疗数据检测模型是纵向放化疗数据检测模型,也即纵向分步判断,在所述纵向分步判断过程中,若有不符合预设判断条件的信息,则停止继续判断,将所述不符合预设判断条件的信息的标准化数据对应的放化疗数据标记为异常数据,并直接输出所述异常数据。
本实施例中,所述通过预先建立的放化疗数据检测模型对所述标准化数据进行检测的步骤之后还包括:
将所述异常数据发送至相关平台,以供所述相关平台对所述异常数据进行分析并输出相应的决策。
本实施例中,所述相关平台可以是社保局的数据处理平台,将所述异常数据发送至相关平台,所述相关平台基于所述异常数据获取与所述异常数据相关的全部信息,所述全部信息包括对应的参保人、对应的定点医疗机构以及对所述参保人的报销费用,以供所述相关平台对所述异常数据进行分析并输出相应的决策。例如,对虚假报销的参保人进行警告、处分、罚款。若某定点医疗机构出现大量的异常数据,导致虚假报销的数量明显超出其它定点医疗机构,则对该定点医疗机构进行全面的审查。
此外,由于放化疗一般花费巨大,故还可以对正常放化疗数据对应的参保人的社保卡余额进行监控,当所述社保卡的余额低于阈值,则为所述余额低于阈值的社保卡对应的参保人提供相应的经济援助。
本实施例通过以上方案,从定点医疗机构中获取待检测的放化疗数据;根据预设流程对所述放化疗数据进行处理,获得标准化数据;通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的多个信息与预设判断条件进行比对,将所述标准化数据中的一个或多个信息不符合预设判断条件的标准化数据判定为异常数据。由此,基于智能决策建立数据检测模型,对放化疗数据进行检测,提高了异常数据检测的效率和准确性。
如图3所示,本发明第二实施例提出一种异常数据检测方法,基于上述图2所示的第一实施例,所述从定点医疗机构中获取待检测的放化疗数据的步骤之前还包括:
步骤S201,设置多个放化疗判断依据,所述放化疗判断依据包括生化指标、血常规、相关药品以及静脉留置针;
本实施例中,将进行放化疗所必须的生化指标、血常规、相关药品以及静脉留置针等信息作为判断依据。
步骤S202,分别设置每一个所述放化疗判断依据对应的判断条件;
一般地,可以为多个放化疗判断依据设置对应的判断条件,并根据所述判断条件对放化疗数据进行判断。例如,由于放化疗一般是按疗程进行,对于所述标准化数据中的血常规信息进行判断的判断条件可以设置为在治疗期间三天一次,若所述血常规数据是三天一次,则判定所述血常规数据符合判断条件,若所述血常规数据不是三天一次,则判定所述血常规数据不符合判断条件。在实际设置中,可以根据具体情况设置所述标准化数据中每一个信息的具体判断条件。例如,将与放化疗对应的必须药品A以及所述必须药品A的用量作为判断依据之一,假设所述必须药品A的用量是一个疗程中需要2盒,若所述标准化数据中存在所述必须药品A,则继续判断所述必须药品A的用量是否符合药品判断条件,若所述必须药品A的用量是2盒,则判定所述必须药品A符合药品判断条件;反之,若所述必须药品A的用量不是2盒,则判定所述必须药品A不符合药品判断条件。以此,分别设置所述标准化数据中其它信息的判断依据。
步骤S203,根据每一个所述放化疗判断依据及每一个所述放化疗判断依据对应的判断条件,建立放化疗数据检测模型。
本实施例中,可以将所述放化疗数据检测模型设置成横向放化疗数据检测模型。对于所述横向放化疗数据检测模型,由所述横向放化疗数据检测模型对接收到的标准化数据中的多个信息按预设判断条件进行同时判断,获得并输出每个信息的判断结果,若所述多个信息都符合预设判断条件,则判定所述标准化数据对应的放化疗数据是正常数据;反之,若所述标准化数据中有一个或多个信息不符合预设判断条件,则判定所述标准化数据对应的放化疗数据是异常数据,并输出所述异常数据。
进一步地,可以将所述放化疗数据检测模型设置成纵向放化疗数据检测模型。对于所述纵向放化疗数据检测模型,设置成由所述纵向放化疗数据检测模型接收到的标准化数据中的多个信息按预设判断条件进行逐一判断,若所述多个信息中的第一个信息符合预设判断条件,则继续判断第二个信息,直至完成对所有信息的判断,若所有信息都符合预设判断条件,则判定所述标准化数据对应的放化疗数据是正常数据;若所述第一个信息不符合预设判断条件,则停止判断,并判定所述标准化数据对应的放化疗数据是异常数据,并输出所述异常数据。可以理解地,在继续判断其它信息是否符合预设判断条件的过程中,若有一个信息不符合预设判断条件,则停止判断,并将所述标准化数据对应的放化疗数据标记为异常数据并输出所述异常数据。
进一步地,所述建立放化疗数据检测模型的步骤之后还包括:
在所述放化疗数据检测模型中输入验证数据,由所述放化疗数据检测模型对所述验证数据进行判断并输出所述验证数据中的第一异常验证数据;具体地,从定点医疗机构中获取所述历史数据,将所述历史数据依次进行预处理、分词、关键词模板匹配的处理流程,得到所述验证数据。
将所述第一异常验证数据与第二异常数据进行比对,所述第二异常数据是预先获得的所述验证数据中的异常数据;所述验证数据是已经通过人工分析等传统分析方法获得判断结果的历史数据,预先保存了所述验证数据中的第二异常验证数据。
若所述第一异常验证数据与所述第二异常数据一致,则判定所述放化疗数据检测模型建立成功,保存所述放化疗数据检测模型以供后续使用;具体地,首先判断所述第一异常验证数据与所述第二异常数据的数量是否一致,若所述第一异常验证数据与所述第二异常数据的数量一致,则继续判断所述第一异常验证数据与所述第二异常数据是否一一对应,若所述第一异常验证数据与所述第二异常数据一一对应,则判定所述第一异常验证数据与所述第二异常数据的一致,反之,若第一异常验证数据与所述第二异常数据不是一一对应,则判定所述第一异常验证数据与所述第二异常数据的不一致。
若所述第一异常验证数据与所述第二异常数据不一致,则判定所述放化疗数据检测模型建立失败,将所述放化疗数据检测模型进行调试后,重新进行验证。若所述第一异常验证数据与所述第二异常数据的数量不一致,则判定所述放化疗数据检测模型建立失败,将所述放化疗数据检测模型进行调试后,重新进行验证。
进一步地,还可以根据所述第一异常验证数据与所述第二异常数据,获得所述放化疗数据检测模型的准确率,若所述准确率大于或等于阈值,则判定所述放化疗数据检测模型建立成功,若所述准确率小于阈值,则判定所述放化疗数据检测模型建立失败,将所述放化疗数据检测模型进行调试后,重新进行验证。
本实施例通过以上方案,建立所述放化疗数据检测模型,并对所述放化疗数据检测模型进行评估,由此提高了异常数据检测的准确性。
此外,本实施例还提供一种异常数据检测装置。参照图4,图4为本发明异常数据检测装置第一实施例的功能模块示意图。
本发明提供的异常数据检测装置是虚拟装置,存储于图1所示的异常数据检测装置的存储器1005中,用于从定点医疗机构中获取待检测的放化疗数据;用于根据预设流程对所述放化疗数据进行处理,获得标准化数据;用于通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的多个信息与预设判断条件进行比对,将所述标准化数据中的一个或多个信息不符合预设判断条件的标准化数据判定为异常数据。
具体地,本实施例中,所述异常数据检测装置包括:
获取模块10,用于从定点医疗机构中获取待检测的放化疗数据;
处理模块20,用于根据预设流程对所述放化疗数据进行处理,获得标准化数据;
检测模块30,用于通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。
进一步地,所述检测模块还用于:
设置多个放化疗判断依据,所述放化疗判断依据包括生化指标、血常规、相关药品以及静脉留置针;
分别设置每一个所述放化疗判断依据对应的判断条件;
根据每一个所述放化疗判断依据及每一个所述放化疗判断依据对应的判断条件,建立放化疗数据检测模型。
进一步地,所述检测模块还用于:
将所述放化疗数据检测模型设置成横向放化疗数据检测模型;或者
将所述放化疗数据检测模型设置成纵向放化疗数据检测模型。
进一步地,所述检测模块还用于:
在所述放化疗数据检测模型中输入验证数据,由所述放化疗数据检测模型对所述验证数据进行判断并输出所述验证数据中的第一异常验证数据;
将所述第一异常验证数据与第二异常数据进行比对,所述第二异常数据是预先获得的所述验证数据中的异常数据;
若所述第一异常验证数据与所述第二异常数据一致,则判定所述放化疗数据检测模型建立成功,保存所述放化疗数据检测模型以供后续使用;
若所述第一异常验证数据与所述第二异常数据不一致,则判定所述放化疗数据检测模型建立失败,将所述放化疗数据检测模型进行调试后,重新进行验证。
进一步地,所述处理模块还用于:
对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式;
使用基于字符匹配的分词方法对纯文本格式的所述透析数据进行分词,得到词组序列;
将所述词组序列与预先设置的关键词模板进行匹配,得到标准化数据。
进一步地,所述检测模块还用于:
若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述所述标准化数据对应的放化疗数据判定为异常数据,并输出所述异常数据;
所述方法还包括:
若所述标准化数据中的每一个信息都符合预设判断条件,则将所述标准化数据对应的放化疗数据判定为正常数据。
此外,本发明还提出一种计算机存储介质,所述计算机存储介质上存储有异常数据检测程序,所述异常数据检测程序被处理器运行时实现如上所述异常数据检测方法的步骤,在此不再赘述。
相比现有技术,本发明提出的一种异常数据检测方法、装置、设备及存储介质,从定点医疗机构中获取待检测的放化疗数据;根据预设流程对所述放化疗数据进行处理,获得标准化数据;通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。由此,基于智能决策建立数据检测模型,对放化疗数据进行检测,提高了异常数据检测的效率和准确性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种异常数据检测方法,其特征在于,所述方法应用于异常数据检测设备,所述方法包括:
从定点医疗机构中获取待检测的放化疗数据;
根据预设流程对所述放化疗数据进行处理,获得标准化数据;
通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。
2.根据权利要求1所述的方法,其特征在于,所述从定点医疗机构中获取待检测的放化疗数据的步骤之前还包括:
设置多个放化疗判断依据,所述放化疗判断依据包括生化指标、血常规、相关药品以及静脉留置针;
分别设置每一个所述放化疗判断依据对应的判断条件;
根据每一个所述放化疗判断依据及每一个所述放化疗判断依据对应的判断条件,建立放化疗数据检测模型。
3.根据权利要求2所述的方法,其特征在于,所述建立放化疗数据检测模型步骤包括:
将所述放化疗数据检测模型设置成横向放化疗数据检测模型;或者
将所述放化疗数据检测模型设置成纵向放化疗数据检测模型。
4.根据权利要求2所述的方法,其特征在于,所述建立放化疗数据检测模型的步骤之后还包括:
在所述放化疗数据检测模型中输入验证数据,由所述放化疗数据检测模型对所述验证数据进行判断并输出所述验证数据中的第一异常验证数据;
将所述第一异常验证数据与第二异常数据进行比对,所述第二异常数据是预先获得的所述验证数据中的异常数据;
若所述第一异常验证数据与所述第二异常数据一致,则判定所述放化疗数据检测模型建立成功,保存所述放化疗数据检测模型以供后续使用;
若所述第一异常验证数据与所述第二异常数据不一致,则判定所述放化疗数据检测模型建立失败,将所述放化疗数据检测模型进行调试后,重新进行验证。
5.根据权利要求1所述的方法,其特征在于,所述预设流程是自然语言处理NLP流程,所述根据预设流程对所述放化疗数据进行处理,获得标准化数据的步骤包括:
对所述透析数据进行预处理,将所述透析数据的格式转换为可供后续处理的纯文本格式;
使用基于字符匹配的分词方法对纯文本格式的所述透析数据进行分词,得到词组序列;
将所述词组序列与预先设置的关键词模板进行匹配,得到标准化数据。
6.根据权利要求1所述的方法,其特征在于,所述由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据判定为异常数据的步骤包括:
若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述所述标准化数据对应的放化疗数据判定为异常数据,并输出所述异常数据;
所述方法还包括:
若所述标准化数据中的每一个信息都符合预设判断条件,则将所述标准化数据对应的放化疗数据判定为正常数据。
7.根据权利要求1所述的方法,其特征在于,所述通过预先建立的放化疗数据检测模型对所述标准化数据进行检测的步骤之后还包括:
将所述异常数据发送至相关平台,以供所述相关平台对所述异常数据进行分析并输出相应的决策。
8.一种异常数据检测装置,其特征在于,所述异常数据检测装置包括:
获取模块,用于从定点医疗机构中获取待检测的放化疗数据;
处理模块,用于根据预设流程对所述放化疗数据进行处理,获得标准化数据;
检测模块,用于通过预先建立的放化疗数据检测模型对所述标准化数据进行检测,由所述放化疗数据检测模型将所述标准化数据中的每一个信息与对应的预设判断条件进行比对,若所述标准化数据中存在信息不符合对应的预设判断条件,则将所述标准化数据对应放化疗数据判定为异常数据。
9.一种异常数据检测设备,其特征在于,所述异常数据检测设备包括处理器,存储器以及存储在所述存储器中的异常数据检测程序,所述异常数据检测程序被所述处理器运行时,实现如权利要求1-7中任一项所述的异常数据检测方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有异常数据检测程序,所述异常数据检测程序被处理器运行时实现如权利要求1-7中任一项所述异常数据检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530504.9A CN109635005A (zh) | 2018-12-13 | 2018-12-13 | 异常数据检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811530504.9A CN109635005A (zh) | 2018-12-13 | 2018-12-13 | 异常数据检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109635005A true CN109635005A (zh) | 2019-04-16 |
Family
ID=66073914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811530504.9A Pending CN109635005A (zh) | 2018-12-13 | 2018-12-13 | 异常数据检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109635005A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750621A (zh) * | 2019-09-06 | 2020-02-04 | 平安医疗健康管理股份有限公司 | 单据数据核查处理方法、装置、计算机设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514576A (zh) * | 2013-09-06 | 2014-01-15 | 深圳民太安信息技术有限公司 | 一种社保就诊违规套现的筛查方法 |
CN107133437A (zh) * | 2017-03-03 | 2017-09-05 | 平安医疗健康管理股份有限公司 | 监控药品使用的方法及装置 |
CN107133438A (zh) * | 2017-03-03 | 2017-09-05 | 平安医疗健康管理股份有限公司 | 医疗行为监控方法及装置 |
-
2018
- 2018-12-13 CN CN201811530504.9A patent/CN109635005A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514576A (zh) * | 2013-09-06 | 2014-01-15 | 深圳民太安信息技术有限公司 | 一种社保就诊违规套现的筛查方法 |
CN107133437A (zh) * | 2017-03-03 | 2017-09-05 | 平安医疗健康管理股份有限公司 | 监控药品使用的方法及装置 |
CN107133438A (zh) * | 2017-03-03 | 2017-09-05 | 平安医疗健康管理股份有限公司 | 医疗行为监控方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750621A (zh) * | 2019-09-06 | 2020-02-04 | 平安医疗健康管理股份有限公司 | 单据数据核查处理方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103871407B (zh) | 语音识别错误的纠正方法及装置 | |
CN110781298B (zh) | 药品分类方法、装置、计算机设备及存储介质 | |
CN108133436A (zh) | 自动判案方法及系统 | |
CN105868179B (zh) | 一种智能问答方法及装置 | |
CN104462053A (zh) | 一种文本内的基于语义特征的人称代词指代消解方法 | |
CN104538035B (zh) | 一种基于Fisher超向量的说话人识别方法及系统 | |
CN109741826B (zh) | 麻醉评估决策树构建方法及设备 | |
CN108763191A (zh) | 一种文本摘要生成方法及系统 | |
CN109545317A (zh) | 基于住院预测模型判定住院行为的方法及相关产品 | |
CN106776832A (zh) | 用于问答交互日志的处理方法、装置及系统 | |
CN106529110A (zh) | 一种用户数据分类的方法和设备 | |
CN106815201A (zh) | 一种自动判定裁判文书判决结果的方法及装置 | |
CN109767326A (zh) | 可疑交易报告生成方法、装置、计算机设备和存储介质 | |
CN108052504A (zh) | 数学主观题解答结果的结构分析方法及系统 | |
CN107688583A (zh) | 创建用于自然语言处理装置的训练数据的方法和设备 | |
CN110009224A (zh) | 嫌疑人违规概率预测方法、装置、计算机设备及存储介质 | |
CN109800309A (zh) | 课堂话语类型分类方法及装置 | |
CN110472209A (zh) | 基于深度学习的表格生成方法、装置和计算机设备 | |
CN106933802B (zh) | 一种面向多数据源的社保类实体识别方法及装置 | |
CN116631643A (zh) | 医疗知识图谱构建方法、装置、电子设备及存储介质 | |
CN109635005A (zh) | 异常数据检测方法、装置、设备及存储介质 | |
CN107862037A (zh) | 一种基于实体连通图的事件模版构造方法 | |
Li et al. | Chemical-induced disease extraction via convolutional neural networks with attention | |
CN109378082A (zh) | 互联网医疗问诊的监管方法、电子装置及可读存储介质 | |
CN108268461A (zh) | 一种基于混合分类器的文本分类装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190416 |