CN109523394B - 一种基于数据处理的风险检测方法、装置及存储介质 - Google Patents

一种基于数据处理的风险检测方法、装置及存储介质 Download PDF

Info

Publication number
CN109523394B
CN109523394B CN201811236334.3A CN201811236334A CN109523394B CN 109523394 B CN109523394 B CN 109523394B CN 201811236334 A CN201811236334 A CN 201811236334A CN 109523394 B CN109523394 B CN 109523394B
Authority
CN
China
Prior art keywords
statement
hospital
similarity
outpatient
hospital outpatient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811236334.3A
Other languages
English (en)
Other versions
CN109523394A (zh
Inventor
周竹凌
汪丽娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811236334.3A priority Critical patent/CN109523394B/zh
Publication of CN109523394A publication Critical patent/CN109523394A/zh
Application granted granted Critical
Publication of CN109523394B publication Critical patent/CN109523394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例公开了一种基于数据处理的风险检测方法和装置,其中基于数据处理的风险检测方法包括:获取需要报销的多张医院门诊结算单;检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。采用本发明,能够通过对多张医院门诊结算单的相似度计算,确定医院门诊计算单的风险值,进而提升发现违规医院门诊结算单的效率和准确率,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。

Description

一种基于数据处理的风险检测方法、装置及存储介质
技术领域
本发明涉及数据处理领域,具体涉及一种基于数据处理的风险检测方法和装置。
背景技术
医保指社会医疗保险。社会医疗保险是国家和社会根据一定的法律法规,为向保障范围内的劳动者提供患病时基本医疗需求保障而建立的社会保险制度。在现有的医保报销过程中,医院上传药品编码即可进行报销。但是可能存在医院或个人为了获得医保报销而空刷卡骗取医保基金、或者将非报销药品篡改为报销药品进行报销的情况,这种违规行为间接造成了社会不公平,应该予以杜绝。
现有的医院门诊医保报销核查过程中,是医院门诊上传患者在医疗机构开具的结算单到医疗保险管理局,然后医疗保险管理局检查结算单上的药品是否属于报销范围,如果是,则根据结算单的金额进行报销。在这个过程中,医疗保险管理局仅能够对单张单据进行审核,审核效率和准确率都十分低下,无法从多张单据的相关性中发现医疗保险的违规与欺诈行为,不利于医保报销的稽查。
发明内容
本发明实施例提供一种基于数据处理的风险检测方法和装置,能够通过对多张医院门诊结算单的相似度计算,确定医院门诊计算单的风险值,进而提升发现违规医院门诊结算单的效率和准确率,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
本发明实施例的第一方面提供了一种基于数据处理的风险检测方法,所述基于数据处理的风险检测方法包括:
获取需要报销的多张医院门诊结算单;
检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
在可选的情况下,所述多张医院门诊结算单的相似度包括药品相似度,所述检测所述多张医院门诊结算单的相似度具体包括:
获取所述多张医院门诊结算单的药品数量和药品种类;
将所述药品数量和所述药品种类作为所述医院门诊结算单的特征值,对所述医院门诊结算单进行药品相似度聚类,获得多个药品相似度类簇,并确定同一药品相似度类簇中医院门诊结算单之间的药品平均相似度;
获取所述药品平均相似度作为所述同一药品相似度类簇中医院门诊结算单的相似度。
在可选的情况下,所述多张医院门诊结算单的相似度包括单据相似度,所述检测所述多张医院门诊结算单的相似度具体包括:
获取所述多张医院门诊结算单对应的医院相关信息,包括医院名称、科室以及开单医生标识;
获取所述多张医院门诊结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;
将所述医院相关信息和所述病人相关信息作为所述门诊结算单的特征值对所述医院门诊结算单进行单据相似度聚类,并确定同一单据相似度类簇中医院门诊结算单之间的单据平均相似度;
获取所述单据平均相似度作为所述同一单据相似度类簇中医院门诊结算单的相似度。
在可选的情况下,所述根据所述多张医院门诊结算单的相似度确定所述医院门诊结算单的风险值,包括:
若确定所述药品相似度类簇和所述单据相似度类簇中的医院门诊结算单数量大于第一预设阈值,则将所述药品相似度类簇设置为第一目标类簇,将所述单据相似度类簇设置为第二目标类簇;
根据所述药品平均相似度为所述第一目标类簇中的医院门诊结算单设置第一子权值;
根据所述单据平均相似度为所述第二目标类簇中的医院门诊结算单设置第二子权值;
根据所述第一子权值和所述第二子权值之和确定所述医院门诊结算单的相似度权值,并根据所述相似度权值确定所述医院门诊结算单的风险值。
在可选情况下,在所述当确定所述医院门诊结算单的风险值大于预设风险阈值时之前,所述方法还包括:
将根据所述相似度权值确定的医院门诊结算单的风险值设为第一风险值;
将所述医院门诊结算单中的药品与药品数据库进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率,并为所述匹配成功率小于预设匹配度阈值的医院门诊结算单设置匹配度权值;
根据所述匹配度权值确定所述匹配成功率小于预设匹配度阈值的医院门诊结算单的风险值,将所述风险值设为第二风险值;
对所述第一风险值和所述第二风险值求和,确定所述医院门诊结算单的风险值。
在可选的情况下,所述将所述医院门诊结算单中的药品与药品数据库进行匹配具体包括:
根据所述医院门诊结算单中的药品从所述药品数据库中获取与所述药品对应的适用症状;
将所述适用症状与所述医院门诊结算单中的病人的诊断症状进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率。
在可选的情况下,所述方法还包括:
获取所述风险结算单的据面信息,所述据面信息包括所述药品数量和药品种类、所述医院相关信息和所述病人相关信息;
获取另一批需要报销的医院门诊结算单的据面信息,并将所述另一批需要报销的医院门诊结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;
当所述结算单相似度大于第二预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。
本发明实施例的第二方面提供了一种风险检测装置,所述风险检测装置包括:
获取单元,用于获取需要报销的多张医院门诊结算单;
检测单元,用于检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
确定单元,用于当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
本发明实施例第三方面提供了一种电子装置,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面任一方法中的步骤的指令。
本发明实施例第四方面提供了一种计算机可读存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第一方面任一方法所述的步骤的指令。
在本发明实施例中,电子设备首先获取需要报销的多张医院门诊结算单;然后检测多张医院门诊结算单的相似度,并根据多张医院门诊结算单的相似度获取医院门诊结算单的风险值;最后当确定医院门诊结算单的风险值大于预设风险阈值时,设置医院门诊结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对多张医院门诊结算单相似度的计算,确定医院门诊结算单存在伪造的可能性,进而确定医院门诊结算单的风险值,而当医院门诊结算单的风险值大于预设阈值时,确定医院门诊结算单为风险结算单并不予以报销。这个过程能够对医院门诊结算单进行快速筛查,提升发现违规医院门诊结算单的效率和准确率,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本发明实施例提供的一种基于数据处理的风险检测方法流程示意图;
图1B是本发明实施例提供的一种医院门诊结算单的示意图;
图2是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图;
图3是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图;
图4是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图;
图5是本发明实施例提供的一种电子装置的结构示意图;
图6是本发明实施例提供的一种风险检测装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面对本发明实施例进行详细介绍。
请参阅图1A,图1A为本发明实施例中一种基于数据处理的风险检测方法流程示意图,如图1A所示,所述基于数据处理的风险检测方法包括:
101、获取需要报销的多张医院门诊结算单。
医院门诊是指医院里开展门诊活动的场所,是医院组成的一部分。医生在门诊部对不住院的病人进行诊疗,或经过门诊收住院治疗。门诊部集医疗、预防、检测、康复为一体,内设外科、妇科、内科、耳鼻喉科、中医科、医学检测等特色科室。
请参阅图1B,图1B为本发明实施例提供的一种医院门诊结算单的示意图,如图1B所示,在医院门诊结算单上,包括医院名称、开单医生姓名、开单时间、病人姓名、性别、年龄、诊断症状、开具药品名称、药品数量、药品价格或者药品使用方法等,用于报销的医院门诊结算单还包括药品编号,属于医保报销药或自费药等,但可能不包括诊断症状或药品使用方法等信息。
获取多张医院门诊结算单,包括一个时间段内医院所有的门诊结算单,例如一个月、三个月或者一年,或者一个科室的所有门诊结算单,例如妇产科、儿科、外科或者内科等。获得多张医院门诊结算单后,执行步骤102。
102、检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值。
在检测医院的多张门诊结算单时,如果很多张门诊结算单的相似度非常高,包括医生信息、病人信息、或药品信息都非常相似,说明医院的门诊计算单可能存在造假,将自费药品修改为报销药品,以达到骗取医保的作用。这种做法将使得不应该报销的药品获得了报销,造成医保局负担,同时也造成了社会上不公平现象的加大。因此需要对这类医院门诊结算单予以发现和处理。
可选的,多张医院门诊结算单的相似度包括药品相似度,检测多张医院门诊结算单的相似度具体包括:获取多张医院门诊结算单的药品数量和药品种类;将药品数量和药品种类作为医院门诊结算单的特征值,对医院门诊结算单进行药品相似度聚类,获得多个药品相似度类簇,并确定同一药品相似度类簇中医院门诊结算单之间的药品平均相似度;获取药品平均相似度作为同一药品相似度类簇中医院门诊结算单的相似度。
具体地,医院门诊结算单的相似度可以根据药品数量和药品种类来获取。医院门诊结算单上有多种药品,并有每一种药品的名称和数量,将药品名称和药品数量作为特征值,组成医院门诊结算单的特征向量并进行聚类。可采用的聚类算法包括基于划分的聚类算法、基于密度的聚类算法、基于层次的聚类算法、基于模型的聚类算法或基于网格的聚类算法等,典型的基于密度的聚类算法可以是基于密度的噪声应用空间聚类(Density-BasedSpatial Clustering of Applications with Noise,DBSCAN),基于划分的聚类算法可以是K均值(K-means)聚类算法等。对于基于划分的聚类算法,是基于距离的,而距离与相似度可以相互转化,距离越近,相似度越高,距离越远,相似度越低。那么,对医院门诊结算单进行聚类后,会获得多个类簇,不同的类簇之间相似度低,同一类簇中的医院门诊结算单之间相似度高。然后计算同一个类簇中的医院门诊结算单之间的药品相似度,最后根据医院门诊结算单之间的药品相似度获得该类簇所有医院门诊结算单相似度的平均数。因为平均数可以表达该类簇中医院门诊结算单相似度的整体情况,因此可以将其设置为药品相似度类簇中医院门诊结算单的相似度。其中,医院门诊结算单之间的相似度可以根据余弦相似度或Pearson相似系数来获得。
可选的,多张医院门诊结算单的相似度包括单据相似度,检测多张医院门诊结算单的相似度具体包括:获取多张医院门诊结算单对应的医院相关信息,包括医院名称、科室以及开单医生标识;获取多张医院门诊结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;将医院相关信息和病人相关信息作为门诊结算单的特征值对医院门诊结算单进行单据相似度聚类,并确定同一单据相似度类簇中医院门诊结算单之间的单据平均相似度;获取单据平均相似度作为同一单据相似度类簇中医院门诊结算单的相似度。
具体地,医院门诊结算单的相似度也可以根据单据信息来获取,包括医院相关信息和病人相关信息。医院相关信息包括医院名称、科室名称、开单医生姓名和开单时间等,病人相关信息包括病人姓名、年龄、性别、诊断症状或有无病史等。这些信息越相似,说明单据相似度越高。医院门诊结算单的单据相似度聚类过程与药品相似度聚类过程相同,区别只在于采用医院门诊结算单上的医疗机构相关信息和病人相关信息作为特征值,获得特征向量然后进行聚类,获得聚类后的单据相似度类簇,然后将单据相似度类簇中所有医院门诊结算单之间的单据平均相似度作为该类簇中医院门诊结算单的相似度。
获得医院门诊结算单的相似度后,需要计算门诊结算单的风险值。对于风险值的计算,可以单独根据门诊结算单的药品相似度计算风险值,也可以单独根据门诊结算单的单据相似度计算风险值,还可以结合门诊结算单的药品相似度和单据相似度计算风险值。
可选的,根据多张医院门诊结算单的相似度确定医院门诊结算单的风险值,包括:若确定药品相似度类簇和单据相似度类簇中的医院门诊结算单数量大于第一预设阈值,则将药品相似度类簇设置为第一目标类簇,将单据相似度类簇设置为第二目标类簇;根据药品平均相似度为第一目标类簇中的医院门诊结算单设置第一子权值;根据单据平均相似度为第二目标类簇中的医院门诊结算单设置第二子权值;根据第一子权值和第二子权值之和确定医院门诊结算单的相似度权值,并根据相似度权值确定医院门诊结算单的风险值。
具体地,医院门诊结算单根据药品相似度或单据相似度聚类,可分别获得多个药品相似度类簇或单据相似度类簇,并且,同一个类簇中的医院门诊结算单数量越多,说明这一批医院门诊结算单的聚集程度越高,即医院门诊结算单之间的相似程度越高,同一类簇中的医院门诊结算单数量越少,说明这一批医院门诊结算单的分散程度越高,即医院门诊结算单之间的相似程度越低。那么首先需要根据同一类簇中的医院门诊结算单数量判定这一批医院门诊结算单的聚集程度。第一预设阈值可以是随机设定的一个值,例如50,101,也可以是根据所有医院门诊结算单固定比率获得的一个值,例如:第一预设阈值=总的门诊结算单*60%等。药品相似度类簇和单据相似度类簇的都设置为第一预设阈值,可以使得根据两种聚类方法聚类出的权值结果数量级统一,提升后续计算的准确度。对于医院门诊结算单数量大于第一预设阈值的药品相似度类簇和单据相似度类簇,分别设置为第一目标类簇和第二目标类簇,那么医院门诊结算单设置权值的过程如表1所示:
表1医院门诊结算单权值设置
Figure BDA0001838239350000081
对于只在第一目标类簇中的医院门诊结算单,其权值为α,对于只在第二目标类簇中的医院门诊结算单,其权值为β,而同时在两个目标类簇中的医院门诊结算单,其权值为α+β,可用公式表达为:
W=α*S1+β*S2 (1)
其中W表示医院门诊结算单的相似度权值,门诊结算单为第一目标类簇中的医院门诊结算单时,S1=1,否者S1=0;门诊结算单为第二目标类簇中的医院门诊结算单时,S2=1,否者S2=0。α和β可以是任意正数。另外,通常情况下,风险医院门诊结算单对药品名称和药品数量造假的概率大于对单据信息的造假,因此,第一子权值的数值应该大于第二子权值的数值。
获得权值后,计算相似度大于预设阈值的门诊结算单的风险值,风险值可以直接等于权值,或者由权值乘以一个风险常数,风险常数为大于0的数值,例如10,100等,使得风险值不存在小数。或者通过其他方法,例如四舍五入省略小数位,使风险值成为容易计算的数值。用公式表示如下:
F=W*T1 (2)
F即为根据相似度权值确定的医院门诊结算单的风险值,T1表示对应的风险常数。
可见,在本发明实施例中,通过医院门诊结算单的药品相似度或单据信息相似度确定医院门诊结算单的相似度,然后根据医院门诊结算单的相似度确定其对应的风险值,可以全面考虑医院门诊结算单的相关内容的相似度,并深层次挖掘出医院门诊结算单存在造假的内容。根据挖掘出的造假内容获取医院门诊结算单的风险值,能够提高获得的风险值的准确度。
103、当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
获得相似度大于预设阈值的门诊结算单的风险值后,如果该风险值超过了预设风险阈值,说明该医院门诊结算单为风险结算单,不通过对该风险结算单的报销。后续可以对该风险结算单进行继续调查和核实。
此外,在当确定医院门诊结算单的风险值大于预设风险阈值时之前,该方法还包括:将根据相似度权值确定的医院门诊结算单的风险值设为第一风险值;将医院门诊结算单中的药品与药品数据库进行匹配,得到医院门诊结算单与药品数据库的匹配成功率,并为匹配成功率小于预设匹配度阈值的医院门诊结算单设置匹配度权值;根据匹配度权值确定匹配成功率小于预设匹配度阈值的医院门诊结算单的风险值,将风险值设为第二风险值;对第一风险值和第二风险值求和,确定医院门诊结算单的风险值。
具体地,对于风险结算单的判断标准,除了医院门诊结算单之间相似度太高之外,还有可能是医院门诊结算单上的药品性质不符合要求,例如药品不是处方药,且药品与病人的诊断症状并不匹配等。那么,首先获取医院门诊结算单中的药品与药品数据库的匹配关系,匹配关系根据关键字匹配获得;然后为与药品数据库匹配成功率小于预设匹配度阈值的医院门诊结算单设置匹配度权值。例如匹配度权值为γ,所有与药品数据库匹配成功率小于预设匹配度阈值的医院门诊结算单的权值都为γ,γ可以根据所有与药品数据库匹配成功率小于预设匹配度阈值的医院门诊结算单与药品数据库匹配成功率的平均值或中位数等方式获取。那么最后可得医院门诊结算单的风险值为:
Figure BDA0001838239350000101
其中f表示医院门诊结算单的风险值,f1表示根据相似度获得的第一风险值,f2表示根据匹配成功率获得的第二风险值;当医院门诊结算单中的药品与药品数据库的匹配成功率小于预设匹配度阈值时,S3=1,否者S3=0.T2表示第二风险值对应的风险常数,T2与T1可以相等,也可以不相等。如果认为药品与药品数据库相匹配的重要程度高于医院门诊结算单之间的相似度,则设置T2>T1。
可选的,将医院门诊结算单中的药品与药品数据库进行匹配具体包括:根据医院门诊结算单中的药品从药品数据库中获取与药品对应的适用症状;将适用症状与医院门诊结算单中的病人的诊断症状进行匹配,得到医院门诊结算单与药品数据库的匹配成功率。
具体地,医院的医生开具的药品的适用症状必须要与病人的诊断症状相匹配,否者医院门诊结算单上的药品就有可能是为了增加医保报销药品,同时减少自费药品而进行的造假。因此,首先对药品根据适用症状进行分类并建立数据库,然后将医院门诊结算单中的药品与药品数据库中的药品进行匹配,获得门诊结算单中的药品的适用症状,最后将适用症状与病人实际的诊断症状进行匹配,获得匹配成功率。
可见,通过医院门诊结算单上的药品性质是否符合要求的判断,获取另一个影响医院门诊结算单风险值的因素,能够更全面地挖掘医院门诊结算单所包含的造假内容,进而获得更准确的医院门诊结算单风险值。
可选的,在确定医院门诊结算单为风险结算单后,该方法还包括:获取风险结算单的据面信息,据面信息包括药品数量和药品种类、医院相关信息和病人相关信息;获取另一批需要报销的医院门诊结算单的据面信息,并将另一批需要报销的医院门诊结算单的据面信息与风险结算单的据面信息进行匹配,获得结算单相似度;当结算单相似度大于第二预设阈值时,确定另一批需要报销的住院结算单为风险结算单,不通过对风险结算单的报销。
即直接将还没判定风险值的医院门诊结算单与已经确定判定结果的风险结算单进行匹配,若两者的相似度大于预设阈值时,则确定还没判定风险值的医院门诊结算单为风险结算单。
可见,在本发明实施例中,电子设备首先获取需要报销的多张医院门诊结算单;然后检测多张医院门诊结算单的相似度,并根据多张医院门诊结算单的相似度获取医院门诊结算单的风险值;最后当确定医院门诊结算单的风险值大于预设风险阈值时,设置医院门诊结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对多张医院门诊结算单相似度的计算,确定医院门诊结算单存在伪造的可能性,进而确定医院门诊结算单的风险值,而当医院门诊结算单的风险值大于预设阈值时,确定医院门诊结算单为风险结算单并不予以报销。这个过程能够对医院门诊结算单进行快速筛查,提升发现违规医院门诊结算单的效率,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
请参阅图2,图2是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图,如图所示,本实施例中的基于数据处理的风险检测方法包括:
201、获取需要报销的多张医院门诊结算单;
202、获取所述多张医院门诊结算单的药品数量和药品种类;
203、将所述药品数量和所述药品种类作为所述医院门诊结算单的特征值,对所述医院门诊结算单进行药品相似度聚类,获得多个药品相似度类簇,并确定同一药品相似度类簇中医院门诊结算单之间的药品平均相似度;
204、获取所述药品平均相似度作为所述同一药品相似度类簇中医院门诊结算单的相似度;
205、获取所述多张医院门诊结算单对应的医院相关信息,包括医院名称、科室以及开单医生标识;
206、获取所述多张医院门诊结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;
207、将所述医院相关信息和所述病人相关信息作为所述门诊结算单的特征值对所述医院门诊结算单进行单据相似度聚类,并确定同一单据相似度类簇中医院门诊结算单之间的单据平均相似度;
208、获取所述单据平均相似度作为所述同一单据相似度类簇中医院门诊结算单的相似度;
209、若确定所述药品相似度类簇和所述单据相似度类簇中的医院门诊结算单数量大于第一预设阈值,则将所述药品相似度类簇设置为第一目标类簇,将所述单据相似度类簇设置为第二目标类簇;
210、根据所述药品平均相似度为所述第一目标类簇中的医院门诊结算单设置第一子权值;
211、根据所述单据平均相似度为所述第二目标类簇中的医院门诊结算单设置第二子权值;
212、根据所述第一子权值和所述第二子权值之和确定所述医院门诊结算单的相似度权值,并根据所述相似度权值确定所述医院门诊结算单的风险值;
213、当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
其中,步骤202~步骤204和步骤205~步骤208为并列的两种确定医院门诊结算单相似度权值的方法,不存在先后顺序。
在本发明实施例中,通过医院门诊结算单的药品相似度和单据相似度,确定医院门诊结算单的相似度,并根据医院门诊结算单的相似度确定其对应的风险值,当医院门诊结算单的风险值大于风险预设风险阈值时,设置该医院门诊结算单为风险结算单,且不通过对该风险结算单的报销。这个过程提升了获取医院门诊结算单的准确率,进一步提高了获取的医院门诊结算单风险值的准确率,使得对于风险结算单的判断更加准确,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
请参阅图3,图3是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图,如图所示,本实施例中的基于数据处理的风险检测方法包括:
301、获取需要报销的多张医院门诊结算单;
302、检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
303、将根据所述相似度权值确定的医院门诊结算单的风险值设为第一风险值;
304、将所述医院门诊结算单中的药品与药品数据库进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率,并为所述匹配成功率小于预设匹配度阈值的医院门诊结算单设置匹配度权值;
305、根据所述匹配度权值确定所述匹配成功率小于预设匹配度阈值的医院门诊结算单的风险值,将所述风险值设为第二风险值;
306、对所述第一风险值和所述第二风险值求和,确定所述医院门诊结算单的风险值;
307、当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
在本发明实施例中,通过医院门诊结算单的相似度和医院门诊结算单中的药品与药品数据库的匹配关系,确定医院门诊结算单的风险值,当确定当医院门诊结算单的风险值大于风险预设风险阈值时,设置该医院门诊结算单为风险结算单,且不通过对该风险结算单的报销。这个过程提升了获取医院门诊结算单的准确率,进一步提高了获取的医院门诊结算单风险值的准确率,使得对于风险结算单的判断更加准确,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
请参阅图4,图4是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图,如图所示,本实施例中的基于数据处理的风险检测方法包括:
401、获取需要报销的多张医院门诊结算单;
402、检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
403、当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单;
404、获取所述风险结算单的据面信息,所述据面信息包括所述药品数量和药品种类、所述医院相关信息和所述病人相关信息;
405、获取另一批需要报销的医院门诊结算单的据面信息,并将所述另一批需要报销的医院门诊结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;
406、当所述结算单相似度大于第二预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。
可见,在本发明实施例中,当确定一些医院门诊结算单为风险结算单后,其他需要报销的医院门诊结算单可以根据与风险结算单的相似度确定是否也为风险结算单。这种方法能够快速确定需要报销的医院门诊结算单是否为风险结算单,提升判断效率,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
图5是本发明实施例提供的一种电子装置的结构示意图,如图5所示,该电子装置包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:
获取需要报销的多张医院门诊结算单;
检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
可以看出,在本发明实施例中,电子设备首先获取需要报销的多张医院门诊结算单;然后检测多张医院门诊结算单的相似度,并根据多张医院门诊结算单的相似度获取医院门诊结算单的风险值;最后当确定医院门诊结算单的风险值大于预设风险阈值时,设置医院门诊结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对多张医院门诊结算单相似度的计算,确定医院门诊结算单存在伪造的可能性,进而确定医院门诊结算单的风险值,而当医院门诊结算单的风险值大于预设阈值时,确定医院门诊结算单为风险结算单并不予以报销。这个过程能够对医院门诊结算单进行快速筛查,提升发现违规医院门诊结算单的效率和准确率,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
在一个可能的示例中,所述多张医院门诊结算单的相似度包括药品相似度,在检测所述多张医院门诊结算单的相似度方面,所述程序包括用于执行以下步骤的指令:
获取所述多张医院门诊结算单的药品数量和药品种类;
将所述药品数量和所述药品种类作为所述医院门诊结算单的特征值,对所述医院门诊结算单进行药品相似度聚类,获得多个药品相似度类簇,并确定同一药品相似度类簇中医院门诊结算单之间的药品平均相似度;
获取所述药品平均相似度作为所述同一药品相似度类簇中医院门诊结算单的相似度。
在一个可能的示例中,所述多张医院门诊结算单的相似度包括单据相似度,在检测所述多张医院门诊结算单的相似度方面,所述程序包括用于执行以下步骤的指令:
获取所述多张医院门诊结算单对应的医院相关信息,包括医院名称、科室以及开单医生标识;
获取所述多张医院门诊结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;
将所述医院相关信息和所述病人相关信息作为所述门诊结算单的特征值对所述医院门诊结算单进行单据相似度聚类,并确定同一单据相似度类簇中医院门诊结算单之间的单据平均相似度;
获取所述单据平均相似度作为所述同一单据相似度类簇中医院门诊结算单的相似度。
在一个可能的示例中,在所述根据所述多张医院门诊结算单的相似度确定所述医院门诊结算单的风险值方面,所述程序包括用于执行以下步骤的指令:
若确定所述药品相似度类簇和所述单据相似度类簇中的医院门诊结算单数量大于第一预设阈值,则将所述药品相似度类簇设置为第一目标类簇,将所述单据相似度类簇设置为第二目标类簇;
根据所述药品平均相似度为所述第一目标类簇中的医院门诊结算单设置第一子权值;
根据所述单据平均相似度为所述第二目标类簇中的医院门诊结算单设置第二子权值;
根据所述第一子权值和所述第二子权值之和确定所述医院门诊结算单的相似度权值,并根据所述相似度权值确定所述医院门诊结算单的风险值。
在一个可能的示例中,在所述当确定所述医院门诊结算单的风险值大于预设风险阈值时之前,所述程序包括用于执行以下步骤的指令:
将根据所述相似度权值确定的医院门诊结算单的风险值设为第一风险值;
将所述医院门诊结算单中的药品与药品数据库进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率,并为所述匹配成功率小于预设匹配度阈值的医院门诊结算单设置匹配度权值;
根据所述匹配度权值确定所述匹配成功率小于预设匹配度阈值的医院门诊结算单的风险值,将所述风险值设为第二风险值;
对所述第一风险值和所述第二风险值求和,确定所述医院门诊结算单的风险值。
在一个可能的示例中,所述将所述医院门诊结算单中的药品与药品数据库进行匹配具体包括:
根据所述医院门诊结算单中的药品从所述药品数据库中获取与所述药品对应的适用症状;
将所述适用症状与所述医院门诊结算单中的病人的诊断症状进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率。
在一个可能的示例中,所述程序包还括用于执行以下步骤的指令:
获取所述风险结算单的据面信息,所述据面信息包括所述药品数量和药品种类、所述医院相关信息和所述病人相关信息;
获取另一批需要报销的医院门诊结算单的据面信息,并将所述另一批需要报销的医院门诊结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;
当所述结算单相似度大于第二预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。
图6是本发明实施例中所涉及的风险检测装置600的功能单元组成框图。该风险检测装置600应用于电子装置,所述风险检测装置包括:
获取单元601,用于获取需要报销的多张医院门诊结算单;
检测单元602,用于检测所述多张医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
确定单元603,用于当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
在此需要说明的是,上述获取单元601、检测单元602和确定单元603的具体工作过程参见上述步骤101-103的相关描述。在此不再赘述。
可以看出,在本发明实施例中,电子设备首先获取需要报销的多张医院门诊结算单;然后检测多张医院门诊结算单的相似度,并根据多张医院门诊结算单的相似度获取医院门诊结算单的风险值;最后当确定医院门诊结算单的风险值大于预设风险阈值时,设置医院门诊结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对多张医院门诊结算单相似度的计算,确定医院门诊结算单存在伪造的可能性,进而确定医院门诊结算单的风险值,而当医院门诊结算单的风险值大于预设阈值时,确定医院门诊结算单为风险结算单并不予以报销。这个过程能够对医院门诊结算单进行快速筛查,提升发现违规医院门诊结算单的效率和准确率,减少对违规医院门诊结算单的通过率,对医保报销过程的规范化发挥积极作用。
在可选情况下,所述多张医院门诊结算单的相似度包括药品相似度,在检测所述多张医院门诊结算单的相似度方面,所述检测单元602具体用于:
获取所述多张医院门诊结算单的药品数量和药品种类;
将所述药品数量和所述药品种类作为所述医院门诊结算单的特征值,对所述医院门诊结算单进行药品相似度聚类,获得多个药品相似度类簇,并确定同一药品相似度类簇中医院门诊结算单之间的药品平均相似度;
获取所述药品平均相似度作为所述同一药品相似度类簇中医院门诊结算单的相似度。
在可选情况下,所述多张医院门诊结算单的相似度包括单据相似度,在检测所述多张医院门诊结算单的相似度方面,所述检测单元602具体用于:
获取所述多张医院门诊结算单对应的医院相关信息,包括医院名称、科室以及开单医生标识;获取所述多张医院门诊结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;将所述医院相关信息和所述病人相关信息作为所述门诊结算单的特征值对所述医院门诊结算单进行单据相似度聚类,并确定同一单据相似度类簇中医院门诊结算单之间的单据平均相似度;获取所述单据平均相似度作为所述同一单据相似度类簇中医院门诊结算单的相似度。
在可选情况下,在根据所述多张医院门诊结算单的相似度确定所述医院门诊结算单的风险值方面,所述检测单元602具体用于:
若确定所述药品相似度类簇和所述单据相似度类簇中的医院门诊结算单数量大于第一预设阈值,则将所述药品相似度类簇设置为第一目标类簇,将所述单据相似度类簇设置为第二目标类簇;根据所述药品平均相似度为所述第一目标类簇中的医院门诊结算单设置第一子权值;根据所述单据平均相似度为所述第二目标类簇中的医院门诊结算单设置第二子权值;根据所述第一子权值和所述第二子权值之和确定所述医院门诊结算单的相似度权值,并根据所述相似度权值确定所述医院门诊结算单的风险值。
在可选情况下,所述风险检测装置还包括匹配单元604,在当确定所述医院门诊结算单的风险值大于预设风险阈值时之前,所述匹配单元604具体用于:
将根据所述相似度权值确定的医院门诊结算单的风险值设为第一风险值;
将所述医院门诊结算单中的药品与药品数据库进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率,并为所述匹配成功率小于预设匹配度阈值的医院门诊结算单设置匹配度权值;
根据所述匹配度权值确定所述匹配成功率小于预设匹配度阈值的医院门诊结算单的风险值,将所述风险值设为第二风险值;
对所述第一风险值和所述第二风险值求和,确定所述医院门诊结算单的风险值。
在可选情况下,在将所述医院门诊结算单中的药品与药品数据库进行匹配方面,所述匹配单元604还具体用于:
根据所述医院门诊结算单中的药品从所述药品数据库中获取与所述药品对应的适用症状;
将所述适用症状与所述医院门诊结算单中的病人的诊断症状进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率。
在可选情况下,所述确定单元603还具体用于:
获取所述风险结算单的据面信息,所述据面信息包括所述药品数量和药品种类、所述医院相关信息和所述病人相关信息;
获取另一批需要报销的医院门诊结算单的据面信息,并将所述另一批需要报销的医院门诊结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;
当所述结算单相似度大于第二预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括移动终端。
本发明实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括移动终端。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种基于数据处理的风险检测方法,其特征在于,所述方法包括:
获取需要报销的多张医院门诊结算单;
检测所述多张医院门诊结算单的相似度,包括:获取所述多张医院门诊结算单的药品数量和药品种类;将所述药品数量和所述药品种类作为所述医院门诊结算单的特征值,对所述医院门诊结算单进行药品相似度聚类,获得多个药品相似度类簇,并确定同一药品相似度类簇中医院门诊结算单之间的药品平均相似度;获取所述药品平均相似度作为所述同一药品相似度类簇中医院门诊结算单的相似度,或者,获取所述多张医院门诊结算单对应的医院相关信息,包括医院名称、科室以及开单医生标识;获取所述多张医院门诊结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;将所述医院相关信息和所述病人相关信息作为所述门诊结算单的特征值对所述医院门诊结算单进行单据相似度聚类,并确定同一单据相似度类簇中医院门诊结算单之间的单据平均相似度;获取所述单据平均相似度作为所述同一单据相似度类簇中医院门诊结算单的相似度;并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多张医院门诊结算单的相似度确定所述医院门诊结算单的风险值,包括:
若确定所述药品相似度类簇和所述单据相似度类簇中的医院门诊结算单数量大于第一预设阈值,则将所述药品相似度类簇设置为第一目标类簇,将所述单据相似度类簇设置为第二目标类簇;
根据所述药品平均相似度为所述第一目标类簇中的医院门诊结算单设置第一子权值;
根据所述单据平均相似度为所述第二目标类簇中的医院门诊结算单设置第二子权值;
根据所述第一子权值和所述第二子权值之和确定所述医院门诊结算单的相似度权值,并根据所述相似度权值确定所述医院门诊结算单的风险值。
3.根据权利要求2所述的方法,其特征在于,在所述当确定所述医院门诊结算单的风险值大于预设风险阈值时之前,所述方法还包括:
将根据所述相似度权值确定的医院门诊结算单的风险值设为第一风险值;
将所述医院门诊结算单中的药品与药品数据库进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率,并为所述匹配成功率小于预设匹配度阈值的医院门诊结算单设置匹配度权值;
根据所述匹配度权值确定所述匹配成功率小于预设匹配度阈值的医院门诊结算单的风险值,将所述风险值设为第二风险值;
对所述第一风险值和所述第二风险值求和,确定所述医院门诊结算单的风险值。
4.根据权利要求3所述的方法,其特征在于,所述将所述医院门诊结算单中的药品与药品数据库进行匹配具体包括:
根据所述医院门诊结算单中的药品从所述药品数据库中获取与所述药品对应的适用症状;
将所述适用症状与所述医院门诊结算单中的病人的诊断症状进行匹配,得到所述医院门诊结算单与所述药品数据库的匹配成功率。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
获取所述风险结算单的据面信息,所述据面信息包括所述药品数量和药品种类、所述医院相关信息和所述病人相关信息;
获取另一批需要报销的医院门诊结算单的据面信息,并将所述另一批需要报销的医院门诊结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;
当所述结算单相似度大于第二预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。
6.一种风险检测装置,其特征在于,所述风险检测装置包括:
获取单元,用于获取需要报销的多张医院门诊结算单;
检测单元,用于检测所述多张医院门诊结算单的相似度,具体用于:获取所述多张医院门诊结算单的药品数量和药品种类;将所述药品数量和所述药品种类作为所述医院门诊结算单的特征值,对所述医院门诊结算单进行药品相似度聚类,获得多个药品相似度类簇,并确定同一药品相似度类簇中医院门诊结算单之间的药品平均相似度;获取所述药品平均相似度作为所述同一药品相似度类簇中医院门诊结算单的相似度,或者,获取所述多张医院门诊结算单对应的医院相关信息,包括医院名称、科室以及开单医生标识;获取所述多张医院门诊结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;将所述医院相关信息和所述病人相关信息作为所述门诊结算单的特征值对所述医院门诊结算单进行单据相似度聚类,并确定同一单据相似度类簇中医院门诊结算单之间的单据平均相似度;获取所述单据平均相似度作为所述同一单据相似度类簇中医院门诊结算单的相似度,并根据所述多张医院门诊结算单的相似度获取所述医院门诊结算单的风险值;
确定单元,用于当确定所述医院门诊结算单的风险值大于预设风险阈值时,设置所述医院门诊结算单为风险结算单,不通过对所述风险结算单的报销。
7.一种电子装置,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1-5任一方法中的步骤的指令。
8.一种计算机可读存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行权利要求1-5中任一方法所述的步骤的指令。
CN201811236334.3A 2018-10-23 2018-10-23 一种基于数据处理的风险检测方法、装置及存储介质 Active CN109523394B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811236334.3A CN109523394B (zh) 2018-10-23 2018-10-23 一种基于数据处理的风险检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811236334.3A CN109523394B (zh) 2018-10-23 2018-10-23 一种基于数据处理的风险检测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN109523394A CN109523394A (zh) 2019-03-26
CN109523394B true CN109523394B (zh) 2023-06-23

Family

ID=65772330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811236334.3A Active CN109523394B (zh) 2018-10-23 2018-10-23 一种基于数据处理的风险检测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN109523394B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985837A (zh) * 2020-08-31 2020-11-24 平安医疗健康管理股份有限公司 基于层次聚类的风险分析方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016122664A1 (en) * 2015-01-30 2016-08-04 Justin Domesek Method and system for prescribing and determining risk associated with medications
CN106530166A (zh) * 2016-08-31 2017-03-22 中国人民解放军总医院第附属医院 医院医保费用防拒付辅助管理信息系统及防拒付方法
CN107273709A (zh) * 2017-07-31 2017-10-20 惠州市格农科技有限公司 基于计算机的医院病人资料处理方法
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016122664A1 (en) * 2015-01-30 2016-08-04 Justin Domesek Method and system for prescribing and determining risk associated with medications
CN106530166A (zh) * 2016-08-31 2017-03-22 中国人民解放军总医院第附属医院 医院医保费用防拒付辅助管理信息系统及防拒付方法
CN107273709A (zh) * 2017-07-31 2017-10-20 惠州市格农科技有限公司 基于计算机的医院病人资料处理方法
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN109523394A (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
Kallus et al. Assessing algorithmic fairness with unobserved protected class using data combination
Van Capelleveen et al. Outlier detection in healthcare fraud: A case study in the Medicaid dental domain
Gaitonde et al. Interventions to reduce corruption in the health sector
US10942956B2 (en) Detecting medical fraud and medical misuse using a shared virtual ledger
CN103843030B (zh) 用于从多个来源产生保健相关经验证预测模型的方法
US8768724B2 (en) System and method for detecting drug fraud and abuse
CN110504035B (zh) 医疗资料库及系统
Shin et al. A scoring model to detect abusive billing patterns in health insurance claims
WO2020082788A1 (zh) 一种医疗数据处理方法、装置、设备及存储介质
Rudmik et al. Geographic variation of endoscopic sinus surgery in the United States
US20190326010A1 (en) Medical claims lead summary report generation
Gibson et al. Relationship between disease severity, quality of life and health‐care resource use in a cross‐section of Australian patients with Crohn's disease
US10318710B2 (en) System and method for identifying healthcare fraud
Filipp et al. Characterization of adult obesity in Florida using the OneFlorida clinical research consortium
Ballreich et al. Medicare spending on drugs with accelerated approval
CN109523394B (zh) 一种基于数据处理的风险检测方法、装置及存储介质
Ai et al. A systematic review and qualitative assessment of fraud detection methodologies in health care
Yange A Fraud Detection System for Health Insurance in Nigeria
US9633396B2 (en) Systems and methods for preventing fraud
CN109508869B (zh) 一种基于数据处理的风险检测方法和装置
US20230306504A1 (en) Machine learning for activity monitoring and validity identification
US20160267230A1 (en) Touchless processing
Lin et al. Linking cancer registry and hospital discharge data for treatment surveillance
CN109545312B (zh) 一种药店结算单风险检测方法和装置
Baser et al. Use of Open Claims vs Closed Claims in Health Outcomes Research

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant