CN112102098B - 数据处理方法、装置、电子设备及存储介质 - Google Patents
数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112102098B CN112102098B CN202010808940.9A CN202010808940A CN112102098B CN 112102098 B CN112102098 B CN 112102098B CN 202010808940 A CN202010808940 A CN 202010808940A CN 112102098 B CN112102098 B CN 112102098B
- Authority
- CN
- China
- Prior art keywords
- money
- similarity
- medical
- deduction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 189
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000004590 computer program Methods 0.000 claims description 11
- 230000004048 modification Effects 0.000 claims description 11
- 238000012986 modification Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 10
- 238000012550 audit Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 10
- 239000003814 drug Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请提供的一种数据处理方法、装置、电子设备及存储介质,应用于数据处理技术领域,所述方法包括:获取待处理的医疗费用数据;将医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将医疗费用数据的款项中与记忆库中二级异常款项和合规款项的第二相似度小于第一相似度阈值的款项作为未知款项;将未知款项中与标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,第二相似度阈值小于第一相似度阈值;根据第一扣减款项和第二扣减款项对医疗费用数据进行费用扣减。本方案不仅节省了医疗费用数据扣减所需的人力成本,而且提高了医疗费用数据扣减的效率。
Description
技术领域
本申请属于数据处理技术领域,特别是涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
随着信息化技术的普及,保险公司已可与医院之间进行信息对接,在用户需要通过保险报销医疗费用时,保险公司可以线上从医院获取用户的各种医疗费用数据来为用户进行理赔,无需用户自行整理繁多的医疗费用文件和票据去找保险公司理赔。
虽然保险公司和医院之间可以灵活交互用户的医疗费用数据,但是若需完成理赔还需要对医疗费用数据中的不合理收费进行扣减,以减少保险公司的理赔开支,这就需要保险公司的理赔人员对医疗费用数据逐一进行审核,不仅需要耗费大量的人力成本,而且对于不合理费用的审核效率低,降低了医疗费用数据扣减的效率。
发明内容
有鉴于此,本申请第一方面提供一种数据处理方法,所述方法包括:
获取待处理的医疗费用数据;
将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项;
将所述未知款项中与所述标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,所述一级异常款项与至少一个所述二级异常款项相关联;
根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
可选的,所述将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项,包括:
获取所述医疗费用数据的款项与所述记忆库中每个二级异常款项的第一相似度,以及所述医疗费用数据的款项与所述记忆库中每个二级异常款项和合规款项的第二相似度;
在所述第一相似度的最大值大于或等于第一相似度阈值的情况下,将所述医疗费用数据的款项作为第一扣减款项;
在所述第二相似度的最大值小于第一相似度阈值的情况下,将所述医疗费用数据的款项作为未知款项;
所述将所述未知款项中与所述标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,包括:
获取所述未知款项与所述标准库中每个一级异常款项的第三相似度;
在所述第三相似度的最大值大于或等于第二相似度阈值的情况下,将所述未知款项作为第二扣减款项。
可选的,在所述获取所述未知款项与所述标准库中每个一级异常款项的第三相似度之后,还包括:
在所述第三相似度的最大值小于第二相似度阈值的情况下,获取所述未知款项的审核结果;
在所述审核结果为异常类型的情况下,将所述未知款项作为第三扣减款项;
根据所述第一扣减款项和所述第三扣减款项对所述医疗费用数据进行费用扣减。
可选的,在所述获取待处理的医疗费用数据之前,还包括:
获取第一样本医疗费用数据;
将所述第一样本医疗费用数据进行同类项合并,得到第二样本医疗费用数据;
获取第二样本医疗费用数据的标注结果;
将标注结果为异常类型的第二样本医疗费用数据作为二级异常款项,并将审核结果为合规类型的第二样本医疗费用数据作为合规款项,得到记忆库;
根据第三相似度阈值对所述二级异常款项进行聚类,得到异常款项集合;
提取所述异常款项集合的关键词;
将所述关键词作为与所述异常款项集合中二级异常款项相关联的一级异常款项,得到标准库。
可选的,在所述将所述异常款项集合相对应的关键词作为一级异常款项,得到标准库之后,还包括:
接收对于所述标准库的一级异常款项中目标款项的修改输入;
将所述目标款项从所述标准库的一级异常款项中移除;
将所述记忆库中与所述目标款项相关联的二级异常款项,变更为合规款项。
可选的,在所述根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减之后,还包括:
对扣减后的医疗费用数据标注扣减说明信息,得到医疗费用扣减明细;
显示所述医疗费用扣减明细。
可选的,在所述获取待处理的医疗费用数据之前,还包括:
接收医疗费用扣减请求,所述医疗费用扣减请求至少包括:医疗案件标识;
所述获取待处理的医疗费用数据,包括:
从所述医疗案件标识所指示医院的数据库,获取医疗明细费用以及出院总费用;
在所述医疗明细费用之和与所述出院总费用间的差额小于差额阈值的情况下,将所述医疗明细费用作为待处理的医疗费用数据。
依据本申请第二方面,提供一种数据处理装置,所述装置包括:
获取模块,用于获取待处理的医疗费用数据;
第一处理模块,用于将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项;
第二处理模块,用于将所述未知款项中与所述标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,所述一级异常款项与至少一个所述二级异常款项相关联;
扣减模块,用于根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
可选的,所述第一处理模块,还用于:
获取所述医疗费用数据的款项与所述记忆库中每个二级异常款项的第一相似度,以及所述医疗费用数据的款项与所述记忆库中每个二级异常款项和合规款项的第二相似度;
在所述第一相似度的最大值大于或等于第一相似度阈值的情况下,将所述医疗费用数据的款项作为第一扣减款项;
在所述第二相似度的最大值小于第一相似度阈值的情况下,将所述医疗费用数据的款项作为未知款项;
所述第二处理模块,包括:
获取所述未知款项与所述标准库中每个一级异常款项的第三相似度;
在所述第三相似度的最大值大于或等于第二相似度阈值的情况下,将所述未知款项作为第二扣减款项。
可选的,所述第一处理模块,还用于:
在所述第三相似度的最大值小于第二相似度阈值的情况下,获取所述未知款项的审核结果;
在所述审核结果为异常类型的情况下,将所述未知款项作为第三扣减款项;
根据所述第一扣减款项和所述第三扣减款项对所述医疗费用数据进行费用扣减。
可选的,所述装置,还包括:
预先生成模块,用于:
获取第一样本医疗费用数据;
将所述第一样本医疗费用数据进行同类项合并,得到第二样本医疗费用数据;
获取第二样本医疗费用数据的标注结果;
将标注结果为异常类型的第二样本医疗费用数据作为二级异常款项,并将审核结果为合规类型的第二样本医疗费用数据作为合规款项,得到记忆库;
根据第三相似度阈值对所述二级异常款项进行聚类,得到异常款项集合;
提取所述异常款项集合的关键词;
将所述关键词作为与所述异常款项集合中二级异常款项相关联的一级异常款项,得到标准库。
可选的,所述装置,还包括:
修改模块,用于:
接收对于所述标准库的一级异常款项中目标款项的修改输入;
将所述目标款项从所述标准库的一级异常款项中移除;
将所述记忆库中与所述目标款项相关联的二级异常款项,变更为合规款项。
可选的,所述装置,还包括:
显示模块,用于:
对扣减后的医疗费用数据标注扣减说明信息,得到医疗费用扣减明细;
显示所述医疗费用扣减明细。
可选的,所述获取模块,还用于:
接收医疗费用扣减请求,所述医疗费用扣减请求至少包括:医疗案件标识;
从所述医疗案件标识所指示医院的数据库,获取医疗明细费用以及出院总费用;
在所述医疗明细费用之和与所述出院总费用间的差额小于差额阈值的情况下,将所述医疗明细费用作为待处理的医疗费用数据。
依据本申请第三方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一所述的数据处理方法。
依据本申请第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述的数据处理方法。
针对现有技术,本申请具备如下优点:
本申请提供的一种数据处理方法、装置、电子设备及存储介质,本方案通过先将医疗费用数据中的款项记忆库中的二级异常款项和合规款项进行高相似度匹配,确定第一扣减款项,然后将未匹配到的未知款项与所有医院的标准库中的一级异常款项进行低相似度匹配,确定第二扣减款项,最后再通过第一扣减款项和第二扣减款项对医疗费用数据进行扣减,不仅节省了医疗费用数据扣减所需的人力成本,而且提高了医疗费用数据扣减的效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本申请实施例提供的一种数据处理方法的步骤流程图;
图2是本申请实施例提供的另一种数据处理方法的步骤流程图;
图3是本申请实施例提供的一种数据处理方法的效果示意图之一;
图4是本申请实施例提供的一种数据处理方法的效果示意图之二;
图5是本申请实施例提供的一种医疗费的预处理方法的步骤流程图;
图6是本申请实施例提供的一种数据处理方法的效果示意图之三;
图7是本申请实施例提供的一种数据处理装置的结构框图;
图8是本申请实施例提供的一种电子设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
图1是本申请实施例提供的一种数据处理方法的步骤流程图,所述方法包括:
步骤101,获取待处理的医疗费用数据。
在本申请实施例中,待处理的医疗费用数据是指用户在医院治疗期间所产生的药物、住院、人工等费用数据,通常医疗费用数据中包含有款项名称和款项数额。
在用户在医院治疗结束后,可通过保险公司的客户端来对医疗费用进行理赔赔付,此时保险公司的后台服务器将通过与医院的数据库获取该用户在治疗期间的医疗费用数据。但是为避免医疗费用数据中可能存储一些不合理费用,若直接依据获取到的待处理的医疗费用数据进行理赔赔付,将会给保险公司带来额外的费用支出,因此需要对医疗费用数据中的不合理收费的款项进行识别和扣减。需要说明的是,保险公司的后台服务器预先与i个医院的数据库建立通信连接,可直接从这i个医院中第j个医院的数据库提取医疗费用数据,其中i、j为正整数,i≥j。
步骤102,将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项。
在本申请实施例中,记忆库包括所连接所有医院的二级异常款项和合规款项,二级异常款项是指医院的不合理收费的异常款项的原名称,可以理解对于不同的医院,同一收费事项的款项名称可能不同,因此记忆库中由于存储有不同医院的二级异常款项,因此对于同一收费事项可能存在多个相对应的二级异常款项。合规款项是指所连接医院中合理收费款项,记忆库中的合规款项和记忆库中的二级异常款项同理,对于同一收费事项也可能存在多个医院的不同合规款项。每个医院相对应有唯一的记忆库。第一相似度是医疗费用数据的款项与二级异常款项之间的相似度,第二相似度是医疗费用数据的款项与二级异常款项、合规款项之间的相似度。第一相似度阈值是指医疗费用数据的款项与记忆库中的款项相匹配的最大相似度,具体可以根据实际需求确定,此处不做限定。
在实际应用中,该记忆库用于直接对医疗费用数据中的款项进行查询,因此该第一相似度阈值可以为100%。通过将医疗费用数据中的款项名称与记忆库中的款项名称进行相似度比对,可以得到包括于二级异常款项的第一扣减款项,以及不包括于异常款项和合规款项的未知款项。可以理解,与二级异常款项相匹配的第一扣减款项可以确定为医院的不合理收费款项,而由于医院会不定期新增款项名称和变更款项名称,因此可能会出现一些不包括于二级异常款项和合规款项的未知款项,仍需进一步判断其是否为不合理收费款项并进行扣减。
当然,如果医疗费用数据中的款项与记忆库中的款项之间的相似度均大于等于该第一相似度阈值,则不存在未知款项,那么直接根据所得到的第一扣减款项对医疗费用数据进行扣减即可。
步骤103,将所述未知款项中与所述标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,所述一级异常款项与至少一个所述二级异常款项相关联。
在本申请实施例中,标准库包括所连接的医院的一级异常款项,也就是预先通过将所连接的医院的二级异常款项进行汇总,对属于同一收费事项的二级异常款项生成相对应的一级异常款项,从而使得每个收费事项都存在唯一相对应的一级异常款项。
第三相似度是未知款项与一级异常款项之间的相似度。第二相似度阈值是未知款项与标准库中的一级异常款项相匹配的最大相似度,该第二相似度阈值可以大于第一相似度阈值,例如在第一相似度阈值为100%的情况下,该第二相似度阈值可以为70%、80%、90%等,具体可以根据实际需求确定,此处不做限定。
由于通过相对于第二相似度阈值更高的第一相似度阈值无法在记忆库中查询到未知款项,因此可以通过包含有所有医院的一级异常款项的标准库,采用相对第一相似度阈值更小的第二相似度阈值来提高搜索能力,从而确定该未知款项是否为不合理收费。具体的,由于记忆库中属于同一收费事项的款项可能重复,因此如果通过较低的第二相似度阈值在记忆库中进行匹配,可能会出现匹配到多个二级异常款项或者同时匹配到二级异常款项和合规款项的情况,使得匹配结果异常,无法准确判断款项是否合理。因此在采用更小的第二相似度阈值进行匹配需要在对于同一收费事项设置有唯一一级异常款项的标准库中进行相似度匹配,避免了匹配结果异常的情况,从而可以保证所匹配结果的准确性。
将与标准库中的一级异常款项之间的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项。
步骤104,根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
在本申请实施例中,通过将所得到的第一扣减款项和第二扣减款项的款项名称对医疗费用数据中相对应的款项名称进行剔除,以及款项数额扣减第一扣减款项和第二扣减款项的数额,从而可以得到扣减不合理收费后的医疗费用数据。
本申请提供的一种数据处理方法,通过先将医疗费用数据中的款项记忆库中的二级异常款项和合规款项进行高相似度匹配,确定第一扣减款项,然后将未匹配到的未知款项与所有医院的标准库中的一级异常款项进行低相似度匹配,确定第二扣减款项,最后再通过第一扣减款项和第二扣减款项对医疗费用数据进行扣减,不仅节省了医疗费用数据扣减所需的人力成本,而且提高了医疗费用数据扣减的效率。
图2是本申请实施例提供的另一种数据处理方法的步骤流程图,所述方法包括:
步骤201,接收医疗费用扣减请求,所述医疗费用扣减请求至少包括:医疗案件标识。
在本申请实施例中,医疗费用扣减请求是用户通过保险公司的客户端发送的携带有医疗案件标识请求。医疗案件标识可以是用户的医疗案件编号。
用户在办理住院结算时,可以通过保险公司设置在医院的客户端输入医疗案件编号发起结算,查询其在治疗期间所产生的医疗费用数据,选取扣减不合理费用审核的功能选项,通过客户端向服务器发送该医疗费用扣减请求。
步骤202,从所述医疗案件标识所指示医院的数据库,获取医疗明细费用以及出院总费用。
在本申请实施例中,医疗明细费用是指用户在治疗期间所产生的各项收费款项,出院总费用是指医院方核算得到的出院所需结算的费用。通过该医疗案件标识可以通过医院的数据库中查询到用户在治疗期间所产生的医疗明细费用和医院所核算的出院总费用。
步骤203,在所述医疗明细费用之和与所述出院总费用间的差额小于差额阈值的情况下,将所述医疗明细费用作为待处理的医疗费用数据。
在本申请实施例中,差额阈值是指允许医疗明细费用之和与若将用户治疗期间所产生的医疗明细费用之和与医院核算的出院总费用之间的数额。可以理解,若医院核算的出院总费用和医疗明细费用之和间的差额超过该差额阈值,则表明所获取到的医疗明细费用的记录不完整,需要重新进行获取。此时可以通知医院方对该医疗明细费用进行审核,上传准确的医疗明细费用。若差额未超出该差额阈值,则表明获取到的医疗明细费用完整,可以将该医疗明细费用作为后续进行处理的医疗费用数据。
本申请实施例通过将获取到的医疗明细费用之和与医院核算的出院总费用进行比对,保证了所获取到的医疗明细费用的完整性。
步骤204,获取所述医疗费用数据的款项与所述记忆库中每个二级异常款项的第一相似度,以及所述医疗费用数据的款项与所述记忆库中每个二级异常款项和合规款项的第二相似度。
在本申请实施例中,可通过将医疗费用数据中的款项名称与所述记忆库中的款项名称进行文字相似度比对,从而确定医疗费用款项中的款项与记忆库中每个款项的相似度,具体的该相似度包括有医疗费用数据的款项名称与每个二级异常款项的名称之间的第一相似度,以及医疗费用数据的款项名称与每个二级异常款项的名称、每个合规款项的名称的第二相似度。具体的,款项名称之间的相似度比对是通过将款项名称进行分词后提取关键词,从而依据关键词的特征向量获取各款项名称的词义特征,继而将相似度比对的款项名称的词义特征进行对比,获取款项名称之间的相似度。
步骤205,在所述第一相似度的最大值大于或等于第一相似度阈值的情况下,将所述医疗费用数据的款项作为第一扣减款项。
在本申请实施例中,由于款项之间的相似度越高,相互匹配的准确性也越高,因此选用将第n个款项与每个二级异常款项的第一相似度的最大值作为医疗费用数据的款项是否与记忆库中的款项相匹配的依据,具体的将该第一相似度的最大大于或等于第一相似度阈值时,则确定第n个款项为不合理收费的款项,作为第一扣减款项。
步骤206,在所述第二相似度的最大值小于第一相似度阈值的情况下,将所述医疗费用数据的款项作为未知款项。
在本申请实施例中,由于第二相似度是第n个款项与每个二级异常款项、合规款项之间的相似度,因此若第二相似度的最大值小于第一相似度阈值时,可以确定第n个款项与记忆库中的二级异常款项和合规款项均无法匹配,即暂时无法确定是否为不合理收费的款项,将该第n个款项作为未知款项,等待后续步骤进一步判别。
步骤207,获取所述未知款项与所述标准库中每个一级异常款项的第三相似度。
在本申请实施例中,由于通过记忆库已无法判别第m个未知款项,因此进一步引入包括有一级异常款项的标准库进一步进行相似度匹配。获取该第m个未知款项与每个一级异常款项之间的第三相似度,该第三相似度的获取方式可以与步骤204中相似度的获取方式类似,此处不再赘述。
步骤208,在所述第三相似度的最大值大于或等于第二相似度阈值的情况下,将所述未知款项作为第二扣减款项。
在本申请实施例中,与步骤205类似,此处在该第三相似度的最大值大于或等于第二相似度阈值的情况下,则确定第m个未知款项是不合理收费的款项,作为第二扣减款项,只是此处的第二相似度阈值相对于步骤205中的第一相似度阈值更小,这也是考虑都不同医院之间的款项名称之间存在一定差异,更小的相似度阈值可以有效提高相似度匹配的效率。
本申请实施例通过将医疗费用数据的款项先与记忆库中的款项进行较高相似度阈值的相似度匹配,再将未匹配到的未知款项与标准库中的款项进行较低相似度阈值的相似度匹配,从而提高了医疗费用数据中款项查询的效率。
步骤209,根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
该步骤可参照步骤104的详细描述,此处不再赘述。
步骤210,在所述第三相似度的最大值小于第二相似度阈值的情况下,获取所述未知款项的审核结果。
在本申请实施例中,如果未知款项与标准库中每个一级异常款项的第三相似度的最大值小于第二相似度阈值,则可以确定该未知款项之前未所连接的医院使用过的新增款项,无法通过记忆库和标准库来判定该未知款项是否为不合理收费的款项。
进一步的,可以对该未知款项进行标注和突出显示进行输出,交由审核人员进行人工审核或者款项审核模型进行自动审核,从而得到该未知款项的审核结果。该款项审核模型是通过对预先标注有合理款项标签和不合理款项标签的样本款项进行训练得到的。
步骤211,在所述审核结果为异常类型的情况下,将所述未知款项作为第三扣减款项。
在本申请实施例中,异常类型为不合理收费的款项类型。若审核结果为异常类型,则可以确定该第m个未知款项为不合理收费的款项,将其作为后续进行扣减的第三扣减款项。
步骤212,根据所述第一扣减款项和所述第三扣减款项对所述医疗费用数据进行费用扣减。
该步骤与步骤104中的医疗费用数据扣减方式类似,此处不再赘述。
在本申请实施例通过将记忆库和标准库无法匹配的未知款项进行输出进行审核,从而判别该未知款项是否需要扣减,不只局限于在已有的记忆库和标准库的款项进行匹配的方式,使得本方案可以适用于新增医疗费用款项,提高了本方案进行医疗费用扣减的适用性。
步骤213,对扣减后的医疗费用数据标注扣减说明信息,得到医疗费用扣减明细。
在本申请实施例中,扣减说明信息是指对医疗费用进行扣减的第一扣减款项或第二扣减款项或第三扣减款项的原因说明,每个扣减款项的扣减说明信息可以是预先设置的,例如:扣减款项为用户治疗期间外的药品费用,此时该扣减说明信息可以是“治疗期间外额外药品收费”。
步骤214,显示所述医疗费用扣减明细。
示例性的,参照图3,用户可通过输入款项编号或者款项名称来查询医疗费用扣减明细,其中包括有各款项数额、相似度、扣减费用,并且还可查看扣减说明信息来了解扣减费用的扣减原因。
进一步的,参照图4,在获取到医疗费用扣减明细后,可通过向用户展示包含有扣减费用的费用信息给用户确认,用户在确认无误后可通过点击左下方的下一步进行医疗费用结算。
在本申请实施例中,通过给扣减后的医疗费用数据添加扣减说明信息,从而显示给用户查看,使得用户可以直观地了解到医疗费用扣减的详细情况。
可选的,参照图5,在所述步骤201之前,还包括:
步骤221,获取第一样本医疗费用数据。
在本申请实施例中,第一样本医疗费用数据可以是通过整理第j个医院在以往医疗理赔赔付案件中的费用明细数据,当然也可以是第j个医院的医疗理赔案件中的额费用明细数据进行实时获取得到的,还可以是用户自行生成的医疗费用数据,具体可以根据实际需求,此处不做限定。
步骤222,将所述第一样本医疗费用数据进行同类项合并,得到第二样本医疗费用数据。
在本申请实施例中,将第一样本医疗费用数据中的款项名称相同的数据进行合并同类项,得到第二样本医疗费用数据,从而使得多次出现的同一收费事项可以作为一个款项进行处理,减少了后续所需的数据处理量。例如:对于同一位用户在治疗期间多次使用药物A,该药物A按照不同的使用时间被记载为多条医疗费用数据,但其实该多条药物A的医疗费用数据属于同一款项,此时就可以将该药物A的医疗费用数据进行合并同类项,得到关于药物A的一条医疗费用数据。
步骤223,获取第二样本医疗费用数据的标注结果。
在本申请实施例中,标注结果是第二样本医疗费用数据是否合理的标签,具体的,对于合理费用的第二样本医疗费用数据,标注结果为合规类型,对于不合理费用的第二样本医疗费用数据,标注结果为异常类型。该标注结果可以是人工标注的,也可以是通过常规的标签生成模型进行自动标注的,具体可以根据实际需求确定,此处不做限定。
步骤224,将标注结果为异常类型的第二样本医疗费用数据作为二级异常款项,并将审核结果为合规类型的第二样本医疗费用数据作为合规款项,得到记忆库。
在本申请实施例中,通过将第j个医院的合规类型的第二样本医疗费用数据进行汇总,作为合规款项;通过将异常类型的第二样本医疗费用数据进行汇总,作为二级异常款项,然后将合规款项和二级异常款项一起进行存储,得到第j个医院的记忆库。
步骤225,根据第三相似度阈值对所述二级异常款项进行聚类,得到异常款项集合。
在本申请实施例中,将记忆库中的二级异常款项进行文字相似度比对,得到每个二级异常款项之间的相似度,将该相似度大于第三相似度阈值的二级异常款项视为属于同一收费事项,归类到同一异常款项集合。
步骤226,提取所述异常款项集合的关键词。
在本申请实施例中,对于属于同一收费事项的二级异常款项中存在可以描述同一收费事项的关键字,例如:取暖费、暖气费的两个二级异常款项都是属于对于暖气的收费,因此其中的关键字“暖”可以作为关键字。当然具体关键字可以根据实际需求确定,也可以是人工选取的,此处不做限定。
步骤227,将所述关键词作为与所述异常款项集合中二级异常款项相关联的一级异常款项,得到标准库。
在本申请实施例中,将关键字作为一级异常款项,并建立与二级异常款项之间的关联关系,即可得到标准库,也就是说标准库是所连接医院的费用款项是否合理的判别标准。
本申请通过预先根据医院的第一样本医疗费用明细进行结构化存储为标准库和每个医院相对应的记忆库,提高了后续进行医疗费用扣减的效率。
步骤228,接收对于所述标准库的一级异常款项中目标款项的修改输入。
在本申请实施例中,修改输入是对于所述一级异常款项的点击、长按、滑动、功能浮窗、语音、手势等类型的输入,具体可以根据实际需求确定,此处不做限定。
在实际应用中,对于某一收费事项是否合理也是可能发生变化的,因此在收费事项是否合理发生变动时,需要高效地对记忆库和标准库中的相关款项进行变更。
步骤229,将所述目标款项从所述标准库的一级异常款项中移除。
在本申请实施例中,对于同一收费事项的是否合理发生变更时,如果逐个去在记忆库中寻找相对应的多个二级异常款项显然非常繁琐,工作人员不仅得一一搜索,而且可能出现遗漏的情况,因此首先需要从包含有对于同一收费事项只存在唯一一级异常款项的标准库进行修改。
步骤230,将所述记忆库中与所述目标款项相关联的二级异常款项,变更为合规款项。
在本申请实施例中,在为一级异常款项的目标款项被从标准库中移除时,相应的将其在记忆库中相关联的二级异常款项变更为合规款项,从而高效地对标准库和记忆库中的款项属性进行变更。
本申请实施例通过在标准库中对一级异常款项进行移除的同时对其相对应的记忆库中的二级异常款项变更为合规款项,使得记忆库可以随着标准库的更新进行同步更新,提高了更新数据库的效率。
示例性的,用户可通过图6所示的界面查看医疗费用数据中各款项的判定结果,其中包含有款项名称、是否包括于一异常款项、匹配对象、操作人、操作时间等信息。具体的,对于包括于第一异常款型的第一扣减款项,用户还可以通过点击右侧操作选项中的“变更为合规款项”选项来将该第一扣减款项1进行变更为合规款项,也可通过选取“自动匹配”来进行相似度匹配。对于不包含于记忆库未知款项,用户可通过点击右侧的“自动匹配”选项来与标准库中的款项进行相似度匹配。
本申请实施例通过建立记忆库和标准库中款项之间的同步映射关系,在记忆库中目标款项发生变更时,将会相应对标准库中的目标款项进行同步更新,保证了记忆库和标准库的有效性。
本申请提供的另一种数据处理方法,通通过先将医疗费用数据中的款项记忆库中的二级异常款项和合规款项进行高相似度匹配,确定第一扣减款项,然后将未匹配到的未知款项与所有医院的标准库中的一级异常款项进行低相似度匹配,确定第二扣减款项,最后再通过第一扣减款项和第二扣减款项对医疗费用数据进行扣减,不仅节省了医疗费用数据扣减所需的人力成本,而且提高了医疗费用数据扣减的效率。并且获取医疗费用数据时,将医疗明细费用之和与医院核算的出院总费用进行比对,保证了所获取到的医疗明细费用的完整性,并且在对医疗费用数据进行扣减后添加相对应的扣减说明信息得到医疗费用扣减明细供用户查看,使得用户可以便捷地了解医疗费用扣减的详情,并且在记忆库中的目标款项发生变更时,对标准库中的目标款项也进行同步更新,保证了记忆库和标准库的有效性。
图7是本申请实施例提供的一种数据处理装置30,所述装置包括:
获取模块301,用于获取待处理的医疗费用数据;
第一处理模块302,用于将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项;
第二处理模块303,用于将所述未知款项中与所述标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,所述一级异常款项与至少一个所述二级异常款项相关联;
扣减模块304,用于根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
可选的,所述第一处理模块302,还用于:
获取所述医疗费用数据的款项与所述记忆库中每个二级异常款项的第一相似度,以及所述医疗费用数据的款项与所述记忆库中每个二级异常款项和合规款项的第二相似度;
在所述第一相似度的最大值大于或等于第一相似度阈值的情况下,将所述医疗费用数据的款项作为第一扣减款项;
在所述第二相似度的最大值小于第一相似度阈值的情况下,将所述医疗费用数据的款项作为未知款项;
所述第二处理模块303,还用于:
获取所述未知款项与所述标准库中每个一级异常款项的第三相似度;
在所述第三相似度的最大值大于或等于第二相似度阈值的情况下,将所述未知款项作为第二扣减款项。
可选的,所述第一处理模块302,还用于:
在所述第三相似度的最大值小于第二相似度阈值的情况下,获取所述未知款项的审核结果;
在所述审核结果为异常类型的情况下,将所述未知款项作为第三扣减款项;
根据所述第一扣减款项和所述第三扣减款项对所述医疗费用数据进行费用扣减。
可选的,所述装置,还包括:
预先生成模块,用于:
获取第一样本医疗费用数据;
将所述第一样本医疗费用数据进行同类项合并,得到第二样本医疗费用数据;
获取第二样本医疗费用数据的标注结果;
将标注结果为异常类型的第二样本医疗费用数据作为二级异常款项,并将审核结果为合规类型的第二样本医疗费用数据作为合规款项,得到记忆库;
根据第三相似度阈值对所述二级异常款项进行聚类,得到异常款项集合;
提取所述异常款项集合的关键词;
将所述关键词作为与所述异常款项集合中二级异常款项相关联的一级异常款项,得到标准库。
可选的,所述装置,还包括:
修改模块,用于:
接收对于所述标准库的一级异常款项中目标款项的修改输入;
将所述目标款项从所述标准库的一级异常款项中移除;
将所述记忆库中与所述目标款项相关联的二级异常款项,变更为合规款项。
可选的,所述装置,还包括:
显示模块,用于:
对扣减后的医疗费用数据标注扣减说明信息,得到医疗费用扣减明细;
显示所述医疗费用扣减明细。
可选的,所述获取模块,还用于:
接收医疗费用扣减请求,所述医疗费用扣减请求至少包括:医疗案件标识;
从所述医疗案件标识所指示医院的数据库,获取医疗明细费用以及出院总费用;
在所述医疗明细费用之和与所述出院总费用间的差额小于差额阈值的情况下,将所述医疗明细费用作为待处理的医疗费用数据。
本申请提供的一种数据处理装置,通过先将医疗费用数据中的款项记忆库中的二级异常款项和合规款项进行高相似度匹配,确定第一扣减款项,然后将未匹配到的未知款项与所有医院的标准库中的一级异常款项进行低相似度匹配,确定第二扣减款项,最后再通过第一扣减款项和第二扣减款项对医疗费用数据进行扣减,不仅节省了医疗费用数据扣减所需的人力成本,而且提高了医疗费用数据扣减的效率。
对于上述服务器的实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例还提供了一种电子设备,如图8所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:
获取待处理的医疗费用数据;将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项;将所述未知款项中与所述标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,所述一级异常款项与至少一个所述二级异常款项相关联;根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据处理方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据处理方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在文本中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
获取待处理的医疗费用数据;
将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项;所述记忆库包括所连接所有医院的二级异常款项和合规款项,所述二级异常款项是指医院的不合理收费的异常款项的原名称,合规款项是指所连接医院中合理收费款项;其中,通过将所述医疗费用数据中的款项名称与所述记忆库中的款项名称进行文字相似度比对,从而确定所述医疗费用款项中的款项与所述记忆库中每个款项的相似度,所述相似度包括所述第一相似度和所述第二相似度;
将所述未知款项中与标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,所述一级异常款项与至少一个所述二级异常款项相关联;所述标准库包括所连接的医院的一级异常款项,所述一级异常款项是预先通过将所述所连接的医院的二级异常款项进行汇总,对属于同一收费事项的所述二级异常款项生成的相对应的所述一级异常款项;
根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
2.根据权利要求1所述的方法,其特征在于,所述将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项,包括:
获取所述医疗费用数据的款项与所述记忆库中每个二级异常款项的第一相似度,以及所述医疗费用数据的款项与所述记忆库中每个二级异常款项和合规款项的第二相似度;
在所述第一相似度的最大值大于或等于第一相似度阈值的情况下,将所述医疗费用数据的款项作为第一扣减款项;
在所述第二相似度的最大值小于第一相似度阈值的情况下,将所述医疗费用数据的款项作为未知款项;
所述将所述未知款项中与所述标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,包括:
获取所述未知款项与所述标准库中每个一级异常款项的第三相似度;
在所述第三相似度的最大值大于或等于第二相似度阈值的情况下,将所述未知款项作为第二扣减款项。
3.根据权利要求2所述的方法,其特征在于,在所述获取所述未知款项与所述标准库中每个一级异常款项的第三相似度之后,还包括:
在所述第三相似度的最大值小于第二相似度阈值的情况下,获取所述未知款项的审核结果;
在所述审核结果为异常类型的情况下,将所述未知款项作为第三扣减款项;
根据所述第一扣减款项和所述第三扣减款项对所述医疗费用数据进行费用扣减。
4.根据权利要求1所述的方法,其特征在于,在所述获取待处理的医疗费用数据之前,还包括:
获取第一样本医疗费用数据;
将所述第一样本医疗费用数据进行同类项合并,得到第二样本医疗费用数据;
获取第二样本医疗费用数据的标注结果;
将标注结果为异常类型的第二样本医疗费用数据作为二级异常款项,并将审核结果为合规类型的第二样本医疗费用数据作为合规款项,得到记忆库;
根据第三相似度阈值对所述二级异常款项进行聚类,得到异常款项集合;
提取所述异常款项集合的关键词;
将所述关键词作为与所述异常款项集合中二级异常款项相关联的一级异常款项,得到标准库。
5.根据权利要求4所述的方法,其特征在于,在所述将所述关键词作为与所述异常款项集合中二级异常款项相关联的一级异常款项,得到标准库之后,还包括:
接收对于所述标准库的一级异常款项中目标款项的修改输入;
将所述目标款项从所述标准库的一级异常款项中移除;
将所述记忆库中与所述目标款项相关联的二级异常款项,变更为合规款项。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减之后,还包括:
对扣减后的医疗费用数据标注扣减说明信息,得到医疗费用扣减明细;
显示所述医疗费用扣减明细。
7.根据权利要求1所述的方法,其特征在于,在所述获取待处理的医疗费用数据之前,还包括:
接收医疗费用扣减请求,所述医疗费用扣减请求至少包括:医疗案件标识;
所述获取待处理的医疗费用数据,包括:
从所述医疗案件标识所指示医院的数据库,获取医疗明细费用以及出院总费用;
在所述医疗明细费用之和与所述出院总费用间的差额小于差额阈值的情况下,将所述医疗明细费用作为待处理的医疗费用数据。
8.一种产品检测装置,其特征在于,包括:
获取模块,用于获取待处理的医疗费用数据;
第一处理模块,用于将所述医疗费用数据的款项中与记忆库的二级异常款项的第一相似度大于或等于第一相似度阈值的款项作为第一扣减款项,并将所述医疗费用数据的款项中与所述记忆库中二级异常款项和合规款项的第二相似度小于所述第一相似度阈值的款项作为未知款项;所述记忆库包括所连接所有医院的二级异常款项和合规款项,所述二级异常款项是指医院的不合理收费的异常款项的原名称,合规款项是指所连接医院中合理收费款项;其中,通过将所述医疗费用数据中的款项名称与所述记忆库中的款项名称进行文字相似度比对,从而确定所述医疗费用款项中的款项与所述记忆库中每个款项的相似度,所述相似度包括所述第一相似度和所述第二相似度;
第二处理模块,用于将所述未知款项中与标准库的一级异常款项的第三相似度大于或等于第二相似度阈值的款项作为第二扣减款项,所述第二相似度阈值小于所述第一相似度阈值,所述一级异常款项与至少一个所述二级异常款项相关联;所述标准库包括所连接的医院的一级异常款项,所述一级异常款项是预先通过将所述所连接的医院的二级异常款项进行汇总,对属于同一收费事项的所述二级异常款项生成的相对应的所述一级异常款项;
扣减模块,用于根据所述第一扣减款项和所述第二扣减款项对所述医疗费用数据进行费用扣减。
9.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7中任一所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现权利要求1至7中任一所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010808940.9A CN112102098B (zh) | 2020-08-12 | 2020-08-12 | 数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010808940.9A CN112102098B (zh) | 2020-08-12 | 2020-08-12 | 数据处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112102098A CN112102098A (zh) | 2020-12-18 |
CN112102098B true CN112102098B (zh) | 2023-10-27 |
Family
ID=73754487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010808940.9A Active CN112102098B (zh) | 2020-08-12 | 2020-08-12 | 数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102098B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109242709A (zh) * | 2018-10-27 | 2019-01-18 | 平安科技(深圳)有限公司 | 估算医疗费用的方法和装置 |
CN109522746A (zh) * | 2018-11-07 | 2019-03-26 | 平安医疗健康管理股份有限公司 | 一种数据处理方法、电子设备及计算机存储介质 |
CN109545312A (zh) * | 2018-10-23 | 2019-03-29 | 平安医疗健康管理股份有限公司 | 一种药店结算单风险检测方法和装置 |
CN109616188A (zh) * | 2018-12-13 | 2019-04-12 | 平安医疗健康管理股份有限公司 | 医疗费用异常的监控方法、监控服务端及存储介质 |
CN109670971A (zh) * | 2018-11-30 | 2019-04-23 | 平安医疗健康管理股份有限公司 | 异常就诊费用的判断方法、装置、设备及计算机存储介质 |
CN110377633A (zh) * | 2019-06-21 | 2019-10-25 | 深圳壹账通智能科技有限公司 | 报表数据处理方法、装置、计算机设备和存储介质 |
WO2020073828A1 (zh) * | 2018-10-10 | 2020-04-16 | 腾讯科技(深圳)有限公司 | 审计结果数据存储、查询方法、审计项存储方法及装置 |
CN111340638A (zh) * | 2020-03-23 | 2020-06-26 | 平安医疗健康管理股份有限公司 | 异常医保单据识别方法、装置、计算机设备及存储介质 |
-
2020
- 2020-08-12 CN CN202010808940.9A patent/CN112102098B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020073828A1 (zh) * | 2018-10-10 | 2020-04-16 | 腾讯科技(深圳)有限公司 | 审计结果数据存储、查询方法、审计项存储方法及装置 |
CN109545312A (zh) * | 2018-10-23 | 2019-03-29 | 平安医疗健康管理股份有限公司 | 一种药店结算单风险检测方法和装置 |
CN109242709A (zh) * | 2018-10-27 | 2019-01-18 | 平安科技(深圳)有限公司 | 估算医疗费用的方法和装置 |
CN109522746A (zh) * | 2018-11-07 | 2019-03-26 | 平安医疗健康管理股份有限公司 | 一种数据处理方法、电子设备及计算机存储介质 |
CN109670971A (zh) * | 2018-11-30 | 2019-04-23 | 平安医疗健康管理股份有限公司 | 异常就诊费用的判断方法、装置、设备及计算机存储介质 |
CN109616188A (zh) * | 2018-12-13 | 2019-04-12 | 平安医疗健康管理股份有限公司 | 医疗费用异常的监控方法、监控服务端及存储介质 |
CN110377633A (zh) * | 2019-06-21 | 2019-10-25 | 深圳壹账通智能科技有限公司 | 报表数据处理方法、装置、计算机设备和存储介质 |
CN111340638A (zh) * | 2020-03-23 | 2020-06-26 | 平安医疗健康管理股份有限公司 | 异常医保单据识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112102098A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7324998B2 (en) | Document search methods and systems | |
US11062132B2 (en) | System and method for identification of missing data elements in electronic documents | |
US20170109430A1 (en) | Systems and methods for self-pairing databases | |
US20080167974A1 (en) | Commodity Information Registering Method and System Which Automatically Matches Commodity Model and Category With the Commodity Information | |
CN110781251A (zh) | 保险知识图谱生成方法、装置、设备及存储介质 | |
CN111191111A (zh) | 内容推荐方法、装置及存储介质 | |
CN108985741B (zh) | 一种警务平台资金流水自动查询追踪方法 | |
CN113362162A (zh) | 基于网络行为数据的风控识别方法、装置、电子设备及介质 | |
JP5614981B2 (ja) | データ照合装置、データ照合方法及びプログラム | |
CN114723543B (zh) | 一种跨境电商的财务档案大数据管理系统及方法 | |
CN112102098B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111680110B (zh) | 数据处理方法、装置、bi系统及介质 | |
CN109324963A (zh) | 自动测试收益结果的方法及终端设备 | |
US20240062235A1 (en) | Systems and methods for automated processing and analysis of deduction backup data | |
CN112488562A (zh) | 一种业务实现方法及装置 | |
CN112686732A (zh) | 异常地址数据识别方法、装置、设备、介质及产品 | |
CN112612817B (zh) | 数据处理方法、装置、终端设备及计算机可读存储介质 | |
CN115906851A (zh) | 一种实体识别方法、装置、电子设备及存储介质 | |
CN110956552A (zh) | 保险问题处理方法、装置、设备及存储介质 | |
JP2015008019A (ja) | データ照合装置、データ照合方法及びプログラム | |
US20250014066A1 (en) | Systems and methods for automated processing and analysis of deduction backup data | |
CN114722074B (zh) | 一种数据表的生成方法、系统及装置 | |
US12165230B2 (en) | Systems and methods for generating title reports | |
CN110728566B (zh) | 报销文件中数据处理方法、装置、计算机设备和存储介质 | |
JP2009134375A (ja) | 融資審査支援システムおよびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |