CN109712007A

CN109712007A - 医疗风险识别方法、设备、存储介质及装置

Info

Publication number: CN109712007A
Application number: CN201811539357.1A
Authority: CN
Inventors: 付舒婷
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-12-14
Filing date: 2018-12-14
Publication date: 2019-05-03

Abstract

本发明公开了一种医疗风险识别方法、设备、存储介质及装置，该方法包括：扫描目标医疗发票，获得所述目标医疗发票对应的发票图片；对所述发票图片进行文字识别，获得目标发票数据；通过预设核赔模型评估所述目标发票数据的目标风险等级；查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议。本发明中，通过对目标医疗发票对应的发票图片进行文字识别，获得目标发票数据，无需人工采集发票数据，提高数据采集效率，降低数据采集错误率；基于人工智能的智能决策，通过预设核赔模型评估目标发票数据的目标风险等级，从而根据目标风险等级给出目标理赔建议，从而提高医疗理赔效率。

Description

医疗风险识别方法、设备、存储介质及装置

技术领域

本发明涉及人工智能的技术领域，尤其涉及一种医疗风险识别方法、设备、存储介质及装置。

背景技术

目前，在医疗保险行业中，当需要进行理赔时，需要通过医疗发票等资料作为理赔的依据。这就需要获取医疗发票上的开具单位、医疗项目和理赔金额等数据。在传统的理赔系统中，客户报案后如属于医疗类报案需提供医疗发票，核赔工作人员需人工核查医疗发票中的相关内容和客户购买的保险以及报案情况是否一致，此部分工作占用较多人力，且人工作业不可避免错误的发生，导致医疗理赔效率低。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种医疗风险识别方法、设备、存储介质及装置，旨在解决现有技术中医疗理赔效率低的技术问题。

为实现上述目的，本发明提供一种医疗风险识别方法，所述医疗风险识别方法包括以下步骤：

扫描目标医疗发票，获得所述目标医疗发票对应的发票图片；

对所述发票图片进行文字识别，获得目标发票数据；

通过预设核赔模型评估所述目标发票数据的目标风险等级；

查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议。

优选地，所述扫描目标医疗发票，获得所述目标医疗发票对应的发票图片，包括：

扫描目标医疗发票的预设位置，获得与所述预设位置对应的发票图片；

所述对所述发票图片进行文字识别，获得目标发票数据，包括：

对所述预设位置对应的发票图片进行文字识别，获得目标发票数据。

优选地，所述对所述预设位置对应的发票图片进行文字识别，获得目标发票数据，包括：

对所述预设位置对应的发票图片进行文字分割，获得所述预设位置对应的发票图片中的所有文字图形；

将所述文字图形与预设图像字典进行匹配，获得所述文字图形对应的文字信息；

从第一映射关系表中获取所述预设位置对应的目标数据类型，并将所述文字信息作为所述目标数据类型对应的目标发票数据，所述第一映射关系表中包括数据位置与数据类型之间的对应关系。

优选地，所述对所述预设位置对应的发票图片进行文字分割，获得所述预设位置对应的发票图片中的所有文字图形之后，所述医疗风险识别方法还包括：

去除所述文字图形中的噪音，获得去噪文字图形；

所述将所述文字图形与预设图像字典进行匹配，获得所述文字图形对应的文字信息，包括：

将所述去噪文字图形与预设图像字典进行匹配，获得所述去噪文字图形对应的文字信息。

优选地，所述去除所述文字图形中的噪音，获得去噪文字图形，包括：

获取预设图像字典中文字的标准图形，从所述标准图形中提取出标准文字大小、标准文字位置及标准笔画粗细；

根据所述标准文字大小、标准文字位置及标准笔画粗细分别调整所述去噪文字图形中的文字大小、文字位置及笔画粗细，获得规范化文字图形；

提取所述规范化文字图形中的文字特征，获得特征图形；

所述将所述去噪文字图形与预设图像字典进行匹配，获得所述去噪文字图形对应的文字信息，包括：

将所述特征图形与预设图像字典进行匹配，获得所述特征图形对应的文字信息。

优选地，所述通过预设核赔模型评估所述目标发票数据的目标风险等级之前，所述医疗风险识别方法还包括：

获取历史医疗用户的历史交易行为数据，从所述历史交易行为数据中提取出历史医疗发票数据及对应的历史核赔数据；

根据所述历史医疗发票数据及对应的所述历史核赔数据生成预设维度的样本核赔数据；

将所述样本核赔数据输入卷积神经网络模型进行训练，根据训练结果获得预设核赔模型。

优选地，所述查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议，包括：

从第二映射关系表中查找与所述目标风险等级对应的目标核赔建议，并展示所述目标核赔建议，所述第二映射关系表中包括风险等级与核赔建议之间的对应关系。

此外，为实现上述目的，本发明还提出一种医疗风险识别设备，所述医疗风险识别设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的医疗风险识别程序，所述医疗风险识别程序配置为实现如上文所述的医疗风险识别方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有医疗风险识别程序，所述医疗风险识别程序被处理器执行时实现如上文所述的医疗风险识别方法的步骤。

此外，为实现上述目的，本发明还提出一种医疗风险识别装置，所述医疗风险识别装置包括：

扫描模块，用于扫描目标医疗发票，获得所述目标医疗发票对应的发票图片；

识别模块，用于对所述发票图片进行文字识别，获得目标发票数据；

评估模块，用于通过预设核赔模型评估所述目标发票数据的目标风险等级；

查找模块，用于查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议。

本发明中，通过扫描目标医疗发票，获得所述目标医疗发票对应的发票图片，对所述发票图片进行文字识别，获得目标发票数据，无需人工采集发票数据，提高数据采集效率，降低数据采集错误率；基于智能决策，通过预设核赔模型评估所述目标发票数据的目标风险等级，查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议，从而提高医疗理赔效率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的医疗风险识别设备的结构示意图；

图2为本发明医疗风险识别方法第一实施例的流程示意图；

图3为本发明医疗风险识别方法第二实施例的流程示意图；

图4为本发明医疗风险识别方法第三实施例的流程示意图；

图5为本发明医疗风险识别装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的医疗风险识别设备结构示意图。

如图1所示，该医疗风险识别设备可以包括：处理器1001，例如中央处理器(Central Processing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)，可选用户接口1003还可以包括标准的有线接口、无线接口，对于用户接口1003的有线接口在本发明中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity，WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory，RAM)存储器，也可以是稳定的存储器(Non-volatileMemory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对医疗风险识别设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及医疗风险识别程序。

在图1所示的医疗风险识别设备中，网络接口1004主要用于连接后台服务器，与所述后台服务器进行数据通信；用户接口1003主要用于连接用户设备；所述医疗风险识别设备通过处理器1001调用存储器1005中存储的医疗风险识别程序，并执行本发明实施例提供的医疗风险识别方法。

基于上述硬件结构，提出本发明医疗风险识别方法的实施例。

参照图2，图2为本发明医疗风险识别方法第一实施例的流程示意图，提出本发明医疗风险识别方法第一实施例。

在第一实施例中，所述医疗风险识别方法包括以下步骤：

步骤S10：扫描目标医疗发票，获得所述目标医疗发票对应的发票图片。

应理解的是，本实施例的执行主体是所述医疗风险识别设备，其中，所述医疗风险识别设备可为个人电脑或服务器等电子设备。所述目标医疗发票为是否进行理赔的重要数据，所述目标医疗发票包括开具单位、消费金额、医疗项目和药品清单等数据信息。为了提高采集所述目标医疗发票中的相关信息的效率，可通过摄像机或扫描机对纸档的所述目标医疗发票进行拍照或者扫描，获得所述目标医疗发票对应的所述发票图片。所述发票图片，可以是对所述目标医疗发票的整体内容进行扫描而获得，也可以是对所述目标医疗发票的预设位置的内容进行扫描而获得，所述预设位置的内容能够反映所述目标医疗发票中至少一种所述数据信息，比如，扫描所述目标医疗发票的下方，获得所述发票图片，所述目标医疗发票的下方为在医院看病所花费的医疗费用，即所述发票图片包括消费金额的数据信息。

步骤S20：对所述发票图片进行文字识别，获得目标发票数据。

可理解的是，文字识别实际上就是解决文字的分类问题，可通过特征判别及特征匹配的方式来进行处理。特征判别是通过文字类别的共同规则进行分类判别，所述文字类别包括英文、汉字或数字等，所述共同规则包括区域特征或四周边特征等。特征匹配是根据各国文字的知识采取按形式匹配的方式进行，可以是直接利用输入的二维平面图像与预设图像字典中的图像进行全域匹配，还可以是只抽出部分图像与所述预设图像字典进行匹配，然后根据各部分形状及相对位置关系，与保存在所述预设图像字典中的知识进行对照，从而识别出所述发票图片中每一个具体的文字，获得所述目标发票数据。

步骤S30：通过预设核赔模型评估所述目标发票数据的目标风险等级。

需要说明的是，所述预设核赔模型可以是卷积神经网络模型等，通过所述发票图片识别的所述目标发票数据，将所述目标发票数据输入至所述预设核赔模型，通过所述预设核赔模型比对所述目标发票数据是否满足核赔要求，从而评估所述目标发票数据的目标风险等级。

在具体实现中，所述预设核赔模型是由历史医疗用户的历史交易行为数据中的历史医疗发票数据和历史核赔数据作为样本数据训练而获得。首先建立基础模型，所述基础模型包括卷积神经网络模型或者支持向量机模型等，获取历史医疗用户的所述历史交易行为数据，从所述历史交易行为数据中提取出历史医疗发票数据和对应的历史核赔数据。所述历史医疗发票数据包括三个预设维度的参数信息：用户信息、诊疗项目信息和诊疗费用信息。将所述历史医疗发票数据和对应的历史核赔数据按照上述三个预设维度进行分类，获得三个所述预设维度的样本核赔数据。所述样本核赔数据包括风险等级为低风险对应的正常核赔数据，还包括风险等级为中风险或者高风险对应的异常核赔数据，将所述样本核赔数据输入卷积神经网络模型或者支持向量机模型进行训练，根据训练结果获得所述预设核赔模型，所述预设核赔模型经过大量的数据训练，能够有效识别出输入的数据对应的风险等级。本实施例中，所述步骤S30之前，还包括：获取历史医疗用户的历史交易行为数据，从所述历史交易行为数据中提取出历史医疗发票数据及对应的历史核赔数据；根据所述历史医疗发票数据及对应的所述历史核赔数据生成预设维度的样本核赔数据；将所述样本核赔数据输入卷积神经网络模型进行训练，根据训练结果获得预设核赔模型。

应理解的是，所述目标发票数据也包括上述三个预设维度的参数信息。所述用户信息是指从所述发票图片中识别出的用户姓名、性别和年龄等信息；所述诊疗项目信息包括疾病类型、药品名称、用量及处方等信息；诊疗费用信息指检查项目和处方等对应的实际消费金额信息。将所述目标发票数据输入所述预设核赔模型中，所述预设核赔模型设置为将低风险对应的样本核赔数据作为比对参数。所述预设核赔模型通过将所述目标发票数据从上述三个维度与模型中的比对参数进行比对，所述比对参数为所述预设核赔模型根据大量的所述样本医疗发票数据学习训练而获得，从而判断用户的理赔诉求是否合理，是否存在骗保的行为，包括但不限于虚假报销或者小病大治等。并对欺诈的风险作风险等级评估，获得所述目标风险等级，所述目标风险等级包括低风险、中风险和高风险。当识别的所述目标发票数据与所述预设核赔模型中对应维度的比对参数偏差超过第一预设偏差时，识别为高风险；类似的，当所述目标发票数据与所述预设核赔模型中对应维度的比对参数偏差小于所述第一预设偏差，但大于第二预设偏差时，识别为中风险，所述第一预设偏差大于所述第二预设偏差；当所述目标发票数据与所述预设核赔模型中对应维度的比对参数偏差小于所述第二预设偏差时，识别为低风险。

步骤S40：查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议。

可理解的是，理赔建议包括：不建议理赔或者建议理赔。可以预先建立风险等级与理赔建议之间的对应关系，将所述对应关系存储与第二映射关系表中，则可从所述第二映射关系表中查找与所述目标风险等级对应的目标理赔建议。可以将高风险和中风险的风险等级的理赔建议都设置为不建议理赔，将低风险的理赔建议设置为建议理赔。本实施例例中，所述步骤S40，包括：从第二映射关系表中查找与所述目标风险等级对应的目标核赔建议，并展示所述目标核赔建议，所述第二映射关系表中包括风险等级与核赔建议之间的对应关系。

需要说明的是，可通过所述医疗风险识别设备的显示界面展示所述目标理赔建议，所述目标理赔建议为不建议理赔或者建议理赔，则理赔工作人员可根据所述目标理赔建议处理用户的理赔申请。

本实施例中，通过扫描目标医疗发票，获得所述目标医疗发票对应的发票图片，对所述发票图片进行文字识别，获得目标发票数据，无需人工采集发票数据，提高数据采集效率，降低数据采集错误率；基于智能决策，通过预设核赔模型评估所述目标发票数据的目标风险等级，查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议，从而提高医疗理赔效率。

参照图3，图3为本发明医疗风险识别方法第二实施例的流程示意图，基于上述图2所示的第一实施例，提出本发明医疗风险识别方法的第二实施例。

在第二实施例中，所述步骤S10，包括：

步骤S101：扫描目标医疗发票的预设位置，获得与所述预设位置对应的发票图片。

可理解的是，医疗发票的格式是固定的。也就是说，在所述医疗发票的预设位置的信息是同一类型的，例如，在医疗发票的下方，是用户在医院看病所花费的诊疗费用信息，在医疗发票的右下角是用户看病所在医院的名称，在医疗发票的上方通常是用户的信息，在医疗发票的中间部分通常为诊疗项目信息。因此在进行识别时，可以针对性的进行识别。所述预设位置包括发票的上方、发票的下方、发票的中间和发票的右下角等位置。通过对所述目标医疗发票划分为多个预设位置，按照划分的多个预设位置进行多次扫描，获得所述目标医疗发票各预设位置对应的发票图片，各预设位置对应的发票图片构成所述目标医疗发票的整体内容。

在第二实施例中，所述步骤S20，包括：

应理解的是，若所述预设位置为发票的上方，则扫描所述目标医疗发票的预设位置，获得发票上方的用户信息对应的发票图片；若所述预设位置为发票的下方，则扫描所述目标医疗发票的预设位置，获得发票下方的诊疗费用信息对应的发票图片；若所述预设位置为发票的右下角，则扫描所述目标医疗发票的预设位置，获得发票右下角的医院名称对应的发票图片；若所述预设位置为发票的中间，则扫描所述目标医疗发票的预设位置，获得发票中间的诊疗项目信息对应的发票图片。可通过对所述目标医疗发票按照所述预设位置的不同进行多次扫描，从而获得完整的目标医疗发票的全部内容，并且，每次扫描获得发票图片内容的类型确定，以提高后续的文字识别效率。

进一步地，所述对所述预设位置对应的发票图片进行文字识别，获得目标发票数据，包括：

步骤S201：对所述预设位置对应的发票图片进行文字分割，获得所述预设位置对应的发票图片中的所有文字图形。

需要说明的是，对所述发票图片进行文字分割的目的在于根据文字图像的特征实现文字图像区域的定位和分割，将所述发票图片中真正的文字图形分割出来，以便后续进行识别，将已分割的文字图形信息加以区分。图片中边缘是指图像局部亮度变化量最显著的部分，图片边缘主要存在于目标与背景或者区域与区域之间，是图像分割、纹理特征提前和形状特征提取等图像分析的重要基础，图像中的边缘通常与图像亮度或图像亮度的一阶导数的不连续性有关。根据图片边缘等特征正确地分割所述发票图片的文字图像区域，从而获得所述预设位置对应的发票图片中的所有文字图形。

步骤S202：将所述文字图形与预设图像字典进行匹配，获得所述文字图形对应的文字信息。

在具体实现中，所述预设图像字典包括大量文字对应的文字图像，将所述文字图形与预设图像字典进行匹配，若匹配上，则能识别出对应的文字信息。所述文字图形中的文字信息的识别可通过特征判别及特征匹配的方式来进行处理。特征判别是通过文字类别的共同规则进行分类判别，所述文字类别包括英文、汉字或数字等，所述共同规则包括区域特征或四周边特征等。特征匹配是根据各国文字的知识采取按形式匹配的方式进行，可以是直接利用输入的二维平面图像与预设图像字典中的图像进行全域匹配，还可以是只抽出部分图像与所述预设图像字典进行匹配，然后根据各部分形状及相对位置关系，与保存在所述预设图像字典中的知识进行对照，从而识别出所述文字图形表示的文字，即获得所述文字图形对应的文字信息。

步骤S203：从第一映射关系表中获取所述预设位置对应的目标数据类型，并将所述文字信息作为所述目标数据类型对应的目标发票数据，所述第一映射关系表中包括数据位置与数据类型之间的对应关系。

应理解的是，医疗发票的格式是固定的。也就是说，在所述医疗发票的预设位置的信息是同一类型的，则可根据所述预设位置对所述文字信息进行分类，所述目标发票数据包括各种类别的数据。可预先根据医疗发票的格式建立医疗发票中各数据位置及对应的数据类型之间的对应关系存储于所述第一映射关系表中，所述第一映射关系表中包括数据位置与数据类型之间的对应关系，则可从所述第一映射关系表中获取所述预设位置对应的目标数据类型。

比如，所述预设位置为医疗发票的下方，所述第一映射关系表中所述医疗发票的下方对应的所述目标数据类型为诊疗费用，则将医疗发票的下方对应的所述文字信息分类为所述诊疗费用对应的诊疗费用信息；所述预设位置为医疗发票的右下角，所述第一映射关系表中所述医疗发票的右下角对应的所述目标数据类型为医院名称，则将医疗发票的右下角对应的所述文字信息分类为所述医院名称对应的医院名称信息；所述预设位置为医疗发票的中间，所述第一映射关系表中所述医疗发票的中间对应的所述目标数据类型为诊疗项目，则将医疗发票的中间对应的所述文字信息分类为是诊疗项目对应的诊疗项目信息；所述预设位置为医疗发票的上方，所述第一映射关系表中所述医疗发票的上方对应的所述目标数据类型为用户基本信息，则将医疗发票的上方对应的所述文字信息分类为所述用户基本信息对应的用户信息。所述目标发票数据包括诊疗费用信息、医院名称信息、诊疗项目信息和用户信息等类型的数据。

本实施例中，通过扫描目标医疗发票的预设位置，获得与所述预设位置对应的发票图片，每次扫描获得发票图片内容的类型确定，以提高后续的文字识别效率；对所述预设位置对应的发票图片进行文字分割，获得所述预设位置对应的发票图片中的所有文字图形，对所述发票图片进行文字分割，获得所述发票图片中的所有文字图形，将所述文字图形与预设图像字典进行匹配，获得所述文字图形对应的文字信息，从第一映射关系表中获取所述预设位置对应的目标数据类型，并将所述文字信息作为所述目标数据类型对应的目标发票数据，通过文字分割和与预设图像字典匹配，实现自动识别所述发票图片的目标发票数据，避免人工采集发票数据，提高数据采集效率，降低数据采集错误率。

参照图4，图4为本发明医疗风险识别方法第三实施例的流程示意图，基于上述图3所示的第二实施例，提出本发明医疗风险识别方法的第三实施例。

在第三实施例中，所述步骤S201之后，还包括：

步骤S2011：去除所述文字图形中的噪音，获得去噪文字图形。

应理解的是，为了提高文字识别的效率，可预先对所述问题图形中的污点和空白等噪音进行去除，以增强文字图形的信息。去噪音的方式可以采用中值滤波或者小波变换等。所述中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术，通过将所述文字图形中某个像素邻域中的像素按灰度值进行排序，然后选择该序列的中间值作为输出的像素值,让周围像素灰度值的差比较大的像素改取与周围的像素值接近的值，从而可以消除孤立的噪声点，利用所述中值滤波算法可以很好地对图像进行平滑处理。所述小波变换是一种窗口大小固定但其形状可改变的时频局部化分析方式，所述小波变换利用非均匀的分辨率，即在低频段用高的频率分辨率和低的时间分辨率，而在高频段利用低的频率分辨率和高的时间分辨率，能有效地从信号(如语言或者图像等)中提取信息，较好地解决了时间和频率分辨率的矛盾。对于一副图像，低频分量是保持信号特性的重要部分，高频分量则仅仅起到提供信号细节的作用，而且噪声也大多属于高频信息，利用所述小波变换，噪声信息大多集中在次低频、次高频以及高频子块中，特别是高频子块，几乎以噪声信息为主，为此，将高频子块置为零，对次低频和次高频子块进行一定的抑制，则可以达到一定的噪声去除效果。

所述步骤S202，包括：

步骤S2021：将所述去噪文字图形与预设图像字典进行匹配，获得所述去噪文字图形对应的文字信息。

可理解的是，所述预设图像字典包括大量文字对应的文字图像，将所述去噪文字图形与预设图像字典进行匹配，若匹配上，则能识别出对应的文字信息。所述去噪文字图形中的文字信息的识别可通过特征判别及特征匹配的方式来进行处理。特征判别是通过文字类别的共同规则进行分类判别，所述文字类别包括英文、汉字或数字等，所述共同规则包括区域特征或四周边特征等。特征匹配是根据各国文字的知识采取按形式匹配的方式进行，可以是直接利用输入的二维平面图像与预设图像字典中的图像进行全域匹配，还可以是只抽出部分图像与所述预设图像字典进行匹配，然后根据各部分形状及相对位置关系，与保存在所述预设图像字典中的知识进行对照，从而识别出所述去噪文字图形表示的文字，即获得所述去噪文字图形对应的文字信息。

在第三实施例中，所述步骤S201，包括：

提取所述规范化文字图形中的文字特征，获得特征图形；

所述步骤S2021，包括：

需要说明的是，根据一定的准则除掉一些非本质信号，对文字的大小、位置和笔画粗细等进行规范化，以便简化判断部分的复杂性。比如，医院名称通常在发票的右下角以相对较小的字体呈现，在对医院名称对应的去噪文字图形进行文字识别时，可以将字体调整为便于识别的字体大小，从而提高识别效率。通常为了规范化，所述预设图像字典中的各文字的大小和笔画粗细等都是统一的格式，可获取预设图像字典中文字的标准图形，从所述标准图形中提取出标准文字大小、标准文字位置及标准笔画粗细，为了提高匹配的效率和准确度，可将所述去噪文字图形中的文字大小和笔画粗细根据所述标准文字大小及所述标准笔画粗细进行调整，调整为与所述预设图像字典一致的格式，所述去噪文字图形中的文字位置若出现偏离中心文字或者出现倾斜等情况，可将所述文字位置根据所述标准文字位置进行适当的修正，以符合所述预设图像字典中的文字格式，从而获得所述规范化文字图形。

在具体实现中，特征提取部分是从整形和规范化的信号中抽取反映字符本身的有用信息，获得所述特征图形，供识别部分进行识别，从而避免与文字本身特征无关的信息对识别进行干扰，从而提高文字识别的效率和准确度。

在第三实施例中，去除所述文字图形中的噪音，获得去噪文字图形，将所述去噪文字图形与预设图像字典进行匹配，获得所述去噪文字图形对应的文字信息，从而提高文字识别的效率和准确度，提高目标医疗发票的目标发票数据的获取效率，从而提高医疗理赔效率。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有医疗风险识别程序，所述医疗风险识别程序被处理器执行时实现如上文所述的医疗风险识别方法的步骤。

此外，参照图5，本发明实施例还提出一种医疗风险识别装置，所述医疗风险识别装置包括：

扫描模块10，用于扫描目标医疗发票，获得所述目标医疗发票对应的发票图片；

识别模块20，用于对所述发票图片进行文字识别，获得目标发票数据；

评估模块30，用于通过预设核赔模型评估所述目标发票数据的目标风险等级；

查找模块40，用于查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议。

应理解的是，所述目标医疗发票为是否进行理赔的重要数据，所述目标医疗发票包括开具单位、消费金额、医疗项目和药品清单等数据信息。为了提高采集所述目标医疗发票中的相关信息的效率，可通过摄像机或扫描机对纸档的所述目标医疗发票进行拍照或者扫描，获得所述目标医疗发票对应的所述发票图片。所述发票图片，可以是对所述目标医疗发票的整体内容进行扫描而获得，也可以是对所述目标医疗发票的预设位置的内容进行扫描而获得，所述预设位置的内容能够反映所述目标医疗发票中至少一种所述数据信息，比如，扫描所述目标医疗发票的下方，获得所述发票图片，所述目标医疗发票的下方为在医院看病所花费的医疗费用，即所述发票图片包括消费金额的数据信息。

在具体实现中，所述预设核赔模型是由历史医疗用户的历史交易行为数据中的历史医疗发票数据和历史核赔数据作为样本数据训练而获得。首先建立基础模型，所述基础模型包括卷积神经网络模型或者支持向量机模型等，获取历史医疗用户的所述历史交易行为数据，从所述历史交易行为数据中提取出历史医疗发票数据和对应的历史核赔数据。所述历史医疗发票数据包括三个预设维度的参数信息：用户信息、诊疗项目信息和诊疗费用信息。将所述历史医疗发票数据和对应的历史核赔数据按照上述三个预设维度进行分类，获得三个所述预设维度的样本核赔数据；所述样本核赔数据包括风险等级为低风险对应的正常核赔数据，还包括风险等级为中风险或者高风险对应的异常核赔数据，将所述样本核赔数据输入卷积神经网络模型或者支持向量机模型进行训练，根据训练结果获得所述预设核赔模型，所述预设核赔模型经过大量的数据训练，能够有效识别出输入的数据对应的风险等级。本实施例中，所述通过预设核赔模型评估所述目标发票数据的目标风险等级之前，还包括：获取历史医疗用户的历史交易行为数据，从所述历史交易行为数据中提取出历史医疗发票数据及对应的历史核赔数据；根据所述历史医疗发票数据及对应的所述历史核赔数据生成预设维度的样本核赔数据；将所述样本核赔数据输入卷积神经网络模型进行训练，根据训练结果获得预设核赔模型。

可理解的是，理赔建议包括：不建议理赔或者建议理赔。可以预先建立风险等级与理赔建议之间的对应关系，将所述对应关系存储与第二映射关系表中，则可从所述第二映射关系表中查找与所述目标风险等级对应的目标理赔建议。可以将高风险和中风险的风险等级的理赔建议都设置为不建议理赔，将低风险的理赔建议设置为建议理赔。本实施例例中，所述查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议，包括：从第二映射关系表中查找与所述目标风险等级对应的目标核赔建议，并展示所述目标核赔建议，所述第二映射关系表中包括风险等级与核赔建议之间的对应关系。

在一实施例中，所述扫描模块10，还用于扫描目标医疗发票的预设位置，获得与所述预设位置对应的发票图片；

所述识别模块20，还用于对所述预设位置对应的发票图片进行文字识别，获得目标发票数据。

在一实施例中，所述医疗风险识别装置还包括：

文字分割模块，用于对所述预设位置对应的发票图片进行文字分割，获得所述预设位置对应的发票图片中的所有文字图形；

匹配模块，用于将所述文字图形与预设图像字典进行匹配，获得所述文字图形对应的文字信息；

获取模块，用于从第一映射关系表中获取所述预设位置对应的目标数据类型，并将所述文字信息作为所述目标数据类型对应的目标发票数据，所述第一映射关系表中包括数据位置与数据类型之间的对应关系。

在一实施例中，所述医疗风险识别装置还包括：

去除模块，用于去除所述文字图形中的噪音，获得去噪文字图形；

所述匹配模块，还用于将所述去噪文字图形与预设图像字典进行匹配，获得所述去噪文字图形对应的文字信息。

在一实施例中，所述医疗风险识别装置还包括：

提取模块，用于获取预设图像字典中文字的标准图形，从所述标准图形中提取出标准文字大小、标准文字位置及标准笔画粗细；

调整模块，用于根据所述标准文字大小、标准文字位置及标准笔画粗细分别调整所述去噪文字图形中的文字大小、文字位置及笔画粗细，获得规范化文字图形；

所述提取模块，还用于提取所述规范化文字图形中的文字特征，获得特征图形；

所述匹配模块，还用于将所述特征图形与预设图像字典进行匹配，获得所述特征图形对应的文字信息。

在一实施例中，所述提取模块，还用于获取历史医疗用户的历史交易行为数据，从所述历史交易行为数据中提取出历史医疗发票数据及对应的历史核赔数据；

所述医疗风险识别装置还包括：

生成模块，用于根据所述历史医疗发票数据及对应的所述历史核赔数据生成预设维度的样本核赔数据；

训练模块，用于将所述样本核赔数据输入卷积神经网络模型进行训练，根据训练结果获得预设核赔模型。

在一实施例中，所述查找模块40，还用于从第二映射关系表中查找与所述目标风险等级对应的目标核赔建议，并展示所述目标核赔建议，所述第二映射关系表中包括风险等级与核赔建议之间的对应关系。

本发明所述医疗风险识别装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序，可将这些词语解释为标识。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器镜像(Read Only Memory image，ROM)/随机存取存储器(Random AccessMemory，RAM)、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种医疗风险识别方法，其特征在于，所述医疗风险识别方法包括以下步骤：

对所述发票图片进行文字识别，获得目标发票数据；

通过预设核赔模型评估所述目标发票数据的目标风险等级；

2.如权利要求1所述的医疗风险识别方法，其特征在于，所述扫描目标医疗发票，获得所述目标医疗发票对应的发票图片，包括：

3.如权利要求2所述的医疗风险识别方法，其特征在于，所述对所述预设位置对应的发票图片进行文字识别，获得目标发票数据，包括：

4.如权利要求3所述的医疗风险识别方法，其特征在于，所述对所述预设位置对应的发票图片进行文字分割，获得所述预设位置对应的发票图片中的所有文字图形之后，所述医疗风险识别方法还包括：

去除所述文字图形中的噪音，获得去噪文字图形；

5.如权利要求4所述的医疗风险识别方法，其特征在于，所述去除所述文字图形中的噪音，获得去噪文字图形，包括：

提取所述规范化文字图形中的文字特征，获得特征图形；

6.如权利要求1-5中任一项所述的医疗风险识别方法，其特征在于，所述通过预设核赔模型评估所述目标发票数据的目标风险等级之前，所述医疗风险识别方法还包括：

7.如权利要求1-5中任一项所述的医疗风险识别方法，其特征在于，所述查找与所述目标风险等级对应的目标理赔建议，并展示所述目标理赔建议，包括：

8.一种医疗风险识别设备，其特征在于，所述医疗风险识别设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的医疗风险识别程序，所述医疗风险识别程序被所述处理器执行时实现如权利要求1至7中任一项所述的医疗风险识别方法的步骤。

9.一种存储介质，其特征在于，所述存储介质上存储有医疗风险识别程序，所述医疗风险识别程序被处理器执行时实现如权利要求1至7中任一项所述的医疗风险识别方法的步骤。

10.一种医疗风险识别装置，其特征在于，所述医疗风险识别装置包括：