CN111507850A - 核保方法及相关装置、设备 - Google Patents
核保方法及相关装置、设备 Download PDFInfo
- Publication number
- CN111507850A CN111507850A CN202010220567.5A CN202010220567A CN111507850A CN 111507850 A CN111507850 A CN 111507850A CN 202010220567 A CN202010220567 A CN 202010220567A CN 111507850 A CN111507850 A CN 111507850A
- Authority
- CN
- China
- Prior art keywords
- data
- underwriting
- target
- text
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 50
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 49
- 238000001514 detection method Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 9
- 238000013136 deep learning model Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 16
- 238000013527 convolutional neural network Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种核保方法及相关装置、设备,其中,核保方法包括:利用目标核保单的图像数据,获取目标核保单的内容数据;利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果。上述方案,能够提高核保效率以及核保准确性和稳定性。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种核保方法及相关装置、设备。
背景技术
目前,消费者一般通过线下手工填写保单的方式进行投保,而为了实现风控前移,保险公司的核保员通常需要对保单内容进行审核,以服务正常投保,并规避恶意投保而带来的不必要损失。
然而,采用人工(即核保员)核保需要消耗大量的人力资源,效率低下,且核保的准确性极易受到人工主观性影响,故稳定性得到不到保障。有鉴于此,如何提高核保效率以及核保准确性和稳定性成为亟待解决的问题。
发明内容
本申请提供一种核保方法及相关装置、设备。
本申请第一方面提供了一种核保方法,包括:利用目标核保单的图像数据,获取目标核保单的内容数据;利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果。
因此,通过利用目标核保单的图像数据,得到目标核保单的内容数据,并利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果,能够免于人工核保而带来的高成本和低效率,从而能够提高核保效率,此外由于核保过程不受主观影响,故能够提高核保准确性和稳定性。
其中,利用目标核保单的图像数据,获取目标核保单的内容数据包括:对目标核保单的图像数据进行识别,得到目标核保单的内容数据。
因此,通过对目标核保单的图像数据进行识别,得到目标核保单的内容数据,能够免于人工录入目标核保单的内容,故能够降低人力成本,提高效率。
其中,对目标核保单的图像数据进行识别,得到目标核保单的内容数据包括:对图像数据进行文本检测,得到若干文本区域;对每个文本区域进行文本识别,得到文本数据;将文本数据作为目标核保单的内容数据,或者,将文本数据划分为至少一个属性数据,并将至少一个属性数据作为目标核保单的内容数据。
因此,通过对图像数据进行文本检测,得到若干文本区域,并对每个文本区域进行文本识别,得到文本数据,从而将文本数据作为目标核保单的内容数据,或者将文本数据划分为至少一个属性数据,并将至少一个属性数据作为目标核保单的内容数据,能够准确地识别出目标核保单的内容数据,从而能够有利于提高核保准确性。
其中,对图像数据进行文本检测,得到若干文本区域包括:利用文本检测模型对图像数据进行文本检测,得到若干文本区域;和/或,对每个文本区域进行文本识别,得到文本数据包括:利用文本识别模型对每个文本区域进行文本识别,得到文本数据;和/或,将文本数据划分为至少一个属性数据包括:利用预设属性匹配规则在文本数据中查找出至少一个属性名称,并从文本数据中读取分别与至少一个属性名称对应的内容作为至少一个属性数据。
因此,利用文本检测模型对图像数据文本检测,得到若干文本区域,利用文本识别模型对每个文本区域进行文本识别,得到文本数据,能够提高图像数据识别的准确性和效率,通过利用预设属性匹配规则在文本数据中查找出至少一个属性名称,并从文本数据中读取分别与至少一个属性名称对应的内容作为至少一个属性数据,能够根据属性,准确地匹配出后续核保所需的属性数据并作为内容数据,从而能够有利于提高后续核保的准确性。
其中,在利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果之前,方法还包括:利用目标核保单的内容数据,生成具有预设数据特征的目标核保单的特征数据;利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果,包括:利用人工智能核保模型对目标核保单的内容数据和特征数据进行处理,得到目标核保单的核保结果。
因此,利用目标核保单的内容数据生成具有预设数据特征的目标核保单的特征数据,能够有利于使人工智能核保模型获得更多知识,故在利用人工智能核保模型对目标核保单的内容数据和特征数据进行处理时,能够使得到的目标核保单的核保结果更加准确。
其中,在利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果之前,方法还包括:确定人工智能核保模型的各输入数据所属的数据类型,其中,数据类型包括连续型数据和离散型数据;利用不同的预设预处理方式分别对连续型数据和离散型数据进行预处理。
因此,通过确定人工智能核保模型的各输入数据所属的数据类型,并利用不同的预设处理方法对不同数据类型的数据进行预处理,能够有利于使人工智能核保模型更加深入地理解数据,从而能够有利于提高核保准确性。
其中,确定人工智能核保模型的各输入数据所属的数据类型,包括:若输入数据为数值类数据,则确定为连续型数据;若输入数据为非数值类数据,则确定为离散型数据;利用不同的预设预处理方式分别对连续型数据和离散型数据进行预处理,包括:将连续型数据进行高斯分布化处理;和/或,将离散型数据进行编码。
因此,将数值类数据确定为连续型数据,对连续型数据采用高斯分布化处理,将非数值类数据确定为离散型数据,对离散型数据进行编码,能够有利于使人工智能核保模型更加深入地理解数据,从而能够有利于提高核保准确性。
其中,人工智能核保模型包括机器学习模型、深度学习模型中的任一种;和/或,人工智能核保模型是利用标注有真实核保结果的样本保单数据训练得到的。
因此,通过将人工智能核保模型设置为包括机器学习模型、深度学习模型中的任一种,利用标注有真实核保结果的样本保单数据训练得到人工智能核保模型,能够有利于提高人工智能核保模型的准确性。
其中,人工智能核保模型的输入数据包括以下至少一种:投保人和被保人的当前属性数据、历史属性数据、既往病史数据;和/或,核保结果包括:保单处理类别及保单处理类别的预测置信度;其中,保单处理类别包括标保、加费、拒保中的至少一者。
因此,通过将人工智能核保模型的输入数据设置为包括以下至少一种:投保人和被保人的当前属性数据、历史属性数据、既往病史数据,能够有利于扩大人工智能核保模型的输入数据的覆盖范围,从而能够有利于提高人工智能核保模型的核保准确性;通过将核保结果设置为包括:保单处理类别及保单处理类别的预测置信度,且保单处理类别包括标保、加费、拒保中的至少一者,能够提高核保结果的自由度,并能够直观地体现各种核保结果的程度。
本申请第二方面提供了一种核保装置,包括:数据获取模块和数据处理模块,数据获取模块用于利用目标核保单的图像数据,获取目标核保单的内容数据;数据处理模块用于利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果。
本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的核保方法。
本申请第四方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的核保方法。
上述方案,通过利用目标核保单的图像数据,得到目标核保单的内容数据,并利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果,能够免于人工核保而带来的高成本和低效率,从而能够提高核保效率,此外由于核保过程不受主观影响,故能够提高核保准确性和稳定性。
附图说明
图1是本申请核保方法一实施例的流程示意图;
图2是图1中步骤S11一实施例的流程示意图;
图3是本申请核保方法另一实施例的流程示意图;
图4是本申请核保装置一实施例的框架示意图;
图5是本申请电子设备一实施例的框架示意图;
图6是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请核保方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S11:利用目标核保单的图像数据,获取目标核保单的内容数据。
目标核保单的图像数据可以是对目标核保单进行拍摄得到的,例如,利用手机、平板电脑等移动终端对目标核保单进行拍摄,得到其图像数据;或者,目标核保单的图像数据也可以是对目标核保单进行扫描得到的,例如,利用扫描仪、带有扫描功能的打印机等文印设备对目标核保单进行扫描,得到其图像数据,在此不做限定。目标核保单具体可以包括但不限于:健康保险单、意外保险单、少儿保险单等,此外,目标核保险单还可以包括车险等,在此不做限定。
在一个实施场景中,为了能够免于利用人工录入目标核保单的内容,可以对目标核保单的图像数据进行识别,得到目标核保单的内容数据,从而能够降低人力成本,提高核保效率。在一个具体的实施场景中,为了提高识别准确性,还可以在对目标核保单的图像数据进行识别之前,对目标核保单进行预处理操作,预处理操作可以包括但不限于:二值化处理、降噪处理、几何变换处理(如透视、扭曲、旋转等)、畸变矫正处理、去除模糊处理、图像增强处理、光线矫正处理,从而能够缓解图像数据可能存在的模糊、扭曲、畸变、光线不清等问题,进而能够有利于提高后续识别的准确性。
步骤S12:利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果。
人工智能核保模型可以包括机器学习模型、深度学习模型中的任一种。例如,人工智能核保模型可以包括线性模型、树模型、支持向量机等机器学习模型,或者,例如,人工智能核保模型还可以包括ANN(Artificial Neural Network,人工神经网络)、DeepFM、xDeepFM、NCF(Neural Collaborative Filtering,神经协同过滤)等深度学习模型。在一个实施场景中,为了提高核保结果的准确性,还可以将人工智能核保模型的输入数据设置为包括投保人和被保人的当前属性数据、历史属性数据、既往病史数据中的至少一种,从而能够提高输入数据的覆盖范围,进而能够有利于提高核保的准确性。
核保结果可以包括保单处理类别(如,标保、加费、拒保中的至少一者)以及保单处理类别的预测置信度,预测置信度可以表示倾向于保单处理类别的程度。例如,核保结果包括:保单处理类别为标保、预测置信度为90%,故可以认为倾向于标保的程度有90%,从而可以对目标核保单进行标保处理;或者,例如,核保结果包括:保单处理类别为拒保、预测置信度为98%,故可以认为倾向于拒保的程度有98%,从而可以对目标核保单进行拒保处理,其他实施场景可以以此类推,在此不再一一举例。
在一个实施场景中,为了提高核保的准确性,还可以利用目标核保单的内容数据,生成具有预设数据特征的目标核保单的特征数据,从而利用人工智能核保模型对目标核保单的内容数据和特征数据进行处理,得到目标核保单的核保结果,进而能够有利于使人工智能核保模型获得更多知识,使得到的目标核保单的核保结果更加准确。例如,目标核保单的内容数据中包括身高数据和体重数据,而单纯的身高数据和体重数据无助于人工智能核保模型获得更多的知识,特别是关于投保人和被保人身体健康状态的知识,故预设数据特征可以包括身体质量指数(Body Mass Index,BMI),从而可以利用体重除以身高的平方,获得身体健康指数,其他场景可以以此类推,从而能够根据目标核保单的内容数据,获得更多的特征数据,以描述投保人和被保人的常驻属性、历史行为、与所投保险业务的契合度等等,以使得人工智能核保模型能够获得更多的知识,提高核保准确性。
在一个实施场景中,人工智能核保模型可以是利用标注有真实核保结果的样本保单数据训练得到的。具体地,可以利用人工智能核保模型对样本保单数据进行处理,得到相应的预测核保结果,并利用预测核保结果和真实核保结果,确定人工智能核保模型的损失值,再利用损失值调整人工智能核保模型的参数。在一个具体的实施场景中,当损失值小于一预设损失值阈值时,可以结束训练。在另一个实施场景中,当训练次数达到预设次数阈值时,可以结束训练,在此不做限定。在又一个具体的实施场景中,可以采用随机梯度下降(Stochastic Gradient Descent,SGD)、批量梯度下降(Batch Gradient Descent,BGD)、小批量梯度下降(Mini-Batch Gradient Descent,MBGD)等方式,利用损失值对人工智能核保模型的参数进行调整,其中,批量梯度下降是指在每一次迭代时,使用所有样本来进行参数更新;随机梯度下降是指在每一次迭代时,使用一个样本来进行参数更新;小批量梯度下降是指在每一次迭代时,使用一批样本来进行参数更新,在此不再赘述。
在一个实施场景中,为了使人工智能核保模型能够适应于业务方的业务更新,例如,在标保、加费、拒保等保单处理类别基础上新增保单处理类别,或者,对标保、加费、拒保等已有的保单处理类别进行进一步细化等等,在此不做限定,并利用人工智能核保模型对重新标注的样本保单数据进行处理,得到相应的预测核保结果,采用预测核保结果和重新标注的真实核保结果,确定人工智能核保模型的损失值,从而利用损失值对人工智能核保模型的参数进行调整,具体可以参阅前述相关步骤,在此不再赘述。
在一个实施场景中,可以将人工智能核保模型设置于保险公司的业务系统中,或者设置于为保险公司提供服务的第三方公司的业务系统中,从而将保险公司或第三方公司现有的业务系统中,利用人工或策略引擎等进行核保的流程,替换为利用人工智能核保模型对目标核保单进行处理的流程,从而能够实现对传统核保的人工智能赋能。
上述方案,通过利用目标核保单的图像数据,得到目标核保单的内容数据,并利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果,能够免于人工核保而带来的高成本和低效率,从而能够提高核保效率,此外由于核保过程不受主观影响,故能够提高核保准确性和稳定性。
请参阅图2,图2是图1中步骤S11一实施例的流程示意图。具体地,图2是对目标核保单的图像数据进行识别而得到内容数据一实施例的流程示意图,包括如下步骤:
步骤S111:对图像数据进行文本检测,得到若干文本区域。
在一个实施场景中,可以利用文本检测模型对图像数据进行文本检测,得到若干文本区域。文本检测模型可以是利用预先标注有文本区域的样本图像数据训练得到的。在一个具体的实施场景中,文本检测模型可以采用YOLO(You Only Look Once)、SSD(SingleShot Multi-box Detector)、Faster-RCNN等网络,在此不做限定。在另一个具体的实施场景中,对图像数据的文本检测可以包括对文本位置、范围、布局的检测,以及版面分析、文字行检查等等。
步骤S112:对每个文本区域进行文本识别,得到文本数据。
在一个实施场景中,可以利用文本识别模型对每个文本区域进行文本识别,得到文本数据。在一个具体的实施场景中,文本识别模型可以是利用标注有保单的内容数据的训练集训练得到的。在另一个具体的实施场景中,文本识别模型可以采用CRNN(Convolutional Recurrent Neural Network,卷积循环神经网络)网络,从而利用CRNN的CNN(Convolutional Neural Network,卷积神经网络)对文本区域进行特征提取,得到文本区域的图像特征,并采用CRNN的RNN(Recurrent Neural Network,循环神经网络)对图像特征进行预测,得到预测结果,再利用CRNN的CTC(Connectionist TemporalClassification,联结主义时间分类)对预测结果进行转录,得到文本数据。在其他实施场景中,文本识别模型也可以采用其他网络模型,在此不做限定。
步骤S113:将文本数据作为目标核保单的内容数据,或者,将文本数据划分为至少一个属性数据,并将至少一个属性数据作为目标核保单的内容数据。
在一个实施场景中,可以根据文本数据在图像数据中所在的位置,以及目标核保单的版面布局,将全部文本数据或文本数据中的一部分作为目标核保单的内容数据,例如,目标核保单的版面布局中最后为用户签字栏,故可以选取位置不在目标核保单最后的文本数据作为目标核保单的内容数据。具体可以根据实际应用而进行设置,在此不做限定。
在另一个实施场景中,还可以利用预设属性匹配规则在文本数据中查找出至少一个属性名称,并从文本数据中读取分别与至少一个属性名称对应的内容作为至少一个属性数据,以作为内容数据。在一个具体的实施场景中,预设属性匹配规则可以是正则表达式,例如可以采用正则表达式“/^男$|^女&/”在文本数据中找出性别对应的属性数据,其他属性数据可以以此类推,在此不再一一举例。在另一个具体的实施场景中,至少一个属性数据可以包括但不限于:姓名数据、性别数据、身高数据、体重数据、年龄数据,在此不再赘述。在又一个具体的实施场景中,属性名称可以根据实际情况预先设置,从而可以从文本数据中获取与预先设置的属性名称对应的内容作为属性数据,例如,属性名称可以预先设置包括:性别、身高、体重、年龄,从而可以从文本数据中分别获取与性别、身高、体重、年龄对应的内容作为属性数据,如:关于性别的属性数据“男”、关于身高的属性数据“175厘米”、关于体重的属性数据“70千克”、关于年龄的属性数据“22岁”,其他场景可以此类推,在此不再一一举例。故此,通过预选设置的属性名称,可以将全部文本数据或文本数据中的一部分作为核保所需的内容数据。
在一个实施场景中,可以将上述文本检测模型、文本识别模型和从文本数据中提取内容数据的方式设置于保险公司或第三方公司的业务系统中,从而将保险公司或第三方公司现有业务系统中采用人工读取内容数据的流程,替换为利用上述模型读取出内容数据的流程,进而能够与人工智能核保模型协同实现线上核保,降低成本,提高效率,且也有利于提高用户体验。
区别于前述实施例,通过对图像数据进行文本检测,得到若干文本区域,并对每个文本区域进行文本识别,得到文本数据,从而将文本数据作为目标核保单的内容数据,或者将文本数据划分为至少一个属性数据,并将至少一个属性数据作为目标核保单的内容数据,能够准确地识别出目标核保单的内容数据,从而能够有利于提高核保准确性。
请参阅图3,图3是本申请核保方法另一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S31:利用目标核保单的图像数据,获取目标核保单的内容数据。
具体请参阅前述实施例中的步骤。
步骤S32:确定人工智能核保模型的各输入数据所属的数据类型,其中,数据类型包括连续型数据和离散型数据。
在一个实施场景中,若输入数据为数值类数据,则可以确定为连续型数据。例如,身高数据“171厘米”、体重数据“120千克”、年龄数据“20岁”等,均可以确定为连续型数据,其他应用场景,可以以此类推,在此不再一一举例。在另一个实施场景中,若输入数据为非数值类数据,则可以确定为离散型数据。例如,性别数据“男”、婚姻状况数据“未婚”等,均可以确定为离散型数据,其他应用场景,可以以此类推,在此不再一一举例。
步骤S33:利用不同的预设预处理方式分别对连续型数据和离散型数据进行预处理。
在一个实施场景中,可以将连续型数据进行高斯分布化处理,例如,对连续型数据进行归一化、离散化,获取对数(log)等处理,使连续型数据的分布趋于高斯分布。在另一个实施场景中,可以对离散型数据进行编码,例如,对于类别型的离散型数据可以采用独热(one-hot)编码、哈希(hash)编码等编码方式,独热编码又称一位有效编码,其采用多位状态寄存器来对多个状态进行编码,每个状态都对应有独立的寄存位,且在任意时刻,其中只有一位有效,如三个状态可以分别表示为:001、010、100,其他情况可以以此类推,在此不再一一举例,对于字符型的离散型数据可以将其转换为数值型数据,以便人工智能核保模型能够更加深入地理解数据。
在一个实施场景中,还可以在对数据进行预处理之前,将数据中的异常值、离群点剔除。异常值和离群点可以是超出预设范围内的值,例如,对于身高数据,若其数值为10厘米,则为异常值、离群点;对于体重数据,若其数值为100克,则为异常值、离群点,其他情况可以以此类推,在此不再一一举例。通过在对数据进行预处理之前,将数据中的异常值、离群点剔除,可以规避异常值和离群点带来的危害,能够有利于提高后续核保的准确性。
步骤S34:利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果。
具体可以参阅前述实施中的步骤。
区别于前述实施例,通过确定人工智能核保模型的各输入数据所属的数据类型,并利用不同的预设处理方法对不同数据类型的数据进行预处理,能够有利于使人工智能核保模型更加深入地理解数据,从而能够有利于提高核保准确性。
请参阅图4,图4是本申请核保装置40一实施例的框架示意图。核保装置40包括数据处理模块41和数据处理模块42,数据获取模块41用于利用目标核保单的图像数据,获取目标核保单的内容数据;数据处理模块42用于利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果。
上述方案,通过利用目标核保单的图像数据,得到目标核保单的内容数据,并利用人工智能核保模型对目标核保单的内容数据进行处理,得到目标核保单的核保结果,能够免于人工核保而带来的高成本和低效率,从而能够提高核保效率,此外由于核保过程不受主观影响,故能够提高核保准确性和稳定性。
在一些实施例中,数据获取模块41具体用于对目标核保单的图像数据进行识别,得到目标核保单的内容数据。
区别于前述实施例,通过对目标核保单的图像数据进行识别,得到目标核保单的内容数据,能够免于人工录入目标核保单的内容,故能够降低人力成本,提高效率。
在一些实施例中,数据获取模块41包括文本检测子模块,用于对图像数据进行文本检测,得到若干文本区域,数据获取模块41包括文本识别子模块,用于对每个文本区域进行文本识别,得到文本数据,数据获取模块41包括数据筛选子模块,用于将文本数据作为目标核保单的内容数据,或者,将文本数据划分为至少一个属性数据,并将至少一个属性数据作为目标核保单的内容数据。
区别于前述实施例,通过对图像数据进行文本检测,得到若干文本区域,并对每个文本区域进行文本识别,得到文本数据,从而将文本数据作为目标核保单的内容数据,或者将文本数据划分为至少一个属性数据,并将至少一个属性数据作为目标核保单的内容数据,能够准确地识别出目标核保单的内容数据,从而能够有利于提高核保准确性。
在一些实施例中,文本检测子模块具体用于利用文本检测模型对图像数据进行文本检测,得到若干文本区域,文本识别子模块具体用于利用文本识别模型对每个文本区域进行文本识别,得到文本数据,数据筛选子模块具体用于利用预设属性匹配规则在文本数据中查找出至少一个属性名称,并从文本数据中读取分别与至少一个属性名称对应的内容作为至少一个属性数据。
区别于前述实施例,利用文本检测模型对图像数据文本检测,得到若干文本区域,利用文本识别模型对每个文本区域进行文本识别,得到文本数据,能够提高图像数据识别的准确性和效率,通过利用预设属性匹配规则在文本数据中查找出至少一个属性名称,并从文本数据中读取分别与至少一个属性名称对应的内容作为至少一个属性数据,能够根据属性,准确地匹配出后续核保所需的属性数据并作为内容数据,从而能够有利于提高后续核保的准确性。
在一些实施例中,核保装置40还包括数据生成模块,用于利用目标核保单的内容数据,生成具有预设数据特征的目标核保单的特征数据,数据处理模块42具体用于利用人工智能核保模型对目标核保单的内容数据和特征数据进行处理,得到目标核保单的核保结果。
区别于前述实施例,利用目标核保单的内容数据生成具有预设数据特征的目标核保单的特征数据,能够有利于使人工智能核保模型获得更多知识,故在利用人工智能核保模型对目标核保单的内容数据和特征数据进行处理时,能够使得到的目标核保单的核保结果更加准确。
在一些实施例中,核保装置40还包括类型确定模块,用于确定人工智能核保模型的各输入数据所属的数据类型,其中,数据类型包括连续型数据和离散型数据,核保装置40还包括预处理模块,用于利用不同的预设预处理方式分别对连续型数据和离散型数据进行预处理。
区别于前述实施例,通过确定人工智能核保模型的各输入数据所属的数据类型,并利用不同的预设处理方法对不同数据类型的数据进行预处理,能够有利于使人工智能核保模型更加深入地理解数据,从而能够有利于提高核保准确性。
在一些实施例中,类型确定模块具体用于在输入数据为数值类数据时,确定为连续性数据;类型确定模块还具体用于在输入数据为非数值类数据时,确定为离散型数据,预处理模块具体用于将连续型数据进行高斯分布化处理,预处理模块具体用于将离散型数据进行编码。
区别于前述实施例,将数值类数据确定为连续型数据,对连续型数据采用高斯分布化处理,将非数值类数据确定为离散型数据,对离散型数据进行编码,能够有利于使人工智能核保模型更加深入地理解数据,从而能够有利于提高核保准确性。
在一些实施例中,人工智能核保模型包括机器学习模型、深度学习模型中的任一种;和/或,人工智能核保模型是利用标注有真实核保结果的样本保单数据训练得到的。
区别于前述实施例,通过将人工智能核保模型设置为包括机器学习模型、深度学习模型中的任一种,利用标注有真实核保结果的样本保单数据训练得到人工智能核保模型,能够有利于提高人工智能核保模型的准确性。
在一些实施例中,人工智能核保模型的输入数据包括以下至少一种:投保人和被保人的当前属性数据、历史属性数据、既往病史数据;和/或,核保结果包括:保单处理类别及保单处理类别的预测置信度;其中,保单处理类别包括标保、加费、拒保中的至少一者。
区别于前述实施例,通过将人工智能核保模型的输入数据设置为包括以下至少一种:投保人和被保人的当前属性数据、历史属性数据、既往病史数据,能够有利于扩大人工智能核保模型的输入数据的覆盖范围,从而能够有利于提高人工智能核保模型的核保准确性;通过将核保结果设置为包括:保单处理类别及保单处理类别的预测置信度,且保单处理类别包括标保、加费、拒保中的至少一者,能够提高核保结果的自由度,并能够直观地体现各种核保结果的程度。
请参阅图5,图5是本申请电子设备50一实施例的框架示意图。电子设备50包括相互耦接的存储器51和处理器52,处理器52用于执行存储器51中存储的程序指令,以实现上述任一核保方法实施例中的步骤。在一个具体的实施场景中,电子设备50可以包括但不限于:微型计算机、服务器,此外,电子设备50还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
具体而言,处理器52用于控制其自身以及存储器51以实现上述任一核保方法实施例中的步骤。处理器52还可以称为CPU(Central Processing Unit,中央处理单元)。处理器52可能是一种集成电路芯片,具有信号的处理能力。处理器52还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器52可以由集成电路芯片共同实现。
上述方案,能够免于人工核保而带来的高成本和低效率,从而能够提高核保效率,此外由于核保过程不受主观影响,故能够提高核保准确性和稳定性。
请参阅图6,图6为本申请计算机可读存储介质60一实施例的框架示意图。计算机可读存储介质60存储有能够被处理器运行的程序指令601,程序指令601用于实现上述任一核保方法实施例中的步骤。
上述方案,能够免于人工核保而带来的高成本和低效率,从而能够提高核保效率,此外由于核保过程不受主观影响,故能够提高核保准确性和稳定性。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (12)
1.一种核保方法,其特征在于,包括:
利用目标核保单的图像数据,获取所述目标核保单的内容数据;
利用人工智能核保模型对所述目标核保单的内容数据进行处理,得到所述目标核保单的核保结果。
2.根据权利要求1所述的核保方法,其特征在于,所述利用目标核保单的图像数据,获取所述目标核保单的内容数据包括:
对所述目标核保单的图像数据进行识别,得到所述目标核保单的内容数据。
3.根据权利要求2所述的核保方法,其特征在于,所述对所述目标核保单的图像数据进行识别,得到所述目标核保单的内容数据包括:
对所述图像数据进行文本检测,得到若干文本区域;
对每个所述文本区域进行文本识别,得到文本数据;
将所述文本数据作为所述目标核保单的内容数据,或者,将所述文本数据划分为至少一个属性数据,并将所述至少一个属性数据作为所述目标核保单的内容数据。
4.根据权利要求3所述的核保方法,其特征在于,所述对所述图像数据进行文本检测,得到若干文本区域包括:
利用文本检测模型对所述图像数据进行文本检测,得到若干文本区域;
和/或,所述对每个所述文本区域进行文本识别,得到文本数据包括:
利用文本识别模型对每个所述文本区域进行文本识别,得到文本数据;
和/或,所述将所述文本数据划分为至少一个属性数据包括:
利用预设属性匹配规则在所述文本数据中查找出至少一个属性名称,并从所述文本数据中读取分别与所述至少一个属性名称对应的内容作为至少一个属性数据。
5.根据权利要求1至4任一项所述的核保方法,其特征在于,在所述利用人工智能核保模型对所述目标核保单的内容数据进行处理,得到所述目标核保单的核保结果之前,所述方法还包括:
利用所述目标核保单的内容数据,生成具有预设数据特征的所述目标核保单的特征数据;
所述利用人工智能核保模型对所述目标核保单的内容数据进行处理,得到所述目标核保单的核保结果,包括:
利用所述人工智能核保模型对所述目标核保单的内容数据和特征数据进行处理,得到所述目标核保单的核保结果。
6.根据权利要求1至5任一项所述的核保方法,其特征在于,在所述利用人工智能核保模型对所述目标核保单的内容数据进行处理,得到所述目标核保单的核保结果之前,所述方法还包括:
确定所述人工智能核保模型的各输入数据所属的数据类型,其中,所述数据类型包括连续型数据和离散型数据;
利用不同的预设预处理方式分别对所述连续型数据和所述离散型数据进行预处理。
7.根据权利要求6所述的核保方法,其特征在于,所述确定所述人工智能核保模型的各输入数据所属的数据类型,包括:
若所述输入数据为数值类数据,则确定为连续型数据;
若所述输入数据为非数值类数据,则确定为离散型数据;
所述利用不同的预设预处理方式分别对所述连续型数据和所述离散型数据进行预处理,包括:
将所述连续型数据进行高斯分布化处理;和/或,
将所述离散型数据进行编码。
8.根据权利要求1至7任一项所述的核保方法,其特征在于,所述人工智能核保模型包括机器学习模型、深度学习模型中的任一种;和/或,
所述人工智能核保模型是利用标注有真实核保结果的样本保单数据训练得到的。
9.根据权利要求1至8任一项所述的核保方法,其特征在于,所述人工智能核保模型的输入数据包括以下至少一种:投保人和被保人的当前属性数据、历史属性数据、既往病史数据;和/或,
所述核保结果包括:保单处理类别及所述保单处理类别的预测置信度;其中,所述保单处理类别包括标保、加费、拒保中的至少一者。
10.一种核保装置,其特征在于,包括:
数据获取模块,用于利用目标核保单的图像数据,获取所述目标核保单的内容数据;
数据处理模块,用于利用人工智能核保模型对所述目标核保单的内容数据进行处理,得到所述目标核保单的核保结果。
11.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至9任一项所述的核保方法。
12.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至9任一项所述的核保方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010220567.5A CN111507850A (zh) | 2020-03-25 | 2020-03-25 | 核保方法及相关装置、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010220567.5A CN111507850A (zh) | 2020-03-25 | 2020-03-25 | 核保方法及相关装置、设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111507850A true CN111507850A (zh) | 2020-08-07 |
Family
ID=71869002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010220567.5A Withdrawn CN111507850A (zh) | 2020-03-25 | 2020-03-25 | 核保方法及相关装置、设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111507850A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112419076A (zh) * | 2020-11-27 | 2021-02-26 | 好人生(上海)健康科技有限公司 | 一种基于大数据的健康保险核保系统、方法及商保云平台 |
CN113723288A (zh) * | 2021-08-30 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于多模态混合模型的业务数据处理方法及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080154651A1 (en) * | 2006-12-22 | 2008-06-26 | Hartford Fire Insurance Company | System and method for utilizing interrelated computerized predictive models |
CN106600417A (zh) * | 2016-11-09 | 2017-04-26 | 前海企保科技(深圳)有限公司 | 一种财产保险保单的核保方法和装置 |
CN108876166A (zh) * | 2018-06-27 | 2018-11-23 | 平安科技(深圳)有限公司 | 财务风险验证处理方法、装置、计算机设备及存储介质 |
WO2019019381A1 (zh) * | 2017-07-25 | 2019-01-31 | 平安科技(深圳)有限公司 | 批量处理保单任务的方法、装置、计算机设备及存储介质 |
WO2019024771A1 (zh) * | 2017-07-31 | 2019-02-07 | 阿里巴巴集团控股有限公司 | 车险图像处理方法、装置、服务器及系统 |
CN109410071A (zh) * | 2018-09-17 | 2019-03-01 | 平安科技(深圳)有限公司 | 核保数据处理方法、装置、计算机设备和存储介质 |
CN110555372A (zh) * | 2019-07-22 | 2019-12-10 | 深圳壹账通智能科技有限公司 | 数据录入方法、装置、设备及存储介质 |
CN110619535A (zh) * | 2018-06-19 | 2019-12-27 | 华为技术有限公司 | 一种数据处理方法及其装置 |
CN110852894A (zh) * | 2019-11-04 | 2020-02-28 | 泰康保险集团股份有限公司 | 保险核保方法及装置、计算机存储介质、电子设备 |
CN110880149A (zh) * | 2019-11-29 | 2020-03-13 | 上海商汤智能科技有限公司 | 信息处理方法及装置、电子设备和存储介质 |
-
2020
- 2020-03-25 CN CN202010220567.5A patent/CN111507850A/zh not_active Withdrawn
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080154651A1 (en) * | 2006-12-22 | 2008-06-26 | Hartford Fire Insurance Company | System and method for utilizing interrelated computerized predictive models |
CN106600417A (zh) * | 2016-11-09 | 2017-04-26 | 前海企保科技(深圳)有限公司 | 一种财产保险保单的核保方法和装置 |
WO2019019381A1 (zh) * | 2017-07-25 | 2019-01-31 | 平安科技(深圳)有限公司 | 批量处理保单任务的方法、装置、计算机设备及存储介质 |
WO2019024771A1 (zh) * | 2017-07-31 | 2019-02-07 | 阿里巴巴集团控股有限公司 | 车险图像处理方法、装置、服务器及系统 |
CN110619535A (zh) * | 2018-06-19 | 2019-12-27 | 华为技术有限公司 | 一种数据处理方法及其装置 |
CN108876166A (zh) * | 2018-06-27 | 2018-11-23 | 平安科技(深圳)有限公司 | 财务风险验证处理方法、装置、计算机设备及存储介质 |
CN109410071A (zh) * | 2018-09-17 | 2019-03-01 | 平安科技(深圳)有限公司 | 核保数据处理方法、装置、计算机设备和存储介质 |
CN110555372A (zh) * | 2019-07-22 | 2019-12-10 | 深圳壹账通智能科技有限公司 | 数据录入方法、装置、设备及存储介质 |
CN110852894A (zh) * | 2019-11-04 | 2020-02-28 | 泰康保险集团股份有限公司 | 保险核保方法及装置、计算机存储介质、电子设备 |
CN110880149A (zh) * | 2019-11-29 | 2020-03-13 | 上海商汤智能科技有限公司 | 信息处理方法及装置、电子设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
刘华平;陈华友;: "基于粗糙集理论的投资行业的CRM模型研究", 统计与决策, no. 21, pages 21 - 23 * |
王 玮: "人工智能在保险行业的应用研究", 互联网天地, no. 03, pages 36 - 43 * |
王国军;: "科技赋能保险全业务链创新发展", 金融电子化, no. 03, pages 36 - 37 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112419076A (zh) * | 2020-11-27 | 2021-02-26 | 好人生(上海)健康科技有限公司 | 一种基于大数据的健康保险核保系统、方法及商保云平台 |
CN113723288A (zh) * | 2021-08-30 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于多模态混合模型的业务数据处理方法及装置 |
WO2023029353A1 (zh) * | 2021-08-30 | 2023-03-09 | 平安科技(深圳)有限公司 | 基于多模态混合模型的业务数据处理方法及装置 |
CN113723288B (zh) * | 2021-08-30 | 2023-10-27 | 平安科技(深圳)有限公司 | 基于多模态混合模型的业务数据处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
CN110659318B (zh) | 基于大数据的策略推送方法、系统及计算机设备 | |
WO2021164232A1 (zh) | 用户识别方法、装置、设备及存储介质 | |
CN110555372A (zh) | 数据录入方法、装置、设备及存储介质 | |
CN115982765A (zh) | 数据脱敏方法、装置、设备及计算机可读存储介质 | |
EP3680850A1 (en) | Method and system for determining risk score for a contract document | |
US20240012846A1 (en) | Systems and methods for parsing log files using classification and a plurality of neural networks | |
CN111046879A (zh) | 证件图像分类方法、装置、计算机设备及可读存储介质 | |
CN110363084A (zh) | 一种上课状态检测方法、装置、存储介质及电子 | |
CN112036295B (zh) | 票据图像处理方法、装置、存储介质及电子设备 | |
CN111915580A (zh) | 烟叶分级方法、系统、终端设备及存储介质 | |
CN109766435A (zh) | 弹幕类别识别方法、装置、设备及存储介质 | |
CN111507850A (zh) | 核保方法及相关装置、设备 | |
CN111159481B (zh) | 图数据的边预测方法、装置及终端设备 | |
CN117454426A (zh) | 一种理赔资料信息脱敏采集方法、装置及系统 | |
CN111695357A (zh) | 文本标注方法及相关产品 | |
CN113434672B (zh) | 文本类型智能识别方法、装置、设备及介质 | |
CN110232328A (zh) | 一种征信报告解析方法、装置及计算机可读存储介质 | |
CN111985519B (zh) | 文本相似度量化方法、设备及系统 | |
CN112818946A (zh) | 年龄识别模型的训练、年龄识别方法、装置及电子设备 | |
CN111507849A (zh) | 核保方法及相关装置、设备 | |
CN113032524A (zh) | 商标侵权识别方法、终端设备及存储介质 | |
CN117407875A (zh) | 一种恶意代码分类方法、系统及电子设备 | |
CN109657710B (zh) | 数据筛选方法、装置、服务器及存储介质 | |
CN111368838A (zh) | 一种举报截图的识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200807 |
|
WW01 | Invention patent application withdrawn after publication |