CN109035032A - 数据结构化处理方法、装置、计算机设备及存储介质 - Google Patents
数据结构化处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109035032A CN109035032A CN201810592868.3A CN201810592868A CN109035032A CN 109035032 A CN109035032 A CN 109035032A CN 201810592868 A CN201810592868 A CN 201810592868A CN 109035032 A CN109035032 A CN 109035032A
- Authority
- CN
- China
- Prior art keywords
- insurance
- target
- keyword
- responsibility
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开一种数据结构化处理方法、装置、计算机设备及存储介质,该方法包括:获取保险合同内容;对保险合同内容进行识别,获取对应的保险类型和保险责任条款;基于保险类型获取对应的理赔关键词,采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任;将目标保险责任和每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度;将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中;获取理赔金额确定请求,根据目标数据表对理赔金额确定请求进行理赔金额计算,实现快速分解保险合同中保险责任条款。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种数据结构化处理方法、装置、计算机设备及存储介质。
背景技术
随着经济发展,随着越来越多的人购买保险,发生理赔时,需要计算理赔金额,但从保险合同中获取相关信息并进行理赔计算的过程不便利;而且,不同保险类型的保险合同不同,每份保险合同中存在多种保险责任,将保险合同中不同的保险责任条款进行分解,获取不同保险责任中计算理赔金额的相关内容时,分解工作量大,费时费力。
发明内容
基于此,有必要针对上述技术问题,提供一种可以快速分解保险合同中保险责任条款的数据结构化处理方法、装置、计算机设备及存储介质。
一种数据结构化处理方法,包括:
通过预设的程序接口,获取保险合同内容;
对保险合同内容进行识别,获取对应的保险类型和保险责任条款;
基于保险类型获取对应的理赔关键词,采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任;
将目标保险责任和每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度;
将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中;
获取理赔金额确定请求,根据所述目标数据表对所述理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
一种数据结构化处理装置,包括:
内容获取模块,用于通过预设的程序接口,获取保险合同内容;
识别处理模块,用于对保险合同内容进行识别,获取对应的保险类型和保险责任条款;
第一匹配模块,用于基于保险类型获取对应的理赔关键词,采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任;
第二匹配模块,用于将目标保险责任和每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度;
数据表生成模块,用于将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中;
理赔计算模块,用于获取理赔金额确定请求,根据所述目标数据表对所述理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述数据结构化处理方法的步骤。
一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述数据结构化处理方法的步骤。
上述数据结构化处理方法、装置、计算机设备及存储介质,通过预设的程序接口获取保险合同内容,获取保险合同简单快速,以便后续对保险合同内容进行结构化处理;对保险合同内容进行识别,获取对应的保险类型和保险责任条款,快速查找到保险责任条款的位置,并能通过保险类型获取对应理赔关键词;获取理赔关键词和保险责任条款匹配成功的目标保险责任和与目标保险责任对应的至少一个目标关键词,实现从保险责任条款中快速提取出保险责任及对应的目标关键词,实现方法简单方便,并节省了人力;将每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度,以便获取到每一目标关键词对应的维度字段,通过将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中,解决快速对保险合同进行结构化处理,并将结构化处理的数据存储至目标数据表中;获取理赔金额确定请求,根据所述目标数据表对所述理赔金额确定请求进行理赔金额计算,获取目标理赔金额,提高理赔计算效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中数据结构化处理方法的一应用环境示意图;
图2是本发明一实施例中数据结构化处理方法的一流程图;
图3是本发明一实施例中数据结构化处理方法的一具体流程图;
图4是本发明一实施例中数据结构化处理方法的一具体流程图;
图5是本发明一实施例中数据结构化处理方法的一具体流程图;
图6是本发明一实施例中数据结构化处理方法的一具体流程图;
图7是本发明一实施例中数据结构化处理方法的一具体流程图;
图8是本发明一实施例中数据结构化处理装置的一示意图;
图9是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的数据结构化处理方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。该数据结构化处理方法应用在服务器中,用于对保险合同进行结构化处理,以分解出保险合同中的保险责任条款内容。由于不同险种的保险合同内容中含有不同的保险责任条款,通过对保险合同内容进行分解,并提取保险责任条款内容的关键词,将关键词结构化处理。其中,客户端包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种数据结构化处理方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10:通过预设的程序接口,获取保险合同内容。
其中,程序接口是指服务器中用于接收保险合同的接口。保险合同是指投保人与保险人约定保险权利义务关系的协议。
具体地,在服务器中预先设定一个程序接口,该程序接口用于接收保险合同,通过预设的程序接口接收客户端发送的保险合同,并获取保险合同内容。本实施例中,客户端可以通过电子邮件或本地上传等方式将保险合同内容发送给服务器。其中,客户端是指与服务器相对应,为客户提供本地服务的程序,客户端与服务器通信连接。服务器接收客户端发送的保险合同,并获取保险合同中保险合同内容。
S20:对保险合同内容进行识别,获取对应的保险类型和保险责任条款。
其中,保险合同内容包括保险对象、保险期限、保险金额、保险责任和除外责任等条款,每一保险合同内容对应一保险类型。其中,保险类型是根据保险经营的性质、目的、对象和保险法规要求以及历史习惯等划分的保险类别。以保险对象进行划分,其对应的保险类型主要包括人身保险和财产保险等。保险责任条款是指保险公司按照保险合同的约定,在保险事故发生时所承担的赔偿或给付保险金责任的合同条款。
具体地,可以通过关键词匹配算法或者获取标准保险合同等方式快速获取保险合同内容中的保险类型和保险责任条款。例如,预设关键词库,关键词库中配置保险责任和保险类型对应的关键词;在获取保险合同内容后,通过调用关键词库中关键词,与保险合同内容进行匹配,提取匹配成功关键词,从而获取与保险合同内容相对应的保险类型和保险责任条款。再例如,服务器可根据客户端上传保险合同内容时一并上传的保险单号,快速查找到对应的标准保险合同,标准保险合同中限定保险类型和保险责任条款的具体位置,从而可快速获取保险合同内容中的保险类型和保险责任条款。服务器通过获取对应的保险类型和保险责任条款,以便后续保险类型快速获取到保险责任条款的理赔关键词,节省劳动力,并简单快速;而且,获取到的保险责任条款可有助于快速对保险责任条款进行分解。
S30:基于保险类型获取对应的理赔关键词,采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任。
其中,理赔关键词是指存储在关键词库中存储的关于保险责任条款的关键词。目标保险责任是指从保险责任条款中获取到与理赔关键词匹配成功的保险责任。
具体地,每一保险类型与预设的理赔关键词关联存储在数据库中,服务器可依据步骤S20获取到的保险类型查询数据库,以获取对应的理赔关键词。其中,每一保险类型的理赔关键词可以相同也可以不相同,每一理赔关键词根据历史保险合同中保险责任条款进行设定的,将设定的理赔关键词存储在对应保险类型的关键词库中。
进一步地,服务器根据对保险合同内容进行识别获取的保险类型,获取到与保险类型对应的理赔关键词,将理赔关键词与保险责任条款对应的内容进行相似度计算,当相似度达到预设阈值时,获取保险责任条款中与理赔关键词匹配成功的目标关键词,并根据至少一个目标关键词确定保险责任条款中的保险责任。其中,保险责任对应的至少一个目标关键词可以是等待期、分段条件、理赔条件及理赔金额计算公式等对应的关键词。其中,等待期是指即已经过了免责期,被保险人接受了护理服务也符合领取保险金的条件,但保险公司依然不予给付的期间。分段条件是指依据不同属性进行分段的条件,例如,可依据年龄对投保人的投保行为进行分段,此时年龄为其分段条件。理赔条件是指给予投保人理赔的条件。理赔金额计算公式是指发生理赔时,用于计算投保人可获得理赔金额的计算公式。例如,保险责任的目标关键词可以设为公共交通意外身故保险金、航空意外保险金及假日公共交通意外保险金等;等待期的目标关键词可以设为30天、60天及80天等;分段条件的目标关键词可以设为0-18周岁,18-30周岁,30-60周岁和60周岁以后;理赔条件的目标关键词可以设为医院初步确诊初次发生条款约定的“重大疾病”及“身故”等;理赔金额计算公式目标关键词可以设为“给付1倍保费”及“给付2倍保费”等。
本实施例中,服务器通过保险类型获取对应的理赔关键词,避免了获取所有保险类型的的理赔关键词,造成查询数据量过大,通过将理赔关键词与保险责任条款进行匹配,从保险责任条款中获取与理赔关键词匹配的目标保险责任,并从目标保险责任中提取至少一个目标关键词,快速对保险责任条款进行分解,不需人工分解,节省劳动力。
S40:将目标保险责任和每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度。
数据库维度表是数据库中存储的维度表格。维度字段是指用于限定字段内容的属性或共性的字段。例如,在数据库维度表这一数据表中,维度字段为数据表的表头字段,而字段内容为数据表中的具体内容,在同一维度字段下的字段内容具有相同的属性或者共性,如等待期这一维度字段对应的所有字段内容均具有时间属性。目标维度是指与目标保险责任中的目标关键词对应的维度字段。
具体地,数据库维度表中可按保险类型进行划分,将同一保险类型的保险责任、目标关键词和维度字段作为一个整体进行存储。服务器获取目标保险责任和每一目标关键词,将目标保险责任和每一目标关键词在数据库维度表中进行匹配,其中,数据库维度表中包括多个保险责任和目标关键词及对应的维度字段。例如,数据库维度表包括等待期、分段条件、理赔条件及理赔金额计算公式等维度字段以及对应的字段内容。进一步地,将目标保险责任和每一目标关键词与预设的数据库维度表中的的保险责任、等待期、分段条件、理赔条件、理赔金额计算公式等对应的字段内容进行匹配,当目标保险责任和每一目标关键词与字段内容匹配成功,获取字段内容对应的表头字段(即维度字段)作为目标维度。通过目标保险责任和每一目标关键词快速获取对应的目标维度,实现方法简单快捷。
例如,目标关键词为意外伤害事故、双目永久完全失明、给付1倍保费;数据库维度表中包括保险责任、等待期、分段条件、理赔条件及理赔金额计算公式等维度字段及对应的字段内容。在数据库维度表中,当意外伤害事故与保险责任的对应的字段内容匹配成功,双目永久完全失明与理赔条件的对应的字段内容匹配成功,给付1倍保费与理赔金额计算公式的对应的字段内容匹配成功,将获取到的匹配成功的字段内容对应的维度字段作为目标维度。
S50:将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中。
其中,目标数据表中存储保险类型对应的目标保险责任、目标关键词和目标维度的表格。
具体地,将目标保险责任、至少一个目标关键词和目标维度进行关联存储。其中,每一目标保险责任的目标关键词可以相同可以不相同,目标数据表中可以具体包括保险责任、等待期、分段条件、理赔条件、及理赔金额计算公式等目标维度及对应的目标关键词。例如,目标保险责任为残疾保险金的等待期为90天,目标保险责任为长期护理保险金的等待期为90天,则残疾保险金和长期护理保险金的维度为等待期的目标关键词相同。将每一目标保险责任和目标关键词对应的目标维度进行关联,按一定格式存储到与保险类型相对应的目标数据表中。例如,将获取的目标保险责任为公共交通意外身故保险金、目标关键词为0-18周岁、以乘客身份乘坐客运公共交通工具期间遭遇意外伤害,并自该意外伤害发生之日起180日内身故及给付100000*份数分别与维度字段中的保险责任、分段条件、理赔条件及理赔金额计算公式按固定的格式存储到目标数据表中。其中,将目标维度作为目标数据表中的维度字段,将目标保险责任和对应的目标关键词为字段内容,并以固定格式进行排列显示。
S60:获取理赔金额确定请求,根据目标数据表对理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
其中,目标数据表是上述对保险合同进行数据结构化处理存储的表格,目标数据表中存储每一目标保险责任对应的理赔条件和理赔金额计算公式,目标数据表中还存储等待期和分段条件等目标维度,其中,当保险合同中某一目标保险责任中未包括等待期和分段条件的关键词时,则为空。理赔金额确定请求是指服务器接收到的用于计算理赔金额的请求。
具体地,当客户端向服务器发送获取理赔金额确定请求时,服务器在获取到理赔金额确定请求后,根据理赔金额确定请求确定在目标数据表中的理赔金额计算公式,根据目标数据表中理赔金额计算公式对理赔金额确定请求进行计算,获取到目标理赔金额,节省从保险责任条款中查找相关的理赔内容的时间,提高工作效率。
步骤S10-S60中,服务器通过预设的程序接口,获取保险合同简单快速,以便后续对保险合同内容进行结构化处理;服务器通过对保险合同内容进行识别,获取对应的保险类型和保险责任条款,以便于快速查找到保险责任条款的位置,并能通过保险类型获取对应理赔关键词;再对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标保险责任和与目标保险责任对应的至少一个目标关键词,实现从保险责任条款中快速提取出目标保险责任及对应的目标关键词,实现方法简单方便,并节省人工分解过程中增加的人力成本和时间成本。服务器还将每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度,以便将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中,实现快速对保险合同的不同保险责任进行分解,并将分解的保险责任中的计算理赔金额的相关内容存储到目标数据表,并根据目标数据表,以便后续快速计算理赔金额;获取理赔金额确定请求,根据目标数据表对理赔金额确定请求进行理赔金额计算,获取目标理赔金额,不需从保险责任条款中查找相关理赔内容,提高工作效率。
在一实施例中,如图3所示,步骤S30中,即采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任,具体包括如下步骤:
S31:对保险责任条款进行处理,获取至少一个待处理关键词。
其中,待处理关键词是指从保险责任条款中提取的关键词。具体地,服务器可以通过关键词提取算法或者去停用词提取算法等对保险责任条款进行处理,提取保险责任条款中的待处理关键词。例如,通过关键词提取算法,获取权重较高的关键词,提取保险责任条款中权重较高的关键词作为待处理关键词。再例如,通过去停用词算法剔除保险责任条款中无实际含义的字或符号,如的、地、了和符号等,将保险责任条款中剩余的关键词作为待处理关键词。
S32:采用相似度算法将每一待处理关键词与理赔关键词相似度计算,获取相似度。
具体地,根据保险类型与理赔关键词预先建立的关联关系,通过保险类型调用关键词库中对应的理赔关键词,将从保险责任条款中提取的待处理关键词与保险类型对应的理赔关键词进行相似度处理,具体可用字符串相似度算法进行相似度计算,获取对应的相似度。例如,待处理关键词为双目永久完全失明,理赔关键词为因意外伤害事故以致双目永久完全失明,通过编辑距离等算法将待处理关键词与理赔关键词进行相似度计算,并获取相似度。
其中,编辑距离是指一个字符串,每次只能通过插入一个字符、删除一个字符或者修改一个字符的方法,变成另外一个字符串的最少操作次数。例如,采用编辑距离算法计算待处理关键词与理赔关键词的相似度。首先,建立矩阵,用来保存完成每个字符串转换需要执行的操作次数,确定待处理关键词与理赔关键词的长度为m和n,并初始化第一行为0到m,第一列为0到n,建立的矩阵d为(m+1)*(n+1)。当str(m,st)==str(n,st),temp为0,否则为1,temp是指计算长度为m的字符串与长度为n的字符串的值。可以理解为,当长度为m的字符串与长度为n的字符串相同,则temp为0,字符串不相同则为1。循环嵌套遍历矩阵d[m,n],对矩阵d[m,n]中每个值赋于d[i-1,j]+1;d[i,j-1]+1;d[i-1,j-1]+temp三者的最小值,直至矩阵全部赋值完成,并返回矩阵最后一个值d[m][n]即是编辑距离L,并通过相似度计算公式其中,MAX(m,n)为m和n的最大长度。
S33:若相似度大于预设阈值,则匹配成功,将待处理关键词确定为目标关键词。
其中,预设阈值是根据实际情况进行设定的,可以设定当相似度大于或等于百分之八十时,则认定匹配成功,当相似度小于百分之八十时,则认定匹配失败。
具体地,服务器获取待处理关键词与理赔关键词的相似度,当相似度大于预设阈值时,判定匹配成功,将匹配成功的待处理关键词确定为目标关键词。其中,当相似度越高,表示两个字符串间的相似程度越高,即待处理关键词与理赔关键词相似程度越高。本实施例中,采用编辑距离算法当计算出的相似度越高,说明通过插入、删除或修改的操作次数越少,将相似度与预设阈值进行对比,当相似度大于预设阈值时,则匹配成功。
S34:基于目标关键词,获取对应的目标保险责任。
其中,目标保险责任是指通过目标关键词在所有保险责任中确定的保险责任。具体地,服务器预先根据历史保险合同确定每一保险类型包括哪些保险责任,再根据步骤S33获取到的一个或多个目标关键词与保险类型对应的保险责任进行模糊匹配,以获取目标保险责任。例如,目标关键词为因意外伤害事故以致双目永久完全失明,将目标关键词与理赔条件进行匹配,当某一理赔条件中包含该目标关键词,则将该理赔条件对应的保险责任为意外伤害保险金作为目标保险责任。
步骤S31-S34,服务器从保险责任条款中提取待处理关键词,并与理赔关键词进行相似度计算,若相似度大于预设阈值则对应的待处理关键词为目标关键词,并根据目标关键词确定对应的目标保险责任,从而实现快速提取保险责任条款中目标关键词,并确定目标保险责任。
在一实施例中,步骤S31中,即对保险责任条款进行处理,获取至少一个待处理关键词,包括:采用关键词提取算法对保险责任条款进行关键词提取,获取至少一个待处理关键词;或者,采用去停用词算法对保险责任条款进行去停用词处理,获取至少一个待处理关键词。
具体地,采用关键词提取算法提取保险责任条款中的待处理关键词,首先,对保险责任条款进行分词,然后通过一个字典保存每个词出现的词频;遍历每个词,得到每个词在保险责任条款中的IDF值(逆文档频率)和在保险责任条款中出现的词频(TF)相乘的值;通过字典(key是词,value是TF*IDF权重)来保存所有的词信息,然后按value对字典排序,最后取权重排名靠前的几个词作为待处理关键词。
具体地,服务器可通过去停用词算法对保险责任条款中的关键词进行提取,以获取至少一个待处理关键词。本实施例中,服务器根据历史保险合同中的保险责任条款建立去停用词库。其中,去停用词库是指存储需要过滤掉的某些字或词。具体地,获取历史保险合同中保险责任条款,每一历史保险合同对应一保险类型,调用去停用词库,获取去停用词库中的去停用词,利用去停用词库中的去停用词对保险责任条款进行去停用词处理,获取保险责任条款中去停用词处理后的至少一个待处理关键词。其中,去停用词不涉及实际含义内容,可包括单个文字、标点符号及组合文字。可以理解为,调用去停用词库中的去停用词,将去停用词与保险责任条款进行匹配,将匹配成功的去停用词进行剔除处理,获取保险责任条款中起停用词处理后的关键词作为待处理关键词。
例如,因意外伤害事故以致双目永久完全失明或两肢永久完全残废,或一目永久完全失明同时一肢永久完全残废的,给付1倍保费。其中,去停用词为“因”、“的”及“标点”等,提取剔除去停用词处理后的待处理关键词“意外伤害事故以致双目永久完全失明或两肢永久完全残废或一目永久完全失明同时一肢永久完全残废”和“给付1倍保费”。
本实施例中,通过采用关键词提取算法或者去停用词算法对保险责任条款进行关键词提取,获取至少一个待处理关键词,以快速获取保险责任条款中的待处理关键词。
在一实施例中,图4示出本发明一实施例中步骤S10的一流程图,如图2所示,步骤S10中,即通过预设的程序接口,获取保险合同内容,具体包括如下步骤:
S11:通过预设的程序接口获取保险合同,并识别保险合同的格式类型。
具体地,服务器通过预设的程序接口接收客户端发送的保险合同后,对保险合同中的格式类型进行识别,以获取保险合同的格式类型。其中,格式类型包括可读电子档文件和不可读电子档文件,例如,XML(eXtensible Markup Language的缩写,即可扩展标记语言)、word、PDF(Portable Document Format)、bmp(BitMap Picture的缩写,位图图像)、jpg(Joint Photographic Experts Group的缩写,即联合摄影专家组)和png(PortableNetwork Graphic,即可移植网络图形)。具体地,依据不同格式类型的文件中的内容能否被服务器识别,将所有格式类型划分为可读电子档文件和不可读电子档文件,本实施例中,服务器根据文件的后缀名进行判断是为可读电子档文件或不可读电子档文件。其中,可读电子档文件是指文件名的后缀为XML、word、PDF或者其他电子档文件,相应地,不可读电子档文件是指文件名的后缀是bmp、jpg和png等图片文件。
S12:若保险合同的格式类型为可读电子档文件,获取保险合同对应的保险合同内容。
其中,可读电子档文件可以是指采用服务器可直接识别的格式类型创建的文件,如XML、word、PDF或者其他电子档文件。
具体地,可读电子档文件包括多种格式类型,当获取的可读电子档文件的格式类型为XML、word、PDF或者其他电子档文件时,服务器可直接识别XML、word、PDF或者其他电子档文件的保险合同,获取保险合同对应的保险合同内容。
S13:若保险合同的格式类型为不可读电子档文件,采用文档转换工具对保险合同进行转换处理,获取保险合同对应的保险合同内容。
其中,不可读电子档文件可以指服务器不能直接识别而需采用内置的文档转换工具转换成可识别的格式类型创建的文件,如bmp、jpg和png等图片文件。具体地,服务器上可内置文档转换工具OCR(Optical Character Recognition的缩写,即光学字符识别)或者其他文字识别算法进行识别不可读电子档文件,转换为可读电子档文件。
具体地,当获取的保险合同的格式类型为扫描的bmp、jpg或png图片文件时,通过内置的文档转换工具将图片文件转换为电子档文件,并识别保险合同内容,从而获取保险合同对应的保险合同内容。例如,通过文档转换工具OCR或者其他文字识别算法对格式类型为bmp的图片文件进行识别,转换为可读的word文件。
步骤S11-S13,通过预设的程序接口获取不同格式类型的保险合同,保险合同的格式可以是可读电子档文件,也可以是不可读电子档文件,当保险合同为可读电子档文件时,直接获取保险合同对应的保险合同内容,以便后续对保险合同内容进行处理;当为不可读电子档文件时通过内置的文档转换工具将文件转换为可读电子档文件的格式,获取保险合同对应的保险合同内容,通过内置的文档转换工具进行格式转换,不需将格式类进行转换后,再通过服务器读取保险合同内容。
在一实施例中,如图5所示,在步骤S20之前,即在对保险合同内容进行识别,获取对应的保险类型和保险责任条款的步骤之前,该数据结构化处理方法还包括如下步骤:
S201:获取历史保险合同,每一历史保险合同对应一保险类型。
具体地,数据库中存储有所有的历史保险合同,获取所有的历史保险合同,每一历史保险合同中对应一保险类型,其中,一保险类型可能对应多个历史保险合同。例如,对应一保险类型为平安福在数据库中存储有多张历史保险合同,获取所有的历史保险合同。
S202:采用关键词提取算法对历史保险合同进行关键词提取,获取与保险类型相对应的理赔关键词。
其中,理赔关键词是指保险责任条款中的每一保险责任对应的关键词。
具体地,服务器采用关键词提取算法提取历史保险合同中保险责任条款对应的理赔关键词,将所获取到的理赔关键词确定为与该保险类型相对应的理赔关键词。具体地,服务器提取历史保险合同中保险责任条款中的理赔关键词的具体过程如下:首先,给历史保险合同进行分词,然后用一个字典保存每个词出现的词频;遍历每个词,得到每个词在历史保险合同中里的IDF值(Inverse Document Frequency,即逆文档频率)和在历史保险合同中出现的TF(term frequency,即词频)相乘的值(即TF*IDF);采用键值对(key是词,value是TF*IDF)来保存词典中所有的词信息,然后按value对字典排序,最后取TF*IDF排名靠前的几个词作为理赔关键词。
进一步地,历史保险合同对应一保险类型,获取保险类型对应的理赔关键词,可以通过设定某些关键词提取理赔关键词,例如,通过设定数字、周岁等关键词,提取分段条件的理赔关键词;通过设定汽车、航空、自驾、假期及疾病等关键词,提取保险责任的理赔关键词;通过设定等待期及数字等关键词,提取等待期的理赔关键词;通过设定数字、倍、给付及保费等关键词,提取理赔金额计算公式的理赔关键词。其中,通过设定的关键词,提取同一个理赔关键词时,通过将提取同一个理赔关键词的关键词间建立关联关系,比如,通过设定的给付、数字、倍及保费,提取理赔关键词为给付1倍保费,并将给付、数字、倍及保费建立关联关系。
进一步地,对数据库中具有关联关系的关键词设置优先级,通过关键词的优先级对提取到的理赔关键词进行相似度处理。例如,理赔关键词给付、数字、倍和保费等设有关联关系,通过理赔关键词给付、数字、倍及保费等理赔关键词的理赔金额计算公式进行相似度处理。当通过给付、数字、倍及保费等对理赔金额计算公式进行相似度处理时,对关键词给付、数字、倍及保费等设置优先级,设置数字和倍为第一等级,设置保费为第二等级,给付为第三等级。其中,根据设置优先等级的关键词与理赔关键词中理赔金额计算公式进行相似度处理时,优先对等级为第一等级的关键词与理赔关键词进行相似度处理,当第一等级的关键词匹配成功后,直接通过预先设定的具有关联关系的关键词对相似度高的理赔关键词附近的文字进行匹配。例如,服务器可根据关键词的优先等级从保险责任条款中匹配到数字和倍,再对保费,给付进行匹配。本实施例中,服务器通过设置关键词的优先级,有助于快速获取到理赔关键词,从而节省时间。
S203:将保险类型和理赔关键词关联存储在关键词库中。
具体地,服务器将从历史保险合同中提取的每一保险类型和对应的理赔关键词关联存储至关键词库中,以便后续可基于保险类型查询关键词库以获取对应的理赔关键词。即关键词库中的理赔关键词按保险类型不同分别存储,通过保险类型能获取对应的理赔关键词。
步骤S201-S203,通过历史保险合同,对每一历史保险合同中的理赔关键词进行提取,获取每一保险类型的理赔关键词,并将每一保险类型与对应的理赔关键词进行关联存储,以便后续对保险合同进行结构化处理时,通过保险类型能够获取到对应的理赔关键词,快速对保险合同进行分解。
在一实施例中,如图6所示,步骤S20中,即对保险合同内容进行识别,获取对应的保险类型和保险责任条款,具体包括如下步骤:
S21:对保险合同内容进行识别,获取保险合同内容对应的保险单号,保险单号包括保险机构ID和保险类型编号。
其中,保险单号是指投保人向保险公司投保成功后,保险公司出具保险合同的保险合同号码。保险机构ID是指保险机构的编码,新申请设立的保险机构,由中国保监会在颁发许可证时分配的编码,基于保险机构ID能确定唯一的保险机构。保险类型编号是指保险类型的编码,通过保险类型编号能确定保险机构中唯一的保险类型。
其中,保险机构ID和保险类型编号可以是字母或数字进行排列的编码。可以理解地,保险单号是依据保险公司内部的保险机构编码规则自动生成,正式的保险合同上都有写明,凭借唯一的保险单号可以在保险公司系统里查到所有的承保信息。其中,保险机构编码规则是指保险机构中对每一保险类型按照预设的排序进行编码。例如,保险机构编码规则中字母P、HP和GP等代表保险类型,阿拉伯数字代表保险机构ID等,如保险单号PDAA2010xxxxxxxx000001中,P代表保单类型,DAA代表一般机动车辆险,2010代表年份,xxxxxxxx代表保险机构ID,000001代表保单流水号。
具体地,服务器获取保险合同内容后,采用关键词提取算法对保险合同内容的保险单号进行提取,其中,每一保险合同对应一保险单号,通过保险机构编码规则,获取保险单号中保险机构ID和保险类型编号。例如,采用关键词提取算法提取保险合同内容中的保险单号,首先,对保险合同内容进行分词,然后通过一个字典保存每个词出现的词频;遍历每个词,得到每个词在保险合同内容中的IDF值(逆文档频率)和在保险合同内容中出现的词频(TF)相乘的值;通过字典(key是词,value是TF*IDF权重)来保存所有的词信息,然后按value对字典排序,最后取权重排名靠前的词作为保险单号。
S22:根据保险机构ID和保险类型编号查询预设的数据库,获取对应的保险类型和标准保险合同。
其中,标准保险合同是指保险公司为了重复使用而预先拟定、并在订立合同时未与对方协商的合同。
具体地,在预设的数据库中存储每一保险机构ID和保险类型编号对应的标准保险合同,并在预设的数据库中存储每一保险机构ID和保险类型编号对应的保险类型,并将保险机构ID和保险类型编号与保险类型建立对应关系。保险类型编号可以是一串数字,预设的数据库中存储有保险类型编号及中文名称的对应关系,根据对应关系能确定保险类型编号对应的保险类型。例如,保险类型编号可以是1000、1001及1002等,1000可以对应为平安福,1001可以对应为安诺,1002可以对应为安益,分别将1000与平安福建立对应关系,将1001与安诺建立对应关系,将1002与安益建立对应关系。本实施例中,预设的数据库与服务器通信连接,服务器根据保险机构ID和保险类型编号查询预设的数据库,根据预设的保险机构ID和保险类型编号与保险类型之间的对应关系,获取保险类型;服务器根据保险机构ID和保险类型编号查询预设的数据库,根据预设的每一保险机构ID和保险类型编号对应的标准保险合同,获取相应的标准保险合同。其中,在标准保险合同中限定保险责任条款的位置。服务器通过将步骤S21中获取的保险机构ID和保险类型编号查询预设的数据库,获取保险类型和标准保险合同,以便快速获取到保险类型和保险责任条款的位置,操作快速方便。
S23:根据标准保险合同中预先限定的保险责任条款位置,从保险合同内容中获取相应的保险责任条款。
具体地,标准保险合同存储在预设的数据库中,每一保险类型的对应的标准保险合同不同,不同保险类型的标准保险合同中都对保险责任条款位置进行限定。例如,中国平安和中国人寿的人身保险这一保险类型对应的标准保险合同不同,但标准保险合同中对保险责任条款位置进行限定。由于保险合同根据标准保险合同的内容进行制定的,为固定格式的文档,因此,服务器可根据标准保险合同中预先限定的保险责任条款的位置,可获取通过预设的程序接口获取的保险合同内容中的保险责任条款。例如,标准保险合同中限定第三条款为保险责任条款,则获取保险合同的第三条款。
步骤S21-S23,服务器根据保险合同识别出的保险单号,获取对应的保险类型编号和保险机构ID,从而确定对应的保险类型和标准保险合同;由于预设的数据库中存储每一保险机构对应的标准保险合同,根据标准保险合同中限定的保险类型和保险责任条款的位置,快速获取到保险合同中的保险类型和保险责任条款,根据保险类型编号和保险机构ID不同获取到不同保险机构中和不同保险类型的标准保险合同,快速查所需的位置,操作简单方便。
在一实施例中,目标数据表中存储每一目标保险责任对应的理赔条件和理赔金额计算公式。
相应地,在S60中,即获取理赔金额确定请求,根据目标数据表对理赔金额确定请求进行理赔金额计算,获取目标理赔金额中,如图7所示,数据结构化处理方法还包括如下步骤:
S61:获取理赔金额确定请求,理赔金额确定请求包括保险单号和理赔请求信息。
其中,理赔请求信息包括理赔原因和保费参数等。理赔原因是向保险机构请求理赔时说明的原因,该原因与请求理赔的事由相关联。其中,保费参数是指购买该保险时所交保费。
具体地,当客户端向服务器发送获取理赔金额确定请求时,服务器在获取到理赔金额确定请求后,需先确定理赔金额确定请求中的保险单号和理赔请求信息,以便后续基于该保险单号和理赔请求信息进行查询操作。
S62:基于保险单号查询目标数据表,获取与理赔请求信息相匹配的目标理赔条件。
其中,目标理赔条件是指在目标数据表中,与理赔请求信息相匹配的目标关键词作为目标理赔条件。
具体地,服务器根据保险单号确定保险类型,并查找该保险类型对应的目标数据表,目标数据表中包括该保险类型的所有保险责任、目标关键词和目标维度,根据理赔请求中的理赔原因与该保险类型对应的目标数据表中目标关键词进行匹配,获取匹配成功的目标关键词,将目标关键词作为目标理赔条件。例如,理赔请求信息中包括理赔原因,理赔原因为因公共交通事故在XX达到发生交通事故致人死亡,通过将理赔原因在目标数据表中的理赔条件进行查找,其中,目标数据表中包含目标关键词为以乘客身份乘坐公共交通工具期交遭受意外伤害,并在该意外伤害之日起180日内身故或全残,通过该理赔请求信息中的理赔原因查找到对应的目标关键词,将该目标关键词确定为目标理赔条件。
S63:获取与目标理赔条件相对应的目标理赔金额计算公式。
其中,目标理赔金额计算公式是指目标数据表中与目标理赔条件相关联的理赔金额计算公式。
具体地,在目标数据表中,每一保险责任、目标关键词和目标维度形成一个关联关系,通过目标关键词确定的目标理赔条件,可获取有关联关系的为目标理赔金额计算公式。
S64:采用目标理赔金额计算公式对理赔请求信息中的保费参数进行计算,获取目标理赔金额。
具体地,理赔金额计算公式可以包括保费倍率和保费参数等数据参数,例如,给付n倍保费。获取理赔请求信息中相应的保费参数,通过目标理赔金额计算公式计算理赔金额。例如,理赔金额计算公式为0.2倍保费,获取理赔请求中保费参数,计算出理赔金额。
本实施例中,服务器可依据事先获取的目标数据表,根据客户端上传的理赔金额确定请求,可快速获取理赔金额计算公式,并利用该理赔金额计算公式进行快速计算目标理赔金额,计算过程可实现智能化操作,无需人工计算,有助于提高理赔效率,节省人工成本。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种数据结构化处理装置,该数据结构化处理装置与上述实施例中数据结构化处理方法一一对应。如图8所示,该数据结构化处理装置包括内容获取模板10、识别处理模块20、第一匹配模块30、第二匹配模块40、数据表生成模块50和理赔计算模块60。各功能模块详细说明如下:
内容获取模板10,用于通过预设的程序接口,获取保险合同内容。
识别处理模块20,用于对保险合同内容进行识别,获取对应的保险类型和保险责任条款。
第一匹配模块30,用于基于保险类型获取对应的理赔关键词,采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任。
第二匹配模块40,用于将目标保险责任和每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度。
数据表生成模块50,用于将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中。
理赔计算模块60,用于获取理赔金额确定请求,根据目标数据表对理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
具体地,内容获取模板10包括格式识别单元11、合同内容获取单元12和格式转换单元13。
格式识别单元11,用于通过预设的程序接口获取保险合同,并识别保险合同的格式类型。
合同内容获取单元12,用于若保险合同为可读电子档文件,获取保险合同对应的保险合同内容。
格式转换单元13,用于若保险合同为不可读电子档文件,采用文档转换工具对保险合同进行转换处理,获取保险合同对应的保险合同内容。
具体地,识别处理模块20包括合同内容识别单元21、查询单元22和责任条款获取单元23。
合同内容识别单元21,用于对保险合同内容进行识别,获取保险合同内容对应的保险单号,保险单号包括保险机构ID和保险类型编号。
查询单元22,用于根据保险机构ID和保险类型编号查询预设的数据库,获取对应的保险类型和标准保险合同。
责任条款获取单元23,用于根据标准保险合同中预先限定的保险责任条款位置,从保险合同内容中获取相应的保险责任条款。
具体地,在识别处理模块20之前,数据结构化处理装置还包括历史合同获取单元201、关键词提取单元202和存储单元203。
历史合同获取单元201,用于获取历史保险合同,每一历史保险合同对应一保险类型。
关键词提取单元202,用于采用关键词提取算法对历史保险合同进行关键词提取,获取与保险类型相对应的理赔关键词。
存储单元203,用于将保险类型和理赔关键词关联存储在关键词库中。
具体地,第一匹配模块30包括待处理关键词获取单元31、相似度计算单元32、目标关键词确定单元33和目标保险责任确定单元34。
待处理关键词获取单元31,用于对保险责任条款进行处理,获取至少一个待处理关键词。
相似度计算单元32,用于采用相似度算法将待处理关键词与理赔关键词相似度计算,获取相似度。
目标关键词确定单元33,用于若相似度大于预设阈值,则匹配成功,将待处理关键词确定为目标关键词。
目标保险责任确定单元34,用于基于目标关键词,获取对应的目标保险责任。
具体地,待处理关键词获取单元31,还用于采用关键词提取算法对保险责任条款进行关键词提取,获取至少一个待处理关键词;或者,采用去停用词算法对保险责任条款进行去停用词处理,获取至少一个待处理关键词。
具体地,目标数据表中存储每一目标保险责任对应的理赔条件和理赔金额计算公式。
理赔计算模块60包括请求获取单元61、条件获取单元62、公式获取单元63和理赔计算单元64。
请求获取单元61,用于获取理赔金额确定请求,理赔金额确定请求包括保险单号和理赔请求。
条件获取单元62,用于基于保险单号查询目标数据表,获取与理赔请求相匹配的目标理赔条件。
公式获取单元63,用于获取与目标理赔条件相对应的目标理赔金额计算公式。
理赔计算单元64,用于采用目标理赔金额计算公式对理赔请求中的保费参数进行计算,获取目标理赔金额。
关于数据结构化处理装置的具体限定可以参见上文中对于数据结构化处理方法的限定,在此不再赘述。上述数据结构化处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于为服务器提供数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据结构化处理方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:通过预设的程序接口,获取保险合同内容;对保险合同内容进行识别,获取对应的保险类型和保险责任条款;基于保险类型获取对应的理赔关键词,采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任;将目标保险责任和每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度;将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中;获取理赔金额确定请求,根据目标数据表对理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
在一实施例中,处理器执行计算机程序时实现以下步骤:对保险责任条款进行处理,获取至少一个待处理关键词;采用相似度算法将待处理关键词与理赔关键词相似度计算,获取相似度;若相似度大于预设阈值,则匹配成功,将待处理关键词确定为目标关键词;基于目标关键词,获取对应的目标保险责任。
在一实施例中,处理器执行计算机程序时实现以下步骤:采用关键词提取算法对保险责任条款进行关键词提取,获取至少一个待处理关键词;或者,采用去停用词算法对保险责任条款进行去停用词处理,获取至少一个待处理关键词。
在一实施例中,处理器执行计算机程序时实现以下步骤:通过预设的程序接口获取保险合同,并识别保险合同的格式类型;若保险合同为可读电子档文件,获取保险合同对应的保险合同内容;若保险合同为不可读电子档文件,采用文档转换工具对保险合同进行转换处理,获取保险合同对应的保险合同内容。
在一实施例中,处理器执行计算机程序时实现以下步骤:对保险合同内容进行识别,获取保险合同内容对应的保险单号,保险单号包括保险机构ID和保险类型编号;根据保险机构ID和保险类型编号查询预设的数据库,获取对应的保险类型和标准保险合同;根据标准保险合同中预先限定的保险责任条款位置,从保险合同内容中获取相应的保险责任条款。
在一实施例中,处理器执行计算机程序时实现以下步骤:获取历史保险合同,每一历史保险合同对应一保险类型;采用关键词提取算法对历史保险合同进行关键词提取,获取与保险类型相对应的理赔关键词;将保险类型和理赔关键词关联存储在关键词库中。
在一实施例中,目标数据表中存储每一目标保险责任对应的理赔条件和理赔金额计算公式。
处理器执行计算机程序时实现以下步骤:获取理赔金额确定请求,理赔金额确定请求包括保险单号和理赔请求;基于保险单号查询目标数据表,获取与理赔请求相匹配的目标理赔条件;获取与目标理赔条件相对应的目标理赔金额计算公式;采用目标理赔金额计算公式对理赔请求中的保费参数进行计算,获取目标理赔金额。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:通过预设的程序接口,获取保险合同内容;对保险合同内容进行识别,获取对应的保险类型和保险责任条款;基于保险类型获取对应的理赔关键词,采用相似度算法对理赔关键词和保险责任条款进行匹配处理,获取匹配成功的目标关键词和与目标关键词对应的目标保险责任;将目标保险责任和每一目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度;将目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与保险类型相对应的目标数据表中;获取理赔金额确定请求,根据目标数据表对理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
在一实施例中,计算机程序被处理器执行时实现以下步骤:对保险责任条款进行处理,获取至少一个待处理关键词;采用相似度算法将待处理关键词与理赔关键词相似度计算,获取相似度;若相似度大于预设阈值,则匹配成功,将待处理关键词确定为目标关键词;基于目标关键词,获取对应的目标保险责任。
在一实施例中,计算机程序被处理器执行时实现以下步骤:采用关键词提取算法对保险责任条款进行关键词提取,获取至少一个待处理关键词;或者,采用去停用词算法对保险责任条款进行去停用词处理,获取至少一个待处理关键词。
在一实施例中,计算机程序被处理器执行时实现以下步骤:通过预设的程序接口获取保险合同,并识别保险合同的格式类型;若保险合同为可读电子档文件,获取保险合同对应的保险合同内容;若保险合同为不可读电子档文件,采用文档转换工具对保险合同进行转换处理,获取保险合同对应的保险合同内容。
在一实施例中,计算机程序被处理器执行时实现以下步骤:对保险合同内容进行识别,获取保险合同内容对应的保险单号,保险单号包括保险机构ID和保险类型编号;根据保险机构ID和保险类型编号查询预设的数据库,获取对应的保险类型和标准保险合同;根据标准保险合同中预先限定的保险责任条款位置,从保险合同内容中获取相应的保险责任条款。
在一实施例中,计算机程序被处理器执行时实现以下步骤:获取历史保险合同,每一历史保险合同对应一保险类型;采用关键词提取算法对历史保险合同进行关键词提取,获取与保险类型相对应的理赔关键词;将保险类型和理赔关键词关联存储在关键词库中。
在一实施例中,目标数据表中存储每一目标保险责任对应的理赔条件和理赔金额计算公式。
计算机程序被处理器执行时实现以下步骤:获取理赔金额确定请求,理赔金额确定请求包括保险单号和理赔请求;基于保险单号查询目标数据表,获取与理赔请求相匹配的目标理赔条件;获取与目标理赔条件相对应的目标理赔金额计算公式;采用目标理赔金额计算公式对理赔请求中的保费参数进行计算,获取目标理赔金额。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据结构化处理方法,其特征在于,所述数据结构化处理方法包括:
通过预设的程序接口,获取保险合同内容;
对所述保险合同内容进行识别,获取对应的保险类型和保险责任条款;
基于所述保险类型获取对应的理赔关键词,采用相似度算法对所述理赔关键词和所述保险责任条款进行匹配处理,获取匹配成功的目标关键词和与所述目标关键词对应的目标保险责任;
将所述目标保险责任和每一所述目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度;
将所述目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与所述保险类型相对应的目标数据表中;
获取理赔金额确定请求,根据所述目标数据表对所述理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
2.如权利要求1所述的数据结构化处理方法,其特征在于,所述采用相似度算法对所述理赔关键词和所述保险责任条款进行匹配处理,获取匹配成功的目标关键词和与所述目标关键词对应的目标保险责任,包括:
对所述保险责任条款进行处理,获取至少一个待处理关键词;
采用相似度算法将所述待处理关键词与所述理赔关键词相似度计算,获取相似度;
若所述相似度大于预设阈值,则匹配成功,将所述待处理关键词确定为目标关键词;
基于所述目标关键词,获取对应的目标保险责任。
3.如权利要求2所述的数据结构化处理方法,其特征在于,对所述保险责任条款进行处理,获取至少一个待处理关键词,包括:
采用关键词提取算法对所述保险责任条款进行关键词提取,获取至少一个待处理关键词;或者,采用去停用词算法对所述保险责任条款进行去停用词处理,获取至少一个待处理关键词。
4.如权利要求1所述的数据结构化处理方法,其特征在于,所述通过预设的程序接口,获取保险合同内容,包括:
通过预设的程序接口获取保险合同,并识别所述保险合同的格式类型;
若所述保险合同为可读电子档文件,获取所述保险合同对应的保险合同内容;
若所述保险合同为不可读电子档文件,采用文档转换工具对所述保险合同进行转换处理,获取所述保险合同对应的保险合同内容。
5.如权利要求1所述的数据结构化处理方法,其特征在于,所述对所述保险合同内容进行识别,获取对应的保险类型和保险责任条款,包括:
对所述保险合同内容进行识别,获取所述保险合同内容对应的保险单号,所述保险单号包括保险机构ID和保险类型编号;
根据所述保险机构ID和所述保险类型编号查询预设的数据库,获取对应的保险类型和标准保险合同;
根据所述标准保险合同中预先限定的保险责任条款位置,从所述保险合同内容中获取相应的保险责任条款。
6.如权利要求1所述的数据结构化处理方法,其特征在于,在所述对所述保险合同内容进行识别,获取对应的保险类型和保险责任条款的步骤之前,所述数据结构化处理方法还包括:
获取历史保险合同,每一所述历史保险合同对应一保险类型;
采用关键词提取算法对所述历史保险合同进行关键词提取,获取与所述保险类型相对应的理赔关键词;
将所述保险类型和所述理赔关键词关联存储在关键词库中。
7.如权利要求1所述的数据结构化处理方法,其特征在于,所述目标数据表中存储每一所述目标保险责任对应的理赔条件和理赔金额计算公式;
所述获取理赔金额确定请求,根据所述目标数据表对所述理赔金额确定请求进行理赔金额计算,获取目标理赔金额,包括:
获取理赔金额确定请求,所述理赔金额确定请求包括保险单号和理赔请求;
基于所述保险单号查询所述目标数据表,获取与所述理赔请求相匹配的目标理赔条件;
获取与所述目标理赔条件相对应的目标理赔金额计算公式;
采用所述目标理赔金额计算公式对所述理赔请求中的保费参数进行计算,获取目标理赔金额。
8.一种数据结构化处理装置,其特征在于,所述数据结构化处理装置包括:
内容获取模块,用于通过预设的程序接口,获取保险合同内容;
识别处理模块,用于对所述保险合同内容进行识别,获取对应的保险类型和保险责任条款;
第一匹配模块,用于基于所述保险类型获取对应的理赔关键词,对所述理赔关键词和所述保险责任条款进行匹配处理,获取匹配成功的目标关键词和与所述目标关键词对应的目标保险责任;
第二匹配模块,用于将所述目标保险责任和每一所述目标关键词与预设的数据库维度表中的维度字段进行匹配,获取对应的目标维度;
数据表生成模块,用于将所述目标保险责任、至少一个目标关键词和对应的目标维度关联存储在与所述保险类型相对应的目标数据表中;
理赔计算模块,用于获取理赔金额确定请求,根据所述目标数据表对所述理赔金额确定请求进行理赔金额计算,获取目标理赔金额。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述数据结构化处理方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述数据结构化处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810592868.3A CN109035032A (zh) | 2018-06-11 | 2018-06-11 | 数据结构化处理方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810592868.3A CN109035032A (zh) | 2018-06-11 | 2018-06-11 | 数据结构化处理方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109035032A true CN109035032A (zh) | 2018-12-18 |
Family
ID=64612559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810592868.3A Withdrawn CN109035032A (zh) | 2018-06-11 | 2018-06-11 | 数据结构化处理方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109035032A (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636655A (zh) * | 2018-12-26 | 2019-04-16 | 上海百事通信息技术股份有限公司 | 一种车辆保险理赔计算系统和自助终端 |
CN109857750A (zh) * | 2019-01-17 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 保险理赔决策方法、装置、计算机设备及存储介质 |
CN110033382A (zh) * | 2019-02-12 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 一种保险业务的处理方法、装置及设备 |
CN110147982A (zh) * | 2019-04-16 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 基于客户请求的自动审核方法、装置、计算机设备及存储介质 |
CN110147392A (zh) * | 2019-04-15 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 信息匹配方法、装置、计算机设备和存储介质 |
CN110310208A (zh) * | 2019-05-27 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 项目赔审申请处理方法及装置 |
CN110378795A (zh) * | 2019-06-17 | 2019-10-25 | 中国平安人寿保险股份有限公司 | 一种条款文件的生成方法、装置、存储介质和服务器 |
CN110516117A (zh) * | 2019-07-22 | 2019-11-29 | 平安科技(深圳)有限公司 | 图计算的类别型变量存储方法、装置、设备及存储介质 |
CN110674250A (zh) * | 2019-08-15 | 2020-01-10 | 中国平安财产保险股份有限公司 | 一种文本匹配方法、装置、计算机系统及可读存储介质 |
CN110825964A (zh) * | 2019-10-24 | 2020-02-21 | 泰康保险集团股份有限公司 | 信息推送方法、装置、设备和计算机可读介质 |
CN111143505A (zh) * | 2019-11-28 | 2020-05-12 | 泰康保险集团股份有限公司 | 文档处理方法、装置、介质及电子设备 |
CN111161088A (zh) * | 2019-12-31 | 2020-05-15 | 上海亿保健康管理有限公司 | 票据处理方法、装置和设备 |
CN111738867A (zh) * | 2020-04-17 | 2020-10-02 | 世纪保众(北京)网络科技有限公司 | 一种保险产品理赔宽松度可量化评估的方法和装置 |
CN111861764A (zh) * | 2020-07-28 | 2020-10-30 | 中国平安财产保险股份有限公司 | 一种保险定责方法、装置、计算机设备及可读存储介质 |
CN111858742A (zh) * | 2020-07-23 | 2020-10-30 | 中国建设银行股份有限公司 | 一种数据可视化方法、装置、存储介质及设备 |
CN112270224A (zh) * | 2020-10-14 | 2021-01-26 | 招商银行股份有限公司 | 保险责任解析方法、装置及计算机可读存储介质 |
CN112270223A (zh) * | 2020-10-14 | 2021-01-26 | 招商银行股份有限公司 | 保单检视方法、装置及计算机可读存储介质 |
CN112270604A (zh) * | 2020-10-14 | 2021-01-26 | 招商银行股份有限公司 | 信息结构化处理方法、装置及计算机可读存储介质 |
CN112308726A (zh) * | 2020-11-26 | 2021-02-02 | 泰康保险集团股份有限公司 | 保险服务权益推送方法、装置、介质及电子设备 |
CN113779998A (zh) * | 2021-09-17 | 2021-12-10 | 建信金融科技有限责任公司 | 业务信息的结构化处理方法、装置、设备及存储介质 |
CN114330283A (zh) * | 2021-11-09 | 2022-04-12 | 世纪保众(北京)网络科技有限公司 | 应用于保险条款解析的保障责任摘要自动填充的技术方法 |
CN115668264A (zh) * | 2020-12-21 | 2023-01-31 | 京东方科技集团股份有限公司 | 一种保险理赔材料的获取方法、业务服务器及系统 |
CN118520862A (zh) * | 2024-07-17 | 2024-08-20 | 沈阳慧筑云科技有限公司 | 一种基于用户合同习惯的合同模板智能生成方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107608958A (zh) * | 2017-09-07 | 2018-01-19 | 湖南湘君奕成信息技术有限公司 | 基于条款统一建模的合同文本风险信息挖掘方法和系统 |
CN107705211A (zh) * | 2017-11-10 | 2018-02-16 | 平安科技(深圳)有限公司 | 一种保险理赔案件的理算方法和装置 |
CN107909494A (zh) * | 2017-12-08 | 2018-04-13 | 中国平安财产保险股份有限公司 | 保险数据信息的配置方法、装置、计算机设备和存储介质 |
CN107909483A (zh) * | 2017-07-25 | 2018-04-13 | 平安科技(深圳)有限公司 | 理赔流程识别方法、装置、服务器和存储介质 |
CN107945030A (zh) * | 2017-12-08 | 2018-04-20 | 中国平安财产保险股份有限公司 | 保费公式的配置方法、装置、计算机设备和存储介质 |
US20180137090A1 (en) * | 2016-11-14 | 2018-05-17 | International Business Machines Corporation | Identification of textual similarity |
-
2018
- 2018-06-11 CN CN201810592868.3A patent/CN109035032A/zh not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180137090A1 (en) * | 2016-11-14 | 2018-05-17 | International Business Machines Corporation | Identification of textual similarity |
CN107909483A (zh) * | 2017-07-25 | 2018-04-13 | 平安科技(深圳)有限公司 | 理赔流程识别方法、装置、服务器和存储介质 |
CN107608958A (zh) * | 2017-09-07 | 2018-01-19 | 湖南湘君奕成信息技术有限公司 | 基于条款统一建模的合同文本风险信息挖掘方法和系统 |
CN107705211A (zh) * | 2017-11-10 | 2018-02-16 | 平安科技(深圳)有限公司 | 一种保险理赔案件的理算方法和装置 |
CN107909494A (zh) * | 2017-12-08 | 2018-04-13 | 中国平安财产保险股份有限公司 | 保险数据信息的配置方法、装置、计算机设备和存储介质 |
CN107945030A (zh) * | 2017-12-08 | 2018-04-20 | 中国平安财产保险股份有限公司 | 保费公式的配置方法、装置、计算机设备和存储介质 |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636655A (zh) * | 2018-12-26 | 2019-04-16 | 上海百事通信息技术股份有限公司 | 一种车辆保险理赔计算系统和自助终端 |
CN109857750A (zh) * | 2019-01-17 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 保险理赔决策方法、装置、计算机设备及存储介质 |
CN110033382B (zh) * | 2019-02-12 | 2020-09-04 | 阿里巴巴集团控股有限公司 | 一种保险业务的处理方法、装置及设备 |
CN110033382A (zh) * | 2019-02-12 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 一种保险业务的处理方法、装置及设备 |
CN110147392A (zh) * | 2019-04-15 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 信息匹配方法、装置、计算机设备和存储介质 |
CN110147982A (zh) * | 2019-04-16 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 基于客户请求的自动审核方法、装置、计算机设备及存储介质 |
CN110310208B (zh) * | 2019-05-27 | 2023-01-10 | 创新先进技术有限公司 | 项目赔审申请处理方法及装置 |
CN110310208A (zh) * | 2019-05-27 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 项目赔审申请处理方法及装置 |
CN110378795A (zh) * | 2019-06-17 | 2019-10-25 | 中国平安人寿保险股份有限公司 | 一种条款文件的生成方法、装置、存储介质和服务器 |
CN110378795B (zh) * | 2019-06-17 | 2024-03-15 | 中国平安人寿保险股份有限公司 | 一种条款文件的生成方法、装置、存储介质和服务器 |
CN110516117A (zh) * | 2019-07-22 | 2019-11-29 | 平安科技(深圳)有限公司 | 图计算的类别型变量存储方法、装置、设备及存储介质 |
CN110674250A (zh) * | 2019-08-15 | 2020-01-10 | 中国平安财产保险股份有限公司 | 一种文本匹配方法、装置、计算机系统及可读存储介质 |
CN110674250B (zh) * | 2019-08-15 | 2023-06-23 | 中国平安财产保险股份有限公司 | 一种文本匹配方法、装置、计算机系统及可读存储介质 |
CN110825964A (zh) * | 2019-10-24 | 2020-02-21 | 泰康保险集团股份有限公司 | 信息推送方法、装置、设备和计算机可读介质 |
CN111143505A (zh) * | 2019-11-28 | 2020-05-12 | 泰康保险集团股份有限公司 | 文档处理方法、装置、介质及电子设备 |
CN111143505B (zh) * | 2019-11-28 | 2023-11-21 | 泰康保险集团股份有限公司 | 文档处理方法、装置、介质及电子设备 |
CN111161088A (zh) * | 2019-12-31 | 2020-05-15 | 上海亿保健康管理有限公司 | 票据处理方法、装置和设备 |
CN111738867A (zh) * | 2020-04-17 | 2020-10-02 | 世纪保众(北京)网络科技有限公司 | 一种保险产品理赔宽松度可量化评估的方法和装置 |
CN111858742A (zh) * | 2020-07-23 | 2020-10-30 | 中国建设银行股份有限公司 | 一种数据可视化方法、装置、存储介质及设备 |
CN111861764A (zh) * | 2020-07-28 | 2020-10-30 | 中国平安财产保险股份有限公司 | 一种保险定责方法、装置、计算机设备及可读存储介质 |
CN111861764B (zh) * | 2020-07-28 | 2023-10-27 | 中国平安财产保险股份有限公司 | 一种保险定责方法、装置、计算机设备及可读存储介质 |
CN112270604A (zh) * | 2020-10-14 | 2021-01-26 | 招商银行股份有限公司 | 信息结构化处理方法、装置及计算机可读存储介质 |
CN112270223A (zh) * | 2020-10-14 | 2021-01-26 | 招商银行股份有限公司 | 保单检视方法、装置及计算机可读存储介质 |
CN112270224A (zh) * | 2020-10-14 | 2021-01-26 | 招商银行股份有限公司 | 保险责任解析方法、装置及计算机可读存储介质 |
CN112270223B (zh) * | 2020-10-14 | 2024-05-31 | 招商银行股份有限公司 | 保单检视方法、装置及计算机可读存储介质 |
CN112308726A (zh) * | 2020-11-26 | 2021-02-02 | 泰康保险集团股份有限公司 | 保险服务权益推送方法、装置、介质及电子设备 |
CN112308726B (zh) * | 2020-11-26 | 2024-03-12 | 泰康保险集团股份有限公司 | 保险服务权益推送方法、装置、介质及电子设备 |
CN115668264A (zh) * | 2020-12-21 | 2023-01-31 | 京东方科技集团股份有限公司 | 一种保险理赔材料的获取方法、业务服务器及系统 |
CN113779998A (zh) * | 2021-09-17 | 2021-12-10 | 建信金融科技有限责任公司 | 业务信息的结构化处理方法、装置、设备及存储介质 |
CN114330283A (zh) * | 2021-11-09 | 2022-04-12 | 世纪保众(北京)网络科技有限公司 | 应用于保险条款解析的保障责任摘要自动填充的技术方法 |
CN118520862A (zh) * | 2024-07-17 | 2024-08-20 | 沈阳慧筑云科技有限公司 | 一种基于用户合同习惯的合同模板智能生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109035032A (zh) | 数据结构化处理方法、装置、计算机设备及存储介质 | |
CN112632292A (zh) | 业务关键词的提取方法、装置、设备及存储介质 | |
US8090599B2 (en) | Method and system for computerized insurance underwriting | |
CN109325041A (zh) | 业务数据处理方法、装置、计算机设备及存储介质 | |
CN108520343A (zh) | 风险模型训练方法、风险识别方法、装置、设备及介质 | |
CN106934536A (zh) | 建设行业工程量计价清单数据自动编码与识别方法及系统 | |
US11675807B1 (en) | Database interface system | |
EP3644214A1 (en) | Method and system for request for proposal (rfp) response generation | |
CN110659298A (zh) | 财务数据处理方法、装置、计算机设备和存储介质 | |
CN109446499B (zh) | 基于xml的合同模板生成方法、装置、设备及介质 | |
CN112270604A (zh) | 信息结构化处理方法、装置及计算机可读存储介质 | |
CN110674250A (zh) | 一种文本匹配方法、装置、计算机系统及可读存储介质 | |
CN115759667A (zh) | 一种人才信息智能匹配方法、系统、设备及介质 | |
CN112328805A (zh) | 基于nlp的漏洞描述信息与数据库表的实体映射方法 | |
CN113610375B (zh) | 基于自然语言处理的保单核保方法及核保装置 | |
CN110941957A (zh) | 交通科技数据标引方法及系统 | |
CN114298845A (zh) | 一种理赔票据处理方法和装置 | |
CN110147982A (zh) | 基于客户请求的自动审核方法、装置、计算机设备及存储介质 | |
US20240127379A1 (en) | Generating actionable information from documents | |
CN111046636B (zh) | 筛选pdf文件信息的方法、装置、计算机设备及存储介质 | |
DE112021001743T5 (de) | Vektoreinbettungsmodelle für relationale tabellen mit null- oder äquivalenten werten | |
CN111950875A (zh) | 一种合同智能评审方法 | |
CN110390083B (zh) | 近似案件的推送方法、装置、计算机设备和存储介质 | |
WO2020000718A1 (zh) | 投资组合生成方法、装置及计算机可读存储介质 | |
CN109410069A (zh) | 结算数据处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20181218 |
|
WW01 | Invention patent application withdrawn after publication |