CN112463931A - 一种保险产品条款的智能化解析方法及相关设备 - Google Patents
一种保险产品条款的智能化解析方法及相关设备 Download PDFInfo
- Publication number
- CN112463931A CN112463931A CN202011459990.7A CN202011459990A CN112463931A CN 112463931 A CN112463931 A CN 112463931A CN 202011459990 A CN202011459990 A CN 202011459990A CN 112463931 A CN112463931 A CN 112463931A
- Authority
- CN
- China
- Prior art keywords
- clause
- insurance product
- insurance
- data
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000006243 chemical reaction Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013499 data model Methods 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本说明书一个或多个实施例提供一种保险产品条款的智能化解析方法及相关设备;所述方法包括:接收保险产品条款文档,获取所述保险产品条款文档中的特征数据;根据标题和预设的段落匹配条件,整合所述段落内容,生成至少五个保险产品条款单元;使用解析模型对所述保险产品条款单元进行解析处理,得到条款字段;将所述条款字段显示在界面前端,供查询使用。本方法通过使用预先训练的保险产品条款文档智能解析模型,对保险产品条款文档进行解析处理,准确定义保险条款数据,提升了条款数据的可用性和价值性;同时,大幅降低保险产品条款的解析时间,提高了保险产品条款从文本内容到格式化、可用性数据的转换效率,降低了人力作业成本。
Description
技术领域
本说明书一个或多个实施例涉及自然语言处理技术领域,尤其涉及一种保险产品条款的智能化解析方法及相关设备。
背景技术
随着经济的发展,我国的保险行业得到了飞速的发展。保险产品呈现多样化趋势,种类和样式繁多,相应的,保险产品条款文档的内容也各不相同。
为了得到保险产品条款中的有价值数据,在传统模式下通常采用人工分析和拆解的方式对保险产品条款进行处理。由于保险产品条款生涩难懂,传统模式下的处理方案很容易造成条款数据定义不准确的问题,影响条款数据的可用性和价值性;另一方面,人工分析和拆解保险产品条款的时间周期过长,影响条款数据的时效性;此外,使用人工处理保险产品条款,人力成本过高。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种保险产品条款的智能化解析方法及相关设备,以解决条款数据定义不准确、解析时间过长、人力成本过高的问题。
基于上述目的,本说明书一个或多个实施例提供了一种保险产品条款的智能化解析方法,包括:
接收保险产品条款文档,获取所述保险产品条款文档中的特征数据;所述特征数据包括标题和段落内容;
根据标题和预设的段落匹配条件,整合所述段落内容,生成至少五个保险产品条款单元;
使用解析模型对所述保险产品条款单元进行解析处理,得到条款字段;
将所述条款字段显示在界面前端,供查询使用。
基于同一发明构思,本说明书一个或多个实施例还提供了一种保险产品条款的智能化解析装置,包括:
获取模块,被配置为接收保险产品条款文档,获取所述保险产品条款文档中的特征数据;
整合模块,被配置为根据预设条件,整合所述段落内容,生成至少五个保险产品条款单元;
解析模块,被配置为使用解析模型对所述保险产品条款单元进行解析处理,得到条款字段;
显示模块,被配置为将所述条款字段显示在界面前端,供查询使用。
基于同一发明构思,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一项所述的保险产品条款的智能化解析方法。
基于同一发明构思,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述任一所述的保险产品条款的智能化解析方法。
从上面所述可以看出,本说明书一个或多个实施例提供的保险产品条款的智能化解析方法及相关设备,通过使用预先训练的保险产品条款文档智能解析模型,对保险产品条款文档进行解析处理,最终将复杂的文本内容转换为可利用、有价值的保险产品条款字段和条款数据。本方法可以准确定义保险条款数据,提升了条款数据的可用性和价值性;同时,大幅降低保险产品条款的解析时间,提高了保险产品条款从文本内容到格式化、可用性数据的转换效率,降低了人力作业成本;此外,使用解析模型处理保险产品条款,其未来的可拓展性强,可以根据不同的保险产品条款进行不断的学习和优化。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例的保险产品条款的智能化解析方法流程图;
图2为本说明书一个或多个实施例的保险产品条款文档的示意图;
图3为本说明书一个或多个实施例的解析模型的训练流程图;
图4为本说明书一个或多个实施例的保险产品条款的智能化解析装置结构示意图;
图5为本说明书一个或多个实施例的电子设备结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如背景技术部分所述,近年来,各个保险公司推出了种类和样式繁多的保险产品,保险产品的条款也是生涩难懂,且越来越复杂。
为了得到保险产品条款中的有价值数据,在传统模式下通常采用人工分析和拆解的方式,对保险产品条款进行处理:在得到一篇保险产品条款文档后,手动拆解文档中的各种章节、标题和段落,并从中提取相关信息,如保险名称、保险期间、保险费、缴费方式、投保范围、保险种类、被保人性别、被保人年龄区间、被保人婚姻状态等,最后再将相关的文字和语句信息以代码数据的格式存储进电脑中,完成对保险产品条款的处理工作。
当保险产品条款相对复杂时,以人力的方式定义条款数据,不能准确定义,从而影响了条款数据的可用性和价值性。此外,人工处理保险产品条款还会有时间周期过长、人力成本过高等问题。
针对于上述现有技术中存在的问题,本说明书一个或多个实施例提出一种保险产品条款的智能化解析方法,通过使用预先训练的保险产品条款文档智能解析模型,对保险产品条款文档进行解析处理,最终将复杂的文本内容转换为可利用、有价值的保险产品条款字段和条款数据,从而提升了条款数据的可用性和价值性,降低了解析时间和人力作业成本。此外,使用解析模型处理保险产品条款,其未来的可拓展性强,可以根据不同的保险产品条款进行不断的学习和优化。
以下,通过具体的实施例来详细说明本说明书一个或多个实施例的技术方案。
本说明书一个或多个实施例提供了一种保险产品条款的智能化解析方法。参考图1,所述的保险产品条款的智能化解析方法,包括以下步骤:
步骤S101、接收保险产品条款文档,获取所述保险产品条款文档中的特征数据;所述特征数据包括标题和段落内容。
本实施例中,首先接收人工上传的保险产品条款文档,其中文档支持doc格式和pdf格式。然后扫描保险产品条款文档的全文,获取文档中的标题特征。其中,标题特征多以加粗字体、大号字体、单独成行等特征显示。再根据标题特征将文档全文解构,以段落为基础结构进行拆分,最终拆分得到若干个段落内容,每个段落内容包含一个段落特征,与标题特征相应。
此外,特征数据还可以包括特定文字,如“年”、“季”、“月”、“日”、“周岁”、“期间”、“费”等。
参考图2,为本说明书一个或多个实施例的保险产品条款文档的示意图。在接收到上述doc格式的保险产品条款文档,并扫描全文后,可以得到“XX保险股份有限公司”、“重大疾病保险利益条款”、“第一条保险合同构成”、“第二条投保范围”、“第三条保险期间和续保”、“第四条保险责任”、“第五条保险金额”、“第六条保险费”等至少8个标题特征。再以标题特征作为识别标识,以段落作为基础结构,对文档全文进行解构。最终拆分得到与标题特征相对应的至少10个段落内容。
步骤S102、根据标题和预设的段落匹配条件,整合所述段落内容,生成至少五个保险产品条款单元。
本步骤中,首先读取预设的段落匹配条件,然后根据段落匹配条件搜索对应的数个标题特征,最后将对应标题下的段落特征所在的段落内容进行组合,组合而成的包含多个段落的文本内容即为保险产品条款单元。
具体的,保险产品条款单元至少有五个,包括基本信息单元、承保信息单元、责任信息单元、保全信息单元和计算类信息单元等。
以图2所示的保险产品条款文档为例,预设的承保信息单元包含的段落匹配条件为:投保范围、保险期间和保险费。根据上述段落匹配条件搜索文档中的标题特征,搜索到的对应标题特征为:“第二条投保范围”、“第三条保险期间和续保”、“第六条保险费”。
其中,“投保范围”标题下的段落中含有段落特征“以上”、“以下”、“被保险人”,且均在同一段落中;“保险期间和续保”标题下的段落中含有段落特征“保险期间”、“续保”,且在两个不同的段落中;“保险费”标题下的段落中含有段落特征“保险费”、“分期”,虽然在两个不同的段落中,但属于保险费这一相同特征,归于同一段落。将“投保范围”段落、“保险期间”段落和“保险费”段落相组合,组合而成的段落内容即为承保信息单元。
解构文档、合并段落的策略减少了不相干信息对后续解析流程中解析模型的干扰,提升了解析模型的解析性能,保证了后续生成的条款数据的准确性和价值性。
步骤S103、使用解析模型对所述保险产品条款单元进行解析处理,得到条款字段。
本实施例中,将前述步骤生成的至少五个保险产品条款单元输入预先训练好的保险产品条款文档智能解析模型中,得到该文档中有价值的条款字段。其中,条款字段可以为词语或短句。
在一些可选的实施例中,保险产品条款文档智能解析模型由自然语言处理(Natural Language Processing,NLP)智能化训练平台生成并训练。以图2所示的保险产品条款文档为例,详细介绍保险产品条款文档智能解析模型的训练过程。参考图3,所述的解析模型的训练过程,包括以下步骤:
步骤S301、接收训练用保险产品条款文档,获取所述训练用保险产品条款文档中的训练用特征数据。
本实施例中,NLP智能化训练平台首先接收训练用保险产品条款文档。训练用保险产品条款文档的数量不少于一千款,文档格式支持doc格式和pdf格式,文档内容与图2所示的保险产品条款文档“XX保险股份有限公司——重大疾病保险利益条款”类似,包含训练用特征数据:标题特征、标题特征下含有段落特征的段落内容。
步骤S302、根据所述训练用特征数据,确定若干标注实体,并确定每个所述标注实体对应的解析结果。
本步骤中,首先根据标题特征和段落特征,确定不少于86项的标注实体,包括保险名称、保险期间、保险费、缴费方式、投保范围、保险种类、被保人性别、被保人年龄区间、被保人婚姻状态等。上述标注实体中,保险名称、保险期间、保险费、投保范围、保险种类等标注实体是根据标题特征作为标注对象获得的,缴费方式、被保人性别、被保人年龄区间、被保人婚姻状态等标注实体则是根据段落特征作为标注对象获得的。
在确定标注实体后,通过结合现有数据模型、以及标注人员对保险产品条款的理解,对保险产品条款文档中的段落内容进行全量的文本标注,获得每个标注实体对应的解析结果。每一个标注实体对应至少一个解析结果,其中,解析结果以词语或短句的形式呈现。
作为一个可选的实施例,将汉字格式的标注实体和解析结果转换为JSON格式的数据,存储在数据库中,用于后续开发人员的使用。
步骤S303、根据所述标注实体和所述解析结果,构建训练集,并基于所述训练集训练生成所述解析模型。
本实施例中,将标注实体及其对应的多个解析结果结合,构成训练集。在本说明书训练解析模型相关的实施例中,即以将标注实体“保险名称”对应的解析结果“XX重大疾病保险”结合、标注实体“保险期间”对应的解析结果“一年”结合、标注实体“投保范围”对应的解析结果“二十八日以上”和“七十五周岁以下”结合为例,构建了训练集。
在得到训练集后,使用深度学习算法对上述训练集进行机器学习和训练,最终得到保险产品条款文档智能解析模型。
在一些可选的实施例中,保险产品条款文档智能解析模型的训练过程,还包括建立解析模型与实际业务场景的数据模型之间的关联。其中,“关联”指训练过程中的解析结果与代码语言的转换关系。以图2所示的保险产品条款文档为例,标注实体“保险期间”对应的解析结果为“一年”的文本词汇。对“一年”这一词汇进行处理,转换为数据库的字段:“DurAmnt:1,DurUnit:Y”,其中“DurAmnt”表示“期间数值”,“DurUnit”表示“期间单位”,“Y”表示“年”。这样就将解析结果的文本词汇转换为代码语言,可以直接存储在数据库中,也可以被业务系统直接应用。
作为一个可选的实施例,保险产品条款文档智能解析模型的训练过程,还包括配置解析模型的相关规则。其中,针对保险业务场景下的部分数据进行文本的规则配置,例如针对长险和短险的区分,需要增加对“保险期间”这个标注实体的规则处理,即保险期间小于等于一年的为短期险,大于一年的是长期险。但由于保险产品相对比较复杂,规则并不单一,例如大部分附加险的保险期间的解析结果为“附加险的保险期间与主合同相同”。在遇到这种情况时,通过进一步完成对主险的追加解析,明确其主险的保险期间,即可得到附加险的保险期间的正确解析结果。通过解析模型与规则配置的共同加持,提升了解析模型的解析准确性,保证了数据的可用性。
在前述实施例的保险产品条款的智能化解析方法,于获得条款字段之后,还包括以下步骤:
步骤S104、将所述条款字段显示在界面前端,供查询使用。
在本步骤中,针对保险产品条款文档的智能解析模型,同样配套部署了界面化的应用。通过解析模型处理得到的条款字段,在网页界面前端以列表的形式展示。列表中除条款字段以外,还包括与之相对应的段落文本和标注实体展示。以图2所示的保险产品条款文档为例,智能解析模型的解析处理结果的示意图如表1所示:
表1条款解析表
作为一个可选的实施例,解析模型处理得到的条款字段,以基本信息单元、承保信息单元、责任信息单元、保全信息单元、计算类信息单元等至少五大类单元,分类展示在网页界面前端,供技术人员查询使用。此外,技术人员也可以点击网页界面前端的保存按钮,将条款字段文本保存在数据库中。
在一些可选的实施例中,在前述实施例的保险产品条款的智能化解析方法,于获得条款字段之后,还包括以下步骤:
处理所述条款字段,得到条款数据,并存储在数据库中;
根据业务系统的需求,分类整合所述条款数据,生成条款价值数据;
将所述条款价值数据传输给业务系统,供业务操作使用。
本实施例中,在得到条款字段后,通过使用解析结果与代码语言的转换关系,将文本格式的条款字段转换为数据格式的条款数据,并将条款数据存储在数据库中。根据各个业务系统的数据需求,将条款数据进行整合归类。例如契约系统需要承保信息和计算类信息相关的数据,则将相关的条款数据整合,生成的数据集合即为契约系统的有价值条款数据。最后,将所有的有价值条款数据通过Kafka数据传输机制分发给保险产品的各个业务系统,供其业务操作使用。业务系统在消费其接收到的有价值数据后,同样会返回消费结果。如此就构成了数据传输的闭环,实现了保险产品条款从文本内容到条款数据再到有价值条款数据的自由转换。
由上述实施例可见,本说明书一个或多个实施例提供的保险产品条款的智能化解析方法及相关设备,通过使用预先训练的保险产品条款文档智能解析模型,对保险产品条款文档进行解析处理,最终将复杂的文本内容转换为可利用、有价值的保险产品条款字段和条款数据。本方法可以准确定义保险条款数据,提升了条款数据的可用性和价值性;同时,大幅降低保险产品条款的解析时间,提高了保险产品条款从文本内容到格式化、可用性数据的转换效率,降低了人力作业成本;此外,使用解析模型处理保险产品条款,其未来的可拓展性强,可以根据不同的保险产品条款进行不断的学习和优化。
可以理解的是,本说明书一个或多个实施例的方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,本说明书一个或多个实施例还提供了一种保险产品条款的智能化解析装置。参考图4,所述的保险产品条款的智能化解析装置,包括:
获取模块401,被配置为接收保险产品条款文档,获取所述保险产品条款文档中的特征数据;
整合模块402,被配置为根据预设条件,整合所述段落内容,生成至少五个保险产品条款单元;
解析模块403,被配置为使用解析模型对所述保险产品条款单元进行解析处理,得到条款字段;
显示模块404,被配置为将所述条款字段显示在界面前端,供查询使用。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一实施例所述的保险产品条款的智能化解析方法。
图5示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
基于同一发明构思,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任意一实施例所述的保险产品条款的智能化解析方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种保险产品条款的智能化解析方法,其特征在于,包括:
接收保险产品条款文档,获取所述保险产品条款文档中的特征数据;所述特征数据包括标题和段落内容;
根据标题和预设的段落匹配条件,整合所述段落内容,生成至少五个保险产品条款单元;
使用解析模型对所述保险产品条款单元进行解析处理,得到条款字段;
将所述条款字段显示在界面前端,供查询使用。
2.根据权利要求1所述的保险产品条款的智能化解析方法,其特征在于,所述保险产品条款单元,包括:基本信息单元、承保信息单元、责任信息单元、保全信息单元和计算类信息单元。
3.根据权利要求1所述的保险产品条款的智能化解析方法,其特征在于,所述解析模型由自然语言处理平台生成并训练。
4.根据权利要求3所述的保险产品条款的智能化解析方法,其特征在于,所述解析模型的训练过程,具体包括:
接收训练用保险产品条款文档,获取所述训练用保险产品条款文档中的训练用特征数据;
根据所述训练用特征数据,确定若干标注实体,并确定每个所述标注实体对应的解析结果;
根据所述标注实体和所述解析结果,构建训练集,并基于所述训练集训练生成所述解析模型。
5.根据权利要求4所述的保险产品条款的智能化解析方法,其特征在于,所述标注实体,包括保险名称、保险期间、保险费、缴费方式、投保范围、保险种类、被保人性别、被保人年龄区间和被保人婚姻状态。
6.根据权利要求4所述的保险产品条款的智能化解析方法,其特征在于,所述解析模型的训练过程,还包括:建立所述解析模型与实际业务场景的数据模型之间的关联;
所述建立所述解析模型与实际业务场景的数据模型之间的关联,是确定所述解析结果和代码语言的转换关系。
7.根据权利要求4所述的保险产品条款的智能化解析方法,其特征在于,所述解析模型的训练过程,还包括:配置所述解析模型的相关规则;
所述配置所述解析模型的相关规则,是对所述标注实体进行预设规则的限制;
所述预设规则配合所述训练集,共同训练生成解析模型。
8.根据权利要求1所述的保险产品条款的智能化解析方法,其特征在于,所述方法还包括:
处理所述条款字段,得到条款数据,并存储在数据库中;
根据业务系统的需求,分类整合所述条款数据,生成条款价值数据;
将所述条款价值数据传输给业务系统,供业务操作使用。
9.一种保险产品条款的智能化解析装置,其特征在于,包括:
获取模块,被配置为接收保险产品条款文档,获取所述保险产品条款文档中的特征数据;
整合模块,被配置为根据预设条件,整合所述段落内容,生成至少五个保险产品条款单元;
解析模块,被配置为使用解析模型对所述保险产品条款单元进行解析处理,得到条款字段;
显示模块,被配置为将所述条款字段显示在界面前端,供查询使用。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011459990.7A CN112463931B (zh) | 2020-12-11 | 2020-12-11 | 一种保险产品条款的智能化解析方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011459990.7A CN112463931B (zh) | 2020-12-11 | 2020-12-11 | 一种保险产品条款的智能化解析方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112463931A true CN112463931A (zh) | 2021-03-09 |
CN112463931B CN112463931B (zh) | 2024-05-28 |
Family
ID=74803434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011459990.7A Active CN112463931B (zh) | 2020-12-11 | 2020-12-11 | 一种保险产品条款的智能化解析方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463931B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114330284A (zh) * | 2021-11-09 | 2022-04-12 | 世纪保众(北京)网络科技有限公司 | 一种基于规则模型的自动化保险条款解析方法 |
CN114387116A (zh) * | 2022-01-14 | 2022-04-22 | 阳光财产保险股份有限公司 | 一种保险分保的方法、装置、电子设备及可读存储介质 |
CN114792272A (zh) * | 2022-05-10 | 2022-07-26 | 北京华通互惠科技有限公司 | 保险产品处理装置、方法、电子设备及存储介质 |
CN114841128A (zh) * | 2022-03-31 | 2022-08-02 | 北京百度网讯科技有限公司 | 基于人工智能的业务交互方法、装置、设备、介质及产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100268528A1 (en) * | 2009-04-16 | 2010-10-21 | Olga Raskina | Method & Apparatus for Identifying Contract Characteristics |
CN107330719A (zh) * | 2017-06-09 | 2017-11-07 | 上海新概念保险经纪有限公司 | 一种保险产品推荐方法及系统 |
CN107392143A (zh) * | 2017-07-20 | 2017-11-24 | 中国科学院软件研究所 | 一种基于svm文本分类的简历精确解析方法 |
CN108874928A (zh) * | 2018-05-31 | 2018-11-23 | 平安科技(深圳)有限公司 | 简历数据信息解析处理方法、装置、设备及存储介质 |
CN110222292A (zh) * | 2019-04-29 | 2019-09-10 | 毕昀 | 网站简历自动解析方法、计算机设备和存储介质 |
CN111046142A (zh) * | 2019-12-13 | 2020-04-21 | 深圳前海环融联易信息科技服务有限公司 | 文本审查方法、装置、电子设备及计算机存储介质 |
CN111143505A (zh) * | 2019-11-28 | 2020-05-12 | 泰康保险集团股份有限公司 | 文档处理方法、装置、介质及电子设备 |
-
2020
- 2020-12-11 CN CN202011459990.7A patent/CN112463931B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100268528A1 (en) * | 2009-04-16 | 2010-10-21 | Olga Raskina | Method & Apparatus for Identifying Contract Characteristics |
CN107330719A (zh) * | 2017-06-09 | 2017-11-07 | 上海新概念保险经纪有限公司 | 一种保险产品推荐方法及系统 |
CN107392143A (zh) * | 2017-07-20 | 2017-11-24 | 中国科学院软件研究所 | 一种基于svm文本分类的简历精确解析方法 |
CN108874928A (zh) * | 2018-05-31 | 2018-11-23 | 平安科技(深圳)有限公司 | 简历数据信息解析处理方法、装置、设备及存储介质 |
CN110222292A (zh) * | 2019-04-29 | 2019-09-10 | 毕昀 | 网站简历自动解析方法、计算机设备和存储介质 |
CN111143505A (zh) * | 2019-11-28 | 2020-05-12 | 泰康保险集团股份有限公司 | 文档处理方法、装置、介质及电子设备 |
CN111046142A (zh) * | 2019-12-13 | 2020-04-21 | 深圳前海环融联易信息科技服务有限公司 | 文本审查方法、装置、电子设备及计算机存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114330284A (zh) * | 2021-11-09 | 2022-04-12 | 世纪保众(北京)网络科技有限公司 | 一种基于规则模型的自动化保险条款解析方法 |
CN114387116A (zh) * | 2022-01-14 | 2022-04-22 | 阳光财产保险股份有限公司 | 一种保险分保的方法、装置、电子设备及可读存储介质 |
CN114841128A (zh) * | 2022-03-31 | 2022-08-02 | 北京百度网讯科技有限公司 | 基于人工智能的业务交互方法、装置、设备、介质及产品 |
CN114792272A (zh) * | 2022-05-10 | 2022-07-26 | 北京华通互惠科技有限公司 | 保险产品处理装置、方法、电子设备及存储介质 |
CN114792272B (zh) * | 2022-05-10 | 2024-02-23 | 北京华通互惠科技有限公司 | 保险产品处理装置、方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112463931B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shen et al. | Layoutparser: A unified toolkit for deep learning based document image analysis | |
CN112463931B (zh) | 一种保险产品条款的智能化解析方法及相关设备 | |
CN109754233B (zh) | 一种智能推荐职位信息的方法和系统 | |
US11762926B2 (en) | Recommending web API's and associated endpoints | |
US11106906B2 (en) | Systems and methods for information extraction from text documents with spatial context | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
CN103329122A (zh) | 使用多个表示的文档存储 | |
CN110738037A (zh) | 用于自动生成电子表格的方法、装置、设备及存储介质 | |
US20150186808A1 (en) | Contextual data analysis using domain information | |
CN105426508A (zh) | 网页生成方法和装置 | |
US20220121668A1 (en) | Method for recommending document, electronic device and storage medium | |
CN111144210A (zh) | 图像的结构化处理方法及装置、存储介质及电子设备 | |
Chou et al. | Integrating XBRL data with textual information in Chinese: A semantic web approach | |
CN113642569A (zh) | 非结构化数据文档处理方法及相关设备 | |
CN102214091A (zh) | 一种定位软件开发中需求变更影响范围的方法和系统 | |
US11392753B2 (en) | Navigating unstructured documents using structured documents including information extracted from unstructured documents | |
Bhatia et al. | Machine Learning with R Cookbook: Analyze data and build predictive models | |
KR20220058259A (ko) | 논문의 메타데이터 추출 방법 및 장치 | |
CN117389890A (zh) | 测试用例的生成方法、装置、电子设备和存储介质 | |
CN110008807B (zh) | 一种合同内容识别模型的训练方法、装置及设备 | |
CN113127060A (zh) | 一种基于自然语言预训练模型(bert)的软件功能点识别方法 | |
CN116229481A (zh) | 一种关键信息抽取方法、装置、电子设备及存储介质 | |
US12093265B2 (en) | Semantics based data and metadata mapping | |
US20190065032A1 (en) | Method and system for capturing, storing, and recreating current state of an application | |
CN115470790A (zh) | 一种识别文件中的命名实体的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |