CN111625646B - 处理投保单的方法、装置、电子设备和存储介质 - Google Patents

处理投保单的方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111625646B
CN111625646B CN202010443156.2A CN202010443156A CN111625646B CN 111625646 B CN111625646 B CN 111625646B CN 202010443156 A CN202010443156 A CN 202010443156A CN 111625646 B CN111625646 B CN 111625646B
Authority
CN
China
Prior art keywords
feature information
verified
frequency word
information
application form
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010443156.2A
Other languages
English (en)
Other versions
CN111625646A (zh
Inventor
史宗耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Pension Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN202010443156.2A priority Critical patent/CN111625646B/zh
Publication of CN111625646A publication Critical patent/CN111625646A/zh
Application granted granted Critical
Publication of CN111625646B publication Critical patent/CN111625646B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开一种处理投保单的方法、装置、电子设备和存储介质。处理投保单的方法包括:将历史问题投保单集合中的历史问题投保单按照所属核保问题的类别进行分类;依次对每类历史问题投保单所对应的问题内容信息集合进行文本分析;对每类历史问题投保单的投保单内容进行特征提取;对待核保投保单进行特征提取;将待核保特征信息依次与每个所述问题特征信息进行比较;当获取到高频词集合时将所获取的所有高频组词生成新问题内容信息,将新问题内容信息流转至待核保投保单的填写人处。本发明中的核保规则自动生成,待核保投保单的核保过程自动化,由此实现更智能、更准确的自动核保。

Description

处理投保单的方法、装置、电子设备和存储介质
技术领域
本发明总体来说涉及一种处理投保单的方法、装置、电子设备和存储介质。
背景技术
投保单又称"投保书"、"要保书",投保人向保险人申请订立保险合同的书面要约。投保书是由保险人事先准备、具有统一格式的书据。投保人必须依其所列项目一一如实填写,以供保险人决定是否承保或以何种条件、何种费率承保。
传统核保流程使用系统预先定义的核保规则进行自动核保,如果自动核保不通过则转入人工核保,处理过程中会产生很多问题件,如被保险人信息填写有误,保险金额填写有误,补充疾病资料,补充财务资料,健康检查等等。
然而,目前问题件处理的自动化、智能化程度较低,导致人工核保工作量过大,造成人力的浪费和时间的增加,并且累积了大量未回销的问题件而影响效率。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
在发明内容部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明。本发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
本发明的一个主要目的在于克服上述现有技术的至少一种缺陷,提供一种处理投保单的方法,其包括:
将历史问题投保单集合中的历史问题投保单按照所属核保问题的类别进行分类;
依次对每类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合;
对每类历史问题投保单的投保单内容进行特征提取以获得问题特征信息;
将每类历史问题投保单的问题特征信息和高频词集合相关联;
当接收到核保请求时对待核保投保单进行特征提取以获得待核保特征信息;
将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合;
当获取到高频词集合时将所获取的所有高频组词生成新问题内容信息,将新问题内容信息流转至待核保投保单的填写人处。
在本发明的一个实施例中,对一类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合,包括:
将一个问题内容信息集合中的每个问题内容信息进行分词处理,以将每个问题内容信息的每个语句拆分成多个词组;
去除每个问题内容信息中的无意义词组;
对问题内容信息集合中的所有问题内容信息进行词频分析以获取高频词集合,高频词集合包含多个出现次数靠前的高频词。
在本发明的一个实施例中,将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合,包括
选取步骤:选取一组还未与待核保特征信息进行比较的问题特征信息;
将该组问题特征信息与待核保特征信息进行比较来获得待核保特征信息覆盖问题特征信息的程度,若是则获取该组问题特征信息所对应的高频词集合然后进入判断步骤,否则进入判断步骤;
判断步骤:判断是否还具有未与待核保特征信息进行比较的问题特征信息,若有则进入选取步骤。
在本发明的一个实施例中,所述方法还包括
当未获取到高频词集合时对待核保投保单进行人工核保;
当该待核保投保单在人工核保的过程中发现存在问题时,人工录入该待核保投保单的问题内容信息,并将该待核保投保单加入到历史问题投保单集合中。
在本发明的一个实施例中,在将新问题内容信息流转至填写人的同时还错误通知发送至填写人。
在本发明的一个实施例中,在将每类历史问题投保单的问题特征信息和高频词集合相关联时,将每类历史问题投保单的问题特征信息和高频词集合存储到key-value结构化特征数据库中,将高频词集合作为关键字存储,将问题特征信息作为值存储。
在本发明的一个实施例中,该预设值的取值范围大于或等于百分之五十且小于或等于百分之九十。
本发明还提出了一种处理投保单的装置,其包括:
分类模块,用于将历史问题投保单集合中的历史问题投保单按照所属核保问题的类别进行分类;
文本分析模块,用于依次对每类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合;
第一特征提取模块,用于对每类历史问题投保单的投保单内容进行特征提取以获得问题特征信息;
关联模块,用于将每类历史问题投保单的问题特征信息和高频词集合相关联;
第二特征提取模块,用于当接收到核保请求时对待核保投保单进行特征提取以获得待核保特征信息;
比较模块,用于将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合;
流转模块,用于当获取到高频词集合时将所获取的所有高频组词生成新问题内容信息,将新问题内容信息流转至待核保投保单的填写人处。
本发明还提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的方法。
本发明还提出了一种电子设备,其包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行如上所述的方法。
由上述技术方案可知,本发明的处理投保单的方法的优点和积极效果在于:
在本发明中,通过对历史问题投保单进行处理来获得与每类核保问题相对应的高频词集合和问题特征信息,并且高频词集合和问题特征信息相对应,众多的问题特征信息组成核保规则用来识别出待核保投保单所存在核保问题。同时,当其中的一个或多个问题特征信息与待核保投保单的待核保特征信息相匹配时,再根据这些问题特征信息所对应的高频词集合能生成新问题内容信息。本发明中的核保规则自动生成,待核保投保单的核保过程自动化,由此实现更智能、更准确的自动核保。
附图说明
通过结合附图考虑以下对本发明的优选实施例的详细说明,本发明的各种目标、特征和优点将变得更加显而易见。附图仅为本发明的示范性图解,并非一定是按比例绘制。在附图中,同样的附图标记始终表示相同或类似的部件。其中:
图1是根据一示例性实施方式示出的一种处理投保单的方法的流程图。
图2是根据一示例性实施方式示出的一种处理投保单的装置的结构示意图。
图3是根据一示例性实施方式示出的一种电子设备的示意图;
图4是根据一示例性实施方式示出的一种计算机可读存储介质的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
参照图1,图1显示了一种处理投保单的方法,其包括步骤S11~S17。
S11:将历史问题投保单集合中的历史问题投保单按照所属核保问题的类别进行分类;
投保单又称"投保书"、"要保书",投保人向保险人申请订立保险合同的书面要约。投保书是由保险人事先准备、具有统一格式的书据。投保人必须依其所列项目一一如实填写,以供保险人决定是否承保或以何种条件、何种费率承保。
保险核保是指保险公司在对投保的标的信息全面掌握、核实的基础上,对可保风险进行评判与分类,进而决定是否承保、以什么样的条件承保的过程。在核保过程中,核保人员会按标的物的不同风险类别给予不同的承保条件,保证业务质量,保证保险经营的稳定性。
历史问题投保单是以往由核保人员人工核保筛选出来的投保单,这类投保单由于不符合其对应的保险核保规则而被筛选出来。核保人员在每筛选出一个历史问题投保单时录入核保不能通过的原因,该核保不能通过的原因即为问题内容信息。同时,核保人员在每处理一个历史问题投保单还会标记该历史问题投保单的核保问题的类别。
例如,核保人员打开某个电子投保单的核保页面后,在确定该电子投保单的投保单内容不符合保险核保规则时,核保人员在核保页面填写问题内容信息并选择核保问题的类别后确认核保不通过。然后,该电子投保单以及与该电子投保单相关联的问题内容信息、核保问题标识存储到历史问题投保单数据库中。
核保问题的类别可以包括分流错误、填写错误、名单错误、录单错误、扫描件错误等等。将历史问题投保单集合中的问题投保单按照所属核保问题的类别划分成多类,每个核保问题对应一类问题投保单。
S12:依次对每类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合;
每类历史问题投保单中的每张问题投保单都具有对应的问题内容信息,该问题内容信息记载了该问题投保单不符合保险核保规则的详细理由。
对每类历史问题投保单所对应的问题内容信息集合文本分析的步骤包括步骤S121~步骤S125。
S121:选取一个还未进行文本分析的问题内容信息集合,进入步骤S122;
S122:将一个问题内容信息集合中的每个问题内容信息进行分词处理,以将每个问题内容信息的每个语句拆分成多个词组,进入步骤S123;
对文档的内容进行分词可以采用中文分词技术,将每个中文语句按照语义拆分成多个词组。
S123:去除每个问题内容信息中的无意义词组,进入步骤S124;
无意义词组包括冠词和语气助词,例如“的”、“了”、“呢”、“吗”等词语。
S124:对问题内容信息集合中的所有问题内容信息进行词频分析以获取高频词集合,高频词集合包含多个出现次数靠前的高频词,进入步骤S125;
进行词频分析可以统计出每个词组的出现次数。将出现次数在前预设位的词组作为高频词,这些高频词组成高频词集合。前预设位可以是前10位,例如,出现次数在前10位的词组为高频词,这些词组组成一个高频词集合。
S125:判断是否还具备未进行文本分析的问题内容信息集合,若具有则进入到步骤S121,否则进入到步骤S13。
S13:对每类历史问题投保单的投保单内容进行特征提取以获得问题特征信息;
投保单内容主要包括:被保险人的名称和地址、保险标的的名称和存放地点、投保的险别、保险责任的起讫、保险价值及保险金额等信息。
问题特征信息包括投保单基础信息数据、险种责任和要素、被保人信息、健康告知信息等。
投保单基础信息数据包括投保单编号、投保单填写日期、核保日期等基础数据。
险种责任和要素包括险种、保险给付责任和承保要求。险种包括财产损失保险、信用保险、人寿保险、意外伤害保险、健康保险等。保险给付责任包括损害赔偿、责任赔偿、保险金给付、施救费用、救助费用、诉讼费用等。承保要求包括年龄范围要求、性别要求、户籍要求、健康要求等。
被保人信息包括年龄、性别、手机号码、身份证号码、居住城市、工作性质。
健康告知信息包括在近期是否患病的信息、患病种类的信息、住院天数信息以及体检结果信息。
S14:将每类历史问题投保单的问题特征信息和高频词集合相关联;
在本实施例中,key-value结构化特征数据中,key是关键字,value是值,将高频词集合作为关键字存储,将每类历史问题投保单的问题特征信息和高频词集合存储到key-value结构化特征数据库中,在存储时将高频词集合作为关键字存储,将问题特征信息作为值存储,这样能使得每类历史问题投保单的问题特征信息与高频词集合对应关联起来。
key-value结构化特征数据库具有查询速度快、存放数据量大、支持高并发的优点,非常适合通过主键进行查询。key-value结构化特征数据库可以是Aerospike、LevelDB、RocksDB等数据库。
S15:当接收到核保请求时对待核保投保单的投保单内容进行特征提取以获得待核保特征信息;
待核保投保单是需要进行核保的新投保单。待核保投保单可以是由保险代理人在投保页面代投保人填写的电子投保单,也可以是由投保人在投保页面自行填写的电子投保单。
提取待核保投保单的保单内容,对该保单内容进行特征提取以获得待核保特征信息。
待核保特征信息包括投保单基础信息数据、险种责任和要素、被保人信息、健康告知信息等信息。
投保单基础信息数据包括投保单编号、投保单填写日期、核保日期等基础数据。
险种责任和要素包括险种、保险给付责任和承保要求。险种包括财产损失保险、信用保险、人寿保险、意外伤害保险、健康保险等。保险给付责任包括损害赔偿、责任赔偿、保险金给付、施救费用、救助费用、诉讼费用等。承保要求包括年龄范围要求、性别要求、户籍要求、健康要求等。
被保人信息包括年龄、性别、手机号码、身份证号码、居住城市、工作性质。
健康告知信息包括在近期是否患病的信息、患病种类的信息、住院天数信息以及体检结果信息。
S16:将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合;步骤S16包括步骤S161~S165。
步骤S161:选取一组还未与待核保特征信息进行比较的问题特征信息,进入步骤S162;
步骤S162:将该组问题特征信息与待核保特征信息进行比较来获得待核保特征信息覆盖问题特征信息的程度,进入步骤S163;
例如,当问题特征信息中已经具有百分之六十信息存在于待核保特征信息中,则表明待核保特征信息覆盖了百分之六十的问题特征信息。
步骤S163:判断该程度是否大于或等于预设值,若是则进入步骤S164,否则进入步骤S165;
该预设值为预设设置的一个阈值,该预设值的取值范围可以是大于或等于百分之五十且小于或等于百分之九十。预设值为一经验值,预设值的选取方法为当待核保特征信息覆盖该组问题特征信息的程度大于预设值时能使得该待核保投保单中大概率存在该组问题特征信息所对应的核保问题。
若将该组问题特征信息与待核保特征信息进行比较来获得待核保特征信息覆盖问题特征信息的程度大于或等于预设值,则说明该待核保投保单存在该组问题特征信息对应的核保问题,因此将该待核保投保单中的核保问题识别出来了。
步骤S164:获取该组问题特征信息所对应的高频词集合,进入到步骤S165;
由于步骤S14中已经将问题特征信息与高频词集合相关联,根据问题特征信息能获得该问题特征信息对应的高频词集合。
步骤S165:判断是否还具有未与待核保特征信息进行比较的问题特征信息,若有则进入步骤S161,否则进入到步骤S17;
S17:当获取到高频词集合时将所获取的所有高频组词生成新问题内容信息,将新问题内容信息流转至待核保投保单的填写人处。
步骤S17包括步骤S171~S173。
S171:判断是否获取到高频词集合,若获取到了则进入到步骤S172;
S172:根据获取的所有高频词集合生成新问题内容信息,进入步骤S173;
预先将每个高频词集合对应至少一条问题内容。在获得一个或多个高频词集合后,根据这些高频词集合获取这些高频词集合对应的问题内容,再将这些问题内容合并成新问题内容信息。
S173:将新问题内容信息流转至待核保投保单的填写人处。
将新问题内容信息发送至待核保投保单的填写人处,可以使填写人根据该新问题内容信息来修改投保单。该填写人可以是保险代理人,也可以是投保人。新问题内容信息可以是通过电子邮箱、电话、客户端页面信息等形式发送给填写人。
在本实施例中,通过对历史问题投保单进行处理来获得与每类核保问题相对应的高频词集合和问题特征信息,并且高频词集合和问题特征信息相对应,众多的问题特征信息组成核保规则用来识别出待核保投保单所存在核保问题。同时,当其中的一个或多个问题特征信息与待核保投保单的待核保特征信息相匹配时,再根据这些问题特征信息所对应的高频词集合能生成新问题内容信息。本实施例中的核保规则自动生成,待核保投保单的核保过程自动化,由此实现更智能、更准确的自动核保。
进一步地,在步骤S173中,还包括在将新问题内容信息流转至填写人的同时还错误通知发送至填写人。
错误通知的内容可以是该新问题内容信息的简要内容。错误通知可以是通过电话或者短信发送至填写人,以便于填写人能及时获知待核保投保单未通过核保,并及时处理该待核保投保单。
进一步地,该方法还包括步骤S18~S20。
步骤S171还包括:若未获取到高频词集合,则进入步骤S18;
S18:对待核保投保单进行人工核保,若该待核保投保单在人工核保的过程中并不存在问题则进入步骤S19,若该待核保投保单在人工核保的过程中发现存在问题则进入步骤S20;
S19:确认该待核保投保单通过审核,对该待核保投保单进行承保;
S20:人工录入该待核保投保单的问题内容信息,并将该待核保投保单加入到历史问题投保单集合中,在进入到步骤S11。
在人工核保时发现待核保投保单具有问题时,将该待核保投保单及其问题内容信息加入到历史问题投保单集合中后作为后续自动核保的依据,能使得后续的具有相同问题的待核保投保单也能被自动识别出来,并能进行自动处理。
参照图2,本实施例还提出了一种处理投保单的装置1,其包括:
分类模块11,用于将历史问题投保单集合中的历史问题投保单按照所属核保问题的类别进行分类;
文本分析模块12,用于依次对每类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合;
第一特征提取模块13,用于对每类历史问题投保单的投保单内容进行特征提取以获得问题特征信息;
关联模块14,用于将每类历史问题投保单的问题特征信息和高频词集合相关联;
第二特征提取模块15,用于当接收到核保请求时对待核保投保单进行特征提取以获得待核保特征信息;
比较模块16,用于将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合;
流转模块17,用于当获取到高频词集合时将所获取的所有高频组词生成新问题内容信息,将新问题内容信息流转至待核保投保单的填写人处。
进一步地,文本分析模块12,还用于将一个问题内容信息集合中的每个问题内容信息进行分词处理,以将每个问题内容信息的每个语句拆分成多个词组;
去除每个问题内容信息中的无意义词组;
对问题内容信息集合中的所有问题内容信息进行词频分析以获取高频词集合,高频词集合包含多个出现次数靠前的高频词。
进一步地,比较模块16还用于执行下列步骤:
选取步骤:选取一组还未与待核保特征信息进行比较的问题特征信息;
将该组问题特征信息与待核保特征信息进行比较来获得待核保特征信息覆盖问题特征信息的程度,若是则获取该组问题特征信息所对应的高频词集合然后进入判断步骤,否则进入判断步骤;
判断步骤:判断是否还具有未与待核保特征信息进行比较的问题特征信息,若有则进入选取步骤。
进一步地,该装置还包括人工核保模块,该人工核保模块用于执行下列步骤:
当未获取到高频词集合时对待核保投保单进行人工核保;
当该待核保投保单在人工核保的过程中发现存在问题时,人工录入该待核保投保单的问题内容信息,并将该待核保投保单加入到历史问题投保单集合中。
进一步地,在将新问题内容信息流转至填写人的同时还错误通知发送至填写人
进一步地,在将每类历史问题投保单的问题特征信息和高频词集合相关联时,将每类历史问题投保单的问题特征信息和高频词集合存储到key-value结构化特征数据库中,将高频词集合作为关键字存储,将问题特征信息作为值存储。
进一步地,该预设值的取值范围大于或等于百分之五十且小于或等于百分之九十。
下面参照图3来描述根据本发明的这种实施方式的电子设备800。图3显示的电子设备800仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(ROM)8203。
存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得保险客户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的处理投保单的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述一种处理投保单的方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图4所示,描述了根据本发明的实施方式的用于实现上述处理投保单的方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程序程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在保险客户计算设备上执行、部分地在保险客户设备上执行、作为一个独立的软件包执行、部分在保险客户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到保险客户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的处理投保单的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
尽管已经参照某些实施例公开了本发明,但是在不背离本发明的范围和范畴的前提下,可以对所述的实施例进行多种变型和修改。因此,应该理解本发明并不局限于所阐述的实施例,其保护范围应当由所附权利要求的内容及其等价的结构和方案限定。

Claims (10)

1.一种处理投保单的方法,其特征在于,包括:
将历史问题投保单集合中的历史问题投保单按照所属核保问题的类别进行分类;
依次对每类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合;
对每类历史问题投保单的投保单内容进行特征提取以获得问题特征信息;
将每类历史问题投保单的问题特征信息和高频词集合相关联;
当接收到核保请求时对待核保投保单进行特征提取以获得待核保特征信息;
将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合;
当获取到高频词集合时根据所获取的所有高频组词生成新问题内容信息,将新问题内容信息流转至待核保投保单的填写人处;
其中,每个高频词集合预先设置对应至少一条问题内容,根据获取的所有高频组词对应的问题内容,合并为新问题内容信息。
2.如权利要求1所述的方法,其特征在于,对一类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合,包括:
将一个问题内容信息集合中的每个问题内容信息进行分词处理,以将每个问题内容信息的每个语句拆分成多个词组;
去除每个问题内容信息中的无意义词组;
对去除无意义词组后的所有词组进行词频分析以获取高频词集合,高频词集合包含多个出现次数靠前的高频词。
3.如权利要求1所述的方法,其特征在于,将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合,包括
选取步骤:选取一组还未与待核保特征信息进行比较的问题特征信息;
将该组问题特征信息与待核保特征信息进行比较来获得待核保特征信息覆盖问题特征信息的程度,判断所述程度是否达到预设值,若是则获取该组问题特征信息所对应的高频词集合然后进入判断步骤,否则进入判断步骤;
判断步骤:判断是否还具有未与待核保特征信息进行比较的问题特征信息,若有则进入选取步骤。
4.如权利要求1所述的方法,其特征在于,所述方法还包括
当未获取到高频词集合时对待核保投保单进行人工核保;
当该待核保投保单在人工核保的过程中发现存在问题时,人工录入该待核保投保单的问题内容信息,并将该待核保投保单加入到历史问题投保单集合中。
5.如权利要求1所述的方法,其特征在于,在将新问题内容信息流转至填写人的同时还将错误通知发送至填写人。
6.如权利要求1至5中任意一项所述的方法,其特征在于,在将每类历史问题投保单的问题特征信息和高频词集合相关联时,将每类历史问题投保单的问题特征信息和高频词集合存储到key-value结构化特征数据库中,将高频词集合作为关键字存储,将问题特征信息作为值存储。
7.如权利要求1至5中任意一项所述的方法,其特征在于,该预设值的取值范围大于或等于百分之五十且小于或等于百分之九十。
8.一种处理投保单的装置,其特征在于,包括:
分类模块,用于将历史问题投保单集合中的历史问题投保单按照所属核保问题的类别进行分类;
文本分析模块,用于依次对每类历史问题投保单所对应的问题内容信息集合进行文本分析以提取与每类历史问题投保单对应的高频词集合;
第一特征提取模块,用于对每类历史问题投保单的投保单内容进行特征提取以获得问题特征信息;
关联模块,用于将每类历史问题投保单的问题特征信息和高频词集合相关联;
第二特征提取模块,用于当接收到核保请求时对待核保投保单进行特征提取以获得待核保特征信息;
比较模块,用于将待核保特征信息依次与每个所述问题特征信息进行比较,当该待核保特征信息覆盖任意问题特征信息的程度达到预设值时则获取该问题特征信息所对应的高频词集合;
流转模块,用于当获取到高频词集合时根据所获取的所有高频组词生成新问题内容信息,将新问题内容信息流转至待核保投保单的填写人处;
其中,每个高频词集合预先设置对应至少一条问题内容,根据获取的所有高频组词对应的问题内容,合并为新问题内容信息。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~7中任意项所述的方法。
CN202010443156.2A 2020-05-22 2020-05-22 处理投保单的方法、装置、电子设备和存储介质 Active CN111625646B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010443156.2A CN111625646B (zh) 2020-05-22 2020-05-22 处理投保单的方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010443156.2A CN111625646B (zh) 2020-05-22 2020-05-22 处理投保单的方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN111625646A CN111625646A (zh) 2020-09-04
CN111625646B true CN111625646B (zh) 2023-04-21

Family

ID=72271086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010443156.2A Active CN111625646B (zh) 2020-05-22 2020-05-22 处理投保单的方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111625646B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553797A (zh) * 2020-03-31 2020-08-18 万达信息股份有限公司 一种商保快速核保系统、方法及云商保平台

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383853A (zh) * 2016-08-30 2017-02-08 刘勇 一种电子病历后结构化以及辅助诊断的实现方法及其系统
CN107451592A (zh) * 2017-06-30 2017-12-08 广东数相智能科技有限公司 一种处方药品核对方法及装置
CN108460692A (zh) * 2018-03-23 2018-08-28 深圳市慧择保险经纪有限公司 一种基于健康险的线上核保方法、装置、设备和存储介质
CN109522400A (zh) * 2018-05-28 2019-03-26 平安医疗健康管理股份有限公司 核保方法、装置、计算机设备和存储介质
CN110728585A (zh) * 2019-10-23 2020-01-24 泰康保险集团股份有限公司 核保方法、装置、设备及存储介质
CN111046142A (zh) * 2019-12-13 2020-04-21 深圳前海环融联易信息科技服务有限公司 文本审查方法、装置、电子设备及计算机存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711584B2 (en) * 2003-09-04 2010-05-04 Hartford Fire Insurance Company System for reducing the risk associated with an insured building structure through the incorporation of selected technologies

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383853A (zh) * 2016-08-30 2017-02-08 刘勇 一种电子病历后结构化以及辅助诊断的实现方法及其系统
CN107451592A (zh) * 2017-06-30 2017-12-08 广东数相智能科技有限公司 一种处方药品核对方法及装置
CN108460692A (zh) * 2018-03-23 2018-08-28 深圳市慧择保险经纪有限公司 一种基于健康险的线上核保方法、装置、设备和存储介质
CN109522400A (zh) * 2018-05-28 2019-03-26 平安医疗健康管理股份有限公司 核保方法、装置、计算机设备和存储介质
CN110728585A (zh) * 2019-10-23 2020-01-24 泰康保险集团股份有限公司 核保方法、装置、设备及存储介质
CN111046142A (zh) * 2019-12-13 2020-04-21 深圳前海环融联易信息科技服务有限公司 文本审查方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN111625646A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
US9299108B2 (en) Insurance claims processing
CN110852894B (zh) 保险核保方法及装置、计算机存储介质、电子设备
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
US20160147943A1 (en) Semantic Address Parsing Using a Graphical Discriminative Probabilistic Model
CN111444717A (zh) 医学实体信息的抽取方法、装置、存储介质及电子设备
CN110827157B (zh) 数据处理方法与装置、存储介质、电子设备
CN112529481A (zh) 一种用户捞回方法、装置及电子设备
CN110688536A (zh) 一种标签预测方法、装置、设备和存储介质
CN111340584A (zh) 一种资金方的确定方法、装置、设备及存储介质
CN111582314A (zh) 目标用户确定方法、装置及电子设备
CN111625646B (zh) 处理投保单的方法、装置、电子设备和存储介质
CN114298845A (zh) 一种理赔票据处理方法和装置
CN112989050B (zh) 一种表格分类方法、装置、设备及存储介质
CN110941957A (zh) 交通科技数据标引方法及系统
CN116385189A (zh) 财务报账单据列账科目匹配度校验方法及系统
CN115171136A (zh) 银行业务材料内容分类识别方法、设备及存储介质
US20230125177A1 (en) Methods and systems for matching and optimizing technology solutions to requested enterprise products
CN115481031A (zh) 南向网关检测方法、装置、设备及介质
CN114417045A (zh) 基于神经网络保险案件抽检方法、系统、设备及存储介质
CN113239126A (zh) 一种基于bor方法的业务活动信息标准化方案
CN113901817A (zh) 文档分类方法、装置、计算机设备和存储介质
CN114443803A (zh) 一种文本信息挖掘方法、装置、电子设备和存储介质
CN113885867B (zh) 一种电子台账录入界面找回方法、装置及电子设备
CN116028880B (zh) 训练行为意图识别模型的方法、行为意图识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant