CN116757858A - 保险信息处理方法、终端设备和存储介质 - Google Patents
保险信息处理方法、终端设备和存储介质 Download PDFInfo
- Publication number
- CN116757858A CN116757858A CN202311062044.2A CN202311062044A CN116757858A CN 116757858 A CN116757858 A CN 116757858A CN 202311062044 A CN202311062044 A CN 202311062044A CN 116757858 A CN116757858 A CN 116757858A
- Authority
- CN
- China
- Prior art keywords
- error reporting
- reporting information
- information
- insurance
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 73
- 230000010365 information processing Effects 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 162
- 238000012512 characterization method Methods 0.000 claims abstract description 93
- 238000000034 method Methods 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 59
- 238000006243 chemical reaction Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 24
- 230000011218 segmentation Effects 0.000 claims description 8
- 239000013589 supplement Substances 0.000 claims description 6
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 31
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 239000008186 active pharmaceutical agent Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012954 risk control Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请适用于保险科技技术领域,提供了保险信息处理方法、终端设备和存储介质。该保险信息处理方法包括:在保险承保系统出现报错信息时,调取报错信息数据库,报错信息数据库中预存有多条预设报错信息和对应的解决方案,并且预设报错信息具有通过语言模型转换得到的相应的第一表征向量;通过语言模型将当前报错信息分别转换为第二表征向量;基于与当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对当前报错信息进行处理;其中,预设报错信息与当前报错信息的相似度基于第一表征向量和第二表征向量计算得到。本申请能够对保险承保过程中出现的报错信息进行及时且智能的处理,不会导致用户的投保操作中断。
Description
技术领域
本申请属于保险科技技术领域,尤其涉及保险信息处理方法、终端设备和存储介质。
背景技术
目前保险承保系统在报价、核保环节遇到保司系统报错时,出错信息文字用户很难理解,导致用户投保过程中断。后续通过运营人员进行人工错误排查,分析报错中的错误信息,排查到具体原因后告知用户重新按照保司报价核保要求提供影像件或选择险种和保额,以确保核保通过。这种方式不仅增加了人力成本,也影响了用户体验和车险投保转化率。因此,如何利用先进的技术手段,对保险承保系统报错信息进行智能处理,提高保险承保系统的效率和用户满意度,是该行业技术发展的重要方向。
传统的保险承保系统报错信息处理方法,主要是通过人工提前编写规则,并将规则嵌入到软件中,在遇到报错信息时,根据规则给出用户提示和功能界面。然而,这种方法不能够覆盖所有的报错信息场景,无法准确地识别和解释报错信息的含义以及给出针对性和有效性的处理建议,需要不断地进行修改和补充,以保证其适应性和准确性。而且用户在投保过程中可能会遇到理解困难、操作中断、反馈不及时等问题,导致用户体验差,投保意愿降低,车险投保转化率低。
对比文件1(CN110942395B):提供一种保险保全风险控制方法、装置、设备及存储介质。通过获取区块链中存储的最新保险保全信息,并根据该最新保险保全信息的业务类型对应的训练后的神经网络模型,确定所述最新保险保全信息对应的信息完整度等级,进一步,根据该最新保险保全信息对应的信息完整度等级,确定该最新保险保全信息的业务类型对应的多个历史保险保全信息中与该最新保险保全信息匹配的目标保险保全信息,并将目标保险保全信息对应的风险提示信息确定为所述最新保险保全信息对应的风险提示信息,从而实现了对保险保全服务中存在的风险的控制,提高了保险保全服务的安全性。
对比文件2(CN115712701A):本申请涉及自然语言处理领域,尤其涉及一种语言处理方法、装置及存储介质。所述方法包括:获取目标语言处理任务的待处理文本和第一提示信息,第一提示信息为任意长度的文本序列;将第一提示信息编码成第二提示信息,第二提示信息为固定长度的向量组;将第二提示信息与待处理文本进行拼接处理,得到拼接后的待处理文本;将拼接后的待处理文本输入至预先训练完成的目标语言模型中进行处理。本申请实施例设计并实现了一种方案,将任意长度的第一提示信息编码成固定长度的第二提示信息,将第二提示信息与待处理文本进行拼接后进行语言处理,解决了提示信息的长度严重受限于预训练语言模型的输入最大长度的问题,提升了语言处理效果。
发明内容
为克服相关技术中存在的问题,本申请实施例提供了保险信息处理方法、终端设备和存储介质,能够对保险承保过程中出现的报错信息进行及时且智能的处理,不会导致用户的投保操作中断。
本申请是通过如下技术方案实现的:
第一方面,本申请实施例提供了一种保险信息处理方法,包括:在保险承保系统出现报错信息时,调取报错信息数据库,报错信息数据库中预存有多条预设报错信息和对应的解决方案,并且预设报错信息具有通过语言模型转换得到的相应的第一表征向量;通过语言模型将当前报错信息分别转换为第二表征向量;以及基于与当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对当前报错信息进行处理,其中,预设报错信息与当前报错信息的相似度基于第一表征向量和第二表征向量计算得到。
基于第一方面,在一些实施例中,报错信息数据库的生成方式包括以下至少一种:从历史数据库中抽取已有的报错信息及解决方案;从保司系统的文档或接口中解析出现的报错信息及解决方案;从运营人员或用户反馈中收集出现的报错信息及其解决方案;其中,预设报错信息和对应的解决方案均为字符串形式的文本。
基于第一方面,在一些实施例中,通过语言模型将各条预设报错信息转换为第一表征向量,包括:加载预训练好的语言模型;将预设报错信息进行分词,利用词嵌入模型将各个词转换为第一词向量,得到第一词向量组;将第一词向量输入至基于Transformer的编码器的语言模型生成相应的第二词向量,得到与语境对应的第二词向量组;以及根据第二词向量组中的第二词向量,得到预设报错信息的第一表征向量。
基于第一方面,在一些实施例中,上述基于与当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对当前报错信息进行处理,包括:根据当前报错信息的第二表征向量和预设报错信息的第一表征向量,计算当前报错信息和各条预设报错信息之间的相似度;以及根据与当前报错信息的相似度最高的预设报错信息所对应的解决方案,对当前报错信息进行处理。
基于第一方面,在一些实施例中,上述基于与当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对当前报错信息进行处理,包括:根据当前报错信息的第二表征向量和预设报错信息的第一表征向量,计算当前报错信息和各条预设报错信息之间的相似度;确定与当前报错信息的相似度由高到低的至少两个预设报错信息;以及根据上述至少两个预设报错信息对应的解决方案中占比最高的解决方案,对当前报错信息进行处理
基于第一方面,在一些实施例中,上述保险信息处理方法还包括:若不存在与当前报错信息的相似度满足预设条件的预设报错信息,根据当前报错信息与各条预设报错信息之间的距离,确定对当前报错信息进行处理的解决方案。
基于第一方面,在一些实施例中,上述根据当前报错信息与各条预设报错信息之间的距离,确定对当前报错信息进行处理的解决方案,包括:根据当前报错信息的第二表征向量与各条预设报错信息的第一表征向量,计算当前报错信息与各条预设报错信息之间的距离;确定与当前报错信息的距离由小到大的至少两个预设报错信息;以及按照预设策略对上述至少两个预设报错信息对应的解决方案进行处理,确定用于对当前报错信息进行处理的解决方案。
基于第一方面,在一些实施例中,上述保险信息处理方法还包括:根据用于对当前报错信息进行处理的解决方案,对用户的投保信息进行调整,或者生成用于引导用户补充影像件的引导信息;以及通过API接口向保司系统发起二次报价或核保请求。
第二方面,本申请实施例提供了一种保险信息处理装置,包括:调取模块,用于在保险承保系统出现报错信息时,调取报错信息数据库,报错信息数据库中预存有多条预设报错信息和对应的解决方案,并且预设报错信息具有通过语言模型转换得到的相应的第一表征向量;向量转换模块,用于通过语言模型将当前报错信息转换为第二表征向量;以及报错处理模块,用于基于与当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对当前报错信息进行处理,其中,预设报错信息与当前报错信息的相似度基于第一表征向量和第二表征向量计算得到。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的保险信息处理方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的保险信息处理方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的保险信息处理方法。
本申请实施例与现有技术相比存在的有益效果是:
本申请实施例,通过语言模型将报错信息转换为表征向量,来确定与当前报错信息比较匹配的历史报错信息,之后采用对应的处理方法对当前报错信息进行处理,相对于上述相关技术,不需要提前预判用户可能遇到的问题,不需要覆盖所有的报错信息场景,也不需要考虑用户在投保过程中可能遇到的特殊或新颖的问题等,通过报错信息数据库和语言模型即可实现对保险承保过程中出现的报错信息进行及时且智能的处理,不会导致用户的投保操作中断,从而能够提高用户体验,可以有效地提高续保场景车险用户的投保成功率和满意度,同时降低车险客服的人力成本和工作压力。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是本申请一实施例提供的保险信息处理方法的流程示意图;
图2A是本申请一实施例提供的语言模型的的结构示意图;
图2B是图2A中示出的权重值计算模型的结构示意图;
图3是本申请一实施例提供的报错信息的表征向量在二维空间的投影图;
图4是本申请一实施例提供的K近邻算法的示意图;
图5是本申请实施例提供的保险信息处理装置的结构示意图;
图6是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
相关的保险承保系统报错信息处理方法,主要是通过人工提前编写规则,并将规则嵌入到软件中,在遇到报错信息时,根据规则给出用户提示和功能界面。本申请发明人在研究中发现,这种方法存在以下几个缺陷:
(1)规则的泛化能力差,无法适应保司系统报错信息的多样性和动态性。由于保司系统报错信息的格式、内容、语义等可能随着保司系统的更新和变化而发生变化,人工提前编写的规则可能无法覆盖所有的报错信息场景,或者无法准确地识别和解释报错信息的含义。
(2)规则的覆盖场景低,无法提前预判用户可能遇到的问题。由于人工提前编写的规则是基于历史数据和经验进行归纳和总结的,可能无法考虑到用户在投保过程中可能遇到的一些特殊或新颖的问题,或者无法给出针对性和有效性的处理建议。
(3)规则的维护成本高,需要不断地更新和优化。由于保司系统报错信息的变化和用户需求的变化,人工提前编写的规则需要不断地进行修改和补充,以保证其适应性和准确性。这不仅增加了人力成本,也增加了软件系统的复杂度和风险。
(4)用户体验差,车险投保转化率低。由于人工提前编写的规则无法及时、准确、全面地处理保险承保系统报错信息,用户在投保过程中可能会遇到理解困难、操作中断、反馈不及时等问题,导致用户体验差,投保意愿降低,车险投保转化率低。
基于上述问题,本申请实施例中提供了一种保险信息处理方法,建立报错信息数据库,将已有报错信息及其对应的处理方法存储在该报错信息数据库中,再利用语言模型对该报错信息数据库中的每个报错信息进行编码,在编码空间每个报错信息被转换成一个表征向量。在出现报错信息时,根据当前报错信息的表征向量(即第二表征向量)与该报错信息数据库中存储的各条保存信息的表征向量(即第一表征向量)进行比较,以确定用于对该报错信息进行处理的处理方法。
本申请实施例,通过语言模型将报错信息转换为表征向量,来确定与当前报错信息比较匹配的历史报错信息,之后采用对应的处理方法对当前报错信息进行处理,相对于上述相关技术,不需要提前预判用户可能遇到的问题,不需要覆盖所有的报错信息场景,也不需要考虑用户在投保过程中可能遇到的特殊或新颖的问题等,通过报错信息数据库和语言模型即可实现对保险承保过程中出现的报错信息进行及时且智能的处理,不会导致用户的投保操作中断,从而能够提高用户体验。
以下对本申请实施例的保险信息处理方法进行详细说明。
图1是本申请一实施例提供的保险信息处理方法的示意性流程图,参照图1,对该保险信息处理方法的详述如下:
步骤101,在保险承保系统出现报错信息时,调取报错信息数据库,该报错信息数据库中预存有多条预设报错信息和对应的解决方案,并且预设报错信息具有通过语言模型转换得到的相应的第一表征向量。
具体地,当用户在保险承保系统进行操作(例如报价等)时,由于用户不正确的操作,从而导致保险承保系统产生相应的报错信息(即当前报错信息)。从而保险承保系统响应于该报错信息调取报错信息数据库。
报错信息数据库中可以包含多种信息,例如预设报错信息、保险公司、地区、规则类型、处理方法等字段,如表1所示。
在一些实施例中,预设报错信息的字段用于存储保司系统返回的报错信息,该报错信息可以是字符串形式的文本,保险公司即为此保司系统的编号、地区则按照国标地区编码。处理方法字段用于存储针对该报错信息的处理方法,该处理方法可以是字符串形式的文本,可能包含用户需要提供的影像件、选择的险种和保额等一种或多种信息。
表1 报错信息数据库存储的信息
例如,报错信息字段A可以为:resultCode:15,缺少以下任意一种事中资料:投保人身份证明(组织机构代码证、税务登记证、统一社会信用代码、营业执照)。处理方法A可以为:当车辆使用性质为企业车,核保补充影像必须提交投保人身份证明(组织机构代码证、税务登记证、统一社会信用代码、营业执照之一)。
报错信息字段B可以为:未承保法定节假日限额翻倍险,请到营业点投保。处理方法B可以为:当使用性质为非营业客车,自动增加法定节假日限额翻倍险进行投保。
报错信息字段C可以为:太保非网销保费计算接口出错:[保费计算]保费计算失败,错误信息为[报价引擎提示:只有投保车上乘客责任险,方可投保车责乘客附加医保外用药责任险]。处理方法C可以为:当投保车上乘客附加医保外用药责任险为是,且没有投保车上乘客责任险的时候,将自动增加投保车上乘客责任险。
报错信息字段D可以为:未同时承保车上人员责任险(乘客)和车上人员责任险(司机),请到我司营业点投保。处理方法D可以为:当车上人员责任险(乘客)和车上人员责任险(司机)未同时承保时,将自动添加缺少的其一险种。
一些实施例中,报错信息数据库的生成方式包括以下至少一种:从历史数据库中抽取已有的报错信息及解决方案;从保司系统的文档或接口中解析出现的报错信息及解决方案;从运营人员或用户反馈中收集出现的报错信息及其解决方案。其中,预设报错信息和对应的解决方案均为字符串形式的文本。
示例性的,可以从历史数据库中抽取已有的报错信息及其解决方案,并将其加载到报错信息数据库中;以及,从保司系统的文档或接口中解析可能出现的报错信息及其解决方案,并将其加载到报错信息数据库中;以及,从运营人员或用户反馈中收集新出现的报错信息及其解决方案,并将其加载到报错信息数据库中;以及,定期对报错信息数据库进行维护和优化,以适应保司系统和用户需求的变化。
并且进一步地,在构建报错信息数据库之后,根据本实施例的技术方案,还利用预设的语言模型,将各个报错信息转换为相应的表征向量(即第一表征向量)。例如,将报错信息字段A转换为相应的表征向量Fa,将报错信息字段B转换为相应的表征向量Fb,将报错信息字段C转换为相应的表征向量Fc,将报错信息字段D转换为相应的表征向量Fd,等等。
本步骤中,语言模型可以为BERT等大语言模型。从而可以通过语言模型将预设报错信息转换为表征向量(第一表征向量)。一些实施例中,通过语言模型将各条预设报错信息转换为表征向量的过程可以包括:加载预训练好的语言模型;将预设报错信息进行分词,利用词嵌入模型将各个词转换为第一词向量,得到第一词向量组;将第一词向量输入至基于Transformer的编码器的语言模型生成相应的第二词向量,得到第二词向量组;根据第二词向量组中的第二词向量,得到预设报错信息的第一表征向量。
即,在一些场景中,利用大语言模型对报错信息数据库中的每条预设报错信息进行文字编码得到表征向量的过程,具体可以包括以下步骤:
首先,加载预训练好的大语言模型。可以根据保险承保系统领域的特点和需求,对该大预言模型进行微调和优化。其中,本申请实施例中的大语言模型可以是基于Transformer架构的语言模型。
其次,遍历报错信息数据库中的每条预设报错信息。参考图2A所示,针对每条预设报错信息,首先进行分词处理。例如,将报错信息字段A分词处理后,得到多个分词,并标识为a1、a2、...、an。
之后通过独热编码程序生成与各个分词对应的独热编码ha1、ha2、...、han。其中ha1与分词a1对应,ha2与分词a2对应,以此类推,han与分词an对应。
之后将各个分词对应的独热编码ha1~han输入词嵌入模型,利用词嵌入模型生成与各个分词对应的词向量(即第一词向量)ea1~ean,其中ea1与ha1对应,ea2与ha2对应,以此类推,ean与han对应,从而构成与该预设报错信息对应的第一词向量组。
然后,通过大语言模型根据与每条预设报错信息对应的第一词向量组,生成相应的第二词向量组。其中第二词向量组中包含与第一词向量对应的第二词向量va1~van。并且其中大语言模型例如可以为BERT。从而基于BERT的大语言模型根据第一词向量ea1~ean,生成相应的第二词向量va1~van。其中va1与ea1对应,va2与ea2对应,以此类推,van与ean对应。
例如,将第一词向量组的第一词向量叠加上位置编码(Positional Encoding),之后输入至Transformer的编码器内。在每个Transformer的编码器内部,都会进行一次多头自注意机制的运算(Multi-head self attention),经过加和与归一化操作后(Add&Normalize),通过一个前馈神经网络(FFN)在对该组词向量进行一次加和与归一化操作(Add&Normalize),得到该编码器的输出(即第二词向量组)。最后,可以将最后一个编码器输出的词向量组(即第二词向量组)中的所有词向量(即第二词向量)输入权重值计算模型,通过权重值计算模型确定与各个第二词向量对应的权重值,标识为wa1、wa2、...、wan。其中权重值计算模型可以为神经网络模型。并且与各个第二词向量对应的权重值wa1、wa2、...、wan的和为1。其中wa1与va1对应,wa2与va2对应,以此类推,wan与van对应,
其中图2B进一步示出了基于神经网络的权重值计算模型的示意图。其中各个神经元的激活函数例如可以是sigmoid函数。参考图2B所示,可以将第二向量wa1~wan组成一个矩阵输入至神经网络的输入层,从而神经网络的输出层可以输出wa1~wan。
之后将权重值计算模型输出的与各个第二词向量对应的权重值wa1~wan,与相应的第二词向量va1~van进行加权求和计算,从而得到预设报错信息A对应的表征向量Fa(即第一表征向量)。
之后,获取大语言模型的最终输出结果作为该报错信息的表征向量,并将其存储在编码空间中。
重复上述的步骤,直到报错信息数据库中所有的预设报错信息都被转换成表征向量,并存储在编码空间中。即尽管图2A和图2B以预设报错信息A为例进行了说明,但是对于其他预设报错信息(例如预设报错信息B~D)也是适用的。
此外除了图2A和图2B所示的方法外,也可通过将预设报错信息的第二词向量进行拼接的方式来得到与预设报错信息对应的第一表征向量。或者通过直接对多个第二词向量求平均值的方式来得到与预设报错信息对应的第一表征向量。
如图3所示,报错信息的表征向量在表征空间中的投影和处理方法的分类,在本示例中仅显示了一个二维空间,但此表征空间可以为维数不定的高维空间。图3中每个点代表一个报错信息的表征向量,不同形状特征的点代表不同的处理方法。
利用大语言模型对报错信息进行文字编码,可以有效地提取报错信息的语义特征,使得不同格式、内容、语义的报错信息可以在编码空间中进行比较和匹配。
大语言模型(例如BERT)是一种基于Transformer的自回归模型,它可以利用大规模的文本数据进行预训练,学习文本的通用表示和生成能力。大语言模型可以根据输入的文本,生成与之相关的文本,或者提取文本的隐藏状态作为表征向量。大语言模型具有强大的文本理解和表达能力,可以有效地捕捉文本的语法、语义、逻辑、情感等多层次的特征,并将其转换为数值形式的向量。
利用大语言模型对报错信息进行文字编码,可以将不同格式、内容、语义的报错信息转换为统一的表征向量,并存储在编码空间中。这样,就可以在编码空间中,对不同的报错信息进行比较和匹配,而无需考虑报错信息的具体形式和含义,从而可以实现对报错信息的智能处理,避免了人工编写规则的复杂性和不稳定性。
利用大语言模型对报错信息进行文字编码,还可以根据保险承保系统领域的特点和需求,对大语言模型进行微调和优化,以提高其针对性和准确性。例如,可以利用保险承保系统领域的专业术语、常见问题、用户反馈等数据,对大语言模型进行领域适应性训练,以增强其对保险承保系统报错信息的理解和生成能力。
从而在调取保险承保系统后,可以基于预设报错信息的第一表征向量确定与当前报错信息对应的解决方案。
步骤102,通过语言模型将当前报错信息分别转换为第二表征向量。
即当保险承保系统产生与与将当前报错信息转换为表征向量(第二表征向量),其过程与确定预设报错信息的第一表征向量的过程是一致的。此处不再赘述。
步骤103,基于与当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对当前报错信息进行处理。
其中,预设报错信息与当前报错信息的相似度基于第一表征向量和第二表征向量计算得到。
一些场景中,步骤103的实现过程可以包括:根据当前报错信息的表征向量(第二表征向量)和预设报错信息的表征向量(第一表征向量),计算当前报错信息和各条预设报错信息之间的相似度;根据与当前报错信息的相似度最高的预设报错信息所对应的解决方案,对当前报错信息进行处理。
又一些场景中,步骤103的实现过程可以包括:根据当前报错信息的表征向量(第二表征向量)和预设报错信息的表征向量(第一表征向量),计算当前报错信息和各条预设报错信息之间的相似度;确定与当前报错信息的相似度由高到低的至少两个预设报错信息;根据该至少两个预设报错信息对应的解决方案中占比最高的解决方案,对当前报错信息进行处理。
举例说明,保险承保系统出现新的报错信息A为“非网销保费计算接口出错:[保费计算]保费计算失败,错误信息为[报价引擎提示:报价受限:三责医保外用药限额最低5万]”。
报错信息数据库中存储有报错信息1至报错信息4,报错信息1和报错信息2对应的处理方法均为处理方法1,报错信息3和报错信息4对应的处理方法均为处理方法2。
报错信息1为:非网销保费计算接口出错:[保额规则]投保了险种:机动车第三者责任保险,但保额[1]不在有效范围内!
报错信息2为:太保非网销保费计算接口出错:[保费计算]保费计算失败,错误信息为[报价引擎提示:投保了三责险法定节假日限额翻倍,使用性质必须为家庭自用车!
报错信息3为:交强险规则提示:标准件,核保通过商业险规则提示:非标件:R1:ZAVCI2:车牌号码:山东户籍客户投保新车,请依据购车发票核实异地风险。
报错信息4为:交强险规则提示:非标件:R2:FATCI2:客户名称:企业用车(客车类)个人客户导致非标商业险规则提示:非标件:R1:ZAVCI2:车牌号码:福建户籍个人客户投保新车,请依据购车发票核实异地风险。
处理方法1为自动调整保额,处理方法2为补充影像件。
此时,计算报错信息A和报错信息1至报错信息4之间的余弦相似度,例如分别为0.9、0.8、0.3和0.2。一些示例中,可以根据余弦相似度最高的报错信息1所对应的处理方法1对报错信息A进行处理。又一些示例中,可以确定余弦相似度最高的至少两条报错信息,例如3条报错信息,为报错信息1、报错信息2和报错信息3,将采取报错信息1、报错信息2和报错信息3所对应的占比高的处理方法,即处理方法1,对报错信息A进行处理。这样就实现了对报错信息的处理方法的分类和推荐。
一些实施例中,当保险承保系统遇到新的未见过的报错信息时,同样可以利用语言模型对新的报错信息进行文字编码,在编码空间,新的报错信息也被转换成一个表征向量。对应的,上述保险信息处理方法还可以包括:若不存在与当前报错信息的相似度满足预设条件的预设报错信息,根据当前报错信息与各条预设报错信息之间的距离,确定对当前报错信息进行处理的解决方案。
例如,可以根据当前报错信息的表征向量(第二表征向量)与各条预设报错信息的表征向量(第一表征向量),计算当前报错信息与各条预设报错信息之间的距离;确定与当前报错信息的距离由小到大的至少两个预设报错信息;按照预设策略对该至少两个预设报错信息对应的解决方案进行处理,确定用于对当前报错信息进行处理的解决方案。
作为举例,为了实现本申请的技术方案,当保险承保系统对新的报错信息进行文字编码后,需要在编码空间中,寻找与新的报错信息最相似的已有报错信息,并获取该已有报错信息的处理方法。为了实现这一目的,可以采用基于距离度量的机器学习算法,例如K近邻算法,也可以采用可以采用有监督的分类方法,如SVM(Support Vector Machine,支持向量机)或LDA(Latent Dirichlet Allocation,文档主题生成模型,也称为三层贝叶斯概率模型)等机器学习分类模型。
以下以K近邻算法为例进行说明。
K近邻算法是一种无需训练的监督学习算法,它可以根据给定的数据集和距离度量,对新的数据进行分类或回归。利用K近邻算法寻找相似报错信息,可以快速地找到最合适的处理方法,避免了人工编写规则的复杂性和不稳定性。
利用K近邻算法在编码空间中寻找相似报错信息,具体包括以下步骤:
设置一个合适的K值,即要寻找的最近邻居的个数;
计算新的报错信息的第二表征向量与报错信息数据库中每条报错信息的第一表征向量之间的距离,可以为欧氏距离、余弦相似度等距离度量;
根据距离大小,排序报错信息数据库中报错信息的表征向量,并选取距离最小的前K个作为最近邻居;参见图4,K=3,到三角形的距离最小的3个点为圆形,因此将圆形划分为三角形对应的类;
获取最近邻居对应的处理方法(即三角形所表征的报错信息对应的处理方法),并根据预设的规则或策略,综合得出最终的处理方法对新的报错信息进行处理。例如,可以使用投票法、加权法等决策方法综合得出最终的处理方法。
利用K近邻算法在编码空间中寻找相似报错信息,可以快速地找到最合适的处理方法,避免了人工编写规则的复杂性和不稳定性。
K近邻算法是一种无需训练的监督学习算法,它可以根据给定的数据集和距离度量,对新的数据进行分类或回归。K近邻算法的核心思想是:新的数据的类别或值,由其最近的K个邻居的类别或值决定。K近邻算法具有简单、直观、易于实现等优点,也具有较好的泛化能力和鲁棒性。
利用K近邻算法在编码空间中寻找相似报错信息,可以根据新的报错信息表征向量(第二表征向量)与数据库中每个报错信息表征向量(第一表征向量)之间的距离,排序数据库中的报错信息,并选取距离最小的前K个作为最近邻居。然后,获取最近邻居对应的处理方法,并根据一定的规则或策略,综合得出最终的处理方法。这样可以实现对新的报错信息的快速、准确、全面地处理,而无需人工编写规则。
利用K近邻算法在编码空间中寻找相似报错信息,还可以根据保险承保系统领域的特点和需求,对K近邻算法进行调整和优化,以提高其针对性和准确性。例如,可以根据不同的报错信息类型、用户特征、保司系统特点等因素,选择合适的K值、距离度量、决策方法等参数,以增强其对保险承保系统报错信息的匹配和推荐能力。
一些实施例中,上述保险信息处理方法还可以包括:根据用于对当前报错信息进行处理的解决方案,对用户的投保信息进行调整,或者生成用于引导用户补充影像件的引导信息;通过API接口向保司系统发起二次报价或核保请求。
本步骤的目的是根据获取到的处理方法,自动调整用户的投保信息或引导用户补充影像件,通过API接口向保司系统发起二次报价或核保请求,以完成车险投保过程。本步骤可以提升用户体验和车险投保转化率,避免用户的投保过程中断或延迟。本步骤根据报错信息的类型,可以分为以下两种情况:
(1)如果报错信息属于规则或险别调整类型,说明用户选择的险别、险种、保额等信息与保司系统不匹配,需要进行修正。此时,保险承保系统可以根据处理方法中给出的建议或要求,自动调整用户的投保信息,并通过API接口向保司系统发起二次报价或核保请求。这样可以避免用户重复输入或选择投保信息,也可以减少报错信息的出现,让用户投保过程无阻断。整个过程耗时50-300毫秒不等,用户无感知。
(2)如果报错信息属于影像补充类型,说明用户需要提供新的影像件或其他资料,以满足保司系统的要求。此时,保险承保系统可以根据处理方法中给出的提示,弹出对话框,引导用户补充相应的证件,如关系证明、税务登记证、身份证正反面信息等。用户提交影像件之后,保险承保系统通过API接口向保司系统发起二次报价或核保请求。这样可以使得用户能够及时地获得处理方法,也可以根据用户的需要进行提醒或重复。整个过程流畅无阻断,无需通过保司客服联系用户。
另外,上述保险信息处理方法还可以包括:利用用户友好的方式展示处理方法,根据当前报错信息的类型,调整用户的投保信息和翻译报错信息以及增加新的功能界面等,以提高用户的理解和操作便利性,提升用户体验和车险投保转化率。
自动调整用户的投保信息可以为:当报错信息涉及到用户选择的险别、险种、保额等信息与保司系统不匹配时,保险承保系统可以根据报错信息中给出的建议或要求,自动修正用户的投保信息,并向用户展示修正后的投保信息,让用户确认或修改。这样可以避免用户重复输入或选择投保信息,也可以减少报错信息的出现,让用户投保过程无阻断。
翻译报错信息可以为:当报错信息使用专业术语或复杂语句时,保险承保系统可以利用大语言模型对报错信息进行翻译,将其转换为简洁、清晰、友好的提示信息,并向用户展示翻译后的提示信息,引导用户执行下一步操作。这样可以使得用户能够更清楚地知道如何按照处理方法进行操作,也可以避免用户感到困惑或无助。
增加新的功能界面可以为:当报错信息需要用户提供新的影像件或其他资料时,保险承保系统可以利用已有的上传影像资料的界面模版,让用户提交新的影像件或其它资料。这样可以使得用户能够及时地获得处理方法,也可以根据用户的需要进行提醒或重复。
从而,采用本申请实施例能够降低投保中断率。续保场景车险用户报价环节中断率降低,说明本申请可以有效地处理报价环节的报错信息,让用户顺利地获取保司系统的报价结果,减少用户的投保时间和等待时间。
续保场景车险用户核保环节核保中断率降低,说明本申请可以有效地处理核保环节的报错信息,让用户顺利地完成核保流程,减少用户的投保难度和操作步骤。
整体续保用户自助投保率由行业的不足20%提升到行业60%-80%,说明本发明可以有效地提高续保用户的自助投保能力和意愿,减少用户对车险客服的依赖和咨询。
车险客服工作量降低40%-60%,说明本发明可以有效地减少车险客服需要处理的报错信息数量和复杂度,提高车险客服的工作效率和质量。
上述保险信息处理方法,通过语言模型将报错信息转换为表征向量,来确定与当前报错信息比较匹配的历史报错信息,之后采用对应的处理方法对当前报错信息进行处理,相对于上述相关技术,不需要提前预判用户可能遇到的问题,不需要覆盖所有的报错信息场景,也不需要考虑用户在投保过程中可能遇到的特殊或新颖的问题等,通过报错信息数据库和语言模型即可实现对保险承保过程中出现的报错信息进行及时且智能的处理,不会导致用户的投保操作中断,从而能够提高用户体验,可以有效地提高续保场景车险用户的投保成功率和满意度,同时降低车险客服的人力成本和工作压力。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的保险信息处理方法,图5示出了本申请实施例提供的保险信息处理装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参见图5,本申请实施例中的保险信息处理装置可以包括调取模块201、向量转换模块202和报错处理模块203。
其中,调取模块201用于在保险承保系统出现报错信息时,调取报错信息数据库,报错信息数据库中预存有多条预设报错信息和对应的解决方案。并且预设报错信息具有通过语言模型转换得到的相应的第一表征向量。
向量转换模块202用于通过语言模型将当前报错信息转换为第二表征向量。
报错处理模块203用于基于与所述当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对所述当前报错信息进行处理。其中,预设报错信息与所述当前报错信息的相似度基于所述第一表征向量和第二表征向量计算得到。
可选的,报错信息数据库的生成方式包括以下至少一种:从历史数据库中抽取已有的报错信息及解决方案;从保司系统的文档或接口中解析出现的报错信息及解决方案;从运营人员或用户反馈中收集出现的报错信息及其解决方案;其中,所述预设报错信息和对应的解决方案均为字符串形式的文本。
可选的,向量转换模块202具体用于:加载预训练好的语言模型;将预设报错信息进行分词,利用词嵌入模型将各个词转换为第一词向量,得到第一词向量组;将第一词向量输入至基于Transformer的编码器的语言模型生成相应的第二词向量,得到第二词向量组;根据第二词向量组中的第二词向量,得到预设报错信息的第一表征向量。
可选的,报错处理模块203具体用于:根据当前报错信息的第二表征向量和预设报错信息的第一表征向量,计算当前报错信息和各条预设报错信息之间的相似度;根据与当前报错信息的相似度最高的预设报错信息所对应的解决方案,对当前报错信息进行处理。
可选的,报错处理模块203具体用于:根据当前报错信息的第二表征向量和预设报错信息的第一表征向量,计算当前报错信息和各条预设报错信息之间的相似度;确定与当前报错信息的相似度由高到低的至少两个预设报错信息;根据上述至少两个预设报错信息对应的解决方案中占比最高的解决方案,对当前报错信息进行处理。
可选的,该保险信息处理装置还可以包括距离处理模块。该距离处理模块用于:若不存在与当前报错信息的相似度满足预设条件的预设报错信息,根据当前报错信息与各条预设报错信息之间的距离,确定对当前报错信息进行处理的解决方案。
可选的,该距离处理模块具体用于:根据当前报错信息的第二表征向量与各条预设报错信息的第一表征向量,计算当前报错信息与各条预设报错信息之间的距离;确定与当前报错信息的距离由小到大的至少两个预设报错信息;按照预设策略对上述至少两个预设报错信息对应的解决方案进行处理,确定用于对当前报错信息进行处理的解决方案。
可选的,该报错处理模块203还可以用于:根据用于对当前报错信息进行处理的解决方案,对用户的投保信息进行调整,或者生成用于引导用户补充影像件的引导信息;通过API接口向保司系统发起二次报价或核保请求。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种终端设备,参见图6,该终端设备300可以包括:至少一个处理器310、存储器320以及存储在所述存储器320中并可在所述至少一个处理器310上运行的计算机程序521,所述处理器310执行所述计算机程序时实现上述任意各个方法实施例中的步骤,例如图1所示实施例中的步骤101至步骤103。或者,处理器310执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块201至203的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器320中,并由处理器310执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序段,该程序段用于描述计算机程序在终端设备300中的执行过程。
本领域技术人员可以理解,图6仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如输入输出设备、网络接入设备、总线等。
处理器310可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器320可以是终端设备的内部存储单元,也可以是终端设备的外部存储设备,例如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。所述存储器320用于存储所述计算机程序以及终端设备所需的其他程序和数据。所述存储器320还可以用于暂时地存储已经输出或者将要输出的数据。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述保险信息处理方法各个实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述保险信息处理方法各个实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种保险信息处理方法,其特征在于,包括:
在保险承保系统出现报错信息时,调取报错信息数据库,所述报错信息数据库中预存有多条预设报错信息和对应的解决方案,并且所述预设报错信息具有通过语言模型转换得到的相应的第一表征向量;
通过所述语言模型将当前报错信息转换为第二表征向量;以及
基于与所述当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对所述当前报错信息进行处理,其中,所述预设报错信息与所述当前报错信息的相似度基于所述第一表征向量和所述第二表征向量计算得到。
2.如权利要求1所述的保险信息处理方法,其特征在于,所述报错信息数据库的生成方式包括以下至少一种:
从历史数据库中抽取已有的报错信息及解决方案;
从保司系统的文档或接口中解析出现的所述报错信息及所述解决方案;以及
从运营人员或用户反馈中收集出现的所述报错信息及所述解决方案,其中,所述报错信息和对应的所述解决方案均为字符串形式的文本。
3.如权利要求1所述的保险信息处理方法,其特征在于,通过所述语言模型将所述预设报错信息转换为所述第一表征向量,包括:
加载预训练好的所述语言模型;
将所述预设报错信息进行分词,利用词嵌入模型将各个词转换为第一词向量,得到第一词向量组;
将所述第一词向量输入至基于Transformer的编码器的所述语言模型,生成相应的第二词向量,得到第二词向量组;以及
根据所述第二词向量组中的第二词向量,得到所述预设报错信息的第一表征向量。
4.如权利要求1所述的保险信息处理方法,其特征在于,所述基于与所述当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对所述当前报错信息进行处理,包括:
根据所述当前报错信息的第二表征向量和所述预设报错信息的第一表征向量,计算所述当前报错信息和各条预设报错信息之间的相似度;以及
根据与所述当前报错信息的相似度最高的预设报错信息所对应的解决方案,对所述当前报错信息进行处理。
5.如权利要求1所述的保险信息处理方法,其特征在于,所述基于与所述当前报错信息的相似度满足预设条件的预设报错信息对应的解决方案,对所述当前报错信息进行处理,还包括:
根据所述当前报错信息的第二表征向量和所述预设报错信息的第一表征向量,计算所述当前报错信息和各条预设报错信息之间的相似度;
确定与所述当前报错信息的相似度由高到低的至少两个预设报错信息;以及
根据所述至少两个预设报错信息对应的解决方案中占比最高的解决方案,对所述当前报错信息进行处理。
6.如权利要求1所述的保险信息处理方法,其特征在于,所述方法还包括:
若不存在与所述当前报错信息的相似度满足预设条件的预设报错信息,根据所述当前报错信息与各条预设报错信息之间的距离,确定对所述当前报错信息进行处理的解决方案。
7.如权利要求6所述的保险信息处理方法,其特征在于,所述根据所述当前报错信息与各条预设报错信息之间的距离,确定对所述当前报错信息进行处理的解决方案,包括:
根据所述当前报错信息的第二表征向量与所述各条预设报错信息的第一表征向量,计算所述当前报错信息与所述各条预设报错信息之间的距离;
确定与所述当前报错信息的距离由小到大的至少两个预设报错信息;以及
按照预设策略对所述至少两个预设报错信息对应的解决方案进行处理,确定用于对所述当前报错信息进行处理的解决方案。
8.如权利要求1所述的保险信息处理方法,其特征在于,所述方法还包括:
根据用于对所述当前报错信息进行处理的解决方案,对用户的投保信息进行调整,或者生成用于引导所述用户补充影像件的引导信息;以及
通过API接口向保司系统发起二次报价或核保请求。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的保险信息处理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的保险信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311062044.2A CN116757858A (zh) | 2023-08-23 | 2023-08-23 | 保险信息处理方法、终端设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311062044.2A CN116757858A (zh) | 2023-08-23 | 2023-08-23 | 保险信息处理方法、终端设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116757858A true CN116757858A (zh) | 2023-09-15 |
Family
ID=87961379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311062044.2A Pending CN116757858A (zh) | 2023-08-23 | 2023-08-23 | 保险信息处理方法、终端设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757858A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377703A (zh) * | 2019-07-22 | 2019-10-25 | 中国工商银行股份有限公司 | 报错信息处理方法、装置和设备 |
CN114357171A (zh) * | 2022-01-04 | 2022-04-15 | 中国建设银行股份有限公司 | 一种应急事件处理方法、装置、存储介质及电子设备 |
CN114647528A (zh) * | 2022-03-16 | 2022-06-21 | 中国工商银行股份有限公司 | 一种批量文件的报错数据处理方法及装置 |
CN114661684A (zh) * | 2022-03-25 | 2022-06-24 | 中国工商银行股份有限公司 | 基于条件随机场的日志报错信息处理方法及装置 |
CN115712701A (zh) * | 2022-11-18 | 2023-02-24 | 华为技术有限公司 | 语言处理方法、装置及存储介质 |
CN116049249A (zh) * | 2021-12-31 | 2023-05-02 | 海光信息技术股份有限公司 | 报错信息处理方法、装置、系统、设备和存储介质 |
CN116467219A (zh) * | 2023-06-01 | 2023-07-21 | 中国工商银行股份有限公司 | 一种测试处理方法及装置 |
-
2023
- 2023-08-23 CN CN202311062044.2A patent/CN116757858A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377703A (zh) * | 2019-07-22 | 2019-10-25 | 中国工商银行股份有限公司 | 报错信息处理方法、装置和设备 |
CN116049249A (zh) * | 2021-12-31 | 2023-05-02 | 海光信息技术股份有限公司 | 报错信息处理方法、装置、系统、设备和存储介质 |
CN114357171A (zh) * | 2022-01-04 | 2022-04-15 | 中国建设银行股份有限公司 | 一种应急事件处理方法、装置、存储介质及电子设备 |
CN114647528A (zh) * | 2022-03-16 | 2022-06-21 | 中国工商银行股份有限公司 | 一种批量文件的报错数据处理方法及装置 |
CN114661684A (zh) * | 2022-03-25 | 2022-06-24 | 中国工商银行股份有限公司 | 基于条件随机场的日志报错信息处理方法及装置 |
CN115712701A (zh) * | 2022-11-18 | 2023-02-24 | 华为技术有限公司 | 语言处理方法、装置及存储介质 |
CN116467219A (zh) * | 2023-06-01 | 2023-07-21 | 中国工商银行股份有限公司 | 一种测试处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929448B2 (en) | Determining a category of a request by word vector representation of a natural language text string with a similarity value | |
US11164564B2 (en) | Augmented intent and entity extraction using pattern recognition interstitial regular expressions | |
US11042710B2 (en) | User-friendly explanation production using generative adversarial networks | |
US12105704B2 (en) | Machine learning-implemented chat bot database query system for multi-format database queries | |
CN117392379B (zh) | 目标检测的方法和装置 | |
US11972490B2 (en) | Determining a category of a request by word vector representation of a natural language text string with a similarity value | |
CN111260484A (zh) | 一种人伤识别的数据处理方法、装置、服务器及系统 | |
KR20210049321A (ko) | 보험 문서 분석 방법을 제공하기 위한 컴퓨터 프로그램 | |
CN113221762A (zh) | 代价平衡决策方法、保险理赔决策方法、装置和设备 | |
CN111062203B (zh) | 基于语音的数据标注方法、装置、介质以及电子设备 | |
US20220036467A1 (en) | Machine learning system and method for quote generation | |
US11922515B1 (en) | Methods and apparatuses for AI digital assistants | |
US11475529B2 (en) | Systems and methods for identifying and linking events in structured proceedings | |
CN116757858A (zh) | 保险信息处理方法、终端设备和存储介质 | |
CN111507849A (zh) | 核保方法及相关装置、设备 | |
US11978273B1 (en) | Domain-specific processing and information management using machine learning and artificial intelligence models | |
US20240160953A1 (en) | Multimodal table extraction and semantic search in a machine learning platform for structuring data in organizations | |
CN118506783B (zh) | 基于Agent的语音交互方法以及相关装置 | |
CN116861302B (zh) | 一种案件自动分类分拨方法 | |
CN114282653A (zh) | 模型训练方法、设备及存储介质 | |
CN115827869A (zh) | 一种单据图像的处理方法、装置、电子设备及存储介质 | |
KR20240000716A (ko) | 키워드 기반으로 세무 기장 정보를 생성하는 세무 기장 자동화 방법 | |
KR20240000719A (ko) | 키워드 분리 프로세스를 통해 사용자의 세무 기장을 자동화하는 시스템 | |
CN118658022A (zh) | 一种分类模型的训练、图像分类方法、装置、设备及介质 | |
CN115774667A (zh) | 一种代码检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |