CN113919962B - 保单出险的智能分析方法、装置、设备及存储介质 - Google Patents

保单出险的智能分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113919962B
CN113919962B CN202111227399.3A CN202111227399A CN113919962B CN 113919962 B CN113919962 B CN 113919962B CN 202111227399 A CN202111227399 A CN 202111227399A CN 113919962 B CN113919962 B CN 113919962B
Authority
CN
China
Prior art keywords
data
policy
dynamic
static
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111227399.3A
Other languages
English (en)
Other versions
CN113919962A (zh
Inventor
曾伟
郑越
梁智豪
任伯阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111227399.3A priority Critical patent/CN113919962B/zh
Publication of CN113919962A publication Critical patent/CN113919962A/zh
Application granted granted Critical
Publication of CN113919962B publication Critical patent/CN113919962B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及人工智能领域,揭露一种保单出险的智能分析方法,包括:将历史保单中的数据划分为静态数据和动态数据,分别提取静态数据和动态数据的数据特征,得到静态特征数据和动态特征数据;利用语义特征提取模型识别静态特征数据中的语义特征;利用时序特征提取模型识别动态特征数据中的时序特征;将语义特征和时序特征作为训练样本输入至保单出险分析模型,以通过训练样本对保单出险分析模型进行训练,得到训练完成的保单出险分析模型;利用训练完成的保单出险分析模型检测当前保单的出险概率,以生成当前保单的出险结果。此外,本发明还涉及区块链技术,所述当前保单可存储区块链。本发明可以实现保单出险的智能分析,提高保单出险的分析效率。

Description

保单出险的智能分析方法、装置、设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种保单出险的智能分析方法、装置、电子设备及计算机可读存储介质。
背景技术
保单出险是指企业或用户在受到自然灾害或意外事件进行保单理赔的过程,由于保单涉及到不同类型的险种,如自然险、车险以及意外险等,而不同类型的险种基于其对应的保单因子进行出险分析,另外,由于不同用户或企业因本身的属性不同,在具体到每个用户或企业的保单出险需要结合其自身的属性特征,目前,保单出险通常是基于出险人员对用户或企业提交的理赔保单进行逐一分析审核后实现,这样容易需要耗费大量的人力和时间成本,从而会影响保单的出险分析效率,因此,如何智能高效分析保单的出险是目前亟待解决的问题。
发明内容
本发明提供一种保单出险的智能分析方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现保单出险的智能分析,提高保单出险的分析效率。
为实现上述目的,本发明提供的一种保单出险的智能分析方法,包括:
获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据;
利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征;
利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征;
将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型;
利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果。
可选地,所述将所述历史保单中的数据划分为静态数据和动态数据,包括:
获取所述历史保单中每个数据的数据类型,根据所述数据类型,识别所述历史保单中每个数据的数据属性;
根据所述数据属性,判断所述历史保单中每个数据是否处于动态变化的状态;
若所述数据不出于动态变化的状态,则将所述数据划分为静态数据;
若所述数据处于动态变化的状态,则将所述数据划分为静态数据。
可选地,所述分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据,包括:
分别计算所述静态数据和所述动态数据中每个数据的信息增益率;
选取所述信息增益率大于预设增益率的数据作为所述静态数据和所述动态数据的特征数据,得到静态特征数据和动态特征数据。
可选地,所述利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征之前,还包括:
获取训练文本,将所述训练文本输入至预构建的语义特征提取模型进行训练,得到训练值;
利用所述预构建的语义特征提取模型中的损失函数计算所述训练值与对应标签的训练损失值;
根据所述训练损失值调整所述语义特征提取模型的参数,直至所述训练损失值小于预设的训练损失值,得到预训练好的语义特征提取模型。
可选地,所述利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征之前,还包括:
获取训练数据及其对应的真实值,利用预构建时序特征提取模型中的输入门计算所述训练数据的状态值;
利用所述预构建时序特征提取模型中的遗忘门计算所述训练数据的激活值;根据所述状态值和激活值计算所述数据的状态更新值;
利用所述预构建时序特征提取模型中的输出门计算所述状态更新值的时序特征值;
根据所述时序特征值和所述训练数据的真实值,调整所述预构建时序特征提取模型中的参数,直至所述预构建时序特征提取模型趋于收敛时,结束所述预构建时序特征提取模型的训练,得到所述预训练好的时序特征提取模型。
可选地,所述通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型,包括:
从所述训练样本中选取特征根节点,并根据所述特征根节点,利用所述预构建保单出险分析模型中分类层对所述训练样本中剩余特征进行节点分割,得到多个分割节点;
利用所述预构建保单出险分析模型中的激活函数计算每个所述分割节点的梯度增益,根据所述梯度增益,对每个所述分割节点进行节点分裂,得到多个分裂节点;
利用所述构建保单出险分析模型中的损失函数计算所述多个分裂节点与所述训练样本标签的损失值;
若所述损失值大于预设阈值,则调整所述预构建保单出险分析模型的参数,并返回执行从所述训练样本中选取特征根节点的步骤;
若所述损失值不大于预设阈值,则得到训练完成的保单出险分析模型。
可选地,所述利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果,包括:
获取所述当前保单的静态特征和动态特征,利用所述训练完成的保单出险分析模型计算所述静态特征和所述动态特征的保单出险概率;
根据所述保单出险概率,生成所述当前保单的出险结果。
为了解决上述问题,本发明还提供一种保单出险的智能分析装置,所述装置包括:
数据特征提取模块,用于获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据;
语义特征识别模块,用于利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征;
时序特征识别模块,用于利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征;
模型训练模块,用于将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型;
保单出险分析模块,用于利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以实现上述所述的保单出险的智能分析方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的保单出险的智能分析方法。
可以看出,相较于现有技术中通过人工进行保单出险的分析,本发明实施例通过将历史保单的数据划分为静态特征数据和动态特征数据,以将所述历史保单按照时序因素进行区分,保障后续在保单出险分析模型训练过程中可以更加细粒度的实现保单出险概率的计算,提高模型的识别能力,其次,本发明实施例通过语义特征提取模型和时序特征提取模型分别识别所述静态特征数据和动态特征数据的语义特征和时序特征,以保障后续保单出险分析模型的训练,以实现实现保单出险的智能专业分析;进一步地,本发明实施例通过训练完成的保单出险分析模型检测当前保单的出险概率,可以避免过多的人为参与保单出险的分析工作,生成当前保单的出险结果,提高保单出险的分析效率。因此,本发明实施例提出的一种保单出险的智能分析方法、装置、电子设备及计算机可读存储介质可以实现保单出险的智能分析,提高保单出险的分析效率。
附图说明
图1为本发明一实施例提供的保单出险的智能分析方法的流程示意图;
图2为本发明一实施例提供的保单出险的智能分析装置的模块示意图;
图3为本发明一实施例提供的实现保单出险的智能分析方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种保单出险的智能分析方法。所述保单出险的智能分析方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述保单出险的智能分析方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的保单出险的智能分析方法的流程示意图。在本发明实施例中,所述保单出险的智能分析方法包括:
S1、获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据。
本发明实施例中,所述历史保单是指用户或企业已经购买过的保险单,其包括出险保单和未出险保单,所述出险保单是指用户或企业在购买保险单之后发生相应理赔事件的理赔保单,所述未出险保单是指用户或企业在购买保险单之后未发生相应理赔事件的保单。应该了解的是,在保单中会出现因不可预估的因素而导致保单出险,如对于自然灾害保单,暴雨、洪灾等不可预估因素常常会导致自然灾害保单进行出险,因此本发明实施例通过将所述历史保单中的数据划分为静态数据和动态数据,以将所述历史保单中的数据拆分为可预估出险因子和不可预估出险因子。其中,所述静态数据可以理解为历史保单在出险过程中可预估的出险因子数据,所述动态数据可以理解为历史保单在出险过程中不可预估的出险因子数据。
作为本发明的一个实施例,所述将所述历史保单中的数据划分为静态数据和动态数据,包括:获取所述历史保单中每个数据的数据类型,根据所述数据类型,识别所述历史保单中每个数据的数据属性,根据所述数据属性,判断所述历史保单中每个数据是否处于动态变化的状态,若所述数据不处于动态变化的状态,则将所述数据划分为静态数据,若所述数据处于动态变化的状态,则将所述数据划分为静态数据。
其中,所述数据类型用于表征所述数据的数据信息特征,如企业的名称、机构代码等数据的数据类型可以为企业身份信息,所述数据属性用于表征所述数据所处的数据特征,如处于企业身份信息类型的数据其本身信息通常是处于不会变换的状态,因此,可以将企业身份信息类型的数据划分为静态数据,处于天气信息类型的数据其本身天气通常是处于变化的状态,因此,可以将天气信息类型的数据划分为动态数据。
进一步地,本发明实施例通过分别提取所述静态数据和所述动态数据的数据特征,以过滤所述静态数据和所述动态数据中的一些无用数据,提高后续所述静态数据和所述动态数据的处理速度。
作为本发明的一个实施例,所述分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据,包括:分别计算所述静态数据和所述动态数据中每个数据的信息增益率,选取所述信息增益率大于预设增益率的数据作为所述静态数据和所述动态数据的特征数据,得到静态特征数据和动态特征数据。
其中,所述信息增益率是指所述静态数据和所述动态数据在所述历史保单出险中所占得权重比例,其可以通过相对熵算法实现,所述预设增益率可以设置为0.55,也可以根据实际业务场景设置。
示例性地,存在历史保单为暴雨保单,则该暴雨保单的静态特征数据可以为以地址标的多维度的空间特征,该暴雨保单的特征数据可以为地址标的多维度的时间特征,其中,所述空间特征包括:水系因子、高程因子、静态降雨因子以及企业或用户的身份信息因子等,所述水系因子可以理解为距离河流湖泊等水域较近,比较容易遭受河水倒灌的数据,所述高程因子可以理解为以地址标的所在坐标位置的中心区域的数据,如高低洼地区,所述静态降雨因子可以理解为以地址标的所在坐标位置的降雨量,所述身份信息因子可以理解为企业或用户所处行业分类的数据,如企业经营范围,用户工作领域等,所述时间特征包括:动态降雨因子、信息变更因子等,所述动态降雨因子可以理解为当前时刻前三天降雨数据或未来三天的降雨预报数据,所述信息变更因子可以理解为企业经营范围变更数据或用户所处行业变更数据。
S2、利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征。
本发明实施例中,所述预训练好的语义特征提取模型包括bert模型,虽然所述bert模型可以预测出数据的语义特征,但由于其预测数据领域较为广泛,缺少对某一领域数据的专一预测,于是,本发明通过利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征,以使所述bert模型能够更加专一的对保险数据进行语义特征预测,从而可以提高静态特征数据中语义特征的提取准确性。需要说明的是,在所述静态特征数据中的数据通常是不会随着时间而发生变化,因此,所述静态特征数据中会包含非结构化数据(如文本数据),如企业的经营范围的描述等文本数据,由于非结构化数据数据无法直接输入到模型中,于是,本发明实施例采用Bert模型将这些文本数据进行向量化,以实现所述静态特征数据的语义特征提取。
本发明一可选实施例中,所述利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征之前还包括:获取训练文本,将所述训练文本输入至预构建的语义特征提取模型进行训练,得到训练值;利用所述预构建的语义特征提取模型中的损失函数计算所述训练值与对应标签的训练损失值,根据所述训练损失值调整所述语义特征提取模型的参数,直至所述训练损失值小于预设的训练损失值,得到预训练好的语义特征提取模型。
其中,所述训练文本是指保单领域中的文本数据,其可以通过从专业网站中下载。所述标签用于表征所述训练样本的真实属性,如所述训练文本为企业的经营范围,则该训练样本的标签可以为关键语义信息。
一个可选实施例中,所述损失函数可以为交叉熵损失函数,所述预设的训练损失值为0.1。
进一步地,本发明实施例将所述静态特征数据输入至所述预训练好的语义特征提取模型中,以输出所述静态特征数据的语义特征。
S3、利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征。
应该了解,所述动态特征数据是随着时间变化而改变的数据,因此,本发明实施例通过预训练好的时序特征提取模型识别所述动态特征数据中的时序特征,以获取所述动态特征数据中用于表征时间变化的数据特征,在本发明中,所述时序特征提取模型包括LSTM(Long Short-Term Memory,长短期记忆人工神经网络)模型,由于所述LSTM模型包含较少的参数,属于小分类识别模型,因此,通过所述LSTM模型虽然可以较快实现进行数据分类预测,但是其预测结果的准确率较低以及泛化性较弱,于是,本发明实施例中,在利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征之前还包括:获取训练数据及其对应的真实值;利用预构建时序特征提取模型中的输入门计算所述训练数据的状态值;利用所述预构建时序特征提取模型中的遗忘门计算所述训练数据的激活值;根据所述状态值和激活值计算所述数据的状态更新值;利用所述预构建时序特征提取模型中的输出门计算所述状态更新值的时序特征值,根据所述时序特征值和所述训练数据的真实值,调整所述预构建时序特征提取模型中的参数,直至所述预构建时序特征提取模型趋于收敛时,结束所述预构建时序特征提取模型的训练,得到所述预训练好的时序特征提取模型。
一个可选实施例中,所述根据所述时序特征值和所述训练数据的真实值调整所述预构建时序特征提取模型中的参数,包括:计算所述时序特征值和训练数据的真实值的差值,若所述差值大于预设的差值时,则调整所述预构建时序特征提取模型的参数,若所述差值不大于预设的差值时,则不调整所述预构建时序特征提取模型的参数,可选地,所述预设的差值为0.1。
进一步地,本发明实施例将所述动态特征数据输入至所述预训练好的时序特征提取模型中,以输出所述动态特征数据的时序特征。
S4、将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型。
本发明实施例中,所述预构建的保单出险分析模型包括LightGBM模型,所述LightGBM模型通过使用直方图的方式,对于每个特征的所有候选分割点按照其范围分成N个箱子,累加箱子内的梯度提升值,对于箱子里的每个候选分割点都计算带来的梯度增益,对于每个箱子分别保存其累计梯度、箱子内的样本数量,之后再分裂节点时直接对直方图遍历进行分割点的候选,以实现数据分类,在本发明中,所述保单出险分析模型用于根据输入的数据特征,计算其数据特征的保单出险概率,从而实现保单出险的智能分析。
作为本发明的一个实施例,所述通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型,包括:从所述训练样本中选取特征根节点,并根据所述特征根节点,利用所述预构建保单出险分析模型中分类层对所述训练样本中剩余特征进行节点分割,得到多个分割节点,利用所述预构建保单出险分析模型中的激活函数计算每个所述分割节点的梯度增益,根据所述梯度增益,对每个所述分割节点进行节点分裂,得到多个分裂节点,利用所述构建保单出险分析模型中的损失函数计算所述多个分裂节点与所述训练样本标签的损失值,若所述损失值大于预设阈值,则调整所述预构建保单出险分析模型的参数,并返回执行从所述训练样本中选取特征根节点的步骤,若所述损失值不大于预设阈值,则得到训练完成的保单出险分析模型。
本发明一可选实施例中,所述从所述训练样本中选取特征根节点,包括:利用决策算法计算所述训练样本中每个特征的信息增益值,将所述信息增益值最高的特征作为所述根节点。其中,所述根节点可以理解为所述训练样本在进行分割时第一个分割点,所述决策算法包括:
Figure BDA0003314795660000081
/>
其中,Ci表示特征的信息增益值,Ei表示训练样本中第i个特征的特征向量期望,
Figure BDA0003314795660000082
表示训练样本中第i个特征的特征期望的特征向量协方差,trace()表示空间滤波函数。
进一步地,本发明一可选实施例中,所述训练样本中剩余特征的节点分割,及所述分割节点的节点分裂可以通过所述分类层中的直方图函数实现,所述损失函数可以为交叉熵损失函数,所述预设阈值可以设置为0.1,也可以根据实际业务场景设置,所述参数包括权重和偏置,所述参数的调整可以通过梯度下降算法实现,如随机梯度下降算法。
S5、利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果。
本发明实施例中,所述当前保单可以理解为需要进行出险分析的保单,需要说明的是,所述当前保单的保单时间处于理赔时间范围内,进一步地,本发明实施例中,所述利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果,包括:获取所述当前保单的静态特征和动态特征,利用所述训练完成的保单出险分析模型计算所述静态特征和所述动态特征的保单出险概率,根据所述保单出险概率,生成所述当前保单的出险结果。其中,所述当前保单的静态特征和动态特征获取与上述历史保单的特征获取采取相同的技术手段,在此不做进一步地阐述。
进一步地,为保障所述当前保单的隐私性和安全性,所述当前保单还可存储于一区块链节点中。
可以看出,相较于现有技术中通过人工进行保单出险的分析,本发明实施例通过将历史保单的数据划分为静态特征数据和动态特征数据,以将所述历史保单按照时序因素进行区分,保障后续在保单出险分析模型训练过程中可以更加细粒度的实现保单出险概率的计算,提高模型的识别能力,其次,本发明实施例通过语义特征提取模型和时序特征提取模型分别识别所述静态特征数据和动态特征数据的语义特征和时序特征,以保障后续保单出险分析模型的训练,以实现实现保单出险的智能专业分析;进一步地,本发明实施例通过训练完成的保单出险分析模型检测当前保单的出险概率,可以避免过多的人为参与保单出险的分析工作,生成当前保单的出险结果,提高保单出险的分析效率。因此,本发明实施例提出的一种保单出险的智能分析方法、装置、电子设备及计算机可读存储介质可以实现保单出险的智能分析,提高保单出险的分析效率。
如图2所示,是本发明保单出险的智能分析装置的功能模块图。
本发明所述保单出险的智能分析装置100可以安装于电子设备中。根据实现的功能,所述保单出险的智能分析装置可以包括数据特征提取模块101、语义特征识别模块102、时序特征识别模块103、模型训练模块104以及保单出险分析模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备的处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述数据特征提取模块101,用于获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据;
所述语义特征识别模块102,用于利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征;
所述时序特征识别模块103,用于利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征;
所述模型训练模块104,用于将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型;
所述保单出险分析模块105,用于利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果。
详细地,本发明实施例中所述保单出险的智能分析装置100中的所述各模块在使用时采用与上述的图1中所述的保单出险的智能分析方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图3所示,是本发明实现保单出险的智能分析方法的电子设备1的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如保单出险的智能分析程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备1的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行保单出险的智能分析程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如保单出险的智能分析程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备1与其他设备之间的通信,包括网络接口和员工接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备1之间建立通信连接。所述员工接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,员工接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的员工界面。
图3仅示出了具有部件的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的保单出险的智能分析程序是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据;
利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征;
利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征;
将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型;
利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果。
具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备1的处理器所执行时,可以实现:
获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据;
利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征;
利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征;
将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型;
利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (9)

1.一种保单出险的智能分析方法,其特征在于,所述方法包括:
获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据;
利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征;
利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征;
将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型;
利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果;
其中,所述将所述历史保单中的数据划分为静态数据和动态数据,包括:获取所述历史保单中每个数据的数据类型,根据所述数据类型,识别所述历史保单中每个数据的数据属性;根据所述数据属性,判断所述历史保单中每个数据是否处于动态变化的状态;若所述数据不处于动态变化的状态,则将所述数据划分为静态数据;若所述数据处于动态变化的状态,则将所述数据划分为动态数据。
2.如权利要求1所述的保单出险的智能分析方法,其特征在于,所述分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据,包括:
分别计算所述静态数据和所述动态数据中每个数据的信息增益率;
选取所述信息增益率大于预设增益率的数据作为所述静态数据和所述动态数据的特征数据,得到静态特征数据和动态特征数据。
3.如权利要求1所述的保单出险的智能分析方法,其特征在于,所述利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征之前,还包括:
获取训练文本,将所述训练文本输入至预构建的语义特征提取模型进行训练,得到训练值;
利用所述预构建的语义特征提取模型中的损失函数计算所述训练值与对应标签的训练损失值;
根据所述训练损失值调整所述语义特征提取模型的参数,直至所述训练损失值小于预设的训练损失值,得到预训练好的语义特征提取模型。
4.如权利要求1所述的保单出险的智能分析方法,其特征在于,所述利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征之前,还包括:
获取训练数据及其对应的真实值,利用预构建时序特征提取模型中的输入门计算所述训练数据的状态值;
利用所述预构建时序特征提取模型中的遗忘门计算所述训练数据的激活值;根据所述状态值和激活值计算所述数据的状态更新值;
利用所述预构建时序特征提取模型中的输出门计算所述状态更新值的时序特征值;
根据所述时序特征值和所述训练数据的真实值,调整所述预构建时序特征提取模型中的参数,直至所述预构建时序特征提取模型趋于收敛时,结束所述预构建时序特征提取模型的训练,得到所述预训练好的时序特征提取模型。
5.如权利要求1所述的保单出险的智能分析方法,其特征在于,所述通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型,包括:
从所述训练样本中选取特征根节点,并根据所述特征根节点,利用所述预构建保单出险分析模型中分类层对所述训练样本中剩余特征进行节点分割,得到多个分割节点;
利用所述预构建保单出险分析模型中的激活函数计算每个所述分割节点的梯度增益,根据所述梯度增益,对每个所述分割节点进行节点分裂,得到多个分裂节点;
利用所述构建保单出险分析模型中的损失函数计算所述多个分裂节点与所述训练样本标签的损失值;
若所述损失值大于预设阈值,则调整所述预构建保单出险分析模型的参数,并返回执行从所述训练样本中选取特征根节点的步骤;
若所述损失值不大于预设阈值,则得到训练完成的保单出险分析模型。
6.如权利要求1至5中任意一项所述的保单出险的智能分析方法,其特征在于,所述利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果,包括:
获取所述当前保单的静态特征和动态特征,利用所述训练完成的保单出险分析模型计算所述静态特征和所述动态特征的保单出险概率;
根据所述保单出险概率,生成所述当前保单的出险结果。
7.一种保单出险的智能分析装置,其特征在于,所述装置包括:
数据特征提取模块,用于获取历史保单,将所述历史保单中的数据划分为静态数据和动态数据,并分别提取所述静态数据和所述动态数据的数据特征,得到静态特征数据和动态特征数据;
语义特征识别模块,用于利用预训练好的语义特征提取模型识别所述静态特征数据中的语义特征;
时序特征识别模块,用于利用预训练好的时序特征提取模型识别所述动态特征数据中的时序特征;
模型训练模块,用于将所述语义特征和所述时序特征作为训练样本输入至预构建的保单出险分析模型中,以通过所述训练样本对所述预构建的保单出险分析模型进行训练,得到训练完成的保单出险分析模型;
保单出险分析模块,用于利用所述训练完成的保单出险分析模型检测当前保单的出险概率,以生成所述当前保单的出险结果;
其中,所述将所述历史保单中的数据划分为静态数据和动态数据,包括:获取所述历史保单中每个数据的数据类型,根据所述数据类型,识别所述历史保单中每个数据的数据属性;根据所述数据属性,判断所述历史保单中每个数据是否处于动态变化的状态;若所述数据不处于动态变化的状态,则将所述数据划分为静态数据;若所述数据处于动态变化的状态,则将所述数据划分为动态数据。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6中任意一项所述的保单出险的智能分析方法。
9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述的保单出险的智能分析方法。
CN202111227399.3A 2021-10-21 2021-10-21 保单出险的智能分析方法、装置、设备及存储介质 Active CN113919962B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111227399.3A CN113919962B (zh) 2021-10-21 2021-10-21 保单出险的智能分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111227399.3A CN113919962B (zh) 2021-10-21 2021-10-21 保单出险的智能分析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113919962A CN113919962A (zh) 2022-01-11
CN113919962B true CN113919962B (zh) 2023-05-26

Family

ID=79242135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111227399.3A Active CN113919962B (zh) 2021-10-21 2021-10-21 保单出险的智能分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113919962B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967575A (zh) * 2017-12-21 2018-04-27 大连丰泰保险信息咨询有限公司 一种人工智能保险咨询服务人工智能平台系统
CN109523412A (zh) * 2018-11-14 2019-03-26 平安科技(深圳)有限公司 智能核保方法、装置、计算机设备及计算机可读存储介质
CN109657918A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 关联评估对象的风险预警方法、装置和计算机设备
CN109857750A (zh) * 2019-01-17 2019-06-07 深圳壹账通智能科技有限公司 保险理赔决策方法、装置、计算机设备及存储介质
US10630723B1 (en) * 2015-12-03 2020-04-21 United Services Automobile Association (Usaa) Determining policy characteristics based on route similarity
CN112541745A (zh) * 2020-12-22 2021-03-23 平安银行股份有限公司 用户行为数据分析方法、装置、电子设备及可读存储介质
CN113256181A (zh) * 2021-07-13 2021-08-13 平安科技(深圳)有限公司 风险因子预测方法、装置、设备及介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10630723B1 (en) * 2015-12-03 2020-04-21 United Services Automobile Association (Usaa) Determining policy characteristics based on route similarity
CN107967575A (zh) * 2017-12-21 2018-04-27 大连丰泰保险信息咨询有限公司 一种人工智能保险咨询服务人工智能平台系统
CN109523412A (zh) * 2018-11-14 2019-03-26 平安科技(深圳)有限公司 智能核保方法、装置、计算机设备及计算机可读存储介质
CN109657918A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 关联评估对象的风险预警方法、装置和计算机设备
CN109857750A (zh) * 2019-01-17 2019-06-07 深圳壹账通智能科技有限公司 保险理赔决策方法、装置、计算机设备及存储介质
CN112541745A (zh) * 2020-12-22 2021-03-23 平安银行股份有限公司 用户行为数据分析方法、装置、电子设备及可读存储介质
CN113256181A (zh) * 2021-07-13 2021-08-13 平安科技(深圳)有限公司 风险因子预测方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113919962A (zh) 2022-01-11

Similar Documents

Publication Publication Date Title
CN113688923B (zh) 订单异常智能检测方法、装置、电子设备及存储介质
CN110163204A (zh) 基于图像识别的商家监管方法、装置及存储介质
CN112528616B (zh) 业务表单生成方法、装置、电子设备及计算机存储介质
CN113704410B (zh) 情绪波动检测方法、装置、电子设备及存储介质
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN115936895A (zh) 基于人工智能的风险评估方法、装置、设备及存储介质
CN114840684A (zh) 基于医疗实体的图谱构建方法、装置、设备及存储介质
CN113919962B (zh) 保单出险的智能分析方法、装置、设备及存储介质
CN114708073B (zh) 一种围标串标智能检测方法、装置、电子设备及存储介质
CN116340516A (zh) 实体关系的聚类提取方法、装置、设备及存储介质
CN113657546B (zh) 信息分类方法、装置、电子设备及可读存储介质
CN113515591B (zh) 文本不良信息识别方法、装置、电子设备及存储介质
CN113051911B (zh) 提取敏感词的方法、装置、设备、介质及程序产品
CN113626605B (zh) 信息分类方法、装置、电子设备及可读存储介质
CN114996386A (zh) 业务角色识别方法、装置、设备及存储介质
CN114722146A (zh) 基于人工智能的供应链资产校验方法、装置、设备及介质
CN113688924B (zh) 异常订单检测方法、装置、设备及介质
CN116933123A (zh) 客用户的常住地预测方法、装置、设备及存储介质
CN114723488B (zh) 课程推荐方法、装置、电子设备及存储介质
CN113792127B (zh) 基于大数据的法规识别方法、装置、电子设备及介质
CN113706207B (zh) 基于语义解析的订单成交率分析方法、装置、设备及介质
CN115098688B (zh) 多标签分类模型训练方法、装置、电子设备及存储介质
CN113704411B (zh) 基于词向量的相似客群挖掘方法、装置、设备及存储介质
CN113793037B (zh) 基于数据分析的业务分配方法、装置、设备及存储介质
CN114723523B (zh) 基于用户能力画像的产品推荐方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant