CN113947076A - 保单数据的检测方法、装置、计算机设备及存储介质 - Google Patents
保单数据的检测方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113947076A CN113947076A CN202111266332.0A CN202111266332A CN113947076A CN 113947076 A CN113947076 A CN 113947076A CN 202111266332 A CN202111266332 A CN 202111266332A CN 113947076 A CN113947076 A CN 113947076A
- Authority
- CN
- China
- Prior art keywords
- data
- policy
- abnormal
- information
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请涉及业务数据检测领域,揭示了一种保单数据的检测方法、装置、计算机设备及存储介质,其中方法包括:获取待检测的保单数据;根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;若所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到;获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。本申请能够提高保单数据中不同项目信息的检测效率及检测准确率。
Description
技术领域
本申请涉及到业务数据检测领域,特别是涉及到一种保单数据的检测方法、装置、计算机设备及存储介质。
背景技术
目前保险企业将保险产品的保单数据以数字化进行记录,在保险产品的销售与售后进程,由于不同进程需要不同部门的认为参与,容易出现数据错误的现象,导致出现异常保单,而对于异常保单的检测,不同部门需要对其负责的阶段制定相应的规则,导致异常保单的检测不统一,检测效率低。
发明内容
本申请的主要目的为提供一种保单数据的检测方法、装置、计算机设备及存储介质,旨在解决保单数据的检测方式复杂、检测效率低的问题。
为了实现上述发明目的,本申请提出一种保单数据的检测方法,包括:
获取待检测的保单数据;
根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;
获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;
若所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到;
获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
进一步地,所述根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,包括:
根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
进一步地,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
进一步地,所述根据所述检测数据与所述项目信息数据计算数据偏移量,包括:
识别所述项目信息数据的类型;
根据所述类型从预设的配置文件中匹配计算规则,根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量。
进一步地,所述根据所述类型从预设的配置文件中匹配计算规则,包括:
根据所述类型从预设的配置文件中匹配待选计算规则;
获取所述项目信息数据的检测执行时间,根据所述检测执行时间从所述待选计算规则中筛选对应时间的目标计算规则。
进一步地,所述根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量,包括:
获取所述计算规则的计算参数及检测参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述检测数据的数据值配置为所述检测参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
进一步的,所述根据所述关联项目信息与所述异常数据生成异常保单信息之后,还包括:
根据所述异常保单信息匹配异常解决措施;
将所述异常保单信息与所述异常解决措施关联,生成异常任务;
将所述异常任务上传至异常任务调度链,并向预设的异常解决部门发送异常任务通知,以依次从所述异常任务调度链获取并执行所述异常任务。
本申请还提供一种保单数据的检测装置,包括:
数据获取模块,用于获取待检测的保单数据;
项目识别模块,用于根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;
偏移计算模块,用于获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;
异常检测模块,用于若判定所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到;
异常生成模块,用于获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述保单数据的检测方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述保单数据的检测方法的步骤。
本申请例提供了一种保单数据进行多维度检测的方法,首先获取待检测的保单数据;所述待检测的保单数据包括记录保险产品上线、销售、售后支出等数字化数据,然后根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,准确地识别保单数据中的每一项信息,当获取了所述保单数据包含的项目信息数据后,获取所述项目信息数据对应的预配置的检测数据,不同的项目信息数据配置的检测数据不相同,然后根据所述检测数据与所述项目信息数据计算数据偏移量,即计算所述检测数据与所述项目信息数据的百分比差异值作为所述数据偏移量,从而可以准确地计算出当前的保单数据中的项目信息数据与预配置的检测数据的差异值,若所述数据偏移量小于所述预设告警值的最小值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据;或,所述数据偏移量大于所述预设告警值的最大值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据,在确定所述项目信息数据为异常数据后,获取所述异常项目数据的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息,不仅基于异常数据生成异常保单信息,还获取异常数据对应的关联项目信息生成异常保单信息,从而快速、全面地对保单数据进行检测,提高保单数据中不同项目信息的检测效率及检测准确率。
附图说明
图1为本申请保单数据的检测方法的一实施例流程示意图;
图2为本申请保单数据的检测装置的一实施例结构示意图;
图3为本申请计算机设备的一实施例结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种保单数据的检测方法,包括步骤S10-S50,对于所述保单数据的检测方法的各个步骤的详细阐述如下,所述保单数据的检测方法可以由内置有相应功能的应用程序完成,例如内置于应用程序中的“保单检测”功能,通过该功能使得应用程序能够完成异常保单的检测,所述应用程序可以运行于终端设备上或运行于云端服务器中,因此,所述保单数据的检测方法也可以理解为由运行所述应用程序的终端设备或云端服务器完成。
S10、获取待检测的保单数据。
本实施例应用于保单数据的监控、管理,随着数字化的不断发展,保险企业将保险产品的保单数据以数字化进行记录,包括记录保险产品上线、销售、售后支出等数字化数据,当保险产品在上线之前、上线之后对保险产品相关的保单数据进行监控,即获取待检测的保单数据。例如,当保险产品上线销售时,对保险产品的售前保单数据进行监控,从而获取相应的待检测的保单数据;当保险产品理赔时,对保险产品的理赔保单数据进行监控,从而获取相应的待检测的保单数据。
S20、根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据。
本实施例中,在获取待检测的保单数据之后,为了准确地识别保单数据中的每一项信息,根据自然语言算法识别所述保单数据,获取所述保单数据包含的各个项目信息,所述项目信息定义为项目信息数据,其中,每一项项目信息数据以预设格式存储在所述保单数据中,通过配置自然语言模型,然后对不同的保单数据的样本进行识别训练,使得训练好的自然语言模型具有对整个保单数据的内容进行识别和分类的能力,能够识别出保单数据中包含的不同项目信息数据。在一种实施方式中,对于保单数据中包含的项目信息数据的识别与确定,通过对不同项目信息数据拼接后的样本进行识别训练,首先,采集多份独立的项目信息数据,然后将至少两份不同的所述项目信息数据样本进行拼接组合,得到保单数据样本,再使用自然语言模型预测保单数据样本中包含的不同项目信息数据的数量,基于自然语言模型预测的项目信息数据的数量与拼接的保单数据样本包含的项目信息数据的数量对所述自然语言模型进行训练,使得训练好的自然语言模型具有对整个保单数据的内容进行识别和分类的能力,从而使用自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,提高了对保单数据中的文本内容的识别效果,所述保单数据中包含多项不同项目信息数据,通过识别所述保单数据,从而能够同时得到多项项目信息数据。
S30、获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量。
本实施例中,当获取了所述保单数据包含的项目信息数据,获取所述项目信息数据对应的预配置的检测数据,不同的项目信息数据配置的检测数据不相同,例如对于A部分的项目信息数据,匹配的是A1的检测数据,对于B部分的项目信息数据,匹配的是B1的检测数据,所述检测数据基于深度学习算法得到,具体的,通过采集不同项目信息对应的历史数据,将所述历史数据与对应的时间建立关联,然后配置人工智能学习模型,以及对所述项目信息的历史数据进行深度学习训练,基于人工智能学习模型预测后一时间节点的项目信息的数据相对于前一时间节点的项目信息的数据的变化值,然后与历史数据中真实的变化值进行比较,从而对人工智能学习模型进行训练,使得训练后的人工智能学习模型能够基于现有的数据预测未来的数据,即对未来某一时间的保单数据中的项目信息数据进行预测,得到项目信息数据的基准值,将该基准值定义为检测数据,然后根据所述检测数据与所述项目信息数据计算数据偏移量。在一种实施方式中,计算所述检测数据与所述项目信息数据的百分比差异值作为所述数据偏移量,从而可以准确地计算出当前的保单数据中的项目信息数据与预配置的检测数据的差异值。
S40、若所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到。
本实施例中,在获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量之后,将所述数据偏移量与预设警告值进行比较,若所述数据偏移量不满足预设告警值的范围要求,确定所述项目信息数据为异常数据。在一种实施方式中,若所述数据偏移量小于所述预设告警值的最小值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据;或,所述数据偏移量大于所述预设告警值的最大值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据。其中,所述预设告警值的数值范围为基于历史数据统计项目信息数据的正常偏移量而得到,即通过统计历史数据中对应的项目信息数据的数值,然后将历史数据中的项目信息数据的数值进行归一化处理,再基于深度学习网络对所述项目信息数据的数值进行学习,得到项目信息数据的数值偏移范围,将其定义为项目信息数据的正常偏移量范围。
S50、获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
本实施例中,在确定所述项目信息数据为异常数据后,获取所述异常数据对应的关联项目信息,即获取所述异常项目数据对应的项目信息及其关联的项目信息,当一项项目信息数据为异常数据时,影响该项目信息数据的所有项目信息均作为该项目信息数据的关联项目信息,在一种实施方式中,首先获取所述异常数据的第一项目信息,再识别所述第一项目信息与其他项目信息的关联关系,根据所述关联关系确定所述第一项目信息的关联项目信息,然后根据所述关联项目信息与所述异常数据生成异常保单信息,不仅基于异常数据生成异常保单信息,还获取异常数据对应的关联项目信息生成异常保单信息,从而快速、全面地对保单数据进行检测,提高保单数据中不同项目信息的检测效率及检测准确率。
本实施例提供了一种保单数据进行多维度检测的方法,首先获取待检测的保单数据;所述待检测的保单数据包括记录保险产品上线、销售、售后支出等数字化数据,然后根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,准确地识别保单数据中的每一项信息,当获取了所述保单数据包含的项目信息数据后,获取所述项目信息数据对应的预配置的检测数据,不同的项目信息数据配置的检测数据不相同,然后根据所述检测数据与所述项目信息数据计算数据偏移量,即计算所述检测数据与所述项目信息数据的百分比差异值作为所述数据偏移量,从而可以准确地计算出当前的保单数据中的项目信息数据与预配置的检测数据的差异值,若所述数据偏移量小于所述预设告警值的最小值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据;或,所述数据偏移量大于所述预设告警值的最大值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据,在确定所述项目信息数据为异常数据后,获取所述异常项目数据的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息,不仅基于异常数据生成异常保单信息,还获取异常数据对应的关联项目信息生成异常保单信息,从而快速、全面地对保单数据进行检测,提高保单数据中不同项目信息的检测效率及检测准确率。
在一个实施例中,所述根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,包括:
根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
本实施例中,在根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据的过程中,先识别所述保单数据包含的项目信息,具体的,通过关键词匹配的方式,识别所述保单数据中与关键词相匹配的词语,将匹配得到的词语确定为对应的项目信息,再识别所述项目信息的内容范围,一般的,每一项项目信息的内容处于同一个内容范围中,通过识别得到的两个项目信息,便可确定前一个项目信息的内容范围,基于该方式确定每一项项目信息的内容范围,再根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,例如,针对项目信息A,只需要获取其中的项目信息数据A1,A2;针对项目信息B,只需要获取其中的项目信息数据B1,从而准确地识别出每一项项目信息包含的内容,以准确地对检测相应的项目信息数据,从而得到准确的项目信息数据,提高保单数据中异常项目信息数据识别的准确率。
在一个实施例中,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
本实施例中,在根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据的过程中,保单数据中不同部分的项目信息可能包含有不同的专属名词,为了准确地识别不同部分的项目信息中的项目信息数据,获取所述项目信息的先验知识数据,所述先验知识通过采集该项目信息对应类型下的单词库统计而得到,一种实施方式中,通过采集该项目信息对应的文本数据,对所述文本数据进行拆分,获得文本数据包含的语句和词汇,并对所述语句和词汇进行语义识别,同时去除无效的词汇如“的”,“了”,所述无效词汇为预收集的词汇,然后统计所述语句和词汇的出现概率,将出现概率满足预设值的目标语句和目标词汇作为该业务信息下的先验知识数据。然后将所述自然语言算法配置所述先验知识数据,得到先验知识的自然语言算法,再根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获得所述项目信息的项目信息数据,通过配置有对应专属名词的先验知识的自然语言算法,能够快速、准确地识别出所述内容范围内的内容信息,获取所述内容范围内所需的目标数据作为项目信息数据,从而提高项目信息数据的识别效率。
在一个实施例中,所述根据所述检测数据与所述项目信息数据计算数据偏移量,包括:
识别所述项目信息数据的类型;
根据所述类型从预设的配置文件中匹配计算规则,根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量。
本实施例中,在根据所述检测数据与所述项目信息数据计算数据偏移量时,不同项目信息数据的检测方式不同,反映为不同项目信息数据的数据偏移量的计算规则不同,具体的,识别所述项目信息数据的类型,具体的,获取所述项目信息,基于所述项目信息与分类类型进行映射,得到所述项目信息数据的类型,若所述项目信息数据为第一类型,然后根据所述类型从预设的配置文件中匹配计算规则,从而根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量,所述计算规则可以在多个维度下的配置不同。在一种实施方式中,所述计算规则的精度要求不同,由于精度要求不同,为一个项目信息数据配置一个计算规则,例如对项目信息数据A的数据偏移量的计算规则为(x+y)/x,项目信息数据B的数据偏移量的计算规则为(50%x+50%y)/x+y,从而为不同的项目信息数据配置符合预设要求的计算规则,准确地计算每一个不同的项目信息数据的数据偏移量,从而提高对不同项目信息的检测准确率。
在一个实施例中,所述根据所述类型从预设的配置文件中匹配计算规则,包括:
根据所述类型从预设的配置文件中匹配待选计算规则;
获取所述项目信息数据的检测执行时间,根据所述检测执行时间从所述待选计算规则中筛选对应时间的目标计算规则。
本实施例中,在根据所述类型从预设的配置文件中匹配计算规则的过程中,在保单数据检测中,对于同一个项目信息数据在不同时间阶段配置不同数据偏移量的计算规则,首先根据所述类型从预设的配置文件中匹配待选计算规则,筛选出若干个待选计算规则,然后获取所述项目信息数据的检测执行时间,再根据所述检测执行时间从所述待选计算规则中筛选对应时间的目标计算规则,从而准确地确定对应时间下的计算规则,例如对项目信息数据“保险产品价格”的初始售卖阶段,该项目信息数据的数据偏移量的计算规则为X1,对项目信息数据“保险产品价格”的中期售卖阶段,该项目信息数据的数据偏移量的计算规则为X2,从而准确地计算不同时间节点下的项目信息数据的偏移量,可以基于时间线呈现项目信息数据的数据偏移量的变化,提高项目信息数据的动态计算的效率。
在一个实施例中,所述根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量,包括:
获取所述计算规则的计算参数及检测参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述检测数据的数据值配置为所述检测参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
本实施例中,在根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量的过程中,获取所述计算规则的计算参数及检测参数,然后获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值,具体的,通过语义识别将项目信息数据中与所述计算参数相同语义的信息筛选出来,作为参数信息,然后获取所述参数信息包含的数据值作为所述计算参数对应的数据值,即将所述数据值配置为所述计算参数的第一参数值,然后将所述检测数据的数据值配置为所述检测参数的第二参数值,根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,即将各个第一参数值、所述第二参数值作为所述计算规则的输入,然后执行所述计算规则,得到所述项目信息数据的数据偏移量,从而提高数据偏移量的自动化计算效率。
在一个实施例中,所述根据所述关联项目信息与所述异常数据生成异常保单信息之后,还包括:
根据所述异常保单信息匹配异常解决措施;
将所述异常保单信息与所述异常解决措施关联,生成异常任务;
将所述异常任务上传至异常任务调度链,并向预设的异常解决部门发送异常任务通知,以依次从所述异常任务调度链获取并执行所述异常任务。
本实施例中,在根据所述关联项目信息与所述异常数据生成异常保单信息之后,根据所述异常保单信息匹配异常解决措施,由于筛选出了出现错误的异常信息数据,根据所述异常信息数据便可匹配对应的异常解决措施,然后将所述异常保单信息与所述异常解决措施关联,生成异常任务,并将所述异常任务上传至异常任务调度链,在一种实施方式中,所述异常任务调度链为区块链链路,即将每一项异常任务配置为一个区块,然后将区块接入区块链,完成异常任务的上链,通过将异常任务上链可以对异常任务的解决过程进行追溯,并向预设的异常解决部门发送异常任务通知,以依次从所述异常任务调度链获取并执行所述异常任务,从而提高异常任务有序解决的效率。
参照图2,本申请还提供一种保单数据的检测装置,包括:
数据获取模块10,用于获取待检测的保单数据;
项目识别模块20,用于根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;
偏移计算模块30,用于获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;
异常检测模块40,用于若判定所述数据偏移量不满足预设告警值的范围要求,确定所述项目信息数据为异常数据;所述预设告警值的范围基于历史数据统计而得到的项目信息数据的正常偏移量范围;
异常生成模块50,用于获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
如上所述,可以理解地,本申请中提出的所述保单数据的检测装置的各组成部分可以实现如上所述保单数据的检测方法任一项的功能。
在一个实施例中,所述根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,包括:
根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
在一个实施例中,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
在一个实施例中,所述根据所述检测数据与所述项目信息数据计算数据偏移量,包括:
识别所述项目信息数据的类型;
根据所述类型从预设的配置文件中匹配计算规则,根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量。
在一个实施例中,所述根据所述类型从预设的配置文件中匹配计算规则,包括:
根据所述类型从预设的配置文件中匹配待选计算规则;
获取所述项目信息数据的检测执行时间,根据所述检测执行时间从所述待选计算规则中筛选对应时间的目标计算规则。
在一个实施例中,所述根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量,包括:
获取所述计算规则的计算参数及检测参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述检测数据的数据值配置为所述检测参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
在一个实施例中,所述根据所述关联项目信息与所述异常数据生成异常保单信息之后,还包括:
根据所述异常保单信息匹配异常解决措施;
将所述异常保单信息与所述异常解决措施关联,生成异常任务;
将所述异常任务上传至异常任务调度链,并向预设的异常解决部门发送异常任务通知,以依次从所述异常任务调度链获取并执行所述异常任务。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是移动终端,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和显示装置及输入装置。其中,该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的输入装置用于接收用户的输入。该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质。该存储介质存储有操作系统、计算机程序和数据库。该计算机设备的数据库用于存放数据。该计算机程序被处理器执行时以实现一种保单数据的检测方法。
上述处理器执行上述的保单数据的检测方法,包括:获取待检测的保单数据;根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;若所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到;获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
所述计算机设备提供了一种保单数据进行多维度检测的方法,首先获取待检测的保单数据;所述待检测的保单数据包括记录保险产品上线、销售、售后支出等数字化数据,然后根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,准确地识别保单数据中的每一项信息,当获取了所述保单数据包含的项目信息数据后,获取所述项目信息数据对应的预配置的检测数据,不同的项目信息数据配置的检测数据不相同,然后根据所述检测数据与所述项目信息数据计算数据偏移量,即计算所述检测数据与所述项目信息数据的百分比差异值作为所述数据偏移量,从而可以准确地计算出当前的保单数据中的项目信息数据与预配置的检测数据的差异值,若所述数据偏移量小于所述预设告警值的最小值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据;或,所述数据偏移量大于所述预设告警值的最大值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据,在确定所述项目信息数据为异常数据后,获取所述异常项目数据的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息,不仅基于异常数据生成异常保单信息,还获取异常数据对应的关联项目信息生成异常保单信息,从而快速、全面地对保单数据进行检测,提高保单数据中不同项目信息的检测效率及检测准确率。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时实现一种保单数据的检测方法,包括步骤:获取待检测的保单数据;根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;若所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到;获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
所述计算机可读存储介质提供了一种保单数据进行多维度检测的方法,首先获取待检测的保单数据;所述待检测的保单数据包括记录保险产品上线、销售、售后支出等数字化数据,然后根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,准确地识别保单数据中的每一项信息,当获取了所述保单数据包含的项目信息数据后,获取所述项目信息数据对应的预配置的检测数据,不同的项目信息数据配置的检测数据不相同,然后根据所述检测数据与所述项目信息数据计算数据偏移量,即计算所述检测数据与所述项目信息数据的百分比差异值作为所述数据偏移量,从而可以准确地计算出当前的保单数据中的项目信息数据与预配置的检测数据的差异值,若所述数据偏移量小于所述预设告警值的最小值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据;或,所述数据偏移量大于所述预设告警值的最大值,且所述数据偏移量与所述预设告警值的绝对差值大于第一数值,将所述项目信息数据确定为异常数据,在确定所述项目信息数据为异常数据后,获取所述异常项目数据的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息,不仅基于异常数据生成异常保单信息,还获取异常数据对应的关联项目信息生成异常保单信息,从而快速、全面地对保单数据进行检测,提高保单数据中不同项目信息的检测效率及检测准确率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。
非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围。
凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种保单数据的检测方法,其特征在于,包括:
获取待检测的保单数据;
根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;
获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;
若所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到;
获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
2.根据权利要求1所述的保单数据的检测方法,其特征在于,所述根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据,包括:
根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
3.根据权利要求2所述的保单数据的检测方法,其特征在于,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
4.根据权利要求1所述的保单数据的检测方法,其特征在于,所述根据所述检测数据与所述项目信息数据计算数据偏移量,包括:
识别所述项目信息数据的类型;
根据所述类型从预设的配置文件中匹配计算规则,根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量。
5.根据权利要求4所述的保单数据的检测方法,其特征在于,所述根据所述类型从预设的配置文件中匹配计算规则,包括:
根据所述类型从预设的配置文件中匹配待选计算规则;
获取所述项目信息数据的检测执行时间,根据所述检测执行时间从所述待选计算规则中筛选对应时间的目标计算规则。
6.根据权利要4所述的保单数据的检测方法,其特征在于,所述根据所述检测数据与所述项目信息数据基于所述计算规则计算数据偏移量,包括:
获取所述计算规则的计算参数及检测参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述检测数据的数据值配置为所述检测参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
7.根据权利要求1所述的保单数据的检测方法,其特征在于,所述根据所述关联项目信息与所述异常数据生成异常保单信息之后,还包括:
根据所述异常保单信息匹配异常解决措施;
将所述异常保单信息与所述异常解决措施关联,生成异常任务;
将所述异常任务上传至异常任务调度链,并向预设的异常解决部门发送异常任务通知,以依次从所述异常任务调度链获取并执行所述异常任务。
8.一种保单数据的检测装置,其特征在于,包括:
数据获取模块,用于获取待检测的保单数据;
项目识别模块,用于根据自然语言算法识别所述保单数据,获取所述保单数据包含的项目信息数据;
偏移计算模块,用于获取所述项目信息数据对应的预配置的检测数据,根据所述检测数据与所述项目信息数据计算数据偏移量;
异常检测模块,用于若判定所述数据偏移量不满足预设告警值的范围要求,则确定所述项目信息数据为异常数据;其中,所述预设告警值的范围基于历史数据统计项目信息数据的正常偏移量范围而得到;
异常生成模块,用于获取所述异常数据对应的关联项目信息,根据所述关联项目信息与所述异常数据生成异常保单信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述保单数据的检测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述保单数据的检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111266332.0A CN113947076A (zh) | 2021-10-28 | 2021-10-28 | 保单数据的检测方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111266332.0A CN113947076A (zh) | 2021-10-28 | 2021-10-28 | 保单数据的检测方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113947076A true CN113947076A (zh) | 2022-01-18 |
Family
ID=79337302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111266332.0A Pending CN113947076A (zh) | 2021-10-28 | 2021-10-28 | 保单数据的检测方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113947076A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114399382A (zh) * | 2022-01-21 | 2022-04-26 | 平安科技(深圳)有限公司 | 用户欺诈风险的检测方法、装置、计算机设备及存储介质 |
CN117473048A (zh) * | 2023-12-28 | 2024-01-30 | 长春职业技术学院 | 基于数据挖掘的财务异常数据监测分析系统及方法 |
-
2021
- 2021-10-28 CN CN202111266332.0A patent/CN113947076A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114399382A (zh) * | 2022-01-21 | 2022-04-26 | 平安科技(深圳)有限公司 | 用户欺诈风险的检测方法、装置、计算机设备及存储介质 |
CN117473048A (zh) * | 2023-12-28 | 2024-01-30 | 长春职业技术学院 | 基于数据挖掘的财务异常数据监测分析系统及方法 |
CN117473048B (zh) * | 2023-12-28 | 2024-03-01 | 长春职业技术学院 | 基于数据挖掘的财务异常数据监测分析系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI723528B (zh) | 電腦執行的事件風險評估方法及裝置、電腦可讀儲存媒體以及計算設備 | |
CN109598095B (zh) | 评分卡模型的建立方法、装置、计算机设备和存储介质 | |
CN111177714B (zh) | 异常行为检测方法、装置、计算机设备和存储介质 | |
US8453027B2 (en) | Similarity detection for error reports | |
AU2019268056A1 (en) | Artificial intelligence and machine learning based incident management | |
CN113947076A (zh) | 保单数据的检测方法、装置、计算机设备及存储介质 | |
CN114116397A (zh) | 一种监控指标的预警归因方法、装置、设备及存储介质 | |
CN113626241B (zh) | 应用程序的异常处理方法、装置、设备及存储介质 | |
CN111045894A (zh) | 数据库异常检测方法、装置、计算机设备和存储介质 | |
Behera et al. | Machine learning approach for reliability assessment of open source software | |
CN115204536A (zh) | 楼宇设备故障预测方法、装置、设备及存储介质 | |
CN110689211A (zh) | 网站服务能力的评估方法及装置 | |
CN114491282B (zh) | 一种基于云计算的异常用户行为分析方法及系统 | |
Nowak et al. | Machine learning algorithms for conversion of CVSS base score from 2.0 to 3. x | |
EP3828731A1 (en) | A method and analytical engine for a semantic analysis of textual data | |
CN112990989B (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
US9443214B2 (en) | News mining for enterprise resource planning | |
CN117196322A (zh) | 智能风控方法、装置、计算机设备及存储介质 | |
US20200143225A1 (en) | System and method for creating reports based on crowdsourced information | |
CN111783883A (zh) | 一种异常数据的检测方法及装置 | |
CN113535458B (zh) | 异常误报的处理方法及装置、存储介质、终端 | |
CN113822684B (zh) | 黑产用户识别模型训练方法、装置、电子设备及存储介质 | |
CN115688759A (zh) | 上报信息归类方法、系统、计算机设备及介质 | |
EP3308296A1 (en) | A method and system for locating regulatory information | |
CN111754103A (zh) | 企业风险画像方法、装置、计算机设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |