发明内容
本发明提供应用于智慧风控任务分析的大数据挖掘方法及服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种应用于智慧风控任务分析的大数据挖掘方法,应用于大数据AI风控分析服务器,所述方法包括:
对待处理风控任务文本进行文本向量挖掘,获得基础风控任务文本向量;
对所述基础风控任务文本向量进行细节表征优化操作,获得第一风控任务文本向量;
依据所述第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,得到用于突显所述目标任务事件段落的基础段落解析窗口;
对所述基础风控任务文本向量和所述第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,获得第二风控任务文本向量;
依据所述第二风控任务文本向量和所述基础段落解析窗口进行关于所述目标任务事件段落的第二阶段解析操作,以修正所述基础段落解析窗口,并依据修正后的段落解析窗口确定出所述待处理风控任务文本中的所述目标任务事件段落。
在一些优选的实施例中,所述对待处理风控任务文本进行文本向量挖掘,获得基础风控任务文本向量,包括:
通过NLP算法的文本向量挖掘子网,对所述待处理风控任务文本进行若干个设定维度的文本向量挖掘,得到各所述设定维度对应的文本向量分布;
通过所述NLP算法的第一滑动平均子网,对所述文本向量分布进行细节表征优化操作,获得基础风控任务文本向量。
在一些优选的实施例中,所述对所述基础风控任务文本向量进行细节表征优化操作,获得第一风控任务文本向量,包括:
通过NLP算法的第一情感描述挖掘子网,依据设定覆盖变量对所述基础风控任务文本向量进行情感描述向量挖掘,得到所述基础风控任务文本向量的关联情感描述数据;
通过所述NLP算法的第二滑动平均子网,对所述关联情感描述数据进行细节表征优化操作,获得所述第一风控任务文本向量。
在一些优选的实施例中,所述依据所述第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,得到用于突显所述目标任务事件段落的基础段落解析窗口,包括:
通过NLP算法的第一段落解析子网,依据所述第一风控任务文本向量估测所述待处理风控任务文本中关于待处理任务事件段落的段落解析窗口;
对所述待处理任务事件段落的段落解析窗口进行判别,得到用于突显所述目标任务事件段落的基础段落解析窗口。
在一些优选的实施例中,所述对所述基础风控任务文本向量和所述第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,获得第二风控任务文本向量,包括:
将所述基础风控任务文本向量和所述第一风控任务文本向量加载到NLP算法的第二情感描述挖掘子网;
依据所述基础风控任务文本向量和所述第一风控任务文本向量修正所述第二情感描述挖掘子网的覆盖变量,得到修正后的覆盖变量;
对所述基础风控任务文本向量和所述第一风控任务文本向量进行文本向量融合,得到完成融合的风控任务文本向量;
依据所述修正后的覆盖变量,对所述完成融合的风控任务文本向量进行情感描述向量挖掘,得到所述完成融合的风控任务文本向量对应的关联情感描述数据;
通过所述NLP算法的第三滑动平均子网,对所述关联情感描述数据进行细节表征优化操作,得到第二风控任务文本向量。
在一些优选的实施例中,所述基础段落解析窗口包括至少一个段落解析窗口;
在所述依据所述第二风控任务文本向量和所述基础段落解析窗口进行关于所述目标任务事件段落的第二阶段解析操作之前,还包括:获取所述基础段落解析窗口中各段落解析窗口对应的解析权重;
对所述解析权重未达到设定解析权重的段落解析窗口进行清洗,得到清洗后的段落解析窗口;依据所述清洗后的段落解析窗口的捕捉标签和所述第一风控任务文本向量对应的捕捉标签,对所述清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口;
所述依据所述第二风控任务文本向量和所述基础段落解析窗口进行关于所述目标任务事件段落的第二阶段解析操作,以修正所述基础段落解析窗口,并依据修正后的段落解析窗口确定出所述待处理风控任务文本中的所述目标任务事件段落,包括:依据所述第二风控任务文本向量和所述挑选后的段落解析窗口进行关于所述目标任务事件段落的第二阶段解析操作,以修正所述挑选后的段落解析窗口,并依据修正后的段落解析窗口确定出所述待处理风控任务文本中的所述目标任务事件段落。
在一些优选的实施例中,所述第一风控任务文本向量对应第一文本向量分布;所述依据所述清洗后的段落解析窗口的捕捉标签和所述第一风控任务文本向量对应的捕捉标签,对所述清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口,包括:
获取所述清洗后的段落解析窗口的窗口参考信息在所述第一文本向量分布中的迁移捕捉标签;
依据所述迁移捕捉标签对所述清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口。
在一些优选的实施例中,所述依据所述迁移捕捉标签对所述清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口,包括:
当若干个段落解析窗口的窗口参考信息在相同第一文本向量分布的迁移捕捉标签一致时,从所述若干个段落解析窗口中选择其中一个段落解析窗口;
依据不具有一致迁移捕捉标签的段落解析窗口以及选择的所述段落解析窗口,得到挑选后的段落解析窗口。
在一些优选的实施例中,所述依据所述第二风控任务文本向量和所述基础段落解析窗口进行关于所述目标任务事件段落的第二阶段解析操作,以修正所述基础段落解析窗口,并依据修正后的段落解析窗口确定出所述待处理风控任务文本中的所述目标任务事件段落,包括:
通过NLP算法的第二段落解析子网,依据所述第二风控任务文本向量从所述基础段落解析窗口中选择段落解析窗口;
依据选择的所述段落解析窗口进行关于所述目标任务事件段落的估测修正,得到修正后的段落解析窗口,并依据所述修正后的段落解析窗口确定出所述待处理风控任务文本中的所述目标任务事件段落。
在一些优选的实施例中,所述第二风控任务文本向量对应第二文本向量分布;所述依据所述第二风控任务文本向量从所述基础段落解析窗口中选择段落解析窗口,包括:
获取所述基础段落解析窗口的捕捉标签在所述第二文本向量分布中的迁移捕捉标签;
当若干个基础段落解析窗口的捕捉标签在相同第二文本向量分布中的迁移捕捉标签一致时,获取各个基础段落解析窗口的解析权重;
依据所述解析权重从所述基础段落解析窗口中选择最优解析权重对应的段落解析窗口,得到选择的段落解析窗口。
在一些优选的实施例中,所述应用于智慧风控任务分析的大数据挖掘方法是基于NLP算法实现的;所述NLP算法通过调试步骤调试获得,所述调试步骤包括:
获取风控任务文本示例和调试注释;所述调试注释是所述风控任务文本示例中关于目标任务事件段落示例的注释知识;
基于所述风控任务文本示例和所述调试注释对待调试的NLP算法进行调试,当达到调试要求时完成调试,得到调试好的NLP算法。
在一些优选的实施例中,所述基于所述风控任务文本示例和所述调试注释对待调试的NLP算法进行调试,当达到调试要求时完成调试,得到调试好的NLP算法,包括:
将所述风控任务文本示例输入待调试的NLP算法,提取所述风控任务文本示例的基础风控任务文本向量示例;
通过所述NLP算法的第一情感描述挖掘子网,对所述基础风控任务文本向量示例进行细节表征优化操作,获得第一风控任务文本向量示例;
通过所述NLP算法的第一段落解析子网,依据所述第一风控任务文本向量示例进行关于目标任务事件段落示例的第一阶段解析操作,得到基础段落解析窗口示例;
通过所述NLP算法的第二情感描述挖掘子网,对所述基础风控任务文本向量示例和所述第一风控任务文本向量示例进行文本向量融合,并对完成融合的风控任务文本向量示例进行细节表征优化操作,获得第二风控任务文本向量示例;
通过所述NLP算法的第二段落解析子网,依据所述第二风控任务文本向量示例和所述基础段落解析窗口示例进行关于所述目标任务事件段落示例的第二阶段解析操作,得到关于目标任务事件段落示例的估测结果示例;
基于所述估测结果示例与所述调试注释的区别,修正所述NLP算法的算法参量,并反复调试,直到达到调试要求时完成调试。
第二方面是一种大数据AI风控分析服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述大数据AI风控分析服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
应用本发明实施例提供的技术方案,通过对待处理风控任务文本进行文本向量挖掘,获得基础风控任务文本向量后,对基础风控任务文本向量进行细节表征优化操作,这样可以得到内容输出质量更佳的第一风控任务文本向量。通过依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,从而可得到用于突显目标任务事件段落的基础段落解析窗口。通过对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,这样可以得到强化了文本细节后的第二风控任务文本向量。依据第二风控任务文本向量和基础段落解析窗口进行关于目标任务事件段落的第二阶段解析操作以修正基础段落解析窗口,这样可以尽可能准确地校对关于目标任务事件段落的捕捉结果,使得修正后的段落解析窗口尽可能匹配真实目标任务事件段落的位置,以便精准可靠地确定出待处理风控任务文本中关于目标任务事件段落的段落解析窗口,提升针对目标任务事件段落的识别准确性和可靠性。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的应用于智慧风控任务分析的大数据挖掘方法的流程示意图,应用于智慧风控任务分析的大数据挖掘方法可以通过大数据AI风控分析服务器实现,大数据AI风控分析服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述大数据AI风控分析服务器执行S202-S210。
步骤202,对待处理风控任务文本进行文本向量挖掘,获得基础风控任务文本向量。
在本发明实施例中,待处理风控任务文本可以是针对电子商务业务的风控处理记录,也可以是针对政企业务的安全风控模拟记录,还可以是针对企业信息的风控策略运行日志等,在此不作限定。
进一步地,文本向量挖掘用于对待处理风控任务文本进行文本特征的提取,基础风控任务文本向量是从待处理风控任务文本中挖掘的初始的风控任务文本向量。比如,风控任务文本向量可以包括风控任务文本的情感极性向量、上下文逻辑向量、内容向量和风控任务场景向量等。
比如,大数据AI风控分析服务器可以通过AI算法对待处理风控任务文本进行文本向量挖掘,比如通过多轮滑动平均操作得到相应维度的一个或若干个文本向量分布,并基于文本向量分布进一步提取风控任务文本向量。因此,文本向量分布可以理解为文本向量图或者文本特征图。
示例性地,大数据AI风控分析服务器获取待处理风控任务文本后,对待处理风控任务文本进行文本向量挖掘,依据设定维度算法参量提取若干个维度对应的文本向量分布,从而能够得到待处理风控任务文本对应的风控任务文本向量。比如可以通过残差模型提取风控任务文本向量,获得携带文本内容细节和高特征识别度的文本向量分布。大数据AI风控分析服务器还可以进一步对提取的文本向量分布进行细节表征优化操作,从而得到待处理风控任务文本对应的基础风控任务文本向量。
步骤204,对基础风控任务文本向量进行细节表征优化操作,获得第一风控任务文本向量。
在本发明实施例中,细节表征优化是对风控任务文本向量的进一步挖掘,包括但不限于噪声清洗、特征补全、特征归一化等。第一风控任务文本向量是指对得到的基础风控任务文本向量进行细节表征优化操作后,进一步得到的待处理风控任务文本对应的风控任务文本向量。
大数据AI风控分析服务器提取出待处理风控任务文本的基础风控任务文本向量后,然后对基础风控任务文本向量进行细节表征优化操作,通过细节表征优化操作能够进一步提取待处理风控任务文本的文本内容表征,从而有效获得内容输出质量更佳的第一风控任务文本向量。
步骤206,依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,得到用于突显目标任务事件段落的基础段落解析窗口。
在本发明实施例中,段落解析窗口是指关于目标任务事件段落进行事件捕捉的可视化单元,即关于目标任务事件段落所估测的高亮窗口。事件捕捉可以通过设定形状来突显目标任务事件段落所处的捕捉标签区域(可以理解为目标任务事件段落所处的位置)。基础段落解析窗口可以包括对目标任务事件段落的捕捉标签估测结果,即通过第一阶段基础解析操作,估测出的待处理风控任务文本中目标任务事件段落所处的捕捉标签区域。
可以理解,待处理风控任务文本中目标任务事件段落对应的基础段落解析窗口可以为若干个。当基础段落解析窗口为若干个时,则表明第一阶段估测输出的是若干个可能存在目标任务事件段落的捕捉标签区域。
在另外的实施例中,待处理风控任务文本中目标任务事件段落对应的基础段落解析窗口也可以一个,比如可从估测的若干个可能存在目标任务事件段落的段落解析窗口中,选择目标任务事件段落种类可能性选择最可能是目标任务事件段落的段落解析窗口,作为基础段落解析窗口。
可以理解,本发明实施例中的应用于智慧风控任务分析的大数据挖掘方法中包括两个阶段的解析操作,第一阶段解析操作即在第一环节关于目标任务事件段落的第一次解析操作。第二阶段解析操作即在第二环节关于目标任务事件段落的第二次解析操作。其中,解析操作可以理解为预测处理或者估测处理。
大数据AI风控分析服务器依据第一风控任务文本向量进行第一阶段解析操作时,依据第一风控任务文本向量对待处理风控任务文本中的任务事件文本集进行分析,并判别所捕捉的任务事件文本集是否为目标任务事件段落。若识别到所捕捉的位置为目标任务事件段落的捕捉结果,则依据所识别的捕捉结果生成相应的识别窗口。大数据AI风控分析服务器进而依据估测生成的识别窗口得到用于突显目标任务事件段落的基础段落解析窗口。
此外,大数据AI风控分析服务器还可以通过预调试的第一事件识别模块,依据第一风控任务文本向量进行第一阶段估测,得到基础段落解析窗口。
步骤208,对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,获得第二风控任务文本向量。
在提取出待处理风控任务文本对应的基础风控任务文本向量,以及依据文本向量挖掘得到第一风控任务文本向量后,大数据AI风控分析服务器还进一步将基础风控任务文本向量和第一风控任务文本向量进行结合,对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,以得到对完成融合的风控任务文本向量。大数据AI风控分析服务器进一步对完成融合的风控任务文本向量进行进一步的文本向量挖掘和细节表征优化操作,以获得丰富性和完整性更佳的风控任务文本向量。
示例性地,大数据AI风控分析服务器将基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,完成融合的风控任务文本向量携带了若干个维度的关联特征。通过对完成融合的风控任务文本向量进行情感描述向量挖掘,以捕捉基础风控任务文本向量和第一风控任务文本向量的关联特征,并进一步对关联特征进行细节表征优化操作,从而能够获得特征强化后的第二风控任务文本向量。
步骤210,依据第二风控任务文本向量和基础段落解析窗口进行关于目标任务事件段落的第二阶段解析操作,以修正基础段落解析窗口,并依据修正后的段落解析窗口确定出待处理风控任务文本中的目标任务事件段落。
进一步地,修正基础段落解析窗口是指通过进行关于目标任务事件段落的第二阶段解析操作,对第一阶段估测的基础段落解析窗口进行估测修正,以估测得到尽可能准确的关于目标任务事件段落的段落解析窗口。
大数据AI风控分析服务器获得第二风控任务文本向量和基础段落解析窗口后,首先依据第二风控任务文本向量对基础段落解析窗口进行挑选,然后依据第二风控任务文本向量和所选择的段落解析窗口进行第二阶段估测,在第二环节解析操作的过程中,大数据AI风控分析服务器可以在所选择的基础段落解析窗口的基础上,进行估测修正,以对基础段落解析窗口进行修正,从而得到修正后的段落解析窗口。
通过依据第二风控任务文本向量和基础段落解析窗口进行第二阶段解析操作,能够尽可能准确地校对关于目标任务事件段落的捕捉结果,以便精准可靠地确定出待处理风控任务文本中关于目标任务事件段落的段落解析窗口。大数据AI风控分析服务器通过第二阶段解析操作得到修正后的段落解析窗口,这样可以直接依据修正后的段落解析窗口确定出待处理风控任务文本中的目标任务事件段落。因此,本发明实施例中的应用于智慧风控任务分析的大数据挖掘方法还能够准确可靠地捕捉得到维度较小的目标任务事件段落。
可见,通过对待处理风控任务文本进行文本向量挖掘,获得基础风控任务文本向量后,对基础风控任务文本向量进行细节表征优化操作,这样可以得到内容输出质量更佳的第一风控任务文本向量。通过依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,从而可得到用于突显目标任务事件段落的基础段落解析窗口。通过对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,这样可以得到强化了文本细节后的第二风控任务文本向量。依据第二风控任务文本向量和基础段落解析窗口进行第二阶段解析操作以修正基础段落解析窗口,这样可以尽可能准确地校对关于目标任务事件段落的捕捉结果,使得修正后的段落解析窗口尽可能匹配真实目标任务事件段落的位置,以便精准可靠地确定出待处理风控任务文本中关于目标任务事件段落的段落解析窗口,提升针对目标任务事件段落的识别准确性和可靠性。
在一些示例性设计思路下,对待处理风控任务文本进行文本向量挖掘,获得基础风控任务文本向量,包括:通过NLP算法的文本向量挖掘子网,对待处理风控任务文本进行若干个设定维度的文本向量挖掘,得到各设定维度对应的文本向量分布;通过NLP算法的第一滑动平均子网,对文本向量分布进行细节表征优化操作,获得基础风控任务文本向量。
在本发明实施例中,NLP算法是预调试的AI算法模型,NLP算法可以为级联算法,NLP算法通常可以选用能够进行文本处理的自然语言处理模型,示例性包括文本向量挖掘子网以及多层的滑动平均子网。文本向量挖掘子网用于提取待处理风控任务文本对应的若干个设定维度的文本向量分布。比如,文本向量挖掘子网可以是金字塔模型。
示例性地,大数据AI风控分析服务器获取待处理风控任务文本后,将待处理风控任务文本加载到预调试的NLP算法。首先通过NLP算法的文本向量挖掘子网对待处理风控任务文本进行文本向量挖掘,从而能够获得待处理风控任务文本对应的若干个设定维度的文本向量分布。
大数据AI风控分析服务器进一步通过NLP算法的第一滑动平均子网,对提取的各个文本向量分布进行细节表征优化操作,通过第一滑动平均子网来强化每个维度文本向量分布的文本内容细节,得到基础风控任务文本向量,从而得到在所有维度都具有高文本内容细节的一组高特征识别度文本向量分布,基于这些文本向量分布进行目标任务事件段落估测能够显著提高目标任务事件段落的捕捉准确性。
本发明实施例中,通过NLP算法的文本向量挖掘子网对待处理风控任务文本进行文本向量挖掘,能够有效地提取出若干个设定维度的文本向量分布。进一步对提取的文本向量分布进行细节表征优化操作,从而能够获取较高文本内容细节的特征,这样可以进一步尽可能准确地对风控任务文本中的目标任务事件段落进行捕捉。
在一些示例性设计思路下,对基础风控任务文本向量进行细节表征优化操作,获得第一风控任务文本向量,包括:通过NLP算法的第一情感描述挖掘子网,依据设定覆盖变量对基础风控任务文本向量进行情感描述向量挖掘,得到基础风控任务文本向量的关联情感描述数据;通过NLP算法的第二滑动平均子网,对关联情感描述数据进行细节表征优化操作,获得第一风控任务文本向量。
其中,关联情感描述数据是指待处理风控任务文本的上下文情感特征。示例性地,大数据AI风控分析服务器通过对待处理风控任务文本进行文本向量挖掘,获得待处理风控任务文本的第一风控任务文本向量后,进一步将获得的基础风控任务文本向量加载到NLP算法所包括的第一情感描述挖掘子网。第一情感描述挖掘子网中包括若干个不同的算法分支,能够有效地关于不同维度的文本向量分布进行文本向量挖掘。这些分支的滑动平均算子具有不同的覆盖变量(感受野),各个滑动平均分支的覆盖变量可以是依据各个不同维度设定的,从而可以基于这些覆盖变量从不同维度提取文本向量分布的关联特征。最后将不同分支提取的特征通过文本向量融合的思路进行组合,由此完成融合的风控任务文本向量携带了若干个维度的关联特征,从而有助于尽可能准确地对维度较小的目标任务事件段落进行捕捉。
通过NLP算法的第一情感描述挖掘子网获得基础风控任务文本向量的关联情感描述数据后,大数据AI风控分析服务器进一步将得到的关联情感描述数据加载到NLP算法的第二滑动平均子网,通过第二滑动平均子网进一步强化每个维度文本向量分布的文本内容细节,从而能够得到细节表征优化后的第一风控任务文本向量。
本发明实施例中,通过预调试的NLP算法的第一情感描述挖掘子网对基础风控任务文本向量进行情感描述向量挖掘,能够尽可能准确地捕捉不同维度文本向量分布对应的关联情感描述数据。并进一步通过NLP算法的第二滑动平均子网依据关联情感描述数据进行细节表征优化操作,从而能够有效地获得丰富度和完整性更佳的第一风控任务文本向量。其中,高阶的文本内容细节可以实现目标任务事件段落和非目标任务事件段落的区分,低阶的文本内容细节可以用于准确确定目标任务事件段落的分布情况。以第一风控任务文本向量为基础进行识别窗口的估测,能够有助于提高目标任务事件段落的捕捉精度。
在一些示例性设计思路下,依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,得到用于突显目标任务事件段落的基础段落解析窗口,包括:通过NLP算法的第一段落解析子网,依据第一风控任务文本向量估测待处理风控任务文本中关于待处理任务事件段落的段落解析窗口;对待处理任务事件段落的段落解析窗口进行判别,得到用于突显目标任务事件段落的段落解析窗口。
其中,NLP算法是预调试好的Transformer模型。NLP算法中包括第一段落解析子网,第一段落解析子网还可以包括预调试的第一事件识别模块,用于对待处理风控任务文本中的目标任务事件段落的识别窗口进行估测。
大数据AI风控分析服务器依据第一风控任务文本向量进行第一阶段解析操作时,可通过NLP算法所包括的第一段落解析子网对待处理风控任务文本中的目标任务事件段落进行第一阶段估测,以获得关于目标任务事件段落捕捉的基础段落解析窗口。
示例性地,大数据AI风控分析服务器提取出待处理风控任务文本的基础风控任务文本向量,并对基础风控任务文本向量进行细节表征优化操作,得到第一风控任务文本向量后。大数据AI风控分析服务器将第一风控任务文本向量加载到NLP算法所包括的第一段落解析子网,进而通过第一段落解析子网包括的第一事件识别模块依据第一风控任务文本向量进行,在不同深度上进行不同维度的段落定位,以依据设定维度的设定的窗口对待处理风控任务文本中的待处理任务事件段落进行捕捉,并生成关于待处理任务事件段落的段落解析窗口。然后,第一事件识别模块则基于设定的窗口进行目标任务事件段落分析,以对所生成的待处理任务事件段落的段落解析窗口进行判别,从而获得关于目标任务事件段落的段落解析窗口,并利用第一事件识别模块估测得到的段落解析窗口,生成用于突显目标任务事件段落的基础段落解析窗口。
本发明实施例中,通过NLP算法所包括的第一段落解析子网,对待处理风控任务文本中的目标任务事件段落进行估测,能够有效地获得关于目标任务事件段落的基础段落解析窗口。由于第一段落解析子网是基于多次文本向量挖掘和细节表征优化操作得到的第一风控任务文本向量进行估测的,这样可以高效且尽可能精准地估测出待处理风控任务文本中的目标任务事件段落。
在一些示例性设计思路下,对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,获得第二风控任务文本向量,包括:将基础风控任务文本向量和第一风控任务文本向量加载到NLP算法的第二情感描述挖掘子网;依据基础风控任务文本向量和第一风控任务文本向量修正第二情感描述挖掘子网的覆盖变量,得到修正后的覆盖变量;对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,得到完成融合的风控任务文本向量;依据修正后的覆盖变量,对完成融合的风控任务文本向量进行情感描述向量挖掘,得到完成融合的风控任务文本向量对应的关联情感描述数据;通过NLP算法的第三滑动平均子网,对关联情感描述数据进行细节表征优化操作,得到第二风控任务文本向量。
其中,NLP算法包括第一情感描述挖掘子网和第二情感描述挖掘子网,以及第一滑动平均子网、第二滑动平均子网和第三滑动平均子网。第二情感描述挖掘子网是用于对风控任务文本向量进行进一步隐含特征挖掘和细节表征优化的模型。比如,第一情感描述挖掘子网和第二情感描述挖掘子网均可以为循环神经网络。
示例性地,大数据AI风控分析服务器通过对待处理风控任务文本进行文本向量挖掘,获得待处理风控任务文本的基础风控任务文本向量后,通过第一情感描述挖掘子网对基础风控任务文本向量,进行关于若干个设定维度的文本向量分布的文本向量挖掘,可以尽可能完整准确的得到完成特征强化的第一风控任务文本向量。
大数据AI风控分析服务器获得待处理风控任务文本对应的基础风控任务文本向量和第一风控任务文本向量后,进一步将基础风控任务文本向量和第一风控任务文本向量加载到NLP算法所包括的第二情感描述挖掘子网。由于第二情感描述挖掘子网是基于可调滑动平均(可变卷积)的模型,因此可以依据传入信息自动修正第二情感描述挖掘子网的覆盖变量,并得到修正后发覆盖变量,从而能够依据所输入的基础风控任务文本向量和第一风控任务文本向量智能化地修正覆盖变量。
进一步地,第二情感描述挖掘子网中包括多层的滑动平均子网,将基础风控任务文本向量和第一风控任务文本向量输入第二情感描述挖掘子网后,将基础风控任务文本向量和第一风控任务文本向量在每一层滑动平均子网上进行组合,同时智能化地修正网络层的覆盖变量。第二情感描述挖掘子网然后依据修正后的覆盖变量和完成融合的风控任务文本向量进行情感描述向量挖掘,获得完成融合的风控任务文本向量对应的关联情感描述数据,从而对完成融合的风控任务文本向量进行关联特征强化。
通过第二情感描述挖掘子网输出完成融合的风控任务文本向量对应的关联情感描述数据后,然后将所提取的关联情感描述数据加载到NLP算法的第三滑动平均子网,由于第三滑动平均子网的传入信息是经过多次细节表征优化和情感描述挖掘的特征,通过第三滑动平均子网再次对传入信息进行细节表征优化,获得第二风控任务文本向量。从而能够尽可能准确地获得具有高阶的文本内容细节和低阶的文本内容细节的风控任务文本向量,进而基于这些强化向量进行目标任务事件段落估测,以便显著提升目标任务事件段落的捕捉精度。
本发明实施例中,通过NLP算法对待处理风控任务文本进行多阶的情感描述向量挖掘和细节表征优化操作,可以精准地挖掘得到隐含文本内容表征和关于风控任务文本中任务事件段落的多维度文本细节,从而能够有助于尽可能准确地估测出待处理风控任务文本中的目标任务事件段落。
在一些示例性设计思路下,基础段落解析窗口包括至少一个段落解析窗口。则另一种应用于智慧风控任务分析的大数据挖掘方法,示例性包括以下步骤。
步骤502,对待处理风控任务文本进行文本向量挖掘,获得基础风控任务文本向量。
步骤504,对基础风控任务文本向量进行细节表征优化操作,获得第一风控任务文本向量。
步骤506,依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,得到用于突显目标任务事件段落的基础段落解析窗口。
步骤508,对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,获得第二风控任务文本向量。
步骤510,获取基础段落解析窗口中各段落解析窗口对应的解析权重。
步骤512,对解析权重未达到设定解析权重的段落解析窗口进行清洗,得到清洗后的段落解析窗口。
步骤514,依据清洗后的段落解析窗口的捕捉标签和第一风控任务文本向量对应的捕捉标签,对清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口。
步骤516,依据第二风控任务文本向量和挑选后的段落解析窗口进行关于目标任务事件段落的第二阶段解析操作,以修正挑选后的段落解析窗口,并依据修正后的段落解析窗口确定出待处理风控任务文本中的目标任务事件段落。
可见,通过第一阶解析操作,可以获得关于待处理风控任务文本中目标任务事件段落的若干个设定维度的段落解析窗口,即基础段落解析窗口包括至少一个段落解析窗口。其中,解析权重是表示对样例的段落捕捉预测的置信度范围,解析权重越高,准确性越高;解析权重越低,准确性越低。
大数据AI风控分析服务器对待处理风控任务文本的基础风控任务文本向量进行细节表征优化操作,获得第一风控任务文本向量,进而依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,得到用于突显目标任务事件段落的基础段落解析窗口后,大数据AI风控分析服务器进一步对获得的基础段落解析窗口进行清洗挑选。示例性地,大数据AI风控分析服务器估测出基础段落解析窗口的过程中,还可以估测获得各个段落解析窗口的解析权重。首先对各段落解析窗口对应的解析权重进行判别,对解析权重未达到设定解析权重的段落解析窗口进行清洗,从而得到清洗后的段落解析窗口。然后依次访问存留的每个估测结果,依据清洗后的段落解析窗口的捕捉标签和第一文本向量分布对应的捕捉标签,具体可以依据两者的捕捉标签映射结果确定清洗后的段落解析窗口与第一文本向量分布的捕捉标签映射结果关系。比如,对于捕捉标签映射结果一致的段落解析窗口,则删除其中多余的段落解析窗口,以对清洗后的段落解析窗口进行挑选,从而得到挑选后的段落解析窗口。
大数据AI风控分析服务器则进一步依据第二风控任务文本向量和挑选后的段落解析窗口进行第二阶段解析操作,以修正挑选后的段落解析窗口,并依据修正后的段落解析窗口确定出待处理风控任务文本中的目标任务事件段落。
本发明实施例中,通过对基础段落解析窗口进行多层清洗和挑选,能够尽可能准确地捕捉与实际目标任务事件段落的捕捉标签更匹配的段落解析窗口,从而能够进一步准确可靠地捕捉得到待处理风控任务文本中的目标任务事件段落。
在一些示例性设计思路下,第一风控任务文本向量对应第一文本向量分布;依据清洗后的段落解析窗口的捕捉标签和第一风控任务文本向量对应的捕捉标签,对清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口,包括:获取清洗后的段落解析窗口的窗口参考信息在第一文本向量分布中的迁移捕捉标签;依据迁移捕捉标签对清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口。
可以理解,第一风控任务文本向量可以是基于各个维度文本向量分布对应的风控任务文本向量,因此第一风控任务文本向量对应了相应的第一文本向量分布,文本向量分布包括了在原始风控任务文本中的捕捉标签区域。若第一风控任务文本向量对应了若干个第一文本向量分布,那么第一风控任务文本向量则包括了若干个第一文本向量分布对应的文本细节。
其中,段落解析窗口的窗口参考信息可为各个段落解析窗口边界对应的窗口参考变量,窗口参考信息可以准确表征估测区域的文本内容细节,能够有效地区分其他类型的文本内容细节。因此窗口参考信息可用于挑选基础段落解析窗口中的噪声段落解析窗口。
通过依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,可以得到用于突显目标任务事件段落的基础段落解析窗口集合,以及各个基础段落解析窗口集合中各个段落解析窗口对应的解析权重。其中,基础段落解析窗口集合中可以包括若干个基础估测所生成的段落解析窗口,以可以仅包括一个基础段落解析窗口。
其中,解析权重越低,表示相应的估测所突显的目标任务事件段落的捕捉标签区域的精度就越低。因此,大数据AI风控分析服务器获得基础段落解析窗口后,进一步依据设定解析权重对基础段落解析窗口进行的清洗。比如,大数据AI风控分析服务器可以清洗掉解析权重小于0.01的段落解析窗口,得到清洗后的段落解析窗口集合。清洗后的段落解析窗口集合可以表示为第一段落解析窗口集合。
大数据AI风控分析服务器进一步获取第一段落解析窗口集合中各个段落解析窗口的窗口参考信息在第一文本向量分布中的迁移捕捉标签,即确定段落解析窗口的窗口参考信息在对应维度文本向量分布上的捕捉标签,窗口参考信息落入维度文本向量分布的捕捉标签即为相应的迁移捕捉标签。
大数据AI风控分析服务器进而依据迁移捕捉标签对清洗后的第一段落解析窗口集合进行挑选,依据窗口参考信息挑选段落解析窗口,能够有效地消除基础段落解析窗口中的噪声解析窗口。比如,对于若干个捕捉标签相近的段落解析窗口,可以采用设定算法挑选出最优的段落解析窗口并记录,从而得到挑选后的段落解析窗口。对第一段落解析窗口集合进行挑选后的段落解析窗口,可以表示为第二段落解析窗口集合。
在一些示例性设计思路下,依据迁移捕捉标签对清洗后的段落解析窗口进行挑选,得到挑选后的段落解析窗口,包括:当若干个段落解析窗口的窗口参考信息在相同第一文本向量分布的迁移捕捉标签一致时,从若干个段落解析窗口中选择其中一个段落解析窗口;依据不具有一致迁移捕捉标签的段落解析窗口以及选择的段落解析窗口,得到挑选后的段落解析窗口。
大数据AI风控分析服务器在对清洗后的段落解析窗口进行依次访问以及挑选时,通过确定段落解析窗口的窗口参考信息在对应维度文本向量分布上的捕捉标签,确定各个段落解析窗口对应在第一文本向量分布中的迁移捕捉标签。
其中,各个段落解析窗口对应在第一文本向量分布中的迁移捕捉标签,可能存在若干个段落解析窗口的窗口参考信息在第一文本向量分布的迁移捕捉标签一致的情况,这种情况表示可能存在多余的段落解析窗口,需要进一步挑选。还可能存在若干个段落解析窗口的窗口参考信息在第一文本向量分布中不具有一致迁移捕捉标签,这种情况则表示这类段落解析窗口属于正常估测区间的段落解析窗口,这些段落解析窗口则可以记录下来。
示例性地,在依次访问完第一段落解析窗口集合中的段落解析窗口之后,对于每个第一文本向量分布上的每个捕捉标签,要么没有对应任何一个段落解析窗口的窗口参考信息,要么该捕捉标签对应若干个段落解析窗口的窗口参考信息。基于此,如果若干个段落解析窗口的窗口参考信息落入相同个文本向量分布上的相同个捕捉标签,表示若干个段落解析窗口的窗口参考信息在第一文本向量分布的迁移捕捉标签一致。大数据AI风控分析服务器则从若干个段落解析窗口中选择其中一个段落解析窗口。示例性地,大数据AI风控分析服务器可以采用设定算法选择其中一个段落解析窗口,比如可以将若干个段落解析窗口的位置变量按照解析权重进行求和并按照求和结果选择最佳的段落解析窗口,以从若干个段落解析窗口中选择其中一个段落解析窗口。
大数据AI风控分析服务器进而利用不具有一致迁移捕捉标签的段落解析窗口,以及所选择的段落解析窗口,得到挑选后的段落解析窗口。最后所记录的挑选后的段落解析窗口可以表示为第二段落解析窗口集合。大数据AI风控分析服务器在进一步进行关于目标任务事件段落的第二阶段解析操作时,则依据第二风控任务文本向量和第二段落解析窗口集合进行第二阶段解析操作,以对基础段落解析窗口进行修正,并得到修正后的段落解析窗口,修正后的段落解析窗口则为最后的估测结果。由此依据修正后的段落解析窗口可以确定出待处理风控任务文本中的目标任务事件段落。
本发明实施例中,通过对基础段落解析窗口进行多次清洗和挑选处理,能够尽可能准确地捕捉与实际目标任务事件段落的捕捉标签更匹配的段落解析窗口,并且通过有效地清洗掉噪声段落解析窗口,以减少对进一步解析操作的扰动。从而能够尽可能准确地捕捉出待处理风控任务文本中的目标任务事件段落。
在一些示例性设计思路下,依据第二风控任务文本向量和基础段落解析窗口进行第二阶段解析操作,以修正基础段落解析窗口,并依据修正后的段落解析窗口确定出待处理风控任务文本中的目标任务事件段落,包括:通过NLP算法的第二段落解析子网,依据第二风控任务文本向量从基础段落解析窗口中选择段落解析窗口;依据选择的段落解析窗口进行关于目标任务事件段落的估测修正,得到修正后的段落解析窗口,并依据修正后的段落解析窗口确定出待处理风控任务文本中的目标任务事件段落。
其中,NLP算法的第二段落解析子网中还可以包括预调试的第二事件识别模块。第二事件识别模块是基于对传入信息和基础段落解析窗口进行估测的网络模型。比如,第二事件识别模块可以为深度神经网络。
可以理解,通过第二事件识别模块进行第二阶段估测时,可依据传入信息和基础段落解析窗口自适应修正第二事件识别模块的设定的窗口,即设定的窗口的覆盖区域可由传入信息和基础段落解析窗口相应的算法参量控制。由此通过第二阶段解析操作,能够依据基础捕捉结果自适应修正设定的窗口的捕捉标签和覆盖区域,以对基础段落解析窗口进行修正。
示例性地,大数据AI风控分析服务器在进行第二阶段解析操作时,将提取的第二风控任务文本向量以及通过第一阶段估测获得的基础风控任务文本向量作为第二阶段解析操作的输入。在进行第二阶及估测之前,还可以首先依据第二风控任务文本向量从基础框中选择达到解析权重条件的段落解析窗口,将选择的段落解析窗口作为第二事件识别模块的设定的窗口,然后依据第二风控任务文本向量以及选择的段落解析窗口进行第二阶段的估测,这样可以在第二环节估测的过程中关于目标任务事件段落的估测修正,以对基础段落解析窗口进行自适应修正,从而获得尽可能匹配实际目标任务事件段落的段落解析窗口。
在一些示例性设计思路下,第二风控任务文本向量对应第二文本向量分布;依据第二风控任务文本向量从基础段落解析窗口中选择段落解析窗口,包括:获取基础段落解析窗口的捕捉标签在第二文本向量分布中的迁移捕捉标签;当若干个基础段落解析窗口的捕捉标签在相同第二文本向量分布中的迁移捕捉标签一致时,获取各个基础段落解析窗口的解析权重;依据解析权重从基础段落解析窗口中选择最优解析权重对应的段落解析窗口,得到选择的段落解析窗口。
可以理解,第二风控任务文本向量也可以是基于各个维度文本向量分布对应的风控任务文本向量,因此第二风控任务文本向量对应了相应的第二文本向量分布,文本向量分布包括了在原始风控任务文本中的捕捉标签区域。若第二风控任务文本向量对应了若干个第二文本向量分布,那么第二风控任务文本向量则包括了若干个第二文本向量分布对应的文本细节。
示例性地,基础段落解析窗口还包括各个段落解析窗口的解析权重。依据第二风控任务文本向量从基础框中选择段落解析窗口的过程中,首先确定各个基础段落解析窗口的捕捉标签在第二文本向量分布中的迁移捕捉标签。其中,各个基础段落解析窗口的捕捉标签在第二文本向量分布中的迁移捕捉标签,可以为各个基础段落解析窗口的整体捕捉标签区域在第二文本向量分布中的捕捉标签映射结果。在另外的实施例中,迁移捕捉标签,还可以是各个基础段落解析窗口的窗口参考信息在第二文本向量分布中的捕捉标签映射结果。
若若干个基础段落解析窗口的捕捉标签在相同第二文本向量分布中的迁移捕捉标签一致时,表示存在若干个捕捉标签类似或一致的基础段落解析窗口。大数据AI风控分析服务器进而获取各个基础段落解析窗口的解析权重,依据解析权重从这些基础段落解析窗口中选择最优解析权重对应的段落解析窗口,即选择出其中解析权重最高的段落解析窗口,得到选择的段落解析窗口。第二段落解析子网则依据选择的段落解析窗口进行第二阶段解析操作,从而估测得到基于对基础段落解析窗口修正后的估测结果。
本发明实施例中,在关于目标任务事件段落进行第二阶段解析操作时,通过依据第二风控任务文本向量对基础段落解析窗口进行挑选,能够有效地清洗掉解析权重不高或者存在误差的段落解析窗口,进而通过将选择的段落解析窗口作为第二事件识别模块的设定的窗口,这样可以依据基础段落解析窗口自适应修正第二阶段估测的段落解析窗口的捕捉标签和大小,从而估测出尽可能匹配实际目标任务事件段落的段落解析窗口,进而有效提高了目标任务事件段落的捕捉精度。
在一些示例性设计思路下,应用于智慧风控任务分析的大数据挖掘方法是基于NLP算法实现的;NLP算法通过调试步骤调试获得,调试步骤包括:获取风控任务文本示例和调试注释;调试注释是风控任务文本示例中关于目标任务事件段落示例的注释知识;基于风控任务文本示例和调试注释对待调试的NLP算法进行调试,当达到调试要求时完成调试,得到调试好的NLP算法。
其中,风控任务文本示例,是指作为算法调试样例的风控任务文本。调试注释用于对每次的调试结果进行参数改进等操作,以进一步调试和优化NLP算法。风控任务文本示例的调试注释可以是对风控任务文本示例中的目标任务事件段落示例进行标记得到的先验信息。
可以理解,在算法调试的过程中,通常需要经过多次循环调试NLP算法。每次循环调试通过修正每一次的NLP算法的算法参量,以渐渐实现算法的收敛,从而得到最后的NLP算法。
在一些示例性设计思路下,NLP算法的调试步骤示例性包括如下内容。
步骤602,获取风控任务文本示例和调试注释;调试注释是风控任务文本示例中关于目标任务事件段落示例的注释知识。
步骤604,将风控任务文本示例输入待调试的NLP算法,提取风控任务文本示例的基础风控任务文本向量示例。
步骤606,通过NLP算法的第一情感描述挖掘子网,对基础风控任务文本向量示例进行细节表征优化操作,获得第一风控任务文本向量示例。
步骤608,通过NLP算法的第一段落解析子网,依据第一风控任务文本向量示例进行关于目标任务事件段落示例的第一阶段解析操作,得到基础段落解析窗口示例。
步骤610,通过NLP算法的第二情感描述挖掘子网,对基础风控任务文本向量示例和第一风控任务文本向量示例进行文本向量融合,并对完成融合的风控任务文本向量示例进行细节表征优化操作,获得第二风控任务文本向量示例。
步骤612,通过NLP算法的第二段落解析子网,依据第二风控任务文本向量示例和基础段落解析窗口示例进行关于目标任务事件段落示例的第二阶段解析操作,得到关于目标任务事件段落示例的估测结果示例。
步骤614,基于估测结果示例与调试注释的区别,修正NLP算法的算法参量,并反复调试,直到达到调试要求时完成调试。
示例性地,预生成的待调试的NLP算法,包括第一段落解析子网和第二段落解析子网,还可以包括文本向量挖掘子网、情感描述挖掘子网和滑动平均子网。其中,第一段落解析子网还可以包括待调试的第一事件识别模块,第二段落解析子网还可以包括待调试的第二事件识别模块。
大数据AI风控分析服务器获取风控任务文本示例后,将风控任务文本示例加载到待调试的NLP算法中,首先,通过NLP算法的文本向量挖掘子网对风控任务文本示例进行文本向量挖掘,得到若干个设定维度的文本向量分布示例,通过滑动平均子网对文本向量分布示例进行细节表征优化,获得风控任务文本示例的基础风控任务文本向量示例。然后通过第一情感描述挖掘子网对基础风控任务文本向量示例进行情感描述向量挖掘,得到对应的关联情感描述数据,进而对关联情感描述数据进行细节表征优化操作,获得完成强化的第一风控任务文本向量示例。大数据AI风控分析服务器进而将第一风控任务文本向量示例加载到NLP算法的第一段落解析子网,通过第一段落解析子网所包括的第一事件识别模块依据第一风控任务文本向量示例对目标任务事件段落的捕捉标签进行基础估测,生成基础段落解析窗口示例。
大数据AI风控分析服务器然后将获得的基础风控任务文本向量示例和第一风控任务文本向量示例加载到第二情感描述挖掘子网,依据基础风控任务文本向量示例和第一风控任务文本向量示例修正第二情感描述挖掘子网的感受算法参量,进而通过第二情感描述挖掘子网将基础风控任务文本向量示例和第一风控任务文本向量示例进行文本向量融合,对完成融合的风控任务文本向量进行情感描述向量挖掘,并通过滑动平均子网进行细节表征优化,从而得到第二风控任务文本向量示例。获得基础段落解析窗口示例和第二风控任务文本向量后 ,此时,将基础段落解析窗口示例和第二风控任务文本向量示例加载到第二段落解析子网,通过第二段落解析子网所包括的第二事件识别模块,依据基础段落解析窗口示例和第二风控任务文本向量示例进行再次估测,以对第一层的估测结果进行修正,得到估测结果示例。
大数据AI风控分析服务器进而基于估测结果示例与调试注释的区别,修正NLP算法的算法参量并反复调试,直到达到调试要求时完成调试。
在其中一个实施例中,在调试第一事件识别模块和第二事件识别模块时通常需要进行窗口共性的匹配来对设定的窗口分配所需要估测的真实识别窗口。窗口共性的匹配可以基于交并比思路实现。对NLP算法中的第一事件识别模块和第二事件识别模块的调试方式,示例性包括:通过第一事件识别模块依据第一风控任务文本向量示例进行第一阶段解析操作,得到基础段落解析窗口示例后,获取基础段落解析窗口示例与样例注释的第一交并变量。通过第二事件识别模块依据第二风控任务文本向量示例和基础段落解析窗口示例进行第二阶段解析操作,得到估测结果示例后,还获取估测结果示例与样例注释的第二交并变量。大数据AI风控分析服务器进而依据第一交并变量和第二交并变量修正第一事件识别模块和第二事件识别模块的算法参量,以及修正NLP算法的其他算法参量,并反复调试,直到达到调试完成条件时,从而得到调试好的第一事件识别模块和第二事件识别模块以及NLP算法。
其中,估测结果示例与调试注释的区别可以用过代价指标来表征,比如以交叉熵损失函数代价指标。调试要求是结束算法调试的条件。调试完成条件可以是达到设定的循环轮次,或者是修正算法参量后的NLP算法的估测优劣评分达到设定优劣评分。
本发明实施例中,通过对风控任务文本示例中目标任务事件段落的捕捉标签区域进行估测调试,得到估测结果示例,进而可以依据得到的估测结果示例与调试注释的区别,逐渐对NLP算法中的算法参量进行修正。由此在算法参量修正过程中,通过NLP算法经过多次文本向量挖掘和细节表征优化,能够有效获得具有高阶的文本内容细节和低阶的文本内容细节的风控任务文本向量,能够有助于尽可能准确地识别风控任务文本示例中目标任务事件段落的捕捉标签区域,并基于基础估测结果和进一步提取的结果再次进行估测,能够尽可能准确地捕捉出目标任务事件段落的捕捉标签,并且能够有效地确定风控任务文本向量与段落解析窗口之间的关系,这样可以调试得到目标捕捉精度较高的NLP算法,从而提升了NLP算法对目标任务事件段落的捕捉精度。
在一些示例性设计思路下,NLP算法包括文本向量挖掘子网、第一滑动平均子网、第一情感描述挖掘子网、第二滑动平均子网、第二情感描述挖掘子网、第三滑动平均子网以及第一段落解析子网和第二段落解析子网。示例性地,文本向量挖掘子网可以为基于残差子网,第一滑动平均子网、第二滑动平均子网和第三滑动平均子网可以为基于全卷积子网,第一情感描述挖掘子网和第二情感描述挖掘子网可以为可变卷积子网。其中,第一滑动平均子网、第二滑动平均子网和第三滑动平均子网可以分别分部在NLP算法中的各个捕捉标签,比如,可以在文本向量挖掘子网、第一情感描述挖掘子网以及第二情感描述挖掘子网之间配置相应的滑动平均子网。
在一些示例性设计思路下,一种应用于智慧风控任务分析的大数据挖掘方法通过预调试的NLP算法执行,示例性包括以下步骤。
步骤802,通过NLP算法的文本向量挖掘子网,对待处理风控任务文本进行文本向量挖掘,得到各设定维度对应的文本向量分布。
步骤804,通过NLP算法的第一滑动平均子网,对文本向量分布进行细节表征优化操作,获得基础风控任务文本向量。
步骤806,通过NLP算法的第一情感描述挖掘子网,依据设定覆盖变量对基础风控任务文本向量进行情感描述向量挖掘,得到基础风控任务文本向量的关联情感描述数据。
步骤808,通过NLP算法的第二滑动平均子网,对基础风控任务文本向量的关联情感描述数据进行细节表征优化操作,获得第一风控任务文本向量。
步骤810,通过NLP算法的第一段落解析子网,依据第一风控任务文本向量估测待处理风控任务文本中关于待处理任务事件段落的段落解析窗口。
步骤812,对待处理任务事件段落的段落解析窗口进行判别,得到用于突显目标任务事件段落的基础段落解析窗口。
步骤814,将基础风控任务文本向量和第一风控任务文本向量加载到NLP算法的第二情感描述挖掘子网;依据基础风控任务文本向量和第一风控任务文本向量修正第二情感描述挖掘子网的覆盖变量,得到修正后的覆盖变量。
步骤816,对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,得到完成融合的风控任务文本向量。
步骤818,依据修正后的覆盖变量,对完成融合的风控任务文本向量进行情感描述向量挖掘,得到对应的关联情感描述数据。
步骤820,通过NLP算法的第三滑动平均子网,对关联情感描述数据进行细节表征优化操作,得到第二风控任务文本向量。
步骤822,通过NLP算法的第二段落解析子网,获取基础段落解析窗口的捕捉标签在第二风控任务文本向量图中的迁移捕捉标签;第二风控任务文本向量对应第二文本向量分布。
步骤824,当若干个基础段落解析窗口的捕捉标签在相同第二文本向量分布中的迁移捕捉标签一致时,获取各个基础段落解析窗口的解析权重;依据解析权重从基础段落解析窗口中选择最优解析权重对应的段落解析窗口,得到选择的段落解析窗口。
步骤826,依据选择的段落解析窗口进行关于目标任务事件段落的估测修正,得到修正后的段落解析窗口,并依据修正后的段落解析窗口确定出待处理风控任务文本中的目标任务事件段落。
本发明实施例中,由于NLP算法是经过调试得到的具有较高捕捉准确性的Transformer模型,通过预调试的NLP算法对待处理风控任务文本进行文本向量挖掘,这样可以得到携带高低阶文本内容细节的第一风控任务文本向量。通过依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,可获得关于目标任务事件段落的基础段落解析窗口。通过NLP算法更深层次对基础风控任务文本向量和第一风控任务文本向量进行文本向量融合,并对完成融合的风控任务文本向量进行细节表征优化操作,并依据强化了文本细节后的第二风控任务文本向量以及基础段落解析窗口,进行关于目标任务事件段落的第二阶段解析操作以修正基础段落解析窗口,这样可以尽可能准确地校对关于目标任务事件段落的捕捉结果,使得修正后的段落解析窗口尽可能匹配真实目标任务事件段落的位置,以便精准可靠地确定出待处理风控任务文本中关于目标任务事件段落的段落解析窗口,有效提高了目标任务事件段落的捕捉精准度。
示例性地,大数据AI风控分析服务器将待处理风控任务文本作为预调试的NLP算法的输入。通过NLP算法的文本向量挖掘子网对待处理风控任务文本进行文本向量挖掘,并通过第一滑动平均子网对提取的特征进行细节表征优化操作,获得基础风控任务文本向量。进一步提高NLP算法的第一情感描述挖掘子网对基础风控任务文本向量进行情感描述向量挖掘,获得对应的关联情感描述数据,进而通过第二滑动平均子网对关联情感描述数据进行细节表征优化操作,这样可以得到内容输出质量更佳的第一风控任务文本向量。然后将第一风控任务文本向量输入NLP算法的第一段落解析子网,通过第一段落解析子网依据第一风控任务文本向量进行关于目标任务事件段落的第一阶段解析操作,输出用于突显任务概要的基础任务概要段落解析窗口。
进一步地,NLP算法获得基础风控任务文本向量和第一风控任务文本向量后,将基础风控任务文本向量和第一风控任务文本向量输入第二情感描述挖掘子网,并依据基础风控任务文本向量和第一风控任务文本向量修正第二情感描述挖掘子网的覆盖变量,并将基础风控任务文本向量和第一风控任务文本向量进行组合,进而基于修正后的覆盖变量对完成融合的风控任务文本向量进行情感描述向量挖掘,得到对应的关联情感描述数据。然后通过第三滑动平均子网对提取的关联情感描述数据进行细节表征优化操作,得到完成强化的第二风控任务文本向量。
大数据AI风控分析服务器进而将获得的基础任务概要段落解析窗口和第二风控任务文本向量,加载到NLP算法的第二段落解析子网,第二段落解析子网进而依据第二风控任务文本向量和基础任务概要段落解析窗口自适应修正第二段落解析子网的设定的窗口,并依据第二风控任务文本向量和基础任务概要段落解析窗口进行估测修正,以修正基础任务概要段落解析窗口,从而得到任务概要捕捉结果。这样可以尽可能准确地校对关于任务概要的捕捉结果,使得修正后的段落解析窗口尽可能匹配真实任务概要的捕捉标签区域。
通过使用第一段落解析子网的基础任务概要段落解析窗口作为第二段落解析子网的自适应设定的窗口,可以使得第二段落解析子网的设定的窗口形状尽可能匹配真实任务概要捕捉窗口大小,从而能够显著提高第二段落解析子网中小维度任务概要匹配到的设定的窗口数量,同时也有助于设定的窗口的判别核更准确地进行判别。通过结合多层的情感描述挖掘子网和用于进行关联细节强化的滑动平均子网,能够对小维度任务概要的更精准捕捉。
通过预调试的NLP算法经过多次文本向量挖掘和设定的窗口的修正,也能够准确可靠地捕捉得到各种维度以及维度较小的任务概要,从而能够准确可靠地捕捉得到待处理风控任务文本中的任务概要识别窗口,相较于传统的任务概要捕捉技术,有效提高了任务概要捕捉的准确性。
在上述内容的基础上,在一些可独立的实施例中,在所述依据所述第二风控任务文本向量和所述基础段落解析窗口进行关于所述目标任务事件段落的第二阶段解析操作,以修正所述基础段落解析窗口,并依据修正后的段落解析窗口确定出所述待处理风控任务文本中的所述目标任务事件段落之后,所述方法还包括:响应于针对所述待处理风控任务文本的分发请求,依据所述目标任务事件段落对所述待处理风控任务文本进行文本内容总结,得到风控任务概要;将所述风控任务概要分发给目标风控平台系统。
在本发明实施例中,分发请求可以是目标风控平台系统向大数据AI风控分析服务器发送的,大数据AI风控分析服务器在分发待处理风控任务文本时,为了提高分发效率,减少资源占用,可以对待处理风控任务文本进行文本内容总结,然后将得到的风控任务概要分发给目标风控平台系统。一般而言,目标风控平台系统具有对风控任务概要进行文本扩展的性能,因而当目标风控平台系统接收到风控任务概要之后,通过文本扩展能够基本恢复出与待处理风控任务文本相同的内容信息。一方面,提高了分发效率,减少了资源占用,另一方面,如果目标风控平台系统存在使用风控任务概要的需求,在接收到风控任务概要之后便可以直接使用,无需在此进行文本内容总结,节约了目标风控平台系统的运算开销。
在上述内容的基础上,在一些可独立的实施例中,依据所述目标任务事件段落对所述待处理风控任务文本进行文本内容总结,得到风控任务概要,包括S901-S903。
S901,将完成了所述目标任务事件段落的高亮处理的当前风控任务文本加载至文本概括模型中的知识提炼子模型,得到所述知识提炼子模型输出的所述完成了所述目标任务事件段落的高亮处理的当前风控任务文本的第一语义总结知识和第二语义总结知识,其中,所述知识提炼子模型包括互相连接的多个词向量抽取节点,所述第一语义总结知识是所述互相连接的多个词向量抽取节点中的除尾部的词向量抽取节点输出的语义总结知识,所述第二语义总结知识是所述互相连接的多个词向量抽取节点中的尾部的词向量抽取节点输出的语义总结知识。
S902,将所述第二语义总结知识加载至所述文本概括模型中的第一概括子模型,得到所述第一概括子模型输出的初始总结文本。
S903,将所述第一语义总结知识、所述第二语义总结知识和第三语义总结知识以及所述初始总结文本加载至所述文本概括模型中的第二概括子模型,得到所述第二概括子模型输出的最终总结文本,将所述最终总结文本确定为所述风控任务概要,其中,所述第三语义总结知识是所述第一概括子模型中的词向量抽取节点根据衍生总结知识输出的语义总结知识,所述衍生总结知识是对所述第二语义总结知识进行更新得到的知识向量。
可见,通过S901-S903,能够通过互相连接的多个词向量抽取节点抽取得到完成了所述目标任务事件段落的高亮处理的当前风控任务文本的第一语义总结知识和第二语义总结知识,从而保障语义总结知识的平滑性和连续性,然后通过第一概括子模型和第二概括子模型有序地挖掘得到初始总结文本和最终总结文本,可以保障初始总结文本和最终总结文本是基于目标任务事件段落为中心思想进行概括的,这样可以确保所得到的风控任务概要的精简性和概括的准确性。
在上述内容的基础上,在一些可独立的实施例中,S901中的将完成了所述目标任务事件段落的高亮处理的当前风控任务文本加载至文本概括模型中的知识提炼子模型,得到所述知识提炼子模型输出的所述完成了所述目标任务事件段落的高亮处理的当前风控任务文本的第一语义总结知识和第二语义总结知识,包括如下步骤。
S9011、将所述完成了所述目标任务事件段落的高亮处理的当前风控任务文本加载至所述知识提炼子模型中包括互相连接的第一层词向量抽取节点,得到所述第一层词向量抽取节点输出的第一层语义总结知识。
S9012、将所述第一层语义总结知识加载至所述知识提炼子模型中包括互相连接的第二层词向量抽取节点,得到所述第二层词向量抽取节点输出的第二层语义总结知识,其中,所述第一语义总结知识为所述第二层语义总结知识。
S9013、将所述第二层语义总结知识加载至所述知识提炼子模型中包括互相连接的第三层词向量抽取节点,得到所述第三层词向量抽取节点输出的第三层语义总结知识,其中,所述第二语义总结知识为所述第三层语义总结知识。
在上述内容的基础上,在一些可独立的实施例中,S902中的将所述第二语义总结知识加载至所述文本概括模型中的第一概括子模型,得到所述第一概括子模型输出的初始总结文本,包括如下步骤。
S9021、将所述第二语义总结知识加载至所述第一概括子模型中的更新节点,得到所述更新节点输出的所述衍生总结知识。
S9022、将所述衍生总结知识加载至所述第一概括子模型中的词向量抽取节点,得到所述第一概括子模型中的词向量抽取节点输出的所述第三语义总结知识。
S9023、将所述第三语义总结知识加载至所述第一概括子模型中的第一总结输出节点,得到所述第一总结输出节点输出的所述初始总结文本。
以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。