发明内容
本发明提供一种基于大数据话题分析的风险识别方法及服务器,为实现上述技术目的,本申请采用如下技术方案。
第一方面是一种基于大数据话题分析的风险识别方法,所述方法包括:
确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述;其中,所述异常话题互动数据记录中每个异常话题互动数据反映识别出用户会话事件的顺序特征和分布特征中的至少一种;
通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表;确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述;其中,所述第一欺诈倾向描述和所述第二欺诈倾向描述为所述用户会话事件的不同会话阶段的欺诈倾向描述;x为正整数;
通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下。
对于一种可能的实施例而言,所述通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表,包括:
确定所述异常话题互动数据记录中匹配的所有用户会话事件的第一欺诈倾向描述中,任两个用户会话事件的第一欺诈倾向描述之间的描述共性系数;
将不小于第三判定值的描述共性系数所匹配的两个异常话题互动数据归为相同用户会话事件的异常话题互动数据,得到所述x个数据融合列表。
对于一种可能的实施例而言,所述通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下,包括:
通过所述用户会话事件的第二欺诈倾向描述,确定所述没有被融合的异常话题互动数据中第一局部话题互动数据匹配的第一风险标签;所述第一风险标签包含于所述x个数据融合列表匹配的风险标签下;所述第一局部话题互动数据匹配的第一风险标签的可信指数不小于目标判定值;
将所述第一局部话题互动数据融合至所述第一风险标签;
其中,所述通过所述用户会话事件的第二欺诈倾向描述,确定所述没有被融合的异常话题互动数据中第一局部话题互动数据匹配的第一风险标签,包括:
确定所述异常话题互动数据记录中已经完成融合的异常话题互动数据匹配的用户会话事件的第三欺诈倾向描述;所述用户会话事件的第三欺诈倾向描述与所述用户会话事件的第二欺诈倾向描述,为所述用户会话事件的相同会话阶段的欺诈倾向描述;
确定每个所述用户会话事件的第二欺诈倾向描述与所述用户会话事件的第三欺诈倾向描述之间的指定描述共性系数;
通过所述指定描述共性系数,确定所述第一局部话题互动数据匹配的第一风险标签。
对于一种可能的实施例而言,所述通过所述指定描述共性系数,确定所述第一局部话题互动数据匹配的第一风险标签,包括:
将不小于第一判定值的指定描述共性系数所匹配的用户会话事件的第二欺诈倾向描述对应的异常话题互动数据,作为所述第一局部话题互动数据;
将不小于所述第一判定值的指定描述共性系数所匹配的用户会话事件的第三欺诈倾向描述对应的欺诈主题,作为所述第一局部话题互动数据匹配的第一风险标签。
对于一种可能的实施例而言,所述方法还包括:
通过所述用户会话事件的第二欺诈倾向描述,确定所述没有被融合的异常话题互动数据中第二局部话题互动数据匹配的第二风险标签;所述第二风险标签包含于所述x个数据融合列表匹配的风险标签下;所述第二局部话题互动数据匹配的第二风险标签的可信指数,小于所述第一局部话题互动数据匹配的第一风险标签的可信指数;
通过所述第二局部话题互动数据匹配的第二风险标签以及所述第二局部话题互动数据中的顺序特征和分布特征中的至少一种,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签。
对于一种可能的实施例而言,所述通过所述用户会话事件的第二欺诈倾向描述,确定所述没有被融合的异常话题互动数据中第二局部话题互动数据匹配的第二风险标签,包括:
确定所述异常话题互动数据记录中已经完成融合的异常话题互动数据匹配的用户会话事件的第三欺诈倾向描述;所述用户会话事件的第三欺诈倾向描述与所述用户会话事件的第二欺诈倾向描述,为所述用户会话事件的相同会话阶段的欺诈倾向描述;
确定每个所述用户会话事件的第二欺诈倾向描述与所述用户会话事件的第三欺诈倾向描述之间的指定描述共性系数;
通过所述指定描述共性系数,确定所述第二局部话题互动数据匹配的第二风险标签;
其中,所述通过所述指定描述共性系数,确定所述第二局部话题互动数据匹配的第二风险标签,包括:
将小于第一判定值且不小于第二判定值的指定描述共性系数所匹配的用户会话事件的第二欺诈倾向描述对应的异常话题互动数据,作为所述第二局部话题互动数据;
将小于所述第一判定值且不小于所述第二判定值的指定描述共性系数所匹配的用户会话事件的第三欺诈倾向描述对应的欺诈主题,作为所述第二局部话题互动数据匹配的第二风险标签。
对于一种可能的实施例而言,所述通过所述第二局部话题互动数据匹配的第二风险标签以及所述第二局部话题互动数据中的顺序特征和分布特征中的至少一种,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签,包括:
确定与所述第二局部话题互动数据中的顺序特征存在设定时序差异的顺序区间;
确定与所述第二局部话题互动数据中的分布特征存在设定分布差异的神经网络模型;
确定所述神经网络模型确定的所述顺序区间内的数据采集线程属性;所述数据采集线程属性反映识别出数据采集线程的顺序特征和分布特征中的至少一种;
通过所述第二局部话题互动数据匹配的第二风险标签和所述数据采集线程属性,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签。
对于一种可能的实施例而言,所述通过所述第二局部话题互动数据匹配的第二风险标签和所述数据采集线程属性,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签,包括:
通过所述第二局部话题互动数据匹配的第二风险标签,确定所述第二局部话题互动数据对应的第一用户会话事件关键词;
确定所述数据采集线程属性对应的第二用户会话事件关键词;
从所述第一用户会话事件关键词中,确定包含于所述第二用户会话事件关键词中的目标用户会话事件关键词;
通过所述目标用户会话事件关键词对应的异常话题互动数据匹配的风险标签,将所述目标用户会话事件关键词对应的异常话题互动数据融合至所述第二风险标签。
对于一种可能的实施例而言,所述方法还包括:在所述异常话题互动数据记录中匹配的所有用户会话事件的第一欺诈倾向描述中,将与剩余用户会话事件的第一欺诈倾向描述之间的描述共性系数中的指定描述共性系数,小于第三判定值且不小于第四判定值的用户会话事件的第一欺诈倾向描述所匹配的异常话题互动数据,作为目标异常话题互动数据;
所述通过所述第二局部话题互动数据匹配的第二风险标签以及所述第二局部话题互动数据中的顺序特征和分布特征中的至少一种,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签,包括:通过所述目标异常话题互动数据和所述第二局部话题互动数据的关联话题互动数据匹配的风险标签和所述关联话题互动数据中的顺序特征和分布特征中的至少一种,将所述关联话题互动数据中的至少部分互动数据融合至所述第二风险标签;
其中,所述方法还包括:确定每个所述数据融合列表匹配的显著性数据集的第一欺诈倾向描述;依据每个所述显著性数据集的第一欺诈倾向描述和记录于云服务空间中多个参考数据集的第一欺诈倾向描述,从所述多个参考数据集中确定与每个所述显著性数据集指向相同用户会话事件的目标参考数据集;从所述云服务空间中确定与所述目标参考数据集对应的用户会话事件的要素内容。
第二方面是一种风险识别服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述风险识别服务器执行第一方面的方法。
根据本发明的一个实施例,基于异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述,对异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,可以提取异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据,进而能够充分考虑异常话题互动数据记录中涵盖的异常话题互动数据的潜在特征;此外,鉴于通过没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述,将没有被融合的异常话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下,可以通过用户会话事件的第二欺诈倾向描述,对通过第一欺诈倾向描述进行融合得到的数据融合列表进行适应性扩展优化,这样可以实现对异常话题互动数据记录中异常话题互动数据的针对性分治处理,从而为话题欺诈风险识别提供精准简要的分析依据,这样能够实现精准快速的话题欺诈风险识别。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的的一种基于大数据话题分析的风险识别方法的流程示意图,一种基于大数据话题分析的风险识别方法可以通过风险识别服务器实现,风险识别服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述风险识别服务器执行如下步骤所描述的技术方案。
步骤101、确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述。
在本发明实施例中,所述异常话题互动数据记录中每个异常话题互动数据反映识别出用户会话事件的顺序特征(比如:时间信息)和分布特征(比如:位置信息)中的至少一种。
可以理解的是,本发明实施例中的异常话题互动数据可以是根据数据采集或者数据抽取等其中一种方式所得到的,获取用户会话事件在不同时间段出现在不同的位置的描述信息。异常话题互动数据记录可以涵盖若干异常话题互动数据。异常话题互动数据记录可以是设定时段内的全部异常话题互动数据的记录。进一步地,异常话题互动数据可以是满足特定捕捉条件的话题互动数据,比如命中部分敏感词,命中部分IP地址等条件。
在一些可能的实施例中,异常话题互动数据记录可以根据如下三种思路中的不低于一种思路得到。
思路一,获取x个网页蜘蛛中的每个网页蜘蛛上传的x个异常话题互动数据。比如,一个网页蜘蛛可以获取大数据话题或者交互事件,在结合大数据话题或者交互事件识别出某一用户会话事件交互的基础上,确定一个异常话题互动数据。本发明实施例中的网页蜘蛛可以根据实际情况选择采集装置进行大数据话题或者交互事件的采集。
思路二,获取x个网页蜘蛛中的每个网页蜘蛛上传的大数据话题和/或者交互事件,基于获取的大数据话题和/或者交互事件,确定x个异常话题互动数据。
思路三,获取话题解析模块上传的x个异常话题互动数据;其中,话题解析模块可以接收x个网页蜘蛛中的各个网页蜘蛛上传的大数据话题和/或者交互事件,话题解析模块基于接收的大数据话题和/或者交互事件,确定x个异常话题互动数据。
本发明实施例中的用户会话事件可以涵盖如下至少一个事件:信息咨询事件、数据调用事件、支付互动事件等。
各异常话题互动数据匹配的交互事件可以是各异常话题互动数据中涵盖的交互事件。各异常话题互动数据中涵盖的交互事件可以涵盖对于一件热度话题的交互事件(比如,仅包括用户会话事件的隐私交互事件和/或非隐私交互事件)。
用户会话事件的第一欺诈倾向描述(比如特征向量)可以是用户会话事件的隐私欺诈倾向描述。在一些可能的实施例中,可以通过对各异常话题互动数据匹配的用户会话事件进行隐私关键内容挖掘,得到隐私欺诈倾向描述。对于存在差异的异常话题互动数据匹配的用户会话事件进行关键内容挖掘所采集的挖掘变量(比如:特征挖掘单元)可以一致。
异常话题互动数据记录中的各个异常话题互动数据存在差异。存在差异的异常话题互动数据中出现如下不低于一种不同之处:用户会话事件存在差异、顺序特征存在差异、分布特征存在差异。
步骤102、通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表。
在本发明实施例中,通过所述用户会话事件的第一欺诈倾向描述,可以得到其中两个异常话题互动数据匹配的两个用户会话事件之间的描述共性系数(比如:相似度),在描述共性系数不小于第三判定值的前提下,反映该两个用户会话事件是同一用户会话事件,将该两个异常话题互动数据总结在同一标签内,可以将异常话题互动数据记录中同一用户会话事件所匹配的异常话题互动数据总结在同一标签内。
第一欺诈倾向描述可以理解为对用户会话事件进行事件欺诈解析后得到的欺诈偏好内容,也可以理解为特征向量。数据融合列表可以理解为对异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据按照设定的聚类规则进行聚类后所得到的分类结果。其中,设定的聚类规则可以是通过属性聚类、类别聚类、话题互动热度值聚类等。
步骤103、确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述。
在本发明实施例中,所述第一欺诈倾向描述和所述第二欺诈倾向描述为所述用户会话事件的不同会话阶段的欺诈倾向描述。没有被融合的异常话题互动数据中可以涵盖x个异常话题互动数据,没有被融合的异常话题互动数据中的其中一个异常话题互动数据,可以是通过第一欺诈倾向描述无法将该异常话题互动数据总结到其中一个欺诈主题的异常话题互动数据。
可以理解的是,在获取用户会话事件的第一欺诈倾向描述对异常话题互动数据记录中的异常话题互动数据进行融合的基础上,若用户会话事件的隐私特征识别指数不满足设定指数或者难以获取到隐私,则无法对隐私特征识别指数不满足设定指数或者难以获取到隐私的用户会话事件所匹配的异常话题互动数据进行融合,从而将以上难以通过第一欺诈倾向描述进行融合的异常话题互动数据,作为没有被融合的异常话题互动数据。
在一些可能的实施例中,在某一个用户会话事件的第一欺诈倾向描述和剩余其中一个用户会话事件的第一欺诈倾向描述之间的描述共性系数均不大于第三判定值的基础上,确定该用户会话事件匹配的异常话题互动数据包含于没有被融合的异常话题互动数据中。
在一些可能的实施例中,第一欺诈倾向描述为隐私欺诈倾向描述,第二欺诈倾向描述为非隐私欺诈倾向描述。本发明实施例对第一欺诈倾向描述和第二欺诈倾向描述匹配的会话阶段不作限定。比如,第一欺诈倾向描述可以是隐私欺诈倾向描述,第二欺诈倾向描述可以是资金欺诈倾向描述,又比如,第一欺诈倾向描述可以是资金欺诈倾向描述,第二欺诈倾向描述可以是个人信息欺诈倾向描述。
在一些可能的实施例中,在识别出隐私和非隐私的基础上,确定的异常话题互动数据可以涵盖如下至少一个事件:第一欺诈倾向描述、第二欺诈倾向描述、隐私交互事件、非隐私交互事件。异常话题互动数据还可以包括隐私和非隐私的关联信息。在一些可能的实施例中,在只识别出用户会话事件的隐私信息的基础上,确定出的异常话题互动数据可以包括第一欺诈倾向描述和/或隐私交互事件。在只识别出用户会话事件的非隐私的基础上,确定出的异常话题互动数据可以包括第二欺诈倾向描述和/或非隐私交互事件。
步骤104、通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下。
在本发明实施例中,至少部分互动数据可以理解为部分互动数据,也可以理解为全部互动数据,风险标签可以理解为风险分类。
综上所述,基于异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述,对异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,可以提取异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据,进而能够借助异常话题互动数据记录中涵盖的异常话题互动数据的潜在特征;此外,鉴于通过没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述,将没有被融合的异常话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下,可以通过用户会话事件的第二欺诈倾向描述,对通过第一欺诈倾向描述进行融合得到的数据融合列表进行适应性扩展优化,这样可以实现对异常话题互动数据记录中异常话题互动数据的针对性分治处理,从而为话题欺诈风险识别提供精准简要的分析依据。
对于一种可能的技术方案而言,本发明实施例还可以示出另一种基于大数据话题分析的风险识别方法的具体过程,该方法示例性的可以包括如下步骤。
步骤201、确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述;其中,所述异常话题互动数据记录中每个异常话题互动数据反映识别出用户会话事件的顺序特征和分布特征中的至少一种。
步骤202、通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表。
步骤203、确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述;所述第一欺诈倾向描述和所述第二欺诈倾向描述为所述用户会话事件的不同会话阶段的欺诈倾向描述。
步骤204、通过所述用户会话事件的第二欺诈倾向描述,确定所述没有被融合的异常话题互动数据中第一局部话题互动数据匹配的第一风险标签。其中,所述第一风险标签包含于所述x个数据融合列表匹配的风险标签下。
可以理解的是,所述第一局部话题互动数据匹配的第一风险标签的可信指数不小于目标判定值。在一些可能的实施例中,可以通过没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述,确定没有被融合的异常话题互动数据中每个异常话题互动数据匹配的风险标签(每个异常话题互动数据匹配的风险标签可以是每个异常话题互动数据最可能的风险标签),确定没有被融合的异常话题互动数据中每个异常话题互动数据匹配的风险标签的可信指数,将可信指数不小于目标判定值的异常话题互动数据作为第一局部话题互动数据。
以第二欺诈倾向描述为非隐私欺诈倾向描述进行举例说明。确定每个异常话题互动数据匹配的风险标签的可信指数可以根据如下步骤进行实现,分别确定没有被融合的异常话题互动数据中每个异常话题互动数据匹配的非隐私欺诈倾向描述,与已经完成融合的所有异常话题互动数据匹配的非隐私欺诈倾向描述之间的描述共性系数的最大值(可以理解为最大相似度),将描述共性系数的最大值匹配的已经完成融合的异常话题互动数据的欺诈主题,作为没有被融合的异常话题互动数据中每个异常话题互动数据匹配的欺诈主题,将该描述共性系数的最大值,作为每个异常话题互动数据匹配的欺诈主题匹配的可信指数。举例而言,目标判定值可以是0.8。目标判定值还可以为其它,比如,目标判定值可以为0.7或者0.9等等。
第一局部话题互动数据可以理解为能够结合用户会话事件的第二欺诈倾向描述进行适应性扩展优化融合(可以理解为补充融合或者补充聚类)的异常话题互动数据,或者还可以理解为能够结合用户会话事件的第二欺诈倾向描述将第一局部话题互动数据适应性扩展优化到x个数据融合列表中。
在一些可能的实施例中,步骤204可以根据如下步骤进行实现:确定所述异常话题互动数据记录中已经完成融合的异常话题互动数据匹配的用户会话事件的第三欺诈倾向描述;所述用户会话事件的第三欺诈倾向描述与所述用户会话事件的第二欺诈倾向描述,为所述用户会话事件的相同会话阶段的欺诈倾向描述;确定每个所述用户会话事件的第二欺诈倾向描述与所述用户会话事件的第三欺诈倾向描述之间的指定描述共性系数;通过所述指定描述共性系数,确定所述第一局部话题互动数据匹配的第一风险标签。
在一些可能的实施例中,用户会话事件的第二欺诈倾向描述和用户会话事件的第三欺诈倾向描述皆为用户会话事件的非隐私欺诈倾向描述。用户会话事件的第二欺诈倾向描述可以理解为没有被融合的异常话题互动数据匹配的用户会话事件的非隐私欺诈倾向描述,用户会话事件的第三欺诈倾向描述可以理解为已经完成融合的异常话题互动数据匹配的用户会话事件的非隐私欺诈倾向描述。本发明实施例中的没有被融合和已经完成融合,是通过用户会话事件的第一欺诈倾向描述确定的。
举例而言,可以确定第一异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述,分别与H个异常话题互动数据匹配的用户会话事件(H个异常话题互动数据为通过所述用户会话事件的第一欺诈倾向描述完成融合的全部异常话题互动数据)的第三欺诈倾向描述之间的H个描述共性系数中的第一指定描述共性系数(比如:最大描述共性系数或者最大相似度),若第一指定描述共性系数不小于第一判定值,则反映第一异常话题互动数据匹配的用户会话事件与第一指定描述共性系数匹配的第一设定异常话题互动数据匹配的用户会话事件(包含于H个异常话题互动数据匹配的用户会话事件中)描述共性系数高,从而可以将第一异常话题互动数据的风险标签作为第一设定异常话题互动数据的风险标签,并基于第一异常话题互动数据风险标签,将第一异常话题互动数据融合至x个数据融合列表的对应风险标签下。
举例而言,没有被融合的异常话题互动数据包括异常话题互动数据Interactivedata_a和异常话题互动数据Interactive data_b,没有被融合的异常话题互动数据中的每个异常话题互动数据对应一个用户会话事件的第二欺诈倾向描述,异常话题互动数据Interactive data_a和异常话题互动数据Interactive data_b分别对应用户会话事件的第二欺诈倾向描述Propensity to cheat_1和用户会话事件的第二欺诈倾向描述Propensity to cheat_2。已经完成融合的异常话题互动数据包括异常话题互动数据Interactive data_c、异常话题互动数据Interactive data_e以及异常话题互动数据Interactive data_d,异常话题互动数据Interactive data_c、异常话题互动数据Interactive data_e以及异常话题互动数据Interactive data_d分别对应用户会话事件的第三欺诈倾向描述Propensity to cheat_1、用户会话事件的第三欺诈倾向描述Propensity to cheat_2、用户会话事件的第三欺诈倾向描述Propensity to cheat_3。确定用户会话事件的第二欺诈倾向描述Propensity to cheat_1分别与用户会话事件的第三欺诈倾向描述Propensity to cheat_1、用户会话事件的第三欺诈倾向描述Propensity tocheat_2、用户会话事件的第三欺诈倾向描述Propensity to cheat_3之间的3个描述共性系数,并确定这3个描述共性系数的指定描述共性系数。还可以确定用户会话事件的第二欺诈倾向描述Propensity to cheat_2分别与用户会话事件的第三欺诈倾向描述Propensityto cheat_1、用户会话事件的第三欺诈倾向描述Propensity to cheat_2、用户会话事件的第三欺诈倾向描述Propensity to cheat_3之间的3个描述共性系数,并确定这3个描述共性系数的指定描述共性系数。
可以理解的是,可以根据所获得的设定数目个指定描述共性系数,确定第一局部话题互动数据匹配的第一风险标签;其中,设定数目与没有被融合的异常话题互动数据涵盖的异常话题互动数据数目一致。
如此设计,通过每个用户会话事件的第二欺诈倾向描述与用户会话事件的第三欺诈倾向描述之间的指定描述共性系数,确定第一局部话题互动数据匹配的第一风险标签,从而能够提供了一种确定第一局部话题互动数据匹配的第一风险标签的思路,可以基于第一局部话题互动数据匹配的第一风险标签,对已经完成融合的异常话题互动数据进行适应性扩展优化。
在一些可能的实施例中,所述通过所述指定描述共性系数,确定所述第一局部话题互动数据匹配的第一风险标签,示例性的可以包括如下内容:将不小于第一判定值的指定描述共性系数所匹配的用户会话事件的第二欺诈倾向描述对应的异常话题互动数据,作为所述第一局部话题互动数据;将不小于所述第一判定值的指定描述共性系数所匹配的用户会话事件的第三欺诈倾向描述对应的欺诈主题,作为所述第一局部话题互动数据匹配的第一风险标签。
举例而言,在用户会话事件的第二欺诈倾向描述Propensity to cheat_1分别与用户会话事件的第三欺诈倾向描述Propensity to cheat_1、用户会话事件的第三欺诈倾向描述Propensity to cheat_2、用户会话事件的第三欺诈倾向描述Propensity tocheat_3之间的3个描述共性系数中的指定描述共性系数,不小于第一判定值的前提下,可以确定用户会话事件的第二欺诈倾向描述Propensity to cheat_1匹配的异常话题互动数据包含于第一局部话题互动数据中。此外,指定描述共性系数对应用户会话事件的第三欺诈倾向描述Propensity to cheat_3,进而能够将用户会话事件的第三欺诈倾向描述Propensity to cheat_3匹配的异常话题互动数据的风险标签,作为用户会话事件的第二欺诈倾向描述Propensity to cheat_1匹配的异常话题互动数据的风险标签。
如此设计,这样能够方便且快捷的从没有被融合的异常话题互动数据中,确定出满足要求的第一局部话题互动数据和第一局部话题互动数据匹配的第一风险标签。
步骤205、将所述第一局部话题互动数据融合至所述第一风险标签。
举例而言,第一局部话题互动数据中的第一个异常话题互动数据的欺诈主题(可以理解为欺诈类别)为欺诈主题欺诈主题Fraud theme_P,将该第一个异常话题互动数据融合至欺诈主题为欺诈主题Fraud theme_P的数据融合列表对应风险标签下;第一局部话题互动数据中的第二个异常话题互动数据的欺诈主题为欺诈主题Fraud theme_Q,将该第二个异常话题互动数据融合至欺诈主题为Fraud theme_Q的数据融合列表对应风险标签下;第一局部话题互动数据中的第三个异常话题互动数据的欺诈主题为欺诈主题欺诈主题Fraud theme_P,即将该第三个异常话题互动数据融合至欺诈主题为Fraud theme_P的数据融合列表对应风险标签下;直至将第一局部话题互动数据中的全部异常话题互动数据融合完成,这样能够准确可靠的实现将第一局部话题互动数据融合至x个数据融合列表的对应风险标签下。
在本发明实施例中,通过没有被融合的异常话题互动数据中的第一局部话题互动数据匹配的第一风险标签,将第一局部话题互动数据融合至x个数据融合列表的对应风险标签下,可以对已经完成融合的异常话题互动数据进行适应性扩展优化,这样可以实现对异常话题互动数据记录中异常话题互动数据的针对性分治处理。
对于一种可能的技术方案而言,本发明实施例还可以示出又一种基于大数据话题分析的风险识别方法的具体过程,示例性的可以包括如下步骤。
步骤301、确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述;其中,所述异常话题互动数据记录中每个异常话题互动数据反映识别出用户会话事件的顺序特征和分布特征中的至少一种。
步骤302、通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表。
步骤303、确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述;所述第一欺诈倾向描述和所述第二欺诈倾向描述为所述用户会话事件的不同会话阶段的欺诈倾向描述。
步骤304、通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下。
步骤305、通过所述用户会话事件的第二欺诈倾向描述,确定所述没有被融合的异常话题互动数据中第二局部话题互动数据匹配的第二风险标签。
举例而言,所述第二风险标签包含于所述x个数据融合列表匹配的风险标签下;所述第二局部话题互动数据匹配的第二风险标签的可信指数,小于所述第一局部话题互动数据匹配的第一风险标签的可信指数。
第二局部话题互动数据匹配的第二风险标签的可信指数可以不大于目标判定值且不小于设定判定值。在一些可能的实施例中,设定判定值可以是0.7。在另一些可能的实施例中,设定判定值可以为其它,比如:设定判定值可以为0.6或者0.8等等。
在一些可能的实施例中,第二会话阶段异常话题互动数据可以为没有被融合的异常话题互动数据中除第一局部话题互动数据之外的全部或局部话题互动数据。第二局部话题互动数据可以为难以通过用户会话事件的第二欺诈倾向描述进行适应性扩展优化融合的异常话题互动数据,或者难以通过用户会话事件的第二欺诈倾向描述将第二局部话题互动数据适应性扩展优化到x个数据融合列表中。
在一些可能的实施例中,步骤305可以根据如下步骤进行实现:确定所述异常话题互动数据记录中已经完成融合的异常话题互动数据匹配的用户会话事件的第三欺诈倾向描述;所述用户会话事件的第三欺诈倾向描述与所述用户会话事件的第二欺诈倾向描述,为所述用户会话事件的相同会话阶段的欺诈倾向描述;确定每个所述用户会话事件的第二欺诈倾向描述与所述用户会话事件的第三欺诈倾向描述之间的指定描述共性系数;通过所述指定描述共性系数,确定所述第二局部话题互动数据匹配的第二风险标签。
可以理解的是,可以通过设定数目个指定描述共性系数,确定第二局部话题互动数据匹配的第二风险标签。
如此设计,通过每个用户会话事件的第二欺诈倾向描述与用户会话事件的第三欺诈倾向描述之间的指定描述共性系数,确定第二局部话题互动数据匹配的第二风险标签,从而提供了一种确定第二局部话题互动数据匹配的第二风险标签的思路,可以基于第二局部话题互动数据匹配的第二风险标签,对已经完成融合的异常话题互动数据进行适应性扩展优化。
在一些可能的实施例中,所述通过所述指定描述共性系数,确定所述第二局部话题互动数据匹配的第二风险标签,包括:将小于第一判定值且不小于第二判定值的指定描述共性系数所匹配的用户会话事件的第二欺诈倾向描述对应的异常话题互动数据,作为所述第二局部话题互动数据;将小于所述第一判定值且不小于所述第二判定值的指定描述共性系数所匹配的用户会话事件的第三欺诈倾向描述对应的欺诈主题,作为所述第二局部话题互动数据匹配的第二风险标签。
举例而言,可以确定第二异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述,分别与H个异常话题互动数据匹配的用户会话事件的第三欺诈倾向描述之间的H个描述共性系数中的第二指定描述共性系数,若第二指定描述共性系数小于所述第一判定值且不小于第二判定值,则反映第二异常话题互动数据匹配的用户会话事件与第二指定描述共性系数匹配的第二设定异常话题互动数据匹配的用户会话事件(包含于H个异常话题互动数据匹配的用户会话事件中)可能相似,可能相似难以通过第二欺诈倾向描述将第二异常话题互动数据适应性扩展优化到x个数据融合列表中,但是可以确定第二异常话题互动数据的风险标签可以趋近于第二设定异常话题互动数据匹配的风险标签,第二异常话题互动数据匹配的风险标签为第二设定异常话题互动数据匹配的风险标签。
举例而言,在用户会话事件的第二欺诈倾向描述Propensity to cheat_2分别与用户会话事件的第三欺诈倾向描述Propensity to cheat_1、用户会话事件的第三欺诈倾向描述Propensity to cheat_2、用户会话事件的第三欺诈倾向描述Propensity tocheat_3之间的3个描述共性系数中的指定描述共性系数,小于第一判定值且不小于第二判定值的基础上,可以确定用户会话事件的第二欺诈倾向描述Propensity to cheat_2匹配的异常话题互动数据包含于第二局部话题互动数据中。此外,指定描述共性系数对应用户会话事件的第三欺诈倾向描述Propensity to cheat_2,从而可以将用户会话事件的第三欺诈倾向描述Propensity to cheat_2匹配的异常话题互动数据的风险标签,作为用户会话事件的第二欺诈倾向描述Propensity to cheat_2匹配的异常话题互动数据的风险标签。
在一些可能的实施例中,还可以确定第三异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述,分别与H个异常话题互动数据匹配的用户会话事件的第三欺诈倾向描述之间的H个描述共性系数中的第三指定描述共性系数,若第三指定描述共性系数小于第二判定值,则反映第三异常话题互动数据匹配的用户会话事件与第三指定描述共性系数匹配的第三设定异常话题互动数据匹配的用户会话事件(包含于H个异常话题互动数据匹配的用户会话事件中)不相似,这样将第三异常话题互动数据不仅能够不总结到第一局部话题互动数据中,而且能够不总结到第二局部话题互动数据中。
第一异常话题互动数据、第二异常话题互动数据或者第三异常话题互动数据可以是没有被融合的异常话题互动数据中的任一个异常话题互动数据。
第一判定值和第二判定值皆可以是大于0且小于1的值。第一判定值不小于第二判定值。比如,在一些可能的实施例中,第一判定值可以为0.4,第二判定值可以为0.35。在另一些可能的实施例中,第一判定值和第二判定值可以为其它值,本发明实施例对此不作进一步限制,比如,第一判定值可以为0.4,第二判定值可以为0.3,或者,第一判定值可以为0.45,第二判定值可以为0.35。
如此设计,这样能够方便且快捷的从没有被融合的异常话题互动数据中,确定出满足要求的第二局部话题互动数据和第二局部话题互动数据匹配的第二风险标签。
步骤306、通过所述第二局部话题互动数据匹配的第二风险标签以及所述第二局部话题互动数据中的顺序特征和分布特征中的至少一种,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签。
在一些可能的实施例中,若第二局部话题互动数据的顺序特征在设定顺序区间内,则基于第二局部话题互动数据匹配的第二风险标签,将第二局部话题互动数据中的至少部分互动数据适应性扩展优化到第二风险标签下。比如,若第二局部话题互动数据的时段是非活跃时段,采集得到的交互事件存在误差,为了提高融合质量,若第二局部话题互动数据的顺序特征是非活跃时段,则基于第二局部话题互动数据匹配的第二风险标签,将第二局部话题互动数据中的至少部分互动数据适应性扩展优化到第二风险标签下,可以提高融合效果。又比如,可以确定顺序特征为设定顺序区间的第二局部话题互动数据,基于第二局部话题互动数据匹配的第二风险标签,将时段为设定顺序区间的第二局部话题互动数据适应性扩展优化到第二风险标签下。
在另一些可能的实施例中,若第二局部话题互动数据的分布特征为包含于预设数据集中,则基于第二局部话题互动数据匹配的第二风险标签,将第二局部话题互动数据中的至少部分互动数据适应性扩展优化到第二风险标签下。又比如,可以确定分布特征为预设数据集的第二局部话题互动数据,基于第二局部话题互动数据匹配的第二风险标签,将分布特征为预设数据集的第二局部话题互动数据适应性扩展优化到第二风险标签下。
在一些可能的实施例中,步骤306可以根据如下步骤进行实现:确定与所述第二局部话题互动数据中的顺序特征存在设定时序差异的顺序区间;确定与所述第二局部话题互动数据中的分布特征存在设定分布差异的神经网络模型;确定所述神经网络模型确定的所述顺序区间内的数据采集线程属性;所述数据采集线程属性反映识别出数据采集线程的顺序特征和分布特征中的至少一种;通过所述第二局部话题互动数据匹配的第二风险标签和所述数据采集线程属性,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签。
举例而言,以第二局部话题互动数据中的一个设定异常话题互动数据进行举例说明,设定异常话题互动数据可以是第二局部话题互动数据中的其中一个异常话题互动数据,首先确定设定异常话题互动数据的顺序特征,再确定与设定异常话题互动数据的顺序特征存在设定时序差异的顺序区间,确定与所述第二局部话题互动数据中的分布特征存在设定分布差异的神经网络模型。在确定到顺序区间和神经网络模型的前提下,可以确定神经网络模型确定的顺序区间内的数据采集线程属性;基于设定异常话题互动数据的风险标签以及确定的数据采集线程属性,确定是否将设定异常话题互动数据融合至所述x个数据融合列表的对应风险标签下。本发明实施例中的数据采集线程属性包括数据采集线程的不同层面和维度的线程特征。
如此设计,通过确定神经网络模型确定的顺序区间内的数据采集线程属性,然后基于第二风险标签和数据采集线程属性,将第二局部话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下,这样一来,通过数据采集线程属性的协助来适应性扩展优化融合,可以提高将第二局部话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下的精度。
在一些可能的实施例中,所述通过所述第二局部话题互动数据匹配的第二风险标签和所述数据采集线程属性,将所述第二局部话题互动数据中的至少部分互动数据融合至所述第二风险标签,包括:通过所述第二局部话题互动数据匹配的第二风险标签,确定所述第二局部话题互动数据对应的第一用户会话事件关键词;确定所述数据采集线程属性对应的第二用户会话事件关键词;从所述第一用户会话事件关键词中,确定包含于所述第二用户会话事件关键词中的目标用户会话事件关键词;通过所述目标用户会话事件关键词对应的异常话题互动数据匹配的风险标签,将所述目标用户会话事件关键词对应的异常话题互动数据融合至所述第二风险标签。
通过第二局部话题互动数据匹配的第二风险标签,能够得知第二局部话题互动数据中每个异常话题互动数据的待定欺诈主题,进而基于第二局部话题互动数据中每个异常话题互动数据的待定欺诈主题,确定第二局部话题互动数据中每个异常话题互动数据对应的第一用户会话事件关键词。各个数据采集线程属性可以关联有一个第二用户会话事件关键词,不一致的数据采集线程属性对应的第二用户会话事件关键词可以一致或者不一致。第一用户会话事件关键词和第二用户会话事件关键词可以是单独用于关键词用户会话事件的关键词。第一用户会话事件关键词和第二用户会话事件关键词可以是语义关键词(比如:ID)。
目标用户会话事件关键词可以是第一用户会话事件关键词与第二用户会话事件关键词之间的同一关键词。如果第二局部话题互动数据中的某一个异常话题互动数据匹配的第一用户会话事件关键词,包含于第二用户会话事件关键词中,则反映该异常话题互动数据的待定风险标签可以是该异常话题互动数据的真实风险标签,从而可以将该异常话题互动数据适应性扩展优化到确定的待定风险标签下。而如果第二局部话题互动数据中的某一个异常话题互动数据匹配的第一用户会话事件关键词,没有包含于第二用户会话事件关键词中,则表明该异常话题互动数据的待定风险标签不是该异常话题互动数据的实际风险标签,从而不会对该异常话题互动数据进行风险标签。
如此设计,从第一用户会话事件关键词中,确定包含于第二用户会话事件关键词中的目标用户会话事件关键词;基于目标用户会话事件关键词对应的异常话题互动数据匹配的风险标签,将目标用户会话事件关键词对应的异常话题互动数据补融合至x个数据融合列表的对应风险标签下,可以提高适应性扩展优化的数据融合列表的可信度。
在本发明实施例中,鉴于第二局部话题互动数据匹配的第二风险标签的可信指数,小于第一局部话题互动数据匹配的第一风险标签的可信指数,由此通过第二局部话题互动数据中的顺序特征和分布特征中的至少一种的协助来适应性扩展优化融合,这样可以提高将第二局部话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下的精度。
对于一种可能的技术方案而言,本发明实施例还可以示出另一种基于大数据话题分析的风险识别方法的具体过程,进一步的,该方法示例性的可以包括如下内容。
步骤401、确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述;其中,所述异常话题互动数据记录中每个异常话题互动数据反映识别出用户会话事件的顺序特征和分布特征中的至少一种。
步骤402、通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表。
步骤403、在所述异常话题互动数据记录中匹配的所有用户会话事件的第一欺诈倾向描述中,将与剩余用户会话事件的第一欺诈倾向描述之间的描述共性系数中的指定描述共性系数,小于第三判定值且不小于第四判定值的用户会话事件的第一欺诈倾向描述所匹配的异常话题互动数据,作为目标异常话题互动数据。
可以理解的是,目标异常话题互动数据是从没有被融合的异常话题互动数据中选出的,目标异常话题互动数据可以是没有被融合的异常话题互动数据中的至少部分互动数据异常话题互动数据。
举例而言,异常话题互动数据记录中的U个异常话题互动数据分别对应U个用户会话事件的第一欺诈倾向描述,分别确定第u(1≤u≤U)个用户会话事件的第一欺诈倾向描述与剩余U-1个用户会话事件的第一欺诈倾向描述之间的U-1个描述共性系数,确定U-1个描述共性系数中的指定描述共性系数,若U-1个描述共性系数中的指定描述共性系数小于第三判定值且不小于第四判定值,则将第U个用户会话事件的第一欺诈倾向描述匹配的异常话题互动数据总结为目标异常话题互动数据,从而可以从U个异常话题互动数据中确定出目标异常话题互动数据。
在U-1个描述共性系数中的指定描述共性系数不小于第三判定值的基础上,则可以将通过U个用户会话事件的第一欺诈倾向描述,将第U个用户会话事件的第一欺诈倾向描述匹配的异常话题互动数据,与指定描述共性系数对应第k个用户会话事件的第一欺诈倾向描述(包含于U-1个用户会话事件的第一欺诈倾向描述中)匹配的异常话题互动数据融合在一起。
在U-1个描述共性系数中的指定描述共性系数小于第四判定值的基础上,则反映第U个用户会话事件与剩余其中一个用户会话事件皆不匹配,在一些可能的实施例中,可以通过第U个用户会话事件的第二欺诈倾向描述,确定是否能够将第U个用户会话事件匹配的异常话题互动数据进行融合;在否的前提下,还可以考虑是否采用第U个用户会话事件匹配的异常话题互动数据的分布特征和/或顺序特征,对第U个用户会话事件匹配的异常话题互动数据进行融合。
在另一些可能的实施例中,在U-1个描述共性系数中的指定描述共性系数小于第四判定值的前提下,则可以直接将第U个用户会话事件匹配的异常话题互动数据作为已冻结的话题互动数据,以不会对第U个用户会话事件匹配的异常话题互动数据进行融合。
步骤404、确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述;所述第一欺诈倾向描述和所述第二欺诈倾向描述为所述用户会话事件的不同会话阶段的欺诈倾向描述。
步骤405、通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下。
步骤406、通过所述用户会话事件的第二欺诈倾向描述,确定所述没有被融合的异常话题互动数据中第二局部话题互动数据匹配的第二风险标签。
其中,所述第二风险标签包含于所述x个数据融合列表匹配的风险标签下;所述第二局部话题互动数据匹配的第二风险标签的可信指数,小于所述第一局部话题互动数据匹配的第一风险标签的可信指数。
步骤407、通过所述目标异常话题互动数据和所述第二局部话题互动数据的关联话题互动数据匹配的风险标签和所述关联话题互动数据中的顺序特征和分布特征中的至少一种,将所述关联话题互动数据中的至少部分互动数据融合至所述第二风险标签。
可以理解的是,关联话题互动数据指向第二局部话题互动数据,从而可以根据第二局部话题互动数据匹配的第二风险标签,能够确定关联话题互动数据匹配的风险标签。
在一些可能的实施例中,步骤407示例性的可以包括如下内容:确定与所述关联话题互动数据中的顺序特征存在设定时序差异的顺序区间;确定与所述关联话题互动数据中的分布特征存在设定分布差异的神经网络模型;确定所述神经网络模型确定的所述顺序区间内的数据采集线程属性;所述数据采集线程属性反映识别出数据采集线程的顺序特征和分布特征中的至少一种;通过所述关联话题互动数据匹配的风险标签和所述数据采集线程属性,将所述关联话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下。
在一些可能的实施例中,通过所述关联话题互动数据匹配的风险标签和所述数据采集线程属性,将所述关联话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下,示例性的可以包括:通过所述关联话题互动数据匹配的风险标签,确定所述关联话题互动数据对应的第一用户会话事件关键词;确定所述数据采集线程属性对应的第二用户会话事件关键词;从所述第一用户会话事件关键词中,确定包含于所述第二用户会话事件关键词中的目标用户会话事件关键词;通过所述目标用户会话事件关键词对应的异常话题互动数据匹配的风险标签,将所述目标用户会话事件关键词对应的异常话题互动数据融合至x个数据融合列表的对应风险标签下。
在本发明实施例中,基于目标异常话题互动数据和第二局部话题互动数据的关联话题互动数据匹配的风险标签和关联话题互动数据中的顺序特征和分布特征中的至少一种,将关联话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下,从而融合至x个数据融合列表的对应风险标签下的异常话题互动数据是关联话题互动数据的至少部分互动数据,这样不仅可以降低资源浪费,还能够提高适应性扩展优化的数据融合列表的可信度。
对于一种可能的技术方案而言,本发明实施例还可以示出另一种基于大数据话题分析的风险识别方法的具体过程,该方法示例性的可以包括如下步骤。
步骤501、确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述;其中,所述异常话题互动数据记录中每个异常话题互动数据反映识别出用户会话事件的顺序特征和分布特征中的至少一种。
步骤502、通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表。
步骤503、确定每个所述数据融合列表匹配的显著性数据集的第一欺诈倾向描述。
可以理解的是,一个数据融合列表中可以包括至少两个异常话题互动数据,至少两个异常话题互动数据中的每个异常话题互动数据中可以包括一个用户会话事件的交互事件和/或包括一个用户会话事件的第一欺诈倾向描述。显著性数据集的第一欺诈倾向描述可以与至少两个异常话题互动数据中的其中一个异常话题互动数据对应。显著性数据集可以是热度较高或者热力分布指数较大的互动数据集。
步骤504、依据每个所述显著性数据集的第一欺诈倾向描述和记录于云服务空间中多个参考数据集的第一欺诈倾向描述,从所述多个参考数据集中确定与每个所述显著性数据集指向相同用户会话事件的目标参考数据集。
云服务空间中可以记录有若干参考数据集和/或若干参考数据集的第一欺诈倾向描述。其中,存在差异的参考数据集匹配的存在差异的用户会话事件。
如此设计,在得到x个数据融合列表后,可以确定各数据融合列表匹配的显著性数据集的第一欺诈倾向描述,然后将显著性数据集的第一欺诈倾向描述与若干参考数据集的第一欺诈倾向描述分别计算描述共性系数,将描述共性系数最高的参考数据集,与该数据融合列表匹配的显著性数据集作为指向相同用户会话事件,从而可以得到x个数据融合列表中各个数据融合列表指向相同用户会话事件的参考数据集。在一些可能的实施例中,不同的数据融合列表匹配的参考数据集可以不一致。在另一些可能的实施中,可以存在至少两个数据融合列表匹配的参考数据集相同。在至少两个数据融合列表匹配的参考数据集相同的基础上,可以整合该至少两个数据融合列表,从而使得不同的数据融合列表对应不同的参考数据集,进而能够基于用户会话事件的不同,对异常话题互动数据记录进行风险标签。
步骤505、从所述云服务空间中确定与所述目标参考数据集对应的用户会话事件的要素内容。
云服务空间中可以记录与目标参考数据集对应的用户会话事件的要素内容,用户会话事件的要素内容可以根据实际情况进行扩展,在此不作赘述。
步骤506、确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述;所述第一欺诈倾向描述和所述第二欺诈倾向描述为所述用户会话事件的不同会话阶段的欺诈倾向描述。
步骤507、通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下。
在本发明实施例中,通过从若干参考数据集中确定与每个显著性数据集指向相同用户会话事件的目标参考数据集,从云服务空间中确定与目标参考数据集对应的用户会话事件的要素内容(可以理解为属性信息),可以得到各个风险标签下用户会话事件的要素内容,进而能够对异常话题互动数据记录匹配的用户会话事件进行深度的提取。
对于一种可能的技术方案而言,本发明实施例还可以示出又一种基于大数据话题分析的风险识别方法的具体过程,进一步的,该方法示例性的可以包括如下步骤。
步骤601、确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述;其中,所述异常话题互动数据记录中每个异常话题互动数据反映识别出用户会话事件的顺序特征和分布特征中的至少一种。
步骤602、确定所述异常话题互动数据记录中匹配的所有用户会话事件的第一欺诈倾向描述中,任两个用户会话事件的第一欺诈倾向描述之间的描述共性系数。
举例而言,异常话题互动数据记录中包括异常话题互动数据Interactive data_1、异常话题互动数据Interactive data_2、异常话题互动数据Interactive data_3和异常话题互动数据Interactive data_4,各个异常话题互动数据对应一个用户会话事件的第一欺诈倾向描述。可以逐一计算异常话题互动数据Interactive data_1和异常话题互动数据Interactive data_2匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数,计算异常话题互动数据Interactive data_1和异常话题互动数据Interactive data_3匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数,计算异常话题互动数据Interactive data_1和异常话题互动数据Interactive data_4匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数,计算异常话题互动数据Interactive data_2和异常话题互动数据Interactive data_3匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数,计算异常话题互动数据Interactive data_2和异常话题互动数据Interactive data_3匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数,计算异常话题互动数据Interactive data_3和异常话题互动数据Interactive data_4匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数。
步骤603、将不小于第三判定值的描述共性系数所匹配的两个异常话题互动数据归为相同用户会话事件的异常话题互动数据,得到所述x个数据融合列表。
比如,若异常话题互动数据Interactive data_1和异常话题互动数据Interactive data_2匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数不小于第三判定值,异常话题互动数据Interactive data_1和异常话题互动数据Interactive data_4匹配的两个用户会话事件的第一欺诈倾向描述之间的描述共性系数不小于第三判定值,则将异常话题互动数据Interactive data_1、异常话题互动数据Interactive data_2以及异常话题互动数据Interactive data_4总结为同一个类型。
x个数据融合列表中每个数据融合列表涵盖的异常话题互动数据的数量可以不小于2个。
步骤604、确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述;所述第一欺诈倾向描述和所述第二欺诈倾向描述为所述用户会话事件的不同会话阶段的欺诈倾向描述。
在一些可能的实施例中,没有被融合的异常话题互动数据中的其中一个异常话题互动数据可以是与剩余异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述之间的描述共性系数皆小于第三判定值。如此,异常话题互动数据记录由x个数据融合列表涵盖的所有异常话题互动数据和没有被融合的异常话题互动数据构成。
在另一些可能的实施例中,没有被融合的异常话题互动数据中的任一个异常话题互动数据可以是剩余异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述之间的描述共性系数皆小于第三判定值且不小于第四判定值。
第三判定值和第四判定值皆可以是大于0且小于1的值。第三判定值大于第四判定值。比如,在一些可能的实施例中,第三判定值可以为0.8,第四判定值可以为0.7。在另一些可能的实施例中,第三判定值和第四判定值可以为其它值,本发明实施例对此不作进一步限制,比如,第三判定值可以为0.4,第四判定值可以为0.3,或者,第三判定值可以为0.45,第四判定值可以为0.35。
在一些可能的实施例中,第三判定值可以与第一判定值一致,第四判定值可以与第二判定值一致。
步骤605、通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下。
在本发明实施例中,将不小于第三判定值的描述共性系数所匹配的两个异常话题互动数据总结相同用户会话事件的异常话题互动数据,得到x个数据融合列表,可以将描述共性系数较高的用户会话事件总结为同一个类型,可以提高得到的数据融合列表的精度。
在本发明实施例中,借助若干环境中获取的隐私、非隐私交互事件,以及隐私和非隐私的关联关键词等,在根据隐私特征进行融合后,通过非隐私信息作为隐私融合适应性扩展优化,并将数据采集线程属性作为隐私融合的适应性扩展优化,这样可以实现对异常话题互动数据记录中异常话题互动数据的针对性分治处理,从而为话题欺诈风险识别提供精准简要的分析依据。
在一些可独立实施的设计思路下,在将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下之后,该方法还可以包括以下内容:根据所述x个数据融合列表中的每个数据融合列表下的分治互动数据,确定所述异常话题互动数据记录的欺诈风险识别结果。
在本发明实施例中,每个数据融合列表可以对应不同的分类结果,每个数据融合列表下分治互动数据可以理解为不同类别的或者具有不同数据特性的数据,这样一来,可以基于不同类别的或者具有不同数据特性的数据针对性且全面地确定异常话题互动数据记录的欺诈风险识别结果。
在一些可独立实施的设计思路下,根据所述x个数据融合列表中的每个数据融合列表下的分治互动数据,确定所述异常话题互动数据记录的欺诈风险识别结果,可以包括以下内容:确定每个数据融合列表下的分治互动数据的互动偏好特征;通过所述互动偏好特征确定所述异常话题互动数据记录的欺诈风险识别结果。
在本发明实施例中,互动偏好特征可以通过预设的卷积神经网络进行特征提取得到,在获得互动偏好特征之后,可以进一步精准快速地定位异常话题互动数据记录的欺诈风险识别结果,可以理解的是,不同的互动偏好特征可能对应不同的欺诈风险识别结果,这样可以保障异常话题互动数据记录的完整性。
在一些可独立实施的设计思路下,通过所述互动偏好特征确定所述异常话题互动数据记录的欺诈风险识别结果,可以通过以下技术方案实现:基于所述互动偏好特征确定待进行欺诈定位处理的目标意图向量分布;对所述目标意图向量分布中的多个意图向量分别进行主动型欺诈定位和被动型欺诈定位,得到主动型欺诈定位结果集和被动型欺诈定位结果集;依据第一特征优化模型,对所述主动型欺诈定位结果集进行第一特征优化处理,得到包括有主动型欺诈活动的第一意图向量集;依据第二特征优化模型,对所述被动型欺诈定位结果集进行第二特征优化处理,得到包括有被动型欺诈活动的第二意图向量集;基于所述第一意图向量集和所述第二意图向量集进行整合处理,得到所述目标意图向量分布中与目标欺诈活动相匹配的目标意图向量集;所述目标欺诈活动包括主动型欺诈活动和被动型欺诈活动中的至少一种,所述目标意图向量集用于对所述目标意图向量分布进行欺诈定位处理;经由所述目标意图向量集对所述目标意图向量分布进行欺诈定位处理,得到所述异常话题互动数据记录的欺诈风险识别结果。如此设计,能够从主动欺诈和被动欺诈两个大方面出发,以准确完整地得到异常话题互动数据记录的欺诈风险识别结果。
基于同样的发明构思,图2示出了本发明实施例提供的的一种基于大数据话题分析的风险识别装置的模块框图,一种基于大数据话题分析的风险识别装置可以包括实施图1所示的相关方法步骤的如下模块。
描述确定模块21,用于确定异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述。
数据融合模块22,用于通过所述用户会话事件的第一欺诈倾向描述,对所述异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,得到x个数据融合列表。
描述查找模块23,用于确定所述异常话题互动数据记录中,没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述。
数据优化模块24,用于通过所述用户会话事件的第二欺诈倾向描述,将所述没有被融合的异常话题互动数据中的至少部分互动数据融合至所述x个数据融合列表的对应风险标签下。
应用于本发明的相关实施例可以达到如下技术效果:基于异常话题互动数据记录中各异常话题互动数据匹配的用户会话事件的第一欺诈倾向描述,对异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据进行融合,可以提取异常话题互动数据记录中指向相同用户会话事件的异常话题互动数据,进而能够充分考虑异常话题互动数据记录中涵盖的异常话题互动数据的潜在特征;此外,鉴于通过没有被融合的异常话题互动数据匹配的用户会话事件的第二欺诈倾向描述,将没有被融合的异常话题互动数据中的至少部分互动数据融合至x个数据融合列表的对应风险标签下,可以通过用户会话事件的第二欺诈倾向描述,对通过第一欺诈倾向描述进行融合得到的数据融合列表进行适应性扩展优化,这样可以实现对异常话题互动数据记录中异常话题互动数据的针对性分治处理,从而为话题欺诈风险识别提供精准简要的分析依据,这样能够实现精准快速的话题欺诈风险识别。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。