发明内容
本发明提供一种结合云计算的跨境电商信息风险分析方法及服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种结合云计算的跨境电商信息风险分析方法,应用于云计算服务器,所述方法包括:
在接收到跨境电商平台系统发送的信息风险分析请求时,根据所述信息风险分析请求确定满足分析条件的目标跨境电商异检日志,并获得目标跨境电商异检日志中的跨境电商异检项目的第一异常会话短语向量、第一项目主题短语向量和项目主题分析数据;
通过所述项目主题分析数据,以及已记录的项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,确定与所述项目主题分析数据配对的项目主题对应的指定跨境电商异检日志;
根据所述目标跨境电商异检日志与各组所述指定跨境电商异检日志所适配的信息风险检测清单之间的第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单;其中,所述第一综合匹配指数根据所述第一异常会话短语向量、所述第一项目主题短语向量,以及所述信息风险检测清单对应的异常会话显著表达和项目主题显著表达所生成。
对于一种可示性实施例而言,所述根据所述目标跨境电商异检日志与各组所述指定跨境电商异检日志所适配的信息风险检测清单之间的第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单,包括:
确定各所述指定跨境电商异检日志所适配的信息风险检测清单依次匹配的异常会话显著表达和项目主题显著表达;
根据所述第一异常会话短语向量和第一项目主题短语向量,与各所述信息风险检测清单对应的所述异常会话显著表达和项目主题显著表达之间的量化匹配评分,确定所述第一综合匹配指数;
通过所述第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单。
对于一种可示性实施例而言,所述根据所述第一异常会话短语向量和第一项目主题短语向量,与各所述信息风险检测清单对应的所述异常会话显著表达和项目主题显著表达之间的量化匹配评分,确定所述第一综合匹配指数,包括:
确定所述第一异常会话短语向量,与各所述信息风险检测清单对应的所述异常会话显著表达之间的量化匹配评分matching value5;
确定所述第一项目主题短语向量,与各所述信息风险检测清单对应的所述项目主题显著表达之间的量化匹配评分matching value6;
通过所述量化匹配评分matching value5与所述量化匹配评分matching value6,得到所述第一综合匹配指数。
对于一种可示性实施例而言,所述通过所述第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单,包括:
依据所述第一综合匹配指数中的最高量化匹配评分大于或等于指定判定值,将所述目标跨境电商异检日志剪切到所述最高量化匹配评分对应的指定跨境电商异检日志所对应的信息风险检测清单;
依据所述第一综合匹配指数中的最高量化匹配评分小于所述指定判定值,创立候选信息风险检测清单,并将所述目标跨境电商异检日志剪切到所述候选信息风险检测清单。
对于一种可示性实施例而言,当通过所述项目主题分析数据,以及已记录的项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,未确定出与所述项目主题分析数据配对的项目主题对应的指定跨境电商异检日志时,所述方法还包括:
根据所述目标跨境电商异检日志与各组携带风险意图关键词的跨境电商异检日志之间的第二综合匹配指数,将所述携带风险意图关键词的跨境电商异检日志中,与所述目标跨境电商异检日志之间量化匹配评分最高的第一数量组跨境电商异检日志,视为所述指定跨境电商异检日志;其中,所述第二综合匹配指数根据所述第一异常会话短语向量、所述第一项目主题短语向量,以及所述携带风险意图关键词的跨境电商异检日志对应的第二异常会话短语向量和第二项目主题短语向量所生成。
对于一种可示性实施例而言,确定所述第一数量组跨境电商异检日志的方法,包括:
确定各组携带风险意图关键词的跨境电商异检日志中跨境电商异检项目的第二异常会话短语向量、第二项目主题短语向量;
通过所述第一异常会话短语向量与所述第二异常会话短语向量之间的量化匹配评分,确定所述携带风险意图关键词的跨境电商异检日志中,与所述目标跨境电商异检日志量化匹配评分最高的第二数量组第二跨境电商异检日志;
通过所述第一项目主题短语向量与所述第二项目主题短语向量之间的量化匹配评分,确定所述携带风险意图关键词的跨境电商异检日志中,与所述目标跨境电商异检日志量化匹配评分最高的第三数量组第三跨境电商异检日志;
根据所述第二数量组所述第二跨境电商异检日志和第三数量组所述第三跨境电商异检日志,确定所述第一数量组跨境电商异检日志;其中,所述第三数量与第二数量的和值不小于第一数量。
对于一种可示性实施例而言,通过持续性更新项目主题与跨境电商异检日志对应的跨境电商异检日志标签之间的匹配描述来持续性更新所述关联列表,且云计算服务器的风险分析线程中具有第一描述集,所述第一描述集以指定方式记录所述匹配描述。
对于一种可示性实施例而言,云计算服务器的风险分析线程中具有第二描述集,外存中具有第三描述集;其中,所述第二描述集记录了在目标周期内触发活跃性检测条件的描述数组;所述第三描述集中记录了在所述目标周期内没有触发活跃性检测条件的描述数组;所述描述数组包括信息风险检测清单对应的异常会话显著表达与项目主题显著表达。
对于一种可示性实施例而言,获取所述异常会话显著表达和项目主题显著表达的方法包括:
确定各所述指定跨境电商异检日志所适配的信息风险检测清单;
针对各所述信息风险检测清单,在所述第二描述集中,确定与所述信息风险检测清单对应的描述数组;
依据确定到所述信息风险检测清单对应的描述数组,将确定到的描述数组视为需获得的异常会话显著表达和项目主题显著表达;
依据未确定出所述信息风险检测清单对应的描述数组,在所述第三描述集中,确定与所述信息风险检测清单对应的描述数组,并将确定到的描述数组视为需获得的异常会话显著表达和项目主题显著表达。
对于一种可示性实施例而言,所述方法还包括:依据在所述第三描述集中确定到所述异常会话显著表达与项目主题显著表达,将确定到的所述异常会话显著表达与项目主题显著表达迁移到所述第二描述集内的描述数组classification1中。
对于一种可示性实施例而言,所述方法还包括:
循环确定所述第二描述集中已记录的每一描述数组对应的无效累计周期是否大于或等于所述目标周期;所述无效累计周期指示所述描述数组没有触发活跃性检测条件的累计时间;
依据其中一个描述数组对应的无效累计周期大于或等于所述目标周期,在所述第二描述集中过滤掉所述其中一个描述数组,并将所述其中一个描述数组添加到所述第三描述集。
对于一种可示性实施例而言,在确定所述目标跨境电商异检日志所适配的信息风险检测清单之后,所述方法还包括:
将所述目标跨境电商异检日志对应的异常检测文本迁移到所述信息风险检测清单;其中,所述异常检测文本包括以下至少一项:跨境电商异检日志的文本内容特征;跨境电商异检日志标签;第一异常会话短语向量;第一项目主题短语向量;项目主题分析数据。
对于一种可示性实施例而言,在完成针对所述目标跨境电商异检日志的检测清单匹配之后,根据所述第一异常会话短语向量与所述第一项目主题短语向量,分别优化所述目标跨境电商异检日志所适配的信息风险检测清单对应的异常会话显著表达与项目主题显著表达;根据所述项目主题分析数据,更新所述关联列表。
第二方面是一种云计算服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述云计算服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
根据本发明的一个实施例,在对目标跨境电商异检日志进行信息风险检测清单匹配的过程中,可以基于对应的项目主题进行跨境电商异检日志的快速检索,可以依据项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,进行指定跨境电商异检日志的确定,且所适配的信息风险检测清单所依据的第一综合匹配指数基于少量的短语向量和显著表达得到,因而能够提高信息风险检测清单配对的时效性,并且能够在一定程度上确保目标跨境电商异检日志的归纳分析准确性和可靠性。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的一种结合云计算的跨境电商信息风险分析方法的流程示意图,一种结合云计算的跨境电商信息风险分析方法可以通过云计算服务器实现,云计算服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述云计算服务器执行如下步骤所描述的技术方案。
步骤12、在接收到跨境电商平台系统发送的信息风险分析请求时,根据所述信息风险分析请求确定满足分析条件的目标跨境电商异检日志,并获得目标跨境电商异检日志中的跨境电商异检项目的第一异常会话短语向量、第一项目主题短语向量和项目主题分析数据。
在本发明实施例中,跨境电商平台系统与云计算服务器通信连接。进一步地,跨境电商平台系统向云计算服务器发送对目标跨境电商异检日志进行风险分析的指令(信息风险分析请求),云计算服务器可以依据信息风险分析请求确定对应的目标跨境电商异检日志。换言之,满足分析条件的目标跨境电商异检日志可以理解为待进行清单匹配/分类的跨境电商异检日志,而跨境电商异检日志可以理解为针对跨境电商业务的异常行为/活动检测报告。
在本发明实施例中,所述目标跨境电商异检日志可以是设置在电商异检日志捕捉线程(比如:日志捕捉模块或者日志捕捉单元等)对于跨境电商业务捕捉的异检日志信息,或者是对捕捉的所述异检日志进行跨境电商异检得到的异检日志。上述异检日志中可以包括跨境电商异检项目以及项目主题事件。所述项目主题事件可以为所述跨境电商异检项目的衍生数据。
比如:日志捕捉单元可以针对存在于跨境电商活动记录中的每一跨境电商活动项目分别采集跨境电商异检日志。日志捕捉单元捕捉的该跨境电商异检日志可以为目标跨境电商异检日志。再比如:日志捕捉单元捕捉的异检日志中可能涵盖若干组跨境电商活动项目,则可以对该捕捉的异检日志进行跨境电商异检,得到每一跨境电商活动项目对应的跨境电商异检日志。每一跨境电商活动项目对应的跨境电商异检日志都为目标跨境电商异检日志。
本发明将已确定所匹配信息风险检测清单的跨境电商异检日志称作携带风险意图关键词的跨境电商异检日志,将需要确定所匹配信息风险检测清单的跨境电商异检日志称作目标跨境电商异检日志。所述信息风险检测清单内可以融合一些跨境电商异检日志,这些跨境电商异检日志具有类似的异常会话短语向量与项目主题短语向量,可以理解为信息风险检测清单中融合了针对同一组跨境电商活动项目(项目主题)捕捉的跨境电商异检日志。
进一步地,为了辨别异常会话短语向量与项目主题短语向量的初始根源,本发明将从目标跨境电商异检日志中得到的异常会话短语向量称作第一异常会话短语向量,项目主题短语向量称作第一项目主题短语向量,将从携带风险意图关键词的项目主题异检日志得到的异常会话短语向量称作第二异常会话短语向量,项目主题短语向量称作第二项目主题短语向量。
可以理解的是,目标跨境电商异检日志在完成清单匹配之后得到携带风险意图关键词的跨境电商异检日志,同理,第一异常会话短语向量会更新为第二异常会话短语向量,第一项目主题短语向量会更新为第二项目主题短语向量。
所述第一异常会话短语向量可以理解为对所述目标跨境电商异检日志进行异常会话挖掘所获得的短语向量。在一些可能的实施例中,可以通过向量降维单元(卷积单元),向量优化单元(池化单元)等对该目标跨境电商异检日志进行短语向量挖掘处理,得到所述第一异常会话短语向量。比如:可以通过CNN进行所述短语向量挖掘处理,得到第一异常会话短语向量。
所述第一项目主题短语向量可以理解为对所述目标跨境电商异检日志中的项目主题事件进行异常会话挖掘所获得的短语向量。在一些可能的实施例中,可以通过预先调试的项目主题识别模型进行项目主题识别,得到所述目标跨境电商异检日志包含的项目主题事件对应的项目主题识别窗口,然后将所述项目主题识别窗口与所述目标跨境电商异检日志输入局部短语向量挖掘模块进行局部短语向量挖掘处理,得到所述第二项目主题短语向量。
所述项目主题识别模型可以是基于GCN、RCN、GNN等系列的目标识别模型创建的模型。通过调试后,该项目主题识别模型具备识别项目主题事件的性能。所述局部短语向量挖掘模块可以用于挖掘所述目标项目主题异检日志中项目主题识别窗口对应的项目主题集分布信息。进一步地,可以事先通过注释了项目主题识别窗口信息的参考调试信息对该模型进行调试。完成调试后便可借助该模型进行项目主题识别,得到所述目标跨境电商异检日志中跨境电商异检项目的跨境电商异检窗口。然后可以将得到的所述跨境电商异检窗口与所述目标跨境电商异检日志(也可以是通过AI模型对该目标跨境电商异检日志进行异常会话挖掘所获得的短语向量分布信息)输入设定单元,得到项目主题集分布信息,然后再对所述项目主题集分布信息进行信息降维、信息优化操作等得到所述第二项目主题短语向量。
所述项目主题分析数据可以理解为对项目主题事件的词向量挖掘信息。在一些可能的实施例中,可以通过预先调试的词向量挖掘模型,对所述目标跨境电商异检日志进行词向量挖掘,得到项目主题分析数据。
在一些可能的实施例中,可以对得到的项目主题集分布信息进行词向量挖掘,进而降低冗余词向量的干扰,显著提高项目主题分析的精度。
比如:可以获取利用项目主题识别模型与局部短语向量挖掘模块对目标项目主题异检日志进行项目主题识别得到的项目主题集分布信息,然后采用自然语言处理思路对项目主题的短语向量分布信息进行词向量挖掘,得到项目主题分析数据。
可以理解的是,项目主题具有独特性,换言之,跨境电商活动项目和项目主题具有一对一的联系,对于同一跨境电商活动项目在不同的时序捕捉到的项目主题异检日志进行项目主题识别,得到的项目主题分析数据可能是保持一致的。
对于一些可示性实施例而言,在对目标跨境电商异检日志进行清单匹配之前,已经对该目标跨境电商异检日志进行检测得到了第一异常会话短语向量,第一项目主题短语向量和项目主题分析数据。这时,步骤12中获取之前得到的第一异常会话短语向量,第一项目主题短语向量和项目主题分析数据便可。
比如:一些电商异检日志捕捉线程具备识别功能,其导出的内容可以称作多模态特征数组。该多模态特征数组中可以包括:为目标项目主题异检日志配置的不重复的项目主题异检日志标签,针对目标项目主题异检日志中跨境电商异检项目识别出的第一异常会话短语向量,以及针对项目主题事件识别出的第一项目主题短语向量和项目主题分析数据。在步骤12中可以根据所述多模态特征数组,获取第一异常会话短语向量,第一项目主题短语向量和项目主题分析数据。
对于一些可示性实施例而言,在对目标跨境电商异检日志进行清单匹配之前,并没有对该目标跨境电商异检日志进行识别,则步骤12中,需要利用相关识别思路,以实现对目标跨境电商异检日志进行识别得到第一异常会话短语向量,以及项目主题事件的第一项目主题短语向量和项目主题分析数据。
步骤14、通过所述项目主题分析数据,以及已记录的项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,确定所述关联列表中,与所述项目主题分析数据配对的项目主题对应的指定跨境电商异检日志。
在本发明实施例中,基于项目主题的独特性,可以持续性更新项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,可以理解为,将分析出相同项目主题分析数据的携带风险意图关键词的跨境电商异检日志进行融合,得到所述关联列表。通过确定所述关联列表可以得到所述指定跨境电商异检日志,首次过滤出与目标跨境电商异检日志包含通过跨境电商的指定跨境电商异检日志,以完成快速检索思路。
在一些可能的实施例中,可以在对于目标跨境电商异检日志完成清单匹配后,基于该跨境电商异检日志对应的项目主题分析数据,更新所述关联列表。以维持所述关联列表的准确率。比如,项目主题Project theme_1之前对应有10组跨境电商异检日志,若目标跨境电商异检日志的项目主题分析数据也是项目主题Project theme_1,则可以将所述目标项目主题异检日志迁移到与所述项目主题Project theme_1对应的跨境电商异检日志中,以更新所述关联列表。
在一些可能的实施例中,可以通过持续性更新项目主题与跨境电商异检日志对应的跨境电商异检日志标签之间的匹配描述来持续性更新所述关联列表,通过确定到与项目主题分析数据配对的项目主题对应的跨境电商异检日志标签,能够确定与该项目主题对应的跨境电商异检日志,完成电商异检日志确定,从而无需记录跨境电商异检日志的文本内容特征,降低文本内容特征的记录量,进而有助于提高处理质量。
本发明中针对目标跨境电商异检日志会为其设置不重复的跨境电商异检日志标签。比如:所述目标跨境电商异检日志为电商异检日志捕捉线程捕捉的异检日志时,该电商异检日志捕捉线程会为其设置跨境电商异检日志标签。再比如:所述目标跨境电商异检日志为对捕捉的异检日志进行跨境电商异检得到的异检日志时,在所述跨境电商异检时,可以为得到的异检日志设置不重复的跨境电商异检日志标签。
因此通过跨境电商异检日志标签可以独立地反映跨境电商异检日志。在持续性更新所述关联列表(对应关系)时,可以持续性更新项目主题与跨境电商异检日志标签之间的匹配描述便可,无需记录跨境电商异检日志的文本内容特征,降低文本内容特征的记录量,进而有助于提高处理质量。
对于一些可示性实施例而言,所述匹配描述可以记录在风险分析线程中,进而提升确定效率,进而显著提高清单匹配质量。比如:在一些可能的实施例中,云计算服务器的风险分析线程中可以设置第一描述集。所述第一描述集可以是特征向量描述集,本发明实施例对于第一描述集的类别不进行限制。所述第一描述集可以用于记录所述匹配描述。在一些示例中,所述第一描述集以指定方式记录所述匹配描述,因此能够提高确定效率,进而显著提高清单匹配质量。
比如:可以将项目主题分析数据视为显著短语,其对应的项目主题异检日志标签可以视为与显著短语具有映射关系的量化值。通过该显著短语便可查询到对应的量化值,从而提升确定时效性。
在一些可能的实施例中,可以在针对目标跨境电商异检日志完成清单匹配后,基于该跨境电商异检日志对应的项目主题分析数据与跨境电商异检日志标签,更新所述匹配描述,以完成所述关联列表的更新。比如,如果目标跨境电商异检日志的项目主题分析数据为项目主题Project theme_1,则可以将所述目标项目主题异检日志对应的项目主题tag迁移到与显著短语为项目主题Project theme_1对应的量化值V中,以更新所述匹配描述。
步骤16、根据所述目标跨境电商异检日志与各组所述指定跨境电商异检日志所适配的信息风险检测清单之间的第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单。
在本发明实施例中,可以将快速检索得到的跨境电商异检日志称作指定跨境电商异检日志。确定到不低于一组所述指定跨境电商异检日志,可以表明可能确定到了与该目标跨境电商异检日志包含通过跨境电商的携带风险意图关键词的跨境电商异检日志。由于进行项目主题识别的准确率存在一定的限制,可能会有偏差的项目主题分析数据,由此,需要进行所述量化匹配评分确定,并根据量化匹配评分确定目标跨境电商异检日志的信息风险检测清单(比如日志分组)。
所述第一综合匹配指数可以理解为所述目标跨境电商异检日志,与各所述信息风险检测清单之间的量化匹配评分。目标跨境电商异检日志与某一信息风险检测清单的量化匹配评分越高,表明目标跨境电商异检日志属于该信息风险检测清单的概率越大。所述第一综合匹配指数根据所述第一异常会话短语向量、所述第一项目主题短语向量,以及所述信息风险检测清单对应的异常会话显著表达和项目主题显著表达所生成。
在一些可能的实施例中,可以挑选所述第一综合匹配指数中的最高量化匹配评分,并将所述目标跨境电商异检日志剪切到所述最高量化匹配评分对应的信息风险检测清单。
如此一来,通过步骤12-步骤16所记录的技术方案,可以在快速检索过程中,可以根据目标跨境电商异检日志的项目主题分析数据所配对的项目主题,检索项目主题与已确定信息风险检测清单的跨境电商异检日志之间的关联列表,找到包含所述项目主题的指定跨境电商异检日志,从而利用项目主题的独特性进行跨境电商异检日志的快速检索,可以依据项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,进行指定跨境电商异检日志的确定,且所适配的信息风险检测清单所依据的第一综合匹配指数基于少量的短语向量和显著表达得到,因而能够提高信息风险检测清单配对的时效性,并且能够在一定程度上确保目标跨境电商异检日志的归纳分析准确性和可靠性。
对于一种可独立实施的技术方案而言,本发明实施例示出的一种基于量化匹配评分确定跨境电商异检日志的信息风险检测清单的思路。进一步的,该方法还可以包括步骤22-步骤26所记录的内容。本发明实施例对于步骤22-步骤26的实施顺序不作特别限制。
步骤22、确定各所述指定跨境电商异检日志所适配的信息风险检测清单依次匹配的异常会话显著表达和项目主题显著表达。
在本发明实施例中,所述异常会话显著表达根据所述信息风险检测清单内融合的跨境电商异检日志中跨境电商异检项目的异常会话短语向量得到。比如:所述信息风险检测清单内融合了10组已融合跨境电商异检日志,则可以对该10组已融合跨境电商异检日志依次匹配的第二异常会话短语向量实施比如计算各种指标数值等处理得到所述信息风险检测清单对应的异常会话显著表达。
所述项目主题显著表达根据所述信息风险检测清单内融合的跨境电商异检日志中项目主题事件的项目主题短语向量得到。比如:所述信息风险检测清单内融合了10组已融合跨境电商异检日志,则可以对该10组已融合跨境电商异检日志依次匹配的第二项目主题短语向量执行诸如求各种指标数值等处理得到所述信息风险检测清单对应的项目主题显著表达。
对于一些可示性实施例而言,可以在针对目标跨境电商异检日志完成清单匹配后,基于该跨境电商异检日志对应的异常会话短语向量与项目主题短语向量,分别优化该跨境电商异检日志所适配的信息风险检测清单对应的异常会话显著表达与项目主题显著表达。比如:信息风险检测清单之前有10组跨境电商异检日志,在新增添一组跨境电商异检日志后,可以根据所述11组跨境电商异检日志再次计算该信息风险检测清单对应的异常会话显著表达与项目主题显著表达。
本发明实施例中可以将信息风险检测清单对应的项目主题显著表达与异常会话显著表达称作描述数组。
在一些可能的实施例中,可以通过在目标周期内是否触发活跃性检测条件,对描述数组进行辨别,分为描述数组classification1与描述数组classification2。其中,描述数组classification1可以为在目标周期内触发活跃性检测条件的数据,由于跨境电商活动项目处于活跃状态,被持续不断捕捉到的概率很大,因此描述数组classification1也可以理解为活跃数据。描述数组classification2可以为在目标周期内没有触发活跃性检测条件的数据,由于长时间没有触发活跃性检测条件,表明跨境电商活动项目可能终止运行,比如之后不会被捕捉到,因此描述数组classification2也可以理解为之后很大可能不会被触发活跃性检测条件的非活跃数据。
本发明实施例可以将描述数组classification1记录在风险分析线程中,描述数组classification2记录在设定线程中。一方面将描述数组classification1记录在风险分析线程中,可以利用从风险分析线程的高时效性提升数据处理效率,进而显著提高清单匹配质量,将之后很大可能不会被触发活跃性检测条件的描述数组classification2记录在设定线程中,可以削弱风险分析线程的资源开销,提高风险分析线程使用率。
在一些可能的实施例中,云计算服务器的风险分析线程中具有第二描述集,动态处理线程中具有第三描述集;其中,所述第二描述集记录了在目标周期内触发活跃性检测条件的描述数组(比如:描述数组classification1);所述第三描述集中记录了在所述目标周期内没有触发活跃性检测条件的描述数组(比如:描述数组classification2)。
所述动态处理线程可以包括设定线程、外部接入线程、缓存空间等等,在此不作限定。
对于一种可独立实施的技术方案而言,本发明实施例示出的一种获取描述数组的方法还可以包括步骤32-步骤34所记录的内容。
步骤32、确定各所述指定跨境电商异检日志所适配的信息风险检测清单。
在本发明实施例中,确定到的各指定跨境电商异检日志可能对应于相同的信息风险检测清单,也可能对应于不同的信息风险检测清单。步骤32中需要确定不同信息风险检测清单对应的信息风险检测清单集。
可以理解的是,指定跨境电商异检日志都是已确定所述信息风险检测清单的跨境电商异检日志。步骤32中可以根据已记录的携带风险意图关键词的跨境电商异检日志与信息风险检测清单之间的关联列表,便可确定各所述指定跨境电商异检日志所述的信息风险检测清单。
在一些可能的实施例中,可以对获取的信息风险检测清单进行优化,整合其中相同的检测清单匹配分组。比如:可以持续性更新携带风险意图关键词的跨境电商异检日志的跨境电商异检日志标签与信息风险检测清单清单编号之间的匹配描述。步骤14确定到5组指定跨境电商异检日志,即5组指定跨境电商异检日志,其异检日志标签分别为tag1~tag5。通过所述匹配描述,以及各所述指定跨境电商异检日志的跨境电商异检日志标签,可以确定每一指定跨境电商异检日志别所适配的信息风险检测清单。如果异检日志标签tag1~tag5分别所适配的信息风险检测清单为detailed list-A,detailed list-A,detailedlist-B,detailed list-A,detailed list-A。然后进行优化可以得到有信息风险检测清单detailed list-A、detailed list-B。
步骤34,针对各所述信息风险检测清单,在所述第二描述集中,确定与所述信息风险检测清单对应的描述数组,以及,依据确定到所述信息风险检测清单对应的描述数组,将确定到的描述数组视为需获得的异常会话显著表达和项目主题显著表达,以及,依据未确定出所述信息风险检测清单对应的描述数组,在所述第三描述集中,确定与所述信息风险检测清单对应的描述数组,并将确定到的描述数组视为需获得的异常会话显著表达和项目主题显著表达。
实施步骤32-步骤34时,可以优先从设置在风险分析线程中的第二描述集确定所需的描述数组,并在无法确定的情况下从第三描述集确定所需的描述数组,如此一来,确定描述数组的思路可以尽可能优先从风险分析线程中确定到描述数组,从而提高描述数组确定效率,进而提高异检日志分团时效性。
比如:步骤32得到的信息风险检测清单集包括信息风险检测清单detailed list-A、detailed list-B。如果信息风险检测清单detailed list-A对应的描述数组为描述数组classification1存储在第二描述集。信息风险检测清单detailed list-B对应的描述数组为描述数组classification2记录在第三描述集。
举例而言,可以分别将信息风险检测清单detailed list-A和信息风险检测清单detailed list-B视为当前信息风险检测清单,并实施步骤34,以获取信息风险检测清单detailed list-A和信息风险检测清单detailed list-B依次匹配的描述数组。针对信息风险检测清单detailed list-A,可以从风险分析线程中直接确定到对应的描述数组,而针对信息风险检测清单detailed list-B,需要从动态处理线程中确定到对应的描述数组。如此一来,处理尽可能优先从风险分析线程中确定描述数组,提高描述数组的确定效率。
进一步地,第二描述集与第三描述集之间可以进行描述数组的调整。进行描述数组调整的节点可以根据实际需求进行设置。可以循环进行描述数组调整,还可以在获取描述数组之后进行描述数组调整。
对于一些可示性实施例而言,第二描述集中已记录的描述数组classification1在目标周期内没有触发活跃性检测条件的情况下,可以被迁移到第三描述集,变为描述数组classification2。第三描述集中已记录的描述数组classification2在被触发活跃性检测条件的情况下,可以迁移至第二描述集,变为描述数组classification1。
在一些可能的实施例中,目标跨境电商异检日志可能不匹配当前的任何信息风险检测清单,然后可以单独为其创立候选信息风险检测清单,在此基础上可以默认将创立候选信息风险检测清单对应的描述数组记录在风险分析线程中的第二描述集内。这样将创立候选信息风险检测清单的描述数组放在风险分析线程中,可以提高描述数组确定的效率。
在所述第二描述集内还可以持续性更新与描述数组对应的无效累计周期。所述无效累计周期指示所述描述数组没有触发活跃性检测条件的累计时间。在描述数组一直没有触发活跃性检测条件的情况下,所述无效累计周期会跟随时序的增长而逐步增长,以指示该描述数组没有触发活跃性检测条件的累计时间。在描述数组被触发活跃性检测条件则的情况下,则更新对应的无效累计周期指示该描述数组刚触发活跃性检测条件。比如:在描述数组被触发活跃性检测条件后可以将无效累计周期更新为0,表明数据刚触发活跃性检测条件,如果该描述数组没有触发活跃性检测条件,跟随时序增长1second,所述无效累计周期上的数值会+1。
在一些可能的实施例中,循环确定所述第二描述集中已记录的每一描述数组对应的无效累计周期是否大于或等于所述目标周期。依据其中一个描述数组对应的无效累计周期大于或等于所述目标周期,在所述第二描述集中过滤掉所述其中一个描述数组,并将所述其中一个描述数组设置到所述第三描述集。由此可以周期性地对风险分析线程描述集中不大概率触发活跃性检测条件的数据进行过滤。
在一些可能的实施例中,在确定各所述指定跨境电商异检日志所适配的信息风险检测清单依次匹配的异常会话显著表达和项目主题显著表达的过程中,依据在所述第三描述集中确定到所述异常会话显著表达与项目主题显著表达,将确定到的所述异常会话显著表达与项目主题显著表达迁移到所述第二描述集内的描述数组classification1中。
由于活跃的跨境电商活动项目会被大概率捕捉到,比如会大概率针对该跨境电商活动项目的跨境电商异检日志进行清单匹配,则表明相应的信息风险检测清单对应的描述数组以后会大概率触发活跃性检测条件,因此在第三描述集找到相应信息风险检测清单对应的描述数组之后,可以将该描述数组迁移到第二描述集中,由此符合实际的异检日志分团要求,可以通过提高描述数组确定效率,提高跨境电商异检日志进行清单匹配的质量。
比如:在步骤32-步骤34中,从第二描述集中确定到信息风险检测清单detailedlist-A对应的描述数组,从第三描述集中确定到信息风险检测清单detailed list-B对应的描述数组。由于活跃的跨境电商活动项目会被定位,即会大概率针对该跨境电商活动项目的跨境电商异检日志进行清单匹配,表明相应信息风险检测清单detailed list-A和detailed list-B会大概率触发活跃性检测条件,则可以将信息风险检测清单detailedlist-B对应的描述数组迁移到第二描述集,以适配日志配对场景,通过提高描述数组确定效率,提高跨境电商异检日志进行清单匹配的质量。
对于一种可独立实施的技术方案而言,在获取每一信息风险检测清单依次匹配的异常会话显著表达和项目主题显著表达之后可以实施步骤24。
步骤24、根据所述第一异常会话短语向量和第一项目主题短语向量,与各所述信息风险检测清单对应的所述异常会话显著表达和项目主题显著表达之间的量化匹配评分,确定所述第一综合匹配指数。
在本发明实施例中,所述第一综合匹配指数可以理解为所述目标跨境电商异检日志与各所述信息风险检测清单之间的量化匹配评分。目标跨境电商异检日志与某一信息风险检测清单的量化匹配评分越高,表明目标跨境电商异检日志属于该信息风险检测清单的概率越大。
在步骤24中,可以针对各所述信息风险检测清单,确定对应的第一综合匹配指数。
对于一些可示性实施例而言,可以将第一异常会话短语向量与第一项目主题短语向量进行组合,得到第一组合向量,将信息风险检测清单对应的异常会话显著表达和项目主题显著表达进行组合,得到第二组合向量,然后基于比如余弦相似度的量化匹配评分确定思路,确定所述第一组合向量与所述第二组合向量之间的量化匹配评分,视为所述第一综合匹配指数。
对于一些可示性实施例而言,可以确定所述第一异常会话短语向量与获取的各所述信息风险检测清单对应的所述异常会话显著表达之间的量化匹配评分matchingvalue5,然后确定所述第一项目主题短语向量,与获取的各所述信息风险检测清单对应的所述项目主题显著表达之间的量化匹配评分matching value6,之后通过所述量化匹配评分matching value5与所述量化匹配评分matching value6,得到所述第一综合匹配指数。因此,可以全面异常会话短语向量与项目主题短语向量的量化匹配评分,得到最后的第一综合匹配指数,由此得到的第一综合匹配指数更精度,进而有利于进行异检日志处理的可信度。
比如:可以利用余弦相似度等量化匹配评分确定思路,确定所述量化匹配评分matching value5与所述量化匹配评分matching value6,然后基于指定规则,确定所述量化匹配评分matching value5与所述量化匹配评分matching value6的求和结果,得到所述第一综合匹配指数。
步骤26、通过所述第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单。
可以理解的是,根据步骤22-步骤26可通过比较所述目标跨境电商异检日志与1组所述指定跨境电商异检日志所适配的信息风险检测清单之间的第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单,从而实现进一步的日志匹配。
在一些可能的实施例中,在步骤26中,可以依据所述第一综合匹配指数中的最高量化匹配评分大于或等于指定判定值,将所述目标跨境电商异检日志剪切到所述最高量化匹配评分对应的指定跨境电商异检日志所对应的信息风险检测清单;依据所述第一综合匹配指数中的最高量化匹配评分小于所述指定判定值,创立候选信息风险检测清单,并将所述目标跨境电商异检日志剪切到所述候选信息风险检测清单。
可以理解的是,在根据步骤26,得到每一信息风险检测清单对应的第一综合匹配指数后,可以选取其中的最高量化匹配评分。所述最高量化匹配评分对应的信息风险检测清单内的跨境电商异检日志,可以理解为是与目标跨境电商异检日志最类似的异检日志。所述指定判定值为先验值。两组电商异检日志之间的量化匹配评分大于或等于该指定判定值,表明所述两组电商异检日志对应于同一清单。
若选取的最高量化匹配评分大于或等于所述指定判定值,表明目标跨境电商异检日志与最高量化匹配评分对应的信息风险检测清单内的跨境电商异检日志对应于同一清单,便可以将所述目标跨境电商异检日志剪切到所述最高量化匹配评分对应的指定跨境电商异检日志所对应的信息风险检测清单。
若选取的最高量化匹配评分小于所述指定判定值,表明目标跨境电商异检日志与最高量化匹配评分对应的信息风险检测清单内的跨境电商异检日志不对应于同一清单,应该独立认定一个清单,可创立候选信息风险检测清单,并将所述目标跨境电商异检日志剪切到所述候选信息风险检测清单。
对于一些可示性实施例而言,在步骤14中可能未确定出其中一个指定跨境电商异检日志,由此可能表明目标跨境电商异检日志中的项目主题可能是首次展示,或者可能是项目主题识别出现误差。本发明实施例中在以上情况下还可以匹配以上技术方案中的快速检索步骤,基于联动的特征分析,快速检索与目标跨境电商异检日志类似的异检日志。
在实际实施时,可以当通过所述项目主题分析数据,以及已记录的项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,未确定出与所述项目主题分析数据配对的项目主题对应的指定跨境电商异检日志时,根据所述目标跨境电商异检日志与各组携带风险意图关键词的跨境电商异检日志之间的第二综合匹配指数,将所述携带风险意图关键词的跨境电商异检日志中,与所述目标跨境电商异检日志之间量化匹配评分最高的第一数量组跨境电商异检日志,视为所述指定跨境电商异检日志。
进一步地,所述第二综合匹配指数可以理解为所述目标跨境电商异检日志,与每一携带风险意图关键词的跨境电商异检日志之间的量化匹配评分。目标跨境电商异检日志与某一携带风险意图关键词的跨境电商异检日志的量化匹配评分越高,表明目标跨境电商异检日志与该携带风险意图关键词的跨境电商异检日志类似。所述第二综合匹配指数根据所述第一异常会话短语向量、所述第一项目主题短语向量,以及所述携带风险意图关键词的跨境电商异检日志对应的第二异常会话短语向量和第二项目主题短语向量所生成。
由此,可以在所述关联列表中未确定出与所述项目主题对应的指定跨境电商异检日志的情况下,匹配以上技术方案中的快速检索步骤,基于联动的特征分析,快速检索与目标跨境电商异检日志类似的异检日志。进一步地,本发明在接收到目标跨境电商异检日志时,可以优先根据所述关联列表,利用项目主题的独特性对跨境电商异检日志进行快速检索,仅在所述关联列表中未确定出指定跨境电商异检日志的情况下,采用联动特征分析思路进行快速检索,能够减少资源开销,提高日志配对的时效性。
对于一种可独立实施的技术方案而言,本发明实施例示出的一种确定与所述目标跨境电商异检日志之间量化匹配评分最高的第一数量组跨境电商异检日志的方法,所述方法可以包括如下步骤52-步骤58。
步骤52、确定各组携带风险意图关键词的跨境电商异检日志中跨境电商异检项目的第二异常会话短语向量、第二项目主题短语向量。
对于一些可示性实施例而言,可以通过设定线程记录各携带风险意图关键词的跨境电商异检日志中跨境电商异检项目的第二异常会话短语向量、第二项目主题短语向量。比如:可以在设定线程中设置的第三描述集中记录由携带风险意图关键词的跨境电商异检日志的跨境电商异检日志标签,第二异常会话短语向量,第二项目主题短语向量构成的多模态特征数组。
通过获取设定线程中已记录的多模态特征数组,可以获取各跨境电商异检日志对应的第二异常会话短语向量与第二项目主题短语向量。
步骤54、通过所述第一异常会话短语向量与所述第二异常会话短语向量之间的量化匹配评分,确定所述携带风险意图关键词的跨境电商异检日志中,与所述目标跨境电商异检日志量化匹配评分最高的第二数量组第二跨境电商异检日志。
在一些可能的实施例中,可以将所述第一异常会话短语向量与各所述跨境电商异检日志对应的所述第二异常会话短语向量之间的第一量化匹配评分,确定为所述目标跨境电商异检日志与各所述跨境电商异检日志之间的第二量化匹配评分,并从各所述跨境电商异检日志中,选取与所述目标跨境电商异检日志之间的第二量化匹配评分最高的第二数量组第二跨境电商异检日志。
在步骤54中,可以采用余弦相似度等量化匹配评分确定思路,确定所述第一量化匹配评分。可以理解的是所述第一量化匹配评分可以是从异常会话短语向量的层面分析,得到的所述目标跨境电商异检日志与各所述跨境电商异检日志之间的第二量化匹配评分。与某一跨境电商异检日志的第二量化匹配评分越高,表明从异常会话短语向量的层面分析,所述目标跨境电商异检日志与该跨境电商异检日志越相似。
进一步地,可以依据与各跨境电商异检日志之间的第二量化匹配评分,进行从大到小的顺序整理,然后选取前第三数量各跨境电商异检日志视为所述第二跨境电商异检日志。
步骤56、通过所述第一项目主题短语向量与所述第二项目主题短语向量之间的量化匹配评分,确定所述携带风险意图关键词的跨境电商异检日志中,与所述目标跨境电商异检日志量化匹配评分最高的第三数量组第三跨境电商异检日志。
在一些可能的实施例中,可以将所述第一项目主题短语向量与各所述跨境电商异检日志对应的所述第二项目主题短语向量之间的第三量化匹配评分,确定为所述目标跨境电商异检日志与各所述跨境电商异检日志之间的量化匹配评分matching value5,并从各所述跨境电商异检日志中,选取与所述目标跨境电商异检日志之间的五量化匹配评分最高的第三数量组第三跨境电商异检日志。
可以采用余弦相似度等量化匹配评分确定思路,确定所述第三量化匹配评分。可以理解的是所述第三量化匹配评分可以是从项目主题短语向量的层面分析,得到的所述目标跨境电商异检日志与各所述跨境电商异检日志之间的第四量化匹配评分。与某一跨境电商异检日志的第四量化匹配评分越高,表明从项目主题短语向量的层面分析,所述目标跨境电商异检日志与该跨境电商异检日志越相似。
进一步地,可以依据与各跨境电商异检日志之间的第四量化匹配评分,进行从大到小的顺序整理,然后选取前第二数量各跨境电商异检日志视为所述第三跨境电商异检日志。
步骤58,根据所述第二数量组所述第二跨境电商异检日志和第三数量组所述第三跨境电商异检日志,确定所述第一数量组跨境电商异检日志。
第三数量和第二数量的和值不小于第一数量。由此根据步骤52-步骤58示意的步骤可以得到与所述目标跨境电商异检日志之间量化匹配评分最高的第一数量组跨境电商异检日志。
进一步地,快速检索得到的指定跨境电商异检日志之后,可以针对每一指定跨境电商异检日志实施以上步骤16或步骤22-步骤26示意的基于量化匹配评分确定跨境电商异检日志信息风险检测清单的方法,以确定针对目标跨境电商异检日志的信息风险检测清单。
对于一些可示性实施例而言,在确定所述目标跨境电商异检日志所适配的信息风险检测清单之后,将所述目标跨境电商异检日志对应的异常检测文本迁移到所述信息风险检测清单。所述异常检测文本包括以下至少一项:跨境电商异检日志的文本内容特征;跨境电商异检日志标签;第一异常会话短语向量;第一项目主题短语向量;项目主题分析数据。
比如:可以将所述目标跨境电商异检日志对应的跨境电商异检日志标签,第一异常会话短语向量,第一项目主题短语向量以及项目主题分析数据组成多模态特征数组,与所述信息风险检测清单关联记录,以完成针对目标跨境电商异检日志的检测清单匹配。
在一些可能的示例中,在对目标跨境电商异检日志进行清单匹配之前,会对目标跨境电商异检日志进行解析,得到第一异常会话短语向量,第一项目主题短语向量以及项目主题分析数据,然后将识别出的信息与目标跨境电商异检日志的跨境电商异检日志标签一起视为目标跨境电商异检日志的异常检测文本,以第一向量化表达的方式传输至所述云计算服务器进行清单匹配。可以理解的是,在一些可能的实施例中,在确定目标跨境电商异检日志所适配的信息风险检测清单后,可以将该信息风险检测清单对应的清单标签迁移到所述第一向量化表达,生成第二向量化表达,从而可以将信息风险检测清单与跨境电商异检日志进行配对。
所述云计算服务器的风险分析线程中持续性更新了基于AI的风险分析线程描述集,设定线程中持续性更新了基于结构化的设定线程描述集。其中所述风险分析线程描述集采用指定方式,将项目主题视为显著短语,项目主题对应的携带风险意图关键词的跨境电商异检日志的跨境电商异检日志标签视为量化值V,记录了项目主题与跨境电商异检日志标签的第一匹配描述。所述风险分析线程描述集中还记录了在目标周期内触发活跃性检测条件的信息风险检测清单的描述数组。所述设定线程描述集记录了在目标周期内没有触发活跃性检测条件的信息风险检测清单的描述数组,携带风险意图关键词的跨境电商异检日志的第二向量化表达。所述描述数组包括信息风险检测清单对应的异常会话显著表达和项目主题显著表达。所述第二向量化表达包括携带风险意图关键词的跨境电商异检日志的异常检测文本,以及该携带风险意图关键词的跨境电商异检日志所匹配信息风险检测清单的清单标签。
风险分析线程描述集中可以为已记录的描述数组持续性更新无效累计周期,并循环的确定各描述数组的无效累计周期是否得到所述目标周期,如果某描述数组的无效累计周期大于或等于所述目标周期,表明该描述数组在目标周期未触发活跃性检测条件,则可以将该描述数组迁移到设定线程描述集。因而能够周期性地对风险分析线程描述集中不大概率触发活跃性检测条件的数据进行过滤。
对于一种可独立实施的技术方案而言,所述方法还可以包括步骤601-步骤610。
步骤601、获取目标跨境电商异检日志的第一向量化表达。
步骤602、通过所述第一向量化表达包括的项目主题分析数据,在所述风险分析线程描述集已记录的项目主题与跨境电商异检日志标签匹配描述中,确定与所述项目主题分析数据配对的项目主题所对应的指定跨境电商异检日志标签。
步骤603、在确定到至少一个指定跨境电商异检日志标签的情况下,将确定到的指定跨境电商异检日志标签分别视为指定跨境电商异检日志标签。
举例而言,可以将项目主题做为显著短语,对应的跨境电商异检日志标签视为量化值V。如果所述第一向量化表达包括的项目主题分析数据配对的项目主题为项目主题Project theme_1,步骤602可以得到的指定跨境电商异检日志标签为tag1~tag5。
步骤604、在未确定出指定跨境电商异检日志标签的情况下,可以进行联动特征分析思路的快速检索,得到从异常会话短语向量进行分析,与目标跨境电商异检日志最类似的第二数量组第二跨境电商异检日志的第二跨境电商异检日志标签,以及从项目主题短语向量分析,与目标跨境电商异检日志最类似的第三数量组第三跨境电商异检日志的第三跨境电商异检日志标签,然后将第二数量组所述第二跨境电商异检日志标签与第三数量组第三跨境电商异检日志标签分别视为指定跨境电商异检日志标签。
在本发明实施例中,可以从设定线程描述集中获取携带风险意图关键词的跨境电商异检日志的第二向量化表达。然后可以根据以上步骤54所记录的内容,得到与目标跨境电商异检日志最类似的第二数量组第二跨境电商异检日志的第二跨境电商异检日志标签,以及根据步骤56的思路,得到目标跨境电商异检日志最类似的第三数量组第三跨境电商异检日志的第三跨境电商异检日志标签。
比如:如果第一向量化表达包括的跨境电商活动项目识别结果为项目主题5,基于持续性更新的匹配描述无法确定到对应的指定跨境电商异检日志标签,则可以执行步骤604,如果通过步骤604得到的3个第二跨境电商异检日志标签为tag51~tag53,通过步骤606得到的2个第三跨境电商异检日志标签为tag54和tag55。即通过步骤604得到的标跨境电商异检日志标签为tag51~tag55。
以下以项目主题分析数据为项目主题Project theme_1,根据步骤603得到指定跨境电商异检日志标签为tag1~tag5为例进行表明。
步骤605,根据每一指定跨境电商异检日志标签,获取每一指定跨境电商异检日志所适配的信息风险检测清单对应的描述数组。
在本发明实施例中,可以针对各所述指定跨境电商异检日志标签,通过所述指定跨境电商异检日志标签,确定到指定跨境电商异检日志对应的第二向量化表达,并确定所述第二向量化表达中包括的清单标签,以确定指定跨境电商异检日志所适配的信息风险检测清单。然后进行优化,得到信息风险检测清单集。
如果指定跨境电商异检日志标签tag1~tag3,对应的信息风险检测清单均为清单detailed list-A,指定跨境电商异检日志标签tag4和tag5对应的信息风险检测清单为清单detailed list-B。基于以上内容可以得到的信息风险检测清单集包括信息风险检测清单detailed list-A和信息风险检测清单detailed list-B。
然后将信息风险检测清单集内的每一信息风险检测清单分别视为当前信息风险检测清单,先从风险分析线程描述集包括的描述数组中,确定与当前信息风险检测清单对应的描述数组,如果在风险分析线程描述集中搜索到相应描述数组,则跳转至视为当前信息风险检测清单对应的描述数组。如果在风险分析线程描述集中未确定出相应描述数组,则在设定线程描述集中确定相应描述数组,并跳转至视为当前信息风险检测清单对应的描述数组。如此一来,可以优先在风险分析线程中进行信息确定。
如果信息风险检测清单detailed list-A的描述数组在之前触发活跃性检测条件存储在风险分析线程描述集中,信息风险检测清单detailed list-B的描述数组在之前没有触发活跃性检测条件记录在设定线程描述集中。对于信息风险检测清单detailed list-A可以从风险分析线程描述集中获取对应的描述数组,对于清单detailed list-B在风险分析线程描述集中没有找到对应的描述数组,可以从设定线程描述集中找到相应的描述数组。
如果从设定线程描述集中确定到相应描述数组,还可以找到的相应描述数组迁移至风险分析线程描述集。鉴于活跃的跨境电商活动项目会被定位,即会大概率针对该跨境电商活动项目的跨境电商异检日志进行清单匹配,表明相应信息风险检测清单detailedlist-A和detailed list-B会大概率触发活跃性检测条件,则可以将信息风险检测清单detailed list-B对应的描述数组迁移到第二描述集,以适配日志配对场景,通过提高描述数组确定效率,提高跨境电商异检日志进行清单匹配的质量。
步骤606、确定所述第一向量化表达中的第一异常会话短语向量和第一项目主题短语向量,与获取的各所述信息风险检测清单对应的所述异常会话显著表达和项目主题显著表达之间量化匹配评分。
在本发明实施例中,可以参阅步骤24,分别针对信息风险检测清单detailedlist-A和信息风险检测清单detailed list-B,根据余弦相似度确定思路,分别确定所述异常会话短语向量之间的量化匹配评分和项目主题短语向量之间的量化匹配评分,并进行全局化计算,得到与信息风险检测清单detailed list-A对应的第一量化匹配评分,和与信息风险检测清单detailed list-B对应的第二量化匹配评分。
步骤607、判断所述第一量化匹配评分与所述第二量化匹配评分结果中的最高量化匹配评分是否大于或等于指定判定值。
步骤608、如果所述最高量化匹配评分大于或等于指定判定值,将所述目标跨境电商异检日志剪切到所述最高量化匹配评分对应的指定跨境电商异检日志所对应的信息风险检测清单。
步骤609、如果所述最高量化匹配评分小于指定判定值,创立候选信息风险检测清单,并将所述目标跨境电商异检日志剪切到所述候选信息风险检测清单。
在本发明实施例中,如果第一量化匹配评分大于第二量化匹配评分,步骤607中选取第一量化匹配评分。如果所述第一量化匹配评分大于所述指定判定值,则可以将目标跨境电商异检日志剪切到信息风险检测清单detailed list-A。
步骤610,将目标跨境电商异检日志的异常检测文本设置到认定的信息风险检测清单,并更新信息风险检测清单对应的异常会话显著表达与项目主题显著表达以及项目主题与跨境电商异检日志标签之间的匹配描述。
在本发明实施例中,可以在所述第一向量化表达中设置信息风险检测清单detailed list-A的分团标签A,完成异常检测文本的设置。然后可以通过所述第一向量化表达包含的异常会话短语向量与项目主题短语向量,分别优化信息风险检测清单detailedlist-A对应的异常会话显著表达与项目主题显著表达。
还可以根据第一向量化表达包含的项目主题分析数据与跨境电商异检日志标签,更新所述匹配描述。在一些示例性的匹配描述中,可以在项目主题Project theme_1(显著短语)的对应的量化值V中加入以上项目主题异检日志标签,完成匹配描述的更新。
在步骤601-步骤610记录的技术方案中,可以根据项目主题独特性进行跨境电商异检日志的快速检索,得到与目标跨境电商异检日志包含同一跨境电商活动项目的一些跨境电商异检日志,然后再基于目标跨境电商异检日志与快速检索得到的这些跨境电商异检日志所适配的信息风险检测清单内日志的量化匹配评分,确定目标跨境电商异检日志所适配的信息风险检测清单,可以将同一跨境电商活动项目对应的检测清单匹配剪切到同一信息风险检测清单,从而可以根据跨境电商活动项目的项目主题或包含跨境电商活动项目的跨境电商异检日志,确定该跨境电商活动项目对应的信息风险检测清单,然后可以将信息风险检测清单内融合的跨境电商异检日志进行输出。
基于上述内容,可以利用项目主题的独特性进行跨境电商异检日志标签的快速检索,可以依据项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,进行指定跨境电商异检日志的确定,且所适配的信息风险检测清单所依据的第一综合匹配指数基于少量的短语向量和显著表达得到,因而能够提高信息风险检测清单配对的时效性,并且能够在一定程度上确保目标跨境电商异检日志的归纳分析准确性和可靠性。还可以在所述匹配描述中未确定出与所述项目主题对应的指定跨境电商异检日志标签的情况下,匹配以上技术方案中的快速检索步骤,基于联动的特征分析,快速检索与目标跨境电商异检日志相似的异检日志的异检日志编号。进一步地,利用在接收到目标跨境电商异检日志时,可以优先根据所述匹配描述,利用项目主题的独特性对跨境电商异检日志标签进行快速检索,仅在所述匹配描述中未确定出相应跨境电商异检日志标签的情况下,采用联动特征分析思路进行快速检索,能够减少资源开销,提高日志配对的时效性。
在一些实施例中,异常会话显著表达可以理解为会话分团特征,项目主题显著表达可以理解为项目主题分团特征。在一些独立的实施例中,在确定所述目标跨境电商异检日志所适配的信息风险检测清单之后,该方法还可以包括如下内容:基于所述目标跨境电商异检日志所适配的信息风险检测清单确定所述目标跨境电商异检日志的入侵风险共性特征;通过所述入侵风险共性特征进行信息防护。
在本发明实施例中,可以通过所述目标跨境电商异检日志所适配的信息风险检测清单对应的共性跨境电商异检日志进行入侵意图分析,从而得到完整的入侵风险共性特征,这样可以结合入侵风险共性特征进行针对性的信息防护处理,避免跨境电商交互过程中出现信息入侵风险。
在一些独立的实施例中,基于所述目标跨境电商异检日志所适配的信息风险检测清单确定所述目标跨境电商异检日志的入侵风险共性特征,包括:通过所述信息风险检测清单提取与所述目标跨境电商异检日志对应的入侵检测报告;通过所述入侵检测报告进行特征挖掘,得到入侵风险共性特征。
在一些独立的实施例中,通过所述入侵检测报告进行特征挖掘,得到入侵风险共性特征,可以包括如下内容:获取所述入侵检测报告对应的入侵行为数据集,其中,所述入侵行为数据集包括关联的X组入侵行为数据,所述X为大于或等于1的整数;根据所述入侵行为数据集获取误检行为数据集,其中,所述误检行为数据集包括关联的X组误检行为数据;基于所述入侵行为数据集,通过入侵行为挖掘网络所包括的第一意图挖掘节点获取入侵行为知识分布集,其中,所述入侵行为知识分布集包括X个入侵行为知识分布;基于所述误检行为数据集,通过所述入侵行为挖掘网络所包括的第二意图挖掘节点获取误检行为知识分布集,其中,所述误检行为知识分布集包括X个误检行为知识分布;基于所述入侵行为知识分布集以及所述误检行为知识分布集,通过所述入侵行为挖掘网络所包括的共享特征识别节点获取所述入侵行为数据所对应的特征描述值;根据所述特征描述值确定所述入侵行为数据集的入侵风险共性特征。如此一来,能够考虑入侵分析的误检行为,从而提高确定的入侵风险共性特征的可信度。
基于同样的发明构思,图2示出了本发明实施例提供的一种结合云计算的跨境电商信息风险分析装置的模块框图,一种结合云计算的跨境电商信息风险分析装置可以包括实施图1所示的相关方法步骤的模块。
项目分析模块21,用于:在接收到跨境电商平台系统发送的信息风险分析请求时,根据所述信息风险分析请求确定满足分析条件的目标跨境电商异检日志,并获得目标跨境电商异检日志中的跨境电商异检项目的第一异常会话短语向量、第一项目主题短语向量和项目主题分析数据。
日志获取模块22,用于:通过所述项目主题分析数据,以及已记录的项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,确定所述关联列表中,与所述项目主题分析数据配对的项目主题对应的指定跨境电商异检日志。
信息检测模块23,用于:根据所述目标跨境电商异检日志与各组所述指定跨境电商异检日志所适配的信息风险检测清单之间的第一综合匹配指数,确定所述目标跨境电商异检日志所适配的信息风险检测清单。
应用于本发明的相关实施例可以达到如下技术效果:在对目标跨境电商异检日志进行信息风险检测清单匹配的过程中,可以基于对应的项目主题进行跨境电商异检日志的快速检索,可以依据项目主题与携带风险意图关键词的跨境电商异检日志之间的关联列表,进行指定跨境电商异检日志的确定,且所适配的信息风险检测清单所依据的第一综合匹配指数基于少量的短语向量和显著表达得到,因而能够提高信息风险检测清单配对的时效性,并且能够在一定程度上确保目标跨境电商异检日志的归纳分析准确性和可靠性。
以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。