CN113011886A - 帐号类型的确定方法和装置及电子设备 - Google Patents

帐号类型的确定方法和装置及电子设备 Download PDF

Info

Publication number
CN113011886A
CN113011886A CN202110189551.7A CN202110189551A CN113011886A CN 113011886 A CN113011886 A CN 113011886A CN 202110189551 A CN202110189551 A CN 202110189551A CN 113011886 A CN113011886 A CN 113011886A
Authority
CN
China
Prior art keywords
sample
behavior feature
behavior
sample behavior
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110189551.7A
Other languages
English (en)
Other versions
CN113011886B (zh
Inventor
李成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110189551.7A priority Critical patent/CN113011886B/zh
Publication of CN113011886A publication Critical patent/CN113011886A/zh
Application granted granted Critical
Publication of CN113011886B publication Critical patent/CN113011886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/085Payment architectures involving remote charge determination or related payment systems

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种帐号类型的确定方法和装置及电子设备。其中,该方法包括:通过获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括目标帐号的交易行为特征和操作行为特征;在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量;根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,预先根据样本异常帐号的样本行为特征序列,确定出多个聚类簇,进一步的,获取目标帐号的行为特征序列击中多个聚类簇中的每个聚类簇的次数,通过阈值来对目标帐号进行甄别,进而解决了现有技术,根据目标帐号的行为信息确定目标帐号类型准确性较低的技术问题。

Description

帐号类型的确定方法和装置及电子设备
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种帐号类型的确定方法和装置及电子设备。
背景技术
在线上支付的生态中,在治理赌博和诈骗的行为需要构建大量的特征,在进行黑产帐号打击的时候,要利用构建的特征来提高打击精度和广度。目前,可以收集到海量用户的埋点数据,这些数据信息量丰富,但是却很少有效地利用起来:1,利用率低:埋点数据量大并且非常杂乱,通常都只是某个特定场景下,会统计某些特定埋点数据。2,数据太“原始”:通常埋点都是某一次支付的发生、某个页面曝光、某个点击事件等等,这些事件维度“低”,单用这些埋点不能表达某些“高维”的事件,比如“收红包->改昵称->拉黑对方”。
现有技术中,对海量用户的埋点数据的使用率较低,根据黑产帐号的行为序列不能提取更有效信息,进一步的,不能根据帐号的行为特征准确的确定帐号类型。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种帐号类型的确定方法和装置及电子设备,以至少解决现有技术,根据目标帐号的行为信息确定目标帐号类型准确性较低的技术问题。
根据本发明实施例的一个方面,提供了一种帐号类型的确定方法,包括:获取第一时间段内目标帐号产生的行为特征序列,其中,所述行为特征序列包括按行为发生时间的顺序排列的一组行为特征,所述一组行为特征包括所述目标帐号的交易行为特征和操作行为特征;在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,所述目标样本行为特征组合出现在所述行为特征序列中,所述每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对所述样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个所述样本行为特征组合包括所述样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,所述样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,所述一组样本行为特征包括所述样本异常帐号的样本交易行为特征和样本操作行为特征;根据所述目标样本行为特征组合的数量,确定所述目标帐号的帐号类型,其中,所述帐号类型用于表示所述目标帐号是否属于异常帐号。
根据本发明实施例的另一方面,还提供了一种帐号类型的确定装置,包括:第一获取单元,用于获取第一时间段内目标帐号产生的行为特征序列,其中,所述行为特征序列包括按行为发生时间的顺序排列的一组行为特征,所述一组行为特征包括所述目标帐号的交易行为特征和操作行为特征;第一确定单元,用于在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,所述目标样本行为特征组合出现在所述行为特征序列中,所述每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对所述样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个所述样本行为特征组合包括所述样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,所述样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,所述一组样本行为特征包括所述样本异常帐号的样本交易行为特征和样本操作行为特征;第二确定单元,用于根据所述目标样本行为特征组合的数量,确定所述目标帐号的帐号类型,其中,所述帐号类型用于表示所述目标帐号是否属于异常帐号。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述帐号类型的确定方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的帐号类型的确定方法。
在本发明实施例中,通过获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征;在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征;根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号,达到了根据已知属性的样本帐号的样本行为特征序列划分出一组样本行为特征组合,根据一组特征组合确定出多个聚类簇,其中,多个聚类簇中的每个聚类簇可以包括一个或多个样本行为特征组合,获取目标帐号的行为特征序列出现在多个聚类簇中的每个聚类簇的次数,得到对应多个聚类簇的一组数据,根据一组数据确定目标帐号的类型的目的,简而言之,预先根据样本异常帐号的样本行为特征序列,确定出多个聚类簇,进一步的,获取目标帐号的行为特征序列击中多个聚类簇中的每个聚类簇的次数,通过阈值来对目标帐号进行甄别,进而解决了现有技术,根据目标帐号的行为信息确定目标帐号类型准确性较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的帐号类型的确定方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的帐号类型的确定方法的流程图;
图3是根据本发明实施例的一种可选的目标帐号类型的甄别流程图;
图4是根据本发明实施例的一种可选的以2-gram模型划分样本行为特征序的结果示意图;
图5是根据本发明实施例的一种可选的聚类簇的结构示意图;
图6是根据本发明实施例的一种可选的基于n-gram和word2vec的行为序列挖掘算法的流程图;
图7是根据本发明实施例的一种可选的重要的子序列的示意图;
图8是根据本发明实施例的一种可选的基于n-gram和word2vec的行为序列挖掘算法的结构框图;
图9是根据本发明实施例的一种可选的帐号类型的确定装置的结构示意图;
图10是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种帐号类型的确定方法,可选地,作为一种可选的实施方式,上述帐号类型的确定方法可以但不限于应用于如图1所示的环境中。终端设备102、网络104以及服务器106。
服务器106获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征;在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征;根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号,达到了根据已知属性的样本帐号的样本行为特征序列划分出一组样本行为特征组合,根据一组特征组合确定出多个聚类簇,其中,多个聚类簇中的每个聚类簇可以包括一个或多个样本行为特征组合,获取目标帐号的行为特征序列出现在多个聚类簇中的每个聚类簇的次数,得到对应多个聚类簇的一组数据,根据一组数据确定目标帐号的类型的目的,简而言之,预先根据样本异常帐号的样本行为特征序列,确定出多个聚类簇,进一步的,获取目标帐号的行为特征序列击中多个聚类簇中的每个聚类簇的次数,通过阈值来对目标帐号进行甄别,进而解决了现有技术,根据目标帐号的行为信息确定目标帐号类型准确性较低的技术问题。
需要说明的是,上述帐号类型的确定方法可以包括但不限于可以由终端设备102执行,还可以由终端设备102和服务器106共同执行,上述仅是一种示例,本实施例中对此不作任何限定。
可选地,在本实施例中,上述终端设备可以是配置有目标客户端的终端设备,可以包括但不限于以下至少之一:手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices,移动互联网设备)、PAD、台式电脑、智能电视等。目标客户端可以是线上支付客户端、带有支付功能的即时通信客户端、带有支付功能的视频客户端等。上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
可选地,作为一种可选的实施方式,如图2所示,上述帐号类型的确定方法包括:
步骤S202,获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征。
步骤S204,在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征。
步骤S206,根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号。
可选的,在本实施例中,上述帐号类型的确定方法可以包括但不限于线上支付风控场景下的帐号类型的确定,即确定线上支付帐号的类型,帐号的类型可以包括但不限于赌博帐号、诈骗帐号,其中,线上支付风控场景可以包括但不限于微信支付的风控场景。上述帐号类型的确定方法可以用于微信支付的风控场景下帐号类型的确定。即确定微信帐号是赌博帐号、还是诈骗帐号。
在本实施例中,获取第一时间段内目标帐号产生的包括目标帐号的交易行为特征和操作行为特征,其中,交易行为特征包括但不限于目标帐号支付资源的行为,或者获取其他帐号支付的资源的行为,具体的,微信帐号支付金额的行为,微信帐号提现的行为,上述操作行为特征可以包括目标帐号更改昵称的操作。
如图3所示,目标帐号类型的甄别流程图。在实际应用中,对目标帐号类型的甄别的实现过程可以包括
步骤S301,获取目标帐号的行为特征;
步骤S302,根据行为特征确定出神经网络模型的输入;
步骤S303,根据神经网络模型输出目标帐号的类型。
其中,根据行为特征确定出神经网络模型的输入,其中,输入的数据可以是在预先确定的多个聚类簇中的每个聚类簇中的确定目标样本行为特征组合的数量。
可选的,在本实施例中,首先根据样本异常帐号产生的样本行为特征序列,其中,样本行为特征序列是根据时间将样本异常帐号的交易行为特征和样本操作行为特征,通过n-gram模型将样本行为特征序列分割出一组样本特征组合,确定出一组样本特征组合中重要的N个样本特征组合,以N个样本特征组合作为种子特征组合,将一组样本特征组合聚类成N个聚类簇。
需要说明的是,以N个样本特征组合作为种子特征组合,将一组样本特征组合聚类成N个聚类簇可以包括但不限于获取一组样本特征组合中的每个特征组合的向量,计算一组样本特征组合中的每个样本特征组合向量与N个种子样本特征组合中的每个样本特征组合向量的相似度,将相似度大于预定阈值的样本特征向量,划分为N个样本特征组合中的一个样本组合簇中,形成N个聚类簇。
在实际应用中,获取样本异常帐号的产生的样本行为特征序列,其中,样本异常帐号是赌博帐号,样本行为特征序列为两周时间内赌博帐号的样本行为特征序列,该样本行为特征序列可以包括但不限100个特征,样本行为特征序列可以为(交易特征、修改昵称特征、提现特征、交易特征、交易特征……修改昵称特征、交易特征、提现特征),通过2-gram模型将样本行为特征序列分割,得到99个样本特征组合,其中,一个样本特征组合中包括2个特征。获取99个样本特征组合中不同的样本特征组合的个数,如99个样本特征组合中确定出50个不同的样本特征组合,其中可以选取30个样本特征组合作为种子特征组合。需要说明的是,根据word2vec训练序列,将99个样本特征组合向量化后,计算所有样本特征组合相似度,将与种子特征组合之间的相似度大于0.8的样本特征组合,形成一个聚类簇,按照同样的方式计算30个种子样本特征组合中每个种子特征组合的相似度大于0.8的样本特征组合,形成30个聚类簇。
其中,在本实施例中,样本行为特征序列可以理解为一个句子,根据n-gram模型对样本行为特征序列进行分割,得到一组样本特征组合,一个样本特征组合可以理解为一个子序列。
需要说明的是,在本实施例中,确定多个聚类簇的方法还可以包括通过XGBoost算法确定。
计算多个样本异常帐号对各样本特征组合(子序列事件)的击中次数,形成特征表。如图4所示,以2-gram模型划分样本行为特征序的结果示意图。
在图4中,获取7个样本异常帐号的样本行为特征对各样本特征组合的击中次数,基于XGBoost算法确定30个聚类簇。
可选的,在本实施例中,在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,具体的,以2-gram模型对样本行为特征序列进行分割,得到样本特征组合,其中,样本特征组合包括2个行为特征,则确定的多个聚类簇中每个簇中包括的样本特征组合可以表示为A#B,其中,A可以表示交易行为或操作行为,B可以表示为交易行为或操作行为。
例如,预设确定的多个聚类簇为2个簇,其中,聚类簇1包括5个样本特征组合,即(A#B,A#C,A#D,A#E,B#C),聚类簇2包括4个样本特征组合,即(B#C,C#D,D#E,E#F),目标帐号的行为特征序列P,P包括5个特征,即(A,B,C,D,E),可以获取行为特征序列P击中聚类簇1中的2个样本特征组合(A#B,B#C),行为特征序列P击中聚类簇2中的3个样本特征组合(B#C,C#D,D#E)。
其中,在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量可以理解为目标帐号的行为特征序列在每个聚类簇中出现的次数,次数表示目标帐号的行为特征序列的子序列出现在聚类簇中的个数,亦或者是目标帐号的行为特征序列的子特征序列落入聚类簇的个数。
其中,在本实施例中,上述第一时间段内为目标帐号发送交易的时间,上述交易行为特征可以表示一个交易事件,其中,交易事件可以包括但不限于通过:交易方式,交易金额分桶,是否整十整百or特殊数字结尾,是否凌晨,交易次数,这五个属性来编码,之间用“_”拼接。
需要说明的是,为提高目标行为特征序列计算的速度,可以将相似的交易行为合并,计算次数后分桶。如,赌博帐号的行为特征组合:对6小时内相同的事件合并,对事件次数分桶<,3-6,7-10,11-20,21-100,>100
赌博帐号的行为特征组合:对1小时内相同的事件合并,对事件次数分桶=1,2-5,6-10,11-20,21-100,>100。合并的事件之间用#来拼接。
例如:
R_TRANSFER_200-1k_1_not-dawn_times=1#nick#WITHDRAW_<50_times=1
含义为:(非凌晨转账收款,金额特点:200-1000元且整十整百or特殊数字结尾,交易一次);(改昵称);(提现,金额特点:<50,交易一次)。
通过本申请提供的实施例,获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征;在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征;根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号,达到了根据已知属性的样本帐号的样本行为特征序列划分出一组样本行为特征组合,根据一组特征组合确定出多个聚类簇,其中,多个聚类簇中的每个聚类簇可以包括一个或多个样本行为特征组合,获取目标帐号的行为特征序列出现在多个聚类簇中的每个聚类簇的次数,得到对应多个聚类簇的一组数据,根据一组数据确定目标帐号的类型的目的,简而言之,预先根据样本异常帐号的样本行为特征序列,确定出多个聚类簇,进一步的,获取目标帐号的行为特征序列击中多个聚类簇中的每个聚类簇的次数,通过阈值来对目标帐号进行甄别,进而解决了现有技术,根据目标帐号的行为信息确定目标帐号类型准确性较低的技术问题。
可选的,上述方法可以包括:获取第二时间段内样本异常帐号产生的样本行为特征序列;将样本行为特征序列分割成一组样本行为特征组合;获取一组样本行为特征组合中不同的样本行为特征组合的统计参数;根据不同的样本行为特征组合的统计参数,确定多个聚类簇。
在本实施例中,样本行为特征序列中可以包括:支付行为特征、操作行为(如改昵称)特征。第二时间段内为样本异常帐号的行为时间跨度:[t-10,t+1],t为诈骗或赌博发生的交易时间,其中,交易事件可以包括但不限于通过:交易方式,交易金额分桶,是否整十整百or特殊数字结尾,是否凌晨,交易次数,这五个属性来编码,之间用“_”拼接。
为了提高计算速度,可以将相似的交易行为合并,计算次数后分桶。如赌博帐号:对6小时内相同的事件合并,对事件次数分桶<,3-6,7-10,11-20,21-100,>100;
诈骗帐号:对1小时内相同的事件合并,对事件次数分桶=1,2-5,6-10,11-20,21-100,>100;事件之间用#来拼接。
例如:
R_TRANSFER_200-1k_1_not-dawn_times=1#nick#WITHDRAW_<50_times=1
含义为:(非凌晨转账收款,金额特点:200-1000元且整十整百or特殊数字结尾,交易一次);(改昵称);(提现,金额特点:<50,交易一次)
需要说明的是,交易方式可以包括但不限于:BIND绑卡,UNBINd解绑,S_C2B用户付款给企业,S_HB付个人红包,R_HB收个人红包,R_TRANSFER收款转账,SELF转账给自己同身份证的帐号。特殊数字结尾可以包括但不限:99、98、88结尾的金额;根据该场景下的金额分布得出交易金额分桶,赌博场景:>1w,1k-1w,100-1k,10-200,<10;诈骗场景:>1w,1k-1w,200-1k,50-200,<50。
在本实施例中,获取到样本异常帐号产生的样本行为特征序列后,可以通过n-gram模型对样本行为特征序列进行分割,得到一组样本行为特征组合,其中,上述n-gram模型可以包括但不限于2-gram模型,3-gram模型。以2-gram模型进行样本行为特征序列分割,则可以将样本行为特征序列看成一个句子,每个特征看成一个词,在相邻的2个特征分割为一个样本行为特征组合。
其中,在本实施例中,获取第二时间段内样本异常帐号产生的样本行为特征序列,可以包括:在样本异常帐号包括多个异常帐号的情况下,获取第二时间段内多个异常帐号分别产生的样本行为特征序列。
将样本行为特征序列分割成一组样本行为特征组合,可以包括:将多个异常帐号分别产生的样本行为特征序列分割成一组样本行为特征组合,其中,每个样本行为特征组合包括一个异常帐号产生的样本行为特征序列中相邻的多个样本行为特征。
可选的,根据不同的样本行为特征组合的统计参数,确定多个聚类簇,可以包括:
S1,根据不同的样本行为特征组合的统计参数,在不同的样本行为特征组合中选择N个样本行为特征组合,其中,不同的样本行为特征组合为不同的M个样本行为特征组合,M大于N,N为大于1的自然数;
S2,将M个样本行为特征组合中的每个样本行为特征组合转换为对应的向量,其中,M个样本行为特征组合转换成的向量共为M个向量;
S3,分别以N个样本行为特征组合中的每个样本行为特征组合为种子行为特征组合,根据M个向量,对M个样本行为特征组合进行聚类,得到N个聚类簇。
其中,根据不同的样本行为特征组合的统计参数,在不同的样本行为特征组合中选择N个样本行为特征组合,可以包括:
在M个样本行为特征组合的统计参数分别表示M个样本行为特征组合中的每个样本行为特征组合在一组样本行为特征组合中的出现次数的情况下,在M个样本行为特征组合中选择按照出现次数从高到低排列的前N个样本行为特征组合。
需要说明的是,将M个样本行为特征组合中的每个样本行为特征组合转换为对应的向量,可以包括:对M个样本行为特征组合中的每个样本行为特征组合,执行以下操作,其中,在执行以下操作时,每个样本行为特征组合被视为当前样本行为特征组合:
将当前样本行为特征组合中的每个特征转换为预设维度的向量;
将当前样本行为特征组合中的每个特征转换成的向量进行拼接,得到当前样本行为特征组合的向量矩阵。
在本实施例中,每个样本行为特征组合根据训练好的word2vec,得到每个样本行为特征组合的向量。在一个样本行为特征组合包括2个行为特征。一个样本行为特征组合表示为A#B,其中,A可以是交易行为特征、还可以是操作行为特征,B可以是交易行为特征、还可以是操作行为特征。通过训练好的word2vec,得到A对应的向量可以是一个1×5的向量,B也是一个1×5的向量,样本行为特征组合的向量可以是1×10的向量,也可以是2×5的矩阵向量。
根据向量或矩阵向量计算每两个样本行为特征组合的相似度。
可选的,将当前样本行为特征组合中的每个特征转换成的向量进行拼接,得到当前样本行为特征组合的向量矩阵,可以包括:将当前样本行为特征组合中的每个特征转换成的向量按照行或列进行拼接,得到当前样本行为特征组合对应的向量矩阵。
可选的,分别以N个样本行为特征组合中的每个样本行为特征组合为种子行为特征组合,根据M个向量,对M个样本行为特征组合进行聚类,得到N个聚类簇,可以包括:
对于N个样本行为特征组合中的每个样本行为特征组合,执行以下步骤,其中,在执行以下步骤时,每个样本行为特征组合被视为当前样本行为特征组合:
分别获取M-1个样本行为特征组合中的每个样本行为特征组合对应的向量与当前样本行为特征组合对应的向量之间的相似度,共得到M-1个相似度,其中,M-1个样本行为特征组合为M个样本行为特征组合中除当前样本行为特征组合之外的样本行为特征组合;
将当前样本行为特征组合对应的一个聚类簇确定为包括在M-1个样本行为特征组合中相似度大于预定阈值的样本行为特征组合以及当前样本行为特征组合。
在本实施例中,样本行为特征序列得到100个样本特征组合,根据XGBoost确定出用户类型对应的30个种子样本行为特征组合,计算30个种子样本行为特征组合中的每个种子样本行为特征组合与其余的99个样本行为特征组合之间的相似度,将99个样本行为特征组合中与种子样本行为特征组合之间的相似度大于0.8的样本行为特征组合聚类,得到该种子样本行为特征组合的聚类簇。如,30个种子样本行为特征组合编号为1、2、3、4……30,计算编号为1的种子样本行为特征组合与其余的99个样本行为特征组合之间的相似度,其中99个样本行为特征组合中有16个样本行为特征组合与编号为1的种子样本行为特征组合之间的相似度大于0.8,则编号为1的种子样本行为特征组合聚类,得到聚类簇1,聚类簇1中包括17个样本行为特征组合。
如图5所示,聚类簇的结构示意图,如图5中列出5个聚类簇,第一行表示簇名,第二行表示种子样本行为特征组合,其余行表示的样本行为特征组合是与第二行中对应种子样本行为特征组合相似度>0.8的样本行为特征组合。如5个聚类簇的簇名为f1,f2,f3,f4,f5,种子样本行为特征组合为:R_F2F_50-20,R_QHB_<50,R_F2F_50,R_F2F_50,S_F2F_50。其中,一列表示一个聚类簇。
需要说明的是,在本实施例中,将样本行为特征组合转换为向量,进而根据向量计算样本行为特征组合之间的相似度,相似度的可以通过两个向量之间的距离标识,可以包括但不限于两个向量之间的欧氏距离、曼哈顿距离、切比雪夫距离等。
例如,样本行为特征组合A为:
R_TRANSFER_1k-1w_1_not-dawn_times=1#R_TRANSFER_200-1k_1_not-dawn_times=1
其中,R_TRANSFER_1k-1w_1_not-dawn_times=1表示一个交易事件,对应的向量为(0.792,-0.177,-0.107,0.109,-0.542);
R_TRANSFER_200-1k_1_not-dawn_times=1表示一个交易事件,对应的向量为(0.793,-0.171,-0.109,0.109,-0.546);
其中,样本行为特征组合A可以是一个1×10的向量,或者是2×5的矩阵。
可选的,根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,可以包括:
根据目标样本行为特征组合的数量,确定行为特征序列在多个聚类簇中的每个聚类簇中的簇特征;
将行为特征序列在多个聚类簇中的每个聚类簇中的簇特征输入到目标神经网络模型,得到目标神经网络模型输出的预测的帐号类型,其中,目标神经网络模型是使用一组簇特征训练样本对待训练的神经网络模型进行训练得到的网络模型,一组簇特征训练样本包括一组训练帐号产生的训练行为特征序列在多个聚类簇中的每个聚类簇中的簇特征。
在本实施例中,簇特征可以包括但不限于簇的频数和频率,其中,簇的频数表示出现的次数,簇的频率表示该簇中的次数相对于所有样本行为特征组合的次数,如目标帐号的行为特征序列在聚类簇1中出现的次数为16,在所有聚类簇中出现的次数是160,则目标帐号的聚类簇的频数为16,频率为0.1,30个聚类簇得到30对(频数,频率)数据,将聚类簇的特征数据输入目标神经网络模型,输出的预测的帐号类型,可以得到帐号是赌博帐号、诈骗帐号、正常帐号等。
可选的,根据目标样本行为特征组合的数量,确定行为特征序列在多个聚类簇中的每个聚类簇中的簇特征,可以包括:
对于多个聚类簇中的每个聚类簇,执行以下步骤,其中,在执行以下步骤时,每个聚类簇被视为当前聚类簇,当前聚类簇中被行为特征序列所包括的样本行为特征组合的数量被视为当前数量:
将行为特征序列在当前聚类簇中的簇特征确定为包括:当前数量以及当前频率,其中,当前频率为当前数量与当前聚类簇中包括的样本行为特征组合的数量之间的比值。
可选的,上述方法还可以包括:获取一组训练帐号产生的训练行为特征序列在多个聚类簇中的每个聚类簇中的簇特征,以得到一组簇特征训练样本,其中,一组训练帐号的帐号类型为已知的帐号类型,已知的帐号类型用于表示训练帐号是否属于异常帐号;使用一组簇特征训练样本对待训练的神经网络模型进行训练,直到待训练的神经网络模型输出的预测的帐号类型与已知的帐号类型之间的损失函数满足预设条件的情况下,结束训练,其中,结束训练时的待训练的神经网络模型为目标神经网络模型。
可选的,将样本行为特征序列分割成一组样本行为特征组合,可以包括:按照预设的n-gram模型将样本行为特征序列分割成一组样本行为特征组合。
在本实施例中,n-gram模型可以包括但不限于2-gram模型,3-gram模型等等。
可选的,在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,可以包括:
将行为特征序列分割成一组行为特征组合,其中,一组行为特征组合中的每个行为特征组合包括行为特征序列中相邻的多个行为特征;
在每个聚类簇中确定目标样本行为特征组合的数量,其中,一组行为特征组合包括目标样本行为特征组合。
可选的,在本申请中还提供了一种可选的实施例基于n-gram和word2vec的行为序列挖掘算法。
本实施例中的行为序列挖掘算法应用在,黑产帐号(用户)在微信场景中进行赌博和诈骗时,后台模型会计算用户行为序列数据命中挖掘出来的黑行为序列的次数,通过阈值来对黑产帐号进行甄别,而后进行打击。
如图6所示,基于n-gram和word2vec的行为序列挖掘算法的流程图。
步骤S61,数据的预处理;
在步骤S61中,获取一段时间内的样本异常帐号产生的一个样本行为特征序列,其中,样本行为特征序列中包括支付行为特征、操作行为特征,操作行为特征包括但不限于样本异常帐号的昵称修改事件。一个样本行为特征序列的行为时间跨度:[t-10,t+1],t为诈骗或赌博发生的交易时间。
其中,交易事件通过可以通过交易方式,交易金额分桶,是否整十整百or特殊数字结尾,是否凌晨,交易次数,这五个属性来编码,之间用“_”拼接。
其中,事件之间可以用#来拼接,例如:
R_TRANSFER_200-1k_1_not-dawn_times=1#nick#WITHDRAW_<50_times=1
含义为:(非凌晨转账收款,金额特点:200-1000元且整十整百or特殊数字结尾,交易一次);(改昵称);(提现,金额特点:<50,交易一次)。
需要说明的是,样本异常帐号的样本行为特征序列一般可以包括14天内样本异常帐号的行为特征,为了提高计算的速度,可以将时间间隔小于预定阈值的两个相同交易事件进行合并。
其中,相似的交易行为合并,计算次数后分桶;
赌博:对6小时内相同的事件合并,对事件次数分桶<3,3-6,7-10,11-20,21-100,>100。
诈骗:对1小时内相同的事件合并,对事件次数分桶=1,2-5,6-10,11-20,21-100,>100。
还需要说明的是,交易方式包括但不限于:BIND绑卡,UNBINd解绑,S_C2B用户付款给企业,S_HB付个人红包,R_HB收个人红包,R_TRANSFER收款转账,SELF转账给自己同身份证的帐号;特殊数字结尾可以包括:99、98、88结尾的金额;交易金额分桶可以根据该场景下的金额分布得出:
赌博场景:>1w,1k-1w,100-1k,10-200,<10
诈骗场景:>1w,1k-1w,200-1k,50-200,<50
获得样本行为特征序列后,对样本行为特征序列中的事件特征通过One-Hot进行编码。
步骤S62,生成子序列;
在步骤S62中,通过n-gram的方法切割样本行为特征序列,获得样本异常帐号的一组样本行为特征组合,其中,样本异常帐号的样本行为特征序列视为句子,把长度为n的样本行为特征组合为词,样本行为特征组合可以理解为样本异常帐号的子序列。
其中,计算用户(样本异常帐号)对各子序列事件(样本行为特征组合)的击中次数,形成特征表,如图4所示,以2-gram模型分割样本行为特征序列得到的序列特征表。
利用图4所示的特征,通过XGBoost算法对用户分类,根据统计次数确定特征重要性前30名的子序列,如图7所示,重要的子序列的示意图,在图7中根据子序列的重要性进行排序。
步骤S63,子序列向量簇;
在步骤S63中,根据训练好的word2vec,将子序列向量化后,计算所有子序列间相似度。
例如,子序列A:
R_TRANSFER_1k-1w_1_not-dawn_times=1#R_TRANSFER_200-1k_1_not-dawn_times=1
其中,R_TRANSFER_1k-1w_1_not-dawn_times=1的向量为(0.792,-0.177,-0.107,0.109,-0.542);
R_TRANSFER_200-1k_1_not-dawn_times=1的向量为(0.798,-0.176,-0.109,0.102,-0.546);
子序列A可以是一个1×10的向量,或是2×5的矩阵。
步骤S64,合并子序列簇。
为了不损失信息,提高特征的信息量与泛化能力,利用top30名的种子子序列(种子样本行为特征组合),通过步骤S63中计算的相似度,提取与种子特征的相似度高的特征(相似度>0.8)合并成簇。
如图5所示,列出5个簇,第一行表示簇名,第二行表示种子子序列,其余行的子序列是是与第二行中对应的种子子序列相似度>0.8的子序列。也就是说,一列表示一个聚类簇。如5个聚类簇的簇名为f1,f2,f3,f4,f5,种子样本行为特征组合为:R_F2F_50-20,R_QHB_<50,R_F2F_50,R_F2F_50,S_F2F_50。其中,一列表示一个聚类簇。
步骤S65,根据簇,计算簇的频数和频率作为簇特征。
在步骤S64中,为了提高特征泛化能力,把这30个簇特征通过有监督的全连接神经网络降维,最终得到8维子序列特征,供打击模型使用。
需要说明的是,得到的8维子序列特征,输入打击模型(目标神经网络模型)中,输出帐号的类型。
如图8所示,基于n-gram和word2vec的行为序列挖掘算法的结构框图。具体的实现过程如下。
如图8所示,首先预处理,即获取序列挖掘算法的交易数据,根据交易数据确定交易特征,并对交易数据对应的事件编码,事件编码得到序列挖掘算法中的运算数据。
其次,生成子序列,即根据n-gram模型对一段时间内的交易事件形成的特征序列生成子序列,并统计出每个子序列出现的次数,显著性筛选出重要的子序列。
再次,得到子序列向量簇,即根据word2vec将所有的子序列转换为向量或距离,通过向量或矩阵计算所有的子序列和重要的子序列之间的聚类相似度,将与重要子序列之间的聚类相似度大于预定阈值的子序列进行聚类,得到子序列向量簇。
最后,合并子序列簇,即可以得到泛化能力更强的特征序列,用于指导帐号序列构建,进一步的,将合并后的特征序列输入至深度学习网络模型中,用于判断帐号的属性,即帐号是异常帐号还是正常帐号,如帐号是赌博帐号等。
通过本申请提供的实施例,一种基于n-gram和word2vec的行为序列模式挖掘算法可以利用低成本的离线计算进行子序列挖掘,利用word2vec使序列向量化后进行相似度合并形成子序列簇来提升黑序列的泛化能力,使得挖掘出来的子序列能很好的识别黑产用户,提高我们离线打击模型的准确率与召回率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述帐号类型的确定方法的帐号类型的确定装置。如图9所示,该帐号类型的确定装置包括:第一获取单元91、第一确定单元93以及第二确定单元95。
第一获取单元91,用于获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征。
第一确定单元93,用于在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征。
第二确定单元95,用于根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号。
通过本申请提供的实施例,第一获取单元91获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征;第一确定单元93在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征;第二确定单元根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号。达到了根据已知属性的样本帐号的样本行为特征序列划分出一组样本行为特征组合,根据一组特征组合确定出多个聚类簇,其中,多个聚类簇中的每个聚类簇可以包括一个或多个样本行为特征组合,获取目标帐号的行为特征序列出现在多个聚类簇中的每个聚类簇的次数,得到对应多个聚类簇的一组数据,根据一组数据确定目标帐号的类型的目的,简而言之,预先根据样本异常帐号的样本行为特征序列,确定出多个聚类簇,进一步的,获取目标帐号的行为特征序列击中多个聚类簇中的每个聚类簇的次数,通过阈值来对目标帐号进行甄别,进而解决了现有技术,根据目标帐号的行为信息确定目标帐号类型准确性较低的技术问题。
可选的,上述装置还可以包括:第二获取单元,用于获取第二时间段内样本异常帐号产生的样本行为特征序列;分割单元,用于将样本行为特征序列分割成一组样本行为特征组合;第三获取单元,用于获取一组样本行为特征组合中不同的样本行为特征组合的统计参数;第三确定单元,用于根据不同的样本行为特征组合的统计参数,确定多个聚类簇。
可选的,上述装置还可以包括:第二获取单元,包括:第一获取模块,用于在样本异常帐号包括多个异常帐号的情况下,获取第二时间段内多个异常帐号分别产生的样本行为特征序列;
分割单元,包括:第一分割模块,用于将多个异常帐号分别产生的样本行为特征序列分割成一组样本行为特征组合,其中,每个样本行为特征组合包括一个异常帐号产生的样本行为特征序列中相邻的多个样本行为特征。
可选的,上述第三确定单元,可以包括:选择模块,用于根据不同的样本行为特征组合的统计参数,在不同的样本行为特征组合中选择N个样本行为特征组合,其中,不同的样本行为特征组合为不同的M个样本行为特征组合,M大于N,N为大于1的自然数;转换模块,用于将M个样本行为特征组合中的每个样本行为特征组合转换为对应的向量,其中,M个样本行为特征组合转换成的向量共为M个向量;聚类模块,用于分别以N个样本行为特征组合中的每个样本行为特征组合为种子行为特征组合,根据M个向量,对M个样本行为特征组合进行聚类,得到N个聚类簇。
其中,上述选择模块,可以包括:选择子模块,用于在M个样本行为特征组合的统计参数分别表示M个样本行为特征组合中的每个样本行为特征组合在一组样本行为特征组合中的出现次数的情况下,在M个样本行为特征组合中选择按照出现次数从高到低排列的前N个样本行为特征组合。
可选的,上述转换模块,可以包括:第一执行子模块,用于对M个样本行为特征组合中的每个样本行为特征组合,执行以下操作,其中,在执行以下操作时,每个样本行为特征组合被视为当前样本行为特征组合:将当前样本行为特征组合中的每个特征转换为预设维度的向量;将当前样本行为特征组合中的每个特征转换成的向量进行拼接,得到当前样本行为特征组合的向量矩阵。
其中,上述拼接子模块还用于执行如下操作:将当前样本行为特征组合中的每个特征转换成的向量按照行或列进行拼接,得到当前样本行为特征组合对应的向量矩阵。
可选的,上述聚类模块,可以包括:
第二执行子模块,用于对于N个样本行为特征组合中的每个样本行为特征组合,执行以下步骤,其中,在执行以下步骤时,每个样本行为特征组合被视为当前样本行为特征组合:分别获取M-1个样本行为特征组合中的每个样本行为特征组合对应的向量与当前样本行为特征组合对应的向量之间的相似度,共得到M-1个相似度,其中,M-1个样本行为特征组合为M个样本行为特征组合中除当前样本行为特征组合之外的样本行为特征组合;将当前样本行为特征组合对应的一个聚类簇确定为包括在M-1个样本行为特征组合中相似度大于预定阈值的样本行为特征组合以及当前样本行为特征组合。
可选的,上述第二确定单元95,可以包括:第一确定模块,用于根据目标样本行为特征组合的数量,确定行为特征序列在多个聚类簇中的每个聚类簇中的簇特征;输出模块,用于将行为特征序列在多个聚类簇中的每个聚类簇中的簇特征输入到目标神经网络模型,得到目标神经网络模型输出的预测的帐号类型,其中,目标神经网络模型是使用一组簇特征训练样本对待训练的神经网络模型进行训练得到的网络模型,一组簇特征训练样本包括一组训练帐号产生的训练行为特征序列在多个聚类簇中的每个聚类簇中的簇特征。
其中,上述第一确定模块,可以包括:第三执行子模块,用于对于多个聚类簇中的每个聚类簇,执行以下步骤,其中,在执行以下步骤时,每个聚类簇被视为当前聚类簇,当前聚类簇中被行为特征序列所包括的样本行为特征组合的数量被视为当前数量:将行为特征序列在当前聚类簇中的簇特征确定为包括:当前数量以及当前频率,其中,当前频率为当前数量与当前聚类簇中包括的样本行为特征组合的数量之间的比值。
可选的,上述装置还可以包括:第二获取模块,用于获取一组训练帐号产生的训练行为特征序列在多个聚类簇中的每个聚类簇中的簇特征,以得到一组簇特征训练样本,其中,一组训练帐号的帐号类型为已知的帐号类型,已知的帐号类型用于表示训练帐号是否属于异常帐号;训练模块,用于使用一组簇特征训练样本对待训练的神经网络模型进行训练,直到待训练的神经网络模型输出的预测的帐号类型与已知的帐号类型之间的损失函数满足预设条件的情况下,结束训练,其中,结束训练时的待训练的神经网络模型为目标神经网络模型。
可选的,上述分割单元,可以包括:第二分割模块,用于按照预设的n-gram模型将样本行为特征序列分割成一组样本行为特征组合。
可选的,上述第一确定单元,可以包括:第三分割模块,用于将行为特征序列分割成一组行为特征组合,其中,一组行为特征组合中的每个行为特征组合包括行为特征序列中相邻的多个行为特征;第二确定模块,用于在每个聚类簇中确定目标样本行为特征组合的数量,其中,一组行为特征组合包括目标样本行为特征组合。
根据本发明实施例的又一个方面,还提供了一种用于实施上述帐号类型的确定方法的电子设备,该电子设备可以是图1所示的终端设备或服务器。本实施例以该电子设备为服务器为例来说明。如图10所示,该电子设备包括存储器1002和处理器1004,该存储器1002中存储有计算机程序,该处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征。
S2,在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征。
S3,根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号。
可选地,本领域普通技术人员可以理解,图10所示的结构仅为示意,电子装置电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图10中所示更多或者更少的组件(如网络接口等),或者具有与图10所示不同的配置。
其中,存储器1002可用于存储软件程序以及模块,如本发明实施例中的帐号类型的确定方法和装置对应的程序指令/模块,处理器1004通过运行存储在存储器1002内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的帐号类型的确定方法。存储器1002可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1002可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1002具体可以但不限于用于存储目标帐号的行为特征序列、预先确定的多个聚类簇等信息。作为一种示例,如图10所示,上述存储器1002中可以但不限于包括上述帐号类型的确定装置中的第一获取单元91、第一确定单元93以及第二确定单元95。此外,还可以包括但不限于上述帐号类型的确定装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1006为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器1008,用于显示上述待目标帐号的类型信息;和连接总线1010,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述帐号类型的确定方面或者帐号类型的确定方面的各种可选实现方式中提供的帐号类型的确定方法。其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取第一时间段内目标帐号产生的行为特征序列,其中,行为特征序列包括按行为发生时间的顺序排列的一组行为特征,一组行为特征包括目标帐号的交易行为特征和操作行为特征。
S2,在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,目标样本行为特征组合出现在行为特征序列中,每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个样本行为特征组合包括样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,一组样本行为特征包括样本异常帐号的样本交易行为特征和样本操作行为特征。
S3,根据目标样本行为特征组合的数量,确定目标帐号的帐号类型,其中,帐号类型用于表示目标帐号是否属于异常帐号。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种帐号类型的确定方法,其特征在于,包括:
获取第一时间段内目标帐号产生的行为特征序列,其中,所述行为特征序列包括按行为发生时间的顺序排列的一组行为特征,所述一组行为特征包括所述目标帐号的交易行为特征和操作行为特征;
在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,所述目标样本行为特征组合出现在所述行为特征序列中,所述每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对所述样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个所述样本行为特征组合包括所述样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,所述样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,所述一组样本行为特征包括所述样本异常帐号的样本交易行为特征和样本操作行为特征;
根据所述目标样本行为特征组合的数量,确定所述目标帐号的帐号类型,其中,所述帐号类型用于表示所述目标帐号是否属于异常帐号。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二时间段内所述样本异常帐号产生的所述样本行为特征序列;
将所述样本行为特征序列分割成所述一组样本行为特征组合;
获取所述一组样本行为特征组合中不同的样本行为特征组合的统计参数;
根据所述不同的样本行为特征组合的统计参数,确定所述多个聚类簇。
3.根据权利要求2所述的方法,其特征在于,
所述获取第二时间段内所述样本异常帐号产生的所述样本行为特征序列,包括:在所述样本异常帐号包括多个异常帐号的情况下,获取所述第二时间段内所述多个异常帐号分别产生的样本行为特征序列;
所述将所述样本行为特征序列分割成所述一组样本行为特征组合,包括:将所述多个异常帐号分别产生的样本行为特征序列分割成所述一组样本行为特征组合,其中,每个所述样本行为特征组合包括一个所述异常帐号产生的样本行为特征序列中相邻的多个样本行为特征。
4.根据权利要求2所述的方法,其特征在于,所述根据所述不同的样本行为特征组合的统计参数,确定所述多个聚类簇,包括:
根据所述不同的样本行为特征组合的统计参数,在所述不同的样本行为特征组合中选择N个样本行为特征组合,其中,所述不同的样本行为特征组合为不同的M个样本行为特征组合,M大于N,N为大于1的自然数;
将所述M个样本行为特征组合中的每个样本行为特征组合转换为对应的向量,其中,所述M个样本行为特征组合转换成的向量共为M个向量;
分别以所述N个样本行为特征组合中的每个样本行为特征组合为种子行为特征组合,根据所述M个向量,对所述M个样本行为特征组合进行聚类,得到N个聚类簇。
5.根据权利要求4所述的方法,其特征在于,所述根据所述不同的样本行为特征组合的统计参数,在所述不同的样本行为特征组合中选择N个样本行为特征组合,包括:
在所述M个样本行为特征组合的统计参数分别表示所述M个样本行为特征组合中的每个样本行为特征组合在所述一组样本行为特征组合中的出现次数的情况下,在所述M个样本行为特征组合中选择按照所述出现次数从高到低排列的前N个样本行为特征组合。
6.根据权利要求4所述的方法,其特征在于,所述将所述M个样本行为特征组合中的每个样本行为特征组合转换为对应的向量,包括:
对所述M个样本行为特征组合中的每个样本行为特征组合,执行以下操作,其中,在执行以下操作时,每个样本行为特征组合被视为当前样本行为特征组合:
将所述当前样本行为特征组合中的每个特征转换为预设维度的向量;
将所述当前样本行为特征组合中的每个特征转换成的向量进行拼接,得到所述当前样本行为特征组合的向量矩阵。
7.根据权利要求6所述的方法,其特征在于,所述将所述当前样本行为特征组合中的每个特征转换成的向量进行拼接,得到所述当前样本行为特征组合的向量矩阵,包括:
将所述当前样本行为特征组合中的每个特征转换成的向量按照行或列进行拼接,得到所述当前样本行为特征组合对应的向量矩阵。
8.根据权利要求4所述的方法,其特征在于,所述分别以所述N个样本行为特征组合中的每个样本行为特征组合为种子行为特征组合,根据所述M个向量,对所述M个样本行为特征组合进行聚类,得到N个聚类簇,包括:
对于所述N个样本行为特征组合中的每个样本行为特征组合,执行以下步骤,其中,在执行以下步骤时,所述每个样本行为特征组合被视为当前样本行为特征组合:
分别获取M-1个样本行为特征组合中的每个样本行为特征组合对应的向量与所述当前样本行为特征组合对应的向量之间的相似度,共得到M-1个相似度,其中,所述M-1个样本行为特征组合为所述M个样本行为特征组合中除当前样本行为特征组合之外的样本行为特征组合;
将所述当前样本行为特征组合对应的一个聚类簇确定为包括在所述M-1个样本行为特征组合中相似度大于预定阈值的样本行为特征组合以及所述当前样本行为特征组合。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述根据所述目标样本行为特征组合的数量,确定所述目标帐号的帐号类型,包括:
根据所述目标样本行为特征组合的数量,确定所述行为特征序列在所述多个聚类簇中的每个聚类簇中的簇特征;
将所述行为特征序列在所述多个聚类簇中的每个聚类簇中的簇特征输入到目标神经网络模型,得到所述目标神经网络模型输出的预测的所述帐号类型,其中,所述目标神经网络模型是使用一组簇特征训练样本对待训练的神经网络模型进行训练得到的网络模型,所述一组簇特征训练样本包括一组训练帐号产生的训练行为特征序列在所述多个聚类簇中的每个聚类簇中的簇特征。
10.根据权利要求9所述的方法,其特征在于,所述根据所述目标样本行为特征组合的数量,确定所述行为特征序列在所述多个聚类簇中的每个聚类簇中的簇特征,包括:
对于所述多个聚类簇中的每个聚类簇,执行以下步骤,其中,在执行以下步骤时,所述每个聚类簇被视为当前聚类簇,所述当前聚类簇中被所述行为特征序列所包括的样本行为特征组合的数量被视为当前数量:
将所述行为特征序列在所述当前聚类簇中的簇特征确定为包括:所述当前数量以及当前频率,其中,所述当前频率为所述当前数量与所述当前聚类簇中包括的所述样本行为特征组合的数量之间的比值。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
获取所述一组训练帐号产生的训练行为特征序列在所述多个聚类簇中的每个聚类簇中的簇特征,以得到所述一组簇特征训练样本,其中,所述一组训练帐号的帐号类型为已知的帐号类型,所述已知的帐号类型用于表示所述训练帐号是否属于异常帐号;
使用所述一组簇特征训练样本对所述待训练的神经网络模型进行训练,直到所述待训练的神经网络模型输出的预测的帐号类型与所述已知的帐号类型之间的损失函数满足预设条件的情况下,结束训练,其中,结束训练时的所述待训练的神经网络模型为所述目标神经网络模型。
12.根据权利要求2至8中的任一项所述的方法,其特征在于,所述将所述样本行为特征序列分割成所述一组样本行为特征组合,包括:
按照预设的n-gram模型将所述样本行为特征序列分割成所述一组样本行为特征组合。
13.根据权利要求1至8中的任一项所述的方法,其特征在于,所述在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,包括:
将所述行为特征序列分割成一组行为特征组合,其中,所述一组行为特征组合中的每个行为特征组合包括所述行为特征序列中相邻的多个行为特征;
在所述每个聚类簇中确定所述目标样本行为特征组合的数量,其中,所述一组行为特征组合包括所述目标样本行为特征组合。
14.一种帐号类型的确定装置,其特征在于,包括:
第一获取单元,用于获取第一时间段内目标帐号产生的行为特征序列,其中,所述行为特征序列包括按行为发生时间的顺序排列的一组行为特征,所述一组行为特征包括所述目标帐号的交易行为特征和操作行为特征;
第一确定单元,用于在预先确定的多个聚类簇中的每个聚类簇中确定目标样本行为特征组合的数量,其中,所述目标样本行为特征组合出现在所述行为特征序列中,所述每个聚类簇是以样本异常帐号产生的一个样本行为特征组合为种子行为特征组合,对所述样本异常帐号产生的一组样本行为特征组合进行聚类,得到的聚类簇,每个所述样本行为特征组合包括所述样本异常帐号产生的样本行为特征序列中相邻的多个样本行为特征,所述样本行为特征序列包括按行为发生时间的顺序排列的一组样本行为特征,所述一组样本行为特征包括所述样本异常帐号的样本交易行为特征和样本操作行为特征;
第二确定单元,用于根据所述目标样本行为特征组合的数量,确定所述目标帐号的帐号类型,其中,所述帐号类型用于表示所述目标帐号是否属于异常帐号。
15.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至13任一项中所述的方法。
CN202110189551.7A 2021-02-19 2021-02-19 帐号类型的确定方法和装置及电子设备 Active CN113011886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110189551.7A CN113011886B (zh) 2021-02-19 2021-02-19 帐号类型的确定方法和装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110189551.7A CN113011886B (zh) 2021-02-19 2021-02-19 帐号类型的确定方法和装置及电子设备

Publications (2)

Publication Number Publication Date
CN113011886A true CN113011886A (zh) 2021-06-22
CN113011886B CN113011886B (zh) 2023-07-14

Family

ID=76403207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110189551.7A Active CN113011886B (zh) 2021-02-19 2021-02-19 帐号类型的确定方法和装置及电子设备

Country Status (1)

Country Link
CN (1) CN113011886B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821574A (zh) * 2021-08-31 2021-12-21 北京达佳互联信息技术有限公司 用户行为分类方法和装置及存储介质
CN113836370A (zh) * 2021-11-25 2021-12-24 上海观安信息技术股份有限公司 用户群体的分类方法、装置、存储介质及计算机设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254153A (zh) * 2016-09-19 2016-12-21 腾讯科技(深圳)有限公司 一种网络异常监控方法和装置
WO2017143932A1 (zh) * 2016-02-26 2017-08-31 中国银联股份有限公司 基于样本聚类的欺诈交易检测方法
US20180365665A1 (en) * 2017-06-16 2018-12-20 Nec Laboratories America, Inc. Banking using suspicious remittance detection through financial behavior analysis
CN110008999A (zh) * 2019-03-07 2019-07-12 腾讯科技(深圳)有限公司 目标帐号的确定方法、装置、存储介质及电子装置
CN110147389A (zh) * 2019-03-14 2019-08-20 腾讯科技(深圳)有限公司 帐号处理方法和装置、存储介质及电子装置
CN110189151A (zh) * 2019-06-12 2019-08-30 北京奇艺世纪科技有限公司 一种账号检测方法及相关设备
CN110225036A (zh) * 2019-06-12 2019-09-10 北京奇艺世纪科技有限公司 一种账号检测方法、装置、服务器及存储介质
US20200175421A1 (en) * 2018-11-29 2020-06-04 Sap Se Machine learning methods for detection of fraud-related events
CN111298445A (zh) * 2020-02-07 2020-06-19 腾讯科技(深圳)有限公司 目标账号检测方法、装置、电子设备及存储介质
CN111698247A (zh) * 2020-06-11 2020-09-22 腾讯科技(深圳)有限公司 异常账号检测方法、装置、设备及存储介质
CN111931047A (zh) * 2020-07-31 2020-11-13 中国平安人寿保险股份有限公司 基于人工智能的黑产账号检测方法及相关装置
CN112215288A (zh) * 2020-10-13 2021-01-12 中国光大银行股份有限公司 目标企业的类别确定方法及装置、存储介质、电子装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017143932A1 (zh) * 2016-02-26 2017-08-31 中国银联股份有限公司 基于样本聚类的欺诈交易检测方法
CN106254153A (zh) * 2016-09-19 2016-12-21 腾讯科技(深圳)有限公司 一种网络异常监控方法和装置
US20180365665A1 (en) * 2017-06-16 2018-12-20 Nec Laboratories America, Inc. Banking using suspicious remittance detection through financial behavior analysis
US20200175421A1 (en) * 2018-11-29 2020-06-04 Sap Se Machine learning methods for detection of fraud-related events
CN110008999A (zh) * 2019-03-07 2019-07-12 腾讯科技(深圳)有限公司 目标帐号的确定方法、装置、存储介质及电子装置
CN110147389A (zh) * 2019-03-14 2019-08-20 腾讯科技(深圳)有限公司 帐号处理方法和装置、存储介质及电子装置
CN110189151A (zh) * 2019-06-12 2019-08-30 北京奇艺世纪科技有限公司 一种账号检测方法及相关设备
CN110225036A (zh) * 2019-06-12 2019-09-10 北京奇艺世纪科技有限公司 一种账号检测方法、装置、服务器及存储介质
CN111298445A (zh) * 2020-02-07 2020-06-19 腾讯科技(深圳)有限公司 目标账号检测方法、装置、电子设备及存储介质
CN111698247A (zh) * 2020-06-11 2020-09-22 腾讯科技(深圳)有限公司 异常账号检测方法、装置、设备及存储介质
CN111931047A (zh) * 2020-07-31 2020-11-13 中国平安人寿保险股份有限公司 基于人工智能的黑产账号检测方法及相关装置
CN112215288A (zh) * 2020-10-13 2021-01-12 中国光大银行股份有限公司 目标企业的类别确定方法及装置、存储介质、电子装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘绍海;刘青昆;安娜;顾跃举;: "基于聚类算法与序列异常技术的入侵检测新方法", 计算机安全 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821574A (zh) * 2021-08-31 2021-12-21 北京达佳互联信息技术有限公司 用户行为分类方法和装置及存储介质
CN113836370A (zh) * 2021-11-25 2021-12-24 上海观安信息技术股份有限公司 用户群体的分类方法、装置、存储介质及计算机设备
CN113836370B (zh) * 2021-11-25 2022-03-01 上海观安信息技术股份有限公司 用户群体的分类方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN113011886B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN111784348B (zh) 账户风险识别方法及装置
Pinna et al. A petri nets model for blockchain analysis
US20230289828A1 (en) Data processing method, computer device, and readable storage medium
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
CN109388674B (zh) 数据处理方法、装置、设备及可读存储介质
CN113011886B (zh) 帐号类型的确定方法和装置及电子设备
CN111260220B (zh) 群控设备识别方法、装置、电子设备和存储介质
CN109117352B (zh) 服务器性能预测方法和装置
CN113239249A (zh) 一种对象关联识别方法、装置和存储介质
CN111291125A (zh) 一种数据处理方法及相关设备
CN111159515B (zh) 数据处理方法、装置及电子设备
WO2024156198A1 (zh) 一种基于图谱的关联关系筛选方法及装置
CN111918136B (zh) 一种兴趣的分析方法及装置、存储介质、电子设备
CN113011966A (zh) 基于深度学习的信用评分方法及装置
CN111832661B (zh) 分类模型构建方法、装置、计算机设备及可读存储介质
CN111368552A (zh) 一种面向特定领域的网络用户群组划分方法及装置
CN112053151A (zh) 行为的确定方法及装置、存储介质、电子设备
CN115393100A (zh) 资源推荐方法及装置
CN112561538B (zh) 风险模型创制方法、装置、计算机设备及可读存储介质
CN113139085B (zh) 用户兴趣的挖掘方法及系统
CN113289346A (zh) 任务模型训练方法、装置、电子设备及存储介质
CN113987260A (zh) 一种视频推送方法、装置、电子设备及存储介质
CN113343577A (zh) 一种参数优化方法、装置、计算机设备及可读存储介质
CN113457158A (zh) 虚拟角色的配置方法及装置、存储介质、电子装置
CN117974276B (zh) 商品推荐模型训练方法、商品推荐方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40046781

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant