CN108520438A - 行为类型确定方法及装置 - Google Patents

行为类型确定方法及装置 Download PDF

Info

Publication number
CN108520438A
CN108520438A CN201810292985.8A CN201810292985A CN108520438A CN 108520438 A CN108520438 A CN 108520438A CN 201810292985 A CN201810292985 A CN 201810292985A CN 108520438 A CN108520438 A CN 108520438A
Authority
CN
China
Prior art keywords
behavior
sample
type
information
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810292985.8A
Other languages
English (en)
Other versions
CN108520438B (zh
Inventor
吴宏刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201810292985.8A priority Critical patent/CN108520438B/zh
Publication of CN108520438A publication Critical patent/CN108520438A/zh
Application granted granted Critical
Publication of CN108520438B publication Critical patent/CN108520438B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0245Surveys

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开是关于一种行为类型确定方法及装置。该方法包括:获取与客户端针对目标对象的行为相关联的行为信息;将行为信息输入决策树模型中进行处理,确定行为的类型,行为的类型包括正常行为及异常行为,其中,决策树模型通过第一样本和第二样本训练得到,第一样本包括与异常行为相关联的行为信息,第二样本包括与正常行为相关联的行为信息。根据本公开的实施例,能够获取与客户端针对目标对象的行为相关联的行为信息,将行为信息输入通过第一样本和第二样本训练得到的决策树模型中进行处理,确定行为的类型为正常行为或异常行为,从而较准确地确定行为的类型。

Description

行为类型确定方法及装置
技术领域
本公开涉及计算机技术领域,尤其涉及一种行为类型确定方法及装置。
背景技术
随着互联网技术的快速发展,应运而生了很多服务平台,例如,互联网广告DSP(Demand-Side Platform)平台、各类投票平台等。因服务平台提供的目标对象(例如,DSP广告、投票等)多与利益相关,不可避免地会存在针对目标对象的各类异常行为,例如,刷广告流量等行为。相关技术中,缺少准确确定异常行为的方法。
发明内容
为克服相关技术中存在的问题,本公开提供一种行为类型确定方法及装置。
根据本公开实施例的第一方面,提供一种行为类型确定方法,所述方法包括:
获取与客户端针对目标对象的行为相关联的行为信息;
将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为,
其中,所述决策树模型通过第一样本和第二样本训练得到,所述第一样本包括与异常行为相关联的行为信息,所述第二样本包括与正常行为相关联的行为信息。
对于以上方法,在一种可能的实现方式中,所述行为类型确定方法还包括:
获取与多个客户端针对参考对象的多个样本行为,其中,每个样本行为包括N个行为特征,N>1;
根据所述N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为,1≤M<N;
将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息;
将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。
对于以上方法,在一种可能的实现方式中,所述行为类型确定方法还包括:
将所述第一样本和所述第二样本输入到决策树模型中进行训练;
当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型。
对于以上方法,在一种可能的实现方式中,所述行为信息包括所述行为发生的时间信息、所述行为发生的地理信息、发起所述行为的终端设备的参数信息、发起所述行为的用户信息、所述行为对应目标对象的历史数据信息中的至少一种。
对于以上方法,在一种可能的实现方式中,所述目标对象包括广告或投票对象,所述行为包括点击、曝光、下载以及激活中的至少一种。
根据本公开实施例的第二方面,提供一种行为类型确定装置,所述装置包括:
信息获取模块,用于获取与客户端针对目标对象的行为相关联的行为信息;
类型确定模块,用于将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为,
其中,所述决策树模型通过第一样本和第二样本训练得到,所述第一样本包括与异常行为相关联的行为信息,所述第二样本包括与正常行为相关联的行为信息。
对于上述装置,在一种可能的实现方式中,所述行为类型确定装置还包括:
样本行为获取模块,用于获取与多个客户端针对参考对象的多个样本行为,其中,每个样本行为包括N个行为特征,N>1;
类型标注模块,用于根据所述N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为,1≤M<N;
行为信息确定模块,用于将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息;
样本确定模块,用于将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。
对于上述装置,在一种可能的实现方式中,所述行为类型确定装置还包括:
模型训练模块,用于将所述第一样本和所述第二样本输入到决策树模型中进行训练;
模型确定模块,用于当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型。
对于上述装置,在一种可能的实现方式中,所述行为信息包括所述行为发生的时间信息、所述行为发生的地理信息、发起所述行为的终端设备的参数信息、发起所述行为的用户信息、所述行为对应目标对象的历史数据信息中的至少一种。
对于上述装置,在一种可能的实现方式中,所述目标对象包括广告或投票对象,所述行为包括点击、曝光、下载以及激活中的至少一种。
根据本公开实施例的第三方面,提供一种行为类型确定装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行上述行为类型确定方法。
本公开的实施例提供的技术方案可以包括以下有益效果:能够获取与客户端针对目标对象的行为相关联的行为信息,将行为信息输入通过第一样本和第二样本训练得到的决策树模型中进行处理,确定行为的类型为正常行为或异常行为,从而较准确地确定行为的类型。
进一步地,根据本公开实施例的行为类型确定方法及装置,可以通过样本行为的参考特征,标注样本行为的类型。将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息,并确定第一样本和第二样本,以使根据该第一样本和第二样本训练得到的决策树模型能够较准确地确定行为类型。同时,最终确定的第一样本和第二样本的行为信息是根据从N个行为特征中去除M个参考特征后的N-M个行为特征所确定的,通过去除标注样本行为类型时所用到的参考特征,可以使得在训练过程中,决策树模型可以更好地学习行为信息中多个行为特征之间的组合规律,而非过多关注到参考特征,从而可以尽可能地减少训练得到的决策树模型过拟合到参考特征上的概率,进一步提高决策树模型的确定准确度。
进一步地,根据本公开实施例的行为类型确定方法及装置,通过将所述第一样本和所述第二样本输入到决策树模型中进行训练,并当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型,可以训练得到用于较准确地确定行为类型的决策树模型。
进一步地,根据本公开实施例的行为类型确定方法及装置,可以获取与客户端针对目标对象的行为相关联的多个维度的行为信息。
进一步地,根据本公开实施例的行为类型确定方法及装置,可以丰富客户端针对目标对象的行为。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种行为类型确定方法的流程图。
图2是根据一示例性实施例示出的一种行为类型确定方法的流程图。
图3是根据一示例性实施例示出的一种行为类型确定方法的流程图。
图4是根据一示例性实施例示出的一种行为类型确定方法的应用场景的示意图。
图5是根据一示例性实施例示出的一种行为类型确定装置的框图。
图6是根据一示例性实施例示出的一种行为类型确定装置的框图。
图7是根据一示例性实施例示出的一种行为类型确定装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种行为类型确定方法的流程图。如图1所示,该方法可用于服务器中。根据本公开实施例的行为类型确定方法包括:
在步骤S11中,获取与客户端针对目标对象的行为相关联的行为信息;
在步骤S12中,将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为,
其中,所述决策树模型通过第一样本和第二样本训练得到,所述第一样本包括与异常行为相关联的行为信息,所述第二样本包括与正常行为相关联的行为信息。
根据本公开的实施例,能够获取与客户端针对目标对象的行为相关联的行为信息,将行为信息输入通过第一样本和第二样本训练得到的决策树模型中进行处理,确定行为的类型为正常行为或异常行为,从而较准确地确定行为的类型。
其中,决策树模型是已经训练好的,可用于确定行为类型的模型。决策树模型通过第一样本和第二样本训练得到,第一样本包括与异常行为相关联的行为信息,第二样本包括与正常行为相关联的行为信息。其中,决策树模型可以包括多种形式,例如,决策树模型可以包括多个可用于确定行为类型的决策树,每个决策树可以包括一个或多个决策树节点,本公开对决策树模型的形式不作限制。
举例来说,服务器获取与客户端针对目标对象的行为相关联的行为信息。其中,目标对象可以包括由各类平台所提供的各种资源、内容等,例如,广告等。客户端针对目标对象的行为可以包括各种客户端针对目标对象可以进行的、与目标对象相关联的各类行为,例如,可以包括针对广告本身的曝光、点击行为,也可以是针对广告推荐内容的注册、下载等行为。与客户端针对目标对象的行为相关联的行为信息可以包括任意与行为相关的特征,例如,可以包括行为本身的参数特征(例如,行为发生的时间、地点等),也可以包括行为对应目标对象的各类特征数据(例如,行为对应广告的历史曝光数据等)、发起行为的用户信息(例如,发起行为的用户的年龄、性别等)等各类与行为相关联的特征。本公开对目标对象的形式和内容、针对目标对象的行为的类别和形式、行为信息的形式和内容等均不作限制。
在一种可能的实现方式中,所述目标对象包括广告或投票对象,所述行为包括点击、曝光、下载以及激活中的至少一种。
举例来说,目标对象可以包括广告或投票对象。例如,互联网DSP广告,亲子类投票等。针对目标对象的行为可以包括点击、曝光、下载以及激活中的至少一种。以目标对象为DSP广告为例,针对DSP广告的行为可以包括曝光。例如,用户通过客户端浏览网页,该网页上有一条DSP广告,则客户端对该DSP广告进行了曝光这一行为。针对DSP广告的行为还可以包括点击,例如,用户通过其客户端点击了该DSP广告,则客户端对该DSP广告进行了点击这一行为。针对DSP广告的行为还可以包括某些与DSP广告相关联的特定行为,例如,下载、激活等。举例来说,用户可以通过客户端针对该DSP广告推荐的内容(例如,应用程序)进行下载、对DSP广告推荐的内容进行激活等,则客户端对该DSP广告进行了下载、激活的行为。以亲子类投票对象为例,针对亲子类投票对象的行为可以包括点击,例如,用户通过其客户端浏览投票页面,点击相应选项。针对亲子类投票对象的行为还可以同时包括点击和确认,例如,确认提交投票等。这样,可以丰富客户端针对目标对象的行为。
本领域技术人员应理解,目标对象可以包括多种,不限于广告、投票对象等。针对目标对象的行为也可以包括多种,例如,还可以包括安装、注册、购买、确认等,只要是针对目标对象可以进行的、与目标对象相关联的行为即可,本公开对此不作限制。
在一种可能的实现方式中,所述行为信息包括所述行为发生的时间信息、所述行为发生的地理信息、发起所述行为的终端设备的参数信息、发起所述行为的用户信息、所述行为对应目标对象的历史数据信息中的至少一种。
举例来说,行为信息可以包括所述行为发生的时间信息、所述行为发生的地理信息、发起所述行为的终端设备的参数信息、发起所述行为的用户信息、所述行为对应目标对象的历史数据信息中的至少一种。以行为为点击为例进行说明,该点击相关联的行为信息可以包括该点击发生的时间信息、该点击发生的地理信息(例如,可以根据互联网协议地址确定该点击发生的国家、城市等)、发起点击的终端设备的参数信息(例如,该终端设备的操作系统等)、发起点击的用户信息(例如,该点击的用户的性别、年龄、学历等)、该点击对应目标对象的历史数据信息(例如,该点击发生之前一个小时内,该点击的广告的曝光量、下载量等)中的至少一种。
通过这种方式,可以获取与客户端针对目标对象的行为相关联的多个维度的行为信息。本领域技术人员应理解,行为信息还可以包括多种形式和内容,例如,行为信息还可以包括发起行为的用户在一定时间区间内的历史行为数据等,例如,该用户在本次点击之前一个小时内,点击广告的次数等,本公开对行为信息的形式和内容不作限制。
如图1所示,在步骤S12中,将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为,
其中,所述决策树模型通过第一样本和第二样本训练得到,所述第一样本包括与异常行为相关联的行为信息,所述第二样本包括与正常行为相关联的行为信息。
举例来说,服务器将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为。例如,训练决策树模型的第一样本和第二样本的行为信息分别包括:发起行为的用户性别、发起行为的用户年龄、行为发生的地理信息、发起行为的用户在之前4个小时内针对广告的曝光量、发起行为的用户在之前5个小时内针对广告的下载量这5个维度的信息。
服务器获取与客户端针对广告的一个点击相关联的行为信息,该行为信息包括上述5个维度的信息。服务器将该行为信息输入训练好的决策树模型中进行处理,可以通过该决策树模型中的某决策树的路径来确定该点击的类型为正常行为或异常行为,例如,决策树模型输出结果确定该点击为异常行为(例如,作弊行为)。
在一种可能的实现方式中,在确定行为的类型之前,可以通过第一样本和第二样本训练决策树模型。下面对决策树模型的训练过程进行说明。
图2是根据一示例性实施例示出的一种行为类型确定方法的流程图。在一种可能的实现方式中,如图2所示,所述方法还包括:
在步骤S13中,获取与多个客户端针对参考对象的多个样本行为,其中,每个样本行为包括N个行为特征,N>1。
举例来说,可以获取与多个客户端针对参考对象的多个样本行为。其中,参考对象可与目标对象同类。例如,希望训练得到的决策树模型可用于确定针对DSP广告的行为类型,则可以收集大量(例如,几万个)的多个客户端针对DSP广告的样本行为。例如,多个客户端针对DSP广告点击、曝光的多个样本行为。其中,每个样本行为包括N个行为特征,N>1,N为整数。
在步骤S14中,根据所述N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为,1≤M<N。
举例来说,可以对多个样本行为的N个行为特征进行分析,例如,可以根据N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为,1≤M<N,M、N均为正数。
例如,多个样本行为的N个行为特征中存在一个行为特征为发起该行为的用户在第一时间区间内的历史行为数据。例如,某个样本行为的N个行为特征中,包括发起该行为的用户在该行为发生之前一个小时内的点击数据,例如,为1万次(超过点击数据阈值),则可以将该行为特征确定为N个行为特征中的1个参考特征,根据该参考特征,可以标注该样本行为的类型为异常行为。
其中,在对多个样本行为的N个行为特征进行分析时,N个行为特征中可能包括M个参考特征,可用于标注样本行为的类型,1≤M<N,M、N均为正数。例如,多个样本行为的N个行为特征中还可能存在一个行为特征为该行为对应参考对象在第二时间区间内的历史激活数据。例如,某个样本行为的N个行为特征中,包括该行为对应的DSP广告在该行为发生之前5秒内的激活数据,例如,为2万次(例如,超过根据常规激活数据确定的激活数据阈值),则该行为特征也可以被确定为N个行为特征中的1个参考特征,根据该参考特征,可以标注该样本行为的类型为异常行为。
举例来说,可以根据上述2个参考特征,将2万个样本行为中的3千个样本行为标注为异常行为,则其余1.7万个样本行为可以被标注为正常行为。本公开对样本行为的数量、样本行为类型的标注方式不作限制。
在步骤S15中,将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息。
举例来说,可以将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息。例如,多个样本行为,每个样本行为包括20个行为特征(N=20),其中,根据20个行为特征中的2个参考特征(M=2),标注样本行为的类型。则可以将20个行为特征中去除2个参考特征后的18个行为特征确定为样本行为的行为信息。
在步骤S16中,将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。
举例来说,可以将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。例如,将3千个被标注为异常行为,行为信息为18个行为特征的样本行为确定为第一样本。将1.7万个被标注为正常行为,行为信息为18个行为特征的样本行为确定为第二样本。
通过这种方式,可以通过样本行为的参考特征,标注样本行为的类型。将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息,并确定第一样本和第二样本,以使根据该第一样本和第二样本训练得到的决策树模型能够较准确地确定行为类型。同时,最终确定的第一样本和第二样本的行为信息是根据从N个行为特征中去除M个参考特征后的N-M个行为特征所确定的,通过去除标注样本行为类型时所用到的参考特征,可以使得在训练过程中,决策树模型可以更好地学习行为信息中多个行为特征之间的组合规律,而非过多关注到参考特征,从而可以尽可能地减少训练得到的决策树模型过拟合到参考特征上的概率,进一步提高决策树模型的确定准确度。本公开对样本行为的数量、行为特征的数量、参考特征的数量不作限制。
图3是根据一示例性实施例示出的一种行为类型确定方法的流程图。在一种可能的实现方式中,如图3所示,所述方法还包括:
在步骤S17中,将所述第一样本和所述第二样本输入到决策树模型中进行训练;
在步骤S18中,当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型。
举例来说,可以将第一样本和第二样本输入到决策树模型中进行训练,例如,通过梯度提升决策树GBDT(Gradient Boosting Decision Tree)来训练决策树模型。当确定所述行为的类型的准确率收敛并且达到阈值后,可以将当前决策树模型确定为最终的决策树模型。
通过这种方式,可以训练得到用于较准确地确定行为类型的决策树模型。本公开对决策树模型的训练过程不作限制。
具体实施方式
以下结合“确定针对DSP广告的行为的类型”作为一个示例性应用场景,给出根据本公开实施例的具体实施方式,以便于理解行为类型确定方法的流程。本领域技术人员应理解,以下具体实施方式仅仅是出于便于理解本公开实施例的目的,不应视为对本公开实施例的限制。
图4是根据一示例性实施例示出的一种行为类型确定方法的应用场景的示意图。在该具体实施方式中,训练决策树模型。例如,可以获取与多个客户端针对参考对象的多个样本行为,其中,每个样本行为包括N个行为特征。根据所述N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为。将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息。将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。例如,获取2万个样本行为,每个样本行为包括20个行为特征。根据20个行为特征中的2个参考特征,标注该2万个样本行为中,有3000个样本行为的类型为异常行为,其余1.7万个样本行为的类型为正常行为。将3000个类型为异常行为,行为信息为20个行为特征去除2个参考特征的18个行为特征的样本行为确定为第一样本。将1.7万个类型为正常行为,行为信息为20个行为特征去除2个参考特征的18个行为特征的样本行为确定为第二样本。
在该具体实施方式中,将所述第一样本和所述第二样本输入到决策树模型中进行训练;当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型。
在该具体实施方式中,获取与客户端针对目标对象的行为相关联的行为信息,将所述行为信息输入决策树模型中进行处理,确定所述行为的类型。例如,如图4所示,为示例性的一个决策树模型中的一个决策树。例如,若某一行为相关联的行为信息中包括:性别为男、年龄为35岁、曝光为10000(大于9500),则输入到决策树模型中进行处理,通过如图4所示的决策树的路径可知,确定该行为的类型为作弊行为。若某一行为相关联的行为信息中包括:性别为男、年龄为29岁(小于等于30)、曝光为10000,则通过如图4所示的决策树的路径可知,确定该行为的类型为正常行为。例如,若某一行为相关联的行为信息中包括:性别为女、城市为深圳,则输入到决策树模型中进行处理,通过如图4所示的决策树的路径可知,确定该行为的类型为正常行为。
根据本公开的实施例,能够获取与客户端针对目标对象的行为相关联的行为信息,将行为信息输入通过第一样本和第二样本训练得到的决策树模型中进行处理,确定行为的类型为正常行为或异常行为,从而较准确地确定行为的类型。
图5是根据一示例性实施例示出的一种行为类型确定装置的框图。参照图5,该装置包括信息获取模块21和类型确定模块22。
该信息获取模块21,被配置为获取与客户端针对目标对象的行为相关联的行为信息;
该类型确定模块22,被配置为将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为,
其中,所述决策树模型通过第一样本和第二样本训练得到,所述第一样本包括与异常行为相关联的行为信息,所述第二样本包括与正常行为相关联的行为信息。
图6是根据一示例性实施例示出的一种行为类型确定装置的框图。参照图6,在一种可能的实现方式中,所述装置还包括:
样本行为获取模块23,被配置为获取与多个客户端针对参考对象的多个样本行为,其中,每个样本行为包括N个行为特征,N>1;
类型标注模块24,被配置为根据所述N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为,1≤M<N;
行为信息确定模块25,被配置为将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息;
样本确定模块26,被配置为将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。
参照图6,在一种可能的实现方式中,所述装置还包括:
模型训练模块27,被配置为将所述第一样本和所述第二样本输入到决策树模型中进行训练;
模型确定模块28,被配置为当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型。
在一种可能的实现方式中,所述行为信息包括所述行为发生的时间信息、所述行为发生的地理信息、发起所述行为的终端设备的参数信息、发起所述行为的用户信息、所述行为对应目标对象的历史数据信息中的至少一种。
在一种可能的实现方式中,所述目标对象包括广告或投票对象,所述行为包括点击、曝光、下载以及激活中的至少一种。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种行为类型确定装置的框图。例如,装置1900可以被提供为一服务器。参照图7,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1932,上述指令可由装置1900的处理组件1922执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (12)

1.一种行为类型确定方法,其特征在于,所述方法包括:
获取与客户端针对目标对象的行为相关联的行为信息;
将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为,
其中,所述决策树模型通过第一样本和第二样本训练得到,所述第一样本包括与异常行为相关联的行为信息,所述第二样本包括与正常行为相关联的行为信息。
2.根据权利要求1所述的方法,其特征在于,所述行为类型确定方法还包括:
获取与多个客户端针对参考对象的多个样本行为,其中,每个样本行为包括N个行为特征,N>1;
根据所述N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为,1≤M<N;
将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息;
将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。
3.根据权利要求1所述的方法,其特征在于,所述行为类型确定方法还包括:
将所述第一样本和所述第二样本输入到决策树模型中进行训练;
当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型。
4.根据权利要求1所述的方法,其特征在于,所述行为信息包括所述行为发生的时间信息、所述行为发生的地理信息、发起所述行为的终端设备的参数信息、发起所述行为的用户信息、所述行为对应目标对象的历史数据信息中的至少一种。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述目标对象包括广告或投票对象,所述行为包括点击、曝光、下载以及激活中的至少一种。
6.一种行为类型确定装置,其特征在于,所述装置包括:
信息获取模块,用于获取与客户端针对目标对象的行为相关联的行为信息;
类型确定模块,用于将所述行为信息输入决策树模型中进行处理,确定所述行为的类型,其中,所述行为的类型包括正常行为及异常行为,
其中,所述决策树模型通过第一样本和第二样本训练得到,所述第一样本包括与异常行为相关联的行为信息,所述第二样本包括与正常行为相关联的行为信息。
7.根据权利要求6所述的装置,其特征在于,所述行为类型确定装置还包括:
样本行为获取模块,用于获取与多个客户端针对参考对象的多个样本行为,其中,每个样本行为包括N个行为特征,N>1;
类型标注模块,用于根据所述N个行为特征中的M个参考特征,标注所述样本行为的类型,所述样本行为的类型包括正常行为及异常行为,1≤M<N;
行为信息确定模块,用于将从所述N个行为特征中去除所述M个参考特征后的N-M个行为特征确定为所述样本行为的行为信息;
样本确定模块,用于将类型为异常行为的样本行为确定为所述第一样本,且将类型为正常行为的样本行为确定为所述第二样本。
8.根据权利要求6所述的装置,其特征在于,所述行为类型确定装置还包括:
模型训练模块,用于将所述第一样本和所述第二样本输入到决策树模型中进行训练;
模型确定模块,用于当确定所述行为的类型的准确率收敛并且达到阈值后,将当前决策树模型确定为最终的决策树模型。
9.根据权利要求6所述的装置,其特征在于,所述行为信息包括所述行为发生的时间信息、所述行为发生的地理信息、发起所述行为的终端设备的参数信息、发起所述行为的用户信息、所述行为对应目标对象的历史数据信息中的至少一种。
10.根据权利要求6至9中任意一项所述的装置,其特征在于,所述目标对象包括广告或投票对象,所述行为包括点击、曝光、下载以及激活中的至少一种。
11.一种行为类型确定装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行权利要求1-5中任意一项所述的方法。
12.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由处理器执行时,使得处理器能够执行根据权利要求1-5中任意一项所述的方法。
CN201810292985.8A 2018-03-30 2018-03-30 行为类型确定方法及装置 Active CN108520438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810292985.8A CN108520438B (zh) 2018-03-30 2018-03-30 行为类型确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810292985.8A CN108520438B (zh) 2018-03-30 2018-03-30 行为类型确定方法及装置

Publications (2)

Publication Number Publication Date
CN108520438A true CN108520438A (zh) 2018-09-11
CN108520438B CN108520438B (zh) 2021-06-22

Family

ID=63431262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810292985.8A Active CN108520438B (zh) 2018-03-30 2018-03-30 行为类型确定方法及装置

Country Status (1)

Country Link
CN (1) CN108520438B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446931A (zh) * 2018-10-11 2019-03-08 河南科技大学 基于时序关联分析的动物运动行为判别方法及装置
CN111737309A (zh) * 2020-05-22 2020-10-02 深圳市天彦通信股份有限公司 用户管理方法及相关产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915960A (zh) * 2016-03-31 2016-08-31 广州华多网络科技有限公司 一种用户类型的确定方法及装置
CN106022834A (zh) * 2016-05-24 2016-10-12 腾讯科技(深圳)有限公司 广告反作弊方法及装置
CN106022826A (zh) * 2016-05-18 2016-10-12 武汉斗鱼网络科技有限公司 一种网络直播平台中的作弊用户识别方法与系统
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN107153971A (zh) * 2017-05-05 2017-09-12 北京京东尚科信息技术有限公司 用于识别app推广中设备作弊的方法及装置
CN107169629A (zh) * 2017-04-17 2017-09-15 四川九洲电器集团有限责任公司 一种电信诈骗识别方法及数据处理设备
CN107682302A (zh) * 2016-08-02 2018-02-09 中国电信股份有限公司 跨站脚本攻击检测方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915960A (zh) * 2016-03-31 2016-08-31 广州华多网络科技有限公司 一种用户类型的确定方法及装置
CN106022826A (zh) * 2016-05-18 2016-10-12 武汉斗鱼网络科技有限公司 一种网络直播平台中的作弊用户识别方法与系统
CN106022834A (zh) * 2016-05-24 2016-10-12 腾讯科技(深圳)有限公司 广告反作弊方法及装置
CN107682302A (zh) * 2016-08-02 2018-02-09 中国电信股份有限公司 跨站脚本攻击检测方法和装置
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN107169629A (zh) * 2017-04-17 2017-09-15 四川九洲电器集团有限责任公司 一种电信诈骗识别方法及数据处理设备
CN107153971A (zh) * 2017-05-05 2017-09-12 北京京东尚科信息技术有限公司 用于识别app推广中设备作弊的方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446931A (zh) * 2018-10-11 2019-03-08 河南科技大学 基于时序关联分析的动物运动行为判别方法及装置
CN109446931B (zh) * 2018-10-11 2022-02-08 河南科技大学 基于时序关联分析的动物运动行为判别方法及装置
CN111737309A (zh) * 2020-05-22 2020-10-02 深圳市天彦通信股份有限公司 用户管理方法及相关产品

Also Published As

Publication number Publication date
CN108520438B (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
CN110019392B (zh) 在网络教学系统中推荐教师的方法
CN106126524B (zh) 信息推送方法和装置
US20140370480A1 (en) Storage medium, apparatus, and method for information processing
US11226991B2 (en) Interest tag determining method, computer device, and storage medium
CN109978033A (zh) 同操作人识别模型的构建与同操作人识别的方法和装置
JP2017211689A (ja) 分類モデル装置、分類モデル学習方法、および分類モデル学習プログラム
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN111753846A (zh) 一种基于rpa和ai的网站验证方法、装置、设备及存储介质
CN110609947A (zh) 智能学习系统的学习内容推荐方法、终端及存储介质
JP2004178521A (ja) 推薦システム
CN108520438A (zh) 行为类型确定方法及装置
CN114461871A (zh) 推荐模型训练方法、对象推荐方法、装置及存储介质
JP2014115427A (ja) 抽出方法、抽出装置および抽出プログラム
CN111192170A (zh) 题目推送方法、装置、设备和计算机可读存储介质
CN110929169A (zh) 基于改进Canopy聚类协同过滤算法的职位推荐方法
CN114693011A (zh) 一种政策匹配方法、装置、设备和介质
CN111291868A (zh) 网络模型训练方法、装置、设备及计算机可读存储介质
CN116228361A (zh) 基于特征匹配的课程推荐方法、装置、设备和存储介质
CN110008356B (zh) 一种纠错本生成系统及方法
CN109522203B (zh) 一种软件产品的评测方法及装置
CN112465227A (zh) 一种授课资料获取方法及装置
CN112328812A (zh) 基于自调参数的领域知识抽取方法与系统、电子设备
US20180322796A1 (en) A/b testing for massive open online courses
CN112380263A (zh) 一种教学数据推荐方法及装置
CN111652767A (zh) 用户画像构建方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant