CN111199415B - 识别点击广告有效性的模型训练方法、装置、设备及介质 - Google Patents
识别点击广告有效性的模型训练方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111199415B CN111199415B CN201811383620.2A CN201811383620A CN111199415B CN 111199415 B CN111199415 B CN 111199415B CN 201811383620 A CN201811383620 A CN 201811383620A CN 111199415 B CN111199415 B CN 111199415B
- Authority
- CN
- China
- Prior art keywords
- user
- click
- preset
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000006399 behavior Effects 0.000 claims description 58
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 125000004122 cyclic group Chemical group 0.000 claims description 11
- 239000011229 interlayer Substances 0.000 claims description 8
- 210000001153 interneuron Anatomy 0.000 claims description 7
- 230000009471 action Effects 0.000 abstract description 20
- 230000001680 brushing effect Effects 0.000 abstract description 16
- 238000003062 neural network model Methods 0.000 description 13
- 239000010410 layer Substances 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000000306 recurrent effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供一种识别点击广告有效性的模型训练方法、装置、设备及介质。方法包括:采集用户标签,以及预设时间段内用户标签对应的用户点击广告的点击数据;根据第一预设规则对每个用户的点击数据进行处理,得到与每个用户对应的点击序列;根据点击序列、用户标签训练模型,得到识别点击广告有效性的模型。本公开提供的方案,可以根据用户在一段时间内产生的点击广告的行为以及用户标签训练模型,从而得到识别点击广告有效性的模型。无论是正常用户,还是恶意刷广告用户,在连续的一段时间里,用户点击广告的行为具有一定的规律,因此,根据连续一段时间内用户的点击数据,训练得到的识别模型更加准确。
Description
技术领域
本公开涉及识别用户点击广告有效性的技术,尤其涉及一种识别点击广告有效性的模型训练方法、装置、设备及介质。
背景技术
互联网中公布的信息传播速度较快,范围较广,因此,很多广告主通过互联网的方式投放广告,以得到更高的曝光率。例如,可以在APP中投放广告,还可以在网页中投放广告等。
目前,广告主投放的广告是按照点击次数收费的,在一定预算的情况下,当点击次数达到了一定次数进而消耗掉这些预算后,该广告就不会再显示。因此,现有技术中存在着恶意刷广告的情况,例如,B厂商雇专门的人员通过各种手段点击A厂商发布的广告,进而刷掉A厂商的广告,对A厂商造成较大的经济损失。
现有技术中,针对上述问题采用黑名单过滤等规则性方式解决,但是,这种方式很容易被恶意刷广告的人员规避,无法彻底解决上述技术问题。
发明内容
本公开提供一种识别点击广告有效性的模型训练方法、装置、设备及介质,以解决现有技术中无法彻底解决恶意刷广告的问题。
本公开的第一个方面是提供一种识别点击广告有效性的模型训练方法,包括:
采集用户标签,以及预设时间段内所述用户标签对应的用户点击广告的点击数据;
根据第一预设规则对每个所述用户的所述点击数据进行处理,得到与每个所述用户对应的点击序列;
根据所述点击序列、所述用户标签训练模型,得到识别点击广告有效性的模型。
本公开的第二个方面是提供一种识别点击广告有效性的模型训练装置,包括:
采集模块,用于采集用户标签,以及预设时间段内所述用户标签对应的用户点击广告的点击数据;
处理模块,用于根据第一预设规则对每个所述用户的所述点击数据进行处理,得到与每个所述用户对应的点击序列;
训练模块,用于根据所述点击序列、所述用户标签训练模型,得到识别点击广告有效性的模型。
本公开的第三个方面是提供一种识别点击广告有效性的模型训练设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如上述第一方面所述的识别点击广告有效性的模型训练方法。
本公开的又一个方面是提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如上述第一方面所述的识别点击广告有效性的模型训练方法。
本公开提供的识别点击广告有效性的模型训练方法、装置、设备及计算机可读存储介质的技术效果是:
本公开提供的识别点击广告有效性的模型训练方法、装置、设备及介质,包括采集用户标签,以及预设时间段内用户标签对应的用户点击广告的点击数据;根据第一预设规则对每个用户的点击数据进行处理,得到与每个用户对应的点击序列;根据点击序列、用户标签训练模型,得到识别点击广告有效性的模型。本公开提供的方法、装置、设备及介质,可以根据用户在一段时间内产生的点击广告的行为以及用户标签训练模型,从而得到识别点击广告有效性的模型。无论是正常用户,还是恶意刷广告用户,在连续的一段时间里,用户点击广告的行为具有一定的规律,因此,根据连续一段时间内用户的点击数据,训练得到的识别模型更加准确。
附图说明
图1为本发明一示例性实施例示出的应用场景示意图;
图2为本发明一示例性实施例示出的识别点击广告有效性的模型训练方法的流程图;
图3为本发明另一示例性实施例示出的识别点击广告有效性的模型训练方法的流程图;
图4为本发明又一示例性实施例示出的识别点击广告有效性的模型训练方法的流程图;
图5为本发明一示例性实施例示出的识别点击广告有效性的模型训练装置的结构图;
图6为本发明另一示例性实施例示出的识别点击广告有效性的模型训练装置的结构图;
图7为本发明一示例性实施例示出的识别点击广告有效性的模型训练设备的结构图。
具体实施方式
图1为本发明一示例性实施例示出的应用场景示意图。
如图1所示,用户可以操作用户终端点击网页或APP中投放的广告,用户终端向服务器发送访问请求,服务器接收到用户终端的访问请求后,可以计算相关费用,并在预算中扣除这部分费用,若预算被完全扣除,则可以下架这条广告,该广告不会在网页或APP中继续显示。若该用户为恶意用户,则该用户可以恶意多次点击该广告,导致广告的预算在短时间内被消耗掉,使得该广告的曝光效果较差。
本实施例提供的方法,基于用户在预设时间段内点击广告产生的点击数据以及用户的标签训练模型,从而使该模型能够根据用户的点击数据识别用户的点击行为是正常的还是恶意的,进而能够剔除掉恶意点击,仅根据正常点击计算广告费用,避免造成广告主的经济损失。
图2为本发明一示例性实施例示出的识别点击广告有效性的模型训练方法的流程图。
如图2所示,本实施例提供的识别点击广告有效性的模型训练方法包括:
步骤201,采集用户标签,以及预设时间段内用户标签对应的用户点击广告的点击数据。
本实施例提供的方法可以由训练服务器执行,该服务器可以根据采集的信息训练模型,得到识别点击广告有效性的模型。
其中,可以预先确定一部分已知用户的账户,已知用户是指已经获知了这部分客户是正常用户,还是恶意刷广告的用户。并采集这部分用户的标签,具体可以是黑名单标签或白名单标签。用户标签可以和用户账户关联。若用户账户携带有黑名单标签,则说明该用户是恶意刷广告的用户;若用户账户携带有白名单标签,则说明该用户是正常用户。
具体的,可以在预设时间内,采集这部分用户点击广告产生的点击数据。
进一步的,可以在训练服务器中监控这部分用户的操作,若登录有这部分用户账户的终端,发送了访问广告的请求,则记录相应的点击数据,具体可以包括点击日期、点击时间、点击的广告标识等。
实际应用时,无论是正常用户,还是恶意刷广告用户,单次的点击行为没有参考意义,也不具有任何规律,而在连续的一段时间里,用户点击广告的行为具有一定的规律,因此,可以采集连续一段时间内用户的点击数据,并基于这些数据训练模型。
其中,预设时间段可以根据需求设置,例如连续的60天。预先选定的已知用户应当包括正常用户以及恶意刷广告用户。可以将正常用户产生的点击数据作为正样本,恶意刷广告用户产生的点击数据作为负样本。可以使正常用户与恶意刷广告用户数量相当,例如不超过一个预设阈值,该预设阈值还可以是0,及正常用户与恶意刷广告用户数量相同,使得样本数量保持平衡。
步骤202,根据第一预设规则对每个用户的点击数据进行处理,得到与每个用户对应的点击序列。
具体的,可以预先设置第一预设规则,该规则用于对数据进行处理,得到与数据对应的序列。
进一步的,可以针对每个用户产生的点击数据进行处理,得到每个用户对应的点击序列。不同用户产生的点击数据具有其自身的规律,因此,可以根据一段时间内产生的点击数据,生成点击序列,使得该点击序列能够体现出用户点击广告的规律性。
实际应用时,可以将点击数据按照时间进行拼接,得到点击序列,从而使点击序列中携带有时间信息。
其中,可以预先设置点击行为对应的字符,例如,用户在0点(可不包括0点)以后1点之前(可包括一点)点击了广告,则对应的字符为1,用户在1点以后2点之前点击了广告,则对应的字符为2。例如在某一天,用户在1:30点击了广告,则这一天用户的点击数据对应的字符为2。若在某一天未产生点击行为,则可以将预设字符设置为0。通过上述对应方式,可以将用户在一段时间内产生的点击数据转化为字符串。
具体的,可以将每天对应的字符用“_”连接起来,例如0_0_1,则该用户在第三天的1点到2点之间,点击了广告。基于本实施例提供的方法,能够将用户产生的点击数据按照日期进行拼接,从而得到包括时间、点击行为的点击序列。正常用户、恶意用户的点击行为在时间轴上均具有一定的规律性,因此,能够根据点击序列确定出正常用户、恶意用户点击广告的规律。例如,只有黑名单标签的用户会在0点到1点之间点击广告,则可以认为在这个时间段点击广告的行为是恶意刷广告的行为。
步骤203,根据点击序列、用户标签训练模型,得到识别点击广告有效性的模型。
进一步的,可以将点击序列以及用户标签输入神经网络,训练神经网络中的权重参数,从而得到识别点击广告有效性的模型。
实际应用时,点击序列可以作为输入值输入神经网络模型,用户标签作为已知的结果。神经网络模型根据点击序列确定权重参数,并基于权重参数输出结果,并与已知结果比对,再根据比对结果重新调整权重参数,并重复这一过程,直到神经网络输出的结果与已知结果间的差异符合标准为止,从而得到识别点击广告有效性的模型。
其中,可以采用循环神经网络模型(Recurrent Neural Network,RNN)进行训练。神经网络一般包含输入层、隐层、输出层,通过激活函数控制输出,层与层之间通过权值连接。激活函数是事先确定好的,神经网络模型通过训练能够确定权值。循环神经网络模型不仅在层与层间通过权值连接,在层之间的神经元之间也建立有权连接。
具体的,在循环神经网络模型中,一个输入值对应的输出值,不仅与权值相关,还与前一个和/或后一个输入值相关,因此,循环神经网络模型能够处理序列信息,即前面的输入和后面的输入是有关系的。
进一步的,根据用户的点击序列对循环神经网络模型进行训练,能够根据用户长时间的点击广告的规律训练得到识别模型,使得该识别模型更加准确。
本实施例提供的方法用于训练识别点击广告有效性的模型,该方法由设置有本实施例提供的方法的设备执行,该设备通常以硬件和/或软件的方式来实现。
本实施例提供的识别点击广告有效性的模型训练方法,包括采集用户标签,以及预设时间段内用户标签对应的用户点击广告的点击数据;根据第一预设规则对每个用户的点击数据进行处理,得到与每个用户对应的点击序列;根据点击序列、用户标签训练模型,得到识别点击广告有效性的模型。本实施例提供的方法,可以根据用户在一段时间内产生的点击广告的行为以及用户标签训练模型,从而得到识别点击广告有效性的模型。无论是正常用户,还是恶意刷广告用户,在连续的一段时间里,用户点击广告的行为具有一定的规律,因此,根据连续一段时间内用户的点击数据,训练得到的识别模型更加准确。
图3为本发明另一示例性实施例示出的识别点击广告有效性的模型训练方法的流程图。
如图3所示,本实施例提供的识别点击广告有效性的模型训练方法,包括:
步骤301,采集用户标签,以及预设时间段内用户标签对应的用户点击广告的点击数据。
用户标签包括黑名单用户、白名单用户。若用户是黑名单用户,则说明该用户是恶意刷广告的用户,若用户是白名单用户,则说明该用户是正常用户。
步骤301与步骤201的具体原理和实现方式类似,此处不再赘述。
步骤302,获取用户的点击数据中包括的与点击行为对应的点击日期、点击时间。
实际应用时,采集的点击数据中可以包括点击日期以及点击时间,例如,用户在2018年9月26日13:20点击了广告,则采集的点击数据中可以有用户标识、点击日期2018年9月26日、点击时间13:20,还可以包括广告标识等信息。
其中,点击数据中可以包括多个点击日期与点击时间,每组日期和时间信息与一个点击行为对应,即用户点击一次,则会产生一组日期和时间的组合。
步骤303,根据预设对应关系确定点击时间对应的预设字符。
具体的,可以预先设置点击时间与预设字符的对应关系,从而根据该对应关系,确定出每个点击行为的点击时间对应的预设字符。
进一步的,可以将不同的时间区间与一个预设字符对应,例如:
0:未点击;1:0-1时点击;2:1-2时点击;3:2-3时点击......24:23-24时点击。
实际应用时,可以根据点击时间落入的时间区间,确定对应的预设字符,本实施例提供的方法中,可以得到每个点击行为对应的预设字符。例如,用户在某一天的0-1时点击,则预设字符为1。
步骤304,根据点击行为对应的点击日期,对预设字符进行拼接,得到用户的点击序列。
其中,每个点击行为还有对应的点击日期,因此,可以根据每个点击行为对应的电击日期,对该点击行为对应的预设字符进行拼接,从而得到点击序列。
具体的,点击行为在时间上具有规律性,例如每天大概的点击次数、点击时间等,因此,可以根据点击日期对预设字符进行拼接,使得点击序列具有时序信息,从而根据该带有时序信息的数据训练模型,找出正常用户与恶意用户点击广告的规律。
进一步的,可以根据预设字符对应的点击日期,对预设字符进行排序。例如,从采集点击数据的第一天到最后一天的顺序对预设字符进行排序,第一天产生的点击行为对应的预设字符排在第一个,最后一天产生的点击行为排在最后。若同一天产生了多个点击行为,则按照点击行为产生的时间进行排序。
实际应用时,还可以在不同的点击日期对应的预设字符之间设置预设符号。例如,预设符号可以是“_”。比如一点击序列为“0_3_2”,则表示该序列对应的用户,在第一天未点击广告,在第二天的2-3时点击了广告,在第三天的1-2时点击了广告。
其中,基于步骤304,能够得到用户标签对应的每个用户的点击序列,例如用户甲具有一个点击序列,用户乙也具有一个点击序列。且该点击序列中包括预设时间段内,该用户产生的点击行为信息。
步骤305,将点击序列作为输入值,将用户标签作为确定值。
步骤306,根据输入值、确定值训练循环神经网络模型,得到层间权重值以及神经元间权重值。
具体的,每个用户都具有一个点击序列,且每个用户都具有用户标签。因此,可以将用户的点击序列以及用户的标签输入循环神经网络。
其中,用户标签可以作为已知的结果,将点击序列作为输入值输入循环神经网络,若循环神经网络的输出结果与用户对应的用户标签相同,则可以认为结果准确,否则认为结果不准确。
具体的,循环神经网络模型中设置有层间连接的权重值以及神经元间连接的权重值。输入值经过隐含层的激活函数处理到达隐含层,再经过输出层的激活函数处理到达输出层。而在隐含层的激活函数中,参数包括当前输入值的上一个输入值。因此,循环神经网络模型能够对序列数据进行处理。
进一步的,基于大量的输入值、确定值对循环神经网络模型进行训练,能够得到较为准确的权重值,具体是指层间权重值以及神经元间权重值,即训练得到最终的识别点击广告有效性的模型。
根据本实施例提供的方法,能够基于用户点击数据训练得到识别模型,在训练过程中,可以根据用户点击数据以及用户的标签,统计正常用户以及恶意用户的规律,从而得到该识别模型,因此,该模型能够基于用户的点击数据得到用户标签。
可选的,本实施例提供的方法,还包括使用识别模型对用户的操作进行识别的步骤:
步骤307,获取实际用户的实际点击数据。
其中,实际用户在操作用户终端时,也会产生点击广告的行为,进而产生实际点击数据,该实际用户可能是正常用户的正常点击行为,也可能是恶意刷广告的用户的恶意行为。
具体的,实际点击数据与采集的用户点击数据相似,也可以包括点击日期、点击时间、点击的广告标识等。
使用训练模型对实际用户的点击行为进行识别的步骤,可以在训练服务器,也可以在识别服务器,本实施例不对此进行限制。
步骤308,根据实际点击数据向识别点击广告有效性的模型中输入数据,以使识别点击广告有效性的模型输出实际用户的实际用户标签。
进一步的,由于训练识别模型时,输入数据是点击序列,因此,还可以在识别模型中设置点击时间与点击序列中预设字符的对应关系。此时,可以直接将实际点击数据输入识别点击广告有效性的模型,识别模型能够根据实际点击数据中的点击时间,确定出相应的预设字符,并基于训练好的权重值,输出实际用户标签。
实际应用时,还可以由获取实际用户的实际点击数据的设备,根据第一预设规则对该数据进行处理,得到对应的预设字符,再将预设字符输入识别点击广告有效性的模型,使得识别模型基于训练好的权重值,输出实际用户标签。
本实施例提供的方法,能够根据用户在一段时间内实际的点击操作行为训练模型,再基于该模型对实际用户的点击操作行为进行识别,判断用户的点击行为是否为恶意行为,从而避免恶意刷广告造成广告主经济损失的问题。
图4为本发明又一示例性实施例示出的识别点击广告有效性的模型训练方法的流程图。
如图4所示,本实施例提供的识别点击广告有效性的模型训练方法,包括:
步骤401,采集用户标签,以及预设时间段内用户标签对应的用户点击广告的点击数据。
步骤301与步骤201的具体原理和实现方式类似,此处不再赘述。
步骤402,根据第一预设规则对每个用户的点击数据进行处理,得到与每个用户对应的点击序列。
步骤402与步骤202或302-304的具体原理和实现方式类似,此处不再赘述。
步骤403,采集用户信息,并根据第二预设规则对用户信息进行处理,得到用户数据。
其中,本实施例提供的方法,还可以采集用户信息,具体是指与用户标签对应的用户信息。用户标签可以与一用户标识对应,可以根据该用户标识采集相应的用户信息。例如,用户甲的标签是黑名单用户,采集用户甲的信息。
具体的,还可以设置第二预设规则,用于对采集的用户信息进行处理,从而得到相应的用户数据。
用户信息包括以下至少一种:
年龄、昵称、性别、历史购买行为、登录位置、浏览历史。
其中,恶意刷广告的用户的注册信息大部分是相仿的,因此,可以采集用户的年龄、昵称、性别。并且,有些时候恶意用户所在的账户都是同一网络区域,因此,可以采集用户的登录位置。另外,若是恶意用户,则其不会有自然的浏览行为,更不会购买广告商品,因此,还可以采集用户的历史购买行为以及浏览历史。
可以根据每种用户信息确定与其对应的预设用户字符,并根据预设用户字符确定用户信息对应的用户数据。
具体的,若用户信息包括年龄,则可以设置年龄与预设年龄字符的对应关系,如:0:未填写年龄;1:1-10岁;2:11-20岁;3:21-30岁……10:91-100岁。可以根据采集的用户信息找到相应的预设年龄字符,作为用户年龄对应的用户数据。
进一步的,若用户信息包括昵称,则可以通过Word2vec转化为词向量,有一些恶意用户为团伙合作,注册多个账户刷广告,这种情况下,他们的你昵称可能是xxx_1、xxx_2等,因此,恶意用户的昵称也具有一定的规律性。
实际应用时,若用户信息包括性别,则可以设置性别与预设性别字符的对应关系,如0:未填写性别;1:男;2:女。
其中,若用户信息包括登录位置,则可以将用户的IP做数字映射,从而基于算法找到恶意用户间的登录位置的关联。可以获取用户最近预设天数的登录位置,如近60天,若某一天未登录,则可以将用户数据设置为0。
具体的,若用户信息包括历史购买行为,则可以根据历史购买行为确定购买日期,根据当前日期、购买日期确定日期差。历史购买行为中可以包括购买日期信息,例如,用户在2018年8月1日购买了广告商品,则获取的购买日期为2018年8月1日。可以使用当前日期与购买日期确定日期差,例如当前日期是2018年8月3日,则日期差为2。若未产生购买行为,则可以将其设置为0。
进一步的,可以根据日期差对应的购买日期,对日期差进行拼接,得到历史购买行为对应的用户数据。具体可以按照购买日期从前到后的顺序,拼接对应的日期差。例如,拼接完成后的用户数据为0_2_1,则表示用户只有两次购买行为,一次在1天前,一次在两天前。可以共收集预设次数的用户购买行为,如10次。
实际应用时,若用户信息包括浏览历史,则可以根据浏览历史确定具有对应关系的浏览日期和浏览行为。浏览日期是产生浏览行为的日期,浏览行为可以包括浏览的网页或APP的题模块。
其中,可以根据浏览行为确定预设浏览字符,并根据浏览行为对应的浏览日期,对预设浏览字符进行拼接,得到浏览历史对应的用户数据。可以预先设置浏览行为对应的预设浏览字符,例如,商品详情为1,购物车为2等。若某一天没有浏览行为,则设置为0。
可以按照浏览日期的先后顺序,对预设浏览字符进行拼接。例如,浏览历史对应的用户数据为0_0_2_1,表明用户最近4天只有2次浏览记录。可以收集连续预设天数的浏览历史,如近50天。
步骤404,将点击序列、用户数据作为输入值,将用户标签作为确定值。
本实施例提供的方法中,用于训练模型的输入数据不仅包括点击序列,还包括用户数据,从而根据更多维度的数据训练模型,使得训练完成的识别模型,能够从多个维度分析用户的点击操作是否为恶意操作。
步骤405,根据输入值、确定值训练循环神经网络,得到层间权重值以及神经元间权重值。
步骤405与步骤306的具体原理和实现方式类似,此处不再赘述。
根据本实施例提供的方法,能够基于用户点击数据、用户信息训练得到识别模型,在训练过程中,可以根据用户点击数据、用户信息以及用户的标签,统计正常用户以及恶意用户的规律,从而得到该识别模型,因此,该模型能够基于用户的点击数据以及用户信息得到用户标签。
可选的,本实施例提供的方法,还包括使用识别模型对用户的操作进行识别的步骤:
步骤406,获取实际用户的实际点击数据;获取实际用户的实际用户信息,根据第二预设规则对实际用户信息进行处理,得到实际用户数据。
本步骤中获取实际用户的实际点击数据与步骤307的具体原理和实现方式类似,此处不再赘述。
与上述实施例不同之处在于,本实施例提供的方法还可以获取实际用户的实际用户信息。例如,点击广告的用户终端中,登陆的账户时用户甲,则获取用户甲的用户信息,具体获取的用户信息可以包括以下至少一种:
年龄、昵称、性别、历史购买行为、登录位置、浏览历史。
并基于第二预设规则对上述用户信息进行处理,得到各个用户信息对应的实际用户数据。具体处理方法与步骤403相似,不再赘述。
步骤407,根据实际点击数据、实际用户数据向识别点击广告有效性的模型中输入数据,以使识别点击广告有效性的模型输出实际用户的实际用户标签。
进一步的,由于训练识别模型时,输入数据是点击序列、用户数据,因此,还可以在识别模型中设置点击时间与点击序列中预设字符的对应关系。此时,可以直接将实际点击数据以及实际用户数据输入识别点击广告有效性的模型,识别模型能够根据实际点击数据中的点击时间,确定出相应的预设字符,并基于训练好的权重值,对得到的预设字符以及实际用户数据进行处理,具体为基于权重值以及激励函数进行计算,输出实际用户标签。
实际应用时,还可以由获取实际用户的实际点击数据的设备,根据第一预设规则对该数据进行处理,得到对应的预设字符,再将预设字符以及实际用户数据输入识别点击广告有效性的模型,使得识别模型基于训练好的权重值,输出实际用户标签。
图5为本发明一示例性实施例示出的识别点击广告有效性的模型训练装置的结构图。
如图5所示,本实施例提供的识别点击广告有效性的模型训练装置,包括:
采集模块51,用于采集用户标签,以及预设时间段内所述用户标签对应的用户点击广告的点击数据;
处理模块52,用于根据第一预设规则对每个所述用户的所述点击数据进行处理,得到与每个所述用户对应的点击序列;
训练模块53,用于根据所述点击序列、所述用户标签训练模型,得到识别点击广告有效性的模型。
本实施例提供的识别点击广告有效性的模型训练装置,包括采集模块,用于采集用户标签,以及预设时间段内用户标签对应的用户点击广告的点击数据;处理模块,用于根据第一预设规则对每个用户的点击数据进行处理,得到与每个用户对应的点击序列;训练模块,用于根据点击序列、用户标签训练模型,得到识别点击广告有效性的模型。本实施例提供的装置,可以根据用户在一段时间内产生的点击广告的行为以及用户标签训练模型,从而得到识别点击广告有效性的模型。无论是正常用户,还是恶意刷广告用户,在连续的一段时间里,用户点击广告的行为具有一定的规律,因此,根据连续一段时间内用户的点击数据,训练得到的识别模型更加准确。
本实施例提供的识别点击广告有效性的模型训练装置的具体原理和实现方式均与图2所示的实施例类似,此处不再赘述。
图6为本发明另一示例性实施例示出的识别点击广告有效性的模型训练装置的结构图。
如图6所示,在上述实施例的基础上,本实施例提供的识别点击广告有效性的模型训练装置,
所述用户标签包括黑名单用户、白名单用户。
所述采集模块51具体用于:
获取所述用户的所述点击数据中包括的与点击行为对应的点击日期、点击时间;
根据预设对应关系确定所述点击时间对应的预设字符;
根据所述点击行为对应的所述点击日期,对所述预设字符进行拼接,得到所述用户的点击序列。
所述采集模块51具体用于根据所述点击行为对应的所述点击日期,对所述预设字符进行排序;
在不同的所述点击日期对应的所述预设字符之间设置预设符号。
所述训练模块53具体用于:
将所述点击序列作为输入值,将所述用户标签作为确定值;
根据所述输入值、所述确定值训练循环神经网络模型,得到层间权重值以及神经元间权重值。
本实施例提供的装置,所述采集模块51还用于:
采集用户信息,并根据第二预设规则对所述用户信息进行处理,得到用户数据;
所述训练模块53还用于:
将所述点击序列、所述用户数据作为输入值,将所述用户标签作为确定值;
根据所述输入值、所述确定值训练循环神经网络,得到层间权重值以及神经元间权重值。
所述用户信息包括以下至少一种:
年龄、昵称、性别、历史购买行为、登录位置、浏览历史。
所述采集模块51具体用于:
根据每种所述用户信息确定与其对应的预设用户字符,并根据所述预设用户字符确定所述用户信息对应的所述用户数据。
若所述用户信息包括所述历史购买行为,则所述采集模块51具体用于:
根据所述历史购买行为确定购买日期,根据当前日期、所述购买日期确定日期差;
根据所述日期差对应的所述购买日期,对所述日期差进行拼接,得到所述历史购买行为对应的所述用户数据。
若所述用户信息包括所述浏览历史,则所述采集模块51具体用于:
根据所述浏览历史确定具有对应关系的浏览日期和浏览行为;
根据所述浏览行为确定预设浏览字符,并根据所述浏览行为对应的所述浏览日期,对所述预设浏览字符进行拼接,得到所述浏览历史对应的所述用户数据。
本实施例提供的装置还包括:
获取模块54,用于获取实际用户的实际点击数据;
识别模块55,用于根据所述实际点击数据向所述识别点击广告有效性的模型中输入数据,以使所述识别点击广告有效性的模型输出所述实际用户的实际用户标签。
所述获取模块54还用于:
获取所述实际用户的实际用户信息,根据所述第二预设规则对所述实际用户信息进行处理,得到实际用户数据;
所述识别模块55具体用于根据所述实际点击数据、所述实际用户数据向所述识别点击广告有效性的模型中输入数据。
本实施例提供的识别点击广告有效性的模型训练装置的具体原理和实现方式均与图3-4所示的实施例类似,此处不再赘述。
图7为本发明一示例性实施例示出的识别点击广告有效性的模型训练设备的结构图。
如图7所示,本实施例提供的识别点击广告有效性的模型训练设备包括:
存储器71;
处理器72;以及
计算机程序;
其中,所述计算机程序存储在所述存储器71中,并配置为由所述处理器72执行以实现如上所述的任一种识别点击广告有效性的模型训练方法。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,
所述计算机程序被处理器执行如上所述的任一种识别点击广告有效性的模型训练方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种识别点击广告有效性的模型训练方法,其特征在于,包括:
采集用户标签,以及预设时间段内所述用户标签对应的用户点击广告的点击数据;
根据第一预设规则对每个所述用户的所述点击数据进行处理,得到与每个所述用户对应的点击序列;
根据所述点击序列、所述用户标签训练模型,得到识别点击广告有效性的模型;
所述方法还包括:采集用户信息,并根据每种所述用户信息确定与其对应的预设用户字符,并根据所述预设用户字符确定所述用户信息对应的用户数据;
所述根据所述点击序列、所述用户标签训练模型,包括:
将所述点击序列、所述用户数据作为输入值,将所述用户标签作为确定值;
根据所述输入值、所述确定值训练循环神经网络,得到层间权重值以及神经元间权重值;
所述根据所述预设用户字符确定所述用户数据,包括:若所述用户信息包括历史购买行为,则根据所述历史购买行为确定购买日期,根据当前日期、所述购买日期确定日期差;根据所述日期差对应的所述购买日期,对所述日期差进行拼接,得到所述历史购买行为对应的所述用户数据;
若所述用户信息包括浏览历史,则根据所述浏览历史确定具有对应关系的浏览日期和浏览行为;根据所述浏览行为确定预设浏览字符,并根据所述浏览行为对应的所述浏览日期,对所述预设浏览字符进行拼接,得到所述浏览历史对应的所述用户数据。
2.根据权利要求1所述的方法,其特征在于,所述用户标签包括黑名单用户、白名单用户。
3.根据权利要求1所述的方法,其特征在于,所述根据第一预设规则对每个所述用户的所述点击数据进行处理,得到与每个所述用户对应的点击序列,包括:
获取所述用户的所述点击数据中包括的与点击行为对应的点击日期、点击时间;
根据预设对应关系确定所述点击时间对应的预设字符;
根据所述点击行为对应的所述点击日期,对所述预设字符进行拼接,得到所述用户的点击序列。
4.根据权利要求3所述的方法,其特征在于,所述根据所述点击行为对应的所述点击日期,对所述预设字符进行拼接,得到所述用户的点击序列,包括:
根据所述点击行为对应的所述点击日期,对所述预设字符进行排序;
在不同的所述点击日期对应的所述预设字符之间设置预设符号。
5.根据权利要求4所述的方法,其特征在于,所述用户信息包括以下至少一种:
年龄、昵称、性别、历史购买行为、登录位置、浏览历史。
6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:
获取实际用户的实际点击数据;
根据所述实际点击数据向所述识别点击广告有效性的模型中输入数据,以使所述识别点击广告有效性的模型输出所述实际用户的实际用户标签。
7.根据权利要求6所述的方法,其特征在于,还包括:
获取所述实际用户的实际用户信息,根据第二预设规则对所述实际用户信息进行处理,得到实际用户数据;
所述根据所述实际点击数据向所述识别点击广告有效性的模型中输入数据,包括:
根据所述实际点击数据、所述实际用户数据向所述识别点击广告有效性的模型中输入数据。
8.一种识别点击广告有效性的模型训练装置,其特征在于,包括:
采集模块,用于采集用户标签,以及预设时间段内所述用户标签对应的用户点击广告的点击数据;
处理模块,用于根据第一预设规则对每个所述用户的所述点击数据进行处理,得到与每个所述用户对应的点击序列;
训练模块,用于根据所述点击序列、所述用户标签训练模型,得到识别点击广告有效性的模型;
所述采集模块还用于:
采集用户信息,并根据第二预设规则对所述用户信息进行处理,得到用户数据;
所述训练模块还用于:
将所述点击序列、所述用户数据作为输入值,将所述用户标签作为确定值;
根据所述输入值、所述确定值训练循环神经网络,得到层间权重值以及神经元间权重值;
所述采集模块具体用于:
根据每种所述用户信息确定与其对应的预设用户字符,并根据所述预设用户字符确定所述用户信息对应的用户数据;
若所述用户信息包括历史购买行为,则所述采集模块具体用于:
根据所述历史购买行为确定购买日期,根据当前日期、所述购买日期确定日期差;
根据所述日期差对应的所述购买日期,对所述日期差进行拼接,得到所述历史购买行为对应的所述用户数据;
若所述用户信息包括浏览历史,则所述采集模块具体用于:
根据所述浏览历史确定具有对应关系的浏览日期和浏览行为;
根据所述浏览行为确定预设浏览字符,并根据所述浏览行为对应的所述浏览日期,对所述预设浏览字符进行拼接,得到所述浏览历史对应的所述用户数据。
9.一种识别点击广告有效性的模型训练设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如权利要求1-7任一种所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,
所述计算机程序被处理器执行以实现如权利要求1-7任一种所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811383620.2A CN111199415B (zh) | 2018-11-20 | 2018-11-20 | 识别点击广告有效性的模型训练方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811383620.2A CN111199415B (zh) | 2018-11-20 | 2018-11-20 | 识别点击广告有效性的模型训练方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111199415A CN111199415A (zh) | 2020-05-26 |
CN111199415B true CN111199415B (zh) | 2024-05-24 |
Family
ID=70747328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811383620.2A Active CN111199415B (zh) | 2018-11-20 | 2018-11-20 | 识别点击广告有效性的模型训练方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111199415B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101132311A (zh) * | 2007-09-25 | 2008-02-27 | 腾讯科技(深圳)有限公司 | 一种防范网络广告被恶意点击的方法及系统 |
US8533825B1 (en) * | 2010-02-04 | 2013-09-10 | Adometry, Inc. | System, method and computer program product for collusion detection |
CN104463635A (zh) * | 2014-12-22 | 2015-03-25 | 北京奇虎科技有限公司 | 广告恶意点击检测方法及装置 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN108235360A (zh) * | 2016-12-22 | 2018-06-29 | 上海掌门科技有限公司 | 甄别用户的方法及设备 |
-
2018
- 2018-11-20 CN CN201811383620.2A patent/CN111199415B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101132311A (zh) * | 2007-09-25 | 2008-02-27 | 腾讯科技(深圳)有限公司 | 一种防范网络广告被恶意点击的方法及系统 |
US8533825B1 (en) * | 2010-02-04 | 2013-09-10 | Adometry, Inc. | System, method and computer program product for collusion detection |
CN104463635A (zh) * | 2014-12-22 | 2015-03-25 | 北京奇虎科技有限公司 | 广告恶意点击检测方法及装置 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN108235360A (zh) * | 2016-12-22 | 2018-06-29 | 上海掌门科技有限公司 | 甄别用户的方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111199415A (zh) | 2020-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106022834B (zh) | 广告反作弊方法及装置 | |
CN106886518B (zh) | 一种微博账号分类的方法 | |
CN106997549A (zh) | 一种广告信息的推送方法及系统 | |
CN111435507A (zh) | 广告反作弊方法、装置、电子设备及可读存储介质 | |
EP3384399A1 (en) | Method and system for purchase behavior prediction of customers | |
WO2014193700A1 (en) | Social media pricing engine | |
CN111727451A (zh) | 用于计算预测数据的信息处理装置等 | |
Safa et al. | An artificial neural network classification approach for improving accuracy of customer identification in e-commerce | |
CN111371767A (zh) | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 | |
CN113516496B (zh) | 广告转化率预估模型构建方法、装置、设备及其介质 | |
CN116862592B (zh) | 一种基于用户行为的sop私域营销信息自动推送方法 | |
CN111782735A (zh) | 羊毛党流量识别方法及装置 | |
CN116127184A (zh) | 产品的推荐方法及装置、非易失性存储介质、电子设备 | |
CN110008980B (zh) | 识别模型生成方法、识别方法、装置、设备及存储介质 | |
CN112347457A (zh) | 异常账户检测方法、装置、计算机设备和存储介质 | |
KR102537601B1 (ko) | 광고 전략을 생성하기 위한 광고 방법 및 장치 | |
CN113886697A (zh) | 基于聚类算法的活动推荐方法、装置、设备及存储介质 | |
CN111199415B (zh) | 识别点击广告有效性的模型训练方法、装置、设备及介质 | |
CN110796379B (zh) | 业务渠道的风险评估方法、装置、设备及存储介质 | |
CN111553542A (zh) | 一种用户优惠券核销率预测方法 | |
KR101494281B1 (ko) | 타겟팅 자동화 장치 및 방법 | |
CN114722954A (zh) | 一种针对评价信息的内容异常处理方法和装置 | |
CN110807179B (zh) | 一种用户识别方法、装置、服务器及存储介质 | |
TWM598454U (zh) | 商品推薦裝置 | |
KR20100103943A (ko) | 키워드 셋트 운영 방법 및 시스템과 이를 위한 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |