CN113129056A - 一种控制广告投放频次的方法及系统 - Google Patents
一种控制广告投放频次的方法及系统 Download PDFInfo
- Publication number
- CN113129056A CN113129056A CN202110405008.6A CN202110405008A CN113129056A CN 113129056 A CN113129056 A CN 113129056A CN 202110405008 A CN202110405008 A CN 202110405008A CN 113129056 A CN113129056 A CN 113129056A
- Authority
- CN
- China
- Prior art keywords
- advertisement
- blog
- exposed
- signature
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0272—Period of advertisement exposure
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例提供一种控制广告投放频次的方法及系统,其中,所述方法包括:当用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;获取向该用户待曝光的广告博文的博文签名;根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。根据本发明的技术方案,通过博文签名进行相似度的计算,在广告投放时进行相似度的计算,从而控制相似候选广告的投放频次,既提高了处理性能,又提升了用户体验和广告投放效果。
Description
技术领域
本发明涉及互联网广告领域,具体涉及一种控制广告投放频次的方法及系统。
背景技术
目前互联网app广告的投放方式中,为提升用户体验,一般会对相同博文的投放频次进行控制,广告投放的频次策略如:同一用户1天内不能看到同一条的博文广告。
某些广告虽然与用户已曝光的广告不是同一博文,但是内容相似,如果不在频次控制时加入相似度判断,就会让用户误以为短时间内看到同一广告,从而影响用户体验,并且影响广告的投放效果。
同时在投放时需要判断用户已曝光博文与候选广告博文的相似度,如果采用在投放时实时对博文内容分词再分析比较的传统方法,处理性能较差,无法适应大量候选广告博文参与计算的情况。
发明内容
本发明实施例提供一种控制广告投放频次的方法及装置,通过博文签名进行相似度的计算,在广告投放时进行相似度的计算,从而控制相似候选广告的投放频次,既提高了处理性能,又提升了用户体验和广告投放效果。
为达到上述目的,一方面,本发明实施例提供了一种控制广告投放频次的方法,所述方法包括:
当用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;
获取向该用户待曝光的广告博文的博文签名;
根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
另一方面,本发明实施例提供了一种控制广告投放频次的系统,所述装置包括:
信息获取单元,用于在用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;以及获取向该用户待曝光的广告博文的博文签名;
相似度单元,用于根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
投放单元,用于根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
上述技术方案具有如下有益效果:
本发明的技术方案由于使用了控制广告投放频次的方法,本申请通过引入博文签名计算相似度的方法,计算并保存候选广告博文和用户已曝光博文的博文签名,并在投放时判断已曝光博文与候选广告博文的相似度,从而控制相似候选广告的投放频次,既提高了处理性能,又提升了用户体验和广告投放效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一种控制广告投放频次的方法的流程图;
图2是本发明实施例一种控制广告投放频次的系统的结构示意图;
图3是本发明实施例中一种simhash算法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,是本发明实施例一种控制广告投放频次的方法的流程图,所述方法包括:
S101:当用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名。
S102:获取向该用户待曝光的广告博文的博文签名。
优选地,所述广告博文的博文签名为通过simhash算法计算获得的simhash签名。
进一步优选地,所述simhash签名的计算方法,包括:将广告博文的语句进行分词,得到特征向量,为每一个特征向量设置权重;
通过哈希hash函数计算每个特征向量的hash值;
根据所述权重和hash值,给每一个特征向量进行加权;
将各个特征向量的加权结果累加,获得对应于广告博文的序列串;
对所述序列串进行降维获得广告博文的simhash签名。
具体地,当广告订单上线时,会给定博文标识,记为mid,并计算该广告博文的博文签名即simhash签名,记为sim_code。
当用户访问请求到来时,投放模块从数据库中获取该用户曝光过的博文mid及博文的sim_code,与各候选订单博文的sim_code计算相似度;可使用比较sim_code的海明距离来衡量相似度。如64位sim_code的海明距离小于3的标记为相似博文。例如:已曝光的博文A的sim_code与候选博文B的sim_code的海明距离小于3,则A与B为相似博文。
S103:根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度。
优选地,所述根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度,包括:通过计算待曝光的广告博文与已曝光的广告博文的simhash签名的海明距离确定待曝光的广告博文与已曝光的广告博文之间的相似度。
S104:根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
优选地,命中频次控制策略是指:待曝光的广告博文与已曝光的广告博文之间的相似度高于设定的相似度阈值,且已曝光的广告博文向所述用户曝光的时间在24小时以内。判断相似博文是否命中频次控制策略,则该相似博文的广告将过滤掉,而不被曝光;例如:A与B为相似博文,且A的曝光时间在一天以内,则候选博文B将被过滤掉,不会曝光给该用户。
当最后有广告博文曝光给用户后,将这些博文的博文标识mid、曝光时间,以及博文的sim_code,保存至数据库,一般使用redis。
如图3所示,simhash算法的流程分为5个步骤:分词、hash、加权、合并、降维,具体过程如下所述:
(1)分词
对广告博文中的语句,进行分词,得到有效的特征向量,然后为每一个特征向量设置1-5等5个级别的权重,对于给定的广告博文,那么特征向量可以是博文文本中的词,其权重可以是这个词出现的次数。例如给定一段语句:“CSDN博客结构之法算法之道的作者July”,分词后为:“CSDN博客结构之法算法之道的作者July”,然后为每个特征向量赋予权值:CSDN(4)博客(5)结构(3)之(1)法(2)算法(3)之(1)道(2)的(1)作者(5)July(5),其中括号里的数字代表这个单词在整条语句中的重要程度,数字越大代表越重要。
(2)hash
通过hash函数计算各个特征向量的hash值,hash值为二进制数01组成的n-bit签名。比如“CSDN”的hash值Hash(CSDN)为100101,“博客”的hash值Hash(博客)为“101011”。就这样,字符串就变成了一系列数字。
(3)加权
在hash值的基础上,给所有特征向量进行加权,即W=Hash*weight,且遇到1则hash值和权值正相乘,遇到0则hash值和权值负相乘。例如给“CSDN”的hash值“100101”加权得到:W(CSDN)=100101 4=4 -4 -4 4 -4 4,给“博客”的hash值“101011”加权得到:W(博客)=101011 5=5 -5 5 -5 5 5,其余特征向量类似此般操作。
(4)合并
将上述各个特征向量的加权结果累加,变成只有一个序列串。拿前两个特征向量举例,例如“CSDN”的“4 -4 -4 4 -4 4”和“博客”的“5 -5 5 -5 5 5”进行累加,得到“4+5 -4+-5 -4+5 4+-5 -4+5 4+5”,得到“9 -9 1 -1 1”。
(5)降维
对于n-bit签名的累加结果,如果大于0则置1,否则置0,从而得到该语句的simhash值,最后我们便可以根据不同语句simhash的海明距离来判断它们的相似度。例如把上面计算出来的“9 -9 1 -1 1 9”降维,某位大于0记为1,小于0记为0,得到的01串为:“10 1 0 1 1”,从而形成它们的simhash签名。
对应于上述方法,如图2所示,是本发明实施例一种控制广告投放频次的系统的结构示意图,所述装置包括:
信息获取单元21,用于在用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;以及获取向该用户待曝光的广告博文的博文签名;
相似度单元22,用于根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
投放单元23,用于根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
优选地,还包括:博文签名计算单元,用于通过simhash算法计算获得的广告博文的simhash签名,将计算得到的simhash签名作为所述博文签名。
优选地,所述博文签名计算单元,具体用于:
将广告博文的语句进行分词,得到特征向量,为每一个特征向量设置权重;
通过hash函数计算每个特征向量的hash值;
根据所述权重和hash值,给每一个特征向量进行加权;
将各个特征向量的加权结果累加,获得对应于广告博文的序列串;
对所述序列串进行降维获得广告博文的simhash签名。
优选地,所述相似度单元,具体用于通过计算待曝光的广告博文与已曝光的广告博文的simhash签名的海明距离确定待曝光的广告博文与已曝光的广告博文之间的相似度。
优选地,命中频次控制策略是指:待曝光的广告博文与已曝光的广告博文之间的相似度高于设定的相似度阈值,且已曝光的广告博文向所述用户曝光的时间在24小时以内。
本发明主要通过零代码侵入的方式隔离API网关中单一业务变动影响、容量变动影响,以及API网关本身变动对全范围的影响。通过配置的方式解决多协议适配的问题,支持HTTP、dubbo等多种协议。
根据本发明的技术方案,第一,实现单一业务服务API与其他业务的物理隔离。第二,使得业务服务API的变动修改的影响控制在本业务范围内。第三,对业务服务API的容量需求只需进行当前服务的扩缩容即可实现。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种控制广告投放频次的方法,其特征在于,包括:
当用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;
获取向该用户待曝光的广告博文的博文签名;
根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
2.如权利要求1所述的控制广告投放频次的方法,其特征在于,所述广告博文的博文签名为通过simhash算法计算获得的simhash签名。
3.如权利要求2所述的控制广告投放频次的方法,其特征在于,所述simhash签名的计算方法,包括:
将广告博文的语句进行分词,得到特征向量,并为每一个特征向量设置权重;
通过哈希hash函数计算每个特征向量的hash值;
根据所述权重和hash值,给每一个特征向量进行加权;
将各个特征向量的加权结果累加,获得对应于广告博文的序列串;
对所述序列串进行降维获得广告博文的simhash签名。
4.如权利要求3所述的控制广告投放频次的方法,其特征在于,所述根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度,包括:
通过计算待曝光的广告博文与已曝光的广告博文的simhash签名的海明距离,确定待曝光的广告博文与已曝光的广告博文之间的相似度。
5.如权利要求4所述的控制广告投放频次的方法,其特征在于,命中频次控制策略是指:待曝光的广告博文与已曝光的广告博文之间的相似度高于设定的相似度阈值,且已曝光的广告博文向所述用户曝光的时间在24小时以内。
6.一种控制广告投放频次的系统,其特征在于,包括:
信息获取单元,用于在用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;以及获取向该用户待曝光的广告博文的博文签名;
相似度单元,用于根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
投放单元,用于根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
7.如权利要求6所述的控制广告投放频次的系统,其特征在于,还包括:
博文签名计算单元,用于通过simhash算法计算获得的广告博文的simhash签名,将计算得到的simhash签名作为所述博文签名。
8.如权利要求7所述的控制广告投放频次的系统,其特征在于,所述博文签名计算单元,具体用于:
将广告博文的语句进行分词,得到特征向量,为每一个特征向量设置权重;
通过哈希hash函数计算每个特征向量的hash值;
根据所述权重和hash值,给每一个特征向量进行加权;
将各个特征向量的加权结果累加,获得对应于广告博文的序列串;
对所述序列串进行降维获得广告博文的simhash签名。
9.如权利要求8所述的控制广告投放频次的系统,其特征在于,所述相似度单元,具体用于通过计算待曝光的广告博文与已曝光的广告博文的simhash签名的海明距离确定待曝光的广告博文与已曝光的广告博文之间的相似度。
10.如权利要求9所述的控制广告投放频次的系统,其特征在于,所述命中频次控制策略是指:待曝光的广告博文与已曝光的广告博文之间的相似度高于设定的相似度阈值,且已曝光的广告博文向所述用户曝光的时间在24小时以内。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110405008.6A CN113129056A (zh) | 2021-04-15 | 2021-04-15 | 一种控制广告投放频次的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110405008.6A CN113129056A (zh) | 2021-04-15 | 2021-04-15 | 一种控制广告投放频次的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113129056A true CN113129056A (zh) | 2021-07-16 |
Family
ID=76776527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110405008.6A Pending CN113129056A (zh) | 2021-04-15 | 2021-04-15 | 一种控制广告投放频次的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113129056A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408965A (zh) * | 2008-11-14 | 2009-04-15 | 徐碧云 | 一种广告发布系统和方法 |
CN103646080A (zh) * | 2013-12-12 | 2014-03-19 | 北京京东尚科信息技术有限公司 | 基于倒序索引的微博去重方法和系统 |
CN104636319A (zh) * | 2013-11-11 | 2015-05-20 | 腾讯科技(北京)有限公司 | 一种文本去重方法和装置 |
CN106873964A (zh) * | 2016-12-23 | 2017-06-20 | 浙江工业大学 | 一种改进的SimHash代码相似度检测方法 |
CN108009599A (zh) * | 2017-12-27 | 2018-05-08 | 福建中金在线信息科技有限公司 | 一种原创文档判断方法、装置、电子设备及存储介质 |
CN108154390A (zh) * | 2017-12-20 | 2018-06-12 | 微梦创科网络科技(中国)有限公司 | 广告博文的投放方法及装置、存储介质和计算设备 |
CN109271487A (zh) * | 2018-09-29 | 2019-01-25 | 浪潮软件股份有限公司 | 一种相似文本分析方法 |
CN110516212A (zh) * | 2019-09-02 | 2019-11-29 | 河南理工大学 | 一种云计算的海量文档相似检测方法 |
CN111046274A (zh) * | 2019-11-08 | 2020-04-21 | 微梦创科网络科技(中国)有限公司 | 一种基于实时博文的信息推送方法及装置 |
CN111241196A (zh) * | 2020-01-03 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 广告频次控制方法及系统 |
CN111552842A (zh) * | 2020-03-30 | 2020-08-18 | 贝壳技术有限公司 | 一种数据处理的方法、装置和存储介质 |
WO2020228182A1 (zh) * | 2019-05-15 | 2020-11-19 | 平安科技(深圳)有限公司 | 基于大数据的数据去重的方法、装置、设备及存储介质 |
-
2021
- 2021-04-15 CN CN202110405008.6A patent/CN113129056A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408965A (zh) * | 2008-11-14 | 2009-04-15 | 徐碧云 | 一种广告发布系统和方法 |
CN104636319A (zh) * | 2013-11-11 | 2015-05-20 | 腾讯科技(北京)有限公司 | 一种文本去重方法和装置 |
CN103646080A (zh) * | 2013-12-12 | 2014-03-19 | 北京京东尚科信息技术有限公司 | 基于倒序索引的微博去重方法和系统 |
CN106873964A (zh) * | 2016-12-23 | 2017-06-20 | 浙江工业大学 | 一种改进的SimHash代码相似度检测方法 |
CN108154390A (zh) * | 2017-12-20 | 2018-06-12 | 微梦创科网络科技(中国)有限公司 | 广告博文的投放方法及装置、存储介质和计算设备 |
CN108009599A (zh) * | 2017-12-27 | 2018-05-08 | 福建中金在线信息科技有限公司 | 一种原创文档判断方法、装置、电子设备及存储介质 |
CN109271487A (zh) * | 2018-09-29 | 2019-01-25 | 浪潮软件股份有限公司 | 一种相似文本分析方法 |
WO2020228182A1 (zh) * | 2019-05-15 | 2020-11-19 | 平安科技(深圳)有限公司 | 基于大数据的数据去重的方法、装置、设备及存储介质 |
CN110516212A (zh) * | 2019-09-02 | 2019-11-29 | 河南理工大学 | 一种云计算的海量文档相似检测方法 |
CN111046274A (zh) * | 2019-11-08 | 2020-04-21 | 微梦创科网络科技(中国)有限公司 | 一种基于实时博文的信息推送方法及装置 |
CN111241196A (zh) * | 2020-01-03 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 广告频次控制方法及系统 |
CN111552842A (zh) * | 2020-03-30 | 2020-08-18 | 贝壳技术有限公司 | 一种数据处理的方法、装置和存储介质 |
Non-Patent Citations (1)
Title |
---|
顾志祥;谢龙恩;杜雨;: "文本相似度计算的Simhash算法的实现与改进", 信息通信, no. 01 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105389722B (zh) | 恶意订单识别方法及装置 | |
CN106355431B (zh) | 作弊流量检测方法、装置及终端 | |
US10650274B2 (en) | Image clustering method, image clustering system, and image clustering server | |
CN106469192B (zh) | 一种文本相关性的确定方法及装置 | |
CN108881138B (zh) | 一种网页请求识别方法及装置 | |
CN101859309A (zh) | 重复文本识别系统及方法 | |
US20160366475A1 (en) | Method for controlling network media information publication, apparatus, and server | |
CN110019779B (zh) | 一种文本分类方法、模型训练方法及装置 | |
CN108234454B (zh) | 一种身份认证方法、服务器及客户端设备 | |
Goodman et al. | TeaForN: Teacher-forcing with n-grams | |
CN106910135A (zh) | 用户推荐方法及装置 | |
KR20200063067A (ko) | 자가 증식된 비윤리 텍스트의 유효성 검증 장치 및 방법 | |
CN113129056A (zh) | 一种控制广告投放频次的方法及系统 | |
US20130166282A1 (en) | Method and apparatus for rating documents and authors | |
CN114943549A (zh) | 一种广告投放方法及装置 | |
CN107291685B (zh) | 语义识别方法和语义识别系统 | |
Benssalah et al. | A cooperative Bayesian and lower bound estimation in dynamic framed slotted ALOHA algorithm for RFID systems | |
CN110147881B (zh) | 语言处理方法、装置、设备及存储介质 | |
CN107818483B (zh) | 网络卡券推荐方法及系统 | |
CN110858852B (zh) | 一种注册域名的获取方法及装置 | |
CN110555301B (zh) | 账号的权限调整方法、装置和设备及账号权限处理方法 | |
CN110827080A (zh) | 一种定向推送方法及装置 | |
CN112949295A (zh) | 一种数据处理方法和装置 | |
CN110543471A (zh) | 一种券码的生成方法及服务器 | |
KR101578802B1 (ko) | 사용자의 키워드에 대한 관심 지속 정도에 기초하여 광고를 제공하는 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |