CN105787133A - 广告信息过滤方法及装置 - Google Patents

广告信息过滤方法及装置 Download PDF

Info

Publication number
CN105787133A
CN105787133A CN201610201399.9A CN201610201399A CN105787133A CN 105787133 A CN105787133 A CN 105787133A CN 201610201399 A CN201610201399 A CN 201610201399A CN 105787133 A CN105787133 A CN 105787133A
Authority
CN
China
Prior art keywords
advertisement
image
belongs
text
released
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610201399.9A
Other languages
English (en)
Other versions
CN105787133B (zh
Inventor
陈志军
王百超
侯文迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201610201399.9A priority Critical patent/CN105787133B/zh
Publication of CN105787133A publication Critical patent/CN105787133A/zh
Application granted granted Critical
Publication of CN105787133B publication Critical patent/CN105787133B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本公开是关于广告信息过滤方法及装置,所述方法包括:获取终端用户上传的待发布信息;判断所述待发布信息是否属于广告信息;当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。本公开实施例可以识别出待发布信息属于广告并添加过滤标识,根据过滤标识可以不推送待发布信息给需进行广告过滤的用户,从而实现了广告信息的自动过滤。

Description

广告信息过滤方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及广告信息过滤方法及装置。
背景技术
随着移动通信技术的快速发展,终端可以通过安装应用程序获得越来越多的功能,例如,社交应用或即时通讯应用等都可以为用户提供公共发布页功能,用户可以发布信息并展示在公共发布页。由于用户可以发布任何其想要发布的信息,涉及广告的信息常常给其好友用户造成困扰。相关技术中,用户可以将经常发布广告的好友设置屏蔽,则该好友发布的所有信息就被服务端屏蔽,用户无法在公共发布页查阅到该好友发布的其他非广告信息。
发明内容
为克服相关技术中存在的问题,本公开提供了广告信息过滤方法及装置。
根据本公开实施例的第一方面,提供一种广告信息过滤方法,所述方法包括:
获取终端用户上传的待发布信息;
判断所述待发布信息是否属于广告信息;
当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
可选的,所述判断所述待发布信息是否属于广告信息,包括:
若所述待发布信息为文本,利用预设的文本训练模型检测所述文本是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息为图像,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息包括文本和图像,利用预设的文本训练模型检测所述文本是否属于广告,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本和图像都属于广告,确定所述待发布信息属于广告信息;或者是当所述文本或图像其中一个属于广告时,确定所述待发布信息属于广告信息。
可选的,所述利用预设的文本训练模型检测所述文本是否属于广告,包括:
利用预设的分类算法对预设的样本广告词库进行分类训练,获得用于区分文本是否为广告的文本训练模型;其中,所述样本广告词库包括广告样本词语和非广告样本词语;
当利用所述文本训练模型检测所述文本属于广告的概率高于预设阈值时,确定所述文本属于广告。
可选的,所述利用预设的图像训练模型检测所述图像是否属于广告,包括:
利用预设的分类算法对预设的样本图像库进行分类训练,获得用于区分所述图像是否为广告的广告图像训练模型;其中,所述样本图像库包括广告样本图像和非广告样本图像;
当利用所述广告训练模型检测所述图像是否属于广告的概率高于预设阈值时,确定所述图像属于广告。
可选的,所述利用预设的图像训练模型检测所述图像是否属于广告,包括:
获取终端发送的广告物品图像;
识别所述广告物品图像中物品的物品类别,将所述广告物品图像及物品类别记录在物品图像库中;
利用预设的分类算法对所述物品图像库进行分类训练,获得用于区分物品类别的物品训练模型;
当利用所述物品训练模型检测所述图像中物品的类别与所述物品训练模型对应的物品类别相同时,确定所述图像属于广告。
根据本公开实施例的第二方面,提供一种广告信息过滤装置,所述装置包括:
信息获取模块,被配置为获取终端用户上传的待发布信息;
广告判断模块,被配置为判断所述待发布信息是否属于广告信息;
过滤模块,被配置为当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
可选的,所述广告判断模块,包括:
确定子模块,被配置为:若所述待发布信息为文本,利用预设的文本训练模型检测所述文本是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息为图像,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息包括文本和图像,利用预设的文本训练模型检测所述文本是否属于广告,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本和图像都属于广告,确定所述待发布信息属于广告信息;或者是当所述文本或图像其中一个属于广告时,确定所述待发布信息属于广告信息。
可选的,所述确定子模块,包括:
文本训练子模块,被配置为利用预设的分类算法对预设的样本广告词库进行分类训练,获得用于区分文本是否为广告的文本训练模型;其中,所述样本广告词库包括广告样本词语和非广告样本词语;
文本确定子模块,被配置为当利用所述文本训练模型检测所述文本属于广告的概率高于预设阈值时,确定所述文本属于广告。
可选的,所述确定子模块,包括:
第一图像训练子模块,被配置为利用预设的分类算法对预设的样本图像库进行分类训练,获得用于区分所述图像是否为广告的广告训练模型;其中,所述样本图像库包括广告样本图像和非广告样本图像;
第一图像确定子模块,被配置为当利用所述广告训练模型检测所述图像是否属于广告的概率高于预设阈值时,确定所述图像属于广告。
可选的,所述确定子模块,包括:
物品图像获取子模块,被配置为获取终端发送的广告物品图像;
物品类别识别子模块,被配置为识别所述广告物品图像中物品的物品类别,将所述广告物品图像及物品类别记录在物品图像库中;
第二图像训练子模块,被配置为利用预设的分类算法对所述物品图像库进行分类训练,获得用于区分物品类别的物品训练模型;
第二图像确定子模块,被配置为当利用所述物品训练模型检测所述图像中物品的类别与所述物品训练模型对应的物品类别相同时,确定所述图像属于广告。
根据本公开实施例的第三方面,提供一种广告信息过滤装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取终端用户上传的待发布信息;
判断所述待发布信息是否属于广告信息;
当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开中,可以检测终端用户上传的待发布信息是否属于广告信息,当待发布信息属于广告信息时,对该待发布信息添加过滤标识,可以获取将所述终端用户标记为需进行广告过滤的目标用户,从而在推送待发布信息时根据过滤标识可以不推送给目标用户,实现了广告信息的自动过滤。
本公开中,待发布信息可以为文本、图像,或者同时包括文本和图像,针对不同形式的待发布信息,可以有不同的广告判断方式,其广告判断的准确率高。
本公开中,可以利用分类算法对样本广告词库进行分类训练获得文本训练模型,从而能够准确地判断文本是否属于广告。
本公开中,可以利用分类算法对样本图像库进行分类训练获得广告图像训练模型,从而能够准确地判断图像是否属于广告。
本公开中,可以获取广告物品图像,利用分类算法对物品图像库进行分类训练获得物品训练模型,从而通过图像中物品的类别与物品训练模型对应的物品类别的匹配,能准确地判断图像是否属于广告。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1A是本公开根据一示例性实施例示出的一种广告信息过滤方法的流程图。
图1B是根据一示例性实施例示出的一种广告信息过滤方法的应用场景示意图。
图1C是根据一示例性实施例示出的另一种广告信息过滤方法的应用场景示意图。
图1D是根据一示例性实施例示出的另一种广告信息过滤方法的应用场景示意图。
图2是本公开根据一示例性实施例示出的一种广告信息过滤装置的框图。
图3是本公开根据一示例性实施例示出的另一种广告信息过滤装置的框图。
图4是本公开根据一示例性实施例示出的另一种广告信息过滤装置的框图。
图5是本公开根据一示例性实施例示出的另一种广告信息过滤装置的框图。
图6是本公开根据一示例性实施例示出的另一种广告信息过滤装置的框图。
图7是本公开根据一示例性实施例示出的一种用于广告信息过滤装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1A所示,图1A是本公开根据一示例性实施例示出的一种广告信息过滤方法的流程图,可应用于服务端,包括以下步骤101至103:
在步骤101中,获取终端用户上传的待发布信息。
其中,服务端可以包括服务器、服务器集群或者云平台。
终端可以包括智能手机、平板电脑、计算机、电子书阅读器等智能终端。终端可以通过安装应用程序获得多种功能,例如,社交应用或即时通讯应用等都可以为用户提供公共发布页功能,终端用户可以将其想要发布的信息通过应用发送给提供该应用服务的服务端,由服务端根据终端用户的好友关系,将该发布的信息推送给好友用户的终端,各个好友即可在公共发布页中查阅到该用户发布的信息。
其中,该待发布信息可以为文本,也可以为图像,或者还可以同时包括文本和图像。终端用户可以编辑该待发布信息并发送至服务端,由服务端将信息推送至终端用户的好友用户,以供好友用户查阅。由于用户可以发布任何其想要发布的信息,在实际应用中,涉及广告的信息常常给其好友用户造成困扰。相关技术中,用户可以将经常发布广告的好友设置屏蔽,则该好友发布的所有信息就被服务端屏蔽,用户无法在公共发布页查阅到该好友发布其他非广告信息。
在步骤102中,判断所述待发布信息是否属于广告信息。
本公开提供的实施例,服务端可以在接收到待发布信息后,对待发布信息进行是否属于广告信息的判断。
在步骤103中,当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
在确定待发布信息属于广告时,可以利用添加过滤标识的方式对待发布信息进行标记,服务端在推送信息时,可以根据该过滤标识,确定待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
例如,终端用户可以有多个具有好友关系的好友用户,服务端可以预先获取被终端用户标记为需进行广告过滤的用户,为与其他用户区别,本实施例称为目标用户。在实际应用中,目标用户可以是所有好友用户中的一个或多个用户,还可以是所有好友用户。
服务端可以预存有每个用户的好友关系,在实际应用中,可以通过数据表的形式存储每个用户的好友关系,数据表中对每个用户可以采用用户标识进行区分,该用户标识可以包括用户的应用账户、用户名称等用于唯一区分用户的标识。
如下表所示,是根据一示例性实施例示出的服务端记录有好友关系的数据表。
本实施例中,在该表中仅示出了用户A1和用户A2的好友关系,且好友关系仅以三个好友为例进行说明。在实际应用中,服务端记录的用户个数,以及每个用户的好友用户个数可以不限于上述说明。
由于在终端用户的好友用户中,筛选出了目标用户,从而在推送待发布信息时,可以不推送给目标用户,实现了广告信息的自动过滤。
例如,从用户A1为信息发布者的角度进行说明,用户A1的好友用户包括用户A2至A5。用户A1向服务端上传了待发布信息,服务端判断出该待发布信息为广告信息。
假设用户A2设置了所有好友用户进行广告过滤,即用户A2对其所有好友用户都标记为需进行广告过滤的用户(其中包括了用户A1);同时,用户A3将用户A1标记为需进行广告过滤的用户,而用户A4和用户A5没有将用户A1标记为需进行广告过滤的用户。
因此,服务端可以只将该待发布信息推送至用户A4和用户A5,而用户A2和A3作为上述目标用户,不会接收到该待发布信息,因此对用户A2和A3来说,实现了广告信息的过滤。
在实际应用中,有可能用户A1被其所有好友都标记为需进行广告过滤的用户,则用户A1发布的广告信息将不会被推送给其任一好友用户。由该实施例可见,服务端可以进行广告信息的自动过滤,从而不会给用户带来广告困扰,同时还不会使用户遗漏其好友用户发布的非广告信息。
如图1B所示,是根据一示例性实施例示出的一种广告信息过滤方法的应用场景示意图。在该图1B中,包括服务端,以及用户A1的终端A1,用户A2的终端A2,以及用户A4的终端A4。在本实施例中,终端均以智能手机为例进行说明,可以理解的是,终端还可以是平板电脑等其他终端。其中,上述3个用户都安装有一社交应用,用户A1与用户A2和用户A4为好友关系,该社交应用中设置有公共发布页,用户可以在公共发布页中查阅到其好友用户发布的信息。服务端可以应用本公开实施例提供的方法,在用户有广告过滤需求时,过滤其某些好友用户发布的广告信息。
在该图1B中,用户A1向服务端上传了待发布信息,该待发布信息中既包括文本,也包括图像,服务端判断出该待发布信息为广告信息。用户A2设置了所有好友用户进行广告过滤,因此服务端不会将该信息推送给用户A2。由于用户A4没有对用户A1设置广告过滤,因此服务端会将该信息推送给用户A4。
同理,从用户A1为信息接收者,用户A2为信息发布者的角度进行说明,用户A1的好友用户包括用户A2至A5,用户A1可以预先设置所有好友进行广告过滤,则所有好友用户A2至A5被标记为需进行广告过滤的用户。当任一好友用户A2至A5发布的信息被服务端判断为广告信息时,服务端将过滤该消息,该消息不会被推送给用户A1,从而实现广告信息的过滤。
或者,用户A1预先标记为需进行广告过滤的用户为用户A2,则用户A2发布的信息被服务端判断为广告信息时,服务端将过滤该消息,该消息不会被推送给用户A1,从而实现对A2发布的广告信息的过滤;而由于用户A3至A5没有被用户A1标记为需进行广告过滤,因此用户A3至A5发布的所有信息都通过服务端推送给用户A1。
由上述实施例可见,本实施例可以检测终端用户上传的待发布信息是否属于广告信息,当待发布信息属于广告信息时,对该待发布信息添加过滤标识,可以获取将所述终端用户标记为需进行广告过滤的目标用户,从而在推送待发布信息时根据过滤标识可以不推送给目标用户,实现了广告信息的自动过滤。
由于待发布信息可能包括多种形式,待发布信息可以为文本、图像,或者同时包括文本和图像等多种形式。针对不同形式的待发布信息,可以有不同的广告判断方式。在实际应用中,可以选择如下几种合适的方式进行处理。
第一种、若所述待发布信息为文本,利用预设的文本训练模型检测所述文本是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息。
若待发布信息中只包括文本,可以利用该文本判断待发布信息是否属于广告。广告信息通常会写有对广告商品的介绍等文本内容,当该文本属于广告时,确定待发布信息属于广告信息,此种方式可以提高广告信息的判断速度,降低广告过滤的处理时长。
例如,图1C是根据一示例性实施例示出的另一种广告信息过滤方法的应用场景示意图。在该图1C中,用户A1向服务端上传了待发布信息,该待发布信息包括一段文本,服务端可以根据待发布信息中的文本进行是否为广告的判断。当服务端根据确定该文本属于广告时,可以确定该待发布信息为广告信息,因此可以只将该待发布信息推送给没有将用户A1设置广告过滤的好友用户,而将用户A1设置广告过滤的好友用户则不会被推送该信息。
在一个可选的实现方式中,所述利用预设的文本训练模型检测所述文本是否属于广告,可以包括:
利用预设的分类算法对预设的样本广告词库进行分类训练,获得用于区分文本是否为广告的文本训练模型。其中,所述样本广告词库包括广告样本词语和非广告样本词语。
当利用所述文本训练模型检测所述文本属于广告的概率高于预设阈值时,确定所述文本属于广告。
在实际应用中,文本训练模型可以预先通过采集样本库,并利用分类算法对样本库进行分类训练后获取得到。例如,可以通过数据挖掘等技术,采集大量的广告文本词语和非广告样本词语作为样本广告词库。用特征选择算法选择合适的特征属性,计算用于表示训练样本的特征属性的特征向量,接着根据每个训练样本及其特征向量,采用分类算法进行分类训练,获得的分类器即为文本训练模型。最后还可以利用样本广告词库包括广告样本词语和非广告样本词语对文本训练模型进行测试,以进一步提高文本训练模型的准确性。由于采用样本广告词库包括广告样本词语,因此训练后得到的每个文本训练模型,记录有相应的广告文本的特征和非广告文本的特征,当将待发布信息输入至文本训练模型时,可以根据待发布信息的特征与文本训练模型的特征的相似性,判断出待发布信息是否属于广告。
其中,分类算法可以包括贝叶斯算法、支持向量机、人工神经网络或决策树等,在进行分类训练时,可以根据所选取的不同分类算法进行相应的分类训练。例如,对于贝叶斯算法,该类算法的主要思想是利用概率统计知识进行分类的算法,训练阶段的任务是生成分类器,主要工作是计算各个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计,并记录结果。在此分类训练阶段,可以由根据贝叶斯定理自动计算,其输入是特征属性和训练样本,输出的则是分类器。
通过分类算法对样本广告词库进行分类训练,可以获得用于区分文本是否为广告的文本训练模型,当将文本输入至文本训练模型时,可以检测出文本属于广告的概率。当文本属于广告的概率高于预设阈值时,确定所述文本属于广告。该预设阈值,在实际应用中可以根据需要而灵活设定。通过上述方式,能够准确地判断文本是否属于广告。
其他的如支持向量机或决策树等分类算法的分类训练过程,可以参考上述贝叶斯算法的相关描述,本实施例对此不再赘述。
第二种、若所述待发布信息为图像,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息。
本公开实施例中,若待发布信息中只包括图像,可以利用该图像判断待发布信息是否属于广告。广告信息通常携带有广告商品的图像内容,当该图像属于广告时,确定待发布信息属于广告信息,此种方式判断速度快,且广告信息的判断准确性较高。
例如,图1D是根据一示例性实施例示出的一种广告信息过滤方法的应用场景示意图。在该图1D中,用户A1向服务端上传了待发布信息,该待发布信息包括有两张图像,服务端可以根据图像进行是否属于广告的判断。当服务端根据确定该图像属于广告时,可以确定该待发布信息为广告信息,因此可以只将该待发布信息推送给没有将用户A1设置广告过滤的好友用户,而将用户A1设置广告过滤的好友用户则不会被推送该信息。
本公开提供的实施例,可以利用预设图像训练模型对该图像进行检测,通过图像训练模型判断图像是否属于广告信息。
在一个可选的实现方式中,所述利用预设的图像训练模型检测所述图像是否属于广告,可以包括:
利用预设的分类算法对预设的样本图像库进行分类训练,获得用于区分所述图像是否为广告的广告图像训练模型;其中,所述样本图像库包括广告样本图像和非广告样本图像。
当利用所述广告训练模型检测所述图像是否属于广告的概率高于预设阈值时,确定所述图像属于广告。
本公开提供的实施例,可以通过分类算法对样本图像库进行分类训练,可以获得用于区分图像是否为广告的广告图像训练模型,当将图像输入至广告图像训练模型时,可以检测出图像属于广告的概率。当图像属于广告的概率高于预设阈值时,确定所述图像属于广告。该预设阈值,在实际应用中可以根据需要而灵活设定。通过上述方式,能够准确地判断图像是否属于广告。
在另一个可选的实现方式中,所述利用预设的图像训练模型检测所述图像是否属于广告,还可以包括:
获取终端发送的广告物品图像。
识别所述广告物品图像中物品的物品类别,将所述广告物品图像及物品类别记录在物品图像库中。
利用预设的分类算法对所述物品图像库进行分类训练,获得用于区分物品类别的物品训练模型。
当利用所述物品训练模型检测所述图像中物品的类别与所述物品训练模型对应的物品类别相同时,确定所述图像属于广告。
在实际应用中,广告信息通常为物品广告,当用户在发布广告信息时,通常会发布该物品的图像。用户可以在已发布信息发现其是广告信息时进行标记,服务端获取各个终端发送的广告物品图像。利用被用户标记为广告的已发布信息进行训练,可以使后续的图像检测更为准确。同时,若某个用户发布广告信息时,其广告的物品通常是同一类物品。因此本实施例可以通过识别物品图像中物品的物品类别,将所述广告物品图像及物品类别记录在物品图像库,获得物品图像库。
通过分类算法对物品图像库进行分类训练,可以获得用于区分物品类别的物品训练模型,当将图像输入至物品训练模型时,可以检测出图像中物品的类别是否与所述物品训练模型对应的物品类别相同。当两者匹配时,能准确确定所述图像属于广告。由于采用终端用户上传的广告物品图像作为物品图像库进行分类训练,获得的物品训练模型能更准确地识别待发布信息中图像的物品类别,也更易于判断图像是否属于广告。
上述判断图像是否属于广告的两种方式,在实际应用中,可以择一执行,也可以选取两种方式同时对图像进行是否属于广告的判断,当上述两种方式都检测出待发布信息中的图像属于广告时,再确定图像属于广告,可以进一步提高广告信息的判断准确性,从而提高广告信息的过滤效果。
第三种、若所述待发布信息包括文本和图像,利用预设的文本训练模型检测所述文本是否属于广告,利用预设的图像训练模型检测所述图像是否属于广告。对于包括有文本和图像的待发布信息,可以是文本和图像都属于广告时,确定所述待发布信息属于广告信息,此种方式的对广告信息的判定准确率高,可靠性较大。或者,也可以是当所述文本或图像其中一个属于广告时,确定所述待发布信息属于广告信息,此种方式则判定速度较快。
例如,图1B中用户A1向服务端上传了待发布信息,该待发布信息包括有一段文本和一张图像,服务端可以根据文本及图像进行是否属于广告的判断。当服务端可以是在判定文本和图像都属于广告时,确定所述待发布信息属于广告信息;也可以是在判定所述文本或图像其中一个属于广告时,确定所述待发布信息属于广告信息。
与前述广告信息过滤方法的实施例相对应,本公开还提供了广告信息过滤装置及其所应用的终端的实施例。
本公开根据一示例性实施例示出一种广告信息过滤装置,如图2所示,所述装置包括:信息获取模块21、广告判断模块22和过滤模块23。
信息获取模块21,被配置为获取终端用户上传的待发布信息。
广告判断模块22,被配置为判断所述信息获取模块21获取的待发布信息是否属于广告信息。
过滤模块23,被配置为当所述广告判断模块22确定所述信息获取模块21中的待发布信息属于广告信息时,对所述信息获取模块21中的待发布信息添加过滤标识,所述过滤标识指示所述信息获取模块21中的待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
由上述实施例可见,可以检测终端用户上传的待发布信息是否属于广告信息,当待发布信息属于广告信息时,对该待发布信息添加过滤标识,可以获取将所述终端用户标记为需进行广告过滤的目标用户,从而在推送待发布信息时根据过滤标识可以不推送给目标用户,实现了广告信息的自动过滤。
本公开根据一示例性实施例示出另一种广告信息过滤装置的框图,如图3所示,该实施例在前述图2所示实施例的基础上,所述广告判断模块22,包括:确定子模块221。
确定子模块221,被配置为:
若所述信息获取模块21中的待发布信息为文本,利用预设的文本训练模型检测所述文本是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;若所述信息获取模块21中的待发布信息为图像,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;若所述信息获取模块21中的待发布信息包括文本和图像,利用预设的文本训练模型检测所述文本是否属于广告,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本和图像都属于广告,确定所述待发布信息属于广告信息;或者是当所述文本或图像其中一个属于广告时,确定所述待发布信息属于广告信息。
由上述实施例可见,待发布信息可以为文本、图像,或者同时包括文本和图像,针对不同形式的待发布信息,可以有不同的广告判断方式,其广告判断的准确率高。
本公开根据一示例性实施例示出另一种广告信息过滤装置的框图,如图4所示,该实施例在前述图3所示实施例的基础上,所述确定子模块221,包括:文本训练子模块2211和文本确定子模块2212。
文本训练子模块2211,被配置为利用预设的分类算法对预设的样本广告词库进行分类训练,获得用于区分文本是否为广告的文本训练模型;其中,所述样本广告词库包括广告样本词语和非广告样本词语。
文本确定子模块2212,被配置为当利用所述文本训练子模块2211中的文本训练模型检测所述文本属于广告的概率高于预设阈值时,确定所述文本属于广告。
由上述实施例可见,可以利用分类算法对样本广告词库进行分类训练获得文本训练模型,从而能够准确地判断文本是否属于广告。
本公开根据一示例性实施例示出另一种广告信息过滤装置的框图,如图5所示,该实施例在前述图3所示实施例的基础上,所述确定子模块221,包括:第一图像训练子模块2213和第一图像确定子模块2214。
第一图像训练子模块2213,被配置为利用预设的分类算法对预设的样本图像库进行分类训练,获得用于区分所述图像是否为广告的广告训练模型;其中,所述样本图像库包括广告样本图像和非广告样本图像。
第一图像确定子模块2214,被配置为当利用所述第一图像训练子模块2213中的广告训练模型检测所述图像是否属于广告的概率高于预设阈值时,确定所述图像属于广告。
由上述实施例可见,可以利用分类算法对样本图像库进行分类训练获得广告图像训练模型,从而能够准确地判断图像是否属于广告。
本公开根据一示例性实施例示出另一种广告信息过滤装置的框图,如图6所示,该实施例在前述图3所示实施例的基础上,所述确定子模块221,包括:物品图像获取子模块2215、物品类别识别子模块2216、第二图像训练子模块2217和第二图像确定子模块2218。
物品图像获取子模块2215,被配置为获取终端发送的广告物品图像。
物品类别识别子模块2216,被配置为识别所述物品图像获取子模块2215中广告物品图像中物品的物品类别,将所述广告物品图像及物品类别记录在物品图像库中。
第二图像训练子模块2217,被配置为利用预设的分类算法对所述物品类别识别子模块2216中的物品图像库进行分类训练,获得用于区分物品类别的物品训练模型。
第二图像确定子模块2218,被配置为当利用所述第二图像训练子模块2217中的物品训练模型检测所述图像中物品的类别与所述物品训练模型对应的物品类别相同时,确定所述图像属于广告。
由上述实施例可见,可以获取广告物品图像,利用分类算法对物品图像库进行分类训练获得物品训练模型,从而通过图像中物品的类别与物品训练模型对应的物品类别的匹配,能准确地判断图像是否属于广告。
相应的,本公开还提供一种广告信息过滤装置,所述装置包括有处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
获取终端用户上传的待发布信息。
判断所述待发布信息是否属于广告信息。
当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
图7是根据一示例性实施例示出的一种用于广告信息过滤装置700的框图。例如,装置700可以被提供为一服务器。参照图7,装置700包括处理组件722,其进一步包括一个或多个处理器,以及由存储器732所代表的存储器资源,用于存储可由处理部件722的执行的指令,例如应用程序。存储器732中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件722被配置为执行指令,以执行上述智能设备的控制方法。
装置700还可以包括一个电源组件726被配置为执行装置700的电源管理,一个有线或无线网络接口750被配置为将装置700连接到网络,和一个输入输出(I/O)接口758。装置700可以操作基于存储在存储器732的操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。

Claims (11)

1.一种广告信息过滤方法,其特征在于,所述方法包括:
获取终端用户上传的待发布信息;
判断所述待发布信息是否属于广告信息;
当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
2.根据权利要求1所述的方法,其特征在于,所述判断所述待发布信息是否属于广告信息,包括:
若所述待发布信息为文本,利用预设的文本训练模型检测所述文本是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息为图像,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息包括文本和图像,利用预设的文本训练模型检测所述文本是否属于广告,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本和图像都属于广告,确定所述待发布信息属于广告信息;或者是当所述文本或图像其中一个属于广告时,确定所述待发布信息属于广告信息。
3.根据权利要求2所述的方法,其特征在于,所述利用预设的文本训练模型检测所述文本是否属于广告,包括:
利用预设的分类算法对预设的样本广告词库进行分类训练,获得用于区分文本是否为广告的文本训练模型;其中,所述样本广告词库包括广告样本词语和非广告样本词语;
当利用所述文本训练模型检测所述文本属于广告的概率高于预设阈值时,确定所述文本属于广告。
4.根据权利要求2所述的方法,其特征在于,所述利用预设的图像训练模型检测所述图像是否属于广告,包括:
利用预设的分类算法对预设的样本图像库进行分类训练,获得用于区分所述图像是否为广告的广告图像训练模型;其中,所述样本图像库包括广告样本图像和非广告样本图像;
当利用所述广告训练模型检测所述图像是否属于广告的概率高于预设阈值时,确定所述图像属于广告。
5.根据权利要求2所述的方法,其特征在于,所述利用预设的图像训练模型检测所述图像是否属于广告,包括:
获取终端发送的广告物品图像;
识别所述广告物品图像中物品的物品类别,将所述广告物品图像及物品类别记录在物品图像库中;
利用预设的分类算法对所述物品图像库进行分类训练,获得用于区分物品类别的物品训练模型;
当利用所述物品训练模型检测所述图像中物品的类别与所述物品训练模型对应的物品类别相同时,确定所述图像属于广告。
6.一种广告信息过滤装置,其特征在于,所述装置包括:
信息获取模块,被配置为获取终端用户上传的待发布信息;
广告判断模块,被配置为判断所述待发布信息是否属于广告信息;
过滤模块,被配置为当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
7.根据权利要求6所述的装置,其特征在于,所述广告判断模块,包括:
确定子模块,被配置为:若所述待发布信息为文本,利用预设的文本训练模型检测所述文本是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息为图像,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本属于广告时,确定所述待发布信息属于广告信息;
若所述待发布信息包括文本和图像,利用预设的文本训练模型检测所述文本是否属于广告,利用预设的图像训练模型检测所述图像是否属于广告,当所述文本和图像都属于广告,确定所述待发布信息属于广告信息;或者是当所述文本或图像其中一个属于广告时,确定所述待发布信息属于广告信息。
8.根据权利要求7所述的装置,其特征在于,所述确定子模块,包括:
文本训练子模块,被配置为利用预设的分类算法对预设的样本广告词库进行分类训练,获得用于区分文本是否为广告的文本训练模型;其中,所述样本广告词库包括广告样本词语和非广告样本词语;
文本确定子模块,被配置为当利用所述文本训练模型检测所述文本属于广告的概率高于预设阈值时,确定所述文本属于广告。
9.根据权利要求7所述的装置,其特征在于,所述确定子模块,包括:
第一图像训练子模块,被配置为利用预设的分类算法对预设的样本图像库进行分类训练,获得用于区分所述图像是否为广告的广告训练模型;其中,所述样本图像库包括广告样本图像和非广告样本图像;
第一图像确定子模块,被配置为当利用所述广告训练模型检测所述图像是否属于广告的概率高于预设阈值时,确定所述图像属于广告。
10.根据权利要求7所述的装置,其特征在于,所述确定子模块,包括:
物品图像获取子模块,被配置为获取终端发送的广告物品图像;
物品类别识别子模块,被配置为识别所述广告物品图像中物品的物品类别,将所述广告物品图像及物品类别记录在物品图像库中;
第二图像训练子模块,被配置为利用预设的分类算法对所述物品图像库进行分类训练,获得用于区分物品类别的物品训练模型;
第二图像确定子模块,被配置为当利用所述物品训练模型检测所述图像中物品的类别与所述物品训练模型对应的物品类别相同时,确定所述图像属于广告。
11.一种广告信息过滤装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取终端用户上传的待发布信息;
判断所述待发布信息是否属于广告信息;
当确定所述待发布信息属于广告信息时,对所述待发布信息添加过滤标识,所述过滤标识指示所述待发布信息不推送给将所述终端用户标记为需进行广告过滤的用户。
CN201610201399.9A 2016-03-31 2016-03-31 广告信息过滤方法及装置 Active CN105787133B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610201399.9A CN105787133B (zh) 2016-03-31 2016-03-31 广告信息过滤方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610201399.9A CN105787133B (zh) 2016-03-31 2016-03-31 广告信息过滤方法及装置

Publications (2)

Publication Number Publication Date
CN105787133A true CN105787133A (zh) 2016-07-20
CN105787133B CN105787133B (zh) 2020-06-02

Family

ID=56395562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610201399.9A Active CN105787133B (zh) 2016-03-31 2016-03-31 广告信息过滤方法及装置

Country Status (1)

Country Link
CN (1) CN105787133B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504101A (zh) * 2016-10-11 2017-03-15 北京小米移动软件有限公司 社交应用的发布信息的显示控制方法及装置
CN107729489A (zh) * 2017-10-17 2018-02-23 北京京东尚科信息技术有限公司 广告文本识别方法和装置
CN108632639A (zh) * 2017-03-23 2018-10-09 北京小唱科技有限公司 一种视频类型判断方法及服务器
CN108804413A (zh) * 2018-04-28 2018-11-13 百度在线网络技术(北京)有限公司 文本作弊的识别方法及装置
CN109617999A (zh) * 2019-01-08 2019-04-12 平安科技(深圳)有限公司 内容推送方法、装置、计算机设备及存储介质
CN112633906A (zh) * 2019-09-24 2021-04-09 北京沃东天骏信息技术有限公司 广告物料同步方法、装置、设备及介质
CN112732895A (zh) * 2018-03-26 2021-04-30 广州虎牙信息科技有限公司 审核文本的方法、装置、电子设备和存储介质
CN113487368A (zh) * 2021-07-29 2021-10-08 宿迁市盛邦信息科技有限公司 一种基于大数据的科技信息推送服务系统
CN114501163A (zh) * 2020-11-12 2022-05-13 北京达佳互联信息技术有限公司 视频处理方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094879A1 (en) * 2007-03-30 2010-04-15 Stuart Donnelly Method of detecting and responding to changes in the online community's interests in real time
CN103561327A (zh) * 2013-10-11 2014-02-05 深圳创维数字技术股份有限公司 一种广告过滤的方法、媒体服务器、视频接收终端及系统
CN103605693A (zh) * 2013-11-04 2014-02-26 北京奇虎科技有限公司 用于识别网络游戏中发布消息的广告特征的装置和方法
CN104951542A (zh) * 2015-06-19 2015-09-30 百度在线网络技术(北京)有限公司 识别社交短文本类别的方法、分类模型训练方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094879A1 (en) * 2007-03-30 2010-04-15 Stuart Donnelly Method of detecting and responding to changes in the online community's interests in real time
CN103561327A (zh) * 2013-10-11 2014-02-05 深圳创维数字技术股份有限公司 一种广告过滤的方法、媒体服务器、视频接收终端及系统
CN103605693A (zh) * 2013-11-04 2014-02-26 北京奇虎科技有限公司 用于识别网络游戏中发布消息的广告特征的装置和方法
CN104951542A (zh) * 2015-06-19 2015-09-30 百度在线网络技术(北京)有限公司 识别社交短文本类别的方法、分类模型训练方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504101A (zh) * 2016-10-11 2017-03-15 北京小米移动软件有限公司 社交应用的发布信息的显示控制方法及装置
CN108632639A (zh) * 2017-03-23 2018-10-09 北京小唱科技有限公司 一种视频类型判断方法及服务器
CN107729489A (zh) * 2017-10-17 2018-02-23 北京京东尚科信息技术有限公司 广告文本识别方法和装置
CN112732895A (zh) * 2018-03-26 2021-04-30 广州虎牙信息科技有限公司 审核文本的方法、装置、电子设备和存储介质
CN112732895B (zh) * 2018-03-26 2024-01-19 广州虎牙信息科技有限公司 审核文本的方法、装置、电子设备和存储介质
CN108804413A (zh) * 2018-04-28 2018-11-13 百度在线网络技术(北京)有限公司 文本作弊的识别方法及装置
CN109617999A (zh) * 2019-01-08 2019-04-12 平安科技(深圳)有限公司 内容推送方法、装置、计算机设备及存储介质
CN112633906A (zh) * 2019-09-24 2021-04-09 北京沃东天骏信息技术有限公司 广告物料同步方法、装置、设备及介质
CN114501163A (zh) * 2020-11-12 2022-05-13 北京达佳互联信息技术有限公司 视频处理方法、装置及存储介质
CN114501163B (zh) * 2020-11-12 2024-01-23 北京达佳互联信息技术有限公司 视频处理方法、装置及存储介质
CN113487368A (zh) * 2021-07-29 2021-10-08 宿迁市盛邦信息科技有限公司 一种基于大数据的科技信息推送服务系统

Also Published As

Publication number Publication date
CN105787133B (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
CN105787133A (zh) 广告信息过滤方法及装置
CN105528392B (zh) 一种类别标签排序方法和装置
KR102010221B1 (ko) 스마트폰 기반 방법들 및 시스템들
CN104885071A (zh) 多设备智能语言模型同步
CN107247722B (zh) 一种文件扫描方法、装置及智能终端
US20170104835A1 (en) Intelligent notifications to devices with multiple applications
US20130346439A1 (en) Pushing Business Objects
CN110392155B (zh) 通知消息的显示、处理方法、装置及设备
US20140214832A1 (en) Information gathering via crowd-sensing
CN107291745B (zh) 一种数据指标的管理方法及装置
CN109583228B (zh) 一种隐私信息管理方法、装置和系统
US20140201279A1 (en) System and method for contact merge management
CN106202392A (zh) 一种照片分类方法及终端
CN105183295A (zh) 一种应用图标的归类方法及终端
CN105550346A (zh) 信息管理方法及设备
CN109934194A (zh) 图片分类方法、边缘设备、系统及存储介质
CN104408193B (zh) 数据可视化模型的处理方法及装置
CN106971004B (zh) 搜索结果提供方法及装置
CN111160410A (zh) 一种物体检测方法和装置
US11630688B2 (en) Method and apparatus for managing content across applications
CN103685254A (zh) 公共账号信息的安全检测方法与服务器
CN103617262A (zh) 图片内容属性识别方法和系统
CN107423304A (zh) 检索词分类方法及装置
CN104065559A (zh) 邮件标记方法及装置
US10432572B2 (en) Content posting method and apparatus

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant