CN111460267A - 对象识别方法、装置和系统 - Google Patents

对象识别方法、装置和系统 Download PDF

Info

Publication number
CN111460267A
CN111460267A CN202010248865.5A CN202010248865A CN111460267A CN 111460267 A CN111460267 A CN 111460267A CN 202010248865 A CN202010248865 A CN 202010248865A CN 111460267 A CN111460267 A CN 111460267A
Authority
CN
China
Prior art keywords
dimension
content
result
recognition
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010248865.5A
Other languages
English (en)
Other versions
CN111460267B (zh
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010248865.5A priority Critical patent/CN111460267B/zh
Publication of CN111460267A publication Critical patent/CN111460267A/zh
Application granted granted Critical
Publication of CN111460267B publication Critical patent/CN111460267B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种对象识别方法、装置和系统,所述方法包括:获取待识别素材;获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;针对每个维度,基于该维度的维度特征进行对象识别;以及基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果。基于本发明提供的对象识别方法,可以很大程度地提升广告营销内容识别的速度、效率和准确性。

Description

对象识别方法、装置和系统
技术领域
本发明涉及计算机技术领域,更具体地,涉及一种对象识别方法、装置和系统。
背景技术
在互联网快速发展的时代,随着内容生产的门槛降低、产量持续攀升,各种内容生产和分发平台获得了极大的快速发展,内容生态体系持续繁荣。大量用户的注意力被吸引到信息流和资讯内容的消费当中,用户消费的时长在持续增加。由于内容流量吸引人,很多软文推广内容和引流广告内容也在持续增加,比如文本信息中包含宣传、推广目的的第三方引流内容、广告营销图片引流内容等等。然而,这些软文推广或引流广告内容一方面会造成用户的审美疲劳和抵触,另一方面也会严重影响内容的阅读体验,从而影响用户阅读时长的进一步提升。对此,目前主要的应对方案是通过机器学习辅助以人工审核的方式,收集每个具体广告的样本,仅基于正文部分等较为单一的维度做广告的分类检测和过滤,需要大量的人工审核投入。然而,广告的变种及形式繁多,这种收集样本再来训练的方法响应速度很慢;此外,广告营销内容逐渐被包装成越来越像软文,广告营销内容和非广告内容的边界难以确定,很大程度上影响广告营销内容识别的效果和效率。
针对上述问题,需要一种内容识别方法,通过将内容审核过程当中人工审核标记的广告营销内容和用户负反馈举报的广告营销内容等作为样本,采用多维度的机器学习方法,结合内容的载体本身,分别针对内容正文、标题、发布者昵称、正文句子语义、图片内容以及发布者的账号质量等维度单独建模和识别,最后通过模型融合构建综合的检测识别模型来做综合广告营销的概率判断,输出广告营销内容的结果概率,从而很大程度地提升广告营销内容识别的速度、效率和准确性。
发明内容
本发明的实施例提供了一种对象识别方法,所述方法包括:获取待识别素材;获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;针对每个维度,基于该维度的维度特征进行对象识别;以及基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果。
根据本发明的实施例,其中,所述至少两个维度还包括以下维度中的至少一个:正文内容维度、正文句子维度、图片维度、标题维度、或昵称维度。
根据本发明的实施例,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:针对素材发布者维度,获取所述待识别素材的素材发布者的历史识别结果信息;获取所述素材发布者的历史影响程度信息;基于所述历史识别结果信息和所述历史影响程度信息来获取所述素材发布者的融合服务质量特征;以及基于所述融合服务质量特征来获取该维度的对象识别结果。
根据本发明的实施例,其中,基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果包括以下中的任何一项:在所述至少两个维度中一个维度的对象识别结果超出与该维度相对应的第一阈值范围的情况下,将该维度的对象识别结果作为所述联合识别结果;将所述至少两个维度的对象识别结果的加权和作为所述联合识别结果;或将所述至少两个维度的对象识别结果的多数命中结果作为所述联合识别结果。
根据本发明的实施例,其中,所述对象识别包括识别拦截对象,所述方法还包括:在所述联合识别结果高于第二阈值的情况下,确定识别到拦截对象;在所述联合识别结果低于第三阈值的情况下,确定未识别到拦截对象;以及在所述联合识别结果低于所述第二阈值且高于所述第三阈值的情况下,生成再次识别请求。
根据本发明的实施例,其中,所述方法还包括:基于所述再次识别请求,接收再次识别结果;基于所述再次识别结果,对实施所述对象识别的对象识别模型进行训练。
根据本发明的实施例,其中,所述方法还包括:接收包含拦截对象的样本;基于所接收的样本,对实施所述对象识别的对象识别模型进行训练。
根据本发明的实施例,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:针对正文内容维度,确定所述待识别素材的正文内容是否包含一个或多个预先定义的规则内容;以及基于所述确定结果来获取该维度的对象识别结果。
根据本发明的实施例,其中,所述方法包括:对所述待识别素材的正文内容进行文本分类;以及基于所述文本分类结果来获取该维度的对象识别结果。
根据本发明的实施例,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:针对正文句子维度,针对每个正文句子进行语义识别;以及基于所述语义识别结果来获取该维度的对象识别结果。
根据本发明的实施例,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:针对图片维度,将所述待识别素材的图片内容转换为文本内容;对所述文本内容进行文本分类;以及基于所述文本分类结果来获取该维度的对象识别结果。
根据本发明的实施例,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:针对标题维度和/或昵称维度,对所述待识别素材的标题和/或发布者昵称进行文本分类;以及基于所述文本分类结果来获取该维度的对象识别结果。
根据本发明的实施例,其中,所述至少两个维度还包括以下维度中的至少一个:正文内容维度、正文句子维度、图片维度、标题维度、或昵称维度。
本发明的实施例提供了一种广告内容识别方法,所述方法包括:获取待识别素材;获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;针对每个维度,基于该维度的维度特征进行广告内容识别;以及基于针对每个维度的广告内容识别结果,获取所述待识别素材的联合识别结果。
本发明的实施例提供了一种对象识别装置,所述装置包括:素材获取模块,用于获取待识别素材;维度提取模块,用于获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;基于维度的子识别模块,用于针对每个维度,基于该维度的维度特征进行对象识别;以及联合识别模块,用于基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果。
本发明的实施例提供了一种对象识别系统,所述系统包括:处理器;和存储器,其上存储有计算机可执行指令,所述指令在被处理器执行时用于实现如上所述的任一方法。
本发明的实施例提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述指令在被处理器执行时用于实现如上所述的任一方法。
本发明的实施例提供了一种对象识别方法、装置和系统,通过将内容审核过程当中人工审核标记的广告营销内容和用户负反馈举报的广告营销内容等作为样本,采用多维度的机器学习方法,结合内容的载体本身,分别针对内容正文、标题、发布者昵称、正文句子语义、图片内容以及发布者的账号质量等维度单独建模和识别,最后通过模型融合构建综合的检测识别模型来做综合广告营销的概率判断,输出广告营销内容的结果概率,从而很大程度地提升广告营销内容识别的速度、效率和准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些示例性实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了根据本发明实施例的对象识别系统的应用场景的示意图。
图2示出了根据本发明实施例的对象识别方法的流程图。
图3示出了根据本发明实施例的FastTest模型的示意性架构图。
图4示出了根据本发明实施例的TextCNN模型的网络结构示意图。
图5示出了根据本发明实施例的基于素材发布者维度进行对象识别的方法500的流程图。
图6示出了根据本发明实施例的广告营销内容识别方法的流程图。
图7A示出了根据本发明实施例的社交网络平台上素材的分发处理过程。
图7B进一步示出了根据本发明实施例的社交网络平台上对广告营销内容识别进行调度的过程。
图7C进一步示出了根据本发明实施例的社交网络平台上的广告营销识别模型。
图7D进一步示出了根据本发明实施例的社交网络平台上的广告营销识别模型的训练样本获取过程。
图7E示出了结合图7A至图7D描述的示意性社交网络平台的整体架构。
图8示出了根据本发明实施例的基于多维度划分进行广告营销内容识别的结构示意图。
图9示出了根据本发明实施例的对象识别装置的示意图。
图10示出了根据本发明实施例的对象识别系统的示意图。
在整个附图和详细描述中,除非另有说明,否则相同的附图标记将被理解为指代相同的元素、特征和结构。
具体实施方式
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。
在本说明书和附图中,具有基本上相同或相似步骤和元素用相同或相似的附图标记来表示,且对这些步骤和元素的重复描述将被省略。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性或排序。
在本说明书和附图中,根据实施例,元素以单数或复数的形式来描述。然而,单数和复数形式被适当地选择用于所提出的情况仅仅是为了方便解释而无意将本发明限制于此。因此,单数形式包括复数形式,并且复数形式也包括单数形式,除非上下文另有明确说明。
本发明的实施例涉及机器学习、内容生产及社交网络等多种技术,为便于理解,以下首先介绍与本发明有关的一些概念。
图文:推荐给用户阅读的文章,可能包含有视频或图片等其它形式的内容,文章通常可以是自媒体开通一个公众号后主动编辑发布的。
终端:智能手机、平板计算机、智能车载设备、可穿戴设备等可以接受消息或图文的任何设备,其可以包含有IOS、Android等各种智能操作系统。
终端程序:运行在终端上的各种可接受消息及Feeds流信息的应用。
服务端:部署在多组服务器上、专门为终端程序提供远程网络服务的服务器程序。
用户:使用终端的人。
MCN(Multi-Channel Network,多频道网络):是一种多频道网络的产品形态,将PGC内容联合起来,在资本的有力支持下,保障内容的持续输出,从而最终实现商业的稳定变现。
PGC(Professional Generated Content):互联网术语,可以指专业生产内容(例如,各种视频网站等)或专家生产内容(例如,微博等)。其可以用来泛指内容个性化、视角多元化、传播民主化、社会关系虚拟化。也称为PPC(Professionally-produced Content)。
UGC(User Generated Content):用户原创内容,是伴随着以提倡个性化为主要特点的Web 2.0概念而兴起的。它并不是某一种具体的业务,而是一种用户使用互联网的新方式,即由原来的以下载为主变成下载和上传并重。
PUGC(Professional User Generated Content):专业用户原创内容,是以UGC形式,产出的相对接近PGC的专业图文或视频等内容。
Feeds:指消息来源、源料、馈送、资讯提供、供稿、摘要、源、新闻订阅、或网源(又译为web feed、news feed、syndicated feed等)等,是一种资料格式,网站透过它将最新资讯传播给用户,通常以时间轴(timeline)方式排列,时间轴是Feeds最原始最直观也最基本的展示形式。用户能够订阅网站的先决条件是网站提供了消息来源。将Feeds汇流于一处称为聚合(aggregation),而用于聚合的软体称为聚合器(aggregator)。对终端用户而言,聚合器是专门用来订阅网站的软件,一般也称为RSS阅读器、feed阅读器、新闻阅读器等。
机器学习:(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
深度学习:深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
自然语言处理(Natural Language Processing,NLP):是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
注意力(Attention)机制:是模仿人类注意力而提出的一种解决问题的办法,简单地说就是从大量信息中快速筛选出高价值信息。主要用于解决LSTM/RNN模型输入序列较长的时候很难获得最终合理的向量表示的问题,其主要方法是保留LSTM的中间结果,用新的模型对其进行学习,并将其与输出进行关联,从而达到信息筛选的目的。
社交网络,也就是网络+社交的意思。通过网络这一载体把人们连接起来,从而形成具有某一特点的团体。社交网络源自于网络社交,而网络社交的起点是电子邮件(E-mail)。互联网本质上就是计算机之间的联网,早期的电子邮件解决了远程的邮件传输问题,至今它也是互联网上最普及的应用之一。电子公告板(Bulletin Board System,BBS)则更进一步,把“群发”和“转发”常态化,理论上实现了向所有人发布信息并讨论话题的功能(其疆界是BBS的访问者数量),成为了早期的互联网内容自发产生平台之一。
BBS把网络社交的发展推进了一步,从单纯的点对点交流的成本降低,推进到了点对面交流的成本降低。即时通信(Instant Messaging,IM)和博客(Blog)更像是上述两种社交工具的升级版本,前者提高了即时效果(例如,传输速度)和交流能力(例如,并行处理);后者则开始体现社会学和心理学的理论——信息发布节点开始体现越来越强的个体意识,因为在时间维度上的分散信息开始可以被聚合,进而形成信息发布节点的“形象”和“性格”。随着网络社交的悄悄演进,一个人在网络上的形象更加趋于完整,这时候社交网络应运而生。
社交网络涵盖以人类社交为核心的所有网络服务形式,社交网络使得互联网从研究部门、学校、政府、商业等应用平台扩展成为一个人类社交的工具。进一步地,网络社交更是把其范围拓展到移动终端领域,借助移动终端(例如,智能手机等)的普遍性和无线网络的应用,利用各种交友/即时通信/邮件收发器等软件,使移动终端成为新的社交网络的载体。
在自媒体时代,各种不同的声音来自四面八方,“主流媒体”的声音逐渐变弱,人们不再接受被一个“统一的声音”告知对或错,每一个人都在从独立获得的资讯中,对事物做出判断。自媒体有别于由专业媒体机构主导的信息传播,它是由普通大众主导的信息传播活动,由传统的“点到面”的传播,转化为“点到点”的一种对等的传播。同时,它也是为个体提供信息生产、积累、共享、传播内容兼具私密性和公开性的信息传播方式。
一般地,自媒体的内容构成(例如,UGC等)也很特别,没有既定的核心,作者想到什么就写什么,只要觉得有价值的东西就分享出来,有时还会分享一些出格的观点,而且不需要考虑太多看官的感受,所以看一些优秀的自媒体文章就像看野史一样十分独特有趣,他们给看官们留下的印象即是该自媒体的个性。此外,自媒体文章在字数方面控制得很好,让看官可以在合适的时间(例如,10分钟)内流畅阅读完,非常适合在移动时代的快速阅读和消费。
自媒体的内容通常以Feeds流形式展示出来供用户快速刷新。以Facebook为例,Facebook首页的News Feed可以看作是一个新型聚合器,订阅源可以是用户的好友或关注的公众人物等,内容则是他们公开发布的动态(例如,心情状态更新、新文章发布等)。当用户的好友数量或关注人物较多且活跃时,就可以收到不断更新的内容,这就是最常见的Feeds流形式。时间是Feeds所遵循的终极维度,因为内容的更新是不断向服务器发出请求的结果。时间轴是Feeds最原始最直观也最基本的展示形式,如果说有更好的,那通常也是在时间轴的基础上做进一步设计。在各种社交网络平台上,各种不同的自媒体号主创作各自的内容(例如,文章、图片、音频或视频等)。用户可以订阅这些内容,然后当内容有更新的时候,可以通过B2C下行的方式将对应的内容推送给用户并展现在Feeds流当中,或者也可以通过用户主动刷新Feeds来获取最新的内容。
在互联网快速发展的时代,随着内容生产的门槛降低、产量持续攀升,各种内容生产和分发平台获得了极大的快速发展,内容生态体系持续繁荣。大量用户的注意力被吸引到信息流和资讯内容的消费当中,用户消费的时长在持续增加。由于内容流量(例如,自媒体)吸引人,很多软文推广内容和引流广告内容也在持续增加,比如文本信息中包含宣传、推广目的的第三方引流内容、广告营销图片引流内容等等。然而,这些软文推广或引流广告内容一方面会造成用户的审美疲劳和抵触,另一方面也会严重影响内容的阅读体验,从而影响用户阅读时长的进一步提升。对此,需要一种方法来有效识别和过滤社交网络中的这些软文推广或引流广告内容。
下面,将结合附图对本发明的示意性应用场景以及示例实施例进行进一步描述。
具体地,图1示出了根据本发明实施例的对象识别系统的应用场景100的示意图。
在如图1所示的社交网络场景中,自媒体素材发布者(未示出)可以向某社交网络平台上传多个素材以待发布。这些素材可以包括和广告营销无关的非广告素材(例如,非广告文章102)、引流广告素材(例如,广告文章103)以及软文推广素材(例如,软文文章104)等等。在一些实施例中,这些素材还可以包括图片、图文结合、音频和视频等任何其它形式的内容,例如,具有明显的、推广第三方资源的引流信息的图文或短视频广告等。
社交网络平台上的对象识别系统101需要采用特定的对象识别方法(例如,下文如图2所示的对象识别方法200)对这些待发布的素材进行识别和过滤,符合预定规则的素材才可以进一步发布,例如,如图1所示,和广告营销无关的非广告文章102将可以被发布,而包含广告内容的广告文章103以及软文文章104将被过滤。应当理解,这里的预定规则不仅可以与是否包含广告内容相关,还可以与是否包含任何其它的特定内容相关。例如,在本发明的其它实施例中,对象识别系统101还可以识别待发布素材是否包含与各种非法内容、各种不健康内容、敏感内容等相关的各种内容。在下文中仍以如图1所示的广告内容识别应用场景为例进行说明。
图2示出了根据本发明实施例的对象识别方法200的流程图。
如图2所示,首先,在步骤S201中,获取待识别素材。
在一个实施例中,如上文结合图1所述,待识别素材可以是各个创作方(例如,自媒体等)上传到特定社交网络平台以待发布的任何类型的素材,其可以包括文章、图片、图文结合、音频和视频等任何形式的内容。
在步骤S202中,可以获取待识别素材的至少两个维度的维度特征,其中至少两个维度包括素材发布者维度。
在一个实施例中,至少两个维度还可以包括以下维度中的至少一个:正文内容维度、正文句子维度、图片维度、标题维度、或昵称维度。以待识别素材为一篇文章为例,在一个实施例中,素材发布者维度特征可以对应于素材的发布者信息,例如,其可以是文章发布者的社交网络平台账号信息。在一个实施例中,正文内容维度特征可以是文章的正文文本内容。在一个实施例中,正文句子维度可以是文章的正文文本经过句子粒度拆分后得到的各个句子粒度级别的文本内容。应当理解,在其它实施例中,还可以将正文文本内容拆分为段落粒度或词粒度等其它级别的文本内容,这里不做限制。在一个实施例中,图片维度特征可以是文章中包含的图片内容。进一步地,图片内容中也可能包括有文本信息。在一个实施例中,标题维度特征可以是文章的标题文本。在一个实施例中,昵称维度特征可以是素材发布者账号的昵称文本。应当理解,在其它实施例中,从图片中提取出的文本信息、以及文章的标题或发布者昵称等文本信息也可以作为正文内容维度特征进行后续处理。
接下来,在步骤S203中,可以针对每个维度,基于该维度的维度特征进行对象识别。下面分别针对各个维度进行描述。
在一个实施例中,针对每个维度,基于该维度的维度特征进行对象识别可以包括:针对正文内容维度,确定待识别素材的正文内容是否包含一个或多个预先定义的规则内容;以及基于确定结果来获取该维度的对象识别结果。
具体地,仍以广告内容识别应用场景为例,在一个实施例中,可以预先建立一个包含各种广告营销内容的规则库。例如,该规则库可以包括“加微信(XXX)联系”、“促销满XXX减XXX”等各种包含广告营销信息的规则内容。规则库中的规则内容可以周期性或实时更新。可以将正文内容与规则库中的规则内容进行比较来确定其是否包含一个或多个规则内容,若正文内容包含一个或多个规则内容,则可以将正文内容维度的对象识别结果确定为:包括广告营销内容。在一个实施例中,当正文内容被确定为包含广告营销内容时,可以过滤掉该文章不予发布。在另一实施例中,当正文内容被确定为包含广告营销内容时,也可以仅删除或过滤掉包含广告营销内容的特定部分,其余部分继续进行后续处理或发布。
在一个实施例中,还可以对待识别素材的正文内容进行文本分类;以及基于文本分类结果来获取该维度的对象识别结果。
具体地,在一个实施例中,可以采用预先训练的FastTest(浅层网络)模型来对待识别素材的正文内容进行文本分类。FastText是一个快速文本分类算法,非常适用于海量的数据,与基于神经网络的分类算法相比有两大优点:(1)FastText在保持高精度的情况下加快了训练速度和测试速度;以及(2)FastText不需要预训练好的词向量,FastText会自己训练词向量。FastText可以取得和深度网络相媲美的精度,而在训练时间上比深度网络快许多数量级。
图3示出了根据本发明实施例的FastTest模型300的示意性架构图。如图3所示,FastText模型可以输入一个词序列301(x1,x2,…,xN-1,xN),然后输出该词序列属于不同类别的概率,例如,可以输出该词序列是否属于广告营销内容的概率。词序列中的词或词组组成特征向量,特征向量通过线性变换映射到中间层(即,隐藏层),中间层再映射到对应的类别标签。FastText模型在预测类别标签时使用非线性激活函数,但在中间层不使用非线性激活函数。在一个实施例中,词序列301可以是待识别素材的正文内容的N-gram向量。进一步地,可以是字粒度的N-gram向量、词粒度的N-gram向量或任何其它粒度的N-gram向量。经过FastTest模型进行文本分类后,可以将待识别素材的正文内容属于广告营销内容的概率作为该维度的对象识别结果。
在一个实施例中,针对每个维度,基于该维度的维度特征进行对象识别可以包括:针对标题维度和/或昵称维度,对待识别素材的标题和/或发布者昵称进行文本分类;以及基于文本分类结果来获取该维度的对象识别结果。
具体地,根据本发明的实施例,可以首先对待识别素材的标题和/或发布者昵称进行文本预处理,例如,可以预先剔除标题和/或昵称中的一些对于文本分类任务来说无意义的符号信息或其它冗余信息,例如,一些html标签或表情符号。在另一实施例中,还可以针对中文、日语等无空格切分字词语言预先进行分词处理,即,将一段标题和/或昵称文本序列划分为合理的词(字)序列,然后再做相应的文本分类处理。
在一个实施例中,经过文本预处理后,可以基于TextCNN模型来对待识别素材的标题和/或发布者昵称进行文本分类。图4示出了根据本发明实施例的TextCNN模型400的网络结构示意图。如图4所示,整个TextCNN模型可以由输入层401、卷积层402、池化层403和全连接层404四部分构成。根据本发明的实施例,首先,可以将待识别素材的标题和/或发布者昵称截取或填充为一个定长(例如,输入序列长度n)的文本序列L,并将文本序列中各个词汇所对应的词向量(如图4中的词向量维度K所示)输入到TextCNN模型的输入层(即,词嵌入层)401中。
在卷积层402中,TextCNN模型可以使用多个不同尺寸的卷积核来对输入的词向量进行处理。类似于N-gram模型中的参数N,卷积核的高度(即,窗口值)可以表示局部词序的长度。窗口值是一个超参数,一般可以选取2-8之间的值。在一个实施例中,窗口值可以取4。
在池化层403中,可以使用Max-pool(最大值池化),这样可以减少模型参数,并且保证在不定长的卷积层输出上获得一个定长的全连接层的输入。卷积层402与池化层403在这里的核心作用是特征提取,即,从输入的定长文本序列L中,利用局部词序信息,提取初级特征,并将初级特征组合为高级特征。通过卷积与池化操作,可以省去繁杂的特征工程。
最终,全连接层404可以将卷积层402与池化层403提取的特征输入到一个逻辑回归(Logistic Regression,LR)分类器中进行分类。图4示出了仅具有一层隐藏层的全连接网络,应当理解,在本发明的其它实施例中,还可以使用具有多个隐藏层的全连接网络。在一个实施例中,TextCNN模型最终可以输出待识别素材的标题和/或发布者昵称包含广告营销内容的概率,并且可以将该概率值作为该维度的对象识别结果。
在一个实施例中,针对每个维度,基于该维度的维度特征进行对象识别可以包括:针对图片维度,将待识别素材的图片内容转换为文本内容;对文本内容进行文本分类;以及基于文本分类结果来获取该维度的对象识别结果。
具体地,在一个实施例中,可以使用光学字符识别(Optical CharacterRecognition,OCR)等文字识别技术来将待识别素材的图片内容转换为文本内容。在一个实施例中,对于视频素材,可以首先对视频素材进行抽帧,从而转换为多帧的图片素材进行后续识别和转换处理。可以采用均匀采样抽帧的方式(例如,等时间间隔抽帧),也可以根据视频时长等参数的不同而采用其它的抽帧方式。在一个实施例中,可以采用如上所述的FastTest模型或TextCNN模型对转换得到的图片的文本内容进行文本分类处理,并将处理得到的待识别素材的图片包含广告营销内容的概率作为该维度的对象识别结果。
在一个实施例中,针对每个维度,基于该维度的维度特征进行对象识别可以包括:针对正文句子维度,针对每个正文句子进行语义识别;以及基于语义识别结果来获取该维度的对象识别结果。
具体地,对于一些待识别素材(例如,软文推广文章),其正文内容从整体上看广告特性并不明显,但是经过拆分后,中间的部分句子可能带有明显的营销广告特性。对于此类素材,在一个实施例中,可以首先将素材的正文文本拆分为句子粒度级别的文本内容,然后可以采用各种语义识别或文本分类方法在句子粒度级别下进行语义识别或文本分类。在一个实施例中,可以将被识别为广告营销内容的部分从原文当中删除,其余内容可以保留下来正常使用。在一个实施例中,可以采用Bi-LSTM+Attention机制的模型来对句子粒度级别的文本内容进行识别处理。Attention机制是自然语言处理领域一个常用的建模长时间记忆机制,能够很直观的给出每个词对结果的贡献。在一个实施例中,可以在其它维度的识别处理完毕之后,召回剩下的疑似广告内容进行句子粒度级别的识别处理,这样可以大大减少计算量和处理量。例如,可以将经正文内容维度的识别处理后得出的正文内容属于广告营销内容的概率处于特定阈值范围(例如,[0.6,0.95])内的素材进行句子粒度级别的识别处理。在一个实施例中,可以将经过语义识别或文本分类得出的文本内容包含广告营销内容的概率作为该维度的识别结果。在一个实施例中,还可以将识别出的特定广告营销内容标识出来,作为该维度的识别结果。
在社交网络中,可能存在专门发布广告营销内容的自媒体号主,其发布的很多素材通常都包含各种导流信息、营销广告或者软文片段。对此,可以针对素材发布者维度来进行建模和识别处理。下面结合图5来进行详细描述。
图5示出了根据本发明实施例的基于素材发布者维度进行对象识别的方法500的流程图。
如图5所示,基于素材发布者维度的维度特征进行对象识别可以包括:在步骤S501中,针对素材发布者维度,获取待识别素材的素材发布者的历史识别结果信息;在步骤S502中,获取素材发布者的历史影响程度信息;在步骤S503中,基于历史识别结果信息和历史影响程度信息来获取素材发布者的融合服务质量特征;以及在步骤S504中,基于融合服务质量特征来获取该维度的对象识别结果。
在一个实施例中,素材发布者的历史识别结果信息可以是包括与该素材发布者所发布的素材在过去的特定时间段内的历史识别结果相关联的信息。例如,在一个实施例中,素材发布者的历史识别结果信息可以是包括与该素材发布者所发布的素材在过去的特定时间段内关于是否包含广告营销内容的识别结果相关联的信息。在一个实施例中,素材发布者的历史识别结果信息可以采用如下等式(1)所示的素材发布者质量服务通过率因子来表示:
Figure BDA0002434791680000141
其中,oi,j可以是第i个素材发布者的第j篇素材是否被审核为包含广告营销内容的标志。oi,j可以取值1或0,1表示不包含广告营销内容且能够通过审核,而0表示包含广告营销内容且未能通过审核;t0可以表示当前日期;t1i,j可以表示第i个素材发布者的第j篇素材被审核是否包含广告营销内容的日期;δ和η可以是起平滑作用的控制参数,在一个实施例中,δ和η可以取值为:δ=1.0,η=10.0。
根据等式(1),素材发布者质量服务通过率因子s1i的值越大,可以说明该素材发布者发布的素材包含广告营销内容的比率越小。
在一个实施例中,素材发布者的历史影响程度信息可以是包括与该素材发布者所发布的素材在过去的特定时间段内的历史影响程度相关联的信息。例如,在一个实施例中,素材发布者的历史影响程度信息可以是包括与该素材发布者所发布的素材在过去的特定时间段内的播放次数或点击次数等相关联的信息。在一个实施例中,素材发布者的历史影响程度信息可以采用如下等式(2)所示的素材发布者影响力因子来表示:
Figure BDA0002434791680000142
其中,vi,j可以表示第i个素材发布者所发布的素材在第j天被观看的次数(例如,可以是视频播放次数或文章点击次数);t0可以表示当前日期;t2i,j可以表示第i个素材发布者第j天的日期;δ可以是起平滑作用的控制参数,在一个实施例中,δ可以取值为:δ=1.0;σ(·)可以是起平滑作用的函数,在一个实施例中,σ(·)可以采用如下等式(3)所示的形式:
Figure BDA0002434791680000143
根据等式(2),素材发布者影响力因子s2i的值越大,可以说明该素材发布者发布的素材的观看率越高。
在一个实施例中,素材发布者的融合服务质量特征可以是对素材发布者的多方面的信息进行融合而获得的该素材发布者的综合服务质量特征。例如,在一个实施例中,素材发布者的融合服务质量特征可以是对上述素材发布者的历史识别结果信息和历史影响程度信息进行融合而获得的特征。在一个实施例中,可以基于如下等式(4)所示的素材发布者质量服务融合因子对素材发布者质量服务通过率因子s1i和素材发布者影响力因子s2i进行融合,以获取素材发布者的融合服务质量特征:
si=(1.0+s1i)(1.0+s2i)0.5 等式(4)
其中,指数部分还可以根据经验设定为其它值。
在一个实施例中,可以将根据等式(4)获取的素材发布者质量服务融合因子si的值作为素材发布者维度的对象识别结果。
从素材发布者维度来进行识别处理可以比单纯地从纯内容维度来进行识别处理效果更好,它可以是批处理的。例如,一旦某一素材发布者被识别为与广告营销相关并被相关平台打击或降权之后,其所有待发布的素材都可以被批量打击。
现在参考回图2,在步骤S204中,可以基于针对每个维度的对象识别结果,获取待识别素材的联合识别结果。
在一个实施例中,可以在如上所述的多个维度中一个维度的对象识别结果超出与该维度相对应的第一阈值范围的情况下,将该维度的对象识别结果作为联合识别结果。例如,在基于正文内容维度获取的待识别素材包含广告营销内容的概率(例如,0.96)高于一个预定阈值(例如,0.95)的情况下,可以直接将该维度下获取的概率值(例如,0.96)作为联合识别结果。在基于标题维度和/或昵称维度获取的待识别素材包含广告营销内容的概率(例如,0.97)高于一个预定阈值(例如,0.95)的情况下,可以直接将该维度下获取的概率值(例如,0.97)作为联合识别结果。在图片维度获取的待识别素材包含广告营销内容的概率(例如,0.98)高于一个预定阈值(例如,0.95)的情况下,可以直接将该维度下获取的概率值(例如,0.98)作为联合识别结果。在正文句子维度获取的待识别素材包含广告营销内容的概率(例如,0.99)高于一个预定阈值(例如,0.95)的情况下,可以直接将该维度下获取的概率值(例如,0.99)作为联合识别结果。在另一实施例中,在基于素材发布者维度获取的素材发布者质量服务融合因子si低于一个预定阈值sth的情况下,可以直接将该维度下获取的素材发布者质量服务融合因子si值作为联合识别结果。在另一实施例中,在多个维度下的对象识别结果都超出对应的阈值范围的情况下,可以采信其中任意一个维度的对象识别结果作为联合识别结果。应当理解,各个维度所对应的阈值范围可以不同。
在一个实施例中,还可以预先为每个维度设置一个权重值,然后将每个维度的对象识别结果的加权和作为联合识别结果。在该实施例中,由于在素材发布者维度下获取的素材发布者质量服务融合因子si越高表示该素材发布者发布的素材包含广告营销内容的比率越小或影响力越高,而在其余维度下获取的概率值越高表示素材包含广告营销内容的概率越高,所以在求加权和时,可以预先对素材发布者质量服务融合因子si进行取倒数或归一化处理,以便可以有效地与其余维度的识别结果进行线性融合。
在一个实施例中,还可以将上述多个维度的对象识别结果的多数命中结果作为联合识别结果。例如,在包含正文内容维度、图片维度和正文句子维度三个维度的情况下,只要其中两个维度的对应识别结果表明待识别素材包含广告营销内容,则直接认为该素材包含广告营销内容。
在获取到待识别素材的联合识别结果之后,可以进一步基于联合识别结果来确定待识别素材是否包括拦截对象(例如,上文中的广告营销内容)。例如,可以将联合识别结果与预设的第二阈值和第三阈值进行比较,在联合识别结果高于第二阈值(例如,0.9)的情况下,可以确定识别到拦截对象;在联合识别结果低于第三阈值(例如,0.6)的情况下,可以确定未识别到拦截对象;以及在联合识别结果低于第二阈值且高于第三阈值的情况下,生成再次识别请求。在一个实施例中,可以基于再次识别请求来对该待识别素材进行再次识别,例如,可以转移到人工审核系统或另一识别系统来对该待识别素材进行再次识别。例如,该待识别素材经过人工审核系统再次识别,可以被准确地识别为包含拦截对象或不包含拦截对象。在一个实施例中,可以接收再次识别的结果,并基于再次识别结果,对上述实施例中实施对象识别的对象识别模型进行训练。例如,可以将经过人工审核系统再次识别并打上正确标签的待识别素材作为样本来更新样本库,并基于其对对象识别模型进行重新训练。此外,还可以直接接收包含拦截对象的样本,并且基于该样本来对实施对象识别的对象识别模型进行训练。例如,仍以广告营销内容识别场景为例,系统可以直接经由用户举报端口接收用户举报的软文、导流图片等广告营销内容,并将其作为样本对对象识别模型进行训练优化。通过以上方式,可以实时地获取优质的样本,对象识别模型也将持续被优化。
图6示出了根据本发明实施例的广告营销内容识别方法600的流程图。
如图6所示,广告营销内容识别方法600可以包括:在步骤S601中,获取待识别素材;在步骤S602中,获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;在步骤S603中,针对每个维度,基于该维度的维度特征进行广告内容识别;以及在步骤S604中,基于针对每个维度的广告内容识别结果,获取所述待识别素材的联合识别结果。
类似于上文参考图2的描述,上述至少两个维度还可以包括以下维度中的至少一个:正文内容维度、正文句子维度、图片维度、标题维度、或昵称维度,具体细节这里不再赘述。
在下文中,将结合图7A至图7E以及图8来描述根据本发明实施例的对象识别方法和系统在广告营销内容识别场景下的示例应用。
具体地,图7A示出了根据本发明实施例的社交网络平台上素材的分发处理过程。如图7A所示,内容生产端701可以是PGC、UGC、PUGC或MCN内容生产者,其可以通过移动端或者后端API接口向平台上传图文或者视频内容等素材,这些素材是平台推荐分发内容的主要来源。内容生产端701可以通过与上下行内容接口服务702进行通信来上传素材。
上下行内容接口服务702可以将从内容生产端701上传的素材的内容实体存储到内容存储服务704中,并且将素材的大小、标题、分类、标签、发布者、摘要、封面图、发布时间、码率等元信息存入内容数据库705中。此外,上下行内容接口服务702还可以将内容生产端701上传的素材提交给调度中心服务706,进行后续的内容识别处理(例如,广告营销内容识别,将在下文结合图7B描述)调度。经后续内容识别处理后满足发布条件(例如,不包含广告营销内容)的素材可以在调度中心服务706的调度下,通过内容分发出口服务708(例如,推荐引擎或搜索引擎等)提供给内容消费端703。
作为内容的观看或消费终端,内容消费端703可以和上下行内容接口服务702进行通信,通过平台推荐分发或者订阅服务获取其推荐或订阅素材的索引信息。然后,内容消费端703可以和内容存储服务704进行通信,获取对应的推荐或订阅素材。内容存储服务704可以是一组分布范围很广、离内容消费端703很近的就近接入的存储服务器,通常其外围还具有CDN加速服务器进行分布式缓存加速。内容存储服务704存储的是素材的内容实体,例如,视频源文件、图片源文件等。另一方面,内容消费端703还可以同时将上传和下载过程当中用户播放的行为数据、素材加载时间、卡顿情况、播放点击等信息上报给平台后端用于统计分析。内容消费端703通常可以通过Feeds流方式来浏览内容数据。
在图7A的基础上,图7B进一步示出了根据本发明实施例的社交网络平台上对广告营销内容识别进行调度的过程。
如图7B所示,调度中心服务706可以将内容生产端701上传的待发布素材进行广告营销内容识别调度。例如,调度中心服务706可以调度人工审核系统707和机器处理系统(例如,广告营销识别服务714)来对上传的待发布素材进行广告营销内容识别。调度中心服务706可以控制整个平台的调度的顺序和优先级。例如,调度中心服务706可以先调用广告营销识别服务714来对上传的待发布素材进行广告营销内容识别,然后,在广告营销识别服务714不能准确判断素材是否包含广告营销内容的情况下,再调度人工审核系统707来进行识别。
广告营销识别服务714可以调用根据本发明提供的方法实施的对象识别模型来对上传的待发布素材进行广告营销内容识别,并将处理结果返回给调度中心服务706,具体将在下文结合图7C和图7D进行描述。
人工审核系统707是人工服务能力的载体,该系统主要可以用于审核过滤敏感内容、不健康内容、法律禁止以及软文广告等机器无法明确判断的内容。如上文所述,通过人工审核的素材可以被启用,并且通过内容分发出口服务708提供给内容消费端703。人工审核系统707可以从内容数据库705读取素材的原始内容进行审核,也可以结合广告营销识别服务714的识别处理结果(例如,疑似广告营销内容部分的标记、素材包含广告营销内容的概率等)来进行审核。此外,人工审核系统707可以对属于广告营销内容的部分进行标记,并且可以对内容消费端703举报反馈的内容(在本示例中主要针对广告营销内容)进行复核。人工审核系统707可以将标记出的或经复核后的内容上报统计接口和举报反馈服务710,以作为广告营销识别模型的训练样本存入样本库中。
统计接口和举报反馈服务710可以同时对举报或上报的数据的分布情况进行量化分析等来确定广告营销样本数据分布的变化,从而确定广告营销模型的更新周期等信息(例如,一段时间内可能会大量出现某一产品或某一相似类型的广告营销内容,下一时段又可能会主要出现另一产品或另一类型的广告营销内容)。
图7C进一步示出了根据本发明实施例的社交网络平台上的广告营销识别模型。
如图7C所示,广告营销识别模型712可以根据本发明结合图2描述的方法分别基于正文内容维度、标题维度、昵称维度、图片维度和素材发布者维度等来进行建模,然后将几个子模型融合为一个联合模型。图7C中仅示意性的示出了基于素材发布者维度建模的账号质量子模型709,其余子模型以及子模型的融合过程可以参考上文以及图8所示的方法,具体这里不再赘述。广告营销识别模型712可以为广告营销识别服务714提供原始的模型输入,同时可以基于线上收集反馈的广告营销样本变化来调整模型训练和更新周期。
广告营销识别服务714可以将广告营销识别模型712进行服务化,例如,可以通过设置不同的阈值或其它模型参数来将广告营销识别模型712部署为不同的工作版本,例如,高准确率版本或高召回率版本。例如,可以先设置一个较高的阈值(例如,0.95),将识别结果高于该阈值的素材直接过滤而不送人审。然后,再设置一个较低的阈值(例如0.6),将更多疑似广告营销素材召回进行人工审核。在人工审核过程中,可以将各个素材包含广告营销内容的概率值提供给审核人员用作提示信息,并且可以根据各个素材包含广告营销内容的概率值的高低进行排序,例如,可以优先审核概率值较低的素材,因为其包含广告营销内容的概率值低,理论上更容易通过人工审核,这样可以提高审核通过的素材启用效率。
账号质量子模型709可以从内容数据库705和统计接口和举报反馈服务710当中读取发布者账号的账号元信息、广告营销审核通过情况及账号对应的素材的分发情况等信息。账号质量子模型709可以根据如上文结合图5所述的基于素材发布者维度的对象识别方法来构建。
图7D进一步示出了根据本发明实施例的社交网络平台上的广告营销识别模型的训练样本获取过程。
如图7D所示,如上文所描述的,广告营销内容样本库711可以将统计接口和举报反馈服务710从内容消费端703接收的和/或经过人工审核系统707复核以后的素材存储作为用于训练广告营销识别模型712的样本数据。广告营销内容样本库711可以动态地保持样本更新,确保能够及时感知到线上广告营销样本数据的分布变化。此外,广告营销内容样本库711还可以将视频下载和抽帧检测服务713对视频或图片的OCR识别和检测结果存储作为用于训练广告营销识别模型712的样本数据。
视频下载和抽帧检测服务713可以用于处理视频文件(例如,短视频或小视频等)。例如,视频下载和抽帧检测服务713可以从内容存储服务704中获取视频的原始内容,然后采用均匀抽帧的方式(例如,每5秒采样1帧)进行采样,将视频转换为图片,通过OCR来检测和识别图片当中的广告营销内容。如上所述,识别和检测的结果信息可以写入广告营销内容样本库711中。
最后,图7E示出了结合图7A至图7D描述的示意性社交网络平台的整体结构。图7E包含了如上文所述的社交网络平台上素材的分发处理、广告营销内容识别调度、广告营销识别模型建模以及广告营销识别模型的训练样本获取等整个过程。
图9示出了根据本发明实施例的对象识别装置900的示意图。
如图9所示,根据本发明实施例的对象识别装置900可以包括:素材获取模块901、维度提取模块902、基于维度的子识别模块903和联合识别模块904。其中,素材获取模块901可以被配置用于获取待识别素材;维度提取模块902可以被配置用于获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;基于维度的子识别模块可以被配置用于针对每个维度,基于该维度的维度特征进行对象识别;以及联合识别模块904可以被配置用于基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果。
图10示出了根据本发明实施例的对象识别系统1000的示意图。
如图10所示,根据本发明实施例的对象识别系统1000可以包括处理器1001以及存储器1002,其可以通过总线1003进行互联。
处理器1001可以根据存储在存储器1002中的程序或代码执行各种动作和处理。具体地,处理器1001可以是一种集成电路芯片,具有信号的处理能力。上述处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中公开的各种方法、步骤、流程及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,可以是X86架构或者是ARM架构等。
存储器1002存储有可执行指令,该指令在被处理器1001执行时用于实现根据本发明实施例的对象识别方法。存储器1002可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(SDRAM)、双倍数据速率同步动态随机存取存储器(DDRSDRAM)、增强型同步动态随机存取存储器(ESDRAM)、同步连接动态随机存取存储器(SLDRAM)和直接内存总线随机存取存储器(DR RAM)。应注意,本文描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本发明还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,该计算机指令被处理器执行时可以实现根据本发明实施例的对象识别方法。类似地,本发明实施例中的计算机可读存储介质可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。应注意,本文描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本发明的实施例提供了一种对象识别方法、装置和系统,通过将内容审核过程当中人工审核标记的广告营销内容和用户负反馈举报的广告营销内容等作为样本,采用多维度的机器学习方法,结合内容的载体本身,分别针对内容正文、标题、发布者昵称、正文句子语义、图片内容以及发布者的账号质量等维度单独建模和识别,最后通过模型融合构建综合的检测识别模型来做综合广告营销的概率判断,输出广告营销内容的结果概率,从而很大程度地提升广告营销内容识别的速度、效率和准确性。
需要说明的是,附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含至少一个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
一般而言,本发明的各种示例实施例可以在硬件或专用电路、软件、固件、逻辑,或其任何组合中实施。某些方面可以在硬件中实施,而其他方面可以在可以由控制器、微处理器或其他计算设备执行的固件或软件中实施。当本发明的实施例的各方面被图示或描述为框图、流程图或使用某些其他图形表示时,将理解此处描述的方框、装置、系统、技术或方法可以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备,或其某些组合中实施。
在上面详细描述的本发明的示例实施例仅仅是说明性的,而不是限制性的。本领域技术人员应该理解,在不脱离本发明的原理和精神的情况下,可对这些实施例或其特征进行各种修改和组合,这样的修改应落入本发明的范围内。

Claims (13)

1.一种对象识别方法,包括:
获取待识别素材;
获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;
针对每个维度,基于该维度的维度特征进行对象识别;以及
基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果。
2.根据权利要求1所述的方法,其中,所述至少两个维度还包括以下维度中的至少一个:
正文内容维度、正文句子维度、图片维度、标题维度、或昵称维度。
3.根据权利要求1所述的方法,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:
针对素材发布者维度,
获取所述待识别素材的素材发布者的历史识别结果信息;
获取所述素材发布者的历史影响程度信息;
基于所述历史识别结果信息和所述历史影响程度信息来获取所述素材发布者的融合服务质量特征;以及
基于所述融合服务质量特征来获取该维度的对象识别结果。
4.根据权利要求1所述的方法,其中,基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果包括以下中的任何一项:
在所述至少两个维度中一个维度的对象识别结果超出与该维度相对应的第一阈值范围的情况下,将该维度的对象识别结果作为所述联合识别结果;
将所述至少两个维度的对象识别结果的加权和作为所述联合识别结果;或
将所述至少两个维度的对象识别结果的多数命中结果作为所述联合识别结果。
5.根据权利要求1所述的方法,其中,所述对象识别包括识别拦截对象,所述方法还包括:
在所述联合识别结果高于第二阈值的情况下,确定识别到拦截对象;
在所述联合识别结果低于第三阈值的情况下,确定未识别到拦截对象;以及
在所述联合识别结果低于所述第二阈值且高于所述第三阈值的情况下,生成再次识别请求。
6.根据权利要求5所述的方法,其中,所述方法还包括:
基于所述再次识别请求,接收再次识别结果;
基于所述再次识别结果,对实施所述对象识别的对象识别模型进行训练。
7.根据权利要求1所述的方法,其中,所述方法还包括:
接收包含拦截对象的样本;
基于所接收的样本,对实施所述对象识别的对象识别模型进行训练。
8.根据权利要求2所述的方法,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:
针对正文内容维度,
确定所述待识别素材的正文内容是否包含一个或多个预先定义的规则内容;以及
基于所述确定结果来获取该维度的对象识别结果。
9.根据权利要求2所述的方法,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:
针对正文句子维度,
针对每个正文句子进行语义识别;以及
基于所述语义识别结果来获取该维度的对象识别结果。
10.根据权利要求2所述的方法,其中,针对每个维度,基于该维度的维度特征进行对象识别包括:
针对标题维度和/或昵称维度,
对所述待识别素材的标题和/或发布者昵称进行文本分类;以及
基于所述文本分类结果来获取该维度的对象识别结果。
11.一种对象识别装置,包括:
素材获取模块,用于获取待识别素材;
维度提取模块,用于获取所述待识别素材的至少两个维度的维度特征,其中所述至少两个维度包括素材发布者维度;
基于维度的子识别模块,用于针对每个维度,基于该维度的维度特征进行对象识别;以及
联合识别模块,用于基于针对每个维度的对象识别结果,获取所述待识别素材的联合识别结果。
12.一种对象识别系统,包括:
处理器;和
存储器,其上存储有计算机可执行指令,所述指令在被处理器执行时用于实现如权利要求1-10中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机可执行指令,所述指令在被处理器执行时用于实现如权利要求1-10中任一项所述的方法。
CN202010248865.5A 2020-04-01 2020-04-01 对象识别方法、装置和系统 Active CN111460267B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010248865.5A CN111460267B (zh) 2020-04-01 2020-04-01 对象识别方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010248865.5A CN111460267B (zh) 2020-04-01 2020-04-01 对象识别方法、装置和系统

Publications (2)

Publication Number Publication Date
CN111460267A true CN111460267A (zh) 2020-07-28
CN111460267B CN111460267B (zh) 2023-04-07

Family

ID=71682207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010248865.5A Active CN111460267B (zh) 2020-04-01 2020-04-01 对象识别方法、装置和系统

Country Status (1)

Country Link
CN (1) CN111460267B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070093A (zh) * 2020-09-22 2020-12-11 网易(杭州)网络有限公司 生成图像分类模型的方法、图像分类方法、装置和设备
CN112948636A (zh) * 2021-03-24 2021-06-11 黑龙江省能嘉教育科技有限公司 一种区域教育云资源共享系统及方法
CN113761235A (zh) * 2021-04-20 2021-12-07 腾讯科技(深圳)有限公司 一种多媒体内容的识别方法、相关装置、设备及存储介质
CN113971402A (zh) * 2021-10-22 2022-01-25 北京字节跳动网络技术有限公司 内容识别方法、装置、介质及电子设备
CN114169323A (zh) * 2021-10-28 2022-03-11 建信金融科技有限责任公司 一种基于机器学习的个人金融敏感信息检测方法及系统
CN114547435A (zh) * 2020-11-24 2022-05-27 腾讯科技(深圳)有限公司 内容质量的识别方法、装置、设备及可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122403A (ja) * 2005-10-28 2007-05-17 Fuji Xerox Co Ltd 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
CN103034654A (zh) * 2011-10-10 2013-04-10 中国电信股份有限公司 社会化动态消息呈现控制方法及系统
CN109063185A (zh) * 2018-08-27 2018-12-21 电子科技大学 面向事件检测的社交网络短文本数据过滤方法
CN109597982A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 摘要文本识别方法及装置
CN110069625A (zh) * 2017-09-22 2019-07-30 腾讯科技(深圳)有限公司 一种内容分类方法、装置及服务器
CN110569361A (zh) * 2019-09-06 2019-12-13 腾讯科技(深圳)有限公司 一种文本识别方法及设备
CN110597988A (zh) * 2019-08-28 2019-12-20 腾讯科技(深圳)有限公司 一种文本分类方法、装置、设备及存储介质
CN110674414A (zh) * 2019-09-20 2020-01-10 北京字节跳动网络技术有限公司 目标信息识别方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122403A (ja) * 2005-10-28 2007-05-17 Fuji Xerox Co Ltd 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
CN103034654A (zh) * 2011-10-10 2013-04-10 中国电信股份有限公司 社会化动态消息呈现控制方法及系统
CN110069625A (zh) * 2017-09-22 2019-07-30 腾讯科技(深圳)有限公司 一种内容分类方法、装置及服务器
CN109597982A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 摘要文本识别方法及装置
CN109063185A (zh) * 2018-08-27 2018-12-21 电子科技大学 面向事件检测的社交网络短文本数据过滤方法
CN110597988A (zh) * 2019-08-28 2019-12-20 腾讯科技(深圳)有限公司 一种文本分类方法、装置、设备及存储介质
CN110569361A (zh) * 2019-09-06 2019-12-13 腾讯科技(深圳)有限公司 一种文本识别方法及设备
CN110674414A (zh) * 2019-09-20 2020-01-10 北京字节跳动网络技术有限公司 目标信息识别方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ROBERT E.SCHAPIRE等: "BoosTexter:A Boosting-based System for Txet Categorization" *
王虹: "体验型商品在线评论有用性影响因素研究" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070093A (zh) * 2020-09-22 2020-12-11 网易(杭州)网络有限公司 生成图像分类模型的方法、图像分类方法、装置和设备
CN114547435A (zh) * 2020-11-24 2022-05-27 腾讯科技(深圳)有限公司 内容质量的识别方法、装置、设备及可读存储介质
CN112948636A (zh) * 2021-03-24 2021-06-11 黑龙江省能嘉教育科技有限公司 一种区域教育云资源共享系统及方法
CN112948636B (zh) * 2021-03-24 2022-09-27 黑龙江省能嘉教育科技有限公司 一种区域教育云资源共享系统及方法
CN113761235A (zh) * 2021-04-20 2021-12-07 腾讯科技(深圳)有限公司 一种多媒体内容的识别方法、相关装置、设备及存储介质
WO2022222850A1 (zh) * 2021-04-20 2022-10-27 腾讯科技(深圳)有限公司 一种多媒体内容的识别方法、相关装置、设备及存储介质
CN113971402A (zh) * 2021-10-22 2022-01-25 北京字节跳动网络技术有限公司 内容识别方法、装置、介质及电子设备
CN114169323A (zh) * 2021-10-28 2022-03-11 建信金融科技有限责任公司 一种基于机器学习的个人金融敏感信息检测方法及系统

Also Published As

Publication number Publication date
CN111460267B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN111460267B (zh) 对象识别方法、装置和系统
Pantano et al. Making sense of consumers’ tweets: Sentiment outcomes for fast fashion retailers through Big Data analytics
US10380249B2 (en) Predicting future trending topics
CN111339404B (zh) 基于人工智能的内容热度预测方法、装置和计算机设备
CN112131411A (zh) 一种多媒体资源推荐方法、装置、电子设备及存储介质
Ayodeji et al. Social media analytics: a tool for the success of online retail industry
US10127522B2 (en) Automatic profiling of social media users
Song et al. “Is a picture really worth a thousand words?”: A case study on classifying user attributes on Instagram
KR102155342B1 (ko) 다중파라미터 분석 기반 인플루언서 매칭을 이용한 광고 서비스 제공 시스템
KR20160058896A (ko) 소셜 커뮤니케이션 데이터를 분석하고 송신하는 시스템 및 방법
CN111507097A (zh) 一种标题文本处理方法、装置、电子设备及存储介质
US20210350202A1 (en) Methods and systems of automatic creation of user personas
US11695713B2 (en) Computerized system and method for multi-factor message classification and delivery
US20180285748A1 (en) Performance metric prediction for delivery of electronic media content items
CN112257661A (zh) 低俗图像的识别方法、装置、设备及计算机可读存储介质
CN108959323B (zh) 视频分类方法和装置
KR102378238B1 (ko) 인공지능을 이용한 광고주 및 1인 마케터 매칭 시스템
Krisna et al. The antecedents of hashtag and geotag use in smart tourism: case study in Indonesia
US20230004832A1 (en) Methods, Systems, And Apparatuses For Improved Content Recommendations
KR102322668B1 (ko) 콘텐츠 크리에이터의 창작활동 활성화를 위한 다중 플랫폼 서비스 제공 시스템
EP3798866A1 (en) Customized thumbnail image generation and selection for digital content using computer vision and machine learning
US11962857B2 (en) Methods, systems, and apparatuses for content recommendations based on user activity
US12096075B2 (en) Methods, systems, and apparatuses for user engagement analysis
US20230004833A1 (en) Methods, Systems, And Apparatuses For Model Selection And Content Recommendations
CN114202402A (zh) 行为特征预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026355

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant