CN109558581B - 一种内容监测方法及装置 - Google Patents
一种内容监测方法及装置 Download PDFInfo
- Publication number
- CN109558581B CN109558581B CN201710888264.9A CN201710888264A CN109558581B CN 109558581 B CN109558581 B CN 109558581B CN 201710888264 A CN201710888264 A CN 201710888264A CN 109558581 B CN109558581 B CN 109558581B
- Authority
- CN
- China
- Prior art keywords
- content
- word
- monitored
- preset
- preset monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0245—Surveys
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种内容监测方法及装置,在获取待监测对象后,获取待监测对象对应的文本内容,并对待监测对象对应的文本内容进行分词处理,得到待监测对象对应的文本内容的至少一个词语,在至少一个词语与待监测对象对应的预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息,这样就可以基于预设监测内容的曝光信息确定预设监测内容在待监测对象中的曝光情况,从而实现对预设监测内容在待监测对象中的曝光情况的监测。
Description
技术领域
本发明涉及内容监测技术领域,更具体的说,尤其涉及一种内容监测方法及装置。
背景技术
随着在线广告的迅速发展,出现了各种广告投放形式,如可以在娱乐节目中植入的原生广告,所谓原生广告是以影音形式投放在特定浏览环境(如社交应用平台或娱乐节目中等)的广告,因此监测诸如原生广告等在线广告的广告曝光信息成为在线广告监测的主要需求。
目前对在线广告的曝光信息进行监测的方式是:获取在线广告在待监测对象(如娱乐节目)被触发播放的播放次数,将播放次数确定为在线广告的曝光信息,也就是说目前可以对整条广告的播放次数进行监测,但是缺少对待监测对象对应的预设监测内容的监测,如缺少对待监测对象中是否包含品牌信息的监测。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的内容监测方法及装置,用于对待监测对象的预设监测内容进行监测。技术方案如下:
本发明提供一种内容监测方法,所述方法包括:
获取待监测对象以及所述待监测对象对应的预设监测内容;
获取所述待监测对象对应的文本内容,并对所述待监测对象对应的文本内容进行分词处理,得到所述待监测对象对应的文本内容的至少一个词语;
在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:
在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量;
将所述词语数量确定为曝光信息中的出现次数。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量包括:
在所述预设监测内容为品牌标识内容的情况下,将所述至少一个词语与所述品牌标识内容进行匹配;
在所述至少一个词语中有与所述品牌标识内容相同的词语的情况下,确定所述至少一个词语与所述品牌标识内容匹配;
获取所述至少一个词语中词语与所述品牌标识内容相同的词语数量;
或者,所述在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量包括:
在所述预设监测内容为预设广告内容的情况下,将所述至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合;
对每个词语集合:在该词语集合中的所有词语均出现在所述预设广告内容的情况下,确定所述至少一个词语与所述预设广告内容匹配;
获取所有词语均出现在所述预设广告内容的词语集合的集合数量,并将所述集合数量确定为所述词语数量。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:
在所述至少一个词语与所述预设监测内容匹配的情况下,获取与所述预设监测内容匹配的词语在所述待监测对象中的出现时长;
将与所述预设监测内容匹配的词语在所述待监测对象中的出现时长确定为所述曝光信息中的出现时长。
本发明还提供一种内容监测装置,所述装置包括:
获取单元,用于获取待监测对象以及所述待监测对象对应的预设监测内容,以及用于获取所述待监测对象对应的文本内容,并对所述待监测对象对应的文本内容进行分词处理,得到所述待监测对象对应的文本内容的至少一个词语;
获得单元,用于在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息。
优选地,所述获得单元,用于在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量,并将所述词语数量确定为曝光信息中的出现次数。
优选地,所述获得单元包括:第一匹配子单元、确定子单元和第一获取子单元;
所述第一匹配子单元,用于在所述预设监测内容为品牌标识内容的情况下,将所述至少一个词语与所述品牌标识内容进行匹配;
所述确定子单元,用于在所述至少一个词语中有与所述品牌标识内容相同的词语的情况下,确定所述至少一个词语与所述品牌标识内容匹配;
所述第一获取子单元,用于获取所述至少一个词语中词语与所述品牌标识内容相同的词语数量;
或者,所述获得单元包括:组合子单元、第二匹配子单元和第二获得子单元;
所述组合子单元,用于在所述预设监测内容为预设广告内容的情况下,将所述至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合;
所述第二匹配子单元,用于对每个词语集合:在该词语集合中的所有词语均出现在所述预设广告内容的情况下,确定所述至少一个词语与所述预设广告内容匹配;
所述第二获得子单元,用于获取所有词语均出现在所述预设广告内容的词语集合的集合数量,并将所述集合数量确定为所述词语数量。
优选地,所述获得单元,用于在所述至少一个词语与所述预设监测内容匹配的情况下,获取与所述预设监测内容匹配的词语在所述待监测对象中的出现时长,并将与所述预设监测内容匹配的词语在所述待监测对象中的出现时长确定为所述曝光信息中的出现时长。
本发明还提供一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述内容监测方法。
本发明还提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述内容监测方法。
借由上述技术方案,在获取待监测对象后,获取待监测对象对应的文本内容,并对待监测对象对应的文本内容进行分词处理,得到待监测对象对应的文本内容的至少一个词语,在至少一个词语与待监测对象对应的预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息,这样就可以基于预设监测内容的曝光信息确定预设监测内容在待监测对象中的曝光情况,从而实现对预设监测内容在待监测对象中的曝光情况的监测。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本公开的示例性实施例提供的内容监测方法的流程图;
图2示出了本公开的示例性实施例提供的获取匹配次数的一种流程图;
图3示出了本公开的示例性实施例提供的获取匹配次数的另一种流程图;
图4示出了本公开的示例性实施例提供的内容监测装置的结构示意图;
图5示出了本公开的示例性实施例提供的内容监测装置中获得单元的一种结构示意图;
图6示出了本公开的示例性实施例提供的内容监测装置中获得单元的另一种结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
请参阅图1,其示出了本公开的示例性实施例提供的内容监测方法的流程图,用以对预设监测内容在待监测对象中的曝光信息的监测。其中图1所示内容监测方法可以包括以下步骤:
101:获取待监测对象以及待监测对象对应的预设监测内容。
可以理解的是:待监测对象可以是影音形式的监测对象,如视频对象和音频对象中的至少一种,预设监测内容是预先设置的用于监测待监测对象中出现的特定内容。如预设监测内容可以是任意品牌的品牌标识内容(如品牌下的产品名称)和任意品牌的预设广告内容(如品牌下产品的广告语、宣传语等等)中的至少一种,如待监测对象是某个娱乐节目的视频文件,则预设监测内容可以是某个品牌下的产品名称,以监测某个品牌下的产品名称在该视频文件中的曝光情况。
在本公开的示例性实施例中,待监测对象可以通过线上爬取或者离线下载方式获取,而对于预设监测内容的具体内容可以视待监测对象以及用户需求而定,本公开的示例性实施例不再详述。
102:获取待监测对象对应的文本内容,并对待监测对象对应的文本内容进行分词处理,得到待监测对象对应的文本内容的至少一个词语。
其中文本内容是对待监测对象中的内容进行识别得到,在本公开的示例性实施例中,获取文本内容的一种可行方式是:从待监测对象中提取出视频内容,并基于图像识别技术识别出视频内容记录的文本内容,如可以基于图像识别技术识别出视频内容中出现的文本,和/或,基于图像识别技术识别出视频内容中出现的标识内容(如品牌的logo),并确定标识内容对应的文本。
获取文本内容的另一种可行方式是:从待监测对象中提取出音频内容,并基于语音识别技术将音频内容转换为文本内容;获取文本内容的再一种可行方式是:从待监测对象中提取出音频内容和视频内容,基于图像识别技术识别出视频内容记录的文本内容,基于语音识别技术将音频内容转换为文本内容。
上述图像识别技术和语音识别技术可以是预训练得到的图像识别模型和语音识别模型,基于图像识别模型识别出视频内容记录的文本内容,基于语音识别模型将音频内容转换为文本内容。当然也可以采用其他方式获取文本内容,如基于第三方提供的应用程序获取文本内容。
并且在获取文本内容时可以每提取出一条视频内容或音频内容,就可以对该视频内容或音频内容进行处理,以得到每条视频内容或音频内容对应的文本内容,也就是说本公开的示例性实施例获取到待监测对象对应的至少一个文本内容,且每个文本内容彼此独立,这样在分词处理时可以对每个文本内容进行分词处理,得到每个文本内容的至少一个词语。或者可以在提取到所有视频内容或音频内容后,对所有视频内容或音频内容进行处理,以得到所有视频内容或音频内容对应的文本内容,也就是说本公开的示例性实施例获取到待监测对象对应的一个文本内容,该文本内容是从待监测对象中识别出的所有文本的集合。
在这里需要说明的一点是:在待监测对象中提取音频内容和视频内容的情况下,可能存在一种情况:在待监测对象的一个播放时间下均提取到音频内容和视频内容,并且从音频内容和视频内容中均识别出同一个文本内容,则可以仅保留一个文本内容。
103:在至少一个词语与预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到预设监测内容的曝光信息。其中预设监测内容的曝光信息用于表明预设监测内容在待监测对象中的出现情况,如曝光信息包括:出现次数和出现时长中的至少一种,出现次数用于表明预设监测内容在待监测对象中出现的次数,出现时长用于表明预设监测内容在待监测对象的哪些时间段内出现以及出现多长时间。
在本公开的示例性实施例中,基于匹配的至少一个词语对应的待监测对象,得到预设监测内容的曝光信息的一种可行方式是:在至少一个词语与预设监测内容匹配的情况下,获取与预设监测内容匹配的词语在待监测对象中的出现时长,将与预设监测内容匹配的词语在待监测对象中的出现时长确定为曝光信息中的出现时长。
基于匹配的至少一个词语对应的待监测对象,得到预设监测内容的曝光信息的另一种可行方式是:在至少一个词语与预设监测内容匹配的情况下,获取至少一个词语中词语与预设监测内容一致的词语数量,并将词语数量确定为曝光信息中的出现次数。
在上述两种得到曝光信息的可行方式中,确定至少一个词语与预设监测内容匹配的可行方式可以是:在至少一个词语中词语与预设监测内容中的词语一致的情况下,确定至少一个词语与预设监测内容匹配。
从上述技术方案可知,在获取待监测对象后,获取待监测对象对应的文本内容,并对待监测对象对应的文本内容进行分词处理,得到待监测对象对应的文本内容的至少一个词语,在至少一个词语与待监测对象对应的预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到预设监测内容的曝光信息,这样就可以基于预设监测内容的曝光信息确定预设监测内容在待监测对象中的曝光情况,从而实现对预设监测内容在待监测对象中的曝光情况的监测。
在本公开的示例性实施例中,获取词语数量的可行方式包括但不限于下述方式:第一种方式如图2所示,其阐述预设监测内容为品牌标识内容的情况下获取词语数量的过程,具体可以包括以下步骤:
201:在预设监测内容为品牌标识内容的情况下,将至少一个词语与品牌标识内容进行匹配。可以理解的是:品牌标识内容用于对品牌进行区分,确定当前监测的是哪个品牌下的产品,该品牌标识内容可以用品牌下产品的名称表示。
202:在至少一个词语中有与品牌标识内容相同的词语的情况下,确定至少一个词语与品牌标识内容匹配。
203:获取至少一个词语中词语与品牌标识内容相同的词语数量。在获取到待监测对象对应的至少一个文本内容(文本内容彼此独立)的情况下,对每个文本内容:获取该文本内容的至少一个词语中词语与品牌标识内容相同的词语子数量,将每个文本内容的词语子数量之和作为词语数量。在获取到待监测对象对应的一个文本内容(即文本内容为一个内容集合)的情况下,直接获取此文本内容的至少一个词语中词语与品牌标识内容相同的词语数量。
第二种方式如图3所示,其阐述预设监测内容为预设广告内容的情况下获取词语数量的过程,具体可以包括以下步骤:
301:在预设监测内容为预设广告内容的情况下,将至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合。可以理解的是:预设广告内容可以是品牌下产品的广告语、宣传语等等,具体可以视用户的实际需求而定。在本公开的示例性实施例中,将至少一个词语中的词语按照预设组合条件进行组合的方式包括但不限于下述方式:
一种可行方式是:对至少一个词语中的第i个词语,将第i个词语至第i+N个词语组合为一个词语集合,即将在至少一个词语中排序相邻的N个词语组合为一个词语集合。其中i和N为自然数,i为1至M-N中的任意一个自然数,M为大于1的自然数,且M为至少一个词语中的词语总数。
将至少一个词语中词语按照预设组合条件进行组合的另一种可行方式是:对至少一个词语中的第j个词语,获取位于第j个词语之后且与第j个词语间隔A个词语的词语,将该词语与第j个词语进行两两组合,得到一个词语集合,其中j和A为自然数,i为1至B-A中的任意一个自然数,B为大于1的自然数,且B为至少一个词语中的词语总数。当然在进行两两组合后还可以将相邻的至少两个词语集合进行再次组合,其中相邻是指两个词语集合中有相同的词语,具体组合几个词语集合视实际应用而定,对此本公开的示例性实施例不对其取值进行限制。
302:对每个词语集合:在该词语集合中的所有词语均出现在预设广告内容的情况下,确定至少一个词语与预设广告内容匹配。
303:获取所有词语均出现在预设广告内容的词语集合的集合数量,并将集合数量确定为词语数量。
与上述方法实施例相对应,本发明实施例还提供一种内容监测装置,其可选结构如图4所示,可以包括:获取单元11和获得单元12。
获取单元11,用于获取待监测对象以及待监测对象对应的预设监测内容,以及用于获取待监测对象对应的文本内容,并对待监测对象对应的文本内容进行分词处理,得到待监测对象对应的文本内容的至少一个词语。
可以理解的是:待监测对象可以是影音形式的监测对象,如视频对象和音频对象中的至少一种,预设监测内容是预先设置的用于监测待监测对象中出现的特定内容。如预设监测内容可以是任意品牌的品牌标识内容(如品牌下的产品名称)和任意品牌的预设广告内容(如品牌下产品的广告语、宣传语等等)中的至少一种,如待监测对象是某个娱乐节目的视频文件,则预设监测内容可以是某个品牌下的产品名称,以监测某个品牌下的产品名称在该视频文件中的曝光情况。
在本公开的示例性实施例中,待监测对象可以通过线上爬取或者离线下载方式获取,而对于预设监测内容的具体内容可以视待监测对象以及用户需求而定,本公开的示例性实施例不再详述。
相应的,获取单元11获取文本内容的可行方式包括但不限于:从待监测对象中提取出视频内容,并基于图像识别技术识别出视频内容记录的文本内容;或者从待监测对象中提取出音频内容,并基于语音识别技术将音频内容转换为文本内容;或者从待监测对象中提取出音频内容和视频内容,基于图像识别技术识别出视频内容记录的文本内容,基于语音识别技术将音频内容转换为文本内容,具体请参阅方法实施例中的相关说明。
获得单元12,用于在至少一个词语与预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到预设监测内容的曝光信息。其中预设监测内容的曝光信息用于表明预设监测内容在待监测对象中的出现情况,如曝光信息包括:出现次数和出现时长中的至少一种,出现次数用于表明预设监测内容在待监测对象中出现的次数,出现时长用于表明预设监测内容在待监测对象的哪些时间段内出现以及出现多长时间。
在本公开的示例性实施例中,获得单元12得到预设监测内容的曝光信息的一种可行方式是:在至少一个词语与预设监测内容匹配的情况下,获取与预设监测内容匹配的词语在待监测对象中的出现时长,将与预设监测内容匹配的词语在待监测对象中的出现时长确定为曝光信息中的出现时长。
在本公开的示例性实施例中,获得单元12得到预设监测内容的曝光信息的另一种可行方式是:在至少一个词语与预设监测内容匹配的情况下,获取至少一个词语中词语与预设监测内容一致的词语数量,并将词语数量确定为曝光信息中的出现次数。
在上述两种得到曝光信息的可行方式中,确定至少一个词语与预设监测内容匹配的可行方式可以是:在至少一个词语中词语与预设监测内容中的词语一致的情况下,确定至少一个词语与预设监测内容匹配。
从上述技术方案可知,在获取待监测对象后,获取待监测对象对应的文本内容,并对待监测对象对应的文本内容进行分词处理,得到待监测对象对应的文本内容的至少一个词语,在至少一个词语与待监测对象对应的预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到预设监测内容的曝光信息,这样就可以基于预设监测内容的曝光信息确定预设监测内容在待监测对象中的曝光情况,从而实现对预设监测内容在待监测对象中的曝光情况的监测。
在本公开的示例性实施例中,获取单元11的一种可选结构如图5所示,可以包括:第一匹配子单元111、确定子单元112和第一获取子单元113。
第一匹配子单元111,用于在预设监测内容为品牌标识内容的情况下,将至少一个词语与品牌标识内容进行匹配。
确定子单元112,用于在至少一个词语中有与品牌标识内容相同的词语的情况下,确定至少一个词语与品牌标识内容匹配。
第一获取子单元113,用于获取至少一个词语中词语与品牌标识内容相同的词语数量。
在本公开的示例性实施例中,获取单元11的一种可选结构如图6所示,可以包括:组合子单元114、第二匹配子单元115和第二获得子单元116。
组合子单元114,用于在预设监测内容为预设广告内容的情况下,将至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合。
第二匹配子单元115,用于对每个词语集合:在该词语集合中的所有词语均出现在预设广告内容的情况下,确定至少一个词语与预设广告内容匹配。
第二获得子单元116,用于获取所有词语均出现在预设广告内容的词语集合的集合数量,并将集合数量确定为词语数量。
对于上述第一匹配子单元111、确定子单元112、第一获取子单元113、组合子单元114、第二匹配子单元115和第二获得子单元116的具体实施请参阅方法实施例中的相关说明,对此本示例性实施例不再阐述。
上述内容监测装置包括处理器和存储器,上述获取单元11和获得单元12等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现对预设监测内容在待监测对象中的曝光情况的监测。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述内容监测方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述内容监测方法。
本发明实施例提供了一种设备,本文中的设备可以是服务器、PC、PAD、手机等,其中设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取待监测对象以及所述待监测对象对应的预设监测内容;
获取所述待监测对象对应的文本内容,并对所述待监测对象对应的文本内容进行分词处理,得到所述待监测对象对应的文本内容的至少一个词语;
在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:
在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量;
将所述词语数量确定为曝光信息中的出现次数。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量包括:
在所述预设监测内容为品牌标识内容的情况下,将所述至少一个词语与所述品牌标识内容进行匹配;
在所述至少一个词语中有与所述品牌标识内容相同的词语的情况下,确定所述至少一个词语与所述品牌标识内容匹配;
获取所述至少一个词语中词语与所述品牌标识内容相同的词语数量;
或者,所述在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量包括:
在所述预设监测内容为预设广告内容的情况下,将所述至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合;
对每个词语集合:在该词语集合中的所有词语均出现在所述预设广告内容的情况下,确定所述至少一个词语与所述预设广告内容匹配;
获取所有词语均出现在所述预设广告内容的词语集合的集合数量,并将所述集合数量确定为所述词语数量。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:
在所述至少一个词语与所述预设监测内容匹配的情况下,获取与所述预设监测内容匹配的词语在所述待监测对象中的出现时长;
将与所述预设监测内容匹配的词语在所述待监测对象中的出现时长确定为所述曝光信息中的出现时长。
本发明实施例还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取待监测对象以及所述待监测对象对应的预设监测内容;
获取所述待监测对象对应的文本内容,并对所述待监测对象对应的文本内容进行分词处理,得到所述待监测对象对应的文本内容的至少一个词语;
在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:
在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量;
将所述词语数量确定为曝光信息中的出现次数。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量包括:
在所述预设监测内容为品牌标识内容的情况下,将所述至少一个词语与所述品牌标识内容进行匹配;
在所述至少一个词语中有与所述品牌标识内容相同的词语的情况下,确定所述至少一个词语与所述品牌标识内容匹配;
获取所述至少一个词语中词语与所述品牌标识内容相同的词语数量;
或者,所述在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量包括:
在所述预设监测内容为预设广告内容的情况下,将所述至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合;
对每个词语集合:在该词语集合中的所有词语均出现在所述预设广告内容的情况下,确定所述至少一个词语与所述预设广告内容匹配;
获取所有词语均出现在所述预设广告内容的词语集合的集合数量,并将所述集合数量确定为所述词语数量。
优选地,所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:
在所述至少一个词语与所述预设监测内容匹配的情况下,获取与所述预设监测内容匹配的词语在所述待监测对象中的出现时长;
将与所述预设监测内容匹配的词语在所述待监测对象中的出现时长确定为所述曝光信息中的出现时长。
本领域内的技术人员应明白,本发明实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (6)
1.一种内容监测方法,其特征在于,所述方法包括:
获取待监测对象以及所述待监测对象对应的预设监测内容;
获取所述待监测对象对应的文本内容,并对所述待监测对象对应的文本内容进行分词处理,得到所述待监测对象对应的文本内容的至少一个词语;
在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息;
所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量;将所述词语数量确定为曝光信息中的出现次数;
所述在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量包括:
在所述预设监测内容为品牌标识内容的情况下,将所述至少一个词语与所述品牌标识内容进行匹配;在所述至少一个词语中有与所述品牌标识内容相同的词语的情况下,确定所述至少一个词语与所述品牌标识内容匹配;获取所述至少一个词语中词语与所述品牌标识内容相同的词语数量;或者,在所述预设监测内容为预设广告内容的情况下,将所述至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合;对每个词语集合:在该词语集合中的所有词语均出现在所述预设广告内容的情况下,确定所述至少一个词语与所述预设广告内容匹配;获取所有词语均出现在所述预设广告内容的词语集合的集合数量,并将所述集合数量确定为所述词语数量。
2.根据权利要求1所述的方法,其特征在于,所述在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息包括:
在所述至少一个词语与所述预设监测内容匹配的情况下,获取与所述预设监测内容匹配的词语在所述待监测对象中的出现时长;
将与所述预设监测内容匹配的词语在所述待监测对象中的出现时长确定为所述曝光信息中的出现时长。
3.一种内容监测装置,其特征在于,所述装置包括:
获取单元,用于获取待监测对象以及所述待监测对象对应的预设监测内容,以及用于获取所述待监测对象对应的文本内容,并对所述待监测对象对应的文本内容进行分词处理,得到所述待监测对象对应的文本内容的至少一个词语;
获得单元,用于在所述至少一个词语与所述预设监测内容匹配的情况下,基于匹配的至少一个词语对应的待监测对象,得到所述预设监测内容的曝光信息;其中,所述获得单元,用于在所述至少一个词语与所述预设监测内容匹配的情况下,获取所述至少一个词语中词语与所述预设监测内容一致的词语数量,并将所述词语数量确定为曝光信息中的出现次数;
所述获得单元包括:第一匹配子单元、确定子单元和第一获取子单元;所述第一匹配子单元,用于在所述预设监测内容为品牌标识内容的情况下,将所述至少一个词语与所述品牌标识内容进行匹配;所述确定子单元,用于在所述至少一个词语中有与所述品牌标识内容相同的词语的情况下,确定所述至少一个词语与所述品牌标识内容匹配;所述第一获取子单元,用于获取所述至少一个词语中词语与所述品牌标识内容相同的词语数量;
或者,所述获得单元包括:组合子单元、第二匹配子单元和第二获得子单元;所述组合子单元,用于在所述预设监测内容为预设广告内容的情况下,将所述至少一个词语中的词语按照预设组合条件进行组合,得到至少一个词语集合;所述第二匹配子单元,用于对每个词语集合:在该词语集合中的所有词语均出现在所述预设广告内容的情况下,确定所述至少一个词语与所述预设广告内容匹配;所述第二获得子单元,用于获取所有词语均出现在所述预设广告内容的词语集合的集合数量,并将所述集合数量确定为所述词语数量。
4.根据权利要求3所述的装置,其特征在于,所述获得单元,用于在所述至少一个词语与所述预设监测内容匹配的情况下,获取与所述预设监测内容匹配的词语在所述待监测对象中的出现时长,并将与所述预设监测内容匹配的词语在所述待监测对象中的出现时长确定为所述曝光信息中的出现时长。
5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1或2所述的内容监测方法。
6.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1或2所述的内容监测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710888264.9A CN109558581B (zh) | 2017-09-27 | 2017-09-27 | 一种内容监测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710888264.9A CN109558581B (zh) | 2017-09-27 | 2017-09-27 | 一种内容监测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109558581A CN109558581A (zh) | 2019-04-02 |
CN109558581B true CN109558581B (zh) | 2022-09-27 |
Family
ID=65863685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710888264.9A Active CN109558581B (zh) | 2017-09-27 | 2017-09-27 | 一种内容监测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109558581B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104518943A (zh) * | 2013-09-27 | 2015-04-15 | 无锡华润微电子有限公司 | 电子邮件管理方法和系统 |
CN105740121A (zh) * | 2016-01-26 | 2016-07-06 | 中国银行股份有限公司 | 一种日志文本监控与预警方法、装置 |
KR20160098564A (ko) * | 2015-02-09 | 2016-08-19 | 김남주 | 언어 노출 정도 모니터링 장치 및 방법 |
CN106156642A (zh) * | 2016-07-28 | 2016-11-23 | 宇龙计算机通信科技(深圳)有限公司 | 数据加密方法及装置 |
-
2017
- 2017-09-27 CN CN201710888264.9A patent/CN109558581B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104518943A (zh) * | 2013-09-27 | 2015-04-15 | 无锡华润微电子有限公司 | 电子邮件管理方法和系统 |
KR20160098564A (ko) * | 2015-02-09 | 2016-08-19 | 김남주 | 언어 노출 정도 모니터링 장치 및 방법 |
CN105740121A (zh) * | 2016-01-26 | 2016-07-06 | 中国银行股份有限公司 | 一种日志文本监控与预警方法、装置 |
CN106156642A (zh) * | 2016-07-28 | 2016-11-23 | 宇龙计算机通信科技(深圳)有限公司 | 数据加密方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109558581A (zh) | 2019-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106940705B (zh) | 一种用于构建用户画像的方法与设备 | |
CN110582025B (zh) | 用于处理视频的方法和装置 | |
CN106649316B (zh) | 一种视频推送方法及装置 | |
CN108108996B (zh) | 视频中的广告投放方法、装置、计算机设备及可读介质 | |
US9465892B2 (en) | Associating metadata with media objects using time | |
CN108520046B (zh) | 搜索聊天记录的方法及设备 | |
CN109002443B (zh) | 一种文本信息的分类方法及装置 | |
US20150262238A1 (en) | Techniques for Topic Extraction Using Targeted Message Characteristics | |
CN110569502A (zh) | 一种违禁广告语的识别方法、装置、计算机设备及存储介质 | |
US20150365451A1 (en) | Method, apparatus and system for presenting mobile media information | |
CN109472722B (zh) | 获得待生成裁判文书经审理查明段相关信息的方法及装置 | |
CN109598171A (zh) | 一种基于二维码的数据处理方法、装置及系统 | |
CN114742582A (zh) | 基于用户终端的广告投放方法、服务器及存储介质 | |
CN114553813A (zh) | 基于银行业务的消息推送方法和装置、处理器及电子设备 | |
CN110569429B (zh) | 一种内容选择模型的生成方法、装置和设备 | |
CN110162793A (zh) | 一种命名实体的识别方法及相关设备 | |
CN109558581B (zh) | 一种内容监测方法及装置 | |
US9514501B2 (en) | Systems and methods for multimedia-processing | |
CN110019508B (zh) | 一种数据同步方法、装置及系统 | |
CN111381901A (zh) | 一种语音播报方法和系统 | |
CN108460131B (zh) | 一种分类标签处理方法及装置 | |
CN106971306B (zh) | 产品问题的识别方法及系统 | |
CN108268545B (zh) | 一种分级的用户标签库的创建的方法和装置 | |
WO2014198111A1 (en) | Systems and methods for multimedia-processing | |
CN112508472A (zh) | 多人查看同一账号下订单信息的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd. Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A Applicant before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |