CN108170742A - 图片舆情获取方法、装置、计算机设备及存储介质 - Google Patents

图片舆情获取方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN108170742A
CN108170742A CN201711373612.5A CN201711373612A CN108170742A CN 108170742 A CN108170742 A CN 108170742A CN 201711373612 A CN201711373612 A CN 201711373612A CN 108170742 A CN108170742 A CN 108170742A
Authority
CN
China
Prior art keywords
picture
monitoring entity
information
recognizing
describing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711373612.5A
Other languages
English (en)
Inventor
刘俐岑
王璐
韦庭
卓泽成
张晓聪
吴伟佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711373612.5A priority Critical patent/CN108170742A/zh
Publication of CN108170742A publication Critical patent/CN108170742A/zh
Priority to US16/224,490 priority patent/US20190188224A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了图片舆情获取方法、装置、计算机设备及存储介质,其中方法包括:获取信息来源及监控实体;从信息来源获取实时流数据;针对实时流数据中的每张图片,分别对图片进行预定内容识别,得到识别结果;根据识别结果确定图片与监控实体是否相匹配,若匹配,则生成图片对应的舆情信息并存储。应用本发明所述方案,能够获取到图片类舆情信息。

Description

图片舆情获取方法、装置、计算机设备及存储介质
【技术领域】
本发明涉及计算机应用技术,特别涉及图片舆情获取方法、装置、计算机设备及存储介质。
【背景技术】
目前的舆情监控系统主要是从各媒体网站、社交平台、移动端采集文本类舆情信息。但随着技术的发展,越来越多的舆情信息采用富媒体的方式发布和传播,如图片。
现有的舆情获取工具均是传统的文本舆情工具,对于如何获取图片舆情,现有技术中还没有一种有效的解决方式。
【发明内容】
有鉴于此,本发明提供了图片舆情获取方法、装置、计算机设备及存储介质。
具体技术方案如下:
一种图片舆情获取方法,包括:
获取信息来源及监控实体;
从所述信息来源获取实时流数据;
针对所述实时流数据中的每张图片,分别对所述图片进行预定内容识别,得到识别结果;
根据所述识别结果确定所述图片与所述监控实体是否相匹配,若匹配,则生成所述图片对应的舆情信息并存储。
根据本发明一优选实施例,所述从所述信息来源获取实时流数据之前,进一步包括:获取所述监控实体的描述信息;
所述根据所述识别结果确定所述图片与所述监控实体是否相匹配包括:
通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配。
根据本发明一优选实施例,所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述对所述图片进行预定内容识别包括:对所述图片进行文本信息识别和人像信息识别;
所述通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配包括:
若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配;
或者,若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配。
根据本发明一优选实施例,所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述对所述图片进行预定内容识别包括:对所述图片进行文本信息识别和logo信息识别;
所述通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配包括:
若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配;
或者,若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配。
根据本发明一优选实施例,所述生成所述图片对应的舆情信息并存储之前,进一步包括:
确定是否已经存储有所述图片对应的舆情信息;
若是,则将所述图片对应的舆情信息与已存储的舆情信息进行合并;
若否,则生成所述图片对应的舆情信息并存储。
根据本发明一优选实施例,所述生成所述图片对应的舆情信息并存储包括:
按照预定的信息结构化格式,生成所述图片对应的舆情信息并存储。
一种图片舆情获取装置,包括:第一获取单元、第二获取单元、识别单元、匹配单元以及存储单元;
所述第一获取单元,用于获取信息来源及监控实体;
所述第二获取单元,用于从所述信息来源获取实时流数据;
所述识别单元,用于针对所述实时流数据中的每张图片,分别对所述图片进行预定内容识别,得到识别结果;
所述匹配单元,用于根据所述识别结果确定所述图片与所述监控实体是否相匹配;
所述存储单元,用于当所述图片与所述监控实体相匹配时,生成所述图片对应的舆情信息并存储。
根据本发明一优选实施例,所述第一获取单元进一步用于,获取所述监控实体的描述信息;
所述匹配单元通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配。
根据本发明一优选实施例,所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述识别单元对所述图片进行文本信息识别和人像信息识别;
所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配;
或者,所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配。
根据本发明一优选实施例,所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述识别单元对所述图片进行文本信息识别和logo信息识别;
所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配;
或者,所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配。
根据本发明一优选实施例,所述存储单元进一步用于,在生成所述图片对应的舆情信息并存储之前,确定是否已经存储有所述图片对应的舆情信息,若是,则将所述图片对应的舆情信息与已存储的舆情信息进行合并,若否,则生成所述图片对应的舆情信息并存储。
根据本发明一优选实施例,所述存储单元按照预定的信息结构化格式,生成所述图片对应的舆情信息并存储。
一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
基于上述介绍可以看出,采用本发明所述方案,可首先获取信息来源及监控实体,并从信息来源获取实时流数据,进而可针对实时流数据中的每张图片,分别对其进行预定内容识别,从而得到识别结果,进而可根据识别结果确定图片与监控实体是否相匹配,若匹配,则可生成图片对应的舆情信息并存储,从而实现了图片类舆情信息的获取,弥补了现有技术中未能覆盖图片类舆情场景的不足。
【附图说明】
图1为本发明所述图片舆情获取方法实施例的流程图。
图2为现有包括人像的图片示意图。
图3为现有包括logo的图片示意图。
图4为现有包括文本信息的图片示意图。
图5为本发明所述图片舆情获取方法的整体实现过程示意图。
图6为本发明所述图片舆情获取装置实施例的组成结构示意图。
图7示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。
【具体实施方式】
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案进行进一步说明。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明所述图片舆情获取方法实施例的流程图。如图1所示,包括以下具体实现方式。
在101中,获取信息来源及监控实体。
在102中,从信息来源获取实时流数据。
在103中,针对实时流数据中的每张图片,分别对其进行预定内容识别,得到识别结果。
在104中,根据识别结果确定图片与监控实体是否相匹配,若匹配,则生成图片对应的舆情信息并存储。
本实施例中,需要首先获取信息来源及监控实体。
信息来源即指从哪里获取信息,可根据实际需要人工定义信息来源,如微博、贴吧、论坛、新闻站点等。
另外,还可定义一个或多个监控实体,同时还可定义监控实体的描述信息,监控实体的描述信息中可包括用于描述监控实体的关键词以及用于描述监控实体的图片等。
比如,监控实体为一个人,那么用于描述该监控实体的关键词可以是指这个人的名字或职务等,用于描述该监控实体的图片可以是指这个人的人像图片等,人像图片通常是指包括人脸的人物图片。
再比如,监控实体为某一品牌,那么用于描述该监控实体的关键词可以是指该品牌的中文名称等,用于描述该监控实体的图片可以是指该品牌的logo图片等。
可从各信息来源获取实时流数据,即对接各信息来源的实时流数据,如可包括微博的实时流数据、贴吧的实时流数据以及新闻站点的实时流数据等。
在获取到实时流数据之后,可首先对其进行垃圾过滤,即过滤掉其中的广告、色情等内容。之后,可针对进行垃圾过滤后的实时流数据中的每张图片,分别对其进行预定内容识别,从而得到识别结果,并根据识别结果确定出图片与监控实体是否相匹配,若匹配,则可生成图片对应的舆情信息并存储。
对图片进行预定内容识别可以包括:对图片进行文本信息识别和人像信息识别、对图片进行文本信息识别和logo信息识别等。
图2为现有包括人像的图片示意图。可以采用现有的人脸检测等技术,识别出图片的人像信息。
图3为现有包括logo信息的图片示意图。可以采用现有的商标图像检索技术,利用sift算子进行识别等,识别出图片中的logo信息。
图4为现有包括文本信息的图片示意图。可以采用现有的光学字符识别(OCR,Optical Character Recognition)等方式,识别出图片中的文本信息。
在获取到图片的识别结果后,可通过比较识别结果以及监控实体的描述信息,确定图片与监控实体是否相匹配。
比如,若识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,或者,识别到人像信息且识别到的人像中包括用于描述监控实体的图片中的人像,则确定图片与监控实体相匹配。
或者,若识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,并且,识别到人像信息且识别到的人像中包括用于描述监控实体的图片中的人像,则确定图片与监控实体相匹配。
再比如,若识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,或者,识别到logo信息且识别到的logo中包括用于描述监控实体的图片中的logo,则确定图片与监控实体相匹配。
或者,若识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,并且,识别到logo信息且识别到的logo中包括用于描述监控实体的图片中的logo,则确定图片与监控实体相匹配。
在实际应用中,用于描述监控实体的图片中的人像数或logo数通常为一个,而识别到的人像数或logo数可能为一个,也可能大于一个。
另外,用于描述监控实体的关键词的个数可以是一个,也可以是多个,如果是多个,那么在进行是否匹配的判断时,可以要求识别到的文本信息中包括任意一个或多个用于描述监控实体的关键词,或者,要求识别到的文本信息中必须包括全部的用于描述监控实体的关键词。
假设监控实体为一个人,那么可分别对实时流数据中的图片进行人像识别和文本信息识别,如果能够识别到人像信息和文本信息,那么可进一步确定识别到的人像中是否包括用于描述该监控实体的图片中的人像以及识别到的文本信息中是否包括用于描述该监控实体的关键词,若两者均符合,则可判定图片与该监控实体相匹配,或者,有一个符合,则可判定图片与监控实体相匹配。
假设监控实体为某一品牌,那么可分别对实时流数据中的图片进行logo识别和文本信息识别,如果能够识别到logo信息和文本信息,那么可进一步确定识别到的logo中是否包括用于描述该监控实体的图片中的logo以及识别到的文本信息中是否包括用于描述该监控实体的关键词,若两者均符合,则可判定图片与该监控实体相匹配,或者,有一个符合,则可判定图片与监控实体相匹配。
若图片与监控实体相匹配,可进一步生成图片对应的舆情信息并存储。
较佳地,可首先确定是否已经存储有图片对应的舆情信息,若是,则将图片对应的舆情信息与已存储的舆情信息进行合并,若否,则生成图片对应的舆情信息并存储,具体地,可按照预定的信息结构化格式,生成图片对应的舆情信息并存储。
信息结构化格式可如下所示。
假设用户发布的一条微博信息中包括一张图片,图片与监控实体相匹配,那么图片对应的舆情信息中可包括:发布时间、用户关注数、用户粉丝数、用户名、头像统一资源定位符(URL,Uniform Resoure Locator)、本贴内容、本贴用户发布微博数、本贴用户是否认证、本贴url、本贴转发数、本帖评论数、本帖点赞数、匹配上的图片url、图片匹配的类型(文字、人物(人像)、logo等)、情感倾向、人物或logo坐标、信息类型(商品发布、生活照片、吐槽谩骂等)等。
假设某一微信公众号发布的一条微信信息中包括一张图片,图片与监控实体相匹配,那么图片对应的舆情信息中可包括:正文、标题、url、发布时间、点赞数、阅读数、评论数、公众号名称、公众号主页、匹配上的图片url、图片匹配的类型、情感倾向、人物或logo坐标、信息类型等。
假设头条号发布的一条信息中包括一张图片,图片与监控实体相匹配,那么图片对应的舆情信息中可包括:正文、标题、url、发布时间、赞赏数、点赞数、评论数、头条号名称、头条号关注数、头条号粉丝数、匹配上的图片url、图片匹配的类型、情感倾向、人物或logo坐标、信息类型等。
假设某一贴吧中的一条信息中包括一张图片,图片与监控实体相匹配,那么图片对应的舆情信息中可包括:标题、创建时间、用户名称、主贴内容、回复贴内容、回复贴数量、匹配上的图片url、图片匹配的类型、情感倾向、人物或logo坐标、信息类型等。
假设某一论坛/社区中的一条信息中包括一张图片,图片与监控实体相匹配,那么图片对应的舆情信息中可包括:标题、正文、评论数、点赞数、用户名称、匹配上的图片url、图片匹配的类型、情感倾向、头像或logo坐标、信息类型等。
假设某一新闻站点发布的一条新闻中包括一张图片,图片与监控实体相匹配,那么图片对应的舆情信息中可包括:标题、正文、发布时间、新闻来源、阅读数、评论数、点赞数、匹配上的图片url、图片匹配的类型、情感倾向、人物或logo坐标等。
需要说明是,以上所述信息结构化格式仅为举例说明,并不用于限制本发明的技术方案,具体包括哪些内容可根据实际需要而定,不限于以上所示。
在实际应用中,由于各种原因,可能会导致已经存储有图片对应的舆情信息,那么则可将图片对应的舆情信息与已存储的舆情信息进行合并。
比如,不同的新闻站点中发布了同一条新闻,但时间上有先有后,另外,该新闻中包括的图片与监控实体相匹配,那么在对较后发布的新闻中的图片进行处理时,就会发现已经存储有图片对应的舆情信息,相应地,则可进行合并处理,另外,某一用户发布了一条微博信息,其他多个用户进行了转发,该微博信息中包括的图片与监控实体相匹配,那么,“转发”与“被转发”对应的舆情信息则可进行合并。如何进行合并不作限制,只要能够体现出上述关系等即可。
基于上述介绍,图5为本发明所述图片舆情获取方法的整体实现过程示意图。如图5所示,首先,获取定义的信息来源及监控实体;之后,从信息来源获取实时流数据;针对实时流数据中的每张图片,分别对其进行文本信息识别和人像信息或logo信息识别;确定识别到的文本信息中是否包括用于描述监控实体的关键词以及识别到的人像或logo中是否包括用于描述监控实体的图片中的人像或logo,即确定识别到的文本信息是否与用于描述监控实体的关键词相匹配以及识别到的人像或logo是否与用于描述监控实体的图片相匹配,若是,则确定图片与监控实体相匹配;进一步地,确定是否已经存储有图片对应的舆情信息,若是,则将图片对应的舆情信息与已存储的舆情信息进行合并,否则,按照预定的信息结构化格式,生成图片对应的舆情信息并存储。
总之,采用上述方法实施例所述方案,实现了图片类舆情信息的获取,弥补了现有技术中未能覆盖图片类舆情场景的不足,从而可以全面准确地获取各种形式的网民舆论。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
图6为本发明所述图片舆情获取装置实施例的组成结构示意图。如图6所示,包括:第一获取单元601、第二获取单元602、识别单元603、匹配单元604以及存储单元605。
第一获取单元601,用于获取信息来源及监控实体。
第二获取单元602,用于从信息来源获取实时流数据。
识别单元603,用于针对实时流数据中的每张图片,分别对图片进行预定内容识别,得到识别结果。
匹配单元604,用于根据识别结果确定图片与监控实体是否相匹配。
存储单元605,用于当图片与监控实体相匹配时,生成图片对应的舆情信息并存储。
第一获取单元601可获取定义的信息来源及监控实体,并可进一步获取监控实体的描述信息。监控实体的描述信息中可包括用于描述监控实体的关键词以及用于描述监控实体的图片等。
相应地,第二获取单元602可从各信息来源获取实时流数据,即对接各信息来源的实时流数据,如可包括微博的实时流数据、贴吧的实时流数据以及新闻站点的实时流数据等。
识别单元603可针对实时流数据中的每张图片,分别对其进行预定内容识别,从而得到识别结果。
之后,匹配单元604可通过比较识别结果以及监控实体的描述信息,确定出图片与监控实体是否相匹配。
其中,识别单元603可对图片进行文本信息识别和人像信息识别。
相应地,匹配单元604确定识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,或者,识别到人像信息且识别到的人像中包括用于描述监控实体的图片中的人像,则可确定图片与监控实体相匹配。
或者,匹配单元604确定识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,并且,识别到人像信息且识别到的人像中包括用于描述监控实体的图片中的人像,则可确定图片与监控实体相匹配。
识别单元603还可对图片进行文本信息识别和logo信息识别。
相应地,匹配单元604确定识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,或者,识别到logo信息且识别到的logo中包括用于描述监控实体的图片中的logo,则可确定图片与监控实体相匹配。
或者,匹配单元604确定识别到文本信息且识别到的文本信息中包括用于描述监控实体的关键词,并且,识别到logo信息且识别到的logo中包括用于描述监控实体的图片中的logo,则可确定图片与监控实体相匹配。
若图片与监控实体相匹配,存储单元605可进一步生成图片对应的舆情信息并存储。
较佳地,在生成图片对应的舆情信息并存储之前,存储单元605可首先确定是否已经存储有图片对应的舆情信息,若是,则将图片对应的舆情信息与已存储的舆情信息进行合并,若否,则生成图片对应的舆情信息并存储,具体地,存储单元605可按照预定的信息结构化格式,生成图片对应的舆情信息并存储。
图6所示装置实施例的具体工作流程请参照前述方法实施例中的相应说明,不再赘述。
图7示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图7显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器(处理单元)16,存储器28,连接不同系统组件(包括存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现图1所示实施例中的方法,即获取信息来源及监控实体,从信息来源获取实时流数据,针对实时流数据中的每张图片,分别对图片进行预定内容识别,得到识别结果,根据识别结果确定图片与监控实体是否相匹配,若匹配,则生成图片对应的舆情信息并存储等。
具体实现请参照前述各实施例中的相关说明,不再赘述。
本发明同时公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时将实现如图1所示实施例中的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种图片舆情获取方法,其特征在于,包括:
获取信息来源及监控实体;
从所述信息来源获取实时流数据;
针对所述实时流数据中的每张图片,分别对所述图片进行预定内容识别,得到识别结果;
根据所述识别结果确定所述图片与所述监控实体是否相匹配,若匹配,则生成所述图片对应的舆情信息并存储。
2.根据权利要求1所述的方法,其特征在于,
所述从所述信息来源获取实时流数据之前,进一步包括:获取所述监控实体的描述信息;
所述根据所述识别结果确定所述图片与所述监控实体是否相匹配包括:
通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配。
3.根据权利要求2所述的方法,其特征在于,
所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述对所述图片进行预定内容识别包括:对所述图片进行文本信息识别和人像信息识别;
所述通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配包括:
若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配;
或者,若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配。
4.根据权利要求2所述的方法,其特征在于,
所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述对所述图片进行预定内容识别包括:对所述图片进行文本信息识别和logo信息识别;
所述通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配包括:
若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配;
或者,若识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配。
5.根据权利要求1所述的方法,其特征在于,
所述生成所述图片对应的舆情信息并存储之前,进一步包括:
确定是否已经存储有所述图片对应的舆情信息;
若是,则将所述图片对应的舆情信息与已存储的舆情信息进行合并;
若否,则生成所述图片对应的舆情信息并存储。
6.根据权利要求1所述的方法,其特征在于,
所述生成所述图片对应的舆情信息并存储包括:
按照预定的信息结构化格式,生成所述图片对应的舆情信息并存储。
7.一种图片舆情获取装置,其特征在于,包括:第一获取单元、第二获取单元、识别单元、匹配单元以及存储单元;
所述第一获取单元,用于获取信息来源及监控实体;
所述第二获取单元,用于从所述信息来源获取实时流数据;
所述识别单元,用于针对所述实时流数据中的每张图片,分别对所述图片进行预定内容识别,得到识别结果;
所述匹配单元,用于根据所述识别结果确定所述图片与所述监控实体是否相匹配;
所述存储单元,用于当所述图片与所述监控实体相匹配时,生成所述图片对应的舆情信息并存储。
8.根据权利要求7所述的装置,其特征在于,
所述第一获取单元进一步用于,获取所述监控实体的描述信息;
所述匹配单元通过比较所述识别结果以及所述监控实体的描述信息,确定所述图片与所述监控实体是否相匹配。
9.根据权利要求8所述的装置,其特征在于,
所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述识别单元对所述图片进行文本信息识别和人像信息识别;
所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配;
或者,所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到人像信息且识别到的人像中包括用于描述所述监控实体的图片中的人像,则确定所述图片与所述监控实体相匹配。
10.根据权利要求8所述的装置,其特征在于,
所述监控实体的描述信息中包括:用于描述所述监控实体的关键词以及用于描述所述监控实体的图片;
所述识别单元对所述图片进行文本信息识别和logo信息识别;
所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,或者,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配;
或者,所述匹配单元确定识别到文本信息且识别到的文本信息中包括用于描述所述监控实体的关键词,并且,识别到logo信息且识别到的logo中包括用于描述所述监控实体的图片中的logo,则确定所述图片与所述监控实体相匹配。
11.根据权利要求7所述的装置,其特征在于,
所述存储单元进一步用于,在生成所述图片对应的舆情信息并存储之前,确定是否已经存储有所述图片对应的舆情信息,若是,则将所述图片对应的舆情信息与已存储的舆情信息进行合并,若否,则生成所述图片对应的舆情信息并存储。
12.根据权利要求7所述的装置,其特征在于,
所述存储单元按照预定的信息结构化格式,生成所述图片对应的舆情信息并存储。
13.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~6中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~6中任一项所述的方法。
CN201711373612.5A 2017-12-19 2017-12-19 图片舆情获取方法、装置、计算机设备及存储介质 Pending CN108170742A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711373612.5A CN108170742A (zh) 2017-12-19 2017-12-19 图片舆情获取方法、装置、计算机设备及存储介质
US16/224,490 US20190188224A1 (en) 2017-12-19 2018-12-18 Method and apparatus for obtaining picture public opinions, computer device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711373612.5A CN108170742A (zh) 2017-12-19 2017-12-19 图片舆情获取方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN108170742A true CN108170742A (zh) 2018-06-15

Family

ID=62522847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711373612.5A Pending CN108170742A (zh) 2017-12-19 2017-12-19 图片舆情获取方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
US (1) US20190188224A1 (zh)
CN (1) CN108170742A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881382A (zh) * 2020-07-30 2020-11-03 北京百度网讯科技有限公司 由计算机系统实现的信息显示方法和装置、系统和介质
CN113704630A (zh) * 2021-10-27 2021-11-26 武汉卓尔数字传媒科技有限公司 一种信息推送方法、装置、可读存储介质和电子设备
CN118015644A (zh) * 2024-04-10 2024-05-10 一网互通(北京)科技有限公司 基于图片和文字的社交媒体关键词数据分析方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417097B (zh) * 2020-11-19 2022-09-16 中国电子科技集团公司电子科学研究院 一种用于舆情解析的多模态数据特征提取与关联方法
WO2022204435A2 (en) * 2021-03-24 2022-09-29 Trust & Safety Laboratory Inc. Multi-platform detection and mitigation of contentious online content
CN113157866B (zh) * 2021-04-27 2024-05-14 平安科技(深圳)有限公司 一种数据分析方法、装置、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101571875A (zh) * 2009-05-05 2009-11-04 程治永 一种基于图像识别的图像搜索系统的实现方法
CN102663134A (zh) * 2012-04-28 2012-09-12 广东威创视讯科技股份有限公司 一种热点图片加载方法、控制服务器、客户端及系统
CN104504081A (zh) * 2014-12-25 2015-04-08 北京东方剪报国际信息咨询有限公司 全媒体检测及监播大数据行为智能分析系统
CN104504104A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 用于搜索引擎的图片物料处理方法、装置和搜索引擎
US20150106158A1 (en) * 2013-10-16 2015-04-16 Verizon Patent And Licensing Inc. Method and apparatus for providing folksonomic object scoring
CN106777177A (zh) * 2016-12-22 2017-05-31 百度在线网络技术(北京)有限公司 检索方法和装置
CN107038178A (zh) * 2016-08-03 2017-08-11 平安科技(深圳)有限公司 舆情分析方法和装置
CN107122450A (zh) * 2017-04-26 2017-09-01 广州图匠数据科技有限公司 一种网络图片舆情监测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101571875A (zh) * 2009-05-05 2009-11-04 程治永 一种基于图像识别的图像搜索系统的实现方法
CN102663134A (zh) * 2012-04-28 2012-09-12 广东威创视讯科技股份有限公司 一种热点图片加载方法、控制服务器、客户端及系统
US20150106158A1 (en) * 2013-10-16 2015-04-16 Verizon Patent And Licensing Inc. Method and apparatus for providing folksonomic object scoring
CN104504081A (zh) * 2014-12-25 2015-04-08 北京东方剪报国际信息咨询有限公司 全媒体检测及监播大数据行为智能分析系统
CN104504104A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 用于搜索引擎的图片物料处理方法、装置和搜索引擎
CN107038178A (zh) * 2016-08-03 2017-08-11 平安科技(深圳)有限公司 舆情分析方法和装置
CN106777177A (zh) * 2016-12-22 2017-05-31 百度在线网络技术(北京)有限公司 检索方法和装置
CN107122450A (zh) * 2017-04-26 2017-09-01 广州图匠数据科技有限公司 一种网络图片舆情监测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881382A (zh) * 2020-07-30 2020-11-03 北京百度网讯科技有限公司 由计算机系统实现的信息显示方法和装置、系统和介质
CN111881382B (zh) * 2020-07-30 2024-05-14 北京百度网讯科技有限公司 由计算机系统实现的信息显示方法和装置、系统和介质
CN113704630A (zh) * 2021-10-27 2021-11-26 武汉卓尔数字传媒科技有限公司 一种信息推送方法、装置、可读存储介质和电子设备
CN118015644A (zh) * 2024-04-10 2024-05-10 一网互通(北京)科技有限公司 基于图片和文字的社交媒体关键词数据分析方法及装置
CN118015644B (zh) * 2024-04-10 2024-06-07 一网互通(北京)科技有限公司 基于图片和文字的社交媒体关键词数据分析方法及装置

Also Published As

Publication number Publication date
US20190188224A1 (en) 2019-06-20

Similar Documents

Publication Publication Date Title
CN108182211A (zh) 视频舆情获取方法、装置、计算机设备及存储介质
US11250887B2 (en) Routing messages by message parameter
CN108170742A (zh) 图片舆情获取方法、装置、计算机设备及存储介质
US11023107B2 (en) Virtual teller systems and methods
US11372608B2 (en) Gallery of messages from individuals with a shared interest
US9691184B2 (en) Methods and systems for generating and joining shared experience
US9854219B2 (en) Gallery of videos set to an audio time line
US10467387B2 (en) Computerized system and method for modifying a media file by automatically applying security features to select portions of media file content
CN106415664A (zh) 生成消息与社交网络应用的用户面部表情库的系统和方法
JP2020528705A (ja) 認知的洞察を使用したビデオ・シーンの移動
CN107038784B (zh) 安全验证方法和装置
CN108932066A (zh) 输入法获取表情包的方法、装置、设备和计算机存储介质
CN109670109A (zh) 信息获取方法、装置、服务器、终端和介质
CN109241344A (zh) 用于处理信息的方法和装置
CN106549860A (zh) 信息获取方法和装置
CN107741991A (zh) 一种文件快速查询的方法、装置、设备及存储介质
CN103607382B (zh) 一种自认证服务系统和方法
CN117609655A (zh) 一种基于多功能模块可配置的云服名片展示方法及系统
CN114911970A (zh) 一种视频处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination