CN113849667A - 一种舆情监控方法、装置、电子设备及存储介质 - Google Patents

一种舆情监控方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113849667A
CN113849667A CN202111438736.3A CN202111438736A CN113849667A CN 113849667 A CN113849667 A CN 113849667A CN 202111438736 A CN202111438736 A CN 202111438736A CN 113849667 A CN113849667 A CN 113849667A
Authority
CN
China
Prior art keywords
evaluated
entity
evaluation
media files
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111438736.3A
Other languages
English (en)
Other versions
CN113849667B (zh
Inventor
张�杰
于皓
陈栋
吴信东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Minglue Zhaohui Technology Co Ltd
Original Assignee
Beijing Minglue Zhaohui Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Minglue Zhaohui Technology Co Ltd filed Critical Beijing Minglue Zhaohui Technology Co Ltd
Priority to CN202111438736.3A priority Critical patent/CN113849667B/zh
Publication of CN113849667A publication Critical patent/CN113849667A/zh
Application granted granted Critical
Publication of CN113849667B publication Critical patent/CN113849667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种舆情监控方法、装置、电子设备及存储介质,该方法包括:从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值。本申请将待评估内容中包含的不同类型的媒体文件均进行分析,保证评估得到舆情评价值的全面性和准确性。

Description

一种舆情监控方法、装置、电子设备及存储介质
技术领域
本申请涉及舆情监控技术领域,具体而言,涉及一种舆情监控方法、装置、电子设备及存储介质。
背景技术
舆情监控:整合互联网信息采集技术及信息智能处理技术通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。
随着直播平台和短视频应用的普及,视频类内容在互联网上的占比越来越大,传统的基于论坛和社交网站的舆情监控方法,评估的数据过于单一,评估结果不够准确,不再满足企业客户的需求。
发明内容
有鉴于此,本申请的目的在于提供一种舆情监控方法、装置、电子设备及存储介质,将待评估内容中包含的不同类型的媒体文件均进行分析,保证评估得到舆情评价值的全面性和准确性。
第一方面,本申请实施例提供了一种舆情监控方法,所述方法包括:
根据待评估内容包含的不同类型媒体文件对应的识别方案,从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;
针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值。
在本申请较佳的技术方案中,上述根据待评估内容包含的不同类型媒体文件对应的识别方案,从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
根据不同类型媒体文件对应的不同文件格式,从所述待评估内容中拆分出带有时间顺序的各个类型的媒体文件;
根据不同类型的媒体文件对应的识别方案,对各个类型的媒体文件进行对应的识别,得到各个类型的媒体文件对应的识别结果;
从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素。
在本申请较佳的技术方案中,上述识别结果中包括至少一个待评估实体和该待评估实体的评估子因素;所述从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
在本申请较佳的技术方案中,上述识别结果中包括至少一个待评估实体和该待评估实体对应的评估子因素、至少一个待评估指代体和该待评估指代体对应的评估子因素;所述从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
针对识别出待评估实体的第一媒体文件,使用其他类型媒体文件中与所述待评估指代体对应的待评估实体替换所述待评估指代体;所述其他类型媒体文件为类型与所述第一媒体文件不同的媒体文件;
进而,将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
在本申请较佳的技术方案中,上述媒体文件至少包括以下之一:视频文件、音频文件、文本文件;
上述视频文件对应的第一识别方案包括:
根据所述视频文件中相邻帧图片的第一内容相似度,将超过第一相似度阈值的相邻帧图片进行合并,得到第一镜头;
若第一镜头为一个,针对第一镜头进行内容识别,得到第一识别结果;
若第一镜头为多个,根据相邻第一镜头之间的第二内容相似度,将超过第二相似度阈值的相邻第一镜头进行合并,得到第二镜头;针对第二镜头进行内容识别,得到第一识别结果。
在本申请较佳的技术方案中,上述视频文件对应的第一识别方案还包括:
若检测到所述视频文件中包含有字幕,对视频文件包含的图片做分组处理,每组图片中包含预设帧数的图片;
提取每组图片中包含的字幕文本,并对所述每组图片中包含的字幕文本进行文本识别,得到第二识别结果。
在本申请较佳的技术方案中,上述针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值,包括:
对所述目标待评估实体对应评估因素的词性进行情感正负极性的分类,得到情感分类的结果;
根据情感正极性占据所述情感分类的结果的比例,确定所述目标待评估实体的舆情评价值。
第二方面,本申请实施例提供了一种舆情监控装置,所述装置包括:
识别模块,用于根据待评估内容包含的不同类型媒体文件对应的识别方案,从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;
确定模块,用于针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的舆情监控方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的舆情监控方法的步骤。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请根据待评估内容包含的不同类型媒体文件对应的识别方案,从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值。本申请将待评估内容中包含的不同类型的媒体文件均进行分析,保证评估得到舆情评价值的全面性和准确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍, 应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种舆情监控方法的流程示意图;
图2示出了本申请实施例所提供的一种确定总评估因素的流程示意图;
图3示出了本申请实施例所提供的一种舆情监控装置示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
舆情监控:整合互联网信息采集技术及信息智能处理技术通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。
现有的大部分舆情监控方法均是仅仅采集某种特定的数据进行分析,导致评估结果不够全面,不能完全反应真实的舆情;分析的过程进行了整体概括,导致数据中出现的不同实体的评估结果相似,针对数据中包括的不同实体的评估不够准确。
本申请实施例提供了一种舆情监控方法、装置、电子设备及存储介质,下面通过实施例进行描述。
图1示出了本申请实施例所提供的一种舆情监控方法的流程示意图,其中,该方法包括步骤S101-S102;具体的:
S101、根据待评估内容包含的不同类型媒体文件对应的识别方案,从待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;
S102、针对至少一个待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于情感分类的结果,确定目标待评估实体的舆情评价值。
本申请将待评估内容中包含的不同类型的媒体文件均进行分析,保证评估得到舆情评价值的全面性和准确性。
下面对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
S101、根据待评估内容包含的不同类型媒体文件对应的识别方案,从待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素。
本申请实施例中的待评估内容为通过爬虫获取的网页或者流媒体文件。待评估内容会包含有多种不同类型的媒体文件:视频文件、音频文件、文本文件。这里的文本文件包括标题、简介等。
为了保证对待评估内容评估的全面性,本申请对待评估内容中包含的所有类型的媒体文件均进行分析处理。针对不同类型的媒体文件,需要有不同的识别方案。分别使用该类型媒体文件对应的识别方案对不同类型的媒体文件进行识别,从不同类型的媒体文件中识别出各个类型的媒体文件中包含的待评估实体和该待评估实体全部的评估因素。
本申请实施例中的待评估实体包括产品、品牌、企业、商标等。不同的待评估实体对应不同的评估因素,评估因素包括效果描述、功能描述、喜爱度描述、品牌声量、品牌健康指数、产品曝光度、产品回应热度等。待评估实体和评估因素是服务器的知识库中预先设置的。例如,美妆领域里,待评估实体有品牌、产品,评估因素有美白效果、吸收、去皱、气味等;汽车领域里,待评估实体有品牌、车型,评估因素有外观、动力、内饰、空间、操控性等。
本申请实施例中,作为一可选实施例,如图2所示,根据待评估内容包含的不同类型媒体文件对应的识别方案,从待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素时,包括:
S201、根据不同类型媒体文件对应的不同文件格式,从待评估内容中拆分出带有时间顺序的各个类型的媒体文件;
S202、根据不同类型的媒体文件对应的识别方案,对各个类型的媒体文件进行对应的识别,得到各个类型的媒体文件对应的识别结果;
S203、从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素。
本申请实施例中在对待评估内容包含的不同类型的媒体文件进行分析处理的时候,需要从待评估内容中将所有类型的媒体拆分出来(提取出来),对于拆分得到的不同类型的媒体文件分别进行分析。
不同媒体文件的文件格式(存储形式)存在差异,可以将不同类型的媒体文件从待识别内容中拆分出来。在对媒体文件进行分析的时候,针对不同的媒体文件,本申请实施例采用不同的识别方案进行识别。然后在对从不同类型媒体文件对应的所有的识别结果做整体分析,得到待评估内容中包含的所有待评估实体和该待评估实体对应的全部评估因素。
本申请实施例中,在对所有类型媒体文件对应的识别结果进行整体分析的时候,需要判断各个识别结果中包含的具体内容。
如果各个类型的媒体文件对应的识别结果中均为待评估实体和该待评估实体的评估子因素,则直接将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
也就是说,将各个类型的媒体文件识别结果中相同待评估实体的评估子因素进行汇总,得到该待评估实体全部的评估因素。
例如,视频文件中识别出待评估实体为A,待评估实体A的评估子因素为a;音频文件中识别出待评估实体为A,待评估实体A的评估子因素为b,音频文件中还识别出了待评估实体D,待评估实体D的评估子因素为d;将上述的识别结果整合得到:待评估实体A,待评估实体A的评估因素a,b;待评估实体D,待评估实体D的评估因素d。
如果各个类型的媒体文件对应的识别结果中不仅包含了待评估实体和该待评估实体的评估子因素,还包含了待评估指代体和该待评估指代体对应的评估子因素,此时,针对识别出待评估实体的第一媒体文件,使用其他类型媒体文件中与待评估指代体对应的待评估实体替换待评估指代体;其他类型媒体文件为类型与所述第一媒体文件不同的媒体文件;然后,将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
这里的待评估指代体表征同等含义的指代词,例如“它”、“该款产品”等。如果识别结果中存在待评估指代体,在进行分析时不能区分该待评估指代体到底的具体内容,所以需要使用该待评估指代体指代的待评估实体替换该待评估指代体。
在对该待评估指代体进行替换的时候,可以从除了出现该待评估实体的媒体文件以外的其他类型的媒体文件中进行寻找该待评估指代体对应的待评估实体。
例如,如果视频文件中出现了待评估指代体,音频文件中对应的同一时刻出现待评估实体,则音频文件中同一时刻出现的待评估实体为该待评估指代体对应的待评估实体。
如果文本文件中出现了待评估实体,而视频文件和音频文件中均为现待评估指代体,此时需要使用文本文件中出现的待评估实体替换视频文件和音频文件中的待评估指代体。
如视频文件识别为口红,同时段音频文件识别出具体某品牌某款口红,则将视频识别的口红具体化为某款口红。 如视频文件识别出具体某款口红,音频文件识别出的是“这款口红”、“它”,则用具体的某款口红替代指代词。
本申请实施例中,作为一可选实施例,当媒体文件是视频文件的时候,针对所述视频文件的第一识别方案包括:
根据视频文件中相邻帧图片的第一内容相似度,将超过第一相似度阈值的相邻帧图片进行合并,得到第一镜头;
若第一镜头为一个,针对第一镜头进行内容识别,得到第一识别结果;
若第一镜头为多个,根据相邻第一镜头之间的第二内容相似度,将超过第二相似度阈值的相邻第一镜头进行合并,得到第二镜头;针对第二镜头进行内容识别,得到第一识别结果。
本申请实施例中,在对视频文件进行识别时,对视频文件包含的每帧图片的图片内容进行识别,计算每帧图片包含图片内容的相似度,将图片内容的相似度超过第一相似度阈值的图片进行合并,得到第一镜头。第一镜头中包括至少一帧图片。
一段视频里,相同场景下可能会有多个镜头拍摄,比如一个镜头拍正脸、一个镜头拍侧脸,然后在不同镜头间切换。为了提高识别效率,本申请实施例中,如果得到的第一镜头为多个时,根据相邻第一镜头之间的第二内容相似度,将超过第二相似度阈值的相邻第一镜头进行合并,得到第二镜头;然后针对第二镜头进行内容识别,可以有效的提高识别效率。
在对第一镜头或者第二镜头进行识别的时候,根据每个镜头出现的时间顺序,对每个镜头中的内容进行识别,得到第一识别结果。
具体实施时,对视频内容的处理:计算视频包含的每帧图片之间的相似度,根据每帧图片之间的相似度,将视频包含的图片进行合并,从而将视频拆分为不同镜头。对于内容相同且时间前后相邻的镜头做合并处理。对相同镜头中的物品、人物、商标、场景做识别,场景标签包含但不限于:餐厅、卧室、酒吧、KTV、直播间、车内、商场、等候区;按以下格式对镜头做结构化表示:起始时间,结束时间,内容:{[人物列表],[物品列表],[商标列表],[场景标签]}。
本申请实施例中,作为一可选实施例,视频中还可能存在字幕,所以上述视频文件对应的第一识别方案还包括:
若检测到视频文件中包含有字幕,对视频文件包含的图片做分组处理,每组图片中包含预设帧数的图片;
提取每组图片中包含的字幕文本,并对每组图片中包含的字幕文本进行文本识别,得到第二识别结果。
对于视频中的每帧图片来说,字幕的变化速度较慢,即一段字幕可能对应多帧图片,或者多帧图片显示的是同一段字幕。所以在对字幕进行处理的时候,没有必要每帧图片都进行处理。本申请实施例中,先对视频文件包含的图片做了分组处理,每组图片中包含了预设帧数的图片,将每组图片中包含的字幕进行提取,得到字幕文本。为了提高识别效率,还可以对字幕文本进行合并和断句处理。
具体实施时,对字幕内容的处理:检测视频帧中是否有字幕,如没有字幕,则终止处理;如果有字幕,则字幕分段处理:每隔一定帧数(如100帧),做OCR识别,转成文本;对连续OCR结果做合并和断句,按以下格式做结构化表示:起始时间,结束时间,内容:{ 字幕文本 }。
本申请实施例中,作为一可选实施例, 当媒体文件是音频文件的时候,针对所述音频文件对应的第二识别方案包括:
针对音频文件中包含的不同声音,进行声音识别,得到第三识别结果。
若识别出的声音为环境背景音,就对环境背景音做环境分类,类别包括以下至少之一:公共场所、水流声、鸟叫等;
若识别出的是音乐背景音,就需要识别出该音乐背景音的乐曲名称;
若识别出的是人的语音交谈,就对该语音做语音识别(Automatic SpeechRecognition,ASR)识别,然后做口语处理,去掉语音交谈中的口头语。
识别出的环境背景音和音乐背景音都是评估子因素。语音交谈中提到待评估实体、待评估指代体或者评估子因素。
具体实施时,对音频文件识别之后,按以下格式做结构化表示:起始时间,结束时间,内容:{ 环境类别,音乐背景类别,语音文本 }。
本申请实施例中,作为一可选实施例,针对文本文件中包含的文字,进行文本识别,得到第四识别结果。
S102、针对至少一个待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于情感分类的结果,确定目标待评估实体的舆情评价值。
本申请实施例中在确定目标待评估实体的舆情评价值的时候,首先,对目标待评估实体对应评估因素的词性进行情感正负极性的分类,得到情感分类的结果;然后,根据情感正极性占据情感分类的结果的比例,确定目标待评估实体的舆情评价值。
图3示出了本申请实施例所提供的一种舆情监控装置的结构示意图,所述装置包括:
识别模块,用于根据待评估内容包含的不同类型媒体文件对应的识别方案,从待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;
确定模块,用于针对至少一个待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于情感分类的结果,确定目标待评估实体的舆情评价值。
识别模块,在用于根据待评估内容包含的不同类型媒体文件对应的识别方案,从待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
根据不同类型媒体文件对应的不同文件格式,从待评估内容中拆分出带有时间顺序的各个类型的媒体文件;
根据不同类型的媒体文件对应的识别方案,对各个类型的媒体文件进行对应的识别,得到各个类型的媒体文件对应的识别结果;
从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素。
识别结果中包括至少一个待评估实体和该待评估实体的评估子因素;从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
识别结果中包括至少一个待评估实体和该待评估实体对应的评估子因素、至少一个待评估指代体和该待评估指代体对应的评估子因素;从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
针对识别出待评估实体的第一媒体文件,使用其他类型媒体文件中与待评估指代体对应的待评估实体替换待评估指代体;所述其他类型媒体文件为类型与所述第一媒体文件不同的媒体文件;
进而,将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
媒体文件至少包括以下之一:视频文件、音频文件、文本文件。
视频文件对应的第一识别方案包括:
根据视频文件中相邻帧图片的第一内容相似度,将超过第一相似度阈值的相邻帧图片进行合并,得到第一镜头;
若第一镜头为一个,针对第一镜头进行内容识别,得到第一识别结果;
若第一镜头为多个,根据相邻第一镜头之间的第二内容相似度,将超过第二相似度阈值的相邻第一镜头进行合并,得到第二镜头;针对第二镜头进行内容识别,得到第一识别结果。
视频文件对应的第一识别方案还包括:
若检测到视频文件中包含有字幕,对视频文件包含的图片做分组处理,每组图片中包含预设帧数的图片;
提取每组图片中包含的字幕文本,并对每组图片中包含的字幕文本进行文本识别,得到第二识别结果。
音频文件对应的第二识别方案包括:
针对音频文件中包含的不同声音,进行声音识别,得到第三识别结果。
文本文件对应的第三识别方案包括:
针对文本文件中包含的文字,进行文本识别,得到第四识别结果。
确定模块,用于针对至少一个待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于情感分类的结果,确定目标待评估实体的舆情评价值时,包括:
对目标待评估实体对应评估因素的词性进行情感正负极性的分类,得到情感分类的结果;
根据情感正极性占据情感分类的结果的比例,确定目标待评估实体的舆情评价值。
如图4所示,本申请实施例提供了一种电子设备,用于执行本申请中的舆情监控方法,该设备包括存储器、处理器、总线及存储在该存储器上并可在该处理器上运行的计算机程序,其中,上述处理器执行上述计算机程序时实现上述的舆情监控方法的步骤。
具体地,上述存储器和处理器可以为通用的存储器和处理器,这里不做具体限定,当处理器运行存储器存储的计算机程序时,能够执行上述的舆情监控方法。
对应于本申请中的舆情监控方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述的舆情监控方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述的舆情监控方法。
在本申请所提供的实施例中,应该理解到,所揭露系统和方法,可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory ,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种舆情监控方法,其特征在于,所述方法包括:
根据待评估内容包含的不同类型媒体文件对应的识别方案,从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;
针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值。
2.根据权利要求1所述的舆情监控方法,其特征在于,所述根据待评估内容包含的不同类型媒体文件对应的识别方案,从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
根据不同类型媒体文件对应的不同文件格式,从所述待评估内容中拆分出带有时间顺序的各个类型的媒体文件;
根据不同类型的媒体文件对应的识别方案,对各个类型的媒体文件进行对应的识别,得到各个类型的媒体文件对应的识别结果;
从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素。
3.根据权利要求2所述的舆情监控方法,其特征在于,所述识别结果中包括至少一个待评估实体和该待评估实体的评估子因素;所述从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
4.根据权利要求2所述的舆情监控方法,其特征在于,所述识别结果中包括至少一个待评估实体和该待评估实体对应的评估子因素、至少一个待评估指代体和该待评估指代体对应的评估子因素;所述从各个类型的媒体文件对应的识别结果中,识别出至少一个待评估实体和该待评估实体对应的评估因素,包括:
针对识别出待评估实体的第一媒体文件,使用其他类型媒体文件中与所述第一媒体文件中的待评估指代体对应的待评估实体替换所述待评估指代体;所述其他类型媒体文件为类型与所述第一媒体文件不同的媒体文件;
进而,将不同类型的媒体文件中识别出的待评估实体和该待评估实体对应的评估子因素进行整合,得到待评估实体和该待评估实体对应的评估因素。
5.根据权利要求1所述的舆情监控方法,其特征在于,所述媒体文件至少包括以下之一:视频文件、音频文件、文本文件;
所述视频文件对应的第一识别方案包括:
根据所述视频文件中相邻帧图片的第一内容相似度,将超过第一相似度阈值的相邻帧图片进行合并,得到第一镜头;
若第一镜头为一个,针对第一镜头进行内容识别,得到第一识别结果;
若第一镜头为多个,根据相邻第一镜头之间的第二内容相似度,将超过第二相似度阈值的相邻第一镜头进行合并,得到第二镜头;针对第二镜头进行内容识别,得到第一识别结果。
6.根据权利要求5所述的舆情监控方法,其特征在于,所述视频文件对应的第一识别方案还包括:
若检测到所述视频文件中包含有字幕,对视频文件包含的图片做分组处理,每组图片中包含预设帧数的图片;
提取每组图片中包含的字幕文本,并对所述每组图片中包含的字幕文本进行文本识别,得到第二识别结果。
7.根据权利要求1所述的舆情监控方法,其特征在于,所述针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值,包括:
对所述目标待评估实体对应评估因素的词性进行情感正负极性的分类,得到情感分类的结果;
根据情感正极性占据所述情感分类的结果的比例,确定所述目标待评估实体的舆情评价值。
8.一种舆情监控装置,其特征在于,所述装置包括:
识别模块,用于根据待评估内容包含的不同类型媒体文件对应的识别方案,从所述待评估内容中,识别出至少一个待评估实体和该待评估实体对应的评估因素;
确定模块,用于针对至少一个所述待评估实体中任一目标待评估实体对应的评估因素进行情感分类,并基于所述情感分类的结果,确定所述目标待评估实体的舆情评价值。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的舆情监控方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的舆情监控方法的步骤。
CN202111438736.3A 2021-11-29 2021-11-29 一种舆情监控方法、装置、电子设备及存储介质 Active CN113849667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111438736.3A CN113849667B (zh) 2021-11-29 2021-11-29 一种舆情监控方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111438736.3A CN113849667B (zh) 2021-11-29 2021-11-29 一种舆情监控方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113849667A true CN113849667A (zh) 2021-12-28
CN113849667B CN113849667B (zh) 2022-03-29

Family

ID=78982481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111438736.3A Active CN113849667B (zh) 2021-11-29 2021-11-29 一种舆情监控方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113849667B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182211A (zh) * 2017-12-19 2018-06-19 百度在线网络技术(北京)有限公司 视频舆情获取方法、装置、计算机设备及存储介质
CN108701144A (zh) * 2016-11-28 2018-10-23 微软技术许可有限责任公司 自动从视频中检测表达情感的内容以及丰富图像索引
CN110837581A (zh) * 2019-11-04 2020-02-25 云目未来科技(北京)有限公司 视频舆情分析的方法、装置以及存储介质
CN112418172A (zh) * 2020-12-11 2021-02-26 苏州元启创人工智能科技有限公司 基于多模信息智能处理单元的多模信息融合情感分析方法
CN113255755A (zh) * 2021-05-18 2021-08-13 北京理工大学 一种基于异质融合网络的多模态情感分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108701144A (zh) * 2016-11-28 2018-10-23 微软技术许可有限责任公司 自动从视频中检测表达情感的内容以及丰富图像索引
CN108182211A (zh) * 2017-12-19 2018-06-19 百度在线网络技术(北京)有限公司 视频舆情获取方法、装置、计算机设备及存储介质
US20190188478A1 (en) * 2017-12-19 2019-06-20 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for obtaining video public opinions, computer device and storage medium
CN110837581A (zh) * 2019-11-04 2020-02-25 云目未来科技(北京)有限公司 视频舆情分析的方法、装置以及存储介质
CN112418172A (zh) * 2020-12-11 2021-02-26 苏州元启创人工智能科技有限公司 基于多模信息智能处理单元的多模信息融合情感分析方法
CN113255755A (zh) * 2021-05-18 2021-08-13 北京理工大学 一种基于异质融合网络的多模态情感分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王海燕等: ""文本细粒度情感分析综述"", 《河南科技学院学报(自然科学版)》 *

Also Published As

Publication number Publication date
CN113849667B (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
CN106294425B (zh) 商品相关网络文章之自动图文摘要方法及系统
CN104598644B (zh) 喜好标签挖掘方法和装置
CN108197282B (zh) 文件数据的分类方法、装置及终端、服务器、存储介质
CN110704682A (zh) 一种基于视频多维特征智能推荐背景音乐的方法及系统
CN110719518A (zh) 多媒体数据处理方法、装置和设备
CN111083141A (zh) 一种仿冒账号的识别方法、装置、服务器和存储介质
CN108305180B (zh) 一种好友推荐方法及装置
CN113779308B (zh) 一种短视频检测和多分类方法、装置及存储介质
KR20100098014A (ko) 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법
CN112883734B (zh) 区块链安全事件舆情监测方法及系统
CN106250553A (zh) 一种服务推荐方法及终端
US10769196B2 (en) Method and apparatus for displaying electronic photo, and mobile device
CN110427897A (zh) 视频精彩度的分析方法、装置和服务器
CN110287314B (zh) 基于无监督聚类的长文本可信度评估方法及系统
KR20160010746A (ko) 소셜 네트워크 서비스 사용자의 감성 분석 시스템 및 그 방법
CN111078943A (zh) 一种视频文本摘要生成方法及装置
CN107577672B (zh) 基于舆情设定剧本的方法和装置
CN111368138A (zh) 视频类别标签的排序方法、装置、电子设备及存储介质
EP3340073A1 (en) Systems and methods for processing of user content interaction
CN114598933B (zh) 一种视频内容处理方法、系统、终端及存储介质
CN114547373A (zh) 一种基于音频智能识别搜索节目的方法
CN113923504A (zh) 视频预览动图生成方法和装置
CN113849667B (zh) 一种舆情监控方法、装置、电子设备及存储介质
CN105809488B (zh) 一种信息处理方法及电子设备
CN110008314B (zh) 一种意图解析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant