CN103186663B - 一种基于视频的网络舆情监测方法及系统 - Google Patents

一种基于视频的网络舆情监测方法及系统 Download PDF

Info

Publication number
CN103186663B
CN103186663B CN201210587031.2A CN201210587031A CN103186663B CN 103186663 B CN103186663 B CN 103186663B CN 201210587031 A CN201210587031 A CN 201210587031A CN 103186663 B CN103186663 B CN 103186663B
Authority
CN
China
Prior art keywords
video
search
module
text
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210587031.2A
Other languages
English (en)
Other versions
CN103186663A (zh
Inventor
吕春华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sino Union (beijing) Technology Co Ltd
Original Assignee
Sino Union (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sino Union (beijing) Technology Co Ltd filed Critical Sino Union (beijing) Technology Co Ltd
Priority to CN201210587031.2A priority Critical patent/CN103186663B/zh
Publication of CN103186663A publication Critical patent/CN103186663A/zh
Application granted granted Critical
Publication of CN103186663B publication Critical patent/CN103186663B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于视频的网络舆情监控系统及方法,包括搜索模块,音频转换模块,视频索引模块,搜索模块根据用户的关键词搜索到的目的视频传输给音频转换模块,经过音频转换模块的音频转文本并进行分词处理,由视频索引模块对目的视频所对应的文本建立方便用户查找的索引文件,所述索引文件是关键词与目的视频的关键时间点以及目的视频帧一一对应的文件,能够根据用户需要进行视频舆情监控,能够节省人工,并准确识别关键词的基于网络视频的舆情监控系统及方法,本发明的舆情监控系统及方法能够采集目的视频的关键时间点。

Description

一种基于视频的网络舆情监测方法及系统
技术领域
本发明涉及网络信息处理技术领域,具体涉及一种基于视频的网络舆情监测方法和系统。
背景技术
网络舆情监控是指通过对网络各类信息汇集、分类、整合、筛选等技术处理,再形成对网络热点、动态、网民意见等实时统计报表的一个过程。
网络舆情监控的背景
随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。当今,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元。如果引导不善,负面的网络舆情将对社会公共安全形成较大威胁。对相关政府部门来说,如何加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。
“网络舆情监测系统”是征对在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度于网络上表达出来意愿集合而进行的计算机监测的系统统称。
“网络舆情”是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情形成迅速,对社会影响巨大,加强互联网信息监管的同时,组织力量开展信息汇集整理和分析,对于及时应对网络突发的公共事件和全面掌握社情民意很有意义。
舆情监控系统的一般工作流程如下:
1.信息采集:互联网信息(新闻、论坛等)的实时监测、采集、内容提取、下载及排重。
2.信息处理:对抓取的内容进行自动分类聚类、关键词过滤、主题检测、专题聚焦等。
3.信息服务:将采集并分析整理后的信息直接为用户或为用户辅助编辑提供信息服务。
随着网络上越来越多的视频新闻,更加直观的描述了新闻信息。相对于文字新闻,网络用户更加倾向于能够直观反映新闻事件经过的网络视频新闻,因此,视频新闻的点击量也是很大的,在网络舆情监控系统大力发展的今天,基于视频的舆情监控系统的发展成为互联网信息处理行业的研究之重。
目前存在的基于视频的网络舆情监控系统,一般都是针对视频的标题进行检索,然后将检索到的视频人工打开,然后人工标记视频所属标签,进行人工研判。这样需要的舆情监控人员量大,检索及后续处理的时间周期延长,这样就会容易漏掉一些关键视频,影响用户形象,使用户公关处理的时间延长。
发明内容
本发明的目的是提供一种能够节省人工,并准确识别关键词的基于视频的网络舆情监控系统及方法。
本发明的目的是提供一种能够查询目的视频和视频关键点的一种基于视频的网络舆情监控系统及方法。
为达到以上目的,本发明采用的技术方案是:一种基于视频的网络舆情监控系统,其特征在于:包括搜索模块,音频转换模块,视频索引模块,搜索模块根据用户的关键词搜索到的目的视频传输给音频转换模块,经过音频转换模块的音频转文本并进行分词处理,由视频索引模块对目的视频所对应的文本建立方便用户查找的索引文件,所述索引文件是关键词与目的视频的关键时间点以及目的视频帧一一对应的文件。
所述搜索模块即用户所用任意款的视频搜索引擎或视频门户网站或指定网站。
所述搜索模块将用户用关键词搜索或选择到的视频所在地址传输至视频索引服务器中。
所述音频转换模块设置在视频索引服务器中。
所述音频转换模块将用户搜索到的目的视频地址进行自动播放,并在自动播放的过程中以后台程序进行音频转换,将视频中的音频信号转换成文本文件,并把视频帧与文本建立一一对应关系。
所述视频索引模块对所述文本文件进行分词处理。
所述分词处理采用的方法为基于词典的分词方法或基于理解的分词方法或基于统计的分词方法。
所述视频索引模块将文本文件分词处理后的文件与目的视频文件进行索引文件建立,建立后的索引文件与搜索到的目的视频帧一一对应。
所述索引文件中还包括供用户查询目的视频文件的关键时间点、帧和视频地址。
具有上述的一种基于视频的网络舆情监控系统的舆情监控方法,其特征在于:所述舆情监控方法包括如下步骤:
1)用户根据需要在搜索模块中进行所需关键词对应目的视频的搜索;
2)用户将搜索到的目的视频的地址传输至音频转换模块,音频转换模块根据地址进行视频的自动播放并将目的视频进行音频转换成文本文件的操作,将目的视频文本文件的索引存储在视频索引服务器中;
3)视频索引模块对目的视频转换成的文本文件进行分词处理,同时对目的视频和目的视频的音频文件转化的文本文件进行索引建立,存储在视频索引服务器中,同时对目的视频的关键点进行索引建立,使目的视频与关键词和分词处理结果一一对应,同时方便用户查找视频的关键时间点。
本发明的一种基于视频的网络舆情监控系统,能够根据用户需要进行舆情监控,能够节省人工,并准确识别关键词的基于网络视频的舆情监控系统及方法,本发明的舆情监控系统及方法能够采集目的视频的关键时间点。
附图说明
图1、本发明的一种基于视频的网络舆情监控系统流程图;
图2、一种基于视频的网络舆情监控方法流程图。
具体实施方式
下面结合附图对本发明的一种基于视频的网络舆情监控系统及方法进行详细描述:如图1所示的本发明的一种基于视频的网络舆情监控系统,包括搜索模块K1,音频转换模块K2,视频索引模块K3,搜索模块K1根据用户的关键词搜索到的目的视频传输给音频转换模块K2,经过音频转换模块K2的音频转文本并进行分词处理,由视频索引模块K3对目的视频所对应的文本建立方便用户查找的索引文件,所述索引文件是关键词与目的视频的关键时间点以及目的视频一一对应的文件。
搜索模块K1即用户所用任意款的搜索引擎或视频门户网站或指定网站,将用户搜索到的关键词搜索到的视频的所在地址传输至视频索引服务器中。
音频转换模K2块设置在视频索引服务器中,块将用户搜索到的目的视频建立连接同时进行自动播放,并在自动播放的过程中以后台程序进行音频转换,将视频中的音频信号转换成文本文件。
视频索引模块K3对所述文本文件进行分词处理。分词处理采用的方法为基于词典的分词方法或基于理解的分词方法或基于统计的分词方法。
视频索引模块K3将文本文件分词处理后的文件与目的视频文件进行索引文件建立,建立后的索引文件与搜索到的目的视频一一对应。索引文件中还包括供用户查询目的视频文件的关键时间点。
如图2所示的本发明的一种基于视频的网络舆情监控系统的舆情监控方法,其特征在于:所述舆情监控方法包括如下步骤:
1)用户根据需要在搜索模块中进行所需关键词对应目的视频的搜索,图2中的step1-step2所示。
2)用户将搜索到的目的视频的地址传输至音频转换模块,音频转换模块根据地址进行视频的自动播放并将目的视频进行音频转换成文本文件的操作,将目的视频和文本文件存储在视频索引服务器中,图2中的step3所示。
3)视频索引模块对目的视频转换成的文本文件进行分词处理,同时对目的视频和目的视频的音频文件转化的文本文件进行索引建立,存储在视频索引服务器中,同时对目的视频的关键点进行索引建立,使目的视频与关键词和分词处理结果一一对应,同时方便用户查找视频的关键时间点,图2中的step4-step5所示。
实施例:以“三鹿奶粉”事件为例:在任一款搜索引擎中输入“三鹿奶粉”,然后搜索视频,对搜索到的所有目的视频由搜索模块进行取地址操作,将目的视频的地址添加至播放模块中,播放模块在后台进行自动播放,然后以视频中的音频信号转化成一文本文件,文本文件以记事本等文件存储。
将文本文件映射至分词空间中,由中文分词方法对文本文件进行分词操作,如下所示的是其中的一段文字:
“2008年6月28日,位于兰州市的解放军第一医院收治了首例患“肾结石”病症的婴幼儿,据家长们反映,孩子从出生起就一直食用河北石家庄三鹿集团所产的三鹿婴幼儿奶粉。7月中旬,甘肃省卫生厅接到医院婴儿泌尿结石病例报告后,随即展开了调查,并报告卫生部。随后短短两个多月,该医院收治的患婴人数就迅速扩大到14名。”
对上述文字进行分词处理的结果如下:
“2008年6月28日,位于兰州市的解放军第一医院收治了首例患“肾结石”病症的婴幼儿,据家长们反映,孩子从出生起就一直食用河北石家庄三鹿集团所产的三鹿婴幼儿奶粉。7月中旬,甘肃省卫生厅接到医院婴儿泌尿结石病例报告后,随即展开了调查,并报告卫生部。随后短短两个多月,该医院收治的患婴人数就迅速扩大到14名。”
去掉其中的高频词语,即出现4次的词语“的”和出现两次的“了”以及“到、起、就、据、名等无实际意义的虚词或单位”。
然后定义中文词语的权重系数:
其中时间节点为两个,“2008年6月28日”、“7月中旬”,此时间节点的权重系数为2。
其中地名有“兰州市”“河北”“石家庄”“甘肃省”此地名的权重系数为1,5。
其中名词“解放军第一医院”、“肾结石”、“家长们”、“孩子”、“出生”“三鹿集团”“三鹿婴幼儿奶粉”、“泌尿结石病例”、“调查”、“卫生部”、“患婴”、“医院”、这些名词根据出现的位置,次数(即词频)还有主谓语关系,设定权重系数为:主语的权重系数为3,谓语的权重系数为2,每多出现一次权重系数便加1,出现在标题中的词语直接加4。
经过计算后的权重系数比例为:
2008年6月28日 2
7月中旬 2
河北 1.5
石家庄 1.5
甘肃省 1.5
解放军第一医院 1.5
肾结石 2
家长们 3
孩子 2
三鹿集团 2+1+4
三路婴幼儿奶粉 2+1+4
泌尿结石病例 2+1
卫生部 3
调查 1
婴患 34 -->
医院 1
经过归一化后的权重指数排序为:三鹿婴幼儿奶粉,三鹿集团、泌尿结石病例、卫生部、、河北、石家庄、甘肃省、婴患、家长……
因此抽取的关键词即:三鹿婴幼儿奶粉,三鹿集团、泌尿结石病例、卫生部、、河北、石家庄、甘肃省、婴患、家长……
这样,针对本次搜索的目标信息进行标记,标签关键词即为:三鹿婴幼儿奶粉,三鹿集团、泌尿结石病例、卫生部、河北、石家庄、甘肃省、婴患、家长……
对目的标视频的文本和目标视频的网络地址进行关键词与关键词出现的时间点进行标记,即生成一个索引文件存放在索引服务器或搜索服务器中,可以生成索引文件至数据库中,即用户稍后查询的时候只需要在索引文件或数据库的入口处输入标签关键词,即可根据需要查询本次舆情监控的目标视频信息,及通过标签关键词找到本次搜索目标信息的主要内容。存储在视频索引服务器中,同时对目的视频的关键点进行索引建立,使目的视频与关键词和分词处理结果一一对应,同时方便用户查找视频的关键时间点。
本发明的一种基于视频的网络舆情监控系统,能够根据用户需要进行舆情监控,能够节省人工,并准确识别关键词的基于网络视频的舆情监控系统及方法,本发明的舆情监控系统及方法能够采集目的视频的关键时间点。

Claims (8)

1.一种基于视频的网络舆情监控系统,其特征在于:包括搜索模块,音频转换模块,视频索引模块,搜索模块根据用户的关键词搜索到的目的视频传输给音频转换模块,经过音频转换模块的音频转文本并进行分词处理,由视频索引模块对目的视频所对应的文本建立方便用户查找的索引文件,所述索引文件是关键词与目的视频的关键时间点以及目的视频帧一一对应的文件;
所述音频转换模块将用户搜索到的目的视频地址进行自动播放,并在自动播放的过程中以后台程序进行音频转换,将视频中的音频信号转换成文本文件,并把视频帧与文本建立一一对应关系;
所述视频索引模块对所述文本文件进行分词处理;其中,将文本文件映射到分词空间中,由中文分词方法对文本文件进行分词操作,得到分词处理结果,首先去掉分词处理结果中的高频词汇,然后定义中文词语的权重系数,并将权重系数进行归一化处理;
对目标视频的文本和目标视频的网络地址进行关键词与关键词出现的时间点进行标记,即生成一个索引文件存放在索引服务器或搜索服务器中,可以生成索引文件至数据库中,即用户稍后查询的时候只需要在索引文件或数据库的入口处输入标签关键词,即可根据需要查询本次舆情监控的目标视频信息,及通过标签关键词找到本次搜索目标信息的主要内容。
2.根据权利要求1所述的一种基于视频的网络舆情监控系统,其特征在于:所述搜索模块即用户所用任意款的视频搜索引擎或视频门户网站或指定网站。
3.根据权利要求1所述的一种基于视频的网络舆情监控系统,其特征在于:所述搜索模块将用户用关键词搜索或选择到的视频所在地址传输至视频索引服务器中。
4.根据权利要求2所述的一种基于视频的网络舆情监控系统,其特征在于:所述音频转换模块设置在视频索引服务器中。
5.根据权利要求1所述的一种基于视频的网络舆情监控系统,其特征在于:所述分词处理采用的方法为基于词典的分词方法或基于理解的分词方法或基于统计的分词方法。
6.根据权利要求5所述的一种基于视频的网络舆情监控系统,其特征在于:所述视频索引模块将文本文件分词处理后的文件与目的视频文件进行索引文件建立,建立后的索引文件与搜索到的目的视频帧一一对应。
7.根据权利要求6所述的一种基于视频的网络舆情监控系统,其特征在于:所述索引文件中还包括供用户查询目的视频文件的关键时间点、帧和视频地址。
8.根据权利要求1-7中的任一项所述的一种基于视频的网络舆情监控系统的舆情监控方法,其特征在于:所述舆情监控方法包括如下步骤:
1)用户根据需要在搜索模块中进行所需关键词对应目的视频的搜索;
2)用户将搜索到的目的视频的地址传输至音频转换模块,音频转换模块根据地址进行视频的自动播放并将目的视频进行音频转换成文本文件的操作,将目的视频文本文件的索引存储在视频索引服务器中;
3)视频索引模块对目的视频转换成的文本文件进行分词处理,同时对目的视频和目的视频的音频文件转化的文本文件进行索引建立,存储在视频索引服务器中,同时对目的视频的关键点进行索引建立,使目的视频与关键词和分词处理结果一一对应,同时方便用户查找视频的关键时间点。
CN201210587031.2A 2012-12-28 2012-12-28 一种基于视频的网络舆情监测方法及系统 Expired - Fee Related CN103186663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210587031.2A CN103186663B (zh) 2012-12-28 2012-12-28 一种基于视频的网络舆情监测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210587031.2A CN103186663B (zh) 2012-12-28 2012-12-28 一种基于视频的网络舆情监测方法及系统

Publications (2)

Publication Number Publication Date
CN103186663A CN103186663A (zh) 2013-07-03
CN103186663B true CN103186663B (zh) 2016-07-06

Family

ID=48677830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210587031.2A Expired - Fee Related CN103186663B (zh) 2012-12-28 2012-12-28 一种基于视频的网络舆情监测方法及系统

Country Status (1)

Country Link
CN (1) CN103186663B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103580952A (zh) * 2013-09-29 2014-02-12 苏州中联互通信息科技有限公司 一种网络监控系统
CN104618807B (zh) * 2014-03-31 2017-11-17 腾讯科技(北京)有限公司 多媒体播放方法、装置及系统
CN104902292B (zh) * 2015-05-20 2017-10-03 无锡天脉聚源传媒科技有限公司 一种基于电视报道的舆情分析方法和系统
CN105975495A (zh) * 2016-04-26 2016-09-28 北京奇虎科技有限公司 大数据的存储、搜索方法及装置
CN107203616A (zh) * 2017-05-24 2017-09-26 苏州百智通信息技术有限公司 视频文件的标注方法和装置
CN107784083A (zh) * 2017-09-30 2018-03-09 北京合力智联科技有限公司 一种网络舆情信息有效性的自动识别处理方法
CN108182211B (zh) * 2017-12-19 2020-06-30 百度在线网络技术(北京)有限公司 视频舆情获取方法、装置、计算机设备及存储介质
CN109299324B (zh) * 2018-10-19 2022-03-04 四川巧夺天工信息安全智能设备有限公司 一种标签式视频文件的检索方法
CN109933709B (zh) * 2019-01-31 2023-09-26 平安科技(深圳)有限公司 视频文本组合数据的舆情跟踪方法、装置和计算机设备
CN110225288A (zh) * 2019-05-09 2019-09-10 黄河 一种信息处理转化装置
CN110837581B (zh) * 2019-11-04 2023-05-23 云目未来科技(北京)有限公司 视频舆情分析的方法、装置以及存储介质
CN110929683B (zh) * 2019-12-09 2021-01-22 北京赋乐科技有限公司 一种基于人工智能的视频舆情监测方法及系统
CN114553740B (zh) * 2022-03-11 2023-11-10 以萨技术股份有限公司 一种跨网监控的方法、系统、可读存储介质及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102074235A (zh) * 2010-12-20 2011-05-25 上海华勤通讯技术有限公司 视频语音识别并检索的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009163643A (ja) * 2008-01-09 2009-07-23 Sony Corp 映像検索装置、編集装置、映像検索方法およびプログラム
US8943054B2 (en) * 2011-01-31 2015-01-27 Social Resolve, Llc Social media content management system and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102074235A (zh) * 2010-12-20 2011-05-25 上海华勤通讯技术有限公司 视频语音识别并检索的方法

Also Published As

Publication number Publication date
CN103186663A (zh) 2013-07-03

Similar Documents

Publication Publication Date Title
CN103186663B (zh) 一种基于视频的网络舆情监测方法及系统
CN103186662B (zh) 一种动态舆情关键词抽取系统和方法
Batool et al. Precise tweet classification and sentiment analysis
CN103177076B (zh) 一种基于定点网站的舆情监测系统及方法
US20190220474A1 (en) Utilizing multiple knowledge bases to form a query response
CN106126619A (zh) 一种基于视频内容的视频检索方法及系统
US11176126B2 (en) Generating a reliable response to a query
CN104281608A (zh) 基于微博的突发事件分析方法
Al-Taie et al. Online data preprocessing: A case study approach
CN108563667A (zh) 基于新词识别的热门话题采集系统及其方法
CN105512300B (zh) 信息过滤方法及系统
Ouyang et al. Sentistory: multi-grained sentiment analysis and event summarization with crowdsourced social media data
CN114896305A (zh) 一种基于大数据技术的智慧互联网安全平台
CN115293723A (zh) 基于大数据分析的网络舆论热度分析系统
US20220245358A1 (en) Creating a superset of knowledge
TW201640383A (zh) 網路事件自動蒐集分析方法及系統
CN110019763B (zh) 文本过滤方法、系统、设备及计算机可读存储介质
US20230359817A1 (en) Identifying utilization of intellectual property
CN113674846A (zh) 基于lstm网络的医院智慧服务舆情监控平台
US11544320B2 (en) Image processing utilizing an entigen construct
Girish et al. Extreme event detection and management using twitter data analysis
CN105245394A (zh) 一种基于分层方式分析网络访问日志的方法和设备
US11720558B2 (en) Generating a timely response to a query
CN113869355B (zh) 一种基于XGBoost的人员危险性评估方法
CN111475706B (zh) 一种全天候自动检测重要消息的ai分析预警方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Lv Chunhua

Inventor before: Yang Xiaobao

Inventor before: Zhao Shuhe

Inventor before: Wang Kun

Inventor before: Wang Zhongyang

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: YANG XIAOBAO ZHAO SHUHE WANG KUN WANG CHONGYANG TO: LV CHUNHUA

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160706

Termination date: 20191228

CF01 Termination of patent right due to non-payment of annual fee