CN101739450A - 对视频中出现的信息进行检索的方法及系统 - Google Patents

对视频中出现的信息进行检索的方法及系统 Download PDF

Info

Publication number
CN101739450A
CN101739450A CN200910224267A CN200910224267A CN101739450A CN 101739450 A CN101739450 A CN 101739450A CN 200910224267 A CN200910224267 A CN 200910224267A CN 200910224267 A CN200910224267 A CN 200910224267A CN 101739450 A CN101739450 A CN 101739450A
Authority
CN
China
Prior art keywords
video
information
record
module
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910224267A
Other languages
English (en)
Other versions
CN101739450B (zh
Inventor
张震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING
Original Assignee
WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING filed Critical WANGTI SCIENCE AND TECHNOLOGY DEVELOPMENT Co Ltd BEIJING
Priority to CN2009102242678A priority Critical patent/CN101739450B/zh
Publication of CN101739450A publication Critical patent/CN101739450A/zh
Application granted granted Critical
Publication of CN101739450B publication Critical patent/CN101739450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

由于目前视频处理技术的局限性,用户无法自动在视频中搜索到所需要的文字部分。本发明公开了一种对视频中出现的信息进行检索的方法及系统,该方法包括:对教学屏幕进行视频录制;对视频录制中出现的信息进行捕获;将捕获的内容记录成日志;从视频中搜索请求检索的信息出现的视频时段;自动地在视频进度条上标记请求检索的信息出现的时间点并进行播放。从而实现了在远程屏幕教学中用户能够自动在视频中搜索到所需要的文字部分。

Description

对视频中出现的信息进行检索的方法及系统
技术领域
本发明涉及屏幕搜索领域,特别是一种在屏幕录制视频后能对屏幕上文字进行搜索并定位到指定视频片段的方法。
背景技术
因教学的需要,教师常常要将教学屏幕上的各项操作录制成教学视频,以供学习者查看学习。由于目前视频处理技术的局限性,用户无法自动在视频中搜索到所需要的信息。若要查找所需要的视频片段,必须人工对视频完整的查看一次。这种方法不但耗时耗力,还可能错过有效信息。后来发展到文字识别的方式。它先将视频信息转换为图片,然后利用各种模式识别算法分析视频中的文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,再来进行检索。由于汉字字量大、字形复杂,这种方式不能保证准确率,另外需要额外的识别、存储时间,效率低下,达不到人们所希望的快捷准确的搜索视频片段的要求。
发明内容
本发明的目的是提出一种可对视频中出现的信息例如汉字、字母及数字等进行检索的方法和系统。根据对教学屏幕进行视频录制的特点,视频中会出现大量的文字等信息,如果在录制视频的同时记录下屏幕中所出现的文字等文本信息,将有助于对视频信息的检索。
为解决目前存在的技术问题,本发明采用的技术方案如下:
一种用于对视频中出现的信息进行检索的方法,所述方法包括以下步骤:
对教学屏幕进行视频录制;
对视频录制中出现的信息进行捕获,所述出现的信息包括汉字、字母或者数字;
将捕获的内容记录成日志;
从视频中搜索请求检索的信息出现的视频时段;
自动地在视频进度条上标记请求检索的信息出现的时间点并进行播放。
其中,所述对视频录制中出现的信息进行捕获,具体是指在数据从计算机总线进入图形处理器时,利用虚拟显卡将计算机系统所需要显示的信息进行捕获;
其中,将捕获到的内容实时记录到日志中;
进一步的,还包括对日志进行分析挖掘,剔除重复,以生成适于检索的索引文件,将生成的索引文件存放到录制文件的地方,并通过脚本将屏幕文件和索引文件相联系;
其中,用户在对视频中的信息进行搜索时,输入搜索关键词,由JavaScript装载xml文件,按条件查找,生成记录集,根据记录集控制播放器,自动在进度条上标记请求检索的信息出现的时间点并进行播放。
本发明还公开了一种用于对视频中出现的信息进行检索的系统,所述系统包括:
视频录制模块,用于对教学屏幕进行视频录制;
捕获模块,用于对视频录制模块在视频录制中出现的信息进行捕获,所述出现的信息包括汉字、字母或者数字;
日志记录模块,用于将捕获模块所捕获的内容记录成日志;
搜索模块,用于通过日志记录模块从视频中搜索请求检索的信息出现的视频时段;
播放模块,用于自动地在视频进度条上标记请求检索的信息出现的时间点并进行播放。
其中,所述对视频录制模块在视频录制中出现的信息进行捕获,具体是指在数据从计算机总线进入图形处理器时,利用虚拟显卡将计算机系统所需要显示的信息进行捕获;
其中,将捕获到的内容实时记录到日志中;
进一步的,所述系统还包括剔重模块和存放模块,所述剔重模块用于对日志进行分析挖掘,剔除重复,以生成适于检索的索引文件,所述存放模块用于将生成的索引文件存放到录制文件的地方,并通过脚本将屏幕文件和索引文件相联系;
其中,用户通过所述系统对视频中的信息进行检索时,输入检索关键词,由JavaScript装载xml文件,按条件查找,生成记录集,根据记录集控制系统中的播放模块,自动在进度条上标记请求检索的信息出现的时间点并进行播放。
本发明的有益效果与传统的人工搜索视频片段方法及ocr方法相比,利用虚拟显卡技术截取屏幕上出现的文字从而实现搜索的方法具有以下优点:
1.有效的缩短了搜索时间:由于虚拟显卡截获的是原始文字信息,故省去了转换、识别的时间,从而使得搜索变得更加快捷;
2.有效的提高了搜索的准确性:由于本方法将文字直接从视频中提取,故准确率可以达到100%。
3.本方法可操作、可实现性强,可以满足用户的不同需求及特殊要求;
4.提高了在远程屏幕教学中查看所需课件的效率:只需输入搜索关键词,就可以看到自己感兴趣的内容;
5.可兼容多种格式的文档,如文件名、word、txt等等,事实上只要是原生的文字都可以记录并进行搜索。
附图说明
图1为对屏幕上视频进行录制的流程图;
图2为对视频中出现的文字进行检索的流程图。
具体实施方式
下面结合附图及具体实施方式,详细描述本发明的技术方案。
如图1及图2所示,本发明采用的技术方案就是在教学屏幕录制视频时对视频中出现的信息进行捕获,记录成日志,然后交由搜索工具将文字等信息出现的视频时段搜索出来。
具体实现时,对教学屏幕进行视频录制,在数据从计算机总线进入GPU(图形处理器)时,利用虚拟显卡将计算机系统所需要显示的信息进行截取,截取的信息包括汉字、字母、数字等形式的信息,并将截取到的内容实时记录到日志中。对日志进行分析挖掘,剔除重复,以生成更适于检索的索引文件。将生成的索引文件存到录制文件的地方,并通过脚本将屏幕文件和索引文件联系。这样就可以用XPath/XQuery进行检索。
用户在使用搜索时,只需输入搜索关键词,由JavaScript装载xml文件,按条件查找,生成记录集。根据记录集控制页面上的播放器,自动在进度条上标记指定的信息出现的时间点并进行播放。
本发明中,采用了一种无需时间转换的日志记录方式,有利于视频的检索定位。由于生成的日志只是按调用情况进行显示,有必要去除重复,去除多余记录等,所以对日志还要进行分析挖掘,处理重复,以生成更适于检索的索引文件。将生成的索引文件存放到录制文件的地方,并通过脚本将屏幕文件和索引文件联系。这样就可以用XPath/XQuery进行检索。
用户在使用搜索时,只需输入搜索关键词,由JavaScript装载xml文件,按条件查找,生成记录集。根据记录集控制页面上的播放器,自动在进度条上标记指定文本出现的时间点并进行播放。
其中在具体实现时,采用以下方案:
1.在对教学屏幕进行视频录制时,使用虚拟显卡技术,将发送到教学屏幕的汉字、字母、数字等信息进行截取。
2.将截取到的时间、参数、内容等信息记录成日志。
日志有两种方案:
---------------------------------------------------
采用类似于log4j的记录样式,时间表示使用ISO8601标准。
[2006-03-08T14:25:10.487+08:00]x y 3 ABC
---------------------------------------------------
利用log4j的%r输出自应用启动到输出该log信息耗费的毫秒数
0 x y 3 ABC
15 x y 6 ABCDEF
使用第二种少了时间转换的过程,有利于视频的检索定位。
3.日志分析挖掘,剔除重复等,生成更适于检索的索引文件。
由于生成的日志只是按调用情况进行显示,有必要去除重复,去除多余记录等。
然后生成xml文件,这样就可以用XPath/XQuery进行检索。
<xml encoding=″UTF-8″>
      <screen>
            <clip api=″TextOutA″length=″3″startTime=″0″
><![CDATA[ABC]]></clip>
            <clip api=″TextOutA″length=″6″startTime=″15″
><![CDATA[ABCDEF]]></clip>
      </screen>
</xml>
4.添加生成索引文件到屏幕中。
将生成索引文件存放到录制文件的地方,并通过脚本将屏幕文件和索引文件联系。
5.在使用搜索时,自动在进度条上标记指定文本出现的时间点。
用户输入搜索关键词;
由JavaScript装载xml文件,按条件查找,生成记录集。
根据记录集控制页面上的播放器,标记出现相应文字的片段并进行播放。
本发明还公开了一种用于对视频中出现的信息进行检索的系统,所述系统包括:
视频录制模块,用于对教学屏幕进行视频录制;
捕获模块,用于对视频录制模块在视频录制中出现的信息进行捕获,所述出现的信息包括汉字、字母或者数字;
日志记录模块,用于将捕获模块所捕获的内容记录成日志;
搜索模块,用于通过日志记录模块从视频中搜索请求检索的信息出现的视频时段;
播放模块,用于自动地在视频进度条上标记请求检索的信息出现的时间点并进行播放。
其中,所述对视频录制模块在视频录制中出现的信息进行捕获,具体是指在数据从计算机总线进入图形处理器时,利用虚拟显卡将计算机系统所需要显示的信息进行捕获。
其中,将捕获到的内容实时记录到日志中。
进一步的,所述系统还包括剔重模块和存放模块,所述剔重模块用于对日志进行分析挖掘,剔除重复,以生成适于检索的索引文件,所述存放模块用于将生成的索引文件存放到录制文件的地方,并通过脚本将屏幕文件和索引文件相联系。
其中,用户通过所述系统对视频中的信息进行检索时,输入检索关键词,由JavaScript装载xml文件,按条件查找,生成记录集,根据记录集控制系统中的播放模块,自动在进度条上标记请求检索的信息出现的时间点并进行播放。
本发明中,通过采用虚拟显卡技术记录所有屏幕上显示的文字。虚拟显卡驱动用于对于1台以上的物理显示器设备进行映射图画处理。在不影响本机操作的情况下,将操作内容通过虚拟显卡驱动镜像记录,它只是反映向虚拟桌面的绘画、因此、和实际的显卡没有关系。理论上是不依赖于硬件的虚拟驱动、并且可以说和普通的驱动一样可以和所有的绘画指令对应。它具有以下优点
1.是Windows可以保证的方式;
不依存于特定的驱动、可以期待将来也可以稳定的运行。
2.只hook绘画信息;
万一发生问题,因为虚拟显示驱动仅仅是hook绘画的构造,不会像NewRC Driver那样不能使用鼠标和键盘。
3.不论什么时候都可以安装、卸载;
和普通的驱动不同、因为不用内核方式运行、可以进行简单的添加删除。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种用于对视频中出现的信息进行检索的方法,其特征在于,包括以下步骤:
对教学屏幕进行视频录制;
对视频录制中出现的信息进行捕获,所述出现的信息包括汉字、字母或者数字;
将捕获的内容记录成日志;
从视频中搜索请求检索的信息出现的视频时段;
自动地在视频进度条上标记请求检索的信息出现的时间点并进行播放。
2.根据权利要求1所述的方法,其特征在于,所述对视频录制中出现的信息进行捕获,具体是指在数据从计算机总线进入图形处理器时,利用虚拟显卡将计算机系统所需要显示的信息进行捕获。
3.根据权利要求1或2所述的方法,其特征在于,将捕获到的内容实时记录到日志中。
4.根据权利要求1、2或3所述的方法,其特征在于,还包括对日志进行分析挖掘,剔除重复,以生成适于检索的索引文件,将生成的索引文件存放到录制文件的地方,并通过脚本将屏幕文件和索引文件相联系。
5.根据权利要求1或2所述的方法,其特征在于,用户在对视频中的信息进行搜索时,输入搜索关键词,由JavaScript装载xml文件,按条件查找,生成记录集,根据记录集控制播放器,自动在进度条上标记请求检索的信息出现的时间点并进行播放。
6.一种用于对视频中出现的信息进行检索的系统,其特征在于,所述系统包括:
视频录制模块,用于对教学屏幕进行视频录制;
捕获模块,用于对视频录制模块在视频录制中出现的信息进行捕获,所述出现的信息包括汉字、字母或者数字;
日志记录模块,用于将捕获模块所捕获的内容记录成日志;
搜索模块,用于通过日志记录模块从视频中搜索请求检索的信息出现的视频时段;
播放模块,用于自动地在视频进度条上标记请求检索的信息出现的时间点并进行播放。
7.根据权利要求6所述的系统,其特征在于,所述对视频录制模块在视频录制中出现的信息进行捕获,具体是指在数据从计算机总线进入图形处理器时,利用虚拟显卡将计算机系统所需要显示的信息进行捕获。
8.根据权利要求6或7所述的系统,其特征在于,将捕获到的内容实时记录到日志中。
9.根据权利要求6-8中任一项所述的系统,其特征在于,还包括剔重模块和存放模块,所述剔重模块用于对日志进行分析挖掘,剔除重复,以生成适于检索的索引文件,所述存放模块用于将生成的索引文件存放到录制文件的地方,并通过脚本将屏幕文件和索引文件相联系。
10.根据权利要求6或7所述的系统,其特征在于,用户通过所述系统对视频中的信息进行检索时,输入检索关键词,由JavaScript装载xml文件,按条件查找,生成记录集,根据记录集控制系统中的播放模块,自动在进度条上标记请求检索的信息出现的时间点并进行播放。
CN2009102242678A 2009-11-26 2009-11-26 对视频中出现的信息进行检索的方法及系统 Active CN101739450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009102242678A CN101739450B (zh) 2009-11-26 2009-11-26 对视频中出现的信息进行检索的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102242678A CN101739450B (zh) 2009-11-26 2009-11-26 对视频中出现的信息进行检索的方法及系统

Publications (2)

Publication Number Publication Date
CN101739450A true CN101739450A (zh) 2010-06-16
CN101739450B CN101739450B (zh) 2012-08-22

Family

ID=42462933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102242678A Active CN101739450B (zh) 2009-11-26 2009-11-26 对视频中出现的信息进行检索的方法及系统

Country Status (1)

Country Link
CN (1) CN101739450B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646235A (zh) * 2013-11-25 2014-03-19 华为技术有限公司 多路视频检测系统中的目标检测方法、装置及服务器
WO2014161282A1 (zh) * 2013-07-15 2014-10-09 中兴通讯股份有限公司 视频文件播放进度的调整方法及装置
CN104283729A (zh) * 2013-07-03 2015-01-14 钟丹晔 屏幕录像系统及其工作方法
CN104378697A (zh) * 2014-11-07 2015-02-25 重庆晋才富熙科技有限公司 一种用于全视频标记的方法
CN104469542A (zh) * 2014-11-07 2015-03-25 重庆晋才富熙科技有限公司 一种用于全视频标记的装置
CN104636162A (zh) * 2013-11-11 2015-05-20 宏达国际电子股份有限公司 使用标签的多媒体管理的方法、装置及计算机程序产品
CN105677919A (zh) * 2016-03-03 2016-06-15 何建勇 一种语言资源有声数据的存储和检索方法
CN105893434A (zh) * 2015-12-10 2016-08-24 乐视网信息技术(北京)股份有限公司 基于搜索关键字的亮点提示方法和装置
CN106021368A (zh) * 2016-05-10 2016-10-12 东软集团股份有限公司 播放多媒体文件的方法及装置
CN109597898A (zh) * 2018-11-28 2019-04-09 广州讯立享智能科技有限公司 一种信息检索方法及装置
CN111597382A (zh) * 2018-07-13 2020-08-28 北京朋创天地科技有限公司 网络安全审计方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6731788B1 (en) * 1999-01-28 2004-05-04 Koninklijke Philips Electronics N.V. Symbol Classification with shape features applied to neural network
CN101382937B (zh) * 2008-07-01 2011-03-30 深圳先进技术研究院 基于语音识别的多媒体资源处理方法及其在线教学系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104283729A (zh) * 2013-07-03 2015-01-14 钟丹晔 屏幕录像系统及其工作方法
WO2014161282A1 (zh) * 2013-07-15 2014-10-09 中兴通讯股份有限公司 视频文件播放进度的调整方法及装置
US9799375B2 (en) 2013-07-15 2017-10-24 Xi'an Zhongxing New Software Co. Ltd Method and device for adjusting playback progress of video file
US9727215B2 (en) 2013-11-11 2017-08-08 Htc Corporation Method for performing multimedia management utilizing tags, and associated apparatus and associated computer program product
CN104636162A (zh) * 2013-11-11 2015-05-20 宏达国际电子股份有限公司 使用标签的多媒体管理的方法、装置及计算机程序产品
CN103646235A (zh) * 2013-11-25 2014-03-19 华为技术有限公司 多路视频检测系统中的目标检测方法、装置及服务器
CN103646235B (zh) * 2013-11-25 2016-10-05 华为技术有限公司 多路视频检测系统中的目标检测方法、装置及服务器
CN104378697A (zh) * 2014-11-07 2015-02-25 重庆晋才富熙科技有限公司 一种用于全视频标记的方法
CN104469542A (zh) * 2014-11-07 2015-03-25 重庆晋才富熙科技有限公司 一种用于全视频标记的装置
CN105893434A (zh) * 2015-12-10 2016-08-24 乐视网信息技术(北京)股份有限公司 基于搜索关键字的亮点提示方法和装置
WO2017096901A1 (zh) * 2015-12-10 2017-06-15 乐视控股(北京)有限公司 基于搜索关键字的亮点提示方法和装置
CN105677919A (zh) * 2016-03-03 2016-06-15 何建勇 一种语言资源有声数据的存储和检索方法
CN106021368A (zh) * 2016-05-10 2016-10-12 东软集团股份有限公司 播放多媒体文件的方法及装置
CN111597382A (zh) * 2018-07-13 2020-08-28 北京朋创天地科技有限公司 网络安全审计方法及系统
CN109597898A (zh) * 2018-11-28 2019-04-09 广州讯立享智能科技有限公司 一种信息检索方法及装置

Also Published As

Publication number Publication date
CN101739450B (zh) 2012-08-22

Similar Documents

Publication Publication Date Title
CN101739450B (zh) 对视频中出现的信息进行检索的方法及系统
US10366154B2 (en) Information processing device, information processing method, and computer program product
CN106484663B (zh) 一种文档内容的提取方法和装置
US20070255706A1 (en) Information retrieval apparatus
CN101488145B (zh) 文档搜索装置及文档搜索方法
CN106971009B (zh) 语音数据库生成方法及装置、存储介质、电子设备
US7783634B2 (en) Device, a program and a system for managing electronic documents
KR970076228A (ko) 텍스트열 추출 시스템
JP2005293239A (ja) 情報共有装置及び情報共有方法
CN102520843A (zh) 一种采集图像作为候选项的输入法及系统
WO2017136444A1 (en) Optical recognition of tables
CN102460432A (zh) 选择性内容提取
US10776570B2 (en) Supporting digital ink in markup language documents
JP2006065754A (ja) 情報処理装置、情報処理方法及びプログラム
CN101008940B (zh) 自动处理字体缺失的方法与装置
CN102930032B (zh) 搜索查询的上下文建议
JP2008123265A (ja) アイデア抽出支援システム及び方法
US7551312B1 (en) Annotable document printer
CN111680555A (zh) 一种智能手写笔迹识别系统
CN102737030A (zh) 专利文档的数据输出方法、终端及系统
CN101777336B (zh) 基于双屏电子阅读器的显示方法和装置
CN112528799A (zh) 一种教学直播方法、装置、计算机设备和存储介质
CN104156458A (zh) 一种信息的提取方法及装置
US20120136815A1 (en) Display Device and Display Method
JP4802689B2 (ja) 情報認識装置及び情報認識プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant