CN104378684A - 一种进行快速视频标记的装置 - Google Patents
一种进行快速视频标记的装置 Download PDFInfo
- Publication number
- CN104378684A CN104378684A CN201410634771.6A CN201410634771A CN104378684A CN 104378684 A CN104378684 A CN 104378684A CN 201410634771 A CN201410634771 A CN 201410634771A CN 104378684 A CN104378684 A CN 104378684A
- Authority
- CN
- China
- Prior art keywords
- video
- module
- marked
- point
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8455—Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47205—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明提供一种进行快速视频标记的装置,应用于教学视频的播放处理领域,所述装置包括:打点模块,用于选取在播视频中的待标记点;拾音模块,用于采集所述待标记点前后的视频段,并提取所述视频段中的语音信号;语音识别模块,用于识别所述语音信号,并将其转换成相应的文字信号;控制处理模块,用于将所述文字信号附加到所述待标记点所在的视频中并予以输出显示。本发明通过对待播视频或者在播视频进行全视频标记或者设点标记,为视频观看者提供了更加便捷而形象的预览效果,避免了现有技术中需要记住时间点或者只能在同一台电脑上进行记忆播放等复杂操作的情况。
Description
技术领域
本发明涉及视频处理领域,主要是指对教学课程类的视频进行内容标记,以便于快速查找需要播放的内容,更加具体地来说,特别是涉及一种进行快速视频标记的装置。
背景技术
随着互联网技术的发展,现代教学模式已经不再局限于传统的现场实际教学,人们更多地可以不用在现场听课学习,而是可以在不受时间和地点的限制,而根据自己的时间和情况来通过视频学习。例如,可以进行远程教学,或者视频自学等。不过这些都是建立在课程的视频录制上,即首先需要将现场教学进行视频录制,以供需要进行学习的在任何地点和时间来进行自由学习。
不过,在实际中存在这样一种情况,某一课程的视频时间过长,而利用其进行学习的人进行学习的时间较为短暂,无法一次性学习完成,那么就需要进行多次学习。不过,每次打开视频时视频一般都是从头开始播放,这就需要人为地进行拖进时间,来找到上一次的学习点。
虽然,现有技术中有缓存技术,可以记忆上次播放的时间点,并在下一次播放时自动找到上次播放点进行继续播放,不过这种技术仅局限于在同一台电脑上,如果下次学习的电脑不一样,就不行。还有一种技术,就是利用时间点,键入上次播放的时间点,让视频跳转到该时间点进行播放,不过,往往是人们在学习完的时候不会刻意去记下该时间点,而且如果时间太久,也容易忘记,无论如何对于学习者来讲,都是十分不方便的。
因此,如何使的学习者在进行视频学习时,可以快速找到上一次未学习完的视频时间点,以方便其进行视频学习就成为了本技术领域接待解决的一个问题。
发明内容
鉴于以上所述,本发明的目的在于提供一种进行快速视频标记的装置,用于解决现有技术中在进行多次学习一个视频时,无法快速找到上一次学习点的问题。
为实现上述目的及其他相关目的,本发明提供以下技术方案:
一种进行快速视频标记的装置,包括:打点模块,用于选取在播视频中的待标记点;拾音模块,用于采集所述待标记点前后的视频段,并提取所述视频段中的语音信号;语音识别模块,用于识别所述语音信号,并将其转换成相应的文字信号;控制处理模块,用于将所述文字信号附加到所述待标记点所在的视频中并予以输出显示。
优选地,在上述进行快速视频标记的装置中,所述打点模块还用于以所述待标记点为起点向前或先后延长一个时间周期,并对所述待标记点至所述延长时间周期之间的时间段所对应的视频进行采集。
优选地,在上述进行快速视频标记的装置中,所述打点模块还用于以所述待标记点为起点同时向前或先后延长一个相同时间周期,并对所述延长时间周期之间的时间段所对应的视频进行采集。
作为上述进行快速视频标记的装置及其所有优选方案的进一步优化中,所述拾音模块中还设有一语音侦测模块,用于检测所述语音信号中是否含有语音信息;若是,则将所述语音信息输出至语音识别模块中;若否,则依据所述待标记点为起点重新延长一个时间周期进行视频段的采集,直到所采集的视频段中含有语音信息为止。
作为上述进行快速视频标记的装置及其所有优选方案的进一步优化中,所述装置还包括一数模转换模块,用于将所述语音信号转化成数字语音信号。
如上所述,本发明具有以下有益效果:本发明通过对待播视频或者在播视频进行全视频标记或者设点标记,为视频观看者提供了更加便捷而形象的预览效果,避免了现有技术中需要记住上次时间点或者只能在同一台电脑上进行记忆播放等复杂操作的情况。
附图说明
为了更清楚地说明本发明实施例中的方案,下面将对具体实施例中描述所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种进行快速视频标记的装置的一实施例方式的原理图。
图2为本发明一种进行快速视频标记的装置的另一实施方式的原理图。
图3为本发明一种进行快速视频标记的装置的又一实施方式的原理图。
附图标号说明
10 打点模块
20 拾音模块
201 语音侦测模块
30 语音识别模块
40 控制处理模块
50 数模转换模块
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
见图1,示出了本发明一种进行快速视频标记的装置的在本实施例中的原理图,如图所示,所述装置包括:打点模块10,用于选取在播视频中的待标记点;拾音模块20,用于采集所述待标记点前后的视频段,并提取所述视频段中的语音信号;语音识别模块30,用于识别所述语音信号,并将其转换成相应的文字信号;控制处理模块40,用于将所述文字信号附加到所述待标记点所在的视频中并予以输出显示。
具体地,在上述打点模块10中,首先是需要将待处理的视频进行播放,并在需要标记的位置进行标记动作。比如,可以是在播放到需要标记的位置时,进行暂停播放,并利用鼠标进行待标记点的选取动作;也可以是人为地拉动进度条来进行拖动选取,以找到需要标记的待标记点。
进一步地,在实际过程中,我们还可能需要进行多处标记,或者学习者需要事先就知晓每个进度点下的文字信息,以便于进行选择性播放学习。那么可以不必要进行在播标记,可以事先地对整个视频文件进行全视频标记。
采用上述方案来进行视频标记,是一种打点标记,还可将其拓展至全视频的全文标记,即对视频的整个文件做标记处理,那么在视频播放时,我们只需要移动进度条或者鼠标点击相关的视频进度,就可以同步看到该进度条下或者鼠标点下所对应的标注信息,这对于那些没有实现看过视频的学习者,或者想要选择性观看视频的学习者来说,是一种更加方便的选择,从而也避免了盲目地进行筛选的情况。
具体地,在所述打点模块10中,根据所选取的待标记点,来获取所述标记点前后的一段视频,或者是所述待标记点向前的一段视频,又或者是向后一段视频。这主要是为了获取与所述待标记点相关的一端视频,以得到语音信号。因为待标记点所对应的可能只是一帧图像信号,而要想通过一帧图像中所附带的语音信号,其信息量是十分有限。
进一步地,可以通过预设时间周期来进行自动截取视频段,即可以根据所述待标记点,自动向前采集5秒的视频段,或者自动先后采集5秒的视频端,还可以选取所述待标记点前后各3秒的视频段。举例来说,如果在一部60分钟的视频中,先选取了25′42″这个标记点,那么可以通过自动采集25′37″至25′42″这个向后5秒的视频段,或者自动采集25′42″至25′47″这个向前5秒的视频段,又或者采集25′39″至25′45″这个前后3秒的视频段。
更进一步地,在实际过程中,有可能采用向前采集的视频段或者向后采集的视频段,甚至是前后采集的视频段中,并没有语音信号,也就是说在所选取的视频段中,并没有人说话,故采集不到语音视频,从而会导致后面的语音解析失败,从而无法完成打点。见图2,示出了本发明一种进行快速视频标记的装置在本实施例中另一实施方式的示意图,如图所示,为了避免上述问题,在所述拾音模块20中还设有一语音侦测模块201,用于检测所述语音信号中是否含有语音信息;若是,则将所述语音信息输出至语音识别模块30中;若否,则依据所述待标记点为起点重新延长一个时间周期进行视频段的采集,直到所采集的视频段中含有语音信息为止。简单地来说,也就是当所采取的视频段中没有语音信号时,可以自动向前、向后或者前后同时延长一个预设时间段。
例如:在提取所述视频段中的语音信号后,检测所述语音信号中是否含有语音信息:若是,则将所述语音信号输出至所述语音识别模块30中;若否,则依据所述待标记点重新再延长一个预设时间周期进行视频段的采集。例如,若是向前5秒进行采集视频段,其所采集的视频段中没有语音信号,则继续向前延长5秒进行采集,直到所采集的视频段有语音信号为止。或者当向前5秒进行采集视频段中没有语音信号时,则依据所述待标记点向后5秒进行采集视频段,直到所采集的视频段有语音信号为止。
应当理解,上述拾音模块20中,所预设的想要采集视频段的长短是根据实际情况作出的优选设置,当然其他时间段的视频也可以,不过其会导致后面语音解析时的时间(下文再详细说明)。另外,如何侦测其所采集的语音信号中是否有语音信息,只需要测其中是否具有声波即可,这对于本领域的技术人员来说,是完全。
具体地,见图3,示出了本发明一种进行快速视频标记的装置的在本实施例中的又一实施方式的原理图,如图所示,在所述进行快速视频标记的装置中,还可以设置一数模转换模块50,用于对所述语音信号进行解析,即进行信号转换,很多时候教学用的视频经提取出来的语音信号是模拟信号,此时要对其进行数模信号转换,将语音信号转换成数字语音信号。本数模转换模块50相对本技术方案来说是可选的,因为,如果所提取出来的语音信号本身是数字信号,就不用进行转换了撒。
更具体地,在所述语音识别模块30中,将所述数字语音信号转换成相应的文字信号,语音识别模块30可以采用现有的语音识别软件来予以实现,对于本领域技术人员来讲是常规技术,故这里不再赘述。
最后,在控制处理模块40中,用于将所述文字信号附加到所述待标记点所在的视频中,这里所得到的文字信号也是数字信号,将其附加到视频中以后,当我们移动至该待标记点是就会看到所述文字信息。例如,我们将鼠标移至该待标记点,那么就会在该待标记点出显示出该文字信息。
综上所述,本发明通过对待播视频或者在播视频进行全视频标记或者设点标记,为视频观看者提供了更加便捷而形象的预览效果,避免了现有技术中需要记住时间点或者只能在同一台电脑上进行记忆播放等复杂操作的情况。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
Claims (6)
1.一种进行快速视频标记的装置,其特征在于,包括:
打点模块,用于选取在播视频中的待标记点;
拾音模块,用于采集所述待标记点前后的视频段,并提取所述视频段中的语音信号;
语音识别模块,用于识别所述语音信号,并将其转换成相应的文字信号;
控制处理模块,用于将所述文字信号附加到所述待标记点所在的视频中并予以输出显示。
2.根据权利要求1所述的进行快速视频标记的装置,其特征在于,所述打点模块还用于以所述待标记点为起点向前或先后延长一个时间周期,并对所述待标记点至所述延长时间周期之间的时间段所对应的视频进行采集。
3.根据权利要求1所述的进行快速视频标记的装置,其特征在于,所述打点模块还用于以所述待标记点为起点同时向前或先后延长一个相同时间周期,并对所述延长时间周期之间的时间段所对应的视频进行采集。
4.根据权利要求2或3所述的进行快速视频标记的装置,其特征在于,所述时间周期为3-5秒。
5.根据权利要求1至3任一项所述的进行快速视频标记的装置,其特征在于,所述拾音模块中还设有一语音侦测模块,用于检测所述语音信号中是否含有语音信息;若是,则将所述语音信息输出至语音识别模块中;若否,则依据所述待标记点为起点重新延长一个时间周期进行视频段的采集,直到所采集的视频段中含有语音信息为止。
6.根据权利要求1至3任一项所述的进行快速视频标记的装置,其特征在于,所述装置还包括一数模转换模块,用于将所述语音信号转化成数字语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410634771.6A CN104378684A (zh) | 2014-11-07 | 2014-11-07 | 一种进行快速视频标记的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410634771.6A CN104378684A (zh) | 2014-11-07 | 2014-11-07 | 一种进行快速视频标记的装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104378684A true CN104378684A (zh) | 2015-02-25 |
Family
ID=52557285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410634771.6A Pending CN104378684A (zh) | 2014-11-07 | 2014-11-07 | 一种进行快速视频标记的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104378684A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965874A (zh) * | 2015-06-11 | 2015-10-07 | 腾讯科技(北京)有限公司 | 信息处理方法及装置 |
CN105100920A (zh) * | 2015-08-31 | 2015-11-25 | 北京奇艺世纪科技有限公司 | 一种视频预览的方法和装置 |
CN106409031A (zh) * | 2015-08-03 | 2017-02-15 | 北京鸿合智能系统股份有限公司 | 一种录播学生端记录问题的方法和装置 |
WO2017190326A1 (zh) * | 2016-05-05 | 2017-11-09 | 汤美 | 网络课程的课件管理方法及系统 |
CN111212317A (zh) * | 2020-01-15 | 2020-05-29 | 清华大学 | 一种视频播放的跳转导航方法 |
CN111935552A (zh) * | 2020-07-30 | 2020-11-13 | 安徽鸿程光电有限公司 | 信息标注方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6360057B1 (en) * | 1999-05-12 | 2002-03-19 | Kabushiki Kaisha Toshiba | Digital video recording/playback system with entry point processing function |
WO2003107347A1 (en) * | 2002-06-18 | 2003-12-24 | Koninklijke Philips Electronics N.V. | System and method for providing videomarks for a video program |
CN101539929A (zh) * | 2009-04-17 | 2009-09-23 | 无锡天脉聚源传媒科技有限公司 | 利用计算机系统进行的电视新闻标引方法 |
CN101833977A (zh) * | 2009-03-12 | 2010-09-15 | 新奥特硅谷视频技术有限责任公司 | 一种通过特定语音触发的法庭庭审视频实时标引方法 |
CN103065625A (zh) * | 2012-12-25 | 2013-04-24 | 广东欧珀移动通信有限公司 | 一种数字语音标签的添加方法及装置 |
-
2014
- 2014-11-07 CN CN201410634771.6A patent/CN104378684A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6360057B1 (en) * | 1999-05-12 | 2002-03-19 | Kabushiki Kaisha Toshiba | Digital video recording/playback system with entry point processing function |
WO2003107347A1 (en) * | 2002-06-18 | 2003-12-24 | Koninklijke Philips Electronics N.V. | System and method for providing videomarks for a video program |
CN101833977A (zh) * | 2009-03-12 | 2010-09-15 | 新奥特硅谷视频技术有限责任公司 | 一种通过特定语音触发的法庭庭审视频实时标引方法 |
CN101539929A (zh) * | 2009-04-17 | 2009-09-23 | 无锡天脉聚源传媒科技有限公司 | 利用计算机系统进行的电视新闻标引方法 |
CN103065625A (zh) * | 2012-12-25 | 2013-04-24 | 广东欧珀移动通信有限公司 | 一种数字语音标签的添加方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965874A (zh) * | 2015-06-11 | 2015-10-07 | 腾讯科技(北京)有限公司 | 信息处理方法及装置 |
CN106409031A (zh) * | 2015-08-03 | 2017-02-15 | 北京鸿合智能系统股份有限公司 | 一种录播学生端记录问题的方法和装置 |
CN105100920A (zh) * | 2015-08-31 | 2015-11-25 | 北京奇艺世纪科技有限公司 | 一种视频预览的方法和装置 |
CN105100920B (zh) * | 2015-08-31 | 2019-07-23 | 北京奇艺世纪科技有限公司 | 一种视频预览的方法和装置 |
WO2017190326A1 (zh) * | 2016-05-05 | 2017-11-09 | 汤美 | 网络课程的课件管理方法及系统 |
CN111212317A (zh) * | 2020-01-15 | 2020-05-29 | 清华大学 | 一种视频播放的跳转导航方法 |
CN111935552A (zh) * | 2020-07-30 | 2020-11-13 | 安徽鸿程光电有限公司 | 信息标注方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104378684A (zh) | 一种进行快速视频标记的装置 | |
CN104333817A (zh) | 一种进行快速视频标记的方法 | |
US10127825B1 (en) | Apparatus, method, and system of insight-based cognitive assistant for enhancing user's expertise in learning, review, rehearsal, and memorization | |
CN104408983B (zh) | 基于录播设备的智能教学信息处理系统 | |
US10354540B2 (en) | Method for generating a dedicated format file for a panorama mode teaching system | |
CN104581351A (zh) | 音频或视频的录制方法及其播放方法、电子装置 | |
CN103763453A (zh) | 一种图文采集识别装置 | |
CN112652200A (zh) | 人机交互系统、方法、服务器、交互控制设备及存储介质 | |
CN110010164A (zh) | 多通道音视频自动智能编辑方法 | |
CN104469543A (zh) | 一种基于语音技术的视频标记装置 | |
CN109814787B (zh) | 关键信息确定方法、装置、设备及存储介质 | |
CN111524507A (zh) | 语音信息的反馈方法、装置、设备、服务器及存储介质 | |
CN110675674A (zh) | 一种基于大数据分析的在线教育方法及在线教育平台 | |
CN104469544A (zh) | 一种基于语音技术的视频标记方法 | |
CN113657509B (zh) | 教学训练提升方法、装置、终端和存储介质 | |
CN201011591Y (zh) | 带条码扫描功能的mp3学习机 | |
CN104462475A (zh) | 一种用于智慧教学系统教学端课件检索的方法及装置 | |
CN104469542A (zh) | 一种用于全视频标记的装置 | |
CN112599130A (zh) | 一种基于智慧屏的智能会议系统 | |
CN107657843A (zh) | 一种课堂视频记录装置及其视频记录方法 | |
CN102142271B (zh) | 同步显示波形的手持式多媒体播放器与复读方法 | |
CN112153421A (zh) | 数据处理方法、装置、系统、电子设备及存储介质 | |
CN107364256A (zh) | 一种智能笔、智能学习系统及其工作方法 | |
CN206348971U (zh) | 一种演讲训练电子仪 | |
JP2024507734A (ja) | 音声類似度決定方法及び装置、プログラム製品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150225 |
|
WD01 | Invention patent application deemed withdrawn after publication |