CN102024009A - 视频场景库生成方法及系统、搜索视频场景的方法及系统 - Google Patents

视频场景库生成方法及系统、搜索视频场景的方法及系统 Download PDF

Info

Publication number
CN102024009A
CN102024009A CN2010101205918A CN201010120591A CN102024009A CN 102024009 A CN102024009 A CN 102024009A CN 2010101205918 A CN2010101205918 A CN 2010101205918A CN 201010120591 A CN201010120591 A CN 201010120591A CN 102024009 A CN102024009 A CN 102024009A
Authority
CN
China
Prior art keywords
video scene
video
captions
storehouse
anchor point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101205918A
Other languages
English (en)
Inventor
李平辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2010101205918A priority Critical patent/CN102024009A/zh
Priority to PCT/CN2011/071072 priority patent/WO2011110063A1/zh
Publication of CN102024009A publication Critical patent/CN102024009A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了一种视频场景库生成方法及系统、基于上述方法所生成的视频场景库的搜索视频场景片段的方法和系统,视频场景库的生成方法包括如下步骤:A、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;B、提取标注的字幕段存入字幕库;C、根据标注的时间锚点对对应视频文件进行有冗余切割,截取该字幕对应的视频场景片段,存入视频场景片段库;D、建立字幕库里的字幕段和视频场景库里的视频场景片段的对应关系。本发明为用户方便快捷的找到目标视频场景片段做好数据支持。

Description

视频场景库生成方法及系统、搜索视频场景的方法及系统
技术领域
本发明属于视频搜索技术领域,具体涉及一种视频场景库的生成方法以及基于这种库的视频场景的搜索方法及系统;此外,本发明还涉及一种直接搜索视频场景的方法及系统。
背景技术
随着互联网络的普及和网络技术的发展,现今互联网上视频搜索技术已经被普遍使用。用户通过使用视频搜索引擎,可以方便的获得自己想要的视频信息。现今视频搜索技术普遍是基于关键字搜索,通过在视频数据库中对视频文件名或者相关标签的关键字匹配检索,将符合搜索条件的视频文件返回给用户。例如,用户输入关键字“疯狂”进行视频搜索,那么《疯狂的石头》《疯狂的赛车》等等文件名包涵“疯狂”二字的视频文件都是符合搜索条件的搜索结果。即使是采用更高级的帧搜索技术,其结果也是以为整个视频文件为单位将搜索结果返回给用户。现今视频搜索技术并没有提供方便快捷的视频场景片段的搜索功能。
假设一个学习外语的用户如果想知道一个单词或者一个句子在众多实际电影场景中如何运用,例如,一个学生想知道“how are you?”在哪些电影场景中可以用到,那么在现有的网络技术条件下,他首先必须得根据经验或者其他辅助条件判断“how are you?”这个句子会出现在哪一部视频里面,然后利用字幕搜索引擎和视频搜索引擎搜得这部视频的字幕文件和视频文件,通过对字幕文件的关键字匹配检索确定这部片子存在“how are you?”这个句子后,再通过拖放方式或者特定播放软件定位到“how are you?”这个句子所在的时间段进行观看。用户如果想收集含有“how are you?”这个句子的视频场景片段,就需要再用视频切割软件对视频文件进行切割收集。通过不断重复所述的过程,用户可以收集到一些包含“how are you?”这个对话内容的不同视频场景。
同样,一个需要大量某一类视频场景作为素材的用户,比如想参考许多战争场景拍摄方法的摄影师,需要一些雨景作为素材的视频制作爱好者,他们也只能首先通过经验或者其他辅助条件判断这一类视频场景会出现在哪一些视频文件上。然后通过观看大量这些视频文件发现目标视频场景,再用视频切割软件进行切割收集。
通过以上所述,可以看到,在现有网络技术下,用户必须花费大量的时间才能获得少量的目标视频场景片段。现今的视频搜索技术不具有通过关键字搜索,快捷获得大量目标视频场景片段的功能。
发明内容
本发明所要解决的问题是,提供一种视频场景库的生成方法,为用户方便快捷的找到目标视频场景片段做好数据支持。
本发明同时提供上述方法对应的视频场景库的生成系统。
此外,本发明还提供了一种基于上述方法所生成的视频场景库的搜索视频场景片段的方法和系统,以便用户方便快捷的找到目标视频场景片段。
此外,本发明还提供了一种直接搜索视频场景片段的方法和系统,以便用户方便快捷的找到目标视频场景片段。
另外,本发明还提供了一种视频场景的生成方法和系统,以便快捷的生成大量视频场景片段。
为解决上述技术问题,本发明采用如下技术方案:
一种视频场景库的生成方法,所述方法包括如下步骤:
A、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B、提取标注的字幕段存入字幕库;
C、根据标注的时间锚点对对应视频文件进行有冗余切割,截取该字幕对应的视频场景片段,存入视频场景片段库;
D、建立字幕库里的字幕段和视频场景库里的视频场景片段的对应关系。
作为本发明的一种优选方案,所述步骤A中,字幕附注包括视频场景里的对白/旁白原文,或者对白/旁白的同义解释或概括,或者描述视频场景类型的标签。
作为本发明的一种优选方案,所述步骤B进一步包括提取时间锚点和相关视频文件信息存入字幕库。
作为本发明的一种优选方案,所述步骤B、步骤C顺序互换。
一种视频场景库的生成系统,所述系统包括:
标注单元,用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕提取单元,用以提取标注的字幕段存入字幕库;
切割单元,用以根据标注的时间锚点对视频文件进行有冗余切割,截取该字幕对应的视频场景片段,存入视频场景片段库;
关系建立单元,用以建立字幕库里的字幕段和视频场景库里的视频场景片段的对应关系。
作为本发明的一种优选方案,所述标注单元中,字幕附注包括视频场景里的对白/旁白原文,或者对白/旁白的同义解释或概括,或者描述视频场景类型的标签;所述字幕提取单元进一步提取时间锚点和相关视频文件信息存入字幕库。
一种基于上述方法所生成的视频场景库的搜索视频场景片段的方法,所述方法包括如下步骤:
a、用户输入关键字提出搜索视频场景片段的请求;
b、在字幕库里检索得到匹配的字幕段信息;
c、返回和匹配字幕段相关联的视频场景片段。
作为本发明的一种优选方案,所述步骤a和步骤b之间进一步包括:
判断是请求搜索对白或旁白类型的视频场景,还是请求描述类型的视频场景。
若为前者,则步骤b在字幕库里搜索对白或旁白类型的字幕段;若为后者,则步骤b在字幕库里搜索描述类型的字幕段。
作为本发明的一种优选方案,所述步骤b和步骤c之间进一步包括:
判断是否请求按照新的切割时间冗余量实时切割截取视频场景片段。
若是,则根据匹配字幕段对应的时间锚点,按照新的切割时间冗余量对相应视频文件进行切割截取获得相应的视频场景片段;若否,则根据视频场景片段库和字幕库的关联关系获得和匹配字幕段对应的视频场景片段。
一种基于上述方法所生成的视频场景库的搜索视频场景片段的系统,所述系统包括:
输入单元,用户通过该输入单元输入信息;
搜索单元,用于接收到输入单元发起请求时,在存储单元中对视频场景片段的搜索;
存储单元,用于存储生成的视频场景库,即存储有相互关联的视频场景片段库和字幕库;
显示单元,用于显示符合搜索条件的视频场景片段。
作为本发明的一种优选方案,所述搜索系统进一步包括判断单元,用于判断搜索请求是针对对白或旁白类型的场景还是针对描述类型的场景,同时用于判断是否要求对视频场景片段按输入的切割时间冗余量重新切割截取。
作为本发明的一种优选方案,所述系统进一步包括切割单元,用于对视频文件按输入的切割时间冗余量重新切割截取。
一种直接搜索视频场景片段的方法,所述方法包括如下步骤:
A′、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B′、提取标注的时间锚点和字幕段以及相关视频文件信息存入字幕库;
C′、用户输入关键字提出搜索视频场景片段的请求;
D′、通过关键字检索获得匹配的字幕段及其相应的时间锚点;
E′、根据时间锚点和切割冗余量,对相应视频文件进行切割截取获得目标视频场景片段,返回给用户。
一种直接搜索视频场景片段的系统,所述系统包括:
标注单元,用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕库提取单元,用以提取标注的字幕段和时间锚点以及相关视频文件信息存入字幕库;
输入单元,用户通过该输入单元输入信息;
搜索单元,用于接收到输入单元发起请求时,在字幕库中进行关键字匹配检索;
切割单元,用于根据时间锚点和切割冗余量,对数据源中的视频文件切割截取目标视频场景片段;
显示单元,用于显示符合搜索条件的视频场景片段。
一种视频场景的生成方法,所述方法包括如下步骤:
A″、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B″、提取标注的字幕段和时间锚点存入字幕库;
C″、根据标注的时间锚点对对应视频文件进行有冗余切割,截取字幕段对应的视频场景片段。
一种视频场景的生成系统,所述系统包括:
标注单元,用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕提取单元,用以提取标注的字幕段和时间锚点存入字幕库;
切割单元,用以根据标注的时间锚点对视频文件进行有冗余切割,截取字幕段对应的视频场景片段。
本发明的有益效果在于:采用本发明提出的视频场景库的生成方法及系统以及搜索视频场景片段的方法及系统,只需花费制作相应字幕文件的人力时间,就可以自动把视频文件里的视频场景采集进视频场景库。视频场景库类似于字库,词库的概念,里面包含有来自各种视频文件里的各种视频场景片段以及相应的字幕段。用户只要在终端输入关键字进行搜索,就可以轻易获得大量来自不同视频文件的目标视频场景片段,免去了现今网络技术下,为达到同样目的,需要下载或者拷贝大量大体积视频文件,进而在字幕文件里检索,在视频文件里定位,切割等等的麻烦。弥补了现今视频搜索引擎不能搜索视频场景片段的不足,为根据关键字搜索视频场景的实现提供了一种方案,为用户,尤其是外语学习者和视频编辑工作者节省了大量的时间,提供了巨大的方便。
附图说明
图1为本发明视频场景库生成方法的流程图。
图2为本发明视频场景搜索方法的流程图。
图3为本发明视频场景库的结构图。
图4为本发明视频场景库生成系统的示意图。
图5为本发明视频场景搜索系统的示意图。
图6为本发明视频场景搜索实例的示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例一
本发明方案所涉及的视频文件,其内容、格式、类型等属性都不影响本发明方案的实施。下面例子中就以一般的英文电影视频的文件为例子,但本发明方案的实施并不限于英文电影的视频文件。如,本发明也适用于华语电影、其他外语电影、非电影类视频。
参阅图1,图1揭示了本发明视频场景库的生成方法的较佳实施实例,所述方法包括如下步骤:
【步骤101】
依照预设的取景规则,对视频文件的每一个视频场景进行时间锚点标注和字幕附注。典型的取景规则有,以视频中的每一句完整的对白或者旁白为一个场景单位,还有以一个特定的场景为一个场景单位。字幕内容可以是对白/旁白原文,或者对白/旁白的同义解释或概括,对应的是对白或旁白类型的视频场景,也可以是场景描述标签,对应的是描述性视频场景。
以《阿甘正传》这部影片的视频文件为例,假设预设的取景规则是以视频中的每一句完整的对白或者旁白为单位进行取景,此外还对特定的场景进行取景,比如雪景,海景,雨景,战斗场景等。假设电影里一共有2000句对白和旁白,50个特定的场景。那么这部影片便被定义了2050个视频场景。该步骤就要对这2050个视频场景进行时间锚点标注和字幕附注。标注的时间锚点有:开始时间锚点和结束时间锚点。开始时间锚点是指视频场景在视频文件中播放开始的时间点。结束时间锚点是指视频场景在视频文件中播放结束的时间点;字幕附注的内容包括对白或旁白和场景描述标签。
比如,在“00:32:46.634”和“00:32:48.727”的时间段之间,有一句“Myname is Forrest Gump”的对白。根据取景规则,以这个时间段为中心,便产生了一个视频场景单位。标注的开始时间锚点是“00:32:46.634”,结束时间锚点是“00:32:48.727”,附注的字幕内容是对白内容“My name is Forrest Gump”。该段视频场景属于对白或旁白类型的视频场景。
又如,在“00:49:10.123”和“00:51:06.351”的时间段之间,是一个较为独立的战斗场景。根据取景规则,以这个时间段为中心,便产生了一个视频场景单位。标注的开始时间锚点是“00:49:10.123”,结束时间锚点是“00:51:06.351”,附注的字幕内容是场景描述标签“战争”。该段视频场景属于描述类型的视频场景。
该步骤采用一般影视字幕制作技术对视频场景进行标注,输出包含时间锚点和字幕段的字幕文件。字幕制作技术是现有成熟技术,在此不做赘述。
【步骤102】
通过正则表达式匹配,提取所有标注的时间锚点和字幕以及相关的视频文件信息,存入字幕库。字幕库可采用一般商用数据库产品。每个存储元素包括一个完整的字幕附注及对应的开始时间锚点和结束时间锚点。整个字幕库的主要结构如下表格所示:
  序号   开始时间锚点   结束时间锚点   字幕信息   类型   来自视频
  …   …   …   …   …   …
  N   00:07:18.269   00:07:20.438   How are you?   对白   《闻香识女人》
  N+1   00:32:46.634   00:32:48.727   My name is Forrest Gump.   对白   《阿甘正传》
  N+2   00:49:10.123   00:51:06.351   战争   描述   《阿甘正传》
  …   …   …   …   …   …
表1
【步骤103】
以所标注的时间锚点为输入参数,循环利用多媒体编程语言的切割函数,比如Java媒体架构(JMF)里的Cut类里的相关函数,对视频文件按切割时间冗余量进行切割截取视频场景片段。切割时间冗余量是指,以目标视频场景所在的时间段为中心,向前还有向后扩展的时间量。设置切割时间冗余量的目的是,为了用户可能需要了解目标视频场景的上下文信息。切割时间冗余量一般是一个以字幕段文字长度和视频场景段时间长度为自变量的函数,即z=f(x,y),其中z代表切割时间冗余量,x是字幕段的单词数或者字数,y是标注视频场景的时间长度。切割时间冗余量也可以是一个人为定义的常量。视频场景片段的开始切割时间点=标注的开始时间锚点-切割时间冗余量;结束切割时间点=标注的结束时间锚点+切割时间冗余量。
以“My name is Forrest Gump”这个字幕单位为例子。开始时间锚点是“00:07:18.269”,结束时间锚点是“00:07:20.438”。假设计算所得或者预定义的切割时间冗余量是3秒。那么从“00:07:15.269”到“00:07:23.438”时间段的视频场景将作为目标视频场景片段被截取出来。
将所有切割截取获得的视频场景片段集,存入视频场景片段库。这里视频场景片段库的概念对应的实体可以是一般商用数据库产品,也可以是普通操作系统中的文件集。
【步骤104】
利用数据库关联技术,建立视频场景片段库和字幕库的关联关系,综合形成可供搜索的视频场景库。参照图3,每一个视频场景片段都有对应的字幕段。
对于数据源的每个视频文件,重复步骤101至步骤104,便可将不同视频文件里的所有视频场景及相关字幕段收录进视频场景库。
此外,由于步骤102、步骤103无必要顺序依赖,步骤102、步骤103的顺序可互换。
以上介绍了本发明的视频场景库的生成方法,本发明在揭示上述方法的同时,还揭示了上述方法对应的视频场景库的生成系统。请参阅图4,所述视频场景库的生成系统包括:标注单元401、字幕提取单元402、切割单元403、关系建立单元404。
标注单元401用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;字幕提取单元402用以提取标注的字幕段和时间锚点以及其他视频文件信息存入字幕库;切割单元403用以根据标注的时间锚点对视频文件进行有冗余切割,截取该字幕对应的视频场景片段,存入视频场景片段库;关系建立单元404用以建立字幕库里的字幕段和视频场景库里的视频场景片段的对应关系。各单元的作用原理可参考上述方法的描述,这里不作赘述。
通过以上视频场景库的生成方法及系统,可获得视频场景库,以下介绍基于视频场景库的搜索视频场景片段的方法。参阅图2、图6,本发明的基于视频场景库的搜索视频场景片段的方法包括如下步骤:
【步骤201】
用户输在终端输入关键字,如在输入框601中输入“how are you”,发出搜索视频场景的请求。
【步骤202】
根据选项602,判断请求是针对对白或旁白类型的视频场景,还是针对描述类型的视频场景,点击搜索视频场景按钮603。如果是针对对白或旁白类型的视频场景,则执行步骤203;如果是执行针对描述类型的视频场景,则执行步骤204。
【步骤203】
在字幕库里搜索匹配的对白或旁白类型的字幕段。比如,输入的关键字是“how are you”,那么来自《Scent Of A Woman》的“how are you?”,《BadLieutenant》的“how are you doing?”,《Mona Lisa Smile》的“Hi.How areyou?”等等都是匹配的目标字幕段。匹配结果显示在列表项604。
【步骤204】
在字幕库里搜索匹配的描述性的字幕段。比如输入的关键字是“战争”,来自《Forrest Gump》《Independence Day》《Avatar》等等片子的战争视频场景片段所对应的字幕段都是匹配的目标字幕段。
【步骤205】
根据选择默认播放605,还是选择切割播放606,判断是请求从视频场景库里直接返回相关的视频场景片段,还是依照新输入的切割时间冗余量实时对视频文件切割截取获得视频场景片段。如果是要求直接从视频场景库返回,则执行步骤206,如果要求实时切割,则执行步骤207。
【步骤206】
依照视频场景库里视频场景片段库和字幕库的关联关系,通过搜索匹配所得的字幕段返回对应的目标视频场景片段。比如直接返回《Scent Of A Woman》的“how are you?”,《Bad Lieutenant》的“how are you doing?”,《Mona LisaSmile》的“Hi.How are you?”等等匹配的字幕段对应的目标视频场景片段。
【步骤207】
通过搜索匹配所得的字幕段进一步取得时间锚点。比如《Scent Of A Woman》的“how are you?”的时间锚点是“00:07:18.269”和“00:07:20.438”。假如用户选择切割播放606,在系统弹出框607中重新输入的时间冗余量是5秒,点击切割播放后,那么程序将对《Scent Of A Woman》的从“00:07:13.269”到“00:07:25.438”的视频场景片段进行切割,返回给搜索用户。
【步骤208】
显示搜得的目标视频场景片段,参照视频播放界面608。
以上介绍了本发明的基于视频场景库的搜索视频场景片段的方法,本发明在揭示上述方法的同时,还揭示上述方法对应的基于视频场景库的搜索视频场景片段的系统;请参阅图5,该搜索系统包括:输入单元501、判断单元502、搜索单元503、切割单元504、存储单元505、显示单元506。
输入单元501用于获取用户输入的信息,包括关键字、切割时间冗余量。
判断单元502用于判断是对对白或旁白的类型的视频场景进行搜索还是对描述类型的视频场景进行搜索。如果是前者,则调用搜索单元对存储单元里的视频场景库里的对白或旁白类型的视频场景进行搜索;如果是后者,则调用搜索单元对存储单元里的视频场景库里的描述类型的视频场景进行搜索。该判断单元502还用于判断是否要求对视频场景片段按输入的切割时间冗余量实时切割,如果是要求实时切割,则调用切割单元对存储单元里的数据源视频文件按输入的切割时间冗余量进行切割。如果不要求实时切割,则直接从存储单元里的视频场景库返回相关的视频场景片段。
搜索单元503用于接收到判断单元发起请求时,在存储单元中对字幕和视频场景片段的搜索。
切割单元504用于接收到判断单元发起请求的时候,对存储单元里的视频文件按输入的切割时间冗余量重新切割截取。
存储单元505用于存储生成的视频场景库和生成视频场景库的数据源视频文件。
显示单元506用于显示符合搜索条件的视频场景片段。
通过本例所述的视频场景库的生成方法和系统,可以获得类似字库,词库概念的视频场景库,库里包含有来自各种视频文件里的各种视频场景片段以及相应的字幕段。通过本例所述的基于视频场景库的搜索视频场景的方法,用户只要在终端输入关键字进行搜索,就可以轻易获得大量来自不同视频文件的目标视频场景片段,免去了现今网络技术下,为达到同样目的,需要下载或者拷贝大量大体积视频文件,进而在字幕文件里检索,在视频文件里定位,切割等等的麻烦。
实施例二
本实施例与实施例一的区别在于,本实施例中,没有构建视频场景库,而在用户提出搜索视频场景片段的请求时,根据搜索所得的字幕段对应的时间锚点对数据源中的视频文件进行实时切割,将目标视频场景片段返回给用户。各个步骤的技术细节以及各个单元的作用原理,可以参考实施例一,在此不做赘述。
一种直接搜索视频场景片段的方法,所述方法包括如下步骤:
A′、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B′、提取标注的时间锚点和字幕段以及相关视频文件信息存入字幕库;
C′、用户输入关键字提出搜索视频场景片段的请求;
D′、通过关键字检索获得匹配的字幕段及其相应的时间锚点;
E′、根据时间锚点和切割冗余量,对相应视频文件进行切割截取获得目标视频场景片段,返回给用户;
上述方法对应的一种直接搜索视频场景片段的系统,所述系统包括:标注单元、字幕库提取单元、输入单元、搜索单元、切割单元、显示单元。
标注单元用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕库提取单元用以提取标注的字幕段和时间锚点以及相关视频文件信息存入字幕库;
输入单元用户通过该输入单元输入信息;
搜索单元用于接收到输入单元发起请求时,在字幕库中进行关键字匹配检索;
切割单元用于根据时间锚点和切割冗余量,对数据源中的视频文件截取目标视频场景片段;
显示单元用于显示符合搜索条件的视频场景片段。
通过本例所述的直接搜索视频场景片段的方法和系统,不需要依赖视频场景库,用户只要在终端输入关键字进行搜索,就可以轻易获得大量来自不同视频文件的实时切割截取的目标视频场景片段,免去了现今网络技术下,为达到同样目的,需要下载或者拷贝大量大体积视频文件,进而在字幕文件里检索,在视频文件里定位,切割等等的麻烦。
实施例三
本实施例与以上两个实施例的区别在于,本实施例只是一个生成视频场景的方法和系统。各个步骤的技术细节以及各个单元的作用原理,可以参考实施例一,在此不做赘述。本实施例揭示的一种视频场景的生成方法,所述方法包括如下步骤:
A″、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B″、提取标注的字幕段和时间锚点存入字幕库;
C″、根据标注的时间锚点对对应视频文件进行有冗余切割,截取字幕段对应的视频场景片段。
上述方法对应的一种视频场景的生成系统,所述系统包括标注单元、字幕提取单元、切割单元。
标注单元用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕提取单元用以提取标注的字幕段和时间锚点存入字幕库;
切割单元用以根据标注的时间锚点对视频文件进行有冗余切割,截取字幕段对应的视频场景片段。
通过本例所述的方法和系统,可以方便快捷的获得大量的视频场景片段,为用户的相关工作提供大量的视频场景素材。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

Claims (16)

1.一种视频场景库的生成方法,其特征在于,所述方法包括如下步骤:
A、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B、提取标注的字幕段存入字幕库;
C、根据标注的时间锚点对对应视频文件进行有冗余切割,截取该字幕对应的视频场景片段,存入视频场景片段库;
D、建立字幕库里的字幕段和视频场景库里的视频场景片段的对应关系。
2.根据权利要求1所述的视频场景库的生成方法,其特征在于:
所述步骤A中,字幕附注包括视频场景里的对白/旁白原文,或对白/旁白的同义解释或概括,或者描述视频场景类型的标签。
3.根据权利要求1所述的视频场景库的生成方法,其特征在于:
所述步骤B进一步包括提取时间锚点和相关视频文件信息存入字幕库。
4.根据权利要求1所述的视频场景库的生成方法,其特征在于:
所述步骤B、步骤C顺序互换。
5.一种视频场景库的生成系统,其特征在于,所述系统包括:
标注单元,用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕提取单元,用以提取标注的字幕段存入字幕库;
切割单元,用以根据标注的时间锚点对视频文件进行有冗余切割,截取该字幕对应的视频场景片段,存入视频场景片段库;
关系建立单元,用以建立字幕库里的字幕段和视频场景库里的视频场景片段的对应关系。
6.根据权利要求5所述的视频场景库的生成系统,其特征在于:
所述标注单元中,字幕附注包括视频场景里的对白/旁白原文,或对白/旁白的同义解释或概括,或者描述视频场景类型的标签;
所述字幕提取单元进一步提取时间锚点和相关视频文件信息存入字幕库。
7.一种基于权利要求1所述方法所生成的视频场景库的搜索视频场景片段的方法,其特征在于,所述方法包括如下步骤:
a、用户输入关键字提出搜索视频场景片段的请求;
b、在字幕库里检索得到匹配的字幕段信息;
c、返回和匹配字幕段相关联的视频场景片段。
8.根据权利要求7所述的搜索方法,其特征在于:
所述步骤a和步骤b之间进一步包括:
判断是请求搜索对白或旁白类型的视频场景,还是请求描述类型的视频场景;
若为前者,则步骤b在字幕库里搜索对白或旁白类型的字幕段;若为后者,则步骤b在字幕库里搜索描述类型的字幕段。
9.根据权利要求7所述的搜索方法,其特征在于:
所述步骤b和步骤c之间进一步包括:
判断是否请求按照新的切割时间冗余量实时切割截取视频场景片段;
若是,则根据匹配字幕段对应的时间锚点,按照新的切割时间冗余量对相应视频文件进行切割截取获得相应的视频场景片段;若否,则根据视频场景片段库和字幕库的关联关系获得和匹配字幕段对应的视频场景片段。
10.一种基于权利要求1所述方法所生成的视频场景库的搜索视频场景片段的系统,其特征在于,所述系统包括:
输入单元,用户通过该输入单元输入信息;
搜索单元,用于接收到输入单元发起请求时,在存储单元中对视频场景片段的搜索;
存储单元,用于存储生成的视频场景库,即存储有相互关联的视频场景片段库和字幕库;
显示单元,用于显示符合搜索条件的视频场景片段。
11.根据权利要求10所述的搜索系统,其特征在于:
所述搜索系统进一步包括判断单元,用于判断搜索请求是针对对白或旁白类型的场景还是针对描述类型的场景,同时用于判断是否要求对视频场景片段按输入的切割时间冗余量重新切割截取。
12.根据权利要求10所述的搜索系统,其特征在于:
所述系统进一步包括切割单元,用于对视频文件按输入的切割时间冗余量重新切割。
13.一种直接搜索视频场景片段的方法,其特征在于,所述方法包括如下步骤:
A′、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B′、提取标注的时间锚点和字幕段以及其他视频文件信息存入字幕库;
C′、用户输入关键字提出搜索视频场景片段的请求;
D′、通过关键字检索获得匹配的字幕段及其相应的时间锚点;
E′、根据时间锚点和切割冗余量,对相应视频文件进行切割截取获得目标视频场景片段,返回给用户。
14.一种直接搜索视频场景片段的系统,其特征在于,所述系统包括:
标注单元,用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕库提取单元,用以提取标注的字幕段和时间锚点以及其他视频文件信息存入字幕库;
输入单元,用户通过该输入单元输入信息;
搜索单元,用于接收到输入单元发起请求时,在字幕库中进行关键字匹配检索;
切割单元,用于根据时间锚点和切割冗余量,对数据源中的视频文件切割截取目标视频场景片段;
显示单元,用于显示符合搜索条件的视频场景片段。
15.一种视频场景的生成方法,其特征在于,所述方法包括如下步骤:
A″、对数据源中视频文件里的视频场景进行时间锚点标注和字幕附注;
B″、提取标注的字幕段和时间锚点存入字幕库;
C″、根据标注的时间锚点对对应视频文件进行有冗余切割,截取字幕段对应的视频场景片段。
16.一种视频场景的生成系统,其特征在于,所述系统包括:
标注单元,用以对数据源的视频文件里的视频场景进行时间锚点标注和字幕附注;
字幕提取单元,用以提取标注的字幕段和时间锚点存入字幕库;
切割单元,用以根据标注的时间锚点对视频文件进行有冗余切割,截取字幕段对应的视频场景片段。
CN2010101205918A 2010-03-09 2010-03-09 视频场景库生成方法及系统、搜索视频场景的方法及系统 Pending CN102024009A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2010101205918A CN102024009A (zh) 2010-03-09 2010-03-09 视频场景库生成方法及系统、搜索视频场景的方法及系统
PCT/CN2011/071072 WO2011110063A1 (zh) 2010-03-09 2011-02-18 视频场景库生成方法及系统、搜索视频场景的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101205918A CN102024009A (zh) 2010-03-09 2010-03-09 视频场景库生成方法及系统、搜索视频场景的方法及系统

Publications (1)

Publication Number Publication Date
CN102024009A true CN102024009A (zh) 2011-04-20

Family

ID=43865312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101205918A Pending CN102024009A (zh) 2010-03-09 2010-03-09 视频场景库生成方法及系统、搜索视频场景的方法及系统

Country Status (2)

Country Link
CN (1) CN102024009A (zh)
WO (1) WO2011110063A1 (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102547141A (zh) * 2012-02-24 2012-07-04 央视国际网络有限公司 基于体育赛事视频的视频数据筛选方法及装置
CN102595191A (zh) * 2012-02-24 2012-07-18 央视国际网络有限公司 体育赛事视频中赛事事件的搜索方法及装置
CN102595206A (zh) * 2012-02-24 2012-07-18 央视国际网络有限公司 基于体育赛事视频的数据同步方法及装置
CN102662970A (zh) * 2012-03-09 2012-09-12 杭州海康威视数字技术股份有限公司 基于文本信息的录像搜索和录像采集控制方法及其系统
WO2013152682A1 (zh) * 2012-04-12 2013-10-17 天脉聚源(北京)传媒科技有限公司 一种新闻视频字幕标注方法
CN103838751A (zh) * 2012-11-23 2014-06-04 鸿富锦精密工业(深圳)有限公司 视频内容搜索系统及方法
CN104053048A (zh) * 2014-06-13 2014-09-17 无锡天脉聚源传媒科技有限公司 一种视频定位的方法及装置
WO2015024533A1 (zh) * 2013-08-22 2015-02-26 百度在线网络技术(北京)有限公司 信息搜索方法、装置和服务器以及存储介质
CN104680188A (zh) * 2015-03-24 2015-06-03 重庆大学 一种人体姿态基准图像库的构建方法
CN104883584A (zh) * 2015-05-19 2015-09-02 福建宏天信息产业有限公司 一种远程解析字幕的方法及系统
CN104915433A (zh) * 2015-06-24 2015-09-16 宁波工程学院 一种影视视频检索方法
CN105430434A (zh) * 2015-11-17 2016-03-23 北京奇虎科技有限公司 下载视频的方法与装置
CN105956170A (zh) * 2016-05-20 2016-09-21 微鲸科技有限公司 实时场景信息嵌入方法、场景实现系统和实现方法
CN106952515A (zh) * 2017-05-16 2017-07-14 宋宇 基于视觉设备的语言学习方法及系统
CN107273388A (zh) * 2016-04-08 2017-10-20 北京国双科技有限公司 庭审录像的处理方法和装置及查询方法和装置
CN107704525A (zh) * 2017-09-04 2018-02-16 优酷网络技术(北京)有限公司 视频搜索方法和装置
CN107785014A (zh) * 2017-10-23 2018-03-09 上海百芝龙网络科技有限公司 一种家庭场景语义理解方法
CN109933691A (zh) * 2019-02-11 2019-06-25 北京百度网讯科技有限公司 用于内容检索的方法、装置、设备和存储介质
CN113672322A (zh) * 2021-07-29 2021-11-19 浙江太美医疗科技股份有限公司 提供解释信息的方法及装置
CN115906781A (zh) * 2022-12-15 2023-04-04 广州文石信息科技有限公司 音频识别加锚点方法、装置、设备及可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107438204B (zh) * 2017-07-26 2019-12-17 维沃移动通信有限公司 一种媒体文件循环播放的方法及移动终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1430166A (zh) * 2003-01-07 2003-07-16 财团法人资讯工业策进会 建立影片检索数据库的方法及记录媒体
CN101000617A (zh) * 2006-12-06 2007-07-18 华为技术有限公司 一种媒体内容管理系统及方法
CN101650958A (zh) * 2009-07-23 2010-02-17 中国科学院声学研究所 对电影类视频进行场景片段抽取方法及其建立索引的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100582956B1 (ko) * 2003-11-28 2006-05-23 엘지전자 주식회사 멀티 미디어 기기에서의 구간 반복 재생방법
JP4403432B2 (ja) * 2007-07-19 2010-01-27 ソニー株式会社 録画再生装置及び録画再生方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1430166A (zh) * 2003-01-07 2003-07-16 财团法人资讯工业策进会 建立影片检索数据库的方法及记录媒体
CN101000617A (zh) * 2006-12-06 2007-07-18 华为技术有限公司 一种媒体内容管理系统及方法
CN101650958A (zh) * 2009-07-23 2010-02-17 中国科学院声学研究所 对电影类视频进行场景片段抽取方法及其建立索引的方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102595191A (zh) * 2012-02-24 2012-07-18 央视国际网络有限公司 体育赛事视频中赛事事件的搜索方法及装置
CN102595206A (zh) * 2012-02-24 2012-07-18 央视国际网络有限公司 基于体育赛事视频的数据同步方法及装置
CN102595206B (zh) * 2012-02-24 2014-07-02 央视国际网络有限公司 基于体育赛事视频的数据同步方法及装置
CN102547141A (zh) * 2012-02-24 2012-07-04 央视国际网络有限公司 基于体育赛事视频的视频数据筛选方法及装置
CN102547141B (zh) * 2012-02-24 2014-12-24 央视国际网络有限公司 基于体育赛事视频的视频数据筛选方法及装置
CN102662970B (zh) * 2012-03-09 2016-01-13 杭州海康威视数字技术股份有限公司 基于文本信息的录像搜索和录像采集控制方法及其系统
CN102662970A (zh) * 2012-03-09 2012-09-12 杭州海康威视数字技术股份有限公司 基于文本信息的录像搜索和录像采集控制方法及其系统
WO2013152682A1 (zh) * 2012-04-12 2013-10-17 天脉聚源(北京)传媒科技有限公司 一种新闻视频字幕标注方法
CN103838751A (zh) * 2012-11-23 2014-06-04 鸿富锦精密工业(深圳)有限公司 视频内容搜索系统及方法
WO2015024533A1 (zh) * 2013-08-22 2015-02-26 百度在线网络技术(北京)有限公司 信息搜索方法、装置和服务器以及存储介质
US10311103B2 (en) 2013-08-22 2019-06-04 Baidu Online Network Technology (Beijing) Co., Ltd. Information search method, device, server and storage medium
CN104053048A (zh) * 2014-06-13 2014-09-17 无锡天脉聚源传媒科技有限公司 一种视频定位的方法及装置
CN104680188B (zh) * 2015-03-24 2018-04-27 重庆大学 一种人体姿态基准图像库的构建方法
CN104680188A (zh) * 2015-03-24 2015-06-03 重庆大学 一种人体姿态基准图像库的构建方法
CN104883584A (zh) * 2015-05-19 2015-09-02 福建宏天信息产业有限公司 一种远程解析字幕的方法及系统
CN104915433A (zh) * 2015-06-24 2015-09-16 宁波工程学院 一种影视视频检索方法
CN105430434A (zh) * 2015-11-17 2016-03-23 北京奇虎科技有限公司 下载视频的方法与装置
CN107273388A (zh) * 2016-04-08 2017-10-20 北京国双科技有限公司 庭审录像的处理方法和装置及查询方法和装置
CN105956170A (zh) * 2016-05-20 2016-09-21 微鲸科技有限公司 实时场景信息嵌入方法、场景实现系统和实现方法
CN105956170B (zh) * 2016-05-20 2019-07-19 微鲸科技有限公司 实时场景信息嵌入方法、场景实现系统和实现方法
CN106952515A (zh) * 2017-05-16 2017-07-14 宋宇 基于视觉设备的语言学习方法及系统
CN107704525A (zh) * 2017-09-04 2018-02-16 优酷网络技术(北京)有限公司 视频搜索方法和装置
CN107785014A (zh) * 2017-10-23 2018-03-09 上海百芝龙网络科技有限公司 一种家庭场景语义理解方法
CN109933691A (zh) * 2019-02-11 2019-06-25 北京百度网讯科技有限公司 用于内容检索的方法、装置、设备和存储介质
CN113672322A (zh) * 2021-07-29 2021-11-19 浙江太美医疗科技股份有限公司 提供解释信息的方法及装置
CN113672322B (zh) * 2021-07-29 2024-05-24 浙江太美医疗科技股份有限公司 提供解释信息的方法及装置
CN115906781A (zh) * 2022-12-15 2023-04-04 广州文石信息科技有限公司 音频识别加锚点方法、装置、设备及可读存储介质
CN115906781B (zh) * 2022-12-15 2023-11-24 广州文石信息科技有限公司 音频识别加锚点方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
WO2011110063A1 (zh) 2011-09-15

Similar Documents

Publication Publication Date Title
CN102024009A (zh) 视频场景库生成方法及系统、搜索视频场景的方法及系统
EP3341857B1 (en) Generation of a topic index with natural language processing
CN100372372C (zh) 电子节目指南数据的自由文本和属性搜索
KR102017853B1 (ko) 검색 방법 및 장치
CN110430476B (zh) 直播间搜索方法、系统、计算机设备和存储介质
CN111294660B (zh) 视频片段定位方法、服务器、客户端及电子设备
US20090089327A1 (en) System and method for social programming of media sources
US20130294746A1 (en) System and method of generating multimedia content
US20020051077A1 (en) Videoabstracts: a system for generating video summaries
JP2009237912A (ja) 検索キーワード改良装置、サーバ装置、および方法
CN103593363A (zh) 视频内容索引结构的建立方法、视频检索方法及装置
KR20220006491A (ko) 댓글 자막을 생성하는 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램
CN111263186A (zh) 视频生成、播放、搜索以及处理方法、装置和存储介质
JP2010220065A (ja) コンテンツ推薦装置及びコンテンツ推薦方法
KR20120070850A (ko) 웹 마이닝을 이용한 콘텐츠 태그 생성 시스템 및 방법
JP2007012013A (ja) 映像データ管理装置及び方法及びプログラム
CN112004137A (zh) 一种智能视频创作方法及装置
WO2021111400A1 (en) System and method for enabling a search platform to users
JP2002108892A (ja) データ管理システム、データ管理方法、及び、記録媒体
CN104731938A (zh) 一种视频搜索方法及装置
JPWO2008136466A1 (ja) 動画編集装置
US7925671B2 (en) Method and system for automatic cue sheet generation
CN113901263B (zh) 一种视频素材的标签生成方法及装置
CN103530311A (zh) 对元数据进行优先次序排序的方法和装置
CN115442540B (zh) 音乐视频生成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110420