发明内容
本发明要解决的技术问题是提供一种视频处理方法和系统,能够使得视频资料定位更快速准确,查看甄别更容易,资料检索管理更方便。
为了解决上述问题,本发明提供了一种视频处理方法,包括:
在视频流中提取出各运动目标及其运动轨迹;
对于各运动目标,分别根据其运动轨迹确定该运动目标出现和消失时的视频帧;
在视频流中找到位于所述运动目标出现和消失时的视频帧之间的视频帧,将找到的视频帧与所述运动目标出现和消失时的视频帧一起标记为对应于该运动目标的视频序列。
进一步地,所述的方法还包括:
列出所述视频流中所有出现过的运动目标的列表;
标记各运动目标具有代表性的视频帧,包括以下任一种或其任意组合:进入画面时的视频帧、最为清晰的视频帧、占据图像比例最大的视频帧、目标运动轨迹中出现拐点的视频帧、离开画面前的视频帧。
进一步地,所述的方法还包括:
设定过滤检索规则,包括区域和针对区域的动作;
在各运动目标对应的视频序列中,根据各运动目标的运动轨迹检索出满足所述过滤检索规则的运动目标的视频帧。
进一步地,所述的方法还包括:
记录视频流的采集时间、采集地点;
提取运动目标的运动轨迹时还提取目标的特征信息并保存;
根据检索条件在所述视频流中检索视频;所述检索条件包括以下任一种或其任意组合:采集时间、采集地点、运动目标的特征信息、运动目标的视频帧。
进一步地,所述的方法还包括:
播放所述视频流,对于标记为对应于运动目标的视频帧或检索出的视频帧进行实时或低于实时的速度播放;对于其它视频帧进行超实时速度播放。
本发明还提供了一种视频处理装置,包括:
存储模块,用于保存输入的视频流;
提取模块,用于在所述视频流中提取出各运动目标及其运动轨迹,并保存在所述存储模块中;
处理模块,用于对于各运动目标,分别根据其运动轨迹确定该运动目标出现和消失时的视频帧;在所述视频流中找到位于所述运动目标出现和消失时的视频帧之间的视频帧,将找到的视频帧与所述运动目标出现和消失时的视频帧一起标记为对应于该运动目标的视频序列。
进一步地,所述处理模块还用于列出所述视频流中所有出现过的运动目标的列表;标记各运动目标具有代表性的视频帧,包括以下任一种或其任意组合:进入画面时的视频帧、最为清晰的视频帧、占据图像比例最大的视频帧、目标运动轨迹中出现拐点的视频帧、离开画面前的视频帧。
进一步地,所述的装置还包括:
设置模块,用于设置过滤检索规则并保存;所述过滤检索规则包括区域和针对区域的动作;
检索模块,用于在各运动目标对应的视频序列中,根据各运动目标的运动轨迹检索出满足所述过滤检索规则的运动目标的视频帧。
进一步地,所述存储模块还用于记录视频流的采集时间、采集地点;
所述提取模块提取运动目标的运动轨迹时还用于提取目标的特征信息并保存;
所述设置模块还用于设置检索条件;所述检索条件包括以下任一种或其任意组合:采集时间、采集地点、运动目标的特征信息、运动目标的视频序列;
所述检索模块还用于根据检索条件在所述视频流中检索视频帧。
进一步地,所述的装置还包括:
播放模块,用于播放所述视频流,对于标记为对应于运动目标的视频序列或检索出的视频帧进行实时或低于实时的速度播放,对于其它视频帧进行超实时速度播放。
本发明的技术方案能够从大量的视频资料中自动筛选出和各运动目标相关的视频,能提高视频的查看速度,减轻查看的工作量,定位所需的视频资料会更加快速准确;其优化方案可以根据预定的规则智能检索,以自动检索视频资料,可以进一步提高查看视频的效率,应用在刑侦领域时可提高办案效率;其另一优化方案可以更好地进行定位和查看,检索更加方便;其另一优化方案可以实现各种视频源的统一解码和管理。
具体实施方式
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一,一种视频处理方法,包括:
在视频流中提取出各运动目标及其运动轨迹;
对于各运动目标,分别根据其运动轨迹确定该运动目标出现和消失时的视频帧;
在视频流中找到位于所述运动目标出现和消失时的视频帧之间的视频帧,将找到的视频帧与所述运动目标出现和消失时的视频帧一起标记为对应于该运动目标的视频序列。
所述视频流可以来自网络或本地,可以是从采集设备传输而来的,或是导入后保存在存储设备中的。这样就可以在导入的大量视频中,快速找到与各运动目标相关的视频帧;本实施例中,将对应于一运动目标的视频序列称为该运动目标的事件。将所采集的视频中所有运动目标的事件称为故事板,可以认为,故事板是由所采集的视频中一系列事件组成;通过查看的故事板,能够快速查看运动目标从进入画面到离开画面的全过程,并可通过这些视频帧快速定位到对应时间点,从而能够快速的了解整个视频的大概内容。
本实施例中,所述找到位于所述运动目标出现和消失时的视频帧之间的视频帧的步骤中,可以是找出全部位于两者之间的视频帧,也可以只找出部分视频帧,比如但不限于是对该运动目标最具代表性的部分视频帧;本实施例中,所述部分视频帧包括但不限于以下任一种或其任意组合:清晰度高于一预设阈值的视频帧、运动目标在图像中所占比例最大的视频帧、运动目标的运动轨迹中出现拐点的视频帧、每几个视频帧中抽取一个视频帧等。
本实施例中,标记所述视频序列时还记录该视频序列中各视频帧在所述视频流中的起始时间,通过该起始时间索引,能够快速定位到和相应运动目标相关的事件或视频帧在原始视频流中的位置。
在实际应用中,标记所述视频序列时也可以是记录该视频序列中各视频帧的序号,还可以是标记该视频帧属于对应于哪个或哪几个运动目标的视频序列。
本实施例中,所述方法还可以包括:
列出所述视频流中所有出现过的运动目标的列表;可以将各运动目标所对应的一个或多个视频帧列成一个运动目标列表,用户可以通过查看该列表,迅速找到关注的运动目标;
标记各运动目标具有代表性的视频帧,包括以下任一种或其任意组合:进入画面时的视频帧、最为清晰的视频帧、占据图像比例最大的视频帧、目标运动轨迹中出现拐点的视频帧、离开画面前的视频帧等。
本实施例中,所述在采集的视频中提取出各运动目标及其运动轨迹的步骤前还可以包括:
将采集的非标准的视频流解码成标准视频流,再将其重新编码为标准开放的视频文件格式的视频流并保存。
本实施例中,所述方法还可以包括:
保存视频流的采集时间、采集地点等信息。
另外,在提取运动目标的运动轨迹时,还可以提取目标其它的特征信息,包括:坐标位置、运动方向、运动速度、目标类型(人,车,人群)等,还可以为每个运动目标设置一个标识。本实施例中,可以将运动目标的特征信息以MPEG-7的标准封装,称为智能元数据信息,并存储。
根据检索条件在所述视频流中检索视频;所述检索条件包括以下任一种或其任意组合:采集时间、采集地点、运动目标的特征信息、运动目标的视频序列。
这样处理后,在检索视频时,不仅可以支持基于采集时间、采集地点等视频基本信息检索,同时支持根据运动目标的特征信息、事件(即对应于该运动目标的视频序列)对于视频内容进行检索。检索结果不再是文件,而是以时间、地点、目标、事件为4个纬度展现,更贴近人的逻辑思维习惯。
本实施例中,所述方法还可以进一步包括:
设定过滤检索规则,包括区域和针对区域的动作;
在各运动目标对应的视频序列中,根据各运动目标的运动轨迹检索出满足所述过滤检索规则的运动目标的视频帧。
本实施例中,所述区域可以包括点、由点确定的线、由点或线确定的范围等;所述针对区域的动作可以包括(未)进入、(未)离开、(未)触及、(未)通过等。可以用坐标和参数等来设置,也可以通过鼠标在界面上标出,通过图形化的交互方式实现所述过滤检索规则的设置。
所述过滤检索规则可以是单独的一个“区域和针对该区域的动作”,比如:进入某条线以左的范围,或未离开线划出的一个范围;也可以是多个“区域和针对该区域的动作”的逻辑组合,比如通过线A划出的范围,且(或)未进入线B划出的另一范围。
这样一来,就可以在找到与各运动目标相关的视频帧(故事板)的基础上,进一步找到符合所述过滤检索规则的关键运动目标或事件。
可以设置多个过滤检索规则,然后分别根据不同的过滤检索规则找到对应的事件;可以为各过滤检索规则设置唯一标识,比如起名,这样就可以将根据一个过滤检索规则所找到的各视频序列对应于该过滤检索规则的标识,并保存该对应关系,从而区分根据不同过滤检索规则检索出的视频序列。
本实施例中,所述方法还可以包括:
将各运动目标对应的或检索得出的关键运动目标或事件关联的运动目标进行图像化的展现;展现内容包含运动目标或所有满足所述过滤检索规则的运动目标的视频帧,还可以进一步包含运动目标对应的视频序列。
以上图片可以是前期提取的目标最具代表性的视频帧的全部或部分,也可以是根据需要临时提取的视频帧。这样就可以基于所述的故事板,对采集的视频进行快速的图片浏览,便于快速寻找具有特征的运动目标。
本实施例中,所述方法还可以包括:
播放所述视频流,对于标记为对应于运动目标的视频序列进行实时或低于实时的速度播放;对于其它视频帧进行超实时速度播放;
还可以在播放所述视频流时是对检索得出的运动目标对应的或事件包括的视频帧等使用人员可能关注的片断进行实时或低于实时的速度播放。
以上两种播放方式的速度可以自由设定(0.1倍实时~32倍实时之间)。
这样就可以基于所述故事板,对采集的视频进行浓缩播放,从而大量节约视频内容的审看时间。
通过本实施例的方法进行视频资料的审看后,用户对认为特别重要的视频序列可直接导出,或是提供编目标注信息并将编目标注信息和视频序列一起保存;所述编目标注信息可以是任意相关信息,比如刑侦人员关心的受害人性别等目标信息,也可以是对于视频描述的文本信息。在检索中,可以根据该编目标注信息检索视频。
用户可以根据运动目标、运动目标的特征信息、所述编目标注信息、过滤检索规则等检索或点播视频序列;还可以获取认为有用的视频片段,进一步还可以对其进行剪切、连接,形成视频序列,并导出或保存,可以保存为标准视频文件,也可以刻录成光盘。
实施例二,一种视频处理装置,如图1所示,包括:
存储模块,用于保存输入的视频流,可以但不限于保存在数据库中;
提取模块,用于在所述视频流中提取出各运动目标及其运动轨迹,并保存在所述存储模块中;在提取运动目标的运动轨迹时,还可以提取目标其它的特征信息,包括:坐标位置、运动方向、运动速度、目标类型(人,车,人群)等,还可以为每个运动目标设置一个标识。本实施例中,可以将运动目标的特征信息以MPEG-7的标准封装,称为智能元数据信息,并存储在所述存储模块中;
处理模块,用于对于各运动目标,分别根据其运动轨迹确定该运动目标出现和消失时的视频帧;在所述视频流中找到位于所述运动目标出现和消失时的视频帧之间的视频帧,将找到的视频帧与所述运动目标出现和消失时的视频帧一起标记为对应于该运动目标的视频序列。
本实施例中,所述处理模块标记所述视频序列时还可以在所述存储模块中记录该视频序列中各视频帧在所述视频流中的起始时间,通过该起始时间索引,能够在所述存储模块保存的视频流中快速定位到和相应运动目标相关的事件。
本实施例中,所述处理模块标记还可以用于:
列出所述视频流中所有出现过的运动目标的列表;可以将各运动目标所对应的一个或多个视频帧列成一个运动目标列表,用户可以通过查看该列表,迅速找到关注的运动目标;
标标记各运动目标具有代表性的视频帧,包括以下任一种或其任意组合:进入画面时的视频帧、最为清晰的视频帧、占据图像比例最大的视频帧、目标运动轨迹中出现拐点的视频帧、离开画面前的视频帧等。
通过这些视频帧,可以快速定位到对应视频片断,用于快速查找定位关注的目标。
本实施例中,所述装置还可以包括一视频导入模块,用于将采集的非标准的视频流解码成标准视频流,再将其重新编码为标准开放的视频文件格式的视频流并保存在所述存储模块中。
如图2所示,所述视频导入模块对于标准视频流,可将原始视频流发送给存储模块,对于非标准视频流,则将重编码视频文件发给存储模块。
所属视频导入模块还可以在保存视频流时在所述存储模块中记录其采集时间、采集地点等信息;所述存储模块还用于记录视频流的采集时间、采集地点。
所述处理模块、提取模块、视频导入模块可以但不限于集成在一台服务器中。
本实施例中,所述装置还可以进一步包括:
编辑模块,用于供用户导出指定的视频序列,或是为该视频序列提供编目标注信息并将编目标注信息也存储到所述存储模块中;所述编目标注信息可以是任意相关信息,比如刑侦人员关心的受害人性别等目标信息,也可以是对于视频描述的文本信息;进一步还可以对指定的视频序列进行剪切、连接,形成视频序列,并导出或保存,可以保存为标准视频文件,也可以刻录成光盘。
本实施例中,所述装置还可以进一步包括:
设置模块,用于设置过滤检索规则并保存;所述过滤检索规则包括区域和针对区域的动作;还可以用于设置检索条件,所述检索条件包括以下任一种或其任意组合:采集时间、采集地点、运动目标的特征信息、运动目标的视频序列等;
检索模块,用于在各运动目标对应的视频序列中,根据各运动目标的运动轨迹检索出满足所述过滤检索规则的运动目标的视频帧;还可以用于根据所述检索条件在所述存储模块中检索出视频帧;可以将检索出的视频帧(多个视频帧有可能构成视频序列)发送给所述编辑模块;
所述设置模块可以但不限于是图形化用户界面的形式,这样可以通过图形化的交互方式实现所述过滤检索规则的设置。
所述设置模块可以设置多个过滤检索规则,然后分别根据不同的过滤检索规则找到对应的事件;可以为各过滤检索规则设置唯一标识,比如起名,这样就可以将根据一个过滤检索规则所找到的各视频序列对应于该过滤检索规则的标识,并保存该对应关系,从而区分根据不同过滤检索规则检索出的视频序列。
本实施例中,所述装置还可以进一步包括:
播放模块,用于播放所述视频流,对于标记为对应于运动目标的视频序列进行实时或低于实时的速度播放,对于其它视频帧进行超实时速度播放;还可以用于对检索模块得出的运动目标对应的或事件包括的视频帧进行实时或低于实时的速度播放。
以上两种播放方式的速度可以自由设定(比如但不限于在0.1倍实时~32倍实时之间)。
所述播放模块和设置模块可以共同构成一个审看客户端,当用户审看视频时,如图3所示,用户在审看客户端输入点播请求(也就是设置检索条件或过滤检索规则),然后所述检索模块发送相应的检索请求在所述存储模块中进行检索,得到检索结果(即哪些视频帧或视频序列满足检索条件或过滤检索规则),根据该检索结果再在所述存储模块中读取相应的视频帧(或视频序列),返回给所述审看客户端,供用户观看。
用户可以在观看后可通过审看客户端挑选部分或全部视频帧保存在所述存储模块中,或先通过所述编辑模块进行剪切,甄选等加工,加工后再保存进所述存储模块。
其它实现细节可以同实施例一。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明的权利要求的保护范围。