CN103106038B - 基于草图手势及弧形摘要时间轴的视频交互方法和系统 - Google Patents

基于草图手势及弧形摘要时间轴的视频交互方法和系统 Download PDF

Info

Publication number
CN103106038B
CN103106038B CN201310048730.4A CN201310048730A CN103106038B CN 103106038 B CN103106038 B CN 103106038B CN 201310048730 A CN201310048730 A CN 201310048730A CN 103106038 B CN103106038 B CN 103106038B
Authority
CN
China
Prior art keywords
gesture
arc
module
sketch
time axle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310048730.4A
Other languages
English (en)
Other versions
CN103106038A (zh
Inventor
刘永进
张金凯
张艳秋
付秋芳
傅小兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Institute of Psychology of CAS
Original Assignee
Tsinghua University
Institute of Psychology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Institute of Psychology of CAS filed Critical Tsinghua University
Priority to CN201310048730.4A priority Critical patent/CN103106038B/zh
Publication of CN103106038A publication Critical patent/CN103106038A/zh
Application granted granted Critical
Publication of CN103106038B publication Critical patent/CN103106038B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了基于草图手势及弧形摘要时间轴的视频交互方法和系统,将一段视频分割成N个镜头,从每个镜头中抽取出相应的关键帧,组成关键帧列表,对所述关键帧列表通过弧形排列形成摘要时间轴,获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串,建立基于所述摘要时间轴的弧形草图手势库,计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。本发明结合视频摘要和草图技术,提供了一种在移动设备上的视频呈现和交互浏览方法,实现方便快捷且可操作性强的目的。

Description

基于草图手势及弧形摘要时间轴的视频交互方法和系统
技术领域
本发明涉及多媒体交互技术领域,尤其涉及基于草图手势及弧形摘要时间轴的视频交互方法和系统。
背景技术
随着全触屏手机、平板电脑等小型便携式移动设备的普及,越来越多的人选择在移动终端上检索和观看视频。
视频摘要又称视频浓缩,是对视频内容的一个简单概括,以自动或半自动的方式,先通过运动目标分析,提取运动目标,然后对各个目标的运动轨迹进行分析,将不同的目标拼接到一个共同的背景场景中,并将它们以某种方式进行组合。视频摘要在视频分析和基于内容的视频检索中扮演着重要角色。
现有技术中的基于时间轴的视频浏览方式,对于用户的操作方法有很大的限制,不方便用户在移动设备上操作和观看视频,无法满足用户的需求,阻碍视频浏览技术在移动平台上的发展,传统的视频浏览方式并没有体现出移动设备的方便快捷以及可操作性强的特点。
发明内容
(一)要解决的技术问题
针对上述缺陷,本发明要解决的技术问题是如何将视频摘要技术以及草图技术结合起来,实现在移动设备上方便快捷地对视频播放进行控制,提高视频在移动设备上的可操作性。
(二)技术方案
为解决上述问题,本发明提供了基于草图手势及弧形摘要时间轴的视频交互方法,所述视频交互方法包括:
A:将一段视频分割成N个镜头,N为整数且N≥2;
B:从每个镜头中抽取出相应的关键帧,组成关键帧列表;
C:对所述关键帧列表通过弧形排列形成摘要时间轴;
D:获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
E:建立基于所述摘要时间轴的弧形草图手势库;
F:计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
为解决上述问题,本发明还提供了基于草图手势及弧形摘要时间轴的视频交互系统,所述视频交互系统包括:
镜头分割模块、抽取关键帧模块、关键帧布局模块、获取轨迹点模块、手势建模模块和手势匹配模块;
所述镜头分割模块,用于将一段视频分割成N个镜头,N≥2且N为整数;
所述抽取关键帧模块,用于从每个镜头中抽取出相应的关键帧,组成关键帧列表;
所述关键帧布局模块,用于对所述关键帧列表通过弧形排列形成摘要时间轴;
所述获取轨迹点模块,用于获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
所述手势建模模块,用于建立基于所述摘要时间轴的弧形草图手势库;
所述手势匹配模块,用于计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
为解决上述问题,本发明还提供了一种弧形无硬边界可滑动的摘要时间轴生成方法,具体包括:
A:将一段视频分割成N个镜头,N≥2且N为整数;
B:从每个镜头中抽取出相应的关键帧,组成关键帧列表;
C:对所述关键帧列表通过弧形排列形成摘要时间轴。
为解决上述问题,本发明还提供了一种弧形无硬边界可滑动的摘要时间轴生成系统,具体包括:镜头分割模块、获取关键帧模块和关键帧布局模块;
所述镜头分割模块,用于将一段视频分割成N个镜头,N≥2且N为整数;
所述获取关键帧模块,用于从每个镜头中抽取出相应的关键帧,组成关键帧列表;
所述关键帧布局模块,用于对所述关键帧列表通过弧形排列形成摘要时间轴。
为解决上述问题,本发明还提供了一种基于摘要时间轴的弧形草图手势建模和识别方法,具体包括:
D:获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
E:建立基于所述摘要时间轴的弧形草图手势库;
F:计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
为解决上述问题,本发明还提供了一种基于摘要时间轴的弧形草图手势建模和识别系统,具体包括:获取轨迹点模块、手势建模模块和手势匹配模块;
所述获取轨迹点模块,用于获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
所述手势建模模块,用于建立基于所述摘要时间轴的弧形草图手势库;
所述手势匹配模块,用于计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
(三)有益效果
本发明提出了基于草图手势及弧形摘要时间轴的视频交互方法和系统,将视频摘要技术以及草图技术结合起来,实现在移动设备上方便快捷地对视频播放进行控制,提高视频在移动设备上的可操作性。
附图说明
图1为本发明实施例一的基于草图手势及弧形摘要时间轴的视频交互方法的流程图;
图2为本发明实施例一的基于草图手势及弧形摘要时间轴的视频交互方法的界面模型;
图3为本发明实施例一的基于草图手势及弧形摘要时间轴的视频交互方法中生成摘要时间轴模型的图解模型;
图4为本发明实施例一的基于草图手势及弧形摘要时间轴的视频交互方法中步骤C的具体流程图;
图5为本发明实施例一的基于草图手势及弧形摘要时间轴的视频交互方法中弧形手势图;
图6为本发明实施例一的基于草图手势及弧形摘要时间轴的视频交互方法中步骤E的流程图;
图7为本发明实施例一的基于草图手势及弧形摘要时间轴的视频交互方法中步骤F的流程图;
图8为本发明实施例二的基于草图手势及弧形摘要时间轴的视频交互系统的组成示意图;
图9为本发明实施例三的一种弧形无硬边界可滑动的摘要时间轴生成方法的步骤流程图;
图10为本发明实施例四的一种弧形无硬边界可滑动的摘要时间轴生成系统的组成示意图;
图11为本发明实施例五的一种基于摘要时间轴的弧形草图手势建模和识别方法的步骤流程图;
图12为本发明实施例六的一种基于摘要时间轴的弧形草图手势建模和识别系统的组成示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例一
本发明实施例一中提供了基于草图手势及弧形摘要时间轴的视频交互方法,步骤流程如图1所示,具体包括以下步骤:
步骤A:将一段视频分割成N个镜头,N为整数且N≥2。
具体的步骤包括:对一段视频中的每一帧计算其对于RGB空间的颜色直方图f(xi),其中xi表示视频的第i帧,f(xi)=[xi1,xi2,…xin]为一个n维向量。对视频中每相邻的两帧,计算其它们的直方图距离 Y i = | f ( x i ) - f ( x i - 1 ) | = Σ j = 1 n ( x ij - x i ( j - 1 ) ) 2 . 若Yi>ε>0,其中ε为设定的阈值,则将当前这两帧作为镜头分割的边界,即第i-1帧为一个镜头的右边界,第i帧为下一个镜头的左边界。视频的第一帧为第一个镜头的左边界,视频的最后一帧为最后一个镜头的右边界。获得一段视频的所有镜头S={S1,S2,…Si…Sm},其中Si为第i个镜头。
步骤B:从每个镜头中抽取出相应的关键帧,组成关键帧列表。
具体的,对每一个镜头Si抽取它的第一帧作为这个镜头的关键帧。获得与镜头序列S={S1,S2,…Si…Sm}一一对应的关键帧序列K={K1,K2,…Ki…Km}。
步骤C:对关键帧列表通过弧形排列形成摘要时间轴。界面模型如图2所示,本实施例中的弧形摘要时间轴放置在界面的右侧,在本发明的其它实施例中还可以放置在界面的其它位置。用户通过弧形草图手势库中的手势模型,可以对视频界面以及摘要时间轴进行交互。例如快进、快退、时间轴滑动、显示播放列表等功能。图3为生成摘要时间轴模型的图解模型。
步骤C的步骤流程如图4所示,具体包括以下步骤:
步骤C1:绘制两段同心圆弧,如图3a所示,圆弧C1和圆弧C2,圆心为O,半径分别为R1和R2,则两条弧线之间的宽度为d=|R1-R2|。令R1>R2>0,即C1为外侧圆弧。
步骤C2:根据同心圆弧的外侧圆弧计算关键点。在外侧圆弧C1上取每隔15°取一个点,共取9个关键点Pi,其中0≤i<9。
步骤C3:根据关键点确定每一帧的帧图片包围盒。
对每相邻两个关键点Pi,Pi+1,图中以关键点P2,P3为例,取线段P2P3的中点Q1,连接OQ1,在直线OQ1上取一点Q2,使得其满足如下两个条件:|OQ1|>|OQ2|和|Q1Q2|=1.2*d。则能将点P2,P3,Q2包围起来的最小矩形即为这三个点的包围盒,如图3(a)中的矩形框M。取包围盒的中心Ci,作为放置关键帧图片的中心位置,并取包围盒的高度H作为显示图片的高度,显示图片的宽度按比例进行缩放,得到W。根据C2,H,W这三个参数唯一确定了图片在弧形时间轴中的摆放位置,如图3b中所示的矩形框N。
步骤C4:去除图片的硬边界。
选取关键帧序列K={K1,K2,…Ki...Km}中连续的8个关键帧,插入到这8个给定的位置中去,将关键帧中超出弧形区域像素点的透明度设置为0,将相邻关键帧相互覆盖的区域进行线性消隐操作,消隐操作具体如图3c所示,连接OP2,将关键帧位于直线OP2右侧的像素点进行线性消隐。其中H0为直线右侧像素点距离直线OP2最大距离。pi为满足消隐区域内的一点,它到直线OP2的距离为h,则点pi处的透明度为:
Alpha = ( 1 - h H 0 ) × 255
通过上述线性消隐操作,达到去除图片硬边界目的。
使用弧形草图手势拨动摘要时间轴之时,摘要时间轴上的关键帧每次移动一个关键点间的弧度距离。每次移动分为15个时间间隔,在每个时间间隔之内,关键帧向左或者向右移动1°。执行多步微小的移动,能使摘要时间轴按弧形滑动的效果更加平滑。
步骤D:获取用户在触摸屏或摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串。
首先获取用户留下的轨迹点集合PC1和PC2,其中PC1={(xi1,yi1),(xi2,yi2),…,(xin,yin)}为第i条轨迹的点集,(x,y)表示坐标在(x,y)的一个点。对每一个点集PCi计算用以代表它的字符串si。计算方法如下,对轨迹集合中相邻两个点A=(x1,y1),B=(x2,y2),计算直线AB的方向,并使用字符c表示直线AB的方向。其中{0,1,2,3,4,5,6,7},即使用字符0-7表示平面中八个方向。对轨迹集合中每一对相邻的点,都计算出它的方向ck,其中ck为第k和第k+1个点的方向。轨迹PCi即可由字符串si表示,其中si=C1C2…Cn-1
再对si=C1C2…Cn-1进行数据压缩处理,过程如下:若si中出现连续的相同的字符,则只保留一次重复的字符,如si=0011,经数据压缩后,经过上述方法,轨迹PCi即可由字符串表示,其中中没有连续相同的字符出现。
步骤E:建立基于摘要时间轴的弧形草图手势库。弧形草图手势如图5所示。
步骤E的一种步骤流程如图6所示,具体包括以下步骤:
步骤E1:选取逆时针圆弧作为向后拨动摘要时间轴的弧形手势。
步骤E2:选取顺时针圆弧作为向前拨动摘要时间轴的弧形手势。
步骤E3:选取顺时针圆作为视频全屏播放的弧形手势。
步骤E4:选取逆时针圆作为取消视频全屏播放的弧形手势。
步骤E5:分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
弧形草图手势库中还包括非弧形手势,如单击、直线滑动等。
值得说明的是,本实施例中基于摘要时间轴建立弧形草图手势库时选取草图图形作为弧形手势的顺序不唯一,每种草图图形与弧形手势的一一对应关系也不唯一。也就是说在本发明的其它实施例中第一步可能先选取顺时针圆弧作为向前拨动摘要时间轴的弧形手势,还有可能逆时针圆弧对应的不是向前拨动摘要时间轴,而是全屏播放的弧形手势,等等。
步骤F:计算用户手势与弧形草图手势库中的各个标准手势之间的距离,获得与用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
步骤F的步骤流程如图7所示,具体包括以下步骤:
步骤F1:遍历弧形草图手势库中的标准手势,使用编辑距离算法计算用户手势和标准手势之间的编辑距离。标准手势模型S={S1,S2,…Si…Sn},计算其与得到的字符串s之间的编辑距离。
步骤F2:选取编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果。
步骤F3:调用匹配结果中的标准手势在弧形草图手势库中的功能,并执行相应的操作。
通过使用上述视频交互方法,将视频摘要技术以及草图技术结合起来,实现在移动设备上方便快捷地对视频播放进行控制,提高视频在移动设备上的可操作性。
实施例二
为达到上述目的,本发明的实施例二中还提供了基于草图手势及弧形摘要时间轴的视频交互系统,组成示意图如图8所示,具体包括:
镜头分割模块810、抽取关键帧模块820、关键帧布局模块830、获取轨迹点模块840、手势建模模块850和手势匹配模块860。
镜头分割模块810,用于将一段视频分割成N个镜头,N≥2且N为整数。
抽取关键帧模块820,用于从每个镜头中抽取出相应的关键帧,组成关键帧列表。
关键帧布局模块830,用于对关键帧列表通过弧形排列形成摘要时间轴。
关键帧布局模块830具体包括:绘制同心圆弧模块831、计算关键点模块832、计算包围盒模块833和去除硬边界模块834。
绘制同心圆弧模块831,用于绘制两段同心圆弧。
计算关键点模块832,用于根据同心圆弧的外侧圆弧计算关键点。
计算包围盒模块833,用于根据关键点确定每一帧的帧图片包围盒。
去除硬边界模块834,用于去除图片的硬边界。
获取轨迹点模块840,用于获取用户在触摸屏或摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串
手势建模模块850,用于建立基于摘要时间轴的弧形草图手势库。
手势建模模块850具体包括:向后拨动模块851、向前拨动模块852、全屏播放模块853、取消全屏播放模块854和打开播放列表模块855。
向后拨动模块851,用于选取逆时针圆弧作为向后拨动摘要时间轴的弧形手势。
向前拨动模块852,用于选取顺时针圆弧作为向前拨动摘要时间轴的弧形手势。
全屏播放模块853,用于选取顺时针圆作为视频全屏播放的弧形手势。
取消全屏播放模块854,用于选取逆时针圆作为取消视频全屏播放的弧形手势。
打开播放列表模块855,用于分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
手势匹配模块860,用于计算用户手势与弧形草图手势库中的各个标准手势之间的距离,获得与用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
手势匹配模块860具体包括:距离计算模块861、选取匹配结果模块862和执行操作模块863。
距离计算模块861,用于遍历弧形草图手势库中的标准手势,计算与表征用户手势的字符串之间的编辑距离。
选取匹配结果模块862,用于选取编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果。
执行操作模块863,用于调用匹配结果中的标准手势在弧形草图手势库中的功能,并执行相应的操作。
通过上述视频交互系统,将视频摘要技术以及草图技术结合起来,实现在移动设备上方便快捷地对视频播放进行控制,提高视频在移动设备上的可操作性。
实施例三
为达到上述目的,本发明的实施例三中还提供了一种弧形无硬边界可滑动的摘要时间轴生成方法,步骤流程如图9所示,具体包括:
步骤A:将一段视频分割成N个镜头,N≥2且N为整数。
步骤B:从每个镜头中抽取出相应的关键帧,组成关键帧列表。
步骤C:对关键帧列表通过弧形排列形成摘要时间轴。
步骤C具体包括:
步骤C1:绘制两段同心圆弧。
步骤C2:根据同心圆弧的外侧圆弧计算关键点。
步骤C3:根据关键点确定每一帧的帧图片包围盒。
步骤C4:去除图片的硬边界。
通过使用上述摘要时间轴生成方法,在每个时间间隔之内向左或向右移动1°,执行多步的微小移动,使得摘要时间轴按弧形滑动鼓的效果更加平滑。
实施例四
为达到上述目的,本发明的实施例四中还提供了一种弧形无硬边界可滑动的摘要时间轴生成方系统,组成示意图如图10所示,具体包括:镜头分割模块1010、获取关键帧模块1020和关键帧布局模块1030。
镜头分割模块1010,用于将一段视频分割成N个镜头,N≥2且N为整数。
获取关键帧模块1020,用于从每个镜头中抽取出相应的关键帧,组成关键帧列表。
关键帧布局模块1030,用于对关键帧列表通过弧形排列形成摘要时间轴。
关键帧布局模块1030具体包括:绘制同心圆弧模块1031、计算关键点模块1032、计算包围盒模块1033和去除硬边界模块1034。
绘制同心圆弧模块1031,用于绘制两段同心圆弧。
计算关键点模块1032,用于根据同心圆弧的外侧圆弧计算关键点。
计算包围盒模块1033,用于根据关键点确定每一帧的帧图片包围盒.
去除硬边界模块1034,用于去除图片的硬边界。
通过使用上述摘要时间轴生成系统,在每个时间间隔之内向左或向右移动1°,执行多步的微小移动,使得摘要时间轴按弧形滑动鼓的效果更加平滑。
实施例五
为达到上述目的,本发明的实施例五中还提供了一种基于摘要时间轴的弧形草图手势建模和识别方法,步骤流程如图11所示,具体包括以下步骤:
步骤D:获取用户在触摸屏或摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串。
步骤E:建立基于摘要时间轴的弧形草图手势库。
步骤E具体包括:
步骤E1:选取逆时针圆弧作为向后拨动摘要时间轴的弧形手势。
步骤E2:选取顺时针圆弧作为向前拨动摘要时间轴的弧形手势;
步骤E3:选取顺时针圆作为视频全屏播放的弧形手势。
步骤E4:选取逆时针圆作为取消视频全屏播放的弧形手势。
步骤E5:分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
步骤F:计算用户手势与弧形草图手势库中的各个标准手势之间的距离,获得与用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
步骤F具体包括:
步骤F1:遍历弧形草图手势库中的标准手势,计算与表征用户手势的字符串之间的编辑距离。
步骤F2:选取编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果。
步骤F3:调用匹配结果中的标准手势在弧形草图手势库中的功能,并执行相应的操作。
通过使用上述弧形草图手势建模和识别方法,利用草图技术,建立基于时间轴的弧形草图手势库,实现方便、操作性强的交互式视频浏览和控制。
实施例六
为达到上述目的,本发明的实施例六中还提供了一种基于摘要时间轴的弧形草图手势建模和识别系统,组成示意图如图12所示,具体包括:
获取轨迹点模块1210、手势建模模块1220和手势匹配模块1230。
获取轨迹点模块1210,用于获取用户在触摸屏或摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串。
手势建模模块1220,用于建立基于摘要时间轴的弧形草图手势库。
手势建模模块1220具体包括:向后拨动模块1221、向前拨动模块1222、全屏播放模块1223、取消全屏播放模块1224和打开播放列表模块1225。
向后拨动模块1221,用于向前选取逆时针圆弧作为向后拨动摘要时间轴的弧形手势。
向前拨动模块1222,用于选取顺时针圆弧作为向前拨动摘要时间轴的弧形手势。
全屏播放模块1223,用于选取顺时针圆作为视频全屏播放的弧形手势。
取消全屏播放模块1224,用于选取逆时针圆作为取消视频全屏播放的弧形手势。
打开播放列表模块1225,用于分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
手势匹配模块1230,用于计算用户手势与弧形草图手势库中的各个标准手势之间的距离,获得与用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
手势匹配模块1230具体包括:距离计算模块1231、选取匹配结果模块1232和执行操作模块1233。
距离计算模块1231,用于遍历弧形草图手势库中的标准手势,计算与表征用户手势的字符串之间的编辑距离。
选取匹配结果模块1232,用于选取编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果。
执行操作模块1233,用于调用匹配结果中的标准手势在弧形草图手势库中的功能,并执行相应的操作。
通过使用上述弧形草图手势建模和识别系统,利用草图技术,建立基于时间轴的弧形草图手势库,实现方便、操作性强的交互式视频浏览和控制。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (16)

1.基于草图手势及弧形摘要时间轴的视频交互方法,其特征在于,所述视频交互方法具体包括:
A:将一段视频分割成N个镜头,N为整数且N≥2;
B:从每个镜头中抽取出相应的关键帧,组成关键帧列表;
C:对所述关键帧列表通过弧形排列形成摘要时间轴;
D:获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
E:建立基于所述摘要时间轴的弧形草图手势库;
F:计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
2.如权利要求1所述的视频交互方法,其特征在于,所述步骤C具体包括:
C1:绘制两段同心圆弧;
C2:根据所述同心圆弧的外侧圆弧计算关键点;
C3:根据所述关键点确定每一帧的帧图片包围盒;
C4:去除图片的硬边界。
3.如权利要求1所述的视频交互方法,其特征在于,所述步骤E具体包括:
E1:选取逆时针圆弧作为向后拨动所述摘要时间轴的弧形手势;
E2:选取顺时针圆弧作为向前拨动所述摘要时间轴的弧形手势;
E3:选取顺时针圆作为视频全屏播放的弧形手势;
E4:选取逆时针圆作为取消视频全屏播放的弧形手势;
E5:分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
4.如权利要求1所述的视频交互方法,其特征在于,所述弧形草图手势库中还包括非弧形手势。
5.如权利要求1或3所述的视频交互方法,其特征在于,所述步骤E中建立弧形草图手势库时选取草图图形作为弧形手势的顺序不唯一,每种草图图形与弧形手势的一一对应关系也不唯一。
6.如权利要求1所述的视频交互方法,其特征在于,所述步骤F具体包括:
F1:遍历所述弧形草图手势库中的标准手势,计算与所述表征用户手势的字符串之间的编辑距离;
F2:选取所述编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果;
F3:调用所述匹配结果中的标准手势在所述弧形草图手势库中的功能,并执行相应的操作。
7.基于草图手势及弧形摘要时间轴的视频交互系统,其特征在于,所述系统具体包括:镜头分割模块、抽取关键帧模块、关键帧布局模块、获取轨迹点模块、手势建模模块和手势匹配模块;
所述镜头分割模块,用于将一段视频分割成N个镜头,N≥2且N为整数;
所述抽取关键帧模块,用于从每个镜头中抽取出相应的关键帧,组成关键帧列表;
所述关键帧布局模块,用于对所述关键帧列表通过弧形排列形成摘要时间轴;
所述获取轨迹点模块,用于获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
所述手势建模模块,用于建立基于所述摘要时间轴的弧形草图手势库;
所述手势匹配模块,用于计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作。
8.如权利要求7所述的视频交互系统,其特征在于,所述关键帧布局模块具体包括:绘制同心圆弧模块、计算关键点模块、计算包围盒模块和去除硬边界模块;
所述绘制同心圆弧模块,用于绘制两段同心圆弧;
所述计算关键点模块,用于根据所述同心圆弧的外侧圆弧计算关键点;
所述计算包围盒模块,用于根据所述关键点确定每一帧的帧图片包围盒;
所述去除硬边界模块,用于去除图片的硬边界。
9.如权利要求7所述的视频交互系统,其特征在于,所述手势建模模块具体包括:向后拨动模块、向前拨动模块、全屏播放模块、取消全屏播放模块和打开播放列表模块;
所述向后拨动模块,用于选取逆时针圆弧作为向后拨动所述摘要时间轴的弧形手势;
所述向前拨动模块,用于选取顺时针圆弧作为向前拨动所述摘要时间轴的弧形手势;
所述全屏播放模块,用于选取顺时针圆作为视频全屏播放的弧形手势;
所述取消全屏播放模块,用于选取逆时针圆作为取消视频全屏播放的弧形手势;
所述打开播放列表模块,用于分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
10.如权利要求7所述的视频交互系统,其特征在于,所述手势匹配模块具体包括:距离计算模块、选取匹配结果模块和执行操作模块;
所述距离计算模块,用于遍历所述弧形草图手势库中的标准手势,计算与所述表征用户手势的字符串之间的编辑距离;
所述选取匹配结果模块,用于选取所述编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果;
所述执行操作模块,用于调用所述匹配结果中的标准手势在所述弧形草图手势库中的功能,并执行相应的操作。
11.一种弧形无硬边界的摘要时间轴生成方法,其特征在于,所述摘要时间轴生成方法具体包括:
A:将一段视频分割成N个镜头,N≥2且N为整数;
B:从每个镜头中抽取出相应的关键帧,组成关键帧列表;
C:对所述关键帧列表通过弧形排列形成摘要时间轴;
所述步骤C具体包括:
C1:绘制两段同心圆弧;
C2:根据所述同心圆弧的外侧圆弧计算关键点;
C3:根据所述关键点确定每一帧的帧图片包围盒;
C4:去除图片的硬边界。
12.一种弧形无硬边界的摘要时间轴生成系统,其特征在于,所述系统具体包括:镜头分割模块、获取关键帧模块和关键帧布局模块;
所述镜头分割模块,用于将一段视频分割成N个镜头,N≥2且N为整数;
所述获取关键帧模块,用于从每个镜头中抽取出相应的关键帧,组成关键帧列表;
所述关键帧布局模块,用于对所述关键帧列表通过弧形排列形成摘要时间轴;
所述关键帧布局模块具体包括:绘制同心圆弧模块、计算关键点模块、计算包围盒模块和去除硬边界模块;
所述绘制同心圆弧模块,用于绘制两段同心圆弧;
所述计算关键点模块,用于根据所述同心圆弧的外侧圆弧计算关键点;
所述计算包围盒模块,用于根据所述关键点确定每一帧的帧图片包围盒;
所述去除硬边界模块,用于去除图片的硬边界。
13.一种基于摘要时间轴的弧形草图手势建模和识别方法,其特征在于,所述弧形草图手势建模和识别方法具体包括:
D:获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
E:建立基于所述摘要时间轴的弧形草图手势库;
F:计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作;
所述建立基于所述摘要时间轴的弧形草图手势库具体包括:
E1:选取逆时针圆弧作为向后拨动所述摘要时间轴的弧形手势;
E2:选取顺时针圆弧作为向前拨动所述摘要时间轴的弧形手势;
E3:选取顺时针圆作为视频全屏播放的弧形手势;
E4:选取逆时针圆作为取消视频全屏播放的弧形手势;
E5:分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
14.如权利要求13所述的弧形草图手势建模和识别方法,其特征在于,所述步骤F具体包括:
F1:遍历所述弧形草图手势库中的标准手势,计算与所述表征用户手势的字符串之间的编辑距离;
F2:选取所述编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果;
F3:调用所述匹配结果中的标准手势在所述弧形草图手势库中的功能,并执行相应的操作。
15.一种基于摘要时间轴的弧形草图手势建模和识别系统,其特征在于,所述系统包括:获取轨迹点模块、手势建模模块和手势匹配模块;
所述获取轨迹点模块,用于获取用户在触摸屏或所述摘要时间轴上留下的一条或多条轨迹,并计算轨迹点,得到一串表征用户手势的字符串;
所述手势建模模块,用于建立基于所述摘要时间轴的弧形草图手势库;
所述手势匹配模块,用于计算所述用户手势与所述弧形草图手势库中的各个标准手势之间的距离,获得与所述用户手势的距离最近的标准手势为匹配结果,并执行相应的操作;
所述手势建模模块具体包括:向后拨动模块、向前拨动模块、全屏播放模块、取消全屏播放模块和打开播放列表模块;
所述向后拨动模块,用于选取逆时针圆弧作为向后拨动所述摘要时间轴的弧形手势;
所述向前拨动模块,用于选取顺时针圆弧作为向前拨动所述摘要时间轴的弧形手势;
所述全屏播放模块,用于选取顺时针圆作为视频全屏播放的弧形手势;
所述取消全屏播放模块,用于选取逆时针圆作为取消视频全屏播放的弧形手势;
所述打开播放列表模块,用于分别选取逆时针和顺时针,两条方向分离的圆弧作为打开播放列表功能的弧形手势。
16.如权利要求15所述的弧形草图手势建模和识别系统,其特征在于,所述手势匹配模块具体包括:距离计算模块、选取匹配结果模块和执行操作模块;
所述距离计算模块,用于遍历所述弧形草图手势库中的标准手势,计算与所述表征用户手势的字符串之间的编辑距离;
所述选取匹配结果模块,用于选取所述编辑距离最小的标准手势作为与用户手势的字符串近似的匹配结果;
所述执行操作模块,用于调用所述匹配结果中的标准手势在所述弧形草图手势库中的功能,并执行相应的操作。
CN201310048730.4A 2013-02-06 2013-02-06 基于草图手势及弧形摘要时间轴的视频交互方法和系统 Expired - Fee Related CN103106038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310048730.4A CN103106038B (zh) 2013-02-06 2013-02-06 基于草图手势及弧形摘要时间轴的视频交互方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310048730.4A CN103106038B (zh) 2013-02-06 2013-02-06 基于草图手势及弧形摘要时间轴的视频交互方法和系统

Publications (2)

Publication Number Publication Date
CN103106038A CN103106038A (zh) 2013-05-15
CN103106038B true CN103106038B (zh) 2015-08-12

Family

ID=48313935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310048730.4A Expired - Fee Related CN103106038B (zh) 2013-02-06 2013-02-06 基于草图手势及弧形摘要时间轴的视频交互方法和系统

Country Status (1)

Country Link
CN (1) CN103106038B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294347B (zh) * 2013-06-24 2016-09-07 贝壳网际(北京)安全技术有限公司 移动终端浏览器视频播放的操作控制方法、装置及浏览器
CN103546709B (zh) * 2013-10-31 2016-10-05 宇龙计算机通信科技(深圳)有限公司 一种视频拍摄的片头生成方法、系统及智能电子设备
CN105100773B (zh) * 2015-07-20 2017-07-28 清华大学 立体视频制作方法、立体视图制作方法和制作系统
CN106599133B (zh) * 2016-12-02 2020-04-17 中国科学院软件研究所 一种基于草图交互的监控视频可视分析方法
CN109511017A (zh) * 2018-11-26 2019-03-22 深圳技威时代科技有限公司 一种视频回放方法及系统
CN111178308A (zh) * 2019-12-31 2020-05-19 北京奇艺世纪科技有限公司 一种手势轨迹的识别方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110067559A (ko) * 2009-12-14 2011-06-22 삼성전자주식회사 디스플레이장치 및 그 제어방법, 디스플레이시스템 및 그 제어방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Sketch-Based Annotation and Visualization in Video Authoring;Gui-Xia Ma et al.;《IEEE TRANSACTIONS ON MULTIMEDIA》;20120830;第14卷(第4期);全文 *
基于三维变换域鲁棒视频水印算法研究;张怀强;《中国优秀硕士学位论文全文数据库》;20121015;第4.2-4.3节 *

Also Published As

Publication number Publication date
CN103106038A (zh) 2013-05-15

Similar Documents

Publication Publication Date Title
CN103106038B (zh) 基于草图手势及弧形摘要时间轴的视频交互方法和系统
CN107515674B (zh) 一种基于虚拟现实与增强现实的采矿操作多交互实现方法
KR101729195B1 (ko) 질의동작기반 안무 검색 시스템 및 방법
CN105474207B (zh) 用于搜索多媒体内容的用户界面方法和设备
US20160198097A1 (en) System and method for inserting objects into an image or sequence of images
CN109618222A (zh) 一种拼接视频生成方法、装置、终端设备及存储介质
US20160125235A1 (en) Image segmentation method and image segmentation device
TWI556639B (zh) 用於將互動特徵加入視頻之技術
CN106960175B (zh) 基于深度卷积神经网络的第一视角动态手势检测方法
CN105718878A (zh) 基于级联卷积神经网络的第一视角空中手写和空中交互方法
CN111680594A (zh) 一种基于手势识别的增强现实交互方法
Zhuge et al. Boundary-guided feature aggregation network for salient object detection
CN104166851A (zh) 一种纸质教材的多媒体互动式学习系统及方法
US20140204123A1 (en) Relational Display of Images
US20130300750A1 (en) Method, apparatus and computer program product for generating animated images
Huang et al. RGB-D salient object detection by a CNN with multiple layers fusion
WO2013076359A1 (en) Method, apparatus and computer program product for generation of animated image associated with multimedia content
Wang et al. Hyper-lapse from multiple spatially-overlapping videos
CN112164065A (zh) 一种基于轻量化卷积神经网络的实时图像语义分割方法
CN112752158A (zh) 一种视频展示的方法、装置、电子设备及存储介质
CN110751668B (zh) 图像处理方法、装置、终端、电子设备及可读存储介质
CN110415263A (zh) 图像分割方法以及图像分割装置
CN111402289A (zh) 基于深度学习的人群表演误差检测方法
Jia et al. MobileNetV3 with CBAM for bamboo stick counting
JP2014524170A5 (zh)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150812

Termination date: 20220206