CN107506385A - 一种视频文件检索方法、设备及计算机可读存储介质 - Google Patents

一种视频文件检索方法、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN107506385A
CN107506385A CN201710614227.9A CN201710614227A CN107506385A CN 107506385 A CN107506385 A CN 107506385A CN 201710614227 A CN201710614227 A CN 201710614227A CN 107506385 A CN107506385 A CN 107506385A
Authority
CN
China
Prior art keywords
video file
video
file
retrieval
touch command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710614227.9A
Other languages
English (en)
Inventor
陈仕心
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201710614227.9A priority Critical patent/CN107506385A/zh
Publication of CN107506385A publication Critical patent/CN107506385A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features

Abstract

本发明公开了一种视频文件检索方法、设备及计算机可读存储介质,其中,该方法包括:确定视频文件的播放状态,并根据播放状态下监测语音检索指令;在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令;确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作;确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。实现了一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。

Description

一种视频文件检索方法、设备及计算机可读存储介质
技术领域
本发明涉及移动通信领域,尤其涉及一种视频文件检索方法、设备及计算机可读存储介质。
背景技术
现有技术中,视频播放一般具有播放记忆功能,当用户再次打开已有播放记录的视频时,视频可以在上次关闭的时间节点上开始继续播放。
但是,用户有时候需要把视频定位到某个记忆中的视频桥段,或者是某个视频画面来开始播放,或者是记忆中的某段台词甚至是某个台词关键词来开始播放,这时候就显得比较棘手了。
目前的方式是通过持续地快进操作和暂停暂停操作,用户持续预览播放画面来确认,这样操作既花费时间,在使用体验上也不好。
发明内容
为了解决现有技术中,没有一种能够在视频播放时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,视频回播的方式过于单一,影响了用户在视频中按需求进行检索的效率的技术缺陷,本发明提出了一种视频文件检索方法,该方法包括:
确定视频文件的播放状态,并根据播放状态下监测语音检索指令;
在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令;
确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作;
确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。
可选的,所述确定视频文件的播放状态,并根据所述播放状态下监测语音检索指令包括:
在所述播放状态下,提取所述视频文件的音频文件;
分析所述音频文件,得到所述音源特征。
可选的,所述在所述视频文件的播放界面内获取触控指令,分析并识别所述触控指令,提取所述语音检索指令包括:
在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈;
分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
可选的,所述确定语音检索指令内的目标特征,并与所述视频文件的音源特征执行匹配操作包括:
解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征;
按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作。
可选的,所述确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度包括:
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度;
确定所述播放进度的截图文件,并加以时间标签;
整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。
本发明还提出了一种视频文件检索设备,该设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现:
确定视频文件的播放状态,并根据所述播放状态下监测语音检索指令;
在所述视频文件的播放界面内获取触控指令,分析并识别所述触控指令,提取所述语音检索指令;
确定语音检索指令内的目标特征,并与所述视频文件的音源特征执行匹配操作;
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度。
可选的,所述计算机程序还被所述处理器执行时实现:
在所述播放状态下,提取所述视频文件的音频文件;
分析所述音频文件,得到所述音源特征。
可选的,所述计算机程序还被所述处理器执行时实现:
在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈;
分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
可选的,所述计算机程序还被所述处理器执行时实现:
解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征;
按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作;
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度;
确定所述播放进度的截图文件,并加以时间标签;
整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。
本发明还提出了一种计算机可读存储介质,该计算机可读存储介质上存储有视频文件检索程序,视频文件检索程序被处理器执行时实现如上述任一项所述的视频文件检索方法的步骤。
实施本发明的视频文件检索方法、设备及计算机可读存储介质,通过确定视频文件的播放状态,并根据播放状态下监测语音检索指令;在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令;确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作;确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。实现了一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明涉及的一种移动终端的硬件结构示意图;
图2是本发明实施例提供的一种通信网络系统架构图;
图3是本发明视频文件检索方法第一实施例的流程图;
图4是本发明视频文件检索方法第二实施例的流程图;
图5是本发明视频文件检索方法第三实施例的流程图;
图6是本发明视频文件检索方法第四实施例的流程图;
图7是本发明视频文件检索方法第五实施例的流程图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(CodeDivision Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进)等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本发明实施例,下面对本发明的移动终端所基于的通信网络系统进行描述。
请参阅图2,图2为本发明实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。
具体地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。其中,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功能实体)2036等。其中,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本发明不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。
基于上述移动终端硬件结构以及通信网络系统,提出本发明方法各个实施例。
实施例一
一种视频文件检索方法,该方法包括:
S1、确定视频文件的播放状态,并根据播放状态下监测语音检索指令;
S2、在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令;
S3、确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作;
S4、确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。
为了解决现有技术中,没有一种能够在视频播放时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,视频回播的方式过于单一,影响了用户在视频中按需求进行检索的效率的技术缺陷,本实施例提出了一种视频文件检索方法,首先,确定视频文件的播放状态,并根据播放状态下监测语音检索指令。具体的,视频文件包括但不限于移动终端设备上存储的视频文件、从网络端缓存或者下载的视频。
进一步的,上述视频文件的播放状态包括该视频的播放记录;
进一步的,上述视频文件的播放状态还包括在特定用户账户使用下的视频播放记录;
进一步的,视频的播放记录包括但不限于播放开始时间、播放暂停时间、播放持续时间以及播放过程中的操控记录。
然后,根据播放状态下检测语音检索指令。
进一步的,该语音检索指令包括操控指令和语音指令,其中,操控指令可以是移动终端设备触控屏获取到的触控信号,语音指令可以是通过移动终端设备麦克风获取的语音信号。
进一步的,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,视频处于播放状态或暂停状态时,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,语音指令可以是通过移动终端设备麦克风获取的语音信号以及通过存储器存储的语音信号、或者从网络端缓存或下载的语音信号。
在本实施例中,确定视频文件的播放状态,并根据播放状态下监测语音检索指令后,在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令。具体的,该语音检索指令包括操控指令和语音指令,其中,操控指令可以是移动终端设备触控屏获取到的触控信号,语音指令可以是通过移动终端设备麦克风获取的语音信号。
进一步的,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,视频处于播放状态或暂停状态时,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,语音指令可以是通过移动终端设备麦克风获取的语音信号以及通过存储器存储的语音信号、或者从网络端缓存或下载的语音信号。
进一步的,在用户执行触控指令,且该触控指令符合预设规则后,开始录入语音指令或者提取内部存储的语音指令。
在本实施例中,视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令后,确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作。具体的,首先,在录入语音指令或者提取内部存储的语音指令中提取该语音的目标特征,也即,该语音的音频特征;然后,分析视频文件内的音频文件,在该音频文件中提取音源特征,也即,该音频文件的音频特征。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
在本实施例中,确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作后,确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。例如,用户在观看一部爱情电影时,输出视频检索的触控指令,此时,用户向终端输入语音(例如“我爱你”三个字),该“我爱你”的音频特征为A,而分析视频文件内的音频文件,在该音频文件中提取音源特征为音源特征B,则将音频特征为A与音源特征B进行匹配,若匹配成功,则在B中定位该匹配的时间节点,并根据时间节点定位视频文件的播放进度。
本实施例的有益效果在于,通过确定视频文件的播放状态,并根据播放状态下监测语音检索指令;在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令;确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作;确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。实现了一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例二
基于上述实施例,所述确定视频文件的播放状态,并根据所述播放状态下监测语音检索指令包括:
S11、在所述播放状态下,提取所述视频文件的音频文件;
S12、分析所述音频文件,得到所述音源特征。
在本实施例中,首先,所述播放状态下,提取所述视频文件的音频文件。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
然后,分析所述音频文件,得到所述音源特征。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件操作,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,且在执行分析视频文件内的音频文件操作完成后,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
本实施例的有益效果在于,通过在所述播放状态下,提取所述视频文件的音频文件,分析所述音频文件,得到所述音源特征。为后续实现一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式提供了数据判断基础,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例三
基于上述实施例,所述在所述视频文件的播放界面内获取触控指令,分析并识别所述触控指令,提取所述语音检索指令包括:
S21、在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈;
S22、分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
在本实施例中,在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈。
进一步的,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,画满一圈作为触控指令结束;
进一步的,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,画满半圈时,视频若处于播放状态,则暂停播放,继续画满一圈作为触控指令结束。
在本实施例中,在所述视频文件的播放界面内获取触控指令后,分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
进一步的,进一步的,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,画满半圈时,视频若处于暂停状态,则保持暂停播放状态,继续画满一圈作为触控指令结束。
本实施例的有益效果在于,通过在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,然后,分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。为后续实现一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式提供了数据判断基础,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例四
基于上述实施例,所述确定语音检索指令内的目标特征,并与所述视频文件的音源特征执行匹配操作包括:
S31、解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征;
S32、按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作。
在本实施例中,解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征。具体的:在视频文件首次播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
然后,分析所述音频文件,得到所述音源特征。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件操作,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,且在执行分析视频文件内的音频文件操作完成后,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
然后,按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作。
进一步的,若视频在播放过程中接收到触控指令,且暂停视频播放,则从视频暂停播放的节点开始,向后检索视频;
进一步的,若视频在播放过程中接收到触控指令,且暂停视频播放,则从视频起始播放的节点开始,向后检索视频;
进一步的,若视频在播放过程中接收到触控指令,且视频继续播放,则从视频当前播放的节点开始,向后检索视频。
本实施例的有益效果在于,通过解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征,按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作。为后续实现一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式提供了数据判断基础,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例五
基于上述实施例,所述确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度包括:
S41、确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度;
S42、确定所述播放进度的截图文件,并加以时间标签;
S43、整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。
在本实施例中,首先,确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度。
具体的,如上例所述,若确定特征匹配的时间节点为P1,则根据P1节点的时刻定位视频文件的播放进度;
进一步的,若确定特征匹配的时间节点为P1、P2…Pn,则分别根据P1、P2…Pn节点的时刻定位视频文件的播放进度。
在本实施例中,确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度后,确定所述播放进度的截图文件,并加以时间标签。具体的,如上例所述,若确定特征匹配的时间节点为P1,则根据P1节点的时刻定位视频文件的播放进度,确定该P1节点对应的T1时刻的视频截图文件,其中,T1为P1节点对应的时间标签;
进一步的,若确定特征匹配的时间节点为P1、P2…Pn,则分别根据P1、P2…Pn节点的时刻定位视频文件的播放进度,并分别确定该P1节点对应的T1T2…Tn时刻的视频截图文件。
在本实施例中,确定所述播放进度的截图文件,并加以时间标签后,整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。同样的,如上例所述,若确定特征匹配的时间节点为P1、P2…Pn,则分别根据P1、P2…Pn节点的时刻定位视频文件的播放进度,并分别确定该P1节点对应的T1T2…Tn时刻的视频截图文件,然后并以缩略图的形式排列所述截图文件。最后,通过用户的选定操作快速定位到截图文件对应的视频播放节点。
本实施例的有益效果在于,通过确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度,确定所述播放进度的截图文件,并加以时间标签,整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。实现了一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例六
基于上述实施例,本发明还提出了一种视频文件检索设备,该设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现:
确定视频文件的播放状态,并根据所述播放状态下监测语音检索指令;
在所述视频文件的播放界面内获取触控指令,分析并识别所述触控指令,提取所述语音检索指令;
确定语音检索指令内的目标特征,并与所述视频文件的音源特征执行匹配操作;
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度。
为了解决现有技术中,没有一种能够在视频播放时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,视频回播的方式过于单一,影响了用户在视频中按需求进行检索的效率的技术缺陷,本实施例提出了一种视频文件检索方法,首先,确定视频文件的播放状态,并根据播放状态下监测语音检索指令。具体的,视频文件包括但不限于移动终端设备上存储的视频文件、从网络端缓存或者下载的视频。
进一步的,上述视频文件的播放状态包括该视频的播放记录;
进一步的,上述视频文件的播放状态还包括在特定用户账户使用下的视频播放记录;
进一步的,视频的播放记录包括但不限于播放开始时间、播放暂停时间、播放持续时间以及播放过程中的操控记录。
然后,根据播放状态下检测语音检索指令。
进一步的,该语音检索指令包括操控指令和语音指令,其中,操控指令可以是移动终端设备触控屏获取到的触控信号,语音指令可以是通过移动终端设备麦克风获取的语音信号。
进一步的,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,视频处于播放状态或暂停状态时,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,语音指令可以是通过移动终端设备麦克风获取的语音信号以及通过存储器存储的语音信号、或者从网络端缓存或下载的语音信号。
在本实施例中,确定视频文件的播放状态,并根据播放状态下监测语音检索指令后,在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令。具体的,该语音检索指令包括操控指令和语音指令,其中,操控指令可以是移动终端设备触控屏获取到的触控信号,语音指令可以是通过移动终端设备麦克风获取的语音信号。
进一步的,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,视频处于播放状态或暂停状态时,用户在终端视频画面上执行画圈(顺或逆时针)动作以进入语音定位输入模式,同时视频随即暂停。
进一步的,语音指令可以是通过移动终端设备麦克风获取的语音信号以及通过存储器存储的语音信号、或者从网络端缓存或下载的语音信号。
进一步的,在用户执行触控指令,且该触控指令符合预设规则后,开始录入语音指令或者提取内部存储的语音指令。
在本实施例中,视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令后,确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作。具体的,首先,在录入语音指令或者提取内部存储的语音指令中提取该语音的目标特征,也即,该语音的音频特征;然后,分析视频文件内的音频文件,在该音频文件中提取音源特征,也即,该音频文件的音频特征。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
在本实施例中,确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作后,确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。例如,用户在观看一部爱情电影时,输出视频检索的触控指令,此时,用户向终端输入语音(例如“我爱你”三个字),该“我爱你”的音频特征为A,而分析视频文件内的音频文件,在该音频文件中提取音源特征为音源特征B,则将音频特征为A与音源特征B进行匹配,若匹配成功,则在B中定位该匹配的时间节点,并根据时间节点定位视频文件的播放进度。
本实施例的有益效果在于,通过确定视频文件的播放状态,并根据播放状态下监测语音检索指令;在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令;确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作;确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。实现了一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例七
基于上述实施例,所述计算机程序还被所述处理器执行时实现:
在所述播放状态下,提取所述视频文件的音频文件;
分析所述音频文件,得到所述音源特征。
在本实施例中,首先,所述播放状态下,提取所述视频文件的音频文件。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
然后,分析所述音频文件,得到所述音源特征。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件操作,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,且在执行分析视频文件内的音频文件操作完成后,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
本实施例的有益效果在于,通过在所述播放状态下,提取所述视频文件的音频文件,分析所述音频文件,得到所述音源特征。为后续实现一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式提供了数据判断基础,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例八
基于上述实施例,所述计算机程序还被所述处理器执行时实现:
在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈;
分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
在本实施例中,在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈。
进一步的,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,画满一圈作为触控指令结束;
进一步的,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,画满半圈时,视频若处于播放状态,则暂停播放,继续画满一圈作为触控指令结束。
在本实施例中,在所述视频文件的播放界面内获取触控指令后,分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
进一步的,进一步的,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,画满半圈时,视频若处于暂停状态,则保持暂停播放状态,继续画满一圈作为触控指令结束。
本实施例的有益效果在于,通过在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈,然后,分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。为后续实现一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式提供了数据判断基础,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例九
基于上述实施例,所述计算机程序还被所述处理器执行时实现:
解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征;
按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作;
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度;
确定所述播放进度的截图文件,并加以时间标签;
整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。
在本实施例中,解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征。具体的:在视频文件首次播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
然后,分析所述音频文件,得到所述音源特征。
进一步的,在视频文件首次播放时,执行分析视频文件内的音频文件操作,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件暂停播放时,执行分析视频文件内的音频文件,且在执行分析视频文件内的音频文件操作完成后,在该音频文件中提取音源特征操作;
进一步的,在视频文件播放时,且检测到触控指令时,且在执行分析视频文件内的音频文件操作完成后,执行分析视频文件内的音频文件,在该音频文件中提取音源特征操作。
然后,按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作。
进一步的,若视频在播放过程中接收到触控指令,且暂停视频播放,则从视频暂停播放的节点开始,向后检索视频;
进一步的,若视频在播放过程中接收到触控指令,且暂停视频播放,则从视频起始播放的节点开始,向后检索视频;
进一步的,若视频在播放过程中接收到触控指令,且视频继续播放,则从视频当前播放的节点开始,向后检索视频。
在本实施例中,首先,确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度。
具体的,如上例所述,若确定特征匹配的时间节点为P1,则根据P1节点的时刻定位视频文件的播放进度;
进一步的,若确定特征匹配的时间节点为P1、P2…Pn,则分别根据P1、P2…Pn节点的时刻定位视频文件的播放进度。
在本实施例中,确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度后,确定所述播放进度的截图文件,并加以时间标签。具体的,如上例所述,若确定特征匹配的时间节点为P1,则根据P1节点的时刻定位视频文件的播放进度,确定该P1节点对应的T1时刻的视频截图文件,其中,T1为P1节点对应的时间标签;
进一步的,若确定特征匹配的时间节点为P1、P2…Pn,则分别根据P1、P2…Pn节点的时刻定位视频文件的播放进度,并分别确定该P1节点对应的T1T2…Tn时刻的视频截图文件。
在本实施例中,确定所述播放进度的截图文件,并加以时间标签后,整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。同样的,如上例所述,若确定特征匹配的时间节点为P1、P2…Pn,则分别根据P1、P2…Pn节点的时刻定位视频文件的播放进度,并分别确定该P1节点对应的T1T2…Tn时刻的视频截图文件,然后并以缩略图的形式排列所述截图文件。最后,通过用户的选定操作快速定位到截图文件对应的视频播放节点。
本实施例的有益效果在于,通过确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度,确定所述播放进度的截图文件,并加以时间标签,整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。实现了一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
实施例十
基于上述实施例,本发明还提出了一种计算机可读存储介质,该计算机可读存储介质上存储有视频文件检索程序,视频文件检索程序被处理器执行时实现如上述任一项所述的视频文件检索方法的步骤。
实施本发明的视频文件检索方法、设备及计算机可读存储介质,通过确定视频文件的播放状态,并根据播放状态下监测语音检索指令;在视频文件的播放界面内获取触控指令,分析并识别触控指令,提取语音检索指令;确定语音检索指令内的目标特征,并与视频文件的音源特征执行匹配操作;确定特征匹配的时间节点,并根据时间节点定位视频文件的播放进度。实现了一种在播放视频文件时,能够及时、准确地定位到视频的任意桥段、或者某个视频画面,丰富了视频检索的方式,通过终端对用户语音的识别和匹配,直接定位到视频内相同语音内容所对应的播放画面,达到快速定位视频的目的,从而大大提升视频定位的操作体验。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种视频文件检索方法,其特征在于,所述方法包括:
确定视频文件的播放状态,并根据所述播放状态下监测语音检索指令;
在所述视频文件的播放界面内获取触控指令,分析并识别所述触控指令,提取所述语音检索指令;
确定语音检索指令内的目标特征,并与所述视频文件的音源特征执行匹配操作;
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度。
2.根据权利要求1所述的视频文件检索方法,其特征在于,所述确定视频文件的播放状态,并根据所述播放状态下监测语音检索指令包括:
在所述播放状态下,提取所述视频文件的音频文件;
分析所述音频文件,得到所述音源特征。
3.根据权利要求2所述的视频文件检索方法,其特征在于,所述在所述视频文件的播放界面内获取触控指令,分析并识别所述触控指令,提取所述语音检索指令包括:
在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈;
分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
4.根据权利要求3所述的视频文件检索方法,其特征在于,所述确定语音检索指令内的目标特征,并与所述视频文件的音源特征执行匹配操作包括:
解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征;
按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作。
5.根据权利要求4所述的视频文件检索方法,其特征在于,所述确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度包括:
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度;
确定所述播放进度的截图文件,并加以时间标签;
整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。
6.一种视频文件检索设备,其特征在于,所述设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现:
确定视频文件的播放状态,并根据所述播放状态下监测语音检索指令;
在所述视频文件的播放界面内获取触控指令,分析并识别所述触控指令,提取所述语音检索指令;
确定语音检索指令内的目标特征,并与所述视频文件的音源特征执行匹配操作;
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度。
7.根据权利要求6所述的视频文件检索设备,其特征在于,所述计算机程序还被所述处理器执行时实现:
在所述播放状态下,提取所述视频文件的音频文件;
分析所述音频文件,得到所述音源特征。
8.根据权利要求7所述的视频文件检索设备,其特征在于,所述计算机程序还被所述处理器执行时实现:
在所述视频文件的播放界面内获取触控指令,其中,所述触控指令包括但不限于在特定区域内顺时针方向画圈或者逆时针方向画圈;
分析并识别所述触控指令,提取所述语音检索指令,同时,暂停所述视频文件的播放状态。
9.根据权利要求8所述的视频文件检索设备,其特征在于,所述计算机程序还被所述处理器执行时实现:
解析所述语音检索指令,提取检索语音数据,分析所述检索语音数据内的目标特征;
按时序在所述视频文件的音源特征内执行与所述目标特征的匹配操作;
确定特征匹配的时间节点,并根据所述时间节点定位所述视频文件的播放进度;
确定所述播放进度的截图文件,并加以时间标签;
整合所述多个时间节点所对应的多个截图文件,并以缩略图的形式排列所述截图文件。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频文件检索程序,所述视频文件检索程序被处理器执行时实现如权利要求1至5中任一项所述的视频文件检索方法的步骤。
CN201710614227.9A 2017-07-25 2017-07-25 一种视频文件检索方法、设备及计算机可读存储介质 Pending CN107506385A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710614227.9A CN107506385A (zh) 2017-07-25 2017-07-25 一种视频文件检索方法、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710614227.9A CN107506385A (zh) 2017-07-25 2017-07-25 一种视频文件检索方法、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN107506385A true CN107506385A (zh) 2017-12-22

Family

ID=60689435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710614227.9A Pending CN107506385A (zh) 2017-07-25 2017-07-25 一种视频文件检索方法、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107506385A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109688475A (zh) * 2018-12-29 2019-04-26 深圳Tcl新技术有限公司 视频播放跳转方法、系统及计算机可读存储介质
CN109767771A (zh) * 2019-03-04 2019-05-17 出门问问信息科技有限公司 一种播放进度控制方法、智能穿戴设备及多媒体显示设备
CN109977239A (zh) * 2019-03-31 2019-07-05 联想(北京)有限公司 一种信息处理方法和电子设备
CN109979462A (zh) * 2019-03-21 2019-07-05 广东小天才科技有限公司 一种结合上下文语境获取意图的方法和系统
CN110035301A (zh) * 2019-04-15 2019-07-19 钟俊强 一种基于语音控制的播放进度调节方法
CN110047513A (zh) * 2019-04-28 2019-07-23 秒针信息技术有限公司 一种视频监测方法、装置、电子设备和存储介质
CN110401879A (zh) * 2019-08-13 2019-11-01 宇龙计算机通信科技(深圳)有限公司 一种视频播放的控制方法、装置、终端及存储介质
CN111818358A (zh) * 2020-08-07 2020-10-23 广州酷狗计算机科技有限公司 音频文件的播放方法、装置、终端及存储介质
CN112256912A (zh) * 2020-09-16 2021-01-22 珠海市新德汇信息技术有限公司 审讯视频智能标注分析及播放方法
CN112752155A (zh) * 2020-01-13 2021-05-04 腾讯科技(深圳)有限公司 一种媒体数据显示方法和相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982800A (zh) * 2012-11-08 2013-03-20 鸿富锦精密工业(深圳)有限公司 具有影音文件处理功能的电子装置及影音文件处理方法
CN103226966A (zh) * 2013-04-26 2013-07-31 广东欧珀移动通信有限公司 一种可快速定位播放进度的方法及移动终端
CN104301771A (zh) * 2013-07-15 2015-01-21 中兴通讯股份有限公司 视频文件播放进度的调整方法及装置
CN105828179A (zh) * 2015-06-24 2016-08-03 维沃移动通信有限公司 视频定位方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982800A (zh) * 2012-11-08 2013-03-20 鸿富锦精密工业(深圳)有限公司 具有影音文件处理功能的电子装置及影音文件处理方法
CN103226966A (zh) * 2013-04-26 2013-07-31 广东欧珀移动通信有限公司 一种可快速定位播放进度的方法及移动终端
CN104301771A (zh) * 2013-07-15 2015-01-21 中兴通讯股份有限公司 视频文件播放进度的调整方法及装置
CN105828179A (zh) * 2015-06-24 2016-08-03 维沃移动通信有限公司 视频定位方法和装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109688475A (zh) * 2018-12-29 2019-04-26 深圳Tcl新技术有限公司 视频播放跳转方法、系统及计算机可读存储介质
WO2020135161A1 (zh) * 2018-12-29 2020-07-02 深圳Tcl新技术有限公司 视频播放跳转方法、系统及计算机可读存储介质
CN109688475B (zh) * 2018-12-29 2020-10-02 深圳Tcl新技术有限公司 视频播放跳转方法、系统及计算机可读存储介质
CN109767771A (zh) * 2019-03-04 2019-05-17 出门问问信息科技有限公司 一种播放进度控制方法、智能穿戴设备及多媒体显示设备
CN109979462A (zh) * 2019-03-21 2019-07-05 广东小天才科技有限公司 一种结合上下文语境获取意图的方法和系统
CN109977239A (zh) * 2019-03-31 2019-07-05 联想(北京)有限公司 一种信息处理方法和电子设备
CN109977239B (zh) * 2019-03-31 2023-08-18 联想(北京)有限公司 一种信息处理方法和电子设备
CN110035301A (zh) * 2019-04-15 2019-07-19 钟俊强 一种基于语音控制的播放进度调节方法
CN110047513B (zh) * 2019-04-28 2021-04-23 秒针信息技术有限公司 一种视频监测方法、装置、电子设备和存储介质
CN110047513A (zh) * 2019-04-28 2019-07-23 秒针信息技术有限公司 一种视频监测方法、装置、电子设备和存储介质
CN110401879A (zh) * 2019-08-13 2019-11-01 宇龙计算机通信科技(深圳)有限公司 一种视频播放的控制方法、装置、终端及存储介质
CN112752155A (zh) * 2020-01-13 2021-05-04 腾讯科技(深圳)有限公司 一种媒体数据显示方法和相关设备
CN112752155B (zh) * 2020-01-13 2024-02-09 腾讯科技(深圳)有限公司 一种媒体数据显示方法和相关设备
CN111818358A (zh) * 2020-08-07 2020-10-23 广州酷狗计算机科技有限公司 音频文件的播放方法、装置、终端及存储介质
CN112256912A (zh) * 2020-09-16 2021-01-22 珠海市新德汇信息技术有限公司 审讯视频智能标注分析及播放方法

Similar Documents

Publication Publication Date Title
CN107506385A (zh) 一种视频文件检索方法、设备及计算机可读存储介质
CN107229402A (zh) 终端的动态截屏方法、装置及可读存储介质
CN108536481A (zh) 一种应用程序启动方法、移动终端及计算机存储介质
CN107314774A (zh) 一种地图导航方法、设备及计算机可读存储介质
CN107566635A (zh) 屏幕亮度设置方法、移动终端和计算机可读存储介质
CN107145385A (zh) 一种多任务界面显示方法、移动终端和计算机存储介质
CN107682547A (zh) 一种语音信息调控方法、设备及计算机可读存储介质
CN107341011A (zh) 一种桌面显示方法、移动终端以及计算机可读存储介质
CN110187943A (zh) 一种录屏方法、终端及计算机可读存储介质
CN107566605A (zh) 一种交互界面处理方法、设备及计算机可读存储介质
CN107844230A (zh) 一种广告页面调整方法、移动终端及计算机可读存储介质
CN108307043A (zh) 语音消息转换方法、移动终端及计算机可读存储介质
CN108762631A (zh) 一种移动终端控制方法、移动终端及计算机可读存储介质
CN109040808A (zh) 一种视频交互调控方法、设备及计算机可读存储介质
CN107181865A (zh) 未读短信的处理方法、终端及计算机可读存储介质
CN107463324A (zh) 一种图片显示方法、移动终端和计算机可读存储介质
CN107688429A (zh) 应用控件的管理方法、移动终端和计算机可读存储介质
CN107483556A (zh) 一种远程配置方法、设备及计算机可读存储介质
CN108449513A (zh) 一种交互调控方法、设备及计算机可读存储介质
CN107168626A (zh) 一种信息处理方法、设备及计算机可读存储介质
CN107239193A (zh) 一种联系人添加方法、移动终端以及计算机可读存储介质
CN107506468A (zh) 应用程序搜索方法、终端、服务器、计算机可读存储介质
CN107566608A (zh) 一种系统导航方法、设备及计算机可读存储介质
CN107133795A (zh) 一种切换支付环境的方法、设备及计算机可读存储介质
CN108319498A (zh) 一种应用程序场景推送方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171222

RJ01 Rejection of invention patent application after publication