WO2020135161A1

WO2020135161A1 - 视频播放跳转方法、系统及计算机可读存储介质

Info

Publication number: WO2020135161A1
Application number: PCT/CN2019/126022
Authority: WO
Inventors: 李其浪
Original assignee: 深圳Tcl新技术有限公司
Priority date: 2018-12-29
Filing date: 2019-12-17
Publication date: 2020-07-02
Also published as: CN109688475A; CN109688475B

Abstract

本申请公开了一种视频播放跳转方法、系统及计算机可读存储介质，包括：接收视频播放终端采集的用户语音信息；对所述用户语音信息进行识别，提取出所述语音信息的特征；将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签；将所述与语音信息特征匹配的场景标签发送至视频播放终端，以控制视频播放终端上播放的视频跳转至相应位置。本申请还公开了一种视频播放跳转系统及计算机可读存储介质。本申请通过服务器的语音识别和语义识别，实现了用户通过语音命令即可实现视频跳转，从而提高用户体验。

Description

视频播放跳转方法、系统及计算机可读存储介质

本申请要求于2018年12月29日提交中国专利局、申请号为201811654558.6、发明名称为“视频播放跳转方法、系统及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及视频播放技术领域，尤其涉及一种视频播放跳转方法、系统及计算机可读存储介质。

背景技术

随着互联网技术的发展，人们不再单纯依赖接收电视直播信号来观看直播视频，而是通过互联网收看网络中现有的任意视频，包括直播视频。这样不仅可以根据自己的喜好选择视频类型，还可以在观看视频的过程中随意调整播放进度，直接将视频跳转至想要观看的场景中。

调整视频播放进度时，用户可以通过电视遥控上的按键或者视频播放软件上的虚拟按键来实现，如用户按下电视遥控上的按键或者视频播放软件上的虚拟按键，视频播放进度向前或者向后跳转一定的时间；如用户一直按住电视遥控上的按键或者视频播放软件上的虚拟按键，视频播放进度一直向前或者向后跳转一定的时间；如用户设置跳转时间后，电视或视频播放软件加载跳转时间后进行视频播放等。这样使得用户需要手动操作按键才能将视频跳转到想要观看的场景中，而且很难一次性跳转完成，用户体验性较差。

技术解决方案

本申请的主要目的在于提供一种视频播放跳转方法、系统及计算机可读存储介质，旨在解决用户需要多次手动操作按键才能将视频跳转到想要观看的场景中，用户体验性较差的技术问题。

为实现上述目的，本申请提供一种视频播放跳转方法，包括以下步骤：

接收视频播放终端采集的用户语音信息；

对所述用户语音信息进行识别，提取出所述语音信息的特征；

将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签；

将所述与语音信息特征匹配的场景标签发送至视频播放终端，以控制视频播放终端上播放的视频跳转至相应位置。

优选地，在所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤之前，包括：

判断所述语音信息特征中是否包括跳转视频名称；

若所述语音信息特征中不包括跳转视频名称，则获取当前播放视频的名称；

所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤包括：

将所述语音信息特征和当前播放视频的名称与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。

优选地，在所述判断所述语音信息特征中是否包括跳转视频名称的步骤之后，包括：

若所述语音信息特征中包括跳转视频名称，则执行步骤：将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。

优选地，所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤包括：

判断预设音频数据中是否包括当前播放视频对应的音频数据；

若预设音频数据中没有当前播放视频对应的音频数据，则向视频播放终端发送请求指令；

接收视频播放终端发送的当前播放视频对应的音频数据，将所述音频数据保存到预设音频数据。

优选地，在所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤之后，还包括：

若在预设时间内未匹配出符合所述语音信息特征的场景标签，则生成匹配失败提示；

将匹配失败提示发送至视频播放终端，以使视频播放终端显示提示信息。

此外，为实现上述目的，本申请还提供一种视频播放跳转方法，包括以下步骤：

采集用户输入的语音信息；

将所述用户语音信息发送至服务器，以使服务器将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签；

接收所述与语音信息特征匹配的场景标签，将视频播放终端上播放的视频跳转至相应位置。

优选地，在所述将所述用户语音信息和当前播放视频的名称信息发送至服务器步骤之后，还包括：

接收到服务器发送的音频数据请求指令；

发送当前播放视频对应的音频数据至服务器。

优选地，在所述将所述用户语音信息发送至服务器步骤之后，还包括：

若服务器在预设时间内未匹配出符合所述语音信息特征的场景标签，则接收匹配失败提示，并在视频终端界面中显示，以提示用户。

此外，为实现上述目的，本申请还提供一种视频播放跳转系统，所述视频播放跳转系统包括：视频播放终端和服务器，

所述视频播放终端采集用户输入的语音信息，并将所述用户语音信息和当前播放视频的名称信息发送至服务器；

所述服务器接收视频播放终端采集的用户语音信息，对所述语音信息进行识别，提取出所述语音信息的特征，将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，将所述与语音信息特征匹配的场景标签发送至视频播放终端；

所述视频播放终端接收所述与语音信息特征匹配的场景标签，将视频播放终端上播放的视频跳转至相应位置。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，该计算机程序被视频播放终端和服务器执行时实现如上所述的视频播放跳转方法。

本申请应用于视频播放终端和服务器组成的交互系统，首先接收视频播放终端通过语音采集模块如麦克风采集到的用户语音信息，将上述用户语音信息通过语音识别和语义识别功能，对用户语音信息进行识别，获取到用户语音信息的特征，该特征主要包括用户意图要跳转的视频名称、场景等信息，同时服务器将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，最后将与语音信息特征匹配的场景标签发送至视频播放终端，使视频跳转至相应位置。从而实现了用户通过语音命令即可实现视频跳转，且能准确地跳转至用户想要的场景中，提高了用户的体验性。

附图说明

图1是本申请实施例方案涉及的系统架构示意图；

图2为本申请视频播放跳转方法第一实施例的流程示意图；

图3为本申请视频播放跳转方法第二实施例的流程示意图；

图4为本申请视频播放跳转方法第三实施例的流程示意图；

图5为本申请视频播放跳转方法第四实施例的流程示意图；

图6为本申请视频播放跳转系统第一实施例的结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本发明的实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例的主要解决方案是：接收视频播放终端采集的用户语音信息；对所述用户语音信息进行识别，提取出所述语音信息的特征；将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签；将所述与语音信息特征匹配的场景标签发送至视频播放终端，以控制视频播放终端上播放的视频跳转至相应位置。

由于现有技术还不能通过用户语音中的场景特征，将视频播放跳转至相应场景位置，故需要本申请来解决。

本申请提供一种解决方案，使用户通过语音命令即可实现视频跳转，且能准确地跳转至用户想要的场景中，提高了用户的体验性。

图1为本申请的视频播放跳转方法实施例的系统架构示意图。

请参照图1，系统架构100可以包括视频播放终端101、102、103，网络104和服务器105。网络104用以在视频播放终端101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种有线、无线通信链路，如光纤电缆、移动网络、WiFi、蓝牙或者热点等等。

用户可以使用视频播放终端101、102、103通过网络104与服务器105交互，以接收或发送消息等。视频播放终端101、102、103上可以安装有各种通讯客户端应用，例如视频播放类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

视频播放终端101、102、103可以是硬件，也可以是软件。当视频播放终端101、102、103为硬件时，可以是具有显示屏并且支持视频播放的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当视频播放终端101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器，例如对视频播放终端101、102、103上播放的视频进行读取，也可以对接收到的各种语音信息、指令信息、视频/音频数据进行分析等处理，并将处理结果例如视频片段、场景标签、指令信息等，反馈给视频播放终端，以使视频播放终端根据处理结果完成相应动作。

需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

需要说明的是，本申请实施例所提供的视频播放跳转方法可以由视频播放终端101、102、103执行，也可以由服务器105执行。相应地，用于推送信息的装置可以设置于视频播放终端101、102、103中，也可以设置于服务器105中。在此不做具体限定。

应该理解，图1中的视频播放终端、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的视频播放终端、网络和服务器。

请参照图2，本申请第一实施例提供一种视频播放跳转方法，包括以下步骤：

步骤S10，接收视频播放终端采集的用户语音信息。

本申请可以应用于视频播放终端和服务器组成的交互系统，视频播放终端与服务器通过网络相连，实现交互。本实施例中视频播放终端以电视机为例，通过电视机的语音采集模块实时采集用户的语音信息，通过无线网络，将采集到的语音信息发送至服务器。服务器实时接收网络另一端电视机发送的用户语音信息。

步骤S20，对所述用户语音信息进行识别，提取出所述语音信息的特征。

服务器将接收到的用户语言信息进行语音识别和语义识别，其中语音识别是通过声学模型和语音模型将语音信息转化为计算机能识别的文字信息，语义识别是在语音识别的基础在，基于用户的性别、爱好、平时的点播倾向等特征来进行智能分析，更好的理解用户的意图。如用户录入语音为一部具体的电影或者电视剧的全名，服务器只需要经过语音识别即可找出用户想要观看的这部电影或者电视剧，如用户录入语音是“一部爱情片”、“热播的动作片”、“香港导演的电影”、“好莱坞大片”等模糊语句，服务器还需要进行语义识别，才能进行精准的跳转。

服务器基于语音识别和语音识别功能，可以提取出用户语音信息的特征，如用户录入语音为“电视剧《**的名义》中赵处长被查”，服务器能对该语音进行识别，并提取出“电视剧”、“**的民义”、“赵处长被查”的特征。

步骤S30，将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。

本申请服务器中预设有海量音频数据，并对所有的音频数据进行语音识别标记，生成相应的场景标签，服务器能将音频数据中不同的场景生成不同的场景标签，该场景标签包含视频类型、名称、场景描述、人物、时间、集数等相关信息。场景标签可以在对应场景音频信息的开头、结尾或高潮位置，本案优选在对应场景音频信息的开始位置。

需要说明的是，除上述实施方式外，服务器能根据音频数据库中的海量音频数据从电视机或网络中获取与之对应的视频片段或字幕信息，然后对视频片段或字幕信息进行智能分析，在音频数据的对应位置生成场景标签。

本实施例中，用户意图是要跳转视频播放终端跳转到对应视频对应的时间段，如视频播放终端当前正在播放电视剧《**的民义》，此刻用户录入语音命令为“电视剧《**的名义》中赵处长被查”，服务器首先会判断用户语音信息提取音频数据库中与电视剧《**的名义》有关的所有音频信息。

根据用户语音信息特征中包含的用户要跳转的场景信息，将用户要跳转的场景信息与所述音频数据中的各个场景标签匹配，找出匹配度最高的场景标签，如用户录入语音命令为“电视剧《**的名义》中赵处长被查”，则在音频数据库中找到对应的音频数据中所有场景标签，如赵处长被抓、陈岩石对抗挖掘机、侯亮平与祁同伟唱《智斗》、欧阳菁被抓等，找出与“赵处长被抓”相匹配的场景标签。

步骤S40，将所述与语音信息特征匹配的场景标签发送至视频播放终端，以控制视频播放终端上播放的视频跳转至相应位置。

服务器获取到与语音信息特征匹配的场景标签后，将其发送至视频播放终端，以使视频播放终端根据该场景标签跳转至相应位置。

需要说明的是，除上述实施方式外，服务器可以根据所述与语音信息特征匹配的场景标签，生成一个跳转指令，该跳转指令包含场景标签位置信息，以使视频播放终端能根据该跳转指令跳转至相应位置。

在本实施例中服务器接收视频播放终端采集的用户语音信息和当前播放视频的名称信息，并对所述用户语音信息进行语音识别和语义识别，提取出所述语音信息的特征，再根据所述当前播放视频的名称信息，确认音频数据库中包含当前播放视频对应的音频数据，将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，再将所述与语音信息特征匹配的场景标签发送至视频播放终端，以控制视频播放终端上播放的视频跳转至相应位置。本申请通过服务器的语音识别功能识别出用户语音信息特征，并根据用户语音特征匹配出与用户语音命令相符的场景标签，以使视频播放终端实现视频跳转，且能准确地跳转至用户想要的场景中，从而提高了用户的体验性。

进一步的，请参照图3，本申请第二实施例提供一种视频播放跳转方法，基于上述图2所示的实施例，在步骤S30将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤之前，包括：

步骤S50，判断所述语音信息特征中是否包括跳转视频名称。

为提高查询结果的准确性，本实施例在进行标签的匹配前，还判断所述语音信息特征中是否包括跳转视频名称，若所述语音信息特征中不包括跳转视频名称，则执行步骤S60，获取当前播放视频的名称。

本实施例中，用户录入的语音命令中没有要跳转的视频名称，本领域技术人员可以理解为用户要跳转的对象为视频播放终端当前正在播放的视频，此时服务器向播放终端获取当前播放视频的名称。步骤S30则替换为：步骤S31：将所述语音信息特征和当前播放视频的名称与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。

在获取到视频名称后，则根据用户的语音和当前播放视频的名称与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，如视频播放终端当前正在播放电视剧《**的民义》，服务器向视频播放终端采集当前播放的视频，然后根据用户录入语音命令为“电视剧《**的名义》中赵处长被查”，服务器首先会判断用户语音信息提取音频数据库中与电视剧《**的名义》有关的所有音频信息，再根据语音信息中特征在与电视剧《**的名义》有关的所有音频信息中，这样先根据视频名称进行匹配的速度更快，结果也更加准确。另外如用户录入语音为“跳至大结局”，将提取“大结局”的特征，并对当前正在播放的视频跳至最后一集开始位置。

当然若所述语音信息特征中不包括跳转视频名称，也可以不获取当前播放视频的名称，直接采用语音信息特征在预设音频数据进行标签匹配，这种方式需要查询的音频数据较多，导致查询速度会较慢。

若所述语音信息特征中包括跳转视频名称，则执行步骤S30，将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。

此时服务器的执行过程与步骤S31相同，区别在于视频名称一种在用户语音信息中，一种由服务器向视频播放终端获得。

此外如果用户录入的语音为“一部爱情片”、“热播的动作片”、“香港导演的电影”、“好莱坞大片”等不包含具体电视剧或电影名称信息时，则需要服务器在语音数据库中自行匹配，可以基于用户的性别、爱好、平时的点播倾向等特征来进行智能分析，选择出适合用户的视频，以使视频播放终端跳转至该视频。用户还可以进行其他指令，如用户录入的语音为“前进30分钟”，将提取“前进”、“30分钟”的特征，对当前正在播放的视频跳转至前进30分钟的位置。

本申请通过服务器判断用户语音信息特征中有无跳转视频名称，从而实现对当前播放视频进行跳转、切换视频播放至其他视频名称或切换视频播放至其他视频名称相应场景，更能符合大众要求。

进一步的，所述步骤S30将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，包括：

步骤S32，判断预设音频数据中是否包括当前播放视频对应的音频数据；

若预设音频数据中没有当前播放视频对应的音频数据，则执行步骤S31，并执行步骤S34。

步骤S33，向视频播放终端发送请求指令。

步骤S34，接收视频播放终端发送的当前播放视频对应的音频数据，将所述音频数据保存到音频数据库。

如音频数据库中没有视频播放终端当前播放视频对应的音频数据，则服务器向视频播放终端发送请求指令，该请求指令要求视频播放终端发送当前播放视频对应的音频数据，服务器接收到视频播放终端发送的音频数据后，请其保存至音频数据库。这样使得音频数据库中的音频数据更丰富、更完整，同时也便于当用户要跳转的视频对象为当前的播放视频时，能及时匹配到用户需要的场景标签。

进一步的，请参照图4，本申请第三实施例提供一种视频播放跳转方法，基于上述图2所示的实施例，在步骤S30将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签之后，还包括：

步骤S70，若在预设时间内未匹配出符合所述语音信息特征的场景标签，则生成匹配失败提示；

步骤S80，将匹配失败提示发送至视频播放终端，以使视频播放终端显示提示信息。

将所述语音信息特征与音频数据库中不同的场景标签进行匹配，若音频数据库中没有用户要跳转的视频对象，则直接结束匹配；如音频数据库中有用户要跳转的视频对象，则识别出音频数据库中用户要跳转的视频名称对应的音频信息，获得所述音频信息对应的各个场景标签，并与各个场景标签匹配。若在预设时间内未匹配出符合所述语音信息特征的场景标签，则结束匹配。结束匹配后，生成匹配失败提示，并发送至视频播放终端。视频播放终端接收到匹配失败提示信息，可以在视频播放界面直接显示出来，也可以通过终端上的用户提示控件如Toast、Snackbar等提示信息。当然，匹配结果出了匹配失败提示外，也可以根据所述语音信息特征给用户推荐音频数据库中更贴近用于意图的其他视频信息。如果用户录入的语音为“一部爱情片”、“热播的动作片”、“香港导演的电影”、“好莱坞大片”等时，服务器在语音数据库中自行匹配，可以基于用户的性别、爱好、平时的点播倾向等特征来进行智能分析，选择出适合用户的视频，以使视频播放终端跳转至该视频。

参照图5，本申请第四实施例提供一种视频播放跳转方法，包括以下步骤：

步骤S110，采集用户输入的语音信息。

在本实施例中，视频播放终端既可以包含视频播放模块和语音采集模块；也可以只包含视频播放模块，再外接语音采集模块，如麦克风。手机、电视机、电脑等都可作为视频播放终端，本实施例中以手机作为视频播放终端，通过手机的麦克风采集用户的语音信息，并在手机中安装有视频播放应用程序，可以由视频播放应用程序播放用户想要观看的视频。

步骤S120，将所述用户语音信息发送至服务器，以使服务器将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。

通过手机将用户语音信息发送给服务器，语音信息中可包括场景关键字(例如“X跳诛仙台”)，还可同时包括剧名关键字和场景关键字(例如“剧名A情节B”)，以使服务器能直接从语音信息中解析出用户意图要跳转的视频对象和场景信息，同时以使服务器根据手机发送的当前播放视频的名称信息，判断音频数据库中是否有当前播放视频对应的音频数据，如无，则执行以下步骤：

步骤S121，接收到服务器发送的音频数据请求指令。

步骤S122，发送当前播放视频对应的音频数据至服务器。

手机接收到服务器发送的音频数据请求指令后，从后台调取当前播放视频对应的音频数据，将其打包，上传至服务器，以使服务器的音频数据库中有当前播放视频对应的音频数据。

步骤S130，接收所述与语音信息特征匹配的场景标签，将视频播放终端上播放的视频跳转至相应位置。

手机实时接收服务器发送的匹配结果，如该匹配结果为与语音信息特征匹配的场景标签，则根据该场景标签中包含的位置信息对视频播放应用程序执行跳转。若服务器未匹配出符合所述语音信息特征的场景标签，手机接收到的是匹配失败提示，则在手机屏幕上显示文本信息，以提示用户。

在本实施例中视频播放终端通过麦克风采集用户输入的语音信息，并获取后台中当前播放视频的名称信息，将所述用户语音信息和当前播放视频的名称信息发送至服务器，以使服务器将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，接收所述与语音信息特征匹配的场景标签，将视频播放终端上播放的视频跳转至相应位置。本申请使得用户直接发送语音命令就可以实现视频跳转，并跳转到想要观看的视频场景中，从而提高用户体验性。

参照图6，本申请为一种视频播放跳转系统第一实施例示意图，所述视频播放跳转系统包括：视频播放终端和服务器，

所述视频播放终端采集用户输入的语音信息，并将所述用户语音信息发送至服务器；

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有视频播放跳转程序，所述视频播放跳转程序被视频播放终端和服务器执行时实现如下操作：

接收视频播放终端采集的用户语音信息；

进一步地，在所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤之前，包括：

判断所述语音信息特征中是否包括跳转视频名称；

进一步地，在所述判断所述语音信息特征中是否包括跳转视频名称的步骤之后，包括：

进一步地，所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤，包括：

进一步地，在所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤之后，还包括：

所述计算机可读存储介质上存储有视频播放跳转程序，所述视频播放跳转程序被视频播放终端和服务器执行时还实现如下操作：

采集用户输入的语音信息；

进一步地，在所述将所述用户语音信息和当前播放视频的名称信息发送至服务器步骤之后，还包括：

接收到服务器发送的音频数据请求指令；

发送当前播放视频对应的音频数据至服务器。

本申请计算机可读存储介质的具体实施例与上述视频跳转方法各实施例基本相同，在此不作赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台视频播放终端(可以是手机，计算机，电视机或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种视频播放跳转方法，其中，包括以下步骤：

接收视频播放终端采集的用户语音信息；

对所述用户语音信息进行识别，提取出所述语音信息的特征；

将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签；

将所述与语音信息特征匹配的场景标签发送至视频播放终端，以控制视频播放终端上播放的视频跳转至相应位置。
如权利要求1所述的视频播放跳转方法，其中，在所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤之前，包括：

判断所述语音信息特征中是否包括跳转视频名称；

若所述语音信息特征中不包括跳转视频名称，则获取当前播放视频的名称；

所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤包括：

将所述语音信息特征和当前播放视频的名称与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。
如权利要求2所述的视频播放跳转方法，其中，在所述判断所述语音信息特征中是否包括跳转视频名称的步骤之后，包括：

若所述语音信息特征中包括跳转视频名称，则执行步骤：将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。
如权利要求1所述的视频播放跳转方法，其中，所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤，包括：

判断预设音频数据中是否包括当前播放视频对应的音频数据；

若预设音频数据中没有当前播放视频对应的音频数据，则向视频播放终端发送请求指令；

接收视频播放终端发送的当前播放视频对应的音频数据，将所述音频数据保存到预设音频数据。
如权利要求1所述的视频播放跳转方法，其中，在所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤之后，还包括：

若在预设时间内未匹配出符合所述语音信息特征的场景标签，则生成匹配失败提示；

将匹配失败提示发送至视频播放终端，以使视频播放终端显示提示信息。
一种视频播放跳转方法，其中，包括以下步骤：

采集用户输入的语音信息；

将所述用户语音信息发送至服务器，以使服务器将所述语音信息特征与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签；

接收所述与语音信息特征匹配的场景标签，将视频播放终端上播放的视频跳转至相应位置。
如权利要求6所述的视频播放跳转方法，其中，在所述将所述用户语音信息发送至服务器步骤之后，还包括：

接收到服务器发送的音频数据请求指令；

发送当前播放视频对应的音频数据至服务器。
如权利要求6所述的视频播放跳转方法，其中，在所述将所述用户语音信息发送至服务器步骤之后，还包括：

若服务器在预设时间内未匹配出符合所述语音信息特征的场景标签，则接收匹配失败提示，并在视频终端界面中显示，以提示用户。
一种视频播放跳转系统，其中，所述视频播放跳转系统包括：视频播放终端和服务器，

所述视频播放终端采集用户输入的语音信息，并将所述用户语音信息发送至服务器；

所述服务器接收视频播放终端采集的用户语音信息，对所述语音信息进行识别，提取出所述语音信息的特征，将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，将所述与语音信息特征匹配的场景标签发送至视频播放终端；

所述视频播放终端接收所述与语音信息特征匹配的场景标签，将视频播放终端上播放的视频跳转至相应位置。
如权利要求9所述的视频播放跳转系统，其中，所述服务器判断所述语音信息特征中是否包括跳转视频名称；

若所述语音信息特征中不包括跳转视频名称，则所述服务器获取当前播放视频的名称；

所述将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤包括：

将所述语音信息特征和当前播放视频的名称与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。
如权利要求9所述的视频播放跳转系统，其中，

若所述语音信息特征中包括跳转视频名称，则执行步骤：所述服务器将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。
如权利要求9所述的视频播放跳转系统，其中，所述服务器判断预设音频数据中是否包括当前播放视频对应的音频数据；

若预设音频数据中没有当前播放视频对应的音频数据，则所述服务器向视频播放终端发送请求指令；

所述服务器接收视频播放终端发送的当前播放视频对应的音频数据，将所述音频数据保存到预设音频数据。
一种计算机可读存储介质，其上存储有计算机程序，其中，该计算机程序被视频播放终端和服务器执行时实现如下步骤：

所述视频播放终端采集用户输入的语音信息，并将所述用户语音信息发送至服务器；

所述服务器接收视频播放终端采集的用户语音信息，对所述语音信息进行识别，提取出所述语音信息的特征，将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签，将所述与语音信息特征匹配的场景标签发送至视频播放终端；

所述视频播放终端接收所述与语音信息特征匹配的场景标签，将视频播放终端上播放的视频跳转至相应位置。
如权利要求13所述的计算机可读存储介质，其中，该计算机程序被视频播放终端和服务器执行时还实现如下步骤：

若所述语音信息特征中不包括跳转视频名称，则所述服务器获取当前播放视频的名称；

所述服务器将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签的步骤包括：

所述服务器将所述语音信息特征和当前播放视频的名称与所述音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。
如权利要求13所述的计算机可读存储介质，其中，该计算机程序被视频播放终端和服务器执行时还实现如下步骤：

若所述语音信息特征中包括跳转视频名称，则执行步骤：所述服务器将所述语音信息特征与预设音频数据中不同的场景标签进行匹配，获取与语音信息特征匹配的场景标签。
如权利要求13所述的计算机可读存储介质，其中，该计算机程序被视频播放终端和服务器执行时还实现如下步骤：

所述服务器判断预设音频数据中是否包括当前播放视频对应的音频数据；

若预设音频数据中没有当前播放视频对应的音频数据，则所述服务器向视频播放终端发送请求指令；

所述服务器接收视频播放终端发送的当前播放视频对应的音频数据，将所述音频数据保存到预设音频数据。