WO2022022075A1

WO2022022075A1 - 视频及直播处理方法、直播系统、电子设备、终端、介质

Info

Publication number: WO2022022075A1
Application number: PCT/CN2021/098901
Authority: WO
Inventors: 周丽佳; 王志东; 孙秀茹; 郭萌; 唐浩
Original assignee: 京东方科技集团股份有限公司
Priority date: 2020-07-30
Filing date: 2021-06-08
Publication date: 2022-02-03
Also published as: US11956510B2; CN114095738A; US20220345783A1

Abstract

本公开提供一种视频处理方法，包括：根据咨询信息确定与所述咨询信息对应的目标短视频；将所述目标短视频推送至发送所述咨询信息的终端。本公开还提供一种直播处理方法、一种电子设备、一种直播系统、一种终端、一种计算机可读存储介质。所述视频处理方法能够提高直播过程中的用户体验。

Description

视频及直播处理方法、直播系统、电子设备、终端、介质

本申请要求享有2020年7月30日提交的、申请号为202010753323.3、发明名称为“视频及直播处理方法、直播系统、电子设备、终端、介质”的中国发明专利申请的优先权。

技术领域

本公开涉及视频处理领域，具体地，涉及一种视频处理方法、一种直播处理方法、一种电子设备、一种直播系统、一种终端、一种计算机可读存储介质。

背景技术

随着计算机、视频处理、通信技术的发展，信息技术也影响到人们的日常生活。例如，人们日常中的购物已经从实体店购物发展为电商平台购物，又由电商平台购物发展为直播平台带货购物。与传统的图文广告相比，直播带货不仅保障强互动性和实时反馈性，还缩短了消费者的决策时间，提升购物效率。

直播过程中，主播除了采用具有个人特色的方式展示商品之外，还需要与消费者保持亲密互动，借此来提升消费者的购买欲。在直播间在线人数过多时，主播难以回答每一位消费者的问题，这样有可能导致问题没有得到解决的消费者退出直播间。

因此，如何回答每一位消费者的提问成为本领域亟待解决的技术问题。

发明内容

本公开的目的在于提供一种视频处理方法、一种直播处理方法、一种电子设备、一种终端、一种计算机可读存储介质。

作为本公开的第一个方面，提供一种视频处理方法，包括：

根据咨询信息确定与所述咨询信息对应的目标短视频；

将所述目标短视频推送至发送所述咨询信息的终端。

可选地，根据咨询信息确定与所述咨询信息对应的目标短视频包括：

提取所述咨询信息的关键词；

将提取到的关键词与已存储的多个短视频的特征信息进行匹配；

将特征信息与所述关键词匹配的短视频作为所述目标短视频。

可选地，提取所述咨询信息的关键词的步骤包括：

对接收到的所有咨询信息进行分类；

提取各类咨询信息的关键词；

其中，在将所述目标短视频推送至发送所述咨询信息的终端的步骤中，向发送类别相同的咨询信息的终端发送的目标视频相同。

可选地，在根据咨询信息确定与所述咨询信息对应的目标短视频的步骤之前，所述视频处理方法还包括：

根据预设的所述特征信息从已经播出的视频流中提取短视频并存储所述短视频。

可选地，根据预设的所述特征信息从已经播出的视频流中提取短视频并存储所述短视频包括：

对视频流进行语音识别；

根据语音识别结果与预设的所述特征信息进行对比，并将确定各个特征信息在所述视频流中对应的时间段；

将各个特征在所述视频流中对应的时间段存储为相应的短视频。

可选地，当已存储的多个短视频的特征信息均不能够与提取到的关键词匹配时，所述视频处理方法还包括：

对已播出的视频流进行语音识别；

根据语音识别结果与提取到的所述关键词进行对比；

当所述语音识别结果中存在与所述关键词匹配的词语时，将该词语在所述视频流中对应的时间段作为所述目标短视频。

可选地，所述视频处理方法还包括：

当所述语音识别结果中不存在与所述关键词匹配的词语时，生成提示信息。

可选地，生成提示信息的步骤包括：

在进行直播的设备的屏幕上显示所述咨询信息。

作为本公开的第二个方面，提供一种直播处理方法，包括：

通过直播程序发送咨询信息；

响应于与所述咨询信息对应的短视频播放信息，播放相应的目标短视频；

响应于直播返回信息，返回直播程序。

可选地，所述直播处理方法还包括：

响应于短视频播放信息，控制所述直播程序进入后台运行状态。

作为本公开的第三个方面，提供一种电子设备，所述电子设备包括：

第一存储模块，其上存储有第一可执行程序；

一个或多个第一处理器，所述一个或多个第一处理器能够调用所述第一可执行程序，以使得所述一个或多个第一处理器实现根据本公开第一个方面所提供的视频处理方法。

作为本公开的第四个方面，提供一种直播系统，所述直播系统包括：

图像采集装置，所述图像采集装置用于采集视频信息；

本公开第三个方面所提供的电子设备。

作为本公开的第五个方面，提供一种终端，包括：

第二存储模块，其上存储有第二可执行程序；

一个或多个第二处理器，所述一个或多个第二处理器能够调用所述第二可执行程序，以使得所述一个或多个第二处理器实现根据本公开第二个方面所提供的直播处理方法。

作为本公开的第六个方面，提供一种计算机可读存储介质，其上存储有可执行程序，当所述可执行程序被调用时，能够实现根据本公开第一个方面所提供的视频处理方法或者根据本公开第二个方面所提供的直播处理方法。

附图说明

附图是用来提供对本发明的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明，但并不构成对本发明的限制。在附图中：

图1是本公开所提供的视频处理方法的一种实施方式的流程示意图；

图2是本公开所提供的视频处理方法的第二种实施方式的流程示意图；

图3是步骤S111的一种实施方式的流程图；

图4是步骤S105的一种实施方式的流程图；

图5是本公开所提供的直播处理方法的一种实施方式的流程图；

图6是本公开所提供的直播处理方法的另一种实施方式的流程图；

图7是本公开所提供给的直播系统的工作流程图。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

作为本公开的一个方面，提供一种视频处理方法，如图1所示，所述视频处理方法包括：

在步骤S110中，根据咨询信息确定与所述咨询信息对应的目标短视频；

在步骤S120中，将所述目标短视频推送至发送所述咨询信息的终端。

本公开所提供的视频处理方法由主播侧的电子设备所执行，需要指出的是，所述咨询信息为消费者通过自己的终端输入、并通过通信网络传输至主播侧的电子设备。

“所述目标短视频与所述咨询信息对应”可以是指，短视频中的内容可以回复所述咨询信息中所涉及的问题。

例如，所述咨询信息可以为咨询折扣的信息，所述目标短视频可以为介绍商品折扣的短视频。

在本公开中，通过向终端推送与咨询信息相对应的目标短视频来回应消费者的咨询，从而可以避免主播因咨询信息过多、无法对所有咨询信息一一解答的问题，增强了消费者在直播时的互动性，提高了消费者的直播体验。

在本公开中对如何获得所述短视频并不做特殊的限定，例如，可以在直播开始时，对直播产生的视频流进行存储，并在存储的视频流中截取多段短视频，也可以是主播预先录制好的对商品进行讲解的短视频。

通常，主播在进行直播时会反复介绍商品信息、以及折扣信息，从直播产生的视频流中截取短视频可以减小主播以及工作人员的工作量，并降低人工成本。相应地，如图2所示，在步骤S110之前，所述视频处理方法还可以包括：

在步骤S100中，存储直播时产生的视频流。

相应地，所述目标短视频截取自所述视频流。

在本公开中，对如何执行步骤S110步骤特殊的限定，作为一种可选实施方式，如图2所示，步骤S110可以包括：

在步骤S111中，提取所述咨询信息的关键词；

在步骤S112中，将提取到的关键词与已存储的多个短视频的特征信息进行匹配；

在步骤S113中，将特征信息与所述关键词匹配的短视频作为所述目标短视频。

通常，消费者输入的咨询信息中包含很多无用的语气词，在步骤S111中所涉及到的“关键词”则是咨询信息中的有用信息。

如上文中所示，多个所述短视频是“已存储的”，意思是，在提取咨询信息的关键词之前，已经在主播侧的电子设备中存储了多个短视频。在存储短视频时，可以利用特征信息对短视频进行标记。例如，涉及商品折扣的短视频的特征信息为“折扣”，因此，可以利用“折扣”对该视频进行标记。涉及商品参数的特征信息为该商品的特征参数。例如，当商品为口红时，相应的特征参数为“色号”，可以利用具体的色号来对商品进行标记。需要指出的是，同一段短视频可以对应多个不同的特征信息。例如，同一段短视频中包括了某一色号口红的打折信息，可以利用口红色号以及打折信息作为特征信息来标记同一段短视频。

例如，消费者输入的咨询信息可能是，“折扣是多少啊？”其中的关键词为“折扣”，其余均为语气词。

在步骤S112中，可以将提取到的“折扣”去与多个短视频的特征信息进行匹配，并在步骤S113中将特征信息包括“折扣”的短视频作为所述目标短视频，推送给消费者的终端。

又例如，消费者输入的咨询信息可能是，“105的折扣是多少啊？”，其中关键词为“105+折扣”，其余均为语气词。在步骤S112中，可以将提取到的“105”、“折扣”与多个短视频特征进行匹配，并在步骤S113中将特征信息同时包括“105”和“折扣”的短视频作为所述目标短视频，推送给消费者的终端。

需要指出的是，关键词长度越长、则匹配精度越高。例如，在一场直播中推销多种型号的商品时，每种型号的商品都有相应的折扣信息，并且，不同型号的商品折扣信息也可能不同。例如，型号105的商品的折扣与型号106的折扣不同。消费者提问时，问题也是自己关注的型号的折扣信息。因此，消费者发出的咨询信息中通常是同时包括型号和折扣的。在从咨询信息中提取关键词时，也要包括商品型号、以及问题(该问题可以为，折扣)。

在观看直播时，消费者关注的信息基本类似。例如，大部分消费者关注的信息多为折扣信息、商品型号、购买方式等几大类。为了快速地对消费者的咨询作出反馈，可选地，如图3所示，步骤S111可以包括：

在步骤S111a中，对接收到的所有咨询信息进行分类；

在步骤S111b中，提取各类咨询信息的关键词。

相应地，在步骤S120中，向发送类别相同的咨询信息的终端发送的目标视频相同。

在本公开中，对如何执行步骤S111a不做特殊的限定。例如，消费者发送的咨询信息多为文字。在接收到各个消费者的咨询信息后，将文字内容重合度达到80％的信息归为同一类。当然，本公开并不对重合度的阈值做特殊的限定，所述阈值可以是80％，也可以是90％，只要取自70％至99％即可。所述阈值越高、则分类越精细，越能够针对性地回答消费者提出的问题。

通过对咨询信息进行分类，可以提高向各个消费者推送目标短视频的效率，有利于实时解决消费者的问题，提高消费者的互动体验，并提高商品售出的概率。

可选地，咨询信息的分类可以包括询问折扣、进行打赏、询问商品信息等。

如上文中所述，所述目标短视频截取自直播时产生的视频流。相应地，在根据咨询信息确定与所述咨询信息对应的目标短视频的步骤之前，如图2所示，所述视频处理方法还包括：

在步骤S105中，根据预设的所述特征信息从已经播出的视频流中提取短视频。

在本公开中，对如何执行步骤S105不做特殊的限定。例如，可以在直播开始前给主播提供台本，要求主播在某些特定的时间段说出所需要的信息。例如，在直播开始的前五分钟介绍商品参数、以及折扣信息。每隔20分钟介绍一次商品特征以及折扣信息等，然后在存储了直播产生的视频流之后，在约定好的时间截取短视频、然后利用所述特征信息标记所述短视频即可。

在本公开中，对如何预设所述特征信息不做特殊的限定。作为一种可选实施方式，可以根据大数据、以及以往的直播记录来确定咨询频率高(例如，可以将该频率设定为每分钟10次)的问题，并根据咨询频率高的问题设定所述“特征信息”。当直播视频流中出现上述“特征信息”即可截取短视频，并存储所述短视频。在消费者发出咨询信息时，直接利用咨询信息中的关键字进行匹配即可。

众所周知的是，很多主播个人特色明显，设置台本会对主播造成限制。因此，很多主播在直播时并没有台本。相应地，如图4所示，步骤S105可以包括：

在步骤S105a中，对视频流进行语音识别；

在步骤S105b中，根据语音识别结果与预设的所述特征信息进行对比，并将确定各个特征信息在所述视频流中对应的部分；

在步骤S105c中，将各个特征在所述视频流中对应的部分存储为相应的短视频。

作为一种可选实施方式，步骤S105b可以被具体执行为“确定各个特征信息在所述视频流中对应的部分的开始时间和结束时间”。在所述视频流中截取所述开始时间、和所述结束时间之间的部分，即可获得与各个特征在视频流中对应的部分。

上文中所述的预先存储的短视频中存在目标视频的情况。当预先存储的短视频中不存在与关键词匹配的目标视频时，如图2所示，所述视频处理方法还可以包括：

在步骤S130中，对已播出的视频流进行语音识别；

在步骤S140中，根据语音识别结果与提取到的所述关键词进行对比；

在步骤S150中，当所述语音识别结果中存在与所述关键词匹配的词语时，将该词语在所述视频流中对应的部分作为所述目标短视频；

在步骤S160中，以所述词语作为特征信息标记所述词语在所述视频流中对应的部分，并存储标记后的短视频。

在本公开中，步骤S150可以被具体执行为“确定该词语在所述视频流中对应的开始时间和结束时间，并将开始时间和结束时间之间的部分作为所述目标短视频”。步骤S160可以被具体执行为“以所述词语作为特征信息标记所述词语在所述视频流中对应的开始时间和结束时间之间对应的短视频，并存储标记后的短视频”。

如果将已存储的短视频作为素材的话，步骤S160相当于对素材库进行补充。

当然，如果经历过步骤S130至步骤S140后，仍然无法得到所述目标短视频时，则需要主播直接进行解答。

相应地，如图2所示，所述处理方法还可以包括：

在步骤S170中，当所述语音识别结果中不存在与所述关键词匹配的词语时，生成提示信息。

通过步骤S110至步骤S160可以降低执行步骤S170的几率，减少主播的工作量，以利于主播更好地介绍商品。

所述提示信息的作用在于提醒主播或者其他工作人员对所述咨询信息进行解答。在本公开中，对提示信息的具体形式不做特殊的限定。例如，生成提示信息的步骤可以包括：

在进行直播的设备的屏幕上显示所述咨询信息。

作为一种可选实施方式，进行直播的设备的屏幕上只显示无法自动匹配到目标视频的咨询信息。

作为另一种可选实施方式，进行直播的设备的屏幕上显示所有咨询信息，但是，无法自动匹配到目标视频的咨询信息与可以自动匹配到目标视频的咨询信息颜色不同或者字体不同，以便主播及时识别出相应的咨询信息。当然，也可以在无法自动匹配到目标视频的咨询信息上添加其他标识信息，以便于主播及时识别并解答。

本公开所提供的视频处理方法除了包括对咨询信息进行处理之外，还可以包括：

对图像采集装置采集到的初始视频进行处理，以获得直播视频流。

对初始视频进行的处理可以包括对初始视频进行过滤、美颜、图像增强、音频降噪等处理中的至少一者，以提高直播视频流的播出效果。

获得所述直播视频流后，将所述视频流推送至各个客户端。

作为本公开的第二个方面，提供一种直播处理方法，如图5所示，所述直播处理方法可以包括：

在步骤S210中，通过直播程序发送咨询信息；

在步骤S220中，响应于与所述咨询信息对应的短视频播放信息，播放相应的目标短视频；

在步骤S230中，响应于直播返回信息，返回直播程序。

本公开所提供的直播处理方法由用户终端所执行。在播放短视频时，可以将直播程序设置为后台运行，也可以直接退出直播程序。

在本公开中，对直播返回信息的具体类型不做特殊的限定。例如，所述直播返回信息可以是短视频播放完毕后的的结束信息，也可以是消费者通过终端关闭短视频时产生的结束信息。

停止播放目标短视频后，即刻返回直播程序，以便于消费者继续观看直播。

为了便于消费者可以快速地重返直播间，可选地，如图6所示，所述直播处理方法还包括：

在步骤S240中，响应于短视频播放信息，控制所述直播程序进入后台运行状态。

第一存储模块，其上存储有第一可执行程序；

所述电子设备设置在主播侧，用于对直播产生的视频流进行处理。如上文中所述，在本公开中，通过向终端推送与咨询信息相对应的目标短视频来回应消费者的咨询，从而可以避免主播因咨询信息过多、无法对所有咨询信息一一解答的问题，增强了消费者在直播时的互动性，提高了消费者的直播体验。

所述电子设备还可以包括一个或多个I/O第一接口，连接在所述第一处理器与第一存储模块之间，配置为实现所述第一处理器与第一存储模块的信息交互。

第一处理器为具有数据处理能力的器件，其包括但不限于中央处理器(CPU)等；第一存储模块为具有数据存储能力的器件，其包括但不限于随机存取存储器(RAM，更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)。

第一I/O接口连接在第一处理器与第一存储模块间，能实现第一处理器与第一存储模块的信息交互，其包括但不限于数据总线(Bus)等。

在一些实施例中，第一处理器、第一存储模块和第一I/O接口通过总线相互连接，进而与显示终端的其它组件连接。

图像采集装置，所述图像采集装置用于采集视频信息；

本公开所提供的上述电子设备。

在本公开中，所述图像采集装置可以外接于所述电子设备，所述电子设备所采集到的视频信息即为用于直播的初始视频流。也是电子设备进行处理的视频素材。

在本公开中，图像采集装置可以是专业的摄像机，也可以是摄像头。当所述图像采集为摄像头时，所述图像采集装置可以集成在所述电子设备上。相应地，所述电子设备还可以包括显示面板，用于显示直播视频流、以及消费者的咨询信息。

作为一种可选实施方式，图像采集装置包括主摄像装置和辅助摄像装置，主摄像装置用于采集主播正面视频图像，辅助摄像装置用于全方位采集直播过程中的其他方位的视屏图像，可以采用多角度分布多个摄像头实现360°全方位视频图像采集，也可以采用移动视频机器人的方式，在主播直播过程中，移动视频机器人在不干扰主播的情况下自行移动实现全方位的视频图像采集；本公开优选采用移动视频机器人的方式，若主播的直播方式以坐为主，移动范围不大，移动视频机器人可按照提前设定的路劲移动完成360°全方位视频图像采集；若主播的直播方过程中有较大移动范围(比如服装直播)，则视频移动机器人的移动方式可以主播为参考中心，自动进行循环往复环绕式移动，进而实现360°全方位视频图像采集。

下面结合图7对本公开所提供的直播系统的进行直播的过程进行简单介绍。整个直播流程如下：

图像采集装置对主播的直播过程进行图像采集，获得初始视频流；

电子设备对初始视频流进行过滤、美颜、图像增强、音频降噪等处理，获得直播视频流；

将直播视频流推送给用户终端；

将直播视频流推送给用户终端的同时，对直播视频流进行存储；

根据预先设定的特征信息对直播视频流进行分割和截取，形成多个短视频；

消费者通过用户终端上安装的直播程序发出咨询信息；

电子设备对接收到的咨询信息进行分类；

对分类后获得的各类咨询信息分别提取关键词；

利用所述关键词与已存储的短视频的特征信息进行匹配(判断关键词与特征信息的相似性)；

将与特征信息与关键词匹配的信息作为目标短视频推送给相应的终端；

若已存储的短视频中不存在目标短视频，则利用关键词与视频流中识别的语音信息进行匹配；

当视频流的语音信息中存在与所述关键词相匹配的部分时，将该部分对应的视频流部分存储为目标短视频，并推送给用户终端；

当视频流的的语音信息中不存在与所述关键词相匹配的部分，将咨询信息推送至主播端的显示装置。

作为本公开的第五个方面，提供一种终端，包括：

第二存储模块，其上存储有第二可执行程序；

一个或多个第二处理器，所述一个或多个第二处理器能够调用所述第二可执行程序，以使得所述一个或多个第二处理器实现本公开第二个方面所提供的直播处理方法。

在本公开中，所述终端为消费者所使用的终端。通过所述终端可以发送观看直播、发送咨询信息、以及播放与所述咨询信息对应的目标短视频。

所述终端还可以包括一个或多个I/O第二接口，连接在所述第二处理器与第二存储模块之间，配置为实现所述第二处理器与第二存储模块的信息交互。

第二处理器为具有数据处理能力的器件，其包括但不限于中央处理器(CPU)等；第一存储模块为具有数据存储能力的器件，其包括但不限于随机存取存储器(RAM，更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)。

第二I/O接口连接在第二处理器与第二存储模块间，能实现第二处理器与第二存储模块的信息交互，其包括但不限于数据总线(Bus)等。

在一些实施例中，第二处理器、第二存储模块和第二I/O接口通过总线相互连接，进而与显示终端的其它组件连接。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据，并且可包括任何信息递送介质。

可以理解的是，以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式，然而本公开并不局限于此。对于本领域内的普通技术人员而言，在不脱离本公开的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本公开的保护范围。

Claims

一种视频处理方法，包括：

根据咨询信息确定与所述咨询信息对应的目标短视频；

将所述目标短视频推送至发送所述咨询信息的终端。
根据权利要求1所述的视频处理方法，其中，根据咨询信息确定与所述咨询信息对应的目标短视频包括：

提取所述咨询信息的关键词；

将提取到的关键词与已存储的多个短视频的特征信息进行匹配；

将特征信息与所述关键词匹配的短视频作为所述目标短视频。
根据权利要求2所述的视频处理方法，其中，提取所述咨询信息的关键词的步骤包括：

对接收到的所有咨询信息进行分类；

提取各类咨询信息的关键词；

其中，在将所述目标短视频推送至发送所述咨询信息的终端的步骤中，向发送类别相同的咨询信息的终端发送的目标视频相同。
根据权利要求2所述的视频处理方法，其中，在根据咨询信息确定与所述咨询信息对应的目标短视频的步骤之前，所述视频处理方法还包括：

根据预设的所述特征信息从已经播出的视频流中提取短视频并存储所述短视频。
根据权利要求4所述的视频处理方法，其中，根据预设的所述特征信息从已经播出的视频流中提取短视频并存储所述短视频包括：

对视频流进行语音识别；

根据语音识别结果与预设的所述特征信息进行对比，并将确定各个特征信息在所述视频流中对应的部分；

将各个特征在所述视频流中对应的部分存储为相应的短视频。
根据权利要求2至5中任意一项所述的视频处理方法，其中，当已存储的多个短视频的特征信息均不能够与提取到的关键词匹配时，所述视频处理方法还包括：

对已播出的视频流进行语音识别；

根据语音识别结果与提取到的所述关键词进行对比；

当所述语音识别结果中存在与所述关键词匹配的词语时，将该词语在所述视频流中对应的部分作为所述目标短视频；

以所述词语作为特征信息标记所述词语在所述视频流中对应的部分，并存储标记后的短视频。
根据权利要求6所述的视频处理方法，其中，所述视频处理方法还包括：

当所述语音识别结果中不存在与所述关键词匹配的词语时，生成提示信息。
根据权利要求7所述的视频处理方法，其中，生成提示信息的步骤包括：

在进行直播的设备的屏幕上显示所述咨询信息。
一种直播处理方法，包括：

通过直播程序发送咨询信息；

响应于与所述咨询信息对应的短视频播放信息，播放相应的目标短视频；

响应于直播返回信息，返回直播程序。
根据权利要求9所述的直播处理方法，其中，所述直播处理方法还包括：

响应于短视频播放信息，控制所述直播程序进入后台运行状态。
一种电子设备，所述电子设备包括：

第一存储模块，其上存储有第一可执行程序；

一个或多个第一处理器，所述一个或多个第一处理器能够调用所述第一可执行程序，以使得所述一个或多个第一处理器实现根据权利要求1至8中任意一项所述的视频处理方法。
一种直播系统，所述直播系统包括：

图像采集装置，所述图像采集装置用于采集视频信息；

权利要求11所述的电子设备。
一种终端，包括：

第二存储模块，其上存储有第二可执行程序；

一个或多个第二处理器，所述一个或多个第二处理器能够调用所述第二可执行程序，以使得所述一个或多个第二处理器实现根据权利要求9或10所述的直播处理方法。
一种计算机可读存储介质，其上存储有可执行程序，当所述可执行程序被调用时，能够实现根据权利要求1至8中任意一项所述的视频处理方法或者根据权利要求9或10所述的直播处理方法。