CN113542257A

CN113542257A - 视频处理方法、视频处理装置、电子设备和存储介质

Info

Publication number: CN113542257A
Application number: CN202110785386.1A
Authority: CN
Inventors: 陈彦府
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2021-07-12
Filing date: 2021-07-12
Publication date: 2021-10-22
Anticipated expiration: 2041-07-12
Also published as: CN113542257B

Abstract

本申请公开了一种视频处理方法、视频处理装置、电子设备和存储介质，属于通信技术领域。其中，视频处理方法包括：在第一终端向会议服务器发送分享视频流的情况下，接收会议服务器发送的标注数据，其中标注数据包括标注数据对应的第一标识、标注内容和标注位置；在标注数据符合预设条件的情况下，根据第一标识和标注内容，生成对应的图像信息；根据标注位置，将图像信息合并至分享视频流。

Description

视频处理方法、视频处理装置、电子设备和存储介质

技术领域

本申请属于通信技术领域，具体涉及一种视频处理方法、视频处理装置、电子设备和存储介质。

背景技术

在相关技术中，对于视频会议系统，当与会者需要将本地内容进行分享讨论时，需要提前将对应的文件或文档分发至其他与会者，并在全部与会者完成对文件的修改后整合，流程复杂且实时性差。

发明内容

本申请实施例的目的是提供一种视频处理方法、视频处理装置、电子设备和存储介质，能够提高视频会议共享内容的实时性。

第一方面，本申请实施例提供了一种视频处理方法，方法包括：

在第一终端向会议服务器发送分享视频流的情况下，接收会议服务器发送的标注数据，其中标注数据包括标注数据对应的第一标识、标注内容和标注位置；

在标注数据符合预设条件的情况下，根据第一标识和标注内容，生成对应的图像信息；

根据标注位置，将图像信息合并至分享视频流。

第二方面，本申请实施例提供了一种视频处理装置，用于第一终端，视频处理装置包括：

第一接收模块，用于在第一终端向会议服务器发送分享视频流的情况下，接收会议服务器发送的标注数据，其中标注数据包括标注数据对应的第一标识、标注内容和标注位置；

处理模块，用于在标注数据符合预设条件的情况下，根据第一标识和标注内容，生成对应的图像信息；根据标注位置，将图像信息合并至分享视频流。

第三方面，本申请实施例提供了一种电子设备，包括处理器，存储器及存储在存储器上并可在处理器上运行的程序或指令，程序或指令被处理器执行时实现如第一方面的方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，该可读存储介质上存储程序或指令，该程序或指令被处理器执行时实现如第一方面和第二方面的方法的步骤。

第五方面，本申请实施例提供了一种芯片，该芯片包括处理器和通信接口，该通信接口和该处理器耦合，该处理器用于运行程序或指令，实现如第一方面和第二方面的方法的步骤。

本申请实施例通过以视频流的方式，进行内容分享，无需将文件提前分发给多个与会者终端，因此提高了内容分享的实时性，同时，当被分享着需要对分享的内容进行标注时，可通过在本地视频上进行标注，从而根据标注内容、标注位置等信息生成标注数据，从而实现了多个被分享着对分享内容的同步标注，且无需将多个被分享者的标注进行整合，也无需对文件做出实际修改，进一步地提高了内容分享的效率和体验。

附图说明

图1示出了根据本申请实施例的视频处理方法的流程图之一；

图2示出了根据本申请实施例的视频处理方法的界面图之一；

图3示出了根据本申请实施例的视频处理方法的流程图之二；

图4示出了根据本申请实施例的视频处理方法的界面图之二；

图5示出了根据本申请实施例的视频处理装置的结构框图之一；

图6示出了根据本申请实施例的视频处理装置的结构框图之二；

图7示出了根据本申请实施例的电子设备的结构框图；

图8为实现本申请实施例的一种电子设备的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的视频处理方法、视频处理装置、电子设备和存储介质进行详细地说明。

在本申请的一些实施例中，提供了一种视频处理方法，用于第一终端，图1示出了根据本申请实施例的视频处理方法的流程图之一，如图1所示，方法包括：

步骤102，在第一终端向会议服务器发送分享视频流的情况下，接收会议服务器发送的标注数据；

在步骤102中，标注数据包括标注数据对应的第一标识、标注内容和标注位置；

步骤104，在标注数据符合预设条件的情况下，根据第一标识和标注内容，生成对应的图像信息；

步骤106，根据标注位置，将图像信息合并至分享视频流。

在本申请实施例中，在视频会议中，如果有分享内容的需求，如在讲解时需要将幻灯片、文档等文件的内容向与会者展示时，可以通过第一输入，对选定的内容进行分享。

系统在接收到标注输入之后，根据标注者的标注内容、标注位置和当前标注者的参会标识等信息，生成对应的标注数据，并同步发送至会议服务器。会议服务器在接收到标注数据后，将标注数据转发至分享者的第一终端，第一终端判断标注数据是否符合预设条件，如标注者是否有标注权限、标注内容是否与当前会议相关等。如果判断标注数据符合预设条件，则根据表述内容和标注位置，在当前视频流的对应位置上，添加该标注内容和对应的标注者身份，从而使得接收分享视频流的全部第二终端均可以看到该标注，从而实现内容分享。

具体地，标注数据具体包括标注数据对应的第一标识、标注内容和标注位置。其中，第一标识为标注者的第二终端的身份标识，或标注者的参会帐号的标识。第一标识能够显示出标注者的身份，其内容可以是标注者的用户名、职位或姓名等。标注内容即标注者通过手写、文字输入或绘图输入等方式进行的标注，如手写的文字、添加的文字标识、框选或划线等。标注位置即标注内容在分享视频流中所处的位置，该位置可以与分享内容中的目标内容相绑定，如与文字绑定，也可以在视频流中自由记录位置，通过记录标注内容在分享视频流中的坐标，来存储标注位置。

根据标注位置，将图像信息合并至分享视频流，其中，图像信息可以是半透明的蒙板图像，将该蒙板图像按照标注位置记录的坐标叠加到分享视频流中，即可在分享视频流中形成对应的标注内容和标注者信息，从而实现基于视频流的内容分享。

具体地，图2示出了根据本申请实施例的视频处理方法的界面图之一，如图2所示，第一终端10的用户即内容分享者，其桌面200中现实有窗口202，当分享者需要将窗口202分享给与会者时，可通过点选桌面200上的分享按钮204，并选定窗口202，从而根据窗口202形成分享视频流，N个第二终端20可通过播放窗口206对分享视频流进行播放。

在本申请的一些实施例中，在接收会议服务器发送的标注数据之前，方法还包括：

接收对目标内容进行分享的第一输入；

响应于第一输入，根据目标内容生成对应的分享视频流；

将分享视频流发送至会议服务器，以使会议服务器将分享视频流发送至N个第二终端。

在本申请实施例中，第一终端为发起内容分享的电子设备，即内容分享者。具体地，在接收到第一输入后，根据目标内容，生成对应的分享视频流。其中，在生成分享视频流时，可以通过采集当前分享者桌面或窗口的图像信息，并形成为对应的视频流数据，即上述分享视频流。分享者可以自定义分享桌面的全部或部分，或者指定分享特定的窗口。

能够理解的是，分享视频流，是独立于视频会议的人像视频流的视频流，也就是说，该分享视频流不是通过摄像头采集的视频流，而是通过“录屏”采集到的视频画面，也即采集当前电子设备的桌面或处于运行状态的应用程序的窗口的视频画面，由于该过程是对电子设备内部画面的采集，因此无需调用摄像头，所以无论视频会议是否启用摄像头，分享视频流总是能够被采集并由与会者播放。

在得到分享视频流后，分享者的第一终端持续将分享视频发送至会议服务器，并由会议服务器将该分享视频流转发至N个与会者的第二终端。其中，N个与会者的第二终端中，可以包括当前作为分享者的第一终端，以使分享者能够实时检测分享画面。

N个第二终端，在接收到分享视频流之后，通过播放分享视频流，能够同步看到分享者分享的内容，并看到分享者对分享内容做出的操作。此时，如果与会者需要对分享这分享的内容进行标注，如对文档中的某些位置进行批注，来对部分内容提出疑问或进行讲解时，可针对视频流的视频内容进行标注输入。

进一步地，在分享者，也即第一终端接收到标注数据后，首先获取标注内容，其中标注内容可以是以文字代码的形式保存的，也可以是以图像的形式保存的。根据第一标识和标识内容，进一步生成对应的图像信息，该图像信息中显示有第一标识和标识内容。

在本申请的一些实施例中，视频处理方法还包括：

根据分享视频流，确定对应的音频数据；

对音频数据进行语音识别，确定分享视频流对应的第一文本；

根据标注内容，确定标注数据对应的第二文本；

根据第一文本和第二文本，确定标注数据与分享视频流的相关性。

在本申请实施例中，视频会议中还包括音频数据，其中，音频数据与分享视频流和基于摄像头采集图像得到的与会者图像视频流同步，用于传递视频会议中的声音。其中，音频数据可以独立于视频流独立传输，也可以与分享视频流合并成有声视频流一并传输。

进一步地，通过基于神经网络模型的语音识别功能，对音频数据进行实时的语义识别，从而得到分享视频流的第一文本。其中，语音识别具体可以是语音转文字的过程，即通过语音识别，将会议中与会者和会议主持人的语言转换为文字，并形成为第一文本。

同时，当有被分享者进行了标注输入后，根据标注数据中的标注内容，确定对应的第二文本。其中，可以通过图像识别技术，将标注内容转换为文字，并形成为第二文本。

在得到第一文本和第二文本后，进一步地根据第一文本和第二文本确定标注数据与分享视频流，也即标注内容和会议内容的相关性。具体地，可以将记录了当前会议讨论内容的第一文本，和标注者发送的修改内容的第二文本，发送至自然语言处理模块，自然语言处理模块分别以第一文本和第二文本进行计算，并得到对应的文本向量，此处即为第一文本向量和第二文本向量。

进一步地，将第一文本向量和第二文本向量输入至预先训练好的文本向量模型中，通过文本向量模型计算第一文本向量和第二文本向量的余弦相似度，该余弦相似度即标注数据和分享视频流，也即标注者的标注内容和会议讨论内容的相关性。根据该相关性，即可判断出标注内容是否为有效标注，从而为自动甄别有效标注提供基础。

在本申请的一些实施例中，预设条件包括：第一标识与N个第二终端中的目标终端的第二标识相匹配，其中，目标终端为视频会议的发言者对应的终端；或相关性大于预设的相关性阈值。

在本申请实施例中，当接收到的标注数据满足预设条件时，第一终端将自动根据标注数据，在分享视频流中形成标注内容，并同步将这些内容和分享视频流一起分项到N个第二终端。

其中，预设条件可以是第一标识与目标终端的第二标识相匹配。其中，目标终端为视频会议的发言者对应的终端，也即当前在视频会议中，正处于发言状态的与会者的终端。该发言者基于分享视频流进行发言，因此其发言过程中，有可能存在对分享视频流中目标内容进行标注，从而加强与会者对会议内容理解的需求，因此，对于发言者的目标终端发送的标注数据，可认为其符合预设条件，当接收到目标终端发送的标注数据后，自动根据标注数据，在分享视频流中与标注位置对应的位置，显示对应的标注内容和第一标识。

在另一些情况下，如果第一标识与第二标识不匹配，则可以进一步比较标注数据与分享视频流的相关性，与预设的相关性与之的关系。如果相关性大于相关性阈值，则认为当前接收到的标注数据，其内容与视频会议当前讨论的内容相关，为有效标注，此时认定标注数据满足预设条件，据标注数据，在分享视频流中与标注位置对应的位置，显示对应的标注内容和第一标识。

如果第一标识与第二标识不匹配，同时标注数据与分享视频流的相关性小于或等于相关性阈值，则说明标注数据为无效标注，与当前会议讨论内容无关，此时不会自动在分享视频流中显示标注内容，可由分享者或会议主持者自行判断是否显示该标注。

本申请实施例通过表述数据对应的第一标识，或标注数据与分享视频流的相关性来判断是否自动显示标注内容，一方面节约了人工审核的时间，另一方面保证了所显示的标注内容是与会议内容相关的，防止无关内容扰乱会议进程，提高了内容分享的体验。

在本申请的一些实施例中，提供了一种视频处理方法，用于第二终端，图3示出了根据本申请实施例的视频处理方法的流程图之二，如图3所示，方法包括：

步骤302，接收会议服务器发送的分享视频流；

步骤304，播放分享视频流；

步骤306，接收对分享视频流进行标注的输入；

步骤308，响应于输入，确定对应的标注内容和标注位置；

步骤310，根据标注内容，标注位置和第二终端对应的第三标识，生成标注数据；

步骤312，将标注数据发送至会议服务器。

在本申请实施例中，第二终端为视频会议中，接收内容分享者分享的视频流的终端。第二终端可以是参加视频会议的全部终端中，内容分享者的第一终端之外的其他终端，也可以包括内容分享者的第一终端，当第二终端为第一终端时，即会议服务器将采集自第一终端本地的视频流发回第一终端播放，从而使第一终端的内容分享者随时监控分享视频流的内容。

在第二终端接收到会议服务器发送的分享视频流之后，对接收到的分享视频流进行实时播放，从而使使用第二终端的与会者能够实时获取来自分享者的分享内容。

进一步地，如果当前被分享者有对分享视频流中的部分内容进行标注，从而对该内容进行解释说明，或者针对该内容发出提问的需求时，被分享者可以对分享视频流进行标注输入，其中，标注输入可以针对分享视频流的部分内容，或针对分享视频流的整体。

图4示出了根据本申请实施例的视频处理方法的界面图之二，如图4所示，第二终端中显示有视频会议的会议窗口400，会议窗口400中显示有分享视频流的播放窗口402。当用户希望对分享视频流进行标注时，可通过点击会议窗口400中的标注标识404，进入标注模式，在标注模式下，用户可针对分享视频流中的内容进行标注，从而在分享视频流中形成标注内容406。

系统同步记录标注内容和标注位置，并与当前标注者的第一标识一起生成对应的标注数据，并发送至会议服务器，通过会议服务器将标注数据转发至内容分享者，内容分享者的第一终端接收该标注数据，并在标注数据满足预设条件的情况下，自动根据标注数据，在分享视频流中与标注位置对应的位置，显示对应的标注内容和第一标识，从而时与会的各个终端和用户均能看到这些标注，从而实现内容分享。

本申请实施例通过以视频流的方式，进行内容分享，无需将文件提前分发给多个与会者终端，因此提高了内容分享的实时性，同时，当被分享着需要对分享的内容进行标注时，可通过在本地视频上进行标注，从而根据标注内容、标注位置等信息生成标注数据，由分享者确定是否显示这些标注数据，从而实现了多个被分享着对分享内容的同步标注，且无需将多个被分享者的标注进行整合，也无需对文件做出实际修改，进一步地提高了内容分享的效率和体验。

在本申请的一些实施例中，提供了一种视频处理装置，用于第一终端，图5示出了根据本申请实施例的视频处理装置的结构框图之一，如图5所示，视频处理装置500包括：

第一接收模块502，用于在第一终端向会议服务器发送分享视频流的情况下，接收会议服务器发送的标注数据，其中标注数据包括标注数据对应的第一标识、标注内容和标注位置；

处理模块504，用于在标注数据符合预设条件的情况下，根据第一标识和标注内容，生成对应的图像信息；根据标注位置，将图像信息合并至分享视频流。

具体地，图2示出了根据本申请实施例的视频处理方法的界面图之一，如图2所示，第一终端的用户即内容分享者，其桌面200中现实有窗口202，当分享者需要将窗口202分享给与会者时，可通过点选桌面200上的分享按钮204，并选定窗口202，从而根据窗口202形成分享视频流，N个第二终端可通过播放窗口206对分享视频流进行播放。

在本申请的一些实施例中，第一接收模块502还用于接收对目标内容进行分享的第一输入；

视频处理装置500还包括：

第一生成模块506，用于响应于第一输入，根据目标内容生成对应的分享视频流；

第一发送模块508，用于将分享视频流发送至会议服务器，以使会议服务器将分享视频流发送至N个第二终端。

在本申请实施例中，第一电子设备为发起内容分享的电子设备，即内容分享者。具体地，在接收到第一输入后，根据目标内容，生成对应的分享视频流。其中，在生成分享视频流时，可以通过采集当前分享者桌面或窗口的图像信息，并形成为对应的视频流数据，即上述分享视频流。分享者可以自定义分享桌面的全部或部分，或者指定分享特定的窗口。

能够理解的是，分享视频流，是独立于视频会议的人像视频流的视频流，也就是说，无论视频会议是否启用摄像头，分享视频流总是能够被采集并由与会者播放。

在本申请的一些实施例中，视频处理装置500还包括：

第一确定模块510，用于根据分享视频流，确定对应的音频数据；

识别模块512，对音频数据进行语音识别，确定分享视频流对应的第一文本；

第一确定模块510，还用于根据标注内容，确定标注数据对应的第二文本；根据第一文本和第二文本，确定标注数据与分享视频流的相关性。

在本申请的一些实施例中，预设条件包括：

第一标识与N个第二终端中的目标终端的第二标识相匹配，其中，目标终端为视频会议的发言者对应的终端；或相关性大于预设的相关性阈值。

在本申请的一些实施例中，提供了一种视频处理装置，用于第二终端，图6示出了根据本申请实施例的视频处理装置的结构框图之二，如图6所示，视频处理装置600包括：

第二接收模块602，用于接收会议服务器发送的分享视频流；

播放模块604，用于播放分享视频流；

第二接收模块602，还用于接收对分享视频流进行标注的输入；

第二确定模块606，用于响应于输入，确定对应的标注内容和标注位置；

第二生成模块608，用于根据标注内容，标注位置和第二终端对应的第三标识，生成标注数据；

第二发送模块610，用于将标注数据发送至会议服务器。

图4示出了根据本申请实施例的视频处理方法的界面图之二，如图4所示，第二终端中显示有视频会议的会议窗口400，会议窗口400中显示有分享视频流的播放窗口402。当用户希望对分享视频流进行标注时，可通过电机会议窗口400中的标注标识404，进入标注模式，在标注模式下，用户可针对分享视频流中的内容进行标注，从而在分享视频流中形成标注内容406。

本申请实施例中的视频处理装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personaldigital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的视频处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为iOS操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的视频处理装置能够实现上述方法实施例实现的各个过程，为避免重复，这里不再赘述。

可选地，本申请实施例还提供一种电子设备700，图7示出了根据本申请实施例的电子设备的结构框图，如图7所示，包括处理器702，存储器704，存储在存储器704上并可在所述处理器702上运行的程序或指令，该程序或指令被处理器702执行时实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

图8为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备2000包括但不限于：射频单元2001、网络模块2002、音频输出单元2003、输入单元2004、传感器2005、显示单元2006、用户输入单元2007、接口单元2008、存储器2009、以及处理器2010等部件。

本领域技术人员可以理解，电子设备2000还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器2010逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图8中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，网络模块2002用于在第一终端向会议服务器发送分享视频流的情况下，接收会议服务器发送的标注数据，其中标注数据包括标注数据对应的第一标识、标注内容和标注位置；

处理器2010还用于在标注数据符合预设条件的情况下，根据第一标识和标注内容，生成对应的图像信息；

根据标注位置，将图像信息合并至分享视频流。

可选地，用户输入单元2007用于接收对目标内容进行分享的第一输入；

处理器2010还用于响应于第一输入，根据目标内容生成对应的分享视频流；

网络模块2002还用于将分享视频流发送至会议服务器，以使会议服务器将分享视频流发送至N个第二终端。

可选地，处理器2010还用于根据分享视频流，确定对应的音频数据；对音频数据进行语音识别，确定分享视频流对应的第一文本；根据标注内容，确定标注数据对应的第二文本；根据第一文本和第二文本，确定标注数据与分享视频流的相关性。

可选地，第一标识与N个第二终端中的目标终端的第二标识相匹配，其中，目标终端为视频会议的发言者对应的终端；或相关性大于预设的相关性阈值。

应理解的是，本申请实施例中，输入单元2004可以包括图形处理器(GraphicsProcessing Unit，GPU)20041和麦克风20042，图形处理器20041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。

显示单元2006可包括显示面板20061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板20061。用户输入单元2007包括触控面板20071以及其他输入设备20072。触控面板20071，也称为触摸屏。触控面板20071可包括触摸检测装置和触摸控制器两个部分。其他输入设备20072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器2009可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器2010可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器2010中。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种视频处理方法，其特征在于，包括：

在所述第一终端向会议服务器发送分享视频流的情况下，接收所述会议服务器发送的标注数据，其中所述标注数据包括所述标注数据对应的第一标识、标注内容和标注位置；

在所述标注数据符合预设条件的情况下，根据所述第一标识和所述标注内容，生成对应的图像信息；

根据所述标注位置，将所述图像信息合并至所述分享视频流。

2.根据权利要求1所述的视频处理方法，其特征在于，在所述接收所述会议服务器发送的标注数据之前，所述方法还包括：

接收对目标内容进行分享的第一输入；

响应于第一输入，根据所述目标内容生成对应的分享视频流；

将所述分享视频流发送至会议服务器，以使所述会议服务器将所述分享视频流发送至N个第二终端。

3.根据权利要求1所述的视频处理方法，其特征在于，还包括：

根据所述分享视频流，确定对应的音频数据；

对所述音频数据进行语音识别，确定所述分享视频流对应的第一文本；

根据所述标注内容，确定所述标注数据对应的第二文本；

根据所述第一文本和所述第二文本，确定所述标注数据与所述分享视频流的相关性。

4.根据权利要求3所述的视频处理方法，其特征在于，所述预设条件包括：

所述第一标识与所述N个第二终端中的目标终端的第二标识相匹配，其中，所述目标终端为视频会议的发言者对应的终端；或

所述相关性大于预设的相关性阈值。

5.一种视频处理装置，其特征在于，所述视频处理装置包括：

第一接收模块，用于在所述第一终端向会议服务器发送分享视频流的情况下，接收所述会议服务器发送的标注数据，其中所述标注数据包括所述标注数据对应的第一标识、标注内容和标注位置；

处理模块，用于在所述标注数据符合预设条件的情况下，根据所述第一标识和所述标注内容，生成对应的图像信息；根据所述标注位置，将所述图像信息合并至所述分享视频流。

6.根据权利要求5所述的视频处理装置，其特征在于，

所述第一接收模块还用于接收对目标内容进行分享的第一输入；

所述视频处理装置还包括：

第一生成模块，用于响应于第一输入，根据所述目标内容生成对应的分享视频流；

第一发送模块，用于将所述分享视频流发送至会议服务器，以使所述会议服务器将所述分享视频流发送至N个第二终端。

7.根据权利要求5所述的视频处理装置，其特征在于，还包括：

第一确定模块，用于根据所述分享视频流，确定对应的音频数据；

识别模块，对所述音频数据进行语音识别，确定所述分享视频流对应的第一文本；

所述第一确定模块，还用于根据所述标注内容，确定所述标注数据对应的第二文本；根据所述第一文本和所述第二文本，确定所述标注数据与所述分享视频流的相关性。

8.根据权利要求7所述的视频处理装置，其特征在于，所述预设条件包括：

所述相关性大于预设的相关性阈值。

9.一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至4中任一项所述方法的步骤。

10.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1至4中任一项所述方法的步骤。