CN110336972A - 一种视频数据的播放方法、装置、及计算机设备 - Google Patents
一种视频数据的播放方法、装置、及计算机设备 Download PDFInfo
- Publication number
- CN110336972A CN110336972A CN201910429454.3A CN201910429454A CN110336972A CN 110336972 A CN110336972 A CN 110336972A CN 201910429454 A CN201910429454 A CN 201910429454A CN 110336972 A CN110336972 A CN 110336972A
- Authority
- CN
- China
- Prior art keywords
- video data
- video
- data
- target
- playing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000010354 integration Effects 0.000 claims abstract description 11
- 230000005540 biological transmission Effects 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 230000009471 action Effects 0.000 claims description 6
- 241001269238 Data Species 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000008685 targeting Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明提供了一种多方视频通话过程中视频数据的播放方法、装置、及计算机设备,该播放方法包括:获取多方视频通话过程中每一视频采集播放设备采集的视频数据,视频数据包括对应的语音数据和图像数据;确定包含目标对象的视频数据,作为目标视频数据;根据预设的规则对目标视频数据和其他视频数据进行整合,得到整合后的视频数据;其中,其他视频数据为获取的视频数据中除目标视频数据以外的视频数据;将整合后的视频数据传送至视频采集播放设备进行播放。
Description
技术领域
本发明涉及视频数据的播放技术领域,更具体地,涉及一种多方视频通话过程中视频数据的播放方法、一种多方视频通话过程中视频数据的播放装置、一种计算机设备、及一种计算机可读存储介质。
背景技术
多方视频通话系统,是指两个或两个以上不同地方的个人或群体,通过传输线路及视频采集播放设备,将声音、影像及文件资料互传,实现即时且互动的沟通,以实现同时进行通话的系统设备。
现有多方视频通话系统中每个视频采集播放设备显示的视频图像的质量相同,无法自动调整每个视频采集播放设备显示的画面质量。
发明内容
本发明的一个目的是提供一种多方视频通话过程中播放视频数据的新技术方案。
根据本发明的第一方面,提供了一种多方视频通话过程中视频数据的播放方法,包括:
步骤S110,获取多方视频通话过程中每一视频采集播放设备采集的视频数据,所述视频数据包括对应的语音数据和图像数据;
步骤S120,根据所述语音数据和所述图像数据确定包含目标对象的视频数据,作为目标视频数据;
步骤S130,根据预设的规则分别对所述目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据;其中,所述其他视频数据为获取的视频数据中除所述目标视频数据以外的视频数据;
步骤S140,将所述整合后的视频数据传送至所述视频采集播放设备进行播放。
可选的,所述步骤S120进一步包括:
确定包含人声的语音数据,作为目标语音数据;
将包含所述目标语音数据的视频数据作为所述目标视频数据。
可选的,所述步骤S120进一步包括:
确定包含说话动作的图像数据,作为目标图像数据;
将包含所述目标图像数据的视频数据作为所述目标视频数据。
可选的,所述步骤S120进一步包括:
确定包含目标物体的图像数据,作为目标图像数据;
将包含所述目标图像数据的视频数据作为所述目标视频数据。
可选的,所述步骤S130进一步包括:
将所述目标视频数据对应的图像数据显示在所述整合后的视频数据的图像数据中的指定位置上,将所述目标视频数据对应的音频数据作为所述整合后的视频数据对应的音频数据。
可选的,所述步骤S130进一步包括:
将所述目标视频数据的码率调整为预设的第一码率,得到调整后的目标视频数据;
将所述其他视频数据的码率调整为预设的第二码率,得到调整后的其他视频数据;
将所述调整后的目标视频数据和所述调整后的其他视频数据整合为所述整合后的视频数据。
可选的,所述播放方法还包括:
确定自身与每一所述视频采集播放设备之间的网络连接质量;
根据每一所述网络连接质量传送至对应的视频采集播放设备的所述调整后的视频数据的视频质量和/或码率。
根据本发明的第二方面,提供了一种多方视频通话过程中视频数据的播放装置,包括:
视频获取模块,用于获取多方视频通话过程中每一视频采集播放设备采集的视频数据,所述视频数据包括对应的语音数据和图像数据;
目标确定模块,用于根据所述语音数据和所述图像数据确定包含目标对象的视频数据,作为目标视频数据;
视频整合模块,用于根据预设的规则分别对所述目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据;其中,所述其他视频数据为获取的视频数据中除所述目标视频数据以外的视频数据;
视频传送模块,用于将所述整合后的视频数据传送至所述视频采集播放设备进行播放。
可选的,所述目标确定模块还用于:
确定包含人声的语音数据,作为目标语音数据;
将包含所述目标语音数据的视频数据作为所述目标视频数据。
可选的,所述目标确定模块还用于:
确定包含说话动作的图像数据,作为目标图像数据;
将包含所述目标图像数据的视频数据作为所述目标视频数据。
可选的,所述目标确定模块还用于:
确定包含目标物体的图像数据,作为目标图像数据;
将包含所述目标图像数据的视频数据作为所述目标视频数据。
可选的,所述视频整合模块还用于:
将所述目标视频数据对应的图像数据显示在所述整合后的视频数据的图像数据中的指定位置上,将所述目标视频数据对应的音频数据作为所述整合后的视频数据对应的音频数据。
可选的,所述视频整合模块还用于:
将所述目标视频数据的码率调整为预设的第一码率,得到调整后的目标视频数据;
将所述其他视频数据的码率调整为预设的第二码率,得到调整后的其他视频数据;
将所述调整后的目标视频数据和所述调整后的其他视频数据整合为所述整合后的视频数据。
可选的,所述播放装置还包括:
用于确定自身与每一所述视频采集播放设备之间的网络连接质量的模块;
用于根据每一所述网络连接质量传送至对应的视频采集播放设备的所述调整后的视频数据的视频质量和/或码率的模块。
根据本发明的第三方面,提供了一种计算机设备,包括:
根据本发明第二方面所述的播放装置;或者,
存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据本发明第一方面所述的播放方法的步骤。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明第一方面所述的播放方法的步骤。
本发明的一个有益效果在于,通过确定多方视频通话过程中多个视频采集播放设备采集的视频数据中,包含目标对象的目标视频数据,并根据预设的规则对目标视频数据和其他视频数据进行整合后传送至多个视频采集播放设备中进行播放。这样,可以自适应地调整多方视频通话系统中传输的视频数据的尺寸、位置、视频质量、和/或码率等视频参数,来达到更好的传输体验。而且,还可以减小多方视频通话系统中视频数据的传输带宽和速率。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是显示可用于实现本发明的实施例的计算机设备的硬件配置的例子的框图。
图2示出了本发明的实施例的视频数据的播放方法的其中一个例子的流程图。
图3示出了本发明的实施例的多方视频通话系统的一个例子的方框原理图。
图4示出了本发明的实施例的视频数据的播放方法的其中一个例子的流程图。
图5示出了本发明的实施例的视频数据的播放装置的其中一个例子的方框原理图。
图6示出了本发明的实施例的计算机设备的其中一个例子的方框原理图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
如图1所示,计算机设备1000例如可以是计算机。在在另一个例子中,计算机设备1000可以如图1所示,包括处理器1010、存储器1020、接口装置1030、通信装置1040、显示装置1050、输入装置1060、扬声器1070、麦克风1080,等等。其中,处理器1010例如可以是中央处理器CPU、微处理器MCU等。存储器1020例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1030例如包括USB接口、串行接口等。通信装置1040例如能够进行有线或无线通信。显示装置1050例如是液晶显示屏。输入装置1060例如可以包括触摸屏、键盘等。
图1所示的计算机设备1000仅是解释性的,并且决不是为了要限制本发明、其应用或用途。
应用于本发明的实施例中,计算机设备1000的所述存储器1020用于存储指令,所述指令用于控制所述处理器1010进行操作以执行本发明实施例提供的任意一项视频数据的播放方法。
本领域技术人员应当理解,尽管在图1中对计算机设备1000示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,计算机设备1000只涉及处理器1010和存储装置1020等。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
本发明实施例的总体构思,是提供一种视频数据的播放的技术方案,通过确定多方视频通话过程中多个视频采集播放设备采集的视频数据中,包含目标对象的目标视频数据,并根据预设的规则对目标视频数据和其他视频数据进行整合后传送至多个视频采集播放设备中进行播放。这样,可以自适应地调整多方视频通话系统中传输的视频数据的尺寸、位置、视频质量、和/或码率等视频参数,来达到更好的传输体验。而且,还可以减小多方视频通话系统中视频数据的传输带宽和速率。
<方法>
在本实施例中,提供一种多方视频通话过程中视频数据的播放方法,通过计算机设备实施。
该计算机设备可以任意具有处理器和存储器的电子产品,例如,可以是台式计算机、笔记本电脑、手机、平板电脑等。在一个例子中,计算机设备可以是图1所示的计算机设备1000。具体的,本实施例的计算机设备可以是音视频会议系统中的数据发送设备。
该视频数据的播放方法,如图2所示,包括:步骤S110~S140。
步骤S110,获取多方视频通话过程中每一视频采集播放设备采集的视频数据,视频数据包括对应的语音数据和图像数据。
如图3所示,本发明的多方视频通话系统3000可以包括多个视频采集播放设备2000、及执行本发明的实施例的计算机设备1000。其中,每个视频采集播放设备2000均可以与执行本发明的实施例的计算机设备1000进行数据通信。
每个视频采集播放设备2000均可以采集视频通话过程中的图像和语音,构成视频数据。每个视频采集播放设备2000可以是按照预设的第一频率主动将采集的视频数据传送至执行本发明的实施例的计算机设备1000中。也可以是执行本发明的实施例的计算机设备1000按照预设的第二频率从每个视频采集设备2000中获取其在对应的获取周期中所采集的视频数据。
第一频率和第二频率可以预先根据应用场景或者具体需求设定。第一频率和第二频率可以相同,也可以不同。例如,第一频率和第二频率可以均为1s。
步骤S120,根据所述语音数据和所述图像数据确定包含目标对象的视频数据,作为目标视频数据。
本实施例中的目标对象可以是正在讲话的用户。
在一个实施例中,确定包含目标对象的视频数据,作为目标视频数据的步骤可以包括:
确定包含人声的语音数据,作为目标语音数据;将包含目标语音数据的视频数据作为目标视频数据。
具体的,可以是确定每一视频采集播放设备采集的音频数据中是否包含处于设定频率区间、或者是处于设定振幅范围的语音信号。如果其中一个视频采集播放设备采集的音频数据中包含该语音信号,则表明该音频数据中包含人声,因此,则可以将音频数据作为目标音频数据,将目标音频数据对应的视频数据作为包含目标对象的目标视频数据。
在一个实施例中,确定包含目标对象的视频数据,作为目标视频数据的步骤可以包括:
确定包含说话动作的图像数据,作为目标图像数据;将包含目标图像数据的视频数据作为目标视频数据。
在一个实施例中,可以确定每一视频采集播放设备采集的图像数据中是否包括嘴巴动的时长超过预设的时长的用户。如果其中一个视频采集播放设备采集的图像数据中包括嘴巴动的时长超过预设的时长的用户,则可以确定该图像数据中包含说话动作,因此,可以将该图像数据作为目标图像数据,将目标视频数据对应的视频数据作为包含目标对象的目标视频数据。
具体的,可以是获取连续的N帧图像数据,通过颜色识别或者是人脸识别等方式,识别出这N帧图像数据中的每个用户的嘴巴部分是闭嘴状态还是张嘴状态。如果这N帧连续的数据图像中既包含闭嘴状态的用户的图像数据,也包含张嘴状态的用户的图像数据,则可以判定图像数据中包括嘴巴动的用户。如果预设的时长内每N帧图像数据中均既包含闭嘴状态的用户的图像数据,也包含张嘴状态的用户的图像数据、且处于张嘴状态的用户相同,则可以判定图像数据中包括嘴巴动的时长超过预设的时长的用户。
在一个实施例中,确定包含目标对象的视频数据,作为目标视频数据的步骤可以包括:
确定包含目标物体的图像数据,作为目标图像数据;将包含目标图像数据的视频数据作为目标视频数据。
例如,目标物体可以是设置有指定文字的名牌。
再例如,可以是确定每一视频采集播放设备采集的图像数据中是否包括名牌,并根据预设的名牌排序,确定包含排序值最小的名牌的图像数据,作为目标图像数据,并将目标视频数据对应的视频数据作为包含目标对象的目标视频数据。具体的,可以是预先存储有每一名牌的排序值,供确定图像数据中包含的名牌对应的排序值。
具体的,可以是预先存储包括每一名牌的参考图像,并预先设定每一名牌的排序值。通过将图像数据与预先存储的参考图像进行比对,以确定图像数据中是否包含名牌。
步骤S130,根据预设的规则分别对目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据。
其中,其他视频数据为获取的视频数据中除目标视频数据以外的视频数据。
对根据预设的规则对目标视频数据和其他视频数据进行整合具体可以是调整目标视频数据和其他视频数据的视频参数后进行整合。其中,视频参数可以包括尺寸、位置、码率、和/或视频质量。
在一个实施例中,根据预设的规则分别对目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据的步骤可以包括:
将目标视频数据对应的图像数据显示在整合后的视频数据的图像数据的指定位置上,将目标视频数据对应的音频数据作为整合后的视频数据对应的音频数据。
具体的,整合后的视频数据可以包括整合后的图像数据和整合后的语音数据。
那么,根据预设的规则分别对目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据可以是:根据预设的规则设定目标图像数据、及其他图像数据在整合后的图像数据中的位置和尺寸。
例如,可以是将目标图像数据设置在整合后的图像数据的中心位置,其他图像数据环绕在目标图像数据周围。还可以是设置目标图像数据设置在整合后的图像数据中的尺寸最大。
再例如,还可以是根据连接的视频采集播放设备的数量,确定整合后的视频图像的模板。那么,根据预设的规则对目标视频数据和其他视频数据进行整合,得到整合后的视频数据可以是:将目标图像数据设置在模板中最大或者是指定的位置上。
在一个实施例中,还可以根据每个视频采集播放设备的类型,来确定执行本发明的实施例的计算机设备发送至每个视频采集播放设备的整合后的视频数据的码率。例如,如果视频采集播放设备为手机,执行本发明的实施例的计算机设备可以是向手机传输码率较低的整合后的视频数据,以降低手机的功耗。如果视频采集播放设备为电脑,执行本发明的实施例的计算机设备可以是向电脑传输码率较高的整合后的视频数据,以提高视频质量,提升用户体验。
在一个实施例中,根据预设的规则分别对目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据的步骤可以包括如图4所示的步骤S131~S133:
步骤S131,将目标视频数据的码率调整为预设的第一码率,得到调整后的目标视频数据。
步骤S132,将其他视频数据的码率调整为预设的第二码率,得到调整后的其他视频数据。
步骤S133,将调整后的目标视频数据和调整后的其他视频数据整合为整合后的视频数据。
具体的,第一码率和第二码率可以预先根据应用场景或具体需求设定。例如,可以设定第一码率大于第二码率。
在一个实施例中,根据预设的规则对目标视频数据和其他视频数据进行整合,得到整合后的视频数据的步骤可以包括:将目标视频数据的传输质量调整为预设的第一质量,得到调整后的目标视频数据;将其他视频数据的传输质量调整为预设的第二传输质量,得到调整后的其他视频数据;将调整后的目标视频数据和调整后的其他视频数据整合为整合后的视频数据。
具体的,第一传输质量和第二传输质量可以预先根据应用场景或具体需求设定。例如,可以设定第一传输质量大于第二传输质量。
在一个实施例中,根据预设的规则分别对目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据的步骤可以包括:可以是控制采集目标视频数据的视频采集播放设备按照第三视频质量来采集视频图像,控制采集其他视频数据的视频采集播放设备按照第四视频质量来采集视频图像,再由执行本发明的实施例的计算机设备对获取的视频图像进行整合后得到整合后的视频数据。
具体的,第三传输质量和第四传输质量可以预先根据应用场景或具体需求设定。例如,可以设定第三传输质量大于第四传输质量。
在一个实施例中,根据预设的规则分别对目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据的步骤可以包括:可以是控制采集目标视频数据的视频采集播放设备按照第三码率来采集视频图像,控制采集其他视频数据的视频采集播放设备按照第四码率来采集视频图像,再由执行本发明的实施例的计算机设备对获取的视频图像进行整合后得到整合后的视频数据。
具体的,第三码率和第四码率可以预先根据应用场景或具体需求设定。例如,可以设定第三码率大于第四码率。
具体的,码率越低,视频压缩率越高,视频质量越差。
步骤S140,将整合后的视频数据传送至视频采集播放设备进行播放。
具体的,传输至每一视频采集播放设备的调整后的视频数据可以相同,也可以不同。
在一个实施例中,该播放方法还可以包括:确定自身与每一视频采集播放设备之间的网络连接质量,根据每一网络连接质量调整传送至对应视频采集播放设备的整合后的视频数据的视频质量和/或码率。
具体的,可以是在执行本发明的实施例的计算机设备与其中一个视频采集播放设备之间的网络连接质量低于预设的第一阈值的情况下,该视频采集播放设备可以将采集的视频数据通过较低的码率传输至执行本发明的实施例的计算机设备中,也可以是执行本发明的实施例的计算机设备通过较低的码率将整合后的视频数据发送至对应的视频采集设备中。执行本发明的实施例的计算机设备与其中一个视频采集播放设备之间的网络连接质量高于预设的第二阈值的情况下,该视频采集播放设备可以将采集的视频数据通过较高的码率传输至执行本发明的实施例的计算机设备中,也可以是执行本发明的实施例的计算机设备通过较高的码率将整合后的视频数据发送至对应的视频采集设备中。这样,自适应地调整视频数据的码率,可以减小视频数据的丢包率,减小网络抖动的问题,可以达到更好的传输体验。
在本发明的实施例中,通过确定多方视频通话过程中多个视频采集播放设备采集的视频数据中,包含目标对象的目标视频数据,并根据预设的规则对目标视频数据和其他视频数据进行整合后传送至多个视频采集播放设备中进行播放。这样,可以自适应地调整多方视频通话系统中传输的视频数据的尺寸、位置、视频质量、和/或码率等视频参数,来达到更好的传输体验。而且,还可以减小多方视频通话系统中视频数据的传输带宽和速率。
<装置>
在本实施例中,提供一种与上述方法相对应的视频数据的播放装置500。
图5为本发明提供的一种视频数据的播放装置500的一种实施结构的方框原理图。如图5所示,该视频数据的播放装置500包括视频获取模块510、目标确定模块520、视频整合模块530和视频传送模块540。该视频获取模块510用于获取多方视频通话过程中每一视频采集播放设备采集的视频数据,视频数据包括对应的语音数据和图像数据;该目标确定模块520用于根据所述语音数据和所述图像数据确定包含目标对象的视频数据,作为目标视频数据;该视频整合模块530用于根据预设的规则分别对目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据;其中,其他视频数据为获取的视频数据中除目标视频数据以外的视频数据;该视频传送模块540用于将整合后的视频数据传送至视频采集播放设备进行播放。
在一个实施例中,目标确定模块520还可以用于:
确定包含人声的语音数据,作为目标语音数据;
将包含目标语音数据的视频数据作为目标视频数据。
在一个实施例中,目标确定模块520还可以用于:
确定包含说话动作的图像数据,作为目标图像数据;
将包含目标图像数据的视频数据作为目标视频数据。
在一个实施例中,目标确定模块520还可以用于:
确定包含目标物体的图像数据,作为目标图像数据;
将包含目标图像数据的视频数据作为目标视频数据。
在一个实施例中,视频整合模块530还可以用于:
将目标视频数据对应的图像数据显示在整合后的视频数据的图像数据中的指定位置上,将目标视频数据对应的音频数据作为整合后的视频数据对应的音频数据。
在一个实施例中,视频整合模块530还可以用于:
将目标视频数据的码率调整为预设的第一码率,得到调整后的目标视频数据;
将其他视频数据的码率调整为预设的第二码率,得到调整后的其他视频数据;
将调整后的目标视频数据和调整后的其他视频数据整合为整合后的视频数据。
在一个实施例中,该播放装置500还可以包括:
用于确定自身与每一视频采集播放设备之间的网络连接质量的模块;
用于根据每一网络连接质量传送至对应的视频采集播放设备的调整后的视频数据的视频质量和/或码率的模块。
本领域技术人员应当明白,可以通过各种方式来实现视频数据的播放装置500。例如,可以通过指令配置处理器来实现视频数据的播放装置500。例如,可以将指令存储在ROM中,并且当启动设备时,将指令从ROM读取到可编程器件中来实现视频数据的播放装置500。例如,可以将视频数据的播放装置500固化到专用器件(例如ASIC)中。可以将视频数据的播放装置500分成相互独立的单元,或者可以将它们合并在一起实现。视频数据的播放装置500可以通过上述各种实现方式中的一种来实现,或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。
在本实施例中,视频数据的播放装置500可以具有多种实现形式,例如,视频数据的播放装置500可以是任何的提供连接服务的软件产品或者应用程序中运行的功能模块,或者是这些软件产品或者应用程序的外设嵌入件、插件、补丁件等,还可以是这些软件产品或者应用程序本身。
<计算机设备>
本发明还提供了一种计算机设备。在一方面,该计算机设备可以包括前述的视频数据的播放装置500。
在另一方面,该计算机设备还可以如图6所示的处理器610和存储器620,存储器620中存储有计算机可读指令,计算机可读指令被处理器610执行时,使得处理器610执行本实施例中所述的视频数据的播放方法的步骤。
通过本发明的实施例的数据处理方法,检测终端设备中用于与自身连接的传输信道的传输质量,来选取目标传输信道进行目标数据的传输。这样,可以保证目标视频数据的播放的有效性。此外,还可以保证与终端设备之间的连接质量最优,还可以保证终端设备能够得到质量更高的视听效果。
<计算机可读介质>
在本实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本实施例中所述的视频数据的播放方法的步骤。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种多方视频通话过程中视频数据的播放方法,其特征在于,包括:
步骤S110,获取多方视频通话过程中每一视频采集播放设备采集的视频数据,所述视频数据包括对应的语音数据和图像数据;
步骤S120,根据所述语音数据和所述图像数据确定包含目标对象的视频数据,作为目标视频数据;
步骤S130,根据预设的规则分别对所述目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据;其中,所述其他视频数据为获取的视频数据中除所述目标视频数据以外的视频数据;
步骤S140,将所述整合后的视频数据传送至所述视频采集播放设备进行播放。
2.根据权利要求1所述的播放方法,其特征在于,所述步骤S120进一步包括:
确定包含人声的语音数据,作为目标语音数据;
将包含所述目标语音数据的视频数据作为所述目标视频数据。
3.根据权利要求1所述的播放方法,其特征在于,所述步骤S120进一步包括:
确定包含说话动作的图像数据,作为目标图像数据;
将包含所述目标图像数据的视频数据作为所述目标视频数据。
4.根据权利要求1所述的播放方法,其特征在于,所述步骤S120进一步包括:
确定包含目标物体的图像数据,作为目标图像数据;
将包含所述目标图像数据的视频数据作为所述目标视频数据。
5.根据权利要求1所述的播放方法,其特征在于,所述步骤S130进一步包括:
将所述目标视频数据对应的图像数据显示在所述整合后的视频数据的图像数据中的指定位置上,将所述目标视频数据对应的音频数据作为所述整合后的视频数据对应的音频数据。
6.根据权利要求1所述的播放方法,其特征在于,所述步骤S130进一步包括:
将所述目标视频数据的码率调整为预设的第一码率,得到调整后的目标视频数据;
将所述其他视频数据的码率调整为预设的第二码率,得到调整后的其他视频数据;
将所述调整后的目标视频数据和所述调整后的其他视频数据整合为所述整合后的视频数据。
7.根据权利要求1所述的播放方法,其特征在于,所述播放方法还包括:
确定自身与每一所述视频采集播放设备之间的网络连接质量;
根据每一所述网络连接质量传送至对应的视频采集播放设备的所述调整后的视频数据的视频质量和/或码率。
8.一种多方视频通话过程中视频数据的播放装置,其特征在于,包括:
视频获取模块,用于获取多方视频通话过程中每一视频采集播放设备采集的视频数据,所述视频数据包括对应的语音数据和图像数据;
目标确定模块,用于根据所述语音数据和所述图像数据确定包含目标对象的视频数据,作为目标视频数据;
视频整合模块,用于根据预设的规则分别对所述目标视频数据和其他视频数据进行处理,并整合得到整合后的视频数据;其中,所述其他视频数据为获取的视频数据中除所述目标视频数据以外的视频数据;
视频传送模块,用于将所述整合后的视频数据传送至所述视频采集播放设备进行播放。
9.一种计算机设备,包括:
根据权利要求8所述的播放装置;或者,
存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据权利要求1-7中任一项所述播放方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-7中任一项所述播放方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910429454.3A CN110336972A (zh) | 2019-05-22 | 2019-05-22 | 一种视频数据的播放方法、装置、及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910429454.3A CN110336972A (zh) | 2019-05-22 | 2019-05-22 | 一种视频数据的播放方法、装置、及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110336972A true CN110336972A (zh) | 2019-10-15 |
Family
ID=68139076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910429454.3A Pending CN110336972A (zh) | 2019-05-22 | 2019-05-22 | 一种视频数据的播放方法、装置、及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110336972A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101478642A (zh) * | 2009-01-14 | 2009-07-08 | 镇江畅联通信科技有限公司 | 视频会议系统的多画面混图方法及装置 |
CN101946511A (zh) * | 2008-02-14 | 2011-01-12 | 微软公司 | 用于为多媒体会议事件生成视觉合成的技术 |
CN105141882A (zh) * | 2015-08-06 | 2015-12-09 | 北京奇艺世纪科技有限公司 | 一种显示控制方法及装置 |
CN105162555A (zh) * | 2015-09-24 | 2015-12-16 | 广州市百果园网络科技有限公司 | 一种码率调整方法及其终端 |
US20180192003A1 (en) * | 2016-12-30 | 2018-07-05 | Akamai Technologies, Inc. | Dynamic speaker selection and live stream delivery for multi-party conferencing |
CN109005377A (zh) * | 2018-08-10 | 2018-12-14 | 维沃移动通信有限公司 | 一种视频处理方法及终端设备 |
-
2019
- 2019-05-22 CN CN201910429454.3A patent/CN110336972A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101946511A (zh) * | 2008-02-14 | 2011-01-12 | 微软公司 | 用于为多媒体会议事件生成视觉合成的技术 |
CN101478642A (zh) * | 2009-01-14 | 2009-07-08 | 镇江畅联通信科技有限公司 | 视频会议系统的多画面混图方法及装置 |
CN105141882A (zh) * | 2015-08-06 | 2015-12-09 | 北京奇艺世纪科技有限公司 | 一种显示控制方法及装置 |
CN105162555A (zh) * | 2015-09-24 | 2015-12-16 | 广州市百果园网络科技有限公司 | 一种码率调整方法及其终端 |
US20180192003A1 (en) * | 2016-12-30 | 2018-07-05 | Akamai Technologies, Inc. | Dynamic speaker selection and live stream delivery for multi-party conferencing |
CN109005377A (zh) * | 2018-08-10 | 2018-12-14 | 维沃移动通信有限公司 | 一种视频处理方法及终端设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111970533B (zh) | 直播间的互动方法、装置及电子设备 | |
CN106791893B (zh) | 视频直播方法及装置 | |
CN109413563B (zh) | 视频的音效处理方法及相关产品 | |
CN107692997B (zh) | 心率检测方法及装置 | |
US7227567B1 (en) | Customizable background for video communications | |
US9817235B2 (en) | Method and apparatus for prompting based on smart glasses | |
CN105611215A (zh) | 一种视频通话方法及装置 | |
GB2544885A (en) | Communication system and method | |
US11102450B2 (en) | Device and method of displaying images | |
CN105554430B (zh) | 一种视频通话方法、系统及装置 | |
CN105120301B (zh) | 视频处理方法和装置、智能设备 | |
CN106921883B (zh) | 一种视频播放处理的方法及装置 | |
CN108924644B (zh) | 视频片段提取方法及装置 | |
CN108174269B (zh) | 可视化音频播放方法及装置 | |
CN110876079B (zh) | 视频处理方法、装置和设备 | |
CN110991329A (zh) | 一种语义分析方法及装置、电子设备和存储介质 | |
CN114727120B (zh) | 直播音频流的获取方法、装置、电子设备及存储介质 | |
WO2017084356A1 (zh) | 通过电视进行视频通话的显示控制方法、系统及电视 | |
CN107623830B (zh) | 一种视频通话方法及电子设备 | |
CN110234015A (zh) | 直播控制方法、装置、存储介质、终端 | |
CN111935442A (zh) | 信息显示方法、装置和电子设备 | |
CN113240702A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109936756A (zh) | 视频封面的确定方法及装置 | |
CN107105311B (zh) | 直播方法及装置 | |
CN112911191B (zh) | 一种视频通话质量调整方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191015 |