CN105791738B - 视频会议中视频窗口的调整方法及装置 - Google Patents
视频会议中视频窗口的调整方法及装置 Download PDFInfo
- Publication number
- CN105791738B CN105791738B CN201410776179.XA CN201410776179A CN105791738B CN 105791738 B CN105791738 B CN 105791738B CN 201410776179 A CN201410776179 A CN 201410776179A CN 105791738 B CN105791738 B CN 105791738B
- Authority
- CN
- China
- Prior art keywords
- frequency
- frequency range
- participant
- sampling data
- highest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
Abstract
本发明公开了一种视频会议中视频窗口的调整方法,所述视频会议中视频窗口的调整方法包括以下步骤:获取所有与会者的音频数据;对获取的各个与会者的音频数据进行采样生成音频采样数据,分别统计各个与会者的音频采样数据在预设频段中出现的次数;根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人,并突出显示所述当前发言人对应的视频窗口。本发明还公开了一种视频会议中视频窗口的调整装置。本发明实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验。
Description
技术领域
本发明涉及视频会议技术领域,尤其涉及视频会议中视频窗口的调整方法及装置。
背景技术
视频会议是一种常用的现代会话手段。通过视频会议,与会者之间不论处于何方,都可以在视频会议客户端通过语音和视频进行交流,非常方便。
在举行视频会议时,每个视频会议客户端无差别的显示所有与会者画面,或者由管理员手动切换各个视频会议客户端的显示画面,或者由各个与会者手动切换自身视频会议客户端的显示画面。其中,所述显示画面的切换包括显示画面中显示与会者画面的个数,显示画面的大小等。
然而,在视频会议的与会者较多,且在会议进行中参与发言的与会者较多时,需要不断的手动切换视频会议客户端的显示画面,使得视频会议客户端的显示画面的切换过程复杂,且不够智能,无法有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,使得视频会议客户端的体验差。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于解决视频会议客户端的显示画面的切换过程复杂,且不够智能,无法有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,使得视频会议客户端的体验差。
为实现上述目的,本发明提供的一种视频会议中视频窗口的调整方法,所述视频会议中视频窗口的调整方法包括以下步骤:
获取所有与会者的音频数据;
对获取的各个与会者的音频数据进行采样生成音频采样数据,分别统计各个与会者的音频采样数据在预设频段中出现的次数;
根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人,并突出显示所述当前发言人对应的视频窗口。
优选地,所述根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人的步骤包括:
确定在预设频段中出现的次数最高的音频采样数据;
将最高次数对应的音频采样数据所对应的与会者确定为当前发言人。
优选地,所述将最高次数的音频采样数据所对应的与会者确定为当前发言人的步骤包括:
当最高次数的音频采样数据为两个或两个以上时,确定最高次数的音频采样数据对应的频段中频率最高的频段;
将最高次数的音频采样数据对应的频段中,频率最高的频段的音频采样数据所对应的与会者确定为当前发言人。
优选地,所述将最高次数的音频采样数据对应的频段中,频率最高的频段的音频采样数据所对应的与会者确定为当前发言人的步骤包括:
当最高次数的音频采样数据对应的频段中频率最高的频段相同时,确定频段最高的频段背景噪音的频率;
将背景噪音的频率最大的音频采样数据所对应的与会者作为当前发言人。
优选地,所述突出显示的方式包括:
只显示所述当前发言人的视频窗口;
或以大于其他发言人视频窗口画面的比例显示所述当前发言人的视频窗口;
或以预设标识显示所述当前发言人的视频窗口。
此外,为实现上述目的,本发明还提供一种视频会议中视频窗口的调整装置,所述视频会议中视频窗口的调整装置包括:
获取模块,用于获取所有与会者的音频数据;
处理模块,用于对获取的各个与会者的音频数据进行采样生成音频采样数据,分别统计各个与会者的音频采样数据在预设频段中出现的次数;还用于根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人;
显示模块,用于突出显示所述当前发言人对应的视频窗口。
优选地,所述处理模块包括确定单元和处理单元,
所述确定单元,用于确定在预设频段中出现的次数最高的音频采样数据;
所述处理单元,还用于将最高次数的音频采样数据所对应的与会者确定为当前发言人。
优选地,所述确定单元,还用于当最高次数的音频采样数据为两个或两个以上时,确定最高次数的音频采样数据对应的频段中频率最高的频段;
所述处理单元,还用于将最高次数的音频采样数据对应的频段中,频率最高的频段的音频采样数据所对应的与会者确定为当前发言人。
优选地,所述确定单元,还用于当最高次数的音频采样数据对应的频段中频率最高的频段相同时,确定频段最高的频段背景噪音的频率;
所述处理单元,还用于将背景噪音的频率最大的音频采样数据所对应的与会者作为当前发言人。
优选地,所述显示模块,还用于只显示所述当前发言人的视频窗口;
或以大于其他发言人视频窗口画面的比例显示所述当前发言人的视频窗口;
或以预设标识显示所述当前发言人的视频窗口。
本发明通过对获取的各个音频数据进行采样,并分别确定采样数据中预设频段的出现次数,并突出显示出现次数最高的音频数据对应的与会者的视频窗口。实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验。
附图说明
图1为本发明视频会议中视频窗口的调整方法的第一实施例的流程示意图;
图2为图1中步骤S30一实施例的细化流程示意图;
图3为本发明视频会议中视频窗口的调整方法的第二实施例的流程示意图;
图4为本发明视频会议中视频窗口的调整方法的第三实施例的流程示意图;
图5为本发明视频会议中视频窗口的调整装置的较佳实施例的功能模块示意图;
图6为图5中处理模块一实施例的细化功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种视频会议中视频窗口的调整方法。
参照图1,图1为本发明视频会议中视频窗口的调整方法的第一实施例的流程示意图。
在一实施例中,所述视频会议中视频窗口的调整方法包括:
步骤S10,获取所有与会者的音频数据;
在用户需要与多个其他用户进行视频会议时,开启视频会议客户端,并邀请需要参加的其他用户加入视频会议中,即建立与其他用户之间的会话通信环境。在成功创建视频会议后,获取所有与会者的音频数据。所述音频数据包括与会者的说话声音及/后与会者所处环境的环境噪音等。当然并不是每一个音频数据中都包括上述内容,可以是包括其中的一种或者几种。所述音频数据为一段音频数据,即为一段时间内视频会议客户端用户发出的音频数据及或环境产生的噪音音频数据。执行本发明视频会议中视频窗口的调整方法的主体可以是视频会议的管理终端,进一步地,可以是安装在管理终端的视频会议窗口调整软件,所述管理终端可以是服务器、台式机、笔记本电脑、pad等电子终端。
可以理解的是,为了能更快的创建视频会议,在向其他用户发出邀请时,同时发送一个检测数据包,在接收到其他用户发送的基于检测数据包的响应数据包时,判定成功创建与接收到响应数据包的视频客户端的会话通信环境;在未接收到响应数据包时,提示用户视频会议创建失败,以供视频会议客户端通过其他方式联系未接收到响应数据包的视频会议客户端用户尽快建立会话通信环境,其他方式可以是短信、电话、邮件等。
步骤S20,对获取的各个与会者的音频数据进行采样生成音频采样数据,分别统计各个与会者的音频采样数据在预设频段中出现的次数;
在获取到所有与会者的音频数据后,对获取的各个音频数据进行采样生成音频采样数据。所述对获取的各个音频数据进行采样生成音频采样数据的过程包括:从获取的各个音频数据中提起预设长度的音频数据。例如,提取600ms时间长度的音频数据。提取预设长度的音频数据的方式可以是从音频数据的开始位置开始提取,或者从音频数据的结束位置开始提取,或者从中随机提取预设长度的音频数据。当然,所述预设长度也还可以是1000ms、500ms等时间长度,根据需要设置。通过提取预设长度的音频数据,使得各个与会者的计算基准相同,即保证每个与会者作为样本的音频数据的长度相同,保证了计算的准确性。在生成各个音频数据对应的音频采样数据后,分别确定各个音频采样数据在预设频段中的出现次数,所述预设频段可以是一个频段或多个频段。若所述音频数据为人发出的声音,则所述预设频段的范围为250HZ-2000HZ,也还可以根据人发出声音不同适当调整预设频段的范围。当所述预设频段为一个频段时,可以是250HZ-600HZ,包括端点250HZ和600HZ,或者是600HZ-1000HZ,包括端点600HZ和1000HZ,或者是1500HZ-2000HZ,包括端点1500HZ和2000HZ。当所述预设频段为多个频段时,按照频率的不同,可以分为高频段850HZ-2000HZ,包括端点850HZ和2000HZ,中频段550HZ-850HZ,不包括端点550HZ和850HZ,低频段250HZ-550HZ,包括端点250HZ和550HZ。例如,在视频会议中存在3个与会者A、B和C时,所述预设频段为250HZ-600HZ,包括端点250HZ和600HZ,与会者A对应的音频采样数据为a,与会者B对应的音频采样数据为b,与会者C对应的音频采样数据为c,从a、b、c中确定的预设频段250HZ-600HZ的出现次数分别为m次、n次和s次;若预设频段为三个,分别为高频段850HZ-2000HZ,包括端点850HZ和2000HZ,中频段550-850,不包括端点550HZ和850HZ,低频段250HZ-550HZ,包括端点250HZ和550HZ,确定的预设频段的出现次数a的为m1、m2和m3次,b的为n1、n2和n3次,c的为s1、s2和s3次,顺序依次为高频段、中频段和低频段。
步骤S30,根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人,并突出显示所述当前发言人对应的视频窗口。
具体的,参考图2,所述根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人的过程包括:
步骤S31,确定在预设频段中出现的次数最高的音频采样数据;
步骤S32,将最高次数的音频采样数据所对应的与会者确定为当前发言人。
在分别确定各个音频采样数据中预设频段的出现次数后,从确定的出现次数中,获取出现次数最高的音频数据。例如,存在3个与会者A、B和C,确定的出现次数分别为3次、4次和2次;则确定的出现次数最高的与会者为B,将与会者B作为当前发言人,突出显示与会者B对应的视频窗口。
所述突出显示所述当前发言人对应的视频窗口的突出显示方式可以是:只显示所述当前发言人的视频窗口;或以大于其他发言人视频窗口画面的比例显示所述当前发言人的视频窗口;或以预设标识显示所述当前发言人的视频窗口,所述预设标识可以是将显示的视频窗口的画面设置为绿色、黄色、红色等。
当所述当前发言人存在多个时,按照预设的显示规则依次显示所有的当前发言人,例如,当前发言人的个数为3个,则2/3的视频窗口显示第一发言人,剩下视频窗口的2/3显示第二发言人,最后剩下的窗口显示第三发言人等。可以通过获取的音频数据的长度来确定第一发言人、第二发言人和第三发言人,或者通过出现次数的高低顺序来确定第一发言人、第二发言人和第三发言人(次数最高的第一发言人,次高的为第二发言人,剩下的为第三发言人)。
本实施例通过对获取的各个音频数据进行采样,并分别确定采样音频数据中预设频段的出现次数,并突出显示出现次数最高的音频采样数据对应的与会者的视频窗口。实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验。
参照图3,图3为本发明视频会议中视频窗口的调整方法的第二实施例的流程示意图。基于上述视频会议中视频窗口的调整方法的第一实施例,所述步骤S32可以包括:
步骤S321,当最高次数的音频采样数据为两个或两个以上时,确定最高次数的音频采样数据对应的频段中频率最高的频段;
步骤S322,将最高次数的音频采样数据对应的频段中,频率最高的频段对应的音频采样数据所对应的与会者确定为当前发言人。
若存在三个预设频段,分别为高频段、中频段、低频段。分别从各个采样数据中确定一个出现次数最多的频段。例如,存在3个与会者A、B和C,从中获取的与会者A的出现次数最多的为高频段,与会者B的出现次数最高的为低频段,与会者C的出现次数最高的为中频段。例如,确定与会者A的高频段出现次数最高为3次,确定与会者B的中频段出现次数最高为4次,确定与会者C的低频段出现次数最高为4次,则确定存在最高出现次数相同的频段,在确定的频段中有最高出现次数相同的频段时,将最高出现次数相同的频段中频率最高的音频数据对应的与会者作为当前发言人。即将与会者B作为当前发言人,突出显示与会者B的视频窗口。若确定的频段中未出现最高次数相同的频段,则突出显示出现次数最高的频段对应的与会者的视频窗口。可以理解的是,所述预设频段也可以是2个频段、4个频段等,具体的频率分配过程可以根据用户预期的效果进行自由设置,例如,设置为250HZ-500HZ和600HZ-1500HZ两个频段,或者设置为250HZ-500HZ,550HZ-700HZ,750HZ-1500HZ和1600HZ-200HZ四个频段等。
本实施例通过确定的各个与会者的音频采样数据的最高出现次数的音频采样数据有两个或以上相同时,将出现次数相同的频段中,频率最高的与会者作为当前发言人,并突出显示其对应的视频窗口。实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验,并使得当前发言人的锁定更加准确。
参照图4,图4为本发明视频会议中视频窗口的调整方法的第三实施例的流程示意图。基于上述视频会议中视频窗口的调整方法的第二实施例,在所述步骤S322还可以包括:
步骤S3221,当最高次数的音频采样数据对应的频段相同时,确定相同频段的背景噪音的频率;
步骤S3222,将背景噪音的频率最大的音频采样数据所对应的与会者作为当前发言人。
例如,存在3个与会者A、B和C,从中获取的与会者A的出现次数最高的为高频段,与会者B的出现次数最高的为低频段,与会者C的出现次数最高的为低频段。确定与会者A的高频段出现次数为3次,确定与会者B的中频段出现次数为4次,确定与会者C的低频段出现次数为4次,则确定存在最高出现次数相同的频段,在确定的频段中有最高出现次数相同的频段时,获取最高出现次数相同的频段的音频采样数据的背景噪音的频率,例如,获取与会者B和与会者C的音频采样数据的背景噪音的频率,若分别为100HZ和120HZ,则将背景噪音的频率最大的音频采样数据对应的与会者C作为当前发言人。突出显示与会者C的视频窗口。
本实施例通过确定的各个与会者的音频采样数据的最高出现次数相同时,且最高的频段相同时,将频段相同的音频采样数据中背景噪音频率最大的音频采样数据对应的与会者作为当前发言人,并突出显示所述当前发言人的视频窗口。实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验,并使得当前发言人的锁定更加准确。
本发明进一步提供一种视频会议中视频窗口的调整装置。
参照图5,图5为本发明视频会议中视频窗口的调整装置的第一实施例的功能模块示意图。
在一实施例中,所述视频会议中视频窗口的调整装置包括:获取模块10、处理模块20及显示模块30。
所述获取模块10,用于获取所有与会者的音频数据;
在用户需要与多个其他用户进行视频会议时,开启视频会议客户端,并邀请需要参加的其他用户加入视频会议中,即建立与其他用户之间的会话通信环境。在成功创建视频会议后,获取所有与会者的音频数据。所述音频数据包括与会者的说话声音及/后与会者所处环境的环境噪音等。当然并不是每一个音频数据中都包括上述内容,可以是包括其中的一种或者几种。所述音频数据为一段音频数据,即为一段时间内视频会议客户端用户发出的音频数据及或环境产生的噪音音频数据。执行本发明视频会议中视频窗口的调整方法的主体可以是视频会议的管理终端,进一步地,可以是安装在管理终端的视频会议窗口调整软件,所述管理终端可以是服务器、台式机、笔记本电脑、pad等电子终端。
可以理解的是,为了能更快的创建视频会议,在向其他用户发出邀请时,同时发送一个检测数据包,在接收到其他用户发送的基于检测数据包的响应数据包时,判定成功创建与接收到响应数据包的视频客户端的会话通信环境;在未接收到响应数据包时,提示用户视频会议创建失败,以供视频会议客户端通过其他方式联系未接收到响应数据包的视频会议客户端用户尽快建立会话通信环境,其他方式可以是短信、电话、邮件等。
所述处理模块20,用于对获取的各个与会者的音频数据进行采样生成音频采样数据,分别统计各个与会者的音频采样数据在预设频段中出现的次数;
在获取到所有与会者的音频数据后,对获取的各个音频数据进行采样生成音频采样数据。所述获取模块10对获取的各个音频数据进行采样生成音频采样数据的过程包括:从获取的各个音频数据中提起预设长度的音频数据,例如,提取600ms时间长度的音频数据。提取预设长度的音频数据的方式可以是从音频数据的开始位置开始提取,或者从音频数据的结束位置开始提取,或者从中随机提取预设长度的音频数据。当然,所述预设长度也还可以是1000ms、500ms等时间长度,根据需要设置。通过提取预设长度的音频数据,使得各个与会者的计算基准相同,即保证每个与会者作为样本的音频数据的长度相同,保证了计算的准确性。在生成各个音频数据对应的音频采样数据后,分别确定各个音频采样数据在预设频段中的出现次数,所述预设频段可以是一个频段或多个频段。若所述音频数据为人发出的声音,则所述预设频段的范围为250HZ-2000HZ,也还可以根据人发出声音不同适当调整预设频段的范围。当所述预设频段为一个频段时,可以是250HZ-600HZ,包括端点250HZ和600HZ,或者是600HZ-1000HZ,包括端点600HZ和1000HZ,或者是1500HZ-2000HZ,包括端点1500HZ和2000HZ。当所述预设频段为多个频段时,按照频率的不同,可以分为高频段850HZ-2000HZ,包括端点850HZ和2000HZ,中频段550HZ-850HZ,不包括端点550HZ和850HZ,低频段250HZ-550HZ,包括端点250HZ和550HZ。例如,在视频会议中存在3个与会者A、B和C时,所述预设频段为250HZ-600HZ,包括端点250HZ和600HZ,与会者A对应的音频采样数据为a,与会者B对应的音频采样数据为b,与会者C对应的音频采样数据为c,从a、b、c中确定的预设频段250HZ-600HZ的出现次数分别为m次、n次和s次;若预设频段为三个,分别为高频段850HZ-2000HZ,包括端点850HZ和2000HZ,中频段550-850,不包括端点550HZ和850HZ,低频段250HZ-550HZ,包括端点250HZ和550HZ,确定的预设频段的出现次数a的为m1、m2和m3次,b的为n1、n2和n3次,c的为s1、s2和s3次,顺序依次为高频段、中频段和低频段。
所述处理模块20,还用于根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人;
所述显示模块30,用于突出显示所述当前发言人对应的视频窗口。
具体的,参考图6,所述处理模块20包括确定单元21和处理单元22,
所述确定单元21,用于确定在预设频段中出现的次数最高的音频采样数据;
所述处理单元22,用于将最高次数的音频采样数据所对应的与会者确定为当前发言人。
在分别确定各个音频采样数据中预设频段的出现次数后,从确定的出现次数中,获取出现次数最高的音频采样数据。例如,存在3个与会者A、B和C,确定的出现次数分别为3次、4次和2次;则确定的出现次数最高的与会者为B,将与会者B作为当前发言人,突出显示与会者B对应的视频窗口。
所述突出显示所述当前发言人对应的视频窗口的突出显示方式可以是:只显示所述当前发言人的视频窗口;或以大于其他发言人视频窗口画面的比例显示所述当前发言人的视频窗口;或以预设标识显示所述当前发言人的视频窗口,所述预设标识可以是将显示的视频窗口的画面设置为绿色、黄色、红色等。
当所述当前发言人存在多个时,按照预设的显示规则依次显示所有的当前发言人,例如,当前发言人的个数为3个,则2/3的视频窗口显示第一发言人,剩下视频窗口的2/3显示第二发言人,最后剩下的窗口显示第三发言人等。可以通过获取的音频数据的长度来确定第一发言人、第二发言人和第三发言人,或者通过出现次数的高低顺序来确定第一发言人、第二发言人和第三发言人(次数最高的第一发言人,次高的为第二发言人,剩下的为第三发言人)。
本实施例通过对获取的各个音频数据进行采样,并分别确定采样音频数据中预设频段的出现次数,并突出显示出现次数最高的音频采样数据对应的与会者的视频窗口。实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验。
进一步地,所述确定单元21,还用于当最高次数的音频采样数据为两个或两个以上时,确定最高次数的音频采样数据对应的频段中频率最高的频段;
所述处理单元22,还用于将最高次数的音频采样数据对应的频段中,频率最高的频段对应的音频采样数据所对应的与会者确定为当前发言人。
若存在三个预设频段,分别为高频段、中频段、低频段。分别从各个采样数据中确定一个出现次数最多的频段。例如,存在3个与会者A、B和C,从中获取的与会者A的出现次数最多的为高频段,与会者B的出现次数最高的为低频段,与会者C的出现次数最高的为中频段。例如,确定与会者A的高频段出现次数最高为3次,确定与会者B的中频段出现次数最高为4次,确定与会者C的低频段出现次数最高为4次,则确定存在最高出现次数相同的频段,在确定的频段中有最高出现次数相同的频段时,将最高出现次数相同的频段中频率最高的音频采样数据对应的与会者作为当前发言人。即将与会者B作为当前发言人,突出显示与会者B的视频窗口。若确定的频段中未出现最高次数相同的频段,则突出显示出现次数最高的频段对应的与会者的视频窗口。可以理解的是,所述预设频段也可以是2个频段、4个频段等,具体的频率分配过程可以根据用户预期的效果进行自由设置,例如,设置为250HZ-500HZ和600HZ-1500HZ两个频段,或者设置为250HZ-500HZ,550HZ-700HZ,750HZ-1500HZ和1600HZ-200HZ四个频段等。
本实施例通过确定的各个与会者的音频采样数据的最高出现次数有两个或以上相同时,将出现次数相同的频段中,频率最高的与会者作为当前发言人,并突出显示其对应的视频窗口。实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验,并使得当前发言人的锁定更加准确。
进一步地,所述确定单元21,还用于当最高次数的音频采样数据对应的频段相同时,确定相同频段的背景噪音的频率;
所述处理单元22,还用于将背景噪音的频率最大的音频采样数据所对应的与会者作为当前发言人。
例如,存在3个与会者A、B和C,从中获取的与会者A的出现次数最高的为高频段,与会者B的出现次数最高的为低频段,与会者C的出现次数最高的为低频段。确定与会者A的高频段出现次数为3次,确定与会者B的中频段出现次数为4次,确定与会者C的低频段出现次数为4次,则确定存在最高出现次数相同的频段,在确定的频段中有最高出现次数相同的频段时,获取最高出现次数相同的频段的音频采样数据的背景噪音的频率,例如,获取与会者B和与会者C的音频采样数据的背景噪音的频率,若分别为100HZ和120HZ,则将背景噪音的频率最大的音频采样数据对应的与会者C作为当前发言人。突出显示与会者C的视频窗口。
本实施例通过确定的各个与会者的音频采样数据的最高出现次数相同时,且最高的频段相同时,将频段相同的音频数据中背景噪音频率最大的音频采样数据对应的与会者作为当前发言人,并突出显示所述当前发言人的视频窗口。实现视频会议客户端的显示画面的自动切换,有效地、快速地确定并在视频会议客户端的显示画面中显示当前发言人,提高了视频会议客户端的体验,并使得当前发言人的锁定更加准确。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种视频会议中视频窗口的调整方法,其特征在于,所述视频会议中视频窗口的调整方法包括以下步骤:
获取所有与会者的音频数据;
对获取的各个与会者的音频数据进行采样生成音频采样数据,分别统计各个与会者的音频采样数据在预设频段中出现的次数;
根据各个与会者的音频采样数据在预设频段中出现的次数,确定在预设频段中出现的次数最高的音频采样数据,将最高次数的音频采样数据所对应的与会者确定为当前发言人,并突出显示所述当前发言人对应的视频窗口;
其中,当最高次数的音频采样数据为两个或两个以上时,确定最高次数的音频采样数据对应的频段中频率最高的频段;在最高次数的音频采样数据的频段中,将频率最高的频段的音频采样数据所对应的与会者确定为当前发言人。
2.如权利要求1所述的视频会议中视频窗口的调整方法,其特征在于,所述将最高次数对应的频段中频率最高的频段对应的音频采样数据所对应的与会者确定为当前发言人的步骤包括:
当最高次数的音频采样数据对应的频段相同时,确定相同频段的背景噪音的频率;
将背景噪音的频率最大的音频采样数据所对应的与会者作为当前发言人。
3.如权利要求1或2中任一项所述的视频会议中视频窗口的调整方法,其特征在于,所述突出显示的方式包括:
只显示所述当前发言人的视频窗口;
或以大于其他发言人视频窗口画面的比例显示所述当前发言人的视频窗口;
或以预设标识显示所述当前发言人的视频窗口。
4.一种视频会议中视频窗口的调整装置,其特征在于,所述视频窗口的调整装置包括:
获取模块,用于获取所有与会者的音频数据;
处理模块,用于对获取的各个与会者的音频数据进行采样生成音频采样数据,分别统计各个与会者的音频采样数据在预设频段中出现的次数;还用于根据各个与会者的音频采样数据在预设频段中出现的次数确定当前发言人;
显示模块,用于突出显示所述当前发言人对应的视频窗口;
其中,所述处理模块包括确定单元和处理单元,
所述确定单元,用于确定在预设频段中出现的次数最高的音频采样数据;
所述处理单元,用于将最高次数的音频采样数据所对应的与会者确定为当前发言人;
且,所述确定单元,还用于当最高次数的音频采样数据为两个或两个以上时,确定最高次数的音频采样数据对应的频段中频率最高的频段;
所述处理单元,还用于当在预设频段中出现最高次数的音频采样数据为两个或两个以上时,在最高次数的音频采样数据的频段中,将频率最高的频段的音频采样数据所对应的与会者确定为当前发言人。
5.如权利要求4所述的视频会议中视频窗口的调整装置,其特征在于,所述确定单元,还用于当最高次数对应的频段中频率最高的频段相同时,确定频段最高的频段背景噪音的频率;
所述处理单元,还用于将背景噪音的频率最大的音频采样数据所对应的与会者作为当前发言人。
6.如权利要求4或5中任一项所述的视频会议中视频窗口的调整装置,其特征在于,所述显示模块,还用于只显示所述当前发言人的视频窗口;
或以大于其他发言人视频窗口画面的比例显示所述当前发言人的视频窗口;
或以预设标识显示所述当前发言人的视频窗口。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410776179.XA CN105791738B (zh) | 2014-12-15 | 2014-12-15 | 视频会议中视频窗口的调整方法及装置 |
PCT/CN2014/094598 WO2016095244A1 (zh) | 2014-12-15 | 2014-12-23 | 视频会议中视频窗口的调整方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410776179.XA CN105791738B (zh) | 2014-12-15 | 2014-12-15 | 视频会议中视频窗口的调整方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105791738A CN105791738A (zh) | 2016-07-20 |
CN105791738B true CN105791738B (zh) | 2019-03-12 |
Family
ID=56125700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410776179.XA Active CN105791738B (zh) | 2014-12-15 | 2014-12-15 | 视频会议中视频窗口的调整方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105791738B (zh) |
WO (1) | WO2016095244A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107734286B (zh) | 2016-08-12 | 2021-05-04 | 阿里巴巴集团控股有限公司 | 视频窗口的展示方法及装置 |
CN107396036A (zh) * | 2017-09-07 | 2017-11-24 | 北京小米移动软件有限公司 | 视频会议中视频处理方法及终端 |
CN107682752B (zh) * | 2017-10-12 | 2020-07-28 | 广州视源电子科技股份有限公司 | 视频画面显示的方法、装置、系统、终端设备及存储介质 |
CN111651632A (zh) * | 2020-04-23 | 2020-09-11 | 深圳英飞拓智能技术有限公司 | 视频会议中发言人音视频输出方法及装置 |
CN111596985B (zh) * | 2020-04-24 | 2023-03-14 | 腾讯科技(深圳)有限公司 | 多媒体会议场景下的界面显示方法、装置、终端及介质 |
CN112380234A (zh) * | 2020-11-03 | 2021-02-19 | 广州迈聆信息科技有限公司 | 视频会议的窗口查找、显示方法和装置及视频会议系统 |
CN112351237A (zh) * | 2020-11-05 | 2021-02-09 | 安徽马钢和菱实业有限公司 | 一种视频会议主视频自动切换决策算法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7355623B2 (en) * | 2004-04-30 | 2008-04-08 | Microsoft Corporation | System and process for adding high frame-rate current speaker data to a low frame-rate video using audio watermarking techniques |
US7664246B2 (en) * | 2006-01-13 | 2010-02-16 | Microsoft Corporation | Sorting speakers in a network-enabled conference |
CN101080000A (zh) * | 2007-07-17 | 2007-11-28 | 华为技术有限公司 | 视频会议中显示发言人的方法、系统、服务器和终端 |
CN101478642A (zh) * | 2009-01-14 | 2009-07-08 | 镇江畅联通信科技有限公司 | 视频会议系统的多画面混图方法及装置 |
US8395653B2 (en) * | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
CN102647578B (zh) * | 2011-02-17 | 2014-08-13 | 鸿富锦精密工业(深圳)有限公司 | 视频切换系统及方法 |
US9030520B2 (en) * | 2011-06-20 | 2015-05-12 | Polycom, Inc. | Automatic camera selection for videoconferencing |
US9293151B2 (en) * | 2011-10-17 | 2016-03-22 | Nuance Communications, Inc. | Speech signal enhancement using visual information |
US9491404B2 (en) * | 2011-10-27 | 2016-11-08 | Polycom, Inc. | Compensating for different audio clocks between devices using ultrasonic beacon |
CN103297743A (zh) * | 2012-03-05 | 2013-09-11 | 联想(北京)有限公司 | 一种视频会议显示窗口调整方法及视频会议服务设备 |
CN102857732B (zh) * | 2012-05-25 | 2015-12-09 | 华为技术有限公司 | 一种多画面视讯会议中的画面控制方法、设备及系统 |
-
2014
- 2014-12-15 CN CN201410776179.XA patent/CN105791738B/zh active Active
- 2014-12-23 WO PCT/CN2014/094598 patent/WO2016095244A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN105791738A (zh) | 2016-07-20 |
WO2016095244A1 (zh) | 2016-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105791738B (zh) | 视频会议中视频窗口的调整方法及装置 | |
EP3282669B1 (en) | Private communications in virtual meetings | |
US9264660B1 (en) | Presenter control during a video conference | |
KR102054173B1 (ko) | 화상 회의 동안 발표자 디스플레이 | |
JP6151273B2 (ja) | 動的な能動的参加者が無制限のテレビ会議 | |
US11250858B2 (en) | Transcription presentation of communication sessions | |
CN106027589B (zh) | 视频与音频处理装置及其视频会议系统 | |
US8606249B1 (en) | Methods and systems for enhancing audio quality during teleconferencing | |
US8878678B2 (en) | Method and apparatus for providing an intelligent mute status reminder for an active speaker in a conference | |
US10924709B1 (en) | Dynamically controlled view states for improved engagement during communication sessions | |
TWI504272B (zh) | 視訊會議系統及其顯示配置方法 | |
EP2018058A1 (en) | Method for displaying speaker in video conference and device and system thereof | |
WO2014180371A1 (zh) | 一种会议控制方法、装置及会议系统 | |
US20180048683A1 (en) | Private communications in virtual meetings | |
US20160134428A1 (en) | User Device Evaluation for Online Meetings | |
WO2012103820A2 (zh) | 视频会议中突显关注者的方法、设备及系统 | |
US9478233B2 (en) | Speech fragment detection for management of interaction in a remote conference | |
EP2973559A1 (en) | Audio transmission channel quality assessment | |
WO2015180330A1 (zh) | 音量调节方法及装置、多点控制单元 | |
WO2019143429A1 (en) | Noise reduction in an audio system | |
CN105141882B (zh) | 一种显示控制方法及装置 | |
CN105592286B (zh) | 即时通信界面信息处理方法及装置 | |
KR102069695B1 (ko) | 분산 텔레프레즌스 서비스 제공 방법 및 장치 | |
CN113572898B (zh) | 语音通话中的无声异常检测方法及对应的装置 | |
CN108833825A (zh) | 视频会议发言人终端的确定方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |