发明内容
鉴于以上内容,有必要提供一种视频切换系统,可有效控制视频会议中的视频切换灵敏度。
此外,还有必要提供一种视频切换方法,可有效控制视频会议中的视频切换灵敏度。
本发明实施方式中提供的视频切换系统,用于在多个与会者参与的视频会议中切换视频画面。所述视频切换系统包括侦测模块、主讲者确定模块、计算模块、切换模块及调整模块。侦测模块用于根据参考时间在所述视频会议的音频信息中侦测讲话信息,所述参考时间是指被视为讲话者所需要讲话的最短时长。主讲者确定模块用于根据所述讲话信息确定所述多个与会者中全部讲话者中的主讲者。计算模块用于计算画面切换频率,所述画面切换频率是固定时间内视频画面切换次数。切换模块用于根据所述画面切换频率决定是否切换至主讲者画面。所述计算模块还用于当决定切换至所述主讲者画面后计算反应时间,所述反应时间是所述主讲者开始讲话时间点离切换至所述主讲者画面时间点之间的时间差。调整模块用于依所述画面切换频率与所述反应时间调整所述参考时间。
优选地,所述主讲者确定模块包括排序子模块与确定子模块。排序子模块用于根据所述讲话信息分析所述多个与会者中全部讲话者的对话行为以产生全部讲话者的优先顺序。确定子模块用于根据所述讲话信息判断全部讲话者的数量是否等于1以及当全部讲话者的数量多于1时判断全部讲话者的优先顺序是否相等,以决定所述主讲者。
优选地,所述确定子模块还用于当全部讲话者的数量等于1时判定当前讲话者为主讲者,当全部讲话者的优先顺序相等时判定目前有讲话且讲话最久的人为主讲者,当全部讲话者的优先顺序不相等时判定优先顺序最高者为主讲者。
优选地,所述切换模块还用于当所述画面切换频率高于切换标准值时不切换至所述主讲者画面,当所述画面切换频率不高于所述切换标准值时切换至所述主讲者画面。
优选地,所述调整模块还用于当所述画面切换频率高于所述切换标准值时增加所述参考时间以降低视频切换灵敏度,当所述反应时间超过反应标准值时减少所述参考时间以提高视频切换灵敏度。
优选地,当所述画面切换频率高于所述切换标准值时,所述调整模块将所述参考时间增加:灵敏度调整基本单位*所述画面切换频率/所述切换标准值。当所述反应时间超过所述反应标准值时,所述调整模块将所述参考时间减少:灵敏度调整基本单位*所述反应时间/所述反应标准值。
本发明实施方式中提供的视频切换方法,用于在多个与会者参与的视频会议中切换视频画面,所述视频切换方法包括以下步骤:根据参考时间在所述视频会议的音频信息中侦测讲话信息,其中所述参考时间是指被视为讲话者所需要讲话的最短时长;根据所述讲话信息确定所述多个与会者中全部讲话者中的主讲者;计算画面切换频率,所述画面切换频率是固定时间内视频画面切换次数;根据所述画面切换频率决定是否切换至主讲者画面;当决定切换至所述主讲者画面后计算反应时间,所述反应时间是所述主讲者开始讲话时间点离切换至主讲者画面时间点之间的时间差;及依所述反应时间与所述画面切换频率调整所述参考时间。
优选地,根据所述讲话信息确定所述多个与会者中全部讲话者中的主讲者的步骤包括:根据所述讲话信息分析所述多个与会者中全部讲话者的对话行为以产生全部讲话者的优先顺序;及根据所述讲话信息判断全部讲话者的数量是否等于1以及当全部讲话者的数量多于1时判断全部讲话者的优先顺序是否相等,以决定所述主讲者。
优选地,所述根据所述讲话信息确定所述多个与会者中全部讲话者中的主讲者的步骤还包括:当全部讲话者的数量等于1时判定当前讲话者为主讲者;当全部讲话者的优先顺序相等时判定目前有讲话且讲话最久的人为主讲者;及当全部讲话者的优先顺序不相等时判定优先顺序最高者为主讲者。
优选地,根据所述画面切换频率决定是否切换至主讲者画面的步骤包括:当所述画面切换频率高于切换标准值时不切换至所述主讲者画面;及当所述画面切换频率不高于所述切换标准值时切换至所述主讲者画面。
优选地,依所述反应时间与所述画面切换频率调整所述参考时间的步骤包括:当所述画面切换频率高于所述切换标准值时增加所述参考时间以降低视频切换灵敏度;及当所述反应时间超过反应标准值时减少所述参考时间以提高视频切换灵敏度。
相较于现有技术,本实施方式中的视频切换系统及方法,依反应时间与画面切换频率动态调整参考时间,进而动态调整视频切换灵敏度,不仅反应速度快,有人讲话即切换至主讲者画面,而且能避免视频画面切换过于频繁。
具体实施方式
图1为本发明视频切换系统一实施方式的环境图。在本实施方式中,视频切换系统可应用于集中式的视频会议系统10中,视频会议系统10包括多个视频会议终端(Video Conference Terminal)11、12、13、14(图中仅示出4个)以及一个多点控制单元(Multi-pointControl Unit,MCU)15。多个视频会议终端11、12、13、14分别位于不同的地方,每个地方都有至少一个与会者。每个视频会议终端11、12、13、14分别采集各自所处地方的视频信息与音频信息并经由多点控制单元15传送至其它的视频会议终端,以及经由多点控制单元15从其它视频会议终端接收其它地方的视频信息与音频信息。
多点控制单元15可控制每个视频会议终端11、12、13、14在本地显示设备上显示一个或多个地方的视频画面,还可根据与会者的讲话状况控制每个视频会议终端11、12、13、14切换视频画面。
在本实施方式中,多点控制单元15先从多个视频会议终端11、12、13、14收集视频会议的音频信息,再根据参考时间在视频会议的音频信息中侦测讲话信息。其中,所述参考时间是指被视为讲话者所需要讲话的最短时长,如1秒。应当注意的是,所述参考时间与视频切换灵敏度为负相关,当参考时间越大,则视频切换灵敏度越低,当参考时间越小,则视频切换灵敏度越高。
然后,多点控制单元15根据讲话信息确定多个与会者中全部讲话者中的主讲者。具体而言,多点控制单元15先根据讲话信息分析多个与会者中全部讲话者的对话行为以产生全部讲话者的优先顺序,再根据讲话信息判断全部讲话者的数量是否等于1以及当全部讲话者的数量多于1时判断全部讲话者的优先顺序是否相等,以决定主讲者。其中,当全部讲话者的数量等于1时判定当前讲话者为主讲者,当全部讲话者的优先顺序相等时判定目前有讲话且讲话最久的人为主讲者,当全部讲话者的优先顺序不相等时判定优先顺序最高者为主讲者。
然后,多点控制单元15再计算画面切换频率,其中画面切换频率是固定时间内(如5秒内)视频画面切换次数。
接着,多点控制单元15根据画面切换频率决定是否切换至主讲者画面。所述主讲者画面是指主讲者所处地方的视频会议终端所采集的视频画面。当画面切换频率高于切换标准值(如每5秒1次)时不切换至主讲者画面,当画面切换频率不高于切换标准值时切换至主讲者画面。
当切换至主讲者画面后,多点控制单元15再进一步计算反应时间,所述反应时间是指主讲者开始讲话时间点离切换至主讲者画面时间点之间的时间差。
最后,多点控制单元15依反应时间与画面切换频率调整参考时间。具体而言,当画面切换频率调整高于切换标准值(如每5秒1次)时增加参考时间以降低视频切换灵敏度,当反应时间超过反应标准值(如1.5秒)时减少参考时间以提高视频切换灵敏度。
在本实施方式中,切换至主讲者画面可以有多种表现方式,例如,可以将主讲者画面用加粗的外框标示,或将主讲者画面放大至全屏等等。
图2为本发明视频切换系统另一实施方式的环境图。在本实施方式中,视频切换系统应用于分散式的视频会议系统20中,视频会议系统20包括多个视频会议终端21、22、23、24(图中仅示出4个)。多个视频会议终端21、22、23、24分别位于不同的地方,每个地方都有至少一个与会者。每个视频会议终端21、22、23、24分别采集各自所处地方的视频信息与音频信息并传送至其它的视频会议终端,以及从其它视频会议终端接收其它地方的视频信息与音频信息。
每个视频会议终端21、22、23、24均可在本地显示设备上显示一个或多个地方的视频画面,并根据与会者的讲话状况切换本地显示设备上显示的视频画面。
在本实施方式中,每个视频会议终端21、22、23、24先收集视频会议的音频信息,再根据参考时间在视频会议的音频信息中侦测讲话信息。其中,所述参考时间是指被视为讲话者所需要讲话的最短时长,如1秒。
然后,每个视频会议终端21、22、23、24根据讲话信息确定多个与会者中全部讲话者中的主讲者。具体而言,每个视频会议终端21、22、23、24先根据讲话信息分析多个与会者中全部讲话者的对话行为以产生全部讲话者的优先顺序,再根据讲话信息判断全部讲话者的数量是否等于1以及当全部讲话者的数量多于1时判断全部讲话者的优先顺序是否相等,以决定主讲者。其中,当全部讲话者的数量等于1时判定当前讲话者为主讲者,当全部讲话者的优先顺序相等时判定目前有讲话且讲话最久的人为主讲者,当全部讲话者的优先顺序不相等时判定优先顺序最高者为主讲者。
然后,每个视频会议终端21、22、23、24再计算画面切换频率,其中画面切换频率是固定时间内(如5秒内)视频画面切换次数。
接着,每个视频会议终端21、22、23、24根据画面切换频率决定是否切换至主讲者画面。所述主讲者画面是指主讲者所处地方的视频会议终端所采集的视频画面。当画面切换频率高于切换标准值(如每5秒1次)时不切换至主讲者画面,当画面切换频率不高于切换标准值(如每5秒1次)时切换至主讲者画面。
当切换至所述主讲者画面后,每个视频会议终端21、22、23、24再进一步计算反应时间,所述反应时间是指主讲者开始讲话时间点离切换至主讲者画面时间点之间的时间差。
最后,每个视频会议终端21、22、23、24依反应时间与画面切换频率调整参考时间。具体而言,当画面切换频率高于切换标准值(如每5秒1次)时增加参考时间以降低视频切换灵敏度,当反应时间超过反应标准值(如1.5秒)时减少参考时间以提高视频切换灵敏度。
图3为本发明视频切换系统100一实施方式的模块图。本实施方式中的视频切换系统100可应用于图1中多点控制单元15,也可应用于图2中任一个视频会议终端21、22、23、24中。
在本发明一具体实施方式中,视频切换系统100包括侦测模块110、主讲者确定模块120、计算模块140、切换模块150、调整模块160、存储器170及处理器180。处理器180用于执行侦测模块110、主讲者确定模块120、计算模块140、切换模块150、调整模块160。存储器170用于存储视频会议中的相关资料,如音频信息、视频信息、参考时间、画面切换频率等。其中,所述参考时间是指被视为讲话者所需要讲话的最短时长,如1秒。应当注意的是,所述参考时间与视频切换灵敏度为负相关,当参考时间越大,则视频切换灵敏度越低,当参考时间越小,则视频切换灵敏度越高。
侦测模块110用于根据参考时间在视频会议的音频信息中侦测讲话信息。举例而言,假定参考时间为1秒,则当侦测模块110在视频会议的音频信息中侦测到某个与会者的声音持续时间超过1秒,则该与会者即被视为讲话者。
主讲者确定模块120用于根据讲话信息确定多个与会者中全部讲话者中的主讲者。在本实施方式中,主讲者确定模块120包括排序子模块121与确定子模块122。
排序子模块121用于根据讲话信息分析多个与会者中全部讲话者的对话行为以产生全部讲话者的优先顺序。在本发明一具体实施例中,排序子模块121可根据图4中的三种情况来确定与会者B的优先顺序大于与会者A的优先顺序,图4中与会者B与A对应的直线分别代表与会者B与A讲话。第一种情况为:当与会者A讲话时,与会者B中间插话进来,与会者A马上就停止讲话,这时即可确定与会者B的优先顺序大于与会者A的优先顺序。第二种情况为:当与会者B讲话时,与会者A中间突然说话,与会者B依旧继续讲话,而与会者A很快就停止说话,这时即可确定与会者B的优先顺序大于与会者A的优先顺序。第三种情况为:当确定与会者B停止讲话后(如当与会者B讲话停止5秒后),与会者A才开始讲话,这时即可确定与会者B的优先顺序大于与会者A的优先顺序。
确定子模块122用于根据讲话信息判断全部讲话者的数量是否等于1以及当全部讲话者的数量多于1时判断全部讲话者的优先顺序是否相等,以决定主讲者。在本实施方式中,当全部讲话者的数量等于1时判定当前讲话者为主讲者,当全部讲话者的优先顺序相等时判定目前有讲话且讲话最久的人为主讲者,当全部讲话者的优先顺序不相等时判定优先顺序最高者为主讲者。
计算模块140用于计算画面切换频率。其中,所述画面切换频率是固定时间内(如5秒内)视频画面切换次数。在本实施方式中,虽然主讲者确定模块120确定主讲者后还未决定是否切换至所述主讲者画面,但计算模块140在计算画面切换频率时会假定已切换至所述主讲者画面,并将此假定切换结果加入最终画面切换频率的计算结果。举例来讲,在确定与会者B为主讲者之前5秒内,视频画面已切换至主讲者A的视频画面,则计算模块140计算的画面切换频率为每5秒2次,因为加入了切换至与会者B的视频画面的假定结果。若在确定与会者B为主讲者之前5秒内,视频画面根本没有切换过,则计算模块140计算的画面切换频率为每5秒1次,因为加入了切换至与会者B的视频画面的假定结果。
切换模块150用于根据所述画面切换频率决定是否切换至主讲者画面。其中所述主讲者画面是指主讲者所处地方的视频会议终端所采集的视频画面。当所述画面切换频率调整高于切换标准值(如5秒1次)时不切换至主讲者画面,当所述画面切换频率调整不高于切换标准值时切换至主讲者画面。
当切换至所述主讲者画面后,计算模块140还用于计算反应时间,所述反应时间是主讲者开始讲话时间点离切换至主讲者画面时间点之间的时间差。如图5所示,tb为主讲者A开始讲话时间点,ts为切换至主讲者A画面的时间点,相应地,tb与ts之间的时间差r即为反应时间。
调整模块160用于依画面切换频率与反应时间调整参考时间。其中,当画面切换频率高于切换标准值(如每5秒1次)时增加参考时间,当反应时间超过反应标准值(如1.5秒)时减少参考时间。在本实施方式中,当画面切换频率高于切换标准值时,调整模块160将参考时间增加:灵敏度调整基本单位*(所述画面切换频率/所述切换标准值);当反应时间超过反应标准值时,调整模块160将参考时间减少:灵敏度调整基本单位*(反应时间/反应标准值)。其中,所述灵敏度调整基本单元可根据需要进行设定,如1秒。
图6为本发明视频切换方法一实施方式的流程图。本实施方式中的视频切换方法是通过图3中的功能模块来实施。
在步骤S100,侦测模块110根据参考时间在视频会议的音频信息中侦测讲话信息。所述参考时间是指被视为讲话者所需要讲话的最短时长。举例而言,假定参考时间为1秒,则当侦测模块110在视频会议的音频信息中侦测到某个与会者的声音持续时间超过1秒,则该与会者即被视为讲话者。
在步骤S102,主讲者确定模块120根据讲话信息分析多个与会者中全部讲话者的对话行为以产生全部讲话者的优先顺序。
在步骤S104,主讲者确定模块120根据讲话信息判断全部讲话者的数量是否等于1。
若全部讲话者的数量等于1,则在步骤S106,主讲者确定模块120判定当前讲话者为主讲者。
若全部讲话者的数量多于1,则在步骤S108,主讲者确定模块120继续判断全部讲话者的优先顺序是否相等。
若全部讲话者的优先顺序不相等,则在步骤S110,主讲者确定模块120判定优先顺序最高者为主讲者。
若当全部讲话者的优先顺序相等,则在步骤S112,主讲者确定模块120判定目前有讲话且讲话最久的人为主讲者。
总的来讲,从步骤S102至步骤S110即是主讲者确定模块120根据讲话信息确定多个与会者中全部讲话者中的主讲者。
在步骤S114,计算模块140计算画面切换频率。其中,所述画面切换频率是固定时间内(如5秒内)视频画面切换次数。
在步骤S116,切换模块150判断画面切换频率是否高于切换标准值(如5秒1次),以决定是否切换至主讲者画面。其中所述主讲者画面是指主讲者所处地方的视频会议终端所采集的视频画面。
若所述画面切换频率高于切换标准值,则切换模块150不切换至主讲者画面。相应地,在步骤S126,调整模块160增加参考时间以降低视频切换灵敏度。在本实施方式中,调整模块160将所述参考时间增加:灵敏度调整基本单位*(所述画面切换频率/所述切换标准值),其中,所述灵敏度调整基本单元可为1秒。
若所述画面切换频率调整不高于切换标准值,则在步骤S118,切换模块150切换至主讲者画面。
在步骤S120,计算模块140计算反应时间,所述反应时间是主讲者开始讲话时间点离切换至主讲者画面时间点之间的时间差。
在步骤S122,调整模块160判断反应时间是否超过反应标准值(如1.5秒)。
若反应时间超过反应标准值(如1.5秒),则在步骤S128,调整模块160减少参考时间以提高视频切换灵敏度。在本实施方式中,调整模块160将所述参考时间减少:灵敏度调整基本单位*(所述反应时间/所述反应标准值),其中,所述灵敏度调整基本单元可为1秒。
总的来讲,步骤S126与步骤S128即是调整模块160依画面切换频率与反应时间动态调整参考时间,进而动态调整视频切换灵敏度。
若反应时间未超过反应标准值,则在步骤S124,视频切换系统100判断视频会议是否结束。
若视频会议未结束,则回到步骤S100,侦测模块110继续根据调整后的参考时间在视频会议的音频信息中侦测讲话信息,重复步骤S102-128,直到视频会议结束。
图7为本发明视频切换方法另一实施方式的流程图。本实施方式中的视频切换方法与图6中的视频切换方法相同,差别仅在于步骤S218、S220、S222与步骤S118、S120、S122的顺序有所不同。
在步骤S218,计算模块140计算反应时间,所述反应时间是主讲者开始讲话时间点离决定切换至主讲者画面时间点之间的时间差。所述决定切换至主讲者画面时间点即确定画面切换频率不高于切换标准值的时间点。
在步骤S220,调整模块160判断反应时间是否超过反应标准值(如1.5秒)。
若反应时间未超过反应标准值,则在步骤S222,切换模块150切换至主讲者画面。
应当注意的是,当决定切换至主讲者画面后,实际切换至主讲者画面的时间很短,几乎可以忽略,所以图6中步骤S120计算所得的反应时间可以等效于图7中步骤S218计算所得的反应时间,即:主讲者开始讲话时间点离实际切换至主讲者画面时间点之间的时间差可以等效于主讲者开始讲话时间点离决定切换至主讲者画面时间点之间的时间差。
综上所述,本实施方式中的视频切换系统100及视频切换方法,依反应时间与画面切换频率动态调整参考时间,由于参考时间与视频切换灵敏度为负相关,因而可以达到动态调整视频切换灵敏度的目的。故,视频切换系统100及视频切换方法不仅反应速度快,有人讲话即切换至主讲话画面,而且能避免视频画面切换过于频繁,从而改善视频会议中与会者的视觉体验。