CN111586337A - 音视频会议系统、控制方法、设备及存储介质 - Google Patents

音视频会议系统、控制方法、设备及存储介质 Download PDF

Info

Publication number
CN111586337A
CN111586337A CN201910120726.1A CN201910120726A CN111586337A CN 111586337 A CN111586337 A CN 111586337A CN 201910120726 A CN201910120726 A CN 201910120726A CN 111586337 A CN111586337 A CN 111586337A
Authority
CN
China
Prior art keywords
audio
target
conference
equipment
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910120726.1A
Other languages
English (en)
Other versions
CN111586337B (zh
Inventor
朱滨
李帅
祁越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910120726.1A priority Critical patent/CN111586337B/zh
Publication of CN111586337A publication Critical patent/CN111586337A/zh
Application granted granted Critical
Publication of CN111586337B publication Critical patent/CN111586337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1069Session establishment or de-establishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1076Screening of IP real time communications, e.g. spam over Internet telephony [SPIT]
    • H04L65/1079Screening of IP real time communications, e.g. spam over Internet telephony [SPIT] of unsolicited session attempts, e.g. SPIT
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • H04L67/125Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/667Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/155Conference systems involving storage of or access to video conference sessions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请实施例提供一种音视频会议系统、控制方法、设备及存储介质,该系统包括服务器以及可供布设于不同会场或位置的多个会议设备,多个会议设备中包含主控设备和受控设备;主控设备用于按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求;服务器用于将主控参数发送给目标会场中的目标受控设备;以及将目标受控设备回传的符合播放要求的音视频内容共享至主控设备,以供主控设备输出;目标受控设备用于按照主控参数调整其音视频采集组件的工作状态,基于工作状态调整后的音视频采集组件采集目标会场的音视频内容并将音视频内容回传至服务器。这使得多个会场间的交互更加灵活,可有效改善会议效果。

Description

音视频会议系统、控制方法、设备及存储介质
技术领域
本申请涉及通信技术领域,尤其涉及一种音视频会议系统、控制方法、设备及存储介质。
背景技术
随着企业全球化扩张及生态系统的多元化,跨地区跨国的实时音视频会议的需求越来越多。
目前,为了实现多会场之间的音视频会议,可在多个会场分别布设会议设备,由会场设备采集并分享会场内的音视频内容。但是,在音视频会议中,多个会场间的交互不够灵活,会议效果并不佳。
发明内容
本申请的多个方面提供一种音视频会议系统、控制方法、设备及存储介质,用以提高音视频会议中多个会场间的交互灵活性。
本申请实施例提供一种音视频会议系统,包括服务器以及可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备;
所述主控设备用于按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求,所述主控请求中包含与所述播放要求对应的主控参数;
所述服务器用于将所述主控参数发送给所述目标会场中的目标受控设备;以及将所述目标受控设备回传的符合所述播放要求的音视频内容共享至所述主控设备,以供所述主控设备输出;
所述目标受控设备用于按照所述主控参数调整其音视频采集组件的工作状态,基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容并将所述音视频内容回传至所述服务器。
本申请实施例还提供一种音视频会议控制方法,适用于音视频会议系统中的主控设备,所述音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备,所述方法包括:
按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求,所述主控请求中包含与所述播放要求对应的主控参数,以供所述服务器基于所述主控参数控制所述目标会场中的目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
接收并输出所述服务器共享的所述目标会场的符合所述播放要求的音视频内容。
本申请实施例还提供一种音视频会议控制方法,适用于音视频会议系统中的服务器,音视频会议系统中还包括可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备,所述方法包括:
接收所述主控设备按照对目标会场的音视频内容的播放要求而发送的主控请求,所述主控请求中包含与所述播放要求对应的主控参数;
将所述主控参数发送给所述目标会场中的目标受控设备,以控制所述目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
将所述目标受控设备回传的符合所述播放要求的音视频内容共享至所述主控设备,以供所述主控设备输出。
本申请实施例还提供一种音视频会议控制方法,适用于音视频会议系统中的受控设备,所述音视频会议系统中包括服务器和可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备,所述方法包括:
接收所述服务器基于所述主控设备对目标会场的主控请求而发送的主控参数,所述主控参数与对所述目标会场的音视频内容的播放要求相对应;
按照所述主控参数调整其音视频采集组件的工作状态;
基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容并将所述音视频内容回传至所述服务器,以使所述服务器将所述音视频内容共享至所述主控设备。
本申请实施例还提供一种音视频会议控制方法,适用于音视频会议系统中的次控设备,所述音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含次控设备和受控设备,所述次控设备布设在任意会场中,当所述次控设备所在的目标会场中包括目标受控设备时,所述方法包括:
响应所述次控设备操作者对所述目标会场的音视频内容的播放要求,获取与所述播放要求相对应的次控参数;
向所述目标受控设备发送次控参数,以期望控制所述目标受控设备按照所述目标次控设备操作者的播放要求采集所述目标会场的音视频内容。
本申请实施例还提供一种电子设备,包括存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器及所述通信组件耦合,用于执行所述一条或多条计算机指令,以用于:
按照对目标会场的音视频内容的播放要求,通过所述通信组件向音视频会议系统中的服务器发送主控请求,所述主控请求中包含与所述播放要求对应的主控参数,以供所述服务器基于所述主控参数控制所述目标会场中的目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
接收并输出所述服务器共享的所述目标会场的符合所述播放要求的音视频内容。
本申请实施例还提供一种服务器,包括存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器及所述通信组件耦合,用于执行所述一条或多条计算机指令,以用于:
通过所述通信组件接收音视频会议系统中的主控设备发送的主控请求,所述主控请求为所述主控设备按照对目标会场的音视频内容的播放要求而发送的,所述主控请求中包含与所述播放要求对应的主控参数;
通过所述通信组件将所述主控参数发送给所述目标会场中的目标受控设备,以控制所述目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
通过所述通信组件将所述目标受控设备回传的符合所述播放要求的音视频内容共享至所述主控设备,以供所述主控设备输出。
本申请实施例还提供一种电子设备,包括音视频采集组件、存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器、所述通信组件及所述音视频采集组件耦合,用于执行所述一条或多条计算机指令,以用于:
通过所述通信组件接收音视频会议系统中的服务器基于所述音视频会议系统中的主控设备的主控请求而发送的主控参数,所述主控参数与对所述电子设备所在目标会场的音视频内容的播放要求相对应;
按照所述主控参数调整所述音视频采集组件的工作状态,;
基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容;
通过所述通信组件将采集到的符合所述播放要求的音视频内容回传至所述服务器,以使所述服务器将所述音视频内容共享至所述主控设备。
本申请实施例还提供一种电子设备,包括存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器及所述通信组件耦合,用于执行所述一条或多条计算机指令,以用于:
响应所述电子设备操作者对所述电子设备所在的目标会场的音视频内容的播放要求,获取与所述播放要求相对应的次控参数;
向所述目标会场中的目标受控设备发送次控参数,以期望控制所述目标受控设备按照所述电子设备操作者的播放要求采集所述目标会场的音视频内容。
本申请实施例还提供一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行前述的音视频会议控制方法。
在本申请实施例中,通过音视频会议系统中布设主控设备,可由主控设备按照对多个会场中的任意目标会场的音视频内容的播放要求,向服务器发送控制请求,服务器可基于主控设备的控制请求,控制目标会场中的目标受控设备进行音视频采集组件的工作状态调整,以使目标受控设备按照所述播放要求采集目标会场的音视频内容。据此,本申请实施例中,可基于主控设备宏观调控多个会场中的音视频内容采集过程,这使得音视频会议系统中多个会场的音视频内容的播放效果更具可控性,多个会场间的交互更加灵活,不再受到地域限制,可有效改善会议效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一实施例提供的一种音视频会议系统的结构示意图;
图2为本申请一实施例提供的另一种音视频会议系统的结构示意图;
图3为本申请一实施例提供的一种音视频会议系统的使用场景示意图;
图4a为本申请一实施例提供的第一类设备的结构示意图;
图4b为本申请一实施例提供的第二类设备的结构示意图;
图4c为本申请一实施例提供的一种主板芯片的端口使用状态示意图;
图5为本申请另一实施例提供的一种音视频会议控制方法的流程示意图;
图6为本申请又一实施例提供的另一种音视频会议控制方法的流程示意图;
图7为本申请又一实施例提供的又一种音视频会议控制方法的流程示意图;
图8为本申请又一实施例提供的又一种音视频会议控制方法的流程示意图;
图9为本申请又一实施例提供的一种电子设备的结构示意图;
图10为本申请又一实施例提供的一种服务器的结构示意图;
图11为本申请又一实施例提供的一种电子设备的结构示意图;
图12为本申请又一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,在音视频会议中,多个会场间的交互不够灵活,会议效果并不佳。为了解决现有技术存在的问题,在本申请的一些实施例中:通过音视频会议系统中布设主控设备,可由主控设备按照对多个会场中的任意目标会场的音视频内容的播放要求,向服务器发送控制请求,服务器可基于主控设备的控制请求,控制目标会场中的目标受控设备进行音视频采集组件的工作状态调整,以使目标受控设备按照所述播放要求采集目标会场的音视频内容。据此,本申请实施例中,可基于主控设备宏观调控多个会场中的音视频内容采集过程,这使得音视频会议系统中多个会场的音视频内容的播放效果更具可控性,多个会场间的交互更加灵活,不再受到地域限制,可有效改善会议效果。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请一实施例提供的音视频会议系统的结构示意图。如图1所示,该系统包括服务器10以及可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器10连接,多个会议设备中包含主控设备20和受控设备30。
本实施例中的会场可理解为会议子系统,会场中包含电源、网络设备等等能够支持受控设备30工作的辅助设备。不同的会场可处于不同的地域,多个会议设备可布设在不同的会场中,多个会议设备也可布设在不同位置,其中,不同位置包括同一会场中的不同位置。值得说明的是,本实施例中的会议设备是指待能够支持会议功能的一类电子设备,例如,会议设备可具有音视频采集、音视频播放或者用户交互等等中的一种或多种会议功能,当然,本实施例对各个会议设备所能支持的会议功能不作具体限定。
在一种实际应用中,可在每个会场中分别布设一个受控设备30,其中,受控设备30至少具备音视频采集功能。当然,本实施例对此并不做限定,某些会场中也可采用其它不同于本实施例中的受控设备30,但能够支持音视频采集功能的终端设备代替本实施例中的受控设备30,这种情况下,可通过制定通信协议等方式实现这些终端设备与本实施例中的主控设备20及服务器10之间的通信。为方便描述,后文中将以每个会场中均布设有本实施例提供的受控设备30为例进行技术方案的说明。
其中,在物理实现上,服务器10既可以是实体服务器,也可以是云端服务器,包括公有云、私有云/专有云、混合云提供的服务能力,也包括边缘计算场景、未来其他场景中的具有服务能力的处理设备。
另外,多个会议设备可通过互联网与服务器10连接,连接的方式包括但不限于2G/3G/4G/5G/WIFI/蓝牙1.0/2.0/3.0以及未来的6G/7G之类的通讯网络技术实现的网络连接。
在一场音视频会议中,可安排一位主持人,其中,主持人可以处在多个会场中的任意会场,本实施例中,可将主持人所在的会场中配置主控设备20。主控设备20可提供用户交互界面,主持人可对主控设备20进行操控,主控设备20可响应主持人的各种操控并获取这些操控所产生的各种指令、参数等等。为了便于主持人操控,主控设备20可采用桌面终端的形式,这样,主控设备20对主持人来说变得触手可及,从而可提供沉浸式的人际交互效果,为主持人提供流畅的操控体验。另外,主控设备20还可提供语音识别功能,主持人可基于语音指令实现对主控设备20的操控。
值得说明的是,本实施例中提及的主持人是一种泛指,在一场音视频会议中,多个会场均有可能有主持需求,而且在会议期间,主持需求可能会在多个会场之间切换,因此,主持人可指代音视频会议中具有主持需求的会场中的会议设备操作者。而对应于主持需求的切换,在音视频会议中也存在着主持人的切换。为了避免出现控制混乱的情况,在一些实际应用中,可通过主持权限传递的方式切换主持人,同时,为了支持主持需求,可在可能具有主持需求的各个会场中布设能够支持主控设备相关功能的会议设备。当然,本实施例还可采用其它方式来支持主持人切换,例如,在可能具有主持需求的各个会场中增加单独承担主控设备功能的会议设备等等,本实施例对此不作限定。为了方面描述,后文中将以其中一个获得主持权限的会场为例进行主控设备的相关阐述,但这不应造成对本申请保护范围的损失。
基于音视频会议系统中多个会场之间的音视频内容共享机制,主持人可在其会场中观看到多个会场的音视频内容,基于此,主持人可根据获取到的多个会场的音视频内容的播放效果,针对需要改进播放效果的任意目标会场提出播放要求。
对主控设备20来说,可按照对目标会场的音视频内容的播放要求,向服务器10发送主控请求,主控请求中包含与播放要求对应的主控参数。其中,目标会场可以是一个或多个,而且,主持人对不同目标会场的播放要求可不完全相同;相应地,不同目标会场对应的主控参数也可不完全相同。
本实施例中,对目标会场的音视频内容的播放要求可以是调整画面视角、提高播放精度、聚焦某位参会人员、静音等等。对目标会场的音视频内容的播放要求可来自主持人,主持人可根据实际需求对目标会场的音视频内容提出各种播放要求,当然,也可来自其它渠道,本实施例对此不作限定。后文中,将以播放要求来自主持人--也即是主控设备的操作者为例进行技术方案的阐述,但显然本实施例并不限于此,针对来自其它渠道的播放要求,主控设备可解析这类播放要求并作出响应。
基于主持人对目标会场的音视频内容的不同播放要求,主持人可通过对主控设备20进行操控以向主控设备20输入与播放要求相对应的主控参数。例如,当主持人希望调整目标会场的画面视角时,主控设备20可提供针对目标会场的摄像头控制界面,主持人可根据所需的画面视角,在该界面上触摸控制摄像头转动角度的相关控件或者向主控设备20发出语音指令,据此,主控设备20可获取到摄像头的转动角度这一主控参数。
与主持人的各种播放要求相对应地,主控参数可以包含摄像头的转动角度、焦距、分辨率或者麦克风的音量参数中的一种或多种参数。当然,这些参数类型也仅是示例性地,本实施例并不限于此,主控参数还可以包含与主持人的播放要求相对应的其它类型的参数。
基于获取到的主控参数,主控设备20可生成主控请求,并通过自身的通信组件将主控请求发送至服务器10。在一些实际应用中,主控设备20发出的主控请求中可携带目标会场的标识,以便服务器10正确地确定出主控设备20希望调控的目标会场。
对服务器10来说,根据主控设备20发送的主控请求,可将主控参数发送给目标会场中的目标受控设备。其中,正如目标会场可以是多个会场中的任意会场,目标受控设备也可以是多个受控设备30中的任意一个,据此,本文中对目标受控设备的相关描述在通常情况下适用于多个受控设备30中的任意一个。
服务器10在获取到主控设备20发送的主控请求时,可确定出目标会场及目标会场中的目标受控设备。在一种实际应用中,音视频会议系统中的多个会场中的会场设备可预先将设备标识及其所在的会场标识上报至服务器10,服务器10中可记录会场与会场设备之间的关联关系。在确定出目标受控设备后,服务器10可将主控请求中的主控参数下发至目标受控设备。可选地,服务器10可基于主控参数生成主控信令,并以主控信令的形式将主控参数发送至目标受控设备,当然,本实施例对服务器10向目标受控设备下发主控参数的形式并不限于此。
对于目标受控设备来说,在接收到服务器10下发的主控参数后,可按照主控参数调整其音视频采集组件的工作状态,基于工作状态调整后的音视频采集组件采集目标会场的音视频内容并将音视频内容回传至服务器10。其中,目标受控设备的音视频采集组件可包括摄像头、麦克风等组件。
如上文提及的,主控参数可包含多种类型的参数,以上文中提到的几种参数类型为例:
当主控参数包括摄像头的转动角度时,目标受控设备可按照转动角度调整其摄像头的拍摄角度,基于调整后的拍摄角度采集目标会场的音视频内容。
当主控参数包括摄像头的焦距时,目标受控设备可按照焦距调整其摄像头的焦距,基于调整后的焦距采集目标会场的音视频内容。
当主控参数包括摄像头的分辨率时,目标受控设备可按照分辨率调整其摄像头的拍摄精度,基于调整后的拍摄精度采集目标会场的音视频内容。
当主控参数包括音量参数时,目标受控设备可按照音量参数调整其麦克风的音量,基于调整后的音量采集目标会场的音视频内容。
值得说明的是,上文对目标受控设备响应主控参数所包含的不同类型的参数的过程进行了分别描述,但应当理解的是,目标受控设备可按照上文中多种类型的参数分别调整或者同时调整音视频采集组件的工作状态,以期将其音视频采集组件调整为能够满足主持人对目标会场中音视频内容的播放要求的工作状态。
据此,目标受控设备可基于工作状态调整后的音视频采集组件,采集到符合主持人的播放要求的音视频内容,当目标受控设备将据此采集到的音视频内容回传给服务器10时,服务器10可将目标受控设备回传的符合播放要求的音视频内容共享至主控设备20,以供主控设备20输出。当然,服务器10也可将目标受控设备回传的符合播放要求的音视频内容共享至当前会议中的其它受控设备30,以实现目标会场的音视频内容的共享,使当前会议的各个会场中所观看到的目标会议的音视频内容的播放效果随主持人的播放要求同步调整,这可大大优化会议效果。
本实施例中,通过音视频会议系统中布设主控设备,可由主控设备按照对多个会场中的任意目标会场的音视频内容的播放要求,向服务器发送控制请求,服务器可基于主控设备的控制请求,控制目标会场中的目标受控设备进行音视频采集组件的工作状态调整,以使目标受控设备按照所述播放要求采集目标会场的音视频内容。据此,本申请实施例中,可基于主控设备宏观调控多个会场中的音视频内容采集过程,这使得音视频会议系统中多个会场的音视频内容的播放效果更具可控性,多个会场间的交互更加灵活,不再受到地域限制,可有效改善会议效果。
在上述或下述实施例中,服务器10还可将当前会议的会议文档以及当前会议中的其它受控设备采集到的音视频内容共享至目标受控设备。
其中,当前会议的会议文档是指会议过程中涉及的与会议内容相关的PDF文件、图片、文本文件等等类型的文档。服务器10可将会议文档共享至各个会场,以供各个会场中的参会人员使用。另外,对于目标会场来说,其可通过目标受控设备获取到当前会议中其它会场的音视频内容并进行展示,当然,目标会场中也可展示其自身的音视频内容以供其了解自身的音视频内容采集效果。
对于目标受控设备来说,可在目标会场中展示服务器10共享的会议文档及音视频内容。根据目标受控设备的硬件实现上的不同,目标受控设备的展示方式也可能有所不同。
在一种实现方式中,目标受控设备可包含显示屏,也即显示屏集成在设备主体上。在该实现方式中,目标受控设备可利用其显示屏展示会议文档以及其它受控设备30采集到的音视频内容。
可选地,目标受控设备可采用分区的方式同时展示会议文档及音视频内容;目标受控设备也可排它性地单独展示会议文档或音视频内容,实际应用中可由其操作者对两种展示对象进行切换。当然,本实现方式中还可采用其它方式在目标受控设备的显示屏中进行会议文档及音视频内容的展示,而并不限于本文中提供的示例性方式。
在另一种实现方式中,目标受控设备可外接至少两个显示器。实际应用中,目标受控设备外接的显示器可布设在目标会场中视野开阔的位置,以便目标会场中所有的参会人员都能无障碍地观看到。在该实现方式中,目标受控设备可基于多屏异显技术,将会议文档以及其它受控设备30采集到的音视频内容发送至不同的显示器进行展示。
以目标受控设备外接两个显示器为例,目标受控设备中可装配至少两个HDMI接口,基于双屏异显技术,目标受控设备可通过两个HDMI将会议文档和音视频内容作为两条媒体流,分别传输至两个显示器,这样,在其中一个显示器中展示会议文档,而在另一个显示器中可展示音视频内容。当然,目标受控设备还可外界更多的显示器,基于更多的显示器,目标受控设备可对音视频内容进行进一步的分流,例如,可将不同会场的音视频内容传输至不同的显示器进行分别展示,本实施例对此不作限定。
另外,基于上述的目标受控设备的任意硬件实现方式,目标受控设备可基于会议文档的展示界面提供文档操作控件,目标受控设备的操作者可通过触控操作实现对会议文档的注释、画面缩放等等文档操作。目标受控设备还可将针对会议文档的文档操作数据回传至服务器10,以通过服务器10将这些文档操作共享至其它会场中的受控设备30。而服务器10中则可将这些文档操作数据与会议文档关联保存,以对相关人员提供下载服务。
本实施例中,不同的会场中可采用硬件实现方式不完全相同的受控设备30,多个会场可根据会场空间大小、参会人员数量等因素选择合适的受控设备30,以期获得更好的展示效果。
在上述或下述实施例中,目标受控设备还可在监测到目标会场中出现人声信号时,利用其麦克风阵列确定目标会场中发言人的位置;根据发言人的位置,计算将摄像头的拍摄角度对准发言人所需的摄像头的转动角度;按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准发言人。
本实施例中,目标受控设备的麦克风可采用麦克风阵列。目标受控设备可对目标会场中的各种声音进行分析,以判断目标会场中是否出现人声信号,而当发现目标会场中出现人声信号时,可基于麦克风阵列采集到的人声信号进行声源定位,以确定出目标会场中发言人与目标受控设备的相对位置。
基于此,目标受控设备可根据其摄像头的当前拍摄角度以及其与发言人的相对位置,计算出将摄像头的拍摄角度对准发言人所需的摄像头的转动角度。根据该转动角度,目标受控设备可控制器摄像头的拍摄角度对准发言人,以实现对发言人的音源跟随。这使得目标会议的音视频内容的播放画面中,画面视角随着发言人的变化自动调整,当前会议中的其它会场中可更方便地观看到发言人的相关画面,可为其它会场中参会人员提供对目标会场的场景沉浸式体验。
进一步,若发言人的发言时长超过预设时长,目标受控设备可按照预设放大倍数放大其摄像头的焦距,以对发言人进行聚焦。据此,目标受控设备可在发言人持续发言时,对发言人进行自动聚焦,更加凸显发言人的相关画面,可进一步优化前述的场景沉浸式体验。
另外,目标受控设备的麦克风阵列的拾音距离可达5-8m,支持远场拾音。
本实施例中,目标受控设备可对目标会场中的发言人进行音源跟踪及自动聚焦,使得目标会场的音视频内容的播放效果更具场景沉浸性,可进一步优化会议效果。
在上述或下述实施例中,若目标受控设备采集到的音视频内容中包含目标会场中至少一个参会人员的图像;则服务器10可基于人脸识别技术,从音视频内容中分别提取各参会人员的人脸特征;根据人脸特征与人物身份标识的关联关系,确定各参会人员的身份标识;在音视频内容中标注各参会人员的身份标识,以生成目标受控设备对应的人物标注后音视频内容;将目标受控设备对应的人物标注后音视频内容共享至当前会议中的其它受控设备,以通过其它受控设备展示目标受控设备对应的人物标注后音视频内容。
本实施例中,服务器10对目标受控设备采集到的音视频内容进行人脸识别,以从中提取出至少一个人脸特征,并可基于人脸特征确定对应的参会人员的身份标识,在此基础上,服务器10可对目标受控设备采集到的音视频内容中的参会人员进行身份标识的标注。这样,当目标受控设备采集到的音视频内容被播放时,其播放画面上将同步展示播放画面中的参会人员的身份标识。进一步,服务器10还可将身份标识的标注位置与相应参会人员在播放画面中的位置进行匹配,以使播放画面中关联展示各参会人员的图像及身份标识。据此,当前会议中的其它会场在播放目标会场的音视频内容时,可直观地获知目标会场中各参会人员的身份,结合前述实施例中提及的发言人聚焦方案,可获得更好的会议互动性,使得多个会场间的音视频会议的会议效果得到进一步改善。
图2为本申请一实施例提供的另一种音视频会议系统的结构示意图。如图2所示,在上述实施例的基础上,本实施例中,多个会议设备中还可包括布设在部分会场中的至少一个次控设备40。
在一些场景中,基于期望采集会场中的全局画面等原因,会场中的受控设备30将被布设在距离参会人员较远的位置,这导致会场中的参会人员对受控设备30的控制非常不便,本实施例中,提出在这类会场中布设次控设备40的解决方案。其中,在硬件实现上,次控设备40可采用与所述主控设备10相似的硬件结构。例如,次控设备40可采用与主控设备20类似的桌面终端的形式,以提高用户的操控便利性,以及更契合用户的操控习惯。
以目标会场为例,当目标受控设备所在的目标会场中布设有目标次控设备时,目标次控设备可与目标受控设备直连。本实施例中,目标次控设备可与目标受控设备可通过WIFI直连,也可通过蓝牙、红外等其它点对点的直连方式进行直连,本实施例对两者的直连方式不作限定。无论采用何种直连方式,目标次控设备可将其与目标受控设备的直连通道作为控制链路,并通过控制链路向目标受控设备下发各种次控信令。
对目标次控设备来说,可响应其操作者对目标会场的音视频内容的播放要求,向目标受控设备发送次控参数,以期望控制目标受控设备按照目标次控设备操作者的播放要求采集目标会场的音视频内容。
其中,次控参数与目标次控设备操作者的播放要求相对应。目标次控设备的操作者也可根据实际需求对目标会场的音视频内容提出各种播放要求,目标次控设备操作者对目标会场的音视频内容的播放要求与前文中描述的主持人对目标会场的音视频内容的播放要求类似,可以是调整画面视角、提高播放精度、聚焦某位参会人员、静音等等。
同样,目标次控设备也可提供用户交互界面,其操作者可通过用户交互界面向目标次控设备输入次控参数。例如,当其操作者发现目标会场的网络不佳时,为了保证目标会场的音视频内容可流畅地发送至服务器10,目标次控设备的操作者可通过次控设备40输入更低的摄像头分辨率,以期以更低的画面精度采集目标会场的音视频内容,从而减少单位时间内发送至服务器10的媒体流量,保证音视频内容流畅地发送至服务器10。
与主控设备20对目标受控设备的主控过程不同的是,目标次控设备对目标受控设备的次控过程中,可采用次控信令的方式,利用其与目标受控设备之间的直连通路将次控参数下发至目标受控设备。与目标次控设备的操作者对目标会场的音视频内容的播放要求相对应的,次控参数也可以包含摄像头的转动角度、焦距、分辨率或者麦克风的音量参数中的一种或多种参数。当然,这些参数类型也仅是示例性地,本实施例并不限于此,次控参数还可以包含与目标次控设备的操作者的播放要求相对应的其它类型的参数。
对目标受控设备来说,在接收到目标次控设备发送的次控参数时,可根据次控参数调整其音视频采集组件的工作状态;基于工作状态调整后的音视频采集组件采集目标会场的音视频内容并将音视频内容发送至服务器10。调整音视频采集组件的工作状态、采集音视频内容及向服务器10回传音视频内容的过程,可参考前文对主控过程中的相关技术细节的描述,在此不再赘述。
据此,目标受控设备可在目标次控设备的控制下,调整其采集动作,以采集到符合目标次控设备操作者的播放要求的音视频内容。
在实际应用中,目标受控设备中可能出现同时接收到服务器10下发的主控参数以及目标次控设备下发的次控参数的情形,对此,目标受控设备可对接收到的控制参数进行优先级判断。可选地,目标受控设备可追溯其收到的控制参数的发送者身份,如果为服务器10,则确定其接收到的为主控参数,如果为目标次控设备,则确定其接收到的为次控参数,由此,可优先按照主控参数调整其音视频采集组件的工作状态。而对于次控过程,则可不再响应,并向目标次控设备返回执行失败通知,当然,也可在主控过程结束后的预定时间间隔后,按照收到的次控参数执行次控过程,本实施例对此不作限定。
本实施例中,通过优先级判断操作,可保证目标受控设备优先响应主控设备20的主控过程,从而可优先保证主持人对目标会场的宏观调控,进而保证会议秩序。
在上述或下述实施例中,对于主持人所在的会场来说,其中的主控设备20除了可承担对任意目标受控设备的主控功能外,还可复用为会场中的受控设备30,承担受控设备30的相关功能,这种情况下,主控设备20所在的会场中无需在布设受控设备30。在硬件实现上,主控设备20可装载与受控设备30的相关功能匹配的硬件器件,以支持实现受控设备30的相关功能,例如音视频采集组件等。
当主控设备20承担起其所在会场中的受控设备30的相关功能时,可利用其音视频采集组件采集其所在会场中的音视频内容。其中,主控设备20可按照主持人对其音视频组件的调整操作调整其音视频组件的工作状态,并基于工作状态调整后的音视频采集组件采集其所在会场的音视频内容并将音视频内容回传至服务器。具体的工作状态调整过程以及采集过程等技术细节可参考前文中对目标受控设备的相关描述,在此不再赘述。
据此,当主控设备20复用为其所在会场中的受控设备30时,该会场中的受控设备30与其它会场中的受控设备30的处理过程略有不同,主要体现在该会场中的受控设备30可由主持人直接对其音视频组件进行调整操作,而不再执行按照主控参数或次控参数调整其音视频采集组件的工作状态的处理过程。据此,当发生主持人切换时,该会场中的主控设备20可不再承担主控角色,而仅承担受控设备30的角色,以接受新主持人的控制。
本实施例中,对于主控设备20所在的会场来说,当其中布设有受控设备30时,主控设备20除了可承担对任意目标受控设备的主控功能外,还可作为会场中的次控设备40,承担次控设备40的相关功能。在硬件实现上,主控设备20可装载与次控设备40的相关功能匹配的硬件组件,以支持实现次控设备40的相关功能。
当主控设备20承担起次控设备40的相关功能时,其可与其所在会场中的受控设备30直连。这种情况下,主控设备20承担的次控设备40的功能相关的技术细节可参考前文中对目标次控设备的相关描述,在此不再赘述。
据此,音视频会议系统中的每个会场中均配置了可支持音视频采集功能的受控设备,当然,主控设备所在会场中的受控设备可能是主控设备的复用,而服务器可基于全双工语音交互技术,实现多个会场间的全双工语音交互,使得音视频会议过程中,多个会场之间可同时讲话,可进一步提高多个会场间的交互性。
本实施例中,主控设备20可具备多重产品属性,除了承担本身的主控角色外,还可承担受控设备30的角色,或者承担次控设备40的角色,这使得主控设备20更具多用性,且更具场景通用性,可满足各种场景中的产品属性需求。
在上述或下述实施例中,主控设备20还可承担会议邀请功能。以下将以主控设备20对目标会场进行的会议邀请为例,对音视频会议系统中的会议邀请过程进行详细说明。
在当前会议过程中,主控设备20可随时邀请目标会场加入会议。
对主控设备20来说,可响应于主持人对目标会场的会议邀请操作,向服务器10发送会议邀请请求。其中,主持人的会议邀请操作可以是触控操作也可以是语音操作等,本实施例对此不作限定。
在实际应用中,服务器10可将其记录的各个会场的标识及各会场中受控设备30的标识及次控设备40的标识等信息进行共享,这样,主控设备20可从服务器10中获取到目标会场的标识,还可确定出目标会场中是否存在次控设备40,当然,对主控设备20来说,确定目标会场中是否存在次控设备40的步骤并不是必须的。
在一种情形中,当主控设备20确定目标会场中存在目标次控设备时,可将目标次控设备的标识携带在会议邀请请求中,服务器10可基于会议邀请请求,向目标会场中的目标次控设备下发入会信令。当然,主控设备20也可直接将目标会场的标识携带在会议邀请请求中,服务器10可基于会议邀请请求,在确定目标会场中存在目标次控设备时,向目标会场中的目标次控设备下发入会信令。
对目标会场中的目标次控设备来说,可在接收到服务器10下发的入会信令时,呈现入会邀请通知。可选地,主控设备20发送的会议邀请请求中还可携带当前会议的会议号、会议主题等信息,以便目标次控设备将当前会议的相关信息呈现在入会邀请通知中。例如,目标次控设备可在接收到入会信令时,在其用户交互界面上呈现当前会议的会议号、会议主题、会议发起人、主持人、参会人员等等信息,也可通过语音输出等方式呈现这些信息,以便目标次控设备的操作者获知当前会议的信息,并确定是否同意入会。
基于此,目标次控设备可响应于其操作者的同意入会操作,向服务器10返回同意通知,以加入当前会议。例如,操作者可在确定入会的情况下,通过触控操作或语音操作向目标次控设备输入同意入会指令,目标次控设备可据此生成同意通知,并回传给服务器10。
在这种情形中,由目标次控设备对主控设备20的会议邀请请求作出响应。服务器10在接收到目标次控设备返回的同意通知时,可允许目标受控设备及目标次控设备加入当前会议,也即是赋予目标次控设备及目标受控设备对当前会议的入会权限。
在另一种情形中,当主控设备20确定目标会场中不存在任何次控设备40时,可将目标受控设备的标识携带在会议邀请请求中,服务器10可基于会议邀请请求,向目标会场中的目标受控设备下发入会信令。当然,主控设备20也可直接将目标会场的标识携带在会议邀请请求中,服务器10可基于会议邀请请求,在确定目标会场中不存在目标次控设备时,向目标会场中的目标受控设备下发入会信令。
对目标会场中的目标受控设备来说,可在接收到服务器10下发的入会信令时,呈现入会邀请通知。可选地,主控设备20发送的会议邀请请求中还可携带当前会议的会议号、会议主题等信息,以便目标受控设备将当前会议的相关信息呈现在入会邀请通知中。例如,目标受控设备可在接收到入会信令时,在其用户交互界面上呈现当前会议的会议号、会议主题、会议发起人、主持人、参会人员等等信息,也可通过语音输出等方式呈现这些信息,以便目标受控设备的操作者获知当前会议的信息,并确定是否同意入会。
基于此,目标受控设备可响应于其操作者的同意入会操作,向服务器10返回同意通知,以加入当前会议。例如,操作者可在确定入会的情况下,通过触控操作或语音操作向目标受控设备输入同意入会指令,目标受控设备可据此生成同意通知,并回传给服务器10。
在这种情形中,由目标受控设备对主控设备20的会议邀请请求作出响应。服务器10在接收到目标受控设备返回的同意通知时,可允许目标受控设备加入当前会议,也即是赋予目标受控设备对当前会议的入会权限。
为了避免无关人员参与到当前会议中,当由目标次控设备对主控设备20的会议邀请请求作出响应时,可利用目标次控设备对其操作者进行入会权限的验证;当由目标受控设备对主控设备20的会议邀请请求作出响应时,可利用目标受控设备对其操作者进行入会权限的验证。以下将以利用目标次控设备对其操作者进行入会权限的验证为例进行验证过程的描述,应当理解的是,利用目标次控设备对其操作者进行入会权限的验证过程也同样适用于以下描述。
目标次控设备可响应于其操作者的同意入会操作,利用其摄像头采集其操作者的图像,基于操作者的图像生成同意通知并发送至服务器10。而对服务器10来说,则可基于人脸识别技术,从操作者的图像中提取操作者的人脸特征;根据人脸特征与人物身份标识的关联关系,确定操作者的身份标识;若操作者的身份标识与当前会议具有关联关系,则确定目标次控设备的当前操作者具有入会权限,并执行允许目标受控设备及目标次控设备加入当前会议的操作。
在实际应用中,服务器10中可记录当前会议对应的所有参会人员的标识,通过人脸识别,服务器10可确定目标次控设备的当前操作者,也即是主控设备20发出的会议邀请请求的响应者的身份标识,从而可判断目标次控设备的当前操作者是否具有入会权限。当确定目标次控设备的当前操作者具有入会权限时,服务器10可认为目标次控设备发送的同意通知有效,而当确定目标次控设备的当前操作者不具备入会权限时,服务器10则可认为目标次控设备发送的同意通知无效。
本实施例中,通过对目标次控设备或目标受控设备的当前操作者的入会权限的验证,可有效避免无关人员参与到当前会议中,尤其对于需要保密的会议内容来说,这具有重要的安全意义。
另外,在当前会议过程中,除了可由主控设备20主动邀请目标会场加入当前会议,还可由目标会场主动申请加入当前会议。
当目标会场中布设有目标次控设备时,可由目标次控设备的操作者向目标次控设备发出加入当前会议的指令,例如,触控输入当前会议的会议号,或语音呼出当前会议的会议号等。目标次控设备可据此向服务器10发送加入当前会议的入会请求,服务器10将入会请求转发至主控设备20,主控设备20可响应于主持人的同意加入操作而向服务器10返回同意加入通知。至此,可基于目标会场中的目标次控设备的主动申请允许目标会场加入本次会议。其中,目标次控设备可从服务器10中下载等方式获取到当前会议的会议号等信息。
当目标会场中不存在任何次控设备40时,可由目标会场中的目标受控设备主动申请加入当前会议。具体的申请过程与由目标次控设备作为申请方时的申请过程类似,在此不再赘述。
另外,在上述目标会场主动申请加入当前会议的过程中,也可对相关操作者进行入会权限的验证,具体的验证过程可参考前文,在此也不再重复赘述。
在上述或下述实施例中,主控设备20还可承担会议开启功能。对主控设备20来说,可响应于主持人的会议开启操作,利用其摄像头采集主持人的图像,并将主持人的图像发送至服务器10。
本实施例中,主持人可利用主控设备20随时请求开启目标会议。例如,主持人可在主控设备20的用户交互界面上进行会议开启操作,主控设备20将据此启动其摄像头,以采集主持人的图像。
当主持人在进行会议开启操作时向主控设备20输入了目标会议的标识时,则主控设备20可根据获取到的目标会议的标识和主持人的图像生成会议开启请求,并将会议开启请求发送至服务器10。其中,会议的标识可以是会议号、会议发起人等等标识类信息。
当主持人在进行会议开启操作时位向主控设备20输入任何会议的标识时,则主控设备20可根据获取到的主持人的图像生成会议开启请求,并将会议开启请求发送至服务器10。其中,会议的标识可以是会议号、会议发起人等等标识类信息。
对服务器10来说,在接收到会议开启请求时,可对会议开启请求进行解析,以获取到主持人的图像。
当解析到会议开启请求中还携带有目标会议的标识时,服务器10可基于人脸识别技术,从主持人的图像中提取主持人的人脸特征;根据人脸特征与人物身份标识的关联关系,确定主持人的身份标识;若主持人的身份标识与目标会议具有关联关系,则允许主控设备20开启目标会议。在一些实际应用中,服务器10中可预先包括目标会议与其所有参会人员的身份标识的关联关系,作为会议开启权限验证的基础。
当解析到会议开启请求中未携带任何会议的标识时,服务器10可基于人脸识别技术,从主持人的图像中提取主持人的人脸特征;根据人脸特征与人物身份标识的关联关系,确定主持人的身份标识;若主持人的身份标识关联有已创建的会议,则将主持人对应的会议列表发送至主控设备20,以供主持人通过主控设备20选中目标会议;并在主持人选中目标会议时,允许主控设备20开启目标会议。
值得说明的是,上述对主控设备20的会议开启功能均是在目标会议已经创建的基础上描述的。在实际应用中,主控设备20期望开启的目标会议有可能并未创建,这种情况下,主控设备20还可承担会议创建的功能,例如,主持人可在主控设备20的用户交互界面中进行会议创建操作,将会议主题、会议时间、参会人员等信息输入主控设备20,主控设备20可向服务器10发送会议创建请求,服务器10根据资源调配情况确定时否同意该会议创建请求;在同意该会议创建请求时,生成该会议的会议号等标识并记录该会议及其参会人员的关联关系,以及将该会议的标识返回给主控设备20,至此完成会议创建。当然,本实施例中,会议创建的功能也可由音视频会议系统中的次控设备40或者受控设备30承担,具体的创建过程与主控设备20执行的上述创建过程类似,在此不再赘述。
以上描述了音视频会议系统中主控设备、次控设备和受控设备的内部功能和结构,实际中,主控设备、次控设备和受控设备可实现为电子设备。从硬件结构上,这些电子设备可分为两类:如图4a所示的第一类设备和图4b所示的第二类设备。其中,第一类设备可作为音视频会议系统中的主控设备或者次控设备,在音视频会议中提供会控功能,也可作为音视频会议系统中的受控设备,在音视频会议中提供音视频内容采集或展示功能;第二类设备则可作为作为音视频会议系统中的受控设备,在音视频会议中提供音视频内容采集或展示功能。以下将分别对第一类设备和第二类设备进行详细说明。
图4a为本申请一实施例提供的第一类设备的硬件结构示意图,如图4a所示,第一类设备可包括设备主体50,设备主体50上装配有显示屏41、网络组件46和主板49,显示屏41及网络组件46集成在主板49上;主板49获取用户通过显示屏41输入的对音视频会议系统中的目标设备的控制参数,并通过网络组件46将控制参数传输至目标设备,以控制目标设备调整其音视频采集组件的工作状态以按照用户要求采集音视频内容。
其中,显示屏41可采用多点触控屏幕,并可集成高清CMOS传感器,显示屏41可提供用户交互界面,网络组件46可提供WIFI双频和蓝牙,网络组件46除了可用于与音视频系统内的电子设备及服务器进行通信外,还可控制和接入音视频系统之外的其他设备和系统。而且,第一类设备中还可装配电池47,电池47可无线充电,电池47的容量可满足第一类设备日常的电力需求,因此,基于其大容量的电池47支持,第一类电子设备可满足用户的移动使用需求。另外,在设备主体的形态上,第一类设备可采用桌面终端的形态,以赋予其体积小、便携性高、人机交互性强等优势。
当第一类设备作为音视频会议系统中的主控设备时,可通过显示屏41获取对目标受控设备的主控参数,主板49可通过服务器将主控参数发送至目标受控设备,以供目标受控设备按照主控参数调整其音视频采集组件的工作状态,并将采集到的符合播放要求的音视频内容通过服务器回传至作为主控设备的第一类设备。
当第一类设备作为音视频会议系统中的次控设备时,第一类设备可与其所在会场中的受控设备直连,主持人可通过显示屏41输入对受控设备的次控参数,主板49可通过网络组件46将次控参数发送至受控设备,以供受控设备按照次控参数调整其音视频采集组件的工作状态并将采集到的符合次控设备操作者要求的音视频内容回传至音视频会议系统中的服务器。
当第一类设备作为音视频会议系统中的受控设备时,第一类设备的设备主体上还装配有音视频采集组件,音视频采集组件集成在主板49上,音视频采集组件采集第一类设备所在会场的音视频内容,主板49通过网络组件46将音视频内容共享至音视频会议系统中的服务器,以供服务器将其音视频内容共享至音视频会议系统中其它作为受控设备的电子设备。
其中,音视频采集组件可包括摄像头44和麦克风42,摄像头44和麦克风42集成在主板49上,摄像头44和麦克风42可分别采集视频信号和声音信号并发送至主板49,主板49可根据摄像头44和麦克风42分别采集到视频信号和声音信号生成音视频内容。
另外,麦克风42与主板49之间还可设置音频数字信号处理芯片48,以对会议过程中的音频信号进行处理。麦克风42可支持全双工语音交互。
在第一类电子设备作为主控设备时,在主持人利用显示屏执行会议开启操作时,主板49可控制摄像头44采集主持人的图像并发送至服务器,以供服务器对主持人的会议开启权限进行验证。
进一步,如图4a所示,第一类设备还包括:扬声器43、物理按键45等其它器件。而且,图4a中仅示意性给出部分器件,并不意味着第一类设备只包括图4a所示器件。
图4b为本申请一实施例提供的第二类设备的硬件结构示意图,如图4b所示,第二类设备可包括设备主体60,设备主体上装配有音视频采集组件、主板61和网络组件62,其中,音视频采集组件及网络组件62集成在主板61上,主板61通过网络组件62接收控制参数,按照控制参数调整音视频采集组件的工作状态,并基于工作状态调整后的音视频采集组件采集音视频内容。
对第二类设备来说,其可根据外来的控制参数自动调整自身的音视频采集组件的工作状态,并按照工作状态调整后的音视频采集组件采集音视频内容,这使得音视频会议系统中多个会场间的远程程控变得具备可行性。
如前述实施例中提及的,第二类设备可按照音视频会议系统中作为主控设备的第一类设备发出的主控参数自动调整音视频采集组件的工作状态;也可按照音视频会议系统中作为次控设备的第一类设备发出的次控参数自动调整音视频采集组件的工作状态。据此,第二类设备不再需要用户通过手动或其它更不方便的方式来调整其音视频采集组件的工作状态,便可在远程或近程控制下实现音视频采集组件的工作状态的自动调整,从而可在音视频会议中灵活控制各会场的播放效果。
在一可选实现方式中,第二类设备的音视频采集组件包括摄像头63和摄像头角度调节件68,摄像头角度调节件68与摄像头63连接,摄像头角度调节件68与主板61集成,当控制参数包含摄像头的转动角度时,主板61控制摄像头角度调节件68调整摄像头63至目标角度。可选地,摄像头63可装配在第二类设备的设备主体60的正面,以更方便地进行会场内的视频内容采集。
其中,摄像头63可采集包括第二类设备所在会场中的多个参会人员的图像的音视频内容并发送至音视频会议系统中的服务器,以供服务器对音视频内容进行人物标注。
在一可选实现方式中,第二类设备的音视频采集组件还包括麦克风阵列64,麦克风阵列64采集声音信号并发送至主板61,主板61根据麦克风阵列64采集到的声音信号确定发言人的位置,并控制摄像头63转动以跟踪发言人,以及在发言人的发言时长超过预设时长时,调整摄像头63的焦距,以对发言人聚焦。优选地,麦克风阵列64可装配在第二类设备的设备主体60的正面。进一步,麦克风阵列64可装配在摄像头63的周围。另外,麦克风阵列64与主板61之间可配置音频数字信号处理芯片69,以对麦克风阵列采集到的声音信号进行处理。
在一可选实现方式中,第二类设备的设备主体上还包括显示器接口65,显示器接口65外接至少两台显示器66,主板61接收音视频会议系统中服务器共享的会议文档及多个会场的音视频内容,并基于多屏异显技术,将会议文档和多个会场的音视频内容分散至不同显示器66中进行显示。可选地,显示器接口65可装配在第二类设备的设备主体60的背面。其中,显示器接口65可采用HDMI接口。
也即是,当第二类设备外接两台显示器66时,可将会议文档显示在其中一台显示器中,而将多个会场的音视频内容显示在另一台显示器中;当然,当第二类设备外接更多的显示器时,还可对多个会场的音视频内容进行进一步的分散显示。
进一步,如图4b所示,第二类设备还包括:扬声器67、物理按键70等其它器件。而且,图4b中仅示意性给出部分器件,并不意味着第二类设备只包括图4b所示器件。
对于第一类设备和第二类设备来说,均可采用硬件高度集成的方式,将相关的计算处理单元和控制单元集成在主板上,例如,本案中涉及的音视频采集组件、电池、显示屏、网络组件、物理按键、显示器接口等等,均可与主板集成。而且,主板可采用安卓等开放性的硬件平台,提高产品扩展性。
其中,第一类设备和第二类设备可采用相同的主板芯片,例如,可采用型号为RK3399的芯片。图4c为本申请一实施例提供的一种主板芯片的端口使用状态示意图。如图4c所示,该主板芯片中的电源管理单元PMU可连接前述的电池,显示屏端口Display Port可连接前述的显示屏,HDMI可连接前述的HDMI接口,音频总线端口I2S08ch可连接前述的麦克风阵列,UART0、SDIO0 SD 3.0以及PCIe端口则可连接前述的网络组件,如图4c中示出的4G、WIFI及蓝牙等,以提供WIFI双频及蓝牙等网络功能,前述的物理按键、扬声器等组件则可通过USB端口连接至主板芯片。另外,值得说明的是,主板芯片的端口及其连接的组件并不限于图4c所示,图4c中示出的各组件也可通过其它端口连接至主板芯片,本实施例并不限于此。
另外,基于第一类设备和第二类设备组成的音视频会议系统中的各电子设备之间的部署关系、交互关系等等,可参考前文有关音视频会议系统的相关实施例的描述,在此不再赘述。
图3为基于第一类设备和第二类设备构成的音视频会议系统的一种示例性使用场景示意图,在图3提供的示例性使用场景中,包括服务器和三个会场,在会场1中,由第一类设备承担主控设备20的角色,主持人处于该会场中;在会场2中,由第二类设备承担受控设备30的角色,并由第一类设备承担次控设备40的角色,第一类设备和第二类设备通过WIFI直连,会场2中配置一会场负责人操控次控设备40;在会场3中,由第二类设备承担受控设备30的角色。会场1、2、3中的第一类设备和第二类设备均通过互联网与服务器连接。为方便描述,以下将以第一类设备及第二类设备在图3提供的使用场景中担任的角色进行方案的阐述。
主持人可利用会场1中的主控设备20开启一场音视频会议,并利用会场1中的主控设备20向服务器10发起针对会场2的会议邀请,会场2中的次控设备40可在其用户交互界面中展示当前会议的入会邀请通知,会场2的负责人可在次控设备40中进行同意入会操作,会场2得以加入当前会议。会场3可基于会场中参会人员的语音指令,向服务器10主动申请加入当前会议,主控设备20在接收到会场3的入会申请时,可同意会场3的入会申请,会场3得以加入当前会议。至此,可建立起包含会场1、2、3参与的音视频会议系统。
在上述过程中,服务器10可对主持人的会议开启权限以及会场2和会场3的入会权限进行验证。
基于建立起的音视频会议系统,主控设备20可基于主持人的播放要求,通过服务器10对会场2和3中的受控设备30进行主控,会场2和3中的受控设备30可按照主控参数调整其音视频采集组件的工作状态,以采集到符合主持人播放要求的音视频内容并回传给服务器10。会场2的会场负责人可通过会场2中的次控设备40对会场2中的受控设备30进行次控,会场2中的受控设备30可按照次控参数调整其音视频采集组件的工作状态,以采集到符合会场2的会场负责人的播放要求的音视频内容并回传给服务器10。另外,会场1中的主控设备20还可承担对会场1的音视频内容的采集工作并回传给服务器10。这大大提高了音视频会议系统中对会场进行控制时的灵活性和秩序性。
至此,服务器10可根据会场1、2和3回传的音视频内容,进行会场间的音视频内容共享,而且,会场1可通过主控设备20向服务器10发送会议文档以供服务器10进行会议文档的共享。会场1、2或3中的参会人员可观看到会议文档及远端会场的音视频画面,且观看到的音视频画面中可包含相关参会人员的身份标识,音视频画面中还可包含发言人的聚焦画面等等,这使得参会人员均可获得较高的会场沉浸式体验,增强了会场间的交互效果。
图5为本申请另一实施例提供的一种音视频会议控制方法的流程示意图。如图5所示,该方法适用于音视频会议系统中的主控设备,音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含主控设备和受控设备,该方法包括:
500、按照对目标会场的音视频内容的播放要求,向服务器发送主控请求,主控请求中包含与播放要求对应的主控参数,以供服务器基于主控参数控制目标会场中的目标受控设备按照播放要求采集目标会场的音视频内容;
501、接收并输出服务器共享的目标会场的符合播放要求的音视频内容。
在一可选实施例中,主控参数包括摄像头的转动角度、焦距、分辨率或麦克风的音量参数中的一种或多种。
在一可选实施例中,主控设备包括音视频采集组件,该方法还包括:
按照对其所在会场的音视频内容的播放要求,调整其音视频采集组件的工作状态;
基于工作状态调整后的音视频采集组件采集其所在会场的音视频内容并将音视频内容回传至服务器,以供服务器将音视频内容共享至当前会议中的其它受控设备。
在一可选实施例中,主控设备的音视频采集组件包括麦克风阵列,该方法还包括:
当监测到其所在会场中出现人声信号时,利用其麦克风阵列确定发言人的位置;
根据发言人的位置,计算将其摄像头的拍摄角度对准发言人所需的摄像头的转动角度;
按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准发言人;
若发言人的发言时长超过预设时长,则按照预设放大倍数放大其摄像头的焦距,以对发言人进行聚焦。
在一可选实施例中,主控设备包括显示屏,步骤输出服务器共享的目标会场的音视频内容,包括:
利用其显示屏展示服务器共享的目标会场的符合播放要求的音视频内容;
该方法还包括:
接收服务器发送的当前会议的会议文档,并利用其显示器展示会议文档。
在一可选实施例中,音视频会议系统还包括布设在部分会场中的至少一个次控设备,当目标受控设备所在的目标会场中布设有目标次控设备时,在按照对目标会场的音视频内容的播放要求,向服务器发送主控请求之前,该方法还包括:
响应于主控设备所在会场中的主持人对目标会场的会议邀请操作,向服务器发送会议邀请请求,以供服务器基于会议邀请请求,向与目标会场中的目标次控设备下发入会信令,并在接收到目标次控设备返回的同意通知时,允许目标受控设备及目标次控设备加入当前会议。
在一可选实施例中,主控设备所在会场中布设有受控设备,主控设备复用为次控设备,该方法还包括:
按照对其所在会场的音视频内容的播放要求,向其所在会场中的受控设备发送次控参数,以控制其所在会场中的受控设备按照播放要求采集其所在会场的音视频内容。
在一可选实施例中,在按照对目标会场的音视频内容的播放要求,向服务器发送主控请求之前,该方法还包括:
响应于其所在会场中的主持人的会议开启操作,利用其摄像头采集主持人的图像,并将主持人的图像发送至服务器,以供服务器对主持人进行当前会议的开启权限认证。
值得说明的是,与上述适用于主控设备的音视频会议控制方法有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关主控设备的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
图6为本申请又一实施例提供的另一种音视频会议控制方法的流程示意图。如图6所示,该方法适用于音视频会议系统中的服务器,音视频会议系统中还包括可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含主控设备和受控设备,该方法包括:
600、接收主控设备按照对目标会场的音视频内容的播放要求而发送的主控请求,主控请求中包含与播放要求对应的主控参数;
601、将主控参数发送给目标会场中的目标受控设备,以控制目标受控设备按照播放要求采集目标会场的音视频内容;
602、将目标受控设备回传的符合播放要求的音视频内容共享至主控设备,以供主控设备输出。
在一可选实施例中,主控参数包括摄像头的转动角度、焦距、分辨率或麦克风的音量参数中的一种或多种。
在一可选实施例中,音视频会议系统中还包括布设在部分会场中的至少一个次控设备,当目标受控设备所在的目标会场中布设有目标次控设备时,该方法还包括:
基于主控设备对目标会场的会议邀请请求,向与目标会场中的目标次控设备下发入会信令,并在接收到目标次控设备返回的同意通知时,允许目标受控设备及目标次控设备加入当前会议。
在一可选实施例中,同意通知中携带有目标次控设备操作者的图像,该方法还包括:
基于人脸识别技术,从操作者的图像中提取操作者的人脸特征;根据人脸特征与人物身份标识的关联关系,确定操作者的身份标识;若操作者的身份标识与当前会议具有关联关系,则执行允许目标受控设备及目标次控设备加入当前会议的操作
在一可选实施例中,当目标会场中不存在次控设备,该方法还包括:
基于主控设备对目标会场的会议邀请请求,向目标受控设备下发入会信令,并在接收到目标受控设备返回的同意通知时,允许目标受控设备加入当前会议。
在一可选实施例中,该方法还包括:
接收主控设备响应于其所在会场的主持人的会议开启操作而采集到的主持人的图像;
基于人脸识别技术,从主持人的图像中提取主持人的人脸特征;
根据人脸特征与人物身份标识的关联关系,确定主持人的身份标识;
若主持人的身份标识关联有已创建的会议,则将主持人对应的会议列表发送至主控设备,以供主持人通过主控设备选中当前会议;
在主持人选中当前会议时,允许主控设备开启当前会议
在一可选实施例中,若目标受控设备回传的音视频内容中包含目标会场中至少一个参会人员的图像,该方法还包括:
基于人脸识别技术,从音视频内容中分别提取各参会人员的人脸特征;
根据人脸特征与人物身份标识的关联关系,确定各参会人员的身份标识;
在音视频内容中标注各参会人员的身份标识,以生成目标受控设备对应的人物标注后音视频内容;
将目标受控设备对应的人物标注后音视频内容共享至当前会议中的其它受控设备,以通过其它受控设备展示目标受控设备对应的人物标注后音视频内容。
值得说明的是,与上述适用于服务器的音视频会议控制方法有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关服务器的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
图7为本申请又一实施例提供的又一种音视频会议控制方法的流程示意图。如图7所示,该方法适用于音视频会议系统中的受控设备,音视频会议系统中包括服务器和可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含主控设备和受控设备,该方法包括:
700、接收服务器基于主控设备对目标会场的主控请求而发送的主控参数,主控参数与对目标会场的音视频内容的播放要求相对应;
701、按照主控参数调整其音视频采集组件的工作状态;
702、基于工作状态调整后的音视频采集组件采集目标会场的音视频内容并将音视频内容回传至服务器,以使服务器将音视频内容共享至主控设备。
在一可选实施例中,受控设备的音视频采集组件包括摄像头;
主控参数包括摄像头的转动角度,该方法具体包括:按照转动角度调整其摄像头的拍摄角度,基于调整后的拍摄角度采集目标会场的音视频内容;和/或
主控参数包括摄像头的焦距,该方法具体包括:按照焦距调整其摄像头的焦距,基于调整后的焦距采集目标会场的音视频内容;和/或
主控参数包括摄像头的分辨率,该方法具体包括:按照分辨率调整其摄像头的拍摄精度,基于调整后的拍摄精度采集目标会场的音视频内容。
在一可选实施例中,受控设备的音视频采集组件包括麦克风,主控参数包括音量参数,该方法具体包括:
按照音量参数调整其麦克风的音量,基于调整后的音量采集目标会场的音视频内容。
在一可选实施例中,受控设备的麦克风采用麦克风阵列,该方法还包括:
当监测到目标会场中出现人声信号时,利用其麦克风阵列确定目标会场中发言人的位置;
根据发言人的位置,计算将摄像头的拍摄角度对准发言人所需的摄像头的转动角度;
按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准发言人;
若发言人的发言时长超过预设时长,则按照预设放大倍数放大其摄像头的焦距,以对发言人进行聚焦。
在一可选实施例中,该方法还包括:
接收服务器共享当前会议的会议文档以及当前会议中的其它受控设备采集到的音视频内容;
展示会议文档及其它受控设备采集到的音视频内容。
在一可选实施例中,受控设备包含显示屏,该方法具体包括:
利用其显示屏展示会议文档以及其它受控设备采集到的音视频内容。
在一可选实施例中,受控设备外接有至少两个显示器;该方法具体包括:
基于多屏异显技术,将会议文档以及其它受控设备采集到的音视频内容发送至不同的显示器进行展示。
在一可选实施例中,音视频会议系统还包括布设在部分会场中的至少一个次控设备,当受控设备所在的目标会场中布设有目标次控设备时,该方法还包括:
接收目标次控设备响应其操作者对目标会场的音视频内容的播放要求而发送的次控参数;
按照次控参数调整其音视频采集组件的工作状态;
基于工作状态调整后的音视频采集组件采集目标会场的音视频内容并将音视频内容发送至服务器。
在一可选实施例中,该方法还包括:
若同时接收到服务器发送的主控参数和次控设备发送的次控参数,则按照主控参数调整其音视频采集组件的工作状态。
在一可选实施例中,当目标会场中不存在次控设备时,该方法还包括:
在接收到服务器下发的入会信令时,呈现入会邀请通知;
响应于其操作者的同意入会操作,向服务器返回同意通知,以加入当前会议。
值得说明的是,与上述适用于受控设备的音视频会议控制方法有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关受控设备的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
图8为本申请又一实施例提供的又一种音视频会议控制方法的流程示意图。如图8所示,该方法适用于音视频会议系统中的次控设备,音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含次控设备和受控设备,次控设备布设在任意会场中,当次控设备所在的目标会场中包括目标受控设备时,该方法包括:
800、响应次控设备操作者对目标会场的音视频内容的播放要求,获取与播放要求相对应的次控参数;
801、向目标受控设备发送次控参数,以期望控制目标受控设备按照目标次控设备操作者的播放要求采集目标会场的音视频内容。
在一可选实施例中,该方法还包括:
在接收到服务器基于主控设备对目标会场的会议邀请请求而下发的入会信令时,呈现入会邀请通知;
响应于其操作者的同意入会操作,向服务器返回同意通知,以加入当前会议。
在一可选实施例中,步骤响应于其操作者的同意入会操作,向服务器返回同意通知,包括:
响应于次控设备操作者的同意入会操作,利用其摄像头采集其操作者的图像;
基于操作者的图像生成同意通知;
将同意通知发送至服务器,以供服务器对次控设备操作者的入会权限进行验证。
值得说明的是,与上述适用于次控设备的音视频会议控制方法有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关次控设备的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
图9为本申请又一实施例提供的一种电子设备的结构示意图。该电子设备所在的音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含该电子设备和受控设备。如图9所示,该电子设备可包括存储器90、处理器91和通信组件92;
处理器91,与存储器90及通信组件92耦合,用于执行存储器中的计算机程序,以用于:
按照对目标会场的音视频内容的播放要求,通过所述通信组件92向音视频会议系统中的服务器发送主控请求,所述主控请求中包含与所述播放要求对应的主控参数,以供所述服务器基于所述主控参数控制所述目标会场中的目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
接收并输出所述服务器共享的所述目标会场的符合所述播放要求的音视频内容。
在一可选实施例中,主控参数包括摄像头的转动角度、焦距、分辨率或麦克风的音量参数中的一种或多种。
在一可选实施例中,电子设备包括音视频采集组件94,处理器91还用于:
按照对其所在会场的音视频内容的播放要求,调整其音视频采集组件94的工作状态;
基于工作状态调整后的音视频采集组件94采集其所在会场的音视频内容并将音视频内容回传至服务器,以供服务器将音视频内容共享至当前会议中的其它受控设备。
在一可选实施例中,音视频采集组件94包括摄像头和麦克风阵列,处理器91还用于:
当监测到其所在会场中出现的人声信号时,利用其麦克风阵列确定发言人的位置;
根据发言人的位置,计算将其摄像头的拍摄角度对准发言人所需的摄像头的转动角度;
按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准发言人;
若发言人的发言时长超过预设时长,则按照预设放大倍数放大其摄像头的焦距,以对发言人进行聚焦。
在一可选实施例中,电子设备包括显示屏95,处理器91在输出服务器共享的目标会场的音视频内容时,用于:
利用其显示屏95展示服务器共享的目标会场的符合播放要求的音视频内容;
处理器还用于:
接收服务器发送的当前会议的会议文档,并利用其显示器95展示会议文档。
在一可选实施例中,音视频会议系统还包括布设在部分会场中的至少一个次控设备,当目标受控设备所在的目标会场中布设有目标次控设备时,在按照对目标会场的音视频内容的播放要求,向服务器发送主控请求之前,处理器91还用于:
通过其显示器95响应于其所在会场中的主持人对目标会场的会议邀请操作,向服务器发送会议邀请请求,以供服务器基于会议邀请请求,向与目标会场中的目标次控设备下发入会信令,并在接收到目标次控设备返回的同意通知时,允许目标受控设备及目标次控设备加入当前会议。
在一可选实施例中,电子设备所在会场中布设有受控设备,电子设备复用为次控设备,处理器91还用于:
按照对其所在会场的音视频内容的播放要求,向其所在会场中的受控设备发送次控参数,以控制其所在会场中的受控设备按照播放要求采集其所在会场的音视频内容。
在一可选实施例中,在按照对目标会场的音视频内容的播放要求,向服务器发送主控请求之前,处理器91还用于:
响应于其所在会场中的主持人的会议开启操作,利用其摄像头采集主持人的图像,并将主持人的图像发送至服务器,以供服务器对主持人进行当前会议的开启权限认证。
进一步,如图9所示,该电子设备还包括:电源组件93等其它组件。图9中仅示意性给出部分组件,并不意味着电子设备只包括图9所示组件。
值得说明的是,与上述与电子设备的功能及硬件器件有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关主控设备的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由主控设备执行的各步骤。
图10为本申请又一实施例提供的一种服务器的结构示意图。服务器所在的音视频会议系统中还包括可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含主控设备和受控设备。如图10所示,服务器可包括存储器100、处理器101和通信组件102;
处理器101,与存储器100及通信组件102耦合,用于执行存储器中的计算机程序,以用于:
通过通信组件102接收音视频会议系统中的主控设备发送的主控请求,主控请求为主控设备按照对目标会场的音视频内容的播放要求而发送的,主控请求中包含与播放要求对应的主控参数;
通过通信组件102将主控参数发送给目标会场中的目标受控设备,以控制目标受控设备按照播放要求采集目标会场的音视频内容;
通过通信组件102将目标受控设备回传的符合播放要求的音视频内容共享至主控设备,以供主控设备输出。
在一可选实施例中,主控参数包括摄像头的转动角度、焦距、分辨率或麦克风的音量参数中的一种或多种。
在一可选实施例中,音视频会议系统中还包括布设在部分会场中的至少一个次控设备,当目标受控设备所在的目标会场中布设有目标次控设备时,处理器101还用于:
基于主控设备对目标会场的会议邀请请求,向与目标会场中的目标次控设备下发入会信令,并在接收到目标次控设备返回的同意通知时,允许目标受控设备及目标次控设备加入当前会议。
在一可选实施例中,同意通知中携带有目标次控设备操作者的图像,处理器101还用于:
基于人脸识别技术,从操作者的图像中提取操作者的人脸特征;根据人脸特征与人物身份标识的关联关系,确定操作者的身份标识;若操作者的身份标识与当前会议具有关联关系,则执行允许目标受控设备及目标次控设备加入当前会议的操作
在一可选实施例中,当目标会场中不存在次控设备时,处理器101还用于:
基于主控设备对目标会场的会议邀请请求,向目标受控设备下发入会信令,并在接收到目标受控设备返回的同意通知时,允许目标受控设备加入当前会议。
在一可选实施例中,处理器101还用于:
接收主控设备响应于其所在会场中的主持人的会议开启操作而采集到的主持人的图像;
基于人脸识别技术,从主持人的图像中提取主持人的人脸特征;
根据人脸特征与人物身份标识的关联关系,确定主持人的身份标识;
若主持人的身份标识关联有已创建的会议,则将主持人对应的会议列表发送至主控设备,以供主持人通过主控设备选中当前会议;
在主持人选中当前会议时,允许主控设备开启当前会议
在一可选实施例中,若目标受控设备回传的音视频内容中包含目标会场中至少一个参会人员的图像,处理器101还用于:
基于人脸识别技术,从音视频内容中分别提取各参会人员的人脸特征;
根据人脸特征与人物身份标识的关联关系,确定各参会人员的身份标识;
在音视频内容中标注各参会人员的身份标识,以生成目标受控设备对应的人物标注后音视频内容;
将目标受控设备对应的人物标注后音视频内容共享至当前会议中的其它受控设备,以通过其它受控设备展示目标受控设备对应的人物标注后音视频内容。
进一步,如图10所示,该服务器还包括:电源组件103等其它组件。图10中仅示意性给出部分组件,并不意味着服务器只包括图10所示组件。
值得说明的是,与上述与服务器的功能及硬件器件有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关服务器的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由服务器执行的各步骤。
图11为本申请又一实施例提供的一种电子设备的结构示意图。电子设备所在的音视频会议系统中包括服务器和可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含主控设备和本实施例中的电子设备。如图11所示,电子设备可包括音视频采集组件113、存储器110、处理器111和通信组件112;
处理器111,与存储器110及通信组件112耦合,用于执行存储器中的计算机程序,以用于:
通过通信组件112接收音视频会议系统中的服务器基于音视频会议系统中的主控设备的主控请求而发送的主控参数,主控参数与对电子设备所在目标会场的音视频内容的播放要求相对应;
按照主控参数调整音视频采集组件的工作状态,;
基于工作状态调整后的音视频采集组件113采集目标会场的音视频内容;
通过通信组件112将采集到的符合播放要求的音视频内容回传至服务器,以使服务器将音视频内容共享至主控设备。
在一可选实施例中,电子设备的音视频采集组件113包括摄像头;
主控参数包括摄像头的转动角度,处理器111具体用于:按照转动角度调整其摄像头的拍摄角度,基于调整后的拍摄角度采集目标会场的音视频内容;和/或
主控参数包括摄像头的焦距,处理器111具体用于:按照焦距调整其摄像头的焦距,基于调整后的焦距采集目标会场的音视频内容;和/或
主控参数包括摄像头的分辨率,处理器111具体用于:按照分辨率调整其摄像头的拍摄精度,基于调整后的拍摄精度采集目标会场的音视频内容。
在一可选实施例中,电子设备的音视频采集组件113包括麦克风,主控参数包括音量参数,处理器具体用于:
按照音量参数调整其麦克风的音量,基于调整后的音量采集目标会场的音视频内容。
在一可选实施例中,电子设备的麦克风采用麦克风阵列,处理器111具体用于:
当监测到目标会场中出现人声信号时,利用其麦克风阵列确定目标会场中发言人的位置;
根据发言人的位置,计算将摄像头的拍摄角度对准发言人所需的摄像头的转动角度;
按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准发言人;
若发言人的发言时长超过预设时长,则按照预设放大倍数放大其摄像头的焦距,以对发言人进行聚焦。
在一可选实施例中,处理器111还用于:
接收服务器共享的当前会议的会议文档以及当前会议中的其它受控设备采集到的音视频内容;
展示会议文档及其它受控设备采集到的音视频内容。
在一可选实施例中,电子设备包含显示屏,处理器具体用于:
利用其显示屏展示会议文档以及其它受控设备采集到的音视频内容。
在一可选实施例中,电子设备外接有至少两个显示器;处理器111具体用于:
基于多屏异显技术,将会议文档以及其它受控设备采集到的音视频内容发送至不同的显示器进行展示。
在一可选实施例中,音视频会议系统还包括布设在部分会场中的至少一个次控设备,当电子设备所在的目标会场中布设有目标次控设备时,处理器111还用于:
接收目标次控设备响应其操作者对目标会场的音视频内容的播放要求而发送的次控参数;
按照次控参数调整其音视频采集组件的工作状态;
基于工作状态调整后的音视频采集组件采集目标会场的音视频内容并将音视频内容发送至服务器。
在一可选实施例中,处理器111具体用于:
若同时接收到服务器发送的主控参数和次控设备发送的次控参数,则按照主控参数调整其音视频采集组件的工作状态。
在一可选实施例中,当目标会场中不存在次控设备时,处理器111具体用于:
在接收到服务器下发的入会信令时,呈现入会邀请通知;
响应于其操作者的同意入会操作,向服务器返回同意通知,以加入当前会议。
进一步,如图11所示,该电子设备还包括:电源组件114等其它组件。图11中仅示意性给出部分组件,并不意味着电子设备只包括图11所示组件。
值得说明的是,与上述与电子设备的功能及硬件器件有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关受控设备的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由受控设备执行的各步骤。
图12为本申请又一实施例提供的一种电子设备的结构示意图。电子设备所在的音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,多个会议设备通过互联网与服务器连接,多个会议设备中包含本实施例的电子设备和受控设备,本实施例的电子设备可布设在任意会场中。如图12所示,该电子设备可包括存储器120、处理器121和通信组件122;
处理器121,与存储器120及通信组件122耦合,用于执行存储器120中的计算机程序,以用于:
响应电子设备操作者对电子设备所在的目标会场的音视频内容的播放要求,获取与播放要求相对应的次控参数;
向目标会场中的目标受控设备发送次控参数,以期望控制目标受控设备按照电子设备操作者的播放要求采集目标会场的音视频内容。
在一可选实施例中,多个会议设备中还包括主控设备,处理器121还用于:
在接收到服务器基于主控设备对目标会场的会议邀请请求而下发的入会信令时,呈现入会邀请通知;
响应于其操作者的同意入会操作,向服务器返回同意通知,以加入当前会议。
在一可选实施例中,处理器121在响应于其操作者的同意入会操作,向服务器返回同意通知时用于:
响应于电子设备操作者的同意入会操作,利用其摄像头采集其操作者的图像;
基于操作者的图像生成同意通知;
将同意通知发送至服务器,以供服务器对电子设备操作者的入会权限进行验证。
进一步,如图12所示,该电子设备还包括:音视频采集组件123、电源组件124等其它组件。图12中仅示意性给出部分组件,并不意味着电子设备只包括图12所示组件。
值得说明的是,与上述与电子设备的功能及硬件器件有关的各种技术细节,可参考前文中关于音视频会议系统的各个实施例中有关次控设备的相关描述,在此不再赘述,但这不应造成本申请的保护范围的损失。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由次控设备执行的各步骤。
其中,前述各实施例中提及的存储器用于存储计算机程序,并可被配置为存储其它各种数据以支持在主控设备上的操作。这些数据的示例包括用于在主控设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
其中,前述各实施例中提及的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件可基于近场通信(NFC)技术、射频识别(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术或其它技术来实现,以促进短程通信。
其中,前述各实施例中提及的显示屏包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
其中,前述各实施例中提及的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (51)

1.一种音视频会议系统,其特征在于,包括服务器以及可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备;
所述主控设备用于按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求,所述主控请求中包含与所述播放要求对应的主控参数;
所述服务器用于将所述主控参数发送给所述目标会场中的目标受控设备;以及将所述目标受控设备回传的符合所述播放要求的音视频内容共享至所述主控设备,以供所述主控设备输出;
所述目标受控设备用于按照所述主控参数调整其音视频采集组件的工作状态,基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容并将所述音视频内容回传至所述服务器。
2.根据权利要求1所述的系统,其特征在于,所述目标受控设备的音视频采集组件包括摄像头;
所述主控参数包括摄像头的转动角度,所述目标受控设备具体用于:按照所述转动角度调整其摄像头的拍摄角度,基于调整后的拍摄角度采集所述目标会场的音视频内容;和/或
所述主控参数包括摄像头的焦距,所述目标受控设备具体用于:按照所述焦距调整其摄像头的焦距,基于调整后的焦距采集所述目标会场的音视频内容;和/或
所述主控参数包括摄像头的分辨率,所述目标受控设备具体用于:按照所述分辨率调整其摄像头的拍摄精度,基于调整后的拍摄精度采集所述目标会场的音视频内容。
3.根据权利要求1所述的系统,其特征在于,所述目标受控设备的音视频采集组件包括麦克风,所述主控参数包括音量参数,所述目标受控设备具体用于:
按照所述音量参数调整其麦克风的音量,基于调整后的音量采集所述目标会场的音视频内容。
4.根据权利要求3所述的系统,其特征在于,所述目标受控设备的麦克风采用麦克风阵列,所述目标受控设备还用于:
当监测到所述目标会场中出现人声信号时,利用其麦克风阵列确定所述目标会场中发言人的位置;
根据所述发言人的位置,计算将所述摄像头的拍摄角度对准所述发言人所需的摄像头的转动角度;
按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准所述发言人;
若所述发言人的发言时长超过预设时长,则按照预设放大倍数放大其摄像头的焦距,以对所述发言人进行聚焦。
5.根据权利要求1所述的系统,其特征在于,所述服务器还用于将当前会议的会议文档以及当前会议中的其它受控设备采集到的音视频内容共享至所述目标受控设备;
所述目标受控设备用于展示所述会议文档以及所述其它受控设备采集到的音视频内容。
6.根据权利要求5所述的系统,其特征在于,所述目标受控设备包含显示屏,所述目标受控设备具体用于:利用其显示屏展示所述会议文档以及所述其它受控设备采集到的音视频内容。
7.根据权利要求5所述的系统,其特征在于,所述目标受控设备外接有至少两个显示器;所述目标受控设备具体用于:基于多屏异显技术,将所述会议文档以及所述其它受控设备采集到的音视频内容发送至不同的显示器进行展示。
8.根据权利要求1所述的会议系统,其特征在于,所述多个会议设备中还包括布设在部分会场中的至少一个次控设备,所述至少一个次控设备通过互联网与所述服务器连接;当所述目标受控设备所在的目标会场中布设有目标次控设备时,所述目标次控设备与所述目标受控设备直连;
所述目标次控设备用于响应其操作者对目标会场的音视频内容的播放要求,向所述目标受控设备发送次控参数,以期望控制所述目标受控设备按照所述目标次控设备操作者的播放要求采集所述目标会场的音视频内容;
所述目标受控设备还用于在按照所述次控参数调整其音视频采集组件的工作状态;基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容并将所述音视频内容发送至所述服务器。
9.根据权利要求8所述的系统,其特征在于,所述目标受控设备还用于:
若同时接收到所述服务器发送的主控参数和所述次控设备发送的次控参数,则按照所述主控参数调整其音视频采集组件的工作状态。
10.根据权利要求8所述的系统,其特征在于,在按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求之前,所述主控设备还用于:
响应于其所在会场中的主持人对所述目标会场的会议邀请操作,向所述服务器发送会议邀请请求;
所述服务器还用于基于所述会议邀请请求,向与所述目标会场中的所述目标次控设备下发入会信令,并在接收到所述目标次控设备返回的同意通知时,允许所述目标受控设备及所述目标次控设备加入当前会议;
所述目标次控设备用于在接收到所述服务器下发的入会信令时,呈现入会邀请通知;响应于其操作者的同意入会操作,向所述服务器返回所述同意通知,以加入当前会议。
11.根据权利要求10所述的系统,其特征在于,所述目标次控设备在响应于其操作者的同意入会操作,向所述服务器返回所述同意通知时,具体用于:
响应于其操作者的同意入会操作,利用其摄像头采集其操作者的图像,基于所述操作者的图像生成所述同意通知并发送至所述服务器;
所述服务器还用于基于人脸识别技术,从所述操作者的图像中提取所述操作者的人脸特征;根据人脸特征与人物身份标识的关联关系,确定所述操作者的身份标识;若所述操作者的身份标识与当前会议具有关联关系,则执行允许所述目标受控设备及所述目标次控设备加入当前会议的操作。
12.根据权利要求10所述的系统,其特征在于,若所述目标会场中不存在次控设备,则所述服务器还用于:
基于所述会议邀请请求,向所述目标受控设备下发入会信令,并在接收到所述目标受控设备返回的同意通知时,允许所述目标受控设备加入当前会议;
所述目标受控设备用于在接收到所述服务器下发的入会信令时,呈现入会邀请通知;响应于其操作者的同意入会操作,向所述服务器返回所述同意通知,以加入当前会议。
13.根据权利要求8所述的系统,其特征在于,所述主控设备还用于作为受控设备采集其所在会场的音视频内容并发送至所述服务器;或者
所述主控设备还用于作为次控设备按照对其所在会场的音视频内容的播放要求,向其所在会场中的受控设备发送次控参数,以控制其所在会场中的受控设备按照所述播放要求采集其所在会场的音视频内容。
14.根据权利要求1所述的系统,其特征在于,所述主控设备在按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求之前,还用于:
响应于其所在会场中的主持人的会议开启操作,利用其摄像头采集所述主持人的图像,并将所述主持人的图像发送至所述服务器;
所述服务器用于基于人脸识别技术,从所述主持人的图像中提取所述主持人的人脸特征;根据人脸特征与人物身份标识的关联关系,确定所述主持人的身份标识;若所述主持人的身份标识关联有已创建的会议,则将所述主持人对应的会议列表发送至所述主控设备,以供所述主持人通过所述主控设备选中当前会议;并在所述主持人选中当前会议时,允许所述主控设备开启当前会议。
15.根据权利要求1所述的系统,其特征在于,若目标受控设备采集到的所述音视频内容中包含所述目标会场中至少一个参会人员的图像;则所述服务器还用于:
基于人脸识别技术,从所述音视频内容中分别提取各参会人员的人脸特征;
根据人脸特征与人物身份标识的关联关系,确定各参会人员的身份标识;
在所述音视频内容中标注所述各参会人员的身份标识,以生成所述目标受控设备对应的人物标注后音视频内容;
将所述目标受控设备对应的人物标注后音视频内容共享至当前会议中的其它受控设备,以通过其它受控设备展示所述目标受控设备对应的人物标注后音视频内容。
16.一种音视频会议控制方法,其特征在于,适用于音视频会议系统中的主控设备,所述音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备,包括:
按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求,所述主控请求中包含与所述播放要求对应的主控参数,以供所述服务器基于所述主控参数控制所述目标会场中的目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
接收并输出所述服务器共享的所述目标会场的符合所述播放要求的音视频内容。
17.根据权利要求16所述的方法,其特征在于,所述主控参数包括摄像头的转动角度、焦距、分辨率或麦克风的音量参数中的一种或多种。
18.根据权利要求16所述的方法,其特征在于,所述主控设备包括音视频采集组件,所述方法还包括:
按照对其所在会场的音视频内容的播放要求,调整其音视频采集组件的工作状态;
基于工作状态调整后的音视频采集组件采集其所在会场的音视频内容并将所述音视频内容回传至所述服务器,以供所述服务器将所述音视频内容共享至当前会议中的其它受控设备。
19.根据权利要求18所述的方法,其特征在于,所述主控设备的音视频采集组件包括麦克风阵列,所述方法还包括:
当监测到其所在会场中出现人声信号时,利用其麦克风阵列确定所述发言人的位置;
根据所述发言人的位置,计算将其摄像头的拍摄角度对准所述发言人所需的摄像头的转动角度;
按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准所述发言人;
若所述发言人的发言时长超过预设时长,则按照预设放大倍数放大其摄像头的焦距,以对所述发言人进行聚焦。
20.根据权利要求18所述的方法,其特征在于,所述主控设备还包括显示屏,所述输出所述服务器共享的所述目标会场的符合所述播放要求的音视频内容,包括:
利用其显示屏展示所述服务器共享的所述目标会场的符合所述播放要求的音视频内容;
所述方法还包括:
接收所述服务器发送的当前会议的会议文档,并利用其显示器展示所述会议文档。
21.根据权利要求16所述的方法,其特征在于,所述音视频会议系统还包括布设在部分会场中的至少一个次控设备,当所述目标受控设备所在的目标会场中布设有目标次控设备时,在按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求之前,所述方法还包括:
响应于所述主控设备所在会场中的主持人对所述目标会场的会议邀请操作,向所述服务器发送会议邀请请求,以供所述服务器基于所述会议邀请请求,向与所述目标会场中的所述目标次控设备下发入会信令,并在接收到所述目标次控设备返回的同意通知时,允许所述目标受控设备及所述目标次控设备加入当前会议。
22.根据权利要求16所述的方法,其特征在于,所述主控设备所在会场中布设有受控设备,所述主控设备复用为次控设备,所述方法还包括:
按照对其所在会场的音视频内容的播放要求,向其所在会场中的受控设备发送次控参数,以控制其所在会场中的受控设备按照所述播放要求采集其所在会场的音视频内容。
23.根据权利要求16所述的方法,其特征在于,在按照对目标会场的音视频内容的播放要求,向所述服务器发送主控请求之前,还包括:
响应于其所在会场中的主持人的会议开启操作,利用其摄像头采集所述主持人的图像,并将所述主持人的图像发送至所述服务器,以供所述服务器对所述主持人进行当前会议的开启权限认证。
24.一种音视频会议控制方法,其特征在于,适用于音视频会议系统中的服务器,音视频会议系统中还包括可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备,包括:
接收所述主控设备按照对目标会场的音视频内容的播放要求而发送的主控请求,所述主控请求中包含与所述播放要求对应的主控参数;
将所述主控参数发送给所述目标会场中的目标受控设备,以控制所述目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
将所述目标受控设备回传的符合所述播放要求的音视频内容共享至所述主控设备,以供所述主控设备输出。
25.根据权利要求24所述的方法,其特征在于,所述主控参数包括摄像头的转动角度、焦距、分辨率或麦克风的音量参数中的一种或多种。
26.根据权利要求24所述的方法,其特征在于,所述音视频会议系统中还包括布设在部分会场中的至少一个次控设备,当所述目标受控设备所在的目标会场中布设有目标次控设备时,所述方法还包括:
基于所述主控设备对所述目标会场的会议邀请请求,向与所述目标会场中的所述目标次控设备下发入会信令,并在接收到所述目标次控设备返回的同意通知时,允许所述目标受控设备及所述目标次控设备加入当前会议。
27.根据权利要求26所述的方法,其特征在于,所述同意通知中携带有所述目标次控设备操作者的图像,所述方法还包括:
基于人脸识别技术,从所述操作者的图像中提取所述操作者的人脸特征;根据人脸特征与人物身份标识的关联关系,确定所述操作者的身份标识;若所述操作者的身份标识与当前会议具有关联关系,则执行允许所述目标受控设备及所述目标次控设备加入当前会议的操作。
28.根据权利要求26所述的方法,其特征在于,当所述目标会场中不存在次控设备,所述方法还包括:
基于所述主控设备对所述目标会场的会议邀请请求,向所述目标受控设备下发入会信令,并在接收到所述目标受控设备返回的同意通知时,允许所述目标受控设备加入当前会议。
29.根据权利要求24所述的方法,其特征在于,还包括:
接收所述主控设备响应于其所在会场中的主持人的会议开启操作而采集到的所述主持人的图像;
基于人脸识别技术,从所述主持人的图像中提取所述主持人的人脸特征;
根据人脸特征与人物身份标识的关联关系,确定所述主持人的身份标识;
若所述主持人的身份标识关联有已创建的会议,则将所述主持人对应的会议列表发送至所述主控设备,以供所述主持人通过所述主控设备选中当前会议;
在所述主持人选中当前会议时,允许所述主控设备开启当前会议。
30.根据权利要求24所述的方法,其特征在于,若目标受控设备回传的所述音视频内容中包含所述目标会场中至少一个参会人员的图像,所述方法还包括:
基于人脸识别技术,从所述音视频内容中分别提取各参会人员的人脸特征;
根据人脸特征与人物身份标识的关联关系,确定各参会人员的身份标识;
在所述音视频内容中标注所述各参会人员的身份标识,以生成所述目标受控设备对应的人物标注后音视频内容;
将所述目标受控设备对应的人物标注后音视频内容共享至当前会议中的其它受控设备,以通过其它受控设备展示所述目标受控设备对应的人物标注后音视频内容。
31.一种音视频会议控制方法,其特征在于,适用于音视频会议系统中的受控设备,所述音视频会议系统中包括服务器和可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含主控设备和受控设备,包括:
接收所述服务器基于所述主控设备对目标会场的主控请求而发送的主控参数,所述主控参数与对所述目标会场的音视频内容的播放要求相对应;
按照所述主控参数调整其音视频采集组件的工作状态;
基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容并将所述音视频内容回传至所述服务器,以使所述服务器将所述音视频内容共享至所述主控设备。
32.根据权利要求31所述的方法,其特征在于,所述受控设备的音视频采集组件包括摄像头;
所述主控参数包括摄像头的转动角度,所述方法具体包括:按照所述转动角度调整其摄像头的拍摄角度,基于调整后的拍摄角度采集所述目标会场的音视频内容;和/或
所述主控参数包括摄像头的焦距,所述方法具体包括:按照所述焦距调整其摄像头的焦距,基于调整后的焦距采集所述目标会场的音视频内容;和/或
所述主控参数包括摄像头的分辨率,所述方法具体包括:按照所述分辨率调整其摄像头的拍摄精度,基于调整后的拍摄精度采集所述目标会场的音视频内容。
33.根据权利要求31所述的方法,其特征在于,所述受控设备的音视频采集组件包括麦克风,所述主控参数包括音量参数,所述方法具体包括:
按照所述音量参数调整其麦克风的音量,基于调整后的音量采集所述目标会场的音视频内容。
34.根据权利要求33所述的方法,其特征在于,所述受控设备的麦克风采用麦克风阵列,所述方法还包括:
当监测到所述目标会场中出现人声信号时,利用其麦克风阵列确定所述目标会场中发言人的位置;
根据所述发言人的位置,计算将所述摄像头的拍摄角度对准所述发言人所需的摄像头的转动角度;
按照计算出的转动角度,控制其摄像头转动,以使其摄像头的拍摄角度对准所述发言人;
若所述发言人的发言时长超过预设时长,则按照预设放大倍数放大其摄像头的焦距,以对所述发言人进行聚焦。
35.根据权利要求31所述的方法,其特征在于,所述方法还包括:
接收所述服务器共享的当前会议的会议文档以及所述音视频会议系统中的其它受控设备采集到的音视频内容;
展示所述会议文档及所述其它受控设备采集到的音视频内容。
36.根据权利要求35所述的方法,其特征在于,所述受控设备包含显示屏,所述方法具体包括:
利用其显示屏展示所述会议文档以及所述其它受控设备采集到的音视频内容。
37.根据权利要求35所述的方法,其特征在于,所述受控设备外接有至少两个显示器;所述方法具体包括:
基于多屏异显技术,将所述会议文档以及所述其它受控设备采集到的音视频内容发送至不同的显示器进行展示。
38.根据权利要求31所述的方法,其特征在于,所述音视频会议系统还包括布设在部分会场中的至少一个次控设备,当所述受控设备所在的目标会场中布设有目标次控设备时,所述方法还包括:
接收所述目标次控设备响应其操作者对目标会场的音视频内容的播放要求而发送的次控参数;
按照所述次控参数调整其音视频采集组件的工作状态;
基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容并将所述音视频内容发送至所述服务器。
39.根据权利要求38所述的方法,其特征在于,所述方法还包括:
若同时接收到所述服务器发送的主控参数和所述次控设备发送的次控参数,则按照所述主控参数调整其音视频采集组件的工作状态。
40.根据权利要求38所述的方法,其特征在于,当所述目标会场中不存在次控设备时,所述方法还包括:
在接收到所述服务器下发的入会信令时,呈现入会邀请通知;
响应于其操作者的同意入会操作,向所述服务器返回所述同意通知,以加入当前会议。
41.一种音视频会议控制方法,其特征在于,适用于音视频会议系统中的次控设备,所述音视频会议系统中包括服务器以及可供布设于不同会场或位置的多个会议设备,所述多个会议设备通过互联网与所述服务器连接,所述多个会议设备中包含次控设备和受控设备,所述次控设备布设在任意会场中,当所述次控设备所在的目标会场中包括目标受控设备时,所述方法包括:
响应所述次控设备操作者对所述目标会场的音视频内容的播放要求,获取与所述播放要求相对应的次控参数;
向所述目标受控设备发送次控参数,以期望控制所述目标受控设备按照所述目标次控设备操作者的播放要求采集所述目标会场的音视频内容。
42.根据权利要求41所述的方法,其特征在于,所述多个会议设备中还包括主控设备,所述方法还包括:
在接收到所述服务器基于所述主控设备对所述目标会场的会议邀请请求而下发的入会信令时,呈现入会邀请通知;
响应于其操作者的同意入会操作,向所述服务器返回所述同意通知,以加入当前会议。
43.根据权利要求42所述的方法,其特征在于,所述响应于其操作者的同意入会操作,向所述服务器返回所述同意通知,包括:
响应于所述次控设备操作者的同意入会操作,利用其摄像头采集其操作者的图像;
基于所述操作者的图像生成所述同意通知;
将所述同意通知发送至所述服务器,以供所述服务器对所述次控设备操作者的入会权限进行验证。
44.一种电子设备,其特征在于,包括存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器及所述通信组件耦合,用于执行所述一条或多条计算机指令,以用于:
按照对目标会场的音视频内容的播放要求,通过所述通信组件向音视频会议系统中的服务器发送主控请求,所述主控请求中包含与所述播放要求对应的主控参数,以供所述服务器基于所述主控参数控制所述目标会场中的目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
接收并输出所述服务器共享的所述目标会场的符合所述播放要求的音视频内容。
45.一种服务器,其特征在于,包括存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器及所述通信组件耦合,用于执行所述一条或多条计算机指令,以用于:
通过所述通信组件接收音视频会议系统中的主控设备发送的主控请求,所述主控请求为所述主控设备按照对目标会场的音视频内容的播放要求而发送的,所述主控请求中包含与所述播放要求对应的主控参数;
通过所述通信组件将所述主控参数发送给所述目标会场中的目标受控设备,以控制所述目标受控设备按照所述播放要求采集所述目标会场的音视频内容;
通过所述通信组件将所述目标受控设备回传的符合所述播放要求的音视频内容共享至所述主控设备,以供所述主控设备输出。
46.一种电子设备,其特征在于,包括音视频采集组件、存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器、所述通信组件及所述音视频采集组件耦合,用于执行所述一条或多条计算机指令,以用于:
通过所述通信组件接收音视频会议系统中的服务器基于所述音视频会议系统中的主控设备的主控请求而发送的主控参数,所述主控参数与对所述电子设备所在目标会场的音视频内容的播放要求相对应;
按照所述主控参数调整所述音视频采集组件的工作状态,;
基于工作状态调整后的音视频采集组件采集所述目标会场的音视频内容;
通过所述通信组件将采集到的符合所述播放要求的音视频内容回传至所述服务器,以使所述服务器将所述音视频内容共享至所述主控设备。
47.一种电子设备,其特征在于,包括存储器、处理器和通信组件;
所述存储器用于存储一条或多条计算机指令;
所述处理器与所述存储器及所述通信组件耦合,用于执行所述一条或多条计算机指令,以用于:
响应所述电子设备操作者对所述电子设备所在的目标会场的音视频内容的播放要求,获取与所述播放要求相对应的次控参数;
向所述目标会场中的目标受控设备发送次控参数,以期望控制所述目标受控设备按照所述电子设备操作者的播放要求采集所述目标会场的音视频内容。
48.一种存储计算机指令的计算机可读存储介质,其特征在于,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行权利要求16-23任一项所述的音视频会议控制方法。
49.一种存储计算机指令的计算机可读存储介质,其特征在于,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行权利要求24-30任一项所述的音视频会议控制方法。
50.一种存储计算机指令的计算机可读存储介质,其特征在于,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行权利要求31-40任一项所述的音视频会议控制方法。
51.一种存储计算机指令的计算机可读存储介质,其特征在于,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行权利要求41-43任一项所述的音视频会议控制方法。
CN201910120726.1A 2019-02-18 2019-02-18 音视频会议系统、控制方法、设备及存储介质 Active CN111586337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910120726.1A CN111586337B (zh) 2019-02-18 2019-02-18 音视频会议系统、控制方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910120726.1A CN111586337B (zh) 2019-02-18 2019-02-18 音视频会议系统、控制方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111586337A true CN111586337A (zh) 2020-08-25
CN111586337B CN111586337B (zh) 2022-01-25

Family

ID=72118523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910120726.1A Active CN111586337B (zh) 2019-02-18 2019-02-18 音视频会议系统、控制方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111586337B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565665A (zh) * 2020-12-08 2021-03-26 北京北信源软件股份有限公司 一种视频会议控制方法、装置、电子设备及存储介质
CN112752062A (zh) * 2021-01-10 2021-05-04 深圳万宏业科技有限公司 一种高速效的视频会议系统
CN113128334A (zh) * 2021-03-03 2021-07-16 广州朗国电子科技有限公司 一种ai智能图像识别方法、电子设备、存储介质
CN113541977A (zh) * 2021-06-17 2021-10-22 中联国智科技管理(北京)有限公司 一种基于5g的远程会议操作方法及装置
CN113949596A (zh) * 2021-10-15 2022-01-18 北京百度网讯科技有限公司 一种设备连接方法、装置、设备以及存储介质
CN114338254A (zh) * 2021-12-29 2022-04-12 随锐科技集团股份有限公司 用于多媒体会议系统的管理方法及其相关产品
WO2022094813A1 (zh) * 2020-11-04 2022-05-12 深圳市汇顶科技股份有限公司 同步通信方法、电子设备及存储介质
CN114630072A (zh) * 2022-03-22 2022-06-14 联想(北京)有限公司 处理方法、处理装置及采集装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1411278A (zh) * 2002-11-25 2003-04-16 北京邮电通信设备厂 Ip网络电视会议系统
CN101141613A (zh) * 2007-10-10 2008-03-12 中国联合通信有限公司 一种视频会议切换控制系统及方法
CN101583011A (zh) * 2009-05-27 2009-11-18 深圳华为通信技术有限公司 视频会议控制方法、系统、视频会议网络设备和会场
CN101668162A (zh) * 2009-10-14 2010-03-10 中国电信股份有限公司 视频会议的实现方法和视频会议系统
CN101834730A (zh) * 2009-03-13 2010-09-15 华为技术有限公司 一种多媒体会议控制方法和系统
CN101867769A (zh) * 2010-05-26 2010-10-20 广东亿迅科技有限公司 一种网络多媒体通信方法与系统
CN104144315A (zh) * 2013-05-06 2014-11-12 华为技术有限公司 一种多点视频会议的显示方法及多点视频会议系统
CN104639777A (zh) * 2013-11-14 2015-05-20 中兴通讯股份有限公司 一种会议控制方法、装置及会议系统
CN105657329A (zh) * 2016-02-26 2016-06-08 苏州科达科技股份有限公司 视频会议系统、处理装置及视频会议方法
CN106254303A (zh) * 2016-04-11 2016-12-21 上海建朗信息科技有限公司 易于组合协调控制的智能化会议系统
US20170041570A1 (en) * 2015-08-03 2017-02-09 Ricoh Company, Ltd. Communication apparatus, communication method, and communication system
US20180165520A1 (en) * 2016-12-12 2018-06-14 Logitech Europe S.A. Video conferencing system and related methods

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1411278A (zh) * 2002-11-25 2003-04-16 北京邮电通信设备厂 Ip网络电视会议系统
CN101141613A (zh) * 2007-10-10 2008-03-12 中国联合通信有限公司 一种视频会议切换控制系统及方法
CN101834730A (zh) * 2009-03-13 2010-09-15 华为技术有限公司 一种多媒体会议控制方法和系统
CN101583011A (zh) * 2009-05-27 2009-11-18 深圳华为通信技术有限公司 视频会议控制方法、系统、视频会议网络设备和会场
CN101668162A (zh) * 2009-10-14 2010-03-10 中国电信股份有限公司 视频会议的实现方法和视频会议系统
CN101867769A (zh) * 2010-05-26 2010-10-20 广东亿迅科技有限公司 一种网络多媒体通信方法与系统
CN104144315A (zh) * 2013-05-06 2014-11-12 华为技术有限公司 一种多点视频会议的显示方法及多点视频会议系统
CN104639777A (zh) * 2013-11-14 2015-05-20 中兴通讯股份有限公司 一种会议控制方法、装置及会议系统
US20170041570A1 (en) * 2015-08-03 2017-02-09 Ricoh Company, Ltd. Communication apparatus, communication method, and communication system
CN105657329A (zh) * 2016-02-26 2016-06-08 苏州科达科技股份有限公司 视频会议系统、处理装置及视频会议方法
CN106254303A (zh) * 2016-04-11 2016-12-21 上海建朗信息科技有限公司 易于组合协调控制的智能化会议系统
US20180165520A1 (en) * 2016-12-12 2018-06-14 Logitech Europe S.A. Video conferencing system and related methods

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘文捷: "数字会议系统在某大型数据研发中心的应用", 《智能建筑电气技术》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022094813A1 (zh) * 2020-11-04 2022-05-12 深圳市汇顶科技股份有限公司 同步通信方法、电子设备及存储介质
CN112565665A (zh) * 2020-12-08 2021-03-26 北京北信源软件股份有限公司 一种视频会议控制方法、装置、电子设备及存储介质
CN112565665B (zh) * 2020-12-08 2022-07-26 北京北信源软件股份有限公司 一种视频会议控制方法、装置、电子设备及存储介质
CN112752062A (zh) * 2021-01-10 2021-05-04 深圳万宏业科技有限公司 一种高速效的视频会议系统
CN113128334A (zh) * 2021-03-03 2021-07-16 广州朗国电子科技有限公司 一种ai智能图像识别方法、电子设备、存储介质
CN113541977A (zh) * 2021-06-17 2021-10-22 中联国智科技管理(北京)有限公司 一种基于5g的远程会议操作方法及装置
CN113949596A (zh) * 2021-10-15 2022-01-18 北京百度网讯科技有限公司 一种设备连接方法、装置、设备以及存储介质
CN114338254A (zh) * 2021-12-29 2022-04-12 随锐科技集团股份有限公司 用于多媒体会议系统的管理方法及其相关产品
CN114630072A (zh) * 2022-03-22 2022-06-14 联想(北京)有限公司 处理方法、处理装置及采集装置

Also Published As

Publication number Publication date
CN111586337B (zh) 2022-01-25

Similar Documents

Publication Publication Date Title
CN111586337B (zh) 音视频会议系统、控制方法、设备及存储介质
CN210112145U (zh) 音视频会议系统及设备
US9473741B2 (en) Teleconference system and teleconference terminal
US11153110B2 (en) Communication method and terminal in live webcast channel and storage medium thereof
US20210409646A1 (en) Apparatus for video communication
EP3236660A1 (en) Video processing method and device
JP6285615B2 (ja) リモートアシスタンス方法、クライアント、プログラム及び記録媒体
JP2018501742A (ja) 機器制御方法、装置、プログラム及び記録媒体
CN104657099A (zh) 屏幕投射方法、装置及系统
US11206372B1 (en) Projection-type video conference system
CN106375479B (zh) 数据共享方法及装置
JP2013236375A (ja) モジュール識別情報運用方法及びシステムとこれを支援する端末機
WO2020063675A1 (zh) 一种智能音箱及智能音箱使用的方法
CN111263103A (zh) 远程会议方法、系统
CN105159523A (zh) 目标功能的开启方法、装置及系统
JP2017514428A (ja) ネットワーク接続方法、装置、プログラム及び記録媒体
US20150035934A1 (en) Video message record terminal, video message transmitting server and method for leaving video message
CN107393528B (zh) 语音控制方法及装置
JP5349656B1 (ja) 映像処理装置及びその制御方法
KR101692909B1 (ko) 화면 미러링을 이용한 화상 회의 제공 방법 및 시스템
CN113452662A (zh) 建立会议、会议创建方法、设备、系统及存储介质
CN106331748A (zh) 直播方法、装置及服务器
CN111010721A (zh) 无线配网方法、无线配网装置及计算机可读存储介质
KR20120079636A (ko) 다자간 회의에서 문서 작업 공유 방법
CN105430423A (zh) 视频备份方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant