CN213213666U - 一种视音频通讯设备 - Google Patents

一种视音频通讯设备 Download PDF

Info

Publication number
CN213213666U
CN213213666U CN202022145215.6U CN202022145215U CN213213666U CN 213213666 U CN213213666 U CN 213213666U CN 202022145215 U CN202022145215 U CN 202022145215U CN 213213666 U CN213213666 U CN 213213666U
Authority
CN
China
Prior art keywords
audio
camera
loudspeaker
video
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202022145215.6U
Other languages
English (en)
Inventor
李新国
冯津伟
杜秉聰
谭国庆
黄伟隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202022145215.6U priority Critical patent/CN213213666U/zh
Application granted granted Critical
Publication of CN213213666U publication Critical patent/CN213213666U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本说明书实施例提供一种视音频通讯设备,支持视频和/或音频会话,包括扬声器、第一拾音器、第二拾音器和摄像头。扬声器,置于设备的一端,用于播放视频和/或音频会话中的远程音频,第一拾音器,置于设备中远离扬声器的另一端,用于拾取现场音频;第二拾音器,沿扬声器的周边设置,用于拾取扬声器播放的第一音频;摄像头,用于采集现场图像;控制电路,扬声器、第一拾音器、第二拾音器以及摄像头均与控制电路电性连接。该设备功能集成度高,搭建难度低,更具实用性。

Description

一种视音频通讯设备
技术领域
本说明书实施例涉及远程办公设备技术领域,具体地,涉及一种视音频通讯设备。
背景技术
远程办公和远程在线教育等远程交互方式,在突发公共卫生事件等应急事件、启动应急响应机制状态下,能够维持人们必要的工作和学习,发挥了重要作用。
目前支持远程办公和在线教育的软件类产品已较为成熟,例如各种在线学习App、即时交互类办公App等等,功能较为丰富。然而,在硬件设备方面,远程办公或者在线教育场景中,普通的移动终端有时难以满足沟通需要,往往需要更专业化的音频、视频处理设备,而目前市场上的音质效果较好的相关设备,大多功能单一,环境架设复杂,普通用户很难自己完成环境搭建。
发明内容
本说明书描述了一种视音频通讯设备,功能集成度高,一台设备可同时实现视频和音频处理,方便用户使用,且双拾音器等各个部件的结构设计为回声消除提供了硬件基础。
第一方面,本说明书实施例提供一种视音频通讯设备,支持视频和/或音频会话,包括:
扬声器,置于该设备的一端,用于播放视频和/或音频会话中的远程音频;第一拾音器,置于该设备中远离扬声器的另一端,用于拾取现场音频;第二拾音器,沿扬声器的周边设置,用于拾取扬声器播放的第一音频;摄像头,用于采集现场图像;控制电路,扬声器、第一拾音器、第二拾音器以及摄像头均与控制电路电性连接。
在一个实施例中,控制电路包括相位同步电路,相位同步电路,用于控制第一拾音器拾取的现场音频与第二拾音器拾取的第一音频的信号相位同步。
在一个实施例中,该设备还包括前壳体,前壳体用于支撑和/或容纳摄像头、扬声器、第一拾音器和第二拾音器中的至少一个。
在一个实施例中,前壳体的一个侧面上设置有用于容纳摄像头的第一腔体,第一腔体的形状及尺寸与摄像头的外观形状及尺寸相配合。
在一个实施例中,第一腔体设置于一个侧面上沿长度方向或宽度方向上的中部位置。
在一个实施例中,前壳体的一个侧面上设置有分别用于嵌入第一拾音器、第二拾音器的两个凹槽。
在一个实施例中,凹槽底部为镂空。
在一个实施例中,该设备还包括后盖板;后盖板与前壳体可拆解连接,后盖板与前壳体拼接成设备的外壳。
在一个实施例中,前壳体上还设置有指示灯和指示窗;指示窗用于透射指示灯发出的灯光。
在一个实施例中,该设备还包括内置支撑架;内置支撑架上设置有用于容纳扬声器的第二腔体;第二腔体的形状及尺寸与扬声器的外观形状及尺寸相配合。
在一个实施例中,控制电路至少包括处理单元,处理单元,用于从拾取的现场音频中消除由第一音频带来的回声。
在一个实施例中,处理单元,还用于控制摄像头,追踪现场的主讲话人并进行图像采集。
在一个实施例中,摄像头为可旋转摄像头。
在一个实施例中,该设备底部设置有可旋转底座。
在一个实施例中,该设备为一体机设备。
第二方面,本说明书实施例还提供一种远程教育直播设备,该设备包括如上述任一项所述的视音频通讯设备。
第三方面,本说明书实施例还提供一种远程办公设备,该设备包括如上述任一项所述的视音频通讯设备。
第四方面,本说明书实施例还提供一种远程通讯设备,该设备包括如上述任一项所述的视音频通讯设备。采用本说明书实施例提供的一种视音频通讯设备,扬声器播放远程音频,也就是播放非现场语音,而第一拾音器和第二拾音器分别位于设备的两端,一个用于采集现场语音信号,另一个用于采集扬声器的语音信号,现场音频信号中会包含扬声器播放的音频信号(第一音频),这部分音频信号对于远程参与者而言,就是自身声音的回声,需要予以消除,这种双拾音器的结构设计,能够更有利于回声消除,因而输出音质效果更好的现场语音,且该设备同时可实现现场视频采集,一台设备即可满足远程交互的各种需求,无需用户自行选择拾音设备、音箱和摄像头再进行搭建,对于普通用户而言,使用更为方便,更具亲和力,有助于提升用户体验。
附图说明
为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本说明书一个实施例中视音频通讯设备的主视图;
图2示出了本说明书一个具体实施例中视音频通讯设备的产品爆炸图;
图3示出了本说明书一个实施例中的视音频通讯设备的俯视图;
图4示出了本说明书一个实施例中的视音频通讯设备的远场拾音效果图;
图5示出了本说明书一个实施例中会议现场示意图;
图6示出了不具备C位跟踪功能的现场图像示意图;
图7示出了本说明书一个实施例中具备C位跟踪功能的现场图像的示意图;
图8示出了本说明书另一个实施例中具备C位跟踪功能的现场图像的示意图。
具体实施方式
下面结合附图,对本说明书披露的多个实施例进行描述。
发明人在产品研发过程中发现,已有技术下的一款相关产品,采用了两个光学变焦镜头以及10麦克风阵列,该产品没有内置扬声器只能配合电视机或者外挂音箱使用,搭建起来复杂且产品价格高昂不适合中小会议使用;另一款已有产品,为提升播放端效果,采用5颗扬声器以降低失真、减小对回声消除算法的影响,该方案声学设计复杂且成本较高。
鉴于此,本说明书实施例披露了一种视音频通讯设备,内置扬声器、双麦克风(即拾音器)及高清摄像头,产品架设简单,功能高度集成,普通用户就可以轻松搭建,实现在线音视频功能。
可选的,在一个实施例中,该设备可以采用一体式设计,即各个功能组件均集成于一台设备中,例如扬声器、双麦克风及高清摄像头等均设置均集成于一台设备。在另一个实施例中,该设备也可以采用分体式设计。
该设备不仅可同时支持视频和音频会话、应用于视音频会话场景、音频会话场景中的任意一种,进一步地,基于该设备的硬件结构设计,还可以通过算法控制可以实现双参考回声消除,提高远场拾音效果,以及配合摄像头和C位跟踪算法,实现“C”位跟踪能力,追踪主讲话人进行拍摄。
参阅图1所示,在一个实施例中,该设备至少包括扬声器11、摄像头12、第一拾音器13和第二拾音器14。
其中,扬声器11,置于设备的一端,用于播放视频和/或音频会话中的远程音频,第一拾音器13,置于设备中远离扬声器的另一端,用于拾取现场音频,第二拾音器14,沿扬声器的周边设置,用于拾取扬声器播放的第一音频,摄像头12,则用于采集现场图像。该设备还包括控制电路15,扬声器、第一拾音器、第二拾音器以及摄像头均与控制电路电性连接(图1所述角度未能示出控制电路)。
可以理解,图1所示仅为表示产品构件相对位置的简要示意图,仅用于说明扬声器与拾音器等构件的方位关系,不可作为对实际产品的必要限定。
参阅图2所述,在一个更具体的实施例中,第二拾音器(麦克风)14贴近扬声器11以拾取扬声器11的非线性失真信号,第一拾音器(麦克风)固定在该设备中距扬声器11最远距离处,用于拾取本地也就是现场讲话人的声音,摄像头12在产品的前方,用于拾取本地与会人的图像。上述各个部件均与控制电路15电性连接。
示例性地,下面从结构设计的角度,对该实施例提供的设备进行说明:
该设备还包括前壳体16,前壳体16用于支撑和/或容纳摄像头12、扬声器11、第一拾音器13和第二拾音器14中的至少一个。在该实施例中,摄像头12、第一拾音器13和第二拾音器14均固定于所述前壳体上。
具体地,在该实施例中,前壳体16的一个侧面161上设置有用于容纳摄像头12的第一腔体162,第一腔体的形状及尺寸与摄像头12的外观形状及尺寸相配合。
为便于图像采集,摄像头可以设置于两个拾音器之间,也就是设备的中部位置,例如,可以设置于侧面161的长度方向或者宽度方向上的中间位置。
前壳体16的一个侧面上设置有分别用于嵌入第一拾音器13、第二拾音器14的两个凹槽。在一个实施例中,凹槽底部可以设置为镂空,便于第一拾音器或第二拾音器,从背面侧采集声音信号,例如指向性拾音器,背面侧的声音信号是否能够顺利进入拾音器内部进而与相应方向上的正面信号相抵消,对于拾音器的指向性也有明显的影响。设计为镂空,可用于背面侧信号进入。
本说明书实施例中,拾音器,即麦克风,也可以称为传声器、咪头、咪胆等等。
在该具体实施例中,该设备还包括后盖板17,后盖板17与前壳体16可拆解连接,后盖板17与前壳体16拼接成设备的外壳。作为一种可实施方式,该设备还包括内置支撑架18,内置支撑架18上设置有用于容纳扬声器11的第二腔体181;第二腔体181的形状及尺寸与扬声器11的外观形状及尺寸相配合。
参阅图3所示,在一个实施例中,前壳体16上还设置有指示灯(图3中未示出)和指示窗163;指示窗163用于透射指示灯发出的灯光。作为一种可实施方式,设有指示窗的侧面与摄像头所在的侧面相互垂直。
具体地,与硬件电路上,控制电路15中设有相位同步电路,用于控制第一拾音器拾取的现场音频与第二拾音器拾取的第一音频的信号相位同步,即第一拾音器13和第二拾音器14在硬件电路上保证相位同步。
控制电路15还至少包括处理单元,处理单元用于从拾取的现场音频中消除由第一声音带来的回声,并且,还用于控制摄像头,追踪现场的主讲话人并进行图像采集。
基于本说明书实施例披露的上述视音频通讯设备,可进一步实施双回声消除和C位跟踪。
在通话场景中,远端的信号通过扬声器播放出来被本地的麦克风拾取,这部分被拾取的声音信号对于远端而言就是自己发出的声音的回声,现场采集的声音信号需要将回声消弧,再传给远端。回声消除的算法就是将扬声器播放的声音消除掉,避免远端听到自己的声音。基于本说明书实施例披露的视音频通讯设备,可实施双回声消除算法。
具体地,本说明书实施例披露的双参考回声消除,是利用第二拾音器拾取扬声器的非线性声音,即用于拾取扬声器的非线性失真信号,以从第一拾音器拾取到的本地现场声音信号中,消除扬声器所产生的非线性成份,再通过电回采信号消除回声中的线性部分,使得回声消除干净没有回声残留。
扬声器产生的非线性成份,通过传统的回声消除(Acoustic Echo Cancellation,AEC)是无法消除的,消除回声后的信号中仍然会残留非线性失真的成分,利用第二拾音器拾取到扬声器非线性成份特性,可以将第二拾音器的信号作为参考信号源进行自适应滤波器学习,更能模拟出真实的回声情况。
此外,第一拾音器和第二拾音器在硬件电路上保证相位同步,通过阵列算法可以改变拾音的指向特性,参阅图4所示,通过该阵列算法,提升了拾音侧信噪比,提升了拾音距离。例如,麦克风阵列算法,可以通过设备上的多个麦克风采集到的语音信号,然后通过算法对各个通道的信号相位进行调整,使得目标信号的波峰和波峰对齐并相互叠加,实现了对该方向信号能量的增强,实现远距离拾音及给出该目标信号的方位信息。
进一步地,本说明书实施例披露的视音频通讯设备,还可以基于双拾音器构成的麦克风阵列,跟踪本地会话现场发言人角度,配合摄像头图像算法,对当前的主讲话人实现跟踪,也就是C位追踪。
对应地,于硬件结构设计上,摄像头为可旋转摄像头,以追踪本地会话现场当前的主讲话人;或者,也可以是摄像头为固定摄像头,而设备底部设置有可旋转底座,可以使得整个设备跟随主讲话人位置的变化而追踪拍摄。
例如,在一会议室中,本地开会人有A、B、C三人,按图5所示方式就坐,如果本地设备不带“C”位跟踪的功能,在远端的会议室的电视端会显示图6所示的画面,即与会的所有人都显示在画面里面,而当本地设备带“C”位跟踪的功能时,若C是主讲话人,则在远端的会议室的显示屏就会显示图7所示的画面,若A为主讲话人,则远端显示屏就会显示图8所示的画面。即主讲话人会再次单独进行显示,这样,远程与会者可以更有针对性地倾听主讲话人,避免注意力分散。可以理解,图5至图7中所示的标记为C的与会者仅为一个普通的与会者,本说明书中的“C位”跟踪,指的是追踪主讲话人,主讲话人可以是A,也可以是B,并非是指定追踪标记为C的与会者。
本说明书实施例公开了一种音视频一体机设备,该设备内置扬声器、麦克风阵列及高清摄像头,不仅仅是功能构件的简单堆砌,双拾音器与扬声器的相对位置设计,为双回声消除算法提供了硬件基础,进一步通过算法控制可以实现双参考回声消除,进而提高音频质量,相比于其他一些同事支持视音频的设备,音质效果更佳;且进一步地,该设备的双拾音器,相当于麦克风阵列,也为相应的算法提供了硬件基础,进而可通过算法控制,进一步提高拾音距离,更好地采集本地远场语音;以及,配合摄像头实现“C”位跟踪能力;该产品功能高度集成,降低了视音频会话环境搭建难度,普通用户即可轻松搭建,实现在线音视频功能,提升了用户体验。
另一方面,本说明书实施例还提供一种远程教育直播设备,该设备包括如上述任一实施例所述的视音频通讯设备。远程教育直播设备,包括支持直播的各种用于远程教育的设备,例如可以是支持在线学习的家教机、学习机等。
再一方面,本说明书实施例还提供一种远程办公设备,该设备包括如上述任一实施例所述的视音频通讯设备。远程办公设备,包括支持视音频采集的各种用于远程办公的设备,例如多放视频电话会议设备等等。
再一方面,本说明书实施例还提供一种远程通讯设备,该设备包括如上述任一实施例所述的视音频通讯设备。远程通讯设备,包括支持视音频采集的各种用于远程通讯的设备。
以上所述的具体实施方式,对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书披露的多个实施例的具体实施方式而已,并不用于限定本说明书披露的多个实施例的保护范围,凡在本说明书披露的多个实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书披露的多个实施例的保护范围之内。

Claims (18)

1.一种视音频通讯设备,支持视频和/或音频会话,包括:
扬声器,置于所述设备的一端,用于播放所述视频和/或音频会话中的远程音频;
第一拾音器,置于所述设备中远离所述扬声器的另一端,用于拾取现场音频;
第二拾音器,沿所述扬声器的周边设置,用于拾取所述扬声器播放的第一音频;
摄像头,用于采集现场图像;
控制电路,所述扬声器、第一拾音器、第二拾音器以及所述摄像头均与所述控制电路电性连接。
2.根据权利要求1所述的设备,其中,所述控制电路包括相位同步电路,所述相位同步电路,用于控制所述第一拾音器拾取的现场音频与所述第二拾音器拾取的第一音频的信号相位同步。
3.根据权利要求1所述的设备,其中,所述设备还包括前壳体,所述前壳体用于支撑和/或容纳所述摄像头、所述扬声器、所述第一拾音器和所述第二拾音器中的至少一个。
4.根据权利要求3所述的设备,其中,所述前壳体的一个侧面上设置有用于容纳所述摄像头的第一腔体,所述第一腔体的形状及尺寸与所述摄像头的外观形状及尺寸相配合。
5.根据权利要求4所述的设备,其中,所述第一腔体设置于所述一个侧面上沿长度方向或宽度方向上的中部位置。
6.根据权利要求3所述的设备,其中,所述前壳体的一个侧面上设置有分别用于嵌入所述第一拾音器、所述第二拾音器的两个凹槽。
7.根据权利要求6所述的设备,其中,所述凹槽底部为镂空。
8.根据权利要求3所述的设备,其中,所述设备还包括后盖板;
所述后盖板与所述前壳体可拆解连接,所述后盖板与所述前壳体拼接成所述设备的外壳。
9.根据权利要求3所述的设备,其中,所述前壳体上还设置有指示灯和指示窗;所述指示窗用于透射所述指示灯发出的灯光。
10.根据权利要求1所述的设备,其中,所述设备还包括内置支撑架;
所述内置支撑架上设置有用于容纳所述扬声器的第二腔体;
所述第二腔体的形状及尺寸与所述扬声器的外观形状及尺寸相配合。
11.根据权利要求1所述的设备,其中,所述控制电路至少包括处理单元,所述处理单元,用于从拾取的所述现场音频中消除由所述第一音频带来的回声。
12.根据权利要求11所述的设备,其中,所述处理单元,还用于控制所述摄像头,追踪现场的主讲话人并进行图像采集。
13.根据权利要求1-12任一项所述的设备,其中,所述摄像头为可旋转摄像头。
14.根据权利要求1-12任一项所述的设备,其中,所述设备底部设置有可旋转底座。
15.根据权利要求1-12任一项所述的设备,其中,所述设备为一体机设备。
16.一种远程教育直播设备,其中,所述设备包括如权利要求1-15中任一项所述的视音频通讯设备。
17.一种远程办公设备,其中,所述设备包括如权利要求1-15中任一项所述的视音频通讯设备。
18.一种远程通讯设备,其中,所述设备包括如权利要求1-15中任一项所述的视音频通讯设备。
CN202022145215.6U 2020-09-25 2020-09-25 一种视音频通讯设备 Active CN213213666U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202022145215.6U CN213213666U (zh) 2020-09-25 2020-09-25 一种视音频通讯设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202022145215.6U CN213213666U (zh) 2020-09-25 2020-09-25 一种视音频通讯设备

Publications (1)

Publication Number Publication Date
CN213213666U true CN213213666U (zh) 2021-05-14

Family

ID=75822928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202022145215.6U Active CN213213666U (zh) 2020-09-25 2020-09-25 一种视音频通讯设备

Country Status (1)

Country Link
CN (1) CN213213666U (zh)

Similar Documents

Publication Publication Date Title
US7852369B2 (en) Integrated design for omni-directional camera and microphone array
JP4885928B2 (ja) テレビ会議システム
US10447970B1 (en) Stereoscopic audio to visual sound stage matching in a teleconference
US8150061B2 (en) Sound generating method, sound generating apparatus, sound reproducing method, and sound reproducing apparatus
EP2352290B1 (en) Method and apparatus for matching audio and video signals during a videoconference
US20040008423A1 (en) Visual teleconferencing apparatus
WO2010130084A1 (zh) 远程呈现系统、方法及视频采集设备
US8390665B2 (en) Apparatus, system and method for video call
WO2012142975A1 (zh) 会场终端音频信号处理方法及会场终端和视讯会议系统
CN114900635A (zh) 一种投影视频会议系统
JP2008005122A (ja) 双方向通信システム及び双方向通信方法並びに制御プログラム
CN213213666U (zh) 一种视音频通讯设备
US7646862B2 (en) Speakerphone with a novel loudspeaker placement
CN115988163A (zh) 一种即插即用的无线智能音视频收发系统
JP5097169B2 (ja) 電話会議装置とそれを用いた電話会議システム
CN110858883A (zh) 一种智能音箱及智能音箱使用的方法
KR20100006029A (ko) 원격 화상회의시스템
US11496654B2 (en) Projection-type video conference device and system there of
CN212343907U (zh) 立体式一体摄像机
CN219643972U (zh) 一种即插即用的无线智能音视频收发系统
CN213213667U (zh) 一种基于视觉与声音融合的可交互的会议装置
JPH06225298A (ja) テレビ通話用端末装置
CN211554521U (zh) 一种视频直播录制装置
RU34835U1 (ru) Система для видеоконференций
EP3917162A1 (en) System and devices for audio-video spatial communication and event sharing

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant