CN207266143U - 具有usb3.0接口的语音跟踪ptz摄像机 - Google Patents

具有usb3.0接口的语音跟踪ptz摄像机 Download PDF

Info

Publication number
CN207266143U
CN207266143U CN201721218355.3U CN201721218355U CN207266143U CN 207266143 U CN207266143 U CN 207266143U CN 201721218355 U CN201721218355 U CN 201721218355U CN 207266143 U CN207266143 U CN 207266143U
Authority
CN
China
Prior art keywords
audio
interfaces
signal
tilt
processing module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201721218355.3U
Other languages
English (en)
Inventor
陈智奇
刘方杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hi Tech Ltd By Share Ltd
Original Assignee
Shenzhen Hi Tech Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Hi Tech Ltd By Share Ltd filed Critical Shenzhen Hi Tech Ltd By Share Ltd
Priority to CN201721218355.3U priority Critical patent/CN207266143U/zh
Application granted granted Critical
Publication of CN207266143U publication Critical patent/CN207266143U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)

Abstract

本实用新型公开了一种具有USB3.0接口的语音跟踪PTZ摄像机,其包括摄像头;将景物图像转换为图像数字信号的图像传感模块;采集声音信号并将声音信号转换为音频模拟信号的音频采集模块;与图像传感模块和音频采集模块连接的视频处理模块,用于分析音频模拟信号以获得优化的目标声源音频信号和相关音频信息,以及将音频信号和图像数字信号转换为视频信号;PTZ控制模块,用于根据视频处理模块依据相关音频信息发出的控制指令,驱动云台转动;与视频处理模块和客户端连接,并通过USB3.0接口输出视频信号的视频输出模块。本实用新型提出的技术方案可以在室内高混响环境中辨别有用声源,并控制云台转动以实现自动定向跟踪。

Description

具有USB3.0接口的语音跟踪PTZ摄像机
技术领域
本实用新型涉及视频会议摄像机技术领域,尤其涉及一种具有USB3.0接口的语音跟踪PTZ摄像机。
背景技术
视频会议系统广泛采用PTZ(Pan Tilt Zoom)摄像机,该摄像机一般作为视频会议终端的主视频源。由于该摄像机可以接收视频会议终端的控制指令水平(Pan)、垂直(Tilt)运动和变焦(Zoom),因此可以满足不同会议形式对摄像机的要求。
目前随着移动互联网的不断发展和网络带宽的不断增加,实时视频通信的需求愈来愈高,已经成为宽带网络中继电视、数据之后的第三大服务内容。高效的视频通信需要不断的实时获取说话人的位置,在视频会议系统中需要不断地调整摄像头的方向,使其对准说话人。目前一般是由专人随着说话人的移动和更换,不断地手工调整摄像头的角度,这种方式不但耗费更多的人力物力,而且实时性差、精确度不高。
实用新型内容
本实用新型的主要目的在于提供一种USB3.0接口的语音跟踪PTZ摄像机,旨在解决目前的视频会议摄像机由于需要手工调整摄像头角度,耗费更多的人力物力、实时性差、精确度不高的技术问题。
为实现上述目的,本实用新型提供的具有USB3.0接口的语音跟踪PTZ 摄像机,其设于云台上并与客户端连接,所述具有USB3.0接口的语音跟踪 PTZ摄像机包括:
摄取景物图像的摄像头;
与所述摄像头连接,将所述景物图像转换为图像数字信号的图像传感模块;
采集声音信号并将所述声音信号转换为音频模拟信号的音频采集模块;
与所述图像传感模块和所述音频采集模块连接的视频处理模块,用于分析所述音频模拟信号以获得优化的目标声源音频信号和相关音频信息,以及将所述优化的目标声源音频信号和所述图像数字信号转换为视频信号;
与所述云台、所述摄像头和所述视频处理模块连接的PTZ控制模块,用于根据所述视频处理模块依据所述相关音频信息发出的控制指令,驱动所述云台转动和所述摄像头变倍;
与所述视频处理模块和所述客户端连接的视频输出模块,所述视频输出模块还包括USB3.0接口,所述视频输出模块通过所述USB3.0接口输出所述视频信号至所述客户端。
优选地,所述音频采集模块包括双MIC采集单元、隔离电路和滤波放大电路,所述双MIC采集单元的输出端与所述隔离电路的输入端电连,所述隔离电路的输出端与所述滤波放大电路的输入端电连,所述滤波放大电路的输出端与所述视频处理模块电连。
优选地,所述视频处理模块包括:
与所述音频采集模块连接的音频模数转换器,用于将所述音频模拟信号转换成音频数字信号;
与所述音频模数转换器连接的ASIC芯片,用于分析所述音频数字信号以获得优化的目标声源音频信号和相关音频信息,并根据所述相关音频信息向所述PTZ控制模块发出控制指令,以及将所述优化的目标声源音频信号和所述图像数字信号转换为视频信号。
优选地,所述USB3.0接口根据UVC协议接收所述客户端的控制信号,以使所述视频处理模块根据该控制信号对PTZ控制模块进行控制。
优选地,所述图像传感模块通过带有屏蔽层的同轴电缆与所述视频处理模块连接。
优选地,所述PTZ控制模块包括:
串口通讯接口;
通过所述串口通讯接口与所述视频处理模块连接的单片机;
与所述单片机和所述云台机械连接,以驱动所述云台转动的水平步进电机和垂直步进电机。
优选地,所述PTZ控制模块还包括与所述单片机连接的IR接口,所述具有USB3.0接口的语音跟踪PTZ摄像机还配有与所述IR接口对应,通过发射红外信号来对所述PTZ控制模块进行无线控制的红外遥控器。
优选地,所述PTZ控制模块还包括与所述单片机连接,以使所述PTZ控制模块与所述客户端之间进行的双向通信的RS-232接口。
优选地,所述串口通讯接口为TTL接口。
优选地,所述云台为全向云台。
本实用新型提出的技术方案中,通过视频处理模块分析采集到的音频模拟信号以获得优化的目标声源音频信号和相关音频信息,并根据所述相关音频信息向PTZ控制模块发送控制信号,从而控制云台向目标声源转动和摄像头变倍。在这个过程中,由于摄像机可以自动跟踪目标声源,无需采用手动调整,实时性好,精确度高。另外,采用USB3.0接口传输视频信号不仅提高了传输性能,而且也不需要大量布线。
附图说明
为了更清楚地说明本实用新型实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本实用新型的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本实用新型一实施例提供的具有USB3.0接口的语音跟踪PTZ摄像机的结构框图;
图2本实用新型另一实施例提供的具有USB3.0接口的语音跟踪PTZ摄像机的结构框图。
本实用新型目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本实用新型实施例中的附图,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本实用新型的一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本实用新型保护的范围。
需要说明,本实用新型实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本实用新型中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本实用新型的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本实用新型中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本实用新型中的具体含义。
另外,本实用新型各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本实用新型要求的保护范围之内。
本实用新型提出一种具有USB3.0接口61的语音跟踪PTZ摄像机。
请参照图1,在本实施例中,该具有USB3.0接口61的语音跟踪PTZ摄像机100,其设于云台200上与客户端300连接,具有USB3.0接口61的语音跟踪PTZ摄像机100包括:
摄取景物图像的摄像头10;
与摄像头10连接,将景物图像转换为图像数字信号的图像传感模块20;
采集声音信号并将声音信号转换为音频模拟信号的音频采集模块30;
与图像传感模块20和音频采集模块连接30的视频处理模块40,用于分析音频模拟信号以获得优化的目标声源音频信号和相关音频信息以及将优化的目标声源音频信号和图像数字信号转换为视频信号;
与云台200、摄像头10和视频处理模块40连接的PTZ控制模块50,用于根据视频处理模块40依据相关音频信息发出的控制指令,驱动云台转动;
与视频处理模块40和客户端100连接的视频输出模块60,视频输出模块 60还包括USB3.0接口61,视频输出模块60通过USB3.0接口61输出所述视频信号至所述客户端;
与视频处理模块40和客户端100连接,并通过USB3.0接口61输出视频信号的视频输出模块60。
本实用新型提出的技术方案中,通过视频处理模块40分析采集到的音频信号以获得优化的目标声源音频信号和相关音频信息,并根据该相关音频信息向PTZ控制模块50发送控制信号,从而控制云台200向目标声源转动,摄像头10向目标声源变倍进行对焦。在这个过程中,由于摄像机可以自动跟踪目标声源,无需采用手动调整,实时性好,精确度高。另外,采用USB3.0接口61传输视频信号不仅提高了传输性能,而且也不需要大量布线。
在具体应用中,摄像头10为变焦镜头,其设置在云台200上;视频处理模块40设置在摄像头10的后方。客户端可以为手机、平板电脑、计算机、笔记本等播放视频的终端。
在一优选实施例中,请参照图2,音频采集模块30,包括双MIC采集单元31,隔离电路32,以及滤波放大电路33构成,双MIC采集单元31的输出端与隔离电路32的输入端电连,隔离电路32的输出端与滤波放大电路33的输入端电连,滤波放大电路33的输出端与视频处理模块40电连。音频采集模块30使用双麦克风采集人说话的声音时,可以获得两路音频信号,同单个的麦克风相比,除了时域和频域,麦克风阵列还多了一个平面空间域,对声音信号有更强的处理能力。后续视频处理模块可以采用类似麦克风阵列的声源定位与跟踪信号处理技术分析这两路音频信号以获得优化的目标声源音频信号。另外,音频采集模块中的隔离电路32,可以隔离前级部分无用信号,音频采集模块中的滤波放大电路33,可以对音频模拟信号进行滤波以去除周围的自然噪音,提高音频信号的信噪比。本实施例中的音频采集模块30最终可以获得两通道一致性良好的音频信号。
在另一优选实施例中,视频处理模块40包括:
与音频采集模块30连接的音频模数转换器,也即音频ADC41 (Analog-to-DigitalConverter),用于将音频模拟信号转换成音频数字信号;
与音频模数转换器连接的ASIC(Application Specific Integrated Circuit)芯片42,即专用集成电路,用于分析音频数字信号以获得优化的目标声源音频信号和相关音频信息,并根据相关音频信息向PTZ控制模块50发出控制指令。
ASIC芯片42接收到音频数字信号和图像数字信号,并分析音频数字信号获得优化的目标声源音频信号和相关音频信息,最终将优化的目标声源音频信号和图像数字信号转换为视频信号以传送给客户端300。
具体地,ASIC芯片42接收到音频采集模块30采集的两路音频数字信号,对采集的两路音频信号进行分析,具体是根据麦克风结构(比如双MIC采集单元)和声源之间的关系得到目标声源的位置信息,还可以通过抑制室内非目标声源方向的噪声,来增强目标方向的声量及音质,从而实现远距离定向及拾音,得到优质悦耳的声音。
另外,ASIC芯片42的ISP(Image Signal Processor)模块,即图像信号处理处理器,接收到图像传感模块20传过来的图像数字信号时,进行如下流水线处理:
1)坏点检测;
2)黑电平校正和颜色格式插值转换;
3)2D和3D滤波;
4)白平衡及颜色校正;
5)曝光处理;
6)伽马校正;
7)镜头畸变校正;
8)图像增强;
9)格式转换;
10)自动聚焦等。
通过以上处理,可以使图像更加清晰、提高色彩质量。
请再次参照图2,图像传感模块20通过带有屏蔽层的同轴电缆70与视频处理模块40连接,通过带有屏蔽层的同轴电缆70与视频处理模块40连接减少了视频信号传输时的损耗以及外界的信号干扰。在具体应用中,同轴电缆70采用GB/T14864-199国家标准、特征电阻为75欧姆的视频同轴电缆。
本实用新型提出的PTZ摄像机不仅可以通过视频处理模块40向PTZ控制模块50发送的控制指令,以驱动云台200和摄像头10转动,用户还可以在客户端300对云台200和摄像头10进行控制,具体地,USB3.0接口61根据UVC协议接收客户端300的反馈控制信号,以使视频处理模40块根据该反馈控制信号对PTZ控制模块50进行反馈控制。通过USB3.0接口61提高了视频信号的传输信能,同时可通过USB3.0接口61反馈客户端300的控制信号,根据UVC协议对PTZ控制模块50进行控制,减少了大量布线的问题。客户端300的控制信号与ASIC芯片42根据获取到优化的目标声源音频信号和相关音频信息而发出的控制指令不冲突,即PTZ控制模块50对云台200和摄像头10转动同一时段只执行一个控制反馈信号,操作化更灵活。
请再次参照图2,PTZ控制模块50包括:
串口通讯接口51;
通过串口通讯接口51与视频处理模50块连接的单片机52;
与单片机52和云台200机械连接,以驱动云台200转动的水平步进电机 53和垂直步进电机54。
PTZ控制模块50接收到视频处理模块40的ASIC芯片42在分析得到优化的目标声源音频信号和相关音频信息的定位信息后并向PTZ控制模块50发出的控制指令,控制指令是通过串口通讯接口51传送到单片机52,单片机 52控制水平电机53执行转动,实现语音跟踪功能,增加产品竞争力。
在又一优选实施例中,PTZ控制模块50还包括与单片机52连接,以使 PTZ控制模块50与客户端300之间进行无线信号传输的IR(Infrared Radiation) 接口55。具有USB3.0接口61的语音跟踪PTZ摄像机100还配有与IR接口 55对应,通过发射红外信号来对PTZ控制模块50进行无线控制的红外遥控器80。IR接口55即为红外线接口,通过红外遥控器来无线控制PTZ控制模块50,较少了布线的问题,节约了布线成本,简化了电路。
另外,PTZ控制模块50还包括与单片机52连接,以使PTZ控制模块50 与客户端300之间进行的双向通信的RS-232接口56,作为PTZ控制模块50 硬件的一部分,将TTL电平信号转换为RS-232电平信号与客户端进行通信。
串口通讯接口51具体为TTL接口。TTL接口用于PTZ控制模块和视频处理模块之间的短距离通讯,效率高。
云台200为全向云台。全向云台具有360°无死角的摄像范围,使得摄像机镜头能够再最大范围内转动并摄取景物图像。
以上所述仅为本实用新型的优选实施例,并非因此限制本实用新型的专利范围,凡是在本实用新型的构思下,利用本实用新型说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本实用新型的专利保护范围内。

Claims (10)

1.一种具有USB3.0接口的语音跟踪PTZ摄像机,其设于云台上并与客户端连接,其特征在于,所述具有USB3.0接口的语音跟踪PTZ摄像机包括:
摄取景物图像的摄像头;
与所述摄像头连接,将所述景物图像转换为图像数字信号的图像传感模块;
采集声音信号并将所述声音信号转换为音频模拟信号的音频采集模块;
与所述图像传感模块和所述音频采集模块连接的视频处理模块,用于分析所述音频模拟信号以获得优化的目标声源音频信号及相关音频信息,以及将所述优化的目标声源音频信号和所述图像数字信号转换为视频信号;
与所述云台、所述摄像头和所述视频处理模块连接的PTZ控制模块,用于根据所述视频处理模块依据所述相关音频信息发出的控制指令,驱动所述云台转动和所述摄像头变倍;
与所述视频处理模块和所述客户端连接的视频输出模块,所述视频输出模块还包括USB3.0接口,所述视频输出模块通过所述USB3.0接口输出所述视频信号至所述客户端。
2.如权利要求1所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述音频采集模块包括双MIC采集单元、隔离电路和滤波放大电路,所述双MIC采集单元的输出端与所述隔离电路的输入端电连,所述隔离电路的输出端与所述滤波放大电路的输入端电连,所述滤波放大电路的输出端与所述视频处理模块电连。
3.如权利要求2所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述视频处理模块包括:
与所述音频采集模块连接的音频模数转换器,用于将所述音频模拟信号转换成音频数字信号;
与所述音频模数转换器连接的ASIC芯片,用于分析所述音频数字信号以获得优化的目标声源音频信号及相关音频信息,并根据所述相关音频信息向所述PTZ控制模块发出控制指令,以及将所述优化的目标声源音频信号和所述图像数字信号转换为视频信号。
4.如权利要求1所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述USB3.0接口根据UVC协议接收所述客户端的控制信号,以使所述视频处理模块根据该控制信号对PTZ控制模块进行控制。
5.如权利要求1-4任一项所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述图像传感模块通过带有屏蔽层的同轴电缆与所述视频处理模块连接。
6.如权利要求1-4任一项所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述PTZ控制模块包括:
串口通讯接口;
通过所述串口通讯接口与所述视频处理模块连接的单片机;
与所述单片机和所述云台机械连接,以驱动所述云台转动的水平步进电机和垂直步进电机。
7.如权利要求6所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述PTZ控制模块还包括与所述单片机连接的IR接口,所述具有USB3.0接口的语音跟踪PTZ摄像机还配有与所述IR接口对应,通过发射红外信号来对所述PTZ控制模块进行无线控制的红外遥控器。
8.如权利要求6所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述PTZ控制模块还包括与所述单片机连接,以使所述PTZ控制模块与所述客户端之间进行的双向通信的RS-232接口。
9.如权利要求6所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述串口通讯接口为TTL接口。
10.如权利要求1-4任一项所述的具有USB3.0接口的语音跟踪PTZ摄像机,其特征在于,所述云台为全向云台。
CN201721218355.3U 2017-09-21 2017-09-21 具有usb3.0接口的语音跟踪ptz摄像机 Active CN207266143U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201721218355.3U CN207266143U (zh) 2017-09-21 2017-09-21 具有usb3.0接口的语音跟踪ptz摄像机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201721218355.3U CN207266143U (zh) 2017-09-21 2017-09-21 具有usb3.0接口的语音跟踪ptz摄像机

Publications (1)

Publication Number Publication Date
CN207266143U true CN207266143U (zh) 2018-04-20

Family

ID=61918699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201721218355.3U Active CN207266143U (zh) 2017-09-21 2017-09-21 具有usb3.0接口的语音跟踪ptz摄像机

Country Status (1)

Country Link
CN (1) CN207266143U (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111142111A (zh) * 2018-11-02 2020-05-12 广州灵派科技有限公司 一种声源定位视频跟踪系统
CN112616034A (zh) * 2020-12-11 2021-04-06 深圳壹秘科技有限公司 一种集成式的音视频装置
CN114827416A (zh) * 2022-04-27 2022-07-29 保升(中国)科技实业有限公司 一种摄像头语言跟踪系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111142111A (zh) * 2018-11-02 2020-05-12 广州灵派科技有限公司 一种声源定位视频跟踪系统
CN112616034A (zh) * 2020-12-11 2021-04-06 深圳壹秘科技有限公司 一种集成式的音视频装置
CN114827416A (zh) * 2022-04-27 2022-07-29 保升(中国)科技实业有限公司 一种摄像头语言跟踪系统

Similar Documents

Publication Publication Date Title
CN100442837C (zh) 一种具有声音位置信息的视频通讯系统及其获取方法
US20220408136A1 (en) Projected Audio and Video Playing Method and Electronic Device
CN207266143U (zh) 具有usb3.0接口的语音跟踪ptz摄像机
CN111343411B (zh) 一种智能远程视频会议系统
CN106992959A (zh) 一种3d全景音视频直播系统及音视频采集方法
CN106027589A (zh) 视频与音频处理装置及其视频会议系统
CN105163061A (zh) 远端视频交互系统
CN106708763A (zh) 可戴式显示设备与智能主机的数据传输系统
CN106791699A (zh) 一种远程头戴交互式视频共享系统
CN101272482A (zh) 一种网络媒体通信远程控制的方法、系统及媒体采集设备
CN206117891U (zh) 一种音视频采集设备
CN112770212B (zh) 一种无线耳机、视频录制系统及方法、存储介质
CN105959614A (zh) 一种视频会议的处理方法及系统
CN106303352A (zh) 一种家庭视频通话装置、系统及方法
CN106603957A (zh) 协同会议一体机及协同会议方法
CN100420298C (zh) 摄像机拍摄方位数字声控定向方法
CN105472226A (zh) 一种前后双镜头全景运动摄像机
CN103002310A (zh) 终端设备用视频采集器和终端设备获取三维视频的方法
TW202231050A (zh) 視訊會議系統與方法
CN208445660U (zh) 一种拍摄设备
CN104754261A (zh) 一种投影设备及投影方法
EP4135314A1 (en) Camera-view acoustic fence
CN216017004U (zh) 一种集成ai摄像头的会议设备
CN104469442A (zh) 一种通过智能终端实现集体歌唱的装置
CN207117791U (zh) 具有电子云台的视频会议摄像机及视频会议系统

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant