CN114071279A - 拾音麦克风确定方法及装置 - Google Patents

拾音麦克风确定方法及装置 Download PDF

Info

Publication number
CN114071279A
CN114071279A CN202010790780.XA CN202010790780A CN114071279A CN 114071279 A CN114071279 A CN 114071279A CN 202010790780 A CN202010790780 A CN 202010790780A CN 114071279 A CN114071279 A CN 114071279A
Authority
CN
China
Prior art keywords
microphone
camera
monomer
information
reference direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010790780.XA
Other languages
English (en)
Inventor
丁学松
周广荣
成键
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202010790780.XA priority Critical patent/CN114071279A/zh
Priority to PCT/CN2021/095800 priority patent/WO2022028050A1/zh
Publication of CN114071279A publication Critical patent/CN114071279A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems

Abstract

本申请公开了一种拾音麦克风确定方法及装置,涉及声音信号处理领域,有助于提高立体声场景布置的灵活性,另外,有助于提高确定拾音麦克风的准确率,从而使得获得的立体声效果更好。该方法可应用于会议系统中。该方法包括:首先确定摄像机的拍摄方向信息,该拍摄方向信息用于指示摄像机的拍摄方向。然后基于摄像机的拍摄方向,确定与该拍摄方向呈第一预设角度的第一参考方向。第一参考方向是阵列麦克风中的目标麦克风单体所在的参考方向,目标麦克风单体是左声道麦克风单体或右声道麦克风单体;左声道麦克风单体用于拾取左声道声音信号,右声道麦克风单体用于拾取右声道声音信号。接着基于第一参考方向,从阵列麦克风中确定目标麦克风单体。

Description

拾音麦克风确定方法及装置
技术领域
本申请涉及声音信号处理领域,尤其涉及一种拾音麦克风确定方法及装置。
背景技术
目前,在会议系统中,阵列麦克风用于立体声拾音时,生成的立体声方位需要和会议系统中的摄像机拍摄到的画面方位对应。例如,会场左侧发言人发言时,拍摄机拍摄到发言人的画面会在显示屏的左侧显示,而发言人的声音方位也从会场左侧发出。为了确保会议中会场发言人发言时的画面和发声方位对应,在安装布置时,摄像机需要正对阵列麦克风放置,并且,将阵列麦克风中一个或多个特定的麦克风单体的方位处于会场的左侧,将阵列麦克风中另外的一个或多个特定的麦克风单体对应的方位处于会场的右侧。通过会场左侧的麦克风单体和右侧的麦克风单体,分别拾取会场左右两个方位的声音信号。后续,阵列麦克风可以将拾取的会场左右两个方位的声音信号,发送至会议系统中的主控会议终端,由主控会议终端根据两个方位的声音信号生成立体声信号。
然而,现有技术中采用的确定拾音麦克风单体的方式,在安装布置摄像机和阵列麦克风时,对摄像机和阵列麦克风的布置位置(即摄像机正对阵列麦克风放置)要求较高,因此布置方式的易用性不高,且容易布置错误。即使阵列麦克风立体声场景布置正确了(即摄像机正对阵列麦克风放置),在使用过程中当阵列麦克风发生了移动时,也会导致拾音方位不对,从而无法还原出与摄像机拍摄图像对应的立体声效果。
发明内容
本申请实施例提供了一种拾音麦克风确定方法及装置,有助于提高立体声场景布置的灵活性,另外,有助于提高确定拾音麦克风的准确率,从而使得获得的立体声效果更好。
为了达到上述目的,本申请提供了以下技术方案:
第一方面,提供了一种拾音麦克风确定方法,包括:确定摄像机的拍摄方向信息。其中,拍摄方向信息用于指示摄像机的拍摄方向。基于摄像机的拍摄方向,确定第一参考方向。其中,第一参考方向是阵列麦克风中的目标麦克风单体所在的参考方向,目标麦克风单体是左声道麦克风单体或右声道麦克风单体;拍摄方向与第一参考方向呈第一预设角度;左声道麦克风单体用于拾取左声道声音信号,右声道麦克风单体用于拾取右声道声音信号。基于第一参考方向,从阵列麦克风中确定目标麦克风单体。
相比现有技术,该技术方案提供了一种动态确定拾音麦克风的方法,其确定拾音麦克风的方法不受限于摄像机的摆放位置与阵列麦克风的摆放位置,因此,立体声场景布置的灵活性更高。并且,在使用过程中,即使阵列麦克风发生了移动,基于该方法可以重新动态确定移动后的拾音麦克风,有助于提高确定拾音麦克风的准确率,从而在该方法应用于生成立体声的场景中时,有助于使得获得的立体声效果更好。
在一种可能的设计中,摄像机的拍摄方向是摄像机在初始位置时的拍摄方向,如摄像机的拍摄方向一直处于初始位置时的拍摄方向,或者摄像机的拍摄方向恢复初始位置时的拍摄方向。其中,初始位置是指摄像机的镜头与摄像机的底座主体垂直时的位置。这是在考虑到“会议场景中,通常要求摄像机的拍摄方向是摄像机在初始位置时的拍摄方向”而提出的技术方案。下文具体实施方式部分也是基于此为例进行说明的。具体实现时,如果摄像机不在初始位置,则通过调整摄像机的镜头方向,可以使得摄像机位于初始位置,具体调整方式可以参考现有技术,此处不再赘述。
在一种可能的设计中,第一预设角度是90°。
例如,基于图9所示的会场左侧和会场右侧,当目标麦克风单体是左声道麦克风单体时,第一参考方向是摄像机的拍摄方向逆时针旋转90°后的方向;当目标麦克风单体是右声道麦克风单体时,第一参考方向是摄像机的拍摄方向顺时针旋转90°后的方向。
又如,基于与图9所示的会场左侧和会场右侧相反的定义,即图9中的会场左侧在实际中被定义为会场右侧,图9中的会场右侧在实际中被定义为会场左侧,当目标麦克风单体是左声道麦克风单体时,第一参考方向是摄像机的拍摄方向顺时针旋转90°后的方向;当目标麦克风单体是右声道麦克风单体时,第一参考方向是摄像机的拍摄方向逆时针旋转90°后的方向。
在一种可能的设计中,基于第一参考方向,从阵列麦克风中确定目标麦克风单体,包括:基于第一参考方向,将阵列麦克风中的,满足第一预设条件的麦克风单体作为目标麦克风单体。其中,满足第一预设条件的麦克风单体,包括:所在方向与第一参考方向之间的角度,小于或等于第一阈值的第一预设数量的麦克风单体;或,所在方向与第一参考方向之间的角度,从小到大排序后的前第一预设数量的角度对应的麦克风单体,或,所在方向与第一参考方向之间的角度,从大到小排序后的后第一预设数量的角度对应的麦克风单体。
如此,将阵列麦克风中至少两个麦克风单体中所在方向与第一参考方向之间的夹角较小的麦克风单体作为目标麦克风单体,有助于提高目标麦克风单体的拾音效果,从而有助于使得合成的立体声信号的效果好。
在一种可能的设计中,该方法还包括:接收阵列麦克风中的任一麦克风单体的磁场方位信息;依据该麦克风单体的磁场方位信息确定该麦克风单体的方向信息;依据该麦克风单体的方向信息确定该麦克风单体所在的方向相对于第一参考方向的角度。或,接收阵列麦克风中的任一麦克风单体的方向信息;依据该麦克风单体的方向信息确定该麦克风单体所在的方向相对于第一参考方向的角度。或,接收阵列麦克风发送的阵列麦克风中的任一麦克风单体所在的方向,相对于第一参考方向的角度。
该可能的设计提供了确定阵列麦克风中的任一麦克风单体所在的方向,相对于第一参考方向的角度的具体实现方式,实际实现时不限于此,具体可参考下述具体实施方式部分。
在一种可能的设计中,阵列麦克风包括第一磁性传感器,第一磁性传感器用于测量任一麦克风单体的磁场方位信息。由于磁性传感器对磁场方向的测量精度较高,因此,使用磁性传感器测量磁场方位信息,进而将磁场方位信息转换为麦克风单体的方向信息有助于提高确定麦克风单体所在的方向的精确度,从而提高确定拾音麦克风单体的精确度。
在一种可能的设计中,阵列麦克风包括第一红外线传感器,第一红外线传感器用于测量任一麦克风单体的方向信息。由于红外线传感器可以直接测量出麦克风单体的方向信息,因此,相比磁性传感器来说,不需要执行将磁场方位信息转换为方向信息的步骤,从而节省处理复杂度,从而缩短确定麦克风单体所在的方向相对于第一参考方向的角度,进而缩短确定拾音麦克风单体所需的时间。
另外,相比于将磁性传感器(或红外传感器)与阵列麦克风分开设置,将磁性传感器(或红外传感器)与阵列麦克风一体设置,不需要增加外部器件即可确定出阵列麦克风中的任一麦克风单体所在的方向相对于第一参考方向的角度,实现方便简单。
在一种可能的设计中,确定摄像机的拍摄方向信息,包括:获取摄像机的磁场方位信息,该磁场方位信息用于指示摄像机的磁场方位;依据摄像机的磁场方位信息,确定摄像机的拍摄方向信息。或者,接收摄像机的拍摄方向信息。该可能的设计提供了确定摄像机的拍摄方向信息的具体实现方式,实际实现时不限于此。
在一种可能的设计中,摄像机包括第二磁性传感器,第二磁性传感器用于测量摄像机的磁场方位信息。这样,有助于提高确定摄像机的拍摄方向信息的精确度。
在一种可能的设计中,摄像机包括第二红外线传感器,第二红外线传感器用于测量摄像机的拍摄方向信息。这样,相比磁性传感器,不需要执行将磁场方位信息转换为方向信息的步骤,从而节省处理复杂度,从而缩短确定摄像机的拍摄方向信息的时间,进而缩短确定拾音麦克风单体所需的时间。
在一种可能的设计中,确定摄像机的拍摄方向信息,包括:获取阵列麦克风中的至少两个麦克风单体(如至少三个麦克风单体)采集的声音信号,该声音信号来自同一发声源,该发声源的发声方向与摄像机的拍摄方向一致(或基本一致);基于该至少两个麦克风单体采集的声音信号,采用声源定位算法,确定摄像机的拍摄方向信息。
在一种可能的设计中,摄像机中包括发声源。基于该方案,在生产摄像机时,就将发声源固定在摄像机中,使得发声源的发声方向与摄像机的拍摄方向一致(或基本一致),这样,在安装布置摄像机时,不需要再人为摆放摄像机与发声源的位置,从而有助于降低布置要求,从而提高易用性。另外,相比认为摆放摄像机与发声源的位置造成的误差,本技术方案,有助于提高所确定的摄像机的拍摄方向信息的准确率,从而提高确定拾音麦克风的准确率。
在一种可能的设计中,在基于第一参考方向,从阵列麦克风中确定目标麦克风单体之后,该方法还包括:基于左声道声音信号和右声道声音信号,合成立体声信号。该可能的设计提供了确定拾音麦克风单体的一种应用场景,具体实现时不限于此。
在一种可能的设计中,该方法还包括:基于摄像机的拍摄方向,确定第二参考方向;第二参考方向是阵列麦克风中的闭麦麦克风的参考方向;拍摄方向与第二参考方向呈第二预设角度;基于第二参考方向,将阵列麦克风中的,满足第二预设条件的麦克风单体作为闭麦麦克风单体。其中,闭麦麦克风单体不做拾音。满足第二预设条件的麦克风单体,包括:所在方向与第二参考方向的角度,小于或等于第二阈值的第二预设数量的麦克风单体;或,所在方向与第二参考方向之间的角度,从小到大排序后的前第二预设数量的角度对应的麦克风单体,或所在方向与第二参考方向之间的角度,从大到小排序后的后第二预设数量的角度对应的麦克风单体。
在一种可能的设计中,第二预设角度为180度。
第二方面,提供一种拾音麦克风确定装置。
在一种可能的设计中,该拾音麦克风确定装置用于执行上述第一方面提供的一种拾音麦克风确定方法。本申请可以根据上述第一方面提供的方法,对该拾音麦克风确定装置进行功能模块的划分。例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。示例性的,本申请可以按照功能将该拾音麦克风确定装置划分为第一确定单元、第二确定单元和第三确定单元等。上述划分的各个功能模块执行的可能的技术方案和有益效果的描述均可以参考上述第一方面或其相应的可能的设计提供的技术方案,此处不再赘述。
在另一种可能的设计中,该拾音麦克风确定装置包括:存储器和一个或多个处理器,该存储器和处理器耦合。该存储器用于存储计算机指令,该处理器用于调用该计算机指令,以执行如第一方面及其任一种可能的设计方式提供的任一种方法。
第三方面,本申请提供了一种计算机可读存储介质,如计算机非瞬态的可读存储介质。其上储存有计算机程序(或指令),当该计算机程序(或指令)在拾音麦克风确定装置上运行时,使得该拾音麦克风确定装置执行上述第一方面中任一种可能的实现方式提供的任一种方法。
第四方面,本申请提供了一种计算机程序产品,当其在计算机上运行时,使得第一方面中的任一种可能的实现方式提供的任一种方法被执行。
第五方面,本申请提供了一种芯片系统,包括:处理器,处理器用于从存储器中调用并运行该存储器中存储的计算机程序,执行第一方面中的实现方式提供的任一种方法。
第六方面,本申请提供了一种会议系统,包括:摄像机、阵列麦克风和主控会议终端。摄像机,用于采集视频信号。阵列麦克风,用于拾取声音信号,并将该声音信号转换为电信号。主控会议终端,用于分别接收摄像机和阵列麦克风发送的视频信号和声音信号。
可以理解的是,上述提供的任一种拾音麦克风确定装置、计算机存储介质、计算机程序产品或会议系统等均可以应用于上文所提供的对应的方法,因此,其所能达到的有益效果可参考对应的方法中的有益效果,此处不再赘述。
在本申请中,上述拾音麦克风确定装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本申请类似,属于本申请权利要求及其等同技术的范围之内。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为本申请实施例提供的会议系统的结构示意图之一;
图2为本申请实施例提供的会议系统的结构示意图之二;
图3为本申请实施例提供的会议系统的结构示意图之三;
图4为本申请实施例提供的一种会议系统的场景应用示意图;
图5为本申请实施例提供的一种主控会议终端的结构示意图;
图6本申请实施例提供的一种拾音麦克风确定方法的流程示意图;
图7为本申请实施例提供的一种摄像机的拍摄方向示意图;
图8为本申请实施例提供的一种磁场方位示意图;
图9为本申请实施例提供的一种摄像机的拍摄方向与左右声道麦克风单体所在的参考方向的示意图;
图10为本申请实施例提供的阵列麦克风中任一麦克风单体所在方向示意图;
图11为本申请实施例提供的一种拾音麦克风确定装置的结构示意图;
图12为本申请实施例提供的一种芯片系统的结构示意图;
图13为本申请实施例提供的计算机程序产品的概念性局部视图。
具体实施方式
下面对本申请中所使用的部分术语进行描述。
1)、阵列麦克风
阵列麦克风是由一定数目的声学传感器(通常是麦克风单体)组成,用来对声场的空间特性进行采样并处理的系统设备。
2)、麦克风单体
麦克风单体是将声音信号转换为电信号的能量转换器件。分类有动圈式、电容式、驻极体和最近新兴的硅微传声器,此外还有液体传声器和激光传声器。
3)、磁场方位
规定小磁针的北极在磁场中某点所受磁场力的方向为该磁场的方向,即磁场方位。磁场方位是:从北极出发到南极的方向,在磁体内部是由南极到北极,在外可表现为磁感线的切线方向或放入磁场的小磁针在静止时北极所指的方向。
4)、磁性传感器
磁性传感器是把磁场、电流、应力应变、温度或光等外界因素引起敏感元件磁性能变化转换成电信号,以这种方式来检测相应物理量的器件。
5)、发声源
发声源是可以发出声音的装置,例如扬声器、压电片或振动马达等。
6)、红外线传感器
红外线传感器是利用红外线来进行数据处理的一种传感器,有灵敏度高等优点,红外线传感器可以控制驱动装置的运行。
7)、其他术语
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的实施例中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。本申请中术语“至少一个”的含义是指一个或多个,本申请中术语“多个”的含义是指两个或两个以上。
应理解,在本文中对各种所述示例的描述中所使用的术语只是为了描述特定示例,而并非旨在进行限制。如在对各种所述示例的描述和所附权利要求书中所使用的那样,单数形式“一个(“a”,“an”)”和“该”旨在也包括复数形式,除非上下文另外明确地指示。
还应理解,本文中所使用的术语“和/或”是指并且涵盖相关联的所列出的项目中的一个或多个项目的任何和全部可能的组合。术语“和/或”,是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请中的字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,在本申请的各个实施例中,各个过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
还应理解,术语“包括”(也称“includes”、“including”、“comprises”和/或“comprising”)当在本说明书中使用时指定存在所陈述的特征、整数、步骤、操作、元素、和/或部件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元素、部件、和/或其分组。
还应理解,术语“如果”可被解释为意指“当...时”(“when”或“upon”)或“响应于确定”或“响应于检测到”。类似地,根据上下文,短语“如果确定...”或“如果检测到[所陈述的条件或事件]”可被解释为意指“在确定...时”或“响应于确定...”或“在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。
应理解,说明书通篇中提到的“一个实施例”、“一实施例”、“一种可能的实现方式”意味着与实施例或实现方式有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”、“一种可能的实现方式”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
图1是本申请实施例提供的一种会议系统10的结构示意图。会议系统10可以为会议室会议系统、桌面会议系统、电视会议系统、计算机会议系统或视频会议系统等。当然,本申请实施例对于会议系统10的实际形态不作具体限定。如图1所示,会议系统10包括摄像机11、阵列麦克风12和主控会议终端13。可选的,会议系统10还可以包括显示屏14以及音箱15。其中,音箱15可以替换为其他声音播放设备/器件,本申请实施例对此不进行限定。
摄像机11,用于采集视频信号,并对视频信号进行编码,以得到码流。然后,将该码流发送至显示屏14和/或主控会议终端13。
阵列麦克风12,用于拾取声音信号,并将该声音信号转换为电信号。然后,将转换后得到的电信号传送至音箱15和/或主控会议终端13。阵列麦克风12包括至少两个麦克风单体,这些麦克风单体可以包括左声道麦克风单体121和右声道麦克风单体122。左声道麦克风单体121,用于拾取左声道声音信号。右声道麦克风单体122用于拾取右声道声音信号。可选的,这些麦克风单体还可以包括闭麦麦克风单体,闭麦麦克风单体不做拾音。
本申请实施例对阵列麦克风12包括的麦克风单体的数量以及排列方式均不进行限制。例如,该数量可以为3个、4个或5个等。阵列麦克风12的排列方式可以为圆环形、三角形、矩形等。下文中的具体示例均是以阵列麦克风12包括3个麦克风单体,且这3个麦克风单体以均匀分布在圆环形上为例进行说明的。另外,本申请实施例对左声道麦克风单体121、右声道麦克风单体122和闭麦麦克风单体的数量均不进行限定,具体实现时,不同种类的麦克风单体的数量可以是预定义的,具体可以是一个或多个。为了描述上的简洁,下文中的具体示例均是以左声道麦克风单体121、右声道麦克风单体122和闭麦麦克风单体的数量均是1为例进行说明的。
主控会议终端13,用于分别接收摄像机11发送的视频信号和阵列麦克风12发送的声音信号。然后,将摄像机11发送的视频信号进行处理后,发送至显示屏14进行显示;将声音信号处理后,发送至音箱15进行播放。
应用于本申请实施例时,主控会议终端13还用于,获取摄像机11的拍摄方向信息,并根据该拍摄方向信息,确定阵列麦克风的左声道麦克风单体121和右声道麦克风单体122中的至少一种。关于摄像机11的拍摄方向信息,以及确定左声道麦克风单体121和右声道麦克风单体122的具体实现方式可以参考下文,此处不再赘述。
显示屏14,用于接收摄像机11或者主控会议终端13发送的视频信号,并将视频信号在显示屏14中显示。
音箱15,用于接收阵列麦克风12或者主控会议终端13发送的声音信号,并播放接收的声音信号。
需要说明的是,图1中示出的结构并不构成对会议系统10的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
示例性的,将摄像机11、阵列麦克风12、显示屏14或者音箱15任意一个或者多个设置在主控会议终端13中。但是阵列麦克风12和摄像机通常不同时设置在主控会议终端13中。
为了从阵列麦克风12中确定左声道麦克风单体121和/或右声道麦克风单体122,以下提供几种可选的实现方式:
可选的,如图2所示,会议系统10还包括第一磁性传感器123或者第一红外线传感器124。图2是在图1的基础上进行绘制的。
第一磁性传感器123用于测量阵列麦克风12中任一麦克风单体的磁场方位信息,该磁场方位信息用于从阵列麦克风12中确定左声道麦克风单体121和/或右声道麦克风单体122,具体实现方式可以参考下文。
第一红外线传感器124用于测量所述阵列麦克风中的任一麦克风单体的方向信息,该方向信息用于从阵列麦克风12中确定左声道麦克风单体121和/或右声道麦克风单体122,具体实现方式可以参考下文。
第一磁性传感器123或者第一红外线传感器124可以与阵列麦克风12一体设置或者与阵列麦克风12分开设置,本申请实施例对此不做具体限制。
为了获得摄像机11的拍摄方向信息,以下提供两种可选的实现方式:
在一种可选的实现方式中,如图2所示,会议系统10还包括第二磁性传感器111或者第二红外线传感器112。
第二磁性传感器111用于测量摄像机11的磁场方位信息,该磁场方位信息用于确定摄像机的拍摄方向信息。第二红外线传感器112用于测量摄像机11的拍摄方向信息。
第二磁性传感器111或者第二红外线传感器112可以与摄像机11一体设置或者与摄像机11分开设置,本申请实施例对此不做具体限制。
在另一种可选的实现方式中,如图3所示,会议系统10还包括发声源113。发声源113的发声方向与摄像机11的拍摄方向一致或大致一致。
发声源113用于输出声音信号,以使得阵列麦克风12中的麦克风单体采集该声音信号,从而确定摄像机11的拍摄方向,具体实现方式可以参考下文。
发声源113与摄像机11可以通过导线的方式进行电性连接,且发声源113的放置位置在阵列麦克风12可以进行信号拾取的位置即可,可以将发声源113放置在距离摄像机11预设距离的位置处,但是需要保证发声源113的发声方向与摄像机11的拍摄方向一致或大致一致。
发声源113发出的声音信号可以是特定频率的信号,以便于主控会议终端13进行识别,具体的,发声源113可以是带内发声源(频率范围:20Hz~22KHz),也可以带外发声源(频率<20Hz或>20KHz)。带外发声源可以避免干扰正常会议通信的声音。
以下,说明本申请实施例提供的一种会议系统10的应用场景示意图:
如图4中,会议系统10应用于包含第一会场和第二会场的场景中,其中,第一会场包括第一摄像机、第一阵列麦克风、第一主控会议终端、第一显示屏以及第一音箱,第二会场包括第二摄像机、第二阵列麦克风、第二主控会议终端、第二显示屏以及第二音箱。第一主控会议终端与第二主控会议终端通过网络交换设备进行数据交换,例如,第一会场的视频信号和声音信号,由第一主控会议终端通过网路交换设备发送给第二主控会议终端,并在第二会场的第二显示屏和第二音箱输出。
第一摄像机用于采集第一会场的视频信号,并将采集第一会场的视频信号发送至第一主控会议终端。第一阵列麦克风用于拾取第一会场的声音信号,并将第一会场的声音信号转换为电信号,将转换后得到的电信号发送至第一主控会议终端。
第一主控会议终端用于将第一摄像机发送的视频信号处理后,一方面将处理后的视频信号发送至第一显示屏进行本地显示,另一方面将处理后的视频信号发送至网络交换设备,以传输至第二会议终端。第二会议终端将处理后的视频信号发送至第二显示屏进行显示,以实现将第一会场的视频信号在第二会场显示。
以及,第一主控会议终端用于将第一阵列麦克风发送的电信号进行处理后,一方面将处理后的声音信号发送至第一音箱进行本地播放,另一方面将处理后的声音信号传输至第二会议终端。第二会议终端将接收到的处理后的声音信号发送至第二音箱进行播放,以实现将第一会场的声音信号在第二会场播放。
相应的,第二摄像机用于采集第二会场的视频信号,以使得第二显示屏进行本地显示,以及通过网络交换设备传输至第一主控会议终端,以实现将第二会场的视频信号在第一会场显示。第二阵列麦克风用于采集第二会场的声音信号,以使得第二音箱进行本地播放,以及通过网络交换设备传输至第一主控会议终端,以实现将第二会场的声音信号在第一会场播放。
需要说明的是,图4仅为本申请实施例提供的会议系统10的一种应用场景的示例,其不对本申请实施例提供的会议系统10的应用场景构成限定。
参考图5,本申请实施例提供了一种主控会议终端50的结构示意图。下面介绍本申请实施例所涉及的技术术语。
如图5所示,主控会议终端50可以包括处理器51、存储器52、通信接口53以及总线54。其中,处理器51、存储器52以及通信接口53之间可以通过总线54连接。
处理器51是主控会议终端50的控制中心,可以是一个通用中央处理单元(centralprocessing unit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为示例,处理器51可以包括一个或多个CPU,例如图5中所示的CPU 0和CPU 1。
存储器52可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
一种可能的实现方式中,存储器52可以独立于处理器51存在。存储器52可以通过总线54与处理器51相连接,用于存储数据、指令或者程序代码。处理器51调用并执行存储器52中存储的指令或程序代码时,能够实现本申请实施例提供的音频渲染方法。
另一种可能的实现方式中,存储器52也可以和处理器51集成在一起。
通信接口53,用于主控会议终端50与其他设备(如网络交换设备等)通过通信网络连接,该通信网络可以是以太网,无线接入网(radio access network,RAN),无线局域网(wireless local area networks,WLAN)等。通信接口53可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
总线54,可以是工业标准体系结构(industry standard architecture,ISA)总线、外部设备互连(peripheral component interconnect,PCI)总线、快速外围组件互连(peripheral component interconnect express,PCIe)总线或扩展工业标准体系结构(extended industry standard architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
需要指出的是,图5中示出的结构并不构成对该主控会议终端50的限定,除图5所示部件之外,该主控会议终端50可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本申请实施例提供了一种拾音麦克风确定方法和装置,该方法可以应用于上文提供的任一种主控会议终端13或者主控会议终端50中,当该方法应用于图5所示的主控会议终端50中时,可以通过处理器51执行存储器52中的程序指令实现本申请实施例提供的拾音麦克风确定方法。通过执行本申请实施例提供的拾音麦克风确定方法,可以提高选择拾音麦克风单体的准确度,并且,有助于避免当阵列麦克风发生移动后,造成拾音效果差的问题。
下面结合附图,对本申请实施例提供的拾音麦克风确定方法进行描述。
请参考图6,图6示出了本申请实施例提供的一种拾音麦克风确定方法的流程示意图。该方法可以包括以下步骤:
S101、主控会议终端确定摄像机的拍摄方向信息。
其中,拍摄方向信息用于指示摄像机的拍摄方向。如图7所示,摄像机的拍摄方向是摄像机恢复初始位置时的拍摄方向,初始位置是指镜头与摄像机底座主体垂直时的位置。
可选的,S101可以通过以下方式实现:
方式一:主控会议终端获取摄像机的磁场方位信息,该磁场方位信息用于指示摄像机的磁场方位。主控会议终端依据摄像机的磁场方位信息,确定摄像机的拍摄方向信息。
例如,结合图2,第二磁性传感器111确定摄像机的磁场方位后,将摄像机的磁场方位发送至摄像机的处理模块。摄像机的处理模块将摄像机的磁场方位信息,发送至主控会议终端。主控会议终端接收摄像机的磁场方位信息,并基于摄像机的磁场方位信息,确定摄像机的拍摄方位信息。
如图8所示,磁场方位是依据磁场标定正东、正西、正南、正北的方向。在本申请中,设定正北方向是0°,由正北方向开始顺时针方向依次规定出0°~360°。基于此,在一个示例中,若摄像机在磁场方位中处于正北方向,则摄像机的拍摄方向信息为0°。在另一个示例中,如图8所示,若摄像机在磁场方位中处于东北方向,则摄像机的拍摄方向信息为45°。
方式二:主控会议终端获取阵列麦克风中的至少两个麦克风单体采集的声音信号。其中,声音信号来自同一发声源,发声源的发声方向与摄像机的拍摄方向一致或大致一致。主控会议终端基于该至少两个麦克风单体采集的声音信号,采用声源定位算法,确定摄像机的拍摄方向信息。
例如,结合图3,发声源113发出声音信号,阵列麦克风12中的至少两个麦克风单体对声音信号进行拾音,阵列麦克风12中的处理模块将该至少两个麦克风单体拾取的声音信号发送至主控会议终端13,主控会议终端13基于该至少两个麦克风单体采集的声音信号,采用声源定位算法,确定发声源13的发声方向。由于发声源13的发声方向与摄像机的拍摄方向一致或大致一致,因此主控会议终端13可以将发声源13的发声方向作为摄像机的拍摄方向。
方式三:主控会议终端接收摄像机的拍摄方向信息。
例如,结合图2,第二磁性传感器111确定摄像机的磁场方位,并将摄像机的磁场方位发送至摄像机的处理模块。摄像机中的处理模块可以基于该磁场方位信息确定摄像机的拍摄方向,然后,将该拍摄方向信息发送至主控会议终端。
再如,结合图2,第二红外线传感器112测量摄像机的拍摄方向信息,并将测量的拍摄方向信息发送至摄像机的处理模块。摄像机11的处理模块将摄像机的拍摄方向信息发送至主控会议模块。
又如,结合图3,发声源113发出声音信号,阵列麦克风12中的至少两个麦克风单体对声音信号进行拾音,阵列麦克风12中的处理模块根据声源定位算法确定发声源113的发声方向,并将该发声方向的信息作为摄像机的拍摄方向信息发送给主控会议终端。
S102、主控会议终端基于摄像机的拍摄方向,确定目标麦克风单体的第一参考方向。
其中,第一参考方向是阵列麦克风中的目标麦克风单体所在的参考方向,目标麦克风单体是左声道麦克风单体或右声道麦克风单体。摄像机的拍摄方向与第一参考方向呈第一预设角度。左声道麦克风单体用于拾取左声道声音信号,右声道麦克风单体用于拾取右声道声音信号。
其中,当目标麦克风单体为左声道麦克风单体时,第一参考方向为:理想状态下,左声道麦克风单体所在的参考方向,具体是垂直于摄像机拍摄方向且位于会场左侧的方向。当目标麦克风单体为右声道麦克风单体时,第一参考方向为:理想状态下,右声道麦克风单体所在的参考方向,具体是垂直于摄像机拍摄方向且位于会场右侧的方向。
如图9所示,为本申请实施例提供的一种摄像机的拍摄方向与左右声道麦克风单体所在的参考方向。其中,在图9中,将摄像机的拍摄方向标记为S1,将左声道麦克风所在的参考方向标记为S2,将右声道麦克风所在的参考方向标记为S3。另外,图9中示意出了会场左侧和会场右侧。会场左侧和会场右侧是相对的,具体实现时可以进行预定义的。本申请实施例对如何确定会场左侧和会场右侧不进行限定,例如,可以将会场的任意一个方向作为会场左侧,将与其相对的方向作为会场右侧。
S103、主控会议终端基于第一参考方向,从阵列麦克风中确定目标麦克风单体。其中,目标麦克风单体包括左声道麦克风单体和/或右声道麦克风单体。
当目标麦克风单体为左声道麦克风单体时,可以通过以下方式实现:
主控会议终端基于第一参考方向,将阵列麦克风中的,满足第一预设条件的麦克风单体作为左声道麦克风单体。
其中,满足第一预设条件的麦克风单体,包括:所在方向与第一参考方向之间的角度,小于或等于第一阈值的第一预设数量的麦克风单体;或者,所在方向与第一参考方向之间的角度,从小到大排序后的前第一预设数量的角度对应的麦克风单体;或者,所在方向与第一参考方向之间的角度,从大到小排序后的后第一预设数量的角度对应的麦克风单体。
由于当目标麦克风单体为左声道麦克风单体时,第一参考方向为:理想状态下,左声道麦克风单体所在的参考方向,因此,将阵列麦克风中至少两个麦克风单体中所在方向与第一参考方向之间的夹角较小的麦克风单体作为左声道麦克风单体,有助于提高左声道麦克风单体的拾音效果,从而有助于使得合成的立体声的效果好。其中,将与第一参考方向之间的夹角越小的麦克风单体作为左声道麦克风单体,越有助于提高左声道麦克风单体的拾音效果,从而越有助于使得合成的立体声的效果好。
类似地,由于当目标麦克风单体为右声道麦克风单体时,第一参考方向为:理想状态下,右声道麦克风单体所在的参考方向,因此,将阵列麦克风中至少两个麦克风单体中所在方向与第一参考方向之间的夹角较小的麦克风单体作为右声道麦克风单体,有助于提高右声道麦克风单体的拾音效果,从而有助于使得合成的立体声的效果好。
以下说明确定阵列麦克风中的任一麦克风单体所在的方向与第一参考方向之间的角度,可以通过以下方式实现:
方式一:主控会议终端接收阵列麦克风中的任一麦克风单体的磁场方位信息。然后,主控会议终端依据该磁场方位信息,确定该麦克风单体的方向信息。接着,主控会议终端依据该麦克风单体的方向信息,确定该麦克风单体所在的方向相对于第一参考方向的角度。
例如,结合图2,第一磁性传感器123测量阵列麦克风中的任一麦克风单体的磁场方位信息,并将该磁场方位信息发送给阵列麦克风的处理模块,该处理模块将该磁场方位信息发送给主控会议终端。后续,主控会议终端基于该麦克风单体的磁场方位信息确定该麦克风单体的方向信息,该步骤的具体实现方式,可以参考上述基于摄像机的磁场方位信息确定摄像机的拍摄方向信息的具体实现方式,此处不再赘述。
在一个示例中,麦克风单体所在的方向是:阵列麦克风的几何中心,到该麦克风单体的几何中心连线的方向。如图10所示,为麦克风单体所在的方向的示意图。图10中是以阵列麦克风包括3个麦克风,且这3个麦克风单体以均匀分布在圆环形上为例进行说明的。
需要说明的是,本申请实施例中阵列麦克风的麦克风单体所在的方向,并不限定必须过麦克风单体的几何中心点。
方式二:主控会议终端接收阵列麦克风中的任一麦克风单体的方向信息。然后主控会议终端依据阵列麦克风的方向信息,确定该麦克风单体所在的方向相对于第一参考方向的角度。
例如,结合图2,第一磁性传感器123测量阵列麦克风中的任一麦克风单体的磁场方位信息,并将该磁场方位信息发送给阵列麦克风的处理模块。该处理模块基于该麦克风单体的磁场方位信息确定该麦克风单体的方向信息,然后将所确定的该麦克风单体的方向信息发送给主控会议终端。后续其他步骤的具体实现方式可以参考上述方式一,此处不再赘述。
又如,结合图2,第一红外传感器124测量阵列麦克风中的任一麦克风单体的方向信息,并将该方向信息发送给阵列麦克风的处理模块;然后,阵列麦克风的处理模块将该方向信息发送给主控会议终端。后续其他步骤的具体实现方式可以参考上述方式一,此处不再赘述。
方式三:主控会议终端接收阵列麦克风中的任一麦克风单体所在的方向相对于第一参考方向的角度。
例如,结合图2,第一磁性传感器123测量阵列麦克风中的任一麦克风单体的磁场方位信息,并将该磁场方位信息发送给阵列麦克风的处理模块,该处理模块基于该麦克风单体的磁场方位信息确定该麦克风单体的方向信息。或者,第一红外传感器124测量阵列麦克风中的任一麦克风单体的方向信息,并将该方向信息发送给阵列麦克风的处理模块。接着,阵列麦克风的处理模块依据该麦克风单体的方向信息,确定该麦克风单体所在的方向相对于第一参考方向的角度,然后将所确定的角度发送给主控会议终端。后续其他步骤的具体实现方式可以参考上述方式一,此处不再赘述。
需要说明的是,对于阵列麦克风中的任一麦克风单体来说,均可以基于但不限于上文提供的任一种方式,确定该麦克风单体所在的方向相对于第一参考方向的角度。另外,由于阵列麦克风中的麦克风的排布方式确定之后,不同麦克风单体所在的方向之间的角度是确定的,因此,在一种可选的实现方式中,可以依据上文提供的方式确定阵列麦克风中的一个或多个麦克风单体所在的方向,并基于不同麦克风单体所在的方向之间的角度关系,确定其他麦克风单体所在的方向。这样,有助于节省因设置磁性传感器或红外传感器等用于测量麦克风单体所在的方向的硬件,而导致的硬件资源开销大的问题。
可选的,主控会议终端可以按照如下方式确定闭麦麦克风单体:
首先,主控会议终端基于摄像机的拍摄方向,确定第二参考方向。其中,第二参考方向是阵列麦克风中的闭麦麦克风的参考方向。拍摄方向与第二参考方向呈第二预设角度。
可选的,第二预设角度是180°,第二参考方向A0如图9所示。但是在实际操作过程中,第二预设角度与180°可以存在一些偏差,也就是说,第二预设角度可以为180°±预设角度范围,预设角度范围可以为:0°-5°、0°-10°或者0°-15°等,本申请实施例对此不做具体限制。
其次,主控会议终端基于第二参考方向,将阵列麦克风中的,满足第二预设条件的麦克风单体作为闭麦麦克风单体。
其中,满足第二预设条件的麦克风单体,包括:所在方向与第二参考方向的角度,小于或等于第二阈值的第二预设数量的麦克风单体。或,所在方向与第二参考方向之间的角度,从小到大排序后的前第二预设数量的角度对应的麦克风单体。或,所在方向与第二参考方向之间的角度,从大到小排序后的后第二预设数量的角度对应的麦克风单体。
需要说明的是,实际实现时,主控会议终端可以基于S103确定左声道麦克风单体和右声道麦克风单体,然后,将阵列麦克风中的剩余麦克风单体作为闭麦麦克风单体。或者,主控会议终端可以基于S103确定左声道麦克风单体,并基于上述可选的实现方式确定闭麦麦克风单体,然后,将将阵列麦克风中的剩余麦克风单体作为右声道麦克风单体。或者,主控会议终端可以基于S103确定右声道麦克风单体,并基于上述可选的实现方式确定闭麦麦克风单体,然后,将将阵列麦克风中的剩余麦克风单体作为左声道麦克风单体。
S104、主控终端设备接收左声道麦克风单体拾取的左声道声音信号和右声道麦克风单体拾取的右声道声音信号,并基于左声道声音信号和右声道声音信号合成立体声信号。
具体的,首先,阵列麦克风中的左声道麦克风单体和右声道麦克风单体分别拾取声音信号,并将拾取的声音信号发送给阵列麦克风的处理模块。其次,阵列麦克风的处理模块将接收到的声音信号发送给主控终端设备。接着,主控终端设备可以基于现有技术提供的任何一种方式,将左声道声音信号和右声道声音信号合成立体声。
例如,使用Audio panning技术,生产立体声信号。
后续,主控终端设备可以将合成后的立体声发送给本地音箱进行播放,可选的,主控终端设备可以将该合成后的立体声通过网络交换设备传输到异地进行播放。本申请实施例对此不进行限定。
需要说明的是,S104以及这里的后续的步骤,均是采用本申请实施例提供的拾音麦克风确定方法的一种应用场景,实际实现时,本申请实施例不限于此。
本申请实施例提供的拾音麦克风确定方法,基于摄像机的拍摄方向,确定阵列麦克风中左声道麦克风单体和/或右声道麦克风单体所在的参考方向(即理想情况下左声道麦克风单体和/或右声道麦克风单体所在的方向)。由于摄像机的拍摄方向与左声道麦克风单体和右声道麦克风单体所在的参考方向之间分别呈预设角度,因此,可以基于摄像机的拍摄方向,确定理想情况下的左声道麦克风单体和/或右声道麦克风单体所在的参考方向。后续,基于所确定的参考方向从阵列麦克风中确定出左声道麦克风单体和/或右声道麦克风单体。
另外,相比现有技术,该技术方案提供了一种动态确定拾音麦克风的方法,其确定拾音麦克风的方法不受限于摄像机的摆放位置与阵列麦克风的摆放位置,因此,立体声场景布置的灵活性更高。并且,在使用过程中,即使阵列麦克风发生了移动,基于该方法可以重新动态确定移动后的拾音麦克风,因此,有助于使得立体声效果更好。
以下,通过一个具体示例,说明本申请实施例提供的拾音麦克风的确定方法。其中,本实施例中是以阵列麦克风包括麦克风单体M1、M2和M3,且这3个麦克风单体之间以圆环形方式均匀分布为例进行说明的。
步骤1:主控终端设备将摄像机的磁场方向S1转换为摄像机的拍摄方向信息S1°。然后,主控终端设备分别基于摄像机的拍摄方向与左右声道麦克风单体所在的参考方向之间的关系,确定左声道麦克风单体所在的参考方向的方向信息为:S2°=S1°-90°,即左声道麦克风单体所在的参考方向S2是摄像机的拍摄方向S1逆时针旋转90°后的方向;右声道麦克风单体所在的参考方向的方向信息为:S3°=S1°+90°,即右声道麦克风单体所在的参考方向S3是摄像机的拍摄方向S1顺时针旋转90°后的方向。
步骤2:主控终端设备基于摄像机的拍摄方向与闭麦麦克风单体所在的参考方向A0(即上文中的第二参考方向)之间的呈180°,因此,可以得到闭麦麦克风单体所在的参考方向信息是A0°=S1°+180°。其中,A0°是方向A0的方向信息。
步骤3:主控终端设备获取麦克风单体M1所在的方向A1的方向信息A1°,具体实现方式可以才参考上文。因三个麦克风单体成120度夹角排列,则麦克风单体M2所在的方向A2转换的角度A2°=A1°+120°,麦克风单体M3所在的方向A3转换为的角度为A3°=A1°+240°。
步骤4:主控终端设备根据公式1确定闭麦麦克风单体N:
公式1:N=min{|(A1°-A0°)|,|(A2°-A0°)|,|A3°-A0°|}。
也就是说,主控终端设备将朝向接近A0方向的麦克风单体作为闭麦麦克风单体N。
步骤5:主控终端设备根据公式2在阵列麦克风中除闭麦麦克风单体之外的其他麦克风单体中,确定左声道麦克风单体L:
公式2:L=min{|(A1°-S2°)|,|(A2°-S2°)|}。
其中,公式2是在假设步骤4中确定的闭麦麦克风单体N是麦克风单体M3为例进行说明的。
步骤6:主控终端设备将阵列麦克风中的除闭麦麦克风单体和左声道麦克风单体之外的其他麦克风单体作为右声道麦克风单体。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对拾音麦克风确定装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图11所示,图11示出了本申请实施例提供的拾音麦克风确定装置110的结构示意图。该拾音麦克风确定装置110用于执行上述的拾音麦克风确定方法,例如,执行图6所示的拾音麦克风确定方法。示例的,拾音麦克风确定装置110可以包括第一确定单元1101、第二确定单元1102和第三确定单元1103。
第一确定单元1101,用于确定摄像机的拍摄方向信息,拍摄方向信息用于指示摄像机的拍摄方向。第二确定单元1102,用于基于摄像机的拍摄方向,确定第一参考方向;其中,第一参考方向是阵列麦克风中的目标麦克风单体所在的参考方向,目标麦克风单体是左声道麦克风单体或右声道麦克风单体;拍摄方向与第一参考方向呈第一预设角度;左声道麦克风单体用于拾取左声道声音信号,右声道麦克风单体用于拾取右声道声音信号。第三确定单元1103,用基于第一参考方向,从阵列麦克风中确定目标麦克风单体。
作为示例,摄像机可以是上文中的摄像机11,阵列麦克风可以是上文中的阵列麦克风12,第一确定单元1101、第二确定单元1102以及第三确定单元1103设置在上文中的主控会议终端13中。结合图6,第一确定单元1101可以执行S101,第二确定单元1102可以执行S102,第三确定单元1103可以执行S103。
可选地,摄像机的拍摄方向是摄像机在(如一直在或恢复)初始位置时的拍摄方向,初始位置是指摄像机的镜头与摄像机的底座主体垂直时的位置。
可选地,第三确定单元1103具体用于:基于第一参考方向,将阵列麦克风中的,满足第一预设条件的麦克风单体作为目标麦克风单体。其中,满足第一预设条件的麦克风单体,包括:所在方向与第一参考方向之间的角度,小于或等于第一阈值的第一预设数量的麦克风单体;或,所在方向与第一参考方向之间的角度,从小到大排序后的前第一预设数量的角度对应的麦克风单体。
可选地,拾音麦克风确定装置110还包括:接收单元1104。
可选地,接收单元1104,用于接收阵列麦克风中的任一麦克风单体的磁场方位信息;第三确定单元1103还用于,依据该麦克风单体的磁场方位信息确定该麦克风单体的方向信息;依据该麦克风单体的方向信息确定该麦克风单体所在的方向相对于第一参考方向的角度。
可选地,接收单元1104,用于接收阵列麦克风中的任一麦克风单体的方向信息;第三确定单元1103还用于,依据该麦克风单体的方向信息确定该麦克风单体所在的方向相对于第一参考方向的角度。
可选地,接收单元1104,用于接收阵列麦克风中的任一麦克风单体所在的方向,相对于第一参考方向的角度。
可选地,阵列麦克风包括第一磁性传感器,第一磁性传感器用于测量任一麦克风单体的磁场方位信息。
可选地,阵列麦克风包括第一红外线传感器,第一红外线传感器用于测量任一麦克风单体的方向信息。
可选地,第一确定单元1101具体用于:获取摄像机的磁场方位信息,磁场方位信息用于指示摄像机的磁场方位;依据摄像机的磁场方位信息,确定摄像机的拍摄方向信息。
可选地,接收单元1104,用于接收所述摄像机的拍摄方向信息。
可选地,摄像机包括第二磁性传感器,第二磁性传感器用于测量摄像机的磁场方位信息。
可选地,摄像机包括第二红外线传感器,第二红外线传感器用于测量摄像机的拍摄方向信息。
可选地,第一确定单元1101具体用于:获取阵列麦克风中的至少两个麦克风单体采集的声音信号,声音信号来自同一发声源,发声源的发声方向与摄像机的拍摄方向一致;基于至少两个麦克风单体采集的声音信号,采用声源定位算法,确定摄像机的拍摄方向信息。
可选地,摄像机中包括发声源。
可选地,第一确定单元1101具体用于:接收摄像机的拍摄方向信息。
可选地,第二确定单元1102具体用于:基于摄像机的拍摄方向,确定第二参考方向;第二参考方向是阵列麦克风中的闭麦麦克风单体的参考方向;拍摄方向与第二参考方向呈第二预设角度;第三确定单元1103具体用于:基于第二参考方向,将阵列麦克风中的,满足第二预设条件的麦克风单体作为闭麦麦克风单体;其中,闭麦麦克风单体不做拾音。满足第二预设条件的麦克风单体,包括:所在方向与第二参考方向的角度,小于或等于第二阈值的第二预设数量的麦克风单体;或,所在方向与第二参考方向之间的角度,从小到大排序后的前第二预设数量的角度对应的麦克风单体。
可选地,第一预设角度为90度。
可选地,拾音麦克风确定装置还包括:合成单元1105,用于基于左声道声音信号和右声道声音信号,合成立体声信号。
关于上述可选方式的具体描述可以参见前述的方法实施例,此处不再赘述。此外,上述提供的任一种拾音麦克风确定装置110的解释以及有益效果的描述均可参考上述对应的方法实施例,不再赘述。
作为示例,结合图5,拾音麦克风确定装置中的第一确定单元1101、第二确定单元1102、第三确定单元1103和合成单元1105中的部分或全部实现的功能可以通过图5中的处理器51执行图5中的存储器52中的程序代码实现。接收单元1104可以通过图5中的通信接口53中的接收单元实现。
本申请实施例还提供一种芯片系统,如图12所示,该芯片系统包括至少一个处理器131和至少一个接口电路132。作为示例,当该芯片系统130包括一个处理器和一个接口电路时,则该一个处理器可以是图12中实线框所示的处理器131(或者是虚线框所示的处理器131),该一个接口电路可以是图12中实线框所示的接口电路132(或者是虚线框所示的接口电路132)。当该芯片系统130包括两个处理器和两个接口电路时,则该两个处理器包括图12中实线框所示的处理器131和虚线框所示的处理器131,该两个接口电路包括图12中实线框所示的接口电路132和虚线框所示的接口电路132。对此不作限定。
处理器131和接口电路132可通过线路互联。例如,接口电路132可用于接收信号(例如从车速传感器或边缘服务单元接收信号)。又例如,接口电路132可用于向其它装置(例如处理器131)发送信号。示例性的,接口电路132可读取存储器中存储的指令,并将该指令发送给处理器131。当所述指令被处理器131执行时,可使得拾音麦克风确定装置执行上述实施例中的各个步骤。当然,该芯片系统还可以包含其他分立器件,本申请实施例对此不作具体限定。
本申请另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在拾音麦克风确定装置上运行时,该拾音麦克风确定装置执行上述方法实施例所示的方法流程中该拾音麦克风确定装置执行的各个步骤。
在一些实施例中,所公开的方法可以实施为以机器可读格式被编码在计算机可读存储介质上的或者被编码在其它非瞬时性介质或者制品上的计算机程序指令。
图13示意性地示出本申请实施例提供的计算机程序产品的概念性局部视图,所述计算机程序产品包括用于在计算设备上执行计算机进程的计算机程序。
在一个实施例中,计算机程序产品是使用信号承载介质140来提供的。所述信号承载介质140可以包括一个或多个程序指令,其当被一个或多个处理器运行时可以提供以上针对图6描述的功能或者部分功能。因此,例如,参考图6中S101~S104的一个或多个特征可以由与信号承载介质140相关联的一个或多个指令来承担。此外,图13中的程序指令也描述示例指令。
在一些示例中,信号承载介质140可以包含计算机可读介质141,诸如但不限于,硬盘驱动器、紧密盘(CD)、数字视频光盘(DVD)、数字磁带、存储器、只读存储记忆体(read-only memory,ROM)或随机存储记忆体(random access memory,RAM)等等。
在一些实施方式中,信号承载介质140可以包含计算机可记录介质142,诸如但不限于,存储器、读/写(R/W)CD、R/W DVD、等等。
在一些实施方式中,信号承载介质140可以包含通信介质143,诸如但不限于,数字和/或模拟通信介质(例如,光纤电缆、波导、有线通信链路、无线通信链路、等等)。
信号承载介质140可以由无线形式的通信介质143(例如,遵守IEEE 802.11标准或者其它传输协议的无线通信介质)来传达。一个或多个程序指令可以是,例如,计算机可执行指令或者逻辑实施指令。
在一些示例中,诸如针对图13描述的拾音麦克风确定装置可以被配置为,响应于通过计算机可读介质141、计算机可记录介质142、和/或通信介质143中的一个或多个程序指令,提供各种操作、功能、或者动作。
应该理解,这里描述的布置仅仅是用于示例的目的。因而,本领域技术人员将理解,其它布置和其它元素(例如,机器、接口、功能、顺序、和功能组等等)能够被取而代之地使用,并且一些元素可以根据所期望的结果而一并省略。另外,所描述的元素中的许多是可以被实现为离散的或者分布式的组件的、或者以任何适当的组合和位置来结合其它组件实施的功能实体。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (32)

1.一种拾音麦克风确定方法,其特征在于,所述方法包括:
确定摄像机的拍摄方向信息,所述拍摄方向信息用于指示所述摄像机的拍摄方向;
基于所述摄像机的拍摄方向,确定第一参考方向;其中,所述第一参考方向是阵列麦克风中的目标麦克风单体所在的参考方向,所述目标麦克风单体是左声道麦克风单体或右声道麦克风单体;所述拍摄方向与所述第一参考方向呈第一预设角度;所述左声道麦克风单体用于拾取左声道声音信号,所述右声道麦克风单体用于拾取右声道声音信号;
基于所述第一参考方向,从所述阵列麦克风中确定所述目标麦克风单体。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一参考方向,从所述阵列麦克风中确定所述目标麦克风单体,包括:
基于所述第一参考方向,将所述阵列麦克风中的,满足第一预设条件的麦克风单体作为所述目标麦克风单体;
其中,满足所述第一预设条件的麦克风单体,包括:
所在方向与所述第一参考方向之间的角度,小于或等于第一阈值的第一预设数量的麦克风单体;
或,所在方向与所述第一参考方向之间的角度,从小到大排序后的前第一预设数量的角度对应的麦克风单体。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
接收所述阵列麦克风中的任一麦克风单体的磁场方位信息;依据所述任一麦克风单体的磁场方位信息确定所述任一麦克风单体的方向信息;依据所述任一麦克风单体的方向信息确定所述任一麦克风单体所在的方向相对于所述第一参考方向的角度;
或,接收所述阵列麦克风中的任一麦克风单体的方向信息;依据所述任一麦克风单体的方向信息确定所述任一麦克风单体所在的方向相对于所述第一参考方向的角度;
或,接收所述阵列麦克风中的任一麦克风单体所在的方向,相对于所述第一参考方向的角度。
4.根据权利要求3所述的方法,其特征在于,所述阵列麦克风包括第一磁性传感器,所述第一磁性传感器用于测量所述任一麦克风单体的磁场方位信息。
5.根据权利要求3所述的方法,其特征在于,所述阵列麦克风包括第一红外线传感器,所述第一红外线传感器用于测量所述任一麦克风单体的方向信息。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述确定摄像机的拍摄方向信息,包括:
获取所述摄像机的磁场方位信息,所述磁场方位信息用于指示所述摄像机的磁场方位;依据所述摄像机的磁场方位信息,确定所述摄像机的拍摄方向信息;
或者,接收所述摄像机的拍摄方向信息。
7.根据权利要求6所述的方法,其特征在于,所述摄像机包括第二磁性传感器,所述第二磁性传感器用于测量所述摄像机的磁场方位信息。
8.根据权利要求6所述的方法,其特征在于,所述摄像机包括第二红外线传感器,所述第二红外线传感器用于测量所述摄像机的拍摄方向信息。
9.根据权利要求1-5任一项所述的方法,其特征在于,所述确定所述摄像机的拍摄方向信息,包括:
获取所述阵列麦克风中的至少两个麦克风单体采集的声音信号,所述声音信号来自同一发声源,所述发声源的发声方向与所述摄像机的拍摄方向一致;
基于所述至少两个麦克风单体采集的声音信号,采用声源定位算法,确定所述摄像机的拍摄方向信息。
10.根据权利要求9所述的方法,其特征在于,所述摄像机中包括所述发声源。
11.根据权利要求1-10任一项所述的方法,其特征在于,在所述基于所述第一参考方向,从所述阵列麦克风中确定所述目标麦克风单体之后,所述方法还包括:
基于所述左声道声音信号和所述右声道声音信号,合成立体声信号。
12.根据权利要求1-11任一项所述的方法,其特征在于,所述方法还包括:
基于所述摄像机的拍摄方向,确定第二参考方向;所述第二参考方向是所述阵列麦克风中的闭麦麦克风的参考方向;所述拍摄方向与所述第二参考方向呈第二预设角度;
基于所述第二参考方向,将所述阵列麦克风中的,满足第二预设条件的麦克风单体作为闭麦麦克风单体;其中,所述闭麦麦克风单体不做拾音;
所述满足所述第二预设条件的麦克风单体,包括:
所在方向与所述第二参考方向的角度,小于或等于第二阈值的第二预设数量的麦克风单体;
或,所在方向与所述第二参考方向之间的角度,从小到大排序后的前第二预设数量的角度对应的麦克风单体。
13.根据权利要求12所述的方法,其特征在于,所述第二预设角度为180度。
14.根据权利要求1至13任一项所述的方法,其特征在于,所述第一预设角度为90度。
15.根据权利要求1至14任一项所述的方法,其特征在于,所述摄像机的拍摄方向是所述摄像机在初始位置时的拍摄方向,所述初始位置是指所述摄像机的镜头与所述摄像机的底座主体垂直时的位置。
16.一种拾音麦克风确定装置,其特征在于,所述装置包括:
第一确定单元,用于确定摄像机的拍摄方向信息,所述拍摄方向信息用于指示所述摄像机的拍摄方向;
第二确定单元,用于基于所述摄像机的拍摄方向,确定第一参考方向;其中,所述第一参考方向是阵列麦克风中的目标麦克风单体所在的参考方向,所述目标麦克风单体是左声道麦克风单体或右声道麦克风单体;所述拍摄方向与所述第一参考方向呈第一预设角度;所述左声道麦克风单体用于拾取左声道声音信号,所述右声道麦克风单体用于拾取右声道声音信号;
第三确定单元,用于基于所述第一参考方向,从所述阵列麦克风中确定所述目标麦克风单体。
17.根据权利要求16所述的装置,其特征在于,所述第三确定单元,具体用于:
基于所述第一参考方向,将所述阵列麦克风中的,满足第一预设条件的麦克风单体作为所述目标麦克风单体;
其中,满足所述第一预设条件的麦克风单体,包括:
所在方向与所述第一参考方向之间的角度,小于或等于第一阈值的第一预设数量的麦克风单体;
或,所在方向与所述第一参考方向之间的角度,从小到大排序后的前第一预设数量的角度对应的麦克风单体。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括:接收单元;
所述接收单元,用于接收所述阵列麦克风中的任一麦克风单体的磁场方位信息;所述第三确定单元还用于,依据所述任一麦克风单体的磁场方位信息确定所述任一麦克风单体的方向信息;依据所述任一麦克风单体的方向信息确定所述任一麦克风单体所在的方向相对于所述第一参考方向的角度;
或,所述接收单元,用于接收所述阵列麦克风中的任一麦克风单体的方向信息;所述第三确定单元还用于,依据所述任一麦克风单体的方向信息确定所述任一麦克风单体所在的方向相对于所述第一参考方向的角度;
或,所述接收单元,用于接收所述阵列麦克风中的任一麦克风单体所在的方向,相对于所述第一参考方向的角度。
19.根据权利要求18所述的装置,其特征在于,所述阵列麦克风包括第一磁性传感器,所述第一磁性传感器用于测量所述任一麦克风单体的磁场方位信息。
20.根据权利要求18所述的装置,其特征在于,所述阵列麦克风包括第一红外线传感器,所述第一红外线传感器用于测量所述任一麦克风单体的方向信息。
21.根据权利要求16-20任一项所述的装置,其特征在于,
所述第一确定单元具体用于:获取所述摄像机的磁场方位信息,所述磁场方位信息用于指示所述摄像机的磁场方位;依据所述摄像机的磁场方位信息,确定所述摄像机的拍摄方向信息;
或者,所述装置还包括接收单元,用于接收所述摄像机的拍摄方向信息。
22.根据权利要求21所述的装置,其特征在于,所述摄像机包括第二磁性传感器,所述第二磁性传感器用于测量所述摄像机的磁场方位信息。
23.根据权利要求21所述的装置,其特征在于,所述摄像机包括第二红外线传感器,所述第二红外线传感器用于测量所述摄像机的拍摄方向信息。
24.根据权利要求16-20任一项所述的装置,其特征在于,所述第一确定单元具体用于:
获取所述阵列麦克风中的至少两个麦克风单体采集的声音信号,所述声音信号来自同一发声源,所述发声源的发声方向与所述摄像机的拍摄方向一致;
基于所述至少两个麦克风单体采集的声音信号,采用声源定位算法,确定所述摄像机的拍摄方向信息。
25.根据权利要求24所述的装置,其特征在于,所述摄像机中包括所述发声源。
26.根据权利要求16-25任一项所述的装置,其特征在于,所述装置还包括:
合成单元,用于基于所述左声道声音信号和所述右声道声音信号,合成立体声信号。
27.根据权利要求16-26任一项所述的装置,其特征在于,
所述第二确定单元还用于,基于所述摄像机的拍摄方向,确定第二参考方向;所述第二参考方向是所述阵列麦克风中的闭麦麦克风的参考方向;所述拍摄方向与所述第二参考方向呈第二预设角度;
所述第三确定单元还用于,基于所述第二参考方向,将所述阵列麦克风中的,满足第二预设条件的麦克风单体作为闭麦麦克风单体;其中,所述闭麦麦克风单体不做拾音;
所述满足所述第二预设条件的麦克风单体,包括:
所在方向与所述第二参考方向的角度,小于或等于第二阈值的第二预设数量的麦克风单体;
或,所在方向与所述第二参考方向之间的角度,从小到大排序后的前第二预设数量的角度对应的麦克风单体。
28.根据权利要求27所述的装置,其特征在于,所述第二预设角度为180度。
29.根据权利要求16至28任一项所述的装置,其特征在于,所述第一预设角度为90度。
30.根据权利要求16至29任一项所述的装置,其特征在于,所述摄像机的拍摄方向是所述摄像机在初始位置时的拍摄方向,所述初始位置是指所述摄像机的镜头与所述摄像机的底座主体垂直时的位置。
31.一种拾音麦克风确定装置,其特征在于,包括:存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行权利要求1-15任一项所述的方法。
32.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行权利要求1-15任一项所述的方法。
CN202010790780.XA 2020-08-07 2020-08-07 拾音麦克风确定方法及装置 Pending CN114071279A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010790780.XA CN114071279A (zh) 2020-08-07 2020-08-07 拾音麦克风确定方法及装置
PCT/CN2021/095800 WO2022028050A1 (zh) 2020-08-07 2021-05-25 拾音麦克风确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010790780.XA CN114071279A (zh) 2020-08-07 2020-08-07 拾音麦克风确定方法及装置

Publications (1)

Publication Number Publication Date
CN114071279A true CN114071279A (zh) 2022-02-18

Family

ID=80116953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010790780.XA Pending CN114071279A (zh) 2020-08-07 2020-08-07 拾音麦克风确定方法及装置

Country Status (2)

Country Link
CN (1) CN114071279A (zh)
WO (1) WO2022028050A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0884286A (ja) * 1994-09-14 1996-03-26 Hitachi Ltd カメラ一体型vtr
US9888317B2 (en) * 2013-10-22 2018-02-06 Nokia Technologies Oy Audio capture with multiple microphones
US9747068B2 (en) * 2014-12-22 2017-08-29 Nokia Technologies Oy Audio processing based upon camera selection
CN105162950B (zh) * 2015-07-08 2020-09-25 Tcl移动通信科技(宁波)有限公司 一种移动终端及其实现通话中切换麦克风的方法
US9800975B1 (en) * 2016-04-18 2017-10-24 mPerpetuo, Inc. Audio system for a digital camera

Also Published As

Publication number Publication date
WO2022028050A1 (zh) 2022-02-10

Similar Documents

Publication Publication Date Title
US20210368248A1 (en) Capturing Sound
CN107182011B (zh) 音频播放方法及系统、移动终端、WiFi耳机
CN113015065B (zh) 一种连接方法、装置、设备及计算机存储介质
CN110574398B (zh) 使用定向分解和路径距离估计的环境立体声声场导航
US20210266665A1 (en) Apparatus, Method and Computer Program for Obtaining Audio Signals
WO2020200132A1 (zh) 麦克风阵列的电子装置及其应用方法
CN109996161A (zh) 一种移动终端及其出声控制方法、具有存储功能的装置
CN110890100B (zh) 语音增强、多媒体数据采集、播放方法、装置及监控系统
US11653170B2 (en) In-ear speaker
CN113889140A (zh) 音频信号播放方法、装置和电子设备
CN114071279A (zh) 拾音麦克风确定方法及装置
CN113726940A (zh) 录音方法和装置
CN112599144A (zh) 音频数据处理方法、音频数据处理装置、介质与电子设备
US11228708B2 (en) Image pickup apparatus and image pickup system
CN114598984B (zh) 立体声合成方法和系统
CN112771893A (zh) 3d音效实现方法、装置、存储介质及电子设备
CN114220454A (zh) 一种音频降噪方法、介质和电子设备
CN113808614A (zh) 声音能量值的校准及设备唤醒方法、设备及存储介质
CN109218920B (zh) 一种信号处理方法、装置及终端
CN108597533B (zh) 一种增强智能终端的语音输入信号的方法和系统
CN111208970A (zh) 音频播放方法及音频播放装置
CN115696114B (zh) 一种麦克风配置调整方法、电子设备及介质
CN114449434B (zh) 麦克风校准方法及电子设备
CN109813295A (zh) 方位确定方法及装置、电子设备
CN112492202B (zh) 全景相机远距离声源定向方法、装置和计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination